Aplicando abordagens de aprendizado de máquina nas previsões de preço no mercado imobiliário

Previsões de preço encontram sua aplicação em vários cenários. Incorporadores imobiliários ou corretores de imóveis, comerciantes de commodities, investidores, clientes de companhias aéreas, comercializadores de energia, entre outros, usam estimativas sobre movimentos de preços futuros para fins comerciais. As previsões de preço podem ser apresentadas como recursos voltados para o consumidor, como também podem ser úteis para tomadas de decisão por empresários.

Um atual e grande desafio é a criação e posterior implementação de modelos de previsão de preços de diversos produtos ou serviços em mercados com alta volatilidade, avaliando determinados fatores ou características importantes. Para atingir este objetivo, temos que enfocar as etapas de construção e implementação dos modelos de previsão de preços nos setores desejados de uma forma ótima e automatizada.

Um modelo de previsão de preços pode ser formulado como um processo de regressão, onde a variável ‘objetivo’ é sempre numérica. A análise de regressão é uma técnica estatística usada para estimar a relação entre uma variável dependente ou variável ‘objetivo’, como, por exemplo, o preço de imóveis, transportes, ações, entre outros, e uma variável independente (única) ou variáveis interdependentes (múltiplas), conhecidas como preditores, e que impactam de forma determinada na variável ‘objetivo’.

Em geral, a previsão de preços é feita através de análises descritivas e preditivas. A análise descritiva depende de métodos estatísticos clássicos que incluem coleta de dados, análise, interpretação e apresentação de resultados. Este tipo de análise permite transformar observações brutas em conhecimento que pode ser entendido e compartilhado, ajudando a responder à pergunta sobre o que aconteceu. A análise preditiva trata de analisar dados atuais e históricos para prever a probabilidade de eventos, resultados ou valores futuros no contexto de previsões de preços. Este tipo de análise requer várias técnicas estatísticas, como mineração de dados (identificação de padrões nos dados) e aprendizado de máquina.

Neste ponto, temos que ter clara a funcionalidade do aprendizado de máquina. O objetivo do aprendizado de máquina é construir sistemas capazes de encontrar padrões em dados, aprendendo com eles sem intervenção humana e reprogramação explícita. Assim, com o objetivo de resolver o problema de previsão de preço, cientistas de dados devem primeiro entender quais dados usar para treinar modelos de aprendizado de máquina, e é exatamente por isso que a análise descritiva é necessária, especialmente para a compreensão das peculiaridades do mercado e para descobrir quais fatores afetam os preços.

Após a análise descritiva, os dados são coletados, selecionados, preparados, pré-processados e transformados. Concluídas essas etapas, cientistas de dados começam a construir modelos preditivos, i.e., dividir dados, treinar modelos, aplicar processos de otimização, testar e validar os modelos, e por último, implementar os modelos em um determinado sistema de software ou aplicativo. Os modelos escolhidos para implementação possuem como característica principal apresentar a maior taxa de precisão.

Previsão de preços de propriedades para agentes, investidores e compradores: desafios e abordagens

O mercado global de investimento imobiliário é complexo e de contínuo crescimento. Uma infinidade de fatores globais e suas inter-relações influenciam o mercado, o que leva a flutuações de preços. Entre esses fatores que influenciam a demanda e os preços dos imóveis, podemos nomear a situação econômica e política, criminalidade, mudanças na infraestrutura urbana, taxas de juros, mudanças climáticas, preços das commodities, entre outros.

Outros fatores de influência no preço dos imóveis são uma série de características e fatores locais que definem o custo de uma propriedade com localização e área específica. Podemos citar o número de quartos, qualidade de construção, área e distância de transportes públicos, lojas, restaurantes, centros culturais, parques, hospitais, etc. Em suma, o valor do imóvel pode depender de fatores globais e locais que influenciam o mercado imobiliário e seus atributos mais específicos.

Como todo sistema complexo, infelizmente, alguns fatores permanecem imprevisíveis, independentemente das técnicas utilizadas pelos especialistas. Um grande desafio para os cientistas de dados é a baixa qualidade dos dados. Não há uma fonte única e verdadeira para os dados de imóveis, e muitas informações são baseadas em dados inseridos manualmente, muitas vezes incorretamente na fonte, como por exemplo, área do imóvel, imóveis reformados ou não, preço de venda, atualização de preços segundo o mercado imobiliário, entre outros. Este aspecto demanda muito tempo no processo, limpando e projetando os dados e modelos para garantir que as previsões não sejam influenciadas por dados que não refletem o estado real no mercado.

Outro fator decisivo é o comportamento humano, que agrega dificuldade às previsões. O elemento humano do mercado é um desafio, já que não podemos prever a variação e o aspecto emocional da compra de uma propriedade. Situações pessoais do vendedor, do comprador e das outras partes da transação podem desempenhar um papel importante no preço de venda final. Uma forma de resolver este problema é criando indicadores para os fatores de oferta e demanda.

A URBIT usa o aprendizado de máquina (machine learning em inglês) para realizar suas previsões de preços para propriedades residenciais. Os usuários precisam inserir um endereço ou outras características para ver as propriedades com preços estimados em um mapa. Nossos dados vêm de uma variedade de portais imobiliários e de outras fontes confiáveis. Nossa missão é fornecer informações imparciais aos agentes do mercado imobiliário. Os modelos preditivos que alimentam a solução analisam uma ampla gama de dados e flutuações de preços, como tendências de áreas, tipos de propriedades e outros fatores de mercado. Já que o Brasil é tão grande e diverso, cada estado é um mercado em si, e cada um desses mercados se comporta de maneira diferente. Na URBIT procuramos que nossos modelos delineiem as mudanças e tendências em um estado e região.

Temos que enfatizar a importância da engenharia de recursos para a construção de modelos que não sejam muito complexos, mas ainda assim sejam capazes de fornecer resultados precisos. Quando se trata de mercado imobiliário, há múltiplos fatores e tendências que afetam o preço de um imóvel a serem considerados, e precisamos ser cuidadosos em relação a quantos desses fatores incorporamos aos nossos modelos. Muitos são os casos onde um recurso pode fornecer o mesmo valor que dezenas de outros combinados, mas com muito menos ruído. Para garantir que as previsões reflitam as mudanças do mercado, os cientistas de dados retreinam, testam e reimplementam os modelos (usando técnicas diferentes, como, por exemplo, conjuntos de árvores de regressão, k-vizinhos mais próximos, máquinas de vetor de suporte para regressão, perceptrons multicamadas, entre outros) para se manterem atualizados com as condições atuais do mercado imobiliário. Os cientistas de dados, portanto, devem investir muito tempo e esforço na preparação de conjuntos de dados de treinamento para obter modelos mais qualitativos a partir de então.

Trabalhos futuros na área de previsão de preços enfocam no uso de dados de série temporal para modelagem, uma vez que podem melhorar muito o desempenho da previsão dos modelos, os quais serviriam para a tomada de decisões, avaliação do retorno esperado do investimento e momento de compra adequado por parte dos agentes imobiliários.

Finalmente, vimos que a previsão de preços pode ser útil para diversos agentes. Pode facilitar a tomada de decisões nas operações diárias e no planejamento de longo prazo. O cientista de dados tem a tarefa de entender quais fatores impulsionam a demanda por produtos, commodities ou serviços. Esses fatores podem incluir sazonalidade, aspectos sociais, situação política e econômica em um país ou região de interesse, tempo e mudanças climáticas, custos de manutenção de infraestrutura e muitos outros. Outro pilar do sucesso são os dados atualizados e de alta qualidade. Os cientistas de dados devem coletar dados suficientes para construir, treinar e testar modelos preditivos, bem como desenvolver e manter a estratégia geral de gerenciamento de dados. Portanto, a escolha do método e das técnicas depende do tipo de dados.

Dr. Marcos A. Albarracin Manrique – Cientista de dados da URBIT

marcos@urbit.com.br

http://lattes.cnpq.br/6746237833541005

https://www.linkedin.com/in/marcos-antonio-albarracin-manrique-0987a6124/