Inteligencia Artificial e Big Data à Serviço do Setor Imobiliário
Introdução
O universo digital está em expansão. Redes sociais, dispositivos móveis, dispositivos wearable, GPS, informações comerciais, são apenas alguns tipos de fontes que geram grandes quantidades de dados. Por outro lado, o setor imobiliário é um dos mais tradicionais e conservadores. Durante décadas nunca foi pioneiro na introdução de novas tecnologias. As inovações chegaram a este mercado quase sempre por último. No entanto, nos últimos anos, as tecnologias de inovação remodelaram quase todas as áreas de atividades das empresas imobiliárias, seja na construção de novos modelos de negócios, recursos humanos e até na otimização custos. Nesse cenário, a influência das novas tecnologias como Big Data (BD), Inteligência Artificial (IA), Geoprocessamento, entre outras, Mostram-se como ferramentas necessárias para o crescimento e otimização do setor imobiliário. Porém, ainda existe confusão conceitual e funcional, para entender as diferenças e os potenciais de usos destas
tecnologias. Quando se fala em BD e IA, o uso indiscriminado desses termos fazem parecer que ambas tem a mesmo origem, trabalham de forma parecida ou que tem os mesmos objetivos, o que está longe de ser o correto. BD e IA são completamente diferentes. BD está relacionado com o acesso e processamento de enorme quantidade de dados, enquanto IA está relacionada à criação do homem de itens artificiais que parecem inteligentes ou se comportam dessa maneira. Antes de falar sobre o potencial existente no uso de BD e IA no mercado imobiliário, pretendo ajudar a esclarecer as diferenças operacionais e de uso dessas duas tecnologias, como ambas se relacionam e o quanto estão longe de conceitos de modelagem estatístico e modelagem de sistemas dinâmicos ou sistemas complexos.
A era do Big Data
O BD surgiu poucos anos atrás, e como o nome sugere, refere-se ao processo de coleta e gerenciamento de grandes volumes e variedades de dados, estruturados ou não, que não podem ser efetivamente processados com aplicativos tradicionais. Para isto, o BD utiliza ferramentas tecnológicas complexas, como computação paralela e
outras ferramentas de automação. Estes grandes volumes de dados são produzidos
por entidades e indivíduos todos os dias por meio de vários canais digitais, como móveis, internet, mídias sociais etc., e requerem muita filtragem para se obter informações úteis a partir deles. Essa grande quantidade de dados possui o atrativo de ser, de forma geral, usada para descobrir padrões ocultos que sejam úteis em diversas aplicações. Para esse fim, fazemos uso dos computadores, utilizados para armazenar e processar milhões de registros e dados. O poder de analisar estas informações é fornecido pelas diversas técnicas de análises de dados. Imagine o BD como uma biblioteca que você visita para procurar informações que respondam à sua pergunta, e análise de dados é como o livro que você seleciona e estuda para encontrar as respostas para suas perguntas. Assim, o BD descreve todas as informações à nossa disposição, mas sempre precisamos analisar esses dados. Nesse cenário é onde ocorrem as aparições técnicas mais poderosas, entre elas a IA, que não funciona sem dados, ao contrário, consome dados para se desenvolver.
Atualmente, BD e IA são duas das tecnologias mais populares e úteis. São o conjunto de duas incríveis tecnologias modernas que capacitam e tornam possível o aprendizado de máquina, reiteram e atualizam continuamente os bancos de dados, com a ajuda da intervenção humana e experimentos recursivos.
Para entender os conceitos
Existe uma confusão, especialmente entre os profissionais que não pertencem à
área da Ciência de Dados, quando se trata de diferenciar IA, Aprendizado de Máquina
ou Machine Learning (ML) e Aprendizado Profundo ou Deep Learning (DL), no domínio do BD. Embora as três terminologias sejam geralmente usadas de forma equivalentes, elas não se referem exatamente aos mesmos assuntos . De forma objetiva, vamos esclarecer o assunto. De forma direta, podemos dizer que DL é um subconjunto de ML, que também é um subconjunto de IA, e que eles não são os únicos subconjuntos existentes na IA. A seguir, iremos explorar sucintamente cada um deles. IA é um conceito abrangente, criado e disseminado na década de 50. Esse campo de conhecimento tem uma longa história enraizada na ciência militar e estatística, com contribuições da filosofia, lógica, psicologia, matemática, estatística, teoria de probabilidades, otimização e ciências cognitivas. IA foi originalmente criada para tornar os computadores mais úteis e mais capazes de raciocínio independente. Atualmente refere-se à possibilidade de que as máquinas poderiam realizar tarefas que caracterizam a inteligência humana. Os eventos que exigem inteligência humana não são claros e gerais, mas se resumem a tarefas como interpretar e traduzir idiomas, resolver problemas complexos, planejar ações, raciocinar, movimenta-se, manipular objetos, capacidade de reconhecer sons e objetos diferentes, inteligência social e criatividade. Portanto, o objetivo central da IA é tornar possível que as máquinas aprendam com a experiência e melhorem sua capacidade de realizar as tarefas humanas à medida em que novas informações são fornecidas. Conforme já foi mencionado anteriormente, ML e DL são subcampos da IA e não são os únicos. Como um todo, a IA inclui muitos subcampos, como ML, Redes Neurais Artificiais (RNAs), DL, Visão Computacional (VC) e Processamento de Linguagem Natural (PLN). Enquanto cada um desses campos, individualmente, baseia-se na ideia que as máquinas devem
aprender tarefas específicas e se adaptar através da experiência, a IA se refere a uma
ideia mais ampla, onde as máquinas podem executar tarefas “de maneira inteligente”. Assim, pode-se afirmar que IA aplica ML, DL, RNA, VC e PLN, além de outras técnicas, para resolver problemas reais. Comentaremos brevemente sobre essas técnicas:
Iniciaremos pela ML. Trata-se de um subconjunto da IA, e concentra-se na capacidade dos computadores de receber conjunto enorme de dados e aprender por si próprios, onde os algoritmos são alterados através de ferramentas estatísticas de alto nível e pesquisa operacional, à medida que aprendem mais sobre as informações que processam (informações ocultas nos dados). Em outras palavras, ML são técnicas cujo objetivo é atingir a IA, através de computadores para imitar as funções cognitivas dos seres humanos (encontrar informações sem ser explicitamente programado para onde procurar ou o que concluir). É importante observar que é possível trabalhar com IA sem usar ML. Isto exige muito mais trabalho de codificação e o uso de técnicas e regras de decisão complexas. Tecnicamente, podemos dizer que ML oferece aos computadores a capacidade de aprender sem serem explicitamente programados para a tarefa em questão. O aprendizado ocorre quando os dados são combinados com modelos matemáticos.como quando se encontram valores adequados de variáveis desconhecidas no modelo. O exemplo mais básico de aprendizado pode
ser o de ajustar uma linha reta aos dados, mas o ML geralmente lida com modelos
muito mais flexíveis do que linhas retas. O objetivo é fazer com que o resultado obtido, ou seja, a previsão, possa ser utilizado para tirar conclusões sobre o estado do sistema em estudo, e onde não existiam dados para serem utilizados no aprendizado do modelo. Uma RNA é um tipo de ML inspirada no funcionamento do cérebro humano. É um sistema de computação composto de unidades interconectadas, como neurônios biológicos, chamadas de neurônios, que possuem camadas e conexões discretas com outros neurônios. Esses neurônios processam informações respondendo a entradas externas, transmitindo informações entre cada unidade (integração espaço-temporal dos estímulos). O processo requer várias passagens nos dados para encontrar conexões e obter significado de dados indefinidos (RNA multicamadas). DL é uma área muito mais recente, que toma forma no inicio do século XXI. O conceito de DL é inspirado pela função, estrutura e complexidade de nossos cérebros. O DL é baseado na teoria de RNAs, que são essencialmente algoritmos que imitam a estrutura biológica de nossos cérebros, como descrito no parágrafo anterior. O nome DL refere-se ao número de camadas ocultas na RNA, onde RNAs profundas têm até 150 camadas, enquanto as RNAs tradicionais possuem de 2 a 3 camadas. No final, DL é apenas uma das muitas abordagens do ML. DL utiliza enormes RNAs com muitas camadas de unidades de processamento, aproveitando os avanços no poder da computação e técnicas de treinamento aprimoradas para aprender padrões complexos em grandes quantidades
de dados. Aplicativos comuns incluem reconhecimento de imagem e fala. A VC depende do reconhecimento de padrões e DL para reconhecer o que há em uma imagem ou vídeo. Quando as máquinas podem processar, analisar e entender imagens, elas podem capturar imagens ou vídeos em tempo real e interpretar suas adjacências, ou seja, caraterísticas que ajustam a paisagem. Aqui, cada imagem ou vídeo são constituídos por grandes conjuntos de dados agrupados, que representam caraterísticas próprias, portanto propriedades específicas de cada imagem ou vídeo.
A PLN é a capacidade dos computadores de analisar, entender e gerar linguagem humana, incluindo a fala. O próximo estágio da PLN será a interação da linguagem natural, que permite que os humanos se comuniquem com os computadores usando a linguagem normal do dia a dia para executar as tarefas. Todas essas técnicas têm como objetivo consolidar os estados do sistema em estudo, os quais serão caracterizados com ajuda do histórico de dados. Os estados do sistema em estudo que queremos conhecer podem referir-se a estados futuros, isso é, se o sistema tem
características que mudarão no tempo, e estados de distribuição espaciais, o que significa que o sistema tem características que mudam espacialmente. Os sistemas
mais interessantes e que conformam o núcleo de muitos sistemas dinâmicos complexos possuem estados que variam no tempo e no espaço, simultaneamente. São tópicos como precificação e valorização de imóveis, valor de ações na bolsa de valores, índices de criminalidade, variação da população, formação urbana, entre muitas outras situações que possuem essa caraterística. Nesse ponto podemos fazer uma importante pergunta: será que somente conhecendo grandes quantidade de dados e analisando-os, utilizando as técnicas de IA, é suficiente para caraterizar por completo, não só novos estados do sistema, mas também a fenomenologia de suas variações espaço/temporais?
Muito além dos dados
Quando são aplicadas as técnicas acima descritas sobre histórico grande de dados e/ou imagens, como resultados obtêm-se os estados futuros (em relação ao tempo) e os estados em posições não avaliadas no histórico de dados (em relação ao espaço), pertencentes ao sistema em estudo, assim, a previsão dos estados mais prováveis em um determinado momento e/ou lugar ou forma. Para esse objetivo, além de conhecer os estados anteriores e/ou atuais do sistema – o histórico dados –, é necessário deter conhecimento de técnicas de IA, que segundo nossas necessidades, nos dará os melhores resultados. Evidentemente, conseguir prever os estados de um sistema de forma ótima e para alguma circunstância específica é objeto de estudo muito interessante, e atualmente possui a maior atenção do mundo acadêmico e empresarial. Em síntese, com o histórico de dados nas suas mais diferentes formas, podemos aplicar técnicas de IA, através de algoritmos computacionais, e assim, conseguimos conhecer, de maneira aproximada, as tendências do sistema, e como o
mesmo estará em alguma configuração de interesse. Em sua essência, as técnicas
utilizadas são apenas aplicação de análise estatística multivariada, teoria da probabilidade, álgebra tensorial e booleana, tratamento espectral de imagens,
lógica, otimização e análise sintática. Importante saber que aplicar essas técnicas a um conjunto de dados não nos dará a informação do por que o sistema se encontra no estado determinado ou por que este mudou de uma configuração A a outra B. Não
temos nenhuma informação sobre como o sistema chegou a esse estado através do
tempo e espaço. E como seria possível obter esse conhecimento? Em princípio, os modelos estatísticos e probabilísticos trabalham baseados em dados, pelo fato que são suficientemente flexíveis para serem alterados conforme a chegada de novos dados, pois incorporam novos padrões e tendências emergentes; é aqui que o reconhecimento de padrões e aprendizado de máquina entra em foco. Os modelos
estatísticos incluem aleatoriedade, que é característica das estatísticas, com o que o
uso da teoria de probabilidade é de extrema relevância. Porém, para conhecer macro e micro detalhes de como os estados evoluem, é necessário muito mais do que apenas a análise de dados. É fundamental a construção de modelos matemáticos que tenham todos os ingredientes importantes para a evolução do sistema: constituintes econômicas, sociais, físicas, ecológicas, etc. As ciências exatas trabalham há séculos com sistemas similares, que têm como objetivo explicar como a natureza evolui. Tais modelos são chamados de sistemas dinâmicos, ou como também são chamados de maneira mais geral, sistemas complexos. Na atualidade, os sistemas complexos estão longe de serem de uso exclusivo das ciências exatas, tornando-se um domínio interdisciplinar e, com isto, muito mais complexos. Esses sistemas complexos extraem contribuições dos mais diversos campos, tais como física estatística, teoria da informação, antropologia, ciência da computação, meteorologia, sociologia, economia, psicologia, biologia, ecologia e matemática. Tópicos como dinâmica não linear ou teoria do caos, redes dinâmicas de multiplicidade, termodinâmica e mecânica estatística, teoria do grafos, teoria dos jogos evolutivos, fractais, estabilidade, equações diferenciais, automatas celulares, parametrização, entre outros, são estudados de forma minuciosa por grupos de pesquisa que os aplicam, principalmente, em áreas como Econofísica, Smart Cities ou Teoria Urbana, Direito, Teoria de Criminalidade, Ecologia.
Mas como tudo isso contribui para o mercado imobiliário?
Vantagens para o mercado imobiliário
Sistemas abrangentes e eficazes, que suportam análises do mercado imobiliário, ainda estão ausentes. Esse fato impede o fluxo efetivo de informações abrangentes
para a tomada de decisões sobre atividades de investimento, desenvolvimento e promoção na área imobiliária. Como mencionado, BD e IA têm o potencial de revolucionar o setor imobiliário e torná-lo mais inovador. Pelo exposto, podemos afirmar que as ferramentas de IA são soluções computacionais programadas para aprender e otimizarem-se a si mesmas. Elas podem ser usadas para melhorar e acelerar processos complexos e, dessa forma, melhorar a eficiência da etapa de
trabalho de agentes imobiliários, como vendedores, corretores, gerentes de ativos e
investidores. Com o uso de IA, obtêm-se respostas baseadas em dados imobiliários para perguntas como: qual dos clientes potenciais tem maior probabilidade de comprar casão imóvel? Qual é a probabilidade que isso ocorra? Qual será o valor e uso correto de um imóvel, conforme sua localização? Obtenção de informações relevantes, como previsões baseadas em dados, padrões de compra, condições cruciais para negócios bem-sucedidos e fatores que resultam em não fechamento de negócio, são apenas alguns exemplos de oportunidades que a tecnologia pode oferecer. Entre as vantagens imediatas do uso da IA no mercado imobiliário, está que vendedor e comprador não precisam perder tempo com pesquisa e validação de informações sobre propriedades; os vendedores não precisam investir ou perder tempo com pessoas que não têm intenção de comprar um imóvel. No caso de compra e venda de imóveis, existem muitos problemas relacionados à transparência e ao fornecimento de informações e serviços confiáveis. Aqui, IA fornece solução aos consumidores, com a segurança necessária para negociar com o setor imobiliário, através do enorme volume de dados existente. Podemos afirmar que o setor imobiliário está voltado para o futuro digitalizado e automatizado. A IA e seus subconjuntos também desempenharão um papel vital para tornar os clientes empoderados para experimentar o processo de compra e venda com muito menos
incertezas. Para comprar um imóvel, os interessados só precisam decidir que estão
prontos; para todas as outras tarefas, eles podem simplesmente confiar em empresas
imobiliárias altamente capacitadas. Por outro lado, é preciso iniciar a criação de novos modelos baseados em sistemas complexos, que farão com que fiquemos menos dependentes de dados e mais dependentes da fenomenologia de nosso sistema em estudo.Podemos ir além da simples análise de dados convencional. Implementar esses modelos e validá-los com cenários passados, nos dará um maior conhecimentos dos fatores que fazem nosso sistema comportar-se de uma determinada forma, de quanto nosso sistema é sensível às mudanças das condições
iniciais, qual tipo de considerações geram mudanças extremas sem voltar atrás ou que mudanças não geram os resultados esperados. Ter conhecimento dessas informações fará com que o setor imobiliário tenha ferramentas poderosas para manter o equilíbrio, aumentar a segurança e minimizar os riscos de uma crise no setor financeiro e econômico, além de ser um pilar na formação da distribuição de fatores predominantes, como redes de transporte, verticalização, variação populacional, estratificação social, entre outros, visando a construção de SmartCities.
Conclusão
Sob o ponto de vista analítico, a introdução dos sistemas complexos nos permite obter soluções para o problema da seleção de métodos apropriados para analisar as informações disponíveis e ter conhecimento da sua fenomenologia, ao contrário de como costuma ser observado na prática, a adaptação da informação existente a métodos analíticos populares, como modelos hedônicos ou de ML. O exposto acima justifica deo princípio mais importante para toda análise de valor imobiliário é a seleção de métodos e procedimentos competentes de pesquisa. Observamos que em futuro próximo, o mercado imobiliário vai depender da implementação de novos processos, baseados em integração multidisciplinar, onde teorias das diferentes áreas de conhecimento serão ferramentas essenciais.
Dr. Marcos A. Albarracin Manrique
Cientista de dados da URBIT
– sagret10@hotmail.com
– http://lattes.cnpq.br/6746237833541005
– https://www.linkedin.com/in/marcosantonio-
albarracin-manrique-0987a6124/