Machine Learning: automação e aprendizado para a decisão

Risco & Recompensa , 30/04/2018

Machine Learning, conjunto de algoritmos ligados à Inteligência Artificial (AI), visa aprimorar e agilizar os processos decisórios, em especial em um mundo repleto de dados (armazenados em computador) e julgamento humano (armazenados em nossos cérebros). No mundo de hoje, com a transformação digital, o que era para poucos passa a estar acessível para muitos.

Antes de falar sobre Machine Learning, vamos falar brevemente sobre o julgamento humano e sua relação com o tema. O estudo sobre o julgamento humano dentro dos processos de decisão é tema analisado exaustivamente há mais de 50 anos. Amos Tversky e Daniel Kahneman (prêmio Nobel de Economia 2002) mostraram cientificamente como tomadores de decisão são tendenciosos. Segundo eles e outros grandes pesquisadores nós nos comportamos frequentemente de forma irracional. Nossas decisões são tendenciosas e muitas vezes viesadas, mesmo sem percebermos.

Machine Learning e todo o ferramental de análise estatística são caminhos para mitigar erros de julgamento e promover processos de decisão em massa (grandes volumes e interações). Kahneman sugere que sempre que se puder usar um algoritmo em processos decisórios, devemos considerar preferencialmente esta possibilidade. Hoje em dia há muito menos hostilidade aos algoritmos à medida que eles nos ajudam em atividades cotidianas: procurar livros e música dentro do nosso gosto, procurar pela informação que necessitamos. Em crédito e cobrança os algoritmos fazem muito sucesso com os tradicionais modelos de Credit e Behavioral Scoring. Entretanto, não foi sempre assim. Algumas pessoas questionavam a validade do uso de tais algoritmos mesmo que eles se mostrassem, na prática, muito eficientes. O mesmo pode acontecer com Machine Learning por desconhecimento ou medo de não compreender a tecnologia. Vale lembrar que algoritmos de Machine Learning não estão livres de erros, assim como qualquer modelo.

Em algumas técnicas o erro pode ser melhor controlado, mas em outras não. Muitas vezes olhamos para o termo Machine Learning sem saber exatamente do que se trata. Apesar do nome “Machine”, não se trata de uma máquina e sim de um conjunto de algoritmos, oriundos de técnicas computacionais diferentes. Estes algoritmos identificam padrões nos dados e em alguns casos na “estrutura” de um modelo (por isso fala-se em “learning” ou “aprendizado”).

Usar o termo Machine Learning parece ser mais imponente do que falar simplesmente: “algoritmos programados para identificar padrões em dados”. Machine Learning não é novo, entretanto, a computação elástica e o barateamento do armazenamento em grande escala viabilizou o uso de algoritmos impossíveis de serem “processados” ou “calculados” anteriormente. Para quem nunca fez um modelo estatístico usando técnicas clássicas, tudo isso parece mágico ou muito complicado, mas não é. Parte do que era feito “manualmente” passou a ser feito automaticamente. Além disso, novos algoritmos e variações dos mesmos são desenvolvidos conferindo maior acerto às predições, classificações e aplicações de todos os tipos.

Vele lembrar que o desafio dos dados continua. Sem um bom conjunto de dados e definição clara de escopo, nenhum modelo funciona bem. Em modelos supervisionados, por exemplo, sem que haja a definição correta da variável resposta (ex: definição de cliente bom ou mau) e do universo que estará sendo estudado, nenhum padrão útil será identificado. Neste sentido, o que vai ser oferecido e como será oferecido para a máquina digerir ainda continua sendo feito com intervenção humana. Muito empenho é necessário até que os primeiros conjuntos de dados estejam em condições para serem aproveitados pelos algoritmos. Existem soluções que permitem melhorar a fase de preparação de dados, automatizando atividades de categorização por exemplo, entretanto nem sempre conseguem o melhor tratamento (considerando minha experiência própria). O que melhorou muito foi a disponibilidade das máquinas, geralmente em cloud. Usa-se uma máquina para desenvolver e outra para aplicar os modelos em produção, cada uma com características próprias. Antes tinha-se que comprar uma máquina específica e hoje isso não é mais assim – existe elasticidade.

Alguns algoritmos são “caixas pretas”, igual as primeiras redes neurais que apareceram. Eu, particularmente, continuo prestigiando a modelagem que permite evoluir em raciocínio, aprendizado contínuo e monitoramento ético da decisão.

As pessoas precisam se capacitar para trabalhar bem com os modelos, monitorando-os e tirando deles o combustível para estratégias e táticas. Diferentes áreas podem ser beneficiadas, combinando “risco e recompensa”. Seguem alguns exemplos:

Vendas e engajamento de clientes: identificar insights sobre os clientes e prospects usando dados internos e externos com foco em vendas, ampliando o faturamento e minimizando riscos. Através dos algoritmos não supervisionados pode-se identificar grupos de perfis similares entre si e com diferenças significativas para os demais agrupamentos. Assim, é possível visualizar novas oportunidades de vendas, selecionando clientes de maior interesse para a empresa. Os modelos supervisionados permitem respostas direcionadas para um objetivo de venda específico, otimizando o cálculo e o cumprimento de metas.

• Crédito e Cobrança: as práticas de concessão de crédito, cobrança e a reestruturação de dívidas precisam considerar a quem abordar (propensão a pagar – identificada pelos algoritmos supervisionados) e como abordar (segmentos de clientes – identificados pelos algoritmos não supervisionados), permitindo a execução de estratégias de risco mais adequadas a cada perfil de cliente. Além disso, os clientes ao serem atraídos para páginas com conteúdos específicos, podem receber interações customizadas em tempo real, dependendo do comportamento e jornada que estejam percorrendo tanto no crédito quanto na cobrança.

• Retenção de clientes: ao identificar clientes com menor propensão de compras recorrentes pode-se agir de forma planejada para reter os mais valiosos. As empresas que usam aprendizado de máquina para lidar com a rotatividade de clientes tendem a controlar com mais precisão a retenção. Ao mesmo tempo que se identifica os que possuem altas chances de permanecer, identifica-se os que possuem menores chances. Para cada um deles deve-se estabelecer réguas de relacionamento distintas, com objetivos e métricas diferentes. Os modelos simplificam muito os processos que usam dados para gerar fluxos de comunicação.  Imagine como seria trabalhoso fazer milhões de “queries” para identificar em bancos de dados os clientes que estão em uma determinada situação durante a execução da comunicação. Neste sentido os algoritmos atrelados aos processos são os grandes viabilizadores da comunicação direcionada, tanto para marketing, como para crédito e cobrança.

• Identificação de fraudes: dentre todas as modalidades de uso aqui apresentadas, na detecção de fraudes é onde Machine Learning consegue o maior sucesso. Isso se deve à própria natureza da fraude, que a cada dia pode surpreender com fatos e dados novos. Neste caso, mais do que se justifica trocar “modelos tradicionais” por modelões baseados em “machine learning”.

Machine Learning está cada dia mais ao alcance de empresas e instituições de todos os tipos. Para o setor de meios de pagamentos esta ideia já está bem consolidada, pois não é possível pensar meios de pagamento sem automação, minimização de erros, menor custo e maior produtividade e satisfação para o cliente.

Para quem já está acostumado com modelos é impossível imaginar uma operação de sucesso sem eles. Para quem não está, talvez seja o momento de começar a se exercitar para ter nas máquinas as grandes aliadas nos processos decisórios.



Links