A internet já tem mais de 3 bilhões de usuários em todo o mundo, e cada um deles é um gerador de conteúdo. Nós produzimos e coletamos mais informações do que nunca. São artigos, desenhos, poemas, fotos, vídeos, podcasts, pesquisas e posts de cada usuário da internet. Para se ter uma ideia, estima-se que 90% da informação gerada na história foi criada nos últimos 2 anos.
Agora que temos esta quantidade de dados imensa, “só” nos resta entendê-la. Temos que filtrar o que não é importante para poder enxergar e aprender com o relevante. Mas, com a enchente de informação, como podemos saber o que jogamos fora e o que analisamos?
É ai que entra o machine learning, ou “aprendizado de máquina”. Esta área da ciência da computação trata justamente disso: elaborar sistemas capazes de analisar e aprender rapidamente aquilo que os humanos demorariam muito tempo.
Quer um exemplo?
Imagine que você quer criar um filtro anti-spam. Uma das primeiras regras seria bloquear algumas palavras claramente características em spams, como “viagra”, e anexos suspeitos, como arquivos de extensão “.exe”. Talvez também links para download de outros arquivos executáveis. Em seguida, você iria filtrar e-mails que tentam imitar mensagens oficiais de bancos, mas que deixasse passar os comunicados legítimos. Tem também os vigaristas que se dizem príncipes nigerianos, e outras histórias absurdas para arrancar dinheiro de você. Ah, não se esqueça dos e-mails marketing de lojas das quais você nunca ouviu falar – e nem quer.
No final das contas, a lista de regras e exceções fica tão grande que se torna difícil de gerenciar. A cada novo e-mail legítimo que fica preso, você precisa mexer nas regras de novo. É um caos.
Automatizando as decisões
Usando machine learning você não precisa dizer que e-mails com a palavra “viagra” provavelmente são spam. A ideia por trás dessas técnicas é identificar características comuns em várias mensagens que você, e outras centenas de pessoas, marcaram como spam no passado, sem explicitamente apontar quais são estas características.
O sistema deve ser capaz de entender “todos estes spams têm em comum a palavra ‘viagra’. Acho que vou barrar”. Ele aprende sozinho, baseado no que o seus usuários humanos dizem. (Para quem quiser saber mais, este relato de um engenheiro do Google sobre a luta contra o spam é muito interessante – conteúdo em inglês).
Machine Learning tem inúmeras aplicaçōes: processamento de imagens (como as tags automáticas nas fotos do Facebook), reconhecimento de voz, carros que dirigem sozinhos e até prever padrões de navegação fraudulentos – sim, é o nosso caso aqui na Konduto! ;).
O potencial da tecnologia é tal que o fundo de venture capital Andreessen Horowitz colocou Big Data+Machine Learning como uma das 16 coisas que eles estão buscando para investir, e a Harvard Business Review chegou a dizer que o Data Scientist é a profissão mais sexy do século 21. Será?
Não sei se a coisa chega a este ponto, mas não podemos negar que, nesta era da informação, quem conseguir navegar melhor vai se dar muito bem.
Sobre a Konduto
Somos a primeira empresa do mundo a considerar o comportamento de navegação e compra do usuário em um site de e-commerce para calcular o risco de fraude em uma transação. Nosso sistema, que combina também todas as técnicas tradicionais da análise de risco (validação de dados cadastrais, revisão manual, fingerprint, geolocalização) ainda conta com filtros de inteligência artificial, que aumentam a precisão do antifraude e beneficiam a operação do lojista.
Nossos cases de sucesso mostram que a Konduto tem a mais moderna e eficiente tecnologia para barrar fraudes on-line. Temos clientes de todos os segmentos do e-commerce e somos reconhecidos pela imprensa e pelo mercado de tecnologia como uma das empresas mais inovadoras do ramo de tecnologia criadas no Brasil nos últimos anos.
Entre em contato conosco no e-mail oi@konduto.com e nos diga como a Konduto pode ajudar o seu e-commerce!