Internet cuenta ya con 3 mil millones de usuarios en todo el mundo, y cada uno de ellos es un generador de contenido. Nosotros producimos y recolectamos más informaciones que nunca. Son artículos, dibujos, poemas, fotos, vídeos, podcasts, encuestas y publicaciones de cada usuario de internet. Para que nos hagamos una idea, se estima que el 90% de la información generada en la historia fue creada en los últimos 2 años.
Ahora que tenemos esta cantidad inmensa de datos, solo queda entenderla. Tenemos que filtrar lo que no es importante para poder ver y aprender con lo relevante. Pero, con esa inundación de información, ¿cómo podemos saber qué debemos descartar y qué debemos analizar?
¿Difícil, no?
En este punto, entra el machine learning, el «aprendizaje de máquina». Esta área de la ciencia de la computación trata justamente de eso: elaborar sistemas capaces de analizar y de aprender rápidamente aquello que los humanos tardarían mucho en aprender.
¿Quieres un ejemplo?
Imagínate que deseas crear un filtro antispam. Una de las primeras reglas sería bloquear algunas palabras claramente características en spams, tales como viagra, y anexos sospechosos, como archivos de extensión .exe. Tal vez también enlaces para descargar otros archivos ejecutables.
A continuación, filtrarías e-mails que intentan imitar mensajes oficiales de bancos, pero dejarías pasar los comunicados legítimos. Hay aun estafadores que se dicen autoridades gubernamentales nigerianas, y otras historias absurdas para obtener dinero. Ah, no te olvides de los e-mails marketing de tiendas de las cuales nunca has oído hablar, ni lo deseas.
Al final, la lista de reglas y de excepciones se vuelve tan extensa que se hace difícil gestionarla. A cada nuevo e-mail legítimo que se queda bloqueado, tienes que editar las reglas nuevamente. Un verdadero caos.
Automatizando las decisiones
Al usar machine learning, no tendrás que especificar que e-mails con la palabra viagraprobablemente son spam. La idea por detrás de esas técnicas es identificar características corrientes en varios mensajes que tú y otros cientos de personas marcaron como spam anteriormente, sin apuntar explícitamente cuáles son estas características.
El sistema debe ser capaz de entender «todos estos spams tienen en común la palabra ‘viagra’, creo que los voy a bloquear». Este aprende solo, con base en lo que dicen sus usuarios humanos. Para los que deseen saber más, este relato de un ingeniero de Google acerca de la lucha contra el spam es muy interesante (en inglés).
El machine learning tiene innúmeras aplicaciones: procesamiento de imágenes (como las tags automáticas en las fotos del Facebook), reconocimiento de voz, autos que conducen solos y hasta la previsión de estándares de navegación estafadores. Sí, este es nuestro caso aquí en Konduto! 😉
El potencial de la tecnología es tal que el fondo de venture capital Andreessen Horowitz ha elegido Big Data y machine learning como una de las 16 cosas que buscan para invertir, y la Harvard Business Review llegó a decir que el Data Scientist es la profesión más atractiva del siglo 21. ¿Será?
No sabemos si la cosa llega a ese punto, pero no podemos negar que, en esta era de la información, el que logre navegar mejor se saldrá muy bien.
Acerca de Konduto
Somos una startup que desarrolló una tecnología innovadora para impedir el fraude online. Nuestros análisis son completos y no se basan tan solo en la combinación de datos de registro, como el e-mail y el número de identificación. Monitoreamos también el comportamiento de navegación del cliente desde el instante en que este entra en tu página web o aplicación móvile hasta el momento en que finaliza la compra.
La solución antifraude Konduto es más eficiente y con respuesta en tiempo real, para no perjudicar tu operación. Detectamos los pedidos que son realmente sospechosos: de este modo, tú reduces los costos con revisiones manuales al mismo tiempo en que vendes más y sufres menos fraudes.
¿Quieres saber más?
Contacta nuestro equipo comercial a través del e-mail hola@konduto.com
Conéctate con Konduto también en las redes sociales: Linkedin y Facebook