Dejen de vender humo diciendo “inteligencia artificial”

Describir tu producto usando el termino inteligencia artificial parece convertirlo automáticamente en algo futurista, complejo, y probablemente perfecto. Es un termino intimidante, y completamente fuera de nuestro conocimiento, pero en realidad es solo una estrategia de marketing.

Espero que después de leer esto puedas entender un poco mas que es lo que comúnmente llaman inteligencia artificial, y ver que no es inteligencia o artificial. No hay conciencia, no hay razón. Probablemente le hablaste a tu teléfono y te entendió mágicamente, seguramente usaste alguna red social que te sugirió el nombre de un amigo en una foto que subiste, alguna vez Facebook te mostró una novedad importante de un amigo primero, quizás Twitter te mostró una publicidad relevante sobre un tema que te interesa sin haberlo explicitado.

Lo que parece magia, es esencialmente algo tan simple como un conjunto de operaciones aritméticas y muchos, muchos datos. Los campos de aplicacion de machine learning son casi interminables, desde juegos y Economía hasta robots y deteccion de fraudes con tarjetas de crédito. Estamos ante una ola de aplicaciones nuevas que esta siendo exacerbado por el interes y el hype que tiene la tecnologia (que no es nueva). Al haber tantas aplicaciones reales hay una gran demanda de gente que sea especialista en el tema, también las herramientas y buenas practicas están madurando rápidamente.

¿Como funciona realmente?

Voy a simplificar muchisimo, pero supongamos que queremos hacer un programa que dada la foto de una planta, nos diga a que especie pertenece. Si tuviésemos que programar esto deberíamos escribir algoritmos capaces de identificar todas las combinaciones posibles de formas, colores, texturas que puede llegar a tener una flor (sumado a lo mal que podes sacar una foto u objetos extraños que aparezcan). Esto, como te imaginas, es imposible e impracticable. Pero en algún momento alguien tuvo una excelente idea: que tal si en lugar de tener que programar todas las combinaciones posibles de plantas, le mostramos a un simple programa de computación millones de ejemplos (cuantos mas mejor) de fotos de plantas con sus respectivas especies (training set), y de esta manera el programa armar un modelo (model) que asigne a cada foto la probabilidad de que pertenezca a una especie en particular. Una vez armado ese modelo, al procesar una foto podriamos calcular facilmente que porcentaje tiene de similitud con cada especie. Este proceso se conoce como Machine learning, y es lo que escuchas todo el tiempo como “inteligencia artificial”, pero es tan solo una especialidad dentro del gran campo de la inteligencia artificial. lo que escuchas todo el tiempo como “inteligencia artificial”, es tan solo una especialidad dentro del gran campo de la inteligencia artificial.

Al crear estos modelos, lo que obtenes es un modelo entrenado que te permite clasificar fotos y asignar una probabilidad. Como te imaginarás, cuanto mayor y de mejor calidad sean los ejemplos que le das al programa, mas exacto será la clasificación, y por lo tanto, mas mágico parecerán los resultados. Pero es importante tener en cuenta que es todo un gran ponele, no hay exactitud o razonamiento, en este ejemplo es solo alterar los pixeles de una foto, normalizarlos y comparar los valores con los ejemplos entrenados, para así poder encontrar un numero, una probabilidad, que consideremos aceptable para decir que la planta es de una especie en particular.

Es comun y parte del proceso calcular la cantidad de falsos positivos y falsos negativos que nuestro modelo va a tener, esto depende claro de la cantidad y calidad de los datos con lo que lo entrenamos. Ese proceso se llama validación del modelo y permite calcular dos valores muy importantes la precisión (precision) y el retiro (recall). La precisión indica la certeza con la que reconocemos una planta. El retiro la cantidad de plantas que reconocimos del total disponible. Generalmente se usan datos de validación pre-armados para chequear y probar que el modelo esta funcionando bien.

En Botanicapp una vez cometí un error de calculo y la app pensaba que las zapatillas de mi hijo eran perros Siberianos: Otra observación importante es que el programa que entrenemos, solo va a servir para identificar plantas, no va a servir por ejemplo para identificar personas. De hecho si en el set de ejemplos no hay una especie en particular, esa especie jamas será reconocida. (Botanicapp no tiene ejemplos de suculentas, con lo cual nunca las reconoce, a pesar de ser plantas muy comunes y fácilmente reconocibles por nosotros los seres humanos).

Veamos otro ejemplo que parece magia, el de los autos que se manejan solos. Google trabaja hace años en este problema, los autos autonomos son basicamente autos comunes y corrientes con muchos sensores (un radar) y computadoras a bordo que tomandecisiones de manejo y reacciona de acuerdo a los que el auto ve con esos sensores (muy parecido a como funciona nuestro cerebro). Me acuerdo que cuando trabajana en Mountain View los veia constantemente dar vueltas, incluso los fines de semana. No estaban probando el rendimiento del auto, en realiad estaban recolectando muchas millas de experiencia y decisiones de manejo para poder así entrenar el modelo almacenado en las computadoras del auto (el training set que mencionabamos antes). De esta manera cuantas mas millas de experiencia haya, mejor y mas eficiente va a ser el modo de manejo y las decisiones que el modelo va a tomar. Por ahora ya acumularon 2 millones de millas de experiencia.

Internet y la gran generacion de datos derivados impulso la reciente explosión de Machine Learning, siendo Google el rey, justamente por la gran cantidad de datos que posee. Los servicios que usamos son gratis justamente porque ellos se benefician con nuestros datos derivados que pueden usar para entrenar sus algoritmos. No te olvides que en la mayoría de los servicios gratuitos de internet, vos sos el producto.

La próxima vez que escuches “Inteligencia Artificial”, acordate que en realidad están hablando de “Machine Learning”, y seguramente dicen eso solo para intimidarte.