La “inteligencia artificial” está en boca de todos, pero ¿qué se esconde realmente detrás de esas palabras? Según la Enciclopedia Británica, la inteligencia artificial es la capacidad de una computadora digital o un robot de realizer tareas comúnmente asociadas a un ser inteligente. Esta definición es bastante amplia y abarca desde los servicios de traducción que utilizamos a los robots asesinos de las películas de ciencia ficción.

En la primera parte de este artículo de dos partes hablaremos de las promesas y limitaciones de la inteligencia artificial en el mundo empresarial y en la vida cotidiana. En la segunda parte entraremos más a profundidad en los detalles técnicos y describiremos las diferentes arquitecturas de redes neuronales para aprendizaje profudo y sus aplicaciones.

Una historia turbulenta

Desde la antigüedad, los humanos nos hemos interesado en construir máquinas inteligentes. Incluso en Egipto y Grecia se veneraban autómatas sagrados. Ya en la Edad Media, distintos alquimistas proclamaban haber inventado humanos mecánicos (por ejemplo, la leyenda del Golem de Praga). Quizá la primera certeza de inteligencia mecánica la debemos a Blaise Pascal, quien en 1642 inventó una primera calculadora digital, aunque en esta primera etapa el salto transcendental fue el trabajo de Charles Babbage y Ada Lovelace en calculadoras programables: estas primeras máquinas, antecedentes directos de la computadoras personales de hoy día.
Sin embargo, el término de “inteligencia artificial” como tal se acuñó en una famosa conferencia en Dartmouth en 1956, donde varios expertos que trabajaban en áreas relacionadas se dieron cita para definir una agenda de investigación y unir esfuerzos. Característico de estos años es una sucesión de ilusiones y desilusiones: anuncios engrandecedores que prometían inteligencia suprahumana en los próximos años, seguidos por argumentos apasionados (y muchas veces, justificados matemáticamente) en contra.
En el centro de la controversia, las redes neuronales: una red neuronal es un modelo vagamente inspirado en las neuronas de nuestro cerebro que toma señales de entrada, las multiplica por ciertos pesos y suma el resultado y al resultado de este operación se le aplica una función. Este proceso se inspira de la biología: las neuronas de nuestro cerebro toman y agregan estímulos del exterior (lo que corresponde a la multiplicación y agregación) y deciden si disparar en base a cierto criterio (correspondiendo a la aplicación de una función al final de la primera fase). Los pesos necesarios para agregar la información inicial se obtienen contrastando el resultado de la red neuronal con un valor de referencia: estos pesos se ajustan de manera proporcional a la diferencia de ambos valores.

Desde un principio, las redes neuronales mostraron resultados prometedores, pero al mismo tiempo desencantaron a muchos porque tenían serias limitaciones en la primera versión: al utilizar como funciones de activación funciones sencillas como las lineales, era fácil establecer los límites, y varios investigadores se dieron a la tarea de construir ejemplos donde las redes neuronales no funcionaban. Sin embargo, la situación cambió cuando los investigadores decidieron utilizar redes neuronales con una cantidad masiva de datos: los resultados inmediatamente superaron los algoritmos de punta en una competencia de visión computacional (Imagenet) y siguieron arrasando en otras tareas “benchmark”. Esto fue posible a la combinación de diferentes capas de redes neuronales (el aprendizaje profundo), que describiremos en detalle en la segunda parte.

¿Qué implicaciones tiene?

Esta tecnología tiene un gran potencial, y aunque seguimos muy lejos del optimismo de la inteligencia suprahumana de la década de los sesenta, hay varias áreas que tienen potencial de cambiar en los próximos 5 a 10 años.

1. Transportación autónoma: No solamente veremos automóviles más y más inteligentes, también en nuestras ciudades: varias ciudades en el mundo ya cuentan con parte de su sistema de transporte colectivo automatizado. El transporte marítimo es también un sector que puede ser automatizado, lo que abarataría los costos.

2. Robots en todos lados: Los robots colaborativos ya se encuentran en pequeñas fábricas alrededor del mundo, lejos han quedado los días en que los brazos mecánicos eran propiedad exclusiva de la industria automotriz. Los robots colaborativos son más pequeños y fáciles de programar, y son seguros para trabajar junto con humanos. Estos no reemplazan a los obreros: requieren supervisión y mantenimiento, por lo que se espera también que sea necesario reeducar a la fuerza laboral.

3. Preguntas complejas: sistemas como los desarrollados por Google que pueden atender preguntas complejas, por ejemplo, reservar una mesa en un restaurante, serán más comunes en nuestra vida cotidiana.

4. Generación de contenidos: Avances en lenguaje natural nos permiten generar reseñas deportivas, recetas de cocina y otros contenidos.

5. Procesamiento de facturas y recibos: en este sector también hay empresas disruptivas que buscan automatizar el proceso de recibos, como rossum.ai.

 

¿Cuáles son las limitaciones?

Aunque las promesa de un futuro más sofisticado es grande, también hay obstáculos importantes: el primero es que para muchas aplicaciones se requiere una cantidad importante de datos. Esto se puede corregir de distintas formas, que discutiremos en detalle. En breve, hemos empezado a ver servicios que ofrecen redes neuronales profundas preentrenadas que se pueden personalizar para una tarea concreta a través del aprendizaje por transferencia.

El mayor obstáculo es humano: por un lado, las organizaciones deben adaptar una cultura de datos, que no se puede quedar en el departamento de TI: esta debe estar presente en todos los aspectos de la vida de la organización. Al adoptar esta mentalidad se empiezan a percibir nuevas oportunidades y modelos de negocio, quizás combinando los datos propios con los datos públicos, o haciendo nuevas sociedades para compartir información. Por otro lado, la escasez de talentos en ciencias duras en México es un problema importante. Iniciativas como el Instituto Internacional de Ciencia de Datos buscan cubrir lo que las universidades no han logrado: formar profesionistas competentes no solamente en los aspectos de software, sino de fundamentos matemáticos y conocimientos de negocios.