Se podría decir que el pico de popularidad de Facebook, la plataforma que ofrece servicios de redes y medios de comunicación sociales, fue durante el año 2008, cuando se expandió a nivel internacional (dos años después, en 2010, ya contaba con 500 millones de usuarios). Desde aquel momento la red social ya se caracterizaba por permitir la opción de “etiquetar amigos”. El proceso era manual: la etiqueta se colocaba en el lugar deseado y posteriormente era necesario teclear el nombre del usuario seleccionado, pero, ¿has notado que ese proceso es automático? ¿Qué lo hace posible?

La respuesta es la Ciencia de Datos. No es una sorpresa, pues se aplican técnicas de programación pertenecientes al Machine Learning, que se usa para resolver situaciones como estimar el precio de una propiedad, generar información a partir de datos existentes o, en este caso, descifrar si una imagen contiene un objeto en específico. El proceso y las herramientas involucradas en esta técnica son parte de sistemas aplicados a lo que se conoce como “reconocimiento facial”.

¿Cómo se “entrena” a una máquina para que realice una acción determinada? Es necesario un algoritmo de Machine Learning que se encargue del vaciado de datos y obtención de resultados a través del siguiente proceso: 

  • Observar la fotografía y encontrar la posición de los rostros
  • Identificar a la persona a través de las facciones de su cara a pesar de que se encuentre en una dirección inesperada o con mala iluminación
  • Notar rasgos que puedan ser particulares y funcionen para diferenciar a una persona de otra (como qué tan grandes son los ojos, qué tan larga es la quijada).
  • Comparar características faciales.

Todas las etapas del proceso detallado anteriormente las realiza automáticamente el cerebro humano, ya que tiene una habilidad muy afinada para realizar reconocimiento facial de forma permanente: sin embargo, las máquinas no tienen la capacidad de generalizar el proceso para ejecutarlo, por lo que se debe entrenar paso por paso de forma separada. Para la realización de este proceso también es menester mencionar que se debe visualizar a manera de conducto: una vez que se resuelve una fase del problema, se toma el resultado obtenido para avanzar al paso siguiente.

Paso a paso: reconocimiento facial

Para que Facebook pueda identificar usuarios en cuestión de segundos es necesario que realice un proceso que se compone de cuatro pasos, los cuales vamos a puntualizar a continuación con la intención de que, poco a poco, la Ciencia de Datos sea algo que comprendamos de manera más sencilla:

  1. Identificación de rostros. Primero, la imagen en cuestión se edita a blanco y negro, ya que no se necesita información sobre el color. Después se hace una revisión pixel por pixel: la imagen original se convierte en una representación HOG que captura las principales características independientemente del brillo. Esta primera etapa representa una búsqueda específica de las áreas de la imagen que será necesario que se analicen más adelante. 
  2. Proyección de los rostros. Una vez que se han identificado las caras dentro de la fotografía, surge una nueva situación que necesita resolverse: cuando el rostro se presenta en una posición distinta, resulta más complicado diferenciar a un individuo de otro basado en los rasgos de su cara, por ello aquí es donde se necesita ejecutar un segundo paso: un algoritmo conocido como “Face landmark estimation” donde se identifican 68 puntos específicos en el rostro analizado.
  3. Encriptación de aspecto. Sería lógico pensar que una opción viable para reconocer un rostro específico es compararlo con toda la información que exista hasta encontrar su identidad, pero ese proceso tardaría horas no milisegundos, por eso se recurre a la comparación de patrones más específicos: como la distancia entre los ojos, el tamaño de las orejas, la longitud y excluir otras características que, de lo contrario, un ser humano tomaría en cuenta, como el color de los ojos o del cabello.
  4. Encontrar el nombre de la persona. Este es, en realidad, el paso más sencillo del proceso. Aquí es necesario ubicar en la base de datos a la persona que encaje dentro de las medidas de rostro específicas que se encriptaron en el paso anterior. Esta última fase se puede resolver gracias al Machine Learning con un algoritmo de clasificación.

Si te interesó este artículo acerca de cómo funcionan algunos procesos de Machine Learning en los aspectos de tu día a día, cuéntanos en los comentarios otros temas de los que quisieras conocer más y de qué forma sería óptimo que lo abordáramos.

FUENTE:

Geitgey, Adam. Machine Learning Is Fun!, Pranav, EE.UU, 2018.