Blog

Implementar el machine learning para la detección de emociones

Contenidos

La detección de emociones es el proceso de reconocer o identificar diferentes emociones humanas que incluyen la felicidad, la tristeza, la sorpresa, el asco, el miedo, la ira, la neutralidad y más.

Con los cambios en el estado emocional, el lenguaje corporal de una persona cambia por completo. Hay cambios visibles en las expresiones faciales, el habla, los gestos, los movimientos, etc. Estos parámetros o rasgos del lenguaje corporal se aprovechan para la detección automática de emociones mediante el machine learning.

¿Cómo ayuda el ML en la detección de emociones?

Las aplicaciones basadas en ML pueden detectar emociones aprendiendo lo que significan estos rasgos del lenguaje corporal (rasgos faciales, rasgos del habla, bioseñales, postura, gestos/movimientos corporales, etc.) y aplicar este conocimiento al nuevo conjunto de datos e información proporcionados. Así es como el machine learning ayuda en la detección de emociones!

Hoy en día, existen algoritmos avanzados de ML que pueden extraer y aprovechar puntos de referencia faciales, características/actividades de la voz, bioseñales, gestos/movimientos corporales, patrones de comportamiento motor y más, para detectar emociones a partir de diversas formas de datos como imágenes, vídeos, etc. El uso del algoritmo de ML correcto según el propósito y las necesidades puede ayudar a obtener resultados precisos en la detección de emociones.

Según Markets and Markets, se prevé que el tamaño del mercado mundial de detección y reconocimiento de emociones crecerá hasta alcanzar los 56.000 millones de dólares de los EE.UU. en 2024 (Fuente).

La detección de emociones tiene una notable contribución en varias industrias, entre las que se incluyen la salud, el marketing, el entretenimiento, la vigilancia, el comercio minorista, el comercio electrónico, los recursos humanos y más. El reconocimiento de las emociones está desempeñando un papel importante en la comercialización. Ayuda a las marcas a medir los sentimientos de los usuarios y las reacciones de los usuarios a sus productos.

Por ejemplo, en el servicio de atención al cliente, la detección de emociones mediante algoritmos de ML permite identificar a los clientes enfadados y ayuda a las empresas a resolver sus problemas de forma prioritaria. Además, la IA y el ML ayudan a redirigir la consulta de esos clientes hacia el agente seleccionado que es experto en el manejo de la misma.

El proceso de ML para la detección de emociones tiene múltiples etapas para incluir la entrada/secuenciación de información (imagen, vídeo, datos de audio), preprocesamiento de imágenes, extracción de características mediante algoritmos ML, eliminación de características no deseadas y clasificación mediante algoritmos ML.

Formas de detección de emociones usando machine learning

Hay diferentes maneras o métodos de abordar la detección o el reconocimiento de emociones a través de ML. Veamos las formas más populares aquí.

1. Reconocimiento facial

El reconocimiento facial basado en ML es un método comúnmente utilizado para la detección de emociones. Utiliza el hecho de que nuestros rasgos faciales sufren cambios significativos con las emociones. Por ejemplo, cuando estamos felices, nuestros labios se estiran hacia arriba por ambos extremos. Del mismo modo, cuando estamos emocionados, nuestras cejas se levantan.

El reconocimiento facial es una útil técnica de detección de emociones en la que, mediante la identificación de puntos de referencia faciales y utilizando ML y deep learning, se analizan los píxeles de regiones faciales importantes para clasificar las expresiones faciales. Los principales puntos de referencia faciales utilizados en la detección de emociones a través de ML son características que incluyen los ojos, la nariz, los labios, la mandíbula, las cejas, la boca (abierta/cerrada) y más.

Si bien un punto de referencia facial particular puede parecer similar en dos emociones diferentes, un análisis cuidadoso de la combinación de diferentes puntos de referencia a través de la IA y ML puede ayudar a diferenciar entre emociones de apariencia similar pero también distintas. Por ejemplo, si bien el levantamiento de las cejas puede ser un factor determinante de la sorpresa, lo mismo es también indicativo de temor. Pero, unas cejas levantadas con los límites de los labios levantados indicarían una sorpresa agradable y no miedo.

Un ejemplo complejo es el «asco», identificado a través de una combinación de múltiples cambios en los rasgos faciales que incluyen cejas caídas, nariz arrugada, labio superior levantado y labios sueltos. La detección de emociones a través del reconocimiento facial puede encontrar su uso en la vigilancia, la atención sanitaria y más.

2. Reconocimiento del habla

El reconocimiento de voz para la detección de emociones implica la extracción de características del habla y la detección de la actividad de la voz. El proceso implica el uso del ML para analizar las características del habla para incluir el tono, la energía, el tono, la frecuencia, etc. y la identificación de las emociones a través de los cambios en éstas.

La detección de emociones basada en ML mediante el habla o el reconocimiento de emociones del habla (SER) es popular porque las señales del habla pueden adquirirse de forma cómoda y económica.

El reconocimiento de las emociones del habla mediante ML requiere una buena base de datos del habla, una extracción eficaz de las características y el uso de clasificadores fiables que utilicen algoritmos de ML y procesamiento del lenguaje natural (NLP).

Para obtener resultados precisos, la extracción y la selección de características son importantes. A continuación, la clasificación de los datos en bruto en una clase particular de emoción sobre la base de las características extraídas de los datos se realiza a través de varios algoritmos de clasificación disponibles para incluir el Modelo de Mezcla Gaussiana (GMM), el Modelo de Markov Oculto (HMM), la Máquina de Vectores de Apoyo (SVM), las Redes Neuronales (NN), las Redes Neuronales Recurrentes, etc.

Las principales áreas de aplicación de la SER son la vigilancia de audio, el aprendizaje electrónico, los estudios clínicos, la banca, el entretenimiento, los centros de llamadas, los juegos y muchos más. Por ejemplo, la detección de emociones en el e-learning ayuda a comprender las emociones de los estudiantes y a modificar las técnicas de enseñanza en consecuencia.

3. Bioseñales

La detección de emociones a través de bioseñales es el proceso de análisis de los cambios biológicos que ocurren con los cambios emocionales. Las bioseñales incluyen el ritmo cardíaco, la temperatura, el pulso, la respiración, la transpiración, la conductividad de la piel, los impulsos eléctricos en los músculos y la actividad cerebral. Por ejemplo, un aumento rápido del ritmo cardíaco indica un estado de estrés o ansiedad.

Estas bioseñales o señales fisiológicas ayudan a comprender los estados fisiológicos de los humanos. El reto aquí es que una sola bioseñal no es suficiente porque puede indicar múltiples posibilidades emocionales. Así que se utilizan múltiples bioseñales de diferentes partes del cuerpo y se analizan colectivamente las combinaciones de éstas. Estas bioseñales (combinaciones) son entonces clasificadas usando técnicas de ML para incluir la red neural convolucional (CNN) y más, y algoritmos de clasificación para incluir el árbol de regresión, máquina de vector de apoyo, análisis discriminante lineal, Bayes ingenuo, etc.

Este método es conveniente ya que es fácil registrar y analizar estas bioseñales a través de los dispositivos inteligentes que se llevan hoy en día. Y, para propósitos de salud, también se registran bioseñales más complejas a través de la electroencefalografía (EEG), electrocardiografía (ECG) y electromiografía (EMG).

4. Gestos y movimientos corporales

El análisis de los movimientos y gestos del cuerpo también ayuda a la detección de emociones con la ayuda del ML. Nuestros movimientos corporales, postura y gestos cambian significativamente con los cambios en las emociones. Esta es la razón por la que generalmente podemos adivinar el estado de ánimo básico de una persona con una combinación de sus gestos de manos y brazos y los movimientos del cuerpo. Por ejemplo, un puño cerrado con una postura de alerta es un signo de ira. Y, si una persona está triste, generalmente tendrá una postura aburrida.

Cada cambio de emoción en los seres humanos va acompañado de una serie de gestos y cambios en el movimiento del cuerpo. Por lo tanto, el estudio de una combinación de múltiples gestos y movimientos corporales puede ofrecer una gran comprensión de la detección de emociones con la ayuda de los algoritmos clasificadores ML apropiados y sensores de gestos como Microsoft Kinect, OpenKinect y OpenNI.

El proceso de detección de emociones mediante gestos y movimientos corporales implica la extracción de regiones en partes relevantes del cuerpo, por ejemplo, de las manos para obtener una máscara de la región de la mano. Luego, se realiza un análisis de contorno en esta región que proporciona los contornos y los defectos de convexidad. Esto se utiliza para la clasificación. Cinco dedos extendidos implican manos abiertas y ningún dedo extendido implica un puño.

5. Patrones de comportamiento motor

Utilizando los algoritmos de ML correctos, los cambios en los patrones de comportamiento de una persona con tensión muscular, fuerza, coordinación y frecuencia también ayudan a definir los cambios en el estado emocional. Por lo tanto, actúan como buenos parámetros para la detección de emociones a través del aprendizaje automático. Por ejemplo, los movimientos simétricos de la mano hacia arriba y hacia abajo indican un estado feliz.

Este método aprovecha el hecho de que los músculos de nuestro cuerpo reaccionan significativamente a los cambios en nuestro estado emocional, como una acción refleja. Aunque ni siquiera seríamos conscientes de lo prominentes que son estos cambios, estos cambios de comportamiento motor si se registran y analizan adecuadamente a través de técnicas de aprendizaje automático, actúan como grandes indicadores para la detección de emociones.

Resumen

Idealmente, una combinación de dos o más de estos métodos puede ofrecer los mejores resultados en la detección de emociones a través del ML. Machine learning mejora con el tiempo y, por lo tanto, los resultados de estas técnicas mejoran a medida que la base de datos crece.

Aprovechar el ML en la detección de emociones para entender a los humanos y servirles mejor! Contacta con Juice Studio para el desarrollo de machine learning.

Artículos destacados

From offline to online.

Comparte tus ideas con nosotros