Blog

Cómo el COVID-19 está afectando a los datos y a la IA

Contenidos

Desde que el SARS-CoV-2 paró el mundo, hemos visto algunos cambios dramáticos en el comportamiento humano – para los sistemas que monitorean e interpretan «cómo nos movemos» y «lo que hacemos» a través de algoritmos de inteligencia artificial, por otra parte, los buenos datos están causando problemas con varios modelos de datos. Las calles de Nueva York, normalmente muy transitadas, están desiertas, las tiendas tienen muchos menos clientes, y así sucesivamente, todo debido a la pandemia.

Aquí, la inteligencia artificial (IA) y el aprendizaje automático (ML) hacen referencia a sistemas de análisis que utilizan datos estructurados para aprender y completar tareas como a hacer varios tipos de predicciones. En estos casos, la IA se relaciona con sistemas comerciales que se unen a aplicaciones financieras, de inventario, de cara al consumidor y otras para hacer predicciones, donde el ML se utiliza a veces como un subconjunto para el aprendizaje no supervisado para ayudar en la toma de decisiones.

Los datos que actualmente están siendo recopilados e interpretados por los sistemas de IA reflejan que hay menos personas que hacen lo que normalmente hacemos, ya sea viajar, comprar o simplemente visitar los lugares que frecuentamos. Echemos un vistazo a algunos ejemplos y luego sumerjamosnos en las formas en que, si no se controlan, los datos recopilados durante la pandemia alterarán las predicciones impulsadas por la IA.

Ejemplos de las tendencias de la IA hoy en día

Puede parecer una hipérbole decir que la IA se usa para todo hoy en día, pero no está lejos de la realidad. Utilizamos algoritmos de IA y ML – o mejor dicho, están incorporados por las aplicaciones que utilizamos – para inferir relaciones para grandes conjuntos de datos recopilados en virtud de que los usuarios simplemente se comprometen con una aplicación.

Cuando usas una aplicación de cualquier tipo, la mayoría de los sistemas de fondo reúnen datos como el tiempo que pasas en una pantalla determinada, dónde navegas, tu ubicación física desde un GPS, los anuncios que puedes ver o en los que hacer clic, las cosas que puedes comprar y mucho más. Esta información es luego procesada por algoritmos de IA para lograr varios objetivos.

Por ejemplo, Google y Waze utilizan información no identificable (es decir, datos no relacionados con la información personal) recogida por los usuarios cuando viajan para generar modelos de datos como mapas de calor. Cuando buscas en Google un restaurante y observas la sección ‘Horario de mayor afluencia’ que muestra cuán ocupado se espera que esté el lugar, puedes ver esta tendencia generada por un algoritmo de IA que utiliza información histórica y algunos datos de ubicación anónima en tiempo real para darte una idea de cuán ocupado puede estar un lugar en ese momento.

Waze funciona de manera similar para determinar las mejores rutas de tráfico, lo que es increíblemente útil para las áreas metropolitanas congestionadas. Las tendencias se derivan mediante algoritmos de IA que examinan conjuntos de datos históricos y se utilizan junto con datos sobre las carreteras (por ejemplo, límites de velocidad, bloqueos, promedios de duración de las paradas de tráfico, etc.) junto con alguna información en tiempo real para generar la ruta más eficiente para los usuarios.

Dado que la mayor parte de la población no ha tenido más remedio que acogerse a diferentes niveles de confinamiento, estos modelos no sólo están obteniendo menos datos de los normales, sino también datos sesgados, ya que los patrones de movimiento de las personas han cambiado drásticamente. Los datos recogidos en los últimos meses están un poco «apagados» en comparación con lo normal, lo que podría dar lugar a grandes problemas cuando la vida vuelva a la normalidad y estos algoritmos empiecen a hacer predicciones basadas en estos datos.

El problema con los datos atípicos en los algoritmos de IA

Digamos que quisieras inventar tu propio sistema para impulsar una nave al espacio, aterrizar en la Luna y volver a la Tierra. Has diseñado magistralmente una nave espacial que tiene la capacidad de hacerlo porque eres un genio y un ingeniero inteligente.

Ahora asumamos que la NASA ha abierto un lago de datos accesible al público con información recogida de cada viaje espacial, todo el camino de vuelta a las misiones Apolo originales. Con estos datos ajustados a las especificaciones de rendimiento de la nave que construiste, podrías construir un algoritmo de IA que manejaría cada detalle del viaje desde la salida de la atmósfera de la Tierra, ajustando la trayectoria y la velocidad, teniendo en cuenta el cambio de gravedad y los campos electromagnéticos a medida que viaja por el espacio antes de hacer un cómodo aterrizaje en la superficie de la luna.

Los datos de las misiones exitosas serían muy valiosos, pero también hay misiones que no salieron tan bien, a saber, las misiones en las que participaron el Challenger y el Columbia.

Los datos recogidos de las misiones fallidas que acabamos de mencionar (y posiblemente los de las misiones no lunares) tienen el potencial de ofuscar un algoritmo porque son como algo atípico a lo que se consideran «datos sanos» o datos que se alinean con el escenario al que se aplican. Imagine que, después de todo el trabajo mental y físico que ha realizado, su sistema decide centrarse en los datos extrapolados de una misión en la que la nave espacial explotó – en lugar de atravesar la atmósfera, su maravilla de ingeniería se desvía de su curso y los cohetes atraviesan lateralmente la Tierra, obligando a un aterrizaje de emergencia.

Sin alguna intervención manual, o un algoritmo de IA específicamente adaptado (posiblemente secundario), que reconozca los datos erróneos, la información extraída de los conjuntos de datos tiene el potencial de ser tratada del mismo modo. Estamos viendo esto ahora con los sistemas mencionados de Google y Waze. También, estos malos datos están afectando a otros sistemas, así que veamos un par de ejemplos.

IA en el comercio minorista. La mayoría de los negocios de venta al por menor operan alrededor de un modelo que mira las cifras de ventas del año anterior para determinar los objetivos de ventas de un día, especialmente en los almacenes de ladrillos. Uno de mis encargados de marketing describe el sistema utilizado, durante su estancia en un óptica, esencialmente como calcular que las cifras de ventas de un día hacen referencia al mismo día del año anterior y aumentan en un porcentaje modesto.

Este sistema arcaico tiene defectos obvios, ya que no tenía en cuenta el día de la semana entre otros factores pertinentes como la dotación de personal, la disponibilidad de existencias, y así sucesivamente. Comprensiblemente, el cálculo de la cantidad de dinero hecha en un día determinado se convierte en un reto.

Hoy en día, el comercio minorista utiliza algoritmos de IA más sofisticados para proyectar con mayor precisión las cifras de ventas, pero la base de cálculo de las ventas, especialmente en los lugares de fabricación de ladrillos, sigue siendo bastante similar. Con la pandemia de COVID-19 poniendo en peligro las ventas de prácticamente todos los minoristas, sus proyecciones se desvanecerán en los próximos años.

Si se dejan sin control, los datos relativos a los últimos dos meses de cierres provocarán que los negocios proyecten menos ventas para el año siguiente, lo que podría llevar a algunos mejores márgenes para un día futuro, pero afectará a otras áreas como la dotación de personal, ya que la mayoría de los negocios tienden a programarlo en relación a los ingresos esperados. El no tener suficiente personal porque el sistema demanda menos mano de obra probablemente llevará a menos ventas y a oportunidades perdidas por no tener suficiente personal para relacionarse con los clientes.

Aparentemente, este fue un problema frecuente con el antiguo sistema usado en la óptica visitada por mi encargado de marketing, ya que las ventas deslucidas del año anterior obligaban a tener menos personal para el mismo día del año en curso, lo que provocaba que los ópticos se vieran abrumados hasta el punto de que los clientes quedaran desatendidos o el personal del laboratorio recibieran más pedidos de los que pudieran procesar a tiempo.

Por lo tanto, será importante que los analistas de los sistemas de venta al por menor modifiquen su sistema analítico de ventas para eliminar los datos atípicos (o que lo hagan manualmente); de lo contrario, las cifras de ventas seguirán sin coincidir con las proyecciones futuras.

IA para el comercio electrónico y los servicios digitales. Debido a la pandemia, nuestro comportamiento se ha alterado de otras maneras, cambios en el comportamiento de ventas y el mayor consumo de más contenido digital de lo habitual porque, bueno, necesitamos algo que hacer durante todo este tiempo de inactividad. Mientras que esto es bueno para algunos proveedores de servicios, también está causando problemas en otras áreas.

El cambio en las ventas de Amazon es uno de los muchos cambios de comportamiento importantes que estamos presenciando actualmente. Las compañías que normalmente vendían una modesta cantidad de artículos para el hogar como papel higiénico y artículos de limpieza, rápidamente superaron a los productos básicos de Amazon como accesorios para teléfonos.

Al final del día, Amazon se ve afectada marginalmente, mientras que estos artículos de bajo costo típicamente superan a los más caros como los juguetes y otros bienes de entretenimiento. El verdadero problema es cómo los sistemas de respaldo y los algoritmos de IA han respondido a las compras de unidades pandémicas.

Los sistemas de inventario de las principales cadenas de suministro ahora piensan que comprar estos artículos en grandes cantidades es la nueva norma: para la IA, los humanos ahora necesitan desesperadamente grandes cantidades de papel higiénico, productos de limpieza y otros «artículos pandémicos» que de repente se han hecho inmensamente populares a medida que COVID-19 se afianza en el mundo.

Es seguro asumir que algunos almacenes ahora mismo están abrumados tratando de encontrar lugares para poner todo el papel higiénico extra que los sistemas de inventario impulsados por la IA ordenaron automáticamente.

Los servicios de streaming como Netflix, Disney+, Hulu, Amazon Prime, y otros han visto dramáticos incrementos en los suscriptores. Esto es genial para el mercado, pero el problema es que estas ventas son un resultado directo de la pandemia COVID-19.

En el backend, estos servicios requieren más recursos para ejecutar el contenido que se entrega a través de Internet al dispositivo del consumidor. Los mayores servicios de transmisión de contenidos, como Netflix, utilizan modelos de precios especializados que tienen en cuenta el uso previsto de los recursos informáticos (Netflix utiliza AWS) frente al uso real, que se equilibra a lo largo del tiempo.

El aumento del uso hará que Netflix pague más en los próximos meses. Si se deja sin control, los sistemas que calculan el uso harían que Netflix gastara más de lo habitual, basándose en las tendencias actuales, aunque la cantidad de consumo de contenido disminuirá a medida que la gente vuelva al trabajo.

En el caso de Netflix, esto significa que los algoritmos de IA deben ajustarse en consecuencia para acomodar los cambios recientes observados en las tendencias de compra y uso. Sin embargo, si vemos que Netflix aumenta las tarifas de nuestros consumidores en un futuro próximo, es casi seguro que el COVID-19 sea el culpable.

Juice Studio trabaja con la IA para asegurar los mejores resultados para las aplicaciones de nuestros clientes

Afortunadamente, la IA no está en el punto en que, si no se controla, los robots tomarán las armas y comenzarán a esclavizar a la raza humana. Lo que estamos viendo son problemas emergentes con los sistemas de navegación, las predicciones de los visitantes para los almacenes de ladrillo, y los sistemas de venta de predicción. 

En Juice Studio, entendemos el valor de la IA y el ML pero también sabemos que la tecnología es todavía joven y tiene el potencial de aprender de los malos datos. Nos damos cuenta de que la higiene de los datos es importante, lo que significa que es crucial gestionar los datos atípicos y otras aberraciones para evitar que los algoritmos de IA, que de otro modo serían buenos, produzcan malos resultados.

Artículos destacados

From offline to online.

Comparte tus ideas con nosotros