Q&A: How to train AI when you don't have enough data
A la izquierda se muestra una imagen de un bebé con una "figura de palo" en 2D creada utilizando un conjunto de puntos clave detectados.A la derecha está el modelo de figura de palo de la pose 3D del bebé.La figura de palo rojo muestra la "verdad fundamental" y la figura de palo azul es la pose 3D estimada con el algoritmo de los investigadores.Crédito: Adaptado dearXiv(2023).DOI: 10.48550/arxiv.2311.12043

La inteligencia artificial sobresale en clasificar información y detectar patrones o tendencias.Pero estos algoritmos de aprendizaje automático deben entrenarse primero con grandes cantidades de datos.

A medida que los investigadores exploran posibles aplicaciones de la IA, han encontrado escenarios en los que la IA podría ser realmente útil, como el análisis de datos de imágenes de rayos X para buscar evidencia de enfermedades raras oDetectando una especie de pez raracapturado en un barco pesquero comercial, pero no hay suficientes datos para entrenar con precisión los algoritmos.

Jenq-Neng Hwang, profesor de electricidad, informática e ingeniería de la Universidad de Washington, se especializa en estos temas.Por ejemplo, Hwang y su equipo desarrollaron un método que enseña a la IA a controlar cuántas posturas distintas puede realizar un bebé a lo largo del día.Hay conjuntos de datos de entrenamiento de bebés limitados, lo que significó que los investigadores tuvieron que crear un canal único para que su algoritmo fuera preciso y útil.

El equipo presentó recientemente este trabajo en laConferencia de invierno IEEE/CVFsobre Aplicaciones de la Visión por Computador 2024. La investigación esdisponibleen elarXivservidor de preimpresión.

UW News habló con Hwang sobre los detalles del proyecto y otras áreas igualmente desafiantes que el equipo está abordando.

¿Por qué es importante desarrollar un algoritmo para rastrear las posturas de los bebés?

Iniciamos una colaboración con la Facultad de Medicina de la Universidad de Washington y el Laboratorio de Inteligencia Artificial del Instituto Coreano de Investigación en Electrónica y Telecomunicaciones.El objetivo del proyecto era tratar de ayudar a las familias con antecedentes de autismo a saber si sus bebés también tenían probabilidades de tener autismo.Los bebés antes de los 9 meses todavía no tienen habilidades lingüísticas, por lo que es difícil saber si son autistas o no.

Los investigadores desarrollaron una prueba, llamadaEscala motora infantil de Alberta, que clasifica varias posturas que los bebés pueden hacer: si un bebé puede hacer esto, obtiene dos puntos;y si pueden hacerlo, obtienen tres puntos;etcétera.Luego sumas todos los puntos y si el bebé está por encima de algún umbral, es probable que no tenga autismo.

Pero para hacer esta prueba, necesitas que un médico observe todas las diferentes posturas.Se convierte en un proceso muy tedioso porque a veces, pasadas tres o cuatro horas, todavía no hemos visto a un bebé hacer una postura concreta.Quizás el bebé podría hacerlo, pero en ese momento no quiso.Una solución podría ser utilizar IA.Los padres suelen tener un vigilabebés en casa.El monitor para bebés podría utilizar IA para realizar un seguimiento continuo y consistente de las distintas posturas que hace un bebé en un día.

¿Por qué la IA es una buena opción para esta tarea?

Mi experiencia es el estudio del procesamiento de imágenes tradicional y la visión por computadora.Intentábamos enseñar a las computadoras a ser capaces de descubrir poses humanas a partir de fotografías o vídeos, pero el problema es que hay muchísimas variaciones.Por ejemplo, incluso la misma persona usando diferentes atuendos es una tarea desafiante para el procesamiento de imágenes tradicional para identificar correctamente el codo de esa persona en cada foto.

Pero la IA lo hace mucho más fácil.Estos modelos pueden aprender.Por ejemplo, podría entrenar un modelo de aprendizaje automático con una variedad de secuencias capturadas de movimiento que muestren diferentes tipos de personas.Estas secuencias podrían anotarse con las correspondientes poses 3D.Entonces este modelo podría aprender a generar un modelo 3D de la pose de una persona en una secuencia que nunca antes había visto.

Pero en este caso, no hay muchas secuencias de bebés capturadas en movimiento que también tengan anotaciones de poses en 3D que puedas usar para entrenar tu modelo de aprendizaje automático.¿Qué hiciste en su lugar?

No tenemos muchas anotaciones de poses en 3D de videos de bebés para entrenar el modelo de aprendizaje automático por razones de privacidad.También es difícil crear un conjunto de datos en el que un bebé realice todas las posturas posibles que necesitaríamos.Nuestros conjuntos de datos son demasiado pequeños, lo que significa que un modelo entrenado con ellos no estimaría poses confiables.

Pero tenemos muchas secuencias de movimiento 3D anotadas de personas en general.Entonces, desarrollamos este canal.

Primero utilizamos la gran cantidad de secuencias de movimiento 3D de personas normales para entrenar una pose 3D genérica.IA generativamodelo, que es similar al modelo utilizado en ChatGPT y otros tipos GPT-4 de modelos de lenguaje grandes.

Luego ajustamos nuestro modelo genérico con nuestro conjunto de datos muy limitado de secuencias de movimientos de bebés anotadas.Luego, el modelo genérico puede adaptarse al pequeño conjunto de datos y producir resultados de alta calidad.

¿Existen otras tareas como esta: buena para la IA, pero no hay muchos datos para entrenar un algoritmo?

Hay muchos tipos de escenarios en los que no tenemos suficiente información para entrenar el modelo.Un ejemplo es unque se diagnostica mediante radiografías.La enfermedad es tan rara que no tenemos suficientes imágenes de rayos X de pacientes con la enfermedad para entrenar un modelo.Pero tenemos muchas radiografías de pacientes sanos.Por lo tanto, podemos utilizar la IA generativa nuevamente para generar la imagen de rayos X sintética correspondiente sin enfermedad, que luego se puede comparar con la imagen enferma para identificar regiones de la enfermedad para un diagnóstico posterior.

La conducción autónoma es otro ejemplo.Hay tantos eventos reales que no puedes crear.Por ejemplo, supongamos que está conduciendo y algunas hojas vuelan delante del coche.si usas, el coche podría pensar que algo anda mal y frenar bruscamente, porque nunca antes había visto esta situación.Esto podría provocar un accidente.

A estos los llamamos eventos de "cola larga", lo que significa que es poco probable que sucedan.Pero en la vida diaria siempre vemos cosas aleatorias como ésta.Hasta que descubramos cómo entrenar sistemas de conducción autónoma para manejar este tipo de eventos, la conducción autónoma no puede ser útil.Nuestro equipo está trabajando en este problema combinando datos de una cámara normal con información de radar.La cámara y el radar verifican persistentemente las decisiones de cada uno, lo que puede ayudar a que un algoritmo de aprendizaje automático dé sentido a lo que está sucediendo.

Otros coautores del artículo sobre posturas de bebés son Zhuoran Zhou, asistente de investigación de la Universidad de Washington en el departamento de ingeniería eléctrica e informática;Zhongyu Jiang y Cheng-Yen Yang, estudiantes de doctorado de la Universidad de Washington en el departamento de ingeniería eléctrica e informática;Wenhao Chai, estudiante de maestría de la Universidad de Washington que estudia ingeniería eléctrica e informática;y Lei Li, becaria de doctorado de la Universidad de Copenhague.

Más información:Zhuoran Zhou et al, Adaptación eficiente del dominio mediante generación previa para la estimación de la postura infantil en 3D,arXiv(2023).DOI: 10.48550/arxiv.2311.12043

Información de la revista: arXiv

Citación:Preguntas y respuestas: Cómo entrenar IA cuando no tienes suficientes datos (28 de marzo de 2024)recuperado el 28 de marzo de 2024de https://techxplore.com/news/2024-03-qa-ai-dont.html

Este documento está sujeto a derechos de autor.Aparte de cualquier trato justo con fines de estudio o investigación privados, noparte puede ser reproducida sin el permiso por escrito.El contenido se proporciona únicamente con fines informativos.