«Para dar el siguiente paso nos faltan datos sobre cómo interactúan las personas con los robots», explica la profesora, una de las ponentes de la Conferencia Europea de la IA
Nvidia quiere prender la mecha de la robótica humanoide: “No es ciencia ficción”
Para que un robot pueda poner la lavadora o planchar la ropa, como quiere Elon Musk, primero tiene que entender cómo se comportan los humanos que están a su alrededor. Qué implica su lenguaje corporal, sus miradas y sus gestos. Esa interacción humano-máquina es el campo de especialización de Iolanda Leite, profesora asociada en el Real Instituto de Tecnología (KTH) de Suecia que ha liderado investigaciones sobre cómo pueden aprender los robots esos detalles sin los que no podrán compartir nuestros mismos espacios.
En esta entrevista, Leite atienden a elDiario.es horas antes de su intervención en la Conferencia Europea de la Inteligencia Artificial, cuya 50ª edición se ha celebrado este año en Santiago de Compostela. Durante su charla la profesora, especialista en cómo los robots pueden influir en las dinámicas de grupo, especialmente en contextos educativos e inclusivos, ha presentado una investigación en la que demuestra que los sistemas que “aprenden informados por el conocimiento humano” consiguen mejores resultados. Pero para ello, necesitan unos datos de entrenamiento que no son tan fáciles de conseguir como los de inteligencias artificiales como ChatGPT.
¿Qué es un robot social?
Son todos los robots que necesitarán interactuar con las personas o alrededor de ellas. Son los robots de reparto que pueden entregar paquetes de última milla, o algún robot que está en el hospital tratando de poner toallas aquí y allá, o estos robots más interactivos que pueden proporcionar tutoría personalizada para los niños, cosas así. Son los robots que eventualmente estarán a nuestro alrededor en nuestros hogares y lugares de trabajo.
La inteligencia artificial generativa ha explotado en los últimos dos años, con millones de personas utilizando estas nuevas herramientas que entienden muy bien nuestras órdenes y lo que necesitamos. Pero de momento siguen detrás de las pantallas. ¿Qué les falta para llegar al espacio físico?
Es un campo en el que definitivamente también estamos viendo muchos avances, pero todavía están en entornos muy restringidos. Deben tener algún tipo de percepción, habilidades de interacción y capacidad de interactuar de una manera que sea intuitiva para las personas. Necesitamos que el robot pueda entender algunos aspectos del entorno social que le rodea, como actuar de una manera apropiada para las personas que están interactuando con el robot o en su entorno prevean lo que el robot va a hacer. Si nos fijamos en el lenguaje por ejemplo, está muy claro que está basado en turnos, ¿verdad? Das una indicación y recibes algo a cambio. Todo este aspecto de la interacción social es algo en lo que todavía estamos un poco lejos. ¿Cuándo es apropiado interrumpir a una persona? ¿Cuándo debo, como robot, dejar de escucharte y empezar a procesar lo que necesito para responder de forma adecuada?
Si nos fijamos en los modelos de lenguaje [herramientas como ChatGPT], tienen muchos datos en Internet con los que pueden entrenar y aprender en ese aspecto, de cómo se produce la interacción a través de una pantalla. Pero no tenemos esa cantidad de datos sobre la interacción humano-máquina en el mundo real. No tenemos esas simulaciones. Tenemos vídeos, pero es difícil codificarlos para entrenar un robot porque son muy intuitivos para nosotros los humanos, pero que todavía son difíciles de razonar para las máquinas. Estamos hablando de las cosas más simples, como entender si está bien o no cruzar el camino de alguien, cuándo interrumpir, cómo pedir ayuda si se quedan atascados. Son detalles así en los que trabajamos.
Uno de los laboratorios de interactuación entre humanos y robots en los que trabaja Iolanda Leite
¿Cómo se pueden conseguir ese tipo de datos?
El reto es que los conjuntos de datos que utilizamos no son tan grandes y la forma en que los recogemos es a menudo trayendo a la gente al laboratorio o llevando los robots a algún sitio donde tengamos un entorno controlado. Eso significa que no es un método escalable. Pero, por supuesto, ahora también hay industria que está buscando recoger estos datos. Están probando cosas como robots que sean teleoperados por un humano, y que esté tratando de hacer cosas que el humano haría. Así están tratando de recoger datos a mayor escala, pero se necesitan muchos datos para obtener el mismo éxito que estamos viendo en el lenguaje y otras modalidades de IA. El problema con el robot es que hay muchas modalidades diferentes: no es solo el lenguaje, es la visión, es el habla, es todo el aspecto social, el contexto. Así que necesitas datos más complejos y algoritmos más complejos para poner un producto así alrededor de personas.
¿Humanos manejando robots?
La IA es muy autónoma, por supuesto, pero es solo muy autónoma y muy impresionante porque hay muchos humanos detrás codificando datos y afinándola. Hay mucho trabajo humano invisible detrás de estos sistemas. Una de las cosas en las que estamos trabajando, aunque parezca contra intuitivo porque nos centramos en los aspectos humanos de la IA, es en reducir ese trabajo humano que hay por detrás porque supone mucha carga. Muchos de estos trabajos de codificación los realiza gente que ni siquiera conoce el propósito de lo que está haciendo. Por eso también existe la cuestión ética de que la automatización no suponga generar otros trabajos humanos aún más precarios en países menos desarrollados.
¿En qué sectores cree que empezaremos a ver este tipo de robots sociales?
Cuando se piensa en las oportunidades, yo diría que dependerá bastante del país y en qué sectores que no tengamos suficiente gente que quiera trabajar allí. Por ejemplo en el sector médico suele ser difícil reclutar gente, por lo que puede ser una oportunidad. Pero no se trata de sustituir a la gente en esos trabajos, sino de hacer ciertas cosas para que los humanos puedan centrarse en proporcionar la atención adecuada. Cosas como los repartos de material podrían ser fácilmente reemplazadas y creo que eso sería lo primero. Pero es difícil de predecir y dependerá mucho del contexto.
¿Le preocupa la reacción de la gente ante estos robots? ¿Ante una automatización tan visible?
Bueno, el cambio no sucederá de repente. No nos levantaremos un día con robots a nuestro alrededor, sino que será gradual. Ya tenemos aspiradoras o cortacéspedes robóticos. Si el siguiente paso es un robot que pueda poner el lavavajillas por mí o planchar la ropa, creo que la reacción será bastante positiva. Si se trata de sustituir estas tareas que la gente no quiere hacer. Luego siempre está la cuestión de que eventualmente algunos trabajos cambiarán. Ese es un aspecto más complicado de abordar, pero no creo que vaya a ser algo repentino, sino similar a lo que ha ocurrido con los nuevos modelos de lenguaje por ejemplo. Primero la gente lo encuentra muy divertido, luego se acostumbran a ello y su uso poco a poco se normaliza.
¿Esto es algo en lo que los expertos están trabajando actualmente? ¿O es un área que se abordará cuando lleguemos a ese punto?
No, definitivamente ya se está estudiando ahora. En mi área principal de investigación, la interacción humano-robot, ya hay mucha gente que está investigando estos aspectos éticos o simplemente como centrar el enfoque del desarrollo en el usuario. No se trata de, ‘oh, construimos un robot’, sino de que el robot pueda resolver algunas necesidades reales de la gente en un entorno concreto. Así que definitivamente hay mucho cuidado con todo esto y para no caer en el determinismo tecnológico. Por supuesto, eso no quiere decir que no haya algunos Elon Musk en el mundo haciendo las cosas a su manera.
Uno de los robots en los que trabaja el centro de Iolanda Leite
Musk también está intentando desarrollar un androide que dice que sacará a la venta en los próximos años. ¿Qué opina de esas promesas?
Creo que están haciendo buenos avances. Por supuesto, creo que es muy optimista sobre los retos, pero tiene que serlo porque es un hombre de negocios y tiene que vender la idea. Tal vez al hacer eso, está aumentando el riesgo de que luego, si no se cumple lo que promete, haya otro invierno de la robótica o algo así. Por otra parte, también es bueno que ponga el listón a ese nivel, ya que la gente va a tratar de superarlo. No es solo Tesla la que está trabajando en ello. Hay muchas otras empresas ahora investigando robots humanoides y tratando de implementarlos en el mundo real.
¿El futuro de la robótica es que las máquinas se parezcan a los humanos? ¿Androides como el que desarrolla Elon Musk?
Hay una buena razón para que estos robots tengan forma humana. Y es porque si queremos que estén en nuestro espacio, no queremos tener que adaptar los espacios al robot. Los espacios están diseñados para nosotros, con las puertas de un tamaño determinado, las mesas de una determinada altura. Así que si los robots tienen una forma humana, es más fácil que puedan hacer las mismas cosas que hacen los humanos.
Su investigación aborda cómo los robots pueden mantener relaciones a largo plazo con los humanos. ¿Qué características debe tener para que una persona quiera interactuar con él repetidamente?
Para que los robots puedan fomentar relaciones a largo plazo con las personas, deben contar con características que los hagan útiles y atractivos. Mi investigación se enfoca en cómo lograr que los robots sean socialmente competentes y efectivos en aplicaciones educativas o terapéuticas, donde su rol va más allá de realizar tareas específicas. Por ejemplo, en el aprendizaje, un robot debe ser capaz de mantener el compromiso de los niños, motivándolos a seguir practicando habilidades como ajedrez o matemáticas. Aún no sabemos con precisión qué características específicas fomentan esta conexión, pero es probable que sean similares a las que observamos en las relaciones humanas. Un buen modelo es el de un profesor que sabe qué ha hecho bien o mal el estudiante en el pasado y ajusta su apoyo en consecuencia. Así, el robot podría adaptar su comportamiento para ofrecer un feedback personalizado, incentivando el aprendizaje continuo y el interés a largo plazo.
En aplicaciones terapéuticas, como en el caso de la rehabilitación física, un robot también puede desempeñar un papel valioso como un entrenador personal. Muchos pacientes deben realizar ejercicios repetitivos y suelen desmotivarse cuando tienen que hacerlos solos en casa. Un robot que actúe como un compañero de ejercicios podría ofrecer apoyo constante, recordando los ejercicios, animando y ayudando a mantener el compromiso en el tiempo.
Como comenta, esas interacciones muchas veces dependen de detalles muy pequeños en los que el robot debe comprender un aspecto social de la comunicación personal ¿Podría explicar algún ejemplo concreto de cómo se trabaja este aspecto?
Hay un ejemplo genial y es muy simple. Demostramos que un robot, solo con mirar a diferentes personas en diferentes momentos, fue capaz de equilibrar la participación de las personas en una conversación. Teníamos este juego en el que un hablante nativo de sueco y una persona que estaba aprendiendo el idioma intentaban adivinar una palabra para el robot. Típicamente, hay un desequilibrio en esa interacción porque el hablante nativo domina la interacción. Así que creamos este escenario desequilibrado para entender realmente que el robot, ignorando al hablante nativo, podía asegurarse de que ambas personas estaban incluidas en la interacción. Demostramos que con un robot autónomo que hacía esto basándose en algún algoritmo de aprendizaje por refuerzo, podemos equilibrar la participación. Esto era solo un juego, pero se puede utilizar para gestionar las interacciones de grupo.
También tenemos una aplicación similar a esa en las escuelas donde tenemos estos grupos de niños que de nuevo, hablante nativo de sueco y niños recién llegados a Suecia. Con un robo simple demostramos que creamos una participación más equilibrada en el juego. Tratamos de analizar si los robots pueden apoyar las interacciones sociales de una manera positiva, así que estamos tratando de usar el robot como una herramienta para mejorar las interacciones sociales entre las personas.