Resolver un problema buscando información en Internet se ha convertido en una actividad cotidiana en todo el planeta para millones de personas. Pero esta acción tan simple para un ser humano puede resultar compleja para un robot. Un equipo de científicos mexicanos ha desarrollado un robot de servicio que busca imágenes y datos en la red para reconocer un objeto, ubicarlo en el espacio más probable en el cual podría estar y entregarlo a la persona que se lo haya pedido.
El proyecto «Aprendiendo de Internet» es liderado por el Dr. Eduardo Morales Manzanares, investigador del Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE), en él han participado estudiantes de maestría y doctorado de este centro público de investigación, ha sido financiado por el Consejo Nacional de Ciencia y Tecnología (Conacyt) y consiste en el desarrollo de nuevos algoritmos que permiten a un robot aprender a buscar en Internet un objeto, reconocerlo, localizarlo en un espacio y finalmente entregarlo al usuario que se lo haya pedido.
El Dr. Eduardo Morales expresa en entrevista que el proyecto original consiste en que un robot resuelva un problema buscando información en Internet. La idea básica es que un usuario le pida un objeto al robot. El robot nunca ha visto el objeto, no lo conoce, pero tiene un mapa del ambiente en el cual va a hacer la búsqueda, sabe dónde se ubica él dentro de ese ambiente, sabe dónde están el cuarto, la cocina, el baño, el comedor, y tiene acceso a Internet.
El investigador del INAOE explica: «El robot primero busca información sobre ese objeto en Internet, como fotos del objeto, y con eso construye un modelo para poder reconocerlo. Es decir, construye un clasificador que dada una imagen puede decir si el objeto está en esa imagen o no. También busca información de cuál sería el lugar más probable en donde puede encontrar el objeto en la casa. Si estamos hablando de una manzana lo más probable es que sea la cocina o el comedor, no esperas encontrarla en el baño, o es poco probable. Esas dos cosas las hace en paralelo y, una vez que aprende el modelo del objeto y conoce los lugares más probables en donde puede encontrarlo, se va a buscarlo. Para ello sigue una estrategia de búsqueda: no necesariamente el lugar más probable en el cual puede hallar el objeto es al cual se dirige primero. Por ejemplo, si el lugar más probable para encontrar una manzana es la cocina pero si para ir ahí tiene que pasar por el comedor, que es el segundo más probable, se va a asomar primero al comedor para ver si está ahí».
El proyecto está tan avanzado que el sistema ya funciona: le piden al robot un objeto, éste lo busca en Internet, va por él e incluso cuenta con un mecanismo para tomarlo y llevárselo al usuario.
«Se trata de un robot de servicio que puede estar en una casa al que le puedes pedir que te lleve los objetos, pero también le puedes pedir cosas para las cuales el robot no estaba programado y en lugar de que se pare, puede buscar en Internet y tratar de solucionar el problema. Eso podría servir para que el robot, una vez que conoce el objeto y sabe dónde está, ya no tenga que hacer de nuevo todas estas operaciones. Si le vuelven a pedir una manzana ya la conoce y sabe dónde está. Puede ir creciendo su conocimiento de los objetos más comunes que hay en una casa y que puede llevarle a un usuario».
Si bien el proyecto Aprendiendo de Internet ha durado casi tres años, el desarrollo de robots de servicio no es nuevo en el INAOE. Desde hace años el equipo del Laboratorio de Robótica ha trabajado en robots como Markovito y Sabina que tienen otras capacidades como seguir a un usuario, reconocerlo o interactuar con él de alguna forma. Este nuevo proyecto es un paso adelante en las innovaciones del área.
El doctor Morales Manzanares subraya que la idea de que el robot aprenda de Internet es atractiva porque es donde hay todo, sólo debe saber buscar y discriminar, y es donde viene la parte complicada porque nosotros hacemos esta actividad de manera natural.
Finalmente, informa que en la actualidad su equipo está empezando a trabajar en un robot que aprenda a hacer tareas viendo videos: «Yo le doy un video al robot de cómo una persona sirve una jarra, o un vino o agua, y con base en los videos el robot debe aprender esa tarea. Esto trae otros problemas porque el video está en 2D y lo que queremos es que el robot se comporte en 3D. Hemos trabajado en enseñarle a un robot a hacer una tarea, usando una cámara de profundidad en donde ve todos los movimientos y la profundidad de los movimientos de una persona haciendo una tarea. Ahora queremos obtener información 3D suficientemente buena a partir de videos en 2D para que el robot aprenda a hacer una tarea».