Investigadores españoles logran “enseñar” a un ordenador a clasificar fotografías y vídeos en función de los objetos que aparezcan en ellos

Lun, 29/03/2010 - 12:39

29/03/2010

oficina con archivadores y cartel con logotipo de la Universidad de Granada en Hospital Real

* Actualmente, las búsquedas y clasificaciones en PCs se realizan según el nombre del fichero, carpeta o atributos tales como la fecha o el tamaño, pero no se hace uso de la información visual que contienen Esta técnica pionera, desarrollada en la UGR, permite clasificar fotos o imágenes según aparezcan o no personas en ellas, o algún tipo objeto concreto

Investigadores de la Universidad de Granada han desarrollado una nueva técnica informática que permite “enseñar” al ordenador a interpretar el contenido visual de una imagen en movimiento o una fotografía. Este avance permitiría, por ejemplo, clasificar de forma automática fotografías según aparezcan o no personas en ellas, o algún tipo de objeto concreto, o clasificar escenas de vídeo donde aparecen personas con una pose determinada.

En la actualidad, las búsquedas y clasificaciones de fotografías en PCs se realizan según el nombre del fichero, carpeta o atributos tales como la fecha o el tamaño, pero no se hace uso de la información visual contenida en ellas. El trabajo realizado en la Universidad de Granada permite utilizar este parámetro, y a corto plazo hará que estas técnicas se puedan usar para clasificar escenas de vídeo según la acción que realizan en ellas las personas.

La investigación ha sido llevada a cabo por Manuel Jesús Marín Jiménez, que actualmente trabaja en la Universidad de Córdoba, y dirigida por el profesor Nicolás Pérez de la Blanca Capilla, del departamento de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Granada.

Una pose concreta

Además de detectar cuándo aparecen personas en fotogramas de vídeos o películas de TV, estas nuevas técnicas permiten estimar la posición de sus miembros superiores (cabeza, torso, brazos y antebrazos), así como llevar a cabo una clasificación automática de escenas de vídeo donde aparecen personas con una pose concreta, y reconocer acciones humanas en secuencias de vídeo, tales como caminar, saltar, agacharse…

Como explica Marín Jiménez, en la actualidad existe, a nivel mundial, un gran interés, por parte de multitud de compañías potentes como Microsoft o Google, en conseguir que los computadores sean capaces de interpretar de forma automática el contenido visual de las imágenes y vídeo. “Nuestro trabajo –afirma el investigador- presenta pequeñas aportaciones para avanzar en ese ambicioso problema”.

Los resultados de esta investigación han sido presentados en importantes congresos internacionales, como el International Conference in Pattern Recognition (ICPR) en 2006, o el Computer Vision and Pattern Recognition (CVPR) en 2008 y 2009. Parte de dichos trabajos han sido desarrollados en colaboración con investigadores de la University of Oxford y el ETH de Zurich.

Imágenes ilustrativas:

- Detección de personas en TV:

http://www.robots.ox.ac.uk/~vgg/software/UpperBody/index.html

- Estimación y reconocimiento de poses humanas:

http://www.robots.ox.ac.uk/~vgg/research/pose_estimation/index.html

NOTA: Las imágenes de esos trabajos son en colaboración con la University of Oxford y el ETH de Zurich.

Contacto: Manuel Jesús Marín Jiménez. Departamento de Informática y Análisis Numérico de la Universidad de Córdoba. Teléfono: 957 212 172 – 958 243 301. Correo electrónico: LINK: mjmarin@uco.es -> mailto:

LINK: VER MÁS NOTICIAS DE LA UGR -> http://canalugr.es/prensa-y-comunicacion
LINK: BUSCAR OTRAS NOTICIAS E INFORMACIONES DE LA UGR PUBLICADAS Y/O RECOGIDAS POR EL GABINETE DE COMUNICACIÓN -> http://canalugr.es/buscar/
LINK: RESUMEN DE MEDIOS IMPRESOS DE LA UGR -> http://canalugr.es/medios-impresos
LINK: RESUMEN DE MEDIOS DIGITALES DE LA UGR -> http://canalugr.es/medios-digitales