Curso UIMP: Intelligent Sensor Networks


La última conferencia del curso ha sido sin duda una de las más interesantes. Se ha tratado del uso de los sistemas multiagente para la construcción de redes de cámaras inteligentes (smart cameras) que integran capacidades de visión artificial, razonamiento espacial y temporal y capaces de cooperar en tareas de detección, identificación y seguimiento de objetos. Estas cámaras forman lo que se llama una red de sensores visuales o una red de sensores inteligentes. La charla ha sido impartida por Miguel Ángel Patricio Guisado, del Grupo de Inteligencia Artificial Aplicada (GIAA) Universidad Carlos III de Madrid.

Estos sistemas permiten automatizar muchas tareas onerosas en sistemas de vigilancia, por ejemplo, y cambiar completamente las funciones de los recursos humanos, que tendrán a su disposición información más elaborada. También tienen aplicaciones en sistemas medioambientales.

El paradigma de sistema de inteligencia ambiental se puede ver como un sistema compuesto por redes de sensores inteligentes (i.e con inteligencia embebida) para capturar la información de contexto de los grupos de usuarios y usuarios individuales, incluyendo como de capital importancia los redes de sensores visuales. Otro componente es un sistema de fusión de sensores y construcción de información de contexto, un ecosistema de interfaces multimodales inteligentes y una red de agentes distribuidos a varios niveles para gestionar, adaptar y realizar las tareas encomendadas al sistema. Este paradigma se puede aplicar a sistemas domóticos, sistemas de vigilancia o sistemas de control medioambiental.

Es interesante ver una aplicación más sofisticada de las redes de agentes inteligentes que hemos visto en el taller del curso. Hemos pasado de ver aplicaciones de juguete como la del mercado, la de la sabana, la del tute, a la gestión inteligente de cámaras inteligentes con servicios como la detección y seguimiento de objetos (personas, vehículos, etc.) capaces de colaborar y comunicarse entre sí para realizar esas tareas.

Se mostraron ejemplos de desarrollos realizados por la Aware-Home Research Initiative. La filosofía que se persigue ahora es monitorizar el comportamiento de colectivos (en el caso de los hogares: las familias) para adaptar mejor el interfaz de usuario de los sistemas domóticos tratados como sistemas de inteligencia ambiental.

Un concepto importante que subyace en estos sistemas es el de inteligencia perceptual acuñado por el profesor Alex Pentland del MIT.

El problema de escalabilidad de las redes de sensores

públicos como calles, plazas, estaciones de tren, autobús, metro, etc. Esto es debido a que estos sensores se han abaratado considerablemente. Se puso como ejemplo paradigmático la ciudad de Londres, con más de un millón de cámaras. Surge el problema de cómo gestionar esa gran cantidad de cámaras y cómo analizar toda la información recibida de esa miriada de sensores visuales en un sistema de monitorización. El uso tradicional de seres humanos para la tarea de interpretación de las imágenes se ha convertido en una cosa imposible no ya por el coste en recursos humanos sino por la capacidad limitada en tiempo de la atención de un ser humano. La solución pasa por automatizar la obtención y el preprocesado de las imágenes y la presentación al usuario humano de una información más elaborada y simplificada.

NOTA: Según he podido ver en la web del profesor pentland, a esto se le llama ahora Reality Mining.

Aplicaciones Reales en el Mundo Real

A día de hoy y a pesar de la publicidad ofrecida por las compañías que se dedican al negocio de los sistemas de monitorización (se mencionó a una empresa famosa surgida del mundo académico como ObjectVideo) no se ha conseguido ni mucho menos que los sistemas funcionen en entornos complejos. Esto se debe a que las condiciones de laboratorio son condiciones controladas donde es fácil obtener la información de contexto precisa que necesitan estos sistemas para funcionar de una manera fiable. No obstante los usuarios han encontrado aplicaciones alternativas a estos sistemas imprecisos y limitados.

Como anécdota se contó la de un grupo musical alternativo que se dedicó a grabar un vídeo musical promocional actuando en varios escenarios delante de cámaras de seguridad y aprovechando la ley que exige a los usuarios a los que se graba la posibilidad de recuperar las imágenes donde aparece dudieron montar el vídeo.

Otro ejemplo es el análisis del comportamiento de colectivos de objetos como personas o vehículos. Esto puede ser aprovechado para la gestión de infraestructuras como carreteras, metro, etc. o en centros comerciales, donde se puede determinar las zonas de mayor tráfico de personas para labores de merchandising. Otro ejemplo más espectacular es el análisis de actividades deportivas, el seguimiento de jugadores de fútbol o baloncesto o el comportamiento colectivo de los equipos en los partidos. La información obtenida de estos sistemas puede servir para dar noticias curiosas como el número de kilómetros “recorridos” por el portero de la selección española en la eurocopa o para obtener información de jugadores concretos con valor para entrenadores y cazatalentos.

Evolución de los sistemas de monitorización de vídeo

El ponente explicó la evolución de los sistemas de monitorización desde los vetustos circuitos cerrados de televisión analógicos (CCTV) hasta los actuales completamente digitales como cámaras inteligentes (con agentes inteligentes empotrados con capacidades de visión artificial) conectadas por redes inalámbricas e IP a centros de proceso de datos donde se analizan las imágenes y se elabora el conocimiento e información de contexto necesaria para la aplicación en cuestión.

Sistemas MultiAgente para Redes de Sensores Visuales

En algunas de las transparencias se menciona el trabajo del ponente en este campo en donde abogan por los sistemas multiagente (MAS) como solución al problema de la gestión de sensores virtuales, alineación temporal y espacial, y coordinación en tareas de detección, seguimiento, localización, etc:

Multi-agent framework in visual sensor networks
EURASIP Journal on Applied Signal Processing archive
Volume 2007 , Issue 1 (January 2007) table of contents
Pages: 226 – 226
Year of Publication: 2007
ISSN:1110-8657

NOTA: He buscado en la red sobre el tema del paper con muy interesantes resultados.

Otro objetivo, que es aumentar la capacidad interpretativa de los sistemas, se consigue aumentando la variedad de sensores utilizados (y su adecuada fusión), la representación multimodal de la información obtenida y la construcción de una información de contexto de calidad. El ponente indicó que la incorporación de esta información de contexto va a suponer una revolución en estos sistemas. La interpretación en alto nivel de las escenas va a requerir de esta información de contexto (¿usando CBRs u otras técnicas quizás?)

Trabajos desarrollados en el GIAA

El ponente comentó algunos trabajos que demuestran las mejoras que se pueden obtener utilizando redes de sensores visuales con agentes inteligentes autónomos embebidos. Uno de ello consistió en construir un sistema de tres cámaras para la identificación de individuos a través el iris. Se consiguió un sistema con tres cámaras distribuidas por un laboratorio que eran capaces de localizar y obtener una imagen del iris de una persona a 7 metros de distancia sin necesidad de que la persona mirara a ninguna de las cámaras. Las cámaras colaboran entre sí para localizar al individuo, su cara y sus ojos y obtener una imagen de calidad el iris de uno de sus ojos. La distancia normal de obtención de la imagen del iris es de apenas un metro, mirando sin moverse fijamente a la cámara.

Técnicas Avanzadas

Una técnica de seguimiento muy interesante es la de filtro de partículas que permite definir para cada objeto a seguir una serie de puntos sobre los que se estima sus características cinéticas. Esta técnica ha permitido obtener resultados de detección y seguimiento de múltiples objetos simultáneamente en escenas complejas. El problema que tiene es su coste computacional que ha permitido analizar solamente del orden de 2 fotogramas por segundo. Esto significa que los resultados que se mostraron en los clips de vídeo que nos mostró el ponente en el que se veían imágenes con vehículos y personas en movimiento que eran localizados, marcados y seguidos, fueron el resultado de un costoso análisis offline de las imágenes. Es necesario procesar al menos 7 para obtener un resultado aceptable en imágenes de vídeo en tiempo real.

Hay otras técnicas matemáticas estadísticas de obtención de características de imágenes de vídeo, especialmente caras, como la de Viola-Jones.

Agentes Intencionales (Agentes deliverativos BDI)

Las cámaras inteligentes tienen embebida la capacidad de detectar, reconocer y seguir objetos y personas. Esa capacidad está en forma de servicios que implementan agentes inteligentes autónomos deliberativos (BDI) El ponente mencionó el trabajo de Michael Bratman, un eminente filósofo, sobre la base filosófica sobre la que se sustentan estos agentes deliberativos:

Intention, Plans, and Practical Reasoning (3/15/99)

Michael E. Bratman

Bratman develops a planning theory of intention. Intentions are treated as elements of partial plans of action. These plans play basic roles in practical reasoning, roles that support the organization of our activities over time and socially. Bratman explores the impact of this approach on a wide range of issues, including the relation between intention and intentional action, and the distinction between intended and expected effects of what one intends.

ISBN (Paperback): 1575861925

Subject: Philosophy; Intentionalism; Planning

Yo he encontrado otra referencia interesante que vale la pena leer:

BDI Agents: From Theory to Practice
Anand S. Rao and Michael P. George
Australian Articial Intelligence Institute

Demostraciones

El ponente puso unas cuantas demos en vídeo de sistemas de detección, reconocimiento y seguimiento.

– Los cascos de realidad aumentada de los bomberos
– Los vídeos demostradores de ObjectVideo
– …

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s