radio uned: La inteligencia artificial como herramienta astrofísica


Dentro de las actividades propias del máster oficial de posgrado de inteligencia artificial aplicada que estoy cursando en la UNED, presento aquí un clip de audio emitido en la radio de la UNED hace cinco años, con participantes del Departamento de Inteligencia Artificial de la UNED que imparten el máster y un astrofísico del INTA-CSIC, en el que se habla sobre las aplicaciones de las técnicas de Inteligencia Artificial a la astrofísica.

La referencia concreta del clip de audio (que por cierto está en formato de RealAudio) la he obtenido buscando en la página web de teleUNED donde se encuentra todo el material audiovisual de la UNED:

Programa: PÓNTE AL DÍA (2003/2004)
01/11/2003, de 22:30 a 23:00

Título: La inteligencia artificial como herramienta astrofísica

Contenido: REDES NEURONALES EN ASTRONOMÍA Y ASTROFÍSICA

Participante/s:

José Mira Mira, Catedrático de Inteligencia Artificial (UNED) (Director del curso)
Luis Sarro Baro (Director del curso)
Benjamín Montesinos Comino, Investigador del CSIC (Invitado)

Aunque el título de la emisión parece indicar un enfoque de técnicas de inteligencia artificial conexionista, al final las reflexiones se acaban centrando en técnicas simbólicas de Ingeniería de Conocimiento.

Luis Sarro Barro, que es mi profesor de la asignatura de Minería de Datos en el máster, comienza identificando dos líneas generales en las cuales se puede vislumbrar la aplicación de la inteñigencia artificial a la astrofísica:

1) la tarea genérica de clasificación

– Papel central en Astrofísica
– Cantidad de datos ingentes almacenados en archivos digitales que hay que clasificar y que superan la capacidad de análisis de los astrofísicos (necesidad de automatizar la tarea como una tarea genérica de clasificación)

2) sistemas expertos (ingeniería de conocimiento)

– Necesidad de crear una ontología del conocimiento astrofísico que permita unificar el conocimiento necesario para realizar entre otras la tarea genérica de clasificación y la determinación de esa tarea
– Modelado del conocimiento implícito del astrofísico a la hora de crear los archivos y de procesar la información que hay en ellos

El astrofísico invitado, Benjamín Montesinos Comino, que fue director de la tesis doctoral de Luis Sarro Baro, comenta una de las herramientas que utilizan los astrofísicos en su quehacer profesional: el estudio de espectros. Se observan objetos cósmicos (astronómicos) en diferentes longitudes de onda. A partir de los datos que se obtienen de esas observaciones se elaboran mapas de espectro de dichos objetos, que son como una firma, y sirven tanto para determinar su composición como sus movimientos (traslación, giro, etc)

Este estudio se sistematizó en el siglo XIX en el que se utilizaban prismas y placas fotográficas. A la hora de analizar los datos que revelaban esas placas se utilizaban un montón de recursos humanos. Se cuenta la anécdota en la que en la Universidad de Harvard, se contrataron mujeres que en principio no tenía conocimientos en la materia, y que eran mucho más metódicas y cuidadosas en la clasificación que los hombres, para clasificar las fotos de objetos, de donde surgió la primera clasificación de objetos cósmicos: la “clasificación de Harvard”.

En el siglo XX surgieron los grandes telescopios, los satélites de observación y la digitalización de las observaciones junto con avances en los sistemas de almacenamiento y proceso que permitieron almacenar todo ese conocimiento en archivos digitales electrónicos. El ritmo de crecimiento de los datos ha sido imparable y también la necesidad de automatizar su tratamiento masivo. El primer paso serán (lo dicen en el momento de la emisión) los observatorios virtuales en los que se almacenarán en un repositorio común todas las observaciones realizadas por los diferentes instrumentos de observación repartidos por el planeta y el espacio, que luego los investigadores podrán analizar con el apoyo de herramientas inteligentes de recuperación de la información y clasificación que hagan uso de técnicas de inteligencia artificial.

Uno de los profesores del máster, en concreto el de minería de datos, ha sido antes astrofísico e hizo su tesis doctoral en inteligencia artificial sobre el asunto. Comenta, en relación al asunto de la Ingeniería del Conocimiento aplicada a la astrofísica, si es posible extraer de una manera formal y sistemática ese conocimiento, por ejemplo en forma de ontología (un vocabulario consensuado expresado en un lenguaje formal con capacidades de expresar conocimiento en el campo y con estructuras que facilitan la inferencia por parte de agentes inteligentes que realizan tareas en el campo), para luego utilizarlo para procesar la ingente información obtenida de las observaciones del universo. La respuesta es que sí, si bien en el momento de hacer esta este programa radiofónico no se ha iniciado. Esto obstaculiza la utilidad de los observatorios virtuales. Dependiendo de los catálogos de observaciones un mismo objeto astronómico puede denominarse de diferentes maneras.

Luis Sarro Baro identifica la creatividad como un componente importante de la actividad en astrofísica que la inteligencia artificial todavía no cubre pero que hay otros aspectos más tediosos y repetitivos, como la clasificación antes mencionada, que si pueden ser realizadas mediante la inteligencia artificial,
liberando al investigador en tiempo y pensamiento para realizar otras actividades más productivas. Es un nicho a explotar para la IA.

José Mira Mira pregunta a Benjamín Montesinos Comino sobre las posibilidades de introducirse en el apasionante mundo de la astrofísica en España. El científico del CISC sugiere los planetariums de los diversos museos de la ciencia repartidos por España y también las agrupaciones astronómicas. Las universidades y centros de investigación pueden satisfacer la curiosidad sobre estos temas ya que suelen atender las preguntas del público en general, tanto de forma virtual como presencial. Los científicos no son entes aislados en sus despachos.

Luego José Mira Mira pasa a reflexionar sobre el papel de la IA en la astrofísica y se pregunta cómo obtener el conocimiento de un astrofísico, cuál es el conocer astrofísico, y posteriormente cómo se puede poner ese conocimiento en un máquina mediante técnicas de inteligencia artificial (ingeniería del conocimiento) Buscar métodos, tareas, conocimiento declarativo y procedimental, etc. Y le pregunta al astrofísico cómo trabaja él.

Benjamín Montesinos Comino pone un ejemplo de un estudio que está realizando él, el estudio de una estrella, modelar una estrella, por ejemplo las que tienen discos protoplanetarios que pueden dar lugar a planetas. Lo que hace primero es recolectar las observaciones de esa estrella en distintas bandas (infrarrojo, radio, rayos gamma, etc) (las entradas del sistema de inteligencia artificial); hay que buscar también en catálogos para ver qué observaciones hay por ahí y analizarlas. El resultado (salidas del sistema de inteligencia artificial) serían parámetros como la luminosidad, la temperatura, la composición, la velocidad a la que rota, su estado evolutivo, su edad, etc. La cuestión es cómo sistematizar esto para que un sistema de IA lo realice para todo tipo de estrellas con análisis adaptados a cada una.

7 comentarios en “radio uned: La inteligencia artificial como herramienta astrofísica

  1. Respecto al comentario sobre cómo introducirse a la astrofísica en España, he investigado un poco la situación en Cantabria siguiendo las recomendaciones del experto.

    En la Universidad de Cantabria hay un centro de investigación, institución mixta de la Universidad de Cantabria y el CSIC, que es el Instituto de Física de Cantabria (IFCA) que realiza investigaciones entorno a Astronomía, Cosmología y Astrofísica. En concreto, tiene un departamento específico dedicado a la Astrofísica.

    Además, recientemente, han construido un observatorio astronómico, el Observatorio Astronómico de Cantabria (OAC), que es un centro de la Consejería de Medio Ambiente del Gobierno de Cantabria, situado en el término municipal de Valderredible, donde se pueden hacer visitas y se programan actividades. Dicha instalación está gestionada por el IFCA.

    Finalmente hay también una asociación astronómica, AstroCantabria, una entidad cultural, fundada en 1982, que se dedica a la observación del cielo y a la difusión de la Ciencia astronómica, y que organiza numerosas actividades divulgativas y de campo.

  2. En lo que respecta a la ingeniería de conocimiento y las ontologías en astrofísica, la curiosidad me ha llevado a entrar por Google en busca de ese santo grial para los sistemas inteligentes en astrofísica. El único enlace que me ha parecido relevante es el de SchemaWeb con su SPASE ontology. También hay otros enlaces a papers donde seguramente se presentan propuestas de ontologías en ese campo pero desgraciadamente solamente están disponibles con la suscripción a la publicación científica correspondiente.

    También me ha picado la curiosidad en el asunto de los observatorios virtuales. En la misma página del Departamento de Inteligencia Artificial de la UNED hay un enlace al proyecto ASTRID, centrado en el desarrollo y explotación de instrumentación astronómica en grandes instalaciones internacionales de las que España es miembro (Agencia Espacial Europea-ESA, Gran Telescopio Canarias-GTC y en un futuro inmediato, European Southern Observatory-ESO) o en las que puede colaborar a nivel internacional (NASA).

    También he encontrado un artículo en una publicación online relacionada con el espacio donde se explica el concepto del Obervatorio Virtual.

    En Europa la iniciativa de montar la infraestructura para implementar el observatorio virtual la lleva EURO-VO (The European Virtual Observatory)

    The EURO-VO project aims at deploying an operational Virtual Observatory (VO) in Europe. Its objectives are technology take-up and VO compliant resource provision, building the technical infrastructure and to support its utilization by the scientific community

    En España tenemos una tradición en astronomía derivada de disponer de sitios privilegiados de observación como los que hay en las Islas Canarias (Instituto de Astrofísica de CanariasIAC) que hemos explotado mediante la colaboración a nivel europeo en instrumentos de observación del universo. Por supuesto, tenemos una iniciativa de Observatorio Virtual: The Spanish Virtual Observatory (SVO)

  3. Otra aplicación que he encontrado de la Inteligencia Artificial a la astrofísica me ha venido de la asignatura del máster de Minería de Datos. En el entorno virtual de formación hay una sección donde se proponen proyectos de maestría relacionados con la asignatura y el proyecto propuesto tiene relación directa con el tema que nos ocupa. Se trata de un proyecto basado en el proyecto GAIA, una misión espacial de la Agencia Espacial Europea (ESA) Resulta que la misión de catalogar los objetos del cielo se van a generar un cantidad ingente de datos que deben ser analizados. Para ellos se ha creado un consorcio adhoc llamado DPAC. Se trata de diseñar algoritmos de agrupamiento de los datos obtenidos.

    Aquí pongo el texto de la propuesta:

    PROYECTOS DE MAESTRÍA

    Proyecto de maestría en el área de Minería de Datos

    1.- Contexto:

    GAIA es una misión espacial de la Agencia Europea del Espacio, cuyo lanzamiento está previsto para 2011. Su objetivo fundamental será el estudio de los objetos miembros de nuestra Galaxia (la Vía Láctea) midiendo sus características observacionales (su brillo y cómo está distribuido en las diferentes longitudes de onda) y sus distancias. Se prevé que el número de objetos observados sea del orden de 10^9.

    Dado el elevadísimo volumen de datos generados, se ha decidido crear como parte del proyecto GAIA un consorcio para el procesamiento y análisis de los datos. Se conoce a este consorcio como DPAC en sus siglas en inglés. El DPAC se encuentra dividido en 8 unidades de coordinación de las cuales, la octava, está focalizada en la derivación de parámetros físicos a partir de las observaciones.

    Dentro de la Unidad de Coordinación 8 (CU8) hay un bloque de trabajo denominado Object Clustering Analysis (OCA) cuya misión principal es la de desarrollar las herramientas adecuadas para el análisis de los datos recibidos desde la perspectiva del agrupamiento. Toda la unidad de coordinación 8 está diseñada para que a cada tipo de objeto se le aplique un algoritmo determinado para la extracción de parámetros físicos, y parte de la base de que conocemos bien las clases y subclases de objetos que van a ser observados por GAIA. Sin embargo, dada la ingente cantidad de objetos, es una posibilidad real que nuevas clases de objetos sean observadas por primera vez en una cantidad suficiente como para ser estadísticamente significativas. Por ello, se ha decidido crear este bloque (OCA) con el objetivo de identificar las clases conocidas en un análisis de conglomerados o agrupamiento (clustering) y monitorizar la base de datos de GAIA para detectar nuevas clases/subclases. De ser este el caso, habría que rediseñar toda la CU8 para incluir estos objetos dentro del esquema de análisis.

    2.1- Enunciado I:

    El proyecto se compone de tres etapas:

    1.- codificación en Java e integración en el sistema de DPA (Data Processing and Analysis) de GAIA del algoritmo de clustering no paramétrico via identificación de modas descrito en Journal of Machine Learning, 8, páginas 1687-1723. Puesto que ya está implementado en c y R, el trabajo no será el mismo que si se debiera implementar desde cero.

    2.- Aplicar el algoritmo a los datos sintéticos de preparación de GAIA. Analizar los resultados. Ampliar la base de datos de ejemplos de acuerdo a funciones de densidad de probabilidad construidas a partir de surveys. Seleccionar los atributos que optimizan la interpretabilidad de los clusters obtenidos. Implementar e integrar técnicas de preprocesado y selección de atributos interesantes y no incluidas ya en weka.

    3.- Proponer mejoras teóricas al algoritmo. Estimar las necesidades de memoria y CPU del algoritmo escaladas a un conjunto de datos de 10^9 instancias. Proponer esquemas de ejecución distribuida del algoritmo (paralelización).

    2.2- Enunciado II:

    Realizar un estudio comparativo en profundidad de los resultados de aplicar varias técnicas de clustering a las bases de datos de variabilidad preparatorias de la misión GAIA. Incluye estudio de viabilidad para n~10^8 instancias de estrellas variables, posibilidades de paralelización, robustez, reproducibilidad e interpretabilidad.

    3.- Cronograma general para todos los proyectos:

    Idealmente, a lo largo de todo el proyecto se trabajará simultáneamente en tres líneas paralelas. En la práctica esto quiere decir que, por ejemplo, desde el principio y durante todo el proyecto se trabajará en la búsqueda bibliográfica relevante para el proyecto, al mismo tiempo que se trabaja en las otras dos líneas.

    Línea A:

    1.A- Fase de lectura de bibliografía básica. [75 horas]
    2.A- Fase de pruebas y análisis con software original. [50 horas]
    3.A- Fase de redacción de conclusiones. [100 horas]

    Línea B:

    1.B- Fase de desarrollo. [300 horas]
    1.C- Fase de evaluación y análisis. [200 horas]

    Línea C:

    1.C- Fase de búsqueda bibliográfica. [25 horas]

  4. Hola, quisiera saber si me puedes ayudar con mi tesis basada en el algoritmo de optimizacion de busqueda basado en colonia de hormigas… te agradeceria que me avisara tanto para un sí como para un no lo más pronto posible. Desde ya muchas gracias.

    1. Hola Karina,

      no tengo ninguna experiencia en ant colony optimization aunque naturalmente estoy interesado en el tema ya que es una técnica bioinspirada de inteligencia artificial.

      No tengo inconveniente en ayudarte en lo que pueda si está en mi mano. El trabajo de tesis que mencionas, ¿es para un máster de posgrado o para doctorado?

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s