Seminario: Data Integration with Regularized Generalized Canonical Correlation Analysis

COMPARTIR

04/05/2022 - 11:30 hrs

Orador: Profesor Arthur Tenenhaus, CentraleSupelec, Francia.

Resumen: A diferencia de los datos estándar estructurados por una única matriz de datos de individuos x variables, los datos de múltiples fuentes se caracterizan por tener múltiples y heterogéneos bloques de información, interconectados y potencialmente de altas dimensiones. Además, cada fuente de información puede tener también una estructura compleja (por ejemplo, una estructura tensorial). La necesidad de analizar los datos teniendo en cuenta su organización natural parece esencial, pero requiere el desarrollo de nuevos métodos estadísticos. Más concretamente, durante la charla se presentará un marco general para el análisis de datos multibloque mediante el Análisis de Correlación Canónica Generalizada Regularizada.

Arthur Tenenhaus es profesor de estadística/aprendizaje automático en la CentraleSupélec, reconocida por ser la mejor escuela de ingeniería de Francia, y miembro del grupo de Señales y Estadística del Laboratoire des Signaux et Systèmes. También es investigador afiliado al Instituto del Cerebro de París (ICM) en el Hospital La Pitié-Salpêtrière y cotitular de la cátedra APHP-CentraleSupelec- INRIA.

Sus investigaciones se centran principalmente en el desarrollo de un marco estadístico para el análisis conjunto de datos heterogéneos y complejos. Este marco suele estar motivado por aplicaciones en biología molecular y neuroimagen. En total, ha publicado 90 artículos arbitrados y un libro.