Noticia

Organizamos un concurso dirigido a especialistas en inteligencia artificial, analítica de datos y Big Data sobre “Federated Machine Learning”

6 de Noviembre de 2020

Organizamos un concurso dirigido a especialistas en inteligencia artificial, analítica de datos y Big Data sobre “Federated Machine Learning”

Este mes de octubre ha tenido lugar el Datathon- “Federated Machine Learning” organizado por TECNALIA en el que participaron 16 investigadores a quienes les une su pasión por la tecnología y la innovación en analítica de datos, inteligencia artificial y Big Data.

En el concurso se planteó un problema clásico de inteligencia artificial bajo una estrategia de federación, y la implementación de una solución tecnológica desde la visión de High Perfomance Architectures. Las reglas y los datos asociados se proporcionaron a los participantes al inicio de la iniciativa.

El objetivo principal consistía en aprender sobre una tecnología de actualidad como es la “Federated Machine Learning” compitiendo entre equipos de expertos formados en diversas ramas de la Inteligencia Artificial y High Performance Arquitectures; ingeniería, informática, matemáticas o física.

La federación permite que aquellos clientes que quieren proteger sus datos aglutinen su conocimiento individual en un metamodelo global sin comprometer la privacidad ni la confidencialidad de estos, es decir, evitando el envío de los datos en crudo.

Actualmente existen diferentes líneas de investigación prometedoras en esta temática, muchas de ellas vinculadas a la ciberseguridad. Grupos de investigación de IA empiezan a ver las bondades y las debilidades del enfoque naïve de FML. La naturaleza de los datos, que tiene cada agente individual, puede poner en jaque las ventajas de la federación, exigiendo por tanto nuevos avances a la comunidad científica.

Asimismo, a nivel de arquitectura FML resulta tremendamente atractiva en ese nuevo escenario (edge/fog/cloud) donde una buena gestión de los recursos distribuidos es crítica.

El datathon contemplaba dos retos: datos desbalanceados (no todas las categorías a predecir están igualmente representadas en los datos de cada agente), y planteamiento de solución tecnológica realista para un futuro despliegue.