Comparado con 2024, lo cierto es que 2025 fue un año algo más tranquilo en lo que respecta a viajes y eventos. En realidad, mi cuerpo también me pedía frenar un poco después de los años como postdoc, con muchos desplazamientos y asistencia continua a congresos. Fue la primera vez desde 2019 que falté a mi cita anual con ESWC, celebrada este año en Portorož (Eslovenia), donde volvimos a organizar el Knowledge Graph Construction Workshop & Challenge. Christophe Debruyne y Umut Serles se encargaron de llevar el workshop in situ, aunque los meses previos requirieron bastante trabajo de organización, revisión, etc. Además, presentamos un artículo con Romana Pernisch (VU) y Eduard Kamburjan (University of Copenhagen) sobre la relación entre la construcción de grafos de conocimiento y las dependencias en el desarrollo de software. Es una línea que me parece especialmente interesante, ya que los desarrollos basados en ontologías y KGs podrían explorar y explotar mucho más este concepto de dependencia, de forma similar a una librería en pip o maven. Desgraciadamente, ha quedado un poco parada, aunque me gustaría retomarla.
En septiembre hubo dos eventos importantes, aunque solo pude asistir a uno de ellos, ya que se solapaban. En Londres se celebró el que probablemente sea el congreso más importante a nivel mundial en bases de datos (VLDB, Core A*), donde presentamos un vision paper sobre los ecosistemas basados en grafos de conocimiento y su ciclo de vida. Este artículo me hace especial ilusión por varios motivos: i) es el resultado del seminario de Dagstuhl que organizamos en febrero de 2024; ii) es mi primer artículo en un congreso A*; y iii) aunque el número de autores es elevado (correspondiente al grupo de trabajo del seminario), a mi me resulta especialmente significativa la participación de Maurizio Lenzerini, uno de los padres de la integración de datos.
El segundo evento fue SEMANTiCS, un congreso del ámbito de la web semántica y los grafos de conocimiento, con una clara orientación hacia la industria. De hecho, más de la mitad de las presentaciones corren a cargo de empresas. Se celebró en Viena, y acudí por dos motivos: i) era chair de workshops y tutoriales; ii) presentaba un artículo sobre la construcción declarativa de collections y containers en RDF junto con Christophe Debruyne y Souail Jaadari. Para nuestra sorpresa (y después de dos nominaciones previas en ISWC en 2023 y 2024), nos llevamos el premio al mejor artículo del congreso. Ya tocaba!
Parece que la historia va llegando a su fin. Tras un año algo convulso, desde septiembre [me he ido encargando de resolver muchos de los issues que quedaban abiertos en la especificación más importante de RML (rml-core). En noviembre comenzamos a retomar el contacto con el W3C para evaluar la posibilidad de transformar el Community Group en un Working Group y dar inicio a la estandarización oficial. De hecho, podéis consultar el charter, el documento formal que se envía al consorcio para solicitar el visto bueno. Desgraciadamente, debido a una serie de factores que escapan a nuestro control, nos han comunicado que, por el momento, no se dará comienzo al WG. Habrá que seguir remando!
Añado este apartado, ya que ha sido un año intenso en lo relativo a la solicitud y ejecución de proyectos de investigación. En enero solicitamos un proyecto en la convocatoria público-privada de la AEI, GALA, que nos fue concedido en julio y en el que estaremos investigando cómo combinar LLMs y KGs en dominios médicos (se adjunta foto de al kick-off a finales de año). En junio/julio solicitamos, junto con NTT Data, la extensión del Public Procurement Data Space (cuatro años de proyecto), y no fue hasta diciembre cuando nos notificaron su concesión. Aunque nuestro esfuerzo directo es reducido, el contexto del proyecto es excelente para disponer de casos de uso reales e investigar sobre los problemas asociados a la puesta en producción de macroiniciativas de este tipo. También obtuvimos un pequeño proyecto con Mestrelab, en el que estamos ayudándoles a integrar sistemas de IA (principalmente LLMs) para mejorar el sistema de soporte de su aplicación.
No todo han sido historias de éxito. En mayo solicitamos un proyecto junto con dos institutos de investigación médica de Valencia, en el marco de la convocatoria de proyectos de IA de la AEI. Se trató de una convocatoria altamente competitiva y el proyecto no fue concedido; aun así, el trabajo está hecho y seguimos buscando oportunidades de financiación que permitan llevarlo a cabo.
Cerramos el año con tres solicitudes más, una de ellas siendo un proyecto europeo.
El resultado de estas propuestas quedará ya para el resumen del año que viene
En cuanto a dirección de trabajos, durante el curso 2024–2025 he dirigido varios TFGs en el Grado de Ingeniería Informática. Adrián Martínez realizó su TFG sobre la extracción automática de restricciones para grafos de conocimiento usando LLMs. Isaac Noya trabajó en un benchmark para el aprendizaje de ontologías a partir de bases de datos relacionales, y Estela Bernárdez abordó el problema del entity linking en el dominio médico. Por su parte, co-dirigí el TFM de Saray Alvite en el Máster en Patrimonio Cultural Digital, centrado en MPC, un geoportal gallego orientado a la ciudadanía. Adrián se ha incorporado recientemente al CiTIUS gracias a una beca de inicio a la investigación e Isaac está en Madrid, haciendo el MUIA mientras trabaja con mi director de tesis, Oscar Corcho, en el grupo de Ingeniería Ontológica. A finales de año también participé como tribunal en la tesis de Salvador Gónzalez Gerpe, dirigido por Raúl Castro y María Poveda, del OEG.
Hemos publicado algún artículo más, aunque muchos de los trabajos en los que he estado involucrado este año se encuentran todavía en las últimas fases de revisión y confío en que vean la luz a comienzos de 2026. Quizá el que más ganas tenía de que saliese es BLINKG, el benchmark sobre construcción de grafos de conocimiento con LLMs, por el impacto que creo que puede llegar a tener en la comunidad. También destacaría Semantic-Emofinder, una colaboración con el Instituto de Psicología (IPsiUS) de la USC, donde hemos publicado un conjunto amplio de datos de investigación sobre palabras emocionales modeladas como grafo de conocimiento, junto con una ontología y una aplicación que permite explotar estos datos.
A nivel personal, obtuve la acreditación a Profesor Titular y pasé a ser investigador asociado del CiTIUS, cerrando formalmente mi etapa en el DTAI de KU Leuven, aunque la colaboración científica continúa.