Los profesores de universidad también
somos investigadores - 2025

Eventos / Viajes

Comparado con 2024, lo cierto es que 2025 fue un año algo más tranquilo en lo que respecta a viajes y eventos. En realidad, mi cuerpo también me pedía frenar un poco después de los años como postdoc, con muchos desplazamientos y asistencia continua a congresos. Fue la primera vez desde 2019 que falté a mi cita anual con ESWC, celebrada este año en Portorož (Eslovenia), donde volvimos a organizar el Knowledge Graph Construction Workshop & Challenge. Christophe Debruyne y Umut Serles se encargaron de llevar el workshop in situ, aunque los meses previos requirieron bastante trabajo de organización, revisión, etc. Además, presentamos un artículo con Romana Pernisch (VU) y Eduard Kamburjan (University of Copenhagen) sobre la relación entre la construcción de grafos de conocimiento y las dependencias en el desarrollo de software. Es una línea que me parece especialmente interesante, ya que los desarrollos basados en ontologías y KGs podrían explorar y explotar mucho más este concepto de dependencia, de forma similar a una librería en pip o maven. Desgraciadamente, ha quedado un poco parada, aunque me gustaría retomarla.

KGCW KGCW

En septiembre hubo dos eventos importantes, aunque solo pude asistir a uno de ellos, ya que se solapaban. En Londres se celebró el que probablemente sea el congreso más importante a nivel mundial en bases de datos (VLDB, Core A*), donde presentamos un vision paper sobre los ecosistemas basados en grafos de conocimiento y su ciclo de vida. Este artículo me hace especial ilusión por varios motivos: i) es el resultado del seminario de Dagstuhl que organizamos en febrero de 2024; ii) es mi primer artículo en un congreso A*; y iii) aunque el número de autores es elevado (correspondiente al grupo de trabajo del seminario), a mi me resulta especialmente significativa la participación de Maurizio Lenzerini, uno de los padres de la integración de datos.

KGCW

El segundo evento fue SEMANTiCS, un congreso del ámbito de la web semántica y los grafos de conocimiento, con una clara orientación hacia la industria. De hecho, más de la mitad de las presentaciones corren a cargo de empresas. Se celebró en Viena, y acudí por dos motivos: i) era chair de workshops y tutoriales; ii) presentaba un artículo sobre la construcción declarativa de collections y containers en RDF junto con Christophe Debruyne y Souail Jaadari. Para nuestra sorpresa (y después de dos nominaciones previas en ISWC en 2023 y 2024), nos llevamos el premio al mejor artículo del congreso. Ya tocaba!

KGCW KGCW

W3C Community Group – KG Construction

Parece que la historia va llegando a su fin. Tras un año algo convulso, desde septiembre [me he ido encargando de resolver muchos de los issues que quedaban abiertos en la especificación más importante de RML (rml-core). En noviembre comenzamos a retomar el contacto con el W3C para evaluar la posibilidad de transformar el Community Group en un Working Group y dar inicio a la estandarización oficial. De hecho, podéis consultar el charter, el documento formal que se envía al consorcio para solicitar el visto bueno. Desgraciadamente, debido a una serie de factores que escapan a nuestro control, nos han comunicado que, por el momento, no se dará comienzo al WG. Habrá que seguir remando!

KGCW

Proyectos

Añado este apartado, ya que ha sido un año intenso en lo relativo a la solicitud y ejecución de proyectos de investigación. En enero solicitamos un proyecto en la convocatoria público-privada de la AEI, GALA, que nos fue concedido en julio y en el que estaremos investigando cómo combinar LLMs y KGs en dominios médicos (se adjunta foto de al kick-off a finales de año). En junio/julio solicitamos, junto con NTT Data, la extensión del Public Procurement Data Space (cuatro años de proyecto), y no fue hasta diciembre cuando nos notificaron su concesión. Aunque nuestro esfuerzo directo es reducido, el contexto del proyecto es excelente para disponer de casos de uso reales e investigar sobre los problemas asociados a la puesta en producción de macroiniciativas de este tipo. También obtuvimos un pequeño proyecto con Mestrelab, en el que estamos ayudándoles a integrar sistemas de IA (principalmente LLMs) para mejorar el sistema de soporte de su aplicación.

KGCW

No todo han sido historias de éxito. En mayo solicitamos un proyecto junto con dos institutos de investigación médica de Valencia, en el marco de la convocatoria de proyectos de IA de la AEI. Se trató de una convocatoria altamente competitiva y el proyecto no fue concedido; aun así, el trabajo está hecho y seguimos buscando oportunidades de financiación que permitan llevarlo a cabo.

Cerramos el año con tres solicitudes más, una de ellas siendo un proyecto europeo.
El resultado de estas propuestas quedará ya para el resumen del año que viene

Miscelánea / Alumni

En cuanto a dirección de trabajos, durante el curso 2024–2025 he dirigido varios TFGs en el Grado de Ingeniería Informática. Adrián Martínez realizó su TFG sobre la extracción automática de restricciones para grafos de conocimiento usando LLMs. Isaac Noya trabajó en un benchmark para el aprendizaje de ontologías a partir de bases de datos relacionales, y Estela Bernárdez abordó el problema del entity linking en el dominio médico. Por su parte, co-dirigí el TFM de Saray Alvite en el Máster en Patrimonio Cultural Digital, centrado en MPC, un geoportal gallego orientado a la ciudadanía. Adrián se ha incorporado recientemente al CiTIUS gracias a una beca de inicio a la investigación e Isaac está en Madrid, haciendo el MUIA mientras trabaja con mi director de tesis, Oscar Corcho, en el grupo de Ingeniería Ontológica. A finales de año también participé como tribunal en la tesis de Salvador Gónzalez Gerpe, dirigido por Raúl Castro y María Poveda, del OEG.

Hemos publicado algún artículo más, aunque muchos de los trabajos en los que he estado involucrado este año se encuentran todavía en las últimas fases de revisión y confío en que vean la luz a comienzos de 2026. Quizá el que más ganas tenía de que saliese es BLINKG, el benchmark sobre construcción de grafos de conocimiento con LLMs, por el impacto que creo que puede llegar a tener en la comunidad. También destacaría Semantic-Emofinder, una colaboración con el Instituto de Psicología (IPsiUS) de la USC, donde hemos publicado un conjunto amplio de datos de investigación sobre palabras emocionales modeladas como grafo de conocimiento, junto con una ontología y una aplicación que permite explotar estos datos.

KGCW

A nivel personal, obtuve la acreditación a Profesor Titular y pasé a ser investigador asociado del CiTIUS, cerrando formalmente mi etapa en el DTAI de KU Leuven, aunque la colaboración científica continúa.

Objetivos de 2025

  • Crear el Working Group de RML en el W3C —> Se intentó, aún queda trabajo por hacer
  • Escribir la metodología de LOT4KG para un journal y con casos de uso reales —> Escribimos el paper y nos lo rechazaron en ISWC, ahora estamos escribiendo el paper para el journal.
  • Escribir un artículo sobre el uso de LLMs en Knowledge Engineering para el SWJ —> Sí, aunque no fue para el SWJ, escribimos el artículo de BLINKG
  • Intentar publicar 1 o 2 artículos en revistas fuera del campo de SW —> Sí, varios artículos que se encuentran en las fases finales de revisión.
  • Ir a ISWC en Nara, Japón —> No :(
  • Crear un equipo de trabajo (con estudiantes de doctorado) a medio largo plazo sobre KG+LLMs en el CiTIUS —> Si, gracias al proyecto GALA y al soporte del CiTIUS, tendremos mínimo 3 personas nuevas en el equipo trabajando con nosotros.
  • Dirigir una o dos tesis de máster en el Máster de IA de la USC —> Si, ahora mismo me encuentro dirigiendo 3 tesis del Máster de IA.
  • Conseguir la acreditación de Profesor Titular de Universidad —> Si
  • Escribir una o dos propuestas de proyectos (a poder ser internacionales) —> Si
  • Estudiar/Hacer un curso de Deep Learning —> No (lo empecé y pero lo dejo para 2026).
  • Objetivos para 2026

  • Crear el Working Group de RML en el W3C
  • Escribir y presentar una ERC Starting Grant
  • Estudiar/Hacer un curso de Deep Learning
  • Asegurar estabilidad del equipo de trabajo a 3/4 años vista
  • Escribir un artículo sobre el PPDS para ISWC
  • Encontrar financiación para proyectos puros de Web Semántica / KGs
  • Colaborar con algún otro equipo del CiTIUS
  • Publicar el artículo de LOT4KG
  • Retomar colaboraciones internacionales
  • Alguno de mis estudiantes presenten sus tesis en un Doctoral Consortium (ISWC lo mejor)