Sanidad

La Oficina Técnica de Sanidad del Plan TL, integrada por expertos en TL en el campo de la biomedicina pertenecientes al Centro Nacional de Investigaciones Oncológicas (CNIO), ha llevados a cabo los siguientes trabajos:

  • Estudio y asesoramiento sobre potenciales casos de uso que implican el desarrollo de infraestructuras lingüísticas para el procesamiento de informes clínicos en colaboración con diferentes organismos públicos del sistema sanitario español como: la Fundación Pública Andaluza para la gestión de la Investigación en Salud de Sevilla, el AQuAS (Agència de Qualitat i Avaluació Sanitàries de Catalunya), el Hospital 12 de Octubre, la AEMPS (Agencia Española del Medicamento y productos Sanitarios), el IACS (Instituto Aragonés de Ciencias de la Salud), el Servicio Canario de la Salud.
  • Asesoramiento técnico en la elaboración de licitaciones y proyectos tales como estudios análisis de cobertura y ampliación de UMLS pera español o herramientas y métricas de evaluación.
  • Evaluación, análisis y adaptación de herramientas para el procesamiento de texto no estructurado en el ámbito de la biomedicina, tanto de herramientas de dominio general para el español al dominio médico (domain-adaptación) como de dominio biomédico en inglés al español (cross language adaptation): Freeling, TreeTagger, GATE, cTakes, UIMA, DKPro, Genia, DNorm, tmChem entre otros.
  • Construcción de un corpus documental y modelos del lenguaje de dominio médico/biomédico en español a través del desarrollo de recolectores de publicaciones médicas en español integrando y armonizando (formato, normalización documental, metadatos estandarizados) de recursos bibliográficos fragmentados/dispersos (SCIELO, IBECS, MEDES, MedlinePlus, PubMed. etc.) en el ámbito de la medicina, enfermería y ciencias sanitarias. A partir de este corpus se han desarrollado recursos terminológicos y léxicos, una base de datos de abreviaturas médicas y sus definiciones, un corpus paralelo inglés-español médico y un corpus de casos clínicos.
  • Creación de un repositorio preliminar de código abierto y de corpora desarrollado por el equipo de trabajo en GitHub así como estudio de modelos de licencias asociado a los recursos y componentes generados.
  • Generación de un censo y análisis sobre el estado de los recursos terminológicos en biomedicina. Se ha evaluado la cobertura en español de UMLS y SNOMED, así como la viabilidad de enriquecer estos recursos de forma automática o semiautomática. Implementación de CUTEXT, extractor automático de términos médicos y mapeo a UMLS, recopilación de recursos terminológicos médicos, glosarios bilingües médicos y extracción de emparejamientos de entidades nombradas médicas inglés-español.
  • Creación y mantenimiento de cuatro campañas de evaluación que potencien el desarrollo de infraestructuras lingüísticas en el área de la Biomedicina para el Plan TL: (1) “Biomedical Abbreviation Recognition and Resolution (BARR) track" de IBEREVAL 2017 usando literatura médica, (2) “Second Biomedical Abbreviation Recognition and Resolution (BARR2) track" de IBEREVAL 2018 usando casos clínicos y la (3) "Technical interoperability and performance of annotation servers track" en BioCreative V.5 y (4) CHEMPROT sobre el reconocimiento de interacciones entre fármacos y dianas terapéuticas (proteínas/genes) en BioCreative V.
  • Participación de labores de difusión del Plan de Impulso de las Tecnologías del Lenguaje en el área de la Biomedicina.
  • Creación de guías de anotación y corpus para la anotación, resolución y mapeo a vocabulario controlado médico de siglas y abreviaturas médicas en español e inglés así como la anotación de entidades nombradas de genes/proteínas, compuestos químicos y de interacciones entre compuestos químicos y proteínas y genes de tipo farmacológico y alteración de expresión génica. participación en la definición de las guías y procesos de anotación de las subcontrataciones de la encomienda para conceptos que incluyen menciones de enfermedades, síntomas, tratamientos y evidencias textuales para la codificación de casos clínicos.
  • Análisis de herramientas de anotación existentes, adaptación y uso para la evaluación de menciones de entidades nombradas en el contexto de las campañas de evaluación previamente descritas así (AnnotateIt, Markyt MyMiner, BRAT) como su testeo como plataforma de benchmarking.