Ideas & Producto 14 Sep 2009 03:13 pm
Extracción de conceptos en textos Biomédicos
Más o menos eso es sobre lo que trata el trabajo que acabo de entregar - que no leer y presentar ante un tribunal y que haré en breve - como fin del Máster de Investigación Informática con el que llevo, y pogo fin a, dos años interesantes.
La idea resumida es como si le pasas a una herramienta automática las palabras “corrupción”, “partidos”, “tesorero”, “políticos”, “tramposos”, o bien el texto de la noticia y que la herramienta te devuelva: “Caso Gürtel” y “Cabrones”.
Pues bien, es eso lo que se ha intentado en el trabajo sólo que aplicado a textos relacionados con la Medicina y la Biología Molecular, campos bastante más bonitos que aquellos de la alta política.
El resumen del trabajo es:
Identificar y extraer cuáles son los conceptos clave relacionados con un texto es un proceso que toma cada vez mayor importancia en Medicina y en Bilogía Molecular dado el incremento exponencial de información existente en forma de artículos científicos, descripciones de experimentos, y anotaciones a enfermedades, medicamentos y procesos. En este trabajo se muestra una herramienta para la anotación automática de textos con conceptos formales definidos en la Ontología del Metathesaurus del Unified Medical Language System (UMLS). El método propuesto no se basa en el acercamiento tradicional propuesto por las herramientas de Procesamiento de Lenguaje Natural (PLN) sino en la ponderación de los conceptos de acuerdo a las frecuencias de aparición de las palabras buscadas en las definiciones. Se informa de los resultados de diferentes experimentos que comparan los resultados obtenidos con los conceptos ofrecidos por herramientas tradicionales y de pruebas revisadas por investigadores expertos y autores de artículos que han sido procesados por la herramienta. Los resultados demuestran que FastUMLS extrae de forma efectiva conceptos sobre textos biomédicos en tiempos más que razonables.
El enlace al trabajo | FastUMLS: Extracción de conceptos en textos biomédicos