PLATAFORMA DE HUMANIDADES DIGITALES Y TECNOLOGÍAS DEL LENGUAJE DE LA UNIVERSIDAD DE ALCALÁ

Descripción

El objetivo principal de esta línea es la recolección, limpieza, anotación y/o tratamiento computacional de textos de diversa índole y escritos en diferentes lenguas (entre las que se incluyen, al menos, el español, el inglés, el francés, el alemán, el chino, el árabe, el griego antiguo y el ruso) así las distintas aplicaciones de estas tecnologías a campos más específicos del saber y/o de la investigación (como, por ejemplo, la historia, literatura, lexicografía, la terminología o la traducción).

Proyectos y recursos

  • Análisis y anotación morfosintácticos (v.g., lematizadores, stemmers, etiquetadores gramaticales – POS taggers). 
  • Análisis y anotación sintácticos (parsers y/o parsing). 
  • Análisis y anotación semánticos (v.g., etiquetadores del sentido – sense taggers, anotación de entidades nombradas, análisis del sentimiento, minería de opiniones).   
  • Análisis y anotación discursivos (v.g., anotación y resolución de anáforas y/o correferencias). 
  • Análisis y anotación pragmáticos (v.g., anotación de ataques contra la imagen). 
  • Análisis y anotación del lenguaje en general y/o en otros niveles (v.g., Voyant-tools, NLP Toolkit, Python, R). 
    • Minería de textos (v.g., modelos neuronales y/o de word-embedding). 
    • Extracción (semi-)automática del léxico y de la terminología. 
    • Tratamiento de multi-word expressions
    • Procesamiento y anotación de lenguas minoritarias (v.g., chabacano, quechua, aimara, shipibo-conibo, etc.). 
  • Compilación, procesamiento, análisis y anotación de corpus de propósito general y específico (v.g., con AntConc). 
    • Análisis métrico de poesía. 
    • Medición de la densidad léxica. 
  • Normalización (estándares) para el desarrollo de recursos lingüísticos (v.g., ISO-Tiger).  
  • Traducción automática. 

Etiquetas

PLN, procesamiento del lenguaje natural, herramientas lingüísticas, modelos computacionales del lenguaje, anotación, marcado, tagging, labelling, lematización, stemming, POS tagging, parsers, entidades nombradas, NLP Toolkit, Python, R, AntConc, Voyant-tools, redes sociales, lexicografía computacional, extractores terminológicos, traducción automática. normalización, estándares.

Integrantes

Skip to content