PLATAFORMA DE HUMANIDADES DIGITALES Y TECNOLOGÍAS DEL LENGUAJE DE LA UNIVERSIDAD DE ALCALÁ

Pedro Sánchez-Prieto Borja

Departamento: Filología, Comunicación y Documentación

Correo electrónico: pedro.sanchezp@uah.es

Presentación

Mi primer contacto cn las humanidades digitales tuvo lugar a mediados de los 90 bajo la forma de colaboración con la RAE en el Corpus Diacrónico del Español, para el que se transcribieron 1500 documentos de hasta el s. XVII de diferentes archivos. Este fue el germen del Corpus de Documentos Españoles a 1700 (CODEA), del que la primera versión digital apareció en la Web en 2011. En 2015 se publicó, también en abierto, otra versión con 2500 documentos y nuevas funcionalidades, entre las que destaca la proyeccción directa a mapa de las formas buscadas filtradas por parámetros de tiempo, lugar, ámbito de emisión, tipología diplomática, participación femenina, etc., con lo que se conseguía una interactividad total. Actualmente está a punto de parece CODEA+ 2022 (4000 documentos) anteriores a 1900, con lematización interactiva completa, lo que va parmitir de manera inmediata combinar la búsqueda por lemas, formas y categoría gramaticales. El buscador se completará con tecnologías procedentes de taxonimías y ontologías (búqueda por ámbitos referenciales de tres niveles, por raíces léxicas y pertenencia de las misma palabras a más de un ámbito referencial, entre otras posibilidades). CODEA ha sido utilizado en numerosos estudios, como recurso exclusivo en muchos de ellos (Cf. Varia lección de la lengua española. Estudios sobre el corpus CODEA, Valencia, Tirant, 2022).
Un consecuenca de la elaboración de CODEA fue la fundación de la Red Internacional CHARTA en 2005 (dirigida por P. Sánchez-Prieto hasta 2017 y desde entonces por B. Almeida), integrada por grupos de España, Venezuela, México, Perú, Italia, Suecia, Inglaterra, Japón, Filipinas, etc. En 2013 se publicaron los criterios de edición digital de fuentes documentales, que han hecho gran fortuna entre los hispanistas, incluso entre algunos grupos de historiadores.
Otra línea ha sido la elaboración del Atlas Lingüístico Diacrónico e Interactivo de la Comunidad de Madrid, con cerca de 900 documentos de 25 archivos hasta el s. XIX incluido de 54 localidades de la Comunidad de Madrid (Cf. La lengua de Madrid a lo largo del tiempo, Sevilla, EUS, 2021). Herramientas avanzadas para la recuperación de información de dicho corpus, como la elaboración de mapas dinámicos de los fenómenos lingüísticos diacrónicos, pueden verse en LYNEAl, conjunto de herramientas elaboradas por H. Ueda, colaborador de GITHE (Universidad de Tokio).
Mi actividad en edición digital ha atendido, de manera paralela a las fuentes literarias de la Edad Media. Se han realizado y revisado numerosas transcripciones de manuscritos, sobre todo los de las obras patrocinadas por Alfonso X. En este marco, se ha colaborado con la Universidadad de Madison en la revisión del corpus alfonsí.
Todos estos trabajos se han elaborado dentro del grupo Grupo de Investigación de Textos para la Historia del Español (GITHE), cuyos miembros han destacado, precisamente, por el trabajo de edición y puesta a disposición de los investigadores bajo forma de corpus digital de un ingente número de fuentes documentales y literarias, tras un amplio trabajo de consulta en los archivos, selección de documentos y elaboración digital.

Publicaciones

Presentaciones y pósters

  • Autores: P. Sánchez-Prieto Borja. Título: “Objetivos de la Red Internacional CHARTA”. Tipo de participación: Organizador y Ponente. Congreso: “Encuentro científico para la fijación de objetivos y líneas de financiación de la Red Internacional CHARTA. Alcalá de Henares, 25-26 junio 2007”- Publicación: No. Lugar de clebración: Alcalá de Henares. Fecha 28-29 septiembre 2007.
  • Autores: P. Sánchez-Prieto Borja, Título: “Propuesta de informatización de un corpus de documentos archivísticos (CODEA. Corpus de Documentos Españoles Anteriores a 1700)”. Tipo de participación: Coorganizador. Congreso: “Encuentro Científico: Propuesta de informatización de un corpus de documentos archivísticos (CODEA. Corpus de Documentos Españoles Anteriores a 1700). Alcalá de Henares, 15-16 octubre 2007”. Publicación: No. Lugar celebración: Alcalá de Henares (Madrid). Fecha: 16 octubre 2007. Autores: P. Sánchez-Prieto Borja. Título: “El Corpus de Documentos Españoles Anteriores a 1700 (CODEA)”. Tipo de participación: Coorganizador. Congreso: “Col·loqui Internacional de Corpus Diacrònics en Llengües Iberorromàniques. Palma de Mallorca, del 25 al 27 d’octubre de 2007”. Publicación: No Lugar celebración: Palma de Mallorca (Baleares) Fecha: 26 octubre 2007
  • Autores: P. Sánchez-Prieto Borja. Título: “WHISCAD-DL”. Tipo de participación: Coordinador y ponente.
  • Congreso: Encuentro Científico “Elaboración de la propuesta del Proyecto Colaborativo World Hispanic Corpus of Archival Documents – Digital Library”, Alcalá de Henares, 4 de abril de 2008. Publicación: No. Lugar celebración: Alcalá de Henares Fecha: 4 abril2008 abril.
  • Autores: P. Sánchez-Prieto Borja. Título: “Hacia un Corpus Mundial de Documentos Hispánicos”. Tipo de participación: Ponencia. Congreso: “Segunda Reunión científica sobre: La creación de un estándar de tratamiento y edición de documentos hispánicos”, Universidad de Valladolid, 23 de mayol de 2008. Publicación: No. Lugar celebración: Valladolid, Fecha: 23 mayo 2008.
  • Autores: P. Sánchez-Prieto Borja. Título: “Un corpus para el estudio integral de fuentes documentales”. Tipo de participación: Ponencia en Mesa Redonda. Congreso: “VIII Congreso de la Asociación Internacional de Historia de la lengua española”, Universidad de Santiago de Compostela, 14-18 de septiembre de 2009. Publicación: Sí. Lugar celebración: Santiago de Compostela. Fecha: 17 septiembre 2009.
  • Autores: P. Sánchez-Prieto Borja. Título: “La red CHARTA: nuevas perspectivas en la edición y estudio de documentos hispánicos”. Tipo de participación: Ponencia inaugural. Congreso: “Congreso Internacional Tradición e Innovación. Nuevas perspectivas para la edición y el estudio de documentos antiguos”, Consejo Superior de Investigaciones Científicas, 11-13 de noviembre de 2009. Publicación: Sí. Lugar celebración: Madrid. Fecha: 11 noviembre 2009.
  • Autores: C. Isasi Martínez, P. Spence, P. Sánchez-Prieto Borja. Título: “Etiquetado TEI de documentos hispánicos”. Tipo de participación: Ponencia. Congreso: “Encuentro Científico sobre Marcación TEI de documentos de CHARTA”, King’s College of London, 15-17 de febrero de 2010. Publicación: No. Lugar celebración: Londres. Fecha: 15-17 febrero 2010.
  • Autores: P. Sánchez-Prieto, M. Carrera, C. Isasi, P. Spence. Título: “El Corpus de CHARTA”. Tipo de participación: Comunicación. Congreso: “XXVI Congrés Internacional de Lingüística i Filologia Romàniques”, Universitat de València, 6-11 de septiembre de 2010. Publicación: Sí. Lugar de celebración: Valencia. Fecha: 7 de septiembre de 2010.
  • Autores: P. Sánchez-Prieto. Título: “Edición electrónica: El Corpus de CHARTA”. Tipo de participación: Organizador y ponente. Congreso: “Encuentro Científico de la Red Internacional Corpus Hispánico y Americano en la Red: Textos Antiguos”, 14-16 de noviembre de 2010. Publicación: No. Lugar de celebración: Sigüenza (Guadalajara). Fecha: 14 de noviembre de 2010.
  • Autores: P. Sánchez-Prieto. Título: “Para una renovación metodológica de la historia de la lengua: desarrollo y explotación del Corpus de Documentos anteriores a 1700 (CODEA)”. Tipo de participación: Ponente. Congreso: “Simposi Internacional de Corpus Diacronics en Llengües Iberorromaniques”, 10-12 de febrero de 2011. Publicación: No. Lugar de celebración: Barcelona. Fecha: 11 de febrero de 2011.
  • Autores: P. Sánchez-Prieto, I. Vicente Miguel. Título: “Corpus de Documentos Españoles Anteriores a 1700”. Tipo de participación: Póster. Congreso: “XVI Congreso Internacional de la Asociación de Lingüística y Filología de la América Latina (ALFAL)”, 6-9 de junio de 2011. Publicación: No. Lugar de celebración: Alcalá de Henares. Fecha: 9 de junio de 2011.
  • Autores: P. Sánchez-Prieto. Título: “Taller sobre edición y estudio de fuentes documentales: el corpus CODEA”. Tipo de participación: Conferenciante invitado. Congreso: “Terceras Jornadas sobre Edición de Textos e Historia de la Lengua: variantes y variación”, 21-23 de marzo de 2012. Publicación: No. Autores: P. Sánchez-Prieto. Título: “Presentación del corpus CHARTA”. Tipo de participación: Ponencia. Congreso: “Periodización del corpus CHARTA y criterios específicos de edición”, 29-30 de marzo de 2012. Publicación: No. Lugar de celebración: CSIC (Madrid). Fecha: 29 de marzo de 2012
  • .Autores: R. Miguel y P. Sánchez-Prieto. Título: “A ‘primary’ corpus of Spanish documents (CODEA)”. Tipo de participación: Comunicación. Congreso: “Ninth Conference of the European Society for Textual Scholarship: Editing Fundamentals: Historical and Literary Paradigms in Sources Editing”, 22-24 de noviembre de 2012. Publicación: Sí. Lugar de celebración: Ámsterdam Fecha: 24 de noviembre de 2012.
  • Autores: P. Sánchez-Prieto. Título: “Hacia un nuevo humanismo (digital): edición de textos, lectura y educación”. Tipo de participación: Ponencia plenaria inaugural. Congreso: “Humanidades Digitales: desafíos, logros y perspectivas de futuro”, 9-12 de julio de 2013. Publicación: No. Lugar de celebración: La Coruña Fecha: 9 de julio de 2013.
  • Autores: B. Almeida y P. Sánchez-Prieto. Título: “Inferencias sobre la cronología de los cambios lingüísticos en la perspectiva de CODEA+ 2015”. Tipo de participación: Comunicación. Congreso: III Internationales Kolloquium zu historischen Corpora der Iberoromanischen Sprachen, 23-25 de junio de 2014. Publicación: Si. Lugar de celebración: Zúrich Fecha: 25 de julio de 2014.
  • Autores: P. Sánchez-Prieto. Título: “El corpus CODEA+ 2015: nuevas perspectivas para la investigación diacrónica”. Tipo de participación: Conferencia de clausura. Congreso: IV Jornadas Monográficas de la AJIHLE. Archivística y Filología: la Historia de la Lengua Española en las fuentes documentales, 6-8 de noviembre de 2014. Publicación: No. Lugar de celebración: Jaén Fecha: 7 de noviembre de 2014.
  • Autores: P. Sánchez-Prieto. Título: “CODEA+ 2015: construcción de un corpus diacrónico de fuentes documentales”. Tipo de participación: Ponencia. Congreso: “Incontri di Orillas. Seminario d’Ispanistica”, 28 de abril de 2015. Publicación: No. Lugar de celebración: Padua (Italia) Fecha: 28 de abril de 2015
  • Autores: B. Almeida, P. Sánchez-Prieto, D. Vázquez. Título: “Para una geografía diacrónica: CODEA+ 2015 como atlas lingüístico dinámico del español”. Tipo de participación: Comunicación. Congreso: “X Congreso Internacional de Historia de la Lengua Española”, 7-11 de septiembre de 2015. Publicación: Sí
  • Lugar de celebración: Zaragoza Fecha: 9 de septiembre de 2015.
  • Autores: P. Sánchez-Prieto. Título: “Para una revisión del peso del factor geográfico en el cambio lingúístico: el corpus CODEA+ 2015”. Tipo de participación: Ponencia. Congreso: “I Jornadas Filológicas Internacionales de la Universidad de La Rioja”, 30 de septiembre-2 de octubre de 2015. Publicación: No. Lugar de celebración: San Millán de la Cogolla Fecha: 1 de octubre de 2015
  • Autores: F. Paredes y P. Sánchez-Prieto. Título: “Propuesta de tipología documental para la red CHARTA. alcance y utilidad”. Tipo de participación: Ponencia. Congreso: “IV Congreso Internacional Tradición e Innovación. Nuevas perspectivas para la edición, la investigación y el estudio de documentos antiguos”, 15-17 de octubre de 2015. Publicación: No. Lugar de celebración: Gotemburgo (Suecia) Fecha: 15-17 de octubre de 2015.
  • Autores: B. Almeida y P. Sánchez-Prieto. Título: “What Corpus, What Users? Questions and Answers on CODEA+ 2015”. Tipo de participación: Comunicación. Congreso: The Annual Meeting of the European Society for Textual Scholarship (ESTS), 19-21 de noviembre de 2015. Publicación: Sí. Lugar de celebración: Leicester (Reino Unido) Fecha: 21 de noviembre de 2015.
  • Autores: P. Sánchez-Prieto y D. Vázquez. Título: “El factor diatópico en la historia de la lengua española: aportaciones del Atlas Lingüístico y Diacrónico del Español (ALDIDI)”. Tipo de participación: Comunicación. Congreso: XXVIII Congresso Internazionale di Linguistica e Filologia Romanza, 18-23 de julio de 2016. Publicación: No. Lugar de celebración: Roma (Italia) Fecha: 19 de julio de 2016.
  • Autores: P. Sánchez-Prieto y D. Vázquez. Título: “Geografia linguistica diacronica a partir de documentos de Madrid. Algunas muestras representativas del ALDICAM‐CM”. Tipo de participación: Comunicación
  • Congreso: Encuentro Científico de la Red Internacional CHARTA, 14-15 de octubre de 2016. Publicación: No. Lugar de celebración: Padua (Italia) Fecha: 15 de noviembre de 2016.
  • Autores: P. Sánchez-Prieto y D. Vázquez . Título: “Del archivo al corpus: edición, filología y lingüística histórica a partir de las fuentes documentales”. Tipo de participación: Ponencia. Congreso: “Del archivo al corpus: edición, filología y lingüística histórica a partir de las fuentes documentales”. Publicación: No
  • Lugar de celebración: Venecia (Italia), Fecha: 13-17 de febrero de 2017.
  • Autores: D. Vázquez y P. Sánchez-Prieto. Título: “Variación diacrónica y diatópica en la comunidad de Madrid a partir de un corpus de documentos archivísticos: ALDICAM-CM”, 9 de mayo de 2018. Tipo de participación: Comunicación. Congreso: X Congreso Internacional de Lingüística de Corpus. Publicación: No. Lugar de celebración: Cáceres, Fecha: 9-11 de mayo de 2018.
  • Autores: P. Sánchez-Prieto. Título: “Geografía lingüística diacrónica de la Comunidad de Madrid: el corpus ALDICAM-CM”, 29 de octubre de 2018. Tipo de participación: Comunicación. Congreso: “CLICE. Congreso de Lingüística de Corpus en Español”. Publicación: Sí. Lugar de celebración: Florencia (Italia), Fecha: 29-30 de octubre de 2018.
  • Autores: P. Sánchez-Prieto y E. Araque. Título: “Hacia un corpus de documentos de los Reyes Católicos”, 30 de octubre de 2018. Tipo de participación: Comunicación. Congreso: “CLICE. Congreso de Lingüística de Corpus en Español”. Publicación: Sí. Lugar de celebración: Florencia (Italia), Fecha: 29-30 de octubre de 2018.
  • Autores: P. Sánchez-Prieto y H. Ueda. Título: “El proyecto ALDICAM-CM: del archivo al atlas”, 1 de marzo de 2019. Tipo de participación: Ponencia. Congreso: Jornadas “La lengua de Madrid ayer y hoy”. Publicación: No. Lugar de celebración: Alcalá de Henares, Fecha: 28 de febrero-1 de marzo de 2019.
  • Autores: P. Sánchez-Prieto y D. Vázquez. Título: “Distribución geográfica del léxico en la Comunidad de Madrid (siglo XVI-XIX)”, 5 de abril de 2019. Tipo de participación: Ponencia. Congreso: III Jornadas Internacionales sobre investigaciones lexicográficas y lexicológicas. Publicación: No. Lugar de celebración: Jaén, Fecha: 4-5 de abril de 2019.
  • Autores: A. Sandoval, P. Sánchez-Prieto y H. Ueda. Título: “Visualización cartográfica de datos lematizados del español clásico: principales. cambios ortográficos en el espacio y en el tiempo”, 12 de septiembre de 2019. Tipo de participación: Comunicación. Congreso: Documentos y monumentos para la historia de la lengua española: VI Congreso de la Red Internacional CHARTA. Publicación: Sí. Lugar de celebración: Sevilla, Fecha: 10-13 de septiembre de 2019.
  • Autores: P. Sánchez-Prieto Borja. Título: ALDICAM: Atlas lingüístico diacrónico e interactivo de la Comunidad de Madrid (Grupo GITHE), 24 de octubre de 2022. Tipo de participación: Comunicación. Congreso: SPADISYN VI Encuentro sobre dialectos del español VI Spanish Dialects Meeting. Publicación: No. Lugar de celebración: Alcalá de Henares, Fecha: 24-25 de octubre de 2022.

Proyectos de investigación

  • Título: Gran corpus documental español de la Edad Media y de los siglos XVI y XVII BFF2001-1041
    Entidad financiadora: Ministerio de Ciencia y Tecnología
    Entidades participantes: Universidad de Alcalá
    Duración: 2002-2005
    Investigador principal: Pedro Sánchez-Prieto Borja
  • Título: Encuentro científico para el establecimiento de criterios de edición de documentos medievales y de los siglos XVI y XVII (HUM2005-25403-E/FILO)
    Entidad financiadora: Acción Complementaria, Ministerio de Educación y Ciencia
    Entidades participantes: Universidad de Alcalá, Consejo Superior de Investigaciones Científicas, Universidad de Murcia, Universidad de Las Palmas de Gran Canaria, Universidad de Valladolid
    Duración: 19 mayo 2006-20 mayo 2006
    Investigador principal: Pedro Sánchez-Prieto Borja. Pilar Díez de Revenga Torres (Universidad de Murcia), Micaela Carrera de la Red (Universidad de Valladolid), Rosa González Monllor (Universidad de las Palmas de Gran Canaria), María Jesús Torrens (Consejo Superior de Investigaciones Científicas), Carmen Isasi (Universidad de Deusto)
    Cuantía: 2000 €
  • Título: Proyecto para la creación de un estándar de tratamiento y edición de documentos hispánicos (HUM2007-29225-E)
    Entidad financiadora: Ministerio de Educación y Ciencia
    Entidades participantes: Universidad de Valladolid, Universidad de Alcalá, Consejo Superior de Investigaciones Científicas, Universidad de Deusto, Universidad de Murcia, Universidad de Las Palmas de Gran Canaria
    Duración: 25/05/ 2007-25/06/08
    Investigador principal: Micaela Carrera de la Red
    Cuantía: 2.000 €.
  • Título: Etiquetado TEI de fuentes documentales
    Entidad financiadora: Gobierno Vasco
    Entidades participantes: Universidad de Deusto, King’s College of London, Universidad de Alcalá
    Duración: 2009-2010
    Investigador principal: Carmen Isasi Martínez.
  • Título: Corpus de Documentos Españoles Anteriores a 1800: CODEA+2015 (FFI2012-33646-)
    Entidad financiadora: Ministerio de Economía y Competitividad
    Entidades participantes: Universidad de Alcalá
    Duración: 2013-2015
    Investigador principal: Pedro Sánchez-Prieto Borja
    Cuantía: 49.970 €
  • Título: Red para un Corpus Diacrónico del Español en el Mundo (RECORDEM) (FFI2015-71829-REDT)
    Entidad financiadora: Ministerio de Economía y Competitividad
    Entidades participantes: Universidad de Alcalá, Consejo Superior de Investigaciones Científicas, Universidad de Granada, Universidad de Málaga, Universidad de Salamanca, Universidad de Sevilla
    Duración: 01/12/2015-30/11/2017
    Investigador principal: Pedro Sánchez-Prieto Borja
    Cuantía: 20.000 €.
  • Título: Atlas Lingüístico Diacrónico e Interactivo de la Comunidad de Madrid (ALDICAM) (H2015/HUM-3443)
    Entidad financiadora: Comunidad de Madrid
    Entidades participantes: Universidad de Alcalá, Consejo Superior de Investigaciones Científicas, Universidad Complutense de Madrid
    Duración: 2016-2019
    Investigador principal: Pedro Sánchez-Prieto Borja
    Cuantía: 138.000 €.
  • Título: Corpus de Documentos Españoles Anteriores a 1900: CODEA+ 2020 (FFI2017-82770-P)
    Entidad financiadora: Ministerio de Economía y Competitividad
    Entidades participantes: Universidad de Alcalá
    Duración: 01/01/2018-30/09/2022
    Investigador principal: Pedro Sánchez-Prieto Borja y Belén Almeida Cabrejas
    Cuantía: 54.450 €.
  • Título: Reproducción sonora alineada de textos de los ss. XII al XIX
    Entidad financiadora: Comunidad de Madrid
    Entidades participantes: Departamento de Filología, Comunicación y Documentación – Universidad de Alcalá
    Duración: 01/04/2021-31/12/2021
    Investigador principal: Pedro Sánchez-Prieto Borja
    Cuantía: 4.700 €.
  • Título: HERES. Patrimonio textual ibérico y novohispano. Recuperación y memoria Atracción de Talento de la Comunidad de Madrid (2018-T1/HUM-10230)
    Entidad financiadora: Comunidad de Madrid
    Entidades participantes: Universidad de Alcalá.
    Investigador principal: Ricardo Pichel.

Recursos

  • Título: Corpus de Documentos Españoles a 1700 (CODEA)
    Tipo de recurso: Corpus
    Creador(a)/Director(a): Pedro Sánchez-Prieto Borja
    Grupo: Grupo de Investigación de Textos para la Historia del Español (GITHE)
    Correo electrónico de contacto: pedro.sanchezp @uah.es
    Enlace: https://corpuscodea.es
Skip to content