Skip to main content

Análisis y gestión de los datos en la investigación en HD

Contenidos

1. Conceptos básicos de análisis de datos y su gestión en las HD.

2. Análisis de datos en sistemas no relacionales.

3. Recuperación de información y descubrimiento de información en textos de HD

4. Accesibilidad y usabilidad de repositorios en abierto.

Bibliografía complementaria

En nueva versión

1.       García-Marco, Francisco-Javier. “La pirámide de la información revisitada: enriqueciendo el modelo desde la ciencia cognitiva”. El profesional de la información, 2011, enero-febrero, v. 20, n. 1, pp. 11-24. https://revista.profesionaldelainformacion.com/index.php/EPI/article/view/epi.2011.ene.02

2.       Tasovac, T., Chambers, S., and Tóth-Czifra, E. (2020). Cultural Heritage Data from a Humanities Research Perspective: A DARIAH Position Paper. hal-02961317 https://hal.archives-ouvertes.fr/hal-02961317/document

3.       Zweig, Benjamin. 2015. “Forgotten Genealogies: Brief Reflections on the History of Digital Art History”. International Journal for Digital Art History, no. 1 (June). https://doi.org/10.11588/dah.2015.1.21633

4.       Quiroga, N. (2018). El archivo y la toma de notas. El lugar del software en la interpretación histórica. Revista De Humanidades Digitales2, 33–48. https://doi.org/10.5944/rhd.vol.2.2018.21936

5.       Toscano, M., Rabadán, A., Ros, S., & González-Blanco, E. (2020). Digital humanities in Spain: Historical perspective and current scenario. Profesional De La Información29(6). https://doi.org/10.3145/epi.2020.nov.01

6.       Rushkoff, D. y Negro L.J. (2021) Programa o serás programado: diez mandamientos de la era digital. Debate ED. 146 páginas

 

 Videos opcionales del Tema 1: La plataforma DARIAH.EU nos proporciona cinco videos cortos de introducción a las humanidades digitales, realizados por diferentes investigadores extranjeros de reconocido prestigio, Mis humanidades digitales (parte 1, parte 2, parte 3, parte 4 y parte 5). https://teach.dariah.eu/course/view.php?id=50&section=2

En versión anterior

•Aldama, N., Guerrero, M., Montoro, H., and Samy, D. (2022) ‘Anotación de corpus
lingüísticos: Metodología utilizada en el Instituto de Ingeniería del Conocimiento (IIC)’, 17.
https://www.iic.uam.es/whitepapers/anotacion-corpus-linguisticos-metodologia-utilizada-iic/
•Al-Thanyyan, S. S., &Azmi, A. M. (2021). Automated Text Simplification: A Survey. ACM
Computing Surveys, 54(2), 1-36. https://doi.org/10.1145/3442695
•Ayuso García, M. (2022) ‘Las ediciones de Arnao Guillén de Brocar de BECLaR transcritas
con ayuda de Transkribus y OCR4all: Creación de un modelo para la red neuronal y posible
explotación de los resultados’,Historias Fingidas, 0, 151-173. https://doi.org/10.13136/2284-
2667/1102
•Baptiste, B., Favre, B., Auguste, J., and Henriot, C. (2021) ‘Transferring Modern Named
Entity Recognition to the Historical Domain: How to Take the Step?’,Workshop on Natural
Language Processing for Digital Humanities (NLP4DH).Available at:https://hal.archives-
ouvertes.fr/hal-03550384
•Cámara, Alicia; Molina, Álvaro y Margarita A. Vázquez. (2020). Manassero (eds.). ‘La ciudad
de los saberes en la Edad Moderna’, Gijón, Ediciones Trea, 296 pp. Available at:http://e-
spacio.uned.es/fez/view/bibliuned:404-Amolina-1011.
•Campillos-Llanos, L., Terroba, A., Zakhir, S., Valverde, A., &Capllonch, A. (2022). Building a
comparable corpus and a benchmark for Spanish medical text simplification. Procesamiento
del Lenguaje Natural, 69(189-196). https://doi.org/10.26342/2022-69-16
•De Toni, F., Akiki, C., De La Rosa, J., Fourrier, C., Manjavacas, E., Schweter, S., and Van
Strien, D. (2022) ‘Entities, Dates, and Languages: Zero-Shot on Historical Texts with T0.’
Proceedings of BigScience Episode #5 -- Workshop on Challenges and Perspectives in
Creating Large Language Models, 75-83. Available at:
https://doi.org/10.18653/v1/2022.bigscience-1.7

•Devlin J., Ming-Wei Chang, Kenton Lee, Kristina Toutanova (2018). BERT: Pre-training of
Deep Bidirectional Transformers for Language Understanding, Proceedings of the 2019
Conference of the North American Chapter of the Association for Computational Linguistics:
Human Language Technologies, V 1.
•Ehrmann, M., Romanello, M., Fluckiger, A., and Clematide, S. (2020). ‘Extended Overview
of CLEF HIPE 2020: Named Entity Processing on Historical Newspapers.’ 38.
•García-Marco, Francisco-Javier. “La pirámide de la información revisitada: enriqueciendo el
modelo desde la ciencia cognitiva”. El profesional de la información, 2011, enero-febrero, v.
20, n. 1, pp. 11-24. DOI: 10.3145/epi.2011.ene.02
•García-Serrano, A. and Castellanos, A. (2016) ‘Representación y organización
dedocumentos digitales: detalles y práctica sobre la ontología DIMH’. Revista de
Humanidades Digitales, v.1, 314-344, ISSN 2531-1786. Available at:
https://doi.org/10.5944/rhd.vol.1.2017.17155
•García-Serrano, A., and Menta-Garuz, A (2022). ‘La inteligencia artificial en las
Humanidades Digitales: dos experiencias con corpus digitales.’Revista de Humanidades
Digitales, 7, 19-39. ISSN 2531-1786. Disponible en (Fecha de acceso: 21 jun. 2022)
https://doi.org/10.5944/rhd.vol.7.2022.30928
•García-Serrano, Ana; Menta-Garuz, Antonio (2021) Orientaciones y evaluaciones de
técnicas en humanidades digitales: de la estadística al Deep-Learning, “La vía de la
implementación: Herramientas e infraestructuras “, V congreso de la Sociedad Internacional
de Humanidades Digitales Hispánicas - HDH 2021 Libro de resúmenes. Santiago de
Compostela, 4-8 octubre, pag: 58-64 (7).
•Li, J., Sun, A., Han, J., and Li, C. (2022) ‘A Survey on Deep Learning for Named Entity
Recognition.’IEEE Transactions on Knowledge and Data Engineering, 34(1), 50-70.
Available at:https://doi.org/10.1109/TKDE.2020.2981314
•Menta, A., Sánchez-Salido, E., and García-Serrano, A. (2022) ‘Transcripción de periódicos
históricos: Aproximación CLARA-HD’,Proceedings of the Annual Conference of the Spanish
Association for Natural Language Processing 2022: Projects and Demonstrations (SEPLN-
PD 2022). Available at: https://ceur-ws.org/Vol-3224/paper17.pdf
•Molina Martín, Á. (2021) ‘Cartografías del adorno en las residencias nobiliarias de la corte
de Carlos IV: redes y modelos de buen gusto y distinción’Magallanica. Revista de Historia
Moderna, 7(14), 205-235.
•Moreno Sandoval, Antonio (2019) “Lenguas y computación” ISBN: 9788491712732.
Páginas 288. ISBN Digital: 9788491718246. Editorial Síntesis.
•Moreno-Sandoval, A., Gisbert, A., &Montoro, H. (2020). FinT-esp: A corpus of financial
reports in Spanish. Multiperspectives in analysis and corpus design, January, 89-102.
•Rubio, A., &Martínez, P. (2022). HULAT-UC3M at SimpleText@CLEF-2022: Scientific text
simplification using BART. Conference and Labs of the Evaluation Forum.

•Toma Tasovac, Sally Chambers, Erzsébet Tóth-Czifra. (2020) Cultural Heritage Data from a
Humanities Research Perspective: A DARIAH Position Paper. hal-02961317