Archivo de la etiqueta: historia digital

Digitalizar la cultura jurisdiccional

En algún momento del año, Anaclet Pons y Matilde Eiroa nos invitaron a Jairo Melo y a mi a escribir un artículo para la revista Culture & History en el que dejásemos constancia del proyecto que hemos imaginado acerca del análisis de la cultura y la memoria a través de análisis digital de un corpus, en este caso, el de la cultura jurisdiccional. Un proyecto, si no imposible, por el momento muy difícil de realizar dados los pocos avances en los procesos de digitalización robusta de las fuentes. No obstante su intangibilidad –por ahora–, nos resultó un excelente ejercicio de imaginación teórica y metodológica de lo que podría ser un estudio de historia digital en el ámbito hispanohablante y, sobre todo, de interés para un amplio grupo de historiadoras e historiadores en ambos lados del Atlántico.

El resultado acaba de ser publicado para alegrarnos este fin de año, en forma de un texto denso, “Jurisdictional Culture and Memory Digitization of the ‘Government of Justice.’ Data Modeling and Digital Approach for the Legal History of Ibero-America” (Cultura jurisdiccional y digitalización de la memoria del “gobierno de justicia.” Modelado de datos y enfoque digital para la historia del derecho de Iberoamérica), que puede consultarse en su versión original en inglés siguiendo su número DOI: https://doi.org/10.3989/chdj.2018.017

La premisa fue la siguiente: “¿Puede una máquina recuperar el significado cultural de un corpus de fuentes? Este artículo aborda el alcance y las restricciones que representan la digitalización, la transcripción y el modelado de datos para las lecturas automatizadas de registros legales e históricos, en particular aquellos derivados del contexto cultural del imperio hispano. Compara la dicotomía entre la ambigüedad característica de los textos legales del antiguo régimen y la precisión requerida para la legibilidad automatizada. Además, problematiza la lectura corporal, la estrategia de lectura distante y las visualizaciones como un modelo para la interpretación de la gran mayoría de los datos textuales. Se propone un modelo de segmentación y modelado de datos que aborde la lógica textual de los registros legales del antiguo régimen con base en su jerarquización, interrelación con fuentes no judiciales (teológicas, históricas, filosóficas, entre otras), su segmentación interna, la lógica de lectura no lineal de la normativa, así como los argumentos de autoridad requeridos en compilaciones y trabajos legales relevantes. Concluye que las ventajas de la automatización están asociadas a la capacidad de manipular archivos sin distorsionar el significado original de los textos, por lo tanto, propone la necesidad de desarrollar vocabularios estandarizados que ayuden a evitar enfoques anacrónicos con respecto a las fuentes legales de la Edad Moderna.”

Para armar el texto, Jairo y yo nos propusimos hacer algunos borradores con propuestas para la digitalización del corpus, mismas que se pueden ver en el repositorio de proyecto en GitHub: corpusnormae/CNHID

Introducción a la historia digital

Para iniciar este mes de octubre fui invitado por la Dra. Maricruz Romero Ugalde, quien forma parte del claustro académico de la Maestría en Estudios Históricos Interdisciplinarios de la Universidad de Guanajuato, a dar un breve Curso-Taller de Introducción a la Historia Digital. Se trata de un módulo de enseñanza compacto, de carácter teórico – práctico para principiantes. Con duración de una semana, permite una primera inmersión en algunas herramientas y técnicas informáticas para el procesamiento, el análisis y la visualización de datos históricos de manera digital. El curso-taller está inspirado en la experiencia de formar parte, desde 2016, del equipo editorial del proyecto The Programming Historian en español.

Para apoyarnos en el curso-taller, armé una bitácora en WordPress con la idea de que sirviera como referente para las personas asistentes pues contiene información sobre el programa, enlaces a diversos recursos en línea. Paralelamente, una actividad a lo largo del curso-taller fue el que cada persona participante desarrollara su sitio Web, aprovechando la tecnología de los Weblogs. Cada bitácora participante fue enlazada a un blogroll disponible en el menú lateral de la bitácora. Con ello se permitió una navegación constante entre el sitio del curso-taller y los desarrollos que se iban llevando a cabo, además de dejar una memoria en línea del evento.

Un dato interesante es que en el propio acervo de la Universidad, la Biblioteca Armando Olivares Carrillo, pudimos conseguir un texto digitalizado muy interesante que nos sirvió para hacer un ejercicio de visualización de datos mediante una nube de palabras. Se trata de un alegato jurídico escrito por el abogado Fernando Fernández de San Salvador en defensa de la marquesa de San Francisco. Hay que recordar que Fernández de San Salvador fue tío de la famosa Leona Vicario. Hay más información en la entrada respectiva de la bitácora del curso.

Finalmente, el sitio Web quedó en línea conservando la experiencia de esta semana que finaliza, con el nombre de Introducción a la Historia Digital ~ The Programming Historian en español. Un dato curioso es que sesionamos en el edificio de Astronomía y Big Data…

The Programming Historian en DH2018-CDMX

Hoy terminó el Congreso DH2018 en la Ciudad de México, organizado por The Alliance of Digital Humanities Organization (ADHO), El Colegio de México y la Universidad Nacional Autónoma de México con la colaboración de la Red de Humanidades Digitales. Es la primera vez que este tipo de encuentros, que datan de 1990, se realiza en una ciudad de América Latina. La experiencia fue muy interesante; además de la oportunidad de presentar la idea para un proyecto sobre el Análisis de una cultura jurisdiccional, el Corpus jurídico hispano indiano digital, escuchar muchas ideas y propuestas para las humanidades digitales así como conocer a un montón de gente interesante, parte del equipo que editamos The Programming Historian nos reunimos por primera vez de manera presencial.

Del equipo editorial en inglés estuvieron James Baker, Matthew Lincoln y Brandon Walsh y del equipo editorial en español María José Afanador-Llach, José Antonio Motilla y yo.

Pero no solamente nos encontramos. En la mesa SP-13 “Local DH, non-standardization”, María José presentó el proyecto bajo el título: The Programming Historian en español: Estrategias y retos para la construcción de una comunidad global de HD.

El breve resumen dice:

The Programming Historian es un proyecto colaborativo de servicio académico voluntario, que se sostiene en la conformación de redes globales de conocimiento abierto. Desde la creación del equipo editorial de contenidos en español, el proyecto ha enfrentado los retos que suponen encontrar voluntarios que quieran revisar, traducir y crear nuevos tutoriales. Lo anterior, teniendo en cuenta la falta de reconocimiento y validez académica dada la carencia de mecanismos de evaluación de productos de investigación digital. De igual manera, ha resultado un reto garantizar la calidad de los contenidos desde un punto de vista lingüístico. Por último, el proyecto afronta el reto de combinar una aproximación global, que al mismo tiempo respete la diversidad local. Esta presentación es una reflexión sobre la experiencia del equipo de contenidos en español de The Programming Historian en relación al panorama general de las humanidades digitales en el mundo hispanoparlante.

Ideas para un corpus digital DH2018-CDMX

Hoy por la mañana me tocó exponer una idea para un proyecto de historia digital en el que se podría analizar la cultura jurisdiccional de la monarquía hispánica. Como seguramente no tendrá mayor difusión que la presentación verbal en el contexto del DH2018, dejo aquí el amplio resumen por si alguien tiene interés en intercambiar ideas.

Corpus Jurídico Hispano Indiano Digital: Análisis de una Cultura Jurisdiccional

DH2018 – SP08 – Text Analysis, Cultural Studies

El proyecto Corpus de derecho castellano-indiano / digital es una propuesta colectiva e interdisciplinaria que abarca la compilación, digitalización, procesamiento, macroanálisis y publicación anotada en línea del conjunto de los textos jurídicos vigentes en el marco de la monarquía castellana entre el siglo XIII y principios del XIX. El núcleo principal del proyecto es la construcción de un modelo para el macroanálisis de estos textos jurídicos y, en consecuencia, la generación de herramientas analíticas y de consulta del corpus que permitan comprender la interrelación entre sus distintos elementos semánticos y conceptuales y su transformación a través de los siglos y así proponer una interpretación de cómo es que posiblemente funcionaban en el contexto del discurso y la práctica en el orden jurídico tradicional de la cultura jurisdiccional, tanto en el ámbito de la doctrina, del ejercicio de la potestad normativa como en el del actuar cotidiano del aparato de gobierno e impartición de justicia.

El proyecto implica diversas conexiones y diálogos en distintos ámbitos. En el ámbito interdisciplinario, entre los historiadores de la corriente crítica (cultural) del derecho, lingüistas, humanistas digitales y programadores; en el ámbito teórico y metodológico, entre dos posturas acaso antagónicas en apariencia: la lectura densa y cercana de los textos jurídicos hecha por la historia cultural del derecho a lo largo de varias décadas y la lectura distante. Lo anterior nos obliga a discutir ciertos principios teóricos, como lectura densa, tomada por la historia cultural del derecho de la idea de descripción densa (Geertz, 1973), como sistema capaz de ser leído como texto en relaciones contextuales, o un nivel más complejo (Genette, 1992) y su noción de transtextualidad. Varios historiadores del derecho han aplicado incluso algo parecido a la lectura cercana del criticismo literario (Clavero, 1991). Esto interesa al estudiar el derecho de antiguo régimen frente a la posibilidad de aplicación de metodologías computacionales enfocadas, generalmente, a una lectura distante (Moretti, 2013) en la búsqueda de estructuras formales mediante el análisis de grandes cantidades de texto/data. Es justamente necesario pensar en la posibilidad de ensayar no sólo una minería de texto cuantitativa sino en aspectos más cualitativos, modelando campos semánticos que se transforman históricamente.

Cabe aclarar que el criterio de selección de fuentes para la conformación del corpus es complejo y presenta muchos problemas. Responde a una historiografía que ha definido el campo de lo jurídico en el antiguo régimen hispánico como algo más allá del texto jurídico normativo (entendido como ley). Incluye la doctrina de los juristas y de los teólogos por considerarse que la cultura jurídica tiene una estrecha relación con la doctrina católica. El corpus completo abarcaría tanto normas como doctrina y costumbre y se consideran textos jurídicos producidos tanto en Castilla como en los territorios americanos de la monarquía. Por lo tanto, no se trata de un corpus reunido de antemano en su propia época, sino de un corpus compuesto por el conjunto de la comunidad de historiadores dado que se ha analizado su utilización práctica a lo largo de los siglos y en un contexto cultural determinado (Castilla y sus dominios ultramarinos entre los siglos XIII y XIX). Tener claro cómo suponemos que se definía un texto jurídico en el antiguo régimen es de suma importancia ya que el interés del proyecto es generar una comunidad colaborativa de investigación interdisciplinario que determine sus elementos semánticos necesarios para poder caracterizar digitalmente este tipo de textos. Esto es primordial puesto que son textos completamente distintos de los literarios o de otra índole que se han considerado, por ejemplo, en la iniciativa TEI. Dicho de otra forma, el nodo fundamental del problema es cómo se construye un corpus histórico jurídico particular para que sea útil en las humanidades digitales.

Como la reunión del corpus completo es un proyecto a muy largo plazo, en una etapa piloto consideramos que trabajar con los textos normativos puede ser suficiente para ensayar la propuesta de un modelo flexible y escalable. Además, para el caso de los textos normativos ya existe un ordenamiento y un proceso de digitalización previo de esa parte del corpus. De unas 35,355 normas referenciadas se han puesto en línea, de manera digital básica, 26,831 por un grupo de académicos españoles que viene trabajando al respecto desde la década de 1970 y en el que se han ya recogido la mayor parte de las normas legisladas entre el año 1020 y 1868. Por tanto, el objetivo de esta ponencia es discutir los diferentes ejes de nuestra propuesta teórica: 1) el aspecto de su realidad digital, es decir, cuáles son los requisitos para una digitalización óptima de fuentes jurídicas que se presentan en la realidad de maneras diversas –manuscritas, impresas, cuyos contenidos varían ortográfica y semánticamente a lo largo de los siglos-, 2) el problema de qué se concibe como texto propio de la cultura jurisdiccional en el orden jurídico tradicional –no sólo los obviamente jurídicos en apariencia-, y, en consecuencia, 3) los retos que implica el diseño de herramientas digitales propias que permitan el macroanálisis de los textos como datos masivos. Esto, a su vez, implica un problema mayor y de fondo que es el de la conexión entre un necesario abordaje hermenéutico de los textos jurídicos (lectura densa) en una perspectiva de larga duración –desde la baja edad media hasta el fin de la edad moderna– para entender su contexto cultural de sentido, y el reto de procesar dichos textos entendidos como corpus y en forma de datos masivos mediante computadora (lectura distante), no sólo en procesos de segmentación del corpus para su visualización (nubes de palabras, frecuencias relativas y absolutas, KWIC), sino la posibilidad de ensayar, sobre todo, un modelado tópico semántico con objeto de reflexionar sobre cuál sería un modelo de macroanálisis adecuado para este tipo de corpus. Finalmente, proponer un modelo particular para la edición digital del corpus de los textos jurídicos propios de la cultura jurisdiccional del orden jurídico tradicional.

Referencias

Clavero, B. (1991). Antidora: antropología católica de la economía moderna. Milano: Giuffrè
Geertz, C. (1973). The Interpretation of Cultures: Selected Essays. New York: Basic Books.
Genette, G. (1992). The architext : an introduction. Berkeley: University of California Press.
Moretti, F. (2013). Distant Reading. London: Verso.

Las instituciones académicas frente al reto digital

Cada año, en El Colegio de Michoacán se lleva a cabo un evento académico paralelo a la celebración del aniversario de la fundación de la institución, que fue el 15 de enero de 1979. En esta ocasión, trigésimo noveno aniversario, tuve la oportunidad de ser el organizador con una propuesta que nos permitiera reflexionar y discutir acerca de los retos que la revolución tecnológica a impuesto a las instituciones académicas, particularmente a las dedicadas a la investigación y docencia en humanidades y ciencias sociales.

Arrancamos el jueves 18 de enero por la tarde con un taller de introducción a las humanidades digitales, que estuvo estructurado como una presentación de la ruta a seguir para la gestión de proyectos digitales, desde su planeación, propuestas de elaboración hasta la evaluación final. Por ello, el taller tuvo por nombre Guía Roji para las humanidades digitales, como un homenaje al clásico callejero en la cultura mexicana. El taller fue impartido por Natalie M. Baur (Web) y Silvia Gutiérrez (Twitter), ambas bibliotecarias de la Bibliotesca Daniel Cosío Villegas de El Colegio de México. Aquí se encuentra la nota del programa y acá se puede leer más información.

El viernes 19 de enero, luego de la ceremonia de inauguración del aniversario, tocó el turno de Anaclet Pons (Weblog | Twitter), catedrático del Departamento de Historia Contemporánea de la Universidad de Valencia, quien dictó la conferencia La sensibilidad digital y la posición del historiador. La conferencia se puede seguir en el Canal de YouTube del Colegio de Michoacán.

Posteriormente a la conferencia, se llevó a cabo un panel de discusión en el que participaron: Alberto Santiago Martínez, Isabel Galina Russel, Rosario Rogel Salazar, Silvia Gutiérrez, Natalie M. Baur y Víctor Gayol, cada quien abordando un tópico en forma de reto.

Como testigos de memoria del evento, queda este pequeño sitio Web y el video de la jornada completa del día 19 de enero.

5 palabras clave sobre CSyHD

Hoy fue la primera sesión del Taller introductorio a las Ciencias Sociales y Humanidades Digitales (CSyHD) – The Programming Historian, en El Colegio de Michoacán, A.C.

Confieso que lo disfruté. Tengo que escribir mucho más sobre esta primera experiencia. Pero ahora lo que quiero hacer es mostrar cuál es la idea en este ámbito (mexicano, latinoamericano) que se tiene cerca de las CSyHD.

Pedí a los asistentes -antes de la plática- que escribieran 5 palabras clave que reflejaran lo que creían/pensaban respecto de qué son las CSyHD. Luego, las procesé con Voyant-tools para conseguir la visualización en forma de nube de palabras.

Este es el resultado:

¿Big data en la investigación histórica?

¿Análisis de big data en la investigación histórica? John Mashey, el científico informático que popularizó el término big data en los años 1990, seguramente moriría de risa si le dijéramos que quienes nos dedicamos a la historia podríamos procesar nuestros datos históricos digitalizados con métodos y técnicas utilizados para el análisis de grandes conjuntos de datos (big data sets). Big data es lo que procesan las grandes empresas de análisis de datos. Se calcula que Google manejaba unos 20 Petabytes de datos diariamente en 2008 (20 X 1,0005 bytes), mientras que toda la información de una investigación histórica no debe rebasar unos cuantos GB.

Sin embargo, los autores del libro Exploring Big Historical Data: The Historian’s Macroscope (2016) recurren al viejo proverbio inglés y argumentan, con razón que: “big is in the eye of the beholder”, algo así como que “el color depende del cristal con que se mire”. Porque en la investigación histórica hay tareas que parecen irrealizables para una sola persona investigadora o para un equipo, como la de procesar en un sólo estudio los 197,752 extractos de juicios criminales digitalizados que contiene el sitio The Procedings of the Old Bailey, la corte criminal de la ciudad de Londres entre 1674 y 1913.

Sobre este libro, la revista Virtualis. Revista de cultura digital del Tecnológico de Monterrey, México, acaba de publicar una reseña mía que puedes encontrar aquí y descargar el texto en PDF.

El libro fue escrito de manera colaborativa por Shawn Graham, Ian Milligand y Scott B. Weingart y es, en realidad, un manual de metodologías, técnicas y herramientas digitales para el procesamiento de datos, mayoritariamente aquellas diseñadas para el tratamiento de lenguaje natural. Por ello, está muy estrechamente vinculado al proyecto The Programming Historian y al ya clásico libro de Cohen y Rosenzweig Digital history: a guide to gathering, preserving, and presenting the past on the Web.

Si hay una forma amable de introducción a la historia digital para estudiantes de grado y posgrado, son esos tres caminos.

Referencias

  • Cohen, D. J., & Rosenzweig, R. (2006). Digital history: A guide to gathering, preserving, and presenting the past on the Web. University of Pennsylvania Press. http://chnm.gmu.edu/digitalhistory/
  • Gayol, V. (2016). Exploring big historical data. The historian’s macroscope. Virtualis, 7(13), 102–105.
  • Graham, S., Milligan, I., & Weingart, S. (2016). Exploring big historical data: The historian’s macroscope. Imperial College Press. http://www.themacroscope.org/2.0/