¿Big data en la investigación histórica?

¿Análisis de big data en la investigación histórica? John Mashey, el científico informático que popularizó el término big data en los años 1990, seguramente moriría de risa si le dijéramos que quienes nos dedicamos a la historia podríamos procesar nuestros datos históricos digitalizados con métodos y técnicas utilizados para el análisis de grandes conjuntos de datos (big data sets). Big data es lo que procesan las grandes empresas de análisis de datos. Se calcula que Google manejaba unos 20 Petabytes de datos diariamente en 2008 (20 X 1,0005 bytes), mientras que toda la información de una investigación histórica no debe rebasar unos cuantos GB.

Sin embargo, los autores del libro Exploring Big Historical Data: The Historian’s Macroscope (2016) recurren al viejo proverbio inglés y argumentan, con razón que: “big is in the eye of the beholder”, algo así como que “el color depende del cristal con que se mire”. Porque en la investigación histórica hay tareas que parecen irrealizables para una sola persona investigadora o para un equipo, como la de procesar en un sólo estudio los 197,752 extractos de juicios criminales digitalizados que contiene el sitio The Procedings of the Old Bailey, la corte criminal de la ciudad de Londres entre 1674 y 1913.

Sobre este libro, la revista Virtualis. Revista de cultura digital del Tecnológico de Monterrey, México, acaba de publicar una reseña mía que puedes encontrar aquí y descargar el texto en PDF.

El libro fue escrito de manera colaborativa por Shawn Graham, Ian Milligand y Scott B. Weingart y es, en realidad, un manual de metodologías, técnicas y herramientas digitales para el procesamiento de datos, mayoritariamente aquellas diseñadas para el tratamiento de lenguaje natural. Por ello, está muy estrechamente vinculado al proyecto The Programming Historian y al ya clásico libro de Cohen y Rosenzweig Digital history: a guide to gathering, preserving, and presenting the past on the Web.

Si hay una forma amable de introducción a la historia digital para estudiantes de grado y posgrado, son esos tres caminos.

Referencias

  • Cohen, D. J., & Rosenzweig, R. (2006). Digital history: A guide to gathering, preserving, and presenting the past on the Web. University of Pennsylvania Press. http://chnm.gmu.edu/digitalhistory/
  • Gayol, V. (2016). Exploring big historical data. The historian’s macroscope. Virtualis, 7(13), 102–105.
  • Graham, S., Milligan, I., & Weingart, S. (2016). Exploring big historical data: The historian’s macroscope. Imperial College Press. http://www.themacroscope.org/2.0/

Procesadores de texto vs escritura académica sostenible

Un serio problema

Hace unos días, un tesista me envió un correo electrónico diciéndome que me remitía ahí mismo el borrador completo de su tesis para hacer la última lectura de revisión antes de someterla al comité académico. Verdaderamente entusiasmado -porque es un trabajo excelente y que lo va a llevar pronto a obtener su grado- abrí el correo, pero mi sorpresa fue mayúscula ya que no encontré ningún archivo adjunto. En cuanto me percaté que el email no tenía un attachment, me comuniqué con el tesista para decirle que su texto no se había adjuntado al correo. Unas (muchas) horas después recibí otro correo en el que me explicaba que había tenido innumerables problemas para adjuntar el archivo al envío y que optaba por hacérmelo llegar por Dropbox. El archivo, que está escrito de origen y guardado como un documento .docx de MS Word ocupa casi 18MB de unidades de información. Sin embargo, su extensión no rebasa las 310 cuartillas y sólo contiene algunas cuantas ilustraciones y mapas. Nada del otro mundo, en cuanto a extensión, que amerite los 18MB (¡18’000,000 de bytes!) de espacio en mi disco duro, cuando bien podría tener solamente 1MB, considerando que cuenta apenas con cerca de 780 mil caracteres más las imágenes, que son pocas, si se ponen en baja resolución. Para tener una idea de qué es a lo que me refiero en términos de extensión, cada carácter equivale aproximadamente a 1 byte por lo que 10MB de unidades de información equivalen a dos veces la obra completa de Shakespeare.

El problema no es solamente la extensión o «peso» del archivo, sino la posibilidad de manipularlo. Como todo borrador de un trabajo, aún debe ser corregido y anotado con las observaciones del director. Si bien MS Word cuenta con una herramienta para ello (-> Herramientas -> Control de cambios), su uso es realmente engorroso y no permite una apreciación cabal y por separado de las correcciones y de las anotaciones. Por otro lado, cualquier cosa que se modifique en el texto, aún siendo solamente el añadido de una coma u otro signo de puntuación, hace tambalear todo el formato del documento, muy probablemente porque el mismo fue generado en una plataforma distinta a la que utilizamos para su corrección (el paso de Windows a Mac, por ejemplo). Incluso, después de trabajar una nota sobre un cambio sustancial, el programa se colapsa y se cierra, descartando los cambios. De esta manera, ponerse a corregir y anotar con la atención debida un trabajo tan interesante, es imposible pues acaba uno por desesperarse y restarle atención al contenido (que es lo importante) por estar preocupado del funcionamiento del procesador de textos. Más valdría entonces imprimirlo en papel para corregirlo y anotarlo de la manera tradicional, lo cual es un contrasentido tratándose de un documento digital, por no hablar del peso que sobre mi conciencia ecológica significaría gastar papel en un borrador.

En los años que tengo de trabajar en entornos digitales (por lo menos 35), ningún procesador de textos me ha dado tantos problemas como el MS Word, en cualquiera de sus versiones. En tiempos de los sistemas operativos DOS, tanto en MS como en Apple, los procesadores como WordStar, WordPerfect o Apple Writer ofrecían un buen servicio: eran robustos, sencillos y eficaces. Raramente se colapsaban, generaban archivos ligeros, y uno podia concentrarse en la tarea fundamental: escribir. Y es que aquellos procesadores carecían de las características actuales, estructuradas con la filosofía del WYSIWYG,1 y uno podía dedicarse a escribir vertiendo fluidamente las ideas en el texto sin distraerse con los detalles del diseño de los márgenes, el formato de los títulos y subtítulos de cada capítulo, el acomodo de las notas a pie y de las referencias bibliográficas así como los demás agregados, gráficos o textuales. Uno escribía y, después del punto final, se dedicaba a acomodar las cosas.

Los procesadores de texto, particularmente el MS Word, no están diseñados para la escritura académica o la literaria. Esto lo han discutido ya varios escritores, científicos sociales y humanistas. Charles Stross, un conocido escritor de ciencia ficción radicado en Escocia, fue al extremo de argumentar Why Microsoft World must Die -«Por qué debe morir MS Word»:

Microsoft Word es un tirano de la imaginación, un pequeño dictador carente de
imaginación e inconsistente, que es inadecuado para cualquier uso en la escritura creativa.
Peor aún, es casi un monopolio que domina el campo de los procesadores de texto.

Soluciones

La entrada del blog de Stross es muy interesante ya que expone varias razones por las cuales MS Word es inútil para la escritura de textos largos, como las novelas, los libros o las tesis académicas. Más aún, uno de los más graves problemas de éste y otros procesadores de texto, es que resulta imposibile producir un documento digital fiable y con garantía de permanencia dado que las actualizaciones de los programas vuelven obsoletos los archivos con la rapidez inusitada de seis meses en promedio. Todos nos hemos dado cuenta en alguna ocasión que es prácticamente imposible abrir un archivo .docx creado y guardado en la versión más actualizada, con una versión anterior del programa. MS World es un buen recurso para el flujo de trabajo de las oficinas y empresas que generan una ingente cantidad de memoranda, circulares, oficios y cartas con una vida efímera; pero no funciona cuando se trata de generar textos cuyos originales necesariamente deben estar a la mano, funcionales y legibles muchos años después, como los textos académicos. Como una alternativa para contrarrestar los diversos problemas de los procesadores de texto como MS Word, Stross sugiere el uso de Scrivener, un procesador de texto pensado para la escritura de archivos largos. Pero, sobre todo, la mejor alternativa es escribir todo en texto plano, generando y guardando archivos .txt, mucho más flexibles, almacenables, distribuibles, independientes de plataforma2 y con garantía de permanencia y legibilidad a largo plazo. Y para ello no necesitamos un procesador de texto sino simplemente un humilde editor de textos como los que vienen por defecto en todas las máquinas: Notepad++ en Windows, TextEdit en OS-X, o la gran variedad de editores que hay para Linux como Vim o gEdit.

El punto de vista de un novelista como Stross es compartido por muchos académicos, pues los problemas que representan los procesadores de texto no son una novedad entre el gremio. W. Caleb McDaniel, un joven historiador de la Rice University en Houston, TX, y egresado de la prestigiosa Johns Hopkins University, es un verdadero entusiasta de este tipo de escritura sostenible independiente de plataforma y con garantía de permanencia. Basta con leer alguno de sus varios textos dedicados al tema, como por ejemplo, Why (and How) I Wrote My Academic Book in Plain Text -«Por qué (y cómo) escribí mi libro académico en texto plano.» En este texto, McDaniel explica detalladamente el cómo es posible adaptar la escritura en texto plano a los requerimientos de los textos académicos mediante la aplicación de un marcaje semántico en el propio texto con el lenguaje de marcado Markdown, desarrollado por John Gruber y Aaron Swartz. Así, es posible hacer uso de cursivas, negritas, listados, referencias y listas bibliográficas, tablas, notas a pie de página y demas florituras de los modos de escribir en nuestro oficio, con sólo un editor de texto plano. ¡Exacto! Hace falta solamente un editor de texto plano, conocer la sintaxis de Markdown y recurrir a herramientas pensadas especialmente para la escritura académica como Pandoc,3 un traductor que funciona en línea de comandos y que convierte archivos .txt o .md a cualquier formato imaginable: .doc, .docx, .odt, .pdf, .html, .tex y un amplio etcétera. Cabe decir que Pandoc fue desarrollado por John MacFarlane, un profesor de filosofía de la University of California, Berkeley; es decir, se trata de una herramienta para académicos pensada y hecha por académicos. En otras palabras: humanidades digitales en su máxima expresión. Al final de su entrada, McDaniel termina explicando el porqué no volvería a utilizar MS Word en su vida. Y yo estoy de acuerdo con él.

Desde que hace casi un año me topé con el sitio The Programming Historian (de cuyo equipo editorial ahora formo parte),4 descubrí varias herramientas y lecciones que me permitieron dejar de complicarme la existencia con los procesadores de texto, así como otra serie de prácticas sostenibles para la producción académica, al grado de que tengo ya varios meses en los que no he abierto MS Word para escribir mis textos, sino única y exclusivamente para leer los que recibo. A continuación dejo algunas pistas de lo que nos puede ser útil como científicos sociales o humanistas para crear textos académicos digitales sostenibles.

En The Programming Historian se encuentra una buena introducción a Markdown, escrita por Sarah Simpkin, «Getting Started with Markdown.» También hay una excelente lección que nos enseña a generar una escritura sostenible con texto plano, Markdown y Pandoc, escrita por Dennis Tennen y Grant Wythoff, «Sustainable Authorship in Plain Text using Pandoc and Markdown.» Si a esto le sumamos buenas prácticas para la conservación de los datos de nuestra investigación, como las que sugiere James Baker en «Preserving Your Research Data«, podemos tener la seguridad de que nos ahorraremos los incontables dolores de cabeza, pérdidas y problemas que nos depara (casi) siempre el uso de software propietario, lo cual redundará en la calidad, permanencia, posibilidad de distribución y colaboración, almacenamiento y más de nuestros textos académicos.

Para leer más

  • Dougherty, Jack y Kristen Nawrotzki. 2013. Writing History in the Digital Age. Ann Arbor: University of Michigan Press. http://writinghistory.trincoll.edu
  • Rosenzweig, Roy. 2011. Clio Wired: The Future of the Past in the Digital Age. New York: Columbia University Press. http://public.eblib.com/choice/publicfullrecord.aspx?p=895110.
  • Voutssas Márquez, Juan. 2013. Cómo preservar mi patrimonio digital personal. México: Universidad Nacional Autónoma de México, Instituto de Investigaciones Bibliotecnológicas y de la Información.

  1. Acrónimo de «what you see is what you get» (lo que ves es lo que obtienes), para referirse a la capacidad de la interfaz gráfica de usuario de las aplicaciones para desplegar el diseño de un documento digital tal y como se verá impreso. Sin embargo, la idea de WYSIWYG es tramposa, pues lo que en realidad conseguimos es un archivo con un código y un marcado muy complejos y confusos para nuestro entendimiento, que se aloja en una capa «invisible», lo cual lo hace inmanejable.
  2. Es decir, legibles sin pérdidas o alteraciones en cualquier plataforma o sistema operativo como Mac, Linux o Windows.
  3. Pandoc es una «biblioteca» o conjunto de módulos o programas escritos en Haskell, un lenguaje de programación de alto nivel multi propósito, y cuenta con una herramienta de línea de comandos que permite utilizar dicha biblioteca.
  4. Estamos trabajando muy duro y en breve contaremos con una versión en español de todo el contenido alojado en The Programming Historian.

Hacer historia en la era digital: big data

Hace justo unos tres años apareció un video en el canal de PHD Comics acerca del trabajo de tesis doctoral de Adam Crymble, uno de los principales animadores del proyecto The Programming Historian.

Con el reto de ¿Puedes contar tu tesis en dos minutos?, el video muestra la utilización de las nuevas tecnologías aplicadas a la investigación histórica, en este caso, la historia de la migración irlandesa a Londres de principios del siglo XIX. Este tipo de investigaciones es posible gracias a la gran cantidad de fuentes de archivo digitalizadas (por lo general, en los países anglosajones), que permiten la aplicación de métodos, técnicas y herramientas informáticas para el análisis del lenguaje natural.

Sin más, comparto el video y dejo abajo la transcripción, hecha por Jairo Melo para el proyecto Historia abierta.

Transcripción

¿Puedes describirnos tu tesis en dos minutos?

Muchas personas piensan que los historiadores gastan todo su tiempo en las bibliotecas leyendo libros y ciertamente no están tan equivocados sin embargo, recientemente las bibliotecas se han vuelto muy grandes, demasiado grandes, y se están creciendo a una velocidad impresionante.

Eso es porque millones de documentos han sido digitalizados y están disponibles actualmente en línea. Los historiadores se enfrentan ahora a más material del que pueden esperar leer en un vida o incluso en cien vidas.

Mi investigación aborda un típico problema histórico: ¿Cómo fueron tratados los Inmigrantes irlandeses en Londres, Inglaterrra al inicio de la revolución industrial?

Pero, en lugar de encerrarme en una biblioteca utilicé mi ordenador para aprovechar uno de los mejores trucos de la informática llamado Lectura Distante («Distant Reading»).

La lectura distante significa básicamente saber qué dice algo sin leerlo realmente. Es el tipo de clasificación que usa Google cuando quieres buscar la receta de un pastel de manzana. Google tiene una gran cantidad de páginas web pero ellos crearon un programa que les ayuda a buscar la información.

Yo estoy haciendo lo mismo, pero en lugar de buscar pasteles me hago preguntas como:
¿qué documentos se refieren a los irlandeses?

Como Google, tuve que desarrollar un programa que sistematizara la búsqueda de información y me ayudara a saber cuál es relevante y cual no lo cual es importante cuando estás trabajando con bases de datos que contienen cientos de millones de palabras.

Pero encontrar información relevante no es todo lo que puedes hacer en la era del Internet.

Los ordenadores también me han permitido evidenciar aspectos en los cuales la vida cotidiana de los irlandeses del siglo XIX se diferenciaba de la de los demás londinenses

Por ejemplo, puedo decirte que un irlandés tenía cuatro veces más posibilidades de ser llevado a juicio de las que tenía un londinense en toda su vida.

No hay manera en la que hubiese encontrado este hecho de no ser por la «lectura distante». Vivimos en un mundo sobre-informado y manejar la información correctamente puede representar la diferencia entre encontrar lo que necesitas o naufragar en un mar de datos. Hay mucho por leer, así que hay que encontrar una nueva manera para hacerlo.

Mi nombre es Adam Crymble estoy estudiando en el Kings College London del Reino Unido y el título de mi tesis es: «Entendiendo la experiencia del inmigrante irlandés en Londres a través de un análisis textual de larga-escala, 1801-1820»

Nuevo equipo de editores en español para The Programming Historian

Ahora sí, podemos hacer público el anuncio. El pasado mes de julio se publicó una convocatoria para reclutar a una persona encargada de comenzar a traducir al español las más de 45 lecciones originales que forman parte de la plataforma The Programming Historian. Esto es un hecho sin precedentes pues, como es bien sabido, la mayor parte de los tutoriales e instrucciones disponibles sobre técnicas y herramientas para la humanidades y la historia digital están en inglés. Por supuesto que han habido intentos de traducción, como los que publicamos a principios de este año en el sitio original de Cibercliografía, entre otros. Pero nada mejor que hacerlo con la gente de la propia plataforma e integrándose al proyecto.

Después de recibir solicitudes y entrevistas, el equipo de PH decidió que los tres finalistas integráramos un equipo. Así que, a partir de esta fecha, estaré trabajando con mis colegas para dar forma a lo que hasta hace unos meses era sólo un sueño. Mis colegas de ruta son:

Maria José Afanador-Llach, quien obtuvo recientemente un doctorado en Historia de la Universidad de Texas en Austin. Actualmente está colaborando con colegas en la Fundación Histórica Neogranadina, una organización sin ánimo de lucro que está digitalizando archivos coloniales en peligro y promoviendo proyectos de humanidades digitales. Tiene amplia experiencia traduciendo escritos académicos del inglés al español y está comprometida con cultivar iniciativas de investigación digital en América Latina.

Antonio Rojas Castro, quien tiene un doctorado en Humanidades de la Universitat Pompeu Fabra en Barcelona, España. Como parte de su disertación construyó una edición digital crítica de las Soledades de Luis de Góngora (actualmente en versión beta). En 2013 creó el Grupo de Humanidades Digitales de Zotero, y actualmente es el Coordinador de Comunicaciones de la European Association for Digital Humanities (EADH).

Así que, ¡manos a la obra! Espero que pronto tengamos un The Programming Historian en español en línea…

Historiadores y bases de datos 3. Jean Bauer y Project Quincy

Hace tiempo que estoy buscando la manera de mejorar y hacer más efectivo el manejo de la información que suelo procesar en una base de datos, pues generalmente he topado con algunos problemas serios a la hora de intentar compartir esa información entre usuarios de distintos gestores de bases de datos y, sobre todo, entre las distintas plataformas más utilizadas (Windows, Mac, Linux). Uno de los peores problemas es el paso de los datos entre los diferentes programas de aplicación propietarios, así como de las herramientas de procesamiento y análisis que cada uno de ellos puede generar. Por ejemplo, al intentar pasar la información de una vieja base de datos documental que utilicé para la escritura de mi tesis doctoral y que fue diseñada en el DBMS Microsoft Access a otro programa (en este caso, FileMaker, por la flexibilidad para trabajar y compartir información entre diversas plataformas, específicamente Windows y Mac), me encontré que, en ocasiones, los datos de algunos campos no tenían transparencia del 100% a la hora de migrarlos. Pero lo que me pareció más terrible es que las consultas SQL diseñadas en Access gracias a la integración del Visual Basic en el propio DBMS, eran irrecuperables en el nuevo programa de gestión de datos (aunque en FileMaker también se pueden ejecutar consultas SQL, pero la escritura del script es diferente). Finalmente, lo más patético es que resulta casi imposible compartir los datos y las consultas con otros colegas o con un equipo de trabajo si cada quien utiliza una plataforma distinta, un programa de aplicación distinto, más aún en el caso de que se quiera que la base de datos sea útil para un equipo de colabores que aporten información y que la usen colectivamente para la investigación.

El caso es que mi decepción sobre el diseño de bases de datos con los gestores comerciales se le ha sumado que, con el paso del tiempo, he acumulado una creciente desconfianza en el uso de software propietario para la investigación histórica. A la vez estoy cada vez más convencido de la necesidad de crear nuestros propios recursos para poder compartir nuestros datos entre más colegas a la vez que nos aseguramos que no sean perecederos por causa de la caducidad tecnológica tanto de software como de hardware.

Todo esto para comentar que una de las soluciones que me ha parecido más viable en teoría es la de crear bases de datos con recursos informáticos menos anclados a las directrices del software propietario común y corriente. En este caso (y gracias a una explicación que me dio hace algunos años Esteban Sánchez Rodríguez), la solución más inteligente sería la creación de una base de datos SQL que resida en un servidor. Para ello, lo más fácil sería la utilización de MySQL que, aunque es software propietario, permite una mayor flexibilidad de uso en diferentes plataformas. A esto le seguiría el diseño de un recurso de gestión y visualización en el navegador Web mediante un lenguaje de programación de alto nivel. Esto permite compartir la base de datos en Internet aprovechando las posibilidades de la Web 2.0.; es decir, de la misma manera en la que operan sitios como Facebook, Wikipedia o WordPress, lo cual nos da la posibilidad de integrar un equipo de trabajo amplio que pueda hacer uso de la base de datos ya sea vía consulta o directamente alimentando los datos en línea si el usuario tiene las credenciales adecuadas para ello.

Después de conversar con Jairo Antonio Melo el otro día sobre el diseño de una base de datos prosopográfica con estas características, me envió el enlace a un ejemplo muy interesante. Se trata de Project Quincy, una base de datos que se puede visualizar en Internet y que ha permitido desarrollar proyectos como The Early American Foreign Service Database (EAFSD), que cubre los primeros cincuenta años de la historia de la diplomacia estadounidense enfocada en los individuos que formaron parte de ella.

The Early American Foreign Service Database
The Early American Foreign Service Database

Project Quincy fue desarrollado por la joven historiadora y programadora Jean Bauer (hija, por cierto, de un informático y una novelista). Bauer diseñó una base de datos en MySQL que almacena información sobre personas, lugares e instituciones y que permite trazar la formación de redes de relaciones sociales (parentesco, patronazgo), la correspondencia entre individuos; la formación, crecimiento y decadencia de organizaciones y de las propias redes, todo ello a través del tiempo. Permite vincular la mención de fuentes para cada evento individual, y un largo etcétera. Por su parte, la visualización y gestión de la base de datos se hace mediante un sencillo framework para aplicaciones web, Django, cuyo código está escrito en Python y por lo tanto bastante accesible para historiadores programadores neófitos.

ProjectQ
Project Quincy (trace the network)

Project Quincy tiene a su favor que es una base de datos creada por una historiadora para historiadores interesados en las redes. Como dice la propia Jean: «La base de datos existe para conectar gente con otra gente en un momento particular, en un lugar en particular y por una razón en particular, permitiendo al usuario el mapeo de redes de correspondencia […] tiene más o menos seis módulos de interconexión, cada uno para rastrear diferentes tipos de redes e información: biográfica (profesional, relaciones personales, lugares de residencia); organizaciones (afiliación e historia de la institución), correspondencia (cartas); asignaciones (conectar a una persona, un trabajo y un lugar en un periodo de tiempo específico), ubicaciones y citas documentales y/o bibliográficas. «

Dos cosas a su favor es que la base de datos trabaja en línea y puede integrar a múltiples usuarios para trabajo en colectivo. Otra cosa a su favor es que el código está disponible de manera libre en el GitHub de Jean. En cuanto tenga un tiempito voy a descargarlo y hacer una prueba. Ya les comentaré.

Historiadores y bases de datos 2. Claudia Espejel y la Relación de Michoacán.

Portal de la Relación de Michoacán, Instrumentos de consulta. ©2008, El Colegio de Michoacán, A.C.
Portal de la Relación de Michoacán, Instrumentos de consulta. ©2008, El Colegio de Michoacán, A.C.

Relación de Michoacán: instrumentos de consulta, es un portal interactivo en Internet que permite al usuario buscar y examinar con detalle la información contenida en esa importante fuente documental manuscrita de la primera mitad del siglo XVI, atribuida al franciscano fray Jerónimo de Alcalá. El portal, que es parte del sitio de El Colegio de Michoacán, lleva en línea por lo menos ocho años, así que en esta entrada no trato de una novedad que acabe de aparecer en la web 2.0, sino que busco señalar algunas estrategias y recursos metodológicos que están detrás de su diseño como medio digital de divulgación del conocimiento histórico, y que fueron creados a la par de que Claudia Espejel desarrollaba una investigación que dio lugar a una tesis doctoral y, posteriormente, a un libro.1

Aunque es de sobra conocida por los estudiosos e interesados en el Michoacán prehispánico y colonial, merece la pena apuntar algunos detalles acerca de la fuente documental misma para, a continuación, tocar algunos aspectos de la investigación de Espejel en los que fue crucial la utilización de recursos informáticos.

relacion

La Relación de Michoacán ha sido llamada así a partir de que en la primera línea de la foja uno del original se lee: Relaçion de las çerimonjas y rrictos y poblaçion y governaçion de los yndios de la provinçia de mechuacan hecha al yllustrisimo señor don antonio de mendoça, virrey y governador desta nueva españa por su magestad, &tc. Fue mandada hacer por orden del primer virrey de Nueva España durante su visita a la provincia en 1539 y terminada a principios de la década de 1540. El fraile autor del documento debía describir las costumbres y la forma de gobierno de los indios mechuaques,2 y para ello debe haberse rodeado de un grupo de informantes, escribanos y pintores seguramente indios, para recabar y organizar y presentar la información. Del documento se conservan 143 fojas manuscritas entre las que se encuentran 44 láminas que describen en imágenes algunos de los pasajes del texto, y a lo largo de ellas se menciona una gran cantidad de lugares, personajes, dioses que muchas veces están asentados con grafías diferentes, así como una serie de categorías que hacen referencia a la organización social, política y religiosa de los indios michoacanos. Por alguna razón que aún no ha sido documentada, el manuscrito llegó a manos de la Orden de San Agustín y quedó depositado en la Biblioteca del Monasterio de San Lorenzo de El Escorial, en donde se comenzó a consultar y copiar a partir de mediados del siglo XIX. Desde entonces a la fecha, la Relación de Michoacán, muchas veces editada e impresa por distintos estudiosos, ha sido utilizada como pieza clave o, incluso, piedra angular para escribir una historia sobre los indios michoacanos de finales del siglo XV y principios del XVI, a la vez que ha servido de referente documental también para la interpretación de los estudios arqueológicos en la región. Es decir, durante cerca de 160 años, la Relación de Michoacán había sido únicamente utilizada como fuente de datos con los que sostener las diversas interpretaciones sobre la cultura, costumbres e historia de los indios del antiguo Mechuacan.

justiciaYfuego1

Pero, ¿cómo se hizo y estructuró la Relación de Michoacán? Claudia Espejel enfocó su investigación en la comprensión de cómo está construido el documento en sí mismo, su estructura interna y el modelo o los modelos discursivos que forman el andamiaje sobre el que se elaboró el texto. Producto de este ensayo hermenéutico es la propuesta de varias claves para la lectura de la Relación…, una de ellas muy sugerente y controvertida, ya que propone que la estructura y la forma de organizar la descripción de la cultura y el gobierno mechuaque sigue las pautas de la descripción y organización del mundo presente en un viejo documento jurídico castellano: las Siete Partidas. Dicho de otra manera, Espejel propone una lectura intertextual que permite comprender la estructura mental del autor de la Relación así como su texto. Esto, sin menoscabo de otras claves culturales propias de esa sociedad que habitó la región lacustre del occidente de Mesoamérica. De ahí, por cierto, el título del libro de Espejel: La justicia y el fuego.

Como parte del proceso de investigación, Espejel tuvo que sistematizar el conjunto de la información presente en el texto. Entre otras de sus preocupaciones (arqueóloga de primera formación, a fin de cuentas), le interesaba tener una relación de lugares capaz de echar luz sobre asentamientos de poblaciones y sitios ceremoniales; así como también poder organizar la gran cantidad de referencias y personajes que aparecen en el texto del siglo XVI. Uno de los productos de esta sistematización es el segundo volumen del libro en que dedica sus 330 páginas a la presentación de un glosario que incluye los nombres de 313 lugares, 215 personajes, 66 dioses y 300 categorías sociales. Cerca de 900 fichas en las que Espejel ofrece información sobre significados, localización geográfica, las diversas grafías o las equivalencias lingüísticas en su caso, su representación en las láminas, su ubicación en el texto de la Relación… o su referencia en otras fuentes.

Para poder organizar todos estos datos, Espejel utilizó fundamentalmente dos recursos informáticos: un sistema de bases de datos relacional y un sistema de información geográfica. Una muestra de los productos generados se pueden apreciar en el libro, pero de manera estática: el glosario de más 300 páginas y varios mapas. De ahí que haya sido una buena idea la publicación paralela del portal en línea pues no sólo sirve como instrumento digital de divulgación del conocimiento, sino como un producto en el que se muestra de manera dinámica el funcionamiento de los recursos informáticos elaborados durante la investigación ya que se pueden hacer consultas a la base de datos casi como si se estuviera utilizando la BD original en la computadora de la investigadora, o se pueden consultar los mapas de manera interactiva casi como si se estuviera frente a la interfaz del programa de aplicación del SIG. Cabe decir que esto implicó un trabajo de equipo pues Esteban Sánchez Rodríguez se encargó de asesorar y ayudar a diseñar las BD, Marco A. Hernández Andrade se encargó del SIG y Carlos A. Villalpando de Santiago se encargó del diseño del sistema en línea.

Relación de Michoacán. Instrumentos de consulta. ©2008, El Colegio de Michoacán, A.C.
Relación de Michoacán. Instrumentos de consulta. ©2008, El Colegio de Michoacán, A.C.

El sistema de BD en las que se capturó la información para su procesamiento consiste en cuatro ficheros (lugares, personajes, dioses y categorías sociales). El primer paso para armar los ficheros fue abrir un registro con cada término y llenar una serie de campos descriptivos y analíticos. Los dos campos más importantes asociados a cada registro consisten en uno con el vaciado de citas textuales de la Relación… en las que aparece el término para enseguida llenar otro campo del registro con una síntesis explicativa. A estos se le fueron agregando campos en función de la naturaleza de los registros. Paralelamente, se fue conformando otra serie de tablas interconectadas que permiten relacionar cualquier registro de los cuatro ficheros con elementos importantes para el análisis: acontecimientos que sucedieron en un lugar o en el que interviene un personaje, en el que se menciona algún dios o se hace referencia a una categoría social. También se incluyeron otras tablas vinculadas, entre las que merece mención especial la que recoge el inventario de los sitios arqueológicos hasta hoy conocidos que pueden asociarse con cada lugar mencionado en la Relación… Esta tabla contiene información detallada del sitio arqueológico como la de localización (coordenadas geográficas), lo que permite enlazar la base de datos directamente con el Sistema de Información Geográfica.

Relación de Michoacán. Instrumentos de consulta. ©2008, El Colegio de Michoacán, A.C.
Relación de Michoacán. Instrumentos de consulta. ©2008, El Colegio de Michoacán, A.C.

Finalmente, la construcción del portal electrónico se dio de manera natural, ya que fue posible gracias al potencial analítico que demostró tener el uso de dos recursos informáticos vinculados cuyo objetivo inmediato fue el de recopilar datos, organizarlos y procesarlos en el transcurso de una investigación cuya pregunta inicial fue ¿cuáles son las claves que nos permitan leer la ya tan leída Relación… del viejo fraile del siglo XVI de manera comprensiva?

Notas:


  1. Claudia Espejel Carbajal, La justicia y el fuego. Dos claves para leer la Relación de Michoacán, 2 Vols. (Zamora: El Colegio de Michoacán, 2008). Este libro es una versión corregida y aumentada de la tesis doctoral: Claudia Espejel Carbajal, “Voces, lugares y tiempos: claves para comprender la Relación de Michoacán”, dirigida por el Dr. Rafael Diego-Fernández y defendida en El Colegio de Michoacán en 2004. El libro se puede conseguir en este enlace, y la tesis puede descargarse de este enlace, pinchando el documento enlazado en el recuadro a la derecha de la ficha bibliográfica. 
  2. La larga y en apariencia inacabable discusión (por bizantina) sobre si se debe llamar tarascos o purépechas a los habitantes de la región lacustre montañosa de la antigua Provincia de Mechuacan me hace optar por llamarlos mechuaques, con todo el peligro que conlleva de recibir una andanada de pedradas discursivas. Por si el lector quiere revisar la discusión y el problema de asumir uno u otro vocablo, recomiendo mucho leer el interesante libro de mi querido amigo y admirado colega Rodrigo Martínez Baracs, Convivencia y utopía. El gobierno indio y español de la “ciudad de Mechoacan”, 1521-1580 (México: Fondo de Cultura Económica / CONACULTA / INAH, 2005), sobre todo pp. 19-84 

Cambio de ruta

Actualización 20 de abril de 2018: Originalmente, esta entrada fue publicada en Cuaderno de notas, bitácora que recoge textos desde 2006 hasta 2018 (28 entradas). Otros textos se han perdido en el ir y venir del sitio original de Cibercliografía y de su segunda versión como sitio colaborativo en asociación con Jairo A. Melo F. y que funcionó entre principios de 2016 hasta finales de 2017 cuando, por diversas razones, decidimos cerrarlo y yo retomé el nombre en esta bitácora para escribir solamente a título personal.

——-

Hace cerca de quince años la Internet se transformó radicalmente gracias a las posibilidades de la Web 2.0. para producir páginas. Esta fue una revolución profunda en la comunicación ya que permitió una más fácil generación de contenidos por parte de los usuarios lo que a su vez transformó la manera de utilizar la red. El potencial de este recurso tecnológico para la comunicación, discusión y colaboración entre diferentes personas con intereses comunes dio un paso gigante, pero también tiene problemas muy serios.

El fenómeno me llamó fuertemente la atención pues yo venía ensayando la construcción de páginas web para la discusión e intercambio de información y conocimiento entre estudiantes, desde finales de la década de 1990. Obviamente, eran páginas que solían quedarse como proyectos en mi computadora por la imposibilidad económica de acceder a un servidor, un diseñador web y porque entonces mis conocimientos de programación eran muy reducidos. Así que, cuando apareció la posibilidad de publicar en línea páginas personales y luego el blogging, me puse a experimentar. Comencé por ensayar varias estrategias: las dos o tres primeras gracias a b2/cafelog, que por fortuna se han perdido. Luego, por ahí de finales de 2005, inicié un proyecto llamado Cibercliografía, que estaba alojado en WordPress (el heredero de b2/cafelog), y en el cual desarrollé por primera vez el interés en revisar y discutir las posibilidades de navegar por la historia en la era digital. Esa fue una de las rutas más interesantes de este viaje: reflexionar sobre lo qué estábamos haciendo con el conocimiento ante la apertura (casi) sin restricciones de la información por Internet. Pero el proyecto se canceló por razones que no viene a cuento comentar, aunque debo confesar que las críticas al estilo «eso de tener un blog no es de historiadores serios», quizá hayan tenido mucho que ver.

A finales de 2009 abrí Cuaderno de Notas, aunque decidí incluir algunas cosas previamente publicadas en Cibercliografía. Sin embargo, este blog se volvió muy formal y quedó encadenado a las reglas de la academia, dedicándole casi todo el espacio a reseñas de libros y novedades con alguno que otro texto por ahí sobre curiosidades o alguna opinión sobre nuestro trabajo como historiadores. Luego, el blog se indexó en Nuevo Mundo Radar, de hypotheses lo cual, en vez de ser un incentivo, me paralizó pues dejé de escribir en él.
Sin embargo, el espíritu de Cibercliografía está aún presente, aunque no tiene cabida en Cuaderno de notas dada la naturaleza colaborativa del proyecto. Por eso cierro este tramo del camino. Aquí resta por publicar media docena de borradores pendientes, lo que haré en cuanto me sea posible ya que se los debo. Pero Ítaca está en el horizonte y la experiencia de las otras Ítacas hace necesario reconsiderar mejor los puertos de la ruta. Así que regreso al proyecto de navegación original en el que he estado trabajando con un colectivo de colegas y amigos.

En breve pondremos en funcionamiento un sitio colectivo en la web, independiente, porque creemos que hemos aplazado mucho una discusión muy necesaria que tiene que ver con nuestro trabajo como historiadores en la era los recursos digitales informáticos.

 En unos días más, nos podrán seguir en: cibercliografia.org

Allá nos leemos.