Archivo de la etiqueta: informática

Clío conectada

La siguiente reseña del hoy clásico libro de Roy Rosenzweig –al menos en el entorno de la historiografía digital anglosajona–, apareció en el número 1 (marzo-agosto, 2011) de la revista Historia 2.0, Conocimiento histórico en clave digital, publicación del proyecto Historia abierta, un esfuerzo pionero de historia digital animado por estudiantes de historia fundamentalmente basados en Colombia. Por ello, y porque el libro de Rosenzweig sigue siendo de mucho interés para la práctica historiográfica en el ámbito hispanohablante de la era digital, me parece importante la relectura de la reseña a 14 años de su primera publicación. Se reproduce con el permiso de su autor. Nótese que: los enlaces indicados en las notas al texto originales ya no funcionan.

Jairo A. Melo, Rosenzweig, Roy. Clio wired: the future of past in the digital age. New York: Columbia University Press, 2011, 309 págs., en Historia 2.0, 1 (marzo – agosto, 2011), 131-134

Este texto, además de una novedad bibliográfica, es un homenaje póstumo a Roy Rosenzweig (1950-2007), fundador del Center of History and New Media (en adelante CHNM)1 de la Universidad George Mason, y uno de los mayores impulsores de este campo histórico. Clio wired, título de difícil traducción al español pero que podría entenderse como Clío conectada, fue el nombre dado por Rosenzweig a un curso desarrollado en el semestre de invierno de 2003 para el doctorado de Historia de la George Mason, en el que se les solicitaba a sus estudiantes realizar una propuesta de proyecto en historia digital y desarrollar una página web para este, algunas de las cuales aún están disponibles, así como la bitácora del curso, en el sitio web del CHNM.2

La Universidad de Columbia lanzó el libro 18 de febrero de este año y se encuentra disponible una copia con visibilidad limitada en Google Books, allí, con algo de paciencia y recursividad, es posible leer y reseñar este libro. Básicamente, consiste en una recopilación de ensayos escritos por Rosenzweig desde 1994 hasta el 2006, cuando según la esposa de Rosenzweig, Deborah Kaplan, “se convirtió en un incisivo e influyente comentarista de la historia digital”. La mayoría de estos ensayos se encuentran disponibles en la Web, un asunto apenas lógico teniendo en cuenta que uno de los llamados de Rosenzweig a sus estudiantes era mantener sus fuentes y escritos abiertos, disponibles al público, en un esfuerzo por fomentar la democratización de la historia a través de los recursos digitales.3

El libro está prologado por Anthony Grafton, quien realiza un bosquejo biográfico de Rosenzweig en donde exalta sus cualidades humanas e ideológicas, así como de la fundación y crecimiento del CHNM. En su prólogo, Grafton deja en claro que la visión de Rosenzweig de la historia digital, comprendía que esta consiste en una serie de herramientas que se encuentran muy alejadas de ser una panacea para la historia, ni mucho menos sus avances pueden considerarse como homogéneos, ya que hay que tener en cuenta las diferencias que la tecnología presenta en los diferentes contextos sociales, económicos y éticos. Rosenzweig se ubica en una prudente posición intermedia entre el “la irreflexiva autosuficiencia y el instintivo neoludismo”, de tal manera que se centra en la historia y de allí enlaza con los recursos tecnológicos.

La idea de Rosenzweig, y quizá donde radicaba su radicalismo, era en la posibilidad que brindan los nuevos medios para democratizar la historia, de utilizar los recursos digitales para mantener vivo el pasado y hacerlo gratificante y atractivo, donde no sólo participen historiadores profesionales, sino todos aquellos que se consideren involucrados, o simplemente interesados en consultar un documento, una imagen estática o imágenes en movimiento, de una manera abierta y gratuita.4

El libro está dividido en tres secciones. La primera, Rethinking History and New Media, incluye tres ensayos de Rosenzweig: “Scarcity or abundance? Preserving the past” (2003), “Wikipedia, can history be open source?” (2006) y “Web of lies? Historical Knowledge on the Internet” (2005) escrito en conjunto con el actual director del CHNM Daniel J. Cohen. Estos ensayos, por el mismo planteamiento de los títulos, muestran una serie de cuestionamientos en torno a la historia y la web, de hecho, plantean ciertos aspectos claves dentro del discurso de la historia disponible a través de la web: la preservación del pasado, la disponibilidad de las fuentes y las representaciones escritas o multimediales y la fiabilidad de las fuentes disponibles en la web. En el primer ensayo, Rosenzweig pone en discusión la situación de los historiadores en un contexto donde pasan de la escasez de fuentes y espacios de publicación, a una abundancia de tal nivel que simplemente no se sabe cómo manejar. En su segundo artículo, como ha de suponerse, discute la Wikipedia como historia, esto es, como una enciclopedia que contiene en sí una buena cantidad de material histórico e historiográfico, haciendo un análisis de las fortalezas y debilidades de una plataforma de edición abierta donde el control es realizado socialmente, pero también, donde la tergiversación, el anacronismo, las atopías y los yerros históricos son invisibles a los escolares. Rosenzweig afirma que los historiadores debemos prestar atención a Wikipedia por una sencilla razón: “nuestros estudiantes lo hacen”, y es por ello que hace un llamado a los historiadores no sólo a intervenir en Wikipedia, sino en investigar y proponer métodos de trabajo que “imiten” la forma social de construcción de conocimiento de esta enciclopedia. El tercer ensayo, es una presentación extensa de un software de búsqueda de hechos históricos denominado H-Bot;5 con el cual se pretende generar un buscador de hechos históricos tales como fechas, eventos y pequeñas biografías de personajes, con una exactitud garantizada, aspecto que es compleja de encontrar en la Web.

La segunda parte del libro se relaciona con la práctica histórica en los nuevos medios: enseñanza, investigación, presentación y recolección. Esta comprende los artículos Historians and Hypertexts: Is it more than Hype?, escrito con Steve Brier (codirector del New Media Lab de la City University of New York), publicado en 1994 en la revista Perspectives de la famosa American Historical Asociation, que consiste básicamente en una reseña del libro electrónico Who Built America? From the Centennial Celebration of 1876 to the Great War of 1914, un CD-ROM multimedia en formato Macintosh (básicamente para ser reproducido en el software QuickTime) que no se centra tanto en sus contenidos como en su formato y en el contenido de fuentes primarias disponibles en el CD, las cuales superan al texto escrito en sí, y que en su momento, encontraban el problema de los costos tecnológicos que esto implicaba. Un segundo artículo denominado Rewriting the History and Social Studies Classroom: Needs, Frameworks, Dangers, Proposals, el cual discute la implementación de la tecnología en el aula de clase, especialmente en torno a convertir el aula de clase en un centro para el aprendizaje activo y el pensamiento crítico apoyado en los recursos tecnológicos disponibles en 1999. Un tercer artículo, denominado The riches of hypertext for Scholarly Journals, donde se presentan de una manera profunda las posibilidades que brinda la Internet para difundir las investigaciones históricas y cómo un proyecto de historia digital puede contribuir a la construcción de contenidos de varios temas, abiertos y disponibles gratuitamente a la comunidad en general. El cuarto artículo de esta sección postula una pregunta bastante compleja: Should Historical Scholarship be Free?, la cual era una contribución a la discusión dentro de la AHA en torno a la gratuidad o costo de sus producciones, Rosenzweig enuncia las posibilidades que brinda la web para la difusión de la historia y cómo estas se compaginan con las postuladas por la mismas asociaciones de historia desde sus orígenes, las cuales no habían podido ser llevadas a cabo por los costos editoriales inherentes a cualquier proceso de edición e impresión. Finalmente, junto con Daniel J. Cohen, presentan un apartado de su libro Digital History. A guide to gathering, preserving and presenting the past on the Web, específicamente el capítulo Collecting History Online, que consiste básicamente en una presentación del por qué existe la necesidad de almacenar la memoria digital o los documentos en línea, así como la forma de seleccionar los materiales a ser recolectados, las herramientas disponibles para esto, y cómo fortalecer los sitios logrando el acceso de contribuidores espontáneos, para lo cual utilizan un ejemplo concreto como fueron los documentos digitales producidos durante el 11 de septiembre.

La sección final del libro corresponde a la investigación histórica en los nuevos medios, con tres artículos relacionados con la historia y su presentación en la web. El primero, escrito en colaboración con el profesor de la Universidad de Columbia Michael O’Malley, titulado Brave New World or Blind Alley ? American History on the World Wide Web, el cual ofrece un acercamiento a las posibilidades y limitaciones de la Web para aquellos interesados en publicar, enseñar y aprender historia. Los autores abordan el pasado disponible en la Web, los archivos, bibliotecas, museos y otras formas de presentar la historia en línea. El segundo artículo de esta sección: Wizards, Bureaucrats, Warriors and Hackers: Writing the History of the Internet, es un texto de 1998 publicado por Rosenzweig en la American Historical Review, y consiste básicamente en una historia de la Internet, cuya novedad más importante es, sin duda, el haber sido realizada por un historiador antes que por un Ingeniero de Sistemas, como había sido hasta el momento. Finalmente, cierra la sección y el libro el artículo The Road to Xanadu: Public and Private Pathways on the History Web. Xanadu para los amates del cine es el Estado privado del ciudadano Kane, pero también fue el primer proyecto de hipertexto fundado en 1960 por Ted Nelson, el cual puede considerarse como el mito original de la Web. Este artículo, además de describir en principio dicho proyecto, también realiza una historia de los proyectos de historia que han involucrado el sentido del hipertexto para presentar sus investigaciones.

Después de un poco menos de trescientas páginas, es posible reseñar las ideas básicas de Rosenzweig, pero difícilmente abarcará toda su obra. De cierta manera, muchos intangibles están aún presentes sin que sea posible imprimirlos o diagramarlos en un libro, de hecho, el famoso trabajo Who Built America?, está aún desconectado y tan sólo por unos cuantos dólares sería posible observarlo, así fuera tan sólo por una especie de sensación romántica. Muchos de nosotros recordamos nuestras primeras etiquetas en HTML, los primeros intentos por hacer una web en Geocities y el deseo de encontrar y publicar nuestras producciones en algo que todavía era desonocido: la Web. Rosenzweig no es solamente alguien que dejó una de las producciones más sistemáticas en historia digital, sino también alguien que nos dejó el sentido de ser historiador en un mundo digital, hoy en día pensar en un proyecto de historia digital en CD-ROM es poco menos que risible, pero dentro del diez años es bastante probable que considerar un Web Site de historia lo sea más. Habrá que estar preparados por lo menos para la siguiente etapa: la portabilidad del Smartphone y las Tablet… in road to Xanadu.

  1. N. del E.: Hoy Roy Rosenzweig Center for History and New Media. ↩︎
  2. Varios cursos están disponibles en los archivos del CHNM, desde el semestre de primavera de 2001 hasta el de invierno de 2004, para navegar por cada uno de ellos es necesario hacerlo manualmente, ya que no están debidamente indexados en un sitio o tan siquiera en Google. Para ver el curso de primavera de 2001 puede ir a este enlace: http ://chnm.gmu.edu/courses/rr/s01/cw, para navegar por los demás cursos se tiene que modificar /s01/ por /f01/, por ejemplo, en caso de querer ir al curso de invierno de 2001, o /f03/ por ejemplo, si quiere cambiar de año. ↩︎
  3. KAPLAN, Deborah, “Note to Readers” en Rosenzweig, Roy. Clio wired: the future of past in the digital age. New York: Columbia University Press, 2011, p. xxiv. ↩︎
  4. GRAFTON, Anthony, “Roy Rosenzweig: Scholarship as Community” en Rosenzweig, Roy. Clio wired, p. xviii – xx. ↩︎
  5. Este es un buscador de hechos históricos donde la persona pregunta datos históricos como la fecha o le lugar de nacimiento de un personaje como Lao-Tse, o las fechas de eventos históricos prominentes como el vuelo de Charles Lindberg sobre el océano Atlántico, e incluso tiene la capacidad de resolver pequeñas dudas como “¿quién descubrió el oxígeno?”. Este buscador desarrollado en php se encuentra disponible en el enlace http ://chnm.gmu.edu/tools/h-bot, y fue programado por Daniel J. Cohen y Simon Kornblith, desarrollador senior del CHNM. Paradójicamente, el mismo año en que fue desarrollado el software H-bot la compañía Yahoo lanzó su servicio “Yahoo Q & A”, el cual cambiaría su nombre posteriormente a “Yahoo Answers”, que aunque no garantiza la exactitud histórica se ha convertido en la herramienta favorita de los estudiantes para resolver preguntas puntuales. ↩︎

¿Por qué aprender a programar?

El jueves de la semana pasada lanzamos públicamente la versión en español de un sitio web bastante conocido por los historiadores digitales: The Programming Historian. Tras unos meses de arduo trabajo colaborativo, la publicación en español es una versión bastante ligera, con una pequeña parte del conjunto de lecciones y tutoriales sobre herramientas digitales, técnicas y flujos de trabajo que se pueden encontrar en el sitio original. Había que comenzar por algo.

No obstante lo incompleto, The Programming Historian en español merece mucho la pena ser visitado porque contiene -por ahora solamente-, la Introducción a Python, un conjunto de tutoriales pensados para estudiarse de manera seriada que permite a los historiadores aprender los rudimentos de ese lenguaje de programación de alto nivel multipropósito. Muchos colegas historiadores y humanistas se preguntarán aquí, «¿para qué nos sirve saber esas cosas que les competen a los encargados de cómputo de mi institución?»

No podemos negar que nuestro quehacer académico se ha digitalizado a un grado superlativo en las últimas décadas. Nos hemos percatado que manipular datos digitalmente nos ofrece la posibilidad de ampliar nuestros horizontes de investigación. Hace tiempo que los historiadores trabajamos con bases de datos de diverso tipo, hacemos análisis de redes sociales auxiliados de programas de cómputo especializado, recurrimos a sistemas de información geográfica para el análisis espacial y para generar representaciones cartográficas, o usamos hojas de cálculo para tabular datos seriales para hacer historia económica o demografía histórica, obteniendo gráficas muy interesantes de tendencias de crecimiento. Pero también, entre otras muchas cosas, los historiadores podemos trabajar con conjuntos de datos masivos (big data), y es ahí donde radica la importancia de aprender un lenguaje de programación que nos permita sacarle provecho a una cantidad ingente de datos.

Los historiadores generalmente acudimos a documentos en los que quedó, en forma de texto, algún registro de los acontecimientos, de las ideas de una persona o de un grupo de personas, así como de las formas culturales de estructurar los discursos. Esos son algunos de los datos con los que trabajamos. Cuando leemos un documento lo interpretamos, es decir, diseccionamos y reorganizamos su discurso de tal manera que los datos nos ofrezca un significado. En otras palabras: manipulamos los datos de diversas maneras a través de un sinnúmero de operaciones de por medio. A veces, con un conjunto de textos, realizamos una serie de operaciones cuantitativas en busca de respuestas cualitativas. Por ejemplo, contamos la frecuencia (concordancia) con la que aparece una palabra o una frase, elaboramos la hipótesis de que esta palabra resulta clave para determinada época, así que buscamos el contexto en el que se encuentra ese término para reconstruir redes semánticas que nos ayuden a comprender un corpus documental mayor. También ponemos atención a las interrelaciones entre un concepto y otro, vemos cuáles juegan un papel intercambiable en el complejo contexto del discurso que nos ofrecen los documentos. Además, ponemos énfasis en las relaciones de intertextualidad entre un tipo de documentos y otros, para intentar reconstruir y explicarnos el contexto cultural en el que se produjeron.

Podemos hacer todo esto de manera más o menos sencilla cuando nos enfrentamos a un corpus documental restrigido, de cien, quinientos o mil quinietos expedientes de archivo… e, incluso, ahí comienzan nuestros peores dolores de cabeza: tenemos que organizar nuestros glosarios de términos, nuestras redes de interrelaciones conceptuales.

Ahora imaginemos que Internet pone a nuestra disposición la transcripción de la impresionante cantidad de ¡197,745! juicios criminales llevados a cabo frente a un tribunal londinense entre 1674 y 1913. Para un historiador solitario, tal cantidad de documentos resulta imposible de procesar y analizar, ya ni se diga de imaginar. Pero, de tener las herramientas, ¿no estaríamos tentados a hacer algunos análisis cuantitativos de esos documentos? ¿No sería maravilloso buscar algunas series de conceptos, sus interrelaciones, los contextos en los que se ubican y sus cambios a lo largo de varias décadas o siglos? La herramienta para hacerlo es posible, está en nuestra propia computadora y solamente es necesario aprender un poco de programación para echarla a funcionar.

En términos de la ciencia de la computación, de la información, de la data, una palabra es una secuencia de caracteres específica, es decir, una cadena de caracteres (string) organizada de una forma determinada que nos ofrece cierto significado, pero que para una computadora es un conjunto de datos procesables carentes de significado. Las frases son una secuencia de palabras interrelacionadas de cierta manera, es decir, cadenas de caracteres de mayor longitud. Un párrafo, el contenido escrito de un documento, el de un expediente, el de un legajo, el de todo un ramo del acervo de un archivo, contiene grandes series diferenciadas de cadenas de caracteres, de datos susceptibles de ser procesados y manipulados por computadora. Los programas de ofimática que utilizamos, como los procesadores de texto, ofrecen cierta capacidad de manipular esos datos, pero es una manipulación elemental y que nunca controlamos a nuestro gusto. En el procesador de texto podemos buscar una palabra determinada (una cadena de caracteres) y obtener un informe de las veces que aparece en el texto. Pero es imposible sacarle más jugo al asunto si queremos incluir las variables de esa palabra y obtener su concordancia en los diversos contextos en las que se encuentra, o construir modelos tópicos. Además, sería imposible trabajar con 197 mil expedientes en ese tipo de programas, por ejemplo, en un solo archivo de MS-Word.

Una de las bondades de Python es que es un lenguaje de programación muy sencillo en su sintaxis a la vez que poderoso (por ser un lenguaje interpretado de alto nivel). Ello facilita el uso del conjunto de funciones orientadas para operar sobre cadenas de caracteres, entre las que se incluyen comparación, búsquedas boleanas, organización por diccionarios, aprendizaje máquina, construcción de n-gramas, modelado tópico y otras más cuya utilización es muy eficaz para analizar datos masivos y generar, con la ayuda de otras herramientas, visualizaciones de los datos que nos permitan encontrar secuencias o tendencias a nivel macro que no podríamos detectar de otra manera; por ejemplo, cómo cambia la relación de sustantivos y adjetivos vinculados con la palabra «asesinato» a lo largo de 150 años, o encontrar, como lo hizo Fred Gibbs, cuál era el método preferido por los criminales londinenses para envenenar a sus víctimas a lo largo de varias décadas. Podemos también construir, estadísticamente, el conjunto de temas predominantes en un conjunto de documentos.

Veamos el ejemplo en el que se basan los tutoriales de Python en The Programming Historian. El proyecto de publicación en Internet de los expedientes criminales londinenses, The Proceedings of the Old Bailey, puso en línea 197,745 transcripciones de juicios criminales, es decir, cerca de 127 millones de palabras registradas a lo largo de 239 años de fuentes históricas capaces de ser analizadas. Esto supuso un reto para los historiadores digitales que generó varios proyectos de desarrollo de herramientas informáticas para proponer un macroanálisis de esto que, en términos de la práctica del historiador, es un conjunto de datos masivos. Entre los diversos proyectos se puede consultar el resultado de Data Mining with Criminal Intent, un proyecto multinacional; Exploring Big Historical Data: The Historian’s Macroscope, y el origen del sitio de tutoriales para historiadores digitales cuya primera versión escribieron WJ Turkel y A MacEarchen The Programming Historian version 1.

Parece que, de ahora en adelante, para los historiadores que se enfrentan de lleno al contexto digitalizado en su práctica cotidiana, saber programar, es decir, escribir código para hacer programas y extraer datos de sus documentos, es muy recomendable. En un mundo donde tenemos acceso a cantidades increíbles de datos, si se permite la comparación, será lo mismo que saber paleografiar.

¿Big data en la investigación histórica?

¿Análisis de big data en la investigación histórica? John Mashey, el científico informático que popularizó el término big data en los años 1990, seguramente moriría de risa si le dijéramos que quienes nos dedicamos a la historia podríamos procesar nuestros datos históricos digitalizados con métodos y técnicas utilizados para el análisis de grandes conjuntos de datos (big data sets). Big data es lo que procesan las grandes empresas de análisis de datos. Se calcula que Google manejaba unos 20 Petabytes de datos diariamente en 2008 (20 X 1,0005 bytes), mientras que toda la información de una investigación histórica no debe rebasar unos cuantos GB.

Sin embargo, los autores del libro Exploring Big Historical Data: The Historian’s Macroscope (2016) recurren al viejo proverbio inglés y argumentan, con razón que: “big is in the eye of the beholder”, algo así como que “el color depende del cristal con que se mire”. Porque en la investigación histórica hay tareas que parecen irrealizables para una sola persona investigadora o para un equipo, como la de procesar en un sólo estudio los 197,752 extractos de juicios criminales digitalizados que contiene el sitio The Procedings of the Old Bailey, la corte criminal de la ciudad de Londres entre 1674 y 1913.

Sobre este libro, la revista Virtualis. Revista de cultura digital del Tecnológico de Monterrey, México, acaba de publicar una reseña mía que puedes encontrar aquí y descargar el texto en PDF.

El libro fue escrito de manera colaborativa por Shawn Graham, Ian Milligand y Scott B. Weingart y es, en realidad, un manual de metodologías, técnicas y herramientas digitales para el procesamiento de datos, mayoritariamente aquellas diseñadas para el tratamiento de lenguaje natural. Por ello, está muy estrechamente vinculado al proyecto The Programming Historian y al ya clásico libro de Cohen y Rosenzweig Digital history: a guide to gathering, preserving, and presenting the past on the Web.

Si hay una forma amable de introducción a la historia digital para estudiantes de grado y posgrado, son esos tres caminos.

Referencias

  • Cohen, D. J., & Rosenzweig, R. (2006). Digital history: A guide to gathering, preserving, and presenting the past on the Web. University of Pennsylvania Press. http://chnm.gmu.edu/digitalhistory/
  • Gayol, V. (2016). Exploring big historical data. The historian’s macroscope. Virtualis, 7(13), 102–105.
  • Graham, S., Milligan, I., & Weingart, S. (2016). Exploring big historical data: The historian’s macroscope. Imperial College Press. http://www.themacroscope.org/2.0/

Historiadores y Bases de Datos 1. François-Xavier Guerra

Nótese que esta entrada replica la publicada en Cuaderno crudo, bitácora asociada a la primera versión de cibercliografía.org.

Cuando estudié la licenciatura, allá por la década de 1980, me comenzó a interesar el uso de las computadoras y las posibilidades de aplicar la tecnología a la investigación histórica. En esos años era muy difícil acercarse a una Computadora Personal (PC), aprender a utilizarla y sacarle algún provecho. La primera máquina que recuerdo haber tecleado y que no dejaba de sorprenderme con lo que aparecía en la pantalla negra con caracteres verdes fue una Apple IIe que tenían en un laboratorio de arqueología de La Escuela y en la que ya se podía correr el dBase II, así que tuve la oportunidad de aprender algo sobre bases de datos (BD) y procesadores de textos (el transparente WordPerfect para el Apple DOS). Ahí fue cuando empezó mi curiosidad por las BD; primero el problema de cómo funcionaban y segundo el problema de cómo diseñar una BD para los fines de una investigación. Y en ese sentido, siempre es bueno detenerse a pensar cómo hicieron las cosas algunos historiadores que utilizaron recursos informáticos para su investigación.

Análisis de un diseño.

En 1988 apareció la traducción al español, en dos tomos, del importante libro de François-Xavier Guerra, Del antiguo régimen a la revolución, cuya investigación inició en 1971 y fue presentada como tesis de doctorado de estado en Francia en 1982, luego publicada como libro en 1985.(1) A mi no me interesaba en realidad una historia tan contemporánea, pero el trabajo de Guerra me llamó la atención por su propuesta metodológica. FX Guerra se propuso reconstruir y analizar el universo de los actores políticos del porfiriato y la revolución para encontrar las dinámicas de cambios y permanencias en el sistema. Para hacer el análisis, Guerra recurrió a una prosopografía colectiva para lo cual tuvo que armarse de una BD ad hoc que le permitiera la captura y el manejo de información biográfica de varios miles de personajes. Todo ello, obviamente, lo hizo con los recursos informáticos existentes en el momento en el que llevó a cabo su investigación: la década de 1970.

La base de datos prosopográfica que diseñó Guerra para estudiar a los actores políticos de la historia mexicana entre 1876 y 1930, reúne información de alrededor de 7,838 individuos y colectividades, y cuenta con cerca de cien mil datos diferentes relacionados a ellos: origen familiar, fecha y lugar de nacimiento, educación, carrera política o militar y riqueza. En suma, se trata de un total de cuarenta y dos variables asociadas a cada personaje que dan cuenta de su vida y actividad publica de manera sistemática. En la actualidad, cualquiera que tenga una PC podría tratar esta información con un programa de BD relacional de fácil manejo, como Microsoft Access o FileMaker. Pero en la década de 1970, las cosas era muy distintas.

Afortunadamente, FX Guerra incluyó la base de datos en los anexos I y II de su libro, así que se puede reconstruir la manera en la que fue diseñada. Sabemos por él también que tuvo que recurrir al Centro de Cálculo (CIRCE) en Orsay. Pero fuera de comentar que la base de datos tuvo que ser alojada en tres grandes cintas magnéticas, no nos da mayor detalle de la máquina o del programa que fue utilizado, y refiere solamente que éste fue diseñado por Denys Ducornet, seguramente un ingeniero en sistemas. Sin embargo, navegando por Internet me topé con que, por aquel tiempo, en el CIRCE de Orsay tenían máquinas de la familia IBM System 360. Así que la máquina en la que se desarrolló la BD de FX Guerra debió tener un aspecto parecido a la que se ve en la fotografía de abajo.

Supercomputer_NSA-IBM360_85-1024x830
IBM System 360 Modelo 85 Tomada de Wikipedia

La familia de las IBM System 360 corresponde a un tipo de máquina que se conoce como Computadora Central o Mainframe. Las IBM S-360 fueron producidas entre 1964 y 1977,  eran inmensas y funcionaban con sistemas operativos cuya utilización demanda necesariamente el conocimiento de lenguaje ensamblador de alto nivel para poder darle instrucciones a la máquina. Algunas tenian pantallas en las que se podían leer las líneas de comandos y guardaban los datos en grandes cintas magnéticas. La base de datos de Guerra estuvo contenida en tres de estas cintas. Es importante resaltar que, al contrario de nuestras actuales PC de escritorio, en ese tipo de máquinas es necesario codificar previamente toda la información que se introduce en la base de datos. El que FX Guerra haya considerado necesario incluir en los anexos del libro la explicación de cómo se codificó la información es de gran ayuda para los historiadores interesados en la prosopografía porque, aunque no utilicemos una IBM S-360 sino una pequeña PC con un programa de BD, nos muestra que es muy importante la manera en la que se eligen los datos a sistematizar y nos permite entender cómo diseñar una BD.

Cuando tuve en mis manos el libro de FX Guerra estuve repasando durante varios meses los anexos relativos a la base de datos. Para finales de la década de 1980, toda la explicación de la codificación podía parecer un tanto árida pues ya contábamos con PC con programas en los que se podían diseñar BD sin recurrir a una codificación previa tan compacta. Sin embargo, observar el sistema de codificación resultaba interesante e incluso útil porque, por entonces, los campos de las BD no soportaban textos largos tipo memo sino que tenían que construirse campos con solamente algunos cuantos caracteres alfanuméricos. Además, el ejercicio permitía que uno se adentrase en la lógica del diseño.

Aunque parece lo contrario a simple vista, la codificación es muy sencilla y obedece a las necesidades de interrelacionar partículas de información con una persona determinada, ya sea individuo o colectividad. Lo primero que tuvieron que hacer fue determinar una clasificación para los individuos, pues la finalidad de una base de datos prosopográfica es relacionar y organizar la información biográfica de los personajes. Para ello se optó por dotar a los individuos con un código de identificación único que consta de las iniciales de su primer apellido y su primer nombre, más un número arbitrario de uno a cuatro dígitos (al parecer, es el número consecutivo según se fue alimentando la BD). Por ejemplo, Francisco I. Madero está codificado como MF 7081, mientras que Porfirio Díaz tiene el código DP 7080. En el caso de las colectividades (ciudades, pueblos, unidades militares), el proceso de identificación es muy parecido.

Una vez organizada y sistematizada la lista de los actores individuales y colectivos, fue necesario establecer la codificación para el resto de la información. Como se trata de un análisis prosopográfico, los datos básicos hacen referencia a la vida de una persona: familia, nacimiento, educación, actividad pública y muerte. También son importantes los datos cronológicos y espaciales pues los individuos hacen su vida en el espacio-tiempo. Pero, como el interés principal era analizar la participación política, hay una serie de datos importantes que Guerra decidió tomar en cuenta: sus cargos políticos o militares, su actividad en acciones importantes, sus vínculos personales y su filiación política.

Cada uno de los acontecimiento de la biografía de un actor se codificó mediante la creación de un módulo de diez celdas en las que debía describirse el suceso de la manera más sintética posible. Cada módulo debía organizar la información sobre la naturaleza del acontecimiento, fechas, lugares, así como la característica específica de ese dato. Después, cada una de las celdas se llenó con un carácter alfanumérico preestablecido y así se obtenía el código respectivo del acontecimiento particular.

Los datos biográficos de un individuo adquieren una sintaxis curiosa en el informe impreso de la BD. Por ejemplo, para referirse al nacimiento de una persona el módulo comienza con el código BN (posiblemente «biographie» y «naissance«) en las dos primeras celdas; las dos siguientes se refieren al año de nacimiento, la siguiente al mes, y las cinco restantes al lugar. De tal manera, los datos del nacimiento de Francisco I. Madero se expresan con la siguiente sintaxis:

BN73ACO036

Lo cual quiere decir que Francisco I Madero nació en algún día del mes de octubre de 1873, en la Hacienda de Parras, Coahuila.

Veamos, por ejemplo, la ficha biográfica completa de Bernardo Reyes en la base de datos de FX Guerra:

BREYES0
Biografía codificada del Gral. Bernardo Reyes en la BD de F-X Guerra

Los códigos leídos por filas de izquierda a derecha y de arriba a abajo indican lo siguiente: 1) Es parte de una red de lazos interpersonales (LX), 2) Origen familiar (BF), 3) Fecha y lugar de nacimiento (BN), 4) Cultura (BC), 5) Profesión (BW, 6) Grado militar (WF), 7) Victoria militar (BZ), y así hasta llegar a BM que se refiere a la fecha y lugar de fallecimiento que, en el caso de Reyes se lee: «caído en combate en el mes de febrero de 1913 en la ciudad de México.»

Por fortuna, las BD en la actualidad nos permiten generar campos con texto completo y no es necesario sintetizar la información como se hacía anteriormente, aunque estos campos presentan el problema de no poder ser indexados por lo que tenemos que elegir cuáles campos de nuestra BD podrán contener texto completo y cuales necesariamente deberán ir ser numéricos o alfanuméricos con un número de caracteres limitado para que la BD tenga un mejor rendimiento. Pero ese será el tema de otra entrada.

Lo que sigue siendo muy interesante de la BD de FX Guerra es el cómo se determinaron las variables que entran en juego en la biografía de una persona así como su clasificación. Mientras que un grupo del total de las 46 variables se refiere a acciones específicas de la vida (nacimiento, educación, origen, muerte), otras se refieren a los cargos políticos, administrativos y militares ocupados por la persona. Es decir, una base de datos prosopográfica de este tipo está diseñada haciendo énfasis en las personas como actores políticos. Si nosotros queremos diseñar una base de datos prosopográfica, no solamente tendremos que incluir los datos vitales de las personas sino todos aquellos acontecimientos que sean importantes dependiendo de la orientación de nuestra investigación. Así, serán diferentes los acontecimientos incluidos en una BD construida para una investigación de historia empresarial que los incluidos en una investigación sobre historia intelectual. Por lo pronto, aquí dejo las variables de la BD de FX Guerra.

Variables

Notas:

(1) François-Xavier Guerra, Del antiguo régimen a la revolución, 2 Vols., trad. de Sergio Fernández Bravo, México, Fondo de Cultura Económica, 1988 (Sección de Obras de Historia). Edición original: Le Mexique de l’Ancien Régime à la Revolution, Paris, L’Harmattan/Publications de la Sorbonne, 1985 (Travaux et mémories de l’Institut des hautes études de l’Amérique latine, 36).