Durante cuatro años de intenso trabajo, investigadores de la Universidad de Harvard, la Enciclopedia Británica, el American Heritage Dictionary y Google han viajado a través de la historia de la literatura digitalizada con el objetivo de analizar la frecuencia con la que aparecen determinadas palabras y frases.
Este equipo ha utilizado un nuevo método – conocido como culturómica, por su analogía con la genómica – para profundizar en temas tan diversos como la memoria colectiva de la humanidad, la adopción de la tecnología, la dinámica de la fama y los efectos de la censura y la propaganda.
Genoma cultural
Para ello se sumergieron en los más de 5,2 millones de libros colgados en Google Books. Alrededor del 72 por ciento de los textos está en inglés, con cantidades más pequeñas en francés, español, alemán, chino y ruso. Según los protagonistas de este proyecto, se trata del lanzamiento de datos más grande de la historia de la Humanidad, una secuencia de letras 1.000 veces mayor que el genoma humano. Este inmenso volumen de información está disponible para su consulta junto con el Google Books Ngram Viewer, la herramienta que hace posible cuantificar y comparar la presencia de los vocablos y sentencias que introduzcamos al realizar la consulta.
Curiosidades
El enfoque aportado por Culturomics resulta ser un poderoso instrumento para la identificación automática de la censura y la propaganda. Por ejemplo, el artista judío Marc Chagall fue mencionado sólo una vez en todo el régimen Nazi (desde 1936 a 1944), aunque su importancia en los libros en inglés creció casi cinco veces. Otra evidencia similar de censura se observa en Rusia en relación con Leon Trotsky, en chino con respecto a la plaza de Tiananmen, y en los Estados Unidos con respecto a los ”Diez de Hollywood”, un grupo de artistas incorporados a la conocida lista negra elaborada tras la Segunda Guerra Mundial.
El estudio también ha desvelado otros datos quizás no tan relevantes, pero sí curiosos. Freud está más profundamente arraigado en nuestro subconsciente colectivo que otras figuras como Galileo, Darwin o Einstein. Asimismo, los personajes célebres del siglo XX son más jóvenes y más famosos que sus predecesores del siglo XIX, pero su éxito se extingue antes. Las celebridades nacidas en el año 1950 alcanzaron la fama a una edad media de 29 años, frente a los 43 de las nacidas en el año 1800. Pero su popularidad también desaparece más rápidamente, con una “vida media” que se acorta a medida que nos acercamos a la actualidad.
Enlace | Harvard Gazette