Pasión por leer. Pasión por escribir.

Portada > Noticias > Varios > Books Ngram Viewer: nace la culturonomia

Books Ngram Viewer: nace la culturonomia

¿Cuánto se usan ciertas palabras en los libros? Juega con nosotros...

10 de enero de 2011. Emilio Ruiz Mateo

Qué: Books Ngram Viewer

Un artículo publicado el pasado diciembre en la revista de ciencia Science ha acabado por ser tema de conversación entre escritores, críticos, curiosos y especialistas. Google ha lanzado al ciberespacio una herramienta con la que pasarás horas con nada que seas un poco juguetón… Se trata del Books Ngram Viewer, una base de datos con la que puedes comprobar con un solo clic la evolución que una palabra o un grupo de palabras han experimentado en los dos últimos siglos en los libros. Esto, que podría ser una simple cuestión de estadística, se convierte en manos de los que trabajan el lenguaje (en mayor medida, de los que estudian el lenguaje) en una mina de oro. Pongamos por caso que un crítico literario quiere comprobar desde cuándo se empieza a hablar de “autoficción” en España, como es el caso de Vicente Luis Mora en su blog Diario de lecturas. Lo que podría exigir meses de investigación se soluciona gracias a Books Ngram Viewer en 5 segundos.

No es casual que el juguetito haya surgido de la cabeza de dos estudiantes de Harvard (Erez Lieberman Aiden y Jean-Baptiste Michel) interesados en el lenguaje: tuvieron que hacer un estudio sobre los verbos irregulares ingleses, y tardaron 18 meses… Para evitarlo en el futuro, se inventaron esta base de datos. Luego llamaron a las puertas de Google… El resultado es este Books Ngram Viewer y un fenómeno que ya tiene nombre: culturonomia (culturomics). Pones “Tiananmen Square” a partir de 1800 y descubres (lógicamente) esto. Pones “blog” y el resultado es este.

Pero ojo, que una base de datos no es la realidad: hay que tener muy en cuenta que hablamos de datos extraídos de 5,2 millones de libros digitalizados por Google (lo que equivale a 500 mil millones de palabras en inglés, francés, español, alemán, chino y ruso) entre 1500 y 2008. Hay, por supuesto, una criba, la que supone partir de los libros escaneados en la inmensa base de datos de Google, que por muy inmensa que sea, nunca será total. Books Ngram Viewer, en nuestra opinión, es sin duda útil, pero hay que interpretarla con ojo crítico. Sirva de fácil ejemplo el gráfico de las apariciones de Umberto Eco en español a partir del 1900 (en la imagen de arriba a la derecha). Serviría de respuesta a una pregunta del Trivial, ¿no te parece? ¿En qué año se editó El nombre de la rosa? Ojo, dijimos "en español"...

Comentarios en estandarte- 3

1 | Monica 10-01-2011 - 14:38:47 h
Pon Amor en Español y Love en ingles, y saca conclusiones... : ) Gracias Standarte!

2 | Maren R. 10-01-2011 - 15:01:35 h
¡Fantástica herramienta este Books Ngram Viewer!

3 | Enegildo Peña 13-01-2011 - 02:59:04 h
Consdiera que era ya tiempo, que desde el Internet haya una necesidad de querer proteger los lenguas, con mayor razón el de nuestra lenguaje español, que muchas veces es limitado y empobrecido por la misma red. Enegido Peña, Santiago, Rep. Dom.