¿Qué nos enseña el big data sobre la narrativa?

Toqué este tema en mi blog el año pasado, cuando hablaba de títulos de libros. Incluso me divertí escribiendo algoritmos para analizar los títulos de libros más populares en géneros particulares y luego deletrear nuevos títulos.

Los resultados fueron predecibles, ya que los nuevos títulos se parecían mucho a los títulos más populares. Pero hay una buena razón para eso (además del hecho de que los títulos son generalmente de 5 palabras o menos): la mayoría de los títulos de libros en un género dado ya son bastante similares .

Esto no es por nada. Los autores de ficción de género quieren que sus libros sean recogidos por lectores a quienes les guste el mismo tipo de cosas. Y las predicciones de Big Data confirman esto.

Así que Big Data ciertamente tiene algo que decirnos sobre los títulos, incluso si no es muy útil.

¿Pero puede enseñarnos algo sobre la narrativa?

No tengo acceso a ningún Really Big Data sobre ficción, pero he realizado un análisis estadístico del contenido de 60 libros que están todos en el mismo género, por un total de 22 autores diferentes. Mi interés era tener una idea de la estructura (cómo se dividían los libros en capítulos o escenas, longitud del párrafo, longitud de la oración, etc.), así como una mirada a la curva del vocabulario. Tengo que decir que no hubo sorpresas. Estoy seguro de que si escribiera en un blog los resultados y los gráficos recibiría mucha atención, pero ¿realmente nos diría algo ?

No lo creo. Lo que me dijo fue que había mucha variación en la longitud de las oraciones, párrafos, escenas y capítulos, pero una variación limitada en el vocabulario. Podría haberte dicho eso sin el análisis.

Eventualmente sospecho que Big Data podrá mostrar tendencias en el uso, tanto de palabras como de puntuación. Será capaz de mostrar tendencias en muchas estructuras de oraciones. ¿Será de alguna utilidad? Lo dudo.

De hecho, la pregunta es: ¿puede el análisis de Big Data ayudar a los autores a escribir mejores libros, o incluso solo libros que se vendan mejor?

Para responder a esto, terminamos en la misma situación con los títulos de los libros. Debido a que Big Data tiene que ver con tamaños de muestra muy grandes, Big Data siempre será bueno para mostrar lo que es exitoso en este momento . Suponga que puede mostrarle que los libros que actualmente venden los mejores no tienen más de 6000 * palabras únicas en ellos. Por lo tanto, tratará de mantener limitado el tamaño de su vocabulario. Pero la próxima gran cosa podría estar a punto de llegar a los estantes. Podría llegar a los estantes mañana. Y podría tener un vocabulario de 10,000 palabras únicas. No hay forma de que Big Data pueda predecir eso. ¿Por qué?

Porque hay muchos factores diferentes que intervienen en la creación de un libro exitoso. Y algunos de esos factores están completamente más allá de Big Data. Y cualquier subconjunto de esos factores podría causar el éxito de la próxima gran cosa. Cualquier subconjunto puede crear la próxima moda, o simplemente causar un resurgimiento menor en un tipo de ficción que ya es popular.

Sospecho que es más útil mirar lo que se está vendiendo bien en este momento, y apuntar a escribir algo que sea lo suficientemente similar como para que los lectores elijan fácilmente su libro como su próxima lectura … pero también, para dar un salto de imaginación. mueve tu libro a un nuevo territorio.

Esta misma técnica, cuando carece de delicadeza o creatividad, es lo que causa los tropos Nuestros monstruos son diferentes y Ninja Pirate Zombie Robot. No hace falta decir que creo que es mejor evitarlo.


_________________
* Para información: en realidad, esto está en el extremo inferior de una escala muy amplia.