Article de Proyecto 451 (newsletter).

“Después del primer confinamiento en marzo de 2020, busqué datos de ventas de libros. Quería saber a qué libros recurría la gente en los primeros días de la pandemia ¿Cuántas copias de la novela pandémica Station Eleven de Emily St. John Mandel se vendieron en tiempos de COVID en comparación con cuando la novela debutó en 2014? ¿Y qué hay de las historias de peste mucho más antiguas de Giovanni Boccaccio, del siglo XIV, El Decamerón? ¿La gente se aferró o huyó de las historias de pandemia durante el pico de pánico del coronavirus? Se podría pensar que un investigador sería capaz de averiguar exactamente cuántos ejemplares de un libro se vendieron en determinados meses o años. Pero estaba equivocado. Fui a buscar datos de ventas de libros, solo para descubrir que la mayor parte es patentada y está bloqueada a propósito. Lo que aprendí fue que los datos individuales más influyentes en la industria editorial, que, todos los días, determinan los contratos de libros y la vida de los autores, son básicamente inaccesibles para cualquiera que no pertenezca a la industria. Y aprendí que este es un gran problema”, así comienza este interesantísimo artículo en el que los profesores Richard So, Laura McGrath y Dan Sinykin cuentan sobre la importancia de poder acceder a los datos de venta de la industria para así tomar decisiones de negocio que respondan al movimiento del mercado.

La fuente subyacente de todas las cifras de ventas suele ser BookScan. Desde su lanzamiento en 2001, BookScan ha ganado autoridad. Todas las principales casas editoriales ahora confían en sus datos. Pero el gran problema es que casi todos tienen prohibido explícitamente el uso de datos de BookScan, incluidos los académicos. La combinación tóxica del poder de estos datos en la industria y su inaccesibilidad secreta para quienes están más allá de la industria revela un problema más amplio. Si queremos comprender el mundo literario contemporáneo, necesitamos mejores datos de libros. Y necesitamos que estos datos sean gratuitos, abiertos e interoperables.

“Las industrias culturales utilizan cada vez más nuestros datos para vendernos sus productos. Es hora de usar sus datos para estudiarlos”. Con ese fin, Richard So, Laura McGrath y Dan Sinykin, crearon Post45 Data Collective, un sitio de acceso abierto que revisa y publica datos literarios y culturales. Uno de los objetivos del repositorio es ayudar a los investigadores a obtener crédito por los datos que recolectan, limpian y comparten minuciosamente. Pero un objetivo más amplio es compartir datos culturales gratuitos con cualquier persona que quiera reutilizarlos y recombinarlos para comprender mejor la literatura, la música, el arte.

Por supuesto, hacer que los datos estén disponibles públicamente es solo el primer paso. Dar sentido a los datos es el siguiente paso mucho más difícil ¿Qué podemos aprender sobre la cultura mediante el estudio de los datos? ¿Qué tipo de preguntas podemos responder realmente?

El futuro de la cultura humana ya está siendo determinado por los datos. Para comprender este futuro y tener la oportunidad de remodelarlo, debemos preocuparnos por los datos. Necesitamos saber dónde están, quién los controla y cómo se utilizan (Publicbooks, 12 minutos).

Més informació: