![]() | |
Captura de pantalla ![]() | |
Tipo de sitio | Libreria digital |
---|---|
Dueño | |
URL | libros.google.com |
Lanzado | Octubre de 2004 ; Hace 17 años (como Google Print) ( 2004-10) |
Estado actual | Activo |
Google Books (anteriormente conocido como Google Book Search y Google Print y por su nombre en clave Project Ocean) es un servicio de Google Inc. que busca el texto completo de libros y revistas que Google ha escaneado y convertido en texto mediante el reconocimiento óptico de caracteres ( OCR) y almacenado en su base de datos digital. Los libros son proporcionados por editores y autores a través del Programa para socios de Google Libros, o por los socios de bibliotecas de Google a través del Proyecto para bibliotecas. Además, Google se ha asociado con varios editores de revistas para digitalizar sus archivos.
El Programa para editores se conoció por primera vez como Google Print cuando se presentó en la Feria del Libro de Frankfurt en octubre de 2004. El Proyecto de bibliotecas de Google Books, que escanea obras en las colecciones de bibliotecas asociadas y las agrega al inventario digital, se anunció en diciembre de 2004.
La iniciativa Google Books ha sido aclamada por su potencial para ofrecer un acceso sin precedentes a lo que podría convertirse en el mayor conjunto de conocimientos humanos en línea y promover la democratización del conocimiento. Sin embargo, también ha sido criticado por posibles violaciones de derechos de autor y falta de edición para corregir los muchos errores introducidos en los textos escaneados por el proceso de OCR.
En octubre de 2015, el número de títulos de libros escaneados superaba los 25 millones, pero el proceso de escaneo se ha ralentizado en las bibliotecas académicas estadounidenses. Google estimó en 2010 que había alrededor de 130 millones de títulos distintos en el mundo y declaró que tenía la intención de escanearlos todos. En octubre de 2019, Google celebró los 15 años de Google Books y proporcionó la cantidad de libros escaneados en más de 40 millones de títulos.
Los esfuerzos de escaneo de Google Book han estado sujetos a litigios, incluido Authors Guild v. Google, una demanda colectiva en los Estados Unidos. Este fue un caso importante que estuvo cerca de cambiar las prácticas de derechos de autor para obras huérfanas en los Estados Unidos.
Los resultados de Google Books aparecen tanto en la Búsqueda universal de Google como en el sitio web dedicado a la búsqueda de Google Books ( books.google.com).
En respuesta a las consultas de búsqueda, Google Libros permite a los usuarios ver páginas completas de libros en los que aparecen los términos de búsqueda si el libro no tiene derechos de autor o si el propietario de los derechos de autor ha dado permiso. Si Google cree que el libro todavía está protegido por derechos de autor, un usuario ve "fragmentos" de texto alrededor de los términos de búsqueda consultados. Todas las instancias de los términos de búsqueda en el texto del libro aparecen resaltadas en amarillo.
Los cuatro niveles de acceso que se utilizan en Google Books son:
En respuesta a las críticas de grupos como la Asociación Estadounidense de Editores y el Gremio de Autores, Google anunció una política de exclusión voluntaria en agosto de 2005, a través de la cual los propietarios de derechos de autor podrían proporcionar una lista de títulos que no quieren escanear, y la solicitud sería ser respetado. La empresa también declaró que no escanearía ningún libro protegido por derechos de autor entre agosto y el 1 de noviembre de 2005, para brindar a los propietarios la oportunidad de decidir qué libros excluir del Proyecto. Por lo tanto, los propietarios de los derechos de autor tienen tres opciones con respecto a cualquier trabajo:
La mayoría de las obras escaneadas ya no están impresas ni disponibles comercialmente.
Además de adquirir libros de las bibliotecas, Google también obtiene libros de sus socios editores, a través del "Programa de socios", diseñado para ayudar a los editores y autores a promocionar sus libros. Los editores y los autores envían una copia digital de su libro en formato EPUB o PDF, o una copia impresa a Google, que está disponible en Google Libros para su vista previa. El editor puede controlar el porcentaje del libro disponible para vista previa, siendo el mínimo el 20%. También pueden optar por hacer que el libro sea completamente visible e incluso permitir que los usuarios descarguen una copia en PDF. Los libros también se pueden poner a la venta en Google Play. A diferencia del Proyecto para bibliotecas, esto no plantea ningún problema de derechos de autor, ya que se lleva a cabo de conformidad con un acuerdo con el editor. El editor puede optar por retirarse del acuerdo en cualquier momento.
Para muchos libros, Google Libros muestra los números de página originales. Sin embargo, Tim Parks, escribiendo en The New York Review of Books en 2014, señaló que Google había dejado de proporcionar números de página para muchas publicaciones recientes (probablemente las adquiridas a través del Programa de socios) "presumiblemente en alianza con los editores, para forzar aquellos de nosotros que necesitamos preparar notas a pie de página para comprar ediciones en papel ".
El proyecto comenzó en 2002 con el nombre en clave Project Ocean. El cofundador de Google, Larry Page, siempre ha tenido interés en digitalizar libros. Cuando él y Marissa Mayer comenzaron a experimentar con el escaneo de libros en 2002, les tomó 40 minutos digitalizar un libro de 300 páginas. Pero poco después, la tecnología se desarrolló hasta el punto de que los operadores de escaneado podían escanear hasta 6000 páginas por hora.
Google estableció centros de escaneo designados a los que se transportaban los libros en camiones. Las estaciones podrían digitalizar a una velocidad de 1.000 páginas por hora. Los libros se colocaron en una base mecánica hecha a medida que ajustaba el lomo del libro en su lugar mientras una serie de luces e instrumentos ópticos escaneaban las dos páginas abiertas. Cada página tendría dos cámaras dirigidas a capturar la imagen, mientras que un telémetro LIDAR superponía una cuadrícula láser tridimensional en la superficie del libro para capturar la curvatura del papel. Un operador humano pasaría las páginas a mano, usando un pedal para tomar las fotografías. Sin necesidad de aplanar las páginas o alinearlas perfectamente, el sistema de Google no solo alcanzó una eficiencia y velocidad notables, sino que también ayudó a proteger las frágiles colecciones de una manipulación excesiva. Posteriormente, las imágenes crudas pasaron por tres niveles de procesamiento: primero, los algoritmos de deformación utilizaron los datos LIDAR para corregir la curvatura de las páginas. Luego, el software de reconocimiento óptico de caracteres (OCR) transformó las imágenes sin procesar en texto y, por último, otra ronda de algoritmos extrajo números de página, notas al pie, ilustraciones y diagramas.
Muchos de los libros se escanean con una cámara Elphel 323 personalizada a una velocidad de 1.000 páginas por hora. Una patente otorgada a Google en 2009 reveló que Google había ideado un sistema innovador para escanear libros que utiliza dos cámaras y luz infrarroja para corregir automáticamente la curvatura de las páginas de un libro. Al construir un modelo 3D de cada página y luego "desarmarlo", Google puede presentar páginas de aspecto plano sin tener que hacer que las páginas sean realmente planas, lo que requiere el uso de métodos destructivos como la separación o placas de vidrio para individualmente aplanar cada página, lo cual es ineficaz para el escaneo a gran escala.
Para cada trabajo, Google Libros genera automáticamente una página de descripción general. Esta página muestra información extraída del libro (sus detalles de publicación, un mapa de palabras de alta frecuencia, la tabla de contenido), así como material secundario, como resúmenes, reseñas de lectores y enlaces a otros textos relevantes. Un visitante de la página, por ejemplo, puede ver una lista de libros que comparten un género y tema similar, o puede ver una lista de estudios actuales sobre el libro. Este contenido, además, ofrece posibilidades interactivas para los usuarios registrados en su cuenta de Google. Pueden exportar los datos bibliográficos y las citas en formatos estándar, escribir sus propias reseñas, agregarlos a su biblioteca para etiquetarlos, organizarlos y compartirlos con otras personas. Por lo tanto, Google Books recopila estos elementos más interpretativos de una variedad de fuentes, incluidos los usuarios, sitios de terceros como Goodreads y, a menudo, el autor y el editor del libro.
De hecho, para animar a los autores a subir sus propios libros, Google ha añadido varias funcionalidades al sitio web. Los autores pueden permitir que los visitantes descarguen su libro electrónico de forma gratuita o pueden establecer su propio precio de compra. Pueden cambiar el precio de un lado a otro, ofreciendo descuentos cuando les convenga. Además, si el autor de un libro elige agregar un número de registro ISBN, LCCN u OCLC, el servicio actualizará la URL del libro para incluirlo. Luego, el autor puede establecer una página específica como ancla del enlace. Esta opción hace que su libro sea más fácil de encontrar.
Ngram Viewer es un servicio conectado a Google Books que representa gráficamente la frecuencia del uso de palabras en su colección de libros. El servicio es importante para historiadores y lingüistas, ya que puede proporcionar una mirada al interior de la cultura humana a través del uso de palabras a lo largo de períodos de tiempo. Este programa ha sido criticado por errores en los metadatos utilizados en el programa.
El proyecto ha recibido críticas de que su objetivo declarado de preservar las obras huérfanas y agotadas está en riesgo debido a que los datos escaneados tienen errores y tales problemas no se resuelven.
Los usuarios pueden informar errores en los libros escaneados de Google en support.google.com/books/partner/troubleshooter/2983879.
El proceso de escaneo está sujeto a errores. Por ejemplo, algunas páginas pueden ser ilegibles, estar al revés o en el orden incorrecto. Los estudiosos incluso han informado de páginas arrugadas, que ocultan los pulgares y los dedos e imágenes borrosas o borrosas. Sobre este tema, una declaración de Google al final de los libros escaneados dice:
La digitalización al nivel más básico se basa en imágenes de páginas de los libros físicos. Para que este libro esté disponible como un archivo con formato ePub, hemos tomado esas imágenes de página y extraído el texto usando tecnología de Reconocimiento Óptico de Caracteres (o OCR para abreviar). La extracción de texto de imágenes de páginas es una tarea de ingeniería difícil. Las manchas en las páginas de los libros físicos, las fuentes elegantes, las fuentes antiguas, las páginas rasgadas, etc. pueden provocar errores en el texto extraído. Imperfect OCR es solo el primer desafío en el objetivo final de pasar de colecciones de imágenes de páginas a libros basados en texto extraído. Nuestros algoritmos informáticos también tienen que determinar automáticamente la estructura del libro (cuáles son los encabezados y pies de página, dónde se colocan las imágenes, si el texto es verso o prosa, etc.). Hacer esto bien nos permite renderizar el libro de una manera que sigue el formato del libro original. A pesar de nuestros mejores esfuerzos, es posible que vea errores ortográficos, caracteres basura, imágenes extrañas o páginas faltantes en este libro. Según nuestras estimaciones, estos errores no deberían impedirle disfrutar del contenido del libro. Los desafíos técnicos de construir automáticamente un libro perfecto son abrumadores, pero continuamos mejorando nuestras tecnologías de extracción de estructura de libros y OCR.
A partir de 2009, Google declaró que comenzaría a usar reCAPTCHA para ayudar a corregir los errores encontrados en los escaneos de libros de Google. Este método solo mejoraría las palabras escaneadas que son difíciles de reconocer debido al proceso de escaneo y no puede resolver errores como páginas pasadas o palabras bloqueadas.
Los académicos han informado con frecuencia errores desenfrenados en la información de metadatos en Google Books, incluidos autores atribuidos incorrectamente y fechas de publicación erróneas. Geoffrey Nunberg, un lingüista que investiga los cambios en el uso de las palabras a lo largo del tiempo, notó que una búsqueda de libros publicados antes de 1950 y que contenían la palabra "internet" arrojó 527 resultados poco probables. Woody Allen se menciona en 325 libros aparentemente publicados antes de su nacimiento. Google respondió a Nunberg culpando de la mayor parte de los errores a los contratistas externos.
Otros errores de metadatos informados incluyen fechas de publicación antes del nacimiento del autor (por ejemplo, 182 obras de Charles Dickens antes de su nacimiento en 1812); clasificaciones de materias incorrectas (una edición de Moby Dick que se encuentra en "computadoras", una biografía de Mae West clasificada como "religión"), clasificaciones en conflicto (10 ediciones de Hojas de hierba de Whitman, todas clasificadas como "ficción" y "no ficción"), títulos, autores y editores mal escritos ( Moby Dick: o la "pared blanca"), y metadatos de un libro adjuntos incorrectamente a un libro completamente diferente (los metadatos de un trabajo matemático de 1818 conducen a una novela romántica de 1963).
Se llevó a cabo una revisión de los elementos de metadatos de autor, título, editor y año de publicación de 400 registros de Google Libros seleccionados al azar. Los resultados muestran que el 36% de los libros muestreados en el proyecto de digitalización contenían errores de metadatos. Esta tasa de error es más alta de lo que cabría esperar en un catálogo en línea de una biblioteca típica.
La tasa de error general del 36,75% encontrada en este estudio sugiere que los metadatos de Google Books tienen una alta tasa de error. Si bien los errores "mayores" y "menores" son una distinción subjetiva basada en el concepto algo indeterminado de "capacidad de búsqueda", los errores encontrados en los cuatro elementos de metadatos examinados en este estudio deben considerarse importantes.
Los errores de metadatos basados en fechas escaneadas incorrectas dificultan la investigación con la base de datos del Proyecto de libros de Google. Google ha mostrado un interés limitado en la limpieza de estos errores.
Algunos políticos e intelectuales europeos han criticado el esfuerzo de Google por motivos de imperialismo lingüístico. Argumentan que debido a que la gran mayoría de los libros que se propone escanear están en inglés, resultará en una representación desproporcionada de los lenguajes naturales en el mundo digital. El alemán, el ruso, el francés y el español, por ejemplo, son idiomas populares en la academia. Sin embargo, el énfasis desproporcionado en línea en el inglés podría moldear el acceso a la erudición histórica y, en última instancia, el crecimiento y la dirección de la erudición futura. Entre estos críticos se encuentra Jean-Noël Jeanneney, ex presidente de la Bibliothèque nationale de France.
Si bien Google Books ha digitalizado una gran cantidad de números anteriores de revistas, sus escaneos no incluyen los metadatos necesarios para identificar artículos específicos en temas específicos. Esto ha llevado a los creadores de Google Scholar a iniciar su propio programa para digitalizar y alojar artículos de revistas más antiguos (de acuerdo con sus editores).
El Proyecto de bibliotecas de Google Books tiene como objetivo escanear y hacer búsquedas en las colecciones de varias bibliotecas de investigación importantes. Junto con la información bibliográfica, a menudo se pueden ver fragmentos de texto de un libro. Si un libro no tiene derechos de autor y es de dominio público, el libro está completamente disponible para leer o descargar.
Los libros protegidos por derechos de autor escaneados a través del Proyecto para bibliotecas están disponibles en Google Libros para verlos como fragmentos. En cuanto a la calidad de los escaneos, Google reconoce que "no siempre son de una calidad lo suficientemente alta" para ser puestos a la venta en Google Play. Además, debido a supuestas limitaciones técnicas, Google no reemplaza los escaneos con versiones de mayor calidad que puedan proporcionar los editores.
El proyecto es objeto de la demanda de Authors Guild v. Google, presentada en 2005 y dictaminada a favor de Google en 2013, y nuevamente, en apelación, en 2015.
Los propietarios de derechos de autor pueden reclamar los derechos de un libro escaneado y ponerlo a disposición para una vista previa o vista completa ("transfiriéndolo" a su cuenta del Programa de socios), o solicitar a Google que evite que se busque el texto del libro.
El número de instituciones que participan en el Proyecto Biblioteca ha crecido desde sus inicios.
Otros socios institucionales se han unido al proyecto desde que se anunció por primera vez la asociación:
2002: Un grupo de miembros del equipo de Google lanza oficialmente el "proyecto de libros secretos". Sergey Brin y Larry Page, fundadores de Google, tuvieron la idea de que más tarde se convertiría en Google Books cuando todavía eran estudiantes graduados en Stanford en 1996. La página de historia en el sitio web de Google Books describe su visión inicial para este proyecto: "en un mundo futuro en el que vastas Si las colecciones de libros están digitalizadas, la gente usaría un ' rastreador web ' para indexar el contenido de los libros y analizar las conexiones entre ellos, determinando la relevancia y utilidad de un libro determinado mediante el seguimiento del número y la calidad de las citas de otros libros ". Este equipo visitó los sitios de algunos de los esfuerzos de digitalización más grandes en ese momento, incluido el Proyecto de Memoria Estadounidense de la Biblioteca del Congreso, el Proyecto Gutenberg y la Biblioteca Universal para averiguar cómo funcionan, así como la Universidad de Michigan, el alma mater de Page, y la base para proyectos de digitalización como JSTOR y Making of America. En una conversación con la entonces presidenta de la Universidad, Mary Sue Coleman, cuando Page descubrió que la estimación actual de la Universidad para escanear todos los volúmenes de la biblioteca era de 1.000 años, Page le dijo a Coleman que "cree que Google puede ayudar a que esto suceda en seis". "
2003: El equipo trabaja para desarrollar un proceso de escaneo de alta velocidad, así como un software para resolver problemas en tamaños de letra extraños, fuentes inusuales y "otras peculiaridades inesperadas".
Diciembre de 2004: Google señaló una extensión de su iniciativa Google Print conocida como Google Print Library Project. Google anunció asociaciones con varias universidades y bibliotecas públicas de alto perfil, incluida la Universidad de Michigan, Harvard ( Biblioteca de la Universidad de Harvard ), Stanford ( Biblioteca verde ), Oxford ( Biblioteca Bodleian ) y la Biblioteca pública de Nueva York. Según comunicados de prensa y bibliotecarios universitarios, Google planeaba digitalizar y poner a disposición a través de su servicio Google Books aproximadamente 15 millones de volúmenes en una década. El anuncio pronto provocó controversia, ya que las asociaciones de editores y autores desafiaron los planes de Google de digitalizar, no solo los libros en el dominio público, sino también los títulos que aún están protegidos por derechos de autor.
Septiembre-octubre de 2005: dos demandas contra Google acusan a la empresa de no respetar los derechos de autor y no compensar adecuadamente a los autores y editores. Una es una demanda colectiva en nombre de los autores (Authors Guild v. Google, 20 de septiembre de 2005) y la otra es una demanda civil presentada por cinco grandes editoriales y la Asociación de Editores Estadounidenses. ( McGraw Hill contra Google, 19 de octubre de 2005)
Noviembre de 2005: Google cambió el nombre de este servicio de Google Print a Google Book Search. Su programa que permite a los editores y autores incluir sus libros en el servicio pasó a llamarse Programa de socios de Google Libros, y la asociación con las bibliotecas se convirtió en Proyecto de bibliotecas de Google Books.
2006: Google agregó un botón "descargar un pdf" a todos sus libros de dominio público sin derechos de autor. También agregó una nueva interfaz de navegación junto con nuevas páginas "Acerca de este libro".
Agosto de 2006: El Sistema de la Universidad de California anunció que se uniría al proyecto de digitalización de libros. Esto incluye una parte de los 34 millones de volúmenes dentro de las aproximadamente 100 bibliotecas administradas por el sistema.
Septiembre de 2006: La Universidad Complutense de Madrid se convierte en la primera biblioteca en español en unirse al Proyecto de Bibliotecas de Google Books.
Octubre de 2006: La Universidad de Wisconsin – Madison anunció que se uniría al proyecto de digitalización de Búsqueda de libros junto con la Biblioteca de la Sociedad Histórica de Wisconsin. Combinadas, las bibliotecas tienen 7,2 millones de fondos.
Noviembre de 2006: la Universidad de Virginia se unió al proyecto. Sus bibliotecas contienen más de cinco millones de volúmenes y más de 17 millones de manuscritos, libros raros y archivos.
Enero de 2007: la Universidad de Texas en Austin anunció que se uniría al proyecto de digitalización de Búsqueda de libros. Se digitalizarían al menos un millón de volúmenes de las 13 bibliotecas de la universidad.
Marzo de 2007: La Biblioteca Estatal de Baviera anunció una asociación con Google para escanear más de un millón de trabajos de dominio público y agotados en alemán, así como en inglés, francés, italiano, latín y español.
Mayo de 2007: Google y la Biblioteca Cantonal y Universitaria de Lausana anunciaron conjuntamente una asociación para el proyecto de digitalización de libros.
Mayo de 2007: La Biblioteca Boekentoren de la Universidad de Gante anunció que participaría con Google en la digitalización y la realización de versiones digitalizadas de libros del siglo XIX en los idiomas francés y holandés disponibles en línea.
Mayo de 2007: la Universidad de Mysore anuncia que Google digitalizará más de 800.000 libros y manuscritos, incluidos unos 100.000 manuscritos escritos en sánscrito o kannada tanto en papel como en hojas de palma.
Junio de 2007: El Comité de Cooperación Institucional (rebautizado como Big Ten Academic Alliance en 2016) anunció que sus doce bibliotecas miembros participarían en el escaneo de 10 millones de libros en el transcurso de los próximos seis años.
Julio de 2007: la Universidad de Keio se convirtió en el primer socio bibliotecario de Google en Japón con el anuncio de que digitalizarían al menos 120.000 libros de dominio público.
Agosto de 2007: Google anunció que digitalizaría hasta 500.000 elementos de dominio público y con derechos de autor de la Biblioteca de la Universidad de Cornell. Google también proporcionaría una copia digital de todos los trabajos escaneados para incorporarlos al sistema de bibliotecas de la propia universidad.
Septiembre de 2007: Google agregó una función que permite a los usuarios compartir fragmentos de libros que son de dominio público. Los fragmentos pueden aparecer exactamente como aparecen en el escaneo del libro o como texto sin formato.
Septiembre de 2007: Google presentó una nueva función llamada "Mi biblioteca" que permite a los usuarios crear bibliotecas personalizadas, selecciones de libros que pueden etiquetar, revisar, calificar o realizar búsquedas de texto completo.
Diciembre de 2007: la Universidad de Columbia se incorporó como socio en la digitalización de obras de dominio público.
Mayo de 2008: Microsoft disminuyó gradualmente y planeó finalizar su proyecto de escaneo, que había alcanzado los 750.000 libros y 80 millones de artículos de revistas.
Octubre de 2008: se llegó a un acuerdo entre la industria editorial y Google después de dos años de negociaciones. Google acordó compensar a los autores y editores a cambio del derecho a poner millones de libros a disposición del público.
De octubre de 2008: El HathiTrust "Shared Repositorio Digital" (más tarde conocido como la Biblioteca Digital HathiTrust) se puso en marcha conjuntamente por el Comité de Cooperación Institucional y las 11 bibliotecas universitarias en la Universidad de California, todos los cuales eran bibliotecas asociados de Google, con el fin para archivar y proporcionar acceso académico a libros de sus colecciones escaneados por Google y otros.
Noviembre de 2008: Google alcanzó la marca de libros de 7 millones de elementos escaneados por Google y por sus socios editoriales. 1 millón estaban en modo de vista previa completa y 1 millón eran obras de dominio público totalmente visibles y descargables. Aproximadamente cinco millones estaban agotados.
Diciembre de 2008: Google anunció la inclusión de revistas en Google Books. Los títulos incluyen New York Magazine, Ebony y Popular Mechanics.
Febrero de 2009: Google lanzó una versión móvil de Google Book Search, que permite a los usuarios de teléfonos iPhone y Android leer más de 1,5 millones de obras de dominio público en EE. UU. (Y más de 500 000 fuera de EE. UU.) Mediante un navegador móvil. En lugar de imágenes de página, se muestra el texto sin formato del libro.
Mayo de 2009: en la convención anual BookExpo en Nueva York, Google señaló su intención de presentar un programa que permitiría a los editores vender versiones digitales de sus libros más recientes directamente a los consumidores a través de Google.
Diciembre de 2009: un tribunal francés cerró el escaneo de libros protegidos por derechos de autor publicados en Francia, diciendo que esto violaba las leyes de derechos de autor. Fue la primera pérdida legal importante para el proyecto de escaneo.
Abril de 2010: los artistas visuales no se incluyeron en la demanda y el acuerdo anteriores, son los grupos de demandantes en otra demanda y dicen que tienen la intención de someter a más que solo Google Books bajo escrutinio. "La nueva demanda colectiva", se lee en la declaración, "va más allá del Proyecto para bibliotecas de Google e incluye otras infracciones sistemáticas y generalizadas de Google de los derechos de fotógrafos, ilustradores y otros artistas visuales".
Mayo de 2010: se informó que Google lanzaría una tienda de libros digitales llamada Google Editions. Competiría con Amazon, Barnes amp; Noble, Apple y otros minoristas de libros electrónicos con su propia tienda de libros electrónicos. A diferencia de otros, Google Editions estaría completamente en línea y no requeriría un dispositivo específico (como Kindle, Nook o iPad).
Junio de 2010: Google superó los 12 millones de libros escaneados.
Agosto de 2010: se anunció que Google tiene la intención de escanear todos los 129,864,880 libros existentes conocidos dentro de una década, lo que equivale a más de 4 mil millones de páginas digitales y 2 billones de palabras en total.
Diciembre de 2010: se lanzó Google eBooks (Google Editions) en los EE. UU.
Diciembre de 2010: Google lanzó Ngram Viewer, que recopila y grafica datos sobre el uso de palabras en su colección de libros.
Marzo de 2011: un juez federal rechazó el acuerdo alcanzado entre la industria editorial y Google.
Marzo de 2012: Google superó los 20 millones de libros escaneados.
Marzo de 2012: Google llegó a un acuerdo con los editores.
Enero de 2013: el documental Google and the World Brain se proyectó en el Festival de Cine de Sundance.
Noviembre de 2013: Fallo en Authors Guild v. Google, el juez de distrito de EE . UU. Denny Chin se pone del lado de Google, citando el uso legítimo. Los autores dijeron que apelarían.
Octubre de 2015: el tribunal de apelaciones se puso del lado de Google y declaró que Google no violó la ley de derechos de autor. Según el New York Times, Google ha escaneado más de 25 millones de libros.
Abril de 2016: la Corte Suprema de EE. UU. Se negó a escuchar la apelación del Gremio de Autores, lo que significa que la decisión del tribunal inferior se mantuvo, y Google podría escanear libros de la biblioteca y mostrar fragmentos en los resultados de búsqueda sin violar la ley.
Google ha sido bastante reservado con respecto a sus planes sobre el futuro del proyecto Google Books. Las operaciones de escaneo se habían ralentizado desde al menos 2012, según confirmaron los bibliotecarios de varias de las instituciones asociadas de Google. En la Universidad de Wisconsin, la velocidad se había reducido a menos de la mitad de lo que era en 2006. Sin embargo, los bibliotecarios han dicho que el ritmo decreciente podría ser un resultado natural de la maduración del proyecto; escaneado, mientras que ahora solo deben tenerse en cuenta los títulos que aún no se han escaneado. La propia página de la línea de tiempo de Google Books de la compañía no mencionó nada después de 2007, incluso en 2017, y el blog de Google Books se fusionó con el blog de Búsqueda de Google en 2012.
A pesar de ganar el litigio de una década en 2017, The Atlantic ha dicho que Google "prácticamente ha cerrado su operación de escaneo". En abril de 2017, Wired informó que solo había unos pocos empleados de Google trabajando en el proyecto y que todavía se estaban escaneando libros nuevos, pero a un ritmo significativamente menor. Comentó que la batalla legal de una década había hecho que Google perdiera su ambición.
A través del proyecto, los libros de la biblioteca se digitalizaron de manera algo indiscriminada, independientemente del estado de los derechos de autor, lo que dio lugar a una serie de demandas contra Google. A finales de 2008, según los informes, Google había digitalizado más de siete millones de libros, de los cuales sólo alrededor de un millón eran obras de dominio público. Del resto, un millón tenían derechos de autor y estaban impresos, y cinco millones tenían derechos de autor pero estaban agotados. En 2005, un grupo de autores y editores entabló una demanda colectiva importante contra Google por infracción de obras protegidas por derechos de autor. Google argumentó que estaba preservando "obras huérfanas", libros que aún están protegidos por derechos de autor, pero cuyos titulares de derechos de autor no pudieron ser localizados.
El Gremio de Autores y la Asociación de Editores Estadounidenses demandaron por separado a Google en 2005 por su proyecto de libro, citando una " infracción masiva de derechos de autor ". Google respondió que su proyecto representaba un uso justo y es el equivalente en la era digital de un catálogo de tarjetas con cada palabra de la publicación indexada. Las demandas se consolidaron y finalmente se propuso un acuerdo. El acuerdo recibió críticas significativas por una amplia variedad de motivos, que incluyen antimonopolio, privacidad e insuficiencia de las clases propuestas de autores y editores. El acuerdo fue finalmente rechazado y los editores llegaron a un acuerdo con Google poco después. El Gremio de Autores continuó con su caso y en 2011 se certificó la clase propuesta. Google apeló esa decisión, y varios amici afirmaron la insuficiencia de la clase, y el Segundo Circuito rechazó la certificación de la clase en julio de 2013, remitiendo el caso al Tribunal de Distrito para que se considerara la defensa de uso justo de Google.
En 2015 Authors Guild presentó otra apelación contra Google para ser considerada por la Corte de Apelaciones del Segundo Circuito de EE. UU. En Nueva York. Google ganó el caso por unanimidad basándose en el argumento de que no estaban mostrando a las personas los textos completos, sino fragmentos, y no permitían que las personas leyeran el libro ilegalmente. En un informe, los tribunales declararon que no infringieron las leyes de derechos de autor, ya que estaban protegidos por la cláusula de uso justo.
Authors Guild intentó nuevamente en 2016 apelar la decisión y esta vez llevó su caso a ser considerado por la Corte Suprema. El caso fue rechazado, dejando intacta la decisión del Segundo Circuito sobre el caso, lo que significa que Google no violó las leyes de derechos de autor. Este caso también sentó un precedente para otros casos similares en lo que respecta a las leyes de uso justo, ya que aclaró aún más la ley y la amplió. Tal aclaración afecta a otros proyectos de escaneo similares a Google.
Otras demandas siguieron el ejemplo del Gremio de Autores. En 2006, se retiró una demanda alemana, presentada anteriormente. En junio de 2006, Hervé de la Martinière, un editor francés conocido como La Martinière y Éditions du Seuil, anunció su intención de demandar a Google France. En 2009, el Tribunal Civil de París otorgó 300.000 EUR (aproximadamente 430.000 USD ) en daños e intereses y ordenó a Google que pagara 10.000 EUR al día hasta que elimine los libros de la editorial de su base de datos. El tribunal escribió: "Google violó las leyes de derechos de autor de los autores al reproducir y hacer accesibles completamente" libros que Seuil posee sin su permiso y que Google "cometió actos de violación de los derechos de autor, que son perjudiciales para los editores". Google dijo que apelará. Syndicat National de l'Edition, que se unió a la demanda, dijo que Google ha escaneado alrededor de 100.000 obras francesas bajo derechos de autor.
En diciembre de 2009, la escritora china Mian Mian presentó una demanda civil por $ 8,900 contra Google por escanear su novela Acid Lovers. Esta es la primera demanda de este tipo que se presenta contra Google en China. Además, en noviembre de ese año, la Sociedad de Derechos de Autor de Obras Escritas de China (CWWCS) acusó a Google de escanear 18.000 libros de 570 escritores chinos sin autorización. Google acordó el 20 de noviembre proporcionar una lista de libros chinos que había escaneado, pero la compañía se negó a admitir haber "infringido" las leyes de derechos de autor.
En marzo de 2007, Thomas Rubin, consejero general asociado de derechos de autor, marcas comerciales y secretos comerciales de Microsoft, acusó a Google de violar la ley de derechos de autor con su servicio de búsqueda de libros. Rubin criticó específicamente la política de Google de copiar libremente cualquier trabajo hasta que el titular de los derechos de autor le notifique que se detenga.
La concesión de licencias por parte de Google de obras de dominio público también es un motivo de preocupación debido al uso de técnicas de marca de agua digital con los libros. Algunas obras publicadas que son de dominio público, como todas las obras creadas por el gobierno federal de los EE. UU., Todavía se tratan como otras obras bajo derechos de autor y, por lo tanto, se bloquean después de 1922.
![]() | Wikimedia Commons tiene medios relacionados con Google Books. |
En algún lugar de Google hay una base de datos que contiene 25 millones de libros y nadie puede leerlos.
Un proyecto experimental dedicado a la reimpresión de libros de dominio público que utilizan: Alibris, Amazon, Book Finder, Google, LibraryThing y WorldCat