Proyecto Gutenberg | |
---|---|
inglés Proyecto Gutenberg | |
URL | gutenberg.org |
Comercial | No |
tipo de sitio | Libreria digital |
Registro | está libre |
Idiomas) | inglés |
Dueño | Proyecto Gutenberg |
Autor | miguel hart |
Comienzo del trabajo | 1971 |
Estado actual | obras |
País | |
Archivos multimedia en Wikimedia Commons |
Project Gutenberg ( en inglés Project Gutenberg , o PG ) es una iniciativa pública sin ánimo de lucro destinada a crear y distribuir una colección digital de obras de dominio público . Gutenberg es considerada la biblioteca digital más antigua del mundo. La mayoría de las obras han sido digitalizadas por voluntarios y están disponibles para su descarga gratuita.
El proyecto se creó el 4 de julio de 1971, cuando el estudiante de la Universidad de Illinois , Michael Hart , escribió a mano el texto de la Declaración de Independencia de EE . UU . y lo envió a otros usuarios de su red, que en ese momento constaba de 15 nodos de ARPANET : progenitor de Internet [1] [2] . Durante los siguientes 20 años, Hart reimprimió alrededor de 100 libros. Con la expansión de Internet a principios de la década de 1990, los voluntarios universitarios y, ya en la década de 2000, las organizaciones Distributed Proofreaders se sumaron a la digitalización de obras . Hart manejó el trabajo administrativo y la recaudación de fondos para mantener el sitio web en funcionamiento. En 1997, el número de obras en la colección fue de 1000, en 2003 - 10 000 , en 2011 - 40 000 . Para 2021, el Proyecto cuenta con más de 60.000 libros en su colección [1] .
Todos los textos electrónicos están digitalizados en código ASCII estándar estadounidense de 7 bits denominado Plain Vanilla. Este formato es legible en cualquier dispositivo y es compatible con el 99% de cualquier software. Para libros con caracteres acentuados, como los que están en alemán y francés, Project Gutenberg también crea una versión ASCII de 7 bits con acentos [3] . Además de Plain Vanilla ASCII, Gutenberg utiliza otros formatos, incluidos HTML , XML , RTF , Unicode [3] .
La fecha formal de creación del proyecto es el 4 de julio de 1971, cuando un estudiante de la Universidad de Illinois, Michael Hart , reescribió manualmente el texto de la Declaración de Independencia de los Estados Unidos y lo envió a otros usuarios de la red ARPANET , que consistía de 15 nodos y unos 100 usuarios registrados [2] . En ese momento, enviar un archivo de 5 kilobytes habría provocado una interrupción de la red, por lo que Hart envió una ubicación de almacenamiento de texto digital, después de lo cual seis usuarios lo descargaron [3] [4] .
La implementación del proyecto fue posible debido al hecho de que a Hart se le dio la oportunidad de trabajar con el mainframe Xerox Sigma 5 ; luego, el creador del proyecto consideró que el tiempo de computadora que se le asignó valía aproximadamente $ 100 millones . El estudiante quería pasar este tiempo en un proyecto "que valiera la pena", pero no se sintió atraído por el procesamiento de datos, el área principal de las computadoras en ese momento [5] [6] .
De una entrevista escrita con Michael Hart [4]Accidentalmente me detuve en el camino en nuestra tienda de comestibles IGA local. Estaba por realizarse la celebración del bicentenario de América , y junto a los productos me pusieron documentos históricos hechos de pergamino artificial. Entonces, mientras buscaba algo para comer en mi mochila, encontré la Declaración de Independencia de los Estados Unidos y se me ocurrió una idea. Durante un tiempo me pregunté si podría pensar en algo que pudiera hacer con una computadora que fuera más importante que emitir la Declaración de Independencia, algo que todavía estaría allí dentro de 100 años. Sin embargo, no se me ocurrió nada y nació el Proyecto Gutenberg.
Hart es llamado "el primer proveedor de información" por comenzar a entender la web como un nuevo tipo de medio de comunicación de masas casi 20 años antes de que Tim Berners-Lee formulara el concepto de World Wide Web [7] . La Declaración de Independencia fue el primer libro electrónico del mundo [4] . Posteriormente, Hart comenzó a buscar y digitalizar libros de biblioteca que ya eran de dominio público . Básicamente, se trataba de obras fundamentales para la historia de los Estados Unidos : la Declaración de derechos , la Constitución , la Biblia King James , las Obras completas de William Shakespeare , " Alicia en el país de las maravillas " de Lewis Carroll , " Peter Pan " por James Barry y otras obras. Todos estos libros fueron digitalizados a mano, mecanografiados por Hart y voluntarios [8] [7] [3] [9] .
La filosofía del proyecto se basa en la creencia de que el mayor valor de la tecnología informática radica en la preservación y difusión de la información. El objetivo original del proyecto era digitalizar los 10.000 libros más populares [10] .
Con el desarrollo y la introducción generalizada de Internet a fines de la década de 1980, el proyecto ganó gran popularidad. En 1990, se creó un círculo de voluntarios en la Universidad de Illinois para ayudar a Hart a escribir textos. La velocidad de su trabajo aumentó gradualmente y en 1995 la colección del proyecto se reponía con un promedio de 16 textos por mes. Al mismo tiempo, se introdujo la tecnología de reconocimiento óptico de caracteres . En la década de 1990, se creó el primer sitio web del proyecto y se llegó a un acuerdo con la Universidad Carnegie Mellon de Pittsburgh para hacerse cargo de las finanzas del proyecto [7] .
A principios de la década de 2000, el movimiento Distributed Proofreaders , formado por Charles Franks en 2000, comenzó a colaborar con el proyecto . Más de mil voluntarios en varios países trabajaron para producir y publicar en línea textos de dominio público que tenían un significado cultural significativo. Gracias a esta colaboración, para 2017, el catálogo de Gutenberg recibió de 150 a 200 libros por mes [7] . En comparación, en las primeras 11 semanas de 2004, el Proyecto Gutenberg agregó 313 libros electrónicos nuevos, mientras que los primeros 313 libros electrónicos tardaron aproximadamente 26 años en completarse [4] . En la primavera de 2002, la colección del proyecto contenía casi una cuarta parte de todas las obras de dominio público disponibles en Internet [3] . Ya en octubre de 2003, el proyecto contaba con 10.000 libros electrónicos [11] .
En 2007, Wattpad y Gutenberg desarrollaron y lanzaron juntos un proyecto que hizo que 17.000 libros estuvieran disponibles para su descarga en la mayoría de los teléfonos móviles [12] .
A principios de la década de 2000, Michael Hart, junto con el fundador de la Biblioteca Mundial de libros electrónicos, John Guallardo, intentaron lanzar el Proyecto Gutenberg 2. Sin embargo, la iniciativa no se implementó porque el proyecto implicaba descargas pagas de obras individuales, lo que no despertó entusiasmo. entre los usuarios [10] .
Hart falleció en 2011. Para 2021, el director ejecutivo del proyecto fue Gregory Newby [13] [14] .
El proyecto se dedica a la digitalización de obras disponibles públicamente. El proceso de reposición de la colección se lleva a cabo en tres etapas principales: mediante escaneo, reconocimiento y corrección. Después de resolver el problema con el estado legal de la obra y su pureza autorizada, los participantes del proyecto escanean el documento y ejecutan el programa de reconocimiento óptico de caracteres . Luego, los voluntarios revisan, releen y corrigen el texto, comparándolo tanto con la versión escaneada como con la página original. En promedio, incluso con un software OCR mejorado, los voluntarios encuentran alrededor de 10 errores por página. Cada libro es revisado por dos voluntarios diferentes que hacen las correcciones necesarias. En caso de que la obra original esté en mal estado, lo que suele ocurrir con los libros antiguos, el texto se introduce manualmente. El personal del proyecto está convencido de que la etapa de corrección por personas es una de las más importantes, ya que simplemente escanear el trabajo y colocarlo en el dominio público no permite buscar entre los textos [3] [15] . En promedio, toma alrededor de 50 horas trabajar en un texto [3] .
Todos los textos electrónicos están digitalizados en código ASCII estándar estadounidense de 7 bits denominado Plain Vanilla. Este formato es legible en cualquier dispositivo y es compatible con el 99% de cualquier software. Para libros con caracteres acentuados, como los que están en alemán y francés, Project Gutenberg también crea una versión ASCII de 7 bits con acentos [3] . Además de Plain Vanilla ASCII, Gutenberg utiliza otros formatos, incluidos HTML , XML , RTF , Unicode [3] .
Vemos los libros electrónicos como un nuevo medio que no tiene una relación real con el papel, excepto por presentar el mismo contenido. Sin embargo, no veo cómo el papel puede competir con las versiones electrónicas, especialmente si todos encuentran su propia forma conveniente de usar los textos electrónicos, especialmente en las escuelas.Michael Hart [3]
Con el reconocimiento de texto, los usuarios pueden buscar la literatura con una función de búsqueda disponible en cualquier navegador y cualquier software de procesamiento de texto. En la búsqueda avanzada, puede completar varios campos: autor, título, tema, idioma, categoría (cualquiera, audiolibro, música, imágenes), LoCC ( clasificación del catálogo de la Biblioteca del Congreso ), tipo de archivo (texto, PDF, HTML, XML , JPEG, etc.) e.) y el número del texto electrónico/e-book [3] . No se requiere pago ni registro para leer en línea o descargar el trabajo [10] .
Los servidores del portal están ubicados y registrados en los EE.UU. Por esta razón , se utiliza la ley de EE. UU. para determinar los derechos de autor . Sin embargo, la ley de derechos de autor está fragmentada y puede variar considerablemente según la jurisdicción. Esto puede resultar en que un libro de dominio público en los EE. UU. tenga derechos de autor en otro país. El portal describe específicamente los "términos de uso", que especifican que los usuarios fuera de los EE. UU. deben verificar los términos de derechos de autor en sus países antes de descargar o distribuir libros electrónicos del proyecto [16] .
CerradurasEn 2015, se presentó una demanda contra el proyecto en Alemania por incumplimiento de los derechos de autor en relación con 18 publicaciones alemanas de la colección de la biblioteca, que estaban disponibles gratuitamente en los Estados Unidos, pero que simultáneamente estaban protegidas por derechos de autor en Alemania [16] . La demanda fue presentada en nombre de los editores S. Fischer Verlag and GmbH., propiedad de Holtzbrinck Publishing Group [17] . El 9 de febrero de 2018, un tribunal alemán dictaminó que Gutenberg debe bloquear el acceso a 18 obras, proporcionar una lista de los usuarios que cargaron estas obras y pagar parte de los costos legales del demandante. En respuesta, el sitio bloqueó temporalmente todas las direcciones IP de Alemania [18] [19] .
En 2020, los ISP de Italia bloquearon el Proyecto Gutenberg tras acusaciones de infracción de derechos de autor [20] .
Año | libros digitalizados |
---|---|
1997 | 1000 |
1999 | 2000 |
2000 | 3000 |
2001 | 4000 |
2002 | 5000 |
2003 | 10,000 |
2005 | 15,000 |
2008 | 24 000 |
2009 | 34 000 |
2015 | 48 000 |
2018 | 56 000 |
2021 | 60 000 |
De 1991 a 1996, el número de trabajos publicados se duplicó aproximadamente. Además de digitalizar los libros, Michael Hart comenzó a coordinar el trabajo de decenas de voluntarios [3] . En agosto de 1998, Hart se fijó el objetivo de poner unos 10.000 textos electrónicos en la web, y en octubre de 2003 lo había logrado. El siguiente objetivo era la digitalización de 1.000.000 de obras [3] .
En 1993, la colección se dividió en tres categorías principales: "literatura ligera" (principalmente ficción); "literatura pesada" como la Biblia , Shakespeare o Moby Dick ; así como "literatura de referencia": el diccionario de sinónimos de Roger , así como un conjunto de enciclopedias y diccionarios [3] [9] .
En enero de 2005, la colección del proyecto incluía 15.000 libros electrónicos y, en 2015, más de 49.200 libros electrónicos gratuitos, todos publicados previamente por editoriales de prestigio [10] .
Dado que el proyecto tiene su sede en los EE. UU., originalmente estaba dirigido al público de habla inglesa y los libros digitalizados exclusivamente en inglés. Sin embargo, desde octubre de 1997, Hart ha decidido ampliar la colección y lanzar libros electrónicos en otros idiomas, principalmente en inglés, francés, alemán, español, finlandés, holandés y chino [3] . Ya en 2004, las obras de la colección se presentaron en 25 idiomas, y en julio de 2005, en 42, incluidos los idiomas iroqués , sánscrito , maya [3] .
En abril de 1995 aparecieron las primeras imágenes en la colección Gutenberg - pinturas rupestres francesas , que en noviembre de 2000 se pusieron a disposición del público en formato XHTML [3] .
CD y DVDEn agosto de 2003, Gutenberg lanzó el CD "Best of Gutenberg" con 600 de las obras más populares de la colección de la biblioteca. En diciembre de 2003, se compiló el DVD "Proyecto Gutenberg" con 9.400 títulos, lo que, en ese momento, equivalía a casi toda la colección de "Gutenberg". En julio de 2007, se lanzó una nueva versión en DVD con 17.000 libros y en abril de 2010 se lanzó un DVD actualizado de doble capa con 30.000 obras. Los usuarios pueden descargar imágenes ISO o solicitar una copia gratuita por correo. A partir de octubre de 2010, el proyecto ha enviado alrededor de 40.000 discos. Para 2021, las imágenes ISO están disponibles para descargar, pero el envío gratuito de CD se suspendió [21] [22] .
La colección del proyecto se considera la biblioteca electrónica más antigua del mundo, y Michael Hart es el creador del primer libro digital [3] [9] . La biblioteca sirvió como prototipo para una serie de otros proyectos, incluidos [23] [3] :
Gutenberg también colabora con Internet Archive y LibriVox [31] .
Varias iniciativas ya han llegado a su fin: el Proyecto Gutenberg en Filipinas, el Proyecto Europa, dirigido por el Proyecto Serbio Rastko, el Proyecto Gutenberg Rusia (también llamado "Rutenberg" por el nombre europeo medieval de Rusia para Rutenia ), el Proyecto Gutenberg en Taiwán , supervisar una colección de libros electrónicos en inglés y chino [32] [3] .
En 2016, se lanzó una aplicación para Android basada en la colección de Gutenberg [33] .
Los proyectos separados se dedican a la conversión de obras digitalizadas por el proyecto a otros formatos electrónicos. Así, Blackmask Online convierte las obras en ocho formatos diferentes basándose en el Open eBook . Manybooks.net ha convertido los libros electrónicos del Proyecto a formatos legibles por PDA . Bookshare , la principal biblioteca digital para personas con discapacidad visual en los Estados Unidos, convierte libros a Braille y DAISY [3] . Muchos textos son utilizados por el proyecto LibriVox para crear audiolibros [34] .
en redes sociales | ||||
---|---|---|---|---|
sitios temáticos | ||||
diccionarios y enciclopedias | ||||
|
dispositivos y documentos ) | Libros electrónicos (|
---|---|
Serie de dispositivos | |
Formatos de archivo | |
catalogadores | |
bibliotecas |
|
ver también |