Google Books (که قبلاً با نام جستجوی کتاب Google ، Google Print و با نام رمز Project Ocean شناخته می شد ) [1] سرویسی از Google است که متن کامل کتاب ها و مجلاتی را که Google اسکن کرده است جستجو می کند و با استفاده از نویسه های نوری به متن تبدیل می شود. شناسایی (OCR) و در پایگاه داده دیجیتال آن ذخیره می شود. [2] کتاب ها یا توسط ناشران و نویسندگان از طریق برنامه شریک Google Books یا توسط شرکای کتابخانه Google از طریق پروژه کتابخانه ارائه می شوند. [3] علاوه بر این، گوگل با تعدادی از ناشران مجلات برای دیجیتالی کردن آرشیو آنها شریک شده است. [4] [5]
برنامه Publisher اولین بار زمانی که در نمایشگاه کتاب فرانکفورت در اکتبر 2004 معرفی شد، با نام Google Print شناخته شد. پروژه کتابخانه کتاب های گوگل، که آثار موجود در مجموعه شرکای کتابخانه را اسکن می کند و آنها را به فهرست موجودی دیجیتال اضافه می کند، در دسامبر 2004 اعلام شد. .
طرح Google Books به دلیل پتانسیل آن برای ارائه دسترسی بی سابقه به آنچه که ممکن است به بزرگترین مجموعه آنلاین دانش بشری تبدیل شود [6] [7] و ترویج دموکراتیک کردن دانش مورد ستایش قرار گرفته است . [8] با این حال، همچنین به دلیل نقض احتمالی حق چاپ، [8] [9] و عدم ویرایش برای تصحیح بسیاری از خطاهای وارد شده به متون اسکن شده توسط فرآیند OCR مورد انتقاد قرار گرفته است .
از اکتبر 2019 [به روز رسانی]، گوگل 15 سال از Google Books را جشن گرفت و تعداد کتاب های اسکن شده را بیش از 40 میلیون عنوان ارائه کرد. [10] گوگل در سال 2010 تخمین زد که حدود 130 میلیون عنوان مجزا در جهان وجود دارد، [11] و اعلام کرد که قصد دارد همه آنها را اسکن کند. [11] با این حال، روند پویش در کتابخانه های دانشگاهی آمریکا از سال 2000 کند شده است. [12] [13] تلاشهای اسکن Google Book مشمول طرح دعوی قضایی بوده است، از جمله انجمن نویسندگان علیه Google ، یک دعوای حقوقی دستهجمعی در ایالات متحده، که به نفع Google تصمیمگیری شده است (به زیر مراجعه کنید). این یک مورد بزرگ بود که به تغییر رویه های حق چاپ برای آثار یتیم در ایالات متحده نزدیک شد . [14] مطالعه سال 2023 توسط محققان دانشگاه کالیفرنیا، برکلی و دانشکدههای بازرگانی دانشگاه نورث ایسترن نشان داد که دیجیتالی کردن کتابها توسط Google Books منجر به افزایش فروش نسخههای فیزیکی کتابها شده است. [15]
نتایج Google Books هم در جستجوی جهانی Google و هم در وبسایت جستجوی اختصاصی Google Books ( books.google.com ) نشان داده میشود.
در پاسخ به پرسشهای جستجو، Google Books به کاربران اجازه میدهد تا صفحات کامل کتابهایی را مشاهده کنند که در آنها عبارات جستجو ظاهر میشوند، اگر کتاب خارج از حق نسخهبرداری باشد یا اگر صاحب حق نسخهبرداری اجازه داده باشد. اگر Google معتقد است کتاب هنوز تحت حق چاپ است، کاربر «قطعههایی» از متن را در اطراف عبارتهای جستجو شده مشاهده میکند. همه موارد جستجو در متن کتاب با یک برجسته زرد ظاهر می شوند.
چهار سطح دسترسی مورد استفاده در Google Books عبارتند از: [16]
در پاسخ به انتقاد گروههایی مانند انجمن ناشران آمریکا و انجمن نویسندگان ، گوگل در آگوست 2005 خط مشی انصرافی را اعلام کرد که از طریق آن صاحبان حق چاپ میتوانند فهرستی از عناوینی را که نمیخواهند اسکن شوند، ارائه کنند و این درخواست میتواند اسکن شود. قابل احترام باشد این شرکت همچنین اعلام کرد که هیچ کتابی را که دارای حق چاپ است بین اوت تا 1 نوامبر 2005 اسکن نخواهد کرد تا به صاحبان این فرصت برای تصمیم گیری در مورد اینکه کدام کتاب را از پروژه حذف کنند، مهیا کند. بنابراین، صاحبان حق چاپ در رابطه با هر اثر سه انتخاب دارند: [18]
بیشتر آثار اسکن شده دیگر چاپ نمی شوند یا به صورت تجاری در دسترس نیستند. [19]
Google علاوه بر تهیه کتاب از کتابخانهها، از شرکای ناشران خود نیز از طریق «برنامه شریک» - که برای کمک به ناشران و نویسندگان برای تبلیغ کتابهایشان طراحی شده است، به دست میآورد. ناشران و نویسندگان یک نسخه دیجیتالی از کتاب خود را در قالب EPUB یا PDF ارسال میکنند یا یک نسخه چاپی را به Google ارسال میکنند که برای پیشنمایش در Google Books در دسترس است. ناشر میتواند درصد کتاب موجود برای پیشنمایش را با حداقل 20 درصد کنترل کند. آنها همچنین می توانند انتخاب کنند که کتاب به طور کامل قابل مشاهده باشد، و حتی به کاربران اجازه دهند یک نسخه PDF را دانلود کنند. همچنین میتوان کتابها را برای فروش در Google Play در دسترس قرار داد. [3] برخلاف پروژه کتابخانه، این موضوع هیچ گونه نگرانی در مورد حق نسخه برداری ایجاد نمی کند زیرا طبق توافق با ناشر انجام می شود. ناشر می تواند هر زمان که بخواهد از توافق خارج شود. [18]
برای بسیاری از کتابها، Google Books شماره صفحه اصلی را نشان میدهد. با این حال، تیم پارکس ، که در سال 2014 در مجله The New York Review of Books نوشت ، خاطرنشان کرد که Google ارائه شماره صفحه برای بسیاری از نشریات اخیر (احتمالاً آنهایی که از طریق برنامه شریک به دست آمده اند) را «احتمالاً در اتحاد با ناشران، به منظور اجبار، متوقف کرده است. کسانی از ما که برای خرید نسخه های کاغذی نیاز به تهیه پاورقی داریم." [20]
این پروژه در سال 2002 با نام رمز پروژه اقیانوس آغاز شد. لری پیج، یکی از بنیانگذاران گوگل، همیشه به دیجیتالی کردن کتاب ها علاقه داشت. زمانی که او و ماریسا مایر در سال 2002 آزمایش اسکن کتاب را آغاز کردند ، 40 دقیقه طول کشید تا یک کتاب 300 صفحهای را دیجیتالی کنند. اما مدت کوتاهی پس از توسعه فناوری به حدی رسید که اپراتورهای اسکن می توانستند تا 6000 صفحه در ساعت را اسکن کنند. [14]
گوگل مراکز اسکن مشخصی را ایجاد کرد که کتاب ها با کامیون ها به آن ها منتقل می شد. این ایستگاه ها می توانند با سرعت 1000 صفحه در ساعت دیجیتال شوند. کتاب ها در یک گهواره مکانیکی سفارشی قرار داده شدند که ستون کتاب را در جای خود تنظیم می کرد در حالی که مجموعه ای از چراغ ها و ابزارهای نوری دو صفحه باز را اسکن می کردند. هر صفحه دارای دو دوربین خواهد بود که به سمت آن عکس می گیرد، در حالی که یک فاصله یاب LIDAR یک شبکه لیزری سه بعدی را روی سطح کتاب می پوشاند تا انحنای کاغذ را ثبت کند. یک اپراتور انسانی صفحات را با دست ورق می زد و از پدال پا برای گرفتن عکس استفاده می کرد. بدون نیاز به صاف کردن صفحات یا تراز کردن کامل آنها، سیستم Google نه تنها به کارایی و سرعت قابل توجهی دست یافت، بلکه به محافظت از مجموعه های شکننده در برابر کنترل بیش از حد کمک کرد. پس از آن، تصاویر خام از طریق سه سطح پردازش رفتند: اول، الگوریتمهای تاب برداشتن از دادههای LIDAR برای رفع انحنای صفحات استفاده کردند. سپس، نرمافزار تشخیص کاراکتر نوری (OCR) تصاویر خام را به متن تبدیل کرد و در نهایت، دور دیگری از الگوریتمها اعداد صفحه، پانوشتها، تصاویر و نمودارها را استخراج کرد. [14]
بسیاری از کتاب ها با استفاده از دوربین Elphel 323 سفارشی [21] [22] با سرعت 1000 صفحه در ساعت اسکن می شوند. [23] حق اختراعی که در سال 2009 به گوگل اعطا شد نشان داد که گوگل سیستمی نوآورانه برای اسکن کتابها ارائه کرده است که از دو دوربین و نور مادون قرمز برای تصحیح خودکار انحنای صفحات یک کتاب استفاده میکند. با ساخت یک مدل سه بعدی از هر صفحه و سپس "جلوگیری" آن، گوگل می تواند صفحاتی با ظاهر مسطح را بدون نیاز به صاف کردن صفحات ارائه دهد که این امر مستلزم استفاده از روش های مخرب مانند جدا کردن یا جدا کردن صفحات شیشه ای به صورت جداگانه است. هر صفحه را صاف کنید، که برای اسکن در مقیاس بزرگ ناکارآمد است. [24] [25]
گوگل تصمیم گرفت اطلاعات رنگی را به نفع تفکیک فضایی بهتر حذف کند، زیرا اکثر کتابهای خارج از حق چاپ در آن زمان حاوی رنگ نبودند. هر تصویر صفحه از طریق الگوریتمهایی که متن و مناطق تصویر را متمایز میکرد منتقل میشد. سپس نواحی متن از طریق OCR پردازش شدند تا جستجوی تمام متن فعال شود. گوگل منابع قابل توجهی را برای دستیابی به تکنیک های فشرده سازی بهینه، با هدف کیفیت تصویر بالا و در عین حال حداقل نگه داشتن اندازه فایل برای امکان دسترسی کاربران اینترنت با پهنای باند کم، صرف کرد. [26]
برای هر اثر، Google Books به طور خودکار یک صفحه نمای کلی ایجاد می کند. این صفحه اطلاعات استخراج شده از کتاب - جزئیات انتشار آن، نقشه کلمات با فرکانس بالا، فهرست مطالب - و همچنین مطالب ثانویه، مانند خلاصه، نظرات خواننده (در نسخه موبایل وب سایت قابل خواندن نیست) و پیوندها را نمایش می دهد. به سایر متون مرتبط برای مثال، بازدیدکنندهای از صفحه ممکن است فهرستی از کتابهایی را ببیند که ژانر و موضوع مشابهی دارند، یا ممکن است فهرستی از بورسیههای موجود در این کتاب را ببینند. این محتوا، علاوه بر این، امکانات تعاملی را برای کاربرانی که به حساب Google خود وارد شده اند ارائه می دهد . آنها می توانند داده های کتابشناختی و نقل قول ها را در قالب های استاندارد صادر کنند ، نظرات خود را بنویسند، آن را به کتابخانه خود اضافه کنند تا برچسب گذاری شوند، سازماندهی شوند و با افراد دیگر به اشتراک گذاشته شوند. [27] [28] بنابراین، Google Books این عناصر تفسیری بیشتر را از طیف وسیعی از منابع، از جمله کاربران، سایتهای شخص ثالث مانند Goodreads ، و اغلب نویسنده و ناشر کتاب جمعآوری میکند. [29]
در واقع، برای تشویق نویسندگان به آپلود کتاب های خود، گوگل چندین قابلیت را به وب سایت اضافه کرده است. نویسندگان می توانند به بازدیدکنندگان اجازه دهند کتاب الکترونیکی خود را به صورت رایگان دانلود کنند، یا می توانند قیمت خرید خود را تعیین کنند. آنها می توانند قیمت را به عقب و جلو تغییر دهند و هر زمان که مناسب باشد تخفیف ارائه دهند. همچنین، اگر نویسنده کتابی انتخاب کند که شماره سابقه ISBN ، LCCN یا OCLC اضافه کند ، سرویس آدرس اینترنتی کتاب را بهروزرسانی میکند تا شامل آن شود. سپس، نویسنده می تواند یک صفحه خاص را به عنوان لنگر پیوند تنظیم کند. این گزینه باعث می شود کتاب آنها به راحتی قابل کشف باشد.
Ngram Viewer یک سرویس متصل به Google Books است که تعداد دفعات استفاده از کلمات را در مجموعه کتابهای آنها نمودار میکند. این سرویس برای مورخان و زبان شناسان مهم است زیرا می تواند نگاهی درونی به فرهنگ انسانی از طریق استفاده از کلمات در طول دوره های زمانی ارائه دهد. [30] این برنامه به دلیل اشتباهات در ابرداده استفاده شده در برنامه مورد انتقاد قرار گرفته است. [31]
این پروژه انتقاداتی را دریافت کرده است که هدف اعلام شده آن از حفظ آثار بیسرپرست و خارج از چاپ به دلیل وجود خطا در دادههای اسکنشده و حل نشدن چنین مشکلاتی در خطر است. [32] [33]
فرآیند اسکن در معرض خطا است. به عنوان مثال، برخی از صفحات ممکن است ناخوانا، وارونه یا دارای ترتیب اشتباه باشند. محققان حتی صفحات مچاله شده، پوشاندن شست ها و انگشتان، و تصاویر لکه دار یا تار را گزارش کرده اند. [34] در مورد این موضوع، اعلامیه ای از گوگل در انتهای کتاب های اسکن شده می گوید:
دیجیتالی شدن در ابتدایی ترین سطح بر اساس تصاویر صفحه کتاب های فیزیکی است. برای در دسترس قرار دادن این کتاب به عنوان یک فایل با فرمت ePub، ما از آن تصاویر صفحه گرفته ایم و متن را با استفاده از فناوری تشخیص کاراکتر نوری (یا به اختصار OCR) استخراج کرده ایم. استخراج متن از تصاویر صفحه یک کار مهندسی دشوار است. لکههای موجود در صفحات فیزیکی کتابها، فونتهای فانتزی، فونتهای قدیمی، صفحات پارهشده و غیره همگی میتوانند منجر به خطا در متن استخراجشده شوند. OCR ناقص تنها اولین چالش در هدف نهایی حرکت از مجموعه تصاویر صفحه به کتاب های مبتنی بر متن استخراج شده است. الگوریتمهای رایانهای ما نیز باید بهطور خودکار ساختار کتاب را تعیین کنند (سرصفحهها و پاورقیها چیست، تصاویر در کجا قرار میگیرند، آیا متن شعر است یا نثر، و غیره). دریافت این حق به ما این امکان را می دهد که کتاب را به گونه ای ارائه کنیم که از قالب کتاب اصلی پیروی کند. علیرغم تمام تلاشهای ما، ممکن است اشتباهات املایی، نویسههای زباله، تصاویر غیرمجاز، یا صفحات گمشده را در این کتاب ببینید. بر اساس برآوردهای ما، این اشتباهات نباید مانع از لذت بردن شما از محتوای کتاب شود. چالشهای فنی ساخت خودکار یک کتاب کامل دلهرهآور است، اما ما همچنان به بهبود فناوریهای OCR و استخراج ساختار کتاب خود ادامه میدهیم. [35]
در سال 2009، گوگل اعلام کرد که استفاده از reCAPTCHA را برای کمک به رفع خطاهای موجود در اسکن Google Book شروع خواهد کرد . این روش فقط کلمات اسکن شده را بهبود می بخشد که به دلیل فرآیند اسکن تشخیص آنها سخت است و نمی تواند خطاهایی مانند صفحات برگشته یا کلمات مسدود شده را حل کند. [36]
خطاهای اسکن الهام بخش آثار هنری مانند مجموعه های منتشر شده از صفحات غیرعادی و وبلاگ Tumblr هستند . [37]
محققان اغلب اشتباهات گسترده ای را در اطلاعات فراداده در Google Books گزارش کرده اند - از جمله نویسندگان نادرست و تاریخ های انتشار اشتباه. جفری نونبرگ ، زبان شناس که در حال تحقیق در مورد تغییرات استفاده از کلمات در طول زمان بود، متوجه شد که جستجوی کتاب هایی که قبل از سال 1950 منتشر شده بودند و حاوی کلمه "اینترنت" بودند، 527 نتیجه بعید به دست آورد. از وودی آلن در 325 کتاب یاد شده است که ظاهراً قبل از تولد او منتشر شده است. گوگل با مقصر دانستن عمده اشتباهات به گردن پیمانکاران خارجی به نونبرگ پاسخ داد. [31]
سایر خطاهای ابرداده گزارش شده عبارتند از تاریخ انتشار قبل از تولد نویسنده (به عنوان مثال 182 اثر چارلز دیکنز قبل از تولد او در سال 1812). طبقهبندیهای موضوعی نادرست (نسخهای از موبی دیک که در زیر «رایانهها» یافت میشود، زندگینامه مای وست طبقهبندی شده در «مذهب»)، طبقهبندی متناقض (10 نسخه از برگهای علف ویتمن که همگی به عنوان «داستانی» و «غیرداستانی» طبقهبندی میشوند)، عناوین، نویسندگان و ناشران با املای نادرست ( موبی دیک: یا "دیوار سفید" )، و ابرداده های یک کتاب به اشتباه به کتابی کاملاً متفاوت اضافه شده اند (فراداده یک اثر ریاضی 1818 منجر به یک رمان عاشقانه در سال 1963 می شود). [38] [39]
بررسی عناصر ابرداده نویسنده، عنوان، ناشر و سال انتشار برای 400 رکورد Google Books که بهطور تصادفی انتخاب شده بودند، انجام شد. نتایج نشان میدهد 36 درصد از کتابهای نمونهگیری شده در پروژه دیجیتالیسازی حاوی خطاهای ابرداده هستند. این میزان خطا بیشتر از آن چیزی است که انتظار می رود در یک فهرست آنلاین کتابخانه معمولی پیدا شود. [40]
نرخ خطای کلی 36.75 درصدی که در این مطالعه یافت شد، نشان میدهد که ابرداده Google Books دارای نرخ بالایی از خطا است. در حالی که خطاهای "عمده" و "جزئی" یک تمایز ذهنی مبتنی بر مفهوم تا حدی نامشخص "قابلیت یافتن" هستند، خطاهای یافت شده در چهار عنصر فراداده مورد بررسی در این مطالعه باید همه در نظر گرفته شوند. [40]
خطاهای ابرداده بر اساس تاریخ های اسکن شده نادرست، تحقیق با استفاده از پایگاه داده پروژه Google Books را دشوار می کند. گوگل علاقه محدودی به پاکسازی این خطاها نشان داده است. [41]
برخی از سیاستمداران و روشنفکران اروپایی از تلاش گوگل در زمینه امپریالیسم زبانی انتقاد کرده اند . آنها استدلال می کنند که چون اکثریت قریب به اتفاق کتاب های پیشنهادی برای اسکن به زبان انگلیسی هستند، منجر به نمایش نامتناسب زبان های طبیعی در دنیای دیجیتال می شود. به عنوان مثال، آلمانی، روسی، فرانسوی و اسپانیایی، زبانهای محبوب در بورسیه هستند. با این حال، تأکید نامتناسب آنلاین بر زبان انگلیسی میتواند دسترسی به بورس تحصیلی تاریخی و در نهایت رشد و جهتگیری بورس تحصیلی آینده را شکل دهد. از جمله این منتقدان، ژان نوئل ژاننی ، رئیس پیشین Bibliothèque Nationale de France است . [42] [43]
در حالی که Google Books تعداد زیادی از شماره های مجله را دیجیتالی کرده است، اسکن های آن شامل ابرداده مورد نیاز برای شناسایی مقالات خاص در شماره های خاص نمی شود. این باعث شده است که سازندگان Google Scholar برنامه خود را برای دیجیتالی کردن و میزبانی مقالات مجلات قدیمی (در توافق با ناشران خود) راه اندازی کنند. [44]
پروژه کتابخانه کتاب های گوگل با هدف اسکن و قابل جستجو کردن مجموعه چندین کتابخانه تحقیقاتی اصلی است . [45] همراه با اطلاعات کتابشناختی ، تکه هایی از متن یک کتاب اغلب قابل مشاهده است. اگر کتابی خارج از حق چاپ باشد و در مالکیت عمومی باشد، کتاب به طور کامل برای خواندن یا دانلود در دسترس است . [16]
کتابهای دارای حق نسخهبرداری که ازطریق پروژه کتابخانه اسکن شدهاند، در Google Books برای نمایش گزیده در دسترس هستند. با توجه به کیفیت اسکنها، گوگل اذعان میکند که این اسکنها "همیشه به اندازه کافی کیفیت بالایی ندارند" که برای فروش در Google Play ارائه شوند. همچنین، به دلیل محدودیتهای فنی فرضی، Google اسکنها را با نسخههای با کیفیت بالاتر که ممکن است توسط ناشران ارائه شود جایگزین نمیکند. [46]
این پروژه موضوع دعوای انجمن نویسندگان علیه گوگل است که در سال 2005 ثبت شد و در سال 2013 به نفع گوگل رای داد و مجدداً در دادگاه تجدید نظر در سال 2015.
صاحبان حق نسخهبرداری میتوانند حقوق یک کتاب اسکنشده را مطالبه کنند و آن را برای پیشنمایش یا مشاهده کامل در دسترس قرار دهند (با «انتقال» آن به حساب برنامه Partner خود)، یا از Google درخواست کنند که از جستجوی متن کتاب جلوگیری کند. [46]
تعداد مؤسسات شرکت کننده در پروژه کتابخانه از زمان شروع آن افزایش یافته است. [47]
شرکای نهادی دیگر از اولین بار اعلام مشارکت به پروژه پیوسته اند: [54]
2002 : گروهی از اعضای تیم گوگل به طور رسمی پروژه "کتاب های مخفی" را راه اندازی کردند. [73] بنیانگذاران گوگل سرگئی برین و لری پیج به این ایده رسیدند که بعداً در حالی که هنوز فارغ التحصیل دانشگاه استنفورد بودند در سال 1996 به Google Books تبدیل شد. که در آن مجموعههای گستردهای از کتابها دیجیتالی میشوند، مردم از « خزنده وب » برای فهرستبندی محتوای کتابها و تجزیه و تحلیل ارتباطات بین آنها استفاده میکنند و با ردیابی تعداد و کیفیت نقلقولهای کتابهای دیگر، ارتباط و مفید بودن هر کتاب را تعیین میکنند.» [73] این تیم از سایتهای برخی از تلاشهای دیجیتالیسازی بزرگتر در آن زمان، از جمله پروژه حافظه آمریکایی کتابخانه کنگره ، پروژه گوتنبرگ ، و کتابخانه جهانی برای اطلاع از نحوه کار آنها، و همچنین دانشگاه میشیگان، پیج بازدید کردند. آلما ماتر، و پایگاهی برای پروژه های دیجیتالی مانند JSTOR و Making of America. در گفتگو با مری سو کولمن ، رئیس دانشگاه در آن زمان ، زمانی که پیج متوجه شد که تخمین فعلی دانشگاه برای اسکن تمام جلدهای کتابخانه 1000 سال است، ظاهراً پیج به کلمن گفت که "بر این باور است که گوگل می تواند در شش سال آینده به انجام آن کمک کند. " [73]
2003 : این تیم برای توسعه یک فرآیند اسکن با سرعت بالا و همچنین نرم افزاری برای حل مسائل در اندازه های نوع عجیب و غریب، فونت های غیرمعمول و "ویژگی های غیرمنتظره دیگر" کار می کند. [73]
دسامبر 2004 : گوگل یک برنامه افزودنی را برای ابتکار چاپ گوگل خود به نام پروژه کتابخانه چاپ گوگل اعلام کرد. [47] گوگل شراکت با چندین دانشگاه و کتابخانه عمومی عمومی، از جمله دانشگاه میشیگان ، هاروارد ( کتابخانه دانشگاه هاروارد )، استنفورد ( کتابخانه سبز )، آکسفورد ( کتابخانه بودلیان )، و کتابخانه عمومی نیویورک را اعلام کرد . بر اساس بیانیههای مطبوعاتی و کتابداران دانشگاه، گوگل برنامهریزی کرده است که در عرض یک دهه 15 میلیون جلد کتاب را دیجیتالی کرده و از طریق سرویس Google Books خود در دسترس قرار دهد. این اعلام به زودی جنجال برانگیخت، زیرا انجمن های ناشران و نویسندگان برنامه های گوگل را برای دیجیتالی کردن نه تنها کتاب های موجود در حوزه عمومی، بلکه همچنین عناوینی که هنوز تحت حق چاپ هستند، به چالش کشیدند.
سپتامبر تا اکتبر 2005 : دو شکایت علیه گوگل متهم شدند که این شرکت به حق نسخهبرداری احترام نمیگذارد و به درستی غرامت نویسندگان و ناشران را جبران نکرده است. یکی دعوای دسته جمعی از طرف نویسندگان (Authors Guild v. Google، 20 سپتامبر 2005) و دیگری یک دعوای مدنی است که توسط پنج ناشر بزرگ و انجمن ناشران آمریکایی مطرح شده است . (McGraw Hill v. Google، 19 اکتبر 2005) [9] [74] [75] [76] [77] [78]
نوامبر 2005 : گوگل نام این سرویس را از Google Print به Google Book Search تغییر داد. [79] برنامه آن که ناشران و نویسندگان را قادر میسازد کتابهای خود را در این سرویس قرار دهند، به Google Books Partner Program تغییر نام داد، [80] و مشارکت با کتابخانهها به پروژه کتابخانه کتابهای Google تبدیل شد.
2006 : گوگل یک دکمه "دانلود پی دی اف" را به همه کتاب های دارای حق چاپ و مالکیت عمومی خود اضافه کرد. همچنین یک رابط مرور جدید به همراه صفحات جدید «درباره این کتاب» اضافه کرد. [73]
آگوست 2006 : سیستم دانشگاه کالیفرنیا اعلام کرد که به پروژه دیجیتالی سازی Books خواهد پیوست. این شامل بخشی از 34 میلیون جلد در حدود 100 کتابخانه تحت مدیریت سیستم است. [81]
سپتامبر 2006 : دانشگاه Complutense مادرید به اولین کتابخانه اسپانیایی زبان تبدیل شد که به پروژه کتابخانه کتاب های گوگل پیوست. [82]
اکتبر 2006 : دانشگاه ویسکانسین-مدیسون اعلام کرد که به پروژه دیجیتالی سازی جستجوی کتاب همراه با کتابخانه انجمن تاریخی ویسکانسین خواهد پیوست . مجموع این کتابخانه ها 7.2 میلیون دارایی دارند. [83]
نوامبر 2006 : دانشگاه ویرجینیا به این پروژه پیوست. کتابخانه های آن شامل بیش از پنج میلیون جلد و بیش از 17 میلیون نسخه خطی، کتاب و آرشیو کمیاب است. [84]
ژانویه 2007 : دانشگاه تگزاس در آستین اعلام کرد که به پروژه دیجیتالی جستجوی کتاب خواهد پیوست. حداقل یک میلیون جلد از 13 مکان کتابخانه دانشگاه دیجیتالی خواهد شد.
مارس 2007 : کتابخانه ایالتی باواریا برای اسکن بیش از یک میلیون اثر عمومی و چاپ نشده به زبان آلمانی، انگلیسی، فرانسوی، ایتالیایی، لاتین و اسپانیایی با گوگل همکاری کرد. [85]
می 2007 : مشارکت پروژه دیجیتالی کردن کتاب به طور مشترک توسط گوگل و کتابخانه کانتونال و دانشگاه لوزان اعلام شد . [86]
می 2007 : کتابخانه بوئکنتورن دانشگاه گنت اعلام کرد که با گوگل در دیجیتالی کردن و ساخت نسخه های دیجیتالی کتاب های قرن 19 به زبان های فرانسوی و هلندی به صورت آنلاین مشارکت خواهد کرد. [87]
مه 2007: دانشگاه میسور اعلام کرد که گوگل بیش از 800000 کتاب و نسخه خطی را دیجیتالی خواهد کرد، از جمله حدود 100000 نسخه خطی که به زبان سانسکریت یا کانادا بر روی کاغذ و برگ نخل نوشته شده است. [68]
ژوئن 2007 : کمیته همکاری نهادی (که در سال 2016 به عنوان ائتلاف بزرگ ده آکادمیک تغییر نام داد ) اعلام کرد که دوازده کتابخانه عضو آن در اسکن 10 میلیون کتاب در طول شش سال آینده شرکت خواهند کرد. [58]
جولای 2007 : دانشگاه Keio با اعلام اینکه حداقل 120000 کتاب با مالکیت عمومی را دیجیتالی می کند، اولین شریک کتابخانه گوگل در ژاپن شد. [88]
آگوست 2007 : گوگل اعلام کرد که تا 500000 مورد دارای حق چاپ و مالکیت عمومی را از کتابخانه دانشگاه کرنل دیجیتالی می کند . گوگل همچنین یک نسخه دیجیتالی از تمام آثار اسکن شده را برای گنجاندن در سیستم کتابخانه خود دانشگاه ارائه خواهد کرد. [89]
سپتامبر 2007 : گوگل قابلیتی را اضافه کرد که به کاربران اجازه میدهد تکههایی از کتابهایی را که در مالکیت عمومی هستند به اشتراک بگذارند. تکه ها ممکن است دقیقاً همانطور که در اسکن کتاب ظاهر می شوند یا به صورت متن ساده ظاهر شوند. [90]
سپتامبر 2007 : گوگل ویژگی جدیدی به نام «کتابخانه من» را معرفی کرد که به کاربران اجازه میدهد کتابخانههای شخصیسازیشده، منتخبی از کتابها را که میتوانند برچسبگذاری کنند، مرور کنند، رتبهبندی کنند یا جستجوی کامل متن ایجاد کنند. [91]
دسامبر 2007 : دانشگاه کلمبیا به عنوان شریکی در دیجیتالی کردن آثار حوزه عمومی اضافه شد. [92]
می 2008 : مایکروسافت کاهش یافت و قصد داشت پروژه اسکن خود را که به 750000 کتاب و 80 میلیون مقاله در مجلات رسیده بود پایان دهد. [93]
اکتبر 2008 : توافقی بین صنعت انتشارات و گوگل پس از دو سال مذاکره انجام شد. گوگل موافقت کرد در ازای حق در دسترس قرار دادن میلیونها کتاب برای عموم، به نویسندگان و ناشران غرامت بدهد. [9] [94]
اکتبر 2008 : "مخزن دیجیتال مشترک" HathiTrust (که بعدها به عنوان کتابخانه دیجیتال HathiTrust شناخته شد) به طور مشترک توسط کمیته همکاری نهادی و 11 کتابخانه دانشگاهی در سیستم دانشگاه کالیفرنیا راه اندازی شد که همه آنها کتابخانه های شریک گوگل بودند. برای آرشیو و دسترسی آکادمیک به کتابهای مجموعههایشان که توسط Google و دیگران اسکن شدهاند. [95]
نوامبر 2008 : گوگل به رکورد 7 میلیون کتاب برای موارد اسکن شده توسط گوگل و شرکای ناشر آن رسید. 1 میلیون در حالت پیش نمایش کامل و 1 میلیون اثر کاملاً قابل مشاهده و دانلود با دامنه عمومی بودند. حدود پنج میلیون چاپ نشده بود . [19] [96] [97]
دسامبر 2008 : گوگل اعلام کرد که مجلات را در Google Books گنجانده است. عناوین عبارتند از مجله نیویورک ، آبنوس ، و مکانیک محبوب [98] [99]
فوریه 2009 : گوگل نسخه موبایلی از جستجوی کتاب گوگل را راه اندازی کرد که به کاربران گوشی های آیفون و اندروید اجازه می داد بیش از 1.5 میلیون اثر دامنه عمومی در ایالات متحده (و بیش از 500000 در خارج از ایالات متحده) را با استفاده از یک مرورگر تلفن همراه بخوانند. به جای تصاویر صفحه، متن ساده کتاب نمایش داده می شود. [100]
می 2009 : در کنوانسیون سالانه BookExpo در نیویورک، گوگل قصد خود را برای معرفی برنامهای اعلام کرد که به ناشران امکان میدهد نسخههای دیجیتال جدیدترین کتابهای خود را مستقیماً از طریق Google به مشتریان بفروشند. [101]
دسامبر 2009 : دادگاهی در فرانسه اسکن کتابهای دارای حق چاپ منتشر شده در فرانسه را تعطیل کرد و گفت که این موضوع قوانین کپی رایت را نقض میکند. این اولین ضرر قانونی عمده برای پروژه اسکن بود. [102]
آوریل 2010 : هنرمندان تجسمی در دعوای قبلی و حل و فصل حضور نداشتند، گروههای شاکی در دعوای دیگری هستند و میگویند که قصد دارند بیش از Google Books را تحت بررسی قرار دهند. در بیانیه آمده است: «اقدامات گروهی جدید فراتر از پروژه کتابخانه گوگل است و سایر موارد نقض سیستماتیک و فراگیر حقوق عکاسان، تصویرگران و سایر هنرمندان تجسمی را شامل می شود.» [103]
می 2010 : گزارش شد که گوگل یک فروشگاه کتاب دیجیتال به نام Google Editions راه اندازی خواهد کرد . [104] با فروشگاه کتاب الکترونیکی خود با آمازون، بارنز و نوبل، اپل و سایر خرده فروشان کتاب الکترونیکی رقابت خواهد کرد. برخلاف سایرین، نسخههای Google کاملاً آنلاین است و به دستگاه خاصی (مانند کیندل، نوک یا آیپد) نیاز ندارد.
ژوئن 2010 : گوگل 12 میلیون کتاب را اسکن کرد. [11]
آگوست 2010 : اعلام شد که گوگل قصد دارد تمامی 129864880 کتاب موجود را در عرض یک دهه اسکن کند که در مجموع به بیش از 4 میلیارد صفحه دیجیتال و 2 تریلیون کلمه می رسد. [11]
دسامبر 2010 : Google eBooks (Google Editions) در ایالات متحده راه اندازی شد. [105]
دسامبر 2010 : گوگل Ngram Viewer را راهاندازی کرد که دادههای استفاده از کلمه را در مجموعه کتابهای خود جمعآوری و نمودار میکند. [30]
مارس 2011 : یک قاضی فدرال توافق حاصله بین صنعت انتشارات و گوگل را رد کرد. [106]
مارس 2012 : گوگل از اسکن 20 میلیون کتاب عبور کرد. [107] [108]
مارس 2012 : گوگل با ناشران به توافق رسید. [109]
ژانویه 2013 : مستند Google and the World Brain در جشنواره فیلم ساندنس نمایش داده شد . [110]
نوامبر 2013 : حکم در انجمن نویسندگان علیه گوگل ، دنی چین ، قاضی منطقه ای ایالات متحده، با استناد به استفاده منصفانه از گوگل حمایت می کند. [111] نویسندگان گفتند که تجدید نظر خواهند کرد. [112]
اکتبر 2015 : دادگاه استیناف با گوگل طرف شد و اعلام کرد که گوگل قانون کپی رایت را نقض نکرده است. [113] طبق گزارش نیویورک تایمز، گوگل بیش از 25 میلیون کتاب را اسکن کرده است. [12]
آوریل 2016 : دادگاه عالی ایالات متحده از رسیدگی به درخواست تجدیدنظر انجمن نویسندگان خودداری کرد، که به این معنی است که تصمیم دادگاه بدوی پابرجاست و Google مجاز خواهد بود کتابهای کتابخانه را اسکن کند و قطعههایی را در نتایج جستجو نمایش دهد بدون اینکه قانون را نقض کند. [114]
گوگل در مورد برنامه های خود در مورد آینده پروژه Google Books کاملا محرمانه عمل کرده است. عملیات اسکن حداقل از سال 2012 کند شده بود، همانطور که کتابداران در چندین مؤسسه شریک Google تأیید کردند. در دانشگاه ویسکانسین، سرعت به کمتر از نیمی از آنچه در سال 2006 بود کاهش یافته بود. با این حال، کتابداران گفتهاند که سرعت کاهش میتواند نتیجه طبیعی بلوغ پروژه باشد – در ابتدا پشتههای کتاب به طور کامل برای این پروژه استفاده میشد. اسکن در حالی که اکنون فقط عناوینی که قبلاً اسکن نشده بودند باید در نظر گرفته شوند. [50] صفحه زمانی Google Books خود شرکت پس از سال 2007 حتی در سال 2017 چیزی ذکر نکرده است، و وبلاگ Google Books در سال 2012 در وبلاگ جستجوی Google ادغام شد. [115]
آتلانتیک علیرغم برنده شدن در دعوای حقوقی یک دهه در سال 2017، گفته است که گوگل "همه عملیات اسکن خود را تعطیل کرده است." [14] در آوریل 2017، Wired گزارش داد که تنها چند کارمند Google روی این پروژه کار میکنند، و کتابهای جدید همچنان در حال اسکن هستند، اما با نرخ بسیار پایینتری. اظهار داشت که نبرد حقوقی یک دهه باعث شده گوگل جاه طلبی خود را از دست بدهد. [115]
از طریق این پروژه، کتابهای کتابخانه بدون توجه به وضعیت کپی رایت، تا حدودی بیرویه دیجیتالی میشدند که منجر به شکایتهای متعددی علیه گوگل شد. گویا تا پایان سال 2008، گوگل بیش از هفت میلیون کتاب را دیجیتالی کرده بود که از این میان تنها حدود یک میلیون کتاب در مالکیت عمومی بودند. از بقیه، یک میلیون در حق چاپ و چاپ بود و پنج میلیون در حق چاپ بود اما تمام شده بود. در سال 2005، گروهی از نویسندگان و ناشران یک دعوای دسته جمعی بزرگ علیه گوگل به دلیل نقض آثار دارای حق چاپ مطرح کردند. گوگل استدلال کرد که از "آثار یتیم" محافظت می کند - کتاب هایی که هنوز تحت حق چاپ هستند، اما صاحبان حق چاپ آنها نمی توانند پیدا شوند. [116]
انجمن نویسندگان و انجمن ناشران آمریکایی به طور جداگانه در سال 2005 از گوگل به دلیل پروژه کتاب خود شکایت کردند و دلیل آن " نقض گسترده حق چاپ " بود. [117] گوگل پاسخ داد که پروژهاش استفاده منصفانه را نشان میدهد و معادل عصر دیجیتال یک کاتالوگ کارت است که هر کلمه در نشریه نمایه شده است. [9] دعاوی تجمیع شد و در نهایت توافقی پیشنهاد شد . این توافقنامه انتقادات قابل توجهی را به دلایل مختلف از جمله ضد انحصار، حریم خصوصی و ناکافی بودن طبقات پیشنهادی نویسندگان و ناشران دریافت کرد. توافق در نهایت رد شد، [118] و ناشران به زودی با Google تسویه حساب کردند. انجمن نویسندگان پرونده خود را ادامه داد و در سال 2011 کلاس پیشنهادی آنها تأیید شد . گوگل در مورد آن تصمیم تجدید نظر کرد، با تعدادی از amici ها که بر عدم کفایت کلاس تاکید کردند، و Circuit دوم گواهینامه کلاس را در ژوئیه 2013 رد کرد و پرونده را برای بررسی دفاع از استفاده منصفانه Google به دادگاه منطقه بازگرداند . [119]
در سال 2015 انجمن نویسندگان درخواست تجدیدنظر دیگری علیه گوگل ارائه کرد تا توسط دومین دادگاه تجدیدنظر ناحیه ایالات متحده در نیویورک بررسی شود. گوگل بر اساس این استدلال که متنهای کامل را به مردم نشان نمیدهد، بلکه تکههایی را به مردم نشان نمیدهد، به اتفاق آرا پیروز شد و به مردم اجازه نمیدهد کتاب را بهطور غیرقانونی بخوانند. [120] در گزارشی، دادگاهها اعلام کردند که قوانین کپی رایت را نقض نکردهاند، زیرا آنها تحت بند استفاده منصفانه محافظت میشوند. [121]
انجمن نویسندگان در سال 2016 مجدداً تلاش کرد تا نسبت به این تصمیم تجدید نظر کند و این بار پرونده خود را به دیوان عالی کشور رسیدگی کرد. این پرونده رد شد، و تصمیم دومین مدار در مورد پرونده دست نخورده باقی ماند، به این معنی که گوگل قوانین کپی رایت را نقض نکرده است. [122] این پرونده همچنین سابقه ای برای سایر موارد مشابه در رابطه با قوانین استفاده منصفانه ایجاد کرد، زیرا قانون را بیشتر روشن کرد و آن را گسترش داد. چنین شفاف سازی بر سایر پروژه های اسکن مشابه گوگل تأثیر می گذارد. [120]
شکایت های دیگر به دنبال رهبری انجمن نویسندگان بود. در سال 2006 یک شکایت آلمانی که قبلاً مطرح شده بود، پس گرفته شد. [123] در ژوئن 2006، Hervé de la Martinière، [124] ناشر فرانسوی معروف به La Martinière و Éditions du Seuil [125] اعلام کرد که قصد دارد از گوگل فرانسه شکایت کند. [126] در سال 2009، دادگاه مدنی پاریس 300,000 یورو (تقریباً 430,000 دلار ) به عنوان غرامت و سود تعیین کرد و به گوگل دستور داد تا 10000 یورو در روز تا زمانی که کتابهای ناشر را از پایگاه داده خود حذف کند، بپردازد. [125] [127] دادگاه نوشت: «Google قوانین حق نسخهبرداری نویسنده را با بازتولید کامل و در دسترس قرار دادن کتابهایی که Seuil بدون اجازه آن دارد نقض کرد [125] و Google «اعمال نقض حق نسخهبرداری را مرتکب شد که به آن آسیب میرساند. ناشران". [124] گوگل گفت که درخواست تجدید نظر خواهد کرد. [125] Syndicat National de l'Edition، که به این دعوی پیوست، گفت که گوگل حدود 100000 اثر فرانسوی تحت حق چاپ را اسکن کرده است. [125]
در دسامبر 2009، نویسنده چینی Mian Mian یک شکایت مدنی به مبلغ 8900 دلار علیه گوگل به دلیل اسکن رمان خود به نام Acid Lovers تنظیم کرد . این اولین شکایتی است که علیه گوگل در چین مطرح می شود. [128] همچنین، در نوامبر همان سال، انجمن حق نشر آثار مکتوب چین (CWWCS) گوگل را به اسکن 18000 کتاب توسط 570 نویسنده چینی بدون مجوز متهم کرد. گوگل در 20 نوامبر با ارائه فهرستی از کتاب های چینی که اسکن کرده بود موافقت کرد، اما این شرکت از اعتراف به "نقض" قوانین کپی رایت خودداری کرد. [129] [ منبع نامعتبر؟ ]
در مارس 2007، توماس روبین، مشاور عمومی حقوق کپی رایت، علائم تجاری و اسرار تجاری در مایکروسافت، گوگل را به نقض قانون کپی رایت با سرویس جستجوی کتاب خود متهم کرد. روبین به طور خاص از سیاست Google برای کپی آزادانه هر اثر تا زمانی که دارنده حق نسخهبرداری از آن مطلع شود، انتقاد کرد. [130]
به دلیل استفاده از تکنیکهای واترمارک دیجیتال با کتابها، مجوز Google برای کارهای حوزه عمومی نیز یک منطقه مورد نگرانی است. برخی از آثار منتشر شده که در مالکیت عمومی هستند، مانند همه آثار ایجاد شده توسط دولت فدرال ایالات متحده ، هنوز مانند سایر آثار تحت حق چاپ تلقی می شوند، و بنابراین پس از سال 1922 قفل می شوند. [131]
{{cite book}}
: CS1 maint: چندین نام: فهرست نویسندگان ( پیوند ){{cite web}}
: CS1 maint: چندین نام: فهرست نویسندگان ( پیوند ){{cite book}}
: CS1 maint: URL نامناسب ( پیوند )از سوی دیگر، گوگل، یکی از پیشگامان این حوزه، ادعا می کند که هفت میلیون کتاب برای پروژه «جستجوی کتاب گوگل» خود که در پایان سال 2004 روشن شد، در دسترس دارد.
{{cite web}}
: CS1 maint: URL نامناسب ( پیوند )