Wayback Machine یک آرشیو دیجیتالی از شبکه جهانی وب است که توسط Internet Archive ، یک سازمان غیرانتفاعی آمریکایی مستقر در سانفرانسیسکو، کالیفرنیا ، تأسیس شده است . در سال 1996 ایجاد شد و در سال 2001 برای عموم راه اندازی شد، به کاربران این امکان را می دهد که "به گذشته" برگردند تا ببینند وب سایت ها در گذشته چگونه به نظر می رسیدند. بنیانگذاران آن، بروستر کاله و بروس گیلیات ، Wayback Machine را توسعه دادند تا با حفظ نسخههای آرشیو شده از صفحات وب از بین رفته، «دسترسی جهانی به همه دانش» را فراهم کند. [2]
Wayback Machine که در 10 می 1996 راه اندازی شد، بیش از 38.2 میلیارد صفحه وب را در پایان سال 2009 ذخیره کرده بود. از 3 ژانویه 2024، Wayback Machine بیش از 860 میلیارد صفحه وب و بیش از 99 پتابایت داده را بایگانی کرده است. [3] [4]
Wayback Machine آرشیو کردن صفحات وب ذخیره شده در حافظه پنهان را در سال 1996 آغاز کرد. یکی از اولین صفحات شناخته شده در 10 می 1996 بایگانی شد.( UTC ). [5]
بنیانگذاران آرشیو اینترنت بروستر کاله و بروس گیلیات ماشین Wayback را در سانفرانسیسکو ، کالیفرنیا [6] در اکتبر 2001 راه اندازی کردند، [ 7] [8] در درجه اول برای رسیدگی به مشکل محو شدن محتوای وب هر زمان که تغییر می کند یا زمانی که یک وب سایت بسته می شود. پایین [9] این سرویس کاربران را قادر می سازد تا نسخه های آرشیو شده صفحات وب را در طول زمان ببینند، که آرشیو آن را "شاخص سه بعدی" می نامد. [10] کاله و گیلیات این ماشین را به امید آرشیو کردن کل اینترنت و فراهم کردن «دسترسی جهانی به همه دانش» ایجاد کردند. [11] نام "Wayback Machine" اشاره ای به یک وسیله خیالی سفر در زمان در انیمیشن کارتونی The Adventures of Rocky and Bullwinkle and Friends از دهه 1960 است. [12] [13] [14] در بخشی از کارتون با عنوان "تاریخ غیر محتمل پی بادی"، شخصیت های مستر پی بادی و شرمن از " ماشین راه برگشت " برای مشاهده و شرکت در رویدادهای تاریخی معروف استفاده می کنند. [ نیازمند منبع ]
از سال 1996 تا 2001، اطلاعات بر روی نوار دیجیتال نگهداری میشد، و کاله گهگاه به محققان و دانشمندان اجازه میداد تا از پایگاه داده «ضخیم» استفاده کنند . [15] هنگامی که آرشیو در سال 2001 به پنجمین سالگرد خود رسید، در مراسمی در دانشگاه کالیفرنیا، برکلی ، رونمایی شد و در معرض دید عموم قرار گرفت . [16] در زمان راه اندازی Wayback Machine، بیش از 10 میلیارد صفحه آرشیو شده داشت. [17] داده ها در خوشه بزرگ گره های لینوکس آرشیو اینترنت ذخیره می شوند . [11] نسخههای جدید وبسایتها را در مواردی بازبینی و بایگانی میکند (به جزئیات فنی زیر مراجعه کنید). [18] همچنین میتوان با وارد کردن نشانی اینترنتی وبسایت در کادر جستجو، سایتها را بهصورت دستی ضبط کرد، مشروط بر اینکه وبسایت به Wayback Machine اجازه دهد آن را « خزیده » و دادهها را ذخیره کند. [19]
نرمافزار Wayback Machine برای « خزیدن » در وب و دانلود تمام اطلاعات و فایلهای داده در دسترس عموم در صفحات وب، سلسلهمراتب Gopher ، سیستم تابلوی اعلانات Netnews (Usenet) و نرمافزار قابل دانلود توسعه یافته است. [27] اطلاعات جمعآوریشده توسط این «خزندهها» شامل تمام اطلاعات موجود در اینترنت نمیشود، زیرا بسیاری از دادهها توسط ناشر محدود شده یا در پایگاههای دادهای که در دسترس نیستند ذخیره میشوند. برای غلبه بر ناهماهنگیها در وبسایتهای نیمه پنهان، Archive-It.org در سال 2005 توسط آرشیو اینترنت به عنوان وسیلهای برای اجازه دادن به مؤسسات و سازندگان محتوا برای جمعآوری و نگهداری داوطلبانه مجموعههای محتوای دیجیتال و ایجاد آرشیوهای دیجیتالی توسعه یافت. [28]
خزنده ها از منابع مختلفی ارائه می شوند، برخی از اشخاص ثالث وارد شده و برخی دیگر به صورت داخلی توسط آرشیو ایجاد شده اند. [18] برای مثال، خزیدن توسط بنیاد اسلون و الکسا انجام میشود ، خزندههایی که توسط Internet Archive به نمایندگی از NARA و بنیاد حافظه اینترنتی اجرا میشوند ، آینههای Common Crawl . [18] "Worldwide Web Crawls" از سال 2010 در حال اجرا هستند و وب جهانی را به تصویر می کشند. [18] [29]
اسناد و منابع با نشانیهای اینترنتی مهر زمانی مانند 20241019015411
. منابع منفرد صفحات مانند تصاویر و شیوه نامه ها و اسکریپت ها، و همچنین لینک های خروجی ، با مهر زمانی صفحه مشاهده شده در حال حاضر پیوند داده می شوند، بنابراین به طور خودکار به عکس های فردی خود هدایت می شوند که از نظر زمانی نزدیک ترین هستند. [30]
فرکانس گرفتن عکس فوری در هر وب سایت متفاوت است. [18] وبسایتهای موجود در «خزیدن وب در سراسر جهان» در «لیست خزیدن» گنجانده شدهاند، که سایت یک بار در هر خزیدن بایگانی میشود. [18] بسته به اندازه خزیدن ممکن است ماهها یا حتی سالها طول بکشد. [ 18] برای مثال، "Wide Crawl Number 13" در 9 ژانویه 2015 شروع شد و در 11 ژوئیه 2016 تکمیل شد . بیش از یک لیست خزیدن، بنابراین تعداد دفعات خزیدن یک سایت بسیار متفاوت است. [18]
از اکتبر 2019، کاربران به 15 درخواست بایگانی و بازیابی در دقیقه محدود می شوند. [32] [ چرا؟ ]
با توسعه فناوری در طول سال ها، ظرفیت ذخیره سازی Wayback Machine افزایش یافته است. در سال 2003، تنها پس از دو سال دسترسی عمومی، ماشین Wayback با سرعت 12 ترابایت در ماه در حال رشد بود. داده ها در سیستم های رک PetaBox که توسط کارکنان Internet Archive طراحی شده اند، ذخیره می شوند. اولین رک 100 ترابایتی در ژوئن 2004 به طور کامل عملیاتی شد، اگرچه به زودی مشخص شد که آنها به فضای ذخیره سازی بسیار بیشتری نیاز دارند. [33] [34]
Internet Archive معماری ذخیره سازی سفارشی خود را در سال 2009 به Sun Open Storage منتقل کرد و میزبان یک مرکز داده جدید در مرکز داده ماژولار Sun در پردیس Sun Microsystems کالیفرنیا است. [35] از سال 2009 [به روز رسانی]، ماشین Wayback تقریباً شامل سه پتابایت داده بود و با سرعت 100 ترابایت در هر ماه رشد میکرد. [36]
نسخه جدید و بهبودیافته Wayback Machine، با رابط به روز شده و فهرست تازهتری از محتوای آرشیو شده، برای آزمایش عمومی در سال 2011 در دسترس قرار گرفت، جایی که عکسها در یک طرح تقویم با دایرههایی ظاهر میشوند که عرض آنها تعداد خزیدنها را در هر روز به تصویر میکشد. اما بدون علامت گذاری موارد تکراری با ستاره یا صفحه جستجوی پیشرفته. [37] [38] یک نوار ابزار بالا برای تسهیل حرکت بین عکسها اضافه شد. نمودار میلهای تعداد عکسبرداریها را در هر ماه در طول سالها به تصویر میکشد. [39] ویژگی هایی مانند "تغییرات"، "خلاصه"، و نقشه سایت گرافیکی متعاقبا اضافه شد.
در مارس همان سال، در فروم Wayback Machine گفته شد که "بتای ماشین جدید Wayback دارای فهرست کاملتر و به روزتری از تمام مواد خزیده شده در سال 2010 است و به طور منظم به روز می شود. راندن ماشین کلاسیک Wayback در سال 2008 تنها مقدار کمی از مواد را در خود جای داده است، و هیچ به روز رسانی دیگری در این فهرست برنامه ریزی نشده است، زیرا امسال به تدریج از بین خواهد رفت." [40] همچنین در سال 2011، Internet Archive ششمین جفت قفسه PetaBox خود را نصب کرد که ظرفیت ذخیره سازی Wayback Machine را تا 700 ترابایت افزایش داد. [41]
در ژانویه 2013، این شرکت یک نقطه عطف پیشگامانه از 240 میلیارد URL را اعلام کرد. [42]
در اکتبر 2013، این شرکت ویژگی «ذخیره یک صفحه» [43] [44] را معرفی کرد که به هر کاربر اینترنتی اجازه میدهد محتویات یک URL را بایگانی کند و به سرعت یک پیوند دائمی را برخلاف ویژگی وب زنده قبلی ایجاد کند .
در دسامبر 2014، Wayback Machine حاوی 435 میلیارد صفحه وب بود - تقریباً 9 پتابایت داده، و حدود 20 ترابایت در هفته رشد می کرد. [17] [45] [46]
در ژوئیه 2016، Wayback Machine طبق گزارش ها حاوی حدود 15 پتابایت داده بود. [47]
در سپتامبر 2018، Wayback Machine حاوی بیش از 25 پتابایت داده بود. [48] [49]
از دسامبر 2020، Wayback Machine حاوی بیش از 70 پتابایت داده بود. [50]
آرشیو اینترنت، از ژانویه 2024، گواهی می دهد که تا کنون بیش از 99 پتابایت داده را ذخیره کرده است. [3] [4]
سرویس Wayback Machine سه API عمومی SavePageNow، Availability و CDX را ارائه می دهد. [53] SavePageNow را می توان برای بایگانی صفحات وب استفاده کرد. Availability API برای بررسی وضعیت در دسترس بودن بایگانی برای یک صفحه وب، [54] بررسی اینکه آیا آرشیو برای صفحه وب وجود دارد یا خیر. CDX API برای پرس و جو پیچیده، فیلتر کردن و تجزیه و تحلیل داده های گرفته شده است. [55] [56]
از لحاظ تاریخی، ماشین Wayback در تعیین اینکه آیا یک وبسایت خزیده میشود - یا اگر قبلاً خزیده شده باشد، بایگانیهای آن برای عموم قابل مشاهده باشد، به استاندارد حذف روباتها (robots.txt) احترام گذاشته است. صاحبان وب سایت این امکان را داشتند که از طریق استفاده از robots.txt از Wayback Machine انصراف دهند. قوانین robots.txt را به صورت ماسبق اعمال کرد. اگر سایتی بایگانی اینترنت را مسدود کند، هر صفحه ای که قبلاً از دامنه بایگانی شده بود بلافاصله از دسترس خارج می شد. علاوه بر این، آرشیو اینترنت اعلام کرد که "گاهی اوقات، یک صاحب وب سایت مستقیماً با ما تماس می گیرد و از ما می خواهد که خزیدن یا آرشیو سایت را متوقف کنیم. ما با این درخواست ها موافقت می کنیم." [57] علاوه بر این، این وب سایت می گوید: "آرشیو اینترنت علاقه ای به حفظ یا ارائه دسترسی به وب سایت ها یا سایر اسناد اینترنتی افرادی که نمی خواهند مطالب آنها در مجموعه باشد، نیست." [58] [59]
در 17 آوریل 2017، گزارشهایی از سایتهایی منتشر شد که از بین رفتهاند و به دامنههای پارک شده تبدیل شدهاند که از robots.txt برای حذف خود از موتورهای جستجو استفاده میکنند و در نتیجه بهطور ناخواسته از Wayback Machine حذف میشوند. [60] به دنبال این، بایگانی اینترنت این خطمشی را تغییر داد تا برای حذف آن از Wayback Machine درخواست حذف صریح درخواست کند. [30]
خط مشی حذف عطف به ماسبق Wayback تا حدی مبتنی بر توصیه هایی برای مدیریت درخواست های حذف و حفظ یکپارچگی آرشیو است که توسط دانشکده مدیریت اطلاعات و سیستم ها در دانشگاه کالیفرنیا، برکلی در سال 2002 منتشر شد، که به صاحب وب سایت این حق را می دهد که دسترسی به آرشیو سایت را مسدود کند. . [61] Wayback برای کمک به جلوگیری از دعاوی پرهزینه از این سیاست پیروی کرده است. [62]
سیاست محرومیت عطف به ماسبق Wayback در سال 2017 شروع به کاهش کرد، زمانی که احترام به روبات ها در وب سایت های دولتی و نظامی ایالات متحده برای خزیدن و نمایش صفحات وب متوقف شد. از آوریل 2017، Wayback به طور گسترده تری robots.txt را نادیده می گیرد، نه فقط برای وب سایت های دولتی ایالات متحده. [63] [64] [65] [66]
از زمان راهاندازی عمومی آن در سال 2001، Wayback Machine هم برای روشهای ذخیره و جمعآوری دادهها و هم برای صفحات واقعی موجود در آرشیو آن توسط محققان مورد مطالعه قرار گرفته است. تا سال 2013، محققان حدود 350 مقاله در زمینه ماشین راه برگشت نوشته بودند، که عمدتاً در زمینه های فناوری اطلاعات ، علوم کتابداری و علوم اجتماعی بودند . محققان علوم اجتماعی از ماشین Wayback برای تجزیه و تحلیل اینکه چگونه توسعه وب سایت ها از اواسط دهه 1990 تا به امروز بر رشد شرکت تأثیر گذاشته است استفاده کرده اند. [17]
هنگامی که Wayback Machine یک صفحه را بایگانی می کند، معمولاً شامل بیشتر پیوندها می شود و این پیوندها را زمانی فعال نگه می دارد که به راحتی ممکن است به دلیل بی ثباتی اینترنت شکسته شوند. محققان هندی کارآیی توانایی Wayback Machine برای ذخیره لینکها در نشریات علمی آنلاین را بررسی کردند و دریافتند که اندکی بیش از نیمی از آنها را ذخیره میکند. [67]
روزنامهنگاران از Wayback Machine برای مشاهده وبسایتهای مرده، گزارشهای خبری قدیمی و تغییرات در محتوای وبسایت استفاده میکنند. محتوای آن برای پاسخگو کردن سیاستمداران و افشای دروغهای میدان جنگ استفاده شده است». [68] در سال 2014، یک صفحه آرشیو شده در رسانه های اجتماعی از ایگور گیرکین ، رهبر شورشیان جدایی طلب در اوکراین، نشان داد که او در مورد اینکه سربازانش یک هواپیمای نظامی مظنون اوکراینی را سرنگون کرده اند، افتخار می کند، قبل از اینکه مشخص شود این هواپیما در واقع یک جت غیرنظامی خطوط هوایی مالزی بوده است. ( پرواز 17 خطوط هوایی مالزی )، پس از آن پست را حذف کرد و ارتش اوکراین را مسئول سرنگونی هواپیما دانست. [68] [69] در سال 2017، راهپیمایی برای علم از بحثی در Reddit سرچشمه گرفت که نشان می داد شخصی از Archive.org بازدید کرده و متوجه شده است که تمام ارجاعات به تغییرات آب و هوایی از وب سایت کاخ سفید حذف شده است. در پاسخ، یکی از کاربران نظر داد: "باید یک راهپیمایی دانشمندان در واشنگتن برگزار شود". [70] [71] [72]
علاوه بر این، این سایت به شدت برای تأیید استفاده می شود، دسترسی به منابع و ایجاد محتوا توسط ویراستاران ویکی پدیا را فراهم می کند . [73] هنگامی که URL های جدید به ویکی پدیا اضافه می شوند، آرشیو اینترنت آنها را بایگانی می کند. [73]
در سپتامبر 2020، همکاری با Cloudflare برای بایگانی خودکار وبسایتهایی که از طریق سرویس «همیشه آنلاین» ارائه میشوند، اعلام شد، که همچنین به آن اجازه میدهد تا در صورت عدم دسترسی به میزبان اصلی، کاربران را به نسخهای از سایت هدایت کند. [74]
در سال 2014، بین زمان خزیدن یک وب سایت تا زمانی که برای مشاهده در ماشین Wayback در دسترس قرار گرفت، یک فاصله زمانی شش ماهه وجود داشت. [75] از سال 2024، زمان تاخیر 3 تا 10 ساعت است. [30] Wayback Machine فقط امکانات جستجوی محدودی را ارائه می دهد. ویژگی "جستجوی سایت" آن به کاربران اجازه می دهد تا یک سایت را بر اساس کلمات توصیف کننده سایت، به جای کلمات موجود در خود صفحات وب، پیدا کنند. [76]
Wayback Machine به دلیل محدودیتهای خزنده وب، تمام صفحات وب ساخته شده را در بر نمیگیرد. Wayback Machine نمیتواند صفحات وب حاوی ویژگیهای تعاملی مانند پلتفرمهای فلش و فرمهای نوشتهشده در جاوا اسکریپت و برنامههای وب پیشرونده را بهطور کامل بایگانی کند ، زیرا این توابع به تعامل با وبسایت میزبان نیاز دارند. این بدان معناست که تقریباً از 9 ژوئیه 2013، Wayback Machine قادر به نمایش نظرات YouTube در هنگام ذخیره صفحات تماشای ویدیوها نبوده است، زیرا طبق گفته تیم آرشیو، نظرات دیگر "در خود صفحه بارگیری نمی شوند." [77] خزنده وب Wayback Machine در استخراج هر چیزی که در HTML یا یکی از انواع آن کدگذاری نشده است، مشکل دارد، که اغلب میتواند منجر به شکستگی لینکها و از دست رفتن تصاویر شود. به همین دلیل، خزنده وب نمی تواند "صفحات یتیم" را که توسط صفحات دیگر به آنها پیوند داده نشده اند، بایگانی کند. [76] [78] خزنده ماشین Wayback فقط تعداد از پیش تعیین شده ای از پیوندها را بر اساس یک محدودیت عمق از پیش تعیین شده دنبال می کند، بنابراین نمی تواند همه پیوندها را در هر صفحه بایگانی کند. [29]
در پرونده ای در سال 2009، Netbula, LLC علیه Chordiant Software Inc. ، متهم Chordiant درخواستی را برای مجبور کردن Netbula به غیرفعال کردن فایل robots.txt در وب سایت خود ارائه کرد که باعث می شد Wayback Machine دسترسی به نسخه های قبلی صفحاتی را که داشت به طور عطف به گذشته حذف کند. بایگانی شده از سایت Netbula، صفحاتی که Chordiant معتقد بود از مورد آن پشتیبانی می کند. [79]
نتبولا به این پیشنهاد اعتراض کرد که متهمان خواستار تغییر وبسایت نتبولا بودند و باید مستقیماً از آرشیو اینترنتی برای این صفحات احضار میکردند. [80] یکی از کارکنان بایگانی اینترنت بیانیه سوگند خورده ای را در حمایت از پیشنهاد Chordiant ارائه کرد، با این حال، اظهار داشت که نمی تواند صفحات وب را به هیچ وجه «بدون هزینه، هزینه و اختلال قابل توجه در عملیات خود» تولید کند. [79]
قاضی هاوارد لوید در ناحیه شمالی کالیفرنیا، بخش سن خوزه، استدلالهای Netbula را رد کرد و به آنها دستور داد تا مسدود کردن robots.txt را موقتاً غیرفعال کنند تا به Chordiant اجازه دهند صفحات بایگانی شدهای را که به دنبال آن بودند بازیابی کند. [79]
در یک پرونده اکتبر 2004، Telewizja Polska USA, Inc. v. Echostar Satellite , No. 02 C 3293, 65 Fed. آر اوید. خدمت 673 (ND Ill. 15 اکتبر 2004)، یکی از طرفین دعوا تلاش کرد تا از آرشیو Wayback Machine به عنوان منبعی برای شواهد قابل قبول استفاده کند، شاید برای اولین بار. Telewizja Polska ارائه دهنده TVP Polonia است و EchoStar شبکه Dish را اداره می کند . قبل از روند محاکمه، EchoStar نشان داد که قصد دارد عکسهای فوری Wayback Machine را به عنوان اثبات محتوای گذشته وبسایت Telewizja Polska ارائه دهد. Telewizja Polska به دلیل شنیده ها و منبع غیرمعتبر ، درخواستی برای سرکوب عکس های فوری ارائه کرد ، اما قاضی قاضی Arlander Keys ادعای Telewizja Polska درباره شنیده ها را رد کرد و درخواست TVP را برای حذف شواهد در دادگاه رد کرد . [81] [82] اما در محاکمه، رونالد گوزمن، قاضی دادگاه منطقه، قاضی دادگاه، یافتههای Magistrate Keys را رد کرد و گفت که نه سوگندنامه کارمند بایگانی اینترنت و نه صفحات زیربنایی (یعنی وبسایت Telewizja Polska) ) به عنوان مدرک قابل قبول بودند. قاضی گوزمن استدلال کرد که سوگندنامه کارمند حاوی گفتههای شایعه و غیرقطعی است، و صفحه وب ادعا شده، چاپهای چاپ شده خود احراز هویت نیست. [83] [84]
اداره ثبت اختراع و علائم تجاری ایالات متحده و اداره ثبت اختراع اروپا، تمبرهای تاریخ را از آرشیو اینترنت به عنوان مدرکی مبنی بر اینکه چه زمانی یک صفحه وب معین در دسترس عموم بوده است، می پذیرند. این تاریخ ها برای تعیین اینکه آیا یک صفحه وب به عنوان هنر قبلی برای مثال در بررسی یک درخواست ثبت اختراع در دسترس است یا خیر استفاده می شود . [85]
برای بایگانی یک وب سایت محدودیت های فنی وجود دارد و در نتیجه، طرف های متخاصم در دعوا می توانند از نتایج ارائه شده توسط آرشیو وب سایت سوء استفاده کنند. این مشکل میتواند با ارائه اسکرین شات از صفحات وب در شکایات، پاسخها یا گزارشهای شاهد متخصص در زمانی که پیوندهای زیربنایی در معرض دید نیستند تشدید شود و بنابراین میتواند حاوی خطا باشد. به عنوان مثال، آرشیوهایی مانند Wayback Machine فرمها را پر نمیکنند و بنابراین، محتویات پایگاههای داده تجارت الکترونیک غیر RESTful را در آرشیو خود درج نمیکنند. [86]
در اروپا، Wayback Machine را می توان به عنوان نقض قوانین کپی رایت تفسیر کرد . فقط سازنده محتوا می تواند تصمیم بگیرد که محتوای آنها در کجا منتشر یا تکراری شود، بنابراین بایگانی باید در صورت درخواست سازنده، صفحات را از سیستم خود حذف کند. [87] سیاستهای حذف Wayback Machine را میتوانید در بخش پرسشهای متداول سایت پیدا کنید. [88]
برخی از پروندهها بهخاطر تلاشهای بایگانی ماشین Wayback، علیه Internet Archive مطرح شده است.
در اواخر سال 2002، آرشیو اینترنت، سایتهای مختلفی را که منتقد ساینتولوژی بودند ، از Wayback Machine حذف کرد. [89] یک پیام خطا بیان کرد که این در پاسخ به "درخواست صاحب سایت" بوده است. [90] بعداً مشخص شد که وکلای کلیسای ساینتولوژی خواستار حذف آن شده بودند و صاحبان سایت نمی خواستند مطالب آنها حذف شود. [91]
در سال 2003، هاردینگ ارلی فولمر و فریلی با استفاده از ماشین راهاندازی بایگانی، از یک مشتری در برابر اختلاف علامت تجاری دفاع کردند. وکلای دادگستری توانستند ثابت کنند که ادعاهای مطرح شده توسط شاکی، بر اساس محتوای چندین سال قبل وب سایت آنها، بی اعتبار است. شاکی، Healthcare Advocates، سپس شکایت خود را اصلاح کرد تا بایگانی اینترنتی را نیز شامل شود و سازمان را به نقض حق نسخه برداری و همچنین نقض قانون DMCA و قانون کلاهبرداری و سوء استفاده رایانه ای متهم کرد . Healthcare Advocates ادعا کرد که از آنجایی که آنها یک فایل robots.txt را در وب سایت خود نصب کرده بودند، حتی اگر پس از طرح دعوی اولیه، بایگانی باید تمام نسخه های قبلی وب سایت شاکی را از Wayback Machine حذف می کرد، با این حال، برخی از مطالب به در Wayback به صورت عمومی قابل مشاهده باشد. [92] پس از رفع مشکل Wayback، این دعوا خارج از دادگاه حل و فصل شد. [93]
فعال سوزان شل در دسامبر 2005 شکایت کرد و از آرشیو اینترنت خواست 100000 دلار آمریکا برای بایگانی وب سایتش profane-justice.org بین سال های 1999 و 2004 بپردازد . ناحیه شمالی کالیفرنیا در 20 ژانویه 2006، به دنبال تصمیم قضایی مبنی بر اینکه بایگانی اینترنتی حق نشر شل را نقض نکرده است . شل پاسخ داد و دعوای متقابلی علیه Internet Archive به دلیل بایگانی کردن سایت خود، که به ادعای او نقض شرایط خدمات او است، مطرح کرد . [96] در 13 فوریه 2007، یک قاضی برای دادگاه منطقه ای ایالات متحده برای ناحیه کلرادو، همه دعاوی متقابل به جز نقض قرارداد را رد کرد . [95] آرشیو اینترنت برای رد ادعاهای نقض حق نسخهبرداری که Shell ادعا میکرد ناشی از فعالیتهای کپیبرداری آن بود، حرکت نکرد ، که این نیز ادامه خواهد داشت. [97]
در 25 آوریل 2007، اینترنت آرشیو و سوزان شل به طور مشترک حل و فصل دعوی خود را اعلام کردند. [94] آرشیو اینترنت گفت: "... هیچ علاقه ای به گنجاندن مطالب در ماشین Wayback افرادی که نمی خواهند محتوای وب خود را بایگانی کنند، ندارد. ما می دانیم که خانم شل دارای حق چاپ معتبر و قابل اجرا در وب خود است. سایت و ما متأسفیم که گنجاندن وب سایت او در Wayback Machine منجر به این دعوا شد." شل گفت: "من به ارزش تاریخی هدف اینترنت آرشیو احترام می گذارم. هرگز قصد مداخله در آن هدف یا ایجاد آسیب به آن را نداشتم." [98]
بین سالهای 2013 تا 2016، یک بازیگر پورنوگرافی به نام دانیل داویدیک، ابتدا با ارسال چندین درخواست DMCA به آرشیو، و سپس با درخواست تجدیدنظر به دادگاه فدرال کانادا ، سعی کرد تصاویر آرشیو شده خود را از آرشیو Wayback Machine حذف کند . [99] [100] [101] تصاویر در سال 2017 از وب سایت حذف شدند.
در سال 2018، آرشیوهای وب سایت نرم افزار stalkerware FlexiSpy از Wayback Machine حذف شد. این شرکت ادعا کرد که با آرشیو اینترنت تماس گرفته است، احتمالاً برای حذف آرشیو وب سایت خود. [102]
Archive.org در چین مسدود شده است . [103] [104] [105] آرشیو اینترنت به طور کامل در روسیه در سالهای 2015-2016 مسدود شد، ظاهراً به دلیل میزبانی یک ویدیوی تبلیغاتی جهاد. [68] [106] [107] از سال 2016، وبسایت به طور کامل در دسترس بوده است، اگرچه در سال 2016 لابیگران تجاری روسی از آرشیو اینترنت شکایت کردند تا آن را به دلایل حق چاپ ممنوع کنند. [108]
در مارس 2015، منتشر شد که محققان امنیتی از تهدید ناشی از میزبانی غیرعمدی باینری های مخرب از سایت های آرشیو شده توسط سرویس آگاه شدند . [109] [110]
آلیسون ماکرینا ، مدیر پروژه آزادی کتابخانه ، خاطرنشان می کند که "در حالی که کتابداران برای حفظ حریم خصوصی افراد ارزش زیادی قائل هستند، ما نیز به شدت با سانسور مخالفیم". [68]
حداقل یک مورد وجود دارد که در آن مقاله مدت کوتاهی پس از حذف از وب سایت اصلی خود از آرشیو حذف شده است. یکی از خبرنگاران Daily Beast مقاله ای نوشته بود که در سال 2016 چند ورزشکار همجنس گرا المپیکی را پس از ساختن یک پروفایل جعلی که به عنوان یک مرد همجنسگرا در یک برنامه دوستیابی ساخته بود، شکست داد. دیلی بیست این مقاله را پس از اینکه با خشم گسترده مواجه شد حذف کرد. اندکی بعد، آرشیو اینترنت نیز به زودی این کار را انجام داد، اما با قاطعیت اعلام کرد که آنها این کار را بدون هیچ دلیل دیگری جز محافظت از ایمنی ورزشکاران خارج شده انجام دادند. [68]
سایر تهدیدها عبارتند از بلایای طبیعی، [111] تخریب (اعم از راه دور و فیزیکی)، [112] دستکاری در محتویات آرشیو، قوانین مشکل کپی رایت، [113] و نظارت بر کاربران سایت. [114]
الکساندر رز، مدیر اجرایی بنیاد Long Now ، گمان میکند که در درازمدت چندین نسل «بدون هیچ» به روشی مفید زنده میمانند و میگوید: «اگر ما در تمدن تکنولوژیک خود تداوم داشته باشیم، من به بسیاری از موارد مشکوک هستم. دادههای خالی قابل یافتن و جستجو باقی خواهند ماند، اما من گمان میکنم که تقریباً هیچ چیز از قالبی که در آن ارائه شده قابل تشخیص نباشد، زیرا سایتهایی که «دارای سیستمهای مدیریت محتوای عمیق مانند دروپال و روبی و جنگو» هستند، سختتر هستند. [115]
در سال 2016، آتلانتیک در مقالهای در مورد حفظ دانش بشری اظهار داشت که آرشیو اینترنت، که خود را برای درازمدت ساخته شده توصیف میکند، [116] «بهشدت کار میکند تا دادهها را قبل از ناپدید شدن بدون هیچگونه ثبت کند. زیرساخت های بلندمدت را می توان صحبت کرد." [117]
در سپتامبر 2024، بایگانی اینترنت با نقض اطلاعات مواجه شد که 31 میلیون رکورد حاوی اطلاعات شخصی، از جمله آدرس های ایمیل و رمزهای عبور هش شده را فاش کرد . در 9 اکتبر 2024، سایت به دلیل یک حمله انکار سرویس توزیع شده از کار افتاد . [118] [119]
همانطور که آرشیو اینترنت 25 ساله می شود، ما شما را به سفری از راه بازگشت به راه رو به جلو دعوت می کنیم، در لحظات مهمی که دانش برای همه قابل دسترس تر شد.
ما توانایی بایگانی فوری یک صفحه و بازگرداندن URL دائمی برای آن صفحه را در Wayback Machine اضافه کرده ایم. این سرویس به هر کسی – ویراستاران ویکیپدیا، محققین، متخصصان حقوقی، دانشجویان، یا آشپزهای خانگی مانند من – اجازه میدهد تا یک URL پایدار برای استناد، اشتراکگذاری یا نشانک کردن اطلاعاتی که میخواهند در آینده به آن دسترسی داشته باشند، ایجاد کنند.
1) درخواست Internet Archive مبنی بر رد دعوای متقابل Shell برای تبدیل و سرقت مدنی (علت دوم اقدام) پذیرفته می شود، 2) درخواست Internet Archive مبنی بر رد ادعای متقابل Shell برای نقض قرارداد (علت سوم اقدام) رد می شود. 3) درخواست اینترنت آرشیو برای رد دعوی متقابل شل برای حمله به راکت تحت RICO و COCCA (چهارمین علت اقدام) پذیرفته می شود.
رایانه ها می توانند از طرف مردم قرارداد ببندند. قانون تراکنشهای الکترونیکی یکنواخت (UETA) میگوید که «قرارداد ممکن است با تعامل نمایندگان الکترونیکی طرفین تشکیل شود، حتی اگر هیچ فردی از اقدامات نمایندگان الکترونیکی یا شرایط و توافقهای ناشی از آن آگاه یا بررسی نکرده باشد».
مهمتر از آن، به نظر دادگاه، کپی کردن صرف اینترنت بایگانی از سایت شل، و نمایش آن در پایگاه داده آن، اعمال سلطه و کنترل لازم بر اموال متهم را تشکیل نمی دهد. دادگاه به این نکته مهم اشاره کرد که متهم همیشه مالک و اداره کننده سایت خود بوده است. دادگاه گفت: «شل در ادعای حقایقی که نشان میدهد اینترنت بایگانی بر وبسایت او تسلط یا کنترل داشته، کوتاهی کرده است، زیرا شکایت شل به صراحت بیان میکند که او همچنان به مالکیت و اداره وبسایت در زمانی که در دستگاه Wayback بایگانی شده بود، ادامه داد. شل هیچ مرجعی را شناسایی نمی کند که از این ایده حمایت کند که کپی کردن اسناد به خودی خود محرومیت از استفاده برای پشتیبانی از تبدیل کافی است. برعکس، مدارهای متعددی مشخص کرده اند که اینطور نیست.
هر دو طرف صمیمانه از هرگونه آشفتگی که این دعوا ممکن است برای دیگری ایجاد کرده باشد متاسف هستند. نه بایگانی اینترنتی و نه خانم شل هیچ رفتاری را که ممکن است باعث آسیب رساندن به هر یک از طرفین ناشی از توجه عمومی به این دعوی شده باشد را نمی پذیرند. طرفین درگیر چنین رفتاری نبودهاند و درخواست میکنند که پاسخ عمومی به حلوفصل دوستانه این دعوا مطابق با خواستههای آنها باشد تا آسیب یا آشفتگی بیشتری برای هیچ یک از طرفین ایجاد نشود.
25/03/2015: آخرین URL های میزبانی شده در این آدرس IP توسط حداقل یک اسکنر URL یا مجموعه داده URL مخرب شناسایی شده است. ... 2/62 2015-03-25 16:14:12 [URL کامل ویرایش شد]/Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [URL کامل ویرایش شده]/CBLightSetup.exe
25/03/2015: بخشی از این سایت برای فعالیت مشکوک 138 بار در 90 روز گذشته فهرست شده است. ... چه اتفاقی افتاد که گوگل از این سایت بازدید کرد؟ ... از 42410 صفحه ای که در 90 روز گذشته در سایت آزمایش کردیم، 450 صفحه منجر به دانلود و نصب نرم افزارهای مخرب بدون رضایت کاربر شد. آخرین باری که گوگل از این سایت بازدید کرد در تاریخ 25/03/2015 و آخرین باری که محتوای مشکوک در این سایت یافت شد در تاریخ 25/03/2015 بود. ... نرم افزارهای مخرب شامل 169 تروجان، 126 ویروس، 43 درب پشتی.
Die Betreiber des Archives fürchten neben Zensur und Manipulation der digitalen Aufzeichnungen demnach auch die Überwachung der Archive-Nutzer. [اپراتورهای آرشیو نه تنها از سانسور و دستکاری ضبط های دیجیتال، بلکه از نظارت کاربران بایگانی نیز هراس دارند].