Wayback Machine
Wayback Machine | |
---|---|
![]() | |
![]() Стартавая старонка партала | |
URL | web.archive.org/ |
Тып сайта | вэб-архіў[d] |
Мова(-ы) | англійская |
Мова праграмавання | Java, Python |
Уладальнік | Архіў Інтэрнэту |
Пачатак працы | 24 кастрычніка 2001 |
Рэйтынг Alexa | 173[1] |
![]() |
Wayback Machine (з англ. — «Машына часу») — бясплатны анлайн-архіў некамерцыйнай бібліятэкі «Архіў Інтэрнэту». З дапамогай пошукавых робатаў "Wayback Machine" архівуе і робіць агульнадаступнай большую частка «адкрытага» інтэрнэту[2].
Сервіс быў запушчаны ў 1996 годзе, аднак стаў даступны для грамадскасці толькі ў 2001.
За першыя 20 гадоў існавання Wayback Machine каталагізаваў і захаваў калекцыю з больш за 286 млрд вэб-старонак. Архіўныя здымкі адлюстроўваюцца ў фармаце HTML, JavaScript і CSS[3]. Дзякуючы захаваным у Wayback Machine дакументам карыстальнікі могуць адсочваць якія паходзяць на сайтах змены і параўноўваць розныя версіі правак[4]. Станам на студзень 2023 года Wayback Machine падае доступ да больш за 767 мільярдам захаваных вэб-старонак[5].
Стварэнне


У 1989 годзе англійскі навуковец Цім Бернерс-Лі стварыў сусветнае павуцінне — сістэму, якая дазваляе перадаваць даныя праз падключаныя да інтэрнэту камп'ютары. Аднак з распаўсюджваннем сусветнага павуціння былі выяўлены дзве асноўныя праблемы. Першая складалася ў недахопе месцаў для захоўвання ўсіх даных, з прычыны чаго шматлікія дакументы і вэб-старонкі выдаляліся. Іншая праблема складалася ў тым, што пасля рэдагавання вэб-старонкі (напрыклад, па юрыдычных прычынах) карыстальнікі не маглі паглядзець яе першапачатковую версію. Вырашыць гэтыя недахопы імкнулася амерыканская лічбавая бібліятэка «Архіў Інтэрнэту» — некамерцыйная арганізацыя, створаная праграмістамі Брустэрам Кейлам і Брусам Галіятам у 1996 годзе. Пры супрацоўніцтве з Alexa Internet (даччынай кампаніяй Amazon, якая займаецца вэб-індэксаваннем) «Архіў» ініцыяваў стварэнне і захоўванне дзід існых сайтаў для развіцця «ўніверсальнага доступу да ведаў». Арганізацыя падавала бясплатны публічны доступ да аблічбаваных матэрыялаў, такім як вэб-старонкі, кнігі, аўдыёзапісы, уключаючы жывыя канцэрты, відэа, выявы і праграмнае забеспячэнне. На 2021 год штаб-кватэра «Архіва Інтэрнэту» знаходзіцца ў Сан-Францыска, у будынку былой хрысціянскай царквы, размешчанай у раёне Рычманд. Журналіст мясцовай радыёстанцыі Kawl у 2019 годзе параўноўваў офіс «Архіва» з рымскім храмам[6][7][8]. Арганізацыя ставіць перад сабой мэта выратаваць інтэрнэт ад знікнення[9].
"Wayback Machine" стаў самым вядомым праектам «Архіва». Анлайн-сэрвіс быў названы ў гонар машыны часу з мультсерыяла 1960-х гадоў «Шоу Рокі і Булвінкля». Ён падае доступ да лічбавай калекцыі з больш за 550 млрд вэб-старонак[4][10][11]. Праект Wayback Machine быў задуманы як рашэнне праблемы памылкі 404, якая азначае, што сервер не можа знайсці даныя па запытаным адрасе. Гэта звязана з так званым выміраннем спасылак — нарастаючай недаступнасцю некалі апублікаваных даных. Так, у 1997 годзе сярэдняя працягласць жыцця вэб-старонкі складала 44 дня. У 2003 годзе гэты паказчык склаў 100 дзён.
Праведзены ў 2008 годзе аналіз спасылак на 2700 лічбавых рэсурсаў, большасць з якіх не мае друкаваных аналагаў, паказаў, што каля 8 працэнтаў спасылак пераставалі працаваць праз год. Да 2011 года, па сканчэнні трох гадоў, 30 працэнтаў спасылак у калекцыі былі непрацуючымі[12]. Дзякуючы інтэграцыі з Alexa, які сутыкнуўся з паведамленнем пра памылку карыстальнік мог атрымаць доступ да заархіваванай версіі старонкі праз укаранёную ў браўзер панэль інструментаў. Калі копія недаступнай старонкі прысутнічала ў базе даных Wayback Machine, то загаралася спецыяльная кнопка. Пры гэтым карыстальнікі маглі падаць браўзеру дазвол на прагляд і рэгістрацыю актыўнасці — у такім разе ўсе наведвальныя сайты архіваваліся на партале[13].
Wayback Machine быў запушчаны ў маі 1996 года, аднак стаў даступным для грамадскасці толькі ў 2001 г. — да гэтага ўся запісаная на лічбавых магнітных стужках інфармацыя была адкрыта толькі для абмежаванай колькасці навукоўцаў і даследчыкаў[14]. Да моманту «адкрыцця» архіў утрымліваў больш 10 млрд заархіваваных старонак[4]. Да снежня 2014 года кіраўніцтва Wayback Machine паведаміла, што захавала 435 млрд вэб-старонак па ўсім свеце[2]. З тэхнічнага пункта гледжання праграмнае забеспячэнне Wayback Machine не з'яўляецца архівам, а хутчэй агульнадаступным інтэрфейсам да абмежаванага падмноства ўсіх сховішчаў[15]. Так, Wayback Machine нельга лічыць пошукавай сістэмай калекцыі арганізацыі, з прычыны таго, што яна не ажыццяўляе пошук па базе даных іншай буйной віртуальнай бібліятэкі — Open Library, якая дазваляе карыстальнікам бясплатна атрымліваць доступ да лічбавых копій кніг, якія загружаюцца і архівуюцца ў рамках праекта[16][17].
Характарыстыка
З запускам "Wayback Machine" «Архіў Інтэрнэту» стаў адным з самых папулярных і вядомых анлайн-парталаў і галоўным сэрвісам вэб-архіваванні[4][9].
У 1999 годзе «Архіў» пачаў пашыраць калекцыю за межы архіўнага вэб-кантэнту, каб забяспечыць статус як да аблічбаваных, так і першапачаткова лічбавых рэсурсаў, у тым ліку кнігам, аўдыё, фільмам, выявам, дакументам, праграмнаму забеспячэнню і відэагульням[7]. Некаторыя сканіраванні выконваюцца пошукавымі робатамі самага архіва, а іншыя — партнёрскімі арганізацыямі. Асобныя базы даных могуць набывацца за кошт ахвяраванняў карыстальнікаў і мэтавых набыццяў[17]. Самі стваральнікі арганізацыі параўноўвалі сваю калекцыю з Александрыйскай бібліятэкай[7].
На 2021 год Wayback Machine змяшаў звыш 424 млрд вэб-старонак[15] — больш, чым дакументаў у Бібліятэцы Кангрэса[18][7][17].
- ↑ Overview (англ.). alexa.com. Архівавана з першакрыніцы 18 мая 2020. Праверана 8 снежня 2021.
- ↑ а б Arora 2015. Памылка шаблона sfn: няма якара: CITEREFArora2015 (даведка)
- ↑ Lerner 2017, pp. 1741–1755. Памылка шаблона sfn: няма якара: CITEREFLerner2017 (даведка)
- ↑ а б в г Michael Bryant. What is the Wayback Machine and Why is it Useful? (англ.). Groovy Post (22 красавіка 2021). Архівавана з першакрыніцы 18 мая 2021. Праверана 29 мая 2021.
- ↑ Wayback Machine (англ.). Wayback Machine. Праверана 7 чэрвеня 2021.
- ↑ Dominic Cummings: how the internet knows when you’ve updated your blog (англ.). The Conversation (28 мая 2020). Архівавана з першакрыніцы 25 ліпеня 2021. Праверана 3 чэрвеня 2021.
- ↑ а б в г Odgen 2017. Памылка шаблона sfn: няма якара: CITEREFOdgen2017 (даведка)
- ↑ In An Old Church, The Internet Archive Stores Our Digital History (англ.). Kalw. San Francisco local public radio (11 верасня 2019). Архівавана з першакрыніцы 6 мая 2021. Праверана 3 чэрвеня 2021.
- ↑ а б Price 2011. Памылка шаблона sfn: няма якара: CITEREFPrice2011 (даведка)
- ↑ Jack Schofield. The Time Machine (англ.). The Guardian (19 лістапада 2007). Архівавана з першакрыніцы 19 красавіка 2021. Праверана 1 чэрвеня 2021.
- ↑ Jenni McKinnon. Using the Wayback Machine to Archive (and Backup) WordPress (англ.). WPMudev (25 мая 2017). Архівавана з першакрыніцы 13 красавіка 2021. Праверана 29 мая 2021.
- ↑ Adrienne LaFrance. Raiders of the Lost Web (англ.). The Atlantic (14 кастрычніка 2015). Архівавана з першакрыніцы 7 мая 2017. Праверана 7 чэрвеня 2021.
- ↑ Rogers 2017, pp. 160–172. Памылка шаблона sfn: няма якара: CITEREFRogers2017 (даведка)
- ↑ Hartelius 2020, p. 378. Памылка шаблона sfn: няма якара: CITEREFHartelius2020 (даведка)
- ↑ а б Bowyer 2021, pp. 43–57. Памылка шаблона sfn: няма якара: CITEREFBowyer2021 (даведка)
- ↑ Aja Romano. A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard (англ.). Vox (23 студзеня 2020). Архівавана з першакрыніцы 18 жніўня 2021. Праверана 29 мая 2021.
- ↑ а б в Kalev Leetaru. The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web (англ.). Forbes (18 студзеня 2016). Архівавана з першакрыніцы 15 жніўня 2021. Праверана 5 чэрвеня 2021.
- ↑ O'Connor 2008, p. 64. Памылка шаблона sfn: няма якара: CITEREFO'Connor2008 (даведка)