跳转到内容

草稿:Archive Team

维基百科,自由的百科全书

Archive Team是一个致力于数字保存和网络存档的团队,由Jason Scott于 2009 年创立。

其目標是复制和保存高风险在线服务所存储的内容。它部分和完整保存一些特定網站,包括:GeoCities雅虎视频Google视频Friendster 、 FortuneCity 、 [a] TwitPicSoundCloud 、 和「纪念Aaron Swartz JSTOR公有论文解放器」。 Archive Team还定期对URL 缩短服务和wiki进行存档。

Jason Scott表示,“Archive Team 的成立源于愤怒和无力感,这种感觉让我们让公司为我们决定什么可以生存,什么可以消亡。” Scott 继续说道,“我们的工作不是弄清楚什么是有价值的,什么是有意义的。我们依靠三种美德工作:愤怒、偏执盗窃癖。”

档案团队由独立贡献者/用户组成的松散社区组成。[需要引用]他们的归档过程利用了虚拟机环境“Warrior”。个人可以在桌面环境中使用 Warrior 下载内容,而无需技术专业知识。任务由集中管理的跟踪器分配,该跟踪器与战士联网并向战士分配物品。该追踪器还监控用户上传活动并显示排行榜。

项目

[编辑]

目前有多個项目正在运行:

  • 图片提供商 Imgur 在 2023 年 4 月 19 日更新了他们的服务条款。 这次更新的重点是删除老旧的、未使用的和不活躍的内容,这些内容不绑定到用户帐户,同时删除 NSFW 内容。
  • Blogger: 2023 年 5 月,Google 宣布从 2023-12-01 开始,包括 Blogger 博客在内的所有非活动账户都将被删除。
  • Reddit: 2023 年 6 月 19 日,禁止为 Reddit 公司带来负面公关的社区,限制访问 API 和数据。
  • 俄罗斯入侵乌克兰: 在俄罗斯政府入侵后归档各种美国文化遗址。
  • 电报: 在各种有新闻价值和 / 或其他值得注意的电报频道中存档公共信息。
  • GitHub: 2018 年被微软收购时,许多档案管理员和用户担心该网站会变得更加严格。 该项目对 GitHub 的 UI 部分和每个存储库的代码进行归档。
  • MediaFire: 在 2020 年 12 月 18 日,用户报告说他们开始收到 MediaFire 的电子邮件,从一月份开始,他们计划如何将不符合特定标准的账户归类为弃用账户。
  • 冠状病毒爆发: 记录和保存数据、事件和 2019 冠状病毒疾病对社会的影响。
  • YouTube: 保存元数据、缩略图、评论和精选视频。 视频和频道仅限于: 因公司破产而可能被删除的频道,频道所有者死亡,YouTube 禁止某些内容,以及与世界事件和政治有关的频道。
  • Wikiteam: 保存 wiki xml 转储。
  • Urlteam: 保存 URL 缩短程序。
  • URL: 从各种来源归档 URL。

截至2024年12月12日 (2024-12-12), ArchiveTeam所做的最大项目是URLs, 保存了超過10PB數據。[b]
引用错误:页面中存在<ref group="lower-alpha">标签或{{efn}}模板,但没有找到相应的<references group="lower-alpha" />标签或{{notelist}}模板