GitHub 启动代码永久保存计划,为人类文明留“火种”?

一句话新闻

GitHub 宣布,为了把开源软件留给子孙后代,将在 2020 年 2 月 2 日为所有公共存储库生成快照,保存在北极一个地下 250 米的废弃煤矿,快照储存在胶片上,寿命高达 1000 年。

* 视频为 GitHub 现场发布的项目介绍短片


2019 年 11月 13-14 日,GitHub 举办了年度开发者大会 GitHub Universe 2019。

今年的 GitHub 大会,除了在会前发布的年度报告(点击蓝字回顾:GitHub 年度报告解读),还公布了一个 GitHub 的 App 版本,让广大开发者喜大普奔。

但最让我感兴趣的,是他们在峰会现场发布的 —— GitHub Archive Program  代码永久保存计划。

在会上,GitHub 官方说明了这个计划启动的原因:

世界由开源软件提供动力。它是现代文明的隐藏基石,也是全人类的共同遗产。GitHub Archive Program 的任务是为后代保留开源软件。

我们还打算将 GitHub Archive Program 用作证明开源社区重要性的证明。我们希望它现在和将来都将进一步宣传全球开源运动。促进在全球范围内广泛采用开源和开放数据政策;并鼓励长期思考。

这个项目由 GitHub 和很多顶级的机构、企业合作,计划通过多种形式并行的存储形式,能够长期保存世界上的开源软件和项目,至少上千年。


一、启动多形式存储计划的原因

GitHub 启动代码永久保存计划,为人类文明留“火种”?

名词解析:步调分层

步调分层在整个系统中提供了多级的校正,稳定反馈。正是在这些层次之间的矛盾中,文明才找到最可靠的健康。我建议在一个健壮且适应性强的文明中,六个重要的步调和规模。

这个项目将采用「步调分层」策略来归档代码,通过提供从实时到长期存储的一系列存储解决方案,该方法旨在最大程度地提高灵活性和耐用性。

存档程序分为三层:热,热和冷。

– 热:接近实时更新

– 暖:每月至每年更新

– 寒冷:每5年以上更新

以下各存储方案按由热到冷的顺序排列:

1. GitHub

每次访问 GitHub 时,GitHub 都会将 Git 数据复制到世界各地的多个数据中心。此外,在 Git 的多个位置存储 Git 数据、问题、拉取请求以及进行所有的数据备份,这些都可通过 GitHub API 实时获得。

2. GH 种子文件(GHTORRENT)

GHTorrent 监视 GitHub 公共项目的时间线,并归档这些事件,递归爬取和归档它们的内容和依赖性。这些存档将在每天或每月供下载。

3. GH 档案(GH ARCHIVE)

GH 档案监视 GitHub 公共事件时间轴,将这些事件归档,并使用 BigQuery 使它们可查询。开发者可以按小时、天或月下载快照。

4. 互联网档案馆(INTERNET ARCHIVE)

互联网档案馆将抓取 GitHub 的公共资料库(包括新的资料库、问题、拉取请求、Wiki 等),并将副本存储在旧金山和其他位置的硬盘上,这些档案将通过 git 和 https 公开提供。

5. 软件遗产基金会(Software Heritage Foundation)

软件遗产基金会将定期抓取 GitHub,并将其公共存储库添加到存档中,并向其提供公共 API 访问权限。

6. Bodleian 图书馆(BODLEIAN LIBRARY)

牛津大学的 Bodleian 图书馆将 GitHub 的 10,000 个最受关注和最依赖的存储库保留为 Piql 胶片格式,从而为 Arctic Code Vault 提供冗余。

7. 北极世界档案(ARCTIC WORLD ARCHIVE)

2020 年 2 月 2 日,GitHub 将捕获每个活动公共存储库的快照,并将其保存在 GitHub Arctic Code Vault 中。这些数据将存储在 3500 英尺的胶片卷轴上,该胶片卷轴由一家专门从事长期数据存储的挪威公司 Piql 提供并编码。薄膜技术依赖于聚酯上的卤化银。根据 ISO 的标准,这种介质的使用寿命为 500 年;模拟的老化测试表明,Piql 的胶片会使用两倍的时间。

8. 微软研究院的 SILICA 项目(PROJECT SILICA FROM MICROSOFT RESEARCH)

GitHub 存档计划与 Microsoft 的 Silica 合作,通过使用飞秒激光将所有活动的公共存储库写入石英玻璃片中,最终将其保存超过 10,000 年。

名词解析:飞秒激光

飞秒激光是指时域脉冲宽度在飞秒(毫微微秒,10的负15次方秒)量级的激光。可以用在聚合物加工、医学成像及外科医疗上。飞秒激光现已是目前21世纪最先进的眼科手术。激光视力矫正(LASIK)可以利用飞秒激光制作角膜瓣。除此之外,也可被应用在固态物理上,以此分析晶体结构,分析其衍射或者萤光光谱图。在基础科学研究领域,飞秒激光可用于超快现象的研究。


三、GitHub 北极代码库

GitHub 启动代码永久保存计划,为人类文明留“火种”?

GitHub 正在召集一个 GitHub Archive Program 咨询小组,其中包括人类学,考古学,历史学,语言学,档案科学,未来主义等方面的专家,以就应该在归档中包含哪些内容以及如何与继承者进行最佳沟通提供建议。

一千年是很长的时间。一千多年前尚未建成吴哥窟,大津巴布韦和马丘比丘等古代遗址。但是,我们可以考虑并计划在未来 1000 年内实现各种可能性。

该计划以我们今天拥有的最佳思路为基础,存档的简介将包括 QR 解码,文件格式,字符编码和其他关键元数据的技术指南,以便可以将原始数据转换回源代码,以供将来其他人使用。

该归档文件还将包括技术树-路线图和 Rosetta Stone,以供将来好奇的人继承该归档文件的数据。

关于存档及其使用方式的概述,“技术树”将作为软件开发和计算的快速入门手册,并与该存档的用户指南捆绑在一起。它将描述如何从原始数据向后处理到源代码,以及如何提取项目,目录,文件和数据格式。

受《长期文明手册》启发(并包括其内容),该档案还将包括应用开源的信息和指南,以及我们今天使用它的背景情况,以防将来读者需要从头开始重建技术。

在人类拥有可以运行的现代计算机但没有可在其上运行的软件的未来范围内,档案及其技术树可能会非常有价值。但是,该价值很有可能是历史性的,也许可以确保今天的技术不会因一个漫不经心地认为无关紧要的明天而丧失,直到发现我们的软件被意外使用。

项目官网:https://archiveprogram.github.com/


代码恒久远,一行永流传。

地球有 46 亿年的历史,我们应该不是出现在这个星球上的第一代智慧生物,那么问题来了:上一代「地球人」的痕迹在哪里们的文化和文明是什么/strong>

这些我们暂时都不得而知,但希望我们的历史和文化,在千万年之后能被下一代「地球接班人」发现,估计挺有意思的~

新福利:

从11月01日开始至12月06日截止,一共五周时间,每周五我会从公众号底部留言+转发+在看综合最多的读者中抽取一名读者,免费包邮送实体新书《Flink入门与实战》,留言互动起来吧~

上周获奖名单:布拉没有格

GitHub 启动代码永久保存计划,为人类文明留“火种”?

GitHub 启动代码永久保存计划,为人类文明留“火种”?

过往记忆大数据微信群,请添加微信:fangzhen0219,备注【进群】

来源:过往记忆

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2019年10月14日
下一篇 2019年10月15日

相关推荐