地质数据中有隐藏的模式,可以揭示新的矿物和未发现的地球事件。

 

 Abellaite(NaPb2(CO3)2(OH))是哈森(Hazen)团队在去年发表的一篇论文中预测的一种矿物,最近在西班牙东北部的一个矿上被发现。

 

上周三,矿物学家罗伯特·哈森 (Robert Hazen)打开一封电子邮件,得知他又一次是对的。在一个中国的钴矿墙壁上,一位同事发现了微小的黑色晶体,结果是一种以前从未在自然界中发现过的氧化钴,它钴原子与氧原子的比例为3:4。哈森(Hazen) 的团队曾预测,它将使用“大数据”统计方法,这一方法在其他领域很常见,不仅仅只应用于矿物的发现。

 

 矿物是一种具有独特晶体结构的化学化合物,在地球或太空中自然形成,而不是由生物体的身体创造的。超过5200种矿物被命名和描述,哈森(Hazen)和他的同事估计至少还有1500种矿物未被发现。在过去几年发表的一系列论文中,研究小组对失踪矿物的类型和哪里可以发现他们做了详细的预测。一些矿物已经被发现,包括新的氧化钴。

 

 研究人员的最新论文发表在当天的《美国矿物学家》杂志上,通过结合网络分析,增加了一个视觉扭曲,这是一种以前用于绘制疾病传播模式和Facebook朋友网络的技术。哈森(Hazen)说,这些可视化技术揭示了以前隐藏的关系和现象。

 

 “这太神奇了——可视化这个世界的整个技术有着丰富的方式,在这里你可以立即看到你从未见过的模式,”哈森(Hazen)说,他是卡内基科学研究所(Carnegie Institution for Science)的一个研究员,也是华盛顿特区深碳观测站(Deep Carbon Observatory)的执行理事。

 

 例如,根据这项新的研究,在过去7000万年中形成的几种稀有含铜矿物与我们地球早期形成的矿物有着显著的不同,在生活的大气层充满氧气之前。根据一份对埃迪卡拉纪化石未发表的分析,研究人员甚至声称发现了5.4亿多年前发生的一次未知大规模灭绝的证据。

 

大数据显示出什么消失了

 

 直到最近,“大数据”方法才可能实现。亚利桑那大学(University of Arizon)的一个研究小组在过去的几年时间里梳理了描述矿物结构和性质的许多出版物,并将他们的发现整合到一个称为Ruff项目的数据库中。自2001年以来,一个名为哈德逊矿物学研究所(Hudson Institution of Mineralogy )的非盈利组织一直在收集人们在哪里可以发现特定矿物的数据。据华盛顿卡内基科学研究所(Carnegie Institution for Science)的矿物学家、新网络分析研究报告的第一作者肖娜·莫里森(Shaunna Morrison)称,其MINDAT.org数据库现在已经有大约100万个矿物位置对。

 

 为了做出预测,莫里森(Morrison)、哈森(Hazen)和他们的同事使用Ruff和Mindat数据库将已知矿物与仅偶尔采集的稀有矿物进行比较。哈森(Hazen)说,通过这种方式,他们可以计算出研究人员和收集者将来在某一特定地点或类别中发现新矿物的可能性。

 

 莫里森(Morrison)说:例如,火成矿物——那些由地球深处融化的岩石而形成的矿物——都比较常见,而且研究得很好,所以我们全部找到他们的机会很好。但在66种含钴矿物中,只有22种在一两个地方被发现。研究小组预测,至少有15种钴矿物仍未被发现。

 

 一些预测的矿物,包括刚刚在中国发现的氧化钴晶体,是以前在实验室合成的化合物,所以探矿者确切地知道他们在寻找什么。但是,哈森说,其他矿物对科学来说将是全新的。

 

 “我们可以预测有一种新的铜矿物,或者有一种新的钴矿物。哈森(Hazen)说:“从统计上看,它必须存在。但在很多情况下,我们不知道它是什么样子。”

 

 

12ec28ab478c4d5795b625313a0f97bf.jpg

 

 图中的彩色圆圈代表不同类型的含铜矿物,每种颜色代表一个化学相关的团和线,将发现的矿物连接在一起。图中这些团的聚集方式可能有助于研究人员发现新的铜矿物。 凯克DTDI项目(Keck DTDI Project)

 

地球内外的矿物网络

 

 社交网络通常用点来表示人,用线来表示人与人之间的关系。类似的图表已经被用来研究从大脑到地球气候在内的所有事物,并用复杂的数学技术创建和分析可视化。2016年6月7日,在纽约特洛伊(Troy)伦斯勒理工学院(Rensselaer Polytechnic Institute)的数据可视化研讨会上,哈森(Hazen)和他的同事开始将这些方法应用于矿物。

 

 哈森(Hazen)说:“数据科学家告诉我们他们使用的一些技术。并且这些技术让我们很震惊:’哇,我们可以用矿物质来做这件事。’”

 

 在矿物网络中,每个点都是一种矿物类型,而线条通常是连接一起被发现的矿物类型。哈森(Hazen)、莫里森(Morrison)和他们的同事通过这种方式表示矿物质,可以把一张密集的数据表格变成一张图片,从中可以跳出模式。到目前为止,他们已经完成了火成岩、铬矿物和铜矿物的网络分析。哈森(Hazen)说,他们正在继续添加新的矿物群和新类型的网络图,有“比我们的编码人员编写代码的速度更快”想法的到来。

 

 其应用范围从实用的到宇宙。例如,哈森(Hazen)正与美国地质调查局合作,寻找有价值的矿床。与此同时,莫里森(Morrison)正在绘制陨石和月球岩石中矿物的图表,发现它们与地球上形成的矿物网络不太相似。她怀疑这些差异与地球上繁茂的生物外壳有关。

 

 她说:“到目前为止,我们观察到的是火星和月球的网络与我们在地球上观察到得网络有很大的不同,所以我们认为我们可以将其应用于观察其他星球。”

 

更多可以发现的

 

 盐湖城犹他大学(University of Utah in Salt Lake City)可视化设计实验室(Visualization Design Lab)的计算机科学家亚历克斯·莱克斯(Alex. Lex)说,新研究中使用的技术已经证明了它们在其他领域的价值,他没有参与该项目。他将哈森(Hazen)和莫里森(Morrison)的最新研究成果视为一种日益增长趋势的一部分,越来越多的科学界人士发现图像数据视为了网络的价值。

 

 哈森(Hazen)和莫里森(Morrison)的技术将免费为任何人使用,哈森(Hazen)希望他们将被其他矿物研究人员采用。但是对于像安东尼·坎普夫(Anthony Kampf)这样的矿物学老兵来说,这些技术仍然是不熟悉的,他是加利福尼亚州洛杉矶国家自然历史博物馆的矿物科学名誉馆长。坎普夫(Kampf)在其职业生涯中已经命名和描述了大约200种矿物。他说,他觉得他个人不需要统计预测,因为他的业余爱好者团队已经给他寄来了比他能跟上技术的更多新矿物标本。

 

 尽管如此,坎普夫(Kampf)仍能看到哈森(Hazen)、莫里森(Morrison)和他们的同事正在做的事情的潜力。他在一封电子邮件中写道:“这篇论文似乎是一个雄心勃勃、富有洞察力的方法来广泛理解矿物系统。”,“看到一种新的看待隐藏关系的方式总是令人兴奋。”

 

 发现矿物的范围可能很大。事实上,坎普夫(Kampf)怀疑宇宙中蕴藏的矿物远远超过了迄今为止预测的1500种。据他估计,“我们永远也找不到他们全部。”