会员登录 登录     |    

当前位置:首页 > 谢长生:探索中国独立自主发展的冷存储道路


扫描二维码,分享此文章

谢长生:探索中国独立自主发展的冷存储道路

供稿: | 2020-09-27

      “2020中国500强企业高峰论坛专题活动”,“第四届信息安全产业发展论坛-聚焦数字基建 构建新一代数据灾备中心”于2020年9月27日至28日在河南省郑州市举办。本届大会由中国企业联合会、工业和信息化科技成果转化联盟、 中关村中企慧联先进制造产业技术联盟、广东紫晶信息存储技术股份有限公司联合主办。本次论坛聚焦未来大数据技术深入应用带来的数据存储的挑战,邀请相关领域的代表共同探讨,将实际需求、技术发展、以及行业前瞻充分结合,为我国数据灾备中心产业的发展探索方向,让大数据的价值得到充分挖掘和释放。

      华中科技大学武汉光电国家研究中心教授谢长生出席“第四届信息安全产业发展论坛”并演讲。

      以下为演讲实录:

      谢长生:刚才两位领导和倪院士从国家战略高度和一个很宏观视角讲了他们关于信息技术的观点。我这里主要集中在一个比较具体的,可以在中国能够很好发展的,甚至有可能在世界走在前列的技术做一个介绍。

      我这个题目叫做新基建新决策数据中心中的光存储,因为光存储目前经过我们产业界和学术界的努力,现在已经成为一个能够进入数据中心的新产品,未来根据我们的研究它应该在现在冷数据存储上有更大空间,所以我把我们研究的一些新的进展跟大家做一个汇报。

      数据中心,刚才倪院士讲是新基建一个非常重要的内容,现在云计算越来越多成为信息服务的新模式,所以现在有公有云,像阿里云、工业云等等都越来越大,还有各个行业的私有云的发展也方兴未艾,所以各种规模的数据中心是云计算的基础设施也是新基建的重要内容。

      现在现在这么多手机和终端产生的数据,还有物联网产生的数据会急剧增长,这是一个数据增长图,我们到2025年会达到175ZB,这么大的量当中冷数据占到80%以上,那我们看一下到底什么是冷数据?大家都用微信,大家每天上载的微信照片腾讯公司统计每天上传有12亿张,一上传上去平均每一张会有十个人点赞,这样的访问量就是百亿,这是热数据。第二天迅速变冷,一周以后访问量会更少,你说一个月之后你这个访问量极少,这就是冷数据。

      所以热数据、温数据、热数据,冷数据占80%以上,每天12亿张每天日积月累每天需要的容量太大了。冷数据实际上有很多很多种类,比如说互联网冷数据,生活冷数据、健康冷数据,这些和人有关的数据保存的时间至少要和人的寿命相当,80年的保存时间是一个合理的要求,所以我们现在还有档案冷数据、科研冷数据,这样我们冷数据存储到底提出了什么挑战呢?我们看两个词,一个叫Big Data,这个是热词,还有一个词叫Lang Data这是一个冷词,冷数据提出一个什么挑战呢?一个是大的挑战,一个是长的挑战,长的挑战就是要保存几十年、几百年,有的还要永久保存。还有一个问题就是成本的挑战,现在数据的集聚生长是成本压力的逐渐增大,现在很多互联网公司找我们谈,现在冷数据越来越多,按照我们现在用硬盘的方式成本已经不可忍受了,所以这个成本挑战表现介质成本、环境成本、更换成本等等,现在云服务商明显开始感到冷数据成本压力比较大了。

      现在的冷数据有两类,有一类是访问程度低,但是保存时间要求不长,还有一种是访问频度低但需要长期保存的数据,比如说归档数据、灾备数据等等。我们对冷数据而言,长寿命是它更严峻的挑战,为什么呢?因为硬盘的寿命平均只有五年,磁带有十年,光盘目前取决于你用什么光盘,有的可以保存几十年,还有一个玻璃光盘可以永久保存。那

      我去年参加一个研讨会,就是数字资源长期保存研讨会,数字资源保存对国家非常重要,我们还成立了国家数字资源长期保存体系工作组,叫NDPP,工作我觉得非常到位,就是从法律法规、管理制度、技术体系全面考虑,而且现在正在规划建设国家的文献战略储备库,投入巨大,但是他们觉得技术上还是有问题,现有的技术问题维持费用,所以希望有技术支撑。

      其实人类宝贵财富是需要长久保存的,比如说好莱坞电影胶片,磁带库、图书馆,所以这样需要用好的手段,比如说国家基因库提出一个一个词就是“超存”,就是既超大又超长,每人基因数据100GB,100万人需要100PB,这样存储下去容量非常大,而且如果要研究几代人基因的话最好有几百年的信息存储,这对存储技术提出非常高的挑战。

      互联网之父说如果我们不注意现在的数据保存,就进入一个数字黑暗时代,未来的人们可能就不知道21世纪的历史记录了,所以世界网络协会开展一个调查就是如何保存信息100年,最后反馈回来的信息是很多行业都有需要。而且美国制定了一系列法律法规,就是规定你必须要保存数据多少年做了强制性规定。

      我们现在就谈谈冷数据目前到底有哪几种方案?分别就是硬盘、磁带、光存储,我们看一下这几种的总体成本有巨大区别。这是国外一个分析,就是说75年一个保存周期,如果你用硬盘五年要换一次,这样的成本是极具增高。磁带是十年换一次,光盘是50年换一次,所以这个成本是有巨大区别的。现在的互联网公司基本上还是用硬盘,硬盘压力承受不了的时候用更大容量的WD硬盘,但是我们觉得这个还有一些问题。磁带还是比较好的方案,但是它也有粘连的问题,两到三年要倒带,还有磨损的问题等等。冷数据现在出现一个新角色,就是光存储,光存储的寿命是最长的,现在是50年以上,而容量提升潜力最大,成本优势也大,这个在中国应该是开始于十年前的一个布局,十年前大家知道以前我们是听音乐、看碟子,是有光盘,后来网络发展起来以后这个就没落了,但是我们十年前在国际会议上提出光存储要战略转型,就是要发展光存储。第一个十年我们就用蓝光光盘做一个大的系统出来,这样相对容易一点,现在已完成,包括我们现在紫晶的也是在十年之内完成的产品,目前也已经上市了。后面的十年是更新的光存储,我们的信心在哪里呢?就是光存储还没有利用到多维度和超衍射极限,所以光存储在未来还有很大的提升空间。

      那么我们在第一阶段就是已经过去的十年,它是用蓝光光盘做,它的好处就是寿命长,能耗低,高可靠,但是它有两个缺点,就是光盘容量小,那怎么办呢?我们就大规模往光盘库堆容量。第二个是速度慢,我们就采用磁光电融合,另外一个是高度并行,几十个光驱同时刻录,这样解决它小和慢的问题,所以这样经过十年的努力,包括我们和紫晶合作做了光盘库是世界上容量最大的,应该说自主的不比日本差。

      我们最近两年又开发了更低成本的,就是使它入门成本也低了很多。下面我就稍微介绍一下我们正在研究的三种未来的存储技术,一个是全息存储,这个离实用化最近。然后是五维玻璃永久存储,还有双光束超衍射存储。我们首先看全息存储,实际上是用两束光双轴全息存储,我们这个技术比日本还更先进一些,这些技术细节我就不仔细讲了,我只是介绍一下。第二个技术是突破衍射极限技术,这个是得了诺贝尔奖的,是用两束光,一束把它打开,还有一束把它演变,这样在中间那个地方形成一个洞,最后出来的可以把它缩小,这个缩小以后存储容量一下子可以上去很多,这个技术以前是用到超分辨成像,现在用到超分辨存储。现在我们这个已经做出来的结果是可以达到600纳米,现在大概可以做到50、60个纳米。另外第三种技术就是在玻璃上用多维技术进行存储,这个刚开始做的时候是英国南开普敦大学做出来的技术,现在这个发明人已经回国了,微软看重了这个技术,就跟英国合作,他们现在就把好莱坞的电影存到他们一个玻璃上永久保存,这个当时都是很大的新闻,就是说这是世界上保存时间最长的技术。最近他回国以后我们一起做了一些工作,就是用深度学习提升读取速度和降低原始误码率,还有就是把5D变成6D,并且要向7D进军,这样数字容量可以进一步提高,所以这些都在实验室已经取得很好的进展。

      目前中国在光盘库设计理论和核心技术方面应该是领先的,因为大家可以看到国际上对我们这些研究还是非常承认的,而且我们发表的文章是国际上首次关于光盘库的文章,另外我们现在是集中了最强的力量。我们对三种冷存储方案形势进行了评述,硬盘可以发展应用,但是政治因素不确定性很大,如果哪天美国说不卖硬盘给我们了,那数据中心会遇到很大困难。磁带机和带库完全由美国控制,但是光存储中国多家企业已经完全掌握了光盘库的技术,而300G以下的光盘和光驱已经可以国产,但是2500G的还是日本控制,但是我们能看到的信心是在下一代就是更新的光盘基础上,我们的研究其实是比日本更多的,可以跨越蓝光,所以以后大容量的光盘库已经有了,再加上新一代光盘,把这两个一结合,那很可能有希望成为中国领先的方案。

      最后说几句话,就是冷数据存储在当前和未来都是十分重要的技术,随着时间的演进人们将越来越认识到它的重要性,就是越往后越认识到它的重要性,而光存储是数据中心冷数据存储的新角色,适合于中国独立自主发展的冷存储道路,而且应该是未来最有优势的数据存储技术,中国有希望在这个领域取得领先,而且发展成新的大产业。

      谢谢大家!