作者 | 张雅婷
在数据资源有限的年代,被历史所记住的往往只是少数的成功者,大部分人都泯灭在时光的尘埃中。
而现在,随着互联网和数据存储技术的高速发展,普通人也能发光发热。在华为OceanStor存储与张朝阳联合拍摄的影片《我们的时代》中,有人认为属于“精英权贵”的时代过去了,他们的成就不再是传奇,越来越多普通人的故事被记录、传播,乃至被歌颂。
作为中国互联网之父,张朝阳也是社会精英的代表,他并没有因为这种变化而沮丧。在《我们的时代》中,他对着镜头诚恳地说道:“时代从来不该只记住少数人。”
在这个不再被少数人定义的世界,推动“记录”规则发生变化的,正是千千万万的程序员们。凭借强大的数据存储介质,程序员将用户与数据、App紧密相联。
凌晨5点起床开早餐店的阿姨、疫情期间奔赴一线的医生护士、北漂打工的外卖小哥,形形色色的人生在短视频、vlog、文字中迸发出强大的生命力和感染力。在数据存储技术高速发展的时代,所有人的故事都能被所有人看见。
记录“所有人”已成为现实
影片《我们的时代》展现了这样的场景,在这个时代,每一个人都能拥抱另一个人的生命,我们会因为陌生人的笑和泪而喜悦或难过,即使素昧平生。要做到记录“所有人”,数据存储、程序员的功劳可不小。
但有人会觉得影片中提到的数据存储的概念非常抽象,离大众很远,甚至在生活中连程序员也很少接触到,为什么是他们推动这个不被少数人定义的时代出现呢?
要回答这个问题,首先我们需要明白数据、数据存储到底是什么?
在计算机科学中,数据指的是“所有能输入计算机并被计算机程序处理的符号的介质的总称”。在数字化的时代,网站、App、文字、视频、色彩……一切信息背后都是一串串代码,都属于数据的一部分,与大众生活紧密相连。
在某互联网大厂的程序员杨一看来,数据在他的工作中就像空气一样,他告诉搜狐科技:“提及计算机,很多人会想到程序、编程语言、算法,但实际上隐匿在它们之下的全部是数据,而这些数据全部依赖于强大的存储介质。”
数据存储可以通俗地理解为通过例如磁盘、磁带、个人电脑、服务器等介质保存数据。对于个人来说,把图片存在手机里、把PPT拷进U盘里等行为都可以理解为数据存储。
需要注意的是,现代数据存储主要面向企业而不是个人,对于企业来说,由于数据量特别大,再加上安全性、成本等方面的考虑,基本上都会通过自建或者租用IDC机房进行数据存储,IDC机房里“黑乎乎的大块头”就是服务器。
(IDC机房,图片来源:网络)
推动“记录”规则发生演化,即从只记录少数人转变为记录所有人,主要是这些存储服务器的功劳,服务器超大的存储容量为记录“所有人”提供了物质条件。
具体来看,一张A4纸大约可以记录700字,而一个汉字占两个字节(信息量单位),一台20T的存储型服务器大约可以存1080000亿个字。一台存储型服务器相当于1500亿张纸。
没有数据存储,我们的数字生活将变成镜花水月。无论是银行App的工资余额,还是社交软件里的个人资料,无论是vlog里外卖小哥充实的工作经历,还是短视频里小姐姐的劲歌热舞,我们通过互联网接触到的一切信息都以字节的形式存储在服务器里。
程序员们则是打造人类数字生活的“工匠”,如果没有他们,我们就没有互联网,没有丰富多彩的互联网应用,没有现代数据存储的技术。拥有被记住权力的是少数精英权贵,只有少数人的故事才有资格被记载在稀有的甲骨、竹简、纸张里。
数据存储的“前世今生”
存储的核心是记录,追溯至远古时期,口口相传、洞穴壁画、结绳记事是人类记录的主要载体。
在造纸术发明之前,人们依靠龟甲、兽骨、竹简、木牍、帛等记录文字,但这些记录载体非常珍贵,往往只有权贵阶层才可以接触到。比如,商代统治阶层将卜辞刻在甲骨上用于测定吉凶、预测大事。
打孔卡和打孔纸带是最早的机械化信息存储形式。1725年,一位法国的纺织工人受到了自动风琴滚筒启发,发明了打孔卡,用纸上打孔的形式存储图案,控制纺织机进行图案织造。1890年,HermanHollerith发明打孔卡制表机,首次把数据转变成二进制信息,六年后还成立了制表机公司,这是IBM的前身。
(打孔纸带,图片来源:中科院软件研究所)
1928年,磁带的发明标志着磁性存储时代的开始,一开始主要是用于录音,直到23年之后,磁带才首次被用于计算机上存储数据。由于磁带存储支持离线保存、寿命长,容量大,性价比高,直到现在仍在使用,但其缺点是读写效率低。
世界上第一个硬盘驱动器出现在了IBM的RAMAC 305计算机中。随着半导体晶体管和集成电路技术的发展,1966年IBM Thomas J. Watson 研究中心发明了动态随机存取存储器(DRAM),显著提升随机访存的效率,至今,大部分PC和服务器的内存还是DRAM。
IBM于1973年发明了温氏硬盘,其特点是工作时磁头悬浮在高速转动的盘片上方,而不与盘片直接接触,取得了存储容量与读写效率的平衡,这便是现代硬盘的原型。硬盘比磁带使用更方便,这为之后PC普及奠定了基础。
1980年,富士雄为东芝工作时发明了闪存,基于它研发的U盘和SD卡是现今最常用的移动数据存储和交换介质。
在上个世纪,计算机的出现、普及,存储介质进一步发展,信息量呈现指数级爆炸的特征,数据的处理和传播速度也更高效快捷,作为第三次科技革命的一部分,数据科技的进步与社会发生的巨大变革有着直接的联系。
随着数据科技的继续演化,现代意义的数据存储,不再是仅仅指基于某种存储介质(比如电脑)提供数据读写能力,而是构建了一套数据中心的系统,包含多种硬件设备,并且大多基于云存储的方式对外提供服务。
因为不同的行业、企业对于数据存储的需求不同,现代数据存储产品呈现出多样化、差异化的特点。比如在华为存储产品中,有全闪存存储、混合闪存存储等等,全闪存存储的性能和延时相对于传统存储来说有大幅提升,更适用于高IO(读写)并发的应用场景。
追溯数据存储的历史,我们可以看到在工程师的努力下,数据存储介质的一步步演进,数据存储的容量提高、成本降低,数据科技的发展为社会生活变革、经济发展、产业升级提供动能。
数据科技代表"未来"
数字经济时代已然到来。前不久,中国信息通信研究院院长刘多表示,我国数字经济规模为5.2万亿美元,居全球第二位,增幅高达15.6%,领跑全球。数字经济的发展伴随着数据量的攀升,根据IDC预测,全球近90%的数据将在这几年内产生,预计到2025年,全球数据量将比2016年的16.1ZB增加十倍,达到163ZB。
而从IDC(数据中心)业务的发展可以看出企业、行业对数据存储的依赖性在进一步提高。据了解,2019全球IDC业务市场整体规模为 6903 亿元,同比增加 10.39%;我国 IDC 业务市场规模达到 1562.5 亿元,同比增长 27.2%,增速为全球增速的 3 倍左右。
在数字时代,企业需要直接接触数据存储,选择数据存储的方案,用以存储C端用户的数据。相较于个人,数据存储对企业、行业有着更加直接的作用。
对于企业来说,业务发展与数据存储直接挂钩。例如,金融行业的业务具有不间断性和实时响应的特点,比如深交所的主板、中小板和创业板等系统每天存储和处理数以亿计的数据。
如果不能保障快速读取、安全备份等数据存储的相关要求,金融行业的业务发展将会遭遇严重困难。2018年,澳大利亚最大的商业银行CBA曾遗失两个存储磁带,这导致1200万条客户交易数据丢失,难以寻回。
而如果选择合适的数据存储方案,则会助力业务的发展,提高企业运转效率。比如,之前汽车行业龙头比亚迪业务增长非常快速,工厂订单每季度增长10%,原传统HDD存储不能满足企业发展需求,月结期间ERP查询速度慢甚至会宕机。
当比亚迪使用华为OceanStor全闪存存储的方案后,存储系统时延不超过1ms,抽取数据的速度大幅缩短,系统整体效率提升5倍。这主要是因为当读取数据时,传统HDD存储要靠磁头移动,比较慢,全闪存靠电路传输,不存在机械作用,速度更快,非常适用于高吞吐、低延时的应用场景。
基于现代数据存储技术的进步,个人、企业、行业,乃至于整个社会的发展,都随之高歌猛进。正如影片《我们的时代》所提到的, “地理数据绘制山海,文化数据传承文明,通信数据链接世界……”
而5G时代即将来临,难以计量的各种数据将随之产生,数据存储的重要性毫无疑问也将进一步提高。一方面,社会发展带来的新需求“倒逼”数据科技的进步,另一方面,数据科技支撑并促进社会发展。
在数字经济时代,数据科技代表"未来",程序员们帮助我们触及未来。或许,这也是张朝阳当CEO二十余年,仍有程序员情节的原因。