英国漏记16000个新冠病例 这锅可能得微软背(组图)

自从新冠疫情以来,各种「 人类迷惑行为 」层出不穷。比如,为了驱逐新冠,美国牧师跑去电视上 “ 跳大神 ”,祈祷完还夸海口说美国已经恢复了原样 ↓ ↓

后来的事情,大家应该都知道了,反正,前阵子美国总统 “ 特靠谱 ” 先生都染上了新冠。。。

有人宣布牛粪是灵丹妙药,只要在牛粪 + 牛尿中洗澡就可以远离新冠病毒。

当然,最骚的还是特朗普,宣扬喝消毒水能抵抗新冠病毒只是他的基本操作,前阵子他还称不相信感染新冠的自己有传染性。。

总之,没有人能比他更懂新冠。

而最近,令人苦笑不得的迷惑行为又多了一例。

在国外疫情形势严峻的当下,英国因为技术问题,漏统计了近 1 万 6 千的新冠病例,因为没统计上,所以也没有去追踪这些病例及跟他们有过接触的人。

来自 BBC 的报道~▼

正当世超为英国捏了一把冷汗时,发现了更令人迷惑的地方,这个所谓的技术故障,因为他们的 Excel “ 爆炸 ” 了。

事情是这样的。。。

英国的新冠检测由第三方机构操作,第三方把每日检测结果提交给 PHE( 英国公关健康部门 ),PHE 把数据汇总到 Excel 模板中,再上传到中央系统。

流程本身并没有啥问题,问题出在 PHE 的开发人员选择了 xls 文件格式来执行这个操作。

咦?xls 不就是 Excel 的文件格式么?能有啥问题么?

看图 ~

xls 跟 xlsx 都是 Excel 文件的常见格式,但 xls 是 93-2003 年老版本生成的格式,而 xlsx 是 2007 年后的生成格式。

除了新旧版本的区别,这哥们还有很多不一样的地方,比如表格行数上限不一样。

xlsx 的行数上限是 104 万多行。

而 xls 的行数上限只有 6 万多行。

( 世超牌小贴士:打开 Excel,按 ctrl + ↓( 向下方向键 )就能查看行数上限。 )

在每个测试案例的数据会占用多行的情况下,xls 模板最多只能容纳几千个案例。

这是什么概念呢?让我们来看下 12 号的英国疫情数据。。。

这样一来,xls 当然不够用了。。。

尽管 PHE 已经在寻找更好的替代方案,但是这一波实打实是吃了一波亏,而 Excel 也在不经意间背上了锅。

不过这也不是 Excel 第一次背锅了,再带大家看一件这哥们搞出来的闹剧。

通常来说,每个基因会有一个正式的名称和缩写,比如有个叫做 Membrane Associated Ring-CH Type Finger 1 的基因,它的简称是 MARCH1。

如果咱们在 Excel 里输入这个词汇的话,奇妙的事情就会发生 ↓ ↓

简单来说,MARCH 是三月的英文,而月份再加上数字的组合会被 Excel 会智能识别为日期。

世超尝试了一下,发现这玩意真的有点东西。

如果数字小的话,比如 march20,他会识别为 2020/03/20,如果数字大的话,超出了每个月日期上限,比如 march55,他还会帮你改成年份!

march55 被识别成了 1995/03/01▼

普通人可能会觉得这玩意还挺方便的,但是科研人员心态直接就崩了,我特么输入一个基因名称,你给我改成日期干啥啊!!

不仅仅是输入会带来这样的操作,如果你把数据导出成 txt 或者 csv 文件,然后再用 Excel 去打开这份文件时,也会遭遇这样的自动转换,然后这时你还不知道转换前是什么东西。。。

而这种智能操作无法被永久性停用。

根据《 华尔街邮报 》的报道,在顶级科学期刊中有五分之一的遗传学论文包含类似的错误。

HGNC ( 基因命名委员会 )直接被逼得把人类的基因名称都给改了。。。

Excel 到底有多坑,大家自己感受下。。。

当然,这些都算是特殊情况,大部分时候 Excel 还是挺好用的。

除了可以轻松做一些简单的数据统计、分析,还可以运用 Excel 自带的模板统计每月的收入和支出、做甘特图等等。

还可以做每日规划。。。

这些都是基本操作了,闲的时候,还可以用 Excel 做个俄罗斯方块来玩玩 ~

下面这个是比较简陋的版本,大致操作途径是调出 Excel 里面的开发工具,然后通过 Visual Basic 编写代码完成。

要是对自己比较自信,还可以学一波大神的操作,用 Excel 重制一个文明 1 。。。

或者用 Excel 来画个画 ~

日本的堀内辰男,60 岁退休以后感觉比较悠闲,就在家开始用 Excel 创作画作了。

带大家来欣赏一下他的画作。

是不是完全看不出来这是用 Excel 做的?

在世超看来,大部分时候 Excel 还是挺好用的,如果它能够再成熟一点,能够自己处理数据就更好了 ~

推荐阅读