【数字存储完全指南系列】 01:储存设备的诞生与历史(下)

奇巧淫技2年前 (2022)发布 知客
10,104 0 0
【福利】绝版流量卡19元/180G,免费领取!🛍️🎉专享福利!全网购物内部优惠卷领取平台!🎉
100T+网盘资源免费分享!点击此处免费下载!
【APP】🎉每日更新!安卓+电视TV优质VIP优化版软件,免费分享!🎉
【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图

本系列文章就是为了帮助你了解信息世界的储存(亦作存储,下同)设备而生,系列将分成过去、现在、未来三部分,用大约十几篇文章,15 万字左右的篇幅,让你了解信息储存设备的基本原理,知道那些复杂的参数都是啥,如何挑选购买适合自己的存储设备,又是如何更好地使用,更安全稳定地保存我们的数据,以及未来我们能够用上什么技术。【我想实现的最好的目标就是,把这个系列打造成中文区想要了解购买使用储存设备的朋友必看,而且能够毫无难度地理解并打开整个储存设备的新世界大门】。


(接上半部分)
▼ 磁带

相比起黑胶唱片机,磁带与中国人结下的不解之缘更加深,我们爸妈那会儿年轻的时候,买到最新的磁带,然后在房间里偷偷享受属于自己的小世界,或者和朋友一起讨论交换最新的歌曲磁带,怕是普通人最潮最常见的娱乐方式了。有钱人甚至能弄一台最新的索尼 Walkman,成为街上回头率百分百的 GGMM。无论是打孔带还是自己灌录,磁带以及它所承载的音乐成为很多人青春回忆里的重要背景。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图1

经典的 Walkman 与磁带

即使是我们这一代人,小时候其实都有被学英语磁带支配的酸爽。不过就跟学习机最后大部分沦为游戏机一样,磁带机最后大概率会变成播放器。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图2

经典的磁带歌曲

那个时候比较经典的磁带怕就是 TDK C60(C+数字 指两面合起来能够录制这么多分钟,C60 也就是每面 30 分钟) 磁带了,不仅能录制最高一个小时(根据机器转速不同实际 35-45 分钟)的音乐,还把「高保真」这一个关键词带进了大众视野,甚至能够录制多声道的立体声。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图3

TDK 磁带

其实磁带的声音和黑胶有点像,因为它们的原理其实都是录制模拟信号,所以前期或者便宜的磁带出来的声音会有点失真和沙沙声。而且大家估计想不到除了我们常用的听歌用途外,磁带还是非常方便和广泛使用的通用储存设备,即使到了现在磁带依然在商业领域被广泛使用。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图4

IBM 的商用磁带备份机

▼ 磁带的原理

磁带其实就是一条上面涂上可以被磁化的氧化物材料(通常是氧化铁)的塑料带,平时我们看到它卷起来只是为了减少储存体积的一种方式。再结合我们初中学到的磁生电与电生磁现象就能很清楚地理解磁带的原理:
储存数据:磁带上方固定一个磁头,磁头与磁带接触,用滚轮等方式将磁带以固定速度从磁头下方滚过。磁头接收发过来的不同电压数据脉冲(比如麦克风记录到的声音变化,数字磁带机直接发送 0 和 1 ),利用电生磁现象就会产生方向不一样的磁场,那么底下通过接触这部分磁带上的材料被永久磁化的磁场方向也不同,就记录上了数据。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图5

磁带的原理示意图,图片来源:TDK 和 IITK

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图6

磁带的结构

▼ 读取数据:读取的原理也和储存类似,不过利用的是磁生电现象,不同的磁场通过磁头会产生不同的电流,磁头就可以将这些电流数据交给其它的部分(比如扬声器发声),实现数据的读取。

磁头一般很小,所以数据密度可以很大,同时如果在一个宽度的磁带上,做两个 1/2 的宽度的磁头甚至更多个磁头,就可以实现多轨记录和读取(比如磁带录音带的立体声)。

看到这里大家是不是觉得有点眼熟,没错它和磁鼓储存器的实现思路有点相像,事实上所有以「电磁」方式来储存数据的设备都差不多是这种思路。

▼ 录像带与其它磁带

我们之前比较少见到的录像带,其实也是一种磁带。不过由于视频数据量和带宽都比较高,录像带一般会做得比较大比较宽,宽度长度大约和胶片差不多,用多个轨道来分别记录红、绿、蓝三个像素信息、同步信息和音频的模拟信号。读取时候旋转的也比较快,而且磁头是螺旋形扫描的。

除了储存音乐,标准的磁带还曾经被储存各种各样奇怪的东西,比如程序,文本和游戏,只需要一台磁带机就能在电脑上读出数据。在曾经软驱比电脑还贵的那个年代(甚至有厂家直接把电脑塞进软驱),用磁带来储存数据是一个便宜好用的方法。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图7

游戏和录像带

了解了原理后,我们也不难知道磁带的优点和它为什么会这么普遍使用了:首先磁带用一种很巧妙的方法让保存材料可以变得很轻薄,加上软性材料可以用特殊的方法收纳(比如卷起来),所以磁带可以在轻、薄、小的同时实现大容量的储存还能节省材料。

写入读取结构简单也可以让磁带与磁带机也变得便宜,既可以录入模拟信息,也可以录入数字信息,同一台机器就可以实现录制还有播放,通过使用高转速和更加坚固的材料,还可以实现飞快的顺序读取写入速度。另外写入数据是永久改变材料上的磁性,磁带的数据稳定性很不错,只要保存得当,理论上应该能够保存几十上百年。

所以磁带迅速风靡全球,在很多发展中国家甚至是主要的储存设备(比如很多国家的演讲都是通过磁带翻录传递到民众中)。另一方面也让最早的盗版盗录产业得以发展。

当然磁带的原理导致它也是有缺陷的,其中最重要的就是基本只能顺序读取,随机读取能力差到忽略不计。相信用过磁带的小伙伴都有过想听磁带里面的某一首歌,然后在那边干等它转啊转的经验,特别是想听倒数第二首歌的时候那感觉真是特别煎熬,更别说随机播放了,基本不存在的。

除了这个比较大的缺陷磁带还有每台设备转速不一样导致声音不一样,转太快崩太紧容易断,磁带磁带机上(俗称吃磁带),用不是空的磁带录制由于磁性改变不彻底会出现声音重复等。

那么为什么现在磁带仍然是企业冷备份的优先选择呢?
主要是LTO 磁带在实现大容量的同时是真的便宜(0.04 元/GB,30TB 只要 2000 不到),体积还蛮小的,而且只需要简单地增加磁带数量就能够增加容量,大规模数据物理转移的时候磁带的稳定性也比硬盘高很多。而且磁带机通过特殊的驱动也能够避免勒索软件或者病毒修改数据。用来储存一些基本不用的冷数据(比如你 10 年前的银行账单或者各种完成的项目存档)简直完美。
所以磁带今天仍然是冷备份的优先选择,像是我们常用的支付宝微信支付等金融数据,都是会稳稳地用磁带保存一份冷备份在地下的,就不用担心服务器全部爆炸,自己的余额都不见了。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图8

企业备份的磁带库

相关文献:
[1]. 常见磁带和磁带机的结构可以参考这份磁带机的专利 查看链接
[2]. 想折腾磁带冷备份的小伙伴可以看一下这份《中华人民共和国档案行业标准:档案数据存储用 LTO 磁带应用规范》查看链接
[3]. 想看看各种商用储存机长什么样的小伙伴,可以去 IBM 提供的各种 3D 产品演示 查看链接

▼ 磁带和黑胶唱片的沙沙声爆豆声是怎么来的

如果你听过磁带和黑胶唱片的声音,那么你一定会对沙沙作响的背景声音和爆豆声印象深刻。甚至最近 lo-FI 音乐开始复苏,就是制作音乐的时候主动往音频文件里面加入这些背景声音和爆豆声的采样(所以说时尚是一个圈),那么这些声音都是怎么来的呢?

对于黑胶唱片来讲,这些声音主要是来自于唱片的缺陷和表面的灰尘。以前唱片在压制条件不会很好(没有真空,唱片不干净之类的),导致刻刀没法把声音正确刻在那个部分,播放的时候就会导致失真。同时我们用的唱片机一般唱片直接暴露在空气中,播放时掉落的灰尘会阻止唱针读取到轨道上的音乐信息,从而让音乐失真一瞬间,这就是爆豆声。

所以当我们小心清理好唱片并用防尘罩盖好播放,会发现爆豆声直接少了大半,甚至如果你直接用上真空播放器,会发现黑胶唱片的声音也能如数字 CD 般顺滑。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图9

擦拭前后的声波对比,图片来源 Youtube@ Vinyl for Miles

原视频 Youtube@Vinyl for Miles:「Vinyl Vac Full Review - Before and After Audio Comparison!」

而磁带背景的沙沙声就有点高大上了(排除电路噪声),是各种来源「不规矩」的磁粒子产生的随机电信号。它们可以是空气中的粒子,可以是磁头精度不够漏掉的粒子,也可以是磁带生产中的磁离子颗粒太粗了……
提高生产精度和磁粒子的密集程度,或者增加磁带的宽度(增加带宽提高信噪比)都可以减少这种背景噪声提高声音纯净度,那个时候各家磁带厂家宣传的「高保真」就是这个意思。

■■ 数字信息(信号)和模拟信息(信号)

接下来出现的就是数字时代的设备了,在数字信息出现之前,磁带和黑胶唱片是典型的储存模拟信息的介质。那什么是模拟和数字信息(包括信号,下同),为什么我们现在都是用数字信息,它有什么优势?

▼ 模拟信息

我们生活在一个现实世界,很多信息是无限连续的,比如我们听到的声音、我们看到的风景、电压电流的变化……如果你把它们细分开来,你会发现它们无穷无尽。所以早期人们如果想通过设备处理和储存这些信息,就必须用另一种可以无限连续的介质去代表它,甚至汽车上的转速表、游戏机上的手柄等都是显示传递模拟信息的例子,所以在存储设备上模拟信息就是用可储存的机械量的连续改变,模拟不可储存信息的连续变化。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图10

模拟信息用电压表示应该是平滑的曲线,没有任何离散值变化

比如黑胶唱片的轨道和磁带上的磁颗粒信息都是连续的,我们能够在上面取到无限的值,而且在每一瞬间它都会有一个确定的值。

模拟信息的特性让它的优点和缺点都非常明显。

优点有:

▼ 信息密度和精细度非常高,毕竟是无限的值。

▼ 非常适合用来记录表示现实世界的变化,比如最常用到的电压电流、声音、温度、速度等。

▼ 读取和保存都非常容易,像是磁带黑胶唱片它们的原理其实都非常直观,直接采用宏观的方式就可以写入读取。

▼ 对传输要求比较低,使用很少的带宽就可以传输相对丰富的信息,像是我们之前的有线电视很多年来都是模拟信号。

但它的缺点催生出了人们现在主要使用的数字信号:

▼ 很容易受到噪声影响,噪声指的是与我们想要处理的信息无关的信息,由于精度、干扰等问题,在模拟信息中噪音基本不可避免,信噪比(xx dB)这个单位就是用来形容信息/噪声的比例,大于 1dB 代表信息比噪声多,所以这个数字越大越好。

▼ 容易产生损耗和干扰,现实世界不存在绝对稳定的介质,无论是有线还是无线传输和储存,随着距离和时间的增加,模拟信息里面的噪声一定是会越来越多的,这就是我们常说的损耗和干扰。如果因为功率密度等原因保存传输的信息读取时需要放大,那信息的完整性就更差了,因为放大信息的同时也会放大噪声。

与数字设备的工作原理相斥,这个会在下面介绍数字信号时讲到。

我们上面说到的沙沙声和爆豆声,其实就是各种意义上的噪声,模拟信号里面的电压电流也会产生噪声,这破坏了信息的完整性与准确性。最重点的是这些噪声的来源太随机了,电路里面一个不稳定的电压,空气中的灰尘,不同的材料甚至今天天气的温湿度、不同的宇宙辐射强度,都会让不同设备处理同一段模拟信息时产生不同的结果,比如你小时候在家看西游记,电视上的雪花和邻居是不一样的,所以严格来讲,你和邻居看的是不一样的西游记。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图11

充满噪点的电视

噪声越多保存传输的数据越难读取恢复,如果低信噪比的数据来进行科学计算,结果甚至会是反的。随着时代发展人们对于传输速度和准确性的要求越来越高,模拟信号在大部分领域都是无法让人接受的。

▼ 数字信息

模拟信号的缺点和更高效新设备的出现,促进了数字信号的诞生。我们都知道计算机里面处理和储存的都是 0 和 1 的有限数据,这是由处理器晶体管组成的逻辑门物理特性决定的,这代表它们基本没办法处理储存无限连续数据。举个简单的例子,各家编程语言里面都有提供圆周率 兀 作为常数变量,而如果你查看底层代码就会发现,它们都是直接预设一个几十位精度的 兀 值,不然用程序算一个圆的面积就能让电脑爆炸。

加上现代计算机领域(处理、储存、加密、传输……)基本都是基于离散数学的,对无限连续的数据非常不友好。这个时候我们就需要按不同精度对现实世界连续的数据进行取样了,这基本就是数字信息的原理。

如果说上面模拟信息用电压表示是连续曲线,那么数字信息用电压表示就是一段一段的(虽然每段可能非常短,看起来是连续的):

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图12

数字信息用电压曲线表示

简单的理解它们的区别:如果模拟信息是一条线,那么数字信息就是用很多密集的点尽量完整模拟出这条线。
举一个我们大家很经常接触的例子,还是音乐。不同于之前设备直接录制声音的连续变化,现代的数字录音机,录制的时候会将声音按照不同的频率采样,比如我们常常听说的 CD 44.1Khz 采样率就是每秒对声音采集 44100 次,记录下每次采集到的信息。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图13

CD 级音质

我们听歌的时候,播放器会将这些离散的数据用算法处理成连续的,这样我们就不会听到一卡一卡的歌(其实这就是经常听理科男们说的数模转换了)。采样率还有其他的一些规定采集读取数据的方式合起来就变成了数字信息编码规则,我们经常看到的文件扩展名(.jpg、.mp3、.apk)这些其实就是不同的编码规则,用来规定不同编码规则弄出来的文件怎么放在物理储存设备上,并提供增删查改方法的东西就是我们每天都会用到的文件系统。

数字信息的优势基本弥补了模拟信号的不足:根本优势是数字信息把现实世界的各种类型信息统一成一个虚拟层(0/1 二进制),实现一种设备处理储存各种类型的信息。

▼ 噪声非常少,更加准确,数字信息保存处理的是经过采样的数据,在信噪比低于一定程度的情况下,可以通过把编码和纠错算法逐个纠错把丢失信息完整还原回来。

▼ 通用保存,不像是模拟信号一般都要对应的存储介质,数字信号经过转换,可以很方便地储存在任何介质上(包括磁带、黑胶、胶卷甚至打孔纸带)。

▼ 复制转换非常简单,大家都是数字信息,复制转换自然不用说,利用不同的算法还能让数据变成不同类型,比如视频转图片,也能很方便地加密压缩数据。

▼ 处理更灵活,数字信息让我们能够更方便的处理它们,比如用 Photoshop 编辑一张图片,实际上就是编辑里面虚拟化的像素信息,在之前需要在胶片上物理修改。

▼ 方便远距离传输
等等等等……

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图14

文件系统其实是很复杂的一样东西

但数字信号也有属于自己的缺点:

▼ 由于需要附加各种复杂的编码信息,数字信号一般对带宽要求更高。

▼ 对硬件的要求更加复杂,我们能够比较无压力的看懂模拟电路,甚至每个人都能自制一个矿石收音机,但数字电路看起来就跟小学三年级学大学英语那样。

▼ 在硬件层上还要经过复杂的系统和算法处理。

所以现在模拟信号还是在某些领域被广泛使用,根据它们各自优缺点安排最合适的用途。

■■ 截然不同的命运:软盘与光盘

虽然我们现在仍然在广泛使用各种光盘,软盘却已经成为时代的眼泪,但软盘和光盘其实兴起于同一个时代,只不过软盘的命运停步于千禧年,而光盘不断焕发新机直到现在。它们都曾经是最广泛使用的储存设备,但最后的结果却相差甚远,这与它们的原理和特点是离不开关系的。

上面我们了解完了模拟信息和数字信息的变化,由于数据的本质形式发生了变化,人们需要容量更加大同时体积更加小的储存设备,软盘和光盘就是数字信息时代应运而生的载体。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图15

光盘和软盘

▼ 光盘

光盘在中国的覆盖可谓是全年龄段的,千禧年之后基本家家户户都会有一台先科的 DVD 机,小孩子的童年是《猫和老鼠》《哆啦 A 梦》等等的正(盗)版 DVD,年轻人把落伍的磁带机换掉,用上了随身 CD 播放器听伍佰周杰伦(千禧年左右 MP3 还是个稀罕玩意儿)。爸妈们常备一套新年歌曲合集和交响乐,全家人还能经常欣赏到充满翻译腔的欧美引进大片,要是家里条件比较好,能有台电脑,那在网络都没有的年代,装软件和驱动都得靠光盘……在信息高速公路直通车前光盘可谓无所不能。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图16

先科的 DVD 机,来源:先科官网

光盘有很多种类型,常见的几大类就是 CD,DVD 还有我们常听见的 BD 也就是蓝光光盘 Blu-ray Disc。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图17

音乐光盘

▼ 光盘的原理

▼ 写入:通过厂家设定好的轨道,按固定的速度把表面材料烧掉,烧出不同间隔长度不一的凹点。这些凹点就代表了不同的信息。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图18

放大的光盘表面是这个样子的,图片来源:Youtube@Applied Science

▼ 读取:传统的是采用近红外线纳米二极管,把红外线射到轨道上,有凹点的地方反射率会不同,从而读取数据。为了提高识别率,没有凸点的地方反射率要尽量得高,所以光盘会添加一个镜面反射层,这也是光盘看起来亮亮的原因,同时由于上面有很多个小凹槽,光线会发生折射与衍射,光盘上便有了那种很独特很漂亮的彩虹纹。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图19

光驱读取的激光头,图片来源:佳能 Canon Global

这种方式有点像是盲文,通过一个个不同长度的点表示文字,然后盲人用手去触摸感受凹凸从而读出文字。
市面上还有一种可擦写光盘,可以反复擦写数据,是 20 年代大众经常使用的「移动硬盘」,价格相对来讲很贵。这种光盘的原理是将数据记录的盘片层换成可相变合金,这种金属的特性是在不同功率激光的照射下能够在晶体与非晶体结构之间转换。

可以用高功率激光,像普通刻录光盘那样照射可擦写光盘,上面金属变成的晶体结构具有良好的反射性,就相当于凹点。而用中等功率激光照射后,就可以把它还原回来。这种光盘由于材料的问题,反射率一般不够一次性光盘高,所以那个时候好的可刻录光盘,价格一般很贵,而且刻录也比较容易翻车(多次刻录后反射性不够,导致无法识别)。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图20

可以反复读写的光盘原理,图片来源:佳能 Canon Global

▼ 蓝光光盘的由来

那我们现在常听到的蓝光光盘,说的就是把镜红外线纳米二极管换成波长更短的蓝光,也就是说在盘片上的凹点能烧得更加密集,提升了数据密度,一个盘自然也就能塞下更多的内容。能够比普通 DVD ROM 容量翻倍。

【数字存储完全指南系列】 01:储存设备的诞生与历史(下)插图21

蓝光光盘的技术

光盘的速度和容量一直随着技术发展在提升,从原本 700MB/150KB/s 的容量速度飙升到现在多层蓝光盘(通过不同折射率的透过率来区分不同层盘片)的最高 128G/72MB/s,在商用领域更是有索尼 2015 年推出的 Archival Disc,单盘容量来到了 300GB ,最高速度去到 250MB/s 读 125MB/s 写。

但随着最近互联网流媒体的发展,人们对光盘的需求越来越低,光盘的容量速度提升也随之放缓。比如 2013 年的研究通过新型技术可以将光盘的容量提升到 TB 级,但直到现在仍没有落地产品。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...