1.5.4 声音图像数字化
1.声音信息数字化
声音信号是典型的连续信号,声音信息的计算获取过程就是声音信号的数字化处理过程。经过数字化处理后的数字声音信息就能像数字和文字一样在计算机内进行存储、检索、编辑和其他处理。数字化过程如图1-21所示。
用数字方式记录声音,首先需对声波采样,声音数字化实际上就是对声音信号进行采样和量化。连续时间的离散化通过采样来实现,就是每隔相等的一小段时间采样一次,这种采样称为均匀采样(uniform sampling);连续幅度的离散化通过量化(quantization)来实现,把信号的强度划分成多个小段,如果幅度的划分是等间隔的,就称为线性量化。
图1-21 声音数字化过程
如果提高采样频率,单位时间所得的振幅值就会更多,对于原声音曲线的模拟就越精确。另外,量化精度也是声音模拟精度的一个重要指标。采样频率和量化精度两个参数的提高也会使记录声音所需的存储空间变大。未压缩的数字化声音每秒所需的存储空间(单位为字节)为:
存储量=(采样频率×量化位数×声道数)/8
例如,数字激光唱盘(CD-DA)的标准采样频率为44.1KHz,量化位数为16位,双声道立体声,1min音乐所需的存储空间根据上述公式计算如下:
44.1×1000×16×2/8×60=10.094MB
2.图像信息数字化
图像数字化过程就是利用数字化设备从现实世界获取图像的过程。数字化过程大体可分为三步:取样、分色和量化。其过程如图1-22所示。
图1-22 图像数字化过程
一幅不经压缩的图像的数据量可按下面的公式计算:
图像数据量=图像水平分辨率×图像垂直分辨率×像素深度/8
其中,像素深度表示每一个取样点的颜色值所采用的数据位数。
例如:计算一幅640×480分辨率(即640×480采样点)的真彩色图像的数据量。
一幅640×480分辨率的真彩色图像若分红、绿、蓝三色,并且每一颜色分量的亮度用8位二进制数表示,则每一个采样点的数据位数(像素深度)为8+8+8=24。根据上述公式,此图像数据量为:
640×480×24/8=900KB
一幅未经压缩的图像的数据量是比较大的,这既浪费存储空间,又不利于图像数据传输,所以后面讲到的图像的压缩,就是用来解决数据占用空间过大的问题。
通过本节的介绍,我们知道了所有的数据:数字(值)、字符、汉字、声音、图形图像、视频等数据到了计算机中都变成了0、1表示的二进制数,因此,可以说计算机世界或者说信息世界就是由0和1组成的“二人”世界。