网络知识与应用
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.4 数据编码技术

通信的目的是交换信息,信息的载体可以是数字、文字、语音、图形或图像,计算机产生的信息一般是字母、数字、语音、图形或图像的组合;为了传送这些信息,首先要将字母、数字、语音、图形或图像用二进制代码的数据来表示;为了传输二进制代码的数据,必须将它们用模拟或数字信号编码的方式表示;数据通信是指在不同计算机之间传送表示字母、数字、符号的二进制代码0、1比特序列的模拟或数字信号的过程。

数据编码是根据一定数据结构和目标的定性特征,将数据转换为代码或编码字符,在数据传输中表示数据组成,并作为传送、接受和处理的一组规则和约定。网络中的数据编码是研究数据在信号传输过程中如何进行编码(变换,处理)。

目前应用最广泛的数据编码是美国信息交换标准编码ASCII码(American Standard Code for Information Interchange); ASCII码(如图2-17所示)本来是一个信息交换编码的国家标准,但后来被国际标准化组织ISO接受,成为国际标准ISO646,又称为国际5号码。因此,它被用于计算机内码,也是数据通信中的编码标准。ASCII码采用7位二进制比特编码,可以表示128个字符。字符分为图形字符与控制字符两类。图形字符包括数字、字母、运算符号、商用符号等。

图2-17 ASCII码的部分字符编码

对于计算机系统来说,它关心的是信息用什么样的编码体制表示出来。例如,如何用ASCII码表示字母、数字与符号,如何用双字节去表示汉字,如何表示图形、图像与语音;对于数据通信系统来说,它要研究的是如何将表示各类信息的二进制比特序列通过传输介质,在不同计算机之间进行传送的问题。

根据数据通信类型,网络中通信信道分为两类:模拟通信信道和数字通信信道。能传输模拟信号的信道称之为模拟信道。数字信道是一种离散信道,它只能传送取离散值的数字信号。用于数据通信的数据编码方式也分为两类:模拟数据编码与数字数据编码。

不同类型的信号在不同类型的信道上传输有4种组合,数字数据在数字信道上传输,数字数据在模拟信道上传输,模拟数据在数字信道上传输,模拟数据在模拟信道上传输,每一种相应地需要进行不同的编码处理,如图2-18所示。数字数据编码为数字信号,数字数据编码为模拟信号,模拟数据编码为模拟信号,模拟数据编码为数字信号。

图2-18 不同类型的信号在不同类型的信道上传输

用数字信号承载数字或模拟数据称为编码,用模拟信号承载数字或模拟数据称为调制。数字信号不可能通过为模拟信号设计的传输线(如电话线)传送,反之亦然。因此,数字数据必须编码为模拟信号才能在模拟信道上传递,模拟数据必须编码为数字信号才能在数字信道上传输,如图2-19所示。模拟数据在模拟信道上传输也需要编码,必须将模拟信号调制成适合在媒介中传输的频率,数字数据在数字信道中传输时,也必须经过编码,使对方计算机更容易正确识别信号。

图2-19 数字信号和模拟信号的编码与调制

2.4.1 数字数据的数字信号传输(基带传输)

基带是指基本频带,指传输变换前所占用的频带,是原始信号所固有的频带。基带传输是在传输时直接使用基带信号。基带传输是一种最简单、最基本的传输方式,一般用低电平表示“0”,高电平表示“1”。适用于低速和高速的各种情况。因基带信号所带的频率成分很宽,所以对传输线有一定的要求。

2.4.1.1 通信信道带宽对基带传输的影响

由于信道的物理性能,往往使信号在传输过程中发生畸变,严重时使得信号不能正确传输,这主要是由于信道的频率特性所致。频率特性分为幅频特性和相频特性。幅频特性是指不同频率的信号,通过信道后,其幅值受到不同程度的衰减的特性。相频特性是指不同频率的信号,通过信道后,其相角发生不同程度的改变的特性。信道的频率特性有一定的截止频率,从而决定了信号的通频带。如果信号的频率在信道通频带范围内,则传输的信号基本上不失真,否则,信号的失真将比较严重。

法国数学家傅立叶证明,任何正常的周期为T的函数g(t),都可以由无限个正弦和余弦函数合成:

式中,f=1/T是周期信号的基频,an和bn分别是正弦和余弦函数的n次谐波的振幅。这种分解叫做傅立叶级数。通过傅立叶级数可以重新合成原始函数,即已知周期T和振幅,通过上式求和能够得到时间函数g(t)。

可以把一个持续时间有限的数据信号(所有的信号都是如此),想象成它在一遍又一遍地无限重复整个模式(即区间T到2T的模式等同于区间0到T,以此类推)。

所有的传输设备对不同的傅立叶分量的衰减程度不同,因而输出信号发生畸变。通常,频率0到(以Hz为单位)范围内的谐波在传输过程中无衰减,而在此截止频率以上的所有谐波在传输过程中衰减极大,如图2-20所示。

图2-20 不同传输设备对傅立叶分量的衰减程度不同

带宽越宽,信号传输的失真越小。

2.4.1.2 数据传输速率的定义与信道速率的极限

数据传输速率是描述数据传输系统的重要技术指标;数据传输速率在数值上,等于每秒钟传输构成数据代码的二进制比特数,单位为比特/秒,记做bps。

常用的数据传输速率单位有:Kbps、Mbps、Gbps与Tb/s,其中:

1Kbps=1×103bps

1Mbps=1×106bps

1Gbps=1×109bps

1Tbps=1×1012bps

根据奈奎斯特准则,二进制数据信号的最大数据传输速率Rmax与通信信道带宽B(B=f,单位Hz)的关系为Rmax=2·f(bps)。根据香农定理:在有随机热噪声的信道上传输数据信号时,数据传输速率Rmax与信道带宽B,信噪比S/N的关系为Rmax=B·log2(1+S/N),其中S/N为信噪比。

2.4.1.3 数字数据的数字信号传输的常用的几种编码方式

数字数据的数字信号传输的常用的几种编码方式有如下几种(如图2-21所示)。

图2-21 常用数字数据的数字信号传输的编码方式

(1)不归零制码(NRZ:Non-Return to Zero)

原理:用两种不同的电平分别表示二进制信息“0”和“1”,低电平表示“0”,高电平表示“1”。

缺点:1)难以分辨一位的结束和另一位的开始;

2)发送方和接收方必须有时钟同步;

3)若信号中“0”或“1”连续出现,信号直流分量将累加。

结论:容易产生传播错误。

(2)曼彻斯特码(Manchester),也称相位编码

原理:每一位中间都有一个跳变,从低跳到高表示“0”,从高跳到低表示“1”。

优点:克服了NRZ码的不足。每位中间的跳变即可作为数据,又可作为时钟,能够自同步。

(3)差分曼彻斯特码(Differential Manchester)

原理:每一位中间都有一个跳变,每位开始时有跳变表示“0”,无跳变表示“1”。位中间跳变表示时钟,位前跳变表示数据。

优点:时钟、数据分离,便于提取。

(4)逢“1”变化的NRZ码

原理:在每位开始时,逢“1”电平跳变,逢“0”电平不跳变。

(5)逢“0”变化的NRZ码

原理:在每位开始时,逢“0”电平跳变,逢“1”电平不跳变。

2.4.2 数字数据的模拟信号传输(频带传输)

频带传输是指在一定频率范围内的线路上,进行载波传输。用基带信号对载波进行调制,使其变为适合于线路传送的信号。调制(Modulation)是用基带脉冲对载波信号的某些参量进行控制,使这些参量随基带脉冲变化。解调(Demodulation):调制的反变换。调制解调器MODEM(modulation-de-modulation)是能进行调制和解调的设备。

2.4.2.1 调制解调器的基本工作原理

如图2-22所示,调制解调器在发送端将计算机中的数字信号转换成能在电话线上传输的模拟信号;在接收端将从电话线路上接收到的模拟信号还原成数字信号。

图2-22 调制解调器的基本工作原理

我们来看一下图2-23所示的FSK方式Modem的工作原理。

图2-23 FSK方式Modem的工作原理

2.4.2.2 调制技术

调制技术的基本原理是用数字信号对载波的不同参量进行调制。根据载波的三个特性:幅度、频率、相位,产生常用的三种调制技术:幅移键控法,频移键控法,相移键控法,如图2-24所示。

图2-24 三种常用调制技术

幅移键控法Amplitude-shift keying(ASK):用载波的两个不同振幅表示0(0v)和1(+5v)。实现容易,技术简单、抗干扰能力差。

频移键控法Frequency-shift keying(FSK):用载波的两个不同频率表示0 (1.2KHz)和1(2.4KHz)。实现容易,技术简单、抗干扰能力较强。目前最常用。

相移键控法Phase-shift keying(PSK):用载波的起始相位的变化表示0 (同相)和1(反相)。

2.4.3 模拟数据的模拟信号传输

要将模拟数据转换成模拟信号传输,主要是要使其能作长距离传输。一般常用的调制信号技术包含三种:振幅调制(Amplitude Modulation,简称AM),频率调制(Frequency Modulation,简称FM),相位调制(Phase Modulation,简称PM)。

2.4.4 模拟数据的数字信号编码

奈奎斯特定理(采样定理)说明,如果连续变化的模拟信号最高频率为F,若以2F的采样频率对其采样,则采样得到的离散信号序列就能完整地恢复出原始信号。例如语音信号要在数字线路上传输,必须将语音信号转换成数字信号。这需要经过三个步骤(如图2-25,图2-26所示):

图2-25 语音信号数字化步骤

图2-26 PCM转换过程举例

(1)采样——按一定间隔对语音信号进行采样。话音信道带宽为4kHz,采样时钟频率为8kHz(> 2倍话音最大频率);

(2)量化——对每个样本舍入到量化级别上。量化级数:256级(8位二进制码表示);

(3)编码——对每个舍入后的样本进行编码。

编码后的信号称为PCM(Pulse Coded Modulation)信号(脉码调制信号),常用于语音处理。编码后的信号数据率为8000次/s×8bit=64Kb/s,即每路PCM信号的速率为64000bps。PCM最初并不是用来传送计算机数据的,采用它是为了解决电话局之间中继线不够,使一条中继线不只传送一路而是可以传送几十路电话。