数字网络音频系统原理与工程设计(txt+pdf+epub+mobi电子书下载)


发布时间:2020-07-26 01:52:31

点击下载

作者:彭妙颜,等

出版社:电子工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

数字网络音频系统原理与工程设计

数字网络音频系统原理与工程设计试读:

前言

音频领域当今正处在由“模拟音频”全面地向“数字音频”过渡的转折时期。

不论是家用音响还是专业音响领域,音频技术数字化已是一股不可逆转的潮流。这对于从事音频设备和音频系统设计、生产、销售、安装、调试、维修、管理和操作使用的这支庞大的技术队伍,包括专业人士、兼职人士和业余爱好者在内,都已切身感受到数字化这股大潮带来的冲击,从而迫切希望尽快掌握新技术以迎接挑战。本书希望能在这方面贡献一点微薄的力量。

作者于2006年编著出版的《数字声频设备与系统工程》一书曾作为广州大学“音视频与艺术照明工程”专业本科教材,并公开发行。时间一晃近十年,数字音频技术的飞速发展,特别是网络传输技术的发展,促使我们有必要在《数字声频设备与系统工程》一书的基础上充实更新,重新编写这本名为《数字网络音频系统原理与工程设计》的新书。

数字音频涵盖的范围很广,涉及通信、广播、计算机等许多学科领域。考虑到市面上有关“数字音频技术”、“数字信号处理”等一类专门讲述数字音频基础理论的教材和书刊数量较多,本书以有限的篇幅,将把侧重点放在数字音频工程方面,讲述音频工程应用的数字音频设备以及由这些设备组成的数字音频扩声系统和录音系统的结构、原理、设计、系统集成和测量等内容。

作者长期从事音频工程的教学、科研、设计、检测和工程实践,并得到广大音频设备生产企业和工程企业单位的支持,提供大量最新的技术资料,使本书能较好地反映当今国内外数字音频工程领域方面的新技术、新工艺、新设备和新的设计理念,并举出一批最新的工程实例。特别是在音频信号处理器(第五章)、数字网络音频系统(第七章)、数字电影系统(第十一章)和声像光机同步表演控制系统(第十四章)等领域充实和更新了丰富的内容,使这几章成为本书的亮点。

为便于与国际接轨,本书所述及的主要专业名词首次出现时都尽量附上英文,这也是本书的特色之一。

本书编写力求理论与实践相结合,使内容深入浅出,在系统讲述一定深度理论知识的基础上给出大量最新的数字音频产品技术资料和数字化、网络化工程实例,其中涵盖了剧场、音乐厅、体育场馆、多功能会堂、歌舞厅、智能化会议厅、数字录音棚、大型航空港、客运站、主题公园、数字立体声电影院和电台播控中心等。

本书可作为大专院校音频工程、音响技术、录音技术、电化教育(教育技术)、应用电子技术及影视舞台音响等相关专业课程的教材或参考教材,也可供从事上述专业的设计、生产、研发及工程技术人员参考。由于书中大量深入浅出的讲述和实例,因而也适合工厂企业、机关学校、文艺团体、娱乐场所、体育场馆、剧场影院、音乐厅、广播电视、声像制作、电化教学(教育技术)等部门从事音频(音响)技术和管理工作的人员和业余爱好者阅读。

近年来我国的文化产业大发展,急需大批这方面的技术人员和管理人员,本书亦可作为相关的专业人员培训和自学教材。

本书的出版得到广州大学教材出版基金的支持。

本书编写过程中得到安恒利(ACE)、迪士普(DSPPA)、博士(BOSE)、EV、百威(Peavey)、锐丰、天创(TICO)、台电、迪声(dB)、励丰、声韵(d&b)、三基、天艺、东汇、汇信、华汇、卡侬、中美亚、K&F和奥特维等国内外知名音响企业的大力支持,给本书提供宝贵资料及编写意见和建议;叶煜晖、陈斌等同志为本书的出版做了大量工作;在此一并表示深切谢意。本书编写过程中还参阅了大量的著作、刊物和网站等参考文献,在此特向这些文献的作者表示衷心的感谢。

作者期望以本书为桥梁,能与广大从事音频工程技术的同行进行交流,也希望能对新入门的音频工作者和广大音响爱好者有所帮助。

由于本书内容较新,涉及面广,加上编者水平所限,书中存在错误或不当之处,敬请广大读者给予批评指正。彭妙颜 周锡韬 徐海广州大学声像与灯光技术研究所广东中南声像灯光设计研究院广州市迪声音响有限公司E-mail:gzhuavl@21cn.com2016年1月第一章数字音频技术基础第一节 音频系统的组成和分类一、音频系统的组成

音频系统(audio system)也称为音响系统(sound system)、声频系统或电声系统,通常是指广播电台、电视台、电影制片厂、音像制品公司、剧场、歌舞厅、音乐厅、电影院、礼堂、体育场馆以及家庭等场所用于扩音或录音的设备的组合。这些设备通称为音频设备或音响设备。常见的音频设备有以下几种:(1)音频放大器,如前置放大器、传声器放大器、唱头放大器、功率放大器等。(2)节目源设备,又称信号源设备或声源设备,如电唱机、CD机、录音机、收音机(调谐器)、MD机等。(3)电声换能器,如扬声器、耳机和传声器(话筒)等,其中传声器同时也是一种信号源。(4)音频信号处理设备,包括均衡器、降噪器、延时/混响器、压缩/限幅器、咝声消除器、听觉激励器和数字信号处理器(DSP)等。(5)调音台,也可将其看成是音频放大器和音频信号处理设备的一种组合。

用上述音频设备组成各种音频系统,以适应不同的使用场合和不同的目的要求。二、音频系统的分类1.按其主要任务划分

音频系统按其主要任务或最终目的不同可划分为扩声系统和录音系统两大类。(1)扩声系统

扩声系统(sound reinforcement system)的任务是把从传声器、电唱机、CD机或录音机等信号源送来的语言或音乐信号进行放大、控制及美化加工,最终送到扬声器或耳机,还原成声音信号供人们聆听。扩声系统还可细分为:

1)厅堂扩声系统(auditorium sound reinforcement system)。它包括礼堂、剧场、电影院、音乐厅、会议厅、歌舞厅等装设的大功率系统以及家庭用的小功率系统。

2)公共广播系统(public address system)。如车站、码头、机场、酒店、工矿企业、机关、学校和农村常见的公共广播等,都属于此类。其中装设于餐厅、商场、银行和酒店等公共场所,播放声音较轻的音乐,目的是营造适当的环境气氛的公共广播系统常称为背景音乐系统(background music system)。

3)电子会议系统(electronics conference system)。亦称为多媒体会议系统,简称会议系统。最基本的组成部分是会议发言系统(讨论系统),较复杂的加上表决系统、同声传译系统、视像显示同步跟踪系统和远程视频会议系统等。(2)录音系统

录音系统(sound recording system)的任务是把从传声器、电唱机、MD机或另一台录音机等信号源送来的音频信号进行放大、控制及加工美化,最终目的是把声音信号记录下来,待到需要时再通过其他重放设备还原成声音。

本书内容侧重点放在扩声系统。有关录音系统的内容安排在本书第十二、十三章作扼要介绍。2.按其使用对象划分

音频系统按其使用对象不同而划分为民用(家庭用)音响和专业音频(专业音响)系统等。(1)民用(家庭用)音响系统(civilian(family)audio system)

适用于听众较少、场地不大的家庭环境的小功率音响设备。(2)专业音频(专业音响)系统(professional audio system)

通常是指广播电台、电视台、电影制片厂、唱片厂、音像制品公司、剧场、歌舞厅、音乐厅、电影院、礼堂、体育场馆等装设的大功率音响系统。

本书的内容安排重点讲述专业音频系统,对民用音响只作简略介绍。3.按其信号处理方式划分

音频系统按其信号处理方式划分为模拟音频系统和数字音频系统。(1)模拟音频系统

模拟(analogue)一词本意为“相似”,在工程技术领域应用则有“连续”的含义;而数字(digital)则具有“不连续”、“离散”的含义。一般说到模拟量都是指“连续量”,而数字量则是指“离散量”。

我们日常听觉接受的声音,视觉接受的图像、颜色等都属于连续变化的信息,称为模拟信息。依此类推,连续变化的音频信号则称为模拟音频信号。

把声音信号在原来模拟状态下进行传送、记录、重放及其他加工处理的技术,称为模拟音频技术或模拟音响技术(analog audio tech.),相应的设备及由此组成的系统称为模拟音频设备及模拟音频系统(analog audio system)。

随着技术的进步,人们发现模拟技术存在许多先天性的难以克服的缺陷,各项性能指标难以进一步提高。而采用数字技术的音频系统与模拟音频系统相比,在存储、检索、处理、传输和利用等各个方面都有着无可比拟的优越性。(2)数字音频系统

把声音信号数字化,并在数字状态下进行传送、记录、重放及其他加工处理的技术,称为数字音频技术或数字音响技术(digital audio tech.),相应的设备及由此组成的系统称为数字音频设备及数字音频系统(digital audio system)。本书定名为《数字网络音频系统原理与工程设计》,主要是从工程应用的角度讲述数字音频中的专业音频设备和系统。至于模拟音频设备和系统目前仍在一定范围内使用,本书亦安排适当的篇幅讲述。4.按声道的数目多少划分

按声道的数目多少划分为单声道音频系统、双声道立体声音频系统和多声道音频系统。本书侧重于双声道立体声系统。第二节 单声、立体声与环绕声

在交响音乐会上,只要你坐在正对舞台中央附近的位置,即使闭上双眼,你也能清晰地分辨出管弦乐队中各种乐器的空间位置——小提琴在左边,管乐器在中间,大提琴在右边,而打击乐器在后边。这是因为人对声音具有很强的“立体感”。

以管弦乐队左侧的小提琴为例,由于它与你的左右两耳的距离不同,所演奏的声音必然先到达你的左耳,稍后才到达你的右耳,即存在着“时间差”(time difference, Δt)。另一方面由于距离不同,再加上人的头部对声音有遮蔽效应,使你的左耳感受到小提琴的声音会比右耳响一些,即存在“声级差”(sound level difference, ΔL)。人的大脑把从两耳接收到的这些细微差别的信息加以分析,并与原来就存储在大脑里的听觉经验进行比较,从而迅速分辨出声源的方位。一、单声道和双声道立体声

音响技术中所谓“声道”或“通道”或“通路”(channel,简称 CH)的意思是指一个电信号或声信号完整独立的专有路径。在电声技术发展的早期,广泛应用的是单声道(mono sound)音响系统,是由一个传声器、一个放大器和一个扬声器组成的单一声音信号通道(见图1-1(a))。用单声道设备去播放一个大型管弦乐队演奏的节目,所有乐器的声音都是从一个“点声源”发出来的,不可能有方位感和展开感。在单声道系统中,即使拾音时用了多只传声器,放音时也用了多只扬声器并放到房间不同的位置,如果拾音和放音的放大器只有一个声道,那么所有扬声器重放的仍然是同一信号,没有声级差和时间差,结果仍不能获得任何立体感。只有采用两个或两个以上的声道,分别使用各自的传声器、放大器和扬声器,组成立体声(stereo sound)系统,才有可能重现在现场感受的方位感、展开感和临场感,即所谓立体感。

图1-1(b)是由左(left,简写L)、右(right,简写R)通道组成的双声道立体声现场扩音系统示意图,两个声道分别使用两只适当拉开距离的传声器拾音,以模拟人的双耳听音的效果,每一个传声器拾得的声音信号各自通过一个独立的放大器,分别驱动放置在听者前方左右两侧的扬声器放音,从而获得类似在现场欣赏节目时的方位感、展开感和深度感。最先出现的双声道立体声(two-channel-stereo)和近年飞速发展的多声道环绕立体声(multi-channel-surround sound)在某种意义上都称为立体声。但人们习惯于把双声道立体声简称为“立体声”,而把多声道环绕立体声简称为“环绕声”(surround sound)。图1-1 单声道和双声道立体声二、环绕声的基本概念

环绕声也是一种立体声。顾名思义,它应能重现环绕于听音者四周的声像。典型的双声道立体声仅模拟了前方传来的声音而不能反映后方来的原发声和反射声,因而听音者还不会有逼真的亲临现场的感觉。为了模拟逼真的临场感,各种环绕声系统都是企图在双声道立体声的基础上把来自听音者后方和侧向的声音重放出来。图1-2 简易环绕声1.简易环绕声系统

如图1-2所示,在双声道立体声的基础上,增加两个后置环绕声声道(S),用 L、R 信号经过延时,衍生后置声道信号 S,即可在一定程度上烘托出临场气氛。上述后置声道信号S也可以用L、R信号经过移相衍生。显然,不论延时或移相,后置声道信号S都是“假”的,故被称为假环绕声(pseudo-surround sound)或赝环绕声。2.杜比定向逻辑环绕声

杜比定向逻辑环绕声(dolby pro logic)是由杜比公司开发用于家庭影院的一种系统。该系统用左(left)、右(right)、中央(center)、环绕(surround)四个声道拾音,得到L、R、C、S四个TT信号,然后经过编码,综合成L、R两个信号记录在媒体(电影拷贝、磁带或光盘)上。重放时,由专用的“杜比解码器”解码还原出L、R、C、S四路信号,送入五个声道重放,如图1-3所示。在该图中,L、R、C三个声道是整个系统的主干,其频响范围应不窄于20 Hz~16kHz(接近全频域),两路后置的声道常称为环绕声道,都用S信号重放;也可以一个用S信号,另一个用反相的S信号。此外,有的杜比解码系统还从L、R、C中分离出低音分量,以便驱动超低音扬声器。3.杜比AC-3环绕声

这是杜比公司开发的另一种环绕声系统,主要用于 DVD 盘片和高清晰度电视中。其特点是信号经过数字压缩编码,以便既节约媒体的存储空间,又保证有极高的音质。AC-3环绕声重放必须有相应的“解压”(解压缩)设备。

图1-4所示为5.1声道AC-3环绕声重放系统,包含前方左、中、右三个声道(L、C、R)和后方左环绕、右环绕两个声道(LS、RS),这五个声道均为全频带声道。另外加一个低频效果增强声道(LFE),其频带大约为20~200 Hz,称为0.1声道,故合称为5.1声道。图1-3 杜比定向逻辑环绕声图1-4 5.1声道AC-3环绕声4.双声道环绕声

从经典理论出发,所有环绕声系统都必须有后置的或旁置的声道。结果重放声道越来越多,而且制式也越来越多。随后人们开发出一种双声道的环绕声系统,即只用两只音箱来产生环绕声效果的系统。其中一种采用“空间均衡三维技术”(Spatializer 3D),用两只音箱营造出水平270°、垂直60°的环绕声场。另一种称为“声音恢复系统”(SRS),也能产生类似效果。据认为主要是根据耳壳的效应进行模拟。5.数字电影环绕声和演出现场环绕声

近年蓬勃发展的数字立体声电影(digital stereo sound cinema)则是采用专业电影领域独特的环绕声系统,如SR-D、DTS和SDDS等平面(2D)环绕声系统。近年更发展了Auro、Iosono和Dolby atoms等增加了顶置声道的三维(3D)全景声等新型的3D数字电影环绕声系统等。本书将在第十一章讲述。

以上各种环绕声系统有一个共同点,都是应用编解码技术预先制成 DVD 或硬磁盘节目源,供家庭娱乐或电影院重放。而近年新开发的TiMax、D-Mitri、TTA和WFS等称为演出现场3D 声像与定位跟踪环绕声系统,在欧美许多大型剧场、音乐厅特别是主题剧场和大型实景演出中已获得相当广泛的应用,本书将在第十四章讲述。第三节 模拟音频系统

模拟音频系统主要由模拟音频设备组合而成,下面列举几个典型的模拟音频系统的组成方框图。图1-5是一个最简单的单声道厅堂扩声系统,由传声器、放大器和扬声器组成,可用于教学培训、会议报告、讨论发言、公共广播甚至小型文艺演出等场合。其结构简单,价格较低廉,功能较少。图1-5 简单扩声系统

图1-6是一个立体声家庭扩声系统示意图。该系统以一台放大器为中心组成,包括 CD 机、录音机、均衡器、功放和音箱等设备。有需要时还可以连接传声器、效果器、影碟机和电视机等组成家庭音像(audio-video, AV)系统(见图1-7)和5.1声道家庭影院(home cinema)系统(见图1-8、图1-9)。图1-6 家庭扩声系统图1-7 家庭音像(AV)系统图1-8 5.1声道家庭影院系统图1-9 5.1声道家庭影院的布局

图1-10是简单厅堂扩声系统。图1-11是一个多功能的现代厅堂专业AV系统示意图。它以一台多路调音台为中心组成,包括多种信号源、放大器、音箱和音频处理设备,适用于剧场、礼堂、歌舞厅或音乐厅等场合,可以用影碟机、MD机播放音乐,也可用传声器讲话、演唱卡拉OK或进行音乐、戏剧、歌舞等文艺表演,还可用投影机或LCD、LED显示屏播放视频节目。图1-10 简单厅堂扩声系统图1-11 多功能厅堂专业AV系统第四节 数字音频技术基础“数字音频技术基础”是一个很大的题目,本身就可以单独写成一本专著或作为一门独立的课程,并牵涉较深入的理论和数学知识。本节仅是从工程应用的角度,对学习本书后续内容必需的一些数字音频技术的基础知识作一提纲式的概略介绍,深入的内容可参阅书末开列的参考文献。一、音频信号的数字化

音频信号的数字化就是对模拟音频信号进行数字化处理,将其转换成数字信号的过程。首先是对输入模拟信号波形以适当的时间间隔(即采样时间)来观测,将各个采样时刻的波形幅值定量,并用“0”和“1”组成的二进制数码序列来表示,最后将该二进制数码序列变成脉冲信号的有无来输出,这就是模拟信号的数字化。以上过程通称为“模/数转换”,缩写为A/D。与此相反,在重放时是把数字音频信号还原为人们感知的模拟音频信号,这个过程称为“数/模转换”(D/A)。

将连续的模拟信号变换成离散的数字信号,其方法很多,但在数字音响中普遍采用的是脉冲编码调制方式(pulse code modulation, PCM)。PCM方式是法国人A.H.里夫斯于1937年发明的,早已广泛应用于通信领域。随着半导体技术的进步,特别是发展到超大规模集成电路阶段后,PCM方式几乎应用于音响的各个领域,它是由采样、量化和编码三个基本环节完成的。

A/D转换过程如图1-12所示。图1-12 采样、量化、编码的概念图1.采样

采样(sampling)是指对连续的模拟信号进行数字化的过程中,在时间轴方向进行离散化。就是说:对模拟信号每隔一定的时间间隔进行瞬时取值,用离散点来表示模拟信号的波形。这些离散点的值称为采样值。

为了能真实地反映原来的模拟信号,采样时间间隔应尽量地小,否则就会漏掉一些信息,重放时就不能反映原来的波形了。2.量化

量化(quantization)是指对采样后的信号在幅度上按分层单位进行四舍五入取整数的过程。显然量化层次越多,量化误差越小,实际上常称这种量化误差为“量化噪声”。3.编码

编码(coding)就是把每一个量化的值转换为二进制的数来表示。

D/A转换是将二进制编码还原为量化信号的过程。采样、量化、编码的概念和模拟信号的数字化,如图1-12、图1-13所示。图1-13 模拟信号的数字化二、数字信号的几个概念1.采样频率s

每秒钟的采样次数称为采样频率,常用 f表示。为了能真实地反映原来的模拟信号,采样时间间隔应尽量地小。奈奎斯特(Nyquist)根据傅里叶分析(一种数学方法),提出采样定理:如果采样频率大于模拟信号上限频率的2倍,信号就不会在采样过程中明显丢失,即s

式中 f ——采样频率;B

f ——模拟信号上限频率。B

声音信号的上限频率 f为20kHz,那么必须有采样频率。在CD机和VCD机中选声音信号的采样频率为 sf=44.1kHz,即每22.76μs就要在模拟音频信号中取一个瞬时幅值。在DVD数字音频处理和某些数字音响系统中,考虑到不同的要求,采样频率有32kHz、44.1kHz、48kHz、96kHz几种。在各种数字视听设备的图像信号的数字化过程中,采样频率也符合奈奎斯特理论。2.采样级数

采样级数是指A/D转换时,表示模拟样本的二进制数码的位数。它表达了量化的精细程度。

例如,用8位二进制数码表示,譬如前面提到的10101101,8位二8进制数码至多有2=256个状态,即把模拟信号幅度划分为256个层次;若用16位二进制数码表示,则可以把模拟信号幅度划分为65536个层次,精度高得多了。

在数字视听设备中,音频信号的采样级数为16(或称为16bit),图像的样本位数为8(或称为8bit)。3. 比特、字节、比特率

在数字技术中,讨论数字信号传输时常用比特(bit)这个单位,二进制数码的每一位称为1个比特(或称为1bit,简写为b)。电路通过数码信号称为比特流,某点每秒钟通过的比特数称为比特率(或称码率、数据传输速率),记为b/s或为bps。

在数字技术中,存储媒体的容量习惯用另一个单位——字节数(Byte)表示,简称B。

字节和比特的关系是:1B=8bit。

字节的进位是:1KB=1024B,1MB=1024KB,1GB=1024MB。例如,某计算机软盘容量为1.4MB;计算机硬盘容量达到几十个GB(吉字节)等。4. 量化噪声

量化噪声与采样级数有密切关系,可用下式来表示信噪比(S/N):

S/N=6n+1.8(dB)

式中n为量化位数。

从上式可知,量化位数越多,信噪比越高。位数n每增大一位,信噪比可提高6dB。在数字音响设备中,量化位数为16bit,信噪比(S/N)应为

S/N=6×16+1.8=97.8(dB)

考虑到其他一些因素影响后,实际的信噪比应比计算结果稍低。

图1-14显示采样时间和量化电平对波形重现的影响。图1-14 采样时间和量化电平对波形重现的影响5.数字化的精确度

增加每秒采样次数(提高采样频率)和加大量化位数(量化的分层数增多),都可以提高波形数字化的精度(见图1-14),但记录和重放设备的频带宽度也成比例地增加,从而增加了成本和技术难度。表1-1是CD和DVD-Audio的对比。表1-1 CD和DVD-Audio的对比6.数字化的优缺点

数字信息传输系统的主要优点有:抗干扰能力强,特别是在中继传输时更为明显;可以进行差错控制,因而提高了信息传输存储的可靠性;便于使用现代计算机技术,对信号进行处理、存储和变换,从而提高了信息传输/存储的灵活性;便于加密,对所传输/存储的信息进行保密或版权保护;易于与其他系统配合使用,构成一个灵活、通用、多功能的综合业务信息传输网;易于集成化和大规模生产,其性能一致性好,且成本低。

除此之外,采用数字音频技术的另一个重要原因是计算机技术的飞速发展,使数字音频处理变得越来越容易。在模拟音频技术为主的年代,声音的处理如声音的混合、延迟、改变都是通过各种专业设备来完成的。为了获得尽可能高的音质,这些设备的造价是非常昂贵的。数字音频技术则不同,当音频信号变为数字形式以后,所有的声音处理实际上都是一种数字的处理。基于数字信号处理的理论和各种算法,数字音频处理既可以通过软件在计算机上实现,也可以通过硬件来实现。以软件为主的实现方法的优点是成本低、灵活,一台计算机配上一块声卡和相应的软件就可以做各种处理,而且可以反复修改、多次加工。其主要缺点是非实时,但随着计算机处理能力的不断提高,这个缺点正在逐步得以克服。基于数字信号处理器(DSP)的以硬件为主的实现方法能够满足实时操作的要求,也可以通过软件实现一些功能,具有较强的灵活性和较高的性价比。

表1-2列出模拟音频唱片(LP)和数字音频唱片(CD)的主要指标对比。由此也可以从一个侧面看出数字化的优越性。表1-2 CD唱片与LP唱片的比较

数字音频系统在发展过程中也存在一些缺点:一是系统组成比较复杂。虽然早在20世纪60年代人们已经认识到数字化的优势,但只是到了半导体管和集成电路特别是大规模集成电路和高密度记录技术出现后,数字音频系统才获得迅速的发展。

另外数字信号传输占用带宽要比模拟信号大很多,因此直到压缩编码技术日益成熟后才有可能更广泛应用。

在数字化的过程中也出现过一些争议。例如音频系统操作人员的观念转变和操作习惯的适应还需要有一个过程,而导致在扩音领域中,数字调音台的推广应用远远落后于录音领域中的应用,主要就是由于这个原因。另外还有“数码声”的争议,部分音响爱好者仍然怀念“黑胶碟”(模拟密纹唱片)那温暖醇厚的声音。随着数字技术的不断发展,这些争议问题相信都会逐步得到解决。三、数字音频信号的处理流程及关键技术

数字音频信号的处理,除上一节讲述的A/D、D/A转换过程(包括采样、量化、编码等过程)外,还要进行一系列环节的处理,如图1-15所示,主要包括信源压缩编码、纠错编码、附加子码、调制和附加同步信号等。由于篇幅所限,对图1-15的进一步讲述从略,需要的读者可参阅有关参考文献。图1-15 数字音频信号的处理流程

从以上流程可以看出,数字音频技术涉及了相当广泛的技术领域,下面对其中关键技术作一简介。1. A/D(模拟/数字)和D/A(数字/模拟)转换

对音频的质量来说,音频信号通过 A/D 和 D/A 转换后,越接近原始的模拟信号,音质就越好。

为了提高数字音频的质量,需要提高采样频率和量化精度。例如,采样频率从44.1kHz发展到192kHz;量化比特数由16bit提高到24bit。近年飞利浦和索尼公司共同推出一种称为直接流数字(direct stream digital, DSD)技术,用于超级音频CD(Super Audio CD, SACD),支持立体声和5.1环绕声。DSD音频格式简化了信号流程,将模拟音频直接以2.8224MHz的频率进行过采样,通过Σ-Δ调制和噪声整形技术以1bit脉冲密度方式进行编码。2. 音频压缩编解码技术

音频信号数字化之后所面临的一个问题是巨大的数据量给存储和传输带来的压力。例如,对于CD音质的数字音频,所用的采样频率为44.1kHz,量化精度为16bit,双声道立体声时,其数码率约为1.411Mb/s(数码率=采样频率×量化比特率×声道数),1s的CD立体声信号需要约176.4KB的存储空间。因此,为了降低传输或存储的费用,就必须对数字音频信号进行压缩。以光盘的利用率为例:一张直径为12cm的单面光盘最大存储容量为700MB,对于未压缩宽带音频信源的时间为:

700M×8b/1.412Mb/s=94min(实际小于此值,因未计算纠错码等带来的比特数)。

如果将1.412Mb/s的比特率压缩到1/4,则存储时间增长4倍为376min,光盘的利用率大大增大。(1)码率压缩的必要性

信源压缩编码可定义为:在保持一个可以接受的逼真度损失下,采用尽可能少的比特数来表示信源。

但是随着比特率的进一步压缩,势必要影响信源的失真度。因此,对比特率压缩可分为两大类:

1)无损压缩:在限制发送端传输码率或存储容量前提下压缩信源速率,并尽最大限度达到高的信源逼真度。

2)有损压缩:在一定信源逼真度下,尽可能地实现低的比特率压缩。利用人的听觉不能检测某些信号损失,从而可以大量减少比特率。(2)数字音频压缩编码的主要标准

当前世界上数字电视标准有两个系列,就声音信源编码而言有 MPEG(moving picture coding experts group,活动图像专家组)制定的音频编码,是MPEG音频统称。另一个是ATSC (advanced television system committee,先进电视系统委员会)中的DolbyAC-3音频编码。其中MPEG音频的应用涉及的领域广泛,不仅用于数字电视、数字声广播,还有影音光盘、多媒体应用及网络服务等,因此是主流。而Dolby AC-3到目前为止仅用在多声道环绕立体声重放,包括DVD影音光盘及ATSC数字电视标准中的音频编码。

下面简介MPEG-1、MPEG-2、MPEG-4 MPEG-7及AC-3等的音频编码技术标准。

1)MPEG-1音频

数字音频压缩编码标准中第一个里程碑式的标准是MPEG-1音频(ISO/IEC 11172-3)。该标准以MUSICAM(masking-patten universal subband intergrated coding and multiplexing)和ASPEC(adaptive spectral perceptual entropy coding)技术为基础,按照编码复杂程度规定了3个层次(Layer 1、Layer 2 和 Layer 3)。CD使用Layer 1,是一种简化版的MUSICAM,典型码率192Kb/s; Layer 2采用MUSICAM,典型码率128Kb/s,广泛应用于数字电视广播、数字演播室等专业音频节目的制作、交换、存储和传输;Layer 3,即市场上广泛应用的MP3,编码复杂度较高,是MUSICAM和ASPEC两种技术的结合,典型码率64Kb/s,在低码率下仍能保证高品质。

2)MPEG-2音频

MPEG-2系列标准沿用了 MPEG-1音频,开发了音频压缩多声道的扩展(ISO/IEC 13818-3),它与MPEG-1音频后向兼容(backward compatibility),也叫MPEG-2 BC。后向兼容是说MPEG-2 BC解码器要能够解出MPEG-1音频。在实际应用中,与MPEG-2视频配套使用的大多数是 MPEG-1音频的 Layer2。此外,MPEG-2新规定了 MPEG-2高级音频编码(advanced audio coding, AAC),与MPEG-1音频不兼容,其中针对不同的应用,发展了多个工具模块,复杂度更高;在同等质量下,具有更低的编码码率。例如,码率为320Kb/s的AAC可提供比码率640Kb/s的MPEG-2 BC更好的多声道音质。

3)MPEG-4音频

MPEG-4音频(ISO/IEC 14496-3)是多种应用对象的编码,分自然语言、自然声音、合成语言、合成声音等对象类型。MPEG-4 AAC是自然声音编码中的一种,它在MPEG-2 AAC基础上,增加感知噪声替代(perceptual noise substitution, PNS)工具模块,形成与 MPEG-2 AAC相对应的三种类型[低复杂度(LC)、主类型(Main)、可变速率(SSR)],并且增加长期预测(LTP)、低时延(LD)、高效压缩(HE)和高效压缩HEv2,构成七种MPEG-4 AAC类型。MPEG-4音频为适应多媒体信息的发展,囊括了自然界和人工合成声音的多种对象,体系庞大,MPEG-4 AAC只是其中一种。

4)MPEG-7多媒体内容标准

MPEG-7称为“多媒体内容描述接口”(multimedia content description interface),主要是描述多媒体素材内容的通用接口的标准化。MPEG-7 支持数据音频(如 CD 唱片、MPEG-1音频格式)、模型音频(如磁带介质、MPEG-4的SAOL)及MIDI(包括一般MIDI及卡拉OK格式)。

5)Dolby AC-3

杜比 AC-3是美国杜比实验室针对多声道环绕声开发的音频压缩技术,在5.1声道下,可将码率压缩到384Kb/s,压缩比约10:1。AC-3最初针对影院系统开发,但目前已成为应用最为广泛的环绕声压缩技术之一,是DVD、ATSC高清晰度数字电视广播的通用标准。

Dolby Digital AC-3可把5个独立的全频带通道和一个频带为全频带1/10的辅助低音通道的信号实现统一编码,成为单一的复合数据流,AC-3符合ATSC美国高级电视咨询A/52规定的数字音频压缩(AC-3)标准。

6)DRA

DRA是我国在2008年制定的《多声道数字音频编解码技术规范》(GB/T 22726—2008)。该规范为推荐性国家标准,不仅可用于数字电视,而且适用于有限容量存储介质或有限带宽,如数字音频广播、家庭音响、数字电影院、激光视盘机、网络流媒体及个人多媒体播放器等。

7)AVS

AVS音频压缩标准是中国AVS音视频系列标准中的一个,命名为AVS-P3。AVS-P3采用了最新的音频编码工具,其应用包括高分辨率/高质量的数字音视频广播、高密度数字存储媒体、多媒体通信、互联网宽带流媒体等。2005年12月AVS-P3的最终草案制定完成。四、数字信号传输技术

数字技术的最大优点之一是便于有效地利用传输线路,在一对传输线路上能同时传输多路信息,这称为信道共享技术。信道共享主要包括信息的“多路传输”与“多址传输”两种技术(见图1-16),下面分别作一简介。1.多路传输技术

多路传输亦称为多路复用或多路通信,是指利用一个信道同时进行多个信息传输的一种技术,主要包括频分多路传输和时分多路传输两类。图1-16 多路传输和多址传输系统模型(1)频分多路传输技术(frequence division multiplex, FDM)又称频分多路复用,是指利用不同频率的副载波作为分路信号,以便在同一信道上同时进行多个信息传输的一种技术。FDM传输系统通常是一个两次调制系统。第一次是副载波调制,用以完成各种信号的频谱搬移,达到能按频谱分路的目的。第二次是主载波调制,用以实现无线电传输。如果需要,也可采用三次或三次以上的调制。(2)时分多路传输技术(time division multiplex, TDM)又称时分多路复用,是指利用时间上相互分开的副载波(脉冲序列)作为分路信号,以便在同一信道上同时进行多个信息传输的一种技术,其理论基础是采样定理。根据采样定理,一个频带有限的信息信号,只需要传输一些在时间上离散的采样值就可包含它的全部信息。这样,信道仅在传输这些采样值的极短时刻被占用,而在其余的长时间是空闲的。此空闲时间就可以用来传输其他信息信号的采样值,从而可以实现多个信息信号依时间先后在同一信道上的传输。图1-17是说明时分多路信道复用的概念、时间分割的原理示意图。在复用信道的两端设置一个同步的电子开关,快速地轮流接通各路用户。这样,各路用户占用信道的时间就互相错开了,因而可以互不混淆。图1-17 时分多路信道复用的概念、时间分割的原理示意图2. 多址传输技术

多址传输亦称为多址通信或多址连接,是指在一个信息传输网中,不同地址的各用户之间通过一个公用的信道进行的传输,其理论基础依然是信号分割理论。多址传输又分为频分多址传输(FDMA)、时分多址传输(time division multiple access, TDMA)和码分多址传输(code division multiple access, CDMA)等方式。(1)频分多址传输技术(FDMA)与FDM的主要差别是:在FDM中是利用信号频率的不同来分割多路传输的“路”(即通道)问题,而在FDMA中是利用信号频率的不同来分割一个通信网中的不同台站的站址问题。通常每个站址的本身又都采用了 FDM 传输技术,以提高效率。(2)时分多址传输技术(TDMA),利用时间分割原理既可进行时分多路传输(TDM),也可进行时分多址传输(TDAM)。它们之间的区别仅在于:TDM是利用时分原理在两个通信站间利用一个高频信道传输多个信息信号;而在TDMA中是利用射频信道的时间分割,实现一个通信网内的多个台站之间的通信。而每个台站本身往往又包含了多路传输的内容。(3)码分多址传输技术(CDMA)是指利用不同波形或码型的副载波作为分址信号,以便在同一通信网中,使多个台站同时进行信息传输的一种技术。五、数字音视频接口标准

数字音频技术中所谓接口(interface)是指一种规格标准,包括两个系统之间相互沟通的通信协议,以及不同设备为实现与其他系统或设备的通信而具有的对接部分,以便进行资料和信息的交换。

模拟音频设备在进行连接时需要注意设备之间的电平匹配、阻抗匹配以及连接方式的一致性(指平衡与不平衡的一致性),但即使产生一些偏差也不会造成信号很大的失真,因此在模拟设备中不特意提及设备之间的接口。但在数字音频设备的互连系统中,接口模式和标准十分重要。其原因在于数字化设备在进行A/D、D/A转换以及数字信号处理时所使用的采样频率及量化比特数彼此存在差异,因此要求互连设备的采样频率及量化比特数应保持一致,否则对传输的信号将产生损伤乃至不能工作。为了实现不同格式的数字音频设备之间的相互连接,故而制定出大家共同遵守的、统一的数字信号输入输出格式对接,即数字音频接口标准。

随着音频与视频技术的紧密结合并从模拟系统逐步向数字系统发展,专业音视频设备(如DVD、硬盘机、调音台、DSP以及投影机、音视频矩阵等)的音频信号和视频信号接口的类型日益增多,通常分为四类:(1)模拟音频信号接口;(2)数字音频信号接口;(3)模拟视频及模拟音视频复合信号接口;(4)数字视频及数字音视频复合信号接口。1.模拟音频信号接口(1)RCA非平衡式音频接口(analog unbalance audio)

RCA 非平衡式模拟音频接口的信号由一根导线传送,而接地参考信号则由另一根导线(或屏蔽网线)传送。这种连接方式有同轴、非屏蔽双绞线(UTP)或屏蔽绞线几种拓扑结构。RCA 连接方式是各种器材间模拟线级(或称线路电平 LINE IN/OUT)音频信号的标准传输方式,常用于CD、MD、DVD和其他民用音响设备,如图1-18所示。图1-18 TRS 6.3mm、莲花(RCA)、卡农(XLR)和BNC接口

传输介质:单根带屏蔽的同轴电缆(coaxial cable, CC);传输阻抗:高低阻;常用接口:直型(TRS,6.3mm)接口或莲花(RCA)接口;接线标准:插针=同轴线信号,外壳公共地=屏蔽网线。(2)XLR平衡式模拟音频接口(analog balance audio)

平衡连接材料由两条反相信号的分离导线和一条供接地的导线组成。

传输介质:带屏蔽的双绞电缆;传输阻抗:600Ω 或高低阻;常用接口:TRS 接口、卡农(XLR)接口(见图1-18);接线标准:TRS 直插:插针=信号+,中环=信号-,外壳公共地=屏蔽;卡农接口:②脚信号+, ③脚信号-, ①脚接公共地=屏蔽网线。(3)5.1声道、6.1声道、7.1声道音频接口

一套5.1声道输入插孔可以输入6个声道的信号:前左(L或FL)、前右(R或FR)、中置(C)、左环绕(LS)、右环绕(RS)和超重低音声道(“LFE”低频效果声道)。一套6.1声道输入端子较5.1声道增加了一个后环绕声(BS)插孔,一套7.1声道输入端子则增加了两个后环绕声(BSL, BSR)插孔。(4)转盘唱机(PHONO)音频输入接口

播放黑胶唱片的转盘唱机产生的音频信号电平远低于CD、磁带录音机和其他电声乐器,而且黑胶唱片在灌制的过程中还要应用一种特殊的均衡曲线将低频内容降低,将高频内容提升。这样可以防止对唱片声纹的过度刻录,将噪声降到最低。

部分民用音响和专业DJ混音台都有一个特殊的唱机输入端子(PHONO IN),它只适用于转盘唱机。从这个端子输入信号被送到了一个专门的前级电路中,它应用相反的均衡,将信号提升到标准的线级电平。

转盘唱机输入端子除了一对RCA(莲花)插孔外还有一个接地螺钉,用于连接转盘唱机接地线,如果不连接这条线会使音响系统出现明显的嗡嗡声。(5)微型(3.5mm)音频接口

大多数袖珍式CD播放机、MD录放机和计算机声卡都使用3.5mm微型音频插孔用于音频输入/输出。连接方式与TRS6.3接口相同。2. 数字音频信号接口(1)同轴数字输入/输出接口

常用于数字音频输入/输出,使用标准的RCA型插孔,但同轴电缆本身进行了特殊的设计,以处理数字信号更宽的频宽。传输介质:单根带屏蔽的同轴电缆或光纤(optical fiber);传输阻抗:75Ω;常用接口:BNC接口或莲花(RCA)接口(见图1-19);接线标准:插针=同轴信号线,外壳数字地=屏蔽网线。(2)AES/EBU(AES 3)平衡式数字音频接口

AES/EBU(音频工程协会/欧洲广播联盟,audio engineering society/european broadcast union)制定的一个专业的、平衡式的数字传输标准。其接口采用三芯的XLR接口(卡农接口),一条电缆传送左右声道的音频数据,输出电压为2~7V。该标准与AES 3接口及IEC958接口(类型I)等基本一致,广泛用于民用和专业的数字音频设备,如CD机、数字调音台、数字工作站等。传输介质:带屏蔽的双绞电缆或同轴电缆。专业的接口允许电缆长度(输送距离)为100~300m;传输阻抗:110Ω;常用接口:a. 平衡或差分连接使用XLR接口的三芯话筒屏蔽电缆;b. 单端非平衡连接使用RCA插头的音频同轴电缆;c. 光学连接使用光纤连接器(见图1-20)。图1-19 同轴数字接口图1-20 光纤连接器(3)标准型民用接口(IEC958,类型Ⅱ)

该接口与上一种专业的AES/EBU接口非常相似,但采用75Ω的同轴电缆和莲花(RCA)接口进行不平衡的电气连接。(4)S/PDIF接口

Sony和Philips的S/PDIF(sony/philips digital interface format)采用75Ω同轴电缆和BNC接口端子。电平为 TTL 兼容电平(0~5V)。与音频通道接口端子相匹配的还有单独一个用来传送字时钟信号的接口端子或光纤作为传输线。也有符合RS422标准的多通道电气接口,这种接口采用D型多通路接口端子,要用单独一个BNC接口端子来传送字时钟。

S/PDIF接口主要应用于由Sony专业数字音频设备向外传送音频数据,同时也广泛用于如CD、DVD和声卡等民用音响,如图1-21所示。

另有两个近似的接口标准:一个称为SDIF-2(sony digital interface,索尼数字接口),协议用于某些专业数字设备的互连。它采用两个独立的非平衡式同轴电缆和 BNC 接口,双通道立体声,另外一条同轴电缆和BNC接口提供字时钟同步信号(对称方波信号)。另一个称为SDIF-24 Sony数字音频接口(SDIF-24 sony digital interface),该接口的传输特性为:多股绞合电缆,24通道、立体声,D25插头。(5)Y1Y2 Yamaha数字音频接口

该接口采用八芯绞合电缆,8针DIN封装。(6)TEAC DTRS数字音频接口

该接口采用多股绞合线缆,8通道、立体声,D25插头。(7)TOSLink 光纤接口

该接口是东芝连接(Toshiba Link)的英文缩写,采用单根光纤,多通道、立体声,光纤接口。其长度最多不能超过7m。详情将在本章第五节讲述。(8)MADI, AES10多通道音频数字接口

多通道音频数字接口(multi-channel audio digital interface, MADI)是以双通道AES/EBU接口标准为基础的多通道数字音频设备间的互连标准。MADI 协议通过 AES10—1991和ANSIS4.43标准公布,我国于2002年也颁布了相应的广电部行业标准 GY/T187—2002《多通路音频数字串行接口标准》。该标准允许通过一条75Ω的同轴电缆和BNC接口连接件(见图1-22),或光纤来串行传输64个通道的线性量化音频数据,采样速率从32~48kHz提高到96 kHz。最长的同轴电缆长度不超过50m。如用光缆,则可以传送更远的距离。例如,光纤分布式数据接口(fiber distributed data interface, FDDI)可以用于长达2km的连接。MADI接口标准已被世界各国的数字调音台厂商广泛采用。本书第七章对MADI还有进一步的讲述。图1-21 S/PDIF接口图1-22 75Ω同轴电缆BNC接口(9)ADAT

ADAT又称Alesis多通道光纤数字接口(aDAT light pipe),或ADI接口。它是美国Alesis公司开发的一种多声道数字音频信号格式,最早用于该公司的ADAT八轨数字录音机(alesis digital audio tape)。该格式使用一条光缆传送8个通道非压缩的数字音频信号,通道24bit/48kHz,使用较广泛(见图1-23(a))。(10)TDIF

日本Tascam公司开发的一种多通道数字音频格式,使用类似于计算机的25针串行电缆线来传送8个通道的数字音频信号(见图1-23(b))。Tascam的专业级磁带录音机、CD机和MD机使用较广泛。图1-23 ADAT(a)及IDIF(b)接口(11)R-BUS

日本Roland公司推出的一种8通道数字音频格式,也被称为RMDB Ⅱ。它的插口和线缆与上述TDIF相同,传送的也是8通道的数字音频信号,但它有两个新增的功能:一是R-BUS端口可以供电,这样当将一些小型器材连接在其上使用时,这些小型器材可以不用外接电源;二是除数字音频信号外,R-BUS还可以同时传送运行控制和同步信号。(12)方形光纤接口

用于 DVD 的数字信号音频输出,又称为“角形端子”,经一根光纤连接线可直接与数字功放、数字处理器或数字调音台的光纤输入口相连。(13)微型光纤接口

这类插孔通常用于便携音频设备如MD的数字音频输入/输出。(14)I/O接口

计算机主机与外围设备通常不能直接连接,必须通过相应的I/O接口电路来实现。

在计算机中,接口是指外围设备与主机进行了解彼此的语言、数据传输速度、指令时序的规范。接口类型有ATA、SCSI、USB及IEEE1394等。

1)SCSI

SCSI接口是小型计算机系统接口(small computer system interface)的缩写,为并行接口(parallel interface)。由8位数据总线、1位奇偶校验和9条控制信号线组成。在高端计算环境(指工作站、服务器、大型计算机及超级计算机)中使用,是通过一条50线扁平电缆(SCSI-2为68线)与SCSI接口的硬盘驱动器相连。

2)ATA

ATA 接口又称 IDE,同样为并行接口,为低端计算环境中使用。采用16位数据并行传送方式,其数据传输率在10Mb/s以上,通过一条40芯扁平电缆与IDE硬盘驱动器相连。

3)USB

USB是通用串行总线(universal serial bus)的缩写,这是一种计算机和周边设备之间(如音频播放机、数字摄像机、数码相机、操纵杆、键盘和打印机)的“即插即用”接口,有三种类型:USBA类插头插入到计算机上的USB接口;USBB类插头插入到一台外围设备中(如一台监视器或打印机);一些小设备,如摄像机和USB音频适配器采用了一种更小型的B类插孔,称作微型USB B类,采用这种插孔的设备一般都包括了一个A类到微型USB B类的电缆。USB2.0标准的传输速率达480Mb/s。USB传输距离不宜超过5m。

4)IEEE1394

IEEE1394是美国苹果(Apple)公司开发称为火线“Fire Wire”(亦称为I.LINK)的串行总线接口。它属于连接外围设备的高速数字接口的一种标准,规定传输速率100Mb/s、200Mb/s 以及400Mb/s,已成为许多苹果电脑的标准配置,同时也广泛用于家用音视频器材中,如数字摄像机和数码相机等(见图1-24)。其电缆内由6根线组成,内有电源线及A和B两对信号线,支持热插拔,电缆长度不宜超过4.5m。图1-24 IEEE 1394接口3.模拟视频及模拟音视频复合信号接口(1)复合射频(RF)接口

它将音频和视频的复合信号调制为复合 RF 信号采用同轴电缆传输。其优点是采用一条75Ω同轴电缆同时传输音频和视频信号,且传输距离较远;其缺点是由于音视频信号的混合干扰而导致图像质量下降。另外,从图1-25所示模拟视频系统(电视机、DVD)多种类型的接口可见,由最左端的RF接口到最右端的显像管,中间经过高频头、中放、检波、预放、亮色分离、视频放大、矩阵电路和末级视放等多信号变换和处理,必然带来信号的劣化。除早期的录像机、VCD机曾设置有复合RF接口外,目前这种传输方式已不再用于录像机、VCD、DVD等视频设备,而是用于有线电视系统、直接广播卫星(DBS)系统和机顶盒的连接。图1-25 模拟视频系统(电视机、DVD)接口示意图

RF电缆插头(常称“F型”插头)可旋入75Ω插孔。(2)复合视频(composite-video)接口

复合视频接口常简称为视频接口,标以符号VIDEO或V,可以通

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载