多媒体应用技术(第2版)(txt+pdf+epub+mobi电子书下载)


发布时间:2020-07-10 00:18:51

点击下载

作者:季怡 龚声蓉 刘纯平 王林

出版社:人民邮电出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

多媒体应用技术(第2版)

多媒体应用技术(第2版)试读:

图书在版编目(CIP)数据多媒体应用技术/季怡等编著 -- 2版 -- 北京:人民邮电出版社,2018.921世纪高等教育计算机规划教材ISBN 978-7-115-48364-5Ⅰ.①多… Ⅱ.①季… Ⅲ.①多媒体技术—高等学校—教材 Ⅳ.①TP37中国版本图书馆CIP数据核字(2018)第086204号◆ 编  著 季怡 龚声蓉 刘纯平 王林责任编辑 李召责任印制 彭志环◆ 人民邮电出版社出版发行北京市丰台区成寿寺路11号邮编 100164电子邮件 315@ptpress.com.cn网址 http://www.ptpress.com.cn三河市君旺印务有限公司印刷◆开本:787×1092 1/16印张:18.75字数:459千字2018年9月第2版2018年9月河北第1次印刷读者服务热线:(010)81055256 印装质量热线:(010)81055316反盗版热线:(010)81055315内容提要

本书系统地讲解多媒体技术以及应用。全书共分12章,内容在第1版的基础上,进行了全面的更新,分别介绍多媒体基本概念、数字音频处理、视觉信息处理、多媒体数据压缩与编码技术、多媒体数据处理的技术标准、多媒体系统结构、超文本与超媒体技术、多媒体数据库技术、虚拟现实技术、流媒体技术、多媒体信息安全技术、多媒体应用开发环境及实例。本书理论与实践相结合,内容系统、完整,实例可操作性强。

本书可作为高等院校计算机科学与技术、软件工程、通信工程等相关专业本科生和研究生的教材,也可供从事多媒体技术研究和开发的工程技术人员参考使用。第2版前言

本书第1版是普通高等教育“十一五”国家级规划教材,江苏省精品教材。该书自2007年由人民邮电出版社出版以来,已重印十余次。该书深入浅出,理论与实践相结合,被许多高校选作教材,深受师生喜爱。

通过对读者的跟踪调查,读者选择《多媒体应用技术》一书作为教材或参考资料,大体有以下原因。(1)通俗易懂。作者在参加各类学术会议时,经常会碰到使用过该书的老师,他们普遍认为该书基础部分介绍得比较清晰,通俗易懂,特别适合选作本科生教材。不少读者也认为,该书“用作课本,挺好”“概念性的介绍比较清晰”。(2)系统全面。不少读者反映,该书“内容比较全面,可以系统地学习”“内容覆盖比较广泛。(3)理论与实践相结合。不少读者认为,该书理论与实践相结合,除了可以帮助自己了解多媒体技术的基本概念,掌握各种技术和标准外,还有助于自己掌握多媒体信息处理的软件平台,直接将所学知识用于工程实践。

近10年来,许多读者纷纷向编辑部或者作者发来E-mail或者打来电话,建议该书修订再版,并提出了十分中肯的意见。针对读者的意见及使用过的学生反馈,修订后的《多媒体应用技术》有以下几个显著特点。(1)强调基础,培养素质,突出“兴趣”。修订后的教材强调多媒体技术基础知识的介绍,力求做到层次分明、条理清晰、难易适度,有利于学生自主学习。(2)理论适度,注重实践,体现实用性。本书既注重理论、方法和标准的介绍,又兼顾案例分析和具体技术的讨论,把学生需要掌握的基本音频、视频等媒体处理技术作为实例贯穿全书,力求重点培养学生在多媒体技术方面的应用能力。本书在系统介绍基础知识的同时,特别突出了实际动手能力的培养,通过应用软件平台介绍、实例操作和作品展示等方式来强化学生的动手能力。(3)更新内容,加入近期多媒体技术的发展来增强实用性。近年来这一领域得到了很快的发展,出现了很多新的应用。在本书的教学实践中,有老师提出“多媒体技术发展很快,我每次上课也会补充一些新内容”,所以本书在修订时丰富和更新了各章的内容,加入了最新的标准,重写了语音识别、多媒体数据库等内容,替换和加入了Unity 3D、Java多媒体应用等章节。

本书包含三部分,共12章。

第1部分(第1~6章)为基础部分。该部分系统介绍了多媒体技术相关的概念、应用背景、主要内容与核心技术。第1章为多媒体技术概述,主要介绍了多媒体技术的相关概念;第2、3章为数字音频处理、视觉信息处理,分别介绍了主要听觉媒体和视觉媒体的处理方法;第4、5章为多媒体数据压缩与编码技术、多媒体数据处理的技术标准,重点介绍了图像及视频的编码及其标准;第6章为多媒体系统结构,在介绍多媒体系统体系结构的同时,也介绍了设计多媒体系统时涉及的主要软硬件。

第2部分(第7~11章)为应用部分。该部分结合实例,从文本、图形、流媒体和信息安全角度介绍了多媒体技术应用及开发实例。其中第7、8、9章介绍超文本与超媒体技术、多媒体数据库技术和虚拟现实技术,第10章介绍流媒体技术,第11章讲解多媒体信息安全技术。

第3部分(第12章)主要是多媒体应用开发环境及实例介绍,具体介绍了使用Java进行多媒体应用软件设计,实际上C++、Delphi等也可以实现相似应用。

由于“多媒体技术”课程的实践性很强,因此,实验甚至课程设计是必不可少的。针对不同的教学对象,建议将实验分为3个层次。第一层次主要侧重于验证性实验,以音频、视频、图像、动画等媒体制作工具软件(如Photoshop、Audition、Premiere、3ds Max等)应用为主,目的是帮助读者通过这些软件的运用加深对多媒体技术概念的理解。第二层次主要侧重于设计性实验,以Visual C++和Java等语言及开发包为主,目的在于帮助读者掌握图形、图像、音频、视频、动画等的简单处理方法,为下一步学习打下基础。第三层次主要侧重于综合性实验,也以Visual C++ 和Java等语言及开发包为主,但实验内容可提升至简易视频监控、流媒体平台的设计,甚至可扩展至毕业设计。因限于篇幅,这部分内容并未一一介绍,有兴趣的读者可以参阅相关的编程书籍。通过本书的学习,读者除了了解多媒体技术的基本概念,掌握各种技术原理外,还将具备初步的应用系统设计能力,能够直接将所学知识用于工程实践。

本书第1版由龚声蓉教授、王林副教授、刘纯平教授和陆建德教授共同编写。第2版由龚声蓉教授、刘纯平教授、季怡副教授和王林副教授共同编写和修订,其中第1、4、5、6、8、9、12章由龚声蓉和季怡编写,第7、10、11章由王林编写,第2、3章由刘纯平编写,最后由季怡统稿。本书在编写过程中得到了苏州大学计算机科学与技术学院的大力支持,复旦大学的吕智慧老师也给本书提供了中肯的意见和建议,在此表示感谢。本书编写过程中参考了国内出版的相关书籍和论文,对所引用书籍和论文的作者深表感谢。

由于编者水平有限,加上多媒体技术本身发展迅速,书中难免有不足和不当之处,恳请读者批评指正。编者2018年7月第1章 多媒体技术概述

本章在介绍媒体概念的基础上,重点介绍多媒体技术的概念及特征、多媒体技术的发展、多媒体技术的应用领域,以及多媒体研究的主要内容与核心技术。1.1 多媒体技术的概念及特征

任何系统理论的产生,都是为了满足人们的需求或需要。计算机科学技术与其所属的各个分支学科也是如此。当人们朝夕面对的计算机屏幕始终是呆板的文本时,人类的想象力和创造性又一次发挥得淋漓尽致。

首先,人们让计算机发出“动听的声音”。这种“数字”声音简单到经过键盘就可以编辑和改变的地步。接着,人们进行各种探索,使计算机的音频处理理论,以及相关的软件、硬件技术得到长足的进步。

随后,人们探索是否可以让计算机展示图片。经过对显示系统的改造,人们在计算机屏幕上呈现丰富多彩的画面,具有广泛发展前景的计算机图像处理技术由此诞生。

后来,人们利用计算机进行各种各样的探索和尝试,逐渐发展起来图形处理技术、CAD技术、动画技术、视频捕捉技术、视频编辑回放技术、虚拟现实技术和增强现实技术等。

这些具有巨大影响力的技术的发展和融合,只不过是最近30多年的事情。伴随着这些技术不断进步的脚步,计算机科学技术的一个非常具有活力的分支—多媒体技术诞生。在介绍多媒体技术的概念之前,我们首先介绍一下媒体与多媒体的概念。1.1.1 媒体“媒体”即媒介、媒质,是信息的载体,是一种传播、表达信息的方法和手段。国际电信联盟(ITU)根据信息被人们感觉、表示、实现存储或进行传输的载体不同,将媒体分为如下6类:一是感知媒体(Perception Medium),指人们的感觉器官所能感觉到的媒体,如人类的各种语言、音乐,自然界的各种声音、图形、图像,计算机系统内的数据、文本等均属于感知媒体。二是表达媒体(Representation Medium),是为了加工、处理和传输感知媒体而通过人工研究、构造出来的媒体,主要用以定义信息的特性。表达媒体以语音编码、图像编码和文本编码等形式来描述,在未来,人们也期望进一步编码和重现触觉、听觉和嗅觉,甚至脑波信号。三是呈现媒体(Presentation Medium),指感知媒体与电信号间相互转换用的媒体,即呈现信息或获取信息的物理设备。呈现媒体有显示器、扬声器、打印机、VR头盔等输出类设备,以及键盘、鼠标器、扫描器、话筒和摄像机等输入类设备。四是存储媒体(Storage edium),指存储表达媒体数据(感知媒体数字化后的代码)的物理设备,如光盘、磁盘、磁带、存储卡,以及应用越发广泛的云存储等。五是传输媒体(Transmission Medium),指媒体传输用的一类物理载体,如同轴电缆、光缆、双绞线、无线电链路等。六是交换媒体(Exchange edium),指在系统之间交换数据的媒体,它们可以是存储媒体、传输媒体,也可以是两者的结合。

这些不同层次的“媒体”为多媒体技术的诞生和发展提供了基本的空间和舞台。在这6类媒体中,感知媒体是在多媒体应用中呈现给用户的媒体元素,主要包括如下几个方面。

1. 文本

文本(Text)包含字母、数字、字、词语等基本元素。多媒体系统除具备一般的文本处理功能外,还可应用人工智能技术对文本进行识别、理解、摘编、翻译、发音等复杂处理。超文本是用超链接的方法,将各种不同空间的文字信息组织在一起的网状文本,是超媒体文档不可缺少的组成部分。超文本是对文本索引的一个应用范例,它能在一个或多个文档中快速地搜索和查询特定的文本内容。

2. 图形

图形(Graph)是多媒体中的静态可视元素之一,在计算机中一般是采用算法语言或某些应用软件生成的矢量图(Vector Drawn)的形式来表达的。矢量图具有体积小、线条圆滑变化的特点,是由一系列线条来描述的图形,适用于直线、方框、圆或多边形,以及其他可用角度、坐标、距离来表示的图形。它常常被用于框架结构的视觉处理,如计算机辅助设计(CAD)系统常用矢量图来描述十分复杂的几何图形。

3. 图像

图像(Image)也是多媒体的一种静态可视元素,其基本形式为位图(Bitmap)。位图由图像中的众多像素组成,每个存储位定义了各个像素单元的颜色和亮度。位图的描述与分辨率、颜色种数有关,分辨率与色彩位数越高,图像质量就越高,占用存储空间也就越大。

4. 视频

在多媒体技术中,视频(Video)是一类重要的媒体,属于动态可视元素。图像与视频是两个既有联系又有区别的概念。一般而言,静止的图片被称为图像(Image),动态的影视图像被称为视频(Video)。静态图像的输入要靠扫描仪、数码照相机等外部设备,而视频信号的输入需要用到摄像机、录像机、影碟机、电视接收机等可以输出连续图像信号的设备。

5. 音频

音频(Audio)是指在15~20000Hz频率范围内连续变化的波形。音频技术在多媒体中的应用极为广泛,多媒体涉及多个方面的音频处理技术,如:音频采集,即把模拟信号转换成数字信号;语音编/解码,即把语音数据进行压缩编码、解压缩;音乐合成,即利用音乐合成芯片,把乐谱转换成乐曲输出;文本/语音转换,即将计算机的文本转换成声音输出;语音识别,即让计算机能够听懂人类的语音,并进行交互。

6. 动画

动画(Animation)是采用计算机动画软件创作并生成的一系列可供实时演播的连续画面,属于一种动态可视媒体元素。动画和视频信号之所以具有动感的视觉效果,是因为人的眼睛具有一种“视觉暂留”的生物特点,在观察过物体之后,物体的映像会在人眼的视网膜上保留短暂的时间,这样,当一系列略微有差异的图像快速播放时,人们会产生一种物体在做连续运动的感觉。1.1.2 多媒体

在内涵上,“多媒体”(Multimedia)本身并不应该是一个名词,而是一个形容词,它只能被用作定语。因而,单独说多媒体是没有意义的,只有将其与名词相联系(如多媒体终端、多媒体系统)才是正确的说法。在绝大多数场合,多媒体指的是多媒体技术,即指能够同时获取、处理、编辑、存储和回放两种或者两种以上不同类型信息媒体的技术。这些信息媒体包括文字、声音、图形、图像、动画、视频等,它一般不是指多种媒体本身,而主要是指处理和应用的一整套技术手段。

从技术角度来说,多媒体是计算机综合处理文本、图形、图像、音频、视频等多种媒体信息,使多种信息建立逻辑连接,集成为一个系统并具有交互性和实时性的崭新技术。它是一种迅速发展的综合性电子信息技术,已渗透到相关领域的方方面面,给人们的工作、生活和娱乐带来了深刻的变革。1.1.3 多媒体技术的基本特征

1. 多样性

人类对信息的接收和产生主要在5个感知空间,即视觉、听觉、触觉、嗅觉和味觉,其中前3者占了95%以上的信息量。借助于这些多感知形式的信息交流,人类对信息的处理可以说是得心应手。但是,计算机以及与之相类似的一系列设备,都远远没有达到人类感知能力的水平。在许多方面,人类只能使用改造或变形后的信息,而且信息只能按照特定的形态才能被加工处理,才能被理解。可以说,在信息交互方面,计算机还处于初级阶段,这一方面在最近几年得到了一定的发展。

多媒体技术就是要把机器处理的信息多样化或多维化,使之在信息交互的过程中,具有更加广阔和更加自由的空间。多媒体信息多维化不仅仅是指捕获或输入,而且包括回放或输出,目前主要涉及视觉和听觉两个方面,触觉、味觉、嗅觉等信息有待于将来在虚拟现实系统中进一步研究。通过对多维化信息进行变换、组合和加工,可以大大丰富信息的表现力。

2. 集成性

早期多媒体中的各项技术都可以单一使用,但很难有很大的作为,因为它们是单一、零散的,如单一的图像、声音、交互技术等,表现为信息空间的不完整。例如,仅有静态图像而无动态视频,仅有语音而无图像等。这些都限制了信息空间的组织,也限制了信息被有效使用。同样,信息交互手段的单调性制约了多媒体应用的进一步需求。

因此,多媒体的集成性主要表现在两个方面,即多种信息媒体的集成及处理这些媒体的设备集成。对前者而言,各种信息媒体尽管可能是多通道的输入或输出,但应该成为一体。这种集成包括信息的多通道统一获取、多媒体信息的统一存储与组织、多媒体信息表现合成等各方个面。对于后者而言,集成指的是多媒体的各种设备应该成为一体。从硬件角度来说,多媒体应该具有能够处理多媒体信息的高速或并行的CPU+GPU系统、大容量的存储系统,以及外设、宽带的通信网络接口等。从软件角度来说,多媒体应该有集成一体化的多媒体操作系统,适于多媒体信息管理、使用的软件系统,以及高效的各类应用软件等。同时多媒体还要在网络的支持下,利用云技术,集成构造出支持广泛信息应用的信息系统等。

3. 交互性

交互性将向用户提供更加有效地控制和使用信息的方法和手段,同时也为多媒体应用开辟更加广阔的领域。交互可以增加人们对信息的注意力和理解力,延长信息保留的时间。但在单一的文本空间中,这种交互的效果和作用较差,人们只能“使用”信息,很难做到自由地控制和干预信息的处理。当引入交互性后,“活动”本身作为一种媒体,介入信息转变为知识的过程。借助于活动,人们可以获得更多的信息,改变使用信息的传统方法。

4. 实时性

实时性是指在多媒体系统中音频、动画和视频等对象是和时间密切相关的,多媒体技术必然要提供对这些实际媒体的实时处理能力。例如,在视频会议系统中传输的声音和图像都应尽量避免延时、断续或停顿,否则发言者要表达的内容就可能出现歧义或根本就没有意义。

5. 非线性

一般而言,使用者对非线性的信息存取需求比对线性存取大得多,这种现象在流媒体的编辑与合成时尤为突出。而在查询系统中,传统的查询系统都是按线性方式检索信息,不符合人类的联想记忆方式。多媒体信息系统克服了这个缺点,它用非线性的结构构成表达特定内容的信息网络,使人们可以有选择地查询自己感兴趣的多媒体信息。

总之,多媒体有许多特征,但其最显著的特征是具有媒体的多样性、集成性和交互性。1.2 多媒体技术的发展

多媒体技术的发展是社会需求的结果,是社会不断推动的结果,是计算机技术不断成熟和扩展的结果。

1984年,美国Apple(苹果)公司开创了用计算机进行图像处理的先河,在世界上首次使用Bitmap(位图)的概念对图像进行描述,从而实现了对图像进行简单的处理、存储和传送等。苹果公司对图像进行处理的计算机是该公司自行研制和开发的“Apple”(苹果)牌计算机,其操作系统名为Macintosh,也有人把“苹果”计算机直接叫作Macintosh计算机。在当时,Macintosh操作系统首次采用了先进的图形用户界面,体现了全新的Windows(窗口)概念和Icon(图标)程序设计理念,并且建立了新型的图形化人机接口标准。

1985年,美国Commodore(霍顿)公司将世界上首台多媒体计算机系统展现在世人面前,该计算机系统被命名为Amiga。在随后的展示会上,该公司展示了自己研制的多媒体计算机系统Amiga的完整系列产品。当时,计算机硬件技术有了较大的突破,为解决大容量存储的问题,激光只读存储器CD-ROM问世,为多媒体数据的存储和处理提供了理想的条件,并对计算机多媒体技术的发展起到了决定性的推动作用。在这一时期,CDDA(Compact Disk Digital Audio)技术也已经趋于成熟,使计算机具备了处理和播放高质量数字音响的能力。这样,计算机的应用领域又多了一种媒体形式,即音乐处理。

1986年3月,荷兰PHILIPS(飞利浦)公司和日本SONY(索尼)公司共同制定了交互式激光光盘(Compact Disc Interactive, CD-I)系统标准,使多媒体信息的存储趋于规范化和标准化。CD-I标准允许一片直径5英寸的激光盘上存储650MB的数字信息量。

1987年3月,RCA公司制定了DVI(Digital Video Interactive)技术标准,该技术标准在交互式视频技术方面进行了规范化和标准化,使计算机能够利用激光光盘以DVI标准存储静止图像和活动图像,并能存储声音等多种模式的信息。DVI标准的问世,使计算机处理多媒体信息具备了统一的技术标准。同年,美国Apple(苹果)公司开发了Hyper Card超级卡,该卡安装在苹果计算机中,使该型计算机具备快速、稳定地处理多媒体信息的能力。

1990年11月,美国Microsoft(微软)公司和包括荷兰PHILIPS(飞利浦)公司在内的一些计算机技术公司成立“多媒体个人计算机市场协会”。该协会的主要任务是对计算机的多媒体技术进行规范化管理和制定相应的标准。该协会制定了多媒体计算机的“MPC标准”。该标准对计算机增加多媒体功能所需的软硬件进行了最低标准的规范、提供量化指标,以及多媒体的升级规范等。

1991年,多媒体个人计算机市场协会提出MPC1标准。全球计算机业共同遵守该标准所规定的各项内容,从而促进了MPC的标准化和生产销售,使多媒体个人计算机成为一种新的流行趋势。

1993年5月,多媒体个人计算机市场协会公布了MPC2标准。该标准根据硬件和软件的迅猛发展状况做出较大的调整和修改,尤其对声音、图像、视频和动画的播放,以及Photo CD做出新的规定。此后,多媒体个人计算机市场协会演变成多媒体个人计算机工作组(Multimedia PC Working Group)。

1995年6月,多媒体个人计算机工作组公布了MPC3标准。该标准为适合多媒体个人计算机的发展,又提高了软件、硬件的技术指标。更为重要的是,MPC3标准制定了视频压缩技术MPEG的技术指标,使视频播放技术更加成熟和规范化,并已指定了采用全屏幕播放,使用软件进行视频数据解压缩等技术标准。同年,由美国Microsoft(微软)公司开发的功能强大的Windows 95操作系统问世,使多媒体计算机的用户界面更容易操作,功能更为强劲。随着视频、音频压缩技术日趋成熟,高速的奔腾系列CPU开始“武装”个人计算机,个人计算机已经占据市场主导地位,多媒体技术得到了蓬勃发展。国际互联网络Internet的兴起,也促进了多媒体技术的发展,更新更高的MPC标准相继问世。

1995年,索尼公司推出了第一代Play Station,任天堂公司、微软公司也在2010年分别推出了Nintendo Wii、XBOX系列的多功能游戏机系列,推动交互技术等多方面的发展。其中XBOX360系列还引入了3D Kinect摄像头,更加丰富了多媒体技术的内容,加入了众多新应用。

近年来,虚拟现实(Virtual Reality)有了长足的发展,2016年,市场上有HTC公司的Vive Pre、Facebook收购的Oculus公司的Rift、三星的Gear VR、索尼的Play Station VR等,其中部分头盔式产品除了3D显示部分和内置处理器外,已经拥有更为先进的头部追踪和运动感知能力,可与外部相机连接,以更精确地追踪头部运动,综合音、像、交互等各方面,给用户沉浸式感受。除娱乐、游戏等功能外,这些产品还可以被广泛应用于教育、科研、医疗等领域。

目前,多媒体技术的发展趋势是逐渐把计算机技术、通信技术和大众传播技术融合在一起,建立更广泛意义上的多媒体平台,实现更深层次的技术支持和应用。从多媒体应用方面看,多媒体技术有以下几个发展趋势:从单个PC用户环境转向多用户环境和个性化用户环境;从集中式、局部环境转向分布式、远程环境;从专用平台和系统有关的解决方案转向开放性、可移植的解决方案;多媒体通信从单向通信转向双向通信;从被动的、简单的交互方式转向主动的、高级的交互方式;从改造原有的应用转向建立新的应用。

其实,多媒体技术将越来越多地被应用于生产,协同工作、生产过程可视化等将换来生产率的提高。多媒体技术也将越来越多地被应用于生活和消费,新的多媒体消费产品和应用将不断涌现。1.3 多媒体技术的应用领域1.3.1 娱乐

1. 家庭信息中心

家庭将是未来人们生活、活动甚至工作的主要场所,借助家庭信息中心,人们可以在家中工作、娱乐。人们可以以家庭信息中心实现多种形式的远程交流、收发传真和电子邮件,通过视频通信与亲属或同事面对面地交谈、处理工作事宜,更可以进行更丰富的交互式娱乐和休闲。

2. 视频点播系统

交互式电视会成为电视传播的主要方式。通过增加机顶盒和铺设高速光缆,将有线电视(Cable TV)改造成为交互式电视系统,从而实现视频点播、交互式电视、家庭购物、多人网络游戏等功能。

3. 高清晰电视与数字电视

从开发和生产厂商及应用的角度出发,可以将多媒体计算机分成两大类:一类是家电制造厂商研制的电视计算机(Teleputer),是把CPU放到家电中,通过编程控制管理电视机、音响,有人称它为“灵智”电视(Smart TV);另一类是计算机制造厂商研制的计算机电视(Compuvision),采用微处理器作为CPU,其他设备还有显卡、光盘系统、音响设备及扩展的多窗口系统,有人说它的发展方向是TV-Killer。

4. 影视娱乐业

影视娱乐业采用计算机技术,能满足人们日益增长的娱乐需求,这已经众人皆知了。多媒体技术作为关键手段,把影视娱乐业推向了新的高度。在作品的制作和处理上,其作用发挥得淋漓尽致。

例如,动画片的制作过程就能充分说明计算机技术在影视娱乐业中的作用。动画片经历了从手工绘画到计算机绘画的过程,动画模式也从经典的平面动画发展到体现高科技的三维动画。由于计算机的介入,动画的表现内容更加丰富多彩,更加离奇和更具有刺激性。

随着多媒体技术逐步趋于成熟,在影视娱乐业中使用先进的计算机技术已经成为一种时髦的趋势,大量的计算机特效被用于影视作品中,从而增加了艺术感染力和商业卖点。1.3.2 教育与培训

教育领域是应用多媒体技术最早的领域,也是进展最快的领域。多媒体技术的各种特点比较适合应用于教育。以最自然、最容易接受的多媒体形式使人们接受教育,不但扩展了信息量、提高了知识的趣味性,还增加了人们学习的主动性。近期慕课(Massive Open Online Courses,Mooc)整合课件、视频、在线交互等多种形式的数字化教学资源,形成更多元化的学习工具,为全世界的教育提供了更加丰富的课程资源。

1. CAI——计算机辅助教学

计算机辅助教学(Computer Assisted Instruction,CAI)是多媒体技术在教育领域中应用的典型范例,它是新型的教育技术和计算机应用技术相结合的产物,其核心内容是指以计算机多媒体技术为教学媒介而进行的教学活动。

CAI的表现形式如下。(1)利用数字化的声音、文字、图片及动态画面,展现各学科中的可视化内容,意在强化形象思维模式,使概念和原理更易于接受。(2)在学校教育中,以“示教型”课堂教学为基本出发点,展示形象、逼真的自然现象、自然规律、科普知识,以及各个领域里的尖端技术等。(3)利用CAI软件本身具备的互动性,提供自学机会。以传授知识、提供范例、自我上机练习、自动识别概念和答案等手段展开教学,使受教育者在自学中掌握知识。

2. CAL——计算机辅助学习

计算机辅助学习(Computer Assisted Learning,CAL)着重体现在学习信息的供求关系方面。CAL向受教育者提供有关学习的帮助信息。在计算机辅助下,受教育者可以检索与某个科学领域相关的教学内容,查阅自然科学、社会科学及其他领域中的信息,征求疑难问题的解决办法,寻求各个学科之间的关系和探讨人们共同关心的问题等。

3. CBI——计算机化教学

计算机化教学(Computer Based Instruction,CBI)是近年来发展起来的,它代表了多媒体技术应用的较高境界。CBI将使计算机教学手段从“辅助”位置走到前台,成为主角,必将成为教育方式的主流和方向。

CBI计算机化教学的主要特点如下。(1)充分运用计算机技术,将全部教学内容包容到计算机所做的工作中,为受教育者提供海量信息,这就是所谓“全程多媒体教学”的概念。(2)教学手段彻底更新,计算机教学手段从辅助变为主导,教师的作用发生转移,从宣讲方式转移到解答疑难问题和深化知识点上。(3)强化教师与学生之间的互动关系,在教育者与受教育者之间建立学术和观念的交流界面,在共同的计算机平台上实现平等交流。(4)强化素质教育,提高主动参与意识,强化实际动手能力,提高学生在计算机方面的应用技巧。

4. CBL——计算机化学习

计算机化学习(Computer Based Learning,CBL)是充分利用多媒体技术提供学习机会和手段的方式。在计算机技术的支持下,受教育者可在计算机上自主学习多学科、多领域的知识。实施CBL的关键,是在全新的教育理念指导下,充分发挥计算机技术的作用,以多媒体的形式展现学习的内容和相关信息。

5. CAT——计算机辅助训练

计算机辅助训练(Computer Assisted Training,CAT)是一种教学的辅助手段,它通过计算机提供多种训练科目和练习,使受教育者快速理解和消化所学知识,充分理解和掌握重点、难点。

CAT的主要作用如下。(1)提出训练科目和训练要求。(2)对受教育者提供自主练习的机会和题目。(3)利用自动识别功能,对受教育者所接受的训练做出评价。(4)提供训练题目的最佳方案,激发受教育者的主动思维和识别能力。(5)通过综合练习,提高受教育者的综合能力,从而提高素质。

6. CMI——计算机管理教学

计算机管理教学,(Computer Managed Instruction,CMI)主要是利用计算机技术解决多方位、多层次教学管理的问题。教学管理的计算机化,可大幅度提高工作效率,使管理更趋科学化和严格化,大幅提高教学管理水平。CMI主要管理的对象有以下几个。(1)监测教学活动是否符合教学大纲及相关的教学规定。(2)监督教学进度,反馈教学信息,为教学决策提供参考意见。(3)指导和规范受教育者的学习,评价学习效果。(4)教学材料、教学计划、受教育者的学习成绩等的保存和管理。

在实施CMI时,计算机技术的应用强度是一个关键问题。计算机介入管理越多,效率越高,效果越明显,同时还可减少人为因素造成的纰漏和疏忽。1.3.3 电子出版物

多媒体光盘可以把软件、游戏、电影、书籍、杂志和报纸等以电子出版物的形式出版、发行,供用户通过多媒体PC或其他多媒体终端设备阅读和使用。这类出版物不仅可以被静态阅读,而且可以进行动态执行,演示出活动的效果,使出版物的表达和表现力更加丰富与生动。近年来,与网络相结合的多媒体网络出版活动越来越多,产生了良好的效果,无论时效性、消息传递效果还是信息的容量,都大大优于传统出版物。1.3.4 咨询、信息服务与广告

由于多媒体信息有非常易于理解、直观、生动和表现力强等诸多优点,其更适合被用作制作信息咨询系统,如城市道路查询、航班咨询、专业业务咨询系统等。

1. 平面设计与广告业

多媒体技术被广泛用于商业与公益广告。从影视广告、招贴广告,到市场广告、企业广告,其绚丽的色彩、变化多端的形态、特殊的创意效果,不但使人们了解了广告的意图,而且得到了艺术享受。近年来,由于Internet国际互联网的兴起,广告范围更为扩大,表现手段更为多媒体化,人们接受的信息量成倍增长。

多媒体技术在商业广告领域中的作用有以下几个。(1)提供最直观、最易于接受的宣传方式,在视觉、听觉、感觉等方面宣扬广告意图。(2)提供交互功能,使消费者能够了解商业信息、服务信息,以及其他相关信息。(3)提供消费者的反馈信息,促使商家及时改变营销手段和促销方式。(4)提供商业法规咨询、消费者权益咨询、问题解答等服务。

随着社会的发展和经济的增长,广告广受人们重视,从表现手法到信息反馈,广告几乎已离不开多媒体技术,这是商业乃至于整个社会发展的必然结果。

2. Internet信息

Internet的兴起与发展,在很大程度上对多媒体技术的进一步发展起到了积极的作用。人们在网络上传递多媒体信息,以多种形式互相交流,为多媒体技术的发展创造了合适的土壤和条件。

多媒体技术应用在互联网上,有如下独特之处。(1)网络信息多元化,其中包括视觉信息和听觉信息等。(2)在时间和空间上没有限制,人们可以在任何时间、任何地点以多媒体形式接收和发送信息。(3)发挥人、机各自的优势,充分利用网络资源,集网络上的众家之长,补己之短。还可以利用网络的多媒体功能,从事复杂而丰富的经济活动和社会活动。(4)建立网络虚拟世界,使网络用户在多媒体平台上享受虚拟世界带来的高等教育、教学实践、图书、音乐、绘画、实验等。(5)为人们提供展示自己实力和能力的机会和条件。在Internet上,个人可以以多媒体形式向全世界展示自己。

3. 旅游业

旅游是人们享受生活的一种重要方式,多媒体技术应用于旅游业,充分体现了信息社会的特点。通过多媒体展示,人们可以全方位了解这个星球上各个角落发生的事情。

多媒体技术应用于旅游业,为旅游业带来以下明显变革。(1)从介绍旅游景点的印刷品,过渡到数字化载体—光盘。大量的信息、逼真的图片、动听的解说,犹如亲临其境一般,在很大程度上强化了宣传效果和力度。(2)通过多媒体技术,真实地反映各地的风土人情、文化背景、语言和音乐,全方位地展现自然、生活与社会活动。(3)提供检索、咨询等互动信息,搭起旅游者与旅游公司沟通的桥梁,提高服务质量。(4)数字化的信息便于加工、整理和保存,更便于更新,从而提高旅游业顺应市场变化的能力,以及增加对市场反馈信息的敏感度。(5)扩大宣传范围和力度。便于携带和扩散的数字化光盘,使旅游信息通过Internet、航空和电信,前所未有地快速“到达”世界的各个角落。1.3.5 工业控制与科学研究

1. 工业控制

现代化企业的综合信息管理和生产过程的自动化控制,都离不开对多媒体信息的采集、监视、存储、传输,以及综合分析处理、管理。应用多媒体技术来综合处理多种信息,可以做到信息处理综合化、智能化,从而提高工业生产和管理的自动化水平。

多媒体技术在工业生产实时监控系统中,尤其在生产现场设备故障诊断和生产过程参数监测等方面,有着非常重大的实际应用价值。特别是在一些危险环境中,多媒体实时监控系统将起到越来越重要的作用。

2. 科学计算可视化

将多媒体技术用于科学计算可视化,可把本来抽象、枯燥的数据用三维图像动态显示,使研究对象的内在特性与其外形变化同步显示。将多媒体技术用于模拟实验和仿真研究,会大大促进科研与设计工作的发展。

3. 过程模拟领域

在设备运行、化学反应、火山喷发、海洋洋流、天气预报、人体演化、生物进化等自然现象的诸多方面,采用多媒体技术模拟其发生的过程,使人们能够轻松、形象地了解事物变化的原理和关键环节,建立必要的感性认识,使复杂、难以用语言准确描述的变化过程变得形象而具体。

事实证明,人们更乐于接受感觉得到的事物。多媒体技术的应用,有利于人们揭开特定事物的变化规律、了解变化的本质。1.3.6 医疗影像与远程诊断

通过多媒体通信网络,人们可以建立远程学习系统和远程医疗保健系统。远程医疗保健可以使处于偏远地区的病人同中心城市中的病人一样及时得到专家的诊断。

现代先进的医疗诊断技术的共同特点是以现代物理技术为基础,借助于计算机技术,对医疗影像进行数字化和重建处理。计算机在成像过程中起着至关重要的作用。随着临床要求的不断提高及多媒体技术的发展,社会上出现了新一代具有多媒体处理功能的医疗诊断系统。多媒体医疗影像系统在媒体种类、媒体介质、媒体存储及管理方式、诊断辅助信息、直观性和实时性等方面,都使传统诊断技术相形见绌,引起医疗领域的一场重大变革。1.3.7 多媒体办公系统

多媒体办公系统是视听一体化的办公信息处理和通信系统。它主要有以下功能。(1)办公信息管理,将文件、档案、报表、数据、图形、音像资料等各种信息进行加工、整理、存储,形成可共享的信息资源。(2)召开可视的电话会议、电视会议。(3)进行多媒体邮件的传递。

多种办公设备与多媒体系统的集成,加上对云资源的运用,简化了办公流程,真正实现了办公自动化。1.3.8 多媒体技术在通信系统中的应用

多媒体通信是20世纪90年代迅速发展起来的一项技术。一方面,多媒体技术使计算机能同时处理视频、音频和文本等多种信息,提高了信息的多样性;另一方面,网络通信技术取消了人们之间的地域限制,提高了信息的瞬时性。二者结合所产生的多媒体通信技术把计算机的交互性、通信的分布性及电视的实效性有效地融为一体,成为当前信息社会的一个重要标志。

多媒体通信涉及的技术面极为广泛,包括人机界面、数字信号处理、大容量存储装置、数据库管理系统、计算机结构、多媒体操作系统、高速网络、通信协议、网络管理及相关的各种软件工程技术。目前,多媒体通信主要应用于可视电话、视频会议、远程文件传输、浏览与检索多媒体信息资源、多媒体邮件及远程教学等方面。1.4 多媒体研究的主要内容与核心技术

要想把一台普通的计算机变成具有多媒体计算功能的计算机,要解决多种媒体的数字化、压缩、通信传输、存储、同步回放等一系列的关键技术问题。综合起来讲,多媒体技术的核心问题应当是:多媒体信号数字化与计算机获取技术;多媒体数据压缩编码和解码技术;多媒体数据的实时处理和特效技术;多媒体数据的输出与回放技术。

如何高效地解决如上问题,也是多媒体相关研究领域及本课程研究的核心问题。

多媒体技术的研究涉及如下众多领域。

1. 多媒体数据压缩编解码技术

在多媒体计算机系统中要表示、传输和处理大量的声音、图像甚至影像视频信息,其数据量之大是非常惊人的,而且信息品种多、实时性要求高,这些都给数据的存储、传输及加工处理均带来巨大的压力。因此,在采用新技术、增加CPU处理速度、存储容量和提高通信带宽的同时,还需研究高效的数据压缩编解码技术,并加入使用专用图形处理器(Graphics Processing Unit, GPU)专门针对图形图像信息的高速处理,实现远远高于基于CPU的传统算法效率。

数据压缩编解码技术作为多媒体技术中最为关键的核心技术,在技术本身和应用方面近年来都取得了引人注目的进展,而其中图像压缩编解码技术更是如此。

2. 多媒体数据存储技术

随着多媒体与计算机技术的发展,多媒体数据量越来越大,对存储设备的要求越来越高。因此,高效快速的存储设备是多媒体技术得以应用的基本部件之一。

3. 多媒体数据库技术

多媒体数据库是一个由若干多媒体对象所构成的集合。这些数据对象按一定的方式被组织在一起,可为其他的应用所共享。多媒体数据库管理系统则负责完成对多媒体数据库的各种操作和管理功能,包括对数据库的定义、操作和控制等传统数据库功能。此外,还必须解决一些新的问题,如海量数据的存储功能、信息提取功能等。

多媒体对象是异构型的,是由若干类型不一且具有不同特点的媒体对象复合而成的。它们的数据量大,内部存在着多种复杂的约束关系,其复杂程度远远高于传统的数据对象,特别是与传统应用相比,多媒体应用有着许多新的需求,如对连续媒体对象的实时处理、对数据对象内容的分析等。有鉴于此,传统的数据库已不适用于多媒体信息管理,因此必须研究新的多媒体数据库技术。这种新的多媒体数据库系统应当能够:支持多种媒体数据类型及多个媒体对象的多种合成方式;能够为大量数据提供高性能的存储管理;支持传统的数据库管理系统功能;支持多媒体信息提取的功能;能为用户提供丰富而便捷的交互手段。

多媒体数据库要研究的内容主要有多媒体数据模型、体系结构、时空编组、数据模拟、查询处理及用户接口技术等。一般可从以下3个方面进行。(1)对现有的关系数据库模型进行扩充。(2)研究面向对象数据库等适应多媒体数据的新型数据库。(3)研究超文本/超媒体模型数据库。

4. 超文本和超媒体技术

超文本和超媒体技术是一种模拟人脑的联想记忆方式,把一些信息块按照需要用一定的逻辑顺序链接成非线性网状结构的信息管理技术。超文本技术以节点作为基本单位,这种节点要比字符高出一个层次。由链把节点链接成网状结构,即非线性文本结构。这种已组织成网的信息网络即是超文本。随着计算机技术的发展,节点中的数据不再仅仅是文字,还可以是图形、图像、声音、动画、动态视频、计算机程序或它们的组合等。由于超文本的节点和链的形式可以被十分容易地推广到多媒体,可以是基于包含不同媒体的节点,所以它自然地成了支持多媒体数据管理的天然技术。同时多媒体信息的引入在某种程度上又为超文本带来不同凡响的效果,大大改善了信息的交互程度和表达思想的准确性。将多媒体信息引入超文本,最终形成了超媒体的概念。

5. 智能多媒体技术

在1993年底的多媒体系统和应用国际会议上,英国的两位科学家首次提出了智能多媒体的概念,引起了人们的普遍关注和研究兴趣。正如人工智能被看作一种高级计算一样,智能多媒体应被看作一种更加拟人化的高级智能计算技术。多媒体技术的进一步发展迫切需要引入人工智能,要利用多媒体技术解决计算机视觉和听觉方面的问题,必须引入知识,这必然要引入人工智能的概念、方法和技术。例如,电影画面与音乐有机结合所产生的整体艺术效果,远远超出孤立画面与音乐效果的简单组合。智能多媒体中的知识表示和推理,必然反映多媒体信息空间的非线性特性,而仅仅依靠简单地排列组合多媒体信息的方法,是不可行的。多媒体技术与人工智能的结合必将把两者的发展推向一个崭新的阶段。

6. 多媒体信息检索技术

多媒体信息检索是根据用户的要求,对图形、图像、文本、声音、动画和视频等信息进行检索,以得到用户所需的信息。基于特征的多媒体信息检索系统有着广阔的应用前景,它将被广泛地应用于电子会议、远程教学、远程医疗、电子图书馆、地理信息系统、计算机支持协同工作等领域。例如,数字图书馆技术可将物理信息转化为数字多媒体形式,通过网络安全地发送给世界各地的用户。计算机使用自然语言查询和概念查询对返回给用户的信息进行筛选,使相关数据的定位更为简单和精确;聚集功能将查询结果组织在一起,使用户能够简单地识别并选择相关的信息;摘要功能能够对查询结果进行主要观点的概括,从而使用户不必查看全部文本就可以确定所要查找的信息。

7. 虚拟现实技术(VR)

虚拟现实技术也被称为“虚拟环境”或“临境”技术,就是采用计算机多媒体技术生成一个逼真的、具有临场感觉的环境,是一种全新的人机交互系统。它可被广泛地应用于模拟训练、科学可视化、军事演习、航天仿真、娱乐、设计与规划、教育与培训、商业等领域。

虚拟现实技术本质上是一种高度逼真地模拟人在现实生活中视觉、听觉、动作等行为的交互技术。它用计算机加上先进的外围设备,模拟生活中的一切,包括过去发生的事件和将要发生的事件。虚拟现实与计算机技术、传感技术、机器人技术、人工智能及心理学等密切相关,是一种高度集成的、综合性极强的技术。

近期,人们还引入了增强现实(Augmented Reality,AR)技术,将摄像机所拍摄到的实景和三维尺度空间建模技术等相结合,达到真实世界和模拟世界的无缝连接,并具有场景融合、实时交互、实时跟踪功能,未来将在医疗、军事、娱乐、旅游、教育等多个领域带来革命性的变革。

8. 人机交互技术(HCI)

人和计算机之间的交互是目前被人们研究最多的问题。计算机能处理和表现越来越多的信息,因此人与计算机之间的交互便显得日益重要。人与计算机之间的信息交流有4种不同的形式,即人—人(通过计算机)、人—机、机—人和机—机。

9. 多媒体网络与通信技术

现代化社会中,人们的工作方式具有群体性和交互性。传统的电信业务如电话、传真等通信方式已不能适应社会的需要,社会迫切要求通信与多媒体技术相结合,为人们提供更加高效和快捷的沟通途径,如提供多媒体电子邮件、视频会议、远程交互式教学系统、视频点播等新型的服务。

多媒体通信是一个综合性技术,涉及多媒体、计算机和通信等领域,长期以来,一直是多媒体应用的一个重要方面。由于多媒体的传输涉及图像、声音和视频数据等多个方面,需要完成大数据量的连续媒体信息的实时传输、时空同步和数据压缩。如语音和视频有较强的实时性要求,它容许出现某些字节的错误,但不能容忍任何延迟;而对数据来说,可以容忍延时,但不能有任何错误,因为即便是一个字节的错误都会改变整个数据的意义。为了给多媒体通信提供新型的传输网络,人们重点发展宽带数字网。它能被用来传输高保真立体声音效和高清晰度电视节目,是多媒体通信的理想环境。

10. 分布式多媒体技术

分布式多媒体技术是多媒体技术、网络通信技术、分布式处理技术、人机交互技术、人工智能技术等多种技术的集成。

分布式多媒体技术具有广泛的应用,包括计算机支持协同工作(CSCW)、远程教育、远程会议、分布式多媒体信息点播、分布式多媒体办公自动化、Internet/Intranet中的分布式多媒体应用和移动式多媒体系统等。其中CSCW是其主要应用领域之一,主要的CSCW应用系统有消息系统、会议系统、合著与讨论系统等,具有分布式、信息共享、多用户界面、连接协调等特征。1.5 本章小结

音乐、广播、电视等单媒体难以满足人们对信息交流和处理的要求,多媒体方式则能和人们自然交流及处理信息。

多媒体技术并非简单地将几个单媒体技术加在一起,而是有机集成多种技术,而形成一个新的多媒体系统。多媒体技术不仅使计算机应用更有效,更接近人类习惯的信息交流方式,而且将开拓前所未有的应用领域,使信息空间走向多元化,使人们思想的表达不再局限于顺序的、单调的、狭窄的范围。多媒体技术为这种自由提供了多维化空间的交互能力。

总之,多媒体技术已成为人们关注的热点之一,多媒体技术将引起信息社会一场划时代的大变革。思考与练习

一、判断题

1. 多媒体办公系统是视听一体化的办公信息处理和通信系统。( )

2. CAI指计算机辅助教学。( )

3. CAL指计算机化学习。( )

4. CBI指计算机化教学。( )

5. CBL指计算机辅助学习。( )

6. CAT指计算机辅助设计。( )

7. CMI指计算机管理教学。( )

二、填空题

1. 国际电信联盟(ITU)将媒体分为_____、______、_____、______、______、______6类。

2. 感知媒体是在多媒体应用中呈现给用户的媒体元素,它主要包括_____、______、_____、______、_____、______等。

3. 多媒体技术在娱乐领域的主要应用包括__________、___________、______________等。

4. 多媒体数据库系统应当能够支持多种媒体数据类型及__________、___________、__________、___________、__________等。

三、简答题

1. 什么是多媒体技术?它有哪些主要特征?

2. 多媒体应用领域主要包括哪些方面?

3. 简述多媒体所涉及的核心问题。

4. 设想一下未来,多媒体技术可能渗透和应用到哪些领域。

5. 试从一两个应用实例出发,谈谈多媒体技术在各应用领域中的重要性。

6. 为什么要研究多媒体数据库技术?研究多媒体数据库可以从哪三方面入手?第2章 数字音频处理

声音是多媒体信息的一个重要组成部分,也是表达思想和情感的一种必不可少的媒体。本章将在介绍模拟音频与数字音频概念的基础上,简要介绍音频的数字化、音频信号编码、语音合成与识别等技术,最后给出在VC++中播放声音的几种方法。2.1 概述

声音是携带信息的重要媒体。研究表明,人类从外部世界获取的信息中,10%是通过听觉获得的,因此声音是多媒体技术研究中的一个重要内容。

如图2.1所示,声音是由物体振动产生的,这种振动引起周围空气压强的振荡,从而使耳朵产生听觉。声音的种类繁多,人的语音是最重要的声音,此外,还有动物、乐器等发出的声音,风声、雨声、雷声等自然声音,以及机器合成产生的声音等。这些声音有许多共同的特性,也有它们各自的特性。在用计算机处理这些声音时,既要考虑它们的共性,又要利用它们各自的特性。图2.1 空气压强振荡的波形

人耳能识别的声音频率(范围在20~20000Hz)通常被称为音频(Audio)信号。音频信号所携带的信息大体上可分为语音(Speech)、音乐和音效3类。语音是指具有语言内涵和人类约定俗成的特殊媒体,如人的发音器官发出的声音范围在80~3400Hz,人说话的信号频率通常为300~3000Hz,就是语音信号。低于20Hz的信号被称为次声波(Subsonic),高于20000Hz的信号被称为超声波(Ultrasonic)。对次声波和超声波,人的耳朵都无法听到。图2.2给出了声音的频率范围。音乐是规范的、符号化了的声音,音效是指人类熟悉的其他声音,如动物发出的声音、机器产生的声音、自然界的风雨雷电声等。音频信号可以携带大量精细、准确的信息。在多媒体系统中,处理的信号主要是音频信号。

声音包含3个要素,即音调、音强和音色,这3个要素与声波参数紧密相关。(1)基频与音调:一个声源每秒钟可产生成百上千个波,通常把每秒钟波峰所产生的数目称为信号的频率,单位用赫兹(Hz)或千赫兹(kHz)表示。例如,一个声波信号在一秒钟内有5000个波峰,则可将它的频率表示为5000Hz或5kHz。图2.2 声音的频率范围

人对声音频率的感觉表现为音调的高低,在音乐中被称为音高。音调正是由频率ω所决定的。音乐中音阶的划分是在频率的对数坐标(20×log)上取等分而得的(见表2.1)。表2.1 音阶(2)谐波与音色:n×ω被称为ω的高次谐波分量,也被称为泛oo音。音色是由混入基音的泛音所决定的,高次谐波越丰富,音色就越有明亮感和穿透力。不同的谐波具有不同的幅值和相位偏移,由此产生各种音色效果。(3)幅度与音强:信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。幅度越大,声音越强。对音频信号,它的强度用分贝(dB)表示。分贝的幅度就是音量。人耳对声音细节的分辨只有在强度适中时才最灵敏。人的听觉响应与强度成对数关系。一般的人只能察觉出3dB的音强变化。在处理音频信号时,绝对强度可以放大,但其相对强度更有意义,一般用动态范围定义,即(4)音宽与频带:频带宽度也被称为带宽,它是描述组成复合信号的频率范围。例如,普通电话容许语音信号通过,带宽约为3.2kHz;高保真度(High-Fidelity,Hi-Fi)声音的频率范围为10~20000Hz,带宽约为20kHz。

客观上,通常用频带宽度、动态范围、信噪比等指标衡量音频信号的质量。音频信号的频带越宽,所包含的音频信号分量越丰富,音质越好。图2.3给出了CD-DA数字音乐、调频(FM)广播、调幅(AM)广播和电话的带宽。图2.3 几种音频业务的带宽

动态范围越大,信号强度的相对变化范围越大,音响效果越好。

声音的质量可以通过信噪比来度量。信噪比(Signal to Noise Ratio,SNR)是有用信号与噪声的平均功率之比的简称,定义为:

信噪比越大,声音质量越好。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载