现代多媒体技术及应用(txt+pdf+epub+mobi电子书下载)


发布时间:2021-01-28 21:28:50

点击下载

作者:张云鹏(编著)

出版社:人民邮电出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

现代多媒体技术及应用

现代多媒体技术及应用试读:

前言

21世纪是知识与信息的社会,是知识经济的时代。多媒体计算机技术正是在此背景下基于计算机、通信和电子技术发展起来的新型学科领域,是目前高效率地掌握知识、获取信息、利用信息、传播信息的有效手段。它的兴起给传统的计算机系统、音频和视频设备带来了方向性的改革,对人们的工作、生活和娱乐产生了深刻的影响。

本书系统地介绍了多媒体技术,主要包括多媒体的概述、发展及应用,一些基本的图像、音频、视频处理软件的使用,数字图像、音频、动画的基础,网络多媒体,多媒体信息的存储以及多媒体与加密技术等内容。本书在内容的组织上符合教学规律和认知规律,反映了多媒体技术学科国内外科学研究的先进成果,正确地阐述了其科学理论和概念,可帮助读者全面了解多媒体技术。

本书深入浅出,覆盖面广。既有丰富的理论知识,又有大量的实战范例及练习题。适合作为计算机公共课基础教材或参考书。对于自学程序设计的计算机爱好者以及从事软件开发和应用的科技人员来说,本书也是极佳的参考。

本书由张云鹏任主编。全书分为4篇共17章,由张云鹏编写,田枫影参与了后期的校订工作。

由于编者水平有限,书中难免存在不当和疏漏之处,恳请读者批评指正。编者2013年8月

基础篇

《道德经》中说:“道可道,非常道;名可名,非常名。”当我们对一个事物的认识发展到一定程度时,反而觉得不好把握它了。几十年来,多媒体领域一直在飞速地发展着,然而“多媒体”却始终没有一个明确的定义。定义就意味着限制,这正反映了多媒体前途不可限量。本书的“多媒体”多限于利用计算机处理文字、图像、声音的技术。强调技术的出现来源于人类的需求,而需求是不断膨胀的;同样,多媒体的出现也来源于人类希望利用多种方式表达信息的需求,而这种需求也在不断地增长。多媒体技术的发展,一定不只限于计算机,不只限于文、图、声。可以想象,未来的世界“万物皆有灵”,或许某一天,你就可以和一棵树谈话、利用墙壁发邮件、通过计算机闻花香了。第1章多媒体基本概念

学习多媒体技术知识前有必要了解一些最基本的概念,这是我们建造“多媒体大厦”的基石。1.1 数据、信息与媒体

数据是记录和描述客观世界的原始记号。信息是经过加工后具有一定意义的数据。信息是主观的,数据是客观的,单纯的数据本身并无实际意义,只有经过解释才能成为有意义的信息。

媒体(Medium)在计算机领域有两种含义:一是指存储信息的实体,如磁盘、光盘、磁带、半导体存储器等,中文译作媒质;二是指传递信息的载体,如数字、文字、声音、图形和图像等,中文译作媒介。多媒体技术中的媒体是指后者。从这个意义来看,媒体在计算机领域中的理解比较狭义。

数据、信息与媒体三者之间有以下关系。(1)有格式的数据才能表达信息含义。媒体种类不同其所具有的格式也不同,只有对格式能够理解,才能对其承载的信息进行表述。(2)不同的媒体所表达的信息程序也是不同的。每种媒体都有自己本身承载的信息形式特征,而人们对不同种类信息的接受程序也不同,便产生了差异。(3)媒体之间的关系也代表着信息。媒体的多样化关键不在于能否接收多种媒体的信息,而在于媒体之间信息表示的合成效果。多种媒体来源于多个感觉通道,其效果远远超出各个媒体单独表达时的效果。(4)媒体是可以进行相互转换的。媒体转换是指媒体从一种形式转换为另一种形式,同时信息的损失总是伴随着媒体的转换过程。1.2 如何理解多媒体“多媒体”一词译自英文“Multimedia”,而该词又是由Multiple和Media复合而成的,核心词是媒体。与多媒体对应的一词是单媒体(Monomedia)。从字面来看,多媒体是由单媒体复合而成的。但是,这种“复合”不是不同媒体所带有信息的简单相加,而是各种媒体相互配合所表现出的更加丰富的综合信息。人类在信息交流中要使用各种信息载体,多媒体就是指多种信息载体的表现形式和传递方式。这些信息媒体包括:文字(Text)、声音(Audio)、图形(Graphic)、图像(Image)、动画(Animation)、视频(Video)等。“媒体”的概念范围相当广泛。根据原国际电报电话咨询委员会(CCITT,现改称为“国际电信联盟标准化部门 ITU-T”)对媒体的定义,“媒体”可分为感觉媒体、表示媒体、显示媒体、存储媒体和传输媒体五大类。

1.感觉媒体

感觉媒体(Perception Medium)是指能直接作用于人们的感觉器官,从而能使人产生直接感觉的媒体。感觉媒体的分类直接对应于人的五种自然感觉——视觉、听觉、触觉、味觉、嗅觉,包括视觉类媒体(位图图像、图形、符号、文字、视频、动画等),听觉类媒体(语音、音乐、音效等),触觉类媒体(指点、位置跟踪、力反馈与运动反馈等),味觉类媒体和嗅觉类媒体等。

人类感知信息的途径有以下三种。

视觉:是人类感知信息最重要的途径,人类从外部世界获取信息的70%~80%都是通过视觉获得。

听觉:人类从外部世界获取信息的10%是通过听觉获得。

嗅觉、味觉、触觉:通过嗅觉、味觉、触觉获得的信息量约占10%。

图1-1所示为视觉媒体,图1-2所示为触觉媒体。图1-1 动画《喜羊羊与灰太狼》图1-2 触屏手机

2.表示媒体

表示媒体(Representation Medium)是指为了加工、处理和传送感觉媒体而人为研究、构造出来的一种媒体。借助于此种媒体,便能更有效地存储感觉媒体或将感觉媒体从一个地方传送到另一个地方。表示媒体包括各种编码方式如语音编码、文本编码、静止图像和运动图像编码等。图1-3所示为语音编码算法。

3.显示媒体

显示媒体(Presentation Medium)是指用于通信中使电信号和感觉媒体之间产生转换的媒体,如输入设施、输出设施、键盘、鼠标器、话筒、喇叭、显示器、打印机等。图1-4所示为一款打印机。

4.存储媒体

存储媒体(Storage Medium)是指用于存储表示媒体的物理介质,以方便计算机加工和调用信息,如纸张、磁带、磁盘、光盘等。图1-5所示为IPOD车载磁带MP3。图1-3 语音编码算法图1-4 打印机

5.传输媒体

传输媒体(Transmission Medium)是指用来将表示媒体从一个地方传输到另一个地方的物理介质,是通信的信息载体。常用的有双绞线、同轴电缆、光缆和微波等。图1-6所示为同轴电缆。图1-5 IPOD 车载磁带 MP3图1-6 同轴电缆

除了上面的分类方式之外,还有一些其他对“媒体”分类的方式。表1-1所示为媒体分类表。表1-1 媒体分类表1.3 多媒体技术

多媒体技术是指能够同时获取、处理、编辑、存储和展示等两个以上不同类型信息媒体的技术。“多媒体”并不是指多种媒体本身,而主要是指处理和应用多媒体的一整套技术。因此,“多媒体”实际上常常被当作“多媒体技术”的同义语。

多媒体技术有如下特性。

1.多样性

信息载体的多样性是多媒体的主要特征之一,也是多媒体研究要解决的关键问题。多媒体计算机技术改变了计算机信息处理的单一模式,使之能处理多种信息。

2.集成性

指以计算机为中心综合处理多种信息媒体,包括媒体的集成和处理这些媒体的设备的集成。一方面它能将多种不同媒体信息有机地组合成一个完整的多媒体信息,另一方面能把不同的媒体设备集成在一起,形成多媒体系统。

从硬件的角度来讲,指能够处理多媒体信息的高速及并行的CPU系统,并具有大容量的存储能力,适合多媒体和多通道的输入输出能力及外设、宽带的通信网络接口能力。

从软件角度来看,指有集成一体化的多媒体操作系统、适应多媒体信息管理和使用的软件系统、创作工具以及高效的各类应用软件。

3.交互性

用户可以与计算机进行交互操作,从而为用户提供控制和使用信息的手段。这种交互都要求实时处理,如从数据库中检索信息量、参与对信息的处理等。交互可分成三个层次:媒体信息的简单检索与显示,是多媒体的初级交互应用;通过交互特性使用户进入信息的活动过程中,才达到了交互应用的中级;当用户完全进入一个与信息环境一体化的虚拟信息空间并自由遨游时,才是交互应用的高级阶段。图1-7所示为交互式电子白板。

4.实时性

实时就是在人的感官系统允许下进行多媒体交互,就好像面对面一样,图像和声音都是连续的。声音、动画、视频等是基于媒体信息要求实时处理的。图1-7 交互式电子白板

5.高质量

避免信息信号的衰减及噪音的干扰,保障多媒体信息的高质量。

在这些特性中,多样性、集成性和交互性是多媒体技术的主要特征。1.4 多媒体计算机的概念

多媒体计算机技术是指运用计算机综合处理多种媒体信息(文本、声音、图形、图像、动画等)的技术,包括将多种信息建立逻辑连接,进而集成一个具有交互性的系统。具有这类能力的计算机称为多媒体计算 机( Multimedia Computer)。

简单地说,多媒体计算机能综合处理声、文、图信息,并具有集成性和交互性。

从开发和生产厂商以及应用的角度出发,多媒体计算机可以分成两大类。(1)电视计算机(Teleputer),由家电制造厂商研制的,是将 CPU放到家电中,通过编程控制管理电视机、音响。图1-8所示为电视电脑一体机。图1-8 电视电脑一体机(2)计算机电视(Compuvision),是由计算机厂商研制的,采用微处理器作为CPU,具有视频图形适配器、光盘驱动器、音响设备以及扩展的多媒体家电系统。1.5 多媒体系统

多媒体系统是指利用计算机技术和数字通信技术来处理和控制多媒体信息的系统。

例如,电视节目、动画片、多媒体教学系统、多媒体视频会议系统、多媒体出版物、多媒体数据库系统等。

整个多媒体系统分成六层,自下而上分别为:多媒体系统外围设备、多媒体计算机硬件系统、核心系统软件、素材制作工具、编辑创作系统和应用系统。下面的两层构成多媒体计算机的硬件系统,其余四层是软件系统。

1.应用系统

多媒体应用系统是在多媒体创作平台上设计开发的面向应用领域的软件系统,及支持特定应用的多媒体软件系统。前者如邮局的多媒体查询系统,后者如会议电视系统、视频点播(Video On Demand,VOD)系统等。

2.编辑创作系统

多媒体编辑创作软件是将分散的多媒体素材按照节目创意的要求集成为一个完整地融合了图、文、声、像等多种表现形式并具有交互多媒体作品的创作工具。常见的工具有:Flash,Director, FrontPage等。

3.素材制作工具

多媒体素材制作工具软件是用于采集和处理各种多媒体数据,使其符合创作需要的工具软件。例如,声音录制和编辑软件、图像扫描和处理软件、动画生成和编辑软件、视频采集和编辑软件等。

4.核心系统软件

多媒体核心系统软件包括多媒体设备硬件驱动程序和支持多媒体功能的操作系统。

多媒体操作系统是整个多媒体计算机系统的核心,其功能是负责多媒体环境下多个任务的调度,以保证音频、视频同步控制及信息处理的实时性,提供多媒体信息的各种基本操作与管理,支持实时数据采集、同步播放等多媒体数据处理流程。

5.多媒体计算机硬件系统

多媒体计算机硬件系统包括多媒体计算机的核心硬件配置与各种外部设备的控制接口卡。接口卡是根据多媒体系统获取、编辑音频或视频的需要而插接在计算机上的,它可解决各种媒体数据的输入和输出问题。

常用的接口卡有声卡、显示卡、视频压缩卡、视频播放卡、光盘接口卡和网卡等。其中,显示卡也属于多媒体计算机的核心硬件配置。

6.多媒体系统外围设备

多媒体系统外围设备包括各种媒体的输入/输出设备及网络。按功能输入/输出设备可分为四类:视频、音频输入设备,视频、音频播放设备,人机交互设备,存储设备。1.6 习题

1.简述数据、信息与媒体三者之间的关系。

2.媒体包括哪些方面,举例说明各个方面的特点。

3.多媒体技术的特性有哪些?

4.简述多媒体系统的构造。第2章多媒体发展

本章将介绍多媒体的发展历程,包括多媒体发展历程中的关键技术、技术发展史和应用等。2.1 多媒体发展的关键技术

多媒体技术是不断发展和完善的,本节我们就来了解多媒体发展经历中的几项关键技术。2.1.1 视频音频信号获取技术

过去,计算机只需处理数学运算和文字,现在则要综合处理声音、文字和图像。多媒体计算机首先要解决的就是视频音频信号的获取问题。

获取视频信号的方法如下。(1)利用计算机产生彩色图形、静态图像和动态图像。比如使用画图程序,如Windows系统自带的画图程序、专业的Photoshop图像处理软件等来创作数字图像。(2)利用彩色扫描仪扫描输入照片等图像,输入计算机内形成数字图像。(3)利用视频信号数字化设备(如数码相机、数码摄像机、视频信息转换卡等)把自然景物、模拟彩色全电视信号数字化,输入多媒体计算机中,获得静态或动态图像。2.1.2 多媒体数据压缩编码与解码技术

过去,计算机无法综合处理声音、文字和图像的原因就在于文件数据量过大。

在信息化社会里,数字化后的信息尤其是数字化后的视频和音频信息具有数据海量性,给信息的存储和传输带来较大的困难,成为阻碍人类有效获取和使用信息的瓶颈问题之一。

多媒体数据压缩编码和解码技术是多媒体系统的关键技术。关于多媒体数据的压缩已形成许多标准,如静态压缩标准(Joint Photograohic Exoerts Group,JPEG)、动态视频压缩标准(Moving Picture Expert Group,MPEG)等。在压缩编码中也有许多常用算法,如预测编码、变换编码、统计编码、混合编码等。

静态及动态数据量分析如下。

1.静态视频

以一幅彩色静态图像(RGB)为例:设分辨率为80×80,每一种颜色用8bit表示。

则该幅彩色静态图像的数据量为:80×80×3×8 = 153600 bits。

2.动态视频

PAL(Phase Alternation Line)——称为逐行倒相彩色电视制式:是通用于中国大陆、中国香港、日本与西欧(除法国)等地的彩色电视信号制式,以交错方式扫描,每秒钟输出25幅画面,每幅画面含625条水平扫描线。

NTSC(National Telvision Standards Committee)——国家电视标准委员会,为美国一个专门制订彩色电视标准的组织。它制订的NTSC制式,每秒钟输出30幅画面,每5幅画面含525条水平扫描线。

以 PAL 视频为例(分辨率为 120×90,每秒 25 帧),一秒钟的数据量:120×90×3×8× 25=6480000bits=791KB。2.1.3 视频音频数据的实时处理和特技

一幅图像一般都有数百KB,甚至更大。

为完成视音频的实时处理,需要利用预处理、分割、扫描、识别、解释等多种处理与数学的点运算、二维卷积运算、二维正交变换等计算。2.1.4 视频音频数据的输出技术

过去计算机只处理数和文字,现在要综合处理声、文、图,文件格式复杂,就要解决视频音频的输出问题。不仅要考虑如何将标准文件存到内存与外存,还需要解决如何将不同的视频音频文件格式进行转换,在输出设备上输出等问题。2.1.5 高速计算机网络传送多媒体信息技术

在网络多媒体出现之前,网络上传输的绝大部分内容都是文本信息。而多媒体数据在网络上传输至少有三方面的难度。(1)网络多媒体应用通常需要更高的网络带宽。一个25s、320×240分辨率的QuickTime电影片段就需要占据2.3MB的存储空间,相当于1000屏的文本数据,这在只有文本传输的过去是不可想象的。(2)大多数多媒体应用都要求实时传输。视频和音频数据必须按照其采样的速率进行连续回放。如果数据未能及时到达,回放过程就停止,人的眼睛和耳朵就会感觉到流畅性有问题。(3)多媒体数据流通常都有一定的突发性,仅仅增加带宽还不能解决突发性带来的问题。缓冲区可能会上溢(数据到达过快,使部分数据丢失,导致质量变差)或下溢(数据到达太慢,应用就会处于饥饿状态)。2.2 多媒体技术的发展及应用

本节我们追本溯源,了解多媒体技术的发展及应用。2.2.1 多媒体技术的发展

多媒体技术经历了不断发展的过程,而科学技术的进步和社会的需求是促进多媒体发展的基本动力。

1.启蒙发展阶段

图2-1所示为敦煌壁画。

远古时代,人们利用壁画、文字等传达信息。在人类发展的过程中,报纸可能是第一种重要的群众性通信介质,主要使用文字内容,也使用图形和图像。电视是20世纪出现的新媒介,带来了视频并从此改变了群体通信世界。多媒体技术的一些概念和方法起源于20世纪60年代,多媒体技术实现于80年代中期。尽管“多媒体”这个名词是由谁在什么时候开始第一次运用的已无法考证,但是1985年10月IEEE计算机杂志首次出版了完备的“多媒体通信”专集,是文献中可以找到最早出处。

启蒙发展阶段重要事件年表:

1895年,俄罗斯亚·斯·波波夫和意大利工程师马可尼(Gugliemo Marconi)分别独立地实现了第一次无线电传输。到了1901年12月,马可尼又完成跨越大西洋、距离为3700km的无线电越洋通信。无线电最初作为电报被发明,现在则成了最主要的音频广播介质。图2-2所示为马可尼与无线电。图2-1 敦煌壁画图2-2 马可尼与无线电

1945年,Vannevar Bush(1890—1974)(见图2-3)在其发表的论文“As We May Think”中提出Memex系统:图书馆将各种信息存储在缩微胶片中,各书目之间的连接可自动跳转。Memex提供了一种方法,使任何一条信息都可以随意直接自动地选择另一条信息。而且,更重要的是将两条信息连接到一起。这就是hypertext的概念。

1965年,纳尔逊(Ted Nelson)为计算机上处理文本文件提出了一种把文本中遇到的相关文本组织在一起的方法,并为这种方法杜撰了“hypertext(超文本)”一词。与传统方式不同,超文本以非线性方式组织文本,使计算机能够响应人的思维以及能够方便地获取所需要的信息。万维网(WWW)上的多媒体信息正是采用了超文本思想与技术,组成了全球范围的超媒体空间。

1967年,Nicholas Negroponte在美国麻省理工学院(MIT)组织了体系结构机器组(Architecture Machine Group)。

1968年,Douglas Engelbart 在 SRI 演示了 NLS 系统。

1969年,纳尔逊(Nelson)和 Van Dam 在布朗大学(Brown)开发出超文本编辑器。

1976年,美国麻省理工学院体系结构机器组向 DARPA 提出了多媒体(Multiple Media)的建议。

1977年,AppleⅡ改变了一切。图2-4所示为第一台应用彩色图形界面的PC。图2-3 Vannevar Bush图2-4 AppleⅡ

1984年,Apple公司的Macintosh个人计算机首先引进了“位映射”的图形机理、用户接口,开始使用Mouse驱动的窗口技术和图标。最早用GUI(图形用户接口)代替CUI(计算机用户接口),大大方便了用户的操作。Apple公司在1987年又引入了“超级卡”(Hypercard),使Macintosh机成为更容易使用、易学习并且能处理多媒体信息的机器,受到计算机用户的一致称赞。

1985年,Microsoft公司推出了Windows,它是一个多用户的图形操作环境。图2-5所示为微软公司Windows1.0的包装,还可以看见IBM字样。

1985年,美国Commodore公司推出世界上第一台多媒体计算机Amiga系统(见图2-6)。Amiga 机采用 Motorola M68000 微处理器作为 CPU,并配置 Commodore 公司研制的图形处理芯片 Agnus 8370、音响处理芯片 Pzula 8364 和视频处理芯片 Denise 8362 三个专用芯片。Amiga 机有专用的操作系统,能够处理多任务,并具有下拉菜单、多窗口、图标等功能。图2-5 Windows1.0 产品包装图2-6 Amiga 系统

1985年,Negroponte 和 Wiesner 成立了麻省理工学院媒体实验室(MIT Media Lab)。

1985年10月,IEEE计算机杂志首次出版了完备的“多媒体通信”专集。图2-7所示为IEEE搜索结果。图2-7 IEEE 搜索结果

1986年,荷兰Philips公司和日本Sony公司联合研制并推出交互式紧凑光盘系统(Compact Disc Interactive,CD-I),同时公布了该系统所采用的 CD-ROM 光盘的数据格式。这项技术对大容量存储设备光盘的发展产生了巨大影响,并经过国际标准化组织(ISO)的认可成为国际标准。大容量光盘的出现为存储和表示声音、文字、图形、音频等高质量的数字化媒体提供了有效的手段。

1987年3月,美国无线电公司RCA研究中心在国际第二届CD-ROM年会上展示了这项称为交互式数字视频(Digital Video Interactive,DVI)的技术,这便是多媒体技术的雏形。图2-7所示为DVI技术应用。DVI与CD-I之间的实质性差别在于,前者的编、解码器置于微机中,由微机控制完成计算,这就把彩色电视技术与计算机技术融合在一起;而后者的设计目的,只是用来播放记录在光盘上的按照 CD-I 压缩编码方式编码的视频信号(类似于后来的VCD播放器)。这便是DVI技术出现后,人们立即就对CD-I失去兴趣的原因。如图2-8所示。图2-8 DVI 技术应用

1987年,Apple公司引入HyperCard,使Macintosh机成为方便用户学习使用且能处理多媒体信息的计算机。

1989年,由Intel和IBM公司推出第一代DVI产品。

Intel 和 IBM 公司合作,在 Comdex/Fall'89 展示会上推出 Action Media 750 多媒体开发平台。该平台硬件系统由音频板、视频板和多功能板块等专用插板组成,其硬件是基于DOS系统的音频视频支撑系统(Audio Video Support System,AVSS)。

1991年,Intel 和 IBM 合作又推出了改进型的 Action MediaⅡ。该系统中硬件部分集中在采集板和用户板两个专用插件上,集成程度更高;软件采用基于 Windows 的音频视频内核(Audio Video Kernel,AVK)。Action MediaⅡ在扩展性、可移植性、视频处理能力等方面均有很大改善。

2.初期应用和标准化阶段

自20世纪90年代以来,多媒体技术逐渐成熟。多媒体技术从以研究开发为重心转移到以应用为重心。由于多媒体技术是一种综合性技术,其实用化涉及计算机、电子、通信、影视等多个行业技术协作;其产品的应用目标,既涉及研究人员也涉及普通消费者,面向各个用户层次。因此,标准化问题是多媒体技术实用化的关键。在标准化阶段,研究部门和开发部门首先各自提出方案,然后经分析、测试、比较、综合,总结出最优、最便于应用推广的标准,以指导多媒体产品的研制。

3.蓬勃发展

多媒体各种标准的制定和应用,极大地推动了多媒体产业的发展。许多多媒体标准和实现方法(如 JPEG,MPEG 等)已被做到芯片级,并作为成熟的商品投入市场;涉及多媒体领域的各种软件系统及工具也层出不穷。这些既解决了多媒体发展过程中必须解决的难题,又为多媒体的普及和应用提供了可靠的技术保障,并促使多媒体成为一个产业而迅猛发展。

下面介绍多媒体技术蓬勃发展中的代表事件。

代表之一是进一步发展多媒体芯片和处理器。1997年1月,美国Intel公司推出了具有MMX技术的奔腾处理器(Pentium processor with MMX),使它成为多媒体计算机的一个标准。如图2-9所示为奔腾Ⅰ处理器。奔腾处理器在体系结构上有三个主要特点。图2-9 奔腾Ⅰ处理器(1)增加了新的指令,使计算机硬件本身就具有多媒体的处理功能(新添了57个多媒体指令集),能更有效地处理视频、音频和图形数据。(2)单条指令多数据处理(Single Instruction Multiple Data process,SIMD)减少了视频、音频、图形和动画处理中常有的耗时的多循环。(3)更大的片内高速缓存减少了处理器不得不访问片外低速存储器的次数。

奔腾处理器使多媒体的运行速度成倍增加,并已开始取代一些普通的功能卡板。除具有MMX技术的奔腾处理器外,还有AGP规格、MPEG-2、AC-97、PC-98、2D/3D 绘图加速器、Java Code(Processor Chip)等最新技术,也为多媒体大家族增添了风采。

另一代表是AC97杜比数字环绕音响的推出。在视觉进入3D立体视觉空间的境界后,对听觉也提出了环绕及立体音效的要求。电影制片商在讲究大场景下,更会要求有逼真及临场感十足的声音效果。加上个人计算机游戏(PC Game)的刺激,将音效的需求带到巅峰。AC97(Audio Codec 97)在此推动下,由声霸卡(Sound Blaster)的创始者 Creative 公司及深耕此领域的 Analog Device,NS,Yamaha,Intel主导生产。在AC97硬件解决方案中,由Controller(声音产生器)及 Codec IC 两片 IC 构成。

随着网络电脑(Internet PC,NC)及新一代消费性电子产品如电视机顶盒(Set-Top Box)、DVD、视频电话(Video Phone)、视频会议(Video Conference)等观念的崛起,强调应用于影像及通信处理上最佳的数字信号处理器(DSP),经过另一番结构包装,可由软件驱动组态的方式进入咨询及消费性的多媒体处理器市场。

1996年,Chromatic Research 推出整合 MPEG-1、MPEG-2、视频、音频、2D、3D、电视输出等七合一功能的Mpact处理器,一举提高了其知名度,引起市场的高度重视。现已推出Mpact2第二代产品,应用于DVD、计算机辅助制造(CAM)、个人数字助手(PDA)、蜂窝电话(Cellular phone)等新一代消费性电子产品市场。继Chromatic后,Fujitsu,Matsushita,Mitsubishi,Philips, Samsung,Sharp等几大厂商亦相继投入此市场。

多媒体处理器结合了数字信号处理DSP的优势,并可发挥其在通信方面的优点。除了最初应用于网络 PC 的构想外,日本 Sharp 将其多媒体微处理器(Data-Driven Media Processor,DDMP)应用于打印机、复印机、传真机及扫描器四合一的多功能摄像机Camcoder中。Fujitsu也将其MMA (Multi Media Assist)系列应用于汽车导航系统中,并将推出第二代甚至第三代。

与此同时,MPEG压缩标准得到推广应用,已开始把活动影视图像的MPEG压缩标准推广用于数字卫星广播、高清晰电视、数字录像机以及网络环境下的电视点播(VOD)、DVD等各方面。

虚拟现实(Virtual reality)技术正向各个应用领域开拓。它是在计算机系统环境下,集视、听、说、触动等多种感觉器官的功能于一体的仿真综合体技术。利用虚拟现实技术推广应用到各个领域,带动各领域实现可视仿真,这一发展趋势在美国特别明显。1994年,美国几所大学公开发表了视听实验的示范成果。2.2.2 多媒体技术的应用

多媒体技术在许多领域得到深入的应用,近年来在多媒体数据库、多媒体通信及多媒体创作工具等方面已有广泛应用。

1.多媒体数据库

传统的数据库管理系统——处理结构化的数据,应用于文字、数值等信息处理。

多媒体数据库管理系统——多种媒体信息及非结构化数据,应用于复杂数据的处理及管理,如图书馆、博物馆、诊断医疗系统等。

目前多媒体数据库研究的主要途径如下。

①在现有商用数据库管理系统的基础上增加接口,以满足多媒体应用的需要;

②建立基于一种或几种应用的专用多媒体信息管理系统;

③从数据模型入手,研究全新的通用多媒体数据库管理系统。

研究开发多媒体数据库要解决的关键技术问题如下。

①多媒体数据模型;

②数据的压缩和解压缩;

③多媒体数据的存储管理和存取方法;

④多媒体信息的再现及良好的用户界面;

⑤分布式技术。

2.多媒体通信

多媒体通信分类如下。

①对称全双工的多媒体通信系统,如分布式多媒体信息系统、视频会议系统(分点对点的视频会议系统和多点视频会议系统)及计算机支持的协同工作系统;

②非对称全双工的多媒体通信系统,如交互式电视系统(ITV)、点播电视系统(VOD)。

多媒体通信的关键技术如下。

①多媒体数据压缩;

②高速数据通信问题。

其中,最突出的问题是视频会议系统要解决的国际标准问题。

3.多媒体创作工具及其应用

多媒体创作工具的分类如下。

①基于时间的创作工具,如 Action,Director 等;

②基于图标(Icon)或流线(Line)创作工具,如 Autherware,Icon Auther 等;

③基于卡片(Card)和页面(Page)的创作工具,如 ToolBook,Hypercard,PowerPoint 等;

④以传统程序语言为基础的创作工具,如 Visual C++,Visual Basic 等。

多媒体创作工具的应用如下。(1)制作各种电子出版物、教材、参考书、地图、医药卫生、商业手册及游戏娱乐节目。图2-10所示为谷歌地图搜索示例。图2-10 谷歌地图搜索示例(2)多媒体应用系统、演示系统或信息查询系统、导游系统;培训和教育系统;娱乐、视频动画及广告等。图2-11所示为多媒体演示系统外观图。图2-11 多媒体演示系统外观图2.3 多媒体发展的新技术

多媒体技术是一门多学科和多技术的交叉技术,也是基于计算机的一种综合技术。现在,多媒体技术及应用正在向更深层次发展。下一代用户界面,基于内容的多媒体信息检索、保证服务质量的多媒体全光通信网、基于高速互联网的新一代分布式多媒体信息系统等,多媒体技术及其应用正在迅速发展,新的技术、新的应用、新的系统也不断涌现。从多媒体应用方面来看,有以下几个发展趋势。(1)从单个PC用户集中式、局部环境转向多用户分布式网络环境。(2)从专用平台和系统有关的解决方案转向开放性、可移植性解决方案。针对数字媒体的嵌入式芯片设计与制造将是未来研究的重要方向。(3)从被动的、简单的交互方式转向主动伺服式高级的人机交互方式。人类使用听觉、视觉、触觉、嗅觉等感官交流信息,自然的人机交互系统必须支持多功能感知、识别和认知,实现多模态的交互手段。(4)普遍适用的多媒体访问。未来多媒体应用将可使用户不论在什么样的访问环境下(包括有线和无线网络)和使用什么样的设备(包括手机和掌上电脑等各种信息终端)都可以无缝地、可移动地、连续地访问应用。

多媒体应用技术主要包括以下几种。

1.流媒体技术

流媒体技术是把连续的视频和音频等多媒体文件经过处理后放在网络服务器上让用户边下载边观看,而不是需要将整个文件全部下载后才能观看的网络技术。

流式传输主要是指通过网络传送媒体(如音频、视频等)的技术总称。实现流式传输有两种方式:实时流式传输和顺序式传输。实时流式传输是指流媒体可以从中间任意时间点开始播放;顺序式传输是指多媒体文件在播放时不能随意指定开始的位置。如图2-12所示为手机流媒体截图。图2-12 手机流媒体截图

目前在这个领域的主要产品有:RealNetworks公司的Real Media;Microsoft 公司的 Windows Media;Apple 公司的 Quick Time。

2.虚拟现实技术

虚拟现实技术(Virtual Reality,VR)是利用计算机技术及硬件设备,实现人们可以通过视听触嗅等手段来感受虚拟幻境。虚拟现实系统具有三个重要特性:临境性、交互性、想象性。

虚拟现实是建立在集成诸多学科如心理学、控制学、计算机图形学、数据库设计、实时分布系统、电子学、机器人及多媒体技术等之上的高级技术。

VR 技术的应用十分广泛,如国防、建筑设计、工业设计、培训、医学等领域。人们利用软件 AutoCAD 来进行的建筑设计就是 VR 技术的应用。如图2-13 所示为 AutoCAD工作台。图2-13 AutoCAD 工作台

3.影视制作及动画的平台技术

影视艺术中的影视制作技术涉及通信存储的传输压缩和多媒体数据库等技术。实时采集、实时压缩传输、实时编辑是该领域中的难点。

计算机动画技术发展会为影视制作带来新的巨大发展,也会带来丰厚的经济效应。

Flash是一款很好的动画制作软件,在后面的实践篇中我们将介绍Flash技术。图2-14所示为Flash CS5 界面。图2-14 Flash CS5 界面

4.多媒体数字水印技术

数字水印(Digital Watermark)技术是指用信号处理的方法,在数字化的多媒体数据中嵌入隐蔽的标记。这种标记通常是不可见的,只有通过专用的检测器或阅读器才能提取。数字印记的特征是:隐蔽性、隐藏位置的安全性和鲁棒性等。目前数字水印的应用领域主要有:数字作品的知识产权保护、商务交易中的票据防伪、声像数据的隐藏标识和篡改提示、隐蔽通信及其对抗等。

5.多媒体数据挖掘技术

数据挖掘(Data Minig)是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中有用的信息和知识的过程。

多媒体数据挖掘(见图2-15)是从大量的多媒体数据中,通过综合分析视听特性和语义,发现隐含的、有效的、有价值的、可理解的模式,进而发现知识,得出事件的趋向和关联,为用户提供问题求解层次的决策支持能力。图2-15 多媒体数据挖掘(IVEE,The Spotfire Visualization Software)

6.智能多媒体技术

多媒体计算机从发展来看应具有以下智能。

①文字的识别和输入,如印刷体汉字、联机手写体汉字和脱机手写体汉字的识别和输入;

②语音的识别和输入,如特定人、非特定人以及连续汉语语音的识别和输入;

③自然语言的理解和机器翻译,如汉语的自然语言理解和机器翻译;

④图形的识别和理解;

⑤机器人视觉和计算机视觉;

⑥知识工程和人工智能等。

智能多媒体数据库的核心技术是将具有推理功能的知识库与多媒体数据库结合起来,形成智能多媒体数据库。

智能多媒体数据库的另一个重要研究课题是基于内容检索技术的多媒体数据库。它需要把人工智能领域中高维空间的搜索技术、视音频信息的特征抽取和识别技术、视音频信息的语义抽取问题以及知识工程中的学习、挖掘和推理等问题应用到基于内容的检索技术中。

7.跨媒体技术

它寻求平面媒体和立体媒体与网络媒体相结合的多媒体资源整合、信息融合,存在于一体。最大限度地获取不同媒体间的关联性和协同效应、互补性和多维互动性,从而达到需求的识别、检索、发布以及发现重构、共生新用等,高效地使用各种媒体。

跨媒体涉及了大量学科的交叉性研究,如智能信息处理、数据挖掘与知识发现、机器学习、多媒体处理、模式识别、检索引擎、数据库技术等。

目前存在的主要技术难点有:跨媒体知识的发现和表达技术;跨媒体知识的推理与重构;跨媒体统一的表示结构;跨媒体信息的融合、识别技术;各种媒体特别是视频、动画等复杂的信息挖掘、智能处理和高效率检索技术;跨媒体海量信息的综合检索等。如图2-16所示为跨媒体图书。图2-16 跨媒体图书(肥寰景信息,3D 跨媒体产品及解决方案)

8.计算机支持协同系统

计算机支持协同系统(Computer Supported Cooperative Work,CSCW)是支持有着共同目标或任务的群体性活动的计算机系统,并且该系统为共享的环境提供接口。CSCW能支持远程医疗会诊,可以将不同地点的专家召集起来,进行异地会诊复杂的病例;CSCW归成著作协同编辑系统,可以把不同地的编辑组织起来,共同编辑一部著作。

CSCW系统具有两个本质特征,即共同任务和共同环境。一般应具备以下三种活动。

①通信。协作工作者之间进行信息交换。

②合作。群体协同共同完成某项任务。

③协同。对协同工作进行协同管理,使群体工作和谐,避免冲突和重复。

CSCW系统可以按照三种方式分类。

①交互模式,即 CSCW 系统群体工作者之间的交互可以是同步或异步的。

②地理位置,即参与协作的多个用户可以是远程的或本地的。

③群体规模,即协作既可以是两个人之间的,也可以是多个人之间的。2.4 习题

1.简述多媒体发展的关键技术。

2.研究多媒体数据库的主要途径和要解决的关键技术问题。

3.多媒体通信的分类和关键技术。

4.多媒体创作工具的分类。

5.了解多媒体应用的新颖技术。第3章超文本和超媒体

本章将对超文本和超媒体做较详细的介绍。3.1 超文本和超媒体概念及产生背景

我们首先分别介绍一下两者的概念和产生背景。3.1.1 超文本的概念

1965年,TedNelson在计算机上处理文本文件时想了一种把文本中遇到的相关文本组织在一起的方法,让计算机能够响应人的思维并能够方便地获取所需信息。他为这种方法杜撰了一个词,即超文本(hypertext)。实际上,这个词的真正含义是“链接”,用来描述计算机中文件的组织方法。后来,人们把用这种方法组织的文本称为“超文本”。

超文本是一种文本,它和书本上的文本是一样的。但与传统的文本文件相比,它们之间的主要差别是:传统文本是以线性方式组织的,而超文本是以非线性方式组织的。这里的“非线性”是指文本中遇到的一些相关内容通过链接组织在一起,用户可以很方便地浏览它们。这种文本的组织方式与人们的思维方式和工作方式比较接近。

超链接(hyperlink)是指文本中的词、短语、符号、图像、声音剪辑或影视剪辑之间的链接,或者与其他文件、超文本文件之间的链接,也称为“热链接( hotlink )”或“超文本链接(hypertextlink)”。词、短语、符号、图像、声音剪辑、影视剪辑和其他文件通常被称为对象或者文档元素(element),因此超链接是对象之间或者文档元素之间的链接。建立互相链接的这些对象不受空间位置的限制,它们可以在同一个文件内,也可以在不同的文件之间,还可以通过网络与世界上任何一台连网计算机上的文件建立链接关系。3.1.2 超媒体的概念

在20世纪70年代,用户语言接口方面的先驱者AndriesVanDam创造了一个新词“电子图书”(Electronic Book)。电子图书中自然包含许多静态图片和图形,含义是用户可以在计算机上去创作作品和联想式地阅读文件。它保存了用纸做存储媒体的最好特性,而同时又加入了丰富的非线性链接,这就促使在80年代产生了超媒体(hypermedia)技术。

超媒体不仅可以包含文字,还可以包含图形、图像以及动画、声音和电视片断,这些媒体之间也是用超级链接组织的,可谓错综复杂。

超媒体与超文本之间的不同之处是,超文本主要以文字的形式表示信息,建立的链接关系主要是文句之间的链接关系。超媒体除了使用文本外,还使用图形、图像、声音、动画或影视片断等多种媒体来表示信息,建立的链接关系是文本、图形、图像、声音、动画和影视片断等媒体之间的链接关系。图3-1所示为超媒体网页。图3-1 超媒体网页

当我们使用 Web 浏览器浏览互联网时,在显示屏幕上看到的页面称为网页(WebPage),它是Web站点上的文档。而进入该站点时在屏幕上显示的第一个综合界面称为起始页(homepage)或者主页,它有点像一本书的封面或者目录表。在万维网网页上,为了区分有链接关系和没有链接关系的文档元素,对有链接关系的文档元素通常用不同颜色或者下画线来表示。目前,在网页上担当链接使命的主要是超文本标记语言(HTML),它是从标准通用标记语言(SGML)导出的。3.2 超文本和超媒体的基本原理

超文本和超媒体是一种典型的数据库技术,是由节点和表达节点之间关系的链组成的网。每个节点都链接在其他节点上,用户对网进行浏览、查询和注释等操作。3.2.1 超文本和超媒体的组成要素

1.节点

超媒体是由节点和链构成的信息网络。节点是表达信息的单位,是围绕一个特殊主题组织起来的数据集合。节点的内容可以是文本、图形、图像、动画、音频、视频等,也可以是一般计算机程序。

2.链

超媒体链又称为超链,是节点间的信息联系,以某种形式将一个节点与其他节点连接起来。由于超媒体没有规定链的规范与形式,因此链也是各异的,信息间的联系丰富多彩引起链的种类复杂多样。但最终达到的效果是一致的,即建立起节点之间的联系。

3.网络

超文本由节点和链构成网络是一个有向图,这种有向图与人工智能中的语义网有类似之处。语义网是一种知识表示法,也是一种有向图。

超文本和超媒体的体系结构分为三个层次:表现层——用户接口层;超文本抽象机层——节点和链;数据库层——存储、共享数据和网络访问。3.2.2 超文本和超媒体的特点

1.信息组织

超文本的信息是以节点作为单位。而如何把一个复杂的信息系统划分成信息块是一个较困难的问题。

2.智能化

虽然大多数超文本系统提供了许多帮助用户阅读的辅助信息和直观表示,但因超文本系统的控制权完全交给了用户,当用户接触一个不熟悉的题目时,可能会在网络中迷失方向。要彻底解决这一问题,还需要研究更有效的方法。这实际上是要超文本系统具有某种智能性,而不是只能被动地沿链跳转。超文本在结构上与人工智能有着相似之处,使它们有机的结合将成为超文本与超媒体系统的必然趋势。

3.数据转换

超文本系统数据的组织与现有各种数据库文件系统的格式完全不一样。引入超文本系统后,如何将传统的数据库数据转换到超文本中也是一个问题。

4.兼容性

目前的超文本系统大都是根据用户的要求分别设计的,没有考虑到它们之间的兼容性问题,也没有统一的标准可循。所以,要尽快制定标准并加强对版本的控制。

5.扩充性

现有的超文本系统有待于提高检索和查询速度,增强信息管理结构和组织的灵活性,以便提供方便的系统扩充手段。

6.媒体间协调性

超文本向超媒体的发展也带来了一系列需要深入研究的问题,如多媒体数据如何组织、各种媒体间如何协调、节点和链如何表示;将音频和视频这一类与时间有密切关系的媒体引入超文本中,对系统的体系结构将产生什么样的影响;当各种媒体数据作为节点和链的内容时,媒体信息时间和空间的划分以及内容之间的合理组织都是在多媒体数据模型建立时要认真解决的问题。3.3 习题

1.简述超文本和超媒体的概念。

2.了解超文本和超媒体的组成要素。

3.简述超文本和超媒体的特点。理论篇在本篇将介绍有关图像、声音、视频等多媒体技术的理论知识,从而使读者对多媒体技术有较深的理性认识。第4章揭开Flash的神秘面纱

本书并不是一本专门的Flash教程,所以不会对Flash进行全面系统的讲解。当然即使那些专门的教程也无法做到这一点,因为 Flash 已经是一门非常庞大的技术,从最初的动画制作到后来的视频发布、游戏制作、软件开发,Flash的定位随着时代在持续变动。

本书只是希望大家能够知道Flash的存在,告诉大家Flash中的某些工具。因此,在介绍过程中会观其大略。这或许会对读者阅读造成很大麻烦,因为读者不得不经常放下书本而在 Flash 里摸索一阵子,等有了眉目再拿起书本。如果实在没有头绪也不要歇斯底里,说明读者已经对Flash技术有了征服的欲望,这时可以选择一本专业的教材仔细研读。本篇就想把感兴趣的读者“领上道儿”,当然其中仍有很多在其他教材中学不到的东西。

Flash的制作方法灵活多变,同一种效果可以用多种方式实现,同一种工具也可以制作多种效果。大家在使用工具时不要“为名所累”,如画曲线不一定要用曲线工具,利用直线工具外加鼠标拖曳同样可以做到,利用椭圆工具和橡皮擦同样能做出一段弧线。只有这样,创造力才会得到提升。我们要把Flash当作一款益智游戏,在创作中积累智慧。

学习的目的就在于获得能力,其余的目的均为衍生品。子曰:“君子务本,本立而道生。”他老人家的这句话笔者就特别喜欢。

接下来,就让我们揭开Flash的神秘面纱吧!4.1 初看 Flash

从 Adobe 官网上下载 Flash Pro CS5。下载安装完毕后,启动 Flash,就会看到如图4-1 所示的界面。我们通常是从这里开始Flash工作的。如果读者的Flash还没有安装好,不建议继续阅读。

单击中间一栏“Create New”中的“ActionScript 3.0”,就会打开一个基于 AS3 的 Flash 空白文档(见图4-2)。这个界面以后就任由我们“蹂躏”了。如果感觉面板排布得不合适,还可以亲自拖曳各部分,直到满意为止。注意看右上角左侧的下拉菜单,那里有预置的几种面板排布模式,去单击试试吧。

刚接触 Flash 时,任何一个下拉菜单都值得我们去单击尝试一下。一般接触新事物时我们都或多或少会有些新鲜疑惑恐惧感,从而阻碍了我们做更多尝试。在这里笔者郑重声明:Flash是安全的,不像电源插座、ATM机、机械车床那么恐怖,是按不坏的。所以,要多动手去探索。为了“刺激”某些不愿意动手的读者,笔者故意只给出谜面不给出谜底,而谜底要通过动手尝试来得到。图4-2 所示为 Flash Pro 的工作环境。图4-1 Flash CS5 开始界面图4-2 Flash Pro 的工作环境

坦率地讲,现在 Flash Pro 的界面的确很漂亮。目前 Flash 的最新版本是 Flash CS 5.5,这里的CS 是 Adobe 公司一个软件系列 Creative Suite 的简称。从 Flash 的发展历程来看,CS5 相当于 Flash的第11个版本。基本过上一两年Flash就有新版本发布,以至于很多Flash开发人员都跟不上进度,甚至开始抵制使用新版本。客观地讲,Flash快速更新版本也有其一定的商业目的,因为版本间的更新都不是很多。不过每次更新,都使 Flash 变得更加强大,新功能的加入总是激动人心。无论是 Macromedia 还是 Adobe Flash 的研发公司都与 Flash 开发者们保持着密切的交流关系,同时积极开源以广泛吸纳开发者的需求和建议,从而做出更有目的性的改进。

从下面两组图就可以看出Flash十年来的巨大变化。第一组图,如图4-3和图4-4所示为Flash5与Flash11的界面对比;第二组图,图4-5所示为Flash5与Flash11工具栏的对比。直观的感受就是后者界面更加漂亮,功能更加强大。从性质上讲,Flash已经由一个简单的动画制作工具转变为将设计与编码集于一身的软件开发平台。图4-3 Flash 5 的工作界面图4-4 Flash 11 的工作界面

不妨做一个“大家来找茬”的小游戏,对比一下图4-5两图有多少不同。当然不一样的地方太多了,那么我们着重来看一下工具栏的变化。也许这是我们最为熟悉的地方,因为它的存在让我们多了几分亲切,感觉Flash就像个绘图板。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载