数字媒体资产管理系统(txt+pdf+epub+mobi电子书下载)


发布时间:2020-08-18 19:52:48

点击下载

作者:(德)毛特,(德)托马斯

出版社:中国传媒大学出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

数字媒体资产管理系统

数字媒体资产管理系统试读:

译者序

随着卫星电视、网络电视和多媒体技术的飞速发展,国内外各种媒体之间的竞争日趋激烈。为应对挑战,我国广播电视行业正在进行机制改革和资源整合,走技术创新、高效发展的市场化之路。在这种情况下,建立有效的数字媒体资产管理系统,是盘活媒体组织原有的大量节目内容和素材、实现媒体资源共享和提高资产利用率的有效手段。

数字媒体资产管理是一个崭新的领域,它充分运用最先进的技术手段,如计算机多媒体技术、网络技术、数据库技术和海量数据存储技术等,对媒体资产进行数字化、网络化管理,提供了从媒体资产的创建、存储、管理、检索到发布、传输的整体解决方案。近年来,国内外许多大的厂商都纷纷加大力度投入到数字资产管理这一新兴领域,并且在技术层面(如硬件设备、软件产品、相应的标准等)已经开发了比较好的解决方案,如IBM的内容管理、Artesia的数字资产管理解决方案、中科大洋公司的媒体资产管理系统等。

目前,我国的数字电视、移动电视、IPTV等产业正在快速发展,但其内容的数量和质量却成为制约这些领域发展的“瓶颈”。在这种情况下,部分有经济实力的广播电台和电视台已经构建或正在开始实施数字媒体资产管理系统。数字媒体资产管理系统是节目内容平台的基础,是非线性编辑制作系统和硬盘播出系统的联接纽带,只有建立数字媒体资产管理系统,实现网络传输、节目非线性编辑制作、媒体资产管理、硬盘播出、内容销售等的无缝集成,才能真正搭建完整的节目内容平台,进而推动内容产业的发展,带动新的经济增长点。

安德列斯·毛特和彼得·托马斯的《数字媒体资产管理系统》,是一本专业理论与实务很好结合的论著,涵盖的内容十分丰富,也是目前世界上极为少见的该领域专著中较为专业的一本,主要包括内容管理系统的基本问题及组成构架、与内容管理相关的工作流、素材的编码格式及元数据、文件格式、相应的技术标准、数字媒体资产管理系统集成及有关的应用等。由于目前国内图书市场上还没有关于数字媒体资产管理方面的专著,因此我们相信,该书的翻译出版,一定会对国内从事数字媒体资产管理系统的开发、建设、管理和应用人员具有重要的参考价值。此外,该书也可以作为信息管理与信息系统、计算机科学与技术、数字媒体技术等专业的高年级本科和研究生的参考教材。

本书由宋培义和严威担任主译和校审。此外,李玉婷、魏炜、李文欢、李丽也参加了部分内容初稿的翻译工作,梁郑丽教授、刘丽华教授对部分章节内容进行了审阅和修改。在此,向所有参加本书翻译和审阅的人员表示感谢。

还要感谢中国传媒大学出版社的蔡翔社长、语言艺术编辑部的程平主任和版权贸易中心的欧丽娜主任,没有他们的支持和帮助,本书是不可能顺利出版的。对本书的责任编辑杨歆颖所付出的辛勤劳动表示感谢。

由于该书涉及的范围较广、专业性较强,尽管本书的译者做了较大努力,但书中的翻译可能还会存在一些不当之处,恳请广大读者提出批评指正意见,以便再版时改进。宋培义2008年6月于中国传媒大学

序言

内容管理正逐渐成为媒体领域众多工作的基础。一些媒体的创建和分发过程可以由那些能够在特定环境下管理内容的系统来完成。然而,随着越来越多的、支持不同媒体类型和使用环境的类似系统被开发出来并进行部署,冠名为内容管理系统(Content Management System,CMS)的解决方案出现了过剩。这些方案中,既有相当简单的、基于PC的文件管理应用程序,也有复杂的、能够处理所有媒体数据、集成大量设备的应用系统。在制作和广播环境中处理高质量的视听内容是最苛刻的内容管理领域之一。本书集中介绍了专业媒体制作、开发和传输过程与内容及内容管理系统有关的所有方面,不仅包括多年行业经验的汇总,还考虑了系统的研发和标准化要求。因此,它集合了以广播和IT领域为主的不同领域的用户和系统的观点,以及内容管理领域内的专业产品、研究成果和标准化工作。

本书并不重点讨论内容管理在网络应用方面的细节,因为这需要专门的应用才能满足该特殊领域的独特需要,而是将网页作为需要专业内容管理系统处理的媒体类型之一,在书中进行探讨。此外,文件管理也不是本书的主要内容,本书只是将文件作为系统所要处理的另一种内容形式来考虑。本书关注的内容对象包括音频、视频、文本和结构化媒体对象等,这些都是现今富内容组织所必须制作和管理的。本书的重点在于媒体和广播业务。但是,随着越来越多的机构(如图书馆、教育机构和大型社团组织等)需要管理高质量的内容,本书所讨论的概念、原理和系统对它们也是适用的。

本书从理论研究和实际问题2个方面介绍与内容相关的工作流、编码原理及相关标准(特别是基于MPEG的格式和基于DV的格式)、元数据原理及相关标准(如MPEG-7、Dublin Core、SMPTE元数据字典,以及XML、MOS和SOAP)和文件格式等内容。本书的核心部分是内容管理系统的体系架构和基础结构。此外,本书还讨论了系统集成和应用。

本书的写作过程

本书的2位作者都在多媒体和内容管理领域工作多年,参与了很多内容管理系统的开发工作,在专业制作及广播环境的内容处理和管理方面积累了大量的知识。开始的学习过程是很艰难的,因为这个领域的很多方面都需要去理解,包括一些技术问题,如相关的编码格式、标准、设备特性、系统特点等,但更重要的是要理解工作流和用户需求。很多研究项目(由European Commission和德国政府资助)促进了这个过程。在这些项目中,不同的利益集团联合起来一起探索所有有关内容管理的问题。作者意识到,尽管在不同的领域以及内容管理的不同方面有很多的经验,但是这些经验并没有被总结在一起。当不同的团体聚集在一起,需要达成一个共识时,这一点尤其重要,其中既有在广播和IT领域从事内容管理系统的开发、实施、运行和维护工作的技术人员,也有富媒体组织内的操作人员(如编目员、新闻记者、编辑及制片人等)和管理者。因此,我们决定将近些年积累的知识组织在一起,提供一个涵盖专业多媒体内容管理的所有问题和解决方案的综述。

本书旨在把这些相关的领域和方面融合在一起,既是一本专业内容管理系统的教科书,也是这方面的一个纲要,既解释了基本原理,又介绍了系统的细节。

本书面向的对象

本书面向从事多媒体内容的处理和管理工作的专业人士、学生,以及对该方面感兴趣的读者。本书的主要内容包括媒体编码与处理、元数据与文件格式、数据与存储管理、分布式多媒体系统、系统集成及应用。本书的目标读者是IT及广播领域的工程师、归档员、编目员、媒体内容管理人员,以及所有与处理、开发和维护内容管理系统工作相关的人士。

此外,本书还能帮助身处数字时代的媒体行业和富媒体组织中的决策人员,如媒体和广播领域的专业人士、经理等,更好地理解内容管理方面的问题。本书详尽地解释了所有必要的概念,使读者能够对内容管理项目有整体的理解,并能了解其潜在的缺陷。

感谢

首先,我们要感谢那些在诸多项目中与我们合作,使我们对媒体内容管理所涉及的诸多方面有更多认识的人,他们中有European Commission资助的EUROMEDIA、OPAL和DIVAN项目的合作伙伴;德国地方政府资助的FMS项目的合作伙伴;在各种项目中为我们出谋划策、与我们一起工作的合作伙伴;还有从事EBU和SMPTE标准化工作的专家。在与他们的讨论中,我们有了更深的认识。另外,我们还要特别感谢多年来实践我们的想法、与我们一起开发了许多系统的同事们。如果要把这些年来作出贡献的人们的名字全部列出来的话,那将是相当长的一串名单,所以我们决定不这样做。我们知道那些优秀的人们知道他们正是我们要感谢的人。

最后,我们还要郑重感谢这些年来支持、鼓励我们的人,尤其是我们的朋友与家人,因为他们经常要容忍一个常常都很忙碌、时间总是被工作和项目占据的人。安德鲁·莫思彼得·托马斯

第1章 概述

信息的建立、表示和交换,以及信息载体的收集、组织和存储是一个很古老的行业。图书馆和档案早就存在于古埃及、巴比伦、中国以及所有先进的文明古国。这可被认为是处理媒体和保留信息的早期文化发展的一部分。因此,可以说内容管理已有上千年的历史,只是在当今的信息社会里,需要处理的信息量、信息产生的速度、媒体的种类及使用的格式有所不同。在19世纪到来之际,连续媒体(如电影和音频)被增加到传统的离散媒体格式中。在20世纪的最后20年,新的数字多媒体格式(如数字音频和视频,还有网页和超文本文档)出现了。所有这些不同的媒体格式都要在产生它的组织内部管理,包括进行各种形式的内容处理、存储和传送。

现在,另一个影响内容管理方式的趋势是,内容的建立不再是线性过程。内容是从代表不同媒体和信息种类的文章中集合而来的。原始的电影胶片、电影工作样片、现存的档案材料和附加的纪录都被用于建立视音频媒体对象。数据单、脚本、生产计划和过程指令等各种类型的文档伴随着内容生产过程产生出来。在整个内容生产过程中,信息周转的时间必须大大减少,同时,所有参与的小组都要能够访问和使用内容的各个组成部分。因此,内容管理系统并不是最终的存储库,而是内容建立和传送的中心环节。

在最近几年,我们可以体察到媒体产业的变化。随着万维网的出现,传统印刷媒体、广播电视公司和娱乐公司之间的区别变得越来越模糊。大多数媒体公司都拥有自己的网址。广播电视公司不仅可以通过已建立的渠道传播,而且可以利用数字广播电视技术进行传播。还有,音乐唱片和视频在当今不仅通过传统的零售商销售,也可通过电子渠道推销。事实上,内容(尤其是信息)不同于金融产品,它是可以进行电子处理和传送的商品。

此外,越来越多的非媒体组织正面临着怎样处理他们的内容的问题。大的企业有采用多媒体存储的促销材料和公司档案,教育机构正在用的视听报告材料也需要管理。博物馆、旅游景点、乡镇和城市也要处理不断增加的、需要保存的内容。还有,电信公司也正由纯网络提供商发展为服务公司。他们一致认为媒体和娱乐市场是一个有增长潜力的领域。为了抢占这个市场空间,他们必须管理媒体并提供其所需的信息。因此,内容管理不仅仅是传统媒体产业要解决的问题,也是各类研究机构和组织要解决的问题。

然而,这种普遍存在的、无所不含的通用内容管理系统迄今为止还未出现。许多产品自称是内容管理系统,声称能够提供一般的或至少是基本的内容管理支持。然而,他们都是在某一特定行业内开发的,因此都集中在某些方面且具有某种特色。直到现在,还没有哪一种开发出来的平台既可用于小型研究所的内容管理,又可用于支持富内容的组织的媒体生产过程以及档案管理。由于不同的应用要求千差万别,建立这样一个通用系统的可行性便更加值得商榷。

本书涉及专业媒体生产、处理和传输环境中的内容(或者叫媒体资产)管理的所有方面。重点关注广播电视产业,但也考虑其他富内容的组织需求;论述了从媒体进入到系统、经过生产的各个阶段到最终的文件归档等整个工作流中的每个环节;并且介绍了主要的媒体格式和编码原则,讨论了系统中内容的表示方式;在后面的章节中还介绍了元数据标准和框架。本书的核心是探讨内容管理系统的体系结构和基础结构。既然这样一个系统是现存环境和可能建立的操作的一部分,那么整合应被作为一个很重要的方面加以考虑。应用是系统最可见的部分,因此理应对它们做适度的介绍。本书的最后讨论了未来的发展趋势。

进一步细化一下,本书做了以下的组织和讨论:

·第1章的余下部分定义了内容的概念,介绍了问题的范围。对内容管理所能发挥重要作用的不同领域进行了讨论。

·第2章介绍了处理内容的不同组织和个人,并讨论了与内容处理和管理的环境相关的许多工作流。这些工作流包括非媒体生产领域,如电子商务、教育和培训、市场营销等的内容管理。

·第3章探讨的重点是内容管理系统所要管理的相关媒体格式,包括介绍基本编码和压缩原理,讨论相关的视音频格式和它们的结构。重点是标准化的、公开的格式,这些格式通常是媒体生产和广播电视产品的基础。这一章还对图像和结构化文档的格式进行了大致描述。在这一章最后部分介绍了自动化媒体生产过程的原理,这些原理是视频、音频和语音分析工具的基础。

·第4章集中讨论了有关内容和元数据的表示法。为了管理媒体并借助媒体工作,在进行表示和描述时要考虑所有相关的观点。本章的第一部分讨论了系统内表示内容的不同方式。接下来介绍了相关元数据的描述方案和标准。在这个领域存在大量的首创,因此,了解它们的原理以及能够区分它们的目标和结构是很重要的。最后,还对相关元数据传输和交换标准的进行了讨论,如XML和SOAP。

·第5章集中讨论了文件的格式,这些格式都是与特殊的内容生产和管理相关的。文件格式包括实际的媒体编码格式和相关内容的描述性信息。本章主要讨论人们为专业系统建议的格式,同时也对涉及的其他多媒体文件格式进行了讨论。

·第6章提出了一个内容管理系统的体系结构。这个结构框架包含了在专业环境中进行内容管理所要求的所有要素。这个体系结构包含许多核心的要素、服务和处理内容及与系统交互所需的应用组件,并对不同的组件进行了详细的讨论。这个体系结构不是一个蓝图,而是一个参考的框架,该框架包含了与内容管理相关的主要组件。

·第7章解释了内容管理系统的基础结构和它的各种不同的组件。体系结构专注于组成内容管理系统的软件模块,而基础结构表示组成内容管理系统和主机的不同软件模块的物理系统要素,也包括实际的内容(如以素材形式表示的媒体和描述性的元数据)。接下来详细讨论了不同基础结构的要素是如何支持管理和生产过程的。此外,操作方面的考虑如项目移植、成本和规模策略也在本章中进行了适当的讨论。

·第8章讨论了系统整合问题。在一个内容丰富的组织中,内容管理系统是更大的结构中的一部分。在已建立的运营系统中,必须考虑遗留下来的内容以及现存需要整合或至少是需要协调的组件。更进一步说,内容管理系统未来可能将成为运营系统的中心。而且,也将有许多其他的系统会用于内容的生产和分配,例如演播室自动控制系统、非线性编辑系统、新闻工作室系统等。本章将会解释如何对它们进行整合或协调。

·第9章给出了与专业内容管理系统相关的应用组件的一个总览。它介绍了基于组件的应用设计的概念,因为内容管理系统的应用需要高度的灵活性和可配置性。本章还简要介绍了一些用于建立实际应用的模块,然后列举了一些应用程序结构的例子用于解释用户是怎样把不同的需求放于系统中的,以及工作流是怎样被反映到应用程序中和它的用户界面上的。

·第10章展望了内容管理的未来发展趋势。首先,简要介绍了相关的原创思想和标准化方面的工作。其次,总结了专业内容管理领域所取得的经验。最后,讨论了这一领域的未来发展方向。

1.1 什么是内容

通常,内容一词是指任何种类的音频、视频、声音或者文本信息。在这种情况下,一个具体的媒体类型表示的内容可能有一个既定的表示周期(如一段视频或音频广播)。然而,在系统的环境中,内容具有永久存在和可获得的特性,即内容可以根据需要访问,或者在系统的某些特定时间去获得。内容可以按部分或整体的形式去生产、转换、传递、消费和交易。

内容的一般特征是很宽泛的,并没有给出任何量化的描述,也没有具体说明其不同要素。然而,这却反映了目前对这一词汇的通常用法。内容在被使用时具有不同的内涵(取决于上下文)和不同的方式,有时会描述完全不同的概念。

为了解决这个问题,电影与电视工程师学会(Society of Motion Picture and Television Engineers,SMPTE)和欧洲广播联盟(European Broadcasting Union,EBU)成立了一个特别任务组,专门用于解决内容和内容管理的相关问题。这个工作组在定义内容一词时是以媒体产业为背景来确定它的要素的。

根据工作组的定义,内容包括:

·素材。

·元数据。

这里,素材是指原始的节目原材料本身,通常以图片、声音、文本、视频等方式存在。素材含有实际的消息或者信息,被称为媒体。然而,媒体这个术语也被用于表示物理的载体,例如录像带、CD等。既然素材指的是一般意义的概念,并且它独立于物理载体,因此必须对它进行清楚的区分。本书决定使用“素材”(Essence)——这个较为专门的术语来特指编码的信息,它直接表示了实际的消息。按照EBU和SMPTE对素材的定义方式,本书通篇使用“素材”这一术语。

第二个内容要素是元数据。它被用于描述实际的素材和它的不同表示形式。元数据可做如下分类:

·与内容相关的元数据,它给出实际内容或主体的描述。

·与素材相关的元数据,它用于描述可用的格式、编码参数和记录的具体信息。

·与位置相关的元数据,描述内容的位置、数量和载体等的状况。

与内容相关的元数据包括正式的数据(如标题、副标题、存在的时间和演员表等)、索引信息(如关键字、图像内容描述和分类等),以及有关专利的数据(如专利所有者、获得的专利权等)。

根据不同的应用环境和领域,内容的2个组成部分(素材和元数据)具有不同的相关性。实际的素材用于使用和操作,元数据则用于描述、查找和检索内容。因此,在所有的应用中,元数据起着关键性的作用,即通过它实现对内容的挑选而不是表示(如应用在内容的生产过程、销售及个性化内容的传递中)。

一个既可以管理素材又可以管理元数据的系统被称作内容管理系统。管理素材的主要任务是对高容量、高带宽和一部分对于时间敏感的数字化数据的存储、管理和传递。在专业环境中,也包括对专业化生产和广播电视系统的集成(或协调)。内容管理并不局限于某个具体的部门,如档案库,它遍及一个内容丰富的组织中的所有部门。

元数据的管理主要涉及描述、存储和定位信息系统以及数据库中与内容相关的数据。除了传统的人工注解,还包括增强的元数据描述和通过如视频分析和语音识别工具等自动过程产生的索引信息。

1.1.1 内容和知识产权

知识产权(Intellectual Property Rights,IPR)和数字版权管理(Digital Rights Management,DRM)属于相关领域,当在一起考虑它们时就形成了一个自我包含的问题域。版权管理包含2部分,版权管理(与内容对象相关的版权描述和版权文档)和版权保护。

对于版权情况不明确的内容在商业环境中是不能使用的。不遵守法律、契约规则和IPR而去使用内容可能会引起严重的问题。一个不了解其相关知识产权的内容对象对于一个组织来说是不具有任何价值的,因为它不能被开发。只有当版权明确,一个内容对象才能被展示、广播或交易。因此,当一个内容对象的所属权对一个组织是确定的时候,它就变成了一项资产,就能用于商业开发。

有些人甚至认为一个不具有适当版权的内容对象就是一项负债,因为必须要对它存储、管理和保存,但却不能在公共场合使用它。当然,保留不具有合适的知识产权的内容可能还有其他原因。例如,有许多研究所负有保留国家文化遗产的责任,因此他们所管理的内容对象就属于这一类。然而,这并不意味着他们有任何权利去开发这些内容。还有其他一些更为注重实效的保留内容的原因,它们对这些内容也不具有合适的版权或者版权不明确,例如,一些特殊的内容在某个特定的情况下可能会变得引人注目。有人认为只要在实际广播开始之前能明确版权的使用权就足够了,但为了方便快速地访问它们,他们会在自己的系统内保留一份这些内容对象的副本,即使在原始契约终止后也是如此。

根据这些考虑,在内容和资产之间要有一个明确的区分。本书主要论述内容和它的管理。内容对象也可以成为资产,在不考虑版权的情况下,同样也可以应用管理过程。然而,为了确保可信的、定义良好的术语的使用,我们在整本书中使用“内容”来表示这个定义。

1.1.2 内容管理系统与DAM-S和MAM-S

有许多不同的系统被称为内容管理系统。例如除了媒体生产支持系统之外,还有一些处理网页的系统也被称为内容管理系统。另一方面,人们在谈论数字资产管理系统(Digital Asset Management System,DAM-S)和媒体资产管理系统(Media Asset Management System,MAM-S)时,实际指的是针对视音频内容的管理,如前面所定义的素材组件和元数据。这样做的目的是为了强调一个事实,即这些系统处理的对象都具有很高的价值,或者至少这些对象是以高质量、高容量的格式编码的。在此处使用前缀“数字”和“媒体”是为了将这些对象与金融资产相区别,因为在资产管理系统(Asset Management System,AMS)中也要对后者进行管理。

经过慎重考虑,本书选择了“专业内容管理系统”作为标题,因为版权的管理并不是这里所描述系统的固有部分(只是其中一方面)。这里的“专业”是指这些系统是在一个企业或组织范围内对内容进行专业处理的平台,包括许多系统和设备、大量的格式及支持内容的生产、处理和传输的工作流。我们在谈到内容管理系统时决定不使用前缀“数字”,因为本书所讨论的系统也包含有这样的内容对象,即它们的素材可能是以模拟格式存放在磁带库的架子上的。

然而,选择“处理数字媒体资产”作为副标题是为保证潜在的读者能立即意识到这个主要的专题领域。尽管数字媒体资产并没有完全得到管理(如同知识产权没有得到完全管理一样),然而内容管理系统还是处理和管理了它的部分内容。而且,与完全的数字化、无带式的内容生产和管理环境相比,在使用数字多媒体格式时,这些系统所具有的潜力还有待开发。

因此,本书的重点是内容和内容管理,包括在系统环境中管理素材及相关元数据所需的所有应用系统和工具。建立这样一个系统的主要目标是,为系统内整个生命周期的对象管理提供一个一致的和综合的观点,同时还包括维护素材和相关元数据间的关系以及不同版本的相同内容对象间的关系。此外,这样的系统必须提供一种信息和对象(素材)交换的接口,用于系统的自动控制或版权管理。

1.2 应用范围

尽管人们对于内容的关注已有很长时间了,但随着内容数量的增长以及人们对获得内容需求的增加,使得人们对内容的管理和查找提出了更高的要求。由于数字化格式和数字生产工具的出现,使得不使用物理载体(如录像带)而进行全数字媒体的生产成为可能。这也使得合作、交流和对内容的商业开发有了新的途径。内容管理在这个过程中起着很重要的作用,因为它为处理数字媒体提供了平台。对内容管理的要求使得应用程序的数量稳步增长。为了确定对潜在系统体系结构的需求,研究不同的应用领域以得到一个对各种用例的总体思路是非常重要的。

这部分会给出一些在不同领域中的关于内容管理的例子,以此来较为详细地说明相关问题,并指出在何种场合,内容管理系统都能对内容处理提供有用的支持。这些例子可能是不全面的,但它会给出一个与内容管理相关的不同领域和需求的较好的概述。

1.2.1 电视、广播和媒体生产中的内容管理

目前,在广播电视中对内容管理的应用主要集中在档案管理以及诸如新闻、体育和时事等节目的制作上。在档案管理中,内容管理支持内容对象的分类并方便检索。分类的任务是通过使用分析方法和自动索引工具来提供自动检索信息(如关键帧和关键字)。这些工具也可以对不同的电影镜头进行视频分段,允许文档快速地使用预先限定的分段结构和关键字,并对内容对象的副本进行浏览。因此,一个概要的文字描述是必要的。这些关键帧和可供浏览的副本对非纯文本文档的描述增加了新的特性,因为它们给内容提供了附加的视听部分。

为了查找内容,通用的查找工具必须支持传统的本地数据库的查询,这种查询包括能进行全文本搜索。由于存在很多数据库,这些数据库必须通过内容管理系统进行集成。这里的集成指的是支持结果一致的多种方式的查找。允许视听查找的(如图像相似性检索、通过哼唱查找等)先进查找工具也是某些先进的内容管理系统的一部分。为了开发具有这种能力的多媒体系统,在任何适当的时候,理想的结果都应该包含一个对素材的视听的表示(如关键帧、浏览、预览和预听副本)。必须通过帧和时码准确地表示连续媒体,以便能够对原始内容对象的内容进行检索。内容管理系统必须能对在线、近线和离线的素材进行综合管理。必须要有专门的应用工具,使得专业用户(如档案管理员)和非专业用户都能够访问这些内容。

在生产的过程中,内容管理系统必须与广播电视的控制和制作工具,如演播室自动控制系统、新闻工作室系统和非线性编辑系统等,进行高度地集成。应用界面必须与记者、编辑工作系统的桌面环境实现无缝整合。在这个环境中,不允许对应用系统进行改变。内容条目在内容管理系统中进行管理;然而,它们也必须和其他系统(如新闻机构)的对象以及新闻工作室系统的节目条目进行链接。这不仅对数据,对元数据也是如此,这暗示着必须能跨系统进行查找。新节目条目的生产必须要求进行帧和时码准确的内容选择,这通常是通过对生产条目的低码率副本的预览来完成的。根据条目的选择来传递制作素材,实际素材的制作是在非线性编辑系统上完成的,这种制作发生在内容管理系统的控制之外。由于内容被不同的系统共享,对一个具体内容条目的控制引用和频繁的传递就会发生。因此,将特殊的演播室服务器、非线性编辑系统和其他广播电视设备通过接口、消息或文件交换进行集成是很必要的。有许多的数据库要么进行集成,要么进行同步。存储管理必须控制在线和近线系统(包括专业广播电视存储系统)各不相同的存储环境。

音频和广播电视制作及归档的需求与视频和电视的需求是很相似的,尽管还要集成其他的设备,并且这类应用系统的集成也是不同的。

一个较新的领域是网页内容的制作和归档。除了集成的应用不同外,在这种环境中的数据率和存储要求要小得多。一个特殊的问题是要选好与其他网页进行超链接的方式。尤其是对于归档素材而言,这些链接很可能已经过期了。因此,归档的深度一定要建立好,即必须决定归档文件中包含哪些参考页面并且哪些地方的链接已不能用了。除了这一点,对在这种环境中的内容管理并没有太多的要求。

1.2.2 非媒体组织中的内容管理

不属于媒体制作和传播行业的组织也要对不断增长的内容进行处理。例如,公司的档案或大型企业的营销部都有需要管理的内容。像博物馆或教育机构等组织,如大学和高等教育学院,也有很多内容需要进行存储和管理,以方便各种具有不同使用权限的人进行检索。这种环境中对内容管理的需求不如媒体制作环境中那么迫切,它们也需要与具有潜力的大型第三方应用程序和系统,如企业资源计划(Enterprise Resource Planning,ERP)、过程计划系统及远程媒体学习平台等,进行集成。

一种随时都有海量视听内容产生的应用领域是通过在建筑上或公共场所内使用的CCTV监测仪来获得安全的服务。由于在这种环境中产生的大量数据不能通过个人去观察,所以电子的或自动化工具便可帮助对内容进行识别和分类。例如视频分析、外貌和物体识别及个人身份确认。

本质上,这些应用领域的需求与广播电视和媒体制作都是很相似的,然而在工作流和需要集成的第三方系统上却有很大的区别。这意味着其核心的功能必须被压缩,而且必须通过一些足够灵活的方法给各类组件和第三方系统提供标准接口。核心问题是如何解决好与其他应用系统、数据管理系统和媒体/素材处理系统的集成。

1.2.3 高级媒体服务中的内容管理

在新媒体传播应用和服务中也需要内容管理,并且它逐渐在跨组织的范围内应用(如支持内容交换和协作)。

诸如此类应用的例子有内容交换和协作性的内容生产支持。许多要求(如不同组件和第三方系统的整合、跨系统查找和数据管理)与内部内容管理过程是很相似的。然而,与传统的内容管理应用相比,这些系统中的许多内容都是分散在一个很大的地理范围内的,这对存放于每个合作伙伴地址内的素材的存储更是如此。在安全的环境中,副本可以被放置在不同的位置,当然还要考虑到知识产权方面的问题。

另一类应用是采用电子商务应用系统销售内容。在这种情况下,重要的是内容管理功能与销售及后端办公体系结构(如订货系统、账单系统和ERP系统)的整合。而且,内容的电子传输方式必须要求与所有的客户进行高带宽的连接。目前,还没有一种通用的、可行的系统结构来支持这类传递方式。

对于通过高速网络连接到内容所有者和分销商的大型内容存储中心而言,目前正在探索外购内容管理的可能性。这种方式能保证规模经济和不同内容领域里的潜在共同合作。迄今为止这种理念还无法实现,因为总体来说内容管理系统是大规模的(规模经济不能应用),而且可利用的通信设施不支持高带宽、大容量的操作。在这种情况下的系统需求(除了内容管理系统的基本需求外)主要与安全和内容保护相关。如果内容管理是外包的,必须确保被授权的第三方能够访问内容。

涉及内容管理的其他领域是个性化内容传送和远程教育。在前面的例子中,内容的元数据必须附带更多的信息以便可以根据个人的喜好进行挑选应用,这种应用环境需要对数据挖掘工具进行整合。远程教育也需要对内容管理与现有工具进行整合。这些应用的显著特点就是用户间高度的交互活动。而且,内容可能被存储在系统内不同的位置,因此需要进行分布式存储和内容管理。

1.3 内容管理:问题阐述

上面所讨论的例子给我们一个关于内容管理系统需求的印象。应用是系统中最可见的部分,它所支持的工作流决定了系统大部分的功能。然而,其他需要考虑的重要方面则是来自于系统中需要管理的不同素材格式特征方面的需求。而且,元数据和它在系统中表示的方式也是很重要的方面。还有,为了从内容管理系统中获得最大的效益,必须对很多外部系统和设备进行整合或者协调。所有这些构成了必须满足的一系列需求。

如此庞杂的一系列需求是不太可能在一个单一的体系结构中得到满足的。理想的情况就是内容管理系统被设计成一个完全分布式管理方案的框架,用于内容的处理和管理。通过在一个内容丰富的组织内进行系统的实际安装就建成了一个数据交换中心,用于素材和元数据的管理和分配。因此,在考虑到特殊需求、使用各方的权限和进行日常操作的不同用户群的情况下,内容管理系统需要提供对信息和素材的便利访问。

为了理解问题的范围和明确本书的视角,接下来的部分将更为详细地介绍对内容管理系统的需求。这个讨论是根据各领域需求来进行的。

本书的重点是有关内容丰富的组织使用企业级的系统,用于内容的生产、处理和分发。这些大规模的系统为与内容相关的所有操作提供平台。因此,工作组和小型应用的具体要求并未被明确地加以考虑。但在很多情况下,本书提出的方法和开发方案对于这类应用领域也是适用的。

1.3.1 媒体和素材的处理需求

内容管理系统的目的是为多媒体对象(或素材)如数字视频、音频、图片、图像和网页等的管理提供一个平台。在一个内容丰富的组织(如广播电视公司)中,会遇到大量的素材以及各种各样的媒体类型和格式。并不是所有这些内容都是数字化的,也就是说系统必须支持全数字化的操作,同时也要能够处理“架子上”的材料。

然而,系统面临的真正挑战是对大量的高质量、高带宽格式的需求。例如,一个10万小时的中等规模的视频文档材料就包含多种格式的对象,从大约4Mb/s的广播质量格式(如MPEG-2MP@ML基本格式)到超过25Mb/s标准的生产格式(如DVCPRO),到更高质量的格式甚至是270Mb/s(依据ITU R BT 601-5编码的)未压缩的视频格式。假设平均带宽为25Mb/s,那么像这样的文档存储需求就已经达到1PB以上。内容长度的变化也是非常大的,从2分钟的新闻短片到90分钟的故事片。通常这些数据必须进行实时处理,有时甚至希望比实时通信更快。对那些在生产中重用内容的组织,典型的内容管理系统必须提供许多功能,以允许从归档内容中进行局部内容的挑选和将局部内容恢复出来传输到所选择的目的地。这意味着内容管理系统在内容归档时必须清楚所有文件和编码格式。由于现在仍有许多不同的技术被用于媒体生产,许多传递和传送过程也要求文件和编码格式的转换,因此需要通过将标准的IT体系结构与标准的广播电视体系结构和网络连接起来以进行完善,当组织的生产中心分散在不同的遥远的位置时,可能还包括广域网间的传输。

除了这些高质量的视频格式外,一个内容丰富的组织也必须能处理其他数据,如音频、图像、图片和文本。对音频的要求是从几kb/s到1.5Mb/s(PCM编码的音频是44.1kHz)甚至更多。低码率的浏览和预览格式通常要与高质量的格式保持连接,而且通过关键帧和其他多媒体的格式,使内容对象的表示被进一步加强。

在理想情况下,内容管理系统应该能够存储、处理和管理各种不同的媒体类型和格式,而不管它们的编码方案或任何其他的具体特征。基于IT的系统特别适合这种情况,因为它们的实质是以位和字节来处理文件。然而,内容管理系统必须对媒体处理和传送提供先进的技术支持,视频和音频必须以文件流的形式传送,采用自动分析过程提取有关媒体对象的附加信息。这些只有在系统知道具体媒体的结构和特征及编码格式时才能实现。除非素材的存储涉及为特殊格式提供优化,否则内容管理系统应该是与格式无关的。

1.3.2 元数据建立和处理的要求

在生产、广播(或传送)和归档过程中,内容管理系统必须方便内容的处理和使用。在这种环境中,一个最重要的任务就是最大限度地使用现存材料,以使生产成本最小化。这可以通过直观的用户界面所提供的便利访问、根据视听反馈来进行查找和其他重要的人机交互来实现。然而,用户界面和应用程序只是其中一个方面,查找结果的质量主要取决于用于描述材料的元数据的质量。因此,分类过程的质量起着至关重要的作用。

内容管理系统要能够提供这样的工具,这些工具是在基于计算机的内容分析的基础上,能自动地从自身内容中提取出一系列元数据。此外,由内容管理系统来支持大部分重要元数据的创建也是非常重要的,即通过有经验的、合格的分类员和档案员输入描述性信息来建立元数据。这些专业人员通常都具有与内容相关领域的知识,因此能够确保那些描述性信息的质量。

传统上,几乎所有的元数据都是由档案或分类部门在材料归档时创建和输入的。这意味着,在很多情况下,早期创建的信息(例如制作细节或新闻工作室系统信息)要么丢失了,要么必须通过手工方式重新输入系统以保证其档案元数据的存在。这就增加了分类部门工作员工的负担,使他们没有太多时间从事深度索引这样的创造性工作。因此,内容管理系统应该在内容对象的整个生命周期中收集和保存元数据,包括从前期制作、检索、编辑、制作、后期制作、电台播放唱片直到归档和重用。这意味着内容管理系统应该:

·自动产生尽可能多的元数据以丰富内容而无需增加人们的工作负担。

·通过提供应用程序来支持周期内的各个步骤参与到全媒体的使用周期中。

·当内容在周期内移动时,保留元数据的完整性,使分类的员工在需要时能很容易地评价和修改所有的元数据。

1.3.3 用户需求举例:电视生产应用

有许多不同的行业和领域都配置了专业的内容管理系统。然而,目前配置内容管理系统最为流行的领域是在广播电视和媒体生产行业。下面是对这个领域用户需求的调查,它给出了用这种系统工作的用户需求的一个描述。本书稍后将会详细介绍在其他领域非常相似、有时又有些不同的需求。1.3.3.1 整合生产

从基于VTR到基于服务器的制作系统的变化要求来使用自动系统存储和传送素材。这反过来又要求有一个内容管理的体系结构。在这种环境中,需要考虑的是从有效素材(包括相关的技术性和描述性的元数据)开发出至关重要的实际素材和要素以及它们的分类过程。人工产生和收集内容信息是非常昂贵和费时的。因此,必须将内容管理系统集成到编辑和生产过程中,以避免生产过程中有用信息的丢失。1.3.3.2 素材管理

把一个视频流当成没有任何特殊的语法或语义的一大堆字节是不够的。一些基本的控制信息的功能是必要的,包括转码到不同的格式。而且,流中所包含的有效元数据对文档用户必须是可访问的。因此,内容管理系统必须能够应用信号压缩来处理新的数字视频格式,并能够提取和解释相关的编码元数据(如视频参数、压缩方案等)。1.3.3.3 浏览

为了节省带宽和存储容量并减少生产服务器的负载,要求在桌面上能够观看和操纵高码率的格式。对两种不同程度的浏览方式要区分开来:用于粗编浏览的编辑决策列表(Edit Decision List,EDL)和用于内容观看和摘录筛选的内容浏览。

EDL浏览有以下属性:

·帧率与原始高码率材料的一致。

·时码的帧准确表示。

·帧准确导航。

·质量水平适合生产粗编稿。

·编码方法提供的图片质量必须等于或高于VHS或MPEG-1。

·编码方案必须标准化且为行业所支持。

·必须能在标准的PC机上运行。

·时码必须是浏览格式编码的一部分。

与之相比,内容浏览在帧的准确性和时码方面就不具有那么严格的要求了,但是它在评价和选择材料上仍然是一个有价值的工具。内容浏览具有非常低的比特率预览质量的特征,然而其基本特征模式功能(如实时重放、快进和快退)必须是可用的。由于这种素材版本在某些情况下是面向公众的,因此一个非授权的商业化保护系统(如版权保护系统)是十分必要的,而且其编码方案应该与因特网技术相兼容,例如,内容浏览应该支持流和文件传送。此外,它应该是可升级的,能为不同种类的传输渠道提供最优化的服务,能够适应最有效的传输渠道的比特率的变化,包括通过流服务器进行自动的服务质量(Quality of Service,QoS)管理。1.3.3.4 信息管理

信息管理主要是解决元数据的处理和索引库的合并。元数据的处理覆盖了整个材料的生命周期,从创建点到归档点。唯一资料标识符(Unique Material Identifier,UMID)在整个生命周期对素材进行标识,更多的是唯一标识符代表了内容对象。元数据在通过自动分析过程导入时自动产生,同时与内容相关的现存元数据被自动提取。自动化工具应该支持元数据生成的整个过程。在这种环境中,使用标准的格式是非常重要的。

内容管理系统应该能提供不同元数据的描述方案,包括遗留数据库的数据模型以及各种标准编码方案。即使在一个系统内,支持多数据库和使用不同数据模型的信息系统也是必要的。1.3.3.5 用户界面需求

用户界面对于一个内容管理项目的成功起着很关键的作用。既然内容管理系统是内容处理的一个通用平台,有许多具有不同技能和背景的用户要与系统进行交互。因此,应用程序界面必须同时支持专业用户和非专业用户。不同的用户界面是解决各类用户组不同需求的一种方式,界面必须符合人机工程学并且能够满足特殊用户的任务要求。

搜索界面必须要考虑最好的IT实践。为了服务于截然不同的用户组,搜索界面必须支持不同的搜索理念。例如,全文本搜索是一种支持非技术用户的方式,相比之下,档案员、分类员和媒体管理者就非常愿意用本地界面直接锁定搜索和进行属性搜索。无论在内容管理系统内采用何种搜索技术,系统保持可扩展性和对新的搜索技术的开放性都是很重要的。

1.3.4 操作需求

既然内容管理系统是所有与内容相关操作的中心,满足操作系统的要求是很关键的。标准化操作对系统提出了很多要求。内容管理系统在一个内容丰富的组织内所发挥的作用可与操作系统(Operating System,OS)相比拟,即除了信息管理,它也为其他服务和组件提供一个平台和主机。在这种情况下,必须要考虑到下面的操作要求:

·提供与文件系统相同的存储、组织、查找和检索资产的方式。这意味着内容管理系统必须允许文件的存储、迁移、重命名和删除。而且,必须能以目录树的形式组织文件,能以合适的系统命令查找它们,能用应用程序来访问它们。

·提供系统范围的中心服务,如用户管理、域名服务、资源保留及其他内容。这与操作系统提供的管理和系统管理能力是相似的。

·提供运行服务的方式,这些服务包括可以访问内容管理系统内归档的资产、可以操作资产或提取信息。这种方式扩展了内容管理系统的能力,就如同运行在操作系统顶层的邮件收发后端程序或后端服务扩展了操作系统平台的功能一样。

·提供了在系统顶层运行应用程序的方法,允许对系统内存储的信息和材料的访问,支持工作流中所有的相关步骤。这一点可与应用程序建立和运行于操作系统顶层的方式相对照。因此,内容管理系统允许对系统性能的访问。

具有这些性能的内容管理系统可为所有与内容相关的管理任务提供支持。因此,它不仅是部署于一个具体组织单元的一个组件,而且能为一个内容丰富的组织提供理想的服务。

既然内容管理系统在诸如广播电视机构这样的组织中是任务的关键,因此必须保证系统具有较高的有效性。还必须采取措施来避免由于系统出现问题而导致的停工期,并且能以不影响系统操作的方式处理可能的失败。

1.3.5 系统需求

在大多数情况下,企业范围的内容管理系统可以被引入到现存组织环境中,而这种组织环境处理内容已有一段时间了。因此,内容管理系统不是一个全新的概念,必须将现存系统结构和操作及以往的系统考虑进去。内容管理系统必须提供定义良好的界面,以允许将现存技术和方案容易地整合到整个框架中。考虑到现存的操作,内容管理系统的引入必须是逐步的,因此良好的界面是必要的。为了达到这个目的,最好的方法是逐步由现存系统过渡到新系统。在这种环境中,主要任务之一就是集成一些重要的可借鉴的系统,如集成现有的数据库或信息系统、制作系统、新闻工作室解决方案或某种中间产品。

此外,内容管理系统必须对进行集成的组件实行开放,这些组件可以是来自其他供应商所提供的用于特定任务的专门设备和仪器,这些组件形成了整合的内容管理体系结构的一个重要组成部分。先进的日志、索引或搜索引擎就是其中的例子。必须能够很容易地将这些技术集成到整体解决方案中。

为了支持地理位置上分散的大企业(如国家广播电视公司),内容管理系统也需要支持组织的远程合作,例如本地或地区演播室或分部工作站。此外,一个组织的内部结构也要求支持分布式操作,例如不同的组织单元(如编辑办公室等)都保留有它们自己的内容。分布式也是处理系统伸缩性问题的一种方式。

因此,内容管理系统的主要需求是:

·开放性:解决方案必须提供定义良好的界面以使以往的系统和第三方系统的集成更为便利。

·模块性:解决方案必须是灵活的和基于组件的,必须提供一个清楚详细的功能说明书,以说明哪个功能需要由哪个组件来提供支持。

·分布式:解决方案必须支持分布式处理,以允许集成不同地理位置的系统和系统组件并可以对其进行更好地升级。

这些需求如何得到满足不仅取决于技术设计,也取决于内容要素或信息结构的特征。例如元数据,开放性是指在不考虑它们的数据结构和内容表示时,独立系统之间进行的信息交换,这意味着必须存在一种标准化的通用的元数据格式以用于这种交换。软件的开放性不仅是指开放的界面,还指这些产品必须是可扩展的和向后兼容的,而且它们应该支持迁移管理策略。

1.3.6 系统结构方面的需求

以上所讨论的需求已经涉及到了系统结构。考虑到所涉及的大量组件,一个高度模块化的系统结构(即可以通过添加服务特殊需求的模块来进行扩展的一种系统结构)将确保在技术改进时通过替换个别的模块来使投资的利益受到保护,这样的结构也是可升级的,能满足不断增长的功能及系统规模扩充的需求。

不同内容管理系统组件的生命周期的差别是非常大的。因此,整个文档系统的顺序移动是不现实的或者是非常昂贵的。一个由定义良好的功能和界面模块组成的开放系统,是保护投资利益的唯一有效的解决方案。还必须保证在系统升级时,对内容的无缝导入和导出不会受影响。此外,通过使用标准化的界面来确保不同系统组件的可交互操作性。内容管理系统相关的交互式操作问题涉及不同的供应商解决方案、不同的文档模块、服务和客户、归档和生产以及新旧归档系统,所有这些都要解决好。

1.3.7 需求摘要

以上考虑给出了问题域和在富媒体组织企业环境中对专业内容管理系统的大多数需求的一个总览。这样的内容管理系统必须能够管理全部数字媒体格式,并能容易地访问编码数据。在已建立了内容管理系统的组织内,内容管理系统也必须能同时处理传统的录像带和数据磁带,必须能轻易地实现从视频格式到文件格式的转换。内容管理系统的主要目标是更好地支持生产过程,使这种过程更有效率,并且为向基于服务器技术和数字格式过渡的无磁带环境提供一个平台。在这个过程中,内容管理系统还必须在IT行业与广播电视行业之间提供接口。服务器的配置要求能自动存储和支持检索。

对描述性数据(即元数据)的管理是一个关键的方面,因为它提供了在系统中查找内容和开发内容的方法。内容管理系统的主要目标之一是允许重用和商业开发。这也意味着应用程序和用户界面必须适合专业人员操作系统的特殊要求。尽管内容管理系统是一个平台,它的任务和功能在于内容管理(即它应该在这种背景下工作),用户界面仍然是最显眼的部分,因此该界面对于系统的成功至关重要。

当内容管理系统能通过商业的途径有效地解决问题时,它就能对投资提供积极的回报。这意味着内容管理系统必须支持企业内重要的业务过程和工作流,它必须能灵活地适应新的工作流。将内容管理系统引进一个组织会改变它的业务过程和工作流,内容管理系统应该支持用户从旧的工作流向新的工作流迁移。许多与内容相关的业务过程都要考虑计划、起草、试运行、获取、注释、查询、检索、收集、传输、编辑、正式批准和传递。内容管理系统应该参与到这些过程中,并且通过添加业务过程对象的相关元数据和提供对现有内容对象的便利访问方式来支持这些过程。

最后,仅靠内容管理系统本身并不能解决所有问题,但是将内容管理系统与其他应用程序和系统连接后就能做到。这样的应用程序和系统的例子有数据库和信息系统、制作系统、新闻工作室系统、自动化系统、记录和显示系统、企业资源计划系统和版权管理系统。因此,内容管理系统必须提供与这些系统接口的方式,允许跨平台搜索、检索、采集和传送,包括元数据和素材的交换,并且提供消息和事件处理能力,使工作流能跨越系统界限。这种能使企业有效地实现其业务过程的整体解决方案就是一个和谐一致的系统,在这个系统中,通过与其他系统的连接并保证无缝的跨系统的工作流,内容管理系统发挥着重要的作用。

第2章 与内容相关的工作流

内容管理系统主要是一个多媒体对象的知识库。然而,无论从商业还是文化角度看,它的价值体现在使内容的开发更为便利。为了做到这一点,内容管理系统必须提供应用程序模块和接口,以便为内容的开发、创建和利用提供优化的支持。依据组织处理的内容及其与处理和使用内容相关的环境,需要不同的工作流来支持。

内容丰富的组织(尤其是广播电视公司)目前是内容的主要用户,因此也是内容管理系统的主要用户。考虑不同用户组的不同需求和内容管理系统结构的工组流过程是非常重要的。认识到内容管理系统的巨大潜力并能将它方便地引入组织而不产生冲突是极为关键的。因此,分析潜在的商业过程对于内容管理系统的开发者和内容丰富的组织本身都是重要的。

每个行业和研究机构都有关于内容处理的特殊结构和工作流。各个组织虽然有所不同,但是它们基本的工作步骤大多都是相似的。除了广播电视公司和媒体生产机构外,其他使用内容管理系统来支持业务和工作过程的重要领域有电子商务系统的内容销售、教学和培训系统以及支持营销和销售活动的系统实现等。本章所给出的例子将有助于组织在考虑引入内容管理系统时应该明确的一些重要问题。

2.1 谁在处理内容

在富媒体组织内(如广播电视公司、生产和后生产机构、电影制片厂、出版社、图书馆和多媒体档案室),几乎每个人都在直接或间接的处理内容。有些人生产和处理内容,也有一些专业人士会涉及与内容有关的管理和法律问题。而且,其他一些组织也越来越多地处理大量的内容,例如,营销和公共关系公司必须管理视听材料和文本材料。大的产业公司、用户公司和服务公司都拥有文档、多媒体培训和营销材料,这些文档和材料都要在企业内部进行管理。在这种环境中,对内容及其管理不再是操作的核心。而且,对需要大量的人处理的内容进行有效的管理会在诸如营销和员工发展这些领域产生优势。

在一个组织内部,各种不同的专业小组在处理和管理着内容。他们对于内容、访问内容和相关信息的要求有不同的理解,这是由于他们的角色、权利和兴趣的不同所决定的。不同的用户组有对相关内容的特殊要求。这种信息的访问和呈现一定要考虑特殊用户,有时是个人的特殊需求。处理内容的小组包括生产员工、总监、创作总监、新闻记者、编辑、工艺编辑、后期生产编辑、编目人员和档案人员,还包括只处理元数据和相关信息的行政管理人员。下文将讨论不同的用户组和他们在处理内容时的作用,讨论将结合他们在内容生产和管理中参与生产、呈现和管理任务的程度。

2.1.1 生产中的内容访问

在内容创建过程的前期生产和生产阶段,对两种主要的用户组要加以区别,即“艺术家”(如制片人和导演)和“手艺人”(如摄像师、音响工程师、制片助理和编辑等)。前者关注理念和创造性的工作,包括研究工作、生产计划和剧本。在内容创建过程中,一系列关于内容对象的原始元数据被创建。理想情况是这些信息应该在内容管理系统的环境中创建。这些信息应该被保存起来,并且在内容对象的整个生命周期都与其联系在一起。而且,在生产过程中产生的信息(如生产注解)应该和内容保存在一起。起初,这类用户组对内容的访问是纯文本的,诸如剧本(自由文本)和计划文档(包括时间规划、工作计划和预算)。在生产阶段,主管和编辑也要在这个过程中审查工作。因此,他们必须能够有效地访问原素材和作注解(这些也是应该保存在内容管理系统中的元数据)。生产中的审查过程可以由非专业化的代理来完成。在这种情况下,必须确保浏览的副本能真实地表现原始材料,对内容的访问必须容易且直观。既然这个小组常常和广播电视生产工具打交道,那么应用界面应该采用类似的风格并提供类似的功能。

生产员工(如摄像师和音响工程师)产生新的内容。传统上,在生产过程中主要生产素材(即视频和音频素材)。然而,在这个阶段理想的做法是,这些素材应该加上与生产相关的元数据的注解。在原始素材的导入阶段,这种元数据就应该能被传到内容管理系统中。为了保证这个任务的工作负荷最小,内容管理系统应该能够自动检索到尽可能多的信息。例如,生产媒体可以通过设备的设置去获得,位置和时间参数可以用GPS模块得到。

在生产中稍后的阶段,编辑人员将这些素材进行编辑和润色工作,但要使用专门的设备来访问和处理素材,这个过程在内容管理系统的控制之外进行。因此,在这个工作步骤中创建素材和元数据,而在这步工作结束或偶尔在这步工作进行中必须要将创建的素材和元数据导入到内容管理系统中。这些元数据包括编辑注解和编辑决策列表(Edit Decision List,EDL)。为了提供最优化的支持,内容管理系统必须与本地的生产工具进行集成,不同工具间的结合点和接口必须要定义好。这种用户组的访问必须是直接的,而且要格外关注所生产的相关信息和素材。理想的情况是,内容管理系统的应用界面应该与本地生产工具集成以便允许在给定环境中实现无缝操作。

2.1.2 文档和分类中的内容访问

在内容管理中一个核心的任务就是内容的档案化和分类,这是归档的传统任务。许多训练有素的助理、分类员和档案员处理内容深度化的文档和素材的保存。从内容进入内容管理系统的那一刻起,就要求有大量的描述信息能对内容进行搜索、查找和检索。最初的文档处理通常是由所谓助理来完成的,他在素材进入系统时就对其进行实时注释(如代理片、工作样片和原素材等)。这类用户要求能快速方便地访问内容,即任何与新来素材和浏览副本(即帧和时码准确的原素材的副本)相关的初始元数据必须即时可用。既然注解必须实时产生,那么应用界面就必须为这些用户的需要量身定做。

由档案员进行深入分类的任务也必须有内容管理系统的支持。人们要求直接对组织的文档数据库进行访问。而且,对内容详细的自由文本的描述也要在这种环境中能实现。对于连续媒体(如视频和音频),这种描述是应用时码特别指明内容的某些片断。档案员和分类员的工作可以由约束单词表或分类词汇集这样的工具来支持,这些工作通常是有针对性的,因此对不同的组织必须进行具体的实现和编写。其他先进的工具如视频分析和关键词定位也逐渐出现,它们作为辅助工具来帮助实现归档过程,可以为材料的档案提供附加的信息。然而,由于目前这些自动工具并不能提供百分之百的准确性,因此工作人员还必须对这些信息进行修正。

在这种环境中,对素材的处理在不断地变化着。迄今为止,素材都存储在物理载体上,即视频或音频磁带上。在这种情况下,归档的任务是将这些载体存储在一个可控的环境中,并且通过将逐渐受损的载体上的素材备份到新载体上来保护内容。而且,磁带格式和设备有一定的生命周期,旧的格式或许要被替换掉,因为原有的设备、备件和训练有素的操作员都不可再用。因此,备份过程也经常涉及到将素材向新载体所对应的新格式的迁移。这些备份工作要花费很大的成本,并且多媒体档案要占用大量的存储容量。在新出现的内容管理系统中采用数字化格式,这种编码格式和素材的物理载体是分离的。素材的拷贝能被在线存储在磁盘上或磁带上。这里的磁带不一定是音频或视频磁带,也可以是存储在自动化磁带库中的数据磁带。素材的实际存储和检索过程完全是自动的,这其中也包括用于保存或格式转换要求的自动备份过程。在系统中可以保存多个备份,在线存储于服务器和近线保存于磁带库。尤其是可以在任何需要的时候创建和删除在线备份。这也改变了我们对内容对象的理解。现在,一般内容对象是由它的物理载体(即磁带)来表示。将来,要想清楚地知道素材和其物理载体的位置已不太可能,因为它在系统中不同的地方会有多个副本和多种不同的格式存在。因此,内容对象的概念变得更加抽象,这对归档工作也会带来影响。越来越多的焦点将会转移到对内容对象的逻辑表示(即档案化)上,而不是媒体的物理处理上。

2.1.3 内容的搜索和检索

内容的价值在于对它的开发(即表示和使用)。因此,在内容管理系统中必须能够容易地对内容进行搜索和检索。传统上这是归档的任务,它提供诸如中介研究这样的服务,搜索和检索取决于专门的文档工具(如数据库)和特殊的文档程序和语言,要求具备专业知识。随着内容的不断增长和对内容进行访问的用户的不断增长,搜索程序必须更加直观和容易处理。在内容管理系统内搜索内容的用户有记者、编辑、研究人员、营销专家,(在开放系统中)甚至还有公众。因此,搜索和检索最为重要的方面是具有简单和友好的用户应用界面、搜索结果的规范表示以及对用户角色访问权的考虑。搜索工具必须允许非结构化(即全文本)的搜索和专业数据库的搜索。此外,随着媒体处理工具的出现,将来使用诸如图像相似性检索或哼唱查询这类搜索将成为可能。因此,系统也要为这些新的搜索操作提供界面。

在结果单中内容的表示主要是文本形式的。然而,这类信息也通过原始素材高码率的副本或视频关键帧、浏览和其他视听摘要的形式变得越来越丰富了。理想情况下,搜索和结果表示的界面应该是可配置的,以适应用户组和个人用户的具体需要。选择的过程也包括粗编,它可使用户标记内容的某些部分以便进一步的处理。

搜索内容的用户应该有不同的权限用于对内容进行查看和检索。在一个专业的环境中,这种权限包括将素材副本(或被选择的部分)自动迁移到生产或广播电视设备中。有些用户可能只被允许查看低质量的副本。在网络环境中,为了防止收看的用户存储这些内容的副本,其下载的内容可能是流的形式的。

2.1.4 与内容相关的管理和经营任务

在富媒体组织内,有大量专业小组处理与内容相关的管理任务。这些小组是金融计划和会计部门、法律部门以及生产和节目计划。这些人需要访问与内容对象相关的状态、成本或法律问题的所有相关数据。通常他们已经在使用特殊的应用程序和软件工具(如企业资源计划系统、数字版权管理系统和节目计划系统等)。他们对内容的查看也仅限于文档某些方面的内容对象的元数据部分。他们几乎不需要对实际内容、素材本身或任何带有元数据的视听代理的描述性信息的访问。

然而,这些用户正在产生和使用的信息的某些部分也应该存在于内容管理系统中,例如,关于具体内容对象的版权状态的说明或者能访问关于某个项目的财政摘要的说明。另一方面,与内容管理方面相关的用户或许也要从内容管理系统中获取信息,例如,关于内容生产或重用的信息就是这些用户所感兴趣的。因此,不同系统中的信息必须能够交换。或者,应该提供(限制性的)访问系统中特殊部分存储的关于内容对象的特殊信息。在这种情况下,就期望在应用水平上有一种集成的方式,即用户应该只使用一种应用程序,而第三方系统也用该程序来表示和查看信息。

2.1.5 内容管理者的角色

内容管理系统目前用于协助各种用户组处理内容。它被看做是一种辅助工具来支持现存工作流并方便那些与内容打交道的用户的工作。然而,内容管理系统也改变了内容处理的方式,而且新的系统和(硬件和软件)组件需要专业的服务和维护。

既然内容管理系统包含数据库和海量存储技术、PC和服务器系统、通信网络和广播电视设备,那么就需要有掌握工作流和处理内容过程的技术全面的人员。而且,需要有人专门从事内容管理系统内的文档工作和实际的内容管理。许多与内容处理和管理相关联的内容管理任务都与传统的档案员、编目人员和广播电视工程师密切相关。然而,既然内容的处理正成为操作的核心部分,这就需要有一个内容管理者专门负责系统和存储在系统中的内容。这样一个内容管理者的关注点有两部分,其必须既关注技术和工程问题,同时也要关注内容和工作流,前者指的是系统和体系结构的技术维护,而后者涉及的是对处理过程和用户处理内容的实际支持。

不同的部门和个人都要对组织内的内容管理系统的操作负责。随着这种系统的逐渐被采用,对于系统和其内容上的一条清晰的责任线必须要建立起来,这件事应给予重视。内容管理者在这种环境中将起到重要的作用,因为他要对提供跨部门服务的系统的操作负责。不只是考虑体系结构和IT任务,内容管理者的工作也包括对内容的实际处理(即内容管理的非技术部分)。

根据系统和组织规模的大小,内容管理者的角色可能被分为实际的内容管理者或更多专注与内容相关方面的分类编辑(如素材和媒体处理、系统资源和提供等)以及与系统维护方面(如硬件,软件和网络维护)相关的内容管理系统工程师。这些新的角色如何被集成到现存的组织结构中去,将取决于在引入内容管理系统后的工作流的变化。

2.2 广播电视中的工作流

在广播电视行业中,内容的创建和供给过程正在发生变化。这是由于引入新的输出渠道、新的数字生产方式和对快速创建高质量内容需求的增长的结果。而且,当今技术的发展也使得工作流的集成比以前更有可能。

通常,内容创建的过程开始于节目的计划、传送方案和生产计划。在这个阶段,一些初始的元数据已经被创建了。这些元数据将在实际节目生产的过程中不断被丰富,而且在内容对象的整个生命周期中都与它相关联。

接下来,将从电子新闻采集(Electronic News Gathering,ENG)组、外部机构和内部生产中获得的材料导入系统,并与新的或已经存在的内容对象建立起关联。在导入过程中,对内容的初始注解就按照惯例产生了。这项工作要么通过所谓的助理来手工完成,要么通过特殊的提取、索引和注解工具自动产生。这些信息(理想情况是实时产生的信息)支持基本查询,甚至允许在内容导入时进行搜索和检索。因此,同时进行合适的、最新素材的选择与对这些素材的记录是可能的。

编辑访问内容管理系统主要是查询元数据。对所需信息的搜索是通过使用全文本或结构化搜索及查询操作来完成。搜索产生一个结果单,它包含新导入的材料和文档中已存在的内容。

分类部门负责对选择的内容进行完全的和详细的描述以便于长期存档。分类者创建或增加正式的和与上下文相关的内容描述并根据需要来精炼现存元数据,他们的职责也包括核实通过自动工具所提取的注解的质量。

版权和特许部门添加关于内容版权和内容知识产权(Intellectual Property Rights,IPR)状态的特定元数据。目前,与内容相关的法律条文的复杂性使得在资产管理系统(即也处理IPR的内容管理系统)中进行自主的资产管理较为困难。得到内容IPR状态的更实际的方法是优化内容管理系统和版权部门之间的信息交换,明确版权的拥有者和法律状态。

在后期生产中创建好的内容形成了节目用于传送,这就形成了内容项目新的(或最终的)版本,它要被输入内容管理系统中。形成的节目素材以后可整体重用或者选用其中的片段进行新的生产。在这个阶段所创建的元数据(如EDL)也应该被传送到内容管理系统中。

此外,内容管理系统还要维护在传送过程中所收集的信息。那些负责节目交换和节目产品营销的其他实体也要创建附加的元数据,这些元数据在内容管理系统中应当是有效的。

接下来的部分是关于工作流模型,这些模型描述了广播电视内容创建和传送的过程,而且给出了导入和录入工作流、检索工作流的较为详细的描述。这两个工作流是广播电视产业内容生产和开发过程的基本构建模块。

2.2.1 顺序的和以内容为中心的工作流模型

传统的内容创建过程遵循一种推进式模型,如图2.1所示。内容创建开始于计划和草稿阶段,在此形成最初的想法并设立项目。在得到认同后,进一步形成项目的细节并计划实际的生产过程。在生产(记录和分析)和后期生产(综合、组合和打包)的每一步,都要对内容进行处理,并将该步工作完成后的内容传递到下一步。这种工作步骤间的传递主要发生在物理载体上(如磁带)。接下来的步骤一直到归档都和内容的传送有关。而且,步骤间传递内容的主要媒体是在一个物理载体上。这也意味着当内容最后到达归档时,内容主要包含实际的素材和极少的元数据要素。在文档中,素材是通过有效的元数据和通过检索内容所能得到的信息来进行归档的。最后,内容被存储起来。这种方法的缺点是:它是一个完全的顺序工作流,不能够对内容或信息进行一个具体工作步骤以外的有关生产过程的访问。而且,不同的工作流步骤传统上是用不同的独立的系统来完成的,这些系统不能够共享元数据,许多创建过程的元数据便在这条链中丢失了。结果,当内容对象最后进行归档时,这些元数据就需要用人工方法进行恢复,将其重新输入到数据库中。图2.1 线性推进工作流模型

新出现的内容管理系统由于具有更高的集成性使得内容创建的过程更加便利,从而使得这个过程由顺序推进式模型向以内容为中心的拉动式模型发展,如图2.2所示。在这个模型中,内容是内容管理系统的操作核心,所有在生产过程中所创建的信息都被存储在内容管理系统中。在整个内容创建过程中,内容管理系统成为创建和使用所有与内容相关信息的中心枢纽。这些信息会随着每一个工作步骤的进行而不断更新。这些内容并不是在一个工作步骤处理完成之后就传递到下一步的,只有当一个具体工作流程的终止信息出现才会传递到接下来的处理过程中。工作的进度能被所有访问内容的人员观察到。这种方法允许快速的生产,甚至对内容项进行并行的操作都是可能的。既然在创建过程中的所有信息都被存储在内容管理系统中,这里就有有关内容对象的更为丰富的元数据集。便捷和快速的内容访问也方便了对现存内容的重复使用。图2.2 以内容为中心的拉动式工作流模型

在EBU和SMPTE工作组中,对以内容为中心的工作流模型进行了更为详细的分析,并且还专门考虑了在这种环境中发生的数据流。该模型对元数据流和素材流进行了区分。这个模型如图2.3所示,图中的内容管理系统处在不同工作步骤的中心,这些步骤是发生在广播电视内容的生产和传送过程中的。图2.3 在以内容为中心的处理模型中的素材流和元数据流

在初始的生产步骤中,元数据在不同的实体间创建和交换。在交互和授权期间,不需要对素材进行直接的访问。在细化阶段,可对现存内容进行查看,或许还可以挑选其中的内容用来进一步生产使用。新的素材在记录的过程被导入系统中,在生产、后期生产和传送的过程中被使用,素材在接收时离开系统。在不同的工作步骤中,素材可能会改变,在每个步骤中又会产生进一步的元数据。无论在内容管理系统中的哪个工作步骤,当素材和元数据发生改变时,它们也会得到相应的更新。

2.2.2 基本广播电视工作流

在广播电视的内容管理系统中,工作流是基于两种基本的处理过程的,即导入和标引工作流,搜索、查询和生产工作流。2.2.2.1 导入和标引工作流

内容在获得时就被引入内容管理系统中,这个过程也称为导入(素材直接记录到系统中)或输入(预先记录好的素材被放入内容管理系统中)。内容可以从不同的媒体和载体中获得,如磁带、电缆和卫星。素材经过合适的编码器进行了数字化后,被记录在服务器和/或录像带上。从这一点看,素材在系统中是可用的,而且能够回放和通过演播室网络传送到其他的位置。除了对高码率素材的记录,还将低码率的预览流创建和记录在服务器上,实际的记录过程可以做到完全自动化。在导入的过程中,新进入的素材能被自动地分析,并创建出索引信息和视听辅助信息如关键帧、快速浏览等。图2.4给出了一般的导入和标引的工作流模型。根据导入环境的不同,图中可能会有一些附加的步骤或细微的变化。然而,基本的工作流步骤对于大多数导入过程都是类似的。图2.4 工作流导入和标引

在图2.4中,导入起始于素材的数字化和自动录入。高码率和低码率的预览和浏览副本在同一时间被创建。素材被记录在不同的设备和存储媒体上,这些设备和存储媒体都受内容管理系统的控制。

素材的编码和记录格式取决于所使用的数字化和记录设备。理想的情况是,在数字化和记录正在进行的同时,只要内容一到达,就能进行即时访问。从而在记录的过程中,就能保证通过助理对内容进行手工注释。这个过程称为标引,它对于提供一些有关内容的初始化信息以便于搜索是必要的。

在对新进入内容进行标引、自动提取元数据和自动素材的分析过程中,下列信息被提取和存储在内容管理系统中:

·自动提取的元数据附有导入信号,该信号包含编码参数、视频文本和在场消隐期(Vertical Blanking Interval,VBI)中所带有的其他数据。

·通过自动素材分析所提供的诸如编辑点、关键帧、演说者、面孔和关键字等信息。

·在标引过程中通过手工方式输入的文本描述。标引过程要遵循语义规则,该规则由使用标引过程的组织来制定。

·利用先前自动提取信息的智能工具所提供的附加信息,通过语义描述的标准使之得到加强。

手工标引在这种环境中(尤其是自动分析工具,如语音识别,仍然不能为专业媒体生产环境提供所需的准确率)具有非常重要的作用。在生产过程中,手工标引创建了最初的手工产生的信息,这有助于成功的搜索和对文档的进一步细化。因此,对标引工作是有一个较高的要求的,这种要求除了需要具备文档的分类知识,还要对编辑们的需求有一个很好的理解,因为正是这些编辑来评估新进入的素材与他们生产的相关性。

对于记者和编辑来说,即使当初始标引过程还在进行时,他们也能够立即使用刚刚进入的素材和所创建的元数据。因此在生产过程中,素材和元数据是能够即时访问和使用的。

经过一段时间,档案员会选择一些相关的、适合于长期保存的素材。这种选择的标准不仅仅是它的历史价值和为了将来生产相关的资料,也包括已经取得的内容使用权的种类。在这个过程中,选择的内容要更为详细地归档、记录其IPR的状态、标记对象归档的永久性。永久归档的素材就不能再从系统中删除了,以供将来在广播电视和生产中使用。2.2.2.2 搜索、查询和生产工作流

第二个基本的工作流过程是对内容的搜索、查询、选择以及在生产环境中的准备。不考虑内容创建过程中想法的形成、选择和最终转变成一个详细的描述方案,实际内容的使用(重用)阶段开始于对内容的搜索和查询请求。这个过程是由编辑或记者完成的;在更为复杂的研究案例中,档案方面的专家可能也要参与其中。

搜索和查询产生的点击单,用户可对其进行查看。每个点击提供有关内容项的信息,该内容项是由元数据、关键帧和预览视频和/或音频组成的。这种信息支持在内容生产中对所用素材的选择。图2.5显示了在搜索、选择和生产过程中的工作流步骤。图2.5 从搜索和查找到最终确认的工作流

利用点击单中找到项目的预听和预览副本能方便实际的查看和选择过程。还可能利用预听或预览的副本和粗编材料选择相关的片段而不仅仅是选择基于项目的生产素材。利用粗编作为选择工具会得到粗编单所表示的片段和相关节目要素的清单。为了使素材的选择尽量精确,粗编应该精确到帧而且应该参照时码,时码在顺序草稿编辑的过程中能被用到。粗编单被用来自动传递从内容管理系统中选择的要素到非线性编辑系统中。在这里完成最终的节目编辑和确认。这些过程发生在内容管理系统的控制之外,即第三方系统,而第三方系统不需要与内容管理系统进行紧密的集成。

最终的确认指的是正式的接受过程,由责任编辑依据技术的、法律的和文脉上的标准来完成。在这些工作步骤都成功地完成之后,新的节目项就被传递到播放服务器上(在节目直接播放的情况下)或其他的存储媒体(如节目要在后续阶段使用)。生产过程的最终步骤就是节目的存档。

素材的物理迁移要么由内容管理系统自身来执行(如果有合适的控制软件去实现的话),要么由责编、分类员或内容经理来控制执行,这取决于系统的结构和环境。

这种工作流的一个关键方面就是编辑阶段的确认过程。这里的确认内容是指来自不同装配部分的节目项的物理创建。乍一看,限制档案到样片或原素材是有优点的。然后新的节目投稿仅需要通过EDL参考它们而不需要创建新的项目。例如,这将使文档中存储素材的容量最小化,因为只有第一代素材被使用。然而,在实际中这种假设会有很多明显的缺点,这些缺点使得实现这样一个实际的确认过程是不可行的。反对这种方法的重要论点有:

·无论如何,元数据允许对原始材料的追踪。

·在传送过程中,如果传送系统需要从EDL的片段中在线安装节目就会增加失败的风险。

·表示一个节目项所要求的所有链接管理是极为复杂的。链接上的信息丢失会导致所有节目的完全丢失。从已经编辑过的素材中创建第二代和第三代节目项会变得更加复杂。

·如果节目以这种方式分成片段,节目片段就可能被分散在大量的服务器上和大容量存储系统的磁带上。这意味着当从文档中检索一个节目时,需要访问大量的磁带以便将所有需要的节目片段放到播放服务器上来重建完整的节目。

因此,潜在的最小化档案容量和确保对素材访问的这种益处是以较低的操作安全和较差的系统响应为代价的。因此,在生产链中,人们强烈建议只将内容作为物理确认实体被迁移到下一步。

2.2.3 内容管理对广播电视工作流的影响

内容管理系统的引进不仅支持现存的工作流,也为创建新的工作流提供潜力。人们并不期望将内容管理系统引入到广播电视组织后会导致已建立的工作过程立即发生根本性的变化。然而,某些工作步骤的重要改变将会在一开始就发生。例如,在内容文档中引入实时标引和革新方法已经对编辑和分类工作产生了重要的影响。

建立一个与生产链紧密结合的元数据产生链和使内容在系统中自动迁移将改变每个员工的工作,也会最终形成新的工作职位说明。

标引过程(即录入材料的手工注释,现今通常是由助理来完成)由员工和对编辑们的需求有详细了解的分类员来共同完成。这种变化转变了编辑人员到分类人员和档案部门的责任。另一方面,希望归档人员及编辑人员都具有研究的技能,尽管在有复杂查询的情况时仍然需要归档人员提供帮助。

生产过程中对元数据的自动提取将使分类员从日常的操作(如手工录入现存元数据)中解脱出来。因此分类员能较早地参与到内容的生产过程中,如标引阶段。他们也能从事更有质量和挑战性的任务,如概念描述。

2.3 电子商务系统中的工作流

数字内容是能被整体用于电子贸易的少数产品之一,即提供、订购和传送全都能在数字领域内完成。两种基本的与内容相关的电子商务交互必须被区分开来,即B2B和B2C过程。B2B是包括在公司和组织间交易内容的所有商业过程,B2C是将内容通过公共通信网络如因特网或有线电视提供给更为广泛的公众。这两种情况的主要差别是得到内容的方式和在涉及到存储、带宽和访问时对基本系统体系结构的要求。这一部分集中论述商业过程和提供内容操作的内部工作流,主要集中于B2B过程。B2C工作流要么与广播电视工作流相似(即按预定的内容传送的情况),要么与B2B电子商务交易接近(即视频点播的情况)。尤其是B2C对基本系统体系结构的需求可能要高于B2B的情况,但是基本的过程和工作流是一样的。图2.6 内容管理和电子商务系统结构

如图2.6所示,提供内容的电子商务系统结构可被分成两个主要的部分,即内容管理系统后端和电子商务前端。内容管理系统后端的任务是由电子商务系统提供所有与内容管理相关的操作。它也涉及到订购的实现,即鉴定订购合同后完成内容的传递。电子商务前端所包含内容对象的界面有提供商(由代理商表示)、搜索功能、电子商务模块(用于处理客户请求)和后端办公室(协调订购过程和实际的实现)。系统的这一部分也与负责订单和会计的ERP系统相连。

分离成两个子系统的原因是出于安全和商业过程的考虑。这里的内容是商业对象,即实际用于交易的资产,它必须被保护以免受侵害和任何可能的误用。因此后端系统应该是不能从外部进行访问的。相反,电子商务的前端必须是对公众开放的,并且要吸引尽可能多的潜在客户,因此它是一个可以通过公共网络访问的系统,也可能引起企图欺诈系统的注意。

从商业过程来讲,通常不会有这种情况,就是一个内容丰富的组织(如含有销售部门的广播电视公司)的所有内容应该或能够同时提供。例如,该组织可能不具有内容管理系统中所有内容项目所必需的IPR出售给外部的合作伙伴。某些素材可能只能保留在后端便于其在其他情况下被使用(如组织自有频道的广播电视),而且要经过一段时间后才能被出售。因此,在版权验证后就需要有个灵活的选择过程。此外,并不是所有用于内容管理的元数据都与内容销售有关。只有那些与销售有关的子集元数据才可被客户访问。内容销售也需要向客户积极地展示对象。因此,在选择用于销售的内容时,应该事先考虑展示的项目。

由于系统只关注内容的销售,因此实现一个带有两个模块(即内容管理系统和电子商务模块)的系统可能是一种选择。然而,对这种解决方案的优缺点要仔细斟酌。在任何情况下都必须确保实际的内容对象(即高码率的素材和所有的内部元数据)受到保护。

2.3.1 内容管理系统后端的工作流

内容管理系统后端有两个主要的工作流:系统的录入、文档化和素材的管理;对电子商务前端请求的应答。2.3.1.1 录入、文档化和内容管理

电子商务系统的内容管理系统后端工作流与广播电视运行的工作流是相似的。素材通过不同的渠道(如磁带、天线和卫星等)进入系统。系统开始记录引入的素材,创建低码率的版本,用一些基本的元数据注释素材,并通知ERP系统有新的内容进入。内容的初始文档也包括所获得的版权登记,这些版权形成了销售业务的基础,因为只有获得版权的内容才能被用于市场营销。

初始的注释(即标引)和深度的文档化可以分开进行,因为(如在广播电视中)当某些信息首次出现时(如关于政治、商业和股市的实际信息等),可能是非常有趣的,因此应该将其尽快地提供给顾客。根据提供方式的不同,在提供内容之前可能要对内容进行处理和准备,这是个标准的编辑过程,该过程也提供摘要等。在广播电视公司,这项工作与新闻和技术的实现过程密切相关。

分类涉及到系统内深度的文档化。在电子商务系统中,以一种反映目标客户群的技术和知识的方式完成文档化是非常重要的。潜在的客户应该能够直接搜索和检索内容。例如,如果为医生和医学专家提供医学方面的内容,文档就应该使用合适的专业术语,然而如果普通大众是这些内容的目标群,文档就应该使用能被具有普通医学常识的人所理解的术语。版权文档必须记录合同的细节,以保证版权和IPR受到尊重,这项任务通常由一个单独的版权管理系统来实现,该系统连接到内容管理系统。

高码率素材(即素材)的管理是在一个媒体管理模块的协力下完成的。这是一个用来控制媒体在系统间迁移的组件,并且也负责实现电子订购。管理素材需要对存储子系统的控制和对素材技术质量的控制,包括根据需要将副本迁移到其他的存储媒体。内容管理过程是运行的中心,它的基本特征与那些在广播电视中遇到的情况是相似的。2.3.1.2 实现和传送

电子商务系统的内容管理系统后端的一个主要任务就是请求的实现。这种请求是由电子商务的前端产生并通过电子方式传递到内容管理系统,它包含内容ID和传送信息。在传送之前,要对版权的状况进行确认。这种信息也被传送到电子商务前端用于清算账目和账单。如果一个具体客户所请求内容的所有版权都是清楚的,内容管理系统就能继续进行内容的传送。

根据内容的类型、系统(内容管理系统、通信网络和客户端)的性能和客户的偏好,有不同的传送内容的方式。例如,音频内容可以通过现存数据网络如因特网实现电子传送。高码率的视频内容需要宽带或卫星连接。在这种环境中,媒体管理组件将控制内容的传送。内容也可以通过传统的方式如邮件或快递服务的方式传送。在这种情况下,素材必须被复制到磁带上,然后打包并邮递,这需要人的介入。

传送过程的信息会被记录在ERP中。

2.3.2 电子商务前端的工作流

电子商务前端系统交易内容的两个不同过程要被区分开来,即用于销售的内容对象的选择和表示过程和实际的销售过程。这些过程的本质与任何其他电子商务系统中的过程都是类似的。在内容管理系统中最有趣的就是发生在电子商务前端和内容管理系统后端之间的交互过程。2.3.2.1 内容的选择和表示

内容的选择是个积极主动的过程,由负责销售活动的员工来完成。这种选择是通过主动搜索内容管理系统后端,得到在特定的背景和时间要提供给顾客的内容来完成的(如有关人物或事件的素材在周年纪念前就变得非常相关)。如果电子商务系统要提供与当前的事件和正在发生的事务有关的内容,那么只要有最新的内容就必须尽快地提供。因此,应该有一个指示器指明内容已经到达系统并且可以提供给顾客。这可以和后端的内容准备阶段并行地进行。

在选择过程中,(子集的)描述性元数据的副本和素材的低码率的副本被放在电子商务的前端。客户能在电子商务系统中主动地搜索所需要的内容。既然前端是“商店”的店面,它就应该主动向顾客提供产品并引导他们购买。因此,在设计系统的部分时需要考虑所提供内容的种类、它所代表的组织和目标客户群体。2.3.2.2 销售过程

在用户访问电子商务系统前,通常需要先进行注册,通过这个过程可以获得顾客的详细信息并存储到系统中。用户注册之后就可以登录,搜索具体的内容或查看提供的项目。这种查找不仅包括描述性的元数据,也可以观看和/或收听内容的浏览副本。根据提供商政策的不同,这些查看的内容可能是关键帧、快速浏览的内容、内容对象的短样片,也可能是以低质量提供的整个项。如果想要的项找不到,还应该可以提炼或改变搜索。用户可以购买全部产品项和片段,因此,应该能够选择和标记顾客愿意购买的产品项的片段。这种功能可由粗编来支持,这类似于生产过程中对内容选择的支持。用于出售的产品项(或产品项的片段)被顾客选择并放在购物车中,这一过程将顾客的详细信息和所要购买内容对象的细节联系起来。根据内容和顾客的种类,需要给出一些如何使用所购买内容的细节。例如,在B2B的环境中,必须确保用于某种使用的所有IPR都是有效的,且是合同的一部分。

顾客方通过主动决定购买过程来预订购物车中的内容商品。订购会引发从电子商务后端办公室到内容管理系统后端的一个信息,这个信息包含顾客和所要购买商品的详细情况。通过IPR管理使版权状况再次得到确认,(如果版权很明确)传送过程就可以开始。接下来会有一条信息返回到电子商务后端办公室以确认销售,这条信息和使用方式会传到ERP系统,该系统具有处理账目和账单的业务。使用信息对于清算账目是必需的,因为这在内容的专业使用方面是一个影响价格的因素。给顾客开出账单是ERP系统的任务之一。

2.4 公司和其他组织中与内容相关的工作流

大的公司、教育和政府组织也越来越多地要处理视听内容。内容在下面三个主要的领域起着重要的作用,即档案部门,用于培训和员工发展的部门,以及营销和销售领域。这些领域的视听文档与其他类型的多媒体文档都是紧密相关的,工作流和处理过程也与2.2所描述的广播电视组织中的文档是类似的。这些领域带有对商业的直接影响,同时必须考虑的附加方面是培训、教育和员工的发展以及对营销和销售的支持。培训、教育和员工的发展对于教育、政府和公司机构很重要,而在营销和销售领域采用内容管理系统主要是出于商业考虑。

2.4.1 培训和电子教育中的内容管理

诸如视频、音频和互动节目这样的电子媒体越来越多地被用于教育和培训。它们已由课程和讲课中视频和音频的使用延伸到远程媒体的课程中。这些系统的结构类似于前面介绍过的带有内容管理系统后端和专门的电子学习前端的电子商务系统。然而,与电子商务系统相比较,这个前端模块本身并不能存储任何数据,只能进入内容管理系统后端进行内容的检索。

在内容管理系统后端,课程资料被处理、存储和用于有效的使用。一门课程从音频、视频、文本、幻灯片和网页等方面进行组合。也有一些程序是通过与用户直接交互的形式来决定内容的表示。在这种环境中,课程内容的表现方式是由计算机程序决定的,在学习课程过程中由该程序引导学生,但并不一定是线性的表示。然而,有限数量的内容对象和其可能的组合与一个具体的课程模块相关。因此,只要有学生访问,每一个课程可以准备所有相关的模块来演示。

对于远程媒体和电子教育系统,将内容对象用原子模块表示是非常重要的,即课程的基本组件。课程本身要么用一个类似于EDL(据此能控制表示)的脚本来表示,要么通过计算机程序来控制演示,也允许交互。有专门的程序用来进行课程内容的创建和汇编。因此,一门课程和其所有相关的内容对象一起被导入内容管理系统中,或该门课程与系统中现存对象的参考内容一起被导入内容管理系统中。这些参考内容是课程元数据的一部分。

在创建的过程中,需要访问存储在内容管理系统中的内容的情况有两种,即当新的课程是由现存内容组合时和当在演示过程中要对课程加注解时。后一种情况类似于将现有内容变为更新版本,这种情况发生在内容管理系统的控制之外,这可被认为是顺序重新导入后的一个导出版。为了支持从现存内容创建新的课程,必须将内容管理系统应用模块和课程创建平台进行集成。这种集成要么允许对其他模块的引用,要么允许拷贝新课程所需要的内容。

演示要么通过预定的广播/多点传送,要么根据需求通过对不同课程模块检索的程序。后一种情况是用户与远程媒体学习平台进行交互。这个程序访问内容管理系统,请求一个专门的内容模块来演示。在这种情况下,重要的是内容管理系统能主动准备出所有的课程模块,一旦第一个课程模块被请求,那么所有的课程模块都可以被请求显示。

2.4.2 在营销和销售中与内容相关的工作流

作为营销资料的视听内容的重要性和成本正在增长。越来越多的社团组织开始自己来管理这类内容,而不是将它留给代理商和创建内容的生产部门来管理。除了保持材料受控和能够容易地重新使用,这种方式也帮助协调了不同组织单元和产出渠道的营销和销售活动。而且,它允许对(不可预测的)事件的快速反应。图2.7所示是社团组织中与营销和销售相关的内容管理系统。图2.7 团体营销和销售中的内容管理系统

法人组织具有不同的组织结构,这主要取决于它们所在的商业行当、它们的商业目标和组织的历史。然而,营销和销售活动中的一系列任务与大多数大型法人企业都是相同的。特别地,这些任务发生在营销部门,经过获得、分发和销售这些环节。除了内部的部门,还有营销代理机构、(后)生产部门和印刷商店提供内容和对系统所需的访问。资料的不同发布渠道有电视、广播、印刷媒体和新近的Web和报摊系统。在这种环境中,需要考虑的相关工作流有营销中的计划、创建和制作阶段,以及发送内容到不同的渠道上。2.4.2.1 营销和销售的内容创建

在营销和销售中,内容的唯一作用就是促销产品和支持销售过程。内容的创建过程与营销活动中开发产品是并行的。在产品的生命周期中,营销和销售资料得到进一步开发,并实施所设计的用于促销产品的新活动。营销部门负责活动的创意。在这个阶段,外部代理商可能也已经加入进来。初始阶段可与电视节目生产中的计划和写草案阶段相对照。在新的理念形成过程中,应该对旧的资料进行分析和思考。理想地,这些资料在内容管理系统中是可得到的,通过元数据和预览副本可进行快速地查看。有关新活动的注释、脚本和协议应该被存储在内容管理系统中。这些资料的一部分对于其他部门(即分发和销售)也应该是可用的,以便尽早地通知这些部门有关新的活动。获取部门在这个时候也必须参与,以便获得属于产品一部分的任何第三方组件的细节。

活动发展的下一个阶段就是材料的收集,例如商业内容的磁带化,照片、标语的开发等。这项工作通常是由代理商来完成的,代理商与生产部门和后期生产部门及印刷商密切配合。内容管理系统是中心内容的枢纽和知识库。从最初的构想到最终的战略,在不同阶段所开发的不同部分和版本被存储在内容管理系统上,并通过内容管理系统进行交换。外部的合作者必须能够访问相关的项目和内容对象。因此对基本系统和通信基础设施有较高的要求。在系统的环境中,不同的用户组只能访问他们被授权查看项目的某些部分和内容对象,通过对不同用户规定的权限来限制它们的读写访问。为了更好地支持创建过程,通信基础设施必须支持对高质量视听素材的交换,如果做不到这一点,那么预览操作只能基于低码率的预览副本,高码率的素材可以用传统方法输入到磁带上。

在开发过程的阶段,从最初的概念和可选择的建议到广告素材的最终确定会有多次的反复。在这种情况下,项目的过程观点是非常关键的。内容管理系统与工作流引擎和项目计划模块的集成也有助于工作进程。

不同国家和语言的译本可被并行地创建。这些可能是与主要活动相连接的子项目。在这些子项目中,这些国家和地区的营销部门可以提供他们自己的资料。

在开展营销活动的最后阶段,发行和销售部门应该更加密切地参与其中,因为他们直接受到活动的影响,而且必须实施活动的某些方面。他们需要访问营销资料的最新版本来制定自己的战略。而且,不同国家和地区的发行和销售组织必须能够查看和订购他们需要的营销资料。2.4.2.2 内容发行

要用资料的最终版本来为不同的使用渠道提供营销材料。电视和广播中的广告节目在电视和广播播出计划之前的时间就被传送到广播电视公司。这种传输能通过磁带、卫星传输或文件传送来完成。对于印刷媒体,广告必须被及时地发送到杂志社和报社。而且,如果广告传单和信息资料已经印刷好,就应将它们发放到销售和发行机构以备进一步使用。内容管理系统可以提供所有这些处理过程,但这是一个主动的传递过程,而不是直接的播放。

在网络和报摊系统使用的营销资料情况有所不同。人们可以根据需要以一种互动的方式显示资料。通常这些资料被设立在类似于内容管理系统的组织自有知识库的顶层。然而,将这些系统与在营销活动开发阶段使用的企业内容管理系统进行直接集成不是一个明智的选择,理由还是涉及电子商务系统的安全和处理过程的考虑。虽然这些系统对公众是开放的,但企业的内容管理系统应该受到保护从而免遭非法入侵。而且,营销资料应该可以自动释放,且只有那些经过许可的资料才能在网上和报摊系统中被访问。

第3章 素材

素材是内容以不同形式和格式的物理表示。它能够被生产、改变、存储、交换、传输或者播出。各种各样用途的素材需要使用大量的用于不同目的的素材格式。一个能够表示所有不同的媒体类型(比如视频、音频、文本、图像和图形等)、满足所有不同需求的通用的素材格式是不存在的。然而,一个理想的内容管理系统应当是独立于媒体和格式的,例如它应当能够操作和管理所有的媒体类型和素材格式。实际上,内容管理系统并不仅仅是一个存储文件的仓库,它还必须理解文件结构、媒体语法、甚至特定部分的语义。除了纯粹的文件检索外,内容管理系统还提供媒体索引、自动信息检索和流媒体等功能和服务。即使是对于部分文件检索,系统也需要理解一些媒体类型和文件格式。因此,为了开发和使用内容管理系统,我们必须了解有关的素材格式以及它们的特点和特征。

此外,为了能够访问不同的媒体类型和素材格式,为特定目的选择最合适的媒体类型和素材格式,我们必须审视特定应用背景下的需求和约束。表示特定信息的媒体类型通常是事先决定的,但内容对象编码格式并非如此。针对各种媒体类型的编码和(数字)表示制定了大量的编码方案和标准。富媒体组织必须仔细地选择最适合的操作和满足其要求的格式。因此,对编码方案的基本原理、功能以及它们背后特征的基本理解是十分重要的。

在一个内容管理系统中,不同素材格式扮演的角色都具有两面性。一方面,它们代表被操作和管理的对象。素材的特点决定了特定的功能是否能被实现以及如何实现。另一方面,素材在内容管理系统中用于表示内容。目前,在内容管理系统中有多种不同的素材格式用于生产和表示,以及对内容的纯粹的表述。要仔细考虑每一个任务的特定需求,才能保证要求的功能能够最好地被实现。

内容管理系统除了对素材进行纯粹的管理外,还可以通过自动检索来获得内容的附加信息,产生一个内容对象的新的表示。例如,视频分析程序允许切点和编辑点检测,以生成内容对象的一个浏览型或情节串联图板形式的浓缩版本。转码处理可以从一种格式生成另一种格式的内容副本,以更好地符合某种要求。

本章讨论内容管理系统中与素材相关的话题,主要介绍基本原理、概念和最重要的标准,另外还讨论素材的处理过程,其中将解释主要相关技术的原理。

3.1 素材的不同形式

在广播环境中,素材被定义为节目原材料,比如实际的节目项目。素材被更广泛地定义为内容对象的组成部分,它被用来表示采用多种编码格式的实际信息或消息(比如字面意思的内容)。相对应地,元数据是描述内容对象的关于数据的数据(见第4章)。因此,素材是直接表达和传递信息、创意、意图或印象的所有形式的媒体。

对于不同的媒体,素材会拥有不同的形式,如视音频、视频、音频和文本形式的素材元素等。此外,素材可以组成结构化的格式或文档。在一个内容管理系统中,管理和经营功能是最受关注的,例如与格式有关的问题。内容的解释留给处理素材的用户来做。

内容管理系统管理与内容对象有关的各种各样的素材,不同的格式适用于不同的目的。高码率素材格式通常要求更高的带宽和更大的存储能力。因此,大多数内容管理系统使用低码率的素材来代替高码率素材用于浏览和选择。但并不是所有的格式都适合这么使用,最重要的是要准确地表示出原始内容。

3.1.1 基本素材元素

基本素材元素是基础组成部分。内容项目被表示为特定的基础素材(或媒体)类型,例如音频、视频、图像、图形和文本等。不同的媒体类型(例如音频、运动图像)可以组合。然而,这种组合建立了一种固定的联系,它不能够表达为需要选择的相关链接,而是一种一对一的相互关系。

素材元素可以根据它们的时间和表示特征进行分类。这种分类与用于多媒体系统的定义类似,是根据人类感知媒体的方式得出的。总的来说,分为离散型(例如非时间相关)和连续型(例如时间相关)2种媒体或素材类型。一个连续的媒体流由连续的、与时间相关的信息单元描述,这种与时间的相关性是指媒体(或其不同部分)对于用户的呈现。在这种情况下,媒体具有时间属性。为了向用户提供易于理解的信息,连续媒体的呈现必须发生在特定的时间限度内。例如在PAL制视频中,每秒必须25帧,每一帧必须在1/25秒内按照正确的顺序呈现,否则一个个帧所表示的信息就是无效的,系统也会被认为是失败的。然而,不同于那些由于超时而会导致严重损坏的实时系统(例如反锁制动系统),在处理连续媒体时,一定的错误率是被容许的,甚至是可以被忽略的。因此,可以根据素材及其处理结果来定义错误率,在这个容许范围内,素材及其处理结果是可以接受的。连续媒体素材的这种与时间的相关性是由时间线及其相联系的时码来表示的。基本的连续媒体素材元素有视频、音频和运动图形。

相反,离散媒体没有内在的时间要求,其表示的内容也与呈现时间无关。离散媒体有文本、图像和图形。

3.1.2 结构化素材格式

除了基本素材元素外,内容管理系统还必须管理结构化的素材格式,例如网页、XML文档和多媒体文件。在结构化素材格式中,基本素材元素或其他结构化素材元素通过引用和链接组合在一起。结构化素材格式的不同组成部分之间通过建立一种关系来管理和决定信息的表示。例如,Web页面中的链接指向其他相关素材,这些链接也代表了基本组件之间的关系。

结构化素材格式间的关系不仅仅由明显的引用来建立,还可以由不同基本元素相联系的时间约束来建立。例如,绝对或相对的时码能够被指派给连续的基本素材元素,也可以被指派给离散的基本素材元素。在后面那种情况下,这决定了结构化素材格式中的离散媒体模块所表示的信息在什么时间呈现给用户。对离散媒体模块所施加的这些时间限制与连续媒体元素的时间限制相似。实际上,这些限制只在结构化素材格式所表示的特定内容对象的语义环境中才是有效的,而不像连续媒体那样是固有的。

管理结构化素材格式的挑战在于保持它们所表示信息的有效性和连续性。由于与结构化素材格式所表示的内容对象有关的不同的基本模块可能会被单独存储或被其他对象引用,因此它们就有可能会被重新部署和改变。这些改变并不会导致结构化素材对象中的引用和链接的改动,从而不会出现不一致的情况。在内容管理系统中,处理结构化素材格式时必须考虑到这一点。为了保证内容对象的完整性,内容管理系统必须明确地管理结构化素材对象的外部链接,防止可能导致内容对象的不一致操作。

3.1.3 高码率和浏览格式

为了评价素材格式对制作、显示和存储的适用程度,关键是考虑素材格式的技术属性和应用场合。在为特定目标和特定系统选择某种素材格式时,应用实例提供了额外的选择标准。技术特征限制了素材的使用和管理,这反过来又对可能的工作流产生了影响。例如,高码率、高质量的视频通常都是高比特率的。以目前的通信和存储技术来说,所有用户直接使用这些格式是不可行的,必须使用替代格式(例如浏览格式)来准确地表示原始的素材。是否选用高码率格式是由质量、制作、广播和存档等方面的要求来决定的。相对应地,对低码率格式的需求来自于需要支持的工作流和内容管理系统基础架构。

为了检索和选择内容,对可选材料的快速准确地预览和审看是很重要的。在一个典型的处理视音频材料的工作流中,对视频内容的初选是基于关键帧的。接下来通过对所选视音频片断的低码率副本的浏览(听和看)来具体选择特定的内容。为了能够在专业环境下应用浏览副本,必须支持像标准的特技模式那样的某些功能(如快进、快退和逐帧往返等)。而且,因为需要快速访问浏览材料,浏览信号应当被高度压缩以节省网络带宽和存储空间。然而,有时情况并不完全相同,例如,内网用户浏览视频的数据传输率可以达到1.5Mb/s,而通过拨号连接的用户数据传输率也许只有64kb/s。因此,我们需要能够根据系统能力提供相应质量水平的可调节的比特率编码。

在内容管理系统中,使用低码率的浏览副本和高质量的材料是通行做法。在内容管理系统中为规范、选择和使用合适的浏览格式定义了2种方法:

·在代码层面定义和使用可以相互操作的、通用的标准格式或格式集。这保证了遵循良好规范的质量和功能,但是限制了跟随技术进步的选择自由。

·能够无缝地处理和显示多种格式的应用组件的开发。这在某些情况下可能会限制质量和功能,但能够充分利用技术上的进步。

这2种方法都是有效的,在开发和实现内容管理系统时都应该考虑到。总的来说,内容管理系统应当能够在保持互操作性的同时支持多种格式,并利用新格式的长处。EBU和SMPTE发表了一份浏览交换格式(Browsing Interchange Format,BIF)的技术要求。这份技术要求的目标是阐明低码率浏览格式所必须满足的条件。3.1.3.1 基本BIF要求

BIF格式试图用于媒体专业人员的浏览和选择,因此必须具备以下基本特征:

·视频(准确的帧和时码以及颜色)。

·双声道音频。

·与内容有关的元数据(包括访问权限、IPR管理和保护信息)。

·与材料有关的元数据(时码、唯一ID等)。

BIF应当支持流和文件传输,而且应当提供技术功能以支持促进至少2种常用的浏览模式:编辑决策列表(Edit Decision List,EDL)和非常窄带浏览。

EDL浏览器是一个允许人们查看内容和选择合适片段进行进一步制作的工具。这种格式允许材料的选择和EDL的生成。它也应当允许以浏览质量的水平、基于EDL无缝地查看选择好的内容。例如,这种选择有可能是一个新节目条目的草样,而不是随机的收集。为了支持EDL的生成,需要合并视音频流中的时间戳(或时码),而在BIF中也需要这样。每一帧的表示要能强制性地生成一个准确的EDL。更进一步,要求有与帧同步的音频,因为编辑决策常常基于声音事件。对于工作站终端的预览窗口,分辨率达到标准清晰度电视视频信号的四分之一就足够了。这种方式比SDTV有更高的容错率。

窄带浏览格式应当允许偏远的地方通过带宽相对较低的广域网(例如Internet)或拨号连接来进行远程内容浏览。在这种情况下,数据率应当是可调整的。64kb/s的数据率应当足以满足这种应用场合。为了实现这一点,分辨率和压缩效能之间必须要有一个折中。不必将每一帧都保留,同样,保留与帧同步的音频虽然更好,但也需要舍弃。对于这种类型的视频浏览,数据流并不一定需要是连续的。这种方式也会有很高的容错率。

3.2 编码和压缩基础

为了评价在内容管理系统中放入不同素材格式的可能性和要求,了解其特征和工作原理是很重要的。一些基本的编码、压缩的概念和技术对所有的素材类型都是一样的。大多数编码和压缩方案(甚至专有格式)都是这些基本过程的组合。因此在讨论具体的编码和压缩格式之前,应该了解这些基本原理和技术。

3.2.1 编码:从模拟到数字领域

基于计算机的内容管理系统的素材记录和处理通常包括模拟到数字的转换,这个过程叫做编码。模拟技术中的信息是连续的信号表示,而数字技术中的信息则转变成为二进制数字表示的数值。在这个转换过程中会发生信息丢失,因为连续值的每个独立的表示值只能是近似的。图3.1展示了模拟信号(波形)如何被表示为许多的数字值。该过程的信息丢失是不可避免的,我们必须接受这个事实。图3.1 波形和抽样波形

数字格式的质量依赖于每个离散值所表示的尺度间隔或者间隔时间,还有用来表示每个值的比特数。前者被称为抽样,后者被称为量化。抽样率是模拟值(例如,一个连续的波)被抽样的比率。抽样率越高,量化中用来表示每个独立数字值的比特数越多,与原值的近似性也就越大,因此数字化信息的质量也就越好。ITU-R BT 601-5的国际视频标准指定了模拟到数字转换的国际标准。

3.2.2 压缩:缩小比特率

数字化会产生相当高的数据率,数据量很大。应用ITU-R BT601-5标准的4∶3电视视频信号的比特率是270Mb/s,每小时的视频就有121.5GB。为了缩小比特率,从而降低带宽及存储的要求,要采用压缩技术。压缩通过去除比特流中的冗余数据来减少比特数。减少媒体中的某些属性,接收器(如人的感官)是很难察觉到这些信息的缺失的。无损压缩和有损压缩是可以区别出来的。对于无损压缩,解压后的数据和原始数据完全一致;而对于有损压缩,解压后的数据流和原始数据不一样,因为某些信息被删除或者近似化了。图3.2 游程编码的例子

压缩技术可以分为熵编码、源编码和混合编码方案。熵编码是一种无损压缩技术,而且不使用任何特殊媒体或者流式特性。在熵编码中,数据被认为只是一系列的比特。图3.2是熵编码方案的例子,它表示了游程编码是如何运作的。游程编码替代了实际的编码模式,它用跟随在码后的标记(只需要一次)和其出现的次数代替了序列。因为游程编码模式有一个最小步长,因此只有重复次数超过最小步长要求的部分才会被编码。图3.2里面用感叹号来表示已经编码过的码序列标记。很明显,此时只有重复超过3个字母的码适合用游程编码法。其他的熵编码形式有向量法、模式置换法、霍夫曼编码法和算术编码法。

源编码法(和熵编码法相反)利用了人类感官的特性(如眼睛和耳朵)。与原始信号相比,源编码法压缩质量有所下降,因此这种方法是有信息丢失的,但却可以保持较高的压缩率。例如,在全部声音内容中,删除人耳无法听到的部分音频信号,或者对视频信号中的色彩信号(而不是亮度信号)进行二次抽样(这源自于人类视觉对明暗程度比对色彩更加敏感)。更具体的例子是插值和转换编码(把数据转换到另外一种更适合压缩的数学域)。

大多数压缩标准采用混合编码技术,例如,结合熵编码和源编码的JPEG、H.261、MPEG-1、MPEG-2和MPEG-4等。根据不同的标准和目的要采用不同的压缩技术。

对于连续媒体,压缩方案有时候也利用连续数据流中的空间冗余信息和发生在相邻信息单元中的临时关系。在这种情况下,不是整个对象被编码,而是来自帧之前或之后的表示相同信息单元的相关信息被编码(即对象上存在变化和差别的相关信息单元才被编码)。例如对于视频来说,有些帧并不是完整的帧,只有这个帧和其他1~2个帧的不同处被编码。因此,为了完全解码这样的帧,所有与其相关的帧都要被计算在内,而且要预先解码。MPEG标准就应用了这种技术(见§3.3.2)。

3.3 视频

视频是内容管理系统的重要组成部分,系统需要处理、存储和管理不同的数字视频格式。存储和通信的需求对系统的底层和基础结构的要求非常严格。视频也要频繁地交换到其他第三方系统上,此时互用性具有重要的作用。此外,低码率的视频可用来浏览资料并查证系统中可用的内容。要仔细地选择这些格式以便在给定的技术和资金条件下更好地表示视频的质量。因此,了解视频编码和压缩的基本原理以及主要的视频格式是很重要的。

这一节将介绍主要视频格式的基本原理。视频制作中最主要的格式是基于MPEG或者DV编码的。内容管理系统中采用的大量的视频格式都基于这2种标准。

3.3.1 视频编码:基础和原理

视频图像是用像素(图片元素)表示的,它们是图片中的最小单元。图像比例给出了图片的宽度与高度的比例,一般宽高比是4∶3。因此,垂直分辨率等于图像高度之内能够显示的像素数,水平宽度能显示的像素数等于垂直分辨率乘以图像比例。NTSC制式中有525行、700列。

彩色影像由红、绿、蓝3种信号(RGB)组成。这3种信号通常分别显示,它们混合在一起就定义了色彩。在传输信号的过程中采用了另外一种由1个亮度信号和2个色度信号(YUV)表示的方法。YUV编码并不分离色彩,而是将亮度(Y)从彩色信号(U和V)中分离出来,这是根据人类的感官对亮度比对色度更加敏感的原理。因此亮度信息更加重要,而且能用更高的带宽编码。这种组件编码带宽的不同通常表示为亮度信号和色度信号之间的比率。

对于连续移动的图像,如果帧频在每秒15帧以上,人类眼睛是无法区分单个帧的,这种特征被应用于表示运动图像。欧洲PAL制式标准使用25Hz的复制率(每秒25帧),而美国NTSC制式标准则使用29.97Hz(每秒29.97帧)。为了使移动画面没有闪烁,刷新率要在50Hz以上。如果采取控制闪烁的措施也可以使用更低的刷新率。例如,电视画面可以分成两半,每半都有相应的扫描线。两半画面用替换的方法交替传送信号。每半画面以2倍的速率被扫描(50Hz或59.94Hz)。

为了用计算机处理视频或者用计算机网络来传输,图像要从模拟制转为数字制。最基本的步骤是抽样、量化和编码。对于视频,灰度(或彩色)级在这个过程中被抽样到一个M×N的点阵数组内。接下来,连续的值根据点阵数组映射到表示量化区间的离散值(如分成256个区间)。

视频编码是处理画面不同色彩成分编码的过程。对编码来说有2种可选方案:抽样和编码整个模拟视频信号(如复合编码);或者对亮度和色度信号分别编码(如组件编码)。前者将所有信号都转换到数字域;而后者,则是对亮度和色度信号分别数字化。为了使不同的信号同时被转换,可以使用多路转换技术。

因为可以对亮度和色度信号单独抽样,对于更为重要的亮度信号可以用更高的抽样率(如13.5MHz),而2个色度信号只需要用亮度信号抽样率的一半来抽样(6.75MHz)即可。这种亮度抽样率为2个色度值抽样率的2倍的抽样方法被称为4∶2∶2抽样。

在8比特量化和亮度抽样值每行864、色度抽样值每行432的情况下,除去空白区间间隔后的累加率为261Mb/s。为了减少数字化视频的初始比特率,某些格式采用不同的抽样频率和每行抽样率,这样会在压缩前就已经影响到数字化视频的质量。表3.1给出了一些主要格式的抽样率和频率的概况。表3.1 编码标准

3.3.2 基于MPEG的格式

ISO/IEC JTC1/SC29/WG11中的运动图像专家组(Moving Pictures Expert Group,MPEG)自1988年以来一直在发展关于视频编码的标准。相关的视频标准有MPEG-1、MPEG-2和MPEG-4。不同的标准制定的时间不同,针对的应用范围也不同。但是它们有很多共同的基本原理,属于同一个格式家族。3.3.2.1 MPEG-1

MPEG-1标准创建的最初目的是定义一种适合数字化存储技术的格式(如CD)。该标准由3个主要部分组成:MPEG视频、MPEG音频(见§3.4.2)和MPEG系统(定义如何多路复用和同步音频和视频)。MEPG-1音视频数据流定义的编码的平均带宽是:视频编码部分1.1Mb/s,音频编码部分128kb/s(支持立体声)。因为MPEG-1的原始应用领域是用于存储媒体,所选择的压缩方案更适合于不对称压缩过程。在这种情况下,压缩能力比解压更强。

与大多数压缩方案不同的是MPEG-1标准并不指定编码器,而是定义MPEG-1视频和音频比特流的语法和语义,因此也就指定了MPEG-1流的形式。只要是MPEG-1对应的解码器就能够解码这样的比特流。MPEG-1中的抽样和量化

MPEG-1中压缩的起始点是一个用所谓宏块作为基本组件的YUV图像。一个宏块被分为16×16的亮度抽样数组(分为4个8×8模块),和2个8×8的Cb和Cr色度抽样数组。然后这些8×8的块由二维的图像域转换为采用离散余弦变换(Discrete Cosine Transformation,DCT)的频率域。该过程的结果是图像中的每一个块都产生一组64 DCT系数。这种在该系数组的左上角表示的灰度和色彩值被称为DC系数,其他值则被称为AC系数。

接下来将量化应用于DCT系数中,在这一过程中实际数值被映射到整数值上。不同的量化步骤和值反映出使用的DC和AC系数的相关性。有一种量化步骤设DC值为8,并设2所乘得的31个量化步长的偶数值,从2到62,为AC的值。量化值取值范围从-255到255。人们使用一个普通的亮度和色度值的量化表。关于MPEG-1量化的更多信息可以参考Hung(1993)。

量化之后,MPEG-1采用了熵编码的方式来减少初始比特率。MPEG-1也定义了各种游程水平的可变编码。MPEG-1帧类型

为了实现高压缩率,MPEG-1不仅将单帧信息进行压缩,而且也会参考前一帧和后一帧的编码信息,这种方法被称为帧间编码。此时要考虑2个互斥的要求:一方面,要保证最大程度的压缩,此时大块的信息仅被编码一次,同时也关联到其他帧;另一方面,应该能够随机访问一个视频流,流中的帧只有在不涉及其他帧的信息的时候才可以被随机访问。

在MPEG-1中,定义了4种不同类型的帧,可以根据它们与其他编码帧的相关程度来区分。在MPEG-1流中,这些类型的帧的组合影响压缩率和MPEG-1的流能够被随机访问的间隔时间。该4种帧类型是I、P、B、和D。

·I帧(帧内编码图像)是在视频序列中,图像编码不参考任何其他的帧。I帧的压缩与联合图片专家组(Joint Photographic Experts Group,JPEG)的压缩方案类似。

·P帧(预测编码图像)需要之前的I帧或者P帧信息。为了解码该P帧,它之前的I帧或P帧需要提前解码。帧内的参考区基于宏块。运动补偿预测根据先前相关帧来预测当前帧变化的区域。运动矢量表示了特定宏块从其在相关帧中的原始位置运动到当前P帧内特定位置的趋势。

·B帧(双向预测编码图像)需要先前的和之后的I帧和(或)P帧的信息。一千B帧表示的是与其相关帧的不同之处,它不能被用作其他图像的参考。应用运动补偿的插值法来寻找与前一帧和后一帧(I或P帧)匹配的宏块。

·D帧(DC编码图像)是为快进和快退功能定义的帧。D帧是内编码的(如I帧),但只有DC参数被编码。D帧也不被用作参考帧。

MPEG-1的帧间编码说明画面的很大区域从一帧到另一帧不发生变化。因此在之前和之后的宏块中已经编码的信息只需要被引用,而不需要再次编码。B帧可以实现最高程度的压缩。P帧压缩率也比帧内编码的I帧要高。图3.3描述了不同帧之间的关系。图3.3 MPEG-1 I、P和B帧的图片组

一个视频流中的不同帧类型的数量和出现频率取决于图片组(Group of Pictures,GoP)。GoP定义了2个I帧中间P帧和B帧的数量和顺序。为了达到高压缩率,大多数图片应该是B帧。然而,随机访问每个单帧却需要只有I帧的流。因此需要权衡压缩率和随机访问视频流的能力。I帧的数量也影响到视频流的错误恢复能力。如果一个I帧损坏或者缺失,则视频流中的所有接下来的P帧和B帧都不能被正常解码。实践证明,一组顺序为IBBPBBPBBI...的画面组是适合的,因为在这个顺序中的每9个帧中(每330毫秒)就有一个可随机访问的帧。

人们定义了2个不同的标准交换格式(Standard Interchange Formats,SIF)(根据PAL和NTSC命名)。为了和MPEG-1标准兼容,人们规定了其中必须要支持的一个最少参数集合,称为限制参数集(Constrain Parameter Set,CPS)。3.3.2.2 MPEG-2

MPEG-1被定义为一种适合数字化资源存储技术的格式。由于它规定了一个最大数据率(1.5Mb/s),在现有技术条件下对于给定的质量不会有显著的提高。因此MPGE-1不适合于高质量的应用要求。为了满足媒体制作和电视的高质量视频的要求,人们定义了MPEG-2。MPEG-2标准是ISO/IEC、ITU-TS、ITU-RS、EBU和SMPTE联合制定的结果。

MPEG-2标准的目的是为音视频信息在很大的分辨率和比特率的范围内提供有效的编码。根据ITU-R 601考虑到更高画面分辨率的要求,MPEG-2规定了最高100Mb/s的数据率。MPEG-2标准甚至考虑了HDTV。此外,它提供了适合交互多媒体服务的特性,如交互电视的随机访问、技巧模式(如快进、快退和慢放等)和多轨音频等。MPEG-2考虑的另一个问题是通过有损耗的信道传输视频。

MPEG-2和MPEG-1标准有同样的基本编码原理。压缩源是数码视频流(如先前的数码流)。与MPEG-1一样,MPEG-2也只定义视频流的语法和解码语义,而不是编码过程。同MPEG-1中定义的一样,有4种不同的画面帧(I、P、B、和D帧)。压缩过程中画面被分解为8×8的宏块,每个块用DTC来变换、量化和之字形扫描,还有运动评价和补偿。熵编码的步骤采用可变的游程编码。因此MPEG-1标准中的所有基本技术也用在MPEG-2中。

然而和MPEG-1不同的是,MPEG-2也支持隔行扫描的视频压缩。这是由MPGE-2的2种不同的画面模式——场画面(场单独被编码)和帧画面(每个隔行扫描的场组成一帧,被划分为宏块,然后被编码)来实现的。在该情况下,MPEG-2也为之字形扫描出现的非最佳情况提供了一种替换扫描模式。当邻近的扫描线来自于不同的场时,可以造成运动画面场景上的不连续。MPEG-2的分层编码

为了提供更好的可扩展性,MPEG-2允许视频信息在不同层进行编码。不同的层相互叠加。从所谓的基本层开始,每个层都去完善前一层生成的画面的质量。MPEG-2定义的分层编码模式有:

·空间可扩展性模式:这种模式允许视频在不同的水平和垂直分辨率范围内被编码。所有的层组合成完整解析度。支持的分辨率有:352×288像素、360×240像素、704×576像素(同ITU-601一样)和1.250行16×9亮度水平的HDTV分辨率。此时的色度抽样是亮度抽样值的一半(如4∶2∶2抽样)。这种特性允许不同质量的视频同时传送,如标准电视和HDTV。

·时间可扩展性模式:这种模式下的基本层包含了低帧率的序列。增加的层将视频补充为全帧率的。此时,层间的不同帧类型的区分是很重要的,例如I、P、B帧在视频序列中的分布不仅仅和GoP有关,也和不同层有关。

·数据分区模式:在这种模式中数据根据优先级被编码。例如,高优先级的流包括:低频DC系数和运动矢量头。这样可以传递不同质量的视频到不同的用户,而且也支持渐进式图像的生成。

·信噪比可扩展模式(Signal-to-Noise Ratio scalability,SNR):这种模式允许基本质量版本画面的编码。增加的层负责全质量图像所需要的信息。MPEG-2类和级

为了支持用户的专业应用以及不同的格式,该标准定义了一系列扩展类。这些类支持不同的色度抽样模式,如4∶2∶0、4∶2∶2和4∶4∶4。一个类将一个支持全部MPEG-2语义子集的编码特征集具体化。继承的类是由之前的类组成的。除了类,该标准还定义了支持许多画面格式的区别空间和时间分辨率的级。表3.2给出了该标准定义的类和级。表3.2 MPEG-2的类和级

MPEG-2标准只定义了可能的类和级的复合子集,以支持特定的应用。例如,定义MPEG-2的主类是为了支持视频在2~80Mb/s范围内传输。在电视制作中,时常用到MPEG-2中的4∶2∶2类;而I、B和18Mb/s的GoP则适合于新闻收集和制作。特效制作则适合使用50Mb/s的仅有I帧的GoP。MPEG-2传递

除了定义视频和音频编码,MPEG-2标准还说明了如何组合不同的成分(在MPEG-2系统规范中)。该标准定义了2个数据流,称为MPEG-2传输流(设计用来同时负载多个程序)和MPEG-2程序流(设计用来支持软件中的系统处理)。程序流优化了多媒体的应用,同时也考虑了兼容MPEG-1。传输流特别考虑了在数据可能缺失的情况下的应用,考虑的应用范围从视频电话到数字电视,支持的网络范围从光纤、卫星、有线、ISDN到ATM网络。

传输流由固定大小的包序列组成,包头都有定义包的标识。许多程序流都可以转换为MPEG-2的传输流(如视频和音频流)。包定义标识区别属于不同流的包。与时分复用不同的是,这种方法允许任何时候在传输流中插入子流的包。

与文件格式(见第5章)相似的是,传输流可能对应一个包含多个视频和音频磁轨成分的单多媒体流(如表示电视节目)。这在MPEG-2中被称为单节目传输流。多节目传输流可以由单节目传输流组合并且可以包含其他数据,如控制信息、具体节目信息和元数据。图3.4所示为MPEG-2多节目传输流的结构。图3.4 MPEG-2多节目传输流的结构3.3.2.3 MPEG-4

MPEG-4正式名称为视音频对象编码,它比MPEG-1和MPEG-2(注重编码和压缩方面)的范围更加广泛。起初,MPEG-4的主要目标是定义一个比常规编码技术更能大幅度提高压缩率的标准,后来变成包含从移动电话到交互多媒体应用再到媒体制作和播出的多媒体应用和设备的需求。可预见的媒体和技术领域的交合点(如通信、计算、电视和娱乐部分)是该标准的重要驱动力。该标准中设想的视音频应用部分的功能定义如下:

·支持基于内容的交互,包括多媒体访问工具、基于内容的操作和比特流的编辑、混合、合成数据编码和优化的临时随机存取。

·通过改进的编码效率和多路数据流编码而优化的压缩。

·在不同环境下(从高速专业网络到低带宽、易出错的无线通讯)支持普遍的访问,但是也考虑了内容对象和基于内容的可扩展性。

MPEG-4指定了一个基于以上功能的工具集和一个需求集。这个集包括:

·系统需求。

·自然视频对象需求。

·合成视频对象需求。

·自然音频对象需求。

·合成音频对象需求。

·传送多媒体集成格式(Delivery Multimedia Integration Format,DMIF)的需求。

·MPEG-J(定义JAVA应用引擎)的需求。

·多用户环境的需求。

·动画框架的需求。

·知识产权管理和保护(Intellectual Property Management and Protection,IPMP)的需求。

表3.3给出了MPEG-4标准主要部分的概况。这个表表明了该标准的实际延伸和界定,可见视音频对象的编码只是其中一个方面。然而,有效的压缩是这个标准的核心问题。标准的第二和第三部分涉及的是视频和音频的编码及相关问题。标准的第十部分是有关高级视频编码问题。表3.3 MPEG-4标准部分部分

MPEG-4支持从2kb/s到24kb/s的语音编码和从5Kb/s到1Gb/s的视频编码。视频格式可以是逐行的或使用隔行扫描,分辨率也可以从QCIF到4K×4K的分辨率变化。MPEG-4是一个适用性很强的标准,它支持基于内容的编码功能,如视频对象/形状编码的分离解码、面部和身体的模拟,以及二维和三维的网格编码。合成对象包括文本、图形覆盖、面部模拟及物体。该标准假想自然的和合成的对象能被集成在同一画面场景中。MPEG-4面向对象的编码

在面向对象的视频编码中,视音频场景由画面、声音和影音对象(称作AVO,Audiovisual Object)等基本元素组成。这些对象可以是任意形状,并进行空间和时间延伸。表示AVO的已编码数据被加载在单独的基本流上。AVO由对象描述符来描述(OD),并且包含了其(固定的)时间和空间位置和比例的信息。AVO的本地坐标系统通过这些信息操作AVO。

一个画面场景由各种各样的AVO组成。组成该场景的信息存储在场景描述等信息里。它定义了空间和时间的位置以及AVO之间的关系、动态行为和该场景中有可能出现的交互信息的种类。场景描述符是场景的一部分,包括了指向不同AVO对象描述符的指针。这些指针表示了场景和基本对象之间的连接。作为一种正式的场景描述语言,MPEG-4定义了场景的二进制格式(Binary Format for Scenes,BIFS)。BIFS提供了二维和三维的功能集以及文字和图画的功能集。而且BIFS还支持基于用户操作事件的交互使用。图3.5表示了基于对象的MPEG-4场景组成的例子。图3.5 一个基于对象的场景组成例子

与MPEG-1、MPEG-2一样,MPEG-4没有具体化编码器,而是指定了它产生的比特流和解码过程。视频编码方案是基于动态补偿混合的DCT编码。与MPEG-1、MPEG-2相比较而言,其动态解码和补偿工具以及文本解码工具共同促成了一个标准化的基于模块的解码器。因此该标准可以与MPEG-1、MPEG-2相兼容,但该标准在视频编码的算法上有了提高,例如压缩效率和容错率的提高是MPEG-4的主要改进内容。

通过增加形态解码工具,该标准转向一种基于对象的视频编码解决方法,例如,编码内容不需要是规则化的,而可以是任意形态的。一个编码对象的MPEG-4比特流可以在一个层级结构中描述。该层级结构的顶层是由可视化对象组成的可视化序列。而可视化对象被定义为由亮度和色度值以及其形状定义的图像序列组成的视频对象平面序列。MPEG-4非视频部分

为了更好地支持电信、计算机模拟和多媒体产业的新兴服务,MPEG-4标准考虑了如支持阿尔法混合和场景细节多层编码的要求。这在MPEG-4的视觉纹理编码(Visual Texture Coding,VTC)中有具体考虑。它提高了纹理压缩效率(在很大质量范围内),并支持随机访问部分或全部场景对象。因此它用不同水平的复杂度规定了各种编码模式。为了实现更有效的压缩,使用了小波变换和零树编码。小波变换代替了DCT,因而使图像在高质量压缩中有非常好的压缩属性和开发结构。MPEG-4类和级

为了减少一个解码器支持所有可能的应用工具的复杂性,MPEG-4也定义了类和级。对每个类所支持的工具集都有具体定义。而级则设置如所需内存、对象数目、比特率等的复杂度的范围。因此所支持的类和级要具体化到每一个MPEG-4解码器,同时也要保证系统间的交互操作。类和级的组合具有一个定义良好的一致性。

MPEG-4把比特流和解码器一致性区别开来。当一个流中只有类定义的语义元素时,以及当类和级的组合定义的参数在范围之内时,该流就被认为是比特流兼容的。当解码器能够解码所有允许的语义元素中的值(静态兼容),并且对在所需地点的所有类和级所支持的根据语法和语义的解码操作有相应的资源(动态兼容)时,则解码器是兼容特定的类和级的。在面向对象的编码环境中,类和级并不定义每一单个对象的最大复杂度,它只是具体化了一个场景中所有对象的复杂度边界。需要注意的是,当对一个具体的视频解码器考虑复杂度的时候,一个场景中对象的数量和它们的复杂度都要被考虑。MPEG-4的对象类型

除了类和级,MPEG-4还指定了对象类型。它们定义了编码一个场景中的对象所需的工具类型和对象类型之间结合的规则。除此之外,对象类型指定了对象的句法和语义。表3.4给出了矩形视频和任意形状视频的对象类型概述。表3.4 MPEG-4视频对象类型MPEG-4视频类级

类决定了一个场景中可以使用哪种类型的对象。例如,它们定义一个允许的对象类型表。表3.5给出了一个矩形视频和不规则视频的视频类,同时也说明了一个类的级数量。表3.5 MPEG-4视频类级

不同的类规定了将要应用的反映对质量和带宽要求不同的比特率。例如,简单的类定义了一个0级比特率为64kb/s,3级比特率为384kb/s。高级的简单类型范围更广:从适合因特网应用的128~768kb/s到适合更高质量应用的3~8Mb/s。主要的类为高清电视相关服务定义的最高比特率为38Mb/s。最后,为了制作需要,在简单演播室类中规定比特率为180~1 800Mb/s,而在核心演播室类中规定的最高比特率为900Mb/s。

目前很少有产品支持MPEG-4编码的视频。因此,还不可预知MPEG-4今后是否能影响媒体并占据主导地位。然而,在内容管理系统中应该能够处理MPEG-4视频。

3.3.3 基于DV的格式

数字视频(Digital Video,DV)最初的考虑是消费类产品的数字磁带记录格式,后来被应用到专业领域。目前有2种标准:由国际电工委员会(International Electrotechnical Commission,IEC)制定的原始DV标准和由电影与电视工程师学会(Society of Motion Picture and Television Engineers,SMPTE)发布的专业DV标准,它指定了DV的特征和功能。

DV规范不仅包含视频编码的内容,还包含一些磁带议题,如磁带错误的修正等。本节的重点是专业DV标准规定的实际编码功能。3.3.3.1 DV格式:编码基础

和MPEG一样,DV压缩也是基于离散余弦变换(Discrete Cosine Transformation,DCT)的。然而,和MPEG不同的是,它只使用帧内压缩。DV的压缩率取决于一帧内的运动,值约为5∶1。这取决于场内压缩(如画面中有很多地方相同,同时又没有很多运动时就能达到更高的压缩率),结果是可变比特率。因为DV编码视频流需要连续的比特率,所以采用了一种可适应帧内空间压缩的方法,如场景内移动的增多也引起空间压缩增加。DV编码由三级层结构构成。首先,画面帧被分成矩形的块,之后这些块被分成278×8的DCT宏块。

一般使用者用的DV信号部分用4∶2∶0的格式,抽样率为13.5MHz,8比特编码。对于专业应用,品质将调整成为4∶1∶1。

考虑NTSC视频的例子,压缩视频数据的一个帧由10个轨道和138个数据块组成。每个数据块包含76字节的视频数据和1字节的头数据。每秒29.97帧的速度相当于25.146Mb/s的视频率,因此对于ITU-R BT601非标准4∶1∶1编码视频的125.5Mb/s的数据率来说,也就等于5∶1的压缩率。

视频数据的错误改正机制(内部)和文件(外部)奇偶编码给予视频数据以改正单个比特错误的能力。对于大块的数据,可以使用更加复杂的错误修正方案,如Reed-Solomon。

除了视频部分以外,编码的流也包含辅助视频数据(Auxiliary Video Data,VAUX),它包括记录数据和时间、闪屏速度、透镜参数、色彩平衡和其他镜头信息。额外的元数据和视频编码信息共同保存是很有利的。3.3.3.2 根据SMPTE的DV专业压缩

SMPTE标准306M和314M定义了DV编码视频和音频的内容、格式、视频记录方法和相关音频以及辅助信息的记录。SMPTE 306M只处理25Mb/s的视频,而314M则处理25Mb/s 4∶1∶1的视频和50Mb/s 4∶2∶2的视频。

该标准定义了1个视频信道和2个独立的音频信道,能够对25Mb/s的DV进行独立编辑,也为50Mb/s的DV定义了1个视频信道和4个独立的音频信道。该标准还同时考虑了2种电视制式NTSC制(525线480动态线,每秒29.97帧)和PAL制(625线576动态线,每秒25帧)。

SMPTE 306M考虑了存取素材在盒式6.35毫米磁带上。该记录使用了螺旋轨道,每个轨道包含原始轨道信息(Intial Track Information,ITI)(包括开始同步信息和轨道信息)、音频部分和次级编码部分(包括时间控制码数据和一些可选数据)。帧的记录具体化为NTSC制10轨道,PAL制12轨道。

音频部分由音频前同步码、音频同步块和音频后同步码(除了实际的音频数据、音频辅助数据、纠错部分和检测信息以外)组成。实际音频数据是音频同步块的一部分。和音频相似,视频部分也有视频前同步码、视频同步块及视频后同步码。视频同步块由149个数据同步块组成。

对于音频编码来说,该标准具体化了包含72个字节音频数据的数据包。每2个(或4个)音频信道完全一致,但是可以独立工作。音频输入信号以48kHz、16比特量化而抽样,并与视频信号锁定。音频信号以NTSC制每帧1602(或1600)的抽样率和PAL制每帧1920的抽样率被处理。音频帧的延续时间和相应的视频帧的延续时间相同。对基于内部和外部的奇偶性错误检测和改正操作也进行了定义。

该标准的视频编码部分区别了4∶2∶2抽样的50Mb/s的DV视频和4∶1∶1抽样的25Mb/s的DV视频。编码过程开始于输入的模拟视频信号,该信号以13.5MHz的亮度信号和6.75MHz的色度信号抽样(在4∶2∶2抽样的情况下)。对于DV25,所有每行的720个亮度像素被处理,但是另外的360个色度像素却被抛弃,因此是将4∶2∶2抽样信号过滤成4∶1∶1的抽样信号。对于DV50则始终保持4∶2∶2的抽样信号。

接下来的抽样应用了DCT。对于DV25,应用1个宏块中的4个亮度信号的DCT块,2个色度信号的DCT块。而DV50使用1个宏块中的2个亮度信号的块和2个色度信号的块。对于NTSC制的DV50每帧有2 700个宏块,DV25每帧有1 350个宏块。而PAL制的DV50每帧有3 240个宏块,DV25每帧有1 620个宏块。

抽样和DCT之后,DCT的协同加权系数被量化成为9比特字节并区分了量化步骤。所谓的视频片段由5个被压缩的宏块组成。然后一个视频片断又被压缩成为385字节的数据流。在压缩过程中,应用了熵编码和各种游程编码。

为了DV25编码视频的转换,为NTSC制定义了每帧10DIF的序列,为PAL制定义了每帧12DIF的序列。而DV50则采用2个每帧10(或12)DIF序列的信道同时转换。

3.3.4 内容管理系统中的视频格式

在内容管理系统中,要管理很多不同的视频格式,其中大部分将是基于DV或者MPEG标准编码的数字化格式。然而应该注意的是,目前视频制作和处理中仍有很多模拟或者基于磁带的格式在使用。尽管这些格式不能在无磁带的工作流中使用,但是它们仍应该得到管理。目前的视频记录格式包括:

·模拟组件格式,如BETACAM、BETACAM SP和M-2。

·D-2、D-3数字复合格式。

·数字BETACAM数字组件格式(用本地数据率约为90Mb/s的压缩格式)。

·D-5数字组件格式,根据数字演播室标准ITU-R BT 601-5透明记录10比特数字视频(不使用视频压缩)。

新的数字视频磁带记录格式通常基于DV或MPEG-2标准的压缩算法。已有的应用如下:

·数字组件格式DVCPRO(使用4∶1∶1抽样和基于DV视频压缩标准,网络数据率为25Mb/s)。

·数字组件格式BETACAM SX(使用4∶2∶2抽样和MPEG-2,IB帧视频压缩方案,网络数据率为21Mb/s)。

·数字组件格式D-9(Digital S)(使用4∶2∶2抽样和基于DV视频压缩标准,网络数据率为50Mb/s)。

·数字组件格式DVCPRO50(使用4∶2∶2抽样和基于DV视频压缩标准,网络数据率为50Mb/s,和D-9格式一样)。

·数字组件格式DVCAM(使用4∶2∶0抽样和家庭DV视频压缩标准,网络数据率为25Mb/s)。

·数字组件格式D-10(MPEG IMXTX)(使用4∶2∶2抽样和基于MPEG-2 4∶2∶2 P@ML、I帧视频压缩标准,网络数据率为50Mb/s)。

为了明确内容管理系统中视频的需求,需要考虑在具体系统中实际应用的格式。大体来说,不同的格式可以达到不同的目的,如低比特率浏览格式是用来预览材料的。然而,浏览的应用越复杂,用户对浏览的要求就越高。目前认为,双声道音频已经够用了,但是在多种语言的节目中需要很多不同语言的音轨,因此这些类型的格式要支持目前和将来所需的特性。

数字广播格式的比特率可以根据转换信道的不同而变化,通常是4~8Mb/s。这些格式目前都是基于MPEG-2标准的。在制作中很多格式支持不同的带宽和质量水平,所以选择何种格式取决于制作者的需要和制作环境。大体来说,这些格式的带宽从新闻制作的18Mb/s到特征特写的50Mb/s变化。内容管理系统要合理处理这些格式并且提供尽可能快速和更好的访问方式。从质量角度来说,无压缩(或无损压缩)的视频是最好的,然而,此时的存储和通信就很困难。表3.6给出了常用格式的概况、传输率和存储要求。存储要求以100000小时的视频量计算,因为这是中型广播的最常用数量。在这种情况下还要考虑并行的很多格式的使用。表3.6 视频格式和质量级

严重影响内容保存的一个因素被称为生成缺失问题。这种影响是指在制作过程中的每一步当其参与到材料的解码和重新编码时,素材的质量都会降低。使用有损压缩方法,每次材料被解码、处理和重新编码时都会发生质量的降低。这些情况甚至在高带宽的格式中也会发生,如MPEG-2的4∶2∶2 P@ML和50Mb/s时的DVCPRO50。在不同种类制作和通讯基础结构中,这种情况是严重的问题。另一个在存储时有可能发生的有关格式的主要问题是,过时格式不能再被处理,它和存储器恶化一样是每年都会发生的、可以预见的内容缺失的原因。

有很多视频专有格式的编码和压缩技术并没有完全完成,例如Real视频作为一种浏览和因特网传输格式或者基于动态JPEG制作的格式被广泛使用。这些格式应该在内容管理系统中被有效地管理,可是这些格式的功能和交互性在系统中却受到了限制,例如只能用本地工具流化、操作和处理专有格式。当不知道编码格式和结构时,素材编码成的专有格式只能被当作文件使用。只有当能够处理这种格式的工具可以被集成进内容管理系统中作为服务或应用组件时,才能进行更加复杂的交互操作。因此选择视频格式的准则之一就是支持这个格式的工具是否可以容易地被集成到系统中去。

3.4 音频

和视频一样,音频可以被归类为连续媒体素材类型,如时间应该被看做是显示的语义中的一部分。和视频一样,音频在内容管理系统中被管理并且通常用低码率的副本来表示(音频)内容。音频和视频的许多参数标准都相同,不同的是音频对于量化方面的要求(如带宽和存储要求)比较低。不同的应用领域使用了不同的音频格式。在内容管理系统中这些数据必须被管理、转化到第三方系统中,并且(在应用层)展示给用户。音频在系统中可以是视频的一部分也可以是独立的组成部分。

在这一节介绍音频编码和主要压缩标准的原理和基础。

3.4.1 音频编码:基础和原理

声音是通过物质的震动而产生的,同时也引起周围介质的压迫震动(通常为空气)。震动产生了规则频率(周期)的波,它通过空气传播,当到达人耳时,人们就听到声音。声音的频率是周期值的倒数,单位是赫兹Hz(周期每秒)或者千赫kHz(1kHz=1000Hz)。人耳能够听到的频率范围是20Hz~20kHz。音调的大小取决于振幅(波偏移平均值的幅度)。

为了数字化地表示声波,可以用模数转换器(Analog-to-Digital Converter,ADC)来抽样,抽样率的单位也是Hz。标准CD抽样率是44.1kHz(即声波以每秒44 100样点进行抽样)。ADC的反向过程是数字到模拟的转换(Digital-to-Analog Conversion,DAC),它把数字信号转换成声波。应用ADC量化之后,接下来的数字化数据就可以被压缩了。不同的音频格式能够达到不同的目的。例如,电话的音频以8kHz抽样、8比特μ编码量化,而CD质量的音频用16比特的线性脉冲编码模式(Pulse Code Modulation,PCM)。从以上论述可知,决定数字音频质量的2个因素是抽样率和抽样量化程度。

CD质量的数字立体声音频的数据率是:

2×44 100(每秒)×16(比特)=1 411 200(比特每秒)

应用其他脉冲编码模式可以得到质量无损的结果。

波形格式(WAVE)常作为无压缩的数字立体声音频的参考格式。WAVE基本上是一种文件格式,它定义了可以作为文件的一部分的编码音频。而更重要的是,它定义了数据怎样打包成为一个文件和能够被转化为文件的元数据的类型。标准明确提到适合WAVE的2个编码规则(MPEG和PCM)。无压缩音频的WAVE编码模式是以上提到的以44.1kHz的抽样和PCM编码、双声道CD质量的立体声音频。另一种常用的无压缩格式是48.0kHz PCM编码的无压缩音频,它被用在数字音频磁带(Digital Audio Tape,DAT)上。

3.4.2 基于MPEG的音频格式

MPEG不仅定义了有多元音频的标准视频,也独立定义了音频。所有相关的MPEG编码标准(例如MPEG-1、MPEG-2和MPEG-4)都涉及音频。3.4.2.1 MPEG-1音频

具体的MPEG-1音频编码与压缩数字音频CD和数字音频磁带(Digital Audio Tape,DAT)是兼容的,它们都是44.1kHz或48kHz抽样,16比特量化。此外还定义了32kHz的抽样频率。

在MPEG-1中定义了3个不同的层,每个层代表不同的编码、解码复杂度和表现水平。层与层之间向下兼容,例如高级的层必须能解码低级层的MPEG-1音频信号。音频文件通常编码成为MPEG-1的第三层,因此被称为MP3。

压缩开始于利用快速傅立叶变换(Fast Fourier Transformation,FFT)的频率转换。在此过程中,频谱被分成32个没有插帧的分波段。接下来计算每个分波段的音频信号的放大。与FFT同时进行的是用心理声学模型来定义每个分波段噪波,该过程的结果决定了量化过程。分波段的噪波水平越高,量化水平就越高。层1和层2的量化用PCM,层3的量化用霍夫曼编码,而最终的压缩步骤用熵编码。

MPEG-1中定义的音频编码有单信道、2个独立信道、双信道立体声和混合立体声。后者中的冗余信息可以去掉,以达到较高的压缩率。对于每个层的编码信息流都定义了14个不同的比特率(根据其不同的比特率索引)。每层的最小值是32kb/s,最大值各不相同。第1层允许的最大比特率为448kb/s,第2层允许的最大比特率是384kb/s,第3层是320kb/s。第3层还可以支持可变的比特率。第2层对于不同的信道有不同的限制要求。3.4.2.2 MPEG-2音频

MPEG-2标准包含和提高了MPEG-1音频标准。例如,它也支持16kHz、22.05kHz和24kHz的抽样率(MPEG-1抽样频率的一半)。这使比特率降低到64kb/s以下,同时MPEG-2的音频部分标准用相对低的比特率支持多信道。有多达5个的全带宽声道:左、右、中间双环绕声道以及一个提高低频质量的声道,而且还支持多达7个信道的不同语言。3.4.2.3 MPEG-4音频

MPEG-4为语音编码、通用音频编码、音频语义和语音合成定义了一种扩展工具。MPEG-4音频(和视频部分相似)是面向对象的,它支持音频场景通过多重音频对象(语义的或者自然的)而创建。和MPEG-1以及MPEG-2中定义的一样,自然音频对象是从样本波形中产生的。和视频的方式相似,不同的音频流组合成为一个音频场景。

语音编码部分是特别为口语单词的有效编码设计的,它可以节省带宽、优化网络通信能力和节省存储量。因为只有语音需要编码,所以可以使用更有效的编码技术,其中杰出的有代码激励线性预测方法(Code Excited Linear Prediction,CELP)和MPEG-4谐波矢量刺激编码方法(Harmonic Vector Excitation Coding,HVXC)。CELP所产生的比特率是4~6kb/s,而HVXC编码的比特率是2~4kb/s。

MPEG-4标准的一般音频部分是将自然音频输入信号的重新制作。MPEG-4的代码部分基于MPEG-2优化编码技术,具有更好的压缩能力和纠错机制。而且它还支持很低的比特率和非常低的延迟。另外,它利用大步骤的可伸缩音频编码和比特分割编码算法实现了比特率的可扩展性(例如在接受有效信息时,还可以解码比特流的子集)。

MPEG-4还定义了音频的类、级和对象类型,具有通用音频、语音、语音和通用音频、语意音频和语意语音的扩展类型列表。表3.7给出了一些选定的音频对象类型的摘要。表3.7 MPEG-4音频对象类型

MPEG-4音频类定义了比特流和解码器的一致性范围。MPEG-4中定义的类比对象类型要少。MPEG-4的音频级是根据复杂度单元来定义的(处理器和RAM的复杂度)。MPEG-4还限制了特殊类型的对象,作者可以在一个音频场景中以不同的复杂度来使用不同的对象类型,只要总体复杂度不超过所定义的该级的复杂度。表3.8给出了通用音频、语言和通用音频的类型定义。表3.8 MPEG-4音频类续表

3.4.3 内容管理系统中的音频格式

标准音频格式(如44.1kHz和48kHz的PCM编码音频和MPEG音频)的带宽和存储要求比同样类型的视频要求要少,因此被认为更易管理。然而,这些格式同样要被整合到内容管理系统中,并且内容管理系统要对其制作和传输所需的工具和应用给予支持。

MPEG的音频编码器支持整个范围的声音压缩,其中最主要的是MPEG-1的第3层(MP3),因为它是目前网上流行的音频格式。基于MPEG-4的音频系统的相关性是显而易见的,同样也存在其他方式的音频编码格式,如Real音频或流式音频。然而,随着MP3的风靡,它们的实用性已经减弱了。

对内容管理系统的另一个挑战是具有更高抽样率和量化区间的新格式的出现。在专业系统中,96kHz的抽样率将可能成为标准。内容管理系统在处理音频和处理视频时的情况一样,必须应付多种多样的格式和需求。

3.5 图片、网页、文本和其他素材格式

除了视频和音频,内容管理系统还要管理其他很多媒体类型(主要是离散媒体类型)。与视频、音频的情况相似的是,图片、图表和文本等的媒体类型都有很多种格式。例如文本文档就可以被编码为无格式ASCII文本、Microsoft Word、FrameMaker、RTF和PDF等。另外,内容管理系统也需要管理一些表示幻灯片、项目计划或计算表单等需要特殊(通常是私有的)格式编码的文本文档。此时内容管理系统的主要功能是索引这些文档以使它们能被检索,以及集成本地应用程序或应用视图以为用户提供原始形式的文档。文档查询索引的问题由可处理多种格式的全文检索引擎来解决,提供本地应用程序和视图的问题要结合第三方的应用综合解决。

内容管理系统管理的其他重要的素材类型是网页中的图片和结构化文档。

3.5.1 图片

图片是可视化的照片或图像。它们描述具体的二维情形,没有时间限制(它们属于离散的媒体类型)。在内容管理系统中,图片由数字图片格式或指向外部图片的链接来表示。本书中只讨论相关的数字图片格式。在技术层面上,图片被认为是平面区域每个点的光线强度功能值的反映。为了数字化地表示这些值,需要对它们进行抽样和对抽样值进行量化。数字图片本身就成了表现量化值强度的数字值矩阵。图片的抽样点是画面元素(如视频中),即像素。图片的数字表示可能会很大。一张和NTSC制电视画面大小一样的图片的分辨率为640×480像素矩阵。以8比特和256灰度水平存储该单色图像需要空间大小约为300kB,因此和在视频中一样,需要压缩图片来减少表现时需要的比特数。最常用的图片格式是JPEG、GIF、TIFF和BMP。3.5.1.1 JPEG

JPEG标准是由ISO和CCITT联合组成的联合图片专家组制定的。JPEG定义了彩色和单色图片的编码和压缩方法,以及含有实际图片数据、编码表和编码参数的交换格式。如果编码器和解码器在相同环境中使用,就不需要编码表和编码参数。

JPEG标准具体化了4种基本模型(每一种还有变体):

·缺失序列DCT基本模型,即每个JPEG工具都支持的基本处理模型。

·扩展的缺失DCT基本模型,是对基本处理模型的增强。

·无损模型,支持原始图片信息的精确复制和重组,但是压缩率低。

·分层模型,包含不同分辨率的图片,并应用以上3种JPEG模型的算法。

这些模型的基本编码和压缩步骤相同(如图3.6)。不是每个模型都应用所有的技术,如基本处理模型用分块、MCU、FDCT、步长和霍夫曼编码方法。图3.6 JPEG压缩步骤

JPEG定义了一种很普遍的图片模式。图片准备阶段的源图片由至少一个、至多255个组成部分或者平面组成。这些组成部分的像素可能不同,如它们可以表示不同颜色(RGB)、明暗或者色度信息(YUV)。像素的表示也是可变的,每一个像素由值为0到2P-1的P个比特来表示。图片的所有组成部分的所有像素要以相同数目的比特数编码。JPEG缺失模型中每个像素用8或12比特表示。无插帧数据单元的处理命令是从左到右、从上到下,然后未压缩的图片样本被归组成8×8像素的数据单元。

基准模型的图像处理在8×8的像素组中,使用前序离散余弦转换(前序DCT),将二维图片值映射至频率域内。这种转换要进行64次,这一步之后所有DCT的系数要用64个输入口的量化表进行量化,每个输入口对应一个DCT系数的量化。量化和DCT过程都是有缺失的。接下来应用熵编码,在基准模型中的熵编码使用霍夫曼编码方法。

扩展的缺失模型支持高抽样精度(最高12比特)。另外,还使用了扩展的量化方法,从而实现渐进式代替顺序的图像显示。前者使得图片更加清晰,后者使得图片自上到下显示。扩展的缺失模型可以使用熵编码。

在无损模型中,预备处理的图像的每个像素的数据单元每像素精度在2~16比特之间。处理和量化步骤是基于根据相邻样本预测样本值的预测技术。3.5.1.2 GIF

图形交换格式(Graphic Interchange Format,GIF)最初由CompuServe开发,以支持与平台无关的图片交换。GIF使用无损压缩方案,支持在一个文件中插入多幅画面。

GIF图片总是编码为比特流。逻辑屏幕描述符定义了编码过的图片大小、位置和色彩表类型,而且也定义了可操作的全局、局部色彩表和指向该表的像素色彩指针。像素色彩用特殊的算法压缩(称为Lempel-Ziv-Welch),该算法可以检测和处理可变长度的比特模式。该比特模式在表中以短比特的形式表示,出现频率最高的比特模式以最短的比特表示。

GIF图片由以下部分组成:

·头,包含GIF ID和算法版本号码。

·应用部分,支持生成图片的程序的版本和名称信息编码。

·尾部,标示GIF流的结束。

·控制部分,控制后续图片块的显示。

·图片部分,包含图片头、可操作的色彩表和像素信息。

·注释部分,包含每个图片块的附加(文本)介绍信息。

·平面文本部分,支持图片中出现的文本信息的ASCII编码。

在GIF图片中,控制部分、图片部分、介绍部分和平面文本部分可以重复和排列。GIF也支持简短动画和图片序列的编码。GIF只适用8比特的色彩表,所以不能应用于高质量的图片。3.5.1.3 TIFF

标签图像文件格式(Tagged Image File Format,TIFF)是微软公司和Aldus公司联合开发的。TIFF的目标是提供可移植的、与硬件无关的图像编码。它有2个组成部分,称为基准部分和扩展部分。基准部分定义每个解码和显示的应用程序都必须支持的一些特征,扩展部分定义其他的附加信息。TIFF支持在很大范围内的色彩模型:从黑白图像到单色图像再到复杂色彩图像、RGB图像等。与GIF相似,TIFF也有以下几个部分:

·头字典,定义字节顺序、版本号码以及含有其他图片或部分的参考信息。

·结构部分,定义编码技术和标记域的数量。

·字段,定义图片编码块(行、对象、单元和块)以及它们的特征(压缩技术、分辨率和校准)。

·数据字段,定义前面没有定义的图形对象。

TIFF支持的压缩技术有游程编码、霍夫曼编码、Lempel-Ziv-Welch压缩和JPEG压缩方法。TIFF是一种广泛应用的格式,它还支持不同分辨率的图像编码,如预览格式和高清格式图片。3.5.1.4 BMP

位图格式(Bitmap Format,BMP)是基于RGB色彩的一般图像格式。它也被用于单色和黑白图像的编码。BMP格式定义了2个主要部分:头和数据部分。前者被称为位图信息(BITMAPINFO),定义了图片大小、色彩深度、色彩表以及压缩技术。数据部分含有每一行中的各个点的像素值。色彩深度可取的值有1、4、8和24。色彩深度值为每像素4和8比特的图片压缩方案采用游程编码方法,而色彩表中的其他相关信息值则采用特殊的编码算法。

3.5.2 结构化文档

结构化文档是内容管理系统中的又一种重要的媒体类型,它的发展主要由2方面促成:印刷媒体工业和网域。另外,超文本和超媒体也对结构化文档语言和标准的发展有一定的影响。与一般文档格式相比(RTF、MS Word或者PDF),结构化文档的特点是使用标记语言并链接到扩展文本和信息。对于内容管理系统来说这是一项特殊的挑战。

这里主要考虑的标准是SGML、HTML和XML。后者在§4.5.2与元数据编码、传输和交换一起介绍,因为它主要应用于这些领域。3.5.2.1 SGML

标准通用标记语言(Standard Generalized Markup Language,SGML)是由美国出版协会支持开发的。它的基本思想是文本的书写不含有任何格式,而使用标记来标明标题、段落等文本元素。利用SGML可以实现文本显示的灵活可变性。标记结构对文本文档的自动处理也很有利。SGML定义了一个框架,在这个框架中定义了标记的语义,标记的出现频率和解释留给处理SGML文档的应用程序来进行。SGML是面向对象的,包括类、对象、类和对象的层级及继承等。它还允许指定SGML文档的处理指令信息。

文档的分析和格式化过程是分开的。标记决定了文档的结构,而显示的部分也常和结构有关。因此,格式化文档时要考虑文档设计的内容。

SGML中定义了4种标记类:

·描述性标记,决定了文档的结构,形式为〈start-tag〉文本元素〈/end-tag〉。

·实体引用,是在显示文档的时候代替实体元素的引用设定。

·标记声明,定义能够被进行引用的实体。

·处理指令,是和格式化指令一样的程序指令,并且能够支持在文本显示的同时显示其他媒体类型,如音频、视频。

SGML只定义了语义,而文档类型定义(Document Type Definition,DTD)则定义了句法。文档风格语义和规格语言(Document Style Semantics and Specification Language,DSSSL)则规定了显示标准。3.5.2.2 网页和HTML

随着万维网的普及,内容管理系统更加需要管理好网页文本。网页是包含文本、图片、图表、声音和视频元素的电子文档,甚至还有一些小的可执行程序。这些文档存储在服务器上,从而用户可以进行检索。网页的不同元素不需要在网页内部被编码,但是可以链接到相关网页。因此,一个网页可能需要链接很多相关的素材元素。为了在内容管理系统中管理网页,需要定义扩展文档。例如,与网页有关的图片、视频或者音频可以被当作是文档的一部分,而到其他页面的链接可能在现有结构之外,只需当作引用项目。因此,用内容管理系统处理网页时,确定结构深度是很重要的。例如,相关的链接元素的范围应包含在存储和管理的处理过程之中。

网页是由超文本标记语言(Hypertext Markup Language,HTML)制作的。HTML是一种定义了如何显示文档的简单标记语言。与SGML文档相比,HTML文档是由标记构成的结构简单的ASCII文本,这些标记可以被认为是控制命令。HTML文档结构由3部分构成:文档类型定义、文档头和文档主体。在HTML文档中可以编码元信息,它不显示给用户但是可以用来声明作者信息、版权信息,或者将网页信息提供给Web搜索引擎。表3.9给出了常用的HTML标记。表3.9 HTML标记举例标记

从表中可以看到,有些标记需要有开始和结束标记来封装声明的元素,否则会出现语法错误。

HTML中可以使用所谓的样式表来声明元素的显示方式。应用样式表来分开实际内容和显示内容。层叠样式表(Cascading Style Sheet,CSS)可以精确定义网页的显示格式。内容管理系统同样也要管理网页的样式表,HTML对样式表的引用也要被正确管理。

3.6 素材的处理

素材的处理包括视音频、音频和视频对象的自动管理,可被用作附加元数据的信息检索以及便捷的输入和检索过程。相关的工具有:视频分析工具、音频分析工具(如语音转为文本的工具和关键字定点)或者图片相似性检索工具。该类的其他程序有:转码工具或者将素材分段的特殊工具。

3.6.1 素材处理的应用程序和服务

有很多工具支持素材处理和语义信息的自动检索,不同工具针对素材处理的不同方面。不仅它们的处理精度在内容管理中十分重要,它们是否能够或者怎样被应用于内容管理系统中也是很重要的问题。

总体来说,相关工具是应用型或者是服务型。它们完全自动地处理素材,并可以将这些工具根据其处理的特定媒体的具体性质和特征进行分类,从而提取出语义信息。

·内容分割(时间和空间)工具和应用程序:根据具体参数如镜头数(时间分层)、特定区域,或者图像中的对象(空间分层)将连续媒体对象分割。

·元数据生成工具:根据特定素材对象的特性或者可分析的特征(如运动检测)来产生元数据。

·自动内容描述工具:如语音标识工具,根据语音或者检测的关键字生成清楚的显示描述。

·索引工具:根据最普遍的模式对素材对象进行分类,如面部标识工具和程序分类工具。

·基于内容的检索工具:利用素材的特征进行内容查询,如画面相似性检索。

3.6.2 素材的处理:基本原理和方法

大部分的素材处理工具是利用数学、统计或者不同媒体的某些可计算特征和属性的随机分析方法。它们对文件、声音、图片或可视视音频信号进行整体操作或者在给定时间内对特定部分分别操作。素材处理过程的基础构成部分有:

·特征提取。

·特征解析。

·查询引擎。

图3.7以部分工作流的方式给出了以上的组成部分。特征提取部分包括所有的处理原始视听材料和利用对象化的手法提取低水平特征的处理过程(如色彩直方图、频谱分析以及主要动作幅度分析等)。通常来说这些特征并不传递任何能被人们直接认知的信息,因此需要更进一步的处理。特征解析部分就是完成这方面工作的,它能解析特征或者特征组合的值(在一定出错范围内),尽量将目标观察和逻辑判断进行匹配(如画面的上半部分主要是浅蓝色的,下半部分主要是绿色的,因此判定它是在户外拍摄的)。这种操作可以对某些内容特征进行人们可以理解的描述,但是这种解析要基于某些试探方法,因此有可能导致错分类。更多先进的方法考虑了媒体的语义方面。图3.7 特征提取工作流

另一种直接应用音频、视频和视音频素材的低水平特征的方法是相似性检索。此时用户要求搜索引擎检索与已给定信息相似的信息条目,然后引擎根据用户提供的信息提取特征值,并与已检索的内容进行特征分析和提取后存储的特征值进行相似性匹配。这也包括从对象相似性度量的比较中提取的相似值。低水平的工具和一些同样考虑内容语义的高水平的工具共同使用,可以得到更加准确的结果。

声音和音频分析是应用随机分析对声音效果、光谱封装和音素进行操作。大体上它可被分为一般声音处理(发现和分类流中出现的声音)、音乐分类(乐器类型和主题识别)和语音分析(提供语言监测和标识、语言定义、关键字标记和脚本翻译)。例如,语音标识就使用了声音指纹鉴定方法。语音分析的原理是基于不同特征值的比较。将音频流中提取的特征值和用户例子的相关值作比较,从而识别出一个说话者或者词。语音分析过程有3个步骤:

·声音和音素分析。

·句法分析,从声音分析中改正错误。

·语义分析,也帮助改正错误。

依赖于说话者的声音的分析引擎通常产生的效果比不依赖说话者的分析工具要好,这是因为可以使用附加参数。总之,没有哪种语音分析工具可以产生100%正确的效果。

静态图像分析是用色彩特征分析、区域分段、文本特征分析和面部检测(可以被认为是特殊的文本特征分析)来得到图像内容的信息。图像标识技术有广泛的应用,如应用在OCR工具或者手写文字标识中。图像标识技术的3个特征是色彩、文本和图像边缘。可以根据这些特征的相似性来查找图像,或者根据某些特征的出现频率利用统计或者随机方法来标识图像。但是这些纯粹的技术分析方法并不能揭示图像确切的内容和语义,还需要知道对象在图像中的位置和区域。

图像标识过程有6个步骤:格式化、背景分析、标识、分组、提取和匹配。背景分析过程评价了信息模式并且清除干扰(噪波);接下来标签标识了信息模式,把它分成单元,组成一个可视化实体(主要使用边缘检测方法);分组步骤将单元组成的实体组成为更大的实体;在提取步骤中,从每个在分组步骤中产生的实体中提取出一个参数列表(如区域、方向、空间和环线位置等);匹配步骤匹配标识实体和已被认知的对象,这最后一步决定了图像中不同的相关对象的翻译。

视频分析工具使用为声音和图像分析开发的分析机制来进行基本分析,它还使用视频序列中的运动信息来决定视频的特定事件。例如使用场景转换、消解和擦除等效果和效果检测来决定视频中的拍摄转换。使用这些信息可以产生一个原始的剪接列表。某些效果,如消解和擦除效果,甚至很难和其他视觉效果区别开来,因此,它们的准确率比简单效果要低很多。可以将运动和轨道评价用于决定视频中对象的运动。所有这些信息可以用于产生视频的可视化摘要。当画面内容中有很大变化时会提取出关键帧。此时的情况与人的视觉感受没有很大关系。例如,在体育场的场景中包括很多运动,画面表现也就有很大不同,然而这些信息并不一定是相关的。提取出的关键帧可以以多种方式排列以给出视频内容的快速预览。此时经常运用情节串联图板或者马赛克技术。

另一种由视频分析产生的可视化摘要是所谓的浏览。它们是基于视频分析结果的简单视频摘要,如编辑在一起的简短的视频片段,可以给出视频内容的快速预览。更复杂的工具甚至考虑了伴音和单独的音轨的编辑以产生连续的视音频摘要。

3.6.3 内容管理系统中素材的处理工具

富媒体组织中需要处理的内容数量越来越多,因此使用自动处理过程来支持内容的标识和存档就变得更加重要。音频、视频和图片由基于计算机的工具和应用程序自动处理以提取语义甚至基本句法信息的特性。然而提取出的信息并不是100%正确的,因此需要仔细考虑处理素材的工具在什么环境中配置、它们提供信息的准确率的高低、还要附加什么人工操作和过程来更有效地使用这些工具和应用程序。目前只有辅助设备提供存档处理,而且还需要专业操作人员来运用。

内容的检索也可以由自动处理程序支持,如图像相似检索和蜂音搜索。此时需要重点考虑用户的需求。例如编辑或者记者检索一个图片数据库,使用样本图片查找一位政治人物的图片,它需要检索到在不同时间、从不同角度拍摄的同一人物的照片。然而目前大多数工具会返回包含相似形状、文本和颜色的图片,有时甚至和要检索的人物图片相去甚远。为了避免这种令人失望的情况,需要管理用户的需求,而且这些工具要用在真正适合使用的地方。

另一个需要考虑的情况是如何将自动处理工具和应用程序用于内容管理系统结构中。它们将文件、数据流或者视音频信号作为输入部分,产生的结果是关键帧集合、视听材料或者元数据信息。这些结果必须和实际内容对象相联系,并要能够在内容管理系统中被处理。另外,如图像相似性检索引擎等工具可以产生内容对象的命中清单。这些命中清单需要与存储在内容管理系统中的实际内容对象相关联。因此自动处理工具和应用程序只有在全面集成于内容管理系统中才能真正发挥作用。

第4章 内容的表达和元数据

内容管理系统的核心是它管理的内容对象。内容管理的主要任务是在对象的生命周期内优化内容的处理和开发。对象的生命周期是指从内容的获取、制作、传输,到归档和存储的过程。内容对象在系统中怎样存储和表示对于检索和应用处理是至关重要的。然而内容的表示并不只与内容对象本身有关,还与内容对象所处的使用环境有关。因此,内容的表示模型应该考虑到这个因素,从而提供一个内容数据和信息的各种处理过程的抽象。

元数据是内容管理系统中不可或缺的部分,它被定义为“有关数据的数据”。元数据在从不同方面描述内容对象时考虑了不同的观点、方面、工作流、处理程序和存在的信息模型,这对于在需要时随时管理、搜索、查找、检索内容信息是很重要的。因此,内容的描述和描述的质量对内容管理系统提供快速便捷的查找内容的能力是很重要的。元数据要考虑不同的用户角色和与系统的交互运行,以及提供相应的视图。理想的内容管理系统支持所有的原始材料进入系统的创建处理过程和描述过程,以及所有相关工作和内容的分配、处理过程。这种情况下需要考虑的不仅是与内容的直接交互工作,还包括相关领域,如统计计算、权限管理和程序计划。

除了纯粹的描述和检索以外,元数据还管理着内容的内部组织和对外组织关系方式。因此,优化实际的交换和信息的转译交换都需要一定的标准。因为标准通常只提供大致的共同特征说明,标准本身并不能提供个体组织所需要的具体功能支持。因此,标准只能覆盖对于具体功能和主题背景很重要的特定方面。

目前已经开发出了很多数据模型、内容描述方案以及内容的表示和描述的参考模型。它们通常从不同角度描述内容,因此不是完全可比较的。不存在通用的内容描述方案。在内容管理系统中,针对不同方面的应用要使用不同的内容表示方案。本章给出了根据不同环境描述内容的概念。接下来介绍了元数据的结构和元数据方案应该捕获的信息。本章还介绍了元数据的交换和数据模型,介绍了许多主要表示模型和描述方案,以及元数据的编码和交换协议,给出了该领域目前的发展概况。另外,本章还说明了目前在不同环境下表示元数据的不同方法。具体方案或者模型的适合程度还要视其在具体实例中的使用情况而定,本章的讨论将有助于形成这种评价。

4.1 内容的表示

内容对象的核心是素材,即包含实际信息或思想的部分。然而有时候内容的信息比内容对象本身还要重要,例如有关内容的所有管理任务。甚至在生产工作流中具体的元信息(元数据、摘要和低码率的素材版本)要比内容对象本身更重要(2.2.1节)。在这种情况下就需要选择适当的方法和适合的元数据,以表示对与内容对象有关的各种工作流和管理程序给予最好的支持。尽管数据模型、内容表示和工作流的详细信息根据不同的内容和不同的组织而不同,但是主要的内容特征和用例是大致相同的。

媒体对象(视频、音频轨道、图片等)可以被表示成为所谓的“代理”。代理对应于基于特定环境的特定方面的内容的具体视图。代理更加强调特定特征,表示特定视图或可视化的具体属性,因此更容易访问。代理可以有不同的媒体形式。视音频内容可以用多媒体代理来表示(综合使用不同媒体类型来表示)。其他代理有:摘要、编辑决策列表(Edit Decision List,EDL)、数据库记录等。图4.1展示了一些常用代理。代理可以被归类为文本代理、数据库代理和多媒体代理。图4.1 媒体对象和代理表示

纯文本代理是有关内容的文档,包括摘要、产品文档(如产品单)、校本、EDL、日志文件(例如和时码有关的文本转换语句和注解)、合约、法律文档等等。这一组代理包含了一般文本中表示内容或者内容的特定部分的所有文档类型,可以对这些文档建立索引以便查找。

数据库代理是存储于数据库管理系统(Database Management System,DBMS)的全部内容的表示。DBMS的特性是可以管理巨大数量的数据。内容对象被表示成为一种抽象模型,称为“数据模型”。数据模型存储于数据库中。所有相关特征由一个结构化文本表示器来采集,它能够优化简便查找,并重新按照属性查找。文本和数据库代理通常和元数据有关。元数据定义为描述核心创作媒体对象数据的数据,这种媒体对象包含创作者需要传递的实际信息。

多媒体代理是表示如低码率副本、视听摘要和不同媒体类型的组合内容的表示方法。内容的低码率副本可以不用实际接触材料就能预览,因此能在窄带宽的链接上传输,在低配置的设备上输出。视听摘要是视听内容的组合,这些摘要通过显示素材的一部分而提供了素材的纵览,典型代表有关键帧或浏览。视听摘要通常通过自动分析程序自动提取和编译。不同媒体类型的组合可以通过链接文本、图片视频和视听信息提供实际内容的更好的总览。例如,情节串联图板就是包含内容描述信息和片断的关键帧和时码的组合,还有与低分辨率素材副本有关的文字材料等。如果内容对象是连续媒体类型,那么不连续的媒体内容表示部分也有与内容对象时码有关的时间参数。

广义的多媒体代理可以被看做是元数据,它们有附属的特征而且主要对象是优化内容的表述和检索。多媒体代理的文本部分显然是元数据描述内容对象的一部分。可视化摘要也有描述的特性。然而,低码率内容副本则是不带有描述信息的对素材的表示。

4.2 元数据:内容的描述

元数据用来描述内容并在系统和系统组件中表示内容,它要遍布整个媒体制作的工作流程,从预制作到存档。另外,它还要容纳权限不同及对内容不同方面感兴趣的不同用户组。因此,对于内容的描述,有不同的方面和目的。

元数据最初在计划阶段产生,在内容对象的整个生命周期内被使用和不断修正。使用元数据的阶段有:生产、传输、媒体管理和其他开发过程。元数据要捕捉程序计划、生产计划(包括原材料、个人计划和相关贡献的参考),还有计划阶段的编辑准备(绘制、调查、收集和情节串联)。元数据应用的其他程序和用例包括:文档撰写、IPR、许可证、分析数据和位置相关数据(存储管理、位置ID等)。另一组元数据是有关内容的使用和开发的,通常这部分包括传输历史记录、程序交换和程序材料的数据和内容销售的信息(市场信息)。新一类的元数据是有关在互联网上使用的内容的数据,此时的数据记录是有关历史访问记录、负责人员(版主或者编辑者)等方面的。

元数据必须捕获和描述过多的特征和工作流,因此存在处理元数据的不同方案和(子)系统。元数据可以根据它所描述的实体来进行分组,有关于对象和关于片段的元数据。关于对象的元数据包括所有以描述媒体对象的特定特征为主题的元数据,而关于片段的元数据用于描述由于空间或时间界限(如图片边界和时码)所分割的内容对象的一个部分。

4.2.1 关于对象的元数据

关于对象的元数据将内容对象作为一个整体描述。部分关于对象的元数据是内容描述(主题、作者、导演等)、相关组织数据(如项目位置、责任编辑办公室等信息)、内容标识和参加团体(处理内容的个人或组织,及其关系、角色和权利)。另外,关于内容的元数据包括技术元数据和所有商业过程(包括媒体制作的所有工作流步骤)。

关于对象的元数据通常存储在数据库中,有时也存储在结构化文件中,以全文检索引擎建立索引,以便于检索。内容对象的相关文档(如注解和合同)也可以以电子形式存储和建立索引来方便搜索。当文档需要像元数据一样存储于硬盘上时(如文章的法律文件),这些文档的相关资料可以(有时是必须)存储于内容管理系统的数据模型之中。4.2.1.1 工作流和内容描述

为了便于内容管理,内容的特征要被获取为结构化元数据。这可以使用描述对象(实体)本身和对象间链接的提取程序来完成。此时,工作流是要考虑的最主要的处理过程。元数据通过工作流被合成,因此,这些工作流定义了内容生命周期特定点所产生的元数据。然而,元数据的产生和标记是由系统定义的。本节介绍一些一般的与内容管理有关的工作流(如内容获取和解析、制作、存储以及归档)。具体的分析需要根据实际的组织及其系统和工作流才能进行,这需要在处理内容的系统中独立进行。

元数据可能在生成的时候就被处理并联系到一部分素材上。记录的位置(比如通过GPS得到的)、日期、时间等信息在产生记录时就自动与材料相关联了。然而,通常在输入和解析过程中,内容进入系统,元数据与内容对象建立关联。

理想情况下,大多数在这个过程中加入的元数据被自动处理。这些信息有:材料相关参数和自动分析程序检索的数据。这个过程中收集到的元数据被编入元数据集合,这些集合的结构有赖于特定系统的实际数据模型。

在查找阶段收集的典型元数据主要是与材料相关的,包括:

·视频源格式。

·视频压缩格式。

·音频源格式。

·音频压缩格式。

·记录参数(摄像和话筒设置)。

·生产信息。

在上载过程中,加入元数据可以用来标识内容,同时也用来支持快速检索和提供一个初始水平,该信息通常要手动输入系统。上载过程中加入的典型的元数据有:

·生产序号。

·标题。

·日期、时间和位置。

·源名(如机构名称、摄像者等)。

·剪辑描述(画面内容的文本摘要)。

·起始或结束标志(磁带或文件的剪辑)。

·拍摄质量。

不同的系统、部门和用户都参与了制作过程,这表现在其产生、引用和用来检索的元数据中。这些不同的系统有服务器组件(上载、制作和播出服务器)、制作条目的记者和编辑、最终内容条目的编辑、提供材料的归档和编目的归档部门。在所有这些处理过程中,额外的元数据被制作出来,并且与内容对象相关联起来。下面的元数据集即表现了后期制作和非线性编辑的典型的关于对象元数据集的例子:

·文献开始或结束。

·时码。

·副标题。

·授权信息。

·电子VTR卡。

·剪辑者、编辑者和制作人的名字等。

附加元数据可能被制作和搜集在另外的元数据集合中,如编辑集合、传输集合、描述集合等等。这些元数据集合更加明确地指向具体的任务和工作流步骤。

一旦材料被制作好之后就可以被分发播出。在广播系统中,分发播出是根据节目单进行的,并且被记录在播出节目(Program as Broadcast,PasB)中,此时相关数据有:

·首播日期。

·首播时间。

·播出频道。

·统计信息(观众或听众数量)。

·重播信息。

内容条目的生命周期最后一步是分类和深层编目。在这一步中,内容被分类和详细描述,以便查找、访问和复用。在制作过程中,添加的元数据在这一步中被修正和整合。应用的分类方案有赖于媒体类型和具体组织结构。这个过程中添加的典型数据有:

·目录表。

·编目时间。

·题目分类。

·节目关系。

·摘要。

在这一步产生了详细的内容描述,也就是关于片段元数据的一部分。4.2.1.2 关于权利的元数据

知识产权(Intellectual Property Rights,IPR)是关于对象元数据的一种特殊类型,它和内容的开发以及内容管理过程有紧密联系。然而,IPR通常是在内容管理系统之外的独立的版权管理系统中被管理,这是由于内容管理系统还没有覆盖到复杂组织的结构和法律领域。版权管理系统维护着IPR体系、合同信息和其他与内容对象有关的法律文档。版权管理系统管理的信息要和内容管理系统中内容对象的信息联系起来。

IPR描述了特定内容对象的所有权和使用限制。这些权限有可能很复杂,通常需要专业人士的解释。该版权有所有权(作者、作曲者、导演、摄影师等)、演出权(演员、音乐家等)、个人版权和其他很多版权。在使用(重用)作品时要充分考虑版权拥有者的具体权利。因此要妥善保管内容对象的法律文档并及时更新。

除了要考虑所有权、用户限制之外,还要考虑以下版权:

·地域限制(通常指地理限制)。

·传输和传播方法(通过电视、电影、广播和网络)。

·传输和传播时间(先于或后于某一天)。

·使用期限。

·用户(传输者)数量。

不仅要注意内容管理系统中和数据有关的某些基本版权,还应该注意在内容对象中享有其他版权的对象内容。然而,因为组织和法律原因,这些只能是象征性的。内容管理系统的用户要从法律部门得到更多有关版权的信息,以便在能用到内容的情况下保证尊重所有的版权。4.2.1.3 数据模型和元数据

数据模型在内容管理系统中非常重要,它们使得关于对象的元数据在数据库系统中得以结构化的表达。本书不涉及对于数据模型的详细讨论,然而在内容管理系统中了解其基本概念和原理是重要的。

数据模型是带有描述数据和操纵它的一组操作的集合的(数学)形式。数据模型已经发展了数年,有很多结构化表示信息的方法。有实体关系模型、网络模型、层级模型、关系模型和面向对象模型。实体关系模型利用实体关系图和概念化的方案自然地对组织进行描述。此时的实体是可标识的对象,它们之间的关系表现在同一模型中的不同实体间的关联上。网络数据模型和实体关系模型相比其所有关系仅限于二进制编码、多对一的关系。在层级模型中实体之间的关系以层级关系来组织。

关系数据模型是面向“值”的。根据关系来定义操作,其结果是产生关系。在关系模型中,操作可以很容易地组合和串联。关系模型中的数学概念是集合理论关系,是关于域列表的笛卡尔乘积的一个子集。

对象在面向对象的模型中是有特定地址的记录。对象可以编入复杂结构并且被定义类别和层级。类型可以有不同特征的子类型。和关系模型相比,面向对象的模型不易组织,这是因为面向对象的模型使用了抽象数据类型,并且不支持对其他操作结果的进一步操作。

评估了表示内容的数据模型的不同的有利方面和不利方面,Stonebraker提出了建议(图4.2所示的分类)。这个分类用数据复杂度和根据特定任务查询适合的数据模型的相似复杂度作为参考。对于结构简单的数据和简单查询,存储在文件系统中的索引文件被认为是适当的。对于简单查询和复杂数据可以采用面向对象的数据模型。根据这个分类,关系数据模型应用于简单数据结构的复杂查询;而在查询和数据都很复杂时,要应用对象关系数据模型。后者是针对内容的,其结构相对复杂,因为工作流的量很大和需要支持的用例众多,其检索也相对复杂。图4.2 Stonebraker建议的数据模型分类

然而,除了要选择适合的数据模型和相应的数据库系统,还应考虑其他重要条件,例如,现有的数据库可能需要扩展或者要集成到内容管理系统中去。另外还应考虑现有组织中的专家经验,其中最重要的是备选数据模型方案要能够获取所有相关数据和程序。因此,开发内容管理系统的组织应该考虑到全面的特征、用例、工作流和过程,从而获取相关的元素和属性。另外,实体以及过程之间的关系和链接也应考虑在内。完成这些工作之后(考虑所有的相关实体和关系之后)才可以开发适合的数据模型。

内容管理系统具体的数据模型的核心是具有所有相关特性的内容对象、任务、工作流以及表征实体。数据模型要考虑所有相关对象的元数据。内容对象之间的不同关系和可能出现的互操作都表现在数据模型中。另外,具体组织的工作流步骤和不同用户的角色也应该反映在数据模型中。图4.3展示了将元数据用于加强内容创建阶段工作流的例子,它可以用于开发这个方面的数据模型。图4.3 内容创建的不同阶段

4.2.2 关于片段的元数据

除了描述对象的元数据,还有描述片段(传统的由时码控制或者由区域参数控制的片断)的元数据。片断描述的优点在于对内容对象进行深度编目的自由度和灵活性很高,它可以对重大事件的详细描述进行编目。另外,它能够支持对于内容对象具体部分的检索,并且能够定位到具体部分。

片段能够表示内容对象的不同逻辑部分。片段可以是根据空间的或者是根据时间的,前者是指内容对象的具体区域或者(如MPEG-4中一样)内容对象的某个具体对象;后者则指时间片段由对象ID和开始以及结束时码(或者开始时码和片段时间长度)为标识。媒体对象的时码以时间线为参考。图4.4表示了应用时间线的时间片段。图4.4 应用时间线的连续媒体对象时间片断

时间线可以是片段相关的逻辑构造。素材的物理时间线要联系到文档程序逻辑时间线上。标识任何副本上的具体片段的能力要独立于素材的存储格式以及内容的集成和组合之外。

利用时码进行内容的逻辑分解通常在日志页面进行,它给出了内容条目的图像描述。时码用来定位内容对象时间线上的特定事件。它以自由文本方式或者分类文档和词典方式来详细描述。

添加面向时间注解的有效概念是分层结构。分层结构以在界定整个媒体对象的各个部分分段处添加锚点的方式,来利用媒体对象的时间、空间本质特征,锚点处可以链接到详细的描述。例如,时间层结构应用时间参数(和各自的时间线有关)来指向音频或者视频对象的某个具体部分。然而,和传统的日志记录相反的是每个层可以有具体的主题和描述主旨。单个的描述可以集中在特定概念上,如图像描述、关键字、相似标题文本、出场人物等。每个层都可以根据与层的片段相关的时码来独立分段,这些片断不需要和媒体对象的其他片段或结构(如拍摄结构)相互关联。利用自动分析和特征提取工具,自动检索到的信息可以关联到以时码作为层限定的特定的层,这样就补充了以手动进行的文档编目。因此,利用文档分层法,专家们可以和自动生成的文档联合操作。

在连续媒体中,片段描述和与时间无关的文本信息以及与时间有关的视听信息相联系。一些多媒体内容管理系统联合应用视听信息和文本信息在情节串联图板中产生基于片段的文档。此时,关键帧、层的描述和时码联合产生图像内容的纵览,同时也连接到预览视频的一个副本。这种技术综合了不同媒体类型生成媒体对象的真正多媒体描述。

图4.5给出了层结构文档的例子。如关键字、相似标题文本、版权和图像内容描述等元数据,在不同层级被描述,每一层级有完全不同的时间线,只需保证有共同的参考点(即开始点)即可。图4.5 层结构片段文档

在检索过程中,联合的层有时要准确地标识出用户感兴趣的片段。例如,当要查找在特定地点某人在另外一个人在场时所做的发言,用户则可以查找“在场人”的层中参与者的姓名,查找“相关主题”层中引用的原文,查找“地点”层中具体的位置。联合输出的结果将准确指向需要的片段。

同样的方法可以应用于空间层结构。此时图像被分为不同的部分,然后单独描述,这些部分可以是对象或者只是媒体对象的某个区域。

编目和检索上的花费在很大程度上有赖于具体组织中对内容文档采取的策略。如果在文档组织上付出的努力能够让用户更快地找到需要的内容条目或者片段(或者查找全部),那么就可以提高文档的重用性。

4.2.3 逻辑内容结构和内容层级

内容对象通常和其他对象以及其他层级的部分有联系,如节目集和节目系列。所以除了表示具体内容对象的元数据以外,这种结构和层级也要反映在内容管理系统中。可以定义以下的层级结构:

·镜头(如传输中的帧序列)。

·节目条目(组成大单元的单个实体,如新闻故事、采访、演出等)。

·节目(由逻辑相关的节目条目组成的节目块,构成相同传输或节目时间表实体)。

·节目集(相同生产的节目组,如电视剧)。

镜头由片段描述,节目条目由相关对象的元数据充分描述,然而节目和节目集需要单独考虑。描述节目的一种方法是利用相关条目的链接和相互关系。但是这样还不够充分,因为有关内容收集的元数据并没有在层级中表示出单个条目的特征,因此在很多情况下节目要以它们自己的方式表示成对象。

层级中不同对象的关系可以用层级树和关系图来表示。图4.6的层级树用于表示节目条目和节目的层级关系。关系图用来表示更松散的关系,如关于某个事件或者主题的新闻故事组。从图中可以看到,根据不同的内容结构和组织,对象层级可以有多于两到三层。图4.6 层级树

开发这些层级关系可以定位检索到层级的具体某一级。例如,如果用户要检索整个节目,但是起始的检索结果是关于节目条目的,那么可以利用层级关系来找到所需结果的对象或者片段。

4.2.4 对象引用

对象引用在内容管理系统中有重要地位,因为它们明确标识了内容对象。它们是元数据的一部分,但是将元数据与素材联系起来。除了将内容对象作为一个实体进行标识以外,它们也能够引用到不同的内容组件(如素材对象),将内容对象的不同表示链接起来。另外,它们还可以用于链接相关的内容对象。为了实现内容交换,这些引用要基于特定的标识。它们至少应该在组织中能被单独标识,在组织间也应该能够单独标识。此时就需要全局的、唯一或者注册的标识符。

区别系统内部标识符(如数据库密码)和内容对象的标识符是很重要的。前者只能标识具体系统中的对象,这在内容管理情况下是不够的,因为同一个内容对象在不同系统中会有不同的表示,每个系统注重于不同方面(如财务、知识产权、节目信息等)。由于对象引用表示对象不仅仅是一个具体的实例化,因此它们有更加广泛的应用。

除了特别标识内容对象之外,标识符可以包含关于内容对象来源的附加信息,其所有权、起始信息、注册团体等将被编码在标识符中,并有各种方案可供选择,以下列出一些:

·对象特性标识符,是本地组织内部的特性唯一标识引用。对象特性标识符的概念也可以用于简化遗留系统到内容管理系统的集成。这些标识符不能在定义范围以外通信和使用。

·唯一资料标识符(Unique Material Identifier,UMID),是为了标识素材条目而提出的。UMID由SMPTE定义标准化,其格式允许纯粹基于本地信息自动生成全局唯一标识符。即在该领域记录时就生成UMID。标识的粒度(同一UMID标识了多少视频帧和音频抽样)一方面有赖于预期使用,另一方面有赖于媒体存储元数据的能力。UMID也标识素材条目和节目条目以及相关素材之间的关系。

·唯一节目标识符(Unique Program Identifier,UPID),是为了传统的节目条目和相关版权的声明而提出的。UPID有法律意义,因此最好选择正式的、注册的标识符。例如,在国际标准视听数字注册机构注册的国际标准视听数字(International Standard Audiovisual Number,ISAN),就长时间拥有唯一标识符。在该过程中附加信息集合(如有关注册组织的)也被注册机构记录下来。

其他的参考程序是处理具体方面的问题的,特别是有关时间的,这对注册时间、创作、生产和传输事件是很重要的。例如,和时间相关的参考有:

·时间参考,是一般的结构化时间戳,它用来表示内容对象和真实世界或者媒体流的协调时间之间的关系。

·真实世界时间表述,是需要同步元数据和基于实时事件的素材条目所必需的。例如,当一些素材版本被单独获取的时候,它们能够通过和初始信息相关的获取时间日志而进行同步。因此,特别版本的索引可以利用真实世界时间表示,自动传播到其他所有版本。适合表征真实世界时间的格式,有关于参考时间或者地理时间的时间单元计数的格式或者是日期时间格式。前者通常由计算机操作系统实现,因为其支持时间跨度的简单计算;后者是人们可以阅读的时间和日期格式。

·媒体流时间,是以开始时间(第一帧)为参考点的具体内容对象为参考的相关时间。在得出的时间线中,事件可以以图示形式给出,例如关于时间的内容逻辑描述、时间片段或者组成元数据。如果UMID没有联系到帧,那么媒体流时间在条目中标识剪辑(如为了片段文档)的作用是很重要的。媒体流时间可以被表示为标准SMPTE时码或者帧单元或者样本单元的位移和持续时间。由于时间计算的基础和设备的内部时钟有关,所以,以上两种都不是真正有效时间的表示。这里还没有考虑设备的偏差。如果素材版本没有在有效时间控制下生成,那么描绘同一节目的不同素材版本的时间线是复杂的问题。例如,如果一个素材版本在播出中被记录,它的延续时间有可能和来源节目的时间不同,因为会有商业插入时间和淡入淡出时间等等。

有很多其他的对象引用内容对象的内部标识符。在内容管理系统中很重要的还有媒体定位器,它用来标识给定的条目(素材或者元数据)的位置。在基于IT的系统中,它们可以根据W3C的定义表示为统一资源定位符(Uniform Resource Locators,URL)。当引用到传统媒体时,物理地址必须根据统一语义赋予。在诸如内容管理系统这样的复杂系统中,推荐执行适宜的定位服务,这些服务应能跟踪内容对象从一个地址到另一个地址的移动。

4.3 获取和交换元数据

元数据的作用是使得内容可访问、易于查找和可以交换。尽管在某些情况下,元数据包含的很多信息可以独立存在,但总的来说,它是用来支持交互功能和实际媒体或者素材的处理过程的。因此,元数据的综合查找、检索和交换对内容管理系统中的交互作用很重要。

4.3.1 元数据的检索和查询

内容管理系统要提供特别的查找功能,以便能够获取与内容管理系统进行互操作的不同数据库和信息系统的信息。大多数用户不能熟练使用数据库也不熟悉数据模型或者内容在数据库中的表达。另一方面,对于专业用户,如存储人员和媒介管理者,他们使用原始的数据库查询能最快得到结果。因此,系统应提供不同的查询元数据的方法。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载