基于XML电子商务标准应用指南(txt+pdf+epub+mobi电子书下载)


发布时间:2020-09-08 22:56:56

点击下载

作者:胡涵景,张荫芬,李小林

出版社:电子工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

基于XML电子商务标准应用指南

基于XML电子商务标准应用指南试读:

前言

电子商务是经济全球化和贸易自由化的重要手段,也是传统产业变革和企业实现技术跨越的关键推动力,已成为各国政府为增强国家竞争力、赢得市场资源配置优势而大力推进的战略性任务。电子商务不是一个单纯的技术问题,而是一个跨国界、跨地区、跨行业、跨学科、跨领域的系统工程。标准化在其间起着协调和统一有关技术问题,更新经营观念,确立市场运营的技术规则,连接电子商务的各个环节,确保其协同工作,使之有序、高效、快速、健康发展的作用。

为迎接电子商务给全球经济带来的机遇和挑战,使其在全球范围内有序地发展,并实现网络间的无缝连接和互操作性,世界主要国家和有关国际组织都非常重视电子商务标准化工作。联合国贸易便利化与电子业务中心(UN/CEFACT)从20世纪初开始为基于XML的电子商务标准化推出了4套标准和5套技术规范,保证了全球基于XML电子商务活动的规范化和标准化。

我国对电子商务标准化的原则是与国际标准接轨。为此,作者将多年跟踪和研究国际标准的经验和成果整理加工后推荐给读者和用户,使他们了解和掌握基于XML电子商务活动标准化的原理以及标准的使用方法。

本书是目前国内第一部全面和准确描述基于XML电子商务活动标准化理论的书籍,内容涉及200多项标准,它不仅可以作为从事国际贸易电子商务工作者的参考书和手册,也可以作为各大专院校和各商务培训机构的教材。

本书由质检公益性行业科研专项“检验检疫业务需求分析方法论及应用技术研究”(201310041)资助出版。

由于作者水平有限,书中错误在所难免,敬请读者和用户指正。作者2014年10月于北京

第1章 基于XML电子商务标准化基础知识

1.1 基于XML电子商务标准化的基本概念

随着科学技术的飞速发展,世界经济日新月异。尤其是20世纪90年代以后,在信息技术革命浪潮的猛烈冲击下,使人类社会的所有领域都发生了改变。在这期间世界经济正逐渐向全球化方向发展,国际贸易也空前活跃,市场竞争愈演愈烈。

正是在这样的背景下,以计算机技术、网络技术和信息技术为基础的电子商务应运而生。电子商务是经济全球化和贸易自由化的重要手段,也是传统产业变革和企业实现技术跨越的关键推动力,已成为各国政府为增强国家竞争力、赢得市场资源配置优势而大力推进的战略性任务。电子商务不是一个单纯的技术问题,而是一个跨国界、跨地区、跨行业、跨学科、跨领域的系统工程。标准化在其中起着协调和统一有关技术问题,更新经营观念,确立市场运营的技术规则,连接电子商务的各个环节,确保其协同工作,使之有序、高效、快速、健康发展的作用。

为迎接电子商务给全球经济带来的机遇和挑战,使得它在全球范围内有序地发展,并实现网络间的无缝连接和互操作性,世界主要国家和有关国际组织都非常重视电子商务标准化工作,纷纷采取措施,保障和促进本国的电子商务有效、快速和健康的发展。

联合国贸易便利化与电子业务中心(UN/CEFACT)是一个专门从事研究、制定、发布和推广国际贸易便利化与标准化的机构,其目标是为来自发达国家、发展中国家和经济转型国家提高其商业、贸易和行政机构的产品交易及相关业务的实际操作能力;其重点在于通过简化和协调流程、手续和信息流,促进国家和国际的贸易,并就此为商业和贸易的整体发展做出贡献;其主要任务就是制定全球统一的标准来消除国际贸易中的技术壁垒,提高效率。

为了解决技术壁垒问题,节省国际贸易的成本,提高效率,UN/CEFACT从20世纪80年代开始就负责专门从事研究和制定国际贸易单证,以及电子商务的国际标准和措施,并在联合国框架内发布和推广这些标准和措施。到目前为止UN/CEFACT共发布了35个建议书、7套标准和5套技术规范,形成了一套全球统一的贸易便利化措施和单证标准化理论。

电子商务包括两大类:一类是电子数据交换(EDI),另一类是基于XML的电子商务。联合国贸易便利化与电子业务中心(UN/CEFACT)将EDI定义为在增值网上一种电子数据传输方法,用这种方法,首先将商业或行政事务处理中的报文数据按照一个公认的标准形成结构化的事务处理的报文数据,然后将这些结构化的数据经由网络,从一个计算机传输到另一个计算机。UN/CEFACT将基于XML的电子商务定义为在互联网上一种电子数据传输方法,用这种方法,首先将商业或行政事务处理中的报文数据按照一个公认的标准形成结构化的事务处理的报文数据,然后将这些结构化的数据经由互联网,从一个计算机传输到另一个计算机。

通过上述定义不难发现EDI是通过增值网来实现的,基于XML的电子商务是通过互联网来实现的。由于采用EDI方式进行电子数据交换,大大提高了数据交换的速度、效率、数据的安全性,节省了大量的人力、物力、财力和时间,因此被世界各国广泛接受和采用。但是由于EDI成本相对较高,程序和标准相对较复杂,这使得许多中小企业望而却步。随着互联网技术的发展和成熟,使得满足中小企业涉足国际贸易需求的愿望成为可能。在这个大的背景下产生了基于互联网的电子商务。

UN/CEFACT成立于1960年,它是联合国下属的标准化机构,最初的名称为联合国欧经会国际贸易单证简化与标准化工作组,1972年更名为联合国欧经会国际贸易便利化工作组,1996年正式更名为联合国欧经会贸易便利化与电子业务中心(UN/CEFACT)。之所以加上电子业务,正是考虑到国际贸易越来越依靠电子手段来进行各种操作,实现数据交换。UN/CEFACT把所有通过电子手段完成的操作称作信息通信技术(ICT)。UN/CEFACT又将电子商务标准分成两大类:第一大类是电子数据交换(EDI)标准,第二大类是基于XML的电子商务标准。基于电子数据交换(EDI)标准已经在国际贸易标准化系列丛书《国际贸易电子数据交换(EDI)标准应用指南》中描述,本书仅描述基于XML的电子商务标准化。

由于基于XML的电子商务是在互联网上进行,为此,必须为它的运行建立一套规则,即标准。这些标准包括基于XML的电子商务的网络标准、处理标准、数据标准和语义语法标准等。构成电子商务应用系统有三个基本要素,即互联网、计算机应用系统,以及基于XML的电子商务标准。本书仅讨论基于XML的电子商务标准,而不讨论互联网和计算机应用系统。

为什么UN/CEFACT把XML定为互联网上电子商务的专用语言呢?可扩展置标语言XML是由互联网联合组织(W3C)于1998年2月发布的一种标准,它同超文本置标语言HTML一样是标准通用置标语言SGML的一个简化子集。由于它将SGML的丰富功能与HTML的易用性结合到了Web的应用中,因此自它推出以来,迅速得到软件开发商的支持和程序开发人员的喜爱,显示出强大的生命力。由于XML较好地解决了HTML无法表达数据内容等问题,使它在政府、金融、证券、邮电、保险、税务、司法、出版,以及国际贸易等方面得到了广泛的应用。XML有以下主要特征。(1)良好的可扩展性。XML允许各个不同的行业根据自己独特的需要制定自己的一套标记,同时,它并不要求所有浏览器都能处理这成千上万个标记,同样也不要求一个置标语言能够适合各个行业各个领域的应用,这种具体问题具体分析的方法更有助于置标语言的发展。(2)内容与形式的分离。正如前面所说,XML中信息的显示方式已经从信息本身中抽取出来,放在了“样式单”中。这样做便于信息表现方式的修改,便于数据的搜索,也使得XML具有良好的自描述性,能够描述信息本身的含义甚至它们之间的关系。(3)遵循严格的语法要求。XML不但要求标记配对、嵌套,而且还要求严格遵守DTD的规定。这样就增加了网页文档的可读性和可维护性,也大大减轻了浏览器开发人员的负担,提高了浏览器的时间空间效率。(4)便于不同系统之间信息的传输。不同企业、不同部门中往往存在着许多不同的系统,XML可以用作各种不同系统之间的交流媒介,是一种非常理想的网际语言。(5)具有较好的保值性。XML的保值性来自它的先驱之一——SGML语言,可以为文档提供50年以上的寿命。正是基于这些优点,国际标准化组织(ISO)和万维网联盟(W3C)推荐XML作为第二代网页发布语言。

正是由于XML具有上述优秀特点,使得UN/CEFACT把XML定为互联网上电子商务的专用语言,同时将标准化的重点全部放在了它上面。

为适应互联网技术对于电子商务的挑战,UN/CEFACT于1998年开始旨在建立XML的国际贸易电子商务标准技术体系和应用体系。从20世纪90年代末至今,UN/CEFACT分别为国际贸易电子商务标准化发布了2个建议书、4套标准和5套技术规范,如下所述。● UN/CEFACT建议书31号——电子商务协议;● UN/CEFACT建议书32号——电子商务自律办法;● 标准——UN/CEFACT业务需求规范;● 标准——UN/CEFACT需求规范映射;● 标准——UN/CEFACT核心构件库;● 标准——UN/CEFACT XML Schema;● 技术规范——UN/CEFACT建模方法技术规范;● 技术规范——UN/CEFACT核心构件技术规范;● 技术规范——UN/CEFACTXML命名和设计规则技术规范;● 技术规范——UN/CEFACT核心构件的UML轮廓技术规范;● 技术规范——UN/CEFACT核心构件数据类型目录技术规范。

上述专门针对基于XML电子商务的2项建议书、4套标准和5套技术规范的知识产权属于UN/CEFACT,并由UN/CEFACT进行维护与更新。就像在EDI中的UN/EDIFACT标准,知识产权属于UN/CEFACT,并由UN/CEFACT进行维护与更新。因此,在标准和技术规范之前均加上了UN/CEFACT。

国际电子商务主要始于90年代。从90年代起,许多国家,尤其是发达国家和地区纷纷提出了电子商务框架,制定了相关的政策、法规和发展战略,并强调了标准的重要性。经济合作和发展组织(OECD)、亚太经合组织(APEC)、世界知识产权组织(WIPO)、联合国相关组织等都先后成立了专门的工作组,提出了一些报告,制定了相关的政策法规,旨在从政策、技术、标准等多角度推动电子商务的应用和发展。国际标准化组织/国际电工委员会(ISO/IEC)、国际电信联盟(ITU)、联合国贸易便利与电子业务中心(UN/CEFACT)、国际WEB联盟(W3C)、Internet工程任务组(IETF)等,也纷纷从不同的角度开展电子商务标准化工作,其中ISO/IEC、ITU、UN/CEFACT还共同签署了电子商务谅解备忘录(MoU),确立包括业务交易数据、业务交易剧本、电子票据格式、支撑技术为主要内容的电子商务标准化范围,明确各自主管的标准化领域、工作分工与协作流程,以强化协调、避免重复,确保电子商务标准在跨行业应用中的一致性。

为适应互联网技术、尤其是XML对基于EDI的电子商务的挑战,一方面,UN/CEFACT于1998年与国际结构化数据标准组织(OASIS)一道共同发起了旨在建立基于XML的电子商务标准技术体制的ebXML活动,产出了一系列电子商务技术规范,得到了ISO、IEC、W3C等组织和IT巨头的广泛支持;另一方面,为增大电子商务标准化成果的可重用性,使之不受各种潜在的诸如XML等新技术的影响,UN/CEFACT正积极考虑新型的标准化方法,以使诸如UN/EDIFACT的成果由依赖于语法向独立于语法的中性标准过渡。ISO/TC154还提出了基于EDIFACT的报文标准向基于XML的报文标准迁移与融合的标准化方法。一些国际性标准论坛和联盟如OBI论坛、OTP论坛、Rosettanet都先后分别提出了OBI、OTP、xCBL、Rosettanet等一系列电子商务基础性或行业性标准。

从2005年开始UN/CEFACT以自己的专业技术人员为主开发了一整套以UN/CEFACT命名的具有独立知识产权的标准和技术规范。上述的4套标准和5套技术规范都是以UN/CEFACT命名的,本教程将以UN/CEFACT的这套理论为主线。

综观国际电子商务标准化现状和发展趋势,可以概括地说:从技术体制上看,电子商务标准分为基于EDI和基于XML两种形式;从当前工作重点上看,基于XML电子商务标准主要解决数据共享、业务协同、安全保密三大问题,即着重于以互联网为主要通信设施,以XML为信息描述语言,以业务交易数据语义、电子文档格式、业务过程、消息服务等为核心内容,并面向特定电子商务模式的综合性标准化解决方案的研制方面。

1.2 基于XML的电子商务标准化术语

在基于XML的电子商务标准中要遇到非常多的专业名词术语,为了便于读者和用户的学习,在这里先来熟悉一下这些专业名词术语。下面给出的术语和定义均是来自UN/CEFACT研制和发布的基于XML电子商务标准。(1)聚合业务信息实体(Aggregate Business Information Entity,ABIE)。由相互关联的若干条业务信息组成的集合,它表达了特定语境中清晰的业务含义。当采用建模语言来表述时,它表达了特定业务语境中的一个对象类。(2)聚合业务信息实体特性(Aggregate Business Information Entity Property)。一种允许值用复杂结构表达的业务信息实体特性,该复杂结构可以用一个聚合业务信息实体描述。(3)聚合核心构件(Aggregate Core Component,ACC)。由相互关联的若干条业务信息组成的集合,它表达了清晰的业务含义,独立于任何特定业务语境。当用建模术语来表达时,它表示一个独立于任何特定业务语境的对象类。(4)聚合核心构件特性(Aggregate Core Component Property)。必须与聚合核心构件概念相关联的聚合核心构件的唯一特性,该特性或是一个关联核心构件,或是一个基本核心构件。(5)聚合(Aggregation)。关联关系的一种特殊形式,该关联规定了整体与构件之间的整体与局部关系。(6)人工信息(Artefact)。在过程中产生、修改和使用的一条信息,它可以是一个模型、一个模型元素或者一个文档,该文档可能包含其他文档。核心构件技术规范的人工信息包含所有注册类和注册类的所有从属的已命名结构。(7)已关联的聚合业务信息实体(Associated Aggregate Business Information Entity)。一个聚合业务信息实体,该实体与关联聚合业务信息实体之间具有的UML聚合类型要么是共享关系,要么是复合关系。已关联的聚合业务信息实体在聚合业务信息实体之间的父子关系中是子。(8)已关联的聚合核心构件(Associated Aggregate Core Component)。一个聚合核心构件,该构件与关联聚合核心构件之间具有的UML聚合类型为共享关系。已关联的聚合核心构件在聚合核心构件之间的父子关系中是子。(9)关联聚合业务信息实体(Associating Aggregate Business Information Entity)。一个聚合业务信息实体,该实体与已关联的聚合业务信息实体之间所具有的UML聚合类型要么是共享关系,要么是复合关系。关联聚合业务信息实体在聚合业务信息实体之间的父子关系中是父。(10)关联聚合核心构件(Associating Aggregate Core Component)。一个聚合核心构件,该构件与已关联的聚合核心构件具有的UML聚合类型为共享关系。关联聚合核心构件在聚合核心构件之间的父子关系中是父。(11)关联业务信息实体(Association Business Information Entity,ASBIE)。一个业务信息实体,该实体定义了一个特定的、与另一个聚合业务信息实体(称为关联聚合业务信息实体)相关联的聚合业务信息实体(称为已关联的聚合业务信息实体)的角色。关联业务信息实体在功能上作为一个关联聚合业务信息实体的聚合业务信息实体特性。(12)关联业务信息实体特性(Association Business Information Entity Property)。一个业务信息实体特性,其允许值可由一个聚合业务信息实体表示为一个复杂结构。(13)关联核心构件(Association Core Component,ASCC)。一个核心构件,该构件定义了一个特定的、与另一个聚合核心构件(称为关联聚合核心构件)相关联的聚合核心构件(称为已关联的聚合核心构件)的角色。关联核心构件在功能上作为一个关联聚合核心构件的聚合核心构件特性。(14)关联核心构件特性(Association Core Component Property)。一个核心构件特性,其允许值可由一个聚合核心构件表示为一个复杂结构。(15)属性(Attribute)。某个实体的部分或所有实例具备的已命名的值或关系,并与实例有直接的关联。(16)基于(Based On)。根据一个特定业务语境的需求对人工信息的使用进行限制。(17)基本业务信息实体(Basic Business Information Entity,BBIE)。一个业务信息实体,表示给定的业务语境中特定聚合业务信息实体的单一业务特性。基本业务信息实体基于基本核心构件,具有基本业务信息实体特性,该特性基于定义其值域的业务数据类型。(18)基本业务信息实体特性(Basic Business Information Entity Property)。一个业务信息实体特性,其允许值可由简单值来表达,该值可由一个数据类型表示。(19)基本核心构件(Basic Core Component,BCC)。一个核心构件,构成特定聚合核心构件的单个业务特性,并具有唯一的业务语义定义。基本核心构件表示基本核心构件的特性,因而具有定义其值域的核心数据类型,在功能上作为聚合核心构件特性。(20)基本核心构件特性(Basic Core Component(CC)Property)。一个核心构件特性,其允许值可由简单值来表达,该值可由一个数据类型表示。(21)基础(Basis)。核心构件人工信息或核心数据类型,业务信息实体人工信息或业务数据类型人工信息可由此衍生。(22)业务语境(Business Context)。用一组语境类别的值来标识的特定业务环境的形式化描述,允许对不同业务环境进行唯一区分。(23)业务数据类型(Business Data Type)。包含且仅包含一个业务数据类型内容构件,该内容构件携带实际内容,以及零或多个业务数据类型附加构件,该附加构件对业务数据类型内容构件给出了必要的附加定义,业务数据类型具有业务语义。(24)业务数据类型内容构件(Business Data Type Content Component)。定义了用于表达核心数据类型内容的原始类型。(25)业务数据类型内容构件限制(Business Data Type Content Component Restriction)。一种格式限制,适用于核心数据类型内容构件的可能值。(26)业务数据类型附加构件(Business Data Type Supplementary Component)。为业务数据类型内容构件给定附加意义。(27)业务数据类型附加构件限制(Business Data Type Supplementary Component Restrictions)。定义了一个格式限制,适用于业务数据类型附加构件的可能值。(28)业务领域(Business Domain)。一组独特的盈利企业,如化工领域、石油和天然气领域、汽车领域。(29)业务信息实体(Business Information Entity,BIE)。核心构件在特定语境下的具体实现,构成具有唯一业务语境定义的一条或一组业务数据。(30)业务信息实体特性(Business Information Entity Property)。特定业务语境中的对象类所具有的业务特性,该对象类由一个聚合业务信息实体描述。(31)业务库(Business Libraries)。特指某一行业(如运输、保险)经核准的过程模型的集合。(32)业务过程(Business Process)。UN/CEFACT通用业务过程目录中描述的业务过程。(33)业务过程语境(Business Process Context)。UN/CEFACT通用业务过程目录中描述的业务过程的名称,用户可对通用业务过程进行扩展。(34)业务过程角色语境(Business Process Role Context)。开展特定业务过程的角色,已在UN/CEFACT通用业务过程目录中标识。(35)业务语义(Business Semantics)。从业务视角所看到的词的精确含义。(36)业务术语(Business Term)。在业务中常见或常用的人工信息的字典条目名称的同义词。一个核心构件技术规范人工信息可以有若干个业务术语。(37)基数(Cardinality)。指明某个特性最少及最多出现次数:不适用(0..0)、可选型(0..1)、可选型重复(0..*)、必备型(1..1)、必备型重复(1..*)、固定(n..n),这里的n是一个非零正整数。(38)业务信息实体目录(Catalogue of Business Information Entities)。在核心构件挖掘过程中挑选出的、且经核准的业务信息实体的集合。(39)分类方案(Classification Scheme)。用来描述一个给定语境类别的正式支持方案。(40)组合(Composition)。一种强聚合关联形式,要求组成部分仅属于单个父对象,并且仅当该父对象存在时才存在。(41)语境(Context)。定义可能使用业务过程的环境,通过一组名为业务语境的语境类别来规定。(42)语境类别(Context Category)。用于表达业务环境特性的一个或多个相关值构成的集合。(43)受控词(Controlled Vocabulary)。用来唯一定义容易引起歧义的词或业务术语的附加词。它可以保证任何核心构件名称和定义中包含的每一个词均被一致、无歧义和准确地使用。(44)核心构件(Core Component,CC)。用来创建清晰、有意义的数据模型、词汇和信息交换包的语义构件,作为创建业务信息实体的基础。(45)核心构件库(Core Component Library)。注册系统或存储库的一部分,核心构件应以注册类的方式存储于其中,核心构件库应包括所有的注册类。(46)核心构件特性(Core Component Property)。对象类的业务特性,该对象类用基本核心构件或关联核心构件特性表示。(47)核心数据类型(Core Data Type,CDT)。包含且仅包含一个核心数据类型内容构件,该内容构件携带实际内容,以及零或多个核心数据类型附加构件,该附加构件对核心数据类型内容构件给出了必要的附加定义。核心数据类型不具有业务语义。(48)核心数据类型内容构件(Core Data Type Content Component)。定义用于表达核心数据类型内容的原始类型。(49)核心数据类型附加构件(Core Data Type Supplementary Component)。对核心数据类型内容构件给出附加含义。(50)数据类型术语(Data Type Term)。表示值域的数据类型字典条目名称的构件名称,从一个通用列表中选取,该通用列表也用于确定所允许的表示词。在这里,表示词就像它们表示数据类型那样不做限定,数据类型术语可以被限定用于反映对值域的限制。(51)定义(Definition)。核心构件、业务信息实体、业务语境或数据类型的唯一语义含义。(52)字典(Dictionary)。核心构件技术规范构件的字典条目名称。(53)字典条目名称(Dictionary Entry Name)。核心构件技术规范构件的正式名称。(54)限制(Facet)。表示业务数据类型内容构件或业务数据类型附加构件的限制,以此来定义其允许值空间。(55)正式限制语言(Formal Constraint Language)。公认的限制语言规范的规范性表达,如统一建模语言对象限制语言。(56)地理政治语境(Geopolitical Context)。影响业务语义的地理因素,如地址的结构。(57)行业分类语境(Industry Classification Context)。与行业或贸易伙伴行业相关的语义影响因素,如不同行业使用的产品标识方案。(58)不变量(Invariant)。限定其值必须在执行过程中始终保持为真。(59)库(Library)。核心构件技术规范构件的集合,针对一个明确目标、一个或多个组织。(60)消息组合(Message Assembly)。为了交换业务信息,业务信息实体被组合成可用的、基于语法的消息的过程。(61)命名约定(Naming Convention)。如何构成核心构件技术规范人工信息字典条目名称的一套规则。(62)对象类(Object Class)。在逻辑数据模型中,一个数据元所属的逻辑数据组。它是表示活动或对象的核心构件或业务信息实体字典条目名称的一部分,由对象类术语表示。对象类具有明确边界和意义,其特性和行为遵守相同的规则。(63)对象类词(Object Class Term)。核心构件或业务信息实体名称的组成部分,并表示了它所属的对象类。(64)官方限制语境(Official Constraints Context)。关于语义的法律和政府影响因素,如运输货物时法律要求的危险品信息。(65)包(Package)。在给定的语境下,语义唯一的业务信息实体集合。(66)前置条件(Pre-Condition)。过程执行前必须满足的条件。(67)后置条件(Post-Condition)。过程执行后必须满足的条件。(68)基本类型(Primitive Type)。也称为基础类型或内置类型,是用于表达更复杂数据类型的值的基本构件。(69)产品分类语境(Product Classification Context)。影响表述物品或服务进行交换、处理或支付等语义的因素,如购买咨询服务不同于购买物资。(70)特性词(Property Term)。表示对象类特性的一种有语义含义的名称,自然地出现在其所属的人工信息的定义中。(71)已限定的业务数据类型(Qualified Business Data Type)。包含对业务数据类型内容构件或业务数据类型附加构件的限制。(72)限定词(Qualifier Term)。一个或一组词,有助于定义一个项(如业务信息实体或业务数据类型),并将其与相关项(如核心构件、核心数据类型、另一个业务信息实体或业务数据类型)区分开来。(73)注册系统(Registry)。管理和参考存储在一个存储库中的人工信息的信息系统。该术语隐含注册系统或存储库的组合。(74)注册类(Registry Class)。所有通用信息的正式定义。通用信息必须由注册系统人工信息(核心构件,业务信息实体或数据类型)记录在注册系统中。(75)存储库(Repository)。存储人工信息的信息系统。(76)表示词(Representation Term)。基本核心构件或基本业务信息实体有效值类型的语义表示。(77)限制(Restriction)。根据下列规则,从现有数据结构衍生出新的数据结构的过程。● 从现有数据结构的任一字段减小基数范围;● 用一个简单数据类型(如字符串、数字)来限制任一字段允许值

的范围;● 增加一个语义限制来缩小任一字段的业务范围。

新的、已限制的数据结构的所有有效实例必须也是现有数据结构的有效实例,新的数据结构可从现有的数据结构衍生出来。(78)支撑角色语境(Supporting Role Context)。与非贸易伙伴角色相关的语义影响因素,如从卖方到买方的订单回复中,第三方托运人所要求的数据。(79)系统能力语境(System Capabilities Context)。捕捉系统限制的语境,如现有后勤部门仅支持特定格式的地址。(80)UMM信息实体(UMM Information Entity)。联合国贸易便利化与电子业务中心建模方法信息实体,该实体实现了结构化业务信息,并通过伙伴角色在业务交易中的活动进行交换。信息实体通过关联包含或参考其他信息实体。(81)唯一标识符(Unique Identifier)。以唯一、明确的方式引用一个人工信息实例的标识符。(82)使用规则(Usage Rules)。描述了一个限制,该限制描述了适用于模型中构件的特定条件。(83)用户群(User Community)。一组具有公开联系地址、可以定义与其业务领域相关的语境梗概的实践人员。用户群内的用户不能创建、定义或管理其自身的语境需求,而应遵循用户群的标准。为了避免工作交叉,这样的用户群应与其他用户群和标准制定组织保持紧密联系。用户群的规模可以小到只有两个协定组织。(84)值域(Value Domain)。一组允许值的集合。(85)版本(Version)。核心构件、数据类型、业务语境或业务信息实体的实例随时间不断演进的一种标记。(86)XML模式(XML Schema)。用于标识基于XML文档结构有效语言(包括更正式的W3C XML模式定义语言,ISO 8601文档类型定义或Schematron)的语法族的通用术语。

1.3 电子商务标准化与贸易便利化的关系

贸易便利化是在20世纪90年代作为国际贸易与各国经济发展的重要因素被提出的。由于它对贸易的竞争力和市场一体化所产生的重要影响,以及在吸引国外直接投资方面的重要性,在过去十多年间受到了各国政府和国际社会的广泛关注。世界贸易组织(WTO)已经将它作为新一轮多边贸易谈判的4大议题之一。

在实施贸易便利化的过程中,无论是政府机构还是企业都能够从中获得巨大的利益。贸易便利化会使政府机构通过增加贸易税征收、改善资源利用和强化贸易商守法水平等方面得益。同时,政府办事机构将会更加高效和透明,使行政管理保持较高的安全等级和有效的政府监管水平,同时还可以避免腐败的发生。贸易便利化会使贸易商提高办理效率、降低交易成本,从而提高全球市场的竞争力。世界银行最近的一项关于促进增效的研究发现,为促进贸易便利化花费1美元就会通过出口为各受益方转化成70美元。

贸易便利化是一项复杂的系统工程,它涉及贸易的各个领域和环节,包括贸易的国际公约、法律、法规、标准和惯例。UN/CEFACT将它定义为:国际贸易便利化就是使办理国际贸易事务的手续、程序、单证和操作实现简化、协调和标准化,使国际贸易业务办理比以前更为简便、快捷和节省成本。标准化、简化、协调是贸易便利化的核心。图1-1给出了简化、协调和标准化之间的逻辑关系。图1-1 简化、协调和标准化之间的逻辑关系

简化就是消除贸易手续、处理和程序中的所有多余部分和重复。简化的典型事例有:基于联合国单证格式、国际商会海运提单及欧盟统一管理单证之类的预定格式将数份经营管理单证合并为一份。

协调就是对本国规程、操作和单证按照国际公约、标准和管理所进行的调整。协调的典型事例有:国家为避免船舶及船上人员财产不必要的延误而遵循国际海事组织《关于简化海上运输的国际公约》,以及援引《国际贸易术语解释通则(INCOTERMS)》以代码形式指称国际公认的贸易条款。

标准化是一项针对国际间各方均予认同的惯例和手续、单证和信息进行格式化开发的过程。标准化的典型事例有:联合国贸易单证格式、联合国关于行政、商业和运输业的电子数据交换标准,以及针对国家、货币和地点的国际标准。应当指出,在国际贸易便利化过程中,技术标准的使用非常重要,如货运集装箱的ISO标准,它确保了集装箱运输的快捷有效。

世界贸易组织(WTO)将透明化列入贸易便利化范畴,并将简化、协调、标准化、透明化作为贸易便利化的四大原则。图1-2给出了WTO贸易便利化的四大原则。

国际贸易标准化是一项针对国际间各方均予认同的惯例和手续、单证和信息进行格式化开发的过程。随之就要按照标准进行调整,最终达到业务和方法的协调。“世界贸易需要国际标准”,早在20世纪60年代初,联合国就成立了联合国贸易便利化与电子业务中心(UN/CEFACT),这是一个专门从事研究、制定、发布和推广国际贸易便利化与标准化的机构,其目标就是简化国际贸易程序、手续和单证,协调世界各国在国际贸易方面的法律、法规、标准及惯例,使它们相互协调与融合,标准化贸易单证和交换的贸易数据,最终使得办理国际贸易业务更为简便、快捷和节省成本。为实现这一目标,UN/CEFACT的主要任务就是制定全球统一的贸易便利化措施和标准,消除国际贸易中的技术壁垒,提高效率、降低成本。

电子商务标准化是贸易便利化的一个分支。前面提到贸易便利化的核心是简化、协调、标准化。标准化包括三部分内容,它们分别是贸易单证标准化、电子数据交换(EDI)标准化、基于XML电子商务标准化。图1-3给出了贸易便利化与电子商务标准化之间的逻辑关系。图1-2 WTO贸易便利化的四大原则图1-3 贸易便利化与电子商务标准化之间的逻辑关系

第2章 基于XML电子商务标准体系与标准化的方法

2.1 基于XML电子商务标准体系及标准之间的逻辑关系

UN/CEFACT为了保证基于XML电子商务系统的安全、便利、可靠和高效,为其研制了266项标准。由于标准众多,涉及面广,不免为用户的学习和使用带来困难。一种研究基于XML电子商务标准化的重要方法就是从研究标准体系入手。研究基于XML电子商务标准体系,分析标准体系的结构,以及标准之间的关系,制定出基于XML电子商务标准体系框架,是一种有效的标准化工作的方法。

什么是基于XML电子商务标准体系呢?通过实际应用将它定义为在一定范围内为了满足基于XML电子商务特定业务需求,实现特定目标而将相关标准有机地结合起来组成科学的整体。

基于XML电子商务标准体系有以下特征。(1)结构性。基于XML电子商务标准体系内的标准按其内在联系分类排列,就形成了标准体系的结构形式。基于XML电子商务标准体系的基本结构形式有层次结构和过程结构。(2)相关性。基于XML电子商务标准化对象的内在联系决定了标准体系内各项标准的相关性。(3)整体性。基于XML电子商务标准化对象的内在联系形成了标准的整体性。每个标准都不是孤立的,都是整个体系中的一个部分。(4)目的性。基于XML电子商务标准体系都是根据明确的需求来达到明确的目的。

前面我们提到UN/CEFACT为基于XML电子商务标准化推出了2个建议书、4套标准和5套技术规范,其中这4套标准又由266项具体的标准组成。在建立标准体系之前首先应当对它们进行科学分类。基于XML电子商务标准按领域划分分为3个层面:第1个层面为应用层面,第2个层面为技术层面,第3个层面为法律层面,每个层面又由具体的小类标准组成。应用层面的标准主要为用户提供应用数据,技术层面的标准主要是为应用层面的标准提供理论和技术支持,法律层面的建议书主要是为用户提供行为守则和法律保证的协议。图2-1给出了基于XML电子商务标准体系框架。

研究基于XML电子商务标准体系的目的首先是了解体系中有哪些标准,其次是分清哪些标准是业务层面标准,哪些是技术层面标准,哪些是法律层面标准,最后是了解和掌握标准之间的逻辑关系。图2-1 基于XML电子商务标准体系框架

业务标准有:(1)UN/CEFACT XML SCHEMA。它由154个XML SCHEMA代码和标识符(通用信息类)标准,以及79个XML SCHEMA数据标准组成。(2)UN/CEFACT核心构件库。它由6个不同的子库组成,它们分别是UN/CEFACT核心构件库(CC)、UN/CEFACT业务信息实体库(Message-BIE)、UN/CEFACT限定数据类型库(Message-qDT)、UN/CEFACT参考业务信息实体库(Reference-BIE)、UN/CEFACT参考限定数据类型库(Reference-qDT),以及UN/CEFACT唯一数据类型库(uDT)。(3)UN/CEFACT业务需求规范。它由27个具体的业务需求规范标准组成。(4)UN/CEFACT需求规范映射。它由5个具体的需求规范映射标准组成。

技术规范标准有:UN/CEFACT核心构件技术规范、UN/CEFACT XML命名与设计规则、UN/CEFACT核心构件数据类型规范、UN/CEFACT UML建模方法、UN/CEFACT UML核心构件轮廓,它们都是以技术规范的形式出现的。

法律标准有UN/CEFACT电子商务协议、UN/CEFACT电子商务自律办法,它们都是以建议书的形式出现的。

在学习基于XML电子商务标准体系时,很重要的一点就是搞清楚标准与标准之间、标准与规范之间,以及规范与规范之间的逻辑关系。下面的几个图是我们经过研究后得出的它们之间的逻辑关系。

图2-2~图2-5给出了业务层面的标准与技术层面标准,以及技术层面标准之间的逻辑关系,在后面几章的描述将完全按照下面的逻辑图展开。

图2-2给出了UN/CEFACT核心构件库与UN/CEFACT核心构件技术规范、UN/CEFACT核心构件数据类型目录,以及UN/CEFACT UML核心构件轮廓之间的逻辑关系。UN/CEFACT UML核心构件轮廓支持UN/CEFACT核心构件技术规范,而UN/CEFACT核心构件技术规范与UN/CEFACT核心构件数据类型目录共同支持UN/CEFACT核心构件库。在这4套标准中,只有UN/CEFACT核心构件库是业务标准并以标准的形式出现的,其他3套都是技术层面的标准并以技术规范的形式出现。图2-2 UN/CEFACT核心构件库、UN/CEFACT核心构件技术规范、UN/CEFACT核心构件数据类型目录,以及UN/CEFACT UML核心构件轮廓之间的逻辑关系

图2-3给出了UN/CEFACT XML SCHEMA与UN/CEFACT XML命名与设计规则之间的逻辑关系。UN/CEFACT XML命名与设计规则支持UN/CEFACT XML SCHEMA。在这2套标准中,UN/CEFACT XML SCHEMA是业务标准并以标准的形式出现的,UN/CEFACT XML命名与设计规则是技术层面的标准并以技术规范的形式出现的。图2-3 UN/CEFACT XML SCHEMA与UN/CEFACT XML命名与设计规则之间的逻辑关系

图2-4给出了UN/CEFACT业务需求规范、UN/CEFACT需求规范映射与UN/CEFACT UML建模方法之间的逻辑关系。UN/CEFACT UML建模方法支持UN/CEFACT业务需求规范和UN/CEFACT需求规范映射。在这3套标准中,UN/CEFACT业务需求规范和UN/CEFACT需求规范映射是业务标准并以标准的形式出现的,UN/CEFACT UML建模方法是技术层面的标准并以技术规范的形式出现的。图2-4 UN/CEFACT业务需求规范、UN/CEFACT需求规范映射与UN/CEFACT UML建模方法之间的逻辑关系

图2-5给出了UN/CEFACT核心构件技术规范与UN/CEFACT XML命名和设计规则,以及UN/CEFACT UML建模方法之间的逻辑关系。UN/CEFACT核心构件技术规范与UN/CEFACT XML命名和设计规则以及UN/CEFACT UML建模方法之间相互支持。图2-5 UN/CEFACT核心构件技术规范、UN/CEFACT XML命名和设计规则,以及UN/CEFACT UML建模方法之间逻辑关系

从上面4个逻辑关系图不难看出UN/CEFACT核心构件技术规范在整个电子商务标准体系中起着理论基础的作用,它相当于ISO 11179标准为贸易数据元标准和UN/EDIFACT中的数据元标准奠定了基础一样。

2.2 基于XML电子商务标准化的方法

在研究基于XML电子商务标准化的方法之前,让我们先看一下UN/CEFACT为国际贸易便利化与标准化研究所建立的贸易流程与国际供应链模型。

UN/CEFACT在标准化活动的初期就研制出了贸易流程与国际供应链模型。这两个模型贯穿了UN/CEFACT整个贸易便利化与标准化工作。图2-6和图2-7给出了这两个模型。图2-6给出了UN/CEFACT的购买-运输-支付模型。图2-6 UN/CEFACT的购买-运输-支付模型

图2-7给出了国际供应链模型,UN/CEFACT在标准化活动的初期就研制出了国际供应链模型。图2-7 国际供应链模型

上述两个模型是根据UN/CEFACT建模方法和国际贸易实际得出的,它为整个国际贸易单证标准化、EDI标准化,以及基于XML的电子商务标准化奠定了理论基础。

在建立了上述模型之后,UN/CEFACT就真正开始了以这两个模型为基础的标准化工作。UN/CEFACT首先是对贸易单证进行标准化,UN/CEFACT通过规定一个单证的标准模版,并要求所有国际贸易单证的格式和布局均以该标准模版为基准,这个基准模版就是联合国贸易单证样式(UNLK)。UNLK规定了纸面单证的纸张规格、单证格式和设计原则、数据项的表示和数据项的布局,还确定了单证标准化的三大要素——数据标准化、格式标准化、布局标准化。标准化方法是对数据、格式、布局分别进行标准化,然后将经过标准化处理后的数据、格式、布局结合起来形成标准化的单证。UNLK不仅奠定了单证标准化的基础,同时也奠定了国际贸易电子商务标准化的基础。

在研究基于XML电子商务标准化时,我们可以将基于XML电子商务报文看作贸易单证。基于XML电子商务标准按照业务领域划分可分为3个层面,即应用层面、技术层面和法律层面,应用层面的标准主要是数据标准。我们可以将电子报文的数据标准化与单证的数据标准化对照,电子报文由结构化的数据组成,其数据结构分为4层:最底层为代码,然后是基本核心构件与关联核心构件,接着是聚合核心构件,最上层为报文。应用层面的标准化工作从代码、基本核心构件与关联核心构件、聚合核心构件,以及报文4个方面开展,通常称之为数据标准化的4要素。与单证数据结构比较,单证的数据结构只有3层,即单证、数据元、代码,因此基于XML电子商务数据标准化相对来说要复杂得多。

我们将基于XML电子商务技术层面的标准与贸易单证的格式和数据元布局相比较,技术层面的标准化工作主要制定电子报文的语法标准和规则标准,我们可以把语法看成单证格式标准,将设计规则与指南看成单证中数据元的布局标准。

为了确保电子数据交换的安全性和可靠性,必须制定法律法规,法律层面的标准主要是电子商务协议和电子商务自律办法。

我们不难发现基于XML电子商务标准化的方法是单证标准化方法的延伸。

基于XML电子商务报文所采用的标准化的方法是在应用层面、技术层面和法律层面分别进行标准化,即对数据、语法和规则分别进行标准化,然后将经过标准化处理后的数据、语法和规则结合起来形成标准化的电子报文。为了保护贸易参与方业务的安全可靠,还应签署电子商务协议,遵守电子商务用户的行为守则。

在基于XML电子商务标准化实践过程中我们发现,没有哪一个标准能够独立完成一项完整的标准化工作,每项标准只能完成一项有限的工作,更多的情况是由多项标准来共同完成一项标准化工作的。

2.3 基于XML电子商务与贸易单证标准及EDI标准之间的区别与联系

通过研究基于XML电子商务标准化的原理与方法发现,它与EDI标准化的原理与方法一样都是源于单证标准化的原理与方法,或者说是单证标准化原理与方法的延伸。(1)基于XML电子商务标准与贸易单证标准及EDI标准之间的区别与联系。

首先我们研究标准体系间的区别与联系,我们将基于XML电子商务标准体系框架(见图2-1)与图2-8所示的国际贸易单证标准体系框架下,及与图2-9所示的基于EDI的电子报文标准体系框架进行比较。通过比较我们发现国际贸易单证标准体系框架最为简单,而基于XML电子商务标准体系框架与基于EDI的电子报文标准体系框架非常相似,它们都分为三个层面,即业务层面、技术层面和法律层面。EDI比基于XML电子商务早问世10年,虽然它们依托不同的网络系统,但是基于XML电子商务在许多方面借鉴了EDI成功的经验,EDI又是从国际贸易单证标准化发展而来的,因此,建议读者或用户在学习使用本书之前最好从学习本系列丛书的《现代国际贸易单证实用指南》开始,然后学习《国际贸易电子数据交换(EDI)标准应用指南》。有了上述基础再来学习本书将会轻松很多。本书在描述时经常会与EDI标准化进行比较,甚至会用到一些EDI标准化的理念。图2-8 国际贸易单证标准体系框架图2-9 基于EDI的电子报文标准体系框架

通过比较我们不难发现国际贸易单证标准体系框架最为简单,其次是基于XML报文的标准体系框架,而基于EDI的电子报文标准体系框架最为复杂。基于XML报文的标准体系框架与基于EDI的电子报文标准体系框架有许多相似之处。(2)基于XML报文、EDI报文和贸易单证三者之间的数据结构。下面我们将基于XML报文数据结构与单证数据结构以及EDI数据结构进行比较。

图2-10给出了基于XML报文数据结构图。构成基于XML报文数据为结构化的数据,它分为4层,最底层为代码,然后是基本核心构件与关联核心构件,接着是聚合核心构件,最上层为报文。

图2-11给出了单证数据结构图。构成单证的数据为非结构化的数据。它分为3层,最底层为代码,中间层为数据元,最上层为单证。图2-10 基于XML报文数据结构图2-11 单证的数据结构

图2-12给出了EDI报文数据结构图。构成EDI数据为结构化的数据,它分为5层,最底层为代码,然后是数据元,接着是复合数据元,再就是段,最上层为报文。图2-12 EDI数据结构

通过比较我们不难发现,单证的数据结构最为简单,其次是基于XML报文的数据结构,而EDI的数据结构最为复杂。基于XML报文的数据结构与EDI的数据结构更为接近,它们都是结构化的数据。(3)XML报文、EDI报文和贸易单证三者之间的数据标准之间的区别与联系。在20世纪80年代初,为了简化国际贸易单证并使其标准化,由UN/CEFACT推出了建议书1号“联合国贸易单证样式(UNLK)”,在UNLK中把数据元称作数据项。研究人员把国际贸易中涉及的几百份单证的所有数据项全部抽出来放在一起后发现它们有许多相同之处。对这些相同的数据项进行统一的分类、定义、描述和表示,就形成了贸易数据元目录。贸易数据元的理论就是这样形成的,反过来它又重新指导实践。整个过程可以概括为实践-理论-再实践。数据元的最大特点就是有限性,数据就像各种物质一样是无限的,但是数据元就像化学元素那样是有限的,它是表示数据的最小单元,不可再分。1987年UN/CEFACT发布了“贸易数据元目录”,该标准规定了贸易数据元的名称、标记、定义和表示方法。该标准在1988年被ISO采纳为国际标准ISO 7372—1988,并在1993年和2005年进行了两次较大的修订,目前的最新版本为ISO 7372—2005。由于贸易数据元目录源自于贸易单证,因此该标准包括的数据元适用于国际贸易单证。尽管目前的国际贸易单证有600多种,但是所有的数据项在贸易数据元目录中均可找到,这就为国际贸易单证数据标准化奠定了基础。

贸易数据元目录标准不仅为单证数据标准化奠定了基础,而且为EDI标准化,以及基于XML电子商务标准化奠定了基础。EDI标准化的基础标准“EDIFACT数据元目录”,以及基于XML电子商务基础标准“UN/CEFACT核心构件库(CCL)”均是由贸易数据元目录标准衍生而来的。(4)UN/CEFACT贸易数据元目录(UNTDED)与EDIFACT数据元目录之间的区别和联系。

首先分析一下它们之间的区别,UN/CEFACT发布的贸易数据元目录(UNTDED)在时间上要早于EDIFACT数据元目录。它们有不同的适用范围,一个适用于国际贸易单证,一个适用于电子数据交换(EDI);它们在数量上不同,目前的UNTDED由1 300多个数据元组成,而最新的UNEDED只有不到800个数据元组成,用于单证的数据元比用于EDI报文的数据元在数量上要多很多。

接下来分析一下它们之间的联系。EDIFACT数据元目录是从贸易数据元目录衍生而来的,EDIFACT数据元目录主要的内容均来自贸易数据元目录;贸易数据元目录能够适用于目前由UN/CEFACT在单证代码中标识和定义的600多种单证,而EDIFACT数据元目录只是满足目前UN/CEFACT发布的210种标准报文,因此,导致了两个目录在数据元数量上的差异。两个目录在数据元标记上都是采用4位数字,都分为9大类,都是从1 000到9 649。当两个目录有相同的数据元标记时它们有相同的名称、定义及表示;而不同的数据元标记则为不同的数据元。EDIFACT数据元目录中出现的与贸易数据元目录中不同的数据元主要是为EDI传输而定义的数据元。两个目录之间的关系实际上是一种交集的形式,图2-13给出了两个目录之间的关系。图2-13 用于贸易单证的数据元与用于EDI报文的数据元之间的关系(5)UN/CEFACT贸易数据元目录(UNTDED)与UN/CEFACT核心构件库(CCL)之间的区别和联系。

基于XML报文所使用的数据放弃了数据元理论,而是使用了信息技术中新创立的核心构件理论。这套理论与数据元理论既有联系又有区别,它在使用上比数据元更为灵活,且避免了烦琐的限制,减少了数据的冗余,因此,目前基于XML的电子商务广泛采用了这套理论。UN/CEFACT根据核心构件理论建立了一套数据标准,即所谓的核心构件库(CCL),其作用相当于EDIFACT数据元目录、复合数据元目录和段目录的集成。虽然核心构件理论听起来很新,但它与数据元有着很密切的联系。其实,UN/CEFACT核心构件库(CCL)与EDIFACT数据元目录均源自UN/CEFACT贸易数据元目录。下面我们就看一下UN/CEFACT核心构件库(CCL)是如何从UN/CEFACT贸易数据元目录衍生而来。

在2005年以前的UN/CEFACT贸易数据元目录标准中,数据元主要由数据元标记、数据元名称、说明及表示等属性组成。在2005年UN/CEFACT发布的新版的贸易数据元目录标准中,把数据元的名称与核心构件理论中的基本核心构件联系了起来,在新的数据元目录标准中数据元主要由数据元标记、字典条目名称、原数据元名称、说明及表示等属性组成。

在新的数据元目录标准中采用了新版ISO 11179(GB/T 18391)对于数据元命名的规定,新的字典条目名称由对象类术语、特性类术语和表示类术语组成,它们之间用点号隔开,即“对象类术语.特性类术语.表示类术语”,如表2-1所示。表2-1 贸易数据元目录示例

这种表示方式是为了满足信息技术和计算机处理的要求,尤其是为了适应基于XML电子商务的发展。在基于XML电子商务的核心构件库标准中,基本核心构件是通过贸易数据元中新的命名方式映射而来的。

在UN/CEFACT核心构件库中,所有的基本核心构件BCC均是从UN/CEFACT贸易数据元目录中映射而来的。例如,贸易数据元目录中的数据元1001,字典条目名称为Document.Type.Code,它对应UN/CEFACT核心构件库(CCL)中的基本核心构件UN00000311,字典条目名称与UN/CEFACT贸易数据元目录中一致,均为Document.Type.Code。(6)XML报文、EDI报文和贸易单证三者所使用代码之间的区别与联系。

20世纪80年代末与90年代初UN/CEFACT分别贸易单证和EDI报文发布了许多代码的标准。UN/CEFACT专门为单证标准化发布的代码以建议书的形式出现,它们包括国家名称代码、货币名称代码、运输方式代码等14项建议书。UN/CEFACT为EDI报文专门发布了一个代码表(UNCL),即所谓的UN/EDIFACT代码表,它由271项代码组成,包括UN/EDIFACT数据元目录中代码型的数据元。在实际使用中它包含了部分UN/CEFACT专门为单证标准化发布的建议书,如UN/CEFACT第5号建议书“国际贸易术语解释通则的字母缩写表示”。因此,UN/CEFACT为EDI报文专门发布的代码表与UN/CEFACT为贸易单证发布的标准如图2-14所示,它们是一种部分交叉的关系,即专门用于EDI报文的代码表(UNCL)包含了部分专门用于单证的代码。图2-14 用于EDI报文的代码表(UNCL)与用于单证的代码之间的关系

通过上面比较可以发现,用于单证的贸易数据元目录(UNTDED)虽然在数量上远远多于用于EDI的数据元目录(UNEDED),但是用于单证的代码却远远少于用于EDI的代码。之所以用于EDI的代码比用于贸易单证的代码多很多主要是因为EDI报文需要用计算机来处理。

而UN/CEFACT专门为XML报文研制的154个XML SCHEMA形式的代码和标识符标准主要采用了欧洲EDI协会(EDIFICASEU)和联合国欧经会(UNECE)的代码和标识符标准,这154个XML SCHEMA形式的代码和标识符有的与用于贸易单证的建议书一致,有的与EDIFACT代码表中的代码一致。因此,我们可以用图2-15来表示XML SCHEMA形式的代码表与用于单证的代码,以及EDIFACT代码表之间的关系。图2-15 XML SCHEMA形式的代码表与用于单证的代码,以及EDIFACT代码表之间的关系

2.4 标准的使用方法

读者也许会问,当同时遇到UN/CEFACT发布的建议书、标准、技术规范和国家标准时,我们应使用哪一个?下面给出了UN/CEFACT建议书与ISO标准和中国国家标准的选择与使用方法。(1)对于国际贸易通用信息标准。对于国际贸易通用信息标准的用户,在国际贸易便利化和标准化应用中,应优先使用现有的国家标准。因为国际贸易通用信息标准主要是等同或修改采用UN/CEFACT发布的建议书,如果有的数据在现有的国家标准中无法找到,例如某个新独立的国家名称或货币名称,可能是由于国家标准还未及时修订,这时用户可以登录UN/CEFACT网站查找最新的建议书获得想要的数据。(2)对于国际贸易单证标准。对于国际贸易单证标准的用户,在国际贸易便利化和标准化应用中,应优先使用现有的国家标准,用户可以将UN/CEFACT发布的建议书和标准作为参考。(3)对于国际贸易电子数据交换(EDI)标准。对于国际贸易电子数据交换(EDI)标准的用户,在国际贸易便利化和标准化应用中,应当与其贸易伙伴协商好使用哪个版本的UN/EDIFACT标准。由于UN/CEFACT对于UN/EDIFACT标准采用动态维护,即:每年都对UN/EDIFACT的300多项标准修订和更新,并且每年都给出上半年版本A版的UN/EDIFACT标准和下半年版本B版的UN/EDIFACT标准。而我国虽然研制了部分我国的EDIFACT标准,但是由于标准不全、版本不新,无法满足实际应用的需要,因此建议用户使用UN/EDIFACT标准,而将EDI的国家标准作为参考。(4)对于基于XML电子商务标准。对于国际贸易电子商务标准的用户,在国际贸易便利化和标准化应用中,应当与其贸易伙伴协商好使用哪个版本的UN/CEFACT标准或技术规范。由于UN/CEFACT对于基于XML电子商务标准和技术规范采用动态维护,尤其对于UN/CEFACT给出的UN/CEFACT核心构件库标准,以及228项UN/CEFACT XML SCHEMA标准,UN/CEFACT每年都对它们进行修订和更新,并且每年都给出上半年版本A版和下半年版本B版的标准。而我国虽然研制了部分我国的基于XML电子商务标准,但是由于标准不全、版本不新,无法满足实际应用的需要,因此,建议用户UN/CEFACT标准或技术规范,而将电子商务的国家标准作为参考。

第3章 UN/CEFACT核心构件、核心构件数据类型目录及UML核心构件轮廓技术规范

3.1 UN/CEFACT核心构件技术规范的基础知识

3.1.1 概述

在第3章、第4章和第5章将分别介绍UN/CEFACT核心构件技术规范、核心构件数据类型目录技术规范、UML核心构件轮廓技术规范、XML命名和设计规则,以及UML建模方法技术规范。考虑到本书的读者主要是电子商务的业务人员而非软件人员,因此,本书重点解析UN/CEFACT核心构件技术规范,而对于另外4个技术规范本书只做一般性介绍。前面已经介绍了这些技术规范完全独立于业务存在,其目的就是保证业务数据规范、有序、高效、准确。

本章将解析UN/CEFACT核心构件技术规范、核心构件数据类型目录技术规范、以及UN/CEFACT UML核心构件轮廓技术规范。为什么要将这三部分内容放在一起呢?因为,这三部分内容在逻辑上紧密相连。核心构件数据类型目录技术规范是以UN/CEFACT核心构件技术规范理论建立起来的。因此,我们先从学习核心构件基础理论开始。

在2.1节中我们分析了业务层面的标准与技术层面标准之间的逻辑关系。通过分析我们得出如下结论:UN/CEFACT核心构件技术规范在整个电子商务标准体系中起着理论基础的作用,整个基于XML电子商务数据标准化理论都是围绕它展开的。因此,学好本章内容将为后续的学习打下坚实的基础。

在学习本章之前先让我们回顾一下数据元的基本概念。

数据元是表示一类数据的概念,其特性可由支持信息交换的一组数据元属性来表示;或者说数据元是一组可识别和可定义的数据基本单元。一般来说,数据元由数据元的名称、属性、表示三部分组成。数据元是表示数据的最小单元,它用一组属性描述其定义、标识、表示和允许值的一个数据单元。组成数据元规范的基本属性分为标识类属性、定义类属性、关系类属性、表示类属性、管理类属性,当然还可以根据需要增加扩展属性。数据元属性应依照一种标准方式来注册和控制,以便数据元字典中的数据元在信息交换中保持一致性,并且能够在不同的数据管理环境中进行数据元管理。在标准的数据元目录中通常给出数据元的名称、定义、表示和标记,这些构成了数据元的基本要素。用数据元表示数据的最大好处是数据的规范性和数据含义理解的一致性。目前UN/CEFACT已经为国际贸易单证的数据标准化研制和发布了贸易数据元目录(UNTDED),同时为电子数据交换(EDI)数据标准化研制和发布了数据元目录(UNEDED),这两套目录为国际贸易单证和EDI在数据上的标准化奠定了基础。

随着互联网技术的发展和成熟,使得依托互联网进行数据交换成为可能,这样就产生了基于XML的电子商务。由于EDI成本相对较高,程序和标准相对较复杂,这使得许多中小企业望而却步,而基于XML的电子商务可以使中小企业涉足国际贸易需求的愿望成为可能。基于XML报文所使用的数据放弃了数据元理论,而是使用了信息技术中新创立的核心构件(有的称作核心组件)理论,这套理论与数据元理论既有联系又有区别,它们在使用上比数据元更为灵活,且避免了烦琐的限制,减少了数据的冗余,因此,目前基于互联网的电子商务广泛采用了这套理论。

3.1.2 核心构件的基本概念及各类之间的关系

核心构件(CC)是一种语义构筑块,也是构建所有电子业务报文的基础。UN/CEFACT把它定义为:用来创建清晰、有意义的数据模型、词汇和信息交换包的语义构件,作为创建业务信息实体的基础。在UN/CEFACT核心构件技术规范中的CC包括4种不同类型,它们分别是基本核心构件(BCC)、关联核心构件(ASCC)、聚合核心构件(ACC)和核心构件类型(CCT)。由于每一种类型的构件英文缩写都包含CC,如BCC、ACC等,因此,CC只是一个通用术语,它是BCC、ASCC、ACC和CCT的统称,这也是为什么整套理论以CC来命名的原因。上述4种类型的构件是如何定义的呢?它们之间存在什么样的关系呢?这正是本节的重点,也是本章的重点,搞清楚它们的定义和它们之间的逻辑关系,就为下一步学习打下了基础。

首先看一下什么是基本核心构件(BCC)。UN/CEFACT把它定义为:一个核心构件,构成特定聚合核心构件的单个业务特性,并具有唯一的业务语义定义。基本核心构件表示基本核心构件的特性,因而具有定义其值域的核心数据类型,在功能上作为聚合核心构件特性。学习过EDI的读者对于数据元理论都不陌生,在实际中BCC的作用与数据元的作用相似,可以将其看作数据元理论中的数据元,但在功能具有聚合核心构件特性,这一点不同于数据元。

那什么是聚合核心构件(ACC)呢?UN/CEFACT把它定义为:由相互关联的若干条业务信息组成的集合,它表达了清晰的业务含义,独立于任何特定业务语境。当用建模术语来表达时,它表示一个独立于任何特定业务语境的对象类。下面举一个例子来帮助理解上述定义。学习过EDI的读者对于EDI数据标准中复合数据元目录和段目录都不陌生,由于ACC具有复合特性,又具有独立的业务语义,因此可以既将其看作EDI中的复合数据元,又可将其看作EDI中的段。下面来看一个ACC为“财务账户.细目”的示例。构成该ACC为“财务账户.细目”的BCC为:● 财务账户.标识符;● 财务账户.名称;● 财务账户.国家.标识符;● 财务账户.产品类型.标识符;● 财务账户.别名.名称。

下面来看一下什么是关联核心构件(ASCC)。UN/CEFACT把它定义为:一个核心构件,该构件定义了一个特定的、与另一个聚合核心构件(被称为关联聚合核心构件)相关联的聚合核心构件(被称为已关联的聚合核心构件)的角色。关联核心构件在功能上作为一个关联聚合核心构件的聚合核心构件特性。下面举一个例子来帮助理解上述定义,图3-1给出了一个ASCC的示例。图3-1 ASCC示例

图3-1给出了两个ACC,一个是“人员.细目”,另一个是“地址.细目”。每个ACC有许多特性(即业务特性)。“人员.细目”ACC有4个特性,分别为姓名、出生日期、居住地址和办公地址。“地址.细目”ACC也有4个特性,分别为街道、邮政编码、城镇和国家。这些特性大多数是表示了单一的业务特性的BCC,它们的值用数据类型(DT)来定义。姓名、街道、邮政编码和城镇是文本数据类型,出生日期是日期数据类型,国家是标识符或代码数据类型。

除了上述特性外,ACC中的其他特性是ASCC。它们表示了复合业务特性,因此其结构由其他ACC来定义。居住地址和办公地址都是ASCC,其结构用“地址.细目”来定义。因此,通过本示例导出下列CC。● 人员.细目(ACC);● 人员.姓名.文本(BCC);● 人员.出生日期(BCC);● 人员.居住地址(ASCC);● 人员.办公地址(ASCC);● 地址.细目(ACC);● 地址.街道.文本(BCC);● 地址.邮政编码.文本(BCC);● 地址.城镇.文本(BCC);● 地址.国家.标识符(BCC)。

通过上述例子看出ASCC本身也是一个ACC,只是当它被另一个ACC关联时,功能上变成了一个BCC,相当于EDI复合数据元理论中的一个成分数据元。

最后让我们看一下什么是核心构件类型(CCT)。UN/CEFACT把它定义为:由一个内容构件(有且仅有一个)和一个或多个辅助构件组成的一种核心构件,其中内容构件给出了实际内容,辅助构件对内容构件给出了实质性的补充定义。核心构件类型没有业务语义。例如,对“金额.类型”这样的CCT,其内容构件的值为12,12本身没有语义含义。但12欧元就有含义了,此处,欧元是对内容构件进行附加定义的补充构件。

了解了上述4种CC之后,下面来看一下它们之间的逻辑关系。图3-2给出了BCC、ACC、ASCC和CCT之间的逻辑关系。图的上半部分是没有业务语义的各种CC,图的下上半部分是有业务语义的各种CC。图3-2 BCC、ACC、ASCC和CCT之间的关系

通过上面4种CC的定义和它们之间逻辑关系的描述,我们已经建立起了核心构件的概念和基本理论,由此也可以建立起由核心构件理论做支撑的基于XML进行数据交换的报文的数据结构。图3-3给出了基于XML电子商务的数据结构。

从图3-3中可以看出,构成基于XML报文数据为结构化的数据,它分为4层,最底层为代码,然后是基本核心构件与关联核心构件,接着是聚合核心构件,最上层为报文。也就是说基于XML报文由若干个ACC组成,ACC由BCC和ASCC组成,而对于代码型的BCC和ASCC可由代码表示。图3-3 基于XML电子商务的数据结构

我们不妨将基于XML电子商务的数据结构与EDI数据结构进行比较。图3-4给出了EDI数据结构。图3-4 EDI数据结构

构成EDI数据为结构化的数据,它分为5层,最底层为代码,然后是数据元,接着是复合数据元,再就是段,最上层为报文。

通过比较我们不难发现,基于XML报文的数据结构比EDI的数据结构简单,它们在顶层都是报文,底层都是代码,而且是相同的代码,但在中间层完全不同。

3.1.3 业务信息实体的基本概念

UN/CEFACT把业务信息实体(BIE)定义为:核心构件在特定语境下的具体实现,构成具有唯一业务语境定义的一条或一组业务数据。也就是说,当在实际的业务环境中使用CC时,它就成为了BIE,BIE是CC用在特定业务语境中的结果。通过3.1.2节的学习我们知道CC是一个通用术语,包括BCC、ASCC、ACC和CCT,同样,BIE也是一个通用术语,它包括基本业务信息实体(BBIE)、聚合业务信息实体(ABIE)和关联业务信息实体(ASBIE)。

CC与BIE之间的主要差异在于有无业务语境。业务语境是CC在特定的业务环境下使用时对其进行限定的机制。一旦标识出业务语境,就可以区分出CC,从而考虑支持CC用在给定业务语境中时任何所需的限定条件和精练机制。业务过程语境从高层面上描述了报文及其内容的用法。CC和BIE之间存在特定的关系,CC和BIE在许多方面是互补的,CC是创建可互操作的业务过程模型的关键所在,也是创建使用受控词表的业务文档的关键所在。图3-5给出了CC与BIE之间的关系。图3-5 CC与BIE之间的关系

BIE分为三种不同类型,它们分别是基本业务信息实体(BBIE)、聚合业务信息实体(ABIE)和关联业务信息实体(ASBIE)。

UN/CEFACT把基本业务信息实体(BBIE)定义为:一个业务信息实体,表示给定的业务语境中特定聚合业务信息实体的单一业务特性。基本业务信息实体基于基本核心构件,具有基本业务信息实体特性,该特性基于定义其值域的业务数据类型。BBIE是用在特定业务语境中的BCC。

UN/CEFACT把聚合业务信息实体(ABIE)定义为:由相互关联的若干条业务信息组成的集合,它表达了特定语境中清晰的业务含义。当采用建模语言来表述时,它表达了特定业务语境中的一个对象类。ABIE是用在特定业务语境中的ACC。

UN/CEFACT把关联业务信息实体(ASBIE)定义为:一个业务信息实体,该实体定义了一个特定的、与另一个聚合业务信息实体(被称为关联聚合业务信息实体)相关联的聚合业务信息实体(被称为已关联的聚合业务信息实体)的角色。关联业务信息实体在功能上作为一个关联聚合业务信息实体的聚合业务信息实体特性。ASBIE是用在特定业务语境中的ASCC。图3-6给出了ASBIE的示例。图3-6 ASBIE的示例

图3-6中给出32个ABIE,它们是“人员(中国).细目”和“地址(中国).细目”,每个ABIE都有一些特性,即业务特征。“人员(中国).细目”有4个特性,分别为姓名、出生日期、居住地址(中国)和办公地址(中国);聚合业务信息实体“地址(中国).细目”有3个特性,即街道邮政编码和城镇。这些特性大多数是表示了单一的业务特性的BBIE,它们的值是用数据类型(DT)来定义的。姓名、街道、邮政编码和城镇是文本数据类型,出生日期是日期数据类型。

除了上述特性外,ABIE中的其他特性是ASBIE,表示复合业务特性,因此其结构由其他ABIE来定义。居住地址(中国)和办公地址(中国)都是ASBIE,其结构用“地址(中国).细目”来定义。因此,通过本示例可导出下列BIE。● 人员(中国).细目(ABIE);● 人员(中国).姓名.文本(BBIE);● 人员(中国).出生日期(BBIE);● 人员(中国).居住地址(中国)(ASBIE);● 人员(中国).办公地址(中国)(ASBIE);● 地址(中国).细目(ABIE);● 地址(中国).街道.文本(BBIE);● 地址(中国).邮政编码.文本(BBIE);● 地址(中国).城镇.文本(BBIE)。

只要ABIE的一个特性是复合特性,并且该特性具有另一个ABIE的结构时,就可以用ASBIE来表示该特性。ASBIE以ASCC为基础,但存在于一个特定业务语境中。

通过上面BIE基本概念的学习,我们不难理解BIE的概念是建立在CC理论之上的,只要掌握了CC理论,掌握BIE就非常容易。

3.2 UN/CEFACT核心构件技术规范

传统上,业务数据交换的标准主要集中在静态信息的定义上,而这些静态信息的定义无法达到令人满意的互操作性和业务交易的灵活性,因此需要一种更加灵活的、可互操作的业务语义标准化方法。

UN/CEFACT核心构件技术规范给出一种标识、捕获和最大化重用业务信息的方法,支持和促进跨多业务情形的信息互操作,其主要内容规定了既满足人类可读又便于机器处理的信息表示方法。规范所述的核心构件方法使用语法中性的方式进行语义标准化,因此比该领域现有标准更灵活方便。核心构件技术规范中给出了许多规则,这些规则主要包括核心构件规则、数据类型规则、业务信息实体规则、业务信息实体规则、命名规则等。对于电子商务的业务人员只需学习3.1节的内容就够了,而对于电子商务的软件人员来说应当学习3.2节部分的内容。

3.2.1 核心构件、数据类型和业务信息实体

本节定义了以下内容。● 核心构件规则,它用大写字母C开始;● 数据类型规则,它用大写字母D开始;● 业务信息实体规则,它用大写字母B开始;● 命名规则;● 核心构件类型;● 内容构件和补充构件;● 表示词。

本节也规定了CC、DT和BIE之间的关系,并包括构建核心构件目录,以及更大的核心构件库所需的详细技术内容。3.2.1.1 核心构件规则

CC有4种类型——BCC、ASCC、CCT和ACC,这四种类型的CC及其相互关系如图3-7所示。

UN/CEFACT核心构件规则用方括号中加大写字母C表示。在发现和描述4种核心构件时,必须遵循以下通用规则。图3-7 核心构件和数据类型元模型【C1】在CC库中,每个CCT、BCC、ASCC或ACC必须有唯一的语义定义。应首先开发CC的定义,然后从定义中提取出CC的字典条目名称。为了进一步说明该定义,可以使用注释,或在注释中给出实例和/或引用一个公认的标准。【C2】所有包含在ACC中的核心构件特性应与聚合概念有关。【C3】包含在同一个ACC中的所有核心构件特性不应出现语义重叠。【C4】对于一个核心构件类型为“代码.类型”的CC,其信息的表示应使用由公认的标准机构发布的标准;如果不使用这些标准,则应给出业务方面的正当理由。【C5】ACC应至少包括一个核心构件特性,核心构件特性可以是基本核心构件特性,也可以是关联核心构件特性。【C6】ACC不应间接或在任何嵌套层上包括任何一个引用其自身的必备型ASCC特性。【C7】CCT应是已批准的CCT。【C8】内容构件应是已批准的、CCT的内容构件。【C9】补充构件应是已批准的、CCT的补充构件。3.2.1.2 数据类型规则

数据类型(DT)规定了用于特定BCC特性或BBIE特性的有效值的集合,DT通过对CCT规定约束条件来定义。

DT表示了可用来表达特定CC特性的全部值的范围,DT必须以CCT为基础,但还可以包括CCT内容构件和/或补充构件值的集合的约束条件。UN/CEFACT数据类型规则用方括号中加大写字母D表示。【D1】DT应以已批准的CCT为基础。【D2】必要时,DT应通过对内容构件和/或补充构件强加约束条件,以便限定CCT所允许的有效值集合。3.2.1.3 业务信息实体规则

BIE是特定业务语境中带有唯一业务语义定义的一条业务数据或一组业务数据。BIE可以是BBIE、ASBIE或ABIE,其中,BBIE以BCC为基础,ASBIE以ASCC为基础,ABIE是ACC在特定的业务语境中的重用。

BIE的基本定义模型见图3-8。UN/CEFACT业务信息实体规则用方括号中加大写字母B表示。【B1】BIE应是BBIE、ASBIE或ABIE。【B2】BIE应由一个或多个业务语境来定义。【B3】BBIE应以BCC为基础。【B4】ASBIE应以ASCC为基础。【B5】ABIE应以ACC为基础。【B6】ABIE应至少包括一个BIE特性,BIE特性可以是BBIE特性,也可以是ASBIE特性。【B7】ABIE的BIE特性应以对应的ACC的CC特性为基础。【B8】BBIE特性的DT应与相应的BCC特性的DT是相似的(即BBIE特性的DT应是与BCC特性相同的DT,或是进一步进行了限定的DT)。【B9】ABIE(ASBIE特性以该ABIE为基础)应以相应的ACC(与ASBIE相应的ASCC特性,以该ACC为基础)为基础。【B10】ABIEA不应直接或在任何嵌套层上包括任何一个引用其自身的必备型ASBIE特性。图3-8 BIE的基本定义模型3.2.1.4 命名规则

为了获得在命名和定义CC、DT和BIE时的一致性,有必要形成一种命名规则。命名和定义的一致性有利于在发现和分析过程中进行对照并排除歧义,例如,具有不同名称的多种CC却有相同的语义含义。

命名规则根据GB/T 18391.5—2001所描述的准则和原则而得出,在某些情况下,这些准则已经应用到CC中。特别地,该准则已经扩展到CCT、DT和BIE的命名和定义中。

应开发补充的受控词表对任何可能存在歧义的词给予明确定义。一旦多个词可以表达相同的定义时,该受控词表也可用来确定优选词。受控词表应出自权威字典,这将确保名称和定义中的每个词都以一致的和明确的方式使用。这种合成的语义完整性也意味着翻译为其他语言时还能保持其原有的准确含义。

1.CC命名规则

1)CC字典信息(1)每个CC均包括下列字典信息。● 字典条目名称(必备型):CC在字典中唯一的正式名称。● 定义(必备型):CC的唯一业务语义。● 业务术语(可选型):通常在业务中使用的CC的同义词。一个

CC可以有几个业务术语或同义词。(2)CC字典信息示例如下。● 字典条目名称:“个人.税.标识符”。● 定义:个人在国家注册的纳税标识。● 业务术语:公民身份号码、所得税号、国家注册号、个人税注册

号、社会保障号、国家保险号。(3)CC字典条目名称的命名。CC字典条目名称的命名规则以GB/T 18391中定义的下列概念为基础。

①对象类:表达特性所属的逻辑数据组或聚合体(在逻辑数据模型中)。对象类由对象类词来表示,因此,对象类是CC字典条目名称的一个组成部分,表达了特定语境中的活动或对象。对象类有清晰的边界和含义,并且其特性和行为遵循同样的规则。

②特性词:表达对象类的显著特征,并在定义中自然体现。

③表示词:CC名称的一个元素,描述了CC的表达形式。

2)CC通用规则【C10】除业务术语外,字典内容都应使用现行的权威字典,以确保书写正确。

3)CC定义的规则【C11】定义应与GB/T 18391.4中第4章的规定保持一致,并具有可理解的含义。【C12】定义应使用尽可能简洁的语句和规范的词语。如果出现同义词,定义应使用受控词表中的优选词条。【C13】BCC定义所使用的结构应以对象类词、特性词和相应BCC特性的DT为基础。【C14】ASCC定义所使用的结构应以对象类词、特性词和相应ASCC特性所基于的ACC对象类词为基础。

4)CC字典条目名称的规则【C16】字典条目名称应是唯一的。【C17】字典条目名称应从CC定义中得出。【C18】字典条目名称应是简洁的,不应包含冗余词。【C20】除非是语言规则的需要,否则字典条目名称不应使用非文字字符,不应使用数字表示顺序。【C21】字典条目名称应只包括动词、名词和形容词(即没有像“和”、“的”等词)。本规则适用于汉语,适当时也可用于其他语言。【C22】字典条目名称中的缩略语和简称应在定义中展开或进行解释。【C23】BCC的字典条目名称应由下列部分按顺序组成。● BCC特性所属的ACC的对象类词;● 相应的BCC特性的特性词;● 相应的BCC特性所基于的DT的表示词。【C24】ASCC的字典条目名称应由下列部分按顺序组成。● ASCC特性所属的ACC的对象类词;● 相应的ASCC特性的特性词;● 相应的ASCC特性所基于的ACC的对象类词。【C25】字典条目名称的各组成部分应用点“.”分隔开。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载