网络行为安全的信息化辅助预警(txt+pdf+epub+mobi电子书下载)


发布时间:2020-08-01 09:14:32

点击下载

作者:王泰

出版社:世界图书出版广东有限公司

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

网络行为安全的信息化辅助预警

网络行为安全的信息化辅助预警试读:

前言

在蓬勃发展的网络时代,青少年的健康发展正面临着许多新的问题。仅仅过滤不良内容已经不能完全解决这些问题了。因为青少年还会过度沉迷网络游戏或者在网上发布一些具有极端情绪倾向的言论,甚至在网上留下自杀遗书。从心理上,我们可以认为这是青少年在采用一种极为特殊的方式向周围的人群发出希望得到关爱的信号。我们当然不能漠视这些信号。“尽快捕获这些信号,为尽早干预赢得时间”就是撰写本书的初衷。在这一初衷的指引下,本书提出了青少年网络行为安全问题的信息化辅助预警思路,并以浏览色情网页、沉迷网络游戏和发泄极端情绪为研究场景,提出了具体的预警方法。这套思路和方法的核心在于综合运用多种信息技术手段(包括信息采集、信息处理等),在保护个人隐私的前提下,以前人积累的大量实践经验为依据,去发现那些在互联网上暴露出来的符合某种特征的网络行为安全问题。文献调研发现,上述思路和方法与国际学术界的认识和进展几乎是在同一时期(2008—2010)形成的。

在此,作者首先要感谢08级硕士陈攀(第二章第三节)、09级硕士李隆(第四章第三节第(一)小节)、10级硕士徐薇(第四章第三节第(一)小节)、11级硕士研究生李乾坤(第三章第三节第(三)小节)和12级硕士研究生魏阳(第四章第三节第(二)小节)的贡献。虽然作者本人在指导他们的过程中提出过具体的想法和撰写了上述对应章节的多数文字,但正是他们卓有成效的辛勤工作,才把纸上的蓝图落实成扎扎实实的系统。作者还要感谢师兄李冰提供了图3-5和图3-8,心理学院的同事高闯副教授提供了图4-9。

作者还要感谢心理学院周宗奎教授和法学院董小红副教授对第二章第二节的修改意见。

本书的作者从学校毕业之后即投身到与本书相关的研究开发领域中,屈指算来已经整整六个年头了。作者本人全职、完整地参加了先后启动的两个连续的国家科技支撑计划项目(“十一五”项目:网络文化安全与民族文化数字化关键技术研究与示范应用,编号:2006BAK11B00;“十二五”项目:网络行为安全与青少年发展关键技术研究与示范应用,编号:2011BAK08B00)从申报到验收的全过程。本书的内容即取材于由作者本人负责完成的科研成果。出版这本书既是完成作者总结六年来工作的心愿,也是项目结题的需要。能将个人兴趣和组织需要结合起来,实属人生一大快事。

让作者体会到上述快乐的,当然要归功于刚刚度过110岁华诞的华中师范大学。这座百年学府在她的历史长河中又迎来了一轮新的发展浪潮。这一次浪潮的标志之一就是大纵深、大范围的学科交叉与融合。每次参加来自多个学院的头脑风暴和学术沙龙都让作者如沐春风。作者现在对学科交叉与融合的体会与认识无疑比六年前又进了一步。

为此,作者本人要特别感谢华中师范大学校长杨宗凯教授、国家数字化学习工程技术研究中心执行主任刘三教授、青少年网络心理与行为教育部重点实验室主任周宗奎教授和美国孟菲斯大学心理学系暨智能系统研究所胡祥恩教授对于学科交叉与融合活动的大力支持。

作者最后还要向本书的策划编辑李敏荣和责任编辑黄利军两位老师致敬,正是他们的专业素养才促成了本书的出版。

本书的出版获得了国家863计划课题“基于行为心理动力学模型的群体行为分析与事件态势感知技术”(编号:2014AA015103)、十二五国家科技支撑计划项目“网络行为安全与青少年发展关键技术研究与示范应用”(编号:2011BAK08B00)和青少年网络心理与行为教育部重点实验室2011-2012年度一般开放课题“青少年心理与行为问题的网络观测方法”(编号:2012B11)的资助。

本书作者欢迎和期待读者提出意见和建议,以利将来再版时予以改进。2014年3月王泰于桂子山

第一章 绪论

一、网络行为的含义

“网络行为”是一个既在信息技术领域又在网络心理学领域出现的术语。前者中的“网络行为”侧重于从“物”的角度来定义,如:网络行为可以被视作计算机之间的通信过程。后者中“网络行为”则侧重于从“人”的角度来定义,如:网络行为是网络空间主体的行为,包括交易行为、消费行为、娱乐行为、政治行为、违法行为等。

上述两个领域中的“网络行为”在概念上既有联系又有区别。它们的联系在于:人的网络行为是通过计算机之间的通信来实施的。它们的区别在于:并非所有的计算机之间的通信都是由人的网络行为来驱动的。例如,在某一种通信协议下,某计算机需要定时向网关节点发送脉冲信号以报告自身状态。这样一种通信过程就不是由人的网络行为来驱动的,它只受制于网络设备内在的工作原理。

本书中采用的“网络行为”的定义是:行为主体为实现某种特定的目标,采用基于计算机系统的电子网络作为手段和方法而进行的有意识的活动。相比较而言,这一概念更接近于网络心理学领域的“网络行为”概念。但与其它专业著作不同的是,本书将更多地从计算机学科的角度,来阐述针对青少年网络行为安全进行预警的信息化辅助方法。

二、青少年所处的网络环境

根据2013年8月教育部公布的《2012年全国教育事业发展统计公报》,我国义务教育阶段在校生14458.96万人,高中教育阶段在校生4595.28万人,中小学在校生合计达19054.24万人。

根据中国互联网络信息中心于2013年7月公布的第32次《中国互联网络发展状况统计报告》(以下简称《统计报告》),6-19岁的网民占5.91亿全体网民的24.5%,即14479.5万人。

由于青少年的绝大部分是中小学在校学生,根据以上数据,以及《统计报告》对“网民”的界定,我们可以算出青少年使用过互联网的比例大致在75%左右。

该《统计报告》还说明:从比例来看,10-19岁的网民(23.2%)是仅次于20-29岁(29.5%)和30-39岁(26.1%)的第三大网民成分。可是,除中国青年网外,专门为这一年龄段的青少年量身定做的知名网站很难挤入Alexa中文访问量排名的前500位,如表1-1所示。表1-1 若干青少年专门网站的访问量排名(2013年11月10日查询)*N/A:没有进入排名统计范围,或远在第64638名之外。

造成这一现象的原因既包括青少年专业网站本身的设计相对困难的因素,又包括青少年网络行为动机与成年人趋同的因素(如均包括查找信息、聊天交友、娱乐游戏等)。面对良莠不齐的网络内容,成年人尚且在某些情况下难以抵御来自阴暗角落的诱惑,就更妄论青少年了。

三、青少年所面临的网络行为安全问题

通常,教师和父母对孩子上网持谨慎或保守的态度。但是,即使这样,青少年仍有可能在网吧或者手机上偷偷接触到对其健康成长不利乃至有害的互联网内容。具有危险性的典型网络行为包括浏览色情网页、沉迷网络游戏、发布表达极其消极情绪的帖子等等。

一般来说,老师或者家长发现这些行为往往为时已晚。学术界和医疗界多建议增加户外运动时间、提高孩子学习兴趣、加强小孩自我控制能力等措施来预防此类行为的发生。在这类行为导致的危害发生之后,则多采用问卷筛查的方法来寻求化解之道。考虑到这些预防措施并不容易落到实处(如家长工作忙、学业压力大、户外运动场地严重不足),再加上青少年在填写调查问卷时的掩饰因素,我们需要将其他技术方案一并纳入到青少年网络行为安全问题的综合治理中来。

本书即以青少年面临的三个典型的网络行为安全问题(第二、三、四章依照问题的普遍性,分别为浏览色情网页、沉迷网络游戏、发布表达极其消极情绪的帖子)为例,阐述采用信息化的方法来进行辅助预警的思路,作为有效应对青少年网络行为安全问题的补充方法。

本书的创新之处是在总体上提出了一套采用信息化方法来对青少年所面临的网络行为安全问题进行辅助预警的思路。具体表现在以下三个方面:

第一,社会科学以人为研究对象,理工科以物为研究对象。要落实通过技术手段辅助解决社会问题这一意图,必须将人的想法实物化、人的判断指标化。在识别和防范危害青少年身心健康的淫秽色情内容这一具体问题上,我们一改过去由计算机专家来确定何者为淫秽色情何者为艺术表达的思维定势,转而邀请心理学家通过做心理测试的方法(包括脑电实验)来确定淫秽色情和非淫秽色情的文字和图像样本,然后再交由计算机学家通过编写机器学习的算法与程序进行判断。这些文字和图像的样本正是社会科学与工程技术结合时的“人机接口”。在这样一种研究路径或者研究范式的指导下,我们用一种比较新的思路比较好地回避了美国联邦最高法院某位大法官曾说的那句名言:“什么是色情,什么不是色情,只有我看了才知道”所引发的技术难题。在技术方面,我们提出了基于肤色和特征部位联合检测的色情图片识别方法,显著降低了虚警率。

第二,参与网络游戏时间的长短是衡量青少年是否网络游戏成瘾的重要指标之一。我们提出了三种不同的在线游戏时间测量方法,分别是基于网络游戏服务器、旁路测量和玩家客户端。测量结果表明,如果仅从参与网络游戏时间的长短来衡量,青少年网络游戏成瘾的普遍性未必像我们曾经想象的那么严重。当然,这要归功于国家长期以来的高度重视。通过比较,我们认为如果要从根本上缓解青少年网络游戏成瘾的问题,花大力气提高已有体育设施的利用率和兴建更多的面向公众的体育场所不失为一条治本之策。

第三,我们采用中文文本处理方法作为心理危机预警的支撑技术。对于在网上留下遗书文字的青少年而言,在撰写遗书之时甚至撰写完毕之后一段不短的时间内,他们尚活在人间。将这项技术投入实际运用,对于及时挽救青少年的生命无疑具有重大意义。我们还考虑到应该将预警关口进一步前置。特别是自杀的青少年中有相当比例生前曾经患有精神类心理疾患。对此,我们成功采集到极少量的曾在精神病专业机构就诊的真实病例,并将之与常模进行对比,发现他们日常用语中表示“愤怒”维度的成分显著高于常人。我们在此书中公布这一研究发现,是希望这一研究结论能够在更大的范围内接受检验,并希望这一研究思路能够对从事相关工作的人士带来实质性启发。

在全书的最后一章,阐述在运用上述方法时所需要注意的隐私权保护问题,并对此类问题的争议从文化角度进行了适当的扩展介绍。

四、心理科学与信息科学的关系发展小史

19世纪晚期,在隔着一条英吉利海峡的两个国家——德国和英国分别萌生出两支截然不同的心理学研究流派。德国学派侧重于研究所有人类共同具有的基本过程的科学本质,这些过程包括看、听、记忆、学习和注意等等。而英国学派则侧重于研究人们在智力、人格、观点和文化等方面具有怎样的不同。简言之,德国学派“求同”,而英国学派“求异”。

在这些学派发展的早期,德国学派的心理学家往往具有较为扎实的物理学和医学等专业背景。例如,因从光学和声学角度对心理感知的研究作出过开创性贡献而被该学派尊为鼻祖之一的心理学家赫尔曼·冯·亥姆霍兹(Hermann von Helmholtz)就曾是一位物理学家,根据麦克斯韦方程组推出的亥姆霍兹方程即是以他的名字命名。而英国学派的心理学家则在统计和测量方面更胜一筹。例如,因从研究有机体对其环境的角度对机能主义的发展施加过特殊影响而被该学派尊为鼻祖之一的心理学家查尔斯·罗伯特·达尔文(Charles Robert Darwin)就曾出版过《物种起源》,该书中阐述的进化论正是建立在对动植物和地质方面的大量统计和测量之上。从这些学派的早期发展来看,它们从一开始就具有交叉学科的特色,而且与自然科学特别是信息科学有着与生俱来的紧密联系。

在后来的发展中,随着德国学派和英国学派的交叉与融合,又出现了数学心理学和心理测量学这两个分支。这两个分支分别继承了德国学派和英国学派各自的特点,而且不再以国别划线,从而逐渐从学派演变为学科。

在这两个学科中,心理测量学一直按照学科内在规律有条不紊地发展着,相关性的定义、因子分析、方差分析、统计推理等概念逐渐丰富起来。事实上,心理测量学在定义现代统计理论的本质方面起着至关重要的作用。

相比之下,数学心理学则由于第二次世界大战而得到了出人意料的发展。在战争期间,德国的许多科学家为了躲避迫害来到了美国,这其中就有许多德国心理学家,而且他们中的许多人都与其他领域的科学家一道工作,为早日结束战争做出了他们自己的贡献。例如深受德国学派影响的美国心理学家高尔顿·威拉德·奥尔波特(Gordon Willard Allport)就在二战结束后的第三年出版了他与人合著的作品《谣言心理学(Psychology of Rumor)》。他不仅在该书的附录中给出了有关部门制止和控制战时谣言的标准,而且在该书的主体部分中,以谣言为背景,研究了有关感知和记忆的若干基本问题。而作者在书中为研究口口相传的准确性而设计的实验程序,甚至在多年以后成为娱乐舞台上经常出现的一种游戏节目。

随着二战催生的控制论、信息论、现代逻辑、随机过程、博弈论、计算理论的发展,心理科学与信息科学的结合也越来越紧密。在20世纪50年代左右,许多心理学家本身就是信息科学家。例如,认知科学奠基人之一、通过实验揭示人类短时记忆的平均容量是7个单元的乔治·米勒(George Miller)曾在二战期间参加过军用语音通信的研制,他的博士论文《干扰信号的最优设计》曾被美国陆军列为最高机密。

在心理学的研究中,有的分支或取向侧重与自然科学分支的关联,有的分支或取向侧重与社会科学分支的关联,而有的分支或取向则侧重与人文科学分支的关联。在20世纪50-60年代期间,不同心理学研究(包括联结主义观和格式塔观)形成一股合力,产生了一种新的认知观,即信息加工观(information processing)。在认知科学中,核心假设是认知涉及计算,即,认知就是个体接受某个表征形式的输入,运用某个过程,然后产生某个表征的输出。认知科学采用人—机隐喻,把心理活动视作计算,以此来阐述心理运作过程。信息加工心理学成为20世纪最有影响的认知理论,而且已经在学习和教学中产生了广泛的影响。

在信息加工心理学中,以著名心理学家加涅为代表的研究者们提出了一类专门用来解释信息处理、认知与记忆的模型——信息加工心理学模型。该模型建立在人对计算机类比的基础上,把人从功能上看成是和计算机一样的符号操作系统,用计算机的工作原理和术语来描述人的认知过程(例如“高速缓存”之于“短时记忆”,“外部存储”之于“长时记忆”等等),如图1-1所示。这一研究范式的出现使其成为继心理学从哲学中独立出来和弗洛伊德精神分析学派的产生之后心理学发展史上第三次重大变革。图1-1 信息加工心理学模型

第二章 浏览色情网页行为的信息化预警的背景和方法

一、浏览色情网页对青少年的影响

受制于法律和道德方面的约束,以及为了避免研究活动给青少年带来不可预料的后果,直接以青少年作为被试,开展浏览色情网页对青少年影响的研究是一项几乎不可能会被批准的研究课题。

要想从学术角度,获得这一研究课题的答案只能到上个世纪互联网出现以前且法律法规尚未如现在这般完善的年代中去寻找类似问题的答案,例如在电视等传统媒体中出现的色情内容对青少年的影响。然而即使是这样,由于相似的原因,直接可以借鉴的学术成果仍然少之又少。

为了扩大搜索视野,我们只能去收集以大学生为被试的相关研究成果来类推,或者收集有关暴力内容对青少年影响的研究成果来外推(这是因为在我们的社会中,对于青少年接触暴力材料的态度比色情材料要更宽容一些)。尽管这样的类推或者外推都有难以回避的逻辑难题,但我们还是想作一番努力,对已有的学术成果进行综述。

我们将按照相关性从强到弱的顺序,首先综述上世纪互联网流行之前,关于传统媒体中出现色情内容对青少年影响的研究成果。然后再综述以大学生为被试的研究成果,最后综述以暴力内容为研究课题的研究成果。

在一项研究中,反复观看具有较多性爱成分的电视节目比观看只有一小部分性爱成分的电视节目的青少年更倾向于参与性行为。与观看婚内性行为或者成人之间非性关系的同龄人相比,接触婚外性行为内容的青少年对该行为的反感程度要低得多,而观看音乐电视增加了青少年对婚前性行为的接受度,。

以大学生等成年人为被试的一项研究则发现在接触色情内容的被试者中有很大比例的男性(以及部分女性)会更多地对性关系感到无所谓,甚至会高估某些非主流性行为的普遍性,且不大反感色情内容,并倾向于支持降低对强奸犯的量刑。

相比于对色情材料的研究,对暴力材料的研究相对丰富得多,我们或许可以从以下对暴力材料的研究成果中获得对某些设想的证实。

社会学习理论认为儿童通过对行为和动作进行观察和建模来学习,该理论常被用来解释儿童模仿他们在电视或电影中所看内容的这一现象。大量研究记录了接触媒体暴力和儿童攻击行为之间的联系。

在以色列中学里进行的一项研究发现:当以色列电视台引进世界摔跤联合会的节目后,该节目中出现的动作被普遍模仿,而且导致了许多游乐场上发生的伤情,。还有,一个学生因尝试谋杀一位小姑娘而被定罪,这位学生声称那是模仿职业摔跤动作。

如果反复接触暴力内容,小孩子就不会生气或者害怕。研究表明,对于媒体暴力的这种脱敏反应会导致目击真实暴力时唤醒程度下降和情绪错乱,在考虑是否应立即呼叫大人来干预争吵时会显得更加犹豫,对于被侮辱和被殴打的受害人缺乏同情,,。

还有一项研究表明,看了4天暴力电影的大学生更有可能与他人在未来的就业机会方面产生冲突,而这实际上是一种反社会的行为。

二、域外网络成人内容监管法律背后的经济文化因素及其启示

当前,网络成人内容在学术界并没有统一的界定。通俗地说,网络成人内容相对于未成年人而言,有些内容可能属于不利于其身心健康发展的淫秽内容。这些内容是否必然诱发未成年人犯罪,在学术研究领域还没有形成定论。但是根据社会学习理论,青少年会有意或无意模仿他们看过的镜头。这些不具有艺术价值或科学价值的内容诱使青少年沉迷其中而导致学业荒废却是一个不争的事实。即使是成年人,也容易受其影响,比如在上班时间浏览成人网站导致工作效率低下,在家里经常浏览色情网站导致夫妻关系破裂的案例比比皆是。

互联网的出现为淫秽色情内容的泛滥起到了推波助澜的作用。2002年,美国国家研究委员会应美国国会要求,撰写了《青少年、色情和互联网》的报告。该报告显示美国购买互联网带宽最多的前两个私企均属于网络成人内容产业。鉴于网络成人内容严重损害青少年身心健康,且是滋生多种犯罪的温床,世界各国不论是政府还是民间都出台了相应的应对措施。

许多学者根据不同的国别对相关措施的出台过程、监管主体、具体内容等方面进行了比较研究。这些研究一般把对网络成人内容进行管制的国家划分为政府主导型和行业自律型两类。政府主导型国家由政府部门依照立法机构通过的法律对网络成人内容进行监管。行业自律型国家则是出于对言论自由的尊重,由民间组织通过设置举报热线或订立行业公约等途径来限制网络成人内容对未成年人的影响。这种划分方式尽管有一定的合理之处,但是也存在一些偏颇。事实上,从较大的时间范围来看,即使是在行业自律型国家,除了充分保护公民的言论自由权利,立法机构也在限制网络成人内容方面制订了专门法律(尽管生效的时间比较晚),否则民间组织对未成年人的保护将缺乏法律依据。在政府主导型国家中,民间组织对国家行动的积极配合也表现得非常突出。由此,国家法律和民间组织行为构成了网络成人内容管制体系中的互为补充的监管主体。其中,国家法律无疑占据着主导地位。

作者选取美国、加拿大、德国、荷兰、日本和韩国等六个国家的网络成人内容管制法律作为研究对象,认为除了影响它们的众多因素外,还有经济和文化这两个领域是现有研究并未涉及的。在这里,经济仅指网络成人内容产业的经济规模,文化采用美国人类学家默多克(G. P. Murdock)对文化的定义,即文化是行为的传统习惯模式,这些行为模式构成了个人进入任何社会所应具备的已确定行为的重要部分。通过比较研究,经济和文化是影响网络成人内容监管法律的两个重要因素。由于经济和文化的不同,导致了网络成人内容监管法律的出台时间和具体措施的不同,其影响力已超越了言论自由和政治信仰对相关法律的影响力。(一)美国、加拿大等六国网络成人内容的概况

作者选取了美国、加拿大、德国、荷兰、日本和韩国等六国作为比较对象,它们分别分布在美洲、欧洲和亚洲,且同一洲内的两个国家彼此相邻。该选择方案是假设同一洲内相邻两国对“色情”或“淫秽”的认知基本一致,来探讨他们法律背后的经济文化因素。

在进行对比之前,先对美国、加拿大、德国、荷兰、日本和韩国等六国与网络成人内容相关的基本情况作大致介绍,如表2-1所示。表2-1 六国基本情况①World Internet Stats,Jun. 30,2010,http://www.internetworldstats.com/stats.htm,2012年12月访问②IBM Global Technology Services,IBM Internet security systems X-Force 2008 trend & risk report,Page 89,Jan. 2009,https://www-935.ibm.com/services/us/iss/xforce/trendre-ports/xforce-2008-annual-report.pdf,2012年12月访问③张建敏,发达国家的互联网色情审查,网络信息安全,2007,(7):74-75.④赵源,论美国文化与美国外交,上海:上海外国语大学,2004.⑤Lyne Casavant,James R. Robertson. The evolution of pornography law in Canada,Parliamentary Information and Research Service,Oct. 25,2007,Page 20.⑥朱红,美加文化差异及加拿大多元文化研究,硕士学位论文,吉林:吉林大学,2007.①毕研韬,各国对网络色情的控制手段,网络信息安全,2007,(8):70-73.②方厚升,辜鸿铭与德国,博士学位论文,上海:上海外国语大学,2007.③潘芳,从文化视角分析德国高校道德教育的内容及实施途径,理论观察,2009,(5):128-130.④Dutch Penal Code(Article 240b),http://www.ictparliament.org/node/1699,2012年12月访问.⑤汪珍,国际合作项目的跨文化风险管理,硕士学位论文,云南:昆明理工大学,2002.⑥BBC News,Web watchdog outlines porn battle,Oct. 24,2006,http://news.bbc.co.uk/2/hi/uk_news/6079706.stm,2012年12月访问.⑦Donnerstein and Linz,Mass media sexual violence and male viewers:current theory and research,American Behavioral Scientist,1986,29:601-618.⑧潘畅和,论日本与韩国文化机质的不同特色,日本学刊,2006,(5):107-116.⑨王娟,网络色情信息的法律规制,硕士学位论文,北京:中国政法大学,2009.⑩D. Zillman and J.B. Weaver,Effects of prolonged exposure to gratuitous media viol-ence on provoked and unprovoked hostile behavior,Journal of Applied Social Psychology,1999,29(1):145-165.

总体来说,上述六国互联网的渗透率都在75%以上,即网民数量占全部人口的70-90%之间;而网络色情产量的比例以美国为最,超过了50%,其出台的首部专门法律生效的年份也最晚(2003年),比最早出台专门法律的韩国晚了8年。从表2-1中列出的有关国家的部分文化特征,可以看出相关法律受经济和文化因素制约的一些端倪。以下将按美洲、亚洲和欧洲的顺序依次进行详细阐述。

1. 美洲美加两国网络成人监管的状况(1)美国宪法第一修正案对网络成人监管的影响力

美国于1791年通过的宪法第一修正案是这样表述的:“国会不得制定关于下列事项的法律:确立国教或禁止信教自由;剥夺言论自由或出版自由;或剥夺人民和平集会和向政府请愿伸冤的权利。”以此为依据,美国公民自由联盟(American Civil Liberties Union,ACLU)等民间组织先后三次向最高法院起诉国会通过的《通信规范法(Communication Decency Act)》、《儿童色情防治法(Children Pornography Prevention Act)》和《儿童在线保护法(Child Online Pro-tection Act)》违宪。

这三项法案的最终都因被最高法院裁定违宪而失效。即使是2003年最终生效的《儿童互联网保护法(Children's Internet Protection Act)》,其应诉过程也是历尽坎坷。其主要的司法实践在事实上被局限在学校和图书馆。而围绕《儿童在线保护法(Child Online Pro-tection Act)》存废的诉讼过程更是长达10年。《PC World》为此配发的一则评论颇能体现美国社会对此事的认识:我始终认为监护儿童的网上活动应该是父母的责任,网页过滤软件有很多,而且许多是免费的。特别是在当下,政府有更要紧的事去做,而不是去做一个保姆监护小孩上网。

与此相比,《爱国者法案(USA Patriot Act)》的部分条款虽屡遭包括美国公民自由联盟在内的多个民间组织质疑,其违反包括宪法第一修正案在内的多项公民基本权利,却一直在国会的不断修缮、政府的积极配合和法院的审慎判决下,避免了相关条款失效的命运。

以2004年发生的第一起《爱国者法案》被诉违宪为例,负责处理该案的美国地区法院虽然认为该法案中“向恐怖组织提供专业建议和协助将面临处罚”的条款过于模糊,会导致一些明显受到宪法第一修正案保护的言论也被定罪,比如人道主义法律项目向库尔德工人党和泰米尔猛虎两个恐怖组织提供的人权训练和非暴力的合法活动。法院一方面裁定人道主义法律项目的上述活动不受爱国者法案相应条款的限制,但却在另一方面拒绝发出该条款的全国禁制令。

通过宪法第一修正案对美国网络成人内容监管法律和《爱国者法案》有关条款最终命运的不同影响,可以发现:在提交送审的网络成人内容管制法律中,父母为婴儿拍摄没穿衣服的纪念照、艺术家的人体艺术创作和有关性教育的严肃出版物都有可能因为对“色情”或“淫秽”的模糊且不统一的定义而受到制裁,最高法院依据宪法第一修正案对这些法律做出了严厉的违宪审查,导致多部法案因此失效。而在送审的《爱国者法案》中,尽管部分条款也会明显受到宪法第一修正案保护的言论被定罪,但是地区法院却拒绝发出相关条款的全国禁制令。由此,我们认为,即使在美国,对言论自由的尊重程度不是无限的,言论自由的影响力也是相对的、有限的。(2)经济因素成为网络成人内容监管法律的重要考量

美国是网络成人内容的产业大国,这一特点促使学者们不得不去探讨经济因素对其监管法律的影响,而这在许多论及有关法律的研究文献中却被忽视。事实上,佛罗里达家庭联盟(Florida Family Association,FFA)在其2005年的工作成就报告中将起诉有关法律违宪的始作俑者直接说成是色情小说作家和色情画家。该联盟应美国司法部的要求,提交了一份名为《儿童接触色情图片,美国领先世界》的研究报告。该报告通过采用该联盟自己研发的色情爬虫软件,分析了数百万个链接背后的20家公司,这些公司提供了超过70%的色情图片。

早在2002年,美国国家研究委员会就披露了网络成人内容产业的盈利模式。该委员会应美国国会要求,撰写了《青少年、色情和互联网》的报告,其中指出:网络成人内容产业的利润来自线上和线下两部分,最大的一部分来自终端用户登陆色情网站时的信用卡消费。

在这种盈利模式下,因年龄限制而无法成为信用卡持有人的儿童,理论上不可能受到色情网站的侵蚀。然而,实际情况并非如此。因为除了该盈利模式外,网站经营者还可以从广告商的广告费中获得利益分成,特别是三大广告盈利模式(“按显示次数分成”、“按点击次数分成”和“按新客户分成”)中的前两种并不区分终端用户是否持有信用卡。

也就是说无论终端用户是成人还是小孩,都能给网站经营者带来利润。这样一来,那些唯利是图的网站经营者就会在网站上通过放置一些吸引人眼球的成人内容来诱使人浏览或点击其中的广告链接,这实际上是将其网站的出口流量卖给了广告商。

采用上述方法的公司一年可以赚到80-100万美元。尽管理性的广告商会慎重考虑广告被点击后的实际效果(即是否促进了有关商品的销售),但是如果那些没有购买力的儿童在点击流量中所占的比例过大,广告商会考虑降低网站经营者的提成;而对于网站经营者来说,儿童点击毕竟能带来可观的流量,所以网站经营者本身不会采取相应措施封闭儿童的点击。

该报告估计,美国网络成人内容产业每年的利润在10亿美元左右,有专家估计2005年之后已达到50-70亿美元。从2006年起,美国网络成人内容产业这个规模已经超过了美国三大媒体公司(美洲广播公司、哥伦比亚广播公司和国家广播公司)盈利的总和。美国新闻界乃至整个美国社会享有盛誉的哥伦比亚广播公司60分钟深谈栏目(CBS 60 minutes overtime)于2003年11月21日做了一期题为《色情在美国》的严肃访谈节目,内容全文公布在网上。该期节目中采访了名叫Bill Lyon的资深说客,他当时主持自由言论联盟(free speech coalition)。该联盟是一个代表色情行业中900家公司的商业组织。据他透露,加尼福利亚色情行业的从业人员超过12000人,仅加尼福利亚一处,该行业每年缴纳利税3600万美元以上;还有一些在纽约股票交易所上市的著名企业也参与到了这个行业中来,比如通用汽车旗下的Hughes Technology,该公司通过EchoStar和DirectTV用卫星转播成人节目,比如全国所有的顶级光纤运营商,从时代华纳到Cablevision,均向他们的付费用户发送露骨的色情材料,只是他们没有在年度报告中公开而已。

由此可见,美国的网络成人内容产业经过高度复杂的商业化运作,形成了一个规模庞大的高利润地下产业。这个行业从保护自己既得利益的角度出发,通过支付巨额律师费聘用游说团体(美国公民自由联盟从其代理的官司中收取律师费)的形式,以宪法第一修正案为掩护,对试图约束其发展的相关监管法律的出台施加影响,不惜与政府展开长达10年的法律诉讼,最终使得包括《通信规范法》等早在1996年就相继签署的三部重要监管法案失效。

在网络成人产业的地区分布中,加拿大并不是公认的网络成人内容产业大国,就其内容的产量而言,尚不足美国的十分之一。其刑事法典中第一个有关网络成人内容管制的条款修正案C-15A法案于2002年6月4日获得批准,短短1个多月之后,于同年7月23日正式生效,至今没有遭违宪审查的记录。

为避免重蹈网络成人内容产业做大后阻挠国家履行社会责任的覆辙,美国和加拿大对以儿童为内容的色情材料或者以儿童为色情传播对象的行为采取了异常严厉的刑事处罚措施。这在2010年8月美国联邦政府司法部致国会的报告《杜绝剥削儿童的国家战略》和加拿大的有关研究文献中体现得非常充分,其中就包括了对儿童色情产业这一经济因素的防患于未然的策略考虑。

2. 亚洲日韩两国网络成人监管的状况

1990年,日本成人漫画的销售额就超过了1800亿日元,即使以120比1的对美元汇率计算,也有15亿美元之巨,仅这一项就与2002年美国整个网络成人内容产业的规模不相上下。据统计,1994年日本生产了大约14000部成人视频,而美国同期只生产了2500部。因此,日本作为网络成人内容产业大国的地位绝对不能小视。

这样看来,1991年2月,当时日本国会中占绝对多数席位的日本自民党提出立法管制成人漫画的动议胎死腹中就不足为奇了。日本的首部专门管制网络成人内容的法律《交友类网站限制法》直到2003年才最终出台。

除了成人内容产业本身出奇的庞大,基于自身经济利益的考量,阻止相应的管制法律出台以外,纵观日本成人内容监管法律的历史,与美国的监管状况迥然不同。即使美国的网络成人内容产业非常强大,态度强硬,但国会和政府却始终强烈要求抵制网络色情,而日本的网络成人监管并没有得到权力部门有利的支持,这就不得不促使我们在日本文化方面进行深入的探寻。美国夏威夷大学医学院教授Milton Diamond和日本政治科学国家研究中心的青少年犯罪研究部主任Ayako Uchiyama,联合撰写的论文《日本的色情、强奸和性犯罪》,对日本的色情文化进行了深入的研究。现将他们散落在全文各处与本文有关的研究结论或其引用的他人的结论简要地集中摘录如下:有人认为“历史上,色情就是日本文化的一个组成部分”。更准确地说,性爱和生育是日本文化的一个传统。宗庙、春宫故事以及那些或明或暗地彰显性符号的艺术并没有包含像西方那样有关羞耻感和性原罪方面的内容。传统上,这种性观念与儒家文化中通过生育子女来巩固家庭和睦的思想是一致的,这些事物本身就是一种性教育的形式,而且是享受生活的一种途径。日本有着长达数个世纪的性暴露传统,它保留着最原始的性观念。二战结束后,西方的法律和道德观通过美国对日本的军事占领渗透进日本社会。比如曾经合法的卖淫在1958年被宣布为非法,卫生间和洗浴间也从那时起才开始按照性别进行区分。尽管色情图画被严厉禁止,可是色情文字小说(因为外国人很容易识别色情图画,可是色情文字小说因其用日文写成导致没有多少外国人看得懂)却依旧缓慢地出现在日本社会的各个角落,而且更加普遍、更加淫秽、更加地物神崇拜化。随着时间的推移,尽管日本法律对淫秽内容的禁止性规定并没有改变,可是对这些法律条文的解释却发生了改变。很多过去被认为是淫秽的内容在上世纪80年代后期不被认定为淫秽。到了1989年,日本出版科学研究所公布的合法出版物的统计数据中,《花花公子》和《闺阁》这两本色情杂志位列成年男性杂志最佳销售榜之中。进入90年代以后,尽管日本的《儿童福利法案》禁止未成年人卖淫,可是日本却没有一部专门的反儿童色情法律,以儿童为内容的露骨的色情材料在日本随处可见。现在,绝大多数对淫秽的指控只针对那些描写了被认为是变态和危险的极少数性行为(如群交和暴力强奸等)的视频文件或写实电影。

上述研究成果为我们分析美国和日本两个国家有关网络成人内容管制法律出台过程的差异提供了一个严谨的诠释角度,也就是说,在日本被广泛接受的色情文化使得很难像美国社会那样出现支持还是反对网络成人内容管制法律方面对立的两极。日本社会对色情文化危害性(特别是对未成年人)的“集体无意识”,甚至像许多学者指出的那样,“日本男性或女性通过浏览成人内容或参与其制作来逃避日常工作、社会和家庭责任带来的束缚”则恐怕是相关法律出台缓慢背后更为重要的深层文化原因。

需要指出的是,上述两位学者把“色情文化属于日本传统文化”在某种程度上部分地归因为受到了儒家文化的影响。尽管儒家文化的经典著作之一的《礼记》的《礼运篇》中确实记载了“饮食男女,人之大欲存焉”这句话,可是结合该句的上下文背景来理解,意在提醒为政者应该通过教化来规范人的物欲和情欲,而不应该坐视不管。因此,日本只是片面、不完整地引进了儒家文化的某一侧面。

日本的邻国韩国则与它有较大的差异。历史上朝鲜半岛是中原王朝的藩属,而且中国和朝鲜半岛毗邻,所以儒家文化对韩国文化的影响并没有因为明清时期海禁政策而减弱。潘畅和先生通过比较日韩两国分别最受欢迎的传统文学著作《忠臣藏》和《春香传》,形象地说明了日本和韩国两国存在相当巨大的文化差异。

德国柏林的洪堡大学维护的世界上最大的人类性学网络资料库中这样描述韩国的色情现象:朝鲜王朝独特的保守主义特征,使得朝鲜半岛相比于日本很晚才有发展有关色情的需求;直到18世纪,朝鲜半岛才出现本土生产的淫秽内容,但比日本要含蓄得多。20世纪70年代工业化浪潮后,各种各样的色情材料才像其他国家一样出现在社会上。

在这样的历史背景和文化传统下,2002年宽带网络普及率就位居世界第一的韩国,在1995年互联网刚刚开始兴起时就出台了新的《电信产业法(Telecommunication Business Law)》。该法规定:信息和通讯部长可以发布命令要求互联网服务提供商拒绝、停止和限制含有妨碍公序良俗和其它社会秩序内容的通讯。由于“妨碍公序良俗”过于模糊,该法律一度被韩国宪法法院裁定破坏言论和通信自由而违宪。

尽管如此,修改后的《电信产业法》中规定的非法信息仍然包括“淫秽”等内容,与修改前并没有太大区别。韩国信息和通讯道德委员会仍然依据该法和相关的其他法律比如《青少年保护法》等对网络色情进行整治。

3. 欧洲荷德两国的网络成人监管状况

荷兰阿姆斯特丹红灯区的“橱窗女郎”几乎成了这座城市的一道标志性风景。尽管荷兰整体的开放程度较高,但整个社会对儿童色情却表现出了异乎寻常的反感情绪(这背后体现了荷兰社会对剥削儿童的认识)。与前述四国不同的是,该国的警察部门负责具体执行过滤互联网儿童色情的任务。

由于儿童色情特别容易激起民众反感,如果对其控制措施进行理性的批评,会很容易被指责成不愿意全心全意阻止儿童色情,从而被归为“政治错误”一类,这是政治家们承受不起的。在这样的政治氛围下,阿姆斯特丹自由大学的计算机法律研究所和计算机安全研究与教育网的多位学者针对政府动用警力来过滤互联网儿童色情这一主题进行了认真的研究,包括两次深入到警察部门内部进行实地的访谈,为我们提供了一份难得的国别研究文献。

这份文献指出:社会对儿童色情的极度反感、民众对安全的顾虑优于隐私和管理阶层对技术的盲目推崇使得政府过滤互联网儿童色情的行政行为在很短时间内赢得了广泛支持。这一现象也在挪威、瑞士和丹麦等其他一些欧洲国家具有普遍性。但该文献也同时指出:尽管警察部门过滤互联网儿童色情确有荷兰刑事法典的相关条款作为依据,可是过滤技术本身却有着无法彻底消除的固有缺陷:漏判和误判。

特别是因误判而导致的网民无法正常浏览合法内容,将导致政府事实上做出了破坏宪法保护隐私(这些学者把互联网比作电话线路)和自由的行为。不仅如此,这种措施还迫使政府动用更多的警力来甄别机器自动生成的黑名单,这与警察以打击犯罪(比如揪出互联网儿童色情的幕后黑手)为核心的职业性质并不一致,况且过滤技术在打击儿童色情犯罪中的效果并没有经过独立机构的客观评估,它所起的作用是值得怀疑的。

因此,该文建议,应该像英国那样,把过滤互联网儿童色情的任务交给民间的行业组织(比如英国的互联网观察基金会,Internet Wat-ch Foundation)去做,由民间机构出面去完成政府想完成而又不好完成的任务。这些行业组织通过与互联网服务提供商签订过滤或“举报—删除”协议,把政府的强制行为变成出于双方自愿而签署的契约行为,既不会有违宪之虞,又把政府从违宪的漩涡中解脱出来。

表面上看该建议解决了两难的困扰,但真正执行,实际效果恐怕也大打折扣。因为美国国家研究委员会在其报告中曾经明确指出:像行业自律的模式,只在行业形成垄断、行业内部仅有的少数几个特别大的巨头公司才有效;而网络成人内容行业是竞争激烈、小公司林立的局面。

与部分荷兰学者把互联网看作电话线路不同的是,德国学界和立法机构普遍把互联网看作是信息高速“公路”。既然是公路,那么政府自然有权检查运行的车辆所运货物是否合法,这样一来,被部分荷兰学者所担忧的侵犯隐私权的问题就不存在了。

应该说德国的这种思维更接近互联网的技术本质,加上德国法律对互联网服务提供商法律责任的严谨规定,德国社会包括学术界在内,对隐私权保护的担忧并不十分突出。比如,德国的《多媒体法》规定互联网服务提供商责任的四个原则:

第一,互联网服务提供商应对自身制作的内容负责。

第二,如果互联网服务提供商知道他人制作的内容,能够采取技术措施避免其使用,而且可以合理地预见到应当避免其使用,则互联网服务提供商应对他人制作的而又由其提供给用户的内容负责,即互联网服务提供商应与内容制作者共同承担责任。

第三,互联网服务提供商对仅接受其接入服务的、由第三方提供的信息内容不承担责任。在这种情况下,责任承担者应是该内容的制作者和将信息发布到相关网络的一方。

第四,属于通信保密单位的互联网服务提供商(例如军方网站等)不承担禁止违法内容传播的义务。(二)我国网络成人内容的监管现状

我国于1994年4月20日接入国际互联网,被国际上正式承认为真正拥有全功能Internet的第77个国家。我国最早的互联网管理法规理论上可以追溯到1996年2月1日国务院发布的《中华人民共和国计算机信息网络国际联网管理暂行规定》,亦即正式接入国际互联网之后不到两年,就制定了首部专门的法规。这部法规的第十三条明确规定:“从事国际联网业务的单位和个人,……,不得制作、查阅、复制和传播妨碍社会治安的信息和淫秽色情等信息。”

到目前为止,有关部门相继颁布了一系列与互联网管理相关的法律法规,主要包括:《全国人民代表大会常务委员会关于维护互联网安全的决定》、《中华人民共和国电子签名法》、《中华人民共和国电信条例》、《互联网信息服务管理办法》、《中华人民共和国计算机信息系统安全保护条例》、《信息网络传播权保护条例》、《外商投资电信企业管理规定》、《计算机信息网络国际联网安全保护管理办法》、《互联网新闻信息服务管理规定》、《互联网电子公告服务管理规定》等。

另外,我国的《刑法》、《民法通则》、《著作权法》、《未成年人保护法》、《治安管理处罚法》等法律的相关条款都适用于互联网管理。在行业内部,不仅成立了网络媒体协会等组织规范行业行为,各大著名网站还联合发布了行业自律公约。在民间,成立了“妈妈评审团”,从关爱下一代的角度出发对网络内容提出评审建议。

在实际监管操作中,国家有关部委每年都联合开展互联网低俗内容整治专项行动。目前,我国对互联网成人内容的监管已经形成了多部门齐抓共管、形成合力的良好局面。经过不懈的努力,根据公安部门的统计,淫秽信息举报中所涉及的线索已经超过85%指向位于境外的服务器。

我国公安部甚至还与美国的联邦调查局开展执法合作,于2011年8月联合摧毁全球最大中文淫秽色情网站联盟“阳光娱乐联盟”,一举抓获在美国的主犯王某及在境内负责洗钱和维护网站的12名犯罪嫌疑人,彻底打掉境外最大淫秽色情源头。2013年10月,由中美两国警方发起,英国、法国、俄罗斯等15国及港澳台警方共同参与的打击儿童淫秽色情网站联合执法行动,历时半年,一举摧毁4个跨国儿童淫秽色情网站,抓获250余名犯罪嫌疑人。(三)域外网络成人内容监管法律的启示

在网络成人内容监管从严到松的整个光谱中,上述六国其实处于不同的坐标点,对各国监管网络成人内容的态度和力度则一目了然。有的国家采取了全面而严格的限制措施(如韩国);有的国家则依据严密的法律思维将其对青少年的影响降到最小(如德国);有的国家尽管制定了法律,但实际执行中却失之于宽松(如日本);有的国家则在经济与文化的博弈中达成了某种程度的妥协(如美国)。

这些域外网络成人内容监管法律给我国的网络成人监管带来一些启示:

第一:监管是原则,不监管(或者没有起到效果的监管)是例外。上述六国都有相应的监管法律。只是极个别国家的法律解释随着时间发生了变化(如前所述),以致在有些情况下,被其他国家视为违法的行为在该国并未受到追究。

第二:网络成人内容产业的利益链之顽固值得我们高度警惕。回顾前述美国网络成人内容监管的立法过程即可发现:并非其主流文化的缺乏对网络成人内容的反感基因,而是从网络成人内容产业获取高额经济利润的实体反向阻碍了相关监管政策的出台,其对社会主流价值观的巨大负面冲击难以计量。

第三,网络成人内容之所以屡禁不绝,除其能迎合人的低级需求外,高品质的网络视频产业的相对弱小则是其得以滋生的重要诱发因素。美国的网络成人内容产业确实庞大,但是其它高制作水准、展现美国社会主旋律的电影产业则更加庞大。我们在寄希望于国家强制力将低俗内容清除出网络受众视野的同时,还寄希望于国家花更大的力气培育高端视听产业,并让其走进千家万户;否则,低端的精神需求市场被清空而无高端的精神产品及时填充,已经取得的监管效果仍有丧失的可能。

三、浏览色情网页行为的信息化预警方法

由于上述国际通行的“监管是原则,不监管是例外”的做法,现在的互联网网关服务器一般都配置了网络行为审计的功能,不仅可以做到对色情网页地址的封禁,还可以做到对浏览色情网页的行为进行记录与统计。这是采用信息化的方法对浏览色情网页的行为进行预警的主要形式。

但是,上述预警方法还存在一些缺陷:(1)色情内容提供者为了规避公安、电信等部门的查禁而经常变换网页地址。针对这种情况,高级一些的互联网网关服务器通常需要维护一个量级在百万左右的色情网页地址库,并且需要做到实时更新。由此产生的高昂代价使得这种解决方法在实际上变得不可行。(2)为了不影响终端用户的浏览体验,通常只针对文字内容进行高速匹配。而以图片形式表现的内容,或者运营商的特殊要求(如尽量降低误检率等)则难以有效满足。

以上缺陷实际上要求工程技术人员对网页的具体内容,特别是图片,开发出一套有效的识别方法,以此来提高浏览色情网页的预警性能,减少对色情网页地址库的依赖。(一)研究现状

在海量网络信息中,快速准确地识别色情图片,将其用来作为对浏览色情网页行为进行预警、或者打击犯罪的证据等等,都需要图像处理技术的有力支持。在各种识别色情图片的方法中,依据它们的识别对象,大致可以将其分为两类:肤色检测和特征部位检测。

在肤色检测中,最直观的方法就是依据肤色的颜色范围来直接判断肤色区域。具体来说,就是在各种颜色空间(如RGB、YCbCr、HIS等)下,从肤色训练样本中得到其颜色的分布区间,然后选择一个合适的颜色空间和较小的颜色范围来确定肤色。Vladimir Vezhnev-ets Vassili等人在其文献中总结了两大肤色模型:一类无参数,指的是贝叶斯模型;另一类有参数,以高斯函数模型为主(后来还发展出了高斯混合模型及其相应的迭代求解方法)。在采用高斯混合模型来描述肤色性质的研究中,Weiming Hu等人的工作比较具有代表性,其创新之处在于通过直方图和对应颜色灰度级的数量来建模,最后得到一系列关于不同高斯概率密度函数个数的实验结果。D.A.Forsyth和M.M.Fleck等人提出了基于肤色和纹理的色情图片检测方法,首先是判断肤色区域,然后通过肤色区域判断四肢的部位,通过四肢部位来判断图像是否是色情图像。

特征部位(如乳头)是判断色情图片的重要依据。尽管有很多图片的肤色面积较大,却很有可能是艺术图像或者是比基尼泳装图片。Fuangkhon等人通过对图像进行预处理,然后用同构神经网络来识别特征部位。Yue Wang等人则采用adaboost算法来识别特征部位,然后通过特征部位的颜色特征来加强对特征部位的识别。

除了上述学术研究中只把肤色检测或者特征部位检测中的一种用作识别色情图片的方法外,现有的发明专利也是如此。比如“一种色情图像检测方法”通过将人脸区域面积与肤色区域面积的比值作为色情图片的判决依据。“基于内容的网络色情图像和不良图像检测系统”采用肤色检测以及基于肤色检测的姿态检测来识别色情图片。

在多种检测方法中,只采用其中的一种来检测色情图片,固然可以获得较低的漏检率(即没有检出色情图片的概率,拦截色情访问的浏览器客户端软件,如NetNanny和WebGuard,通常追求较低的漏检率),但这样获得的低漏检率实际上是以高虚警率(即将正常图片判定成色情图片)为代价的。与拦截色情访问的浏览器客户端软件不同的是,对浏览色情网页的行为进行预警,则更重视虚警率。重要原因有2个:一个是对色情的界定存在不同的认识,较低的虚警率有利于避免误判;另一个是过高的虚警率意味着在采用机器进行判读后,还要再投入大量的人力对结果进行校正。这是我们所不希望遭遇的情况。(二)基于肤色和特征部位联合检测的色情图片识别方法

针对上述问题,我们试图在已有的技术基础上,通过肤色检测和特征部位的联合检测,在允许一定的漏检率的前提下,进一步减小色情图片的虚警率。该方法具体分为样本训练的准备阶段、待检图像的识别阶段两个阶段。

1. 样本训练的准备阶段

在样本训练的准备阶段,分别围绕肤色样本训练和特征部位(如乳头。以下文字中,“乳头”与“特征部位”混用)样本训练展开。

在肤色样本的训练中,首先收集足够数量的肤色样本,获得肤色灰度直方图,然后通过高斯混合模型来逼近肤色灰度直方图,采用EM迭代算法(Entropy Maximization,熵最大化)求出模型参数。

在乳头样本训练中,首先收集足够数量的样本,然后通过Ada-boost算法训练出一个级联的分类器(级联数量最好在20个以上,本专利中使用的是一个25级的分类器)。

2. 待检图像的识别阶段

在待检图像的识别阶段,首先进行肤色检测,然后进行特征部位检测。

在肤色检测中,先将待检图像的长、宽分别等分10份,形成100个单元格。为了提高肤色检测的速度,取这些单元格的中心点作为该单元格的代表,也就是说,如果判定该中心点是肤色点,那么该中心点所处的单元格即为肤色格。在判定该中心点是否为肤色点时,将该中心点的灰度值分解到RGB空间中的R、G、B的三个分量上,代入到在准备阶段中建立的高斯混合模型中,获得其成为肤色点的概率,如果这三个分量都大于其相应的阈值,则判决该中心点为肤色点,所在的单元格为肤色格。对于划分的每一个单元格,都重复以上的判决,从而获得肤色区域。如果该肤色区域的面积占整个图像的1/2以上,则继续进行特征部位检测,否则不把该图像判决为色情图片。

在特征部位的检测中,首先运用在准备阶段中用Adaboost算法训练出来的级联分类器,对待检图像进行初检。然后对初检结果按照以下4个限制条件逐个进行筛查,只要有一个条件不符合,就判定该初检结果不是特征部位:1. 该初检结果的面积不超过整个图像的1/100;2. 该初检结果不在人脸上;3. 该初检结果距离最近的肤色区块不超过一个块长(10个像素);4. 该初检结果的边缘呈圆形。

通过以上4个限制条件筛查的初检结果称为终检结果。

如果这时终检结果至少有1个,那么整个图像就被判为色情图片。

该方法能有效降低色情图片的误检率,能尽可能地避免互联网上的正常图片被拦截,能够在浏览色情网页行为的预警方面提供信息化技术支持。

该方法的整个流程如图2-1所示。下一节将更加具体地描述本节中所涉及的算法和所需的参数。(三)具体实施方式

1. 样本训练的准备阶段

该准备阶段由建立高斯混合模型和采用Adaboost算法训练分类器(简称为“训练Adaboost分类器”)两个进程组成。这两个进程可以分开同时进行,也可以先后进行。在建立肤色的高斯混合模型时,我们采集了660个样本。在训练Adaboost分类器时,我们采集了402个正样本(乳头)和7500个负样本(不含乳头)。

在描述样本训练阶段的具体实施方式时,所用到的数学符号及其含义如表2-2所示。图2-1 基于肤色和特征部位联合检测的色情图片识别方法流程图表2-2 本节所用数学符号及其含义(1)建立高斯混合模型

设肤色样本的灰度值分布为X={x,x,…x}。由于肤色样本12n的灰度值分布通常出现多个峰值,所以需要采用多个高斯密度函数(高斯混合密度函数,或称高斯混合模型)的加权平均来逼近。设高斯密度函数的个数为M,则肤色样本的灰度值概率密度函数p(x)可表示为:

其中,g(x;μ,∑)是第k个高斯概率密度函数,μ是它的中kkk心点,∑是它的协方差矩阵,α是它的加权系数,满足:kk

通常,∑可表示为:k

则第k个高斯概率密度函数可表示为:

将上式对各参数进行微分,可以得到:

由(3)式,(1)式可以表示为:

可以假设x(i=1,2,…,n)之间为互相独立的事件,则发生iX={x,…,x}的概率密度为:1n2

由于X是已发生的事件,因此我们希望找出μ和σ值,使得kkp(x),亦即式(8)最大。令,也即求出下式的最大值,记为式(9)。

故对参数μ和σ求导,得:kk

令式(10)和式(11)为零,可得:

在(9)式中对参数α求导得时,因需要考虑(2)式,故引入拉k格朗日因子λ,并定义新目标函数为:

现在,以(12)、(13)和(14)为基础,通过迭代的方法,来求解参数向量:

[1]设定一个起始参数值,。可以令,并使用K-means方式来计算群聚的中心点,以此作为的值。

[2]使用来计算β(x),i=1,…n。ki

[3]把β(x)代入(12)求得新的μ,记为。kik

[4]把代入(13)中的μ,求得新的σ,记为。kk

[5]把β(x)代入(14)求得新的α,记为。kik

[6]令小于某一极小的容忍值,则停止。否则令,并返回步骤[2]。(2)训练Adaboost分类器

设二元组(c,y)表示样本图片c及其正负属性y,其中,i=1,iiii2,…,n。如果样本c是正样本,则y记为1;否则y记为0。设正样本iii有L个,负样本有L个。qv

训练Adaboost分类器的方法用Matlab风格的伪代码如图2-2所示。图2-2 训练Adaboost分类器的步骤

弱分类器hj(c)可表示为:

其中,D表示不等号的方向可以根据实际情况调整。S是特征值fjjj的阈值。弱分类器的训练方法是:将样本的特征值f按升序排列,再j将阈值S设在能让被分类错误的样本数量最少的地方。j

2. 待测图像的识别阶段

在肤色检测中,先将待检图像划分成边长为10个像素的网格。为了提高肤色检测的速度,取这些单元格的中心点作为该单元格的代表,也就是说,如果判定该中心点是肤色点,那么该中心点所处的单元格即为肤色格。

在判定该中心点是否为肤色点时,将该中心点的灰度值分解到RGB空间中的R、G、B的三个分量上,代入到在准备阶段中建立的高斯混合模型(综合考虑建模时间和建模精度,本方法所建立的高斯混合模型的参数如表2-3所示)中,获得其成为肤色点的概率。如果这三个分量都大于其相应的阈值,则判决该中心点为肤色点,所在的单元格为肤色格。表2-3 高斯混合模型(M=5)的参数表

对于划分的每一个单元格,都重复以上的判决,从而获得肤色区域。如果该肤色区域的面积占整个图像的1/2以上,则继续进行特征部位检测,否则不把该图像判决为色情图片。

在特征部位的检测中,首先运用在准备阶段中用Adaboost算法训练出来的一个25级的级联分类器,对待检图像进行初检。然后对初检结果按照以下4个限制条件逐个进行筛查,只要有一个条件不符合,就判定该初检结果不是特征部位:

[1]该初检结果的面积不超过整个图像的1/100;

[2]该初检结果不在人脸上;

在判断初检结果是否满足该限制条件时,首先,采用人脸检测算法检测人脸是否存在,如果不存在人脸,则初检结果当然不在人脸上,即初检结果符合该限制条件。如果检测出了人脸,则接着判断该初检结果的覆盖区域是否与人脸的覆盖区域存在重合的部分。如果重合,则认为初检结果位于人脸,否则该初检结果不在人脸上。

[3]该初检结果距离最近的肤色区块不超过一个块长(10个像素);

设置此项限制条件的考虑是排除距离肤色区域很远的初检结果。如果这些初检结果不在人体皮肤上,自然就不是特征部位了。

[4]该初检结果的边缘呈圆形。

如前文所述,这里所指的特征部位与乳头混用,考虑到乳头周围存在一圈乳晕,而这个乳晕的形状接近圆形。因此可以通过hough变换检测圆的方法检测乳晕。所以如果该初检结果的边缘不是圆形,则自然不是特征部位了。

通过以上4个限制条件筛查的初检结果称为终检结果。如果这时终检结果至少有1个,那么整个图像就被判为色情图片。

为了测试皮肤和特征部位联合检测(Skin Nipple Joint Detection,缩写为SNJD)的效果,选择了166张正样本和720张负样本用于测试,分别和单一肤色检测算法(Single Skin Detection,缩写为SSD)和单一特征部位检测算法(Single Nipple Detection,缩写为SND)进行了比较。(四)实施效果

为了体现一般性,正样本中包含了很多种类。其中包括单人的,多人的,室内的,室外的,以及特征裸露的。负样本图片分为两个部分。一部分是不含比基尼的正常图片,另外一部分是含有比基尼的正常图片。

我们一共进行了10次测试。其中,比基尼占负样本图片比例各不相同,依次是10%、20%、…、100%。每次测试的指标包括误检率和运行时间,结果如图2-3和图2-4所示。图2-3 参加比较的3种算法的虚警率图2-4 参加比较的3种算法的运行时间

在图2-3和图2-4两幅图中,我们可以发现:(1)尽管SSD的运行速度很快,但是虚警率过高;(2)SNJD在运行速度上和SND基本相同,但SNJD的虚警率与SND相比,降低了20%左右;(3)SNJD的运行时间虽然是SSD的3倍,但虚警率却只有后者的1/5。据此,可以认为SNJD的综合性能最佳。(五)推广应用

本章第(二)节中提出的旨在降低虚警率的色情图片识别方法还可以用在其它方面,比如色情视频的识别。对色情视频的识别也是针对未来可能出现的——网页中并不出现色情文字或图片,但却在网络传输中出现色情影像——的情况(过去和现在都出现过的“裸聊”即是这一情况的雏形)所做的技术准备。另外,互联网行业的主管部门对网络视频内容进行监管、固定网络色情犯罪的电子证据或者电信、移动等运营商检查用户上传的海量文件合法性时,也都可以借鉴这种虚警率很低的色情图片识别方法。

由于欧美等国的绝大多数成人网站不对没有信用卡的青少年开放,因此这些国家对不良内容的检测主要局限在图像层面(即检测成人网站首页的不良图像)。与欧美国家相比,把色情视频作为一个整体来检测的研究在我国更活跃一些。例如吕丽等人提出4点约束光流算法提取关键帧,以减少检测色情视频的计算量,刘艳民提出把往复运动作为色情视频的运动特征。

一段视频的组织结构可以分为场景、镜头和图像等3个层面。在语义上,一段视频由一系列具有相对完整涵义的场景组成。一个场景由一系列相对独立的镜头组成。一个镜头又由一系列连续的图像组成。

对于一段较长的视频,色情镜头和正常镜头一般同时存在,为了能够区分这两种信息,需要首先将镜头分割,然后以镜头为单位进行判断。镜头分割包括基于直方图的方法和基于内容的聚类等多种方法。前者速度快,精确性稍低。后者速度慢,精确性较高。考虑到视频检测的实时性要求,在我们考虑对第(二)节所提方法进行推广应用时,选择改进后的直方图法快速分割镜头。

分割镜头后,在图像识别之前还需要做的一项预处理工作是提取关键帧。提取关键帧的方法按照其思路是否关注相邻两帧之间的联系及其关注程度,可分为直方图平均法、光流法和PCA法。下面,将色情视频识别的整个过程三大步骤中除最后一步(色情图片识别)外的前两个步骤(镜头分割和关键帧提取)阐述如下。

1. 推广的步骤(1)镜头分割

采用直方图法分割镜头所依据的假设是镜头变换的边界绝大多数出现在2个直方图差异较大的视频帧之间。在实际操作中,如果这种差异超过了某个阈值,则判为发生了一次镜头变换。

在计算直方图时,我们采用参考文献中的分块计算思路,以突出场景变换的重要性。但不同之处在于我们的分块在RGB空间进行。不仅如此,我们还考虑到不良视频的画面顶部和底部很少有广告或新闻字幕出现,因此采用均匀分块,将图像划为3 × 3个矩形块,且每块的直方图的权重相同。我们将相邻帧的相应块的直方图的差异的绝对值相加之后获得相邻帧的直方图差异度。

在设定判定镜头变换的直方图差异度阈值时,我们采用文献中提到的方法自适应地调整阈值。首先给滑动窗口设定一个固定长度,并假设该窗口内最多只能发生一次镜头变换。当该窗口在整个视频的时间线上滑动时,计算该窗口中的每对相邻帧的直方图差异度,如果某对相邻帧的直方图之差超过了该窗口内所有差异度平均值的3倍,则该对相邻帧就是镜头变换的边界。与上述文献不同的是,为了进一步减少计算量,没有采用Chi平方测度法计算帧间直方图差,而是如式(1)所示,按照帧间直方图差的定义直接计算D(f,f)。i-1i

其中,M是帧图像的像素总数;N为灰度级数;h(k)是灰度图i像i在灰度级k处的像素总数。(2)关键帧提取

我们采用LK算法计算光流,通过寻找光流的极小值,从而提取关键帧。具体来说,对于P点(x,y)的光流(V,V),设I、I和Ixyxyt分别是P点的亮度在X、Y和时间轴T上的梯度。根据光流约束方程:IxVx+IyVy+It=0 (2)

取P(x,y)周围相邻的8个点q(i=1,2,…,8),代入式i(2),得到:I(q)V+I(q)V=-I(q) (3)xixyiyti

通过最小二乘法获得式(3)的解为:T-1(V,V)=(AA)Ab (4)xyTT

其中,A和b均是矩阵变量。

式(4)即采用LK算法计算光流的解。选取所有光流之和最小的帧作为关键帧。LK方法的优点不仅在于不用迭代,计算量较小,而且参数的选择较少,方便调试。

2. 应用的效果

在完成1、2两大步骤和第(二)节所提方法之后,我们对像这样采用了基于肤色和特征部位联合检测的色情图片识别方法的色情视频识别技术进行了整体测验。色情视频的识别准则是:如果超过3个关键帧被判决为色情图片,则该视频为色情视频。

测验前的有关参数如下:总共选取不同光照、背景的48段不良视频和47段正常视频。它们的帧率都在25 f/s-30 f/s之间,播放时长在3-10分钟不等。测验在Pentium(R)双核E2140-1.6 GHz、内存1 GB的PC机上进行。

经过测验,在准确性方面:不良视频的识别率为75%,虚警率为8.5%。在速度方面:经过镜头分割和关键帧提取后,参加色情图像检测的关键帧只占视频总帧数的0.5%-1.5%,极大降低了识别色情图像的工作量。如果将镜头分割、关键帧提取和不良图像识别的时间都计算在内,那么检测速度在20 f/s-25 f/s之间,几与视频的帧率相当,较好地满足了实时性要求,可以做到边播放边检测。

第三章 网络游戏成瘾的争议及其信息化预警方法

一、网络游戏成瘾的研究现状

网络游戏本身可以划分为两类,一类是场景预设型游戏,用户在预定的规则下进行游戏,大都为对抗性游戏,主要满足用户的攻击需求;另一类是用户定制型游戏,用户可以自定义游戏规则,乃至通过修改公开源码来上传新的游戏内容,大都为简单的互动休闲游戏,主要满足用户的社交需求。我们研究网络游戏成瘾现象,不仅可以摸索及时发现这种现象的方法,及时预警,而且对于分析游戏设计成功的重要因素(即增加玩家粘度),提升严肃游戏或者教育用途的游戏设计与开发具有重要的促进作用。而这方面恰好是已有的研究所欠缺的。

然而,学术界对于一个最基本的概念——网络游戏成瘾——尚存在较为严重的争议,尚未形成一致的意见。这是我们始料未及,但又在情理之中的。说它在情理之中,是因为毕竟互联网的兴起是最近20年才发生的事情,而将网络游戏成瘾确定为一项心理疾患尚需长期的临床观察,甚至需要观察网络游戏成瘾“患者”的下一代的基因变化。(一)关于网络游戏成瘾概念的争论

美国成瘾医学学会(American Society of Addiction Medicine)对成瘾的简版定义是:成瘾是大脑奖赏、动机、记忆及其有关回路的原发性慢性疾病。上述回路的机能障碍会引起生理、心理、社会和精神等方面的特异性表现。这些表现出现在患者病态地追求奖赏或者通过物质和其他行为来得到放松的过程中。成瘾的特征是:无法永久戒除、行为控制受损、渴求、对自身行为和与他人关系中的重要问题失去认识、情绪反应出现机能障碍。与其他慢性病相似,患者常陷入复发与缓解的周期中。如果不治疗或者不参加康复活动,成瘾会逐渐加重并导致残疾或者英年早逝。

尽管医学界对成瘾的上述界定是明确而具体的,但是,学术界对于“网络游戏成瘾”这一概念的内涵,在本书撰写之时,都还在争论之中。这一争论集中体现了网络游戏成瘾领域的研究现状,争论的结果还会直接影响网络游戏成瘾的诊断标准。因此,我们十分有必要对这场尚在进行的争论进行一番梳理。为了更好地陈述争论双方的观点,我们将认为这一概念已经完善的一派称为“完善派”,将认为这一概念还有重要缺陷的一派称为“缺陷派”。

在DSM-5(Diagnostic and Statistical Manual of Mental Disor-ders,《精神疾病诊断与统计手册》第5版)正式出版之前,通行了13年的DSM-IV-TR(《精神疾病诊断与统计手册》第4版的文字修订版)中只有唯一一个行为成瘾的诊断标准——病态赌博。有些医疗单位和学术机构根据各自的临床观察,在病态赌博的诊断标准的基础上,分别提出了不尽相同的网络游戏成瘾的诊断标准(如Grusser、Salguero、Wood等人的工作),相关的量表也有很多。但是,“缺陷派”认为网络游戏成瘾的研究在诊断标准的内容和致瘾机理这两大方面还存在重大缺陷。

在诊断标准的内容方面,“缺陷派”认为诸如认知显著性、耐受性和兴奋过度等特征应属于成瘾标准的外围特征。这些特征实际上是“正常”玩乐的特征,而不应该作为辨识成瘾行为的特征。剩下的诸如冲突、戒断反应、复发等才是成瘾标准的核心特征。

在致瘾机理方面,“缺陷派”认为目前对网络游戏致瘾机理的研究还很不充分,未能从“大脑奖赏、动机、记忆及其有关回路”这一“成瘾”定义的角度来回答网络游戏自身内在结构性特征是否具有致瘾性这一问题。“缺陷派”的这一质疑是难以回避的,因为与此形成鲜明对比的是病态赌博的致瘾机理已经研究得比较充分了,即赌博活动本身的内在结构特征具有致瘾性(见Dickerson、Griffiths、Ladouceur、Reid、Strickland等人的工作)。大体来说,病态赌博的致瘾机理是这样的。赌博者一旦在开始时受到小赢的激励,就会幻想大赢也会随之到来。他们还会误解统计学中有关“概率”或者“事件独立性”的概念,以为只要尝试足够多次,期待中的大赢一定会发生,甚至失败的次数越多,就越接近成功。人们去赌博的目的,不论是为了摆脱贫穷,还是因为坚信“人定胜天”,还是为了摆脱压力,还是为了摆脱糟糕的情绪,都需要大赢才能实现。但事实上,赌博者在实现他们的目的的过程中,常常会输掉更多的钱。这样一来,就形成一个可怕的恶性循环:赌博者一开始赌博是因为他们想赢,但是到最后变成他们必须要赢,否则连生计都维持不下去。这就是赌博活动本身所具有的致瘾性内在结构特征。

相比而言,网络游戏致瘾机理的研究不仅很不充分,甚至已经开展的研究会提示我们:即使网络游戏能够致瘾,所谓的恶性循环也比病态赌博轻得多。以魔兽世界为例,该游戏除了通过声音、动画、颜色、场景吸引玩家以外,还通过设置击败游戏中的“恶龙”(以下简称“屠龙”)以夺取高质量的装备这一情节来吸引玩家。这是该游戏与通过赢取大奖来吸引玩家的赌博最相似的地方了。然而,仔细考察该游戏的环节设计,我们就会发现它与赌博之间其实存在着两个本质区别:首先,魔兽玩家一开始可能会执着于夺取某一件物品,但是根据游戏规则的设定,这件当初看来很珍贵的物品随着时间的推移会贬值;其次,魔兽玩家还抱团开发了DKP(Dragon Kill Points,即“屠龙点数”)系统,该系统尽最大可能降低“屠龙”之后遗产分配的随机性,按照多劳多得的原则尽量公平地在玩家之间分配遗产。以上两个特征与赌博里奖池越筑越高和侥幸取胜的特征截然相反,极大降低了诱使玩家陷入恶性循环而致瘾的可能性。这种区别会促使我们更加深入地思考究竟什么是赌博,什么是游戏。也许在某些情况下,正是因为难以分清什么是赌博,什么是游戏,所以DSM-5中关于网络游戏障碍的推荐诊断标准与赌博成瘾的诊断标准才那样相似(后文还会详述)。

事实上,究竟是什么原因导致玩家出现网络游戏成瘾的症状,是一个非常困难的研究课题。它不同于酒精、毒品等物质成瘾,可以通过分析生物化学过程来剖析其成瘾原因;它也不同于“病态赌博”这一到目前为止仍是唯一的一个医学界公认的行为成瘾,可以通过分析赌博行为内在的结构特征来解释其致瘾机理。它的主要困难不仅在于难以控制实验条件,更在于存在一条难以逾越的研究伦理:我们不能出于研究目的让一个本是正常的人暴露在可能具有强致瘾性的网络游戏中,坐视其成瘾,在没有任何有效的、可完全逆转的保护性措施出现之前,放任危害的发生。尽管上述鸿沟横亘在眼前,但还是有科研

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载