免疫优化理论及其应用(txt+pdf+epub+mobi电子书下载)


发布时间:2020-06-28 23:43:23

点击下载

作者:张瑜

出版社:湖北科学技术出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

免疫优化理论及其应用

免疫优化理论及其应用试读:

前言

自然界一直是人类各种技术思想、工程原理及重大发明的灵感源泉。层次各异、种类繁多的生物界经过长期的“优胜劣汰、适者生存”的自然进化过程,逐渐适应自然环境的变化,并得以生存与发展。人类也是自然界长期进化的产物。一部人类与人类智能的发展史更是一部仿生学发展史。

在仿生学研究中,人工智能是其研究的主攻方向。在人工智能研究领域,计算智能是一个主要研究方向,它以生物进化的观点认识和模拟智能,以数据为基础,通过训练建立联系,进行问题求解。而在计算智能领域,人工免疫系统理论与算法又是一个研究热点,已经引起了国内外学者的广泛关注和极大兴趣。

人工免疫系统以生物免疫系统的原理、机制和特性为理论基础,实现类似于生物免疫系统的抗原识别、细胞分化、记忆和自我调节的功能,主要应用于网络安全、计算机病毒检测、入侵检测、优化计算、模式识别等领域。本书汇总了作者在免疫优化算法、模型和理论等方面的基础研究,以及在恶意代码检测等网络安全应用方面的研究成果。

本书的研究内容和主要成果归纳如下:(1)提出了抗体、MHC和抗原三位一体的免疫进化算法体系。本算法体系突破了传统免疫算法的抗体/抗原二元结构,更加全面地模拟生物免疫系统中抗体在MHC(MajorHistocompat-ibilityComplex,主要组织相容性复合体)分子辅助下学习、记忆、识别和清除抗原的机制,提高了免疫进化算法的性能和效率,拓展了人工免疫系统算法研究思路。(2)提出了基于MHC的抗体克隆算法通用框架。该算法通用框架的主要特点是:①利用MHC分子的单倍型特性来保留优秀的父代抗体基因,并利用疫苗接种遗传给子代,以增强局部搜索能力并提高收敛速度;②利用MHC分子的多基因性和多态性以及随机引入部分新抗体来生成多样性的抗体群体,以防止群体早熟,从而增强全局搜索能力。

在此算法通用框架的基础上,针对多模态函数优化问题,设计了新的免疫优化算法MOAMHC。定义了抗体、MHC、抗原、亲和力、相似度等基本概念,设计了免疫选择算子、接种疫苗算子、变异算子以及MHC移位算子、MHC替换算子、MHC交叉算子及MHC变异算子。利用马尔可夫链理论分析了该算法的收敛性问题。MOAMHC算法的特点:①利用MHC单倍型特性来保存优秀抗体基因片段,以使优势基因得以在群体中扩散,可搜索局部最优值、提高群体的收敛速度;②利用MHC的多态性和多基因性直接促进抗体群的多样性,防止群体早熟,从而确保算法结束时搜索到全局最优值。通过14个基准测试函数,对比了MOAMHC算法和遗传算法SGA、典型克隆选择算法CLONALG的性能。实验表明,MOAMHC算法在求解精度、收敛速度、稳定性和解的多样性等方面,要优于SGA算法和CLONALG算法。

针对组合优化问题,设计了基于MHC的免疫优化算法COAMHC。定义了抗体、MHC、抗原、亲和力、相似度等基本概念,设计了免疫选择算子、接种疫苗算子、变异算子以及MHC系列算子。利用马尔可夫理论分析了COAMHC算法的收敛性问题。通过5个典型的TSP问题的求解,对比了COAMHC算法和克隆选择算法CLONALG的性能。实验表明,COAMHC算法在收敛速度和求解精度方面,要优于CLONALG算法。(3)提出了基于MHC的恶意代码检测模型MCDMHC。给出了模型中自体、非自体、MHC基因、抗体、检测器、抗原提呈、免疫识别等数学定义,建立了自体/非自体、MHC基因库、检测器自体耐受等动态演化模型。本检测模型的特点:①建立自体与非自体集动态演化模型,以解决自体集合完整性问题;②构建MHC基因库,利用基于MHC的抗体克隆算法动态生成检测器中的抗体;③建立检测器集合的动态演化模型,以解决检测器集合完备性问题。本模型利用疫苗接种来初始化未成熟检测器,提高检测器生成效率。在MHC基因库进化的基础上利用抗体克隆算法生成有限的获得非自体空间大规模覆盖的检测器集,从而克服了传统的基于免疫的恶意代码检测方法中因检测器集的完备性和自体集的完整性不够而导致的检测率低和误报率高的缺陷。与相关恶意代码检测方法进行的对比实验表明,本模型能对未知恶意代码进行高效检测,从而为恶意代码检测研究提供了一种新方法,为将生物免疫机制和特性应用于解决具体网络安全问题提供了一种新思路。

本书研究和探索生物免疫系统中抗体在MHC分子辅助下学习、记忆、识别并清除外来入侵抗原的机制和MHC分子所具有的特性(单倍型特性、多态性和多基因性)的基础上,针对数值优化、组合优化以及恶意代码检测等问题展开了深入研究,提出了基于MHC的抗体克隆算法和基于MHC的恶意代码检测模型,为人工免疫系统算法和模型研究提供了新思路。探索将生物免疫系统原理和免疫智能优化算法应用于解决恶意代码检测等网络安全实际问题,对解决目前的网络安全所面临的困境,具有重要的理论价值和广阔的应用前景。

本书共分为6章,每章的主要内容如下:

第1章绪论。介绍本书的研究背景、恶意代码检测研究现状及存在的问题、研究目的、研究意义、课题来源以及主要研究内容。

第2章人工免疫系统概况。首先,介绍了生物免疫系统的组成、机理,MHC分子特性以及克隆选择学说;然后,介绍了人工免疫系统的模型、算法和应用。

第3章基于MHC的多模态函数优化算法研究。首先,介绍了目前解决多模态函数优化问题所使用的方法及其优、缺点;其次,介绍了基于MHC的多模态函数优化算法的思想与具体设计实现;再次,理论分析了该算法的收敛性;最后,进行了数值仿真实验并与遗传算法和克隆选择算法做了对比,并对实验结果做了分析和讨论。

第4章基于MHC的组合优化算法研究。首先,介绍了目前组合优化算法所存在的问题;其次,介绍了基于MHC的组合优化算法的设计思想与具体的算法实现,包括算法的基本定义、算子的构造、算法的基本流程;然后,从理论上证明了算法的收敛性;最后,就TSP问题进行了同类算法实验对比,并对实验结果做了分析和讨论。

第5章基于MHC的恶意代码检测模型。本章详细介绍了模型的基本定义,包括自体、非自体、MHC基因、MHC基因库、抗体、检测器、抗原提呈、免疫识别等;然后,介绍了模型的体系结构、模型的检测流程以及模型的性能分析;最后,进行了恶意代码检测实验,并进行了同类研究对比,验证了该模型在未知恶意代码检测方面的有效性。

第6章结论与展望。本章对全书的研究成果进行了总结,分析了研究中存在的问题和不足,展望了今后的研究方向。

本书的结构如下图所示:

本书的出版是基于我的博士课题研究和近年来主持的海南省自然科学基金项目(610220)、浙江省信息安全重点实验室项目(2010ZISKL007)、海南师范大学博士科研项目(00203020214)等研究项目资助。尤其要感谢我的博士生导师、四川大学计算机学院李涛教授,感谢海南师范大学信息学院吴丽华教授、马生全教授,感谢浙江省电子产品检验所宋丽萍女士,感谢湖北科学技术出版社,感谢海南师范大学信息学院的领导与同事对我的大力支持与帮助。作者2010年11月第1章绪论1.1仿生学概述

古往今来,自然界一直是人类各种技术思想、工程原理及重大发明的灵感源泉。层次各异、种类繁多的生物界经过长期的“优胜劣汰、适者生存”的自然进化过程,逐渐适应自然环境的变化,并得以生存与发展。人类也是自然界长期进化的产物。在长期的生产实践中,人类以自己直立的身躯、能劳动创造的双手、交流情感和思想的语言,促进了神经系统尤其是大脑的高度发展。然而,人类的智慧不仅仅停留在观察和认识生物界的现象与规律上,而且还能运用人类所独有的思维和设计能力模仿生物的形态结构与功能,通过创造性的劳动来延展自身智能和扩展自身的能力。因此,我们可以这样来描述:人类源于自然,人类智能源于自然,人类创造能力更是源于自然。这也是仿生学一直不断发展、不断拓展新的应用领域的深层次根源。一部人类与人类智能的发展史更是一部仿生学发展史。

人类模仿鱼类的形体造船,以木桨仿鳍。相传早在大禹时期,我国古代劳动人民观察鱼在水中用尾巴的摇摆而游动、转弯,就在船尾上安置木桨。通过反复地观察、模仿和实践,逐渐改成橹和舵,增加了船的动力,掌握了使船转弯的手段。这样,即使在波涛滚滚的江河中,人们也能让船只航行自如。

人类模仿鸟类的形体制造飞行器,以机翼仿翅。据《韩非子》记载,鲁班用竹木作鸟,“成而飞之,三日不下”。意大利著名科学家兼画家达·芬奇和他的助手对鸟类进行仔细解剖,研究鸟的身体结构并认真观察鸟类的飞行,设计和制造了世界上第一架人造飞行器——扑翼机。

人类模仿鲸鱼的体形和鱼类的沉浮系统——鱼鳔,制造了潜水艇;模仿蝙蝠、海豚的回音定位系统而发明了声呐系统;模仿苍蝇的楫翅(又叫平衡棒)而制成了广泛应用于火箭和高速飞机上实现自动驾驶功能的振动陀螺仪;利用蝴蝶的色彩在花丛中不易被发现的道理,发明了迷彩服,在军事设施上覆盖蝴蝶花纹般的伪装;模仿蜻蜓的飞行原理而发明了直升机;模仿蜂类的蜂窝构造原理而发明了覆盖面广、节省材料的蜂窝式GMS移动通信系统;根据响尾蛇的颊窝能感觉到0.001℃的温度变化的原理,人类发明了跟踪追击的响尾蛇导弹;人类还利用蛙跳的原理设计了蛤蟆夯;人类模仿警犬的高灵敏嗅觉制成了用于侦缉的“电子警犬”;科学家根据野猪的鼻子测毒的奇特本领制成了世界上第一批防毒面具。

以上这些模仿生物形态构造和功能的发明与尝试,是人类仿生学的具体应用。随着科学技术的发展和人类社会的进步,将会出现越来越多的仿生产品应用于生产活动中。那么,什么是仿生学?

仿生学是研究生物系统的结构和性质,为工程技术提供新的设计思想及工作原理的科学。它是在20世纪中期才出现的一门新的边缘科学。仿生学研究生物体的结构、功能和工作原理,并将这些原理移植于工程技术之中,发明性能优越的仪器、装置和机器,创造新技术。

仿生学Bionics一词是1960年美国斯蒂尔根据拉丁文“bios”(生命方式的意思)和字尾“nic”(“具有……的性质”的意思)构成的。仿生学的研究主要包括力学仿生、分子仿生、能量仿生、信息与控制仿生等。其中,信息与控制仿生是仿生学的主要领域。一方面由于自动化向智能控制发展的需要;另一方面是由于生物科学已发展到这样一个阶段,使研究大脑已成为对神经科学最大的挑战。人工智能和智能机器人研究是仿生学研究的主攻方向。1.2计算智能概述

人工智能主要研究用人工的方法和技术,模仿、延伸和扩展人的智能,实现机器智能。可把人工智能分成两大类:一类是符号智能,一类是计算智能。符号智能是以知识为基础,通过推理进行问题求解,即所谓的传统人工智能。计算智能是以数据为基础,通过训练建立联系,进行问题求解。

计算智能是以生物进化的观点认识和模拟智能。按照此观点,智能是在生物的遗传、变异、生长以及外部环境的自然选择中产生的。在用进废退、优胜劣汰的自然进化过程中,适应度高的(头脑)结构被保存下来,智能水平也随之提高。因此,可认为计算智能就是基于结构演化的智能。计算智能的主要方法有人工神经网络、遗传算法、遗传程序、演化程序、局部搜索、模拟退火等等。这些方法具有以下共同的要素:自适应的结构、随机产生的或指定的初始状态、适应度的评测函数、修改结构的操作、系统状态存储器、终止计算的条件、指示结果的方法、控制过程的参数。计算智能的这些方法具有自学习、自组织、自适应的特征和简单、通用、鲁棒性强、适于并行处理的优点,在并行搜索、联想记忆、模式识别、知识自动获取等方面得到了广泛的应用。

典型的代表,如遗传算法、免疫算法、模拟退火算法、蚁群算法、微粒群算法等仿生算法,都是基于“智慧源于自然”的理念,通过人们对自然界独特规律的认知,提取出适合获取知识的一套计算工具。而免疫算法是近年来在计算智能领域新兴的一类仿生算法,它基于生物免疫系统基本机制,从体细胞理论和网络理论得到启发,实现类似于生物免疫系统的抗原识别、细胞分化、记忆和自我调节的功能。免疫算法具有自组选择学习、全息容错记忆、辩证克隆仿真和协同免疫优化的启发式人工智能。由于该算法具有收敛速度快、求解精度高、稳定性能好,并有效克服了早熟和欺骗的问题,成为一种新兴的实用智能算法。1.3免疫算法及其应用

生物免疫系统(BiologyImmuneSystem, BIS)是一个分布式、自组织和具有动态平衡能力的自适应复杂系统。它对外界入侵抗原(Antigen, Ag),可由分布全身的不同种类的淋巴细胞产生相应的抗体(Antibody, Ab),其目标是尽可能保证整个生物系统的基本生理功能得到正常运转。人工免疫系统(ArtificialIm-muneSystem, AIS)就是研究、借鉴、利用生物免疫系统的原理、机制而发展起来的各种信息处理技术、计算技术及其在工程和科学中的应用而产生的多种智能系统的统称。从生物信息处理的角度看,可归为信息科学范畴,是计算智能研究领域中一个新的热点内容与研究方向。

免疫算法是基于免疫系统的学习算法,是人工免疫系统研究的主要内容之一。它具有良好的系统应答性和自主性,对干扰具有较强维持系统自平衡的能力。免疫算法模拟免疫系统独有的学习、记忆、识别等功能,具有较强模式分类能力,尤其对多模态问题的分析、处理和求解表现出较高的智能性和鲁棒性。1.3.1 免疫算法的发展

免疫算法和免疫系统的理论与应用的研究历史较短。相关理论可[1]追溯到1958年澳大利亚学者Burnet率先提出了克隆选择原理,1960年因此获得诺贝尔奖。1974年,诺贝尔奖得主、生物学家、医学[2]家、免疫学家Jerne提出了免疫网络理论并建立了数学模型,奠定了免疫计算的基础。之后Farmer、Perelson、Bers-ini、Varela等学者分别在1986年、1989年和1990年发表了有关论文,在免疫系统启发实际工程应用方面做出了突出贡献,他们的研究工作为建立有效的基[3,4]于免疫原理的计算系统和智能系统开辟了道路。1990年,Bersini[5,6]首次使用免疫算法来解决问题。20世纪末,Forrest等开始将免疫算法应用于计算机安全领域。近年来,免疫理论和算法已经引起了相关研究人员的极大关注。

1996年,在日本举行了基于免疫系统的国际专题讨论会,首次提出了“人工免疫系统”的概念。1997年和1998年IEEE Systems, ManandCybernetics国际会议还组织了相关专题讨论,并成立了“人工免疫系统及应用分会”。目前,世界上绝大多数人工免疫系统研究成果出自美国、英国、中国和日本。而巴西Campinas大学的[7-9]DeCastro博士最早在其博士论文中总结了人工免疫系统,并试图建立人工免疫系统的统一框架结构。取得显著成绩的主要有:利用免疫系统原理研究计算机安全的美国New Mexico大学计算机科学系的[5,6]Forrest博士;研究基于免疫原理的计算机安全和异常检测及工业[10,11]应用的Missouri大学计算机与数学系的Dasgupta博士;研究数据[12-16]分析的英国Kent大学的Timmis博士;研究计算机网路入侵的[17][18-20]King' s学院的Kim博士;威尔士大学Hunt和Cooke领导的ISYS研究小组等。[21]

在我国,西南交通大学的靳蕃教授等在1990年前后就已经指出“免疫系统所具有的信息处理与肌体防卫功能,从工程角度来看,具有非常深远的意义”。目前,国内在免疫优化算法理论与应用方面[22-24]的研究成果具有鲜明特色。其中,中国科学技术大学王煦法教授在国内较早开展免疫优化算法方面的研究,并扩展到基于免疫计算的[25-31]人工生命、进化硬件领域;西安电子科技大学焦李成教授的科研团队提出了具有较完备理论基础的免疫克隆算法及一系列改进,也在[32-53]国际上较早提出了新颖的免疫遗传算法;四川大学李涛教授的科研团队提出了基于免疫动态克隆选择算法。此外,哈尔滨工程大学莫

[54,55][56-59]宏伟博士科研团队、东华大学的丁永生教授科研团队,都先后对免疫算法及理论进行了研究,并提出了一系列免疫算法;重庆大[60-63]学的黄席樾教授系统总结了人工免疫系统理论;华中科技大学肖[64,65]人彬教授提出了工程免疫计算;北京信息科技大学杨孔雨教授总[66,67]结了免疫进化理论。笔者提出了基于MHC的抗体克隆算法等免疫优化算法。1.3.2 免疫算法的类型

免疫算法是基于免疫机理提出的高效学习和优化算法,是人工免疫系统理论研究的重要内容之一。常见的免疫算法类型有:

1.克隆选择算法(CSA:CloneSelectionAlgorithm)

由于生物免疫系统本身的复杂性,有关算法机理的描述还不多见,相关算法还比较少。CastroL D、KimJ、杜海峰、焦李成等基于抗体克隆选择机理相继提出了克隆选择算法。Nohara等基于抗体单元的功能提出了一种非网络的人工免疫系统模型。而目前两个比较有影响的人工免疫网络模型是Timmis等基于人工识别球(ArtificialRecognitionBall, AR)概念提出的资源受限人工免疫系统(Resource Limited ArtificialImmune System, RLAIS)和Leandro等模拟免疫网络响应抗原刺激过程提出的aiNet算法。

2.B细胞网络算法(B-cellAlgorthm)

以独特型网络理论和克隆选择理论为基础。Hunt等人模拟生物免疫系统的自学习、自组织机理提出一种人工免疫网络模型——B细胞网络及其算法。

算法将未知问题的解看作抗原,认为只要找到能产生最高亲和度抗体的B细胞,也就找到了未知问题的解。实验结果证明,该算法具有较强的寻优能力,并保持网络中多种模式和谐并存,有比人工神经网络更快、更好的模式识别能力。

3.否定选择算法(NSA:NegativeSelectionAlgorithm)

否定选择算法基于生物免疫系统的特异性,借鉴生物免疫系统T细胞生成时的“否定选择”(NegativeSelection)过程。For-rest研究了一种用于检测数据变化的阴性选择算法,用于解决计算机安全领域的问题。该算法通过系统对异常变化的成功监测而使免疫系统发挥作用,而监测成功的关键是系统能够分清自体和非自体的信息;随机产生检测器,删除那些测到自体的检测器,以使那些测到非自体的检测器保留下来。

4.免疫遗传算法(IGA:ImmuneGeneticAlgorithm)

免疫遗传算法可以看做一种新型融合算法,是一种改进的遗传算法,是具有免疫功能的遗传算法。该算法由西安电子科技大学焦李成教授提出。1.3.3 免疫算法的应用

免疫算法是模仿免疫系统抗原识别、抗原与抗体结合及抗体产生过程,并利用免疫系统多样性和记忆机理抽象得到的一种智能算法。

人工免疫系统(ArtificialImmuneSystem, AIS)是受生物免疫系统启发,模拟生物免疫系统功能、机理和特性来解决复杂问题的自适应系统。

生物免疫系统所具有的学习与记忆、特征提取、模式识别、模糊与概率检测以及多样性、鲁棒性、自适应性、动态性等有效机制与特性,对于人工信息系统的安全保障显然具有重要的借鉴意义。由此可见,人工免疫系统的研究不仅具有重要的理论价值,而且具有广阔的应用前景。

1.多模态函数优化

在科学研究和工程应用中的很多问题,都归结于选择一个最优[68]值,或者选择一个最优值和多个次优值。在数学上,可将其分别表示为求解单模态函数优化问题和多模态函数优化问题。

对于单模态函数优化问题(假设求其最大值),可形式化描述为

maxf(X) (X∈S),

式中,f(X)是目标函数;S是所有可行解的集合,称为解空间或搜索空间;X∈S为向量X的约束条件,可为线性或非线性不等式。显然,只要改变f(X)的符号,即可将最大值问题转化为最小值问题。

对于多模态函数优化问题,其特点是:目标函数的局部最优值多,全局最优值难以确定,或者目标函数有多个全局最优值或1个全局最优值和多个局部最优值。可形式化描述为

∀maxf(X) (X∈S)。

传统的数值优化求解方法,如最速下降法、共轭梯度法、Powell法等,尽管具有收敛速度快、求解精度高的优点,但却难以求出所有的局部最优值。借鉴生物界的自然选择与进化特性,人们提出了一些用于解决复杂优化问题的仿生算法,如遗传算法、蚁群算法、免疫算法、适应度分享算法、序列小生境算法等。诸如此类经典的进化算法大多只是简单地模拟达尔文进化,而忽略了Baldwin效应、Lamark效[69,70]应等非达尔文进化对个体学习与种群整体进化相互关系的作用,从而导致这些算法仍存在搜索效果不够理想、对复杂问题求解能力有限等不足之处。因此,继续深入探索和研究新的求解复杂优化问题的仿生算法仍是非常必要的。

2.组合优化

在诸如网络、调度、运输、布局等诸多工程应用和科学研究领域[71-73]的很多问题,都可归结为组合优化问题。组合优化问题可描述为:12nii令Ω={s, s, …, s}为所有状态构成的解空间,C(s)为状态s对应的**i目标函数值,要求寻找最优解s,使得∀s∈Ω, C(s)=m in iC(s)。组合优化涉及排序、分类、筛选等问题。典型的组合优化问题有TSP问题、加工调度问题、0-1背包问题、装箱问题、图着色问题、聚类问题等。组合优化问题的最优化求解非常困难,主要是存在“组合爆炸”问题。譬如,基于置换排列描述的n城市TSP问题有n!种可行排列,显然,状态数量随问题规模呈指数级增长。如计算机每秒处理1亿种排列,则穷举20城市问题的20!种排列需要几百年时间,如此巨大的计算量在目前是无法完成的,更不用说大规模问题的求解。因此,解决这类问题的关键在于寻求有效的优化算法。

3.网络安全

人工免疫技术主要是利用生物免疫机制和计算机安全的相似性,将生物免疫学的原理应用到计算机安全中。这种仿生学的方法在许多科研领域中都取得了骄人的成绩。生物免疫系统学习、识别未知病原体的机制为解决未知恶意代码检测问题提供了新的研究思路。

生物免疫系统的核心是自体与非自体的识别机制,借鉴这一机制,美国新墨西哥大学的Forrest等提出的一个简单的否定选择算法(Negativeselectionalgorithm)。其核心思想是:从随机生成的检测器集中删除和自体匹配的检测器,再用经历自体耐受而保存下的检测器去匹配非自体和待检测位串。在检测系统保持检测器集的完备性和自体集的完整性的前提下,Forrest证明了否定选择算法的有效性。[74-76]Dasgupta等研究表明,否定选择中检测器数量与问题呈指数关系。若检测器集不完备则将导致检测率降低,若自体集不完整则将导致误报率增高。因此,否定选择算法的关键问题是要产生足够多的覆盖非自体空间的检测器。

然而,在计算机网络应用系统的瞬息万变的复杂环境中,检测系统将面临3个主要问题:①由于程序的动态性,将难以获取完整的自体集合;②由于非自体集的空间异常之大,难以获取完整的非自体集合;③由于自体集合和非自体集合的完整性问题,将导致难以获得完备的检测器集合。因此,如何获取尽可能完备的检测器集合和完整的自体与非自体集合,一直是基于人工免疫原理的网络安全系统的研究难点。1.4研究内容

本书旨在深入探索和研究生物免疫系统中复杂的信息处理机制,尤其是抗体在MHC分子的辅助下快速学习、识别、记忆并清除外来入侵的未知抗原机制,针对网络安全领域设计高效的恶意代码检测模型,针对恶意代码检测器的生成等复杂优化问题设计了高效的免疫优化算法。在设计基于MHC和生物免疫系统的优化算法和恶意代码检测模型时,充分借鉴生物免疫学的理论研究成果,分析出对网络安全领域有重要启发意义的免疫学习与记忆、模式识别、多样性遗传、克隆选择、自学习和自组织性的实现机制,有效克服了传统的恶意代码检测系统自体/非自体定义缺乏灵活性、抗体(检测器)生成效率低、抗体多样性不足而导致误报率高等缺陷。

具体来说,本书研究内容包括以下几个方面。

1.基于MHC的多模态函数优化算法

算法理论基础:生物免疫系统中抗体识别抗原需满足如下3个条件:①抗原被MHC和抗原提呈细胞呈递至细胞表面;②抗体只能识别MHC-多肽复合物,即MHC限制性;③多样性抗体的生成。

由此可见,MHC分子在抗体识别抗原过程中扮演了非常重要的角色,起着重要的作用。具体体现为:①MHC参与抗原提呈;②抗体在MHC-多肽复合物的辅助下识别抗原(MHC限制性); ③MHC的多基因性和多态性促使多样性抗体的产生并识别抗原。MHC分子具有如下特性:①单倍型特性(Haplotype);②多基因性(Polygenism); ③多态性(Polymorphism)。

算法思想:求解多模态函数优化问题与抗体识别抗原问题具有很大的相似性,可对应于生物免疫系统中多个抗原能被抗体识别以及多个抗体能识别同一个抗原的机制。

算法设计:目标函数对应于抗原,目标函数的可行解对应于抗体。抗体在结构上由恒定区和可变区组成。恒定区由经过疫苗接种算子而获得的MHC基因组成,保持相对稳定;可变区由MHC基因和其他抗体基因片段组成,变化较大。抗体与抗原之间的亲和力视为可行解与目标函数值的接近程度。MHC是优秀抗体基因片段,即可行解中定长的一小段。

算法性能:①将MHC基因视为疫苗,将每一代的抗体进行疫苗接种,使得抗体在优势基因的基础上进化,从而增强其局部搜索能力与提高抗体群体的收敛速度;②将MHC视为抗体的组成成分,那么,MHC的多态性和多基因性便直接体现为抗体的多样性,同时,通过变异算子及随机引入的新抗体群,来共同提高其群体多样性,以防止群体早熟,从而确保算法结束时搜索到全局最优值。

2.基于MHC的组合优化算法

算法思想:生物免疫系统中,MHC分子所具有的特性以及在抗体识别抗原过程中的重要作用,为组合优化问题提供了一种新的研究思路。12n

组合优化问题可描述为:令Ω={s, s, …, s}为所有状态构成的解*ii空间,C(s)为状态s对应的目标函数值,要求寻找最优解s,使得*ii∀s∈Ω, C(s)=m in C(s)。TSP问题是一种典型的组合优化问题,是NP问题,它在某种程度上已成为对各种非线性优化方法的评价标[44]准。

算法设计:定义抗体为待求解TSP问题的可行路径,其结构由恒定区和可变区组成。恒定区由MHC基因组成,恒定不变;可变区由12iLMHC基因和可变基因片段组成。即抗体Ab= {x, x, …, x, x}, i∈N, L∈N,其中,L是城市的个数,i是对L个城市的编号。

在可行路径中,肯定包含一些相邻城市间距离最短的路径。定义MHC为优秀抗体基因片段,即可行路径中定长的一小段路径。抗体选择十进制编码,设其长度为L;所有抗体组成抗体空间S,抗体群NN的规模为N,则所有抗体群组成的空间称为状态空间S,则|S|NL(MHC)10+N-1=C ; MHC串长设为L。

定义抗原为待求解TSP问题的最短路径。

定义疫苗为TSP问题中两两城市间的距离最小值。在最佳路径的选取中,必然包含相邻城市间距离最短的路径。这是TSP问题自身的一种属性,也是解决问题时可利用的一种特征信息,故可提取作为疫苗。

定义亲和力为抗体与抗原之间的匹配程度。亲和力用于评估抗体能否进行克隆而进入子代群体,即亲和力高的抗体通过克隆进入子代,亲和力低的抗体则被淘汰。在本算法中,亲和力选择所求得路径距离的倒数,即

式中,f(x)表示在求TSP问题时抗体x对应的路径长度值;η是调节因子,视具体情况而定。这表明,在求解TSP问题时,如抗体x所对应的路径长度值越接近实际最短路径值,则其亲和力越大;反之越小。

定义相似度为抗体与抗体之间的相似程度。相似度用于评估抗体群的多样性,即在给定的相似度阈值范围内的两个抗体,可认为是同种抗体,否则认为是异种抗体。由于本算法采用城市的排列路径来编码,对于在函数优化中采用的二进制编码方案,已不能适用于用路径表示的编码方案。因此,对于在函数优化中所采用的r-连续位匹配方案也不再适用于TSP问题。为此,我们提出了循环比较法来评价抗体与抗体的相似度。

算法性能:①借鉴MHC分子的多态性和多基因性,本算法保持了较好的抗体多样性。②通过MHC分子的单倍型特性和MHC基因库,保留了优秀抗体的基因片段,再利用MHC基因进行疫苗接种,明显提高了算法的寻优速度。

3.基于MHC的恶意代码检测模型

模型理论:生物免疫系统的主要功能是在遭遇未知抗原入侵时,通过抗原提呈细胞和MHC分子学习该抗原,进化出与之匹配的最佳抗体,并消除该抗原以保持机体健康。生物免疫系统的本质就是如何区分自体和非自体的问题。

依照冯·诺依曼体系结构设计的计算机系统,其中的所有信息都是以二进制串存储的。鉴于二进制串在描述上的不便,引入了十六进制串的机器码表示。因此,恶意代码检测本质上就是一个根据一定的规则和先验知识,通过某种算法对十六进制串进行识别与分类的问题。鉴于网络安全系统与生物免疫系统所具有的功能相似性,我们借鉴生物免疫系统中的免疫原理和MHC分子特性,提出了一种基于MHC的恶意代码检测模型。模型设计方案如下。(1)定义自体与非自体,以及自体与非自体的动态演化模型。定义自体为计算机系统中正常的系统文件或应用文件,用Self表示。定义非自体为计算机系统中行为异常的可疑文件,用Nonself表示。定义P为所有计算机文件(程序)集。自体Self和非自体Nonself应当满足条件:Self⊂P, Nonself⊂P,Self∪Nonself=P,Self∩Nonself= ∅。(2)建立MHC基因库及MHC库动态演化模型。定义MHC是指优秀抗体基因片段,取自于恶意代码所共有的特征代码片段。其数学描述为:,H为十六进制数集,N为自然数。MHC模拟了生物免疫系统中MHC分子,即利用MHC分子的单倍型遗传特性来编码抗体恒定区,利用MHC分子的多态性和多基因性来获取多样性抗体。定义MHC基因库

G={g|∃y, y∈Ab, g=y.C∨g=y.V},

式中,Ab为检测器抗体集;C为抗体的恒定区;V为抗体的可变区。MHC基因库模拟了生物免疫系统某一染色体上一组紧密连锁的高度多态性的基因群,该基因群在免疫应答的启动和免疫调节中发挥重要作用。MHC基因库主要用于更有效地生成未成熟检测器,加快免疫应答,检测未知恶意代码。(3)抗原提呈。抗原提呈是从疑似恶意代码中提取其基因(特征码)以组成MHC基因库。抗原提呈模拟了生物免疫系统中抗原提呈细胞在MHC分子协助下摄取抗原分子的过程,主要用于系统对恶意代码的特征码的快速提取。(4)检测器生成。检测器集合由未成熟检测器和成熟检测器组成。未成熟检测器是还未经历自体耐受的检测器;通过了自体耐受而保留下来的未成熟检测器便进化为成熟检测器。成熟检测器负责扫描、检测计算机系统中已知或未知的恶意代码。未成熟检测器动态耐受模型模拟了生物免疫系统中未成熟抗体在骨髓中的生长发育过程。本书采取:①通过自体演化减少自体集合的大小;②由MHC基因库通过MHC替换、MHC交叉、MHC移位等基因进化措施促进抗体恒定区的MHC基因多维重组;③通过基因变异和免疫选择以及随机加入一定数目的新抗体,保持抗体群体的多样性;④通过接种疫苗,使得以MHC保存的优秀抗体基因直接遗传至抗体恒定区并保证抗体沿着尽快与抗原结合的方向进化的方法,既确保了抗体多样性,又提高未成熟检测器的生成效率。成熟检测器动态演化模型模拟了生物免疫系统中初次应答阶段抗体克隆选择过程,以及二次应答阶段的快速免疫反应机制。抗体识别抗原后,经历亲和力成熟过程,克隆增生为成熟抗体,用于检测已知的恶意代码;同时经过变异生成新的成熟抗体,用于检测未知恶意代码或已知恶意代码的变种。(5)免疫识别。免疫识别是通过抗体与抗原的亲和力来实现的,其核心是定义一个匹配阈值δ,大于该阈值的匹配则可认为该抗原是恶意代码。免疫识别不仅可识别同一种抗原,而且可对结构类似的抗原进行识别。因此,本模型在理论上不仅可检测已知恶意代码,还可检测未知恶意代码。第2章人工免疫系统2.1生物免疫系统简介

生物免疫系统是生物体抵御病原体侵犯最重要的保卫系统。免疫系统的主要元素为:免疫器官、免疫细胞、免疫分子。免疫系统的主要功能是:免疫防御、免疫稳定、免疫监督。免疫系统的主要类别有:固有免疫系统和自适应免疫系统。免疫系统的主要应答方式为:首次应答和二次应答。

以下将分别从生物免疫系统的组成、机理及MHC分子特性等方面简要介绍生物免疫系统。2.1.1 生物免疫系统组成[77]

生物免疫系统主要由免疫组织和器官、免疫细胞、免疫分子组成。2.1.1.1 免疫组织和器官

免疫组织和器官分布于身体各处,用于完成各种免疫防卫功能,主要是淋巴器官和淋巴组织。淋巴器官按功能可分为:中枢淋巴器官和外围淋巴器官。中枢淋巴器官主要由胸腺和骨髓组成,其功能是生成免疫细胞。外围淋巴器官主要由淋巴结、脾脏、扁桃体等组成,成熟的免疫细胞将在此执行免疫应答功能。淋巴细胞经血液循环和淋巴循环,进出淋巴组织和器官,构成免疫系统的完整网络,能及时动员免疫细胞聚集于病原体入侵部位,并由吞噬细胞将该抗原提呈至淋巴组织和淋巴器官,激活T细胞及B细胞,执行免疫应答功能。2.1.1.2 免疫细胞

免疫细胞主要有造血干细胞、淋巴细胞、第三群淋巴细胞和单核吞噬细胞。以下分别予以简介。

1.造血干细胞

造血干细胞(HemopoieticStem Cell, HSC)是存在于造血组织中的一群原始造血细胞,它不是组织固定细胞,可存在于造血组织及血液中。淋巴细胞是由造血干细胞分化、发育而来。例如,B细胞是在骨髓中生成的,骨髓中的HSC经过分化、发育,一部分成熟为B细胞,另有一部分从骨髓中迁移到胸腺,最终发育成T细胞。

2.淋巴细胞

淋巴细胞是具有特异免疫识别的细胞系,由形态相似、功能各异的细胞群组成。按其个体产生、表面分子和功能的不同,可将淋巴细胞分为B细胞和T细胞。(1)B细胞。B细胞(Bursaorbone marrow dependentlym-phocyte, BCell)是在骨髓中发育成熟的淋巴细胞。它受抗原刺激后可产生抗体的浆细胞。B细胞膜表面表达有表面免疫球蛋白(SurfaceImmunoglobulin, SIg),用于与抗原进行特异性结合。未成熟的B细胞都在骨髓中,成熟初期仍停留在骨髓中2~3天,待其表面的SIg表达完全后便离开骨髓进入血液循环,进而分布到外围免疫器官的非胸腺区。B细胞在受抗原刺激后,可在外围免疫器官中继续增殖分化成浆细胞,并分泌抗体。(2)T 细胞。T 细胞(Thymus-dependentlymphocyte, T Cell)是在胸腺中成熟的淋巴细胞。与B细胞表面的SIg一样,表达于T细胞表面的T细胞受体(TCellReceptor, TCR)可识别外来抗原并与之结合。T细胞源于骨髓干细胞,在胸腺中发育成熟。成熟的T细胞离开胸腺进入血液循环,分布到外围免疫器官的胸腺区,受抗原刺激后参与免疫应答。(3)第三群淋巴细胞。在淋巴细胞中,除B细胞和T细胞之外,还有一群没有表面标志的淋巴细胞,称之为第三群淋巴细胞。自然杀伤细胞(NaturalKillerCell, NK)是最常见的一种。NK细胞源于骨髓,主要存在于血液和淋巴组织中,特别是存在于脾脏中。NK细胞没有抗原识别受体,能非特异地杀伤肿瘤细胞和病毒感染细胞。

3.单核吞噬细胞

单核吞噬细胞(MononuclearPhagocyte, MP)源于骨髓干细胞,游离于血液中,具有很强的吞噬能力。它是主要的抗原提呈细胞,在特异性免疫应答的诱导和调节中起关键作用,广泛参与免疫应答、免疫效应和免疫调节。2.1.1.3 免疫分子

免疫分子主要有抗体分子和MHC分子。以下分别予以介绍。

1.抗体分子

抗体(Antibody, Ab)是B细胞识别抗原后克隆扩增分化为浆细胞所产生的一种免疫球蛋白分子。抗体分子的基本结构分为恒定区(Constantregion, C区)和可变区(Variableregion, V区),由4个肽链组成,其中有2条相同的分子量较小的轻链(Lightchain, L链)和2条相同的分子量较大的重链(Heavy chain, H链)。C区内的肽链氨基酸组成与排列相对稳定,而V区内的肽链氨基酸组成与排列随抗体结合抗原的特异性不同而不同。由于V区内的氨基酸组成与排列各异,故可形成结合不同抗原的特异性抗体。

抗体主要以3种方式参与免疫反应,即中和作用、调理作用和辅助作用。(1)中和作用。该免疫方式主要针对病毒和细胞内细菌的感染,用于防止病原体与靶细胞的结合。(2)调理作用。该免疫反应方式针对细胞外病原体感染。抗体与病原体表面结合,之后再与吞噬细胞表面的受体结合,将病原体带至吞噬细胞表面,使之易被吞噬。(3)辅助作用。该免疫反应方式也针对细胞外病原体感染。抗体与病原体表面结合后,激活补体,形成一种复合物。该复合物中的补体成分与吞噬细胞表面的相应补体受体结合,把病原体带至吞噬细胞表面,使之易被吞噬。

经过识别和刺激过程,B细胞会克隆、变异产生种类繁多的抗体,清除体内的病原体抗原。抗体结合抗原,是通过抗体表面的抗体决定基(Paratope)与抗原表面的抗原决定基(Epitope)之间模式互补匹配进行的。结合强度取决于模式匹配接近程度。抗体与抗原之间的匹配模式越接近,分子结合强度越大,识别效果越好。

2.MHC分子

MHC(MajorHistocompatibilityComplex,主要组织相容性复合体)分子是位于生物免疫系统某一染色体上一组紧密连锁的高度多态性的基因群,其基因产物不但参与移植排斥反应和T细胞的分化发育,而且在免疫应答的启动和免疫调节中发挥重要作用。

MHC分子主要分为两类:MHC-Ⅰ类和MHC-Ⅱ类。MHC-Ⅰ分子在每个细胞中都有,MHC-Ⅱ分子则只在免疫系统抗原提呈细胞上出现。

MHC分子具有如下的生物学特性:①单倍型遗传,即在遗传过程中MHC单倍型作为一个完整的遗传单位由亲代传给子代;②多态性,即MHC不同的等位基因,通过突变、基因转换或座位间的重组、外显子改组或座位内改组等机制,产生了多样化的多态序列,从而表现出高度的多态性;③多基因性,是指生物免疫系统中包含多种不同的MHC-Ⅰ类和MHC-Ⅱ类基因。

本书的2.1.4节将详细介绍MHC分子。2.1.2 生物免疫系统机理

免疫是机体的一种特异性生理反应,通过识别和排除抗原性异物来维持机体内环境的稳定,其功能是通过诸多免疫细胞和免疫分子之间的相互作用而实现的。生物免疫系统的机理主要有:免疫识别、免疫应答、免疫记忆、免疫调节、免疫耐受。下面将分别予以介绍。2.1.2.1 免疫识别

现代免疫学认为,免疫系统的主要功能是识别自己和排除异己。免疫识别(ImmuneRecognition)是免疫系统发挥免疫功能的重要前提。对于免疫识别现象,奥地利免疫学家Burnet提出了一种细胞克隆学说。该学说认为:在胚胎期,由于细胞的分化,体内形成了很多淋巴细胞系即克隆,每个淋巴细胞表面有一种特别的抗原受体。该淋巴细胞的抗原受体在识别相应的抗原后即发生特异性结合,会导致该克隆的淋巴细胞活化、增殖、分化,从而引起特异性免疫应答。2.1.2.2 免疫应答

免疫应答(ImmuneResponse)是指免疫细胞和免疫分子对抗原分子的识别、活化、分化和产生免疫效应的全过程。免疫应答一般由抗原引发,由多种免疫细胞参与的一系列反应。首先,抗原提呈细胞将抗原提呈给相应的T细胞;其次,活化后的T细胞通过细胞膜上的分子或分泌的细胞介素进一步活化其他免疫细胞,产生相应的免疫效应;最后,通过补体分子从细胞因子介导炎症反应,促进对抗原和靶细胞的吞噬,最终清除抗原并维持机体的平衡与稳定。

根据参与免疫应答的细胞类型和效应的不同,免疫应答可分为:B细胞介导的体液免疫应答和T细胞介导的细胞免疫应答。

体液免疫应答是指,B细胞在抗原刺激后,增殖分化为浆细胞,并分泌抗体的免疫应答过程。抗原初次进入机体后引起初次应答,其特点是:抗体产生慢,应答时间长。当机体再次遭遇相同的抗原刺激后将产生二次应答,其特点是:抗体产生快,应答时间短。二次应答是抗原直接刺激记忆B细胞,无需识别,直接进行免疫反应。

细胞免疫应答是指T细胞受抗原刺激后,增殖分化为致敏T细胞,致敏T细胞再次接触同种抗原时,通过胞毒T细胞(Cy-CtotoxicTCells, T)细胞的细胞毒作用及辅助T细胞(HelperT Cells, HT)细胞释放淋巴因子发挥细胞免疫作用的免疫应答过程。

现代免疫学认为,无论体液免疫应答或是细胞免疫应答,都是由多种细胞、多种因子参与的复杂生理过程,并受体内多个系统、多个因素的调控和制约。此外,这两种免疫应答方式具有如下共同点:①特异性,即表现为对相应抗原的特异性识别和特异性记忆;②受制于MHC; ③遵循二次应答规律。2.1.2.3 免疫记忆

免疫记忆(ImmuneMemory)是指当同种抗原再次入侵机体时,引起的比初次免疫更强的、亲和力更高的抗体产生现象。体液免疫和细胞免疫都有免疫记忆功能。

免疫记忆可解释为对特异性抗原应答的淋巴细胞数量增多的现象。图2.1所示为初次应答和二次应答中抗体数量随时间的演化关系。当抗原初次入侵机体时,潜伏期长,抗体数量少。当同种抗原再次入侵机体时,抗体数量明显增多,潜伏期较短。这是因为在初次应答过程中形成了特异性抗原的记忆细胞的缘故。图2.1 初次应答和二次应答中抗体数量与时间演化关系2.1.2.4 免疫调节

免疫调节(ImmuneRegulation)是指免疫应答过程中免疫系统内部各细胞间、免疫细胞与免疫分子间、免疫系统与其他系统(如神经系统、内分泌系统、遗传系统)间的相互作用,从而构成了一个相互协助又相互制约的网络,使免疫应答维持合适的强度以保证内环境的稳定。免疫调节主要有如下几个方面。(1)抗原的调节:在一定数量范围内,增加抗原浓度可增强免疫应答。随着抗原在体内的分解和消除而使浓度降低,进而使免疫应答逐渐减弱。此外,当两种抗原先后进入机体,先进入的抗原可抑制机体对后进入抗原的免疫应答。(2)抗体的调节:由特异性抗原刺激所产生的抗体,当其达到一定浓度时分泌便受到抑制。抗体与抗原结合后可促使吞噬细胞对抗原的吞噬,并加速该抗原的清除,从而减少了该抗原对免疫细胞的刺激,抑制了抗体的分泌。(3)抗体亲和力的调节:血清中的多克隆抗体对抗原的亲和力各异,从而导致免疫反应效力不同。随着免疫反应的进行,所生成抗体的亲和力会越来越高。这是克隆选择对抗体亲和力的调节。(4)免疫细胞的调节:参与免疫应答的各类免疫细胞中存在辅助性和抑制性细胞亚群,它们通过细胞间的直接接触或通过释放细胞因子,而导致刺激或抑制效应,使免疫应答在双相调节下表现出适当的强度。2.1.2.5 免疫耐受

免疫耐受(ImmuneTolerance)是指免疫活性细胞接触抗原性物质时表现出的一种特异性无应答状态。抗原入侵机体后可能导致免疫反应,也可能导致免疫耐受。在正常生理状况下,机体对自身组织抗原是耐受的,即自体耐受。如缺少这种自体耐受则会导致自身免疫疾病。

由于体细胞高频变异,随机产生的T细胞和B细胞受体可能会与自体结合。为保持自体耐受,一般有两种方法进行选择:①肯定选择法,即未成熟的T细胞抗原受体基因在胸腺中重组,能被自体MHC分子识别的将生存,否则将死亡;②否定选择法,即与自体氨基酸和MHC缩氨酸结合的免疫细胞将被克隆删除。2.1.3 抗体克隆选择原理

奥地利著名免疫学家Burnet等根据生物学和遗传学的进一步发展,特别是免疫学自身的发展,如对自身免疫、免疫耐受等现象的发现和启发下,于1959年提出了克隆选择学说。该学说在随后数十年逐渐被相关实验所证实,成为在免疫学中占主导地位的学说。

克隆选择原理的基本思想:只有那些识别抗原的细胞才能扩增,只有这些细胞才能被免疫系统选择并保留下来,而那些不能识别抗原的细胞则不扩增不被选择(如图2.2所示)。图2.2 克隆选择原理

克隆选择原理认为,免疫细胞是随机形成的多样性的细胞克隆,每一克隆的细胞表达同一特异性受体,当受抗原刺激后,细胞表面受体特异性识别并结合抗原,导致细胞进行克隆扩增,产生大量子代细胞,合成大量相同特异性抗体。

克隆选择原理可认为是免疫系统内的达尔文进化论,即克隆竞争结合抗原,亲和力高的抗体被大量克隆。克隆选择原理的生理学基础是免疫细胞的多样性。抗体多样性的产生源于其可变区内基因高频变异与基因重组等,可保证免疫系统以少量的抗体来识别抗原并清除之。

克隆选择是生物免疫系统自适应抗原刺激的动态反应过程,所体现的学习、记忆、抗体多样性等生物特性,都是人工免疫系统所借鉴的。2.1.4 MHC的概念与特性

MHC(MajorHistocompatibilityComplex,主要组织相容性复合体)是位于生物免疫系统某一染色体上一组紧密连锁的高度多态性的基因群,其基因产物不但参与移植排斥反应和T细胞的分化发育,而且在免疫应答的启动和免疫调节中发挥重要作用。

MHC分子有两种类型:MHC-Ⅰ类和MHC-Ⅱ类。MHC-Ⅰ类和MHC-Ⅱ类可分别将来源于不同细胞器的抗原肽提呈至感染细胞表面。前者结合来源于细胞质的多肽,并提呈给CD8T细胞识别;而后者则结合囊泡中产生的多肽,并提呈给CD4T细胞识别。MHC分子结构如图2.3所示。图2.3 MHC分子结构

MHC-Ⅰ分子的结合位点是封闭的,因而只能结合短肽;MHC-Ⅱ分子的结合位点是开放的,故能结合长度各异的肽。MHC-Ⅰ分子的编码基因存在轻微的变异形式,而MHC-Ⅱ分子则具有广泛的变异形式,即多态性。MHC分子与抗原多肽结合可使抗原有效提呈至细胞表面,供免疫细胞识别、消除。免疫细胞只能识别MHC-肽复合物,而不能单独识别抗原的现象即MHC限制性。

MHC分子具有如下的生物学特性:①单倍型,MHC是一组紧密连锁的基因群,这些连锁在一条染色体上的等位基因相对稳定,很少发生同源染色体间的交换,因此构成了以单倍型为特征的遗传,即在遗传过程中MHC单倍型作为一个完整的遗传单位由亲代传给子代;②多基因性,即包含多种不同的MHC-Ⅰ类和MHC-Ⅱ类基因,因而每个个体都拥有一系列有不同肽结合特异性的MHC分子;③多态性,即MHC不同的等位基因,通过突变、基因转换或座位间的重组、外显子改组或座位内改组等机制,产生了多样化的多态序列,从而表现出高度的多态性。

MHC单倍型遗传特性有利于保留父代的优秀基因,并遗传给子代。MHC的多基因性和MHC的多态性在抗体选择和进化过程中起着关键作用,使得免疫系统能应对如此多样且进化如此迅速的病原体。[78]Messaoudi等指出,MHC的多态性使MHC分子能够训练T细胞,确保T细胞在感染时就能尽快地杀死病原体,避免病原体所造成的疾病和死亡。

本书提出的基于MHC的抗体克隆算法(AntibodyCloneAl-gorithminspiredbyMHC, ACAMHC)将应用MHC分子单倍型特性将优秀抗体基因保存为MHC串,并通过疫苗接种遗传至子代以增强其局部搜索能力;应用MHC分子多态性和多基因性并通过基因突变以及随机引入新抗体基因来提高抗体群多样性,以增强其全局搜索能力。2.2人工免疫系统概况

生物免疫系统所具有的学习与记忆、特征提取、模式识别、模糊与概率检测以及多样性、鲁棒性、自适应性、动态性等有效机制与特性,对于人工信息系统的安全保障显然具有重要的借鉴意义。由此可见,人工免疫系统的研究不仅具有重要的理论价值,而且具有广阔的[54]应用前景。

人工免疫系统(ArtificialImmuneSystem, AIS)是受生物免疫系统启发,模拟生物免疫系统功能、机理和特性来解决复杂问题的自适应

[9]系统。[79]

Farmer等人于20世纪80年代中期,基于免疫网络学说建立了免疫系统的动态模型,探讨免疫系统与人工智能的联系,开始了人工免疫系统的研究。1996年12月,“人工免疫系统”概念首次出现在日本举行的基于免疫系统的国际专题研讨会上。之后,一些人工智能领域著名的国际会议相继开辟了人工免疫系统专题,如IEEECongressonEvolutionaryComputation(CEC)、GeneticandEvolutionaryComputationConference(GECC)、In-ternationalConferenceon ArtificialImmuneSystems(ICARIS)等。Forrest等人基于免疫系统的自体/非自体识别原理,提出了否定选择算法。DeCastro等人基于Burnet提出的克隆选择原理提出了著名的克隆选择算法CLONALG。

作为一个新兴的研究领域,人工免疫系统也引起了国内研究者的广泛关注。王煦法教授的团队较早开展了免疫算法的研究;焦李成教授的团队提出了一系列克隆选择算法的改进;李涛教授的团队在计算机免疫系统应用领域进行了深入的研究;莫宏伟博士的团队在人工免疫数据挖掘领域开展了深入的研究;丁永生教授的团队在免疫控制方面进行了卓有成效的研究;肖人彬教授的团队在工程免疫计算方面进行了系统的研究;黄席樾教授的团队在免疫理论分析方面进行了深入的研究;杨孔雨教授的团队在免疫进化理论与应用方面开展了有效的工作。

由于人工免疫系统的主要研究过程是:提取免疫机制→设计免疫模型或算法→实验验证或计算机仿真。经过十余年的发展,人工免疫系统的研究主要集中于免疫模型、免疫算法以及免疫应用等3个方面。下面将分别予以介绍,最后将展望人工免疫系统的发展趋势。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载