网络测试和故障诊断(txt+pdf+epub+mobi电子书下载)


发布时间:2021-02-28 11:52:20

点击下载

作者:孙国强,潘凯恩,等

出版社:电子工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

网络测试和故障诊断

网络测试和故障诊断试读:

内容简介

本书内容贯穿网络测试中的三个要素:测试环境、测试方法和测试工具。本书的主线是当网络出现问题和故障时,借助于系统性的测试方法,对现有网络环境进行测试和分析,针对不同的网络问题或故障,运用测试工具进行分析与测试。

全书共分8章,内容包括计算机网络测试和故障诊断概述、计算机网络测试和故障诊断工具、物理层测试和故障诊断、链路层测试和故障诊断、网络层测试和故障诊断、传输层测试和故障诊断、应用层测试和故障诊断、网络测试和故障诊断综合应用。

本书涉及案例全部取材于实际网络工程中的真实测试数据和结果,为学习者提供一个真实的学习场景,有助于与理论教学相结合,帮助学习者更有效地了解和掌握网络测试与故障诊断中的相关知识。

本书提供电子课件,请登录华信教育资源网(www.hxedu.com.cn)注册后免费下载。扫描书中的二维码可以查看相应的彩图效果。

本书观点新颖、内容实用,适合高等学校本科生及研究生作为“网络测试与性能分析”、“网络运维技术”等课程的教材使用,也可以作为专业技术从业人员的参考和培训资料。

未经许可,不得以任何方式复制或抄袭本书之部分或全部内容。

版权所有,侵权必究。

图书在版编目(CIP)数据

网络测试和故障诊断/孙国强,潘凯恩,刘彬编著.—北京:电子工业出版社,2014.8

高等学校网络工程规划教材

ISBN 978-7-121-23891-8

Ⅰ.①网… Ⅱ.①孙…②潘…③刘… Ⅲ.①计算机网络—测试—高等学校—教材②计算机网络—故障诊断—高等学校—教材 Ⅳ.①TP393

中国版本图书馆CIP数据核字(2014)第169286号

责任编辑:冉 哲

印  刷:

装  订:

出版发行:电子工业出版社

     北京市海淀区万寿路173信箱 邮编100036

开  本:787×1 092 1/16 印张:16.75 字数:386.7千字

版  次:2014年8月第1版

印  次:2014年8月第1次印刷

印  数:3 000册 定价:42.00 元

凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社发行部联系,联系及邮购电话:(010)88254888。

质量投诉请发邮件至zlts@phei.com.cn,盗版侵权举报请发邮件至dbqq@phei.com.cn。

服务热线:(010)88258888。前 言

技术发展使计算机网络成为现代社会的基础设施,我国的网络工程专业也有了迅猛的发展,但是缺乏讲授网络整体测试与故障诊断的教材,特别是在无线网络方面。为此,作者编写了本书。

本书建立了网络测试与故障诊断系统级分层式的分析方法,结合实际工程项目中的三个要素:测试环境、测试方法、测试工具,将网络分析故障排查按照理论架构细化为5 个部分:物理层测试和故障诊断、链路层测试和故障诊断、网络层测试和故障诊断、传输层测试和故障诊断、应用层测试和故障诊断。

测试场景分为:故障排查与诊断场景、网络监控与优化场景和性能评估场景,便于学习者形成横向(三类应用场景)和纵向(自物理层到应用层)的分析问题视野,尽量贴近现实工作的需求,对专业人员提供指导性建议,并供开拓思路之用。

全书共分8 章,内容包括计算机网络测试和故障诊断概述、计算机网络测试和故障诊断工具、物理层测试和故障诊断、链路层测试和故障诊断、网络层测试和故障诊断、传输层测试和故障诊断、应用层测试和故障诊断、网络测试和故障诊断综合应用。

本书采用适合学习的案例式教学方法组织教学内容,加入知识小贴士,穿插于不同的内容中,给学习者及时答疑。通过工程实践模型或案例的形式将理论和实践进行融合,并将案例涉及的内容通过专门章节“网络测试与故障诊断应用”串联起来,强调实用性。

本书涉及案例全部取材于实际网络工程中的真实测试数据和结果,为学习者提供一个真实的学习场景,有助于与理论教学相结合,帮助学习者更有效地了解和掌握网络测试与故障诊断中的相关知识。

本书观点新颖、内容实用,适合高等学校本科生及研究生作为“网络测试与性能分析”、“网络运维技术”等课程的教材使用,也可以作为专业技术从业人员的参考和培训资料。

本书提供电子课件,请登录华信教育资源网(www.hxedu.com.cn)注册后免费下载。扫描书中的二维码可以查看相应的彩图效果。

为了满足实际教学需求,特邀请了两位具有非常丰富实战经验的上海朗坤信息系统有限公司的工程师潘凯恩和刘彬参与本教材的编写工作。

因时间仓促以及作者水平有限,书中肯定还存在一些不足和缺点,欢迎读者批评指正。联系方式:孙国强gqsun@usst.edu.cn,潘凯恩pankaien@163.com。第1章 计算机网络测试和故障诊断概述1.1 计算机网络测试和故障诊断的发展及趋势

信息产业的快速发展,使得网络与人们的日常工作和生活越来越紧密地结合在一起。网络发展在带给人们便利的同时,也带来了新的问题和挑战。在通信、交通、能源、金融和制造等各个行业中,一旦网络出现重大故障,人们社会生活的方方面面可能都会受到影响,而且这种损失难以估计。即便是中小规模的网络,一旦出现故障,也会造成诸多不便。这都使得网络的日常监控和故障排除变得尤为重要。网络的发展也使得网络测试变得越发复杂,从物理层连通性测试到应用层的连通性测试,从共享环境的测试到分布式交换环境的测试,从单个广播域分析到多VLAN 环境的故障诊断,从简单的捕包解码到应用数据的还原回放,从点到点设备间分析到多层服务架构的分析,从局域网链路分析到广域网链路分析,从有线介质分析到无线介质分析,我们看到的是不断变化的网络世界,而目前,可以说没有一种设备或者软件能够完全覆盖整个网络测试和故障诊断,于是管理维护网络变成了一个系统性的学科,需要掌握各类功能测试、性能测试、应用测试等更为全面的网络测试和故障诊断知识与技能。

本章将围绕计算机网络测试故障诊断的发展及趋势展开,有助于初步了解网络测试技术和故障诊断。1.1.1 计算机网络测试和故障诊断的发展

自从计算机网络诞生起,网络测试也随之孕育而生,网络测试发展的历程是计算机网络发展不可分割的一部分。

以时间阶段进行划分,网络测试和故障诊断分为三个阶段。(1)1990 年以前

在这个阶段,计算机网络尚未普及,网络本身承载应用业务比较少,专业专用性强。在20 世纪70 年代,互联网前身ARPAnet 诞生初期,就已经开始有了ARPAnet 性能测试实验计划,由因特网之父之称的Vinton G. Cerf 组织了NMG(Network Measurement Group)网络测量小组对网络的各项性能进行测试研究。1974 年,Kleinrock 和Naylor 发表了第一篇关于网络测试的文章“On Measured Behavior of The ARPA Network”。在1980 年前后,ARPAnet 的所有主机都转向TCP/IP 协议。到了80 年代中期,美国国家科学基金会NSF(National Science Foundation)在全美建立了6 个超级计算机中心并进行了互连,允许研究人员对 Internet 进行访问,以共享研究成果并查找信息。NSFNet 于1990 年彻底取代了ARPAnet 而成为Internet 的主干网。这一时期,相对可用的测试设备和工具较少,测试以功能性测试为主,专业性能测试系统和设备比较少。(2)1990—2002 年

当NSFNet 成为互联网中枢后,ARPAnet 逐渐退出。而NSFNet 和各国网络互连后形成了真正的Internet,随着电子邮件和WWW 万维网等网络应用的开发与运用,互联网开始迅猛发展。1995 年,IEEE 正式通过了802.3u 快速以太网标准。1998 年,IEEE 802.3z 千兆位以太网标准正式发布,为计算机网络商业化展开铺平道路。在这个阶段,集线器(Hub)成本不断降低,组网易于实现,逐渐被大量运用到网络中,推动了网络用户数量不断增多。在网络基础架构的建设中,10Mbps 到桌面成为可能,级联主干为100Mbps 的网络架构成为标准,这极大地推动了综合布线市场的逐步繁荣。双绞线标准在这一阶段快速发展,从Cat3、Cat5到Cat5e直至Cat6,而网络也逐步完成交换式网络的蜕变,网络应用也由10Base-T经历了100Base-Tx 阶段提升到1000Base-T。网络技术的迅速发展也造就了测试设备的一个黄金发展时期,现今较为成功的专业网络测试仪器生产厂商,如Fluke Networks(福禄克网络公司)、思博伦和IXIA 等专业公司在网络测试领域不断发展壮大。在网络发展的阶段,由于介质的快速发展和更替,因此网络的下三层连通、匹配和性能问题成为网络维护中故障的主要来源。综合布线市场的快速发展与验收标准的不同步,导致综合布线工程质量参差不齐。1995 年,诞生了第一台线缆认证测试仪。同时,应用的发展又催生出新型网络性能测试仪表,如协议综合网络分析仪Fluke F683。另外,协议分析工具和一致性测试工具等新的测试技术和设备使得基于SNMP 架构的网络管理系统开始出现。(3)2002 年后至今

这个时期的网络流量开始由前一阶段的单纯数据变成了实时和多媒体应用,特别是在线音频和视频对网络带宽提出了更高的要求。2002 年7 月,IEEE 通过了802.3ae 万兆位以太网标准(10Gbps 以太网),它包括了10GBase-R、10GBase-W 和10GBADW-LX4 三种物理接口标准。2004 年3 月,IEEE 批准了802.3ak 铜缆万兆位以太网标准,新标准作为10GBase-CX4 实施,提供双绞线电缆的10Gbps 传输。高带宽使得万兆位主干链路成为现实,而节点和桌面的千兆位化也随着端口成本的降低逐渐加速,使网络上承载高带宽应用成为可能。于是,网络用户数量急剧增多,应用种类层出不穷,办公自动化、移动通信、三网融合、物联网与云计算变成新的趋势。网络测试领域又迎来了繁荣:在基础建设中,光纤被大量采用,促进了光测试设备的发展;网络终端数量的不断扩容使无线技术得到迅猛发展,带动了无线测试设备的发展;应用服务的不断更新,催生数据中心复杂化,推动了网络测试平台系统的发展,如HP OpenView 系统和NetScout Sniffer 系统等。1.1.2 计算机网络测试和故障诊断的趋势

经历了三个发展阶段,网络测试逐步成为一门复杂且综合的学科。网络流量日益增大和高层应用数据加密等给测试中的实时监测、解密和统计提出了新的挑战。应用多样性带来的海量数据不仅需要具有线速捕获数据的能力,还需要进行海量数据的存储。伴随应用数量的爆炸式增加,许多无法通过人工学习的应用,需要通过系统或设备进行还原和回放。监测还需要具有数据分析过滤能力(硬件过滤和软件过滤),这些都是分析关键流量时不可或缺的分析方法。

从目前情况来看,网络测试领域发展趋势可分为以下5 个方面。(1)网络化

由于业务网络化、生产网络化和管理网络化是工业界的一个趋势,因此网络测试和管理的网络化也是大势所趋。网络应用人员数量的增加和分支机构的增加要求在网络监控时必须多点同时同步进行测试统计,这必将使网络测试具备网络化能力。(2)综合化

虽然网络测试不断网络化,但如同城市交通系统一样,即便部署了各类监控系统,但还是需要交警现场处理事务。网络中现场排除故障的工作不可避免,今后网络的规模还将继续扩大,应用的流量也会越来越多,新型网络故障会不断涌现,依靠增加测试人员和测试次数的方式,显然不能满足日常网络维护的需要。而且,随着网络复杂程度的提高,测试人员需要具备的技能要求也非常高。因此网络测试需要具备多层次测试的能力,从底层故障到协议层面完整地进行测试,要求网络现场测试设备需要具备高集成度和便携的特点。(3)智能化

网络技术的更新使得测试标准和参数不断变化。自网络诞生起,业界主流的标准也一直处于不断更新和修订中。对于测试领域的人员来说,首先要跟进学习变化的技术标准,并具有一定的市场前瞻性。其次,由于标准的增加,同一测试设备在不同标准的网络进行测试时需考虑兼容性和完整性。这必然需要对网络测试的各类仪器平台是否支持各类测试标准、自动测试、自动告警和结合标准进行评估等,以减少测试过程中人为主观因素的影响。(4)高性能

新一代数据中心的发展,使得10G、40GE 和100GE 的物理端口大量涌现,要求网络测试必须能在100GE 的速度环境测试流量和应用环境,这对数据捕获分析、实时性和过滤性能等提出了更高层次的要求。(5)定制化

目前,测试仪器平台在实际测试中,具备了测试数据采集、存储、分析和统计等功能。但在实际使用环境中,测试仪器平台还需要支持随时更新测试要求,以便升级来支持新出现的标准和一些临时标准,这需要有第三方接口和二次功能开发。1.2 计算机网络测试和故障诊断的定义与目的

网络测试和故障诊断是指按照特定的方法,在指定的网络环境中,运用测试仪器平台对计算机网络进行数据采集,并对采集到的数据进行分析处理,得到数据结果,同时对故障原因进行分析或定位。综合来说,可以概括为三要素:测试方法、测试环境和测试工具。

网络测试是网络管理的基础,进行网络管理的根本目的是为了向网络用户提供更好的服务。网络业务质量和网络性能是用户尤其关心的内容。对于网络性能来说,它本身处于动态变化中,是网络基础设备如路由器、交换机和服务器等与实际流量共同作用的结果,为了了解网络某一时刻的性能情况,需要对网络进行测试。为了提升网络服务质量,也需要对网络传输中的各个节点进行测试分析。不过实际情况是,TCP/IP 的分组分层架构使得路径中的路由和交换设备只负责转发,不负责统计记录,如果要对应用服务质量进行分析,则需借助系统级的监控测试。

时至今日,网络故障的案例数不胜数,其原因也不尽相同,小到光纤或线缆的品质问题和连通性问题等导致的网络故障,大到异常流量导致的网络拥塞、门户网站系统崩溃、网络受到攻击和安全信息泄露等。这都促使我们全面系统地学习、了解乃至掌握网络测试和故障诊断这门学科。网络测试贯穿于整个网络使用周期中的各个环节,不可或缺。

一般,将网络建设使用周期分为规划、部署、验收、维护和升级5 个阶段。虽然在这过程中,网络测试都非常重要,但这并不意味着搭建维护一个网络,这5 个阶段都要进行网络测试。很多工程项目由于考虑人力、时间、成本和效率等因素,通常将网络测试运用在验收和维护阶段,可以根据实际环境来决定是否对网络进行测试。

例如,在网络规划阶段,除去成本预算限制外,为了搭建一个高性能的网络,通常需要选用性能较好的网络基础设施和设备。而在市场化的今天,可以选择的硬件和软件数不胜数,用户无须通过网络测试方式去评估不同品牌、不同等级和不同技术的各类设施或设备的功能与性能。用户可以通过厂商提供的性能报告或者第三方机构的评测报告,根据设计规划要求,进行选择。

在网络安装部署阶段,为了确保网络工程完工后的质量,需要进行网络测试。尤其是对一次性投入的基础设施,需要随施工进展进行测试,避免在工程验收阶段出现整体性网络质量或性能问题,导致进退两难的境地。网络整体性能状况不同于单个网络设备,它是一个系统,一旦建成以后,不太可能通过更换的方式,快速解决功能和设计上的缺陷。通过测试可以及早发现网络规划时可能存在的问题。

在网络部署完成后,还需进行验收测试。通常,由第三方网络测试机构对网络建设部署的质量进行测试评估。这一阶段的验收测试极为关键,可以在网络投入运营前,获得网络整体的性能指标和参数指标。既可对规划设计目标进行验证,也可获得网络投入运行前的具体各项参数数据,为下阶段的维护建立基准。

进入维护阶段后,网络测试的重心转向网络问题和故障的发现和排除。从时间角度看,这是整个网络建设周期中时间最长的阶段,也是测试需求量最大的阶段。用户不仅需要了解测试方法,还需要具备完整的网络测试领域的专业知识技能。在这个阶段中,网络测试投入会相应增加,网络维护费用可能占一般网络总成本的15%左右。从网络测试发展判断,对网络应用层的功能和性能分析将在今后几年得到迅猛发展。

最后,当网络运行到一定阶段,升级将是不可避免的环节。计算机网络技术的快速发展,使得网络里会不断出现新的技术和应用,需要在现行网络中增加、替换或改变现有网络,对这些变动可能造成的影响进行测试和评估。

区别于设备测试,网络测试的测试对象是计算机网络,设备测试可看作网络测试中的一个子集(本书中称为“元”级测试环境),不能简单地把测试网络设备等同于网络测试,而应将计算机网络看作一个实体。

网络测试参照的特定方法,或称测试方法,是指业界约定俗成的规则或标准。由于网络测试的复杂性,因此测试规则和标准也相当之多。

国外的常见规则和标准:

· ISO/IEC 11801 用户建筑群通用布线规范

· TIA/EIA-568C 商用建筑电信电缆布线标准

· EN 50173 信息技术通用布线标准

· ISO/IEC 8802.11 信息技术系统间远程通信和信息交换局域网和城域网特定要求第11部分:无线局域网媒体访问(MAC)和物理(PHY)层规范

· RFC1242 网络互连设备基准术语

· RFC2544 网络互连设备基准测试方法

· RFC2285 局域网交换设备基准术语

· RFC2889 局域网交换设备基准测试方法

· RFC3918 IP 组播基准测试方法

· RFC3511 防火墙性能测试

· RFC1157 简单网络管理协议

· RFC1724 路由信息协议(版本2)管理信息库(MIB)扩展

· RFC1902 SNMPv2 管理信息结构

· RFC2236 Internet 组管理协议(版本2)

· RFC1902 SNMPv2 管理信息结构

· RFC2236 Internet 组管理协议(版本2)

· RFC2571 描述SNMP 管理框架的体系结构

· RFC2889 局域网交换设备的基准测试方法

· RFC2722 流测试架构

· RFC2679 单向时延测试

· RFC2681 往返时延测试

· RFC3393 时延抖动测试

国内的常见规则和标准:

· GB/T 2421-1999 电工电子产品环境试验 第1 部分:总则

· GB/T 2887-2000 电子计算机场地通用规范

· GB 50174-1993 电子计算机机房设计规范

· GB 50311-2007 综合布线系统工程设计规范

· GB 50312-2007 综合布线系统工程验收规范

· GB/T 21671-2008 基于以太网技术的局域网系统验收测评规范

· YD/T 1099-2005 以太网交换机技术要求

· YD/T 1096-2001、YO/T 1097-2001 路由器设备技术规范

· GB/T 18019-1999、GB/T 18020-1999、YD/T 1132-2001 防火墙设备技术要求

· GB 15629.11 信息技术 系统间远程通信和信息交换局域网和城域网 特定 要求 第11部分:无线局域网媒体访问控制和物理层规范

虽然标准或规则定义了非常详细和全面的测试内容,但在实际运用于网络测试和故障诊断时,需要根据测试环境和现有测试工具制定测试流程和方法。1.3 计算机网络测试和故障诊断的体系划分1.3.1 按功能体系划分网络测试和故障诊断

按功能体系可将网络测试和故障诊断数据分为:数据采集、数据管理、数据分析和数据表示4 个模块。

1.数据采集模块

数据采集模块是网络测试的基础,采用主动或被动方式进行数据采集。主动方式是指通过测试系统或工具自身产生测试报文,并设置接收端采集被测网络的响应数据。被动方式是指通过测试系统或工具自带监控接口对数据进行捕捉采集。数据采集分为全线速采集和抽样采集。

采集端接口可以是测试仪自带的网络接口,也可以是网络设备如交换机或路由器等。例如,协议分析软件一般采用计算机的网络接口作为数据采集口,网络测试仪采用集成的网络接口卡作为采集口,网络管理系统则通过采集口发送测试请求,并采集交换机或路由器等网络设备回应的数据。

2.数据管理模块

数据管理模块负责将数据采集模块收集的信息进行预处理和存储。预处理工作包括对采集数据进行分类、过滤和统计。存储工作主要包括标签、存储到文件或数据库以及数据压缩。不同的测试工具的功能有所区别,可能只涵盖上述一部分功能。

数据管理要求做到标准化,可以提高数据分析时提取数据的效率,同时还能与其他分析软件和系统兼容。

3.数据分析模块

数据分析模块负责将数据管理模块预处理的数据以及记录存储的数据进行后续分析,按照不同的分析功能模块进行处理。其主要功能是数据统计分析和事件分析。

在数据统计分析中,需要统计网络设备的端口信息、利用率信息、CPU 趋势、协议和协议关联等。事件分析是指分析模块根据内建的判断准则或者专家库,对数据进行匹配分析,用于判断网络故障或者网络性能。

小贴士:协议和协议关联——协议和协议本身在数据流中是按时间顺序排列的,不会做关联。协议分析软件可以将协议流程化处理,例如,在VoIP 语音分析时,需要将SIP 和RTP 进行协议关联,这样可以将语音呼叫时的主叫和被叫信令以及通话语音流关联后一并分析。

小贴士:专家库——由于网络上存在海量的数据,因此在测试工具上往往会集成专家库功能,专家库通过对数据的分析,将特定事件以专家库建议和判定结果的方式,展现给使用者,给分析带来了极大的便利。

4.数据表示模块

数据表示模块又称人机接口,将测试分析结果以图形化或者报表化的形式展现给使用者,或者以不同的方式进行告知,如告警和提示等。数据表示模块还可以对数据管理模块和数据分析模块获得的数据再次进行处理,得到更多功能层次的数据和报表,如显示过滤、数据合并和数据导出等。1.3.2 按结构体系划分网络测试和故障诊断

按功能体系可将网络测试和故障诊断数据分为元和流两个级。

生活中的交通系统本身有其法规(相当于网络中的协议),但交通拥堵和交通瘫痪也经常发生。因此现实中交通管理部门会采用各种办法尽量减少事故或事件的发生。例如,在各个重要区域安装信号指示灯、探头,增加交警执勤,同时在法规和规划上制定不同的细则和方案,如道路拓宽、新建高架隧道、综合立交以及城市热区规划等。综合来看,交通系统的维护集中在车流的管理,以及交通网络基础设施的管理方面。计算机网络系统与交通系统有很多相似之处,将交通系统特点运用到网络结构体系的划分中就有元和流的区分。

如同交通系统一样,网络中存在着同车辆、道路和交通指示等类似的基本单位,如网线、网卡、交换机、路由器、主机和服务器等,以“元”来代表所有这类组成网络的基本单位以及组成网络的架构。而这些“元”组成了网络后,就有了第二个概念“流”。有了“流”的存在,在网络测试中就需要对各类“流”进行测试分析。测试分析的“流”可以是比特流、数据帧流,也可以是分组流和应用流。对“流”的分析也如同交通系统里对车流的监控一样,需要在交通系统环境中部署探测设施,例如,按车流的分布特点,可以采取在关键道口或主干道路(对应网络中的网关或出口)进行集中分析的方式,也可以采取网点式部署在各个节点(对应分支机构较多的网络)进行分布式分析的方式。

在OSI 中将计算机网络模型分成为7 层,目前广泛应用的TCP/IP 模型将网络分成4层,如图1.1 所示。

本书按照TCP/IP的4 层协议模型架构来展开网络测试和故障诊断的内容。为便于阐述,将TCP 的底层展开成两部分内容:物理层和数据链路层。

基于元和流测试的划分方法,在TCP/IP 架构中对应的测试内容如图1.2 所示。

1.元的纵向分析(1)物理层的元分析

构成网络的硬件基础是光、电和无线介质,以及各类接口和设备板卡线路。双绞线和光纤作为整个网络的龙骨自然成为这一类测试中的重点。物理链路中每个环节都可能成为网络传输中的短板,导致实际传输性能下降。有关数据统计表明,物理层故障占到网络故障的50%以上,因此,物理层的测试分析是必需的。细化到综合布线系统中的双绞线和光纤,经历多年的发展,目前双绞线主要采用Cat5e 和Cat6,Cat6A 也有一定比例的应用。除了连通性的问题外,双绞线的一些固有特性如衰减和电磁辐射、易相互串扰等,对传输影响极大,表现为网络传输中的传输丢包以及误码。测试中不仅需要给出一些常规参数,如线序、长度等规范性内容,同时还需要给出干扰测试、衰减测试等参数内容,以方便对双绞线系统进行定量分析。图1.1 网络模型结构示意图图1.2 元和流环境中的测试示意图

对于光缆的分析同样重要,大量光纤模块和光电转化设备的使用使网络光缆的维护不再是传统运营商的专职,实际用户也参与到光纤测试这一环节中,测试内容也随着光纤技术的发展有所变化。(2)链路层的元分析

链路层进行元测试的内容较多,如链路传输速率、背靠背、丢包率、时延和吞吐量等。除此之外,还有协议的匹配性和设备的兼容性,也包括交换机的MAC 地址表。

① 链路传输速率(Rate):设备间通过网络传输数字信息的速率。

② 吞吐量(Throughput):在不发生数据包丢失情况下,被测设备能够支持的最大传输速率。

③ 时延(Latency):数据包从发送端口到目的端口所需经历的时间。

④ 丢包率(Frame loss rate):在一定负载下,被测设备丢失数据包的比例。

⑤ 背靠背(Back-to-back frame):在最大速率和不发生数据包丢失前提下,被测设备可以接收的最大突发数据包数目。(3)网络层和传输层的元分析

网络层和传输层在实际测试时很难区分,故合并在一起进行介绍。其测试主要对象是网络设备,如三层交换机和路由设备及其他设备,测试主要围绕协议和会话展开,另外还包括流缓存表等测试。主要对象为并发连接数、端口和流的持续时间等。

① 最大吞吐量(Throughput):在无数据包丢失的情况下,被测设备能够支持的最大传输速率。

② 最大并发用户(Maximum Simultaneous Users):被测设备能够成功处理的最大用户数目。

③ 最大连接速率(Maximum Connection Rate):被测设备每秒能够成功处理的最大连接数目。

④ 最大并发连接数(Maximum Concurrent Connections):被测设备能够成功处理的最大并发连接数目。

⑤ 最大带宽(Maximum Bandwidth):被测设备能够成功处理的最大带宽。

⑥ 最大事务速率(Maximum Transaction Rate):被测设备每秒能够成功处理的最大事务数目。(4)应用层的元分析

由于网络中采用的应用协议不同,因此测试项目的有关参数可能需要重新定义。在应用层的测试中,由于应用数量的不断增长和更新,使得这一层的分析最为复杂,因此需要结合实际应用内容建立测试模型,定制测试方法。

2.集中式环境中的流横向分析

在网络测试和故障诊断过程中,经常遇到的困难是人员和可用工具的不足,一般在小规模的网络及网络分支机构末端都会有这样的问题,这导致监控网络信息流时需要进行集中式的分析。例如,分析网络流量和分析服务器访问流量等,在条件受限时,测试更倾向采用流量汇总方式进行分析。现有大型数据中心由于流量集中,也是集中式分析比较理想的应用环境。通过对大量数据访问的测试和分析,判断其工作状态,并做出预判和优化。

因此集中式环境可以理解为在网络中特定位置集中获得网络流量和状态数据,然后加以分析和后续处理。

在典型的集中式环境中,分析的是出口流量或服务器端口的流量,这些环境的主要特点是流量构成复杂、并发连接数高以及突发性高。突发性高会导致测试分析时需要分析测试设备具有较高的冗余量,另外对于多级架构的服务环境,需要建立多级分析的模型。同时为了分析结果的易读性,需要进行数据关联,将不同应用服务器间的数据包进行时间和应用上的关联,并且应用分析需要深度包检测(Deep Packet Inspection,DPI)技术。

在集中式分析环境中,测试的重点在于对流的数量、流的报文分布、传输量、持续时间、IP 流量分布和应用流量分布做出更为详细的测试,以获得全面的网络信息。

3.分布式环境中的综合分析

相对于集中式环境,分布式环境特指网络规模巨大和用户数量众多的网络结构。分布式网络环境是拓扑结构上的分散分布,地域分布上彼此相对独立但又互联互通的网络结构。这就要求在对分布式环境网络进行分析时,测试系统本身需要具备多点数据采集能力,并且采集后数据可以在现场进行快速预处理或完全处理,然后进行数据汇总。

大型网络中的网络测试环境逐渐演变成网络管理的重要组成部分,不仅需要进行元测试,同时也要进行流测试。执行两类测试的目的是为了更好地进行网络管理。网络测试不仅用于排除故障,也是网络管理中不可或缺的部分。国际标准化组织将网络管理定义为五大功能:故障管理、计费管理、配置管理、性能管理和安全管理。(1)故障管理(Fault Management)

ISO/IEC 7498-4 的故障管理由故障检测、隔离和纠正三方面组成。网络测试提供了故障管理中各个环节得以进行的基础工作。如图1.3 所示是网络测试在故障管理中的运用。故障管理要求有识别不同类型故障的能力,通过主动和被动的测试获取网络运行数据,并且根据网络运行特点,建立长期的趋势标准。针对可能出现的问题,设置策略。当故障发生时,通过报警和日志获得故障的类型,从而确定下一步的测试方法。随后进行系统的诊断测试,最后找出故障原因并进行纠正故障。图1.3 网络测试在故障管理中的运用(2)计费管理(Accounting Management)

计费管理是网络管理五大功能中的重要内容,它记录网络资源的使用情况,控制和监测网络运行的费用和开销。ISP 运营商可以快速估算出用户使用网络资源的情况以及需要支付的费用。对于网络管理者来说,掌握网络资源的使用情况可以帮助控制预算费用,防止用户过多占用和使用网络资源。

一个完整的计费管理包括:计费数据采集、数据管理和数据维护、计费政策制定、政策比较和决策、数据分析和费用计算以及数据查询等。网络测试中数据采集技术被大量运用到计费管理的数据采集功能中,同时网络测试中的数据统计分析也是计费管理的重要数据依据。(3)配置管理(Configuration Management)

大型网络中的网络测试不仅局限于元和流的性能分析,还需要对网络中大量基础设施设备的配置进行管理。完全依赖人力完成配置管理不仅费时,而且还容易出错。对于不熟悉网络结构的人员来说,这项工作甚至无法完成。一个技术先进的网络管理系统应该具有配置信息自动获取功能,这需要测试设备具备配置获取和管理能力。测试工具需要支持基于SNMP 的获取方式,并且尽可能支持更多的网络MIB 库。

当然在配置管理中除了获取信息外,还需要支持修改和写入的操作,需要借助网管协议中定义的方法(如SNMP 中的set 服务)对配置信息进行设置。

此外,对于配置的一致性检查以及对配置更改的记录备案,也是配置管理中的重要项目。(4)性能管理(Performance Management)

性能管理是指对现有网络状况进行评估,且根据实际情况调整运行模式,以获得更优的网络性能。这部分内容是目前网络测试相关书籍中提及最多的部分。性能管理离不开性能测试,性能测试包括很多内容,主要分为以下三个部分。

① 压力测试:运用一系列辅助测试方法,测得各类性能参数,如当前负载、丢包、延时和设备CPU 等性能指标。

② 性能监控:对特定对象进行监控和采集,采集间隔可自定义。被监控对象类型包括线路和路由器以及其他网络设备。被监控的属性包括流量、延迟、丢包率、CPU 利用率、温度和内存余量。对每个被测对象定时采集性能数据,自动生成性能报告。

③ 趋势分析:对数据进行分析和处理,生成性能趋势曲线,以直观的图形反映性能分析的结果。(5)安全管理(Security Management)

安全性一直是网络管理中的重中之重,用户对网络安全的要求不言而喻。网络测试在安全管理中的应用也是极为重要的。例如,查找重要数据被篡改和伪造时间,异常攻击行为的来源和攻击方式,认证系统的安全性测试,防火墙或应用系统的端口漏洞等。

通过网络测试能够针对很多安全问题进行源头定位和故障原因分析,为安全管理提供更好的技术保障。习题1

1.简述计算机网络测试和故障诊断的发展的三个阶段。

2.简述计算机网络测试和故障诊断的发展趋势。

3.简述计算机网络测试和故障诊断的三要素。

4.国内常用的网络测试标准有哪些?

5.网管的五大功能是什么?

6.列举数据链路层性能测试的关键指标(5 个以上)。

7.网络测试和故障诊断按功能体系是如何划分的?

8.网络测试和故障诊断按结构体系是如何划分的?第2章 计算机网络测试和故障诊断工具2.1 网络测试和故障诊断工具分类

本章介绍的测试工具是一个泛指的概念,包括计算机内置的常用命令、专用网络分析仪器仪表、网络测试软件、协议分析系统和网络测试平台等。

如今已不能用一个简单的标准来划分测试工具,有时很难界定测试工具属于哪一种具体分类。同一种测试工具可以适用于OSI 7 层模型中的不同层级,也可以是专注于某一功能领域的专用工具,还可以是网络管理维护中的特殊采集点。为了便于系统理解网络测试工具的划分,一般按数据源、用途以及被测对象功能层对网络测试工具进行分类。当然,分类方式不限于这几种,主要是通过常用的几种分类方法,帮助选择正确、合适的测试工具,建立一个更为全面的视野。

本书在测试工具分类时,按照物理层测试和故障诊断、数据链路层的测试和故障诊断、网络层的测试和故障诊断、传输层的测试和故障诊断以及应用层的测试和故障诊断5 层分析模型进行描述。将网络工具分类模型建成三维视图,如图2.1 所示,其中,X 轴代表数据源分类、Y 轴代表用途分类、Z 轴代表被测对象功能层分类。图2.1 测试工具的分类2.1.1 按被测对象功能层分类

在实际生产和工作中,很多测试是直接按被测对象类型进行设计的,如交换机流量统计软件、路由测试软件和WLAN 频谱分析等。测试功能被设计成简单的若干项内容,但专业程度非常高,操作简便,强调实用性和专业性。一般来说,可以按被测对象类型进行快速类别区分。(1)物理层

现有网络中运用的介质类型主要有铜线、光纤和无线等,因此测试工具也有专门针对不同介质类型的设备,如双绞线的验证和认证测试仪、光纤衰减测试仪、光纤OTDR 光时域反射定位仪和无线频谱分析仪等。(2)网络下三层

如果被测对象为网络互连设施,不包含三层以上设备,则使用网络下三层测试工具,其主要测试网络逻辑连通性、路由可达性、丢包情况和延时情况等内容,如误码仪、路由追踪软件和网络扫描软件等都属于这一分类。(3)网络上层

如果被测对象为三层以上设备,需要分析高层协议或应用,则使用网络高层或上层测试工具,其主要测试协议一致性、应用流程和应用访问时延或应答情况等,如协议分析仪、模拟流量生成器和网络流量管理软件等。2.1.2 按数据源分类

按照测试中数据来源方式不同,主要分成主动测试数据源和被动测试数据源两大类。

1.主动测试

主动测试时的测试流量或测试请求是由测试设备发起的。主动测试类的测试工具可以根据需要发送或注入测试流量或请求,人为定义测试流量的内容,灵活性非常高,同时由于不涉及用户数据信息,因此特别适合安全性要求较高的测试场合。其局限性是,在网络繁忙时,主动测试会增加额外的流量,加重网络负担,造成网络拥塞以及延时增大,特别是在大型网络尤其是拥有众多广域分支的网络中,主动测试将带来巨大流量,额外的流量很可能会对被测网络形成干扰,导致测试结果偏差。在使用主动测试时需要特别注意网络压力情况。

主动测试一般用于网络性能评估测试以及网络硬件故障的测试,通常借助发送模型及采集模型,发送不同类型的流量或数据,并在采集接收处进行统计处理,得出被测网络的性能情况以及验证网络的配置情况。

在进行主动测试时,操作人员根据测试要求自定义测试流量的类型和内容,按照预定模型,注入被测网络,测试网络的响应情况。主动测试分为性能测试和功能测试两类。(1)性能测试

性能测试又称压力测试(Stress Testing),压力测试是一种有效的质量保证行为,适合在计算机数量较少或测试资源相对有限的条件下运行测试。

压力测试也可分为元测试和流测试。为了测试极限性能,有时需要模拟各种流量异常情况,如错误注入、大并发连接数等来进行压力测试。

思博伦公司于2005 年推出的TestCenter 以太网测试平台是元测试领域的代表产品,如图2.2 所示。TestCenter 是一种集成的测试解决方案,采用可扩展式的设计方法,实现机架、测试模块分离,用户可以按实际需求,选择不同的测试模块,结合客户端软件构成一套测试系统。TestCenter 可以实现多种元测试,如交换机中负载、吞吐量、丢帧率以及转发速率等参数的测试,路由器中吞吐量、丢包率、延迟、背靠背、不同路由协议和路由容量的测试等。在流测试领域中,TestCenter 经过多年的完善,也成为运营商和大型厂商广泛使用的工具。图2.2 TestCenter 以太网测试平台

在流测试领域中,易测公司的IxChariot 也是较典型的应用流测试工具,它通过模拟真实应用流来评估网络设备和系统的性能。IxChariot 测试系统包括IxChariot 控制台、测试端点(Performance Endpoint)和IxProfile 文件包。通过网络节点模拟上百种协议,提供详尽的网络性能评估和设备测试功能。

如图2.3 所示为IxChariot 测试系统的大致结构,Endpoint 是测试安装的节点,通过Console 对测试进行控制并统计结果。通过模拟不同应用流量可以获得网络中的各类信息,如吞吐量、响应时间、事务处理速率、丢失的数据帧、乱序数据帧、抖动(流媒体)和延迟等关键测试参数信息。(2)功能测试

功能测试区别于性能测试,以验证网络配置和硬件参数为主。功能测试可以利用网络中的各类不同层次的协议和特性进行测试,如基于ICMP 的Ping 工具和Tracert 工具,基于TCP 或UDP 的Iperf 工具,基于CDP 或STP 的拓扑发现工具等。图2.3 IxChariot 测试系统的结构

2.被动测试

相对于主动测试,被动测试获取数据的方式不同,它借助探针或代理获得。将探针或代理部署在网络的不同位置被动地接收网络中传输的数据,采集实际网络中的流量信息(原始数据报文)。这种方法要求测试工具本身具有较高的性能,接口速率可以适应高速主干网络、线速的存储速率以及后续原始报文数据的快速处理。

目前,常用的被动测试分为三种:代理架构、间接数据源架构、直接数据源架构。

采用代理架构进行测试时,需要将网络测试任务分布于不同的代理点上,代理点通常为路由器或者交换机。测试工具通过发送测试请求,获得所需的网络信息。代理点通常内嵌于网络设备中,借助于流量经过这些设备,在保证网络运行功能的同时具备采集数据的功能。这样通过测试工具发送相关指令时,可以借助代理返回测试结果信息。因为需要牺牲部分设备运行资源用于网络数据统计,所以数据采集深度会有所限制。

SNMP 是现有大规模商业应用的被动测试方式之一,基于轮询式的网络测试模型,但是其优先级低,当网络繁忙时,代理可能停止响应。间接数据源架构中比较典型的是基于NetFlow 的发布式模型。不同于SNMP 代理架构,NetFlow 采用发布的形式,可以保证代理响应,除了增加部分网络流量外,几乎可以忽略其对网络造成的影响。

Orion 网络测试分析系统是SolarWinds 公司的企业级IT 测试管理产品,其结合SNMP和NetFlow 的采集数据方式,构建了非常有特色的网络测试分析系统,如图2.4 所示。

不论是SNMP 架构还是NetFlow 架构的测试系统,都采用对数据轮询或者间隔采样的方式。对于需要进行深入数据分析的网络,以上架构采集的数据精细度和提供的内容不能满足高层的分析要求。

对于大型网络而言,直接数据源架构可以实现原始数据报文的获取,最真实地了解网络流量情况,当然这需要被动测试工具的性能非常高,还需要具备数据整合提取能力。直接数据源架构需要预先规划数据采集点的部署。

在进行直接数据源架构测试时,主要有三种方法获得流量。图2.4 Orion 网络测试分析系统(1)直接获取

直接获取的方式实施最为简易,即通过物理线路将测试设备和被测设备直接相连,被测设备无须做特定配置。在20 世纪90 年代,这是非常实用的测试方式,由于Hub 在此时还是主要的组网方式,对于测试设备来说,只要在同一个冲突域内,无论接在Hub 的哪一个端口,都可以接收到其他主机间的通信数据报文。但到了以交换式网络为主后,这种直接获取数据的方式受到了限制。因为每个测试口成为了一个单独的冲突域,直连测试设备时往往只能接收到广播和组播报文,以及一些测试设备自身的流量;监控端口一般必须是流量大于或等于受控端口的带宽,否则可能会出现丢包的情况,而这在实际网络中是普遍存在的现象。(2)镜像方式

SPAN 方式(Switch Port Analyzer),俗称镜像方式,其主要目的是用于监控交换机的数据流,利用SPAN 技术把交换机上需要被监控的端口或VLAN 中的数据流复制到测试设备所连接的端口上。

远程SPAN(简称RSPAN)方式可以在不同的交换机上实现远程数据获取,但在二层协议的监控上有所制约。

实施SPAN 技术需要在交换机或被测设备上进行配置,不同设备的配置方式不同,实际操作比直接获取方式要复杂一些。网络设备在设计上的第一要务是数据交换,其次是管理功能,所以在CPU 和进程等资源分配时,都会有所限制,导致镜像测试时有较多局限性。例如,在很多交换机中,只允许有两个镜像会话,势必造成在很多情形下无法完整实现测试分析。(3)TAP 方式

TAP(Test Access Point)方式,俗称“三通”方式,使用时起到分路作用。在将正常流量进行传输的同时,引出一路或多路流量供监测设备分析使用。TAP 分为电TAP 和光TAP两类。电TAP 按其电路设计又延伸出汇聚TAP、镜像TAP、镜像汇聚TAP 和可编程TAP。光TAP 区分单模和多模,同时按分光比也延伸出多种类型,如1:9 分光,2:8 分光以及5:5分光等。选择时需要综合考虑分光器对传输的影响以及测试设备光收发器的可接收范围。随着技术的发展,TAP 又发展出混合型TAP,输入/输出端口可以自定义,且介质类型也可以选择,如监测口为光口,被测口为电口等。

经过多年的发展,目前测试工具也是种类繁多。从发展过程来看,已经从最初的协议分析软件发展到分布式协议分析仪,以及现在的海量存储测试。

协议分析仪是常用的网络流量分析法,协议分析仪依赖于一套捕包函数库(如UNIX平台下的Libpcap 和Windows 平台下的Winpcap 函数库)由主机内嵌软件的方式实现,主机一般采用PC 机或服务器。在操作系统中,通常将网络通信作为一个相对独立的模块,借助驱动程序实现,主机和网络的通信通过调用Socket 语句实现。采用网卡获取主机和网络间通信的物理流量。

普通的网卡正常工作时处于非混杂模式,在此模式下,网卡仅负责把发送给自己主机的包传递给上层应用程序,其他的包都丢弃。工作在混杂模式下的网卡接收所有经过网卡的数据包并传递给应用程序,包括不是发给自己的数据包。

当PC 机、服务器或终端安装协议分析软件并将网卡设置成混杂模式后,就成了协议分析仪。协议分析仪在实际使用中还要区分测试位置和测试环境,由于网卡有上、下行的概念,因此对全双工的链路分析有一定局限性。另外协议分析在操作时,由于现今大量的交换式网络环境,需要对网络设备进行一些镜像配置。

随着线速处理技术和存储技术的日益成熟,使得大型网络的线速(Deep Packet Inspection,DPI)分析成为可能。协议分析设备辅以TAP 连接方式支持多端口采集,可以按照需要进行关键业务和节点的大量数据采集和分析,实现复杂网络环境架构中的数据采集。结合数据库技术和强大的硬件处理能力可以实现实时的数据报表分析功能,这同传统的PC 机级别的协议分析软件有了很大的不同。在进行深度分析时,无须将捕包和解码操作分离。海量协议分析仪具有快速调用历史数据功能,如同视频监控系统中调用以往录像一样,使得一些网络突发异常事件可以溯源。

福禄克网络公司的NTM 系列协议分析系统是比较典型的海量存储分析仪,其千兆位(1GbE)分析端口可以捕获20 纳秒时间分辨率的数据包,所配置的万兆位(10GbE)分析端口可以捕获10 纳秒时间分辨率的数据包。其硬件可以实现捕获、存储和归档操作,可以回放60TBs 的存储数据并支持扩展。

NTM 系列海量存储分析仪架构如图2.5 所示。NTM 系列海量存储分析仪采用FPGA捕获卡完成数据包的线速采集,并将数据进行复制,一份数据给PacketStore 进行原始数据包存储,并且供Packet View Engine 进行后续原始包的查看;另一份数据给Real-Time Monitoring Engine,实现数据的实时分析,并通过二次标签的方式优化数据,以便后续分析时能够实现快速历史数据调用。图2.5 NTM 系列海量存储分析仪架构2.1.3 按用途分类

由于不同的人员对计算机网络测试的理解和需要差异很大,很多时候也可以按用途来区分不同的网络工具。人员本身的角色不同,对应的网络测试用途不同。在网络维护阶段分为三种主要用途。(1)功能测试

功能测试是强调功能的实现,判定相对容易,如VLAN 测试、路由可达测试、冗余测试和路径是否可达等。使用人员为日常维护人员。很多测试工具和测试命令都属于功能测试,如Ping 命令、Tracert 命令和服务端口查看等。(2)性能测试

性能测试执行要求比较严格,有明确的操作规范和测试模型定义,并且,随着IT 技术的发展,以及用户使用要求的提高,需要同行业标准甚至更高级别的标准比对。此类测试多用于网络性能评估,通过基于标准的测试,获得网络当前的性能状况,如Iperf 工具、各类RFC2544 性能测试仪表均属于性能测试工具。(3)故障诊断测试

在故障诊断测试中,来源于用户体验和QoS 服务质量评估已经不能满足当前网络测试要求,而采用用户感受作为判定标准的QoE 成为主要准则。当发生故障时,不能仅给出测试数据,而是需要通过测试定位到故障原因。以QoE 为设计理念的测试工具也逐渐被大量采用,主要目的是减少故障排查时间,提高服务质量。2.2 常用网络测试诊断工具和基本工作原理2.2.1 常用网络故障测试命令工具

1.ICMP

ICMP(Internet Control Message Protocol)是Internet 控制报文的缩写,用于在IP 设备间传递控制消息,是TCP/IP 协议族的子协议。ICMP 报文提供针对网络层的错误诊断、拥塞控制、路径控制和查询服务4 项功能。这些报文虽然并不传输用户数据,但是对于用户数据的传递起着重要的作用。

Ping 因特网包探索器就是运用发送ICMP 报文,测试网络连通性状况以及信息包发送和接收状况的实用工具。另外,用于追踪路径的Tracert 命令同样也是基于ICMP 的常用命令。ICMP 报文结构见表2.1。表2.1 ICMP 报文结构

ICMP 的报文组成说明如下。(1)IP Header(报头)

Protocol 字段设置为1,Type of Service 字段设置为0。(2)ICMP Payload

· Type(类型):8bit。

· Code:8bit。

· Checksum:16bit,仅计算ICMP 部分。

· Quench:32bit,由Identifier(16bit)和Sequence Number(16bit)组成。

· Data:数据载荷因回复变化而不同,可以是任意长度,但必须小于网络的最大传输单元(MTU)。

当IP 报头的Protocol 字段值为1 且Type of Service 字段值为0 时,表明这是一个ICMP报文。ICMP 头部中的Type(类型)字段表明ICMP 报文的作用及格式,Code 域表明ICMP报文的类型,所有数据都在ICMP 头部后面。RFC 定义了13 种ICMP 报文格式,具体见表2.2。

表2.2 中最为常用的类型为0 和8。当一台主机向一个节点发送一个Type=8 的ICMP报文时,如果途中没有异常(数据包被丢弃或目标不响应等),则目标返回Type=0 的ICMP报文,说明这台主机存在。Tracert 命令通过计算ICMP 报文通过的节点来确定主机与目标之间的路由器跳数。

目标不可达报文(Type=3)在主机或节点不能传递报文时使用,当试图连接对方一个不存在的系统端口(端口号小于1024)时,将返回Type=3 和Code=3 的ICMP 报文,表示端口不可达。还有很多其他报文不可达情况,具体见表2.3。表2.2 ICMP 报文格式

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载