Go程序员面试算法宝典(txt+pdf+epub+mobi电子书下载)


发布时间:2020-08-26 13:14:35

点击下载

作者:猿媛之家,董良松,楚秦,等

出版社:机械工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

Go程序员面试算法宝典

Go程序员面试算法宝典试读:

前言

计算机技术博大精深,日新月异,Hadoop、GPU计算、移动互联网、模式匹配、图像识别、神经网络、蚁群算法、大数据、机器学习、人工智能、深度学习等新技术让人眼花缭乱,稍有迟疑,就会被时代所抛弃。很多IT从业者非常困惑,不知道从何学起,到底什么才是计算机技术的基石。其实,其本质还是最基础的数据结构与算法知识:Hash、动态规划、分治、排序、查找等,所以,无论是世界级的大型企业还是几个人的小公司,在面试求职者的时候,往往会考查这些最基础的知识,无论你的研究方向是什么,这些基础知识还是应该熟练掌握的。

本书正是从这些基础知识点出发,讲解了求职过程中常见的数据结构与算法的真题,从而让求职者能轻松应付算法类的笔试面试题目。本书的出版得到了机械工业出版社时静老师的大力支持与配合。在写作风格上,推陈出新,对于算法的讲解,不仅使用图文并茂的方式,而且还辅以示例的讲解,目的就是为了使讲解更容易读懂。为了能够写出精品书籍,我们对每一个技术问题,都反复推敲,与算法大牛一起反复论证可行性,咬文嚼字,字斟句酌,所有这些付出,只为让读者能够在读完本书后有所收获。

虽然市面上同类型书籍很多,也都写得不错,但是,我们相信,我们能够写出更符合读者需求的高质量精品书籍。为了能够在有限的篇幅里面尽可能地展现“干货”,我们在题目的选择上下了很大功夫:首先,通过收集近3年以来IT企业的面试笔试算法真题,包括已经出版的相关著作、技术博客、在线编码平台、刷题网站等,保证所选样本足够大。其次,我们选择题目的时候,尽可能不选择一眼就能知道结果的简单题,也没有选择那种怪题、偏题和很难的题,我们原则是选择难度适中或者看上去简单但实际容易出错的题。通过我们的努力,力求所选出来的算法真题能够最大限度地帮助读者。在真题的解析上,我们采用层层递进的写法,先易后难,层层深入,将问题抽丝剥茧,使得读者能够跟随我们的思路,一步步找到问题的最优解。

写作的过程是一个自我认识、自我提高的过程。很多知识,只有深入理解与剖析后,才能领悟其中的精髓,掌握其中的技巧,程序员求职算法也不例外。本书不仅具备了同类书籍分析透彻,代码清晰合理的优点,还具备以下几个方面的优势:

第一,本套书籍分多种语言版本:C/C++、Java、C#、Python、PHP、Javascript、Kotlin、Go等,这样,不管读者侧重于哪一种语言,都能够有适合自己的书。本书中如果没有特别强调,代码实现均默认使用Go语言。

第二,每个题目除了循序渐进的分析以外,还对方法进行了详细阐述,针对不同方法的时间复杂度与空间复杂度,都进行了详细分析,除此之外,为了更具说服力,每一种方法几乎都对应有示例讲解辅以说明,对方法是一种更好的辅助讲解。

第三,代码较为规范,完全参照华为公司的编程规范等进行规范编码。小作坊编码的时代早已过去,程序员要想在一个团队中大展拳脚,就离不开合作,而合作的基础就是共同遵循统一的编码规范。不仅如此,规范化的编码往往还有助于读者理解代码。

第四,除了对题目的讲解,还有部分触类旁通的题目供读者练习。本书不可能将所有的程序员求职类的数据结构与算法类题目囊括,但是,本书会尽可能地将一些常见的求职类算法题、具有代表性的算法题重点讲解,将其他一些题目以练习题的形式展现在读者面前,以供读者思考与学习。

本书中有部分思想来源于网络上的无名英雄,无法追踪到最原始的出处,在此对这些幕后英雄致以最崇高的敬意。没有学不好的学生,只有教不好的老师,我们希望无论是什么层次的读者,都能毫无障碍地看懂书中所讲内容。如果读者存在求职困惑或是对本书中的内容存在异议,都可以通过邮件(yuancoder@foxmail.com)联系作者。猿媛之家面试笔试经验技巧篇

想找到一份程序员的工作,一点技术都没有显然是不行的,但是,只有技术也是不够的。面试笔试经验技巧篇主要针对程序员面试笔试中遇到的13个常见问题进行深度解析,并且结合实际情景,给出了一个较为合理的参考答案以供读者学习与应用,掌握这13个问题的解答精髓,对于求职者大有裨益。经验技巧1 如何巧妙地回答面试官的问题

所谓“来者不善,善者不来”,程序员面试中,求职者不可避免地需要回答面试官各种刁钻、犀利的问题,回答面试官的问题千万不能简单地回答“是”或者“不是”,而应该具体分析“是”或者“不是”的理由。

回答面试官的问题是一门学问。面对面试官提出的各类问题,如何才能条理清晰地回答呢?如何才能让自己的回答不至于撞上枪口呢?如何才能让自己的回答结果令面试官满意呢?

谈话是一种艺术,回答问题也是一种艺术,同样的话,不同的回答方式,往往也会产生出不同的效果,甚至是截然相反的效果。在此,编者提出以下几点建议,供读者参考。首先回答问题务必谦虚谨慎。既不能让面试官觉得自己很自卑,唯唯诺诺,也不能让面试官觉得自己清高自负,而应该通过问题的回答表现出自己自信从容、不卑不亢的一面。例如,当面试官提出“你在项目中起到了什么作用”的问题时,如果求职者回答:我完成了团队中最难的工作,此时就会给面试官一种居功自傲的感觉,而如果回答:我完成了文件系统的构建工作,这个工作被认为是整个项目中最具有挑战性的一部分内容,因为它几乎无法重用以前的框架,需要重新设计。这种回答不仅不傲慢,反而有理有据,更能打动面试官。

其次,回答面试官的问题时,不要什么都说,要适当地留有悬念。人一般都有猎奇的心理,面试官自然也不例外,而且,人们往往对好奇的事情更有兴趣、更加偏爱,也更加记忆深刻。所以,在回答面试官问题时,切记说关键点而非细节,说重点而非和盘托出,通过关键点,吸引面试官的注意力,等待他们继续“刨根问底”。例如,当面试官对你的简历中一个算法问题有兴趣,希望了解时,可以如下回答:我设计的这种查找算法,对于80%以上的情况,都可以将时间复杂度从 O(n)降低到 O(log n),如果您有兴趣,我可以详细给您分析具体的细节。

最后,回答问题要条理清晰、简单明了,最好使用“三段式”方式。所谓“三段式”,有点类似于中学作文中的写作风格,包括“场景/任务”“行动”和“结果”三部分内容。以面试官提的问题“你在团队建设中,遇到的最大挑战是什么”为例,第一步,分析场景/任务:在我参与的一个ERP项目中,我们团队一共四个人,除了我以外的其他三个人中,两个人能力很给力,人也比较好相处,但有一个人却不太好相处,每次我们小组讨论问题的时候,他都不太爱说话,也很少发言,分配给他的任务也很难完成。第二步,分析行动:为了提高团队的综合实力,我决定找个时间和他好好单独谈一谈。于是我利用周末时间,约他一起吃饭,吃饭的时候,顺便讨论了一下我们的项目,我询问了一些项目中他遇到的问题,通过他的回答,我发现他并不懒,也不糊涂,只是对项目不太了解,缺乏经验,缺乏自信而已,所以越来越孤立,越来越不愿意讨论问题。为了解决这个问题,我尝试着把问题细化到他可以完成的程度,从而建立起他的自信心。第三步,分析结果:他是小组中水平最弱的人,但是,慢慢地,他的技术变得越来越厉害了,也能够按时完成安排给他的工作了,人也越来越自信了,也越来越喜欢参与我们的讨论,并发表自己的看法,我们也都愿意与他一起合作了。“三段式”回答的一个最明显的好处就是条理清晰,既有描述,也有结果,有理有据,让面试官一目了然。

回答问题的技巧,是一门大学问。求职者完全可以在平时的生活中加以练习,提高自己与人沟通的技能,等到面试时,自然就得心应手了。经验技巧2 如何回答技术性的问题

程序员面试中,面试官会经常询问一些技术性的问题,有的问题可能比较简单,都是历年的笔试面试真题,求职者在平时的复习中会经常遇到,应对自然不在话下。但有的题目可能比较难,来源于Microsoft等大企业的题库或是企业自己为了招聘需要设计的题库,求职者可能从来没见过或者从来都不能完整地、独立地想到解决方案,而这些题目的解答往往又是企业比较关注的。

如何能够回答好这些技术性的问题呢?编者建议:会做的一定要拿满分,不会做的一定要拿部分分。即对于简单的题目,求职者要努力做到完全正确,毕竟这些题目,只要复习得当,完全回答正确一点问题都没有(编者认识的一个朋友据说把《编程之美》《编程珠玑》《程序员面试笔试宝典》上面的技术性题目与答案全都背得滚瓜烂熟了,后来找工作简直成了“offer杀器”,完全就是一个“Bug”,无解了);对于难度比较大的题目,不要惊慌,也不要害怕,即使无法完全做出来,也要努力思考问题,哪怕是半成品也要写出来,至少要把自己的思路表达给面试官,让面试官知道你的想法,而不是完全回答不会或者放弃,因为面试官很多时候除了关注你的独立思考问题的能力以外,还会关注你技术能力的可塑性,观察求职者是否能够在别人的引导下去正确地解决问题,所以,对于你不会的问题,他们很有可能会循序渐进地启发你去思考,通过这个过程,让他们更加了解你。

一般而言,在回答技术性问题时,求职者大可不必胆战心惊,除非是没学过的新知识,否则,一般都可以采用以下六个步骤来分析解决。(1)勇于提问

面试官提出的问题,有时候可能过于抽象,让求职者不知所措,或者无从下手,所以,对于面试中的疑惑,求职者要勇敢地提出来,多向面试官提问,把不明确或二义性的情况都问清楚。不用担心你的问题会让面试官烦恼,影响你的面试成绩,相反还对面试结果产生积极影响:一方面,提问可以让面试官知道你在思考,也可以给面试官一个心思缜密的好印象;另一方面,方便后续自己对问题的解答。

例如,面试官提出一个问题:设计一个高效的排序算法。求职者可能丈二和尚摸不到头脑,排序对象是链表还是数组?数据类型是整型、浮点型、字符型还是结构体类型?数据基本有序还是杂乱无序?数据量有多大,1000以内还是百万以上个数?此时,求职者大可以将自己的疑问提出来,问题清楚了,解决方案也自然就出来了。(2)高效设计

对于技术性问题,如何才能打动面试官?完成基本功能是必须的,仅此而已吗?显然不是,完成基本功能顶多只能算及格水平,要想达到优秀水平,至少还应该考虑更多的内容,以排序算法为例:时间是否高效?空间是否高效?数据量不大时也许没有问题,如果是海量数据呢?是否考虑了相关环节,例如数据的“增删改查”?是否考虑了代码的可扩展性、安全性、完整性以及鲁棒性?如果是网站设计,是否考虑了大规模数据访问的情况?是否需要考虑分布式系统架构?是否考虑了开源框架的使用?(3)伪代码先行

有时候实际代码会比较复杂,上手就写很有可能会漏洞百出、条理混乱,所以,求职者可以首先征求面试官的同意,在编写实际代码前,写一个伪代码或者画好流程图,这样做往往会让思路更加清晰明了。

切记在写伪代码前要告诉面试官,他们很有可能对你产生误解,认为你只会纸上谈兵,实际编码能力却不行。只有征得了他们的允许,方可先写伪代码。(4)控制节奏

如果是算法设计题,面试官都会给求职者一个时间限制用以完成设计,一般为 20min左右。完成得太慢,会给面试官留下能力不行的印象,但完成得太快,如果不能保证百分百正确,也会给面试官留下毛手毛脚的印象,速度快当然是好事情,但只有速度,没有质量,速度快根本不会给面试加分。所以,编者建议,回答问题的节奏最好不要太慢,也不要太快,如果实在是完成得比较快,也不要急于提交给面试官,最好能够利用剩余的时间,认真仔细地检查一些边界情况、异常情况及极性情况等,看是否也能满足要求。(5)规范编码

回答技术性问题时,多数都是纸上写代码,离开了编译器的帮助,求职者要想让面试官对自己的代码一看即懂,除了字迹要工整,不能眉飞色舞以外,最好是能够严格遵循编码规范:函数变量命名、换行缩进、语句嵌套和代码布局等,同时,代码设计应该具有完整性,保证代码能够完成基本功能、输入边界值能够得到正确的输出、对各种不合规范的非法输入能够做出合理的错误处理,否则,写出的代码即使无比高效,面试官也不一定看得懂或者看起来非常费劲,这些对面试成功都是非常不利的。(6)精心测试

在软件界,有一句真理:任何软件都有Bug。但不能因为如此就纵容自己的代码,允许错漏百出。尤其是在面试过程中,实现功能也许并不十分困难,困难的是在有限的时间内设计出的算法,各种异常是否都得到了有效的处理,各种边界值是否都在算法设计的范围内。

测试代码是让代码变得完备的高效方式之一,也是一名优秀程序员必备的素质之一。所以,在编写代码前,求职者最好能够了解一些基本的测试知识,做一些基本的单元测试、功能测试、边界测试以及异常测试。

在回答技术性问题时,注意在思考问题的时候,千万别一句话都不说,面试官面试的时间是有限的,他们希望在有限的时间内尽可能地去了解求职者,如果求职者坐在那里一句话不说,不仅会让面试官觉得求职者技术水平不行,而且会认为求职者思考问题能力以及沟通能力可能都存在问题。

其实,在面试时,求职者往往会存在一种思想误区,把技术性面试的结果看得太重要了。面试过程中的技术性问题,结果固然重要,但也并非最重要的内容,因为面试官看重的不仅仅是最终的结果,还包括求职者在解决问题的过程中体现出来的逻辑思维能力以及分析问题的能力。所以,求职者在与面试官的博弈中,要适当地提问,通过提问获取面试官的反馈信息,并抓住这些有用的信息进行辅助思考,从而博得面试官的认可,进而提高面试的成功率。经验技巧3 如何回答非技术性问题

评价一个人的能力,除了专业能力,还有一些非专业能力,如智力、沟通能力和反应能力等,所以在IT企业招聘过程的笔试面试环节中,并非所有的笔试内容都是C/C++/Java、数据结构与算法及操作系统等专业知识,也包括其他一些非技术类的知识,如智力题、推理题和作文题等。技术水平测试可以考查一个求职者的专业素养,而非技术类测试则更加强调求职者的综合素质,包括数学分析能力、反应能力、临场应变能力、思维灵活性、文字表达能力和性格特征等内容。考查的形式多种多样,但与公务员考查相似,主要包括行测(占大多数)、性格测试(大部分都有)、应用文和开放问题等内容。

每个人都有自己的答题技巧,答题方式也各不相同,以下是一些相对比较好的答题技巧(以行测为例):

1)合理有效的时间管理。由于题目的难易不同,所以不要对所有题目都“绝对的公平”,或“一刀切”,要有轻重缓急,最好的做法是不按顺序回答。行测中有各种题型,如数量关系、图形推理、应用题、资料分析和文字逻辑等,而不同的人擅长的题型是不一样的,因此应该首先回答自己最擅长的问题。例如,如果对数字比较敏感,那么就先答数量关系。

2)注意时间的把握。由于题量一般都比较大,可以先按照总时间/题数来计算每道题的平均答题时间,如10s,如果看到某一道题5s后还没思路,则马上放弃。在做行测题目的时候,以在最短的时间内拿到最多分为目标。

3)平时多关注图表类题目,培养迅速抓住图表中各个数字要素间相互逻辑关系的能力。

4)做题要集中精力,只有集中精力、全神贯注,才能将自己的水平最大限度地发挥出来。

5)学会关键字查找,通过关键字查找,能够提高做题效率。

6)提高估算能力,有很多时候,估算能够极大地提高做题速度,同时保证正确率。

除了行测以外,一些企业非常相信个人性格对入职匹配的影响,所以都会引入相关的性格测试题用于测试求职者的性格特性,看其是否适合所投递的职位。大多数情况下,只要按照自己的真实想法选择就行了,不要弄巧成拙,因为测试是为了得出正确的结果,所以大多测试题前后都有相互验证的题目。如果求职者自作聪明,选择该职位可能要求的性格选项,则很可能导致测试前后不符,这样很容易让企业发现你是个不诚实的人,从而首先予以筛除。经验技巧4 如何回答快速估算类问题

有些大企业的面试官,总喜欢使一些“阴招”“损招”,出一些快速估算类问题,对他们而言,这些问题只是手段,不是目的,能够得到一个满意的结果固然是他们所需要的,但更重要的是通过这些题目他们可以考查求职者的快速反应能力以及逻辑思维能力。由于求职者平时准备的时候可能对此类问题有所遗漏,一时很难想起解决的方案。而且,这些题目乍一看确实是毫无头绪,无从下手,完全就是为难求职者的,其实求职者只要从惊慌失措中冷静下来,稍加分析,也就有解决方法了。因为此类题目比较灵活,属于开放性试题,一般没有标准答案,只要弄清楚了回答要点,分析合理到位,具有说服力,能够自圆其说,就是正确答案,一点都不困难。

例如,面试官可能会问这样一个问题:“请你估算一下一家商场在促销时一天的营业额?”,求职者又不是统计局官员,如何能够得出一个准确的数据呢?求职者又不是开商场的,如何能够得出一个准确的数据呢?即使求职者是商场的大当家,也不可能弄得清清楚楚明明白白吧?

难道此题就无解了吗?其实不然,本题只要能够分析出一个概数就行了,不一定要精确数据,而分析概数的前提就是做出各种假设。以该问题为例,可以尝试从以下思路入手:从商场规模、商铺规模入手,通过每平方米的租金,估算出商场的日租金,再根据商铺的成本构成,得到全商场日均交易额,再考虑促销时的销售额与平时销售额的倍数关系,乘以倍数,即可得到促销时一天的营业额。具体而言,包括以下估计数值:

1)以一家较大规模商场为例,商场一般按6层计算,每层大约2长100m,宽100m,合计60000m的面积。2

2)商铺规模占商场规模的一半左右,合计30000m。2

3)商铺租金约为40元/m,估算出年租金为40×30000×365=4.38亿。

4)对商户而言,租金一般占销售额20%左右,则年销售额为4.38亿×5=21.9亿。计算平均日销售额为21.9亿/365=600万。

5)促销时的日销售额一般是平时的10倍,所以大约为600万×10=6000万。

此类题目涉及面比较广,例如:估算一下北京小吃店的数量?估算一下我国在过去一年方便面的市场销售额是多少?估算一下长江的水的质量?估算一下一个行进在小雨中的人5min内身上淋到的雨的质量?估算一下东方明珠电视塔的质量?估算一下我国去年一年一共用掉了多少块尿布?估算一下杭州的轮胎数量?但一般都是即兴发挥,不是哪道题记住答案就可以应付得了的。遇到此类问题,一步步抽丝剥茧,才是解决之道。经验技巧5 如何回答算法设计问题

程序员面试中的很多算法设计问题,都是历年来各家企业的“炒现饭”,不管求职者以前对算法知识学习得是否扎实,理解得是否深入,只要面试前买本《程序员面试笔试宝典》(编者早前编写的一本书,由机械工业出版社出版),学习上一段时间,牢记于心,应付此类题目完全没有问题。但遗憾的是,很多世界级知名企业也深知这一点,如果纯粹是出一些毫无技术含量的题目,对于考前“突击手”而言,可能会占尽便宜,但对于那些技术好的人而言是非常不公平的。所以,为了把优秀的求职者与一般的求职者能够更好地区分开来,他们会年年推陈出新,越来越倾向于出一些有技术含量的“新”题,这些题目以及答案,不再是以前的陈谷子烂芝麻了,而是经过精心设计的好题。

在程序员面试中,算法的地位就如同是GRE或托福考试在出国留学中的地位一样,必须但不是最重要的,它只是众多考核方面中的一个而已,不一定就能决定求职者的生死。虽然如此,但并非说就不用去准备算法知识了,因为算法知识回答得好,必然会成为面试的加分项,对于求职成功,百利而无一害。那么如何应对此类题目呢?很显然,编者不可能将此类题目都在本书中一一解答,一来由于内容众多,篇幅有限,二来也没必要,今年考过了,以后一般就不会再考了,不然还是没有区分度。编者以为,靠死记硬背肯定是行不通的,解答此类算法设计问题,需要求职者具有扎实的基本功以及良好的运用能力,编者无法左右求职者的个人基本功以及运用能力,因为这些能力需要求职者“十年磨一剑”地苦学,但编者可以提供一些比较好的答题方法和解题思路,以供求职者在面试时应对此类算法设计问题。“授之以鱼不如授之以渔”,岂不是更好?(1)归纳法

此方法通过写出问题的一些特定的例子,分析总结其中一般的规律。具体而言就是通过列举少量的特殊情况,经过分析,最后找出一般的关系。例如,某人有一对兔子饲养在围墙中,如果它们每个月生一对兔子,且新生的兔子在第二个月后也是每个月生一对兔子,问一年后围墙中共有多少对兔子。

使用归纳法解答此题,首先想到的就是第一个月有多少对兔子,第一个月的时候,最初的一对兔子生下一对兔子,此时围墙内共有两对兔子。第二个月仍是最初的一对兔子生下一对兔子,共有 3 对兔子。到第三个月除最初的兔子新生一对兔子外,第一个月生的兔子也开始生兔子,因此共有 5 对兔子。通过举例,可以看出,从第二个月开始,每一个月兔子总数都是前两个月兔子总数之和,U=Un+1n+U,一年后,围墙中的兔子总数为377对。n-1

此种方法比较抽象,也不可能对所有的情况进行列举,所以,得出的结论只是一种猜测,还需要进行证明。(2)相似法

此方法考虑解决问题的算法是相似的。如果面试官提出的问题与求职者以前用某个算法解决过的问题相似,此时此刻就可以触类旁通,尝试改进原有算法来解决这个新问题。而通常情况下,此种方法都会比较奏效。

例如,实现字符串的逆序打印,也许求职者从来就没遇到过此问题,但将字符串逆序肯定在求职准备的过程中是见过的。将字符串逆序的算法稍加处理,即可实现字符串的逆序打印。(3)简化法

此方法首先将问题简单化,例如改变一下数据类型、空间大小等,然后尝试着将简化后的问题解决,一旦有了一个算法或者思路可以解决这个被简化过的问题,再将问题还原,尝试着用此类方法解决原有问题。

例如,在海量日志数据中提取出某日访问xxx网站次数最多的IP。很显然,由于数据量巨大,直接进行排序不可行,但如果数据规模不大时,采用直接排序不失为一种好的解决方法。那么如何将问题规模缩小呢?于是想到了Hash法,Hash往往可以缩小问题规模,然后在简化过的数据里面使用常规排序算法即可找出此问题的答案。(4)递归法

为了降低问题的复杂度,很多时候都会将问题逐层分解,最后归结为一些最简单的问题,这就是递归。此种方法,首先要能够解决最基本的情况,然后以此为基础,解决接下来的问题。

例如,在寻求全排列的时候,可能会感觉无从下手,但仔细推敲,会发现后一种排列组合往往是在前一种排列组合的基础上进行的重新排列,只要知道了前一种排列组合的各类组合情况,只需将最后一个元素插入到前面各种组合的排列里面,就实现了目标:即先截去字符串 s[1…n]中的最后一个字母,生成所有 s[1…n-1]的全排列,然后再将最后一个字母插入到每一个可插入的位置。(5)分治法

任何一个可以用计算机求解的问题所需的计算时间都与其规模有关。问题的规模越小,越容易直接求解,解题所需的计算时间也越少。而分治法正是充分考虑到这一内容,将一个难以直接解决的大问题,分割成一些规模较小的相同问题,以便各个击破,分而治之。分治法一般包含以下三个步骤:

1)将问题的实例划分为几个较小的实例,它们之间最好具有相等的规模。

2)对这些较小的实例求解,而最常见的方法一般是递归。

3)如果有必要,合并这些较小问题的解,以得到原始问题的解。

分治法是程序员面试常考的算法之一,一般适用于二分查找、大整数相乘、求最大子数组和、找出伪币、金块问题、矩阵乘法、残缺棋盘、归并排序、快速排序、距离最近的点对、导线与开关等。(6)Hash法

很多面试笔试题目,都要求求职者给出的算法尽可能高效。什么样的算法是高效的?一般而言,时间复杂度越低的算法越高效。而要想达到时间复杂度的高效,很多时候就必须在空间上有所牺牲,用空间来换时间。而用空间换时间最有效的方式就是 Hash 法、大数组和位图法。当然,此类方法并非包治百病,有时,面试官也会对空间大小进行限制,那么此时,求职者只能再去思考其他的方法了。

其实,凡是涉及大规模数据处理的算法设计中,Hash法是最好的方法之一。(7)轮询法

在设计每道面试笔试题时,往往会有一个载体,这个载体便是数据结构,例如数组、链表、二叉树或图等,当载体确定后,可用的算法自然而然地就会暴露出来。可问题是很多时候并不确定这个载体是什么。当无法确定这个载体时,一般也就很难想到合适的方法了。

编者建议,此时求职者可以采用最原始的思考问题的方法--轮询法,在脑海中轮询各种可能的数据结构与算法,常考的数据结构与算法一共就那么几种(见表1),即使不完全一样,也是由此衍生出来的或者相似的,总有一款适合考题。表1 最常考的数据结构与算法知识点

此种方法看似笨拙,其实实用,只要求职者对常见的数据结构与算法烂熟于心,一点都没有问题。

为了更好地理解这些方法,求职者可以在平时的准备过程中,应用此类方法去答题,做得多了,自然对各种方法也就熟能生巧了,面试的时候,再遇到此类问题,也就能够收放自如了。算法设计功力的练就是平时一点一滴的付出和思维的磨炼。方法与技巧也许只是给面试打了一针“鸡血”、喂一口“大补丸”,不会让自己变得从容自信,真正的功力还是需要一个长期的积累过程的。经验技巧6 如何回答系统设计题

应届生在面试的时候,偶尔也会遇到一些系统设计题,而这些题目往往只是测试一下求职者的知识面,或者测试求职者对系统架构方面的了解,一般不会涉及具体的编码工作。虽然如此,对于此类问题,很多人还是感觉难以应对,也不知道从何说起。

如何应对此类题目呢?在正式介绍基础知识之前,首先罗列几个常见的系统设计相关的面试笔试题,如下:

1)设计一个DNS的Cache结构,要求能够满足每秒5000次以上的查询,满足IP数据的快速插入,查询的速度要快(题目还给出了一系列的数据,比如站点数总共为 5000万、IP地址有1000万等)。

2)有N台机器,M个文件,文件可以以任意方式存放到任意机器上,文件可任意分割成若干块。假设这N台机器的宕机率小于33%,想在宕机时可以从其他未宕机的机器中完整导出这M个文件,求最好的存放与分割策略。

3)假设有30台服务器,每台服务器上面都存有上百亿条数据(有可能重复),如何找出这30台机器中,根据某关键字,重复出现次数最多的前100条?要求使用Hadoop来实现。

4)设计一个系统,要求写速度尽可能快,并说明设计原理。

5)设计一个高并发系统,说明架构和关键技术要点。

6)有25T的log(query->queryinfo),log在不断地增长,设计一个方案,给出一个query能快速返回queryinfo。

以上所有问题中凡是不涉及高并发的,基本可以采用Google的三个技术解决,即GFS、MapReduce 和 Bigtable,这三个技术被称为“Google 三驾马车”,Google 只公开了论文而未开源代码,开源界对此非常有兴趣,仿照这三篇论文实现了一系列软件,如 Hadoop、HBase、HDFS及Cassandra等。

在Google这些技术还未出现之前,企业界在设计大规模分布式系统时,采用的架构往往是database+sharding+cache,现在很多公司(比如taobao、weibo.com)仍采用这种架构。在这种架构中,仍有很多问题值得去探讨。如采用什么数据库,是SQL界的MySQL还是NoSQL界的Redis/TFS,两者有何优劣?采用什么方式sharding(数据分片),是水平分片还是垂直分片?据网上资料显示, weibo.com 和 taobao 图片存储中曾采用的架构是Redis/MySQL/TFS+sharding+cache,该架构解释如下:前端cache是为了提高响应速度,后端数据库则用于数据永久存储,防止数据丢失,而sharding是为了在多台机器间分摊负载。最前端由大块大块的cache组成,要保证至少99%(该数据在weibo.com架构中的是自己猜的,而taobao图片存储模块是真实的)的访问数据落在cache中,这样可以保证用户访问速度,减少后端数据库的压力。此外,为了保证前端 cache 中的数据与后端数据库中的数据一致,需要有一个中间件异步更新(为什么使用异步?理由简单:同步代价太高。异步有缺点,如何弥补?)数据,这个有些人可能比较清楚,新浪有个开源软件叫Memcachedb (整合了Berkeley DB和Memcached),正是完成此功能。另外,为了分摊负载压力和海量数据,会将用户微博信息经过分片后存放到不同节点上(称为“Sharding”)。

这种架构优点非常明显:简单,在数据量和用户量较小的时候完全可以胜任。但缺点是扩展性和容错性太差,维护成本非常高,尤其是数据量和用户量暴增之后,系统不能通过简单地增加机器解决该问题。

鉴于此,新的架构应运而生,新的架构仍然采用Google公司的架构模式与设计思想,以下将分别就此内容进行分析。

GFS是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上,提供容错功能。现在开源界有 HDFS ( Hadoop Distributed File System),该文件系统虽然弥补了数据库+sharding的很多缺点,但自身仍存在一些问题,比如:由于采用 master/slave 架构,因此存在单点故障问题;元数据信息全部存放在master端的内存中,因而不适合存储小文件,或者说如果存储大量小文件,那么存储的总数据量不会太大。

MapReduce是针对分布式并行计算的一套编程模型。其最大的优点是:编程接口简单,自动备份(数据默认情况下会自动备三份),自动容错和隐藏跨机器间的通信。在 Hadoop中,MapReduce作为分布计算框架,而HDFS作为底层的分布式存储系统,但MapReduce不是与 HDFS 耦合在一起的,完全可以使用自己的分布式文件系统替换掉 HDFS。当前MapReduce有很多开源实现,如Java实现Hadoop MapReduce,C++实现Sector/sphere等,甚至有些数据库厂商将MapReduce集成到数据库中了。

BigTable俗称“大表”,是用来存储结构化数据的,编者觉得,BigTable在开源界最火爆,其开源实现最多,包括HBase、Cassandra和levelDB等,使用也非常广泛。

除了这“三驾马车”以外,还有其他一些技术可供学习与使用:

Dynamo是亚马逊的key-value模式的存储平台,可用性和扩展性都很好,采用DHT (Distributed Hash Table)对数据分片,解决单点故障问题,在Cassandra中,也借鉴了该技术,在BT和电驴这两种下载引擎中,也采用了类似算法。

虚拟节点技术常用于分布式数据分片中。具体应用场景是:有一大块数据(可能 TB级或者 PB 级),需按照某个字段(key)分片存储到几十(或者更多)台机器上,同时想尽量负载均衡且容易扩展。传统的做法是:Hash(key) mod N,这种方法最大的缺点是不容易扩展,即增加或者减少机器均会导致数据全部重分布,代价太大。于是新技术诞生了,其中一种是上面提到的DHT,现在已经被很多大型系统采用,还有一种是对“Hash(key) mod N”的改进:假设要将数据分布到20台机器上,传统做法是Hash(key) mod 20,而改进后, N取值要远大于20,比如是20000000,然后采用额外一张表记录每个节点存储的key的模值,比如:

node1:0~1000000

node2:1000001~2000000

……

这样,当添加一个新的节点时,只需将每个节点上部分数据移动给新节点,同时修改一下该表即可。

Thrift是一个跨语言的RPC框架,分别解释“RPC”和“跨语言”如下:RPC是远程过程调用,其使用方式与调用一个普通函数一样,但执行体发生在远程机器上;跨语言是指不同语言之间进行通信,比如C/S架构中,Server端采用C++编写,Client端采用PHP编写,怎样让两者之间通信,Thrift是一种很好的方式。

本篇最前面的几道题均可以映射到以上几个系统的某个模块中,如:

1)关于高并发系统设计,主要有以下几个关键技术点:缓存、索引、数据分片及锁粒度尽可能小。

2)题目2)涉及现在通用的分布式文件系统的副本存放策略。一般是将大文件切分成小的block(如64MB)后,以block为单位存放三份到不同的节点上,这三份数据的位置需根据网络拓扑结构配置,一般而言,如果不考虑跨数据中心,可以这样存放:两个副本存放在同一个机架的不同节点上,而另外一个副本存放在另一个机架上,这样从效率和可靠性上,都是最优的。如果考虑跨数据中心,可将两份存在一个数据中心的不同机架上,另一份放到另一个数据中心。

3)题目4)涉及BigTable的模型。主要思想是将随机写转化为顺序写,进而大大提高写速度。具体是:由于磁盘物理结构的独特设计,其并发的随机写(主要是因为磁盘寻道时间长)非常慢,考虑到这一点,在BigTable模型中,首先会将并发写的大批数据放到一个内存表(称为“memtable”)中,当该表大到一定程度后,会顺序写到一个磁盘表(称为“SSTable”)中,这种写是顺序写,效率极高。此时可能有读者问,随机读可不可以这样优化?答案是:看情况。通常而言,如果读并发度不高,则不可以这么做,因为如果将多个读重新排列组合后再执行,系统的响应时间太慢,用户可能接受不了,而如果读并发度极高,也许可以采用类似机制。经验技巧7 如何解决求职中的时间冲突问题

对于求职者而言,求职季就是一个赶场季,一天少则几家、十几家企业入校招聘,多则几十家、上百家企业招兵买马,企业多,选择自然也多,这固然是一件好事情,但由于招聘企业实在是太多,自然而然会导致另外一个问题的发生:同一天企业扎堆,且都是自己心仪或欣赏的大牛企业。如果不能够提前掌握企业的宣讲时间、地点,是很容易迟到或错过的。但有时候即使掌握了宣讲时间、笔试和面试时间,还是有可能错过,为什么呢?时间冲突,人不可能具有分身术,也不可能同一时间做两件不同的事情,所以,很多时候就必须有所取舍了。

到底该如何取舍呢?该如何应对这种时间冲突的问题呢?在此,编者将自己的一些想法和经验分享出来,以供读者参考:

1)如果多家心仪企业的校园宣讲时间发生冲突(前提是只宣讲,不笔试,否则请看后面的建议),此时最好的解决方法是和同学或朋友商量好,各去一家,然后大家进行信息共享。

2)如果多家心仪企业的笔试时间发生冲突,此时只能选择其一,毕竟企业的笔试时间都是考虑到了成百上千人的安排,需要提前安排考场、考务人员和阅卷人员等,不可能为了某一个人而轻易改变。所以,最好选择自己更有兴趣的企业参加笔试。

3)如果多家心仪企业的面试时间发生冲突,不要轻易放弃。对于面试官而言,面试任何人都是一样的,因为面试官谁都不认识,而面试时间也是灵活性比较大的,一般可以通过电话协商。求职者可以与相关工作人员(一般是企业的HR)进行沟通,以某种理由(例如学校的事宜、导师的事宜或家庭的事宜等,前提是必须能够说服人,不要给出的理由连自己都说服不了)让其调整时间,一般都能协调下来。但为了保证协调的成功率,一般要接到面试通知后第一时间联系相关工作人员变更时间,这样他们协调起来也更方便。

正如世界上没有能够包治百病的药物一样,以上这些建议在应用时,很多情况下也做不到全盘兼顾,当必须进行多选一的时候,求职者就要对此进行评估了,评估的项目可以包括对企业的中意程度、获得offer的概率及去工作的可能性等。评估的结果往往具有很强的参考性,求职者依据评估结果做出的选择一般也会比较合理。经验技巧8 如果面试问题曾经遇见过,是否要告知面试官

其实面试中,大多数题目都不是凭空想象出来的,而是有章可循,只要求职者肯花时间,耐得住寂寞,复习得当,基本上在面试前都会见过相同的或者类似的问题(当然,很多知名企业每年都会推陈出新,这些题目是很难完全复习到位的)。所以,在面试中,求职者曾经遇见过面试官提出的问题也就不足为奇了。那么,一旦出现这种情况,求职者是否要如实告诉面试官呢?

选择不告诉面试官的理由比较充分:首先,面试的题目 60%~70%都是见过或者见过类似的题目,难道要一一告知面试官吗?如果那样的话,估计就没有几个题不用告知面试官了,面试官估计也就要等着失业了。其次,即使曾经见过该问题了,也是自己辛勤耕耘、努力奋斗的结果,很多人复习不用功或者方法不到位,也许从来就没见过,而这些题也许正好是拉开求职者差距的分水岭,是面试官用来区分求职者实力的内容,为什么要告知面试官呢?最后,一旦告知面试官,面试官很有可能会不断地加大面试题的难度来“为难”你,对你的面试可能没有好处。

同样,选择告诉面试官的理由也比较充分:第一,如实告诉面试官,不仅可以彰显出求职者个人的诚实品德,还可以给面试官留下良好的印象,说不定能够在面试中加分。第二,有些问题,即使求职者曾经复习过,但也无法保证完全回答正确,如果向面试官如实相告,没准还可以规避这一问题,避免错误的发生。第三,求职者如果见过该问题,也能轻松应答,题目简单倒也无所谓,一旦题目难度比较大,求职者却对面试官有所隐瞒,就极有可能给面试官造成一种求职者水平很强的假象,进而导致面试官的判断出现偏差,后续的面试有可能向着不利于求职者的方向发展。

其实,仁者见仁,智者见智,这个问题并没有固定的答案,需要根据实际情况来决定。针对此问题,一般而言,如果面试官不主动询问求职者,求职者也不用主动告知面试官真相。但如果求职者觉得告知面试官真相对自己更有利的时候,也可以主动告知。经验技巧9 被企业拒绝后是否可以再申请

很多企业为了能够在一年一度的招聘季节中,提前将优秀的程序员锁定到自己的麾下,往往会先下手为强。他们通常采取的措施有以下两种:第一种,招聘实习生;第二种,多轮招聘。

招聘开始后,往往是几家欢喜几家愁,提前拿到企业绿卡的欢天喜地,而没有被选上的忧心忡忡。难道一次失望的表现就永远会被企业拉入黑名单了吗?难道一次失败的经历就会永远被记录在个人历史的耻辱柱上了吗?

答案当然是否定的,对心仪的女孩表白,即使第一次被拒绝了,都还可以一而再再而三地表白呢?多次表白后成功的案例比比皆是,更何况是求职找工作。一般而言,企业是不会记仇的,尤其是知名的大企业,对此都会有明确表示。如果在企业的实习生招聘或在企业以前的招聘中不幸被pass掉了,一般是不会被拉入企业的黑名单的。在下一次招聘中,和其他求职者具有相同的竞争机会(有些企业可能会要求求职者等待半年到一年时间再能应聘该企业,但上一次求职的糟糕表现不会被计入此次招聘中)。

对心仪的对象表白被拒绝了,不是一样还可以继续表白吗?也许是在考验,也许是在等待,也许真的是拒绝,但无论出于什么原因,此时此刻都不要对自己丧失信心。工作也是如此,以编者身边的很多同学和朋友为例,很多人最开始被一家企业拒绝了,过了一段时间,又发现他们已成为该企业的员工。所以,即使被企业拒绝了也不是什么大不了的事情,以后还有机会的,有志者自有千计万计,无志者只感千难万难,关键是看你愿意成为什么样的人了。经验技巧10 如何应对自己不会回答的问题

在面试的过程中,求职者对面试官提出的问题并不是每个问题都能回答上来,计算机技术博大精深,很少有人能对计算机技术的各个分支学科了如指掌,而且抛开技术层面的问题,在面试那种紧张的环境中,回答不上来的情况也容易出现。面试的过程是一个和面试官“斗智斗勇”的过程,遇到自己不会回答的问题时,错误的做法是保持沉默或者支支吾吾、不懂装懂,硬着头皮胡乱说一通,这样会使面试气氛很尴尬,很难再往下继续进行。

其实面试遇到不会的问题是一件很正常的事情,没有人是万事通,即使对自己的专业有相当的研究与认识,也可能会在面试中遇到感觉没有任何印象、不知道如何回答的问题。在面试中遇到实在不懂或不会回答的问题,正确的办法是本着实事求是的原则,态度诚恳,告诉面试官不知道答案。例如,“对不起,不好意思,这个问题我回答不出来,我能向您请教吗?”

征求面试官的意见时可以说说自己的个人想法,如果面试官同意听了,就将自己的想法说出来,回答时要谦逊有礼,切不可说起没完。然后应该虚心地向面试官请教,表现出强烈的学习欲望。

所以,遇到自己不会的问题时,正确的做法是:“知之为知之,不知为不知”,不懂就是不懂,不会就是不会,一定要实事求是,坦然面对。最后也能给面试官留下诚实、坦率的好印象。经验技巧11 如何应对面试官的“激将法”“激将法”是面试官用以淘汰求职者的一种惯用方法,它是指面试官采用怀疑、尖锐或咄咄逼人的交流方式来对求职者进行提问的方法。例如,“我觉得你比较缺乏工作经验”“我们需要活泼开朗的人,你恐怕不合适”“你的教育背景与我们的需求不太适合”“你的成绩太差”“你的英语没过六级”“你的专业和我们不对口”“为什么你还没找到工作”或“你竟然有好多门课不及格”等,很多求职者遇到这样的问题,会很快产生我是来面试而不是来受侮辱的想法,往往会被“激怒”,于是奋起反抗。千万要记住,面试的目的是要获得工作,而不是要与面试官争个高低,也许争辩取胜了,却失去了一份工作。所以对于此类问题求职者应该进行巧妙的回答,一方面化解不友好的气氛,另一方面得到面试官的认可。

具体而言,受到这种“激将”时,求职者首先应该保持清醒的头脑,企业让你来参加面试,说明你已经通过了他们第一轮的筛选,至少从简历上看,已经表明你符合求职岗位的需要,企业对你还是感兴趣的。其次,做到不卑不亢,不要被面试官的思路带走,要时刻保持自己的思路和步调。此时可以换一种方式,如介绍自己的经历、工作和优势,来表现自己的抗压能力。

针对面试官提出的非名校毕业的问题,比较巧妙的回答是:比尔盖茨也并非毕业于哈佛大学,但他一样成为世界首富,成为举世瞩目的人物。针对缺乏工作经验的问题,可以回答:每个人都是从没经验变为有经验的,如果有幸最终能够成为贵公司的一员,我将很快成为一个经验丰富的人。针对专业不对口的问题,可以回答:专业人才难得,复合型人才更难得,在某些方面,外行的灵感往往超过内行,他们一般没有思维定式,没有条条框框。面试官还可能提问:你的学历对我们来讲太高了。此时也可以很巧妙地回答:今天我带来的3张学历证书,您可以从中挑选一张您认为合适的,其他两张,您就不用管了。针对性格内向的问题,可以回答:内向的人往往具有专心致志、锲而不舍的品质,而且我善于倾听,我觉得应该把发言机会更多地留给别人。

面对面试官的“挑衅”行为,如果求职者回答得结结巴巴或者无言以对,抑或怒形于色、据理力争,那就掉进了对方所设的陷阱,所以当求职者碰到此种情况时,最重要的一点就是保持头脑冷静,不要过分较真,以一颗平淡的心对待。经验技巧12 如何处理与面试官持不同观点这个问题

在面试的过程中,求职者所持有的观点不可能与面试官一模一样,在对某个问题的看法上,很有可能两个人相去甚远。当与面试官持不同观点时,有的求职者自作聪明,立马就反驳面试官,例如,“不见得吧!”“我看未必”“不会”“完全不是这么回事!”或“这样的说法未必全对”等,其实,虽然也许确实不像面试官所说的,但是太过直接的反驳往往会导致面试官心理的不悦,最终的结果很可能是“逞一时之快,失一份工作”。

就算与面试官持不一样的观点,也应该委婉地表达自己的真实想法,因为我们不清楚面试官的度量,碰到心胸宽广的面试官还好,万一碰到了“小心眼”的面试官,他和你较真起来,吃亏的还是自己。

所以回答此类问题的最好方法往往是应该先赞同面试官的观点,给对方一个台阶下,然后再说明自己的观点,用“同时”“而且”过渡,千万不要说“但是”,一旦说了“但是”“却”就容易把自己放在面试官的对立面去。经验技巧13 什么是职场暗语

随着求职大势的变迁发展,以往常规的面试套路,因为过于单调、简明,已经被众多“面试达人”们挖掘出了各种“破解秘诀”,形成了类似“求职宝典”的各类“面经”。所谓“道高一尺,魔高一丈”,面试官们也纷纷升级面试模式,为求职者们制作了更为隐蔽、间接、含混甚至“下套”的面试题目,让那些早已流传开来的“面试攻略”毫无用武之地,一些蕴涵丰富信息但以更新面目出现的问话屡屡“秒杀”求职者,让求职者一头雾水,掉进了陷阱里面还以为吃到肉了,例如,“面试官从头到尾都表现出对我很感兴趣的样子,营造出马上就要录用我的氛围,为什么我最后还是被拒了?”“为什么 HR 会问我一些与专业、能力根本无关的怪问题,我感觉回答得也还行,为什么最后还是被拒了?”其实,这都是没有听懂面试“暗语”,没有听出面试官“弦外之音”的表现。“暗语”已经成为一种测试求职者心理素质、挖掘求职者内心真实想法的有效手段。理解这些面试中的暗语,对于求职者而言,不可或缺。

以下是一些常见的面试暗语,求职者一定要弄清楚其中蕴含的深意,不然可能“躺着也中枪”,最后只能铩羽而归。(1)请把简历先放在这,有消息我们会通知你的

面试官说出这句话,则表明他对你已经兴趣不大,为什么一定要等到有消息了再通知呢?难道现在不可以吗?所以,作为求职者,此时一定不要自作聪明、一厢情愿地等待着他们有消息通知你,因为一般不会有消息了。(2)我不是人力资源的,你别拘束,咱们就当是聊天,随便聊聊

一般来说,能当面试官的人都是久经沙场的老将,所以,作为求职者应该时刻保持高度警觉,面试官不经意间问出来的问题,看似随意,很可能是他最想知道的。所以千万不要把面试过程当作聊天,当作朋友之间的侃大山,不要把面试官提出的问题当作是普通问题,而应该对每一个问题都仔细思考,认真回答,切忌不经过大脑的随意接话和回答。(3)是否可以谈谈你的要求和打算

面试官在翻阅了求职者的简历后,说出这句话,很有可能是对求职者有兴趣,此时求职者应该尽量全方位地表现个人水平与才能,但也不能像王婆卖瓜那样引起对方的反感。(4)面试时只是“例行公事”式的问答

如果面试时只是“例行公事”式的问答,没有什么激情或者主观性的赞许,此时希望就很渺茫了。但如果面试官对你的专长问得很细,而且表现出一种极大的关注与热情,那么此时希望会很大,作为求职者,一定要抓住机会,将自己最好的一面展示在面试官面前。(5)你好,请坐

简单的一句话,从面试官口中说出来其含义就大不同了。一般而言,面试官说出此话,求职者回答“你好”或“您好”不重要,重要的是求职者是否“礼貌回应”和“坐不坐”。有的求职者的回应是“你好”或“您好”后直接落座,也有求职者回答“你好,谢谢”或“您好,谢谢”后落座,还有求职者一声不吭就坐下去,极个别求职者回答“谢谢”但不坐下来。前两种方法都可接受,后两者都不可接受。通过问候语,可以体现一个人的基本修养,直接影响在面试官心目中的第一印象。(6)面试官向求职者探过身去

在面试的过程中,面试官会有一些肢体语言,了解这些肢体语言对于了解面试官的心理情况以及面试的进展情况非常重要。例如当面试官向求职者探过身去时,一般表明面试官对求职者很感兴趣;当面试官打呵欠或者目光呆滞、游移不定,甚至打开手机看时间或打电话、接电话时,一般表明面试官此时有了厌烦的情绪;而当面试官收拾文件或从椅子上站起来,一般表明此时面试官打算结束面试。针对面试官的肢体语言,求职者也应该迎合他们:当面试官很感兴趣时,应该继续陈述自己的观点;当面试官厌烦时,此时最好停下来,询问面试官是否愿意再继续听下去;当面试官打算结束面试,领会其用意,并准备好收场白,尽快地结束面试。(7)你从哪里知道我们的招聘信息的

面试官提出这种问题,一方面是在评估招聘渠道的有效性,另一方面是想知道求职者是否有熟人介绍。一般而言,熟人介绍总体上会

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载