零起点Python足彩大数据与机器学习实盘分析(txt+pdf+epub+mobi电子书下载)


发布时间:2020-06-27 20:03:12

点击下载

作者:何海群

出版社:电子工业出版社

格式: AZW3, DOCX, EPUB, MOBI, PDF, TXT

零起点Python足彩大数据与机器学习实盘分析

零起点Python足彩大数据与机器学习实盘分析试读:

前言

从足彩到量化,再从量化到足彩。

生命总是在轮回中,不断完成自我突破与成长壮大。

本书是

“Python量化三部曲”

的补充部分。“Python量化三部曲”“Python量化三部曲”包括:●《 零起点Python大数据与量化交易》(入门课程);●《 零起点Python量化与机器学习实盘分析》(重点分析Sklearn);●《 零起点Python量化与TensorFlow深度学习实盘分析》(重点分析

TensorFlow)。

此外还有两部补充作品:●《 零起点Python足彩大数据与机器学习实盘分析》;●《 零起点Python机器学习快速入门》。

较好的Python机器学习入门教程

本书中的机器学习算法章节,是目前较系统的Python机器学习入门教程,其特点如下。● 独创的黑箱教学模式,全书无任何抽象理论和深奥的数学公式。● 首次系统化融合Sklearn人工智能软件和Pandas数据分析软件,

无需直接使用复杂的Numpy数学矩阵模块。● 三位一体的课件模式:图书+开发平台+成套的教学案例。系统

讲解,逐步深入。● 业内第一个系统化的Sklearn函数和API中文文档,可作为案头工

具书随时查阅。● 基于Sklearn+Pandas模式,无需任何理论基础,全程采用MBA

案例模式,懂Excel就可看懂。

这些内容采用独创的黑箱模式和MBA案例教学机制,结合一线实战案例,介绍Sklearn人工智能模块库和常用的机器学习算法。

进一步学习

本书的读者如果有兴趣可以进一步学习“Python量化三部曲”的内容,虽然“Python量化三部曲”的内容是以金融量化分析为主,但基本原理都是相通的,本质上都是数据分析,只是数据源不同,一个是金融数据,另一个是足彩赔率数据。

对于“Python量化三部曲”的读者而言,本书也有很大的价值,特别是对于入门的读者。

本书有多章关于网络爬虫的内容和具体案例,讲解了提取网络数据的方法,为希望自己编写自动交易程序的读者提供了一种基于Web的操作接口。

网络资源

本书的读者QQ群是:264880547(Top极宽足彩大数据)。

本书有关的程序和数据下载,请浏览网站:TopQuant.vip极宽量化社区。网站【下载中心】有最新的程序和数据下载地址。

本书在TopQuant.vip极宽量化社区设有专栏,对本书和足彩有任何建议的读者,请在社区相关专栏发布信息,笔者会在第一时间进行反馈和答复。

“零起点Python”系列丛书

本书继续保持了“零起点Python”系列丛书的一贯风格,简单实用,书中配有大量图表说明,没有一条数学公式,普通读者只要懂Word和Excel,就能够轻松阅读全书。● IT零起点,不需要任何电脑编程基础,会打字、会Excel就能看

懂本书,利用本书配套的Python软件包,轻松学会利用Python对

股票、足彩数据进行专业分析、量化投资分析。● 投资零起点,无须购买任何专业软件,本书配套的zwPython软

件包采用开源模式,提供100%全功能、全免费的工业级数据分

析平台。● 配置零起点,所有软件、数据全部采用苹果“开箱即用”模式,

绿色版本,无须安装,解压即可,直接运行系统。● 理财零起点,不需要任何专业金融背景,使用通俗易懂的语言,

配合大量专业图表和实盘操作案例,轻松掌握各种量化投资策

略。● 数学零起点,全书没有任何复杂的数学公式,只有最基本的加、

减、乘、除,易于理解。

关于足彩的几个误区

近年来,大数据产业、人工智能行业风生水起,可国内足彩大数据的专业研究还处于冷门和偏门,这其中有很多关于足彩领域的误区。

很多主流学者,到现在都看不起足彩,认为是赌博,这个我们不讨论。最近国家级别的彩票大数据研究中心已经正式成立了,资本的力量是无穷的。

为此,笔者做了一个简单的小结,以正视听。● 足彩虽然容易与赌球混淆,但却是最好的大数据研究对象,没有

之一。● 微软、百度和谷歌等公司目前都有专业团队在做足彩大数据研究,

并定期发布结果。● 足彩相当于十倍配资的股票。● 国内足彩赔率的确很低,差不多是全球最低的,比欧洲平均低

10%左右。● 彩票和股票的发明人据说都是同一个英国爵士。● 必胜足彩交易所成立当年获得了英国MBA商业创新大奖。● 高盛公司多年前就开始进行足彩套利业务,维基百科中有介绍。● 极宽黑天鹅(红牛吧)足彩是业内首家公开进行实盘测试的足彩

大数据模型。● 黑天鹅算法在业内率先以“盈利率”而不是“胜率”测试足彩算

法模型。

致谢

虽然很多网友在笔者博客中留言,建议笔者早日完成这本书的写作,但本书的创作和正式出版还是经历了许多波折。

如今本书终于出版,在此,要特别感谢电子工业出版社的黄爱萍和戴新编辑,感谢她们在选题策划和稿件整理方面所做的大量工作。

同时,在本书创作过程中,极宽开源量化团队和培训班的全体成员提出很多宝贵的意见,并对部分课件程序做了中文注解。

特别是吴娜、余勤、王硕三位同学,为极宽开源量化文库和zwQuant开源量化软件编写文档,并在团队成员管理方面做了大量工作,对他们的付出表示感谢。

何海群(字王)

北京极宽科技有限公司CTO

2017年3月25日第1章足彩与数据分析1.1 “阿尔法狗”与足彩

百度百科中“阿尔法狗”词条的解释如下:“阿尔法狗”一般指阿尔法围棋。阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由谷歌(Google)旗下DeepMind公司的戴密斯·哈萨比斯、大卫·席尔瓦、黄士杰与他们的团队开发,其主要工作原理是“深度学习”。

2016年3月,该程序与围棋世界冠军、职业九段选手李世石进行人机大战,并以4:1的总比分获胜。2016年年末和2017年年初,该程序在中国棋类网站上以“大师”(Master)为注册账号与中、日、韩数十位围棋高手进行快棋对决,连续60局无一败绩。不少职业围棋手认为,阿尔法围棋的棋力已经达到甚至超过围棋职业九段水平,在世界职业围棋排名中,其等级分曾经超过人类排名第一的棋手柯洁。

2017年1月,谷歌DeepMind公司CEO哈萨比斯在德国慕尼黑DLD(数字、生活、设计)创新大会上宣布推出真正2.0版本的阿尔法围棋(AlphaGo)。其特点是摈弃了人类棋谱,只靠深度学习的方式成长起来挑战围棋的极限。

现代社会已经进入后互联网时代,信息资源随手可得,大数据产业风生水起,科技创新层出不穷,不过类似工业革命、卫星登月、原子弹爆炸、Internet信息高速公路等级别的重大科技突破却一直没有出现,甚至有学者认为,目前的社会处于科技停滞阶段。

直到2016年3月,谷歌公司的“阿尔法狗”横空出世,与围棋世界冠军、职业九段选手李世石进行人机大战,并以4:1的总比分获胜。

这个结果震惊了整个社会,特别是学术界,人工智能领域的从业人员,即使最乐观的学者,在IBM公司的“深蓝”战胜国际象棋冠军以后,过去一直都认为:围棋是人类智慧的最后堡垒,19×19的围棋棋盘矩阵,可以衍生出天文数字的组合变化,至少在五十年内,受计算机技术的限制,人工智能无法达到人类职业选手的标准。

没想到,“阿尔法狗”只用几年时间不仅战胜了围棋职业选手,而且战胜了人类的围棋冠军。

以下资料摘自网络:(1)AlphaGo程序首席设计师黄士杰。

黄士杰从小热爱围棋,在中国台湾师大读书时创办了学校的围棋社,曾获台湾大专杯围棋赛冠军,拥有业余六段棋力,是“当时大专生最强”;2010年,他在读博士的最后一年,开发了围棋软件“Erica”(艾丽卡),参加国际电脑奥林匹亚竞赛(International Computer Games Association,简称ICGA),击败了当时围棋AI公认最强程式“Zen”(禅),引起轰动。黄士杰是DeepMind公司团队中的重要成员,是两位首席工程师之一。

Aja Huang(黄士杰)的弈城账号为DeepMind,据网友调查,AlphaGo曾经用该账号做过测试。(2)AlphaGo之父:一个有着一半华人血统的英国天才哈萨比斯。

1976年7月,哈萨比斯出生于英国伦敦,母亲是新加坡华人,父亲来自希腊的塞浦路斯。17岁时,在一个游戏设计比赛中,哈萨比斯获得第二名,进入著名的牛蛙游戏软件公司实习,参与设计和开发游戏《主题公园》(Theme Park)。

1998年,哈萨比斯成立了自己的游戏软件公司(Elixir Studios)。这家拥有60人的游戏公司,发布了包括《革命》和《魔鬼天才》等很多游戏软件。

1999年,年仅23岁的哈萨比斯第一次参加了“智力奥林匹克运动会”,这是一个专门为天才较量智力的国际比赛。哈萨比斯连续参加了4年,赢了5次。

2009年,因其在游戏设计上的成就,哈萨比斯被选为英国皇家艺术协会的成员。

2011年,哈萨比斯成立DeepMind Technologies公司,其目标是“解决智能问题”。(3)低调的DeepMind公司。

DeepMind公司一直保持低调,直到2013年12月,DeepMind公司首次参加业界领先的机器学习研究大会时,DeepMind的研究人员演示他们的软件,一开始就令人惊艳。此前从未有人演示过具备这种能力的软件,即可以从零开始学习和掌握如此复杂的任务。一个月后,谷歌公司重金收购了DeepMind。再后来,就是我们今天看到的哈萨比斯所创造的历史:他领导开发的人工智能AlphaGo打败了世界顶尖的围棋选手。“阿尔法狗”程序虽然神秘,但其核心算法却很简单,源自古老的Monte Carlo (蒙特卡罗)算法。

2006年,欧洲数学家Rémi Coulomb、Kocsis和Szepervari等学者,在研究围棋程序时,结合蒙特卡罗算法与对手树搜索算法,设计出一种全新的算法:MCTS(蒙特卡罗树搜索算法)。

MCTS全称Monte Carlo Tree Search,即蒙特卡罗树搜索算法,是一种在人工智能问题中做出最优决策的方法,它结合了随机模拟的一般性和树搜索的准确性。

而古老的蒙特卡罗算法,正是源自世界上最古老的国际大赌场蒙特卡罗。事实上,现代统计学、博弈学甚至金融领域的量化投资,都不同程度源自赌场和蒙特卡罗算法。1.2 案例1-1:可怕的英国足球

据说,目前欧洲的顶级数学家90%都是被欧洲博彩公司雇佣的,而足彩,更是博彩行业当中最重要的组成部分之一,而英国的博彩公司更是雄霸天下。

口说无凭,有图为证,案例1-1通过分析2010—2016年近7万场足球比赛的数据,用数字和图表来说明这一点。

案例1-1的文件名是zc101_gid01des.py,核心代码如下: def gid_anz_top10(df,ksgn): xn9=len(df['gid']) d10=df[ksgn].value_counts()[:10];print(d10) # #---set chinese font mpl.rcParams['font.sans-serif'] = ['SimHei'] #指定默认字体 mpl.rcParams['axes.unicode_minus'] = False #解决保存图像是负号'-'显示为方块的问题 # d10.plot(kind = 'bar',rot=0,color=zsys.cors_brg) plt.show() # dsum=d10.sum() d10['other']=xn9-dsum k10=np.round(d10/xn9*100,decimals=2) k10.plot(kind = 'pie',rot=0,table=True) plt.show() #----------------------- rs0='/tfbdat/' fgid=rs0+'gid2017.dat' df=pd.read_csv(fgid,index_col=False,dtype=str,encoding='gb18030') print(df.tail()) print('\n',df.describe()) # gid_anz_top10(df,'gset')

案例1-1的程序读者看不懂没关系,这里只是简单介绍,后面的章节会有具体讲解。

案例1-1中的gid2017数据包和本书其他的数据包都是基于实盘数据的,在不断实时更新中,具体的案例运行结果在细节上和具体数字上可能会有所不同,这属于正常现象,请读者不要介意。

现在我们先看看案例1-1的部分运行结果。

案例1-1调用自定义的gid_anz_top10分析函数,分析gid比赛数据各个数据列排名前十位的数据,也就是常说的Top10数据分析。

案例1-1运行结果比较长,我们将分段介绍,第一部分是显示gid数据文件的尾部数据和调用Pandas的describe快速统计汇总函数,对gid数据文件做简单的统计: gid gset mplay mtid gplay gtid qj qs qr kend kwin kwinrq tweek tplay tsell 68517 632918 智甲 巴勒人 2032 康塞普西 2823 -1 -1 0 0 -1 -1 0 2017-02-05 2017-02-06 00:55:00 68518 632919 智甲 天主大 1718 基约塔 6127 -1 -1 0 0 -1 -1 0 2017-02-05 2017-02-06 00:55:00 68519 633032 阿超杯 河床 864 拉努斯 963 -1 -1 0 0 -1 -1 6 2017-02-04 2017-02-05 00:55:00 68520 634245 非洲杯 布基纳 73 加纳 60 -1 -1 0 0 -1 -1 6 2017-02-04 2017-02-05 00:55:00 68521 634246 非洲杯 埃及 41 喀麦隆 5 -1 -1 0 0 -1 -1 0 2017-02-05 2017-02-06 00:55:00 gid gset mplay mtid gplay gtid qj qs qr kend kwin kwinrq tweek tplay tsell count 68522 68521 68521 68517 68521 68517 68522 68522 68522 68522 68522 68522 68522 68522 68522 unique 68522 154 2007 1724 1958 1681 14 11 1 2 4 1 7 2530 14785 top 438989 英甲 布里斯 653 布里斯 653 1 1 0 1 3 -1 6 2016-05-08 2013-02-08 23:30:00 freq 1 3807 277 218 280 220 22219 23830 68522 68365 30810 68522 22940 103 131

新版本的describe函数对统计分析结果做了简化,默认没有分位数,只有简单的四行:count数据总数、unique无重复总数、top最多数据和freq最多的数据频率。

由案例1-1的输出信息,我们简单分析gid比赛数据,可以得出以下结论。● 2010年1月—2017年1月,共有近7万场比赛。● 在gset联赛数据中,共有154种不同的联赛,排名第一的是英甲,

共有3807场比赛。● 在球队中,按名称来看,主队mplay有2007支,客队有1958支;

按球队id来看,主队mtid有1724支,客队gtid有1681支。这是由

于翻译和历史原因,部分国外球队有几个不同的名称,但球队的

id是唯一的。有趣的是,不管是主队还是客队,比赛次数最多的

都是英甲的布利斯球队。● qj进球数据有14种不同情况,其中最多的是进1球,有22219场。● qs失球数据有11种不同情况,其中最多的是失1球,有23830

场。● tweek数据列显示星期六的比赛最多,有22940场。● 按tplay比赛日期来看,2016-05-08的比赛场次最多,当天有103

场比赛。● 按tsell博彩销售截止日期来看,2013-02-08销售的比赛场次最多,

当天有131场比赛。

案例1-1输出信息的第二部分是Top10的联赛信息数据: 英甲 3807 英冠 3779 日职乙 3033 阿甲 2744 巴甲 2642 英超 2598 西甲 2597 法甲 2595 意甲 2548 法乙 2378

英国不愧是足球强国,比赛场次最多的第一名英甲、第二名英冠都是英国的足球比赛,令人意外的是排名第三的是日本的足球联赛日职乙,比阿根廷、巴西的足球比赛场次还多。

由日本的数据可以看出,人口基数和经济实力对于足球联赛的支持还是很大的,中国的经济实力和综合国力目前已经远远超过日本,人口基数更是日本的数倍,从职业联赛的基数方面看,超越日本应该是不难的,有了数量方面的突破,才会有质的蜕变。

案例1-1输出信息的第三部分是联赛数据Top10的柱形图,如图1-1所示。图1-1 联赛数据Top10的柱形图

案例1-1输出信息的第四部分是联赛数据Top10的比例图,如图1-2所示。图1-2 联赛数据Top10的比例图

为了进一步说明,第四部分的图形做了以下部分优化。● 采用计算过的百分数据,表示相关的联赛比例。● 英甲和英冠的比赛场次合计超过了比赛总场次的11%。● 排名前10的联赛占据了42%的比赛场次,其他联赛的比赛场次

合计约58%。

这些数据只是对gid比赛基本数据最简单的分析,还谈不上大数据,不过已经可以获得许多有意思的结论。

由以上数据和图表分析可以看出,英国在足彩行业占据10%以上的份额,不愧是老牌足球强国。1.3 关于足彩的几个误区

近年来,大数据产业、人工智能行业风生水起,可我国足彩大数据的专业研究还是冷门和偏门,这其中有很多关于足彩领域的误区。

很多主流学者,到现在都看不起足彩,认为是赌博,这个我们不讨论,最近国家级别的彩票大数据研究中心已经正式成立了,资本的力量是无穷的。

为此,笔者做了一个简单的小结。● 足彩虽然容易与赌球混淆,但却是最好的大数据研究对象,没有

之一。● 微软、百度、谷歌等公司目前都有专业团队在做足彩大数据研究,

并定期发布。● 通俗地说,足彩相当于十倍配资的股票。● 我国足彩赔率的确很低,差不多是全球最低的,比欧洲平均低

10%左右。● 彩票和股票的发明人据说都是同一个英国爵士。● 必胜足彩交易所成立当年获得了英国MBA商业创新大奖。● 高盛公司多年前就开始进行足彩套利业务,维基百科中有介绍。● 极宽黑天鹅(红牛吧)足彩是业内首家公开进行实盘测试的足彩

大数据模型。● 黑天鹅算法在业内率先以“盈利率”而不是“胜率”测试足彩算

法模型。1.4 足彩·大事件

下面笔者介绍一下自己的足彩研究历程,本节内容摘自笔者博客,以大事件的方式节选如下。● 笔者虽然马马虎虎,却做过不少很好的项目,像现在的黑天鹅足

彩算法,可以说在行业内算得上Top10了。● 黑天鹅项目最早源于笔者的验证码项目,当时叫z-SPO:z粒子

算法,2012年的博客中有提过。● 在做验证码识别项目时,笔者想将新浪、SOHU、网易、天涯这

些网站分类,识别角度可能更高,于是就写了一个自动分类算法。● 算法其实很简单,就是“二选一”模式:首先,是新浪的验证码,

类型标记为“新浪”,不是的标记为“其他”;然后,对“其他”

进行二次分类,是SOHU的,标记为“搜狐”,不是的标记为“其他”。这样,几个循环下来,自动分类就完成了。● 令人吃惊的是,这个程序很简单,准确度却相当高,差不多达到

90%,可以完成几百种不同风格验证码的自动分类。● 因为是“二选一”模式,很容易就联想到股市的涨与跌。这方面,

读者可以看笔者的博客《文科生、易经与大数据》,这里就不展

开说明了。● 下载了历年的股票数据,当时是2010年,从2004—2010年的数

据都有,这些数据现在还在网盘里面,不过格式忘记了,要看看

源程序。● 对股市研究了一年,各种公式、指标、算法差不多都测试过,没

有一个靠谱的。● 笔者做项目,喜欢看一些相关的外围书,特别是相关的历史书,

在研究股市数据的时候,笔者发现股市和足彩的发明人都是同一

个英国贵族。● 通过维基百科,笔者知道了必发交易所获得过商业创新大奖,知

道了高盛足彩套利的故事。● 在2012年,朋友叫笔者去深圳做项目,在高丽,深圳大学城附

近,笔者喜欢一个人在街上溜达,笔者发现离高丽地铁站十分钟

的路程内,至少有三十家彩票投注站,比药店、银行还要多,仅

次于手机店,要知道,深圳的门面租金差不多每月一万元。● 于是,在网上查询,发现国内正规的彩票网站差不多有上百家,

而且大部分都有上市公司背景。● 查看彩票网站的现金流,基本上都是十亿元、百亿元级别,很少

有千万元级别的(2015年,深圳查封一家足彩网站,一年的流

水就是上千亿元)。● 笔者做过很多互联网公司的方案,知道很多互联网公司看起来风

光,可实际上就几千万元、几百万元的现金在周转。● 再想到高盛、必发的故事,于是开始研究足彩。● 起步很痛苦,因为笔者从不看足球,现在也是,更不用说“3、

1、0、胜、平、负”了,还有什么大球、小球、上盘、下盘。● 刚开始只是看,不掏钱,很多细节总是搞混,好在买足彩才2元。

笔者买足彩是看赔率、看数字,看那个数字顺眼,就投哪个。● 交了不少学费后,开始知道有合买了,而且运气不错,跟单开始

时有连续几个4~5倍的胜盘,不过一个月左右就全亏了,于是

换人合买,换了很多人,还是不靠谱。● 这期间交了不少学费,基本上每个环节都交过,因为是真金白银,

虽然不多,但都有印象。所以,一定要做实盘练习,一定要注意

细节。● 没有实盘,量化训练就没有任何意义,有了实盘,细节上吃几次

亏,就会注意了,这总比正式投资出问题好。● 当然,这时候,对于足彩的数据分析也没停。足彩也有好多所谓

的必胜公式,试了很多个,不靠谱,再用经典的教科书算法、机

器学习、数据挖掘,还是不靠谱。● 最终,转来转去,还是笔者自己的算法最靠谱。笔者认为,不是

笔者的算法靠谱,可能是,一方面靠谱的算法一般机构不会公开,

另一方面公开的算法大部分是限制模型,是有很多前提的,部分

没有前提的,准确度又不行。● 2014—2015年,大数据风起云涌,笔者跟风,把zwPython给开

源了。● 2015年,发布我国首个足彩开源数据包zc-dat,收录近5万场比

赛数据。● 2016年,发布我国首个开源量化软件zwQuant和zwDat金融数据

包。● 2016年,组建TopQuant.vip北京极宽科技公司。● 2016年12月,笔者在电子工业出版社正式出版《零起点Python

大数据与量化交易》。● 2017年,笔者创作本书。● 2017年,发布Top Quant for Football(简称TFB,极宽足彩量化

分析软件),是我国首个开源的足彩量化回溯分析系统,内置

TOP-AI极宽人工智能、机器学习模块库。● 2017年,发布我国首个足彩开源大数据项目tfbDat2017版,收录

近7万场比赛数据、二百多万条赔率数据。1.5 大数据图灵(足彩)原则

足球比赛的结果,从数学角度而言,是最简单的三选一,即胜、负、平。而真正的大数据分析,是在成千上万种可能中,选择最接近的进行匹配。连最简单的三选一都搞不定,来谈难度、复杂度高数百倍、上千倍的n选一(n>1000),是不是有些不靠谱?

2014年世界杯对于大数据、人工智能来说是个分水岭,这一年是人工智能的元年。微软、谷歌、百度等公司都有世界杯相关的项目。

有网友认为:这个标准,是高到永远不可能实现的标准!

原因很简单,真做到了,你不只是发财了,而且是彻底推翻了从帕斯卡开始的无数超级头脑和严密逻辑得出的概率论这一门数学理论!推翻一门理论在科学上屡见不鲜,但在数学上还未发生过。

这个标准并非高不可攀。

图灵测试,并非要求人工智能达到爱因斯坦的IQ才算合格,目前,人工大脑有小学生的水平就已经是最顶尖的了。

目前,人工智能最多相当3~5岁的儿童,基于人工智能的商业智能,和建立在二者之上的大数据,也只有3~5岁的智能,所以说大数据只是概念产品阶段。

足彩是最简单的三选一模式,随机盲选的概率都超过30%,如果一个大数据分析模型连随机概率都无法超过,那么只能说这个模型不靠谱。1.6 主要在线彩票资源

目前,我国正式的彩票网站有近百家,其中大部分是上市企业或者上市企业的关联公司创办的,这些网站都可以提供足彩及其他各种彩票的信息数据。

这些在线资源,大体可以分为以下这些类型。● 热门彩票网站。● 热门足彩彩票网站。● 热门彩票论坛社区。● AI智能足彩预测网站。● 传统足彩预测机构。● 热门彩票博客。● 热门足彩推荐专家。● 热门足彩合买名人。

因为彩票产业在我国属于特种监管行业,经常进行整顿,特别是网络彩票,因此本节介绍的网络资源与实际情况可能会有所差异。

下面具体介绍部分相关的网络资源。

1.热门彩票网站● http://www.zhcw.com,中彩网。● http://www.lottery.gov.cn,体彩网。● http://lottery.sina.com.cn,新浪彩票。● http://caipiao.sohu.com,搜狐彩票。● http://sports.qq.com/lottery,QQ彩票。● http://www.china-lottery.net,中华彩票。● http://www.55125.cn,中国彩吧。● http://www.17500.cn,乐彩网。● http://www.16788.cn,天吉网。● http://www.cz89.com,牛彩网。● http://www.800820.net,天齐网。● http://www.55128.cn,彩吧助手。● http://www.fcp.cn,777福彩。● http://www.55126.cn,彩搜网。● http://www.8200.cn,彩宝网。● http://www.ssqzj.com,3D之家。● http://www.scw98.com,南方双彩。● http://www.cjcp.com.cn,彩经网。● http://www.china-lottery.net,公益时报。● http://www.starlott.com,星彩网。● http://www.97654.com,好运彩。● http://www.fa818.com,东彩网。● http://www.170win.cn,170彩票网。● http://www.fenbaihe.com,粉百合。● http://www.cncaiba.cn,新彩吧。● http://www.55127.cn,7彩网。● http://www.bcyz777.com/bbs/forum.php,博彩E族。● http://www.cocololo.com,彩之网。● http://www.newcp.cn,新彩网。● http://www.pinble.com,拼搏在线。● http://www.cpyjy.com,彩票研究院。● http://www.taocai.cn,淘彩网。● http://www.haocw.com,好彩网。● http://www.17mcp.com,众彩网。● http://www.51985.net,彩民之家。● http://www.027cp.com,搏彩王。● http://www.zibocn.com,智博网。● http://www.dddcun.com,3D村。● http://www.gtjd.net,3D基础。● http://www.cpew.cn,彩易网。● http://www.cp2y.com,彩票2元网。● http://www.3216.cc,彩博士。● http://www.hcw888.com,好彩888。● http://www.50cp.com,50彩票网。● http://www.sdps365.cn,365彩票网。● http://www.c393.com,393彩票网。● http://www.smswriter.com,华彩网。● http://www.gq01.com,大星彩票。● http://www.cp121.com,彩票121。● http://www.cpew.cn,彩易。● http://www.500.com,500WAN彩票。● http://www.okooo.com,奥客彩票。● http://www.aicai.com,爱彩网。● http://www.lecai.com,乐彩。● http://caipiao.taobao.com,淘宝彩票。● http://caipiao.163.com,网易彩票。● http://www.cpdyj.com,大赢家。● http://www.cailele.com,彩乐乐。● http://www.iletou.com,爱乐透。● http://www.kuaicaile.com,快彩乐。● http://888.sports.qq.com,QQ彩票。● http://www.310win.com,彩客网。● http://www.ffcp.cn,非凡彩票。

2.热门足彩彩票网站● http://www.sporttery.cn,中国竞彩网。● http://www.zucai310.com,足彩310。● http://www.zgzcw.com,足彩网。● http://www.500wan.com,500WAN。● http://www.aibo123.com,爱波网。● http://www.jc258.cn,竞彩258。● http://www.310win.com,彩客网。● http://sports.sina.com.cn/l/sporttery,新浪竞彩。● http://www.cpdyj.com,大赢家。● http://www.bet007.com,探球网。● http://www.titan24.com,体坛网。

3.热门彩票论坛社区● http://bbs.55125.cn,彩吧论坛。● http://bbs.52cp.com,双彩论坛。● http://bbs.zhcw.com,中彩论坛。● http://bbs.16788.cn,天吉论坛。● http://bbs.17500.cn,乐彩论坛。● http://bbs.bwlc.net,北京福彩论坛。● http://bbs.cnhubei.com/forum-197-1.html,东湖福彩论坛。● http://bbs.hnticai.com,湖南体彩论坛。● http://bbs.17mcp.com,众彩论坛。● http://bbs.pinble.com,拼搏在线。● http://bbs.haocw.ocm,好彩论坛。● http://bbs.310win.com,彩客论坛。● http://bbs.cpdyj.com,大赢家论坛。● http://bbs.500wan.com,500WAN论坛。● http://bbs.okooo.com/forum.php,澳客论坛。● http://bbs.fa818.com,东北彩票论坛。● http://bbs.aibo123.com,爱波论坛。● http://bbs.zgzcw.com,猜猜论坛。● http://bbs.aicai.com,爱彩论坛。● http://bbs.cai898.com,小财神论坛。● http://88.hinews.cn/bbs/forum-2-1.html,南国论坛。● http://www.33633.cn,天中网。

4.AI智能足彩预测网站

对于AI智能足彩预测网站,除了传统的足彩网站,近年来出现了不少做大数据、人工智能项目的企业,甚至许多做手机App软件的公司,也开始进入这个领域。● 百度足球赛事预测——单场预测,http://trends.baidu.com/

football。● 足彩预测—足彩分析—足球魔方官网—欢呼吧财富社区,http://

www.huanhuba. com/。● 310DATA,http://310data.wozhongla.com/index.html。● 彩球网—体育大数据应用,http://www.caiqr.com/。● 数据购买—球探网,http://guess1.win007.com/sale/。

5.传统足彩预测机构

传统足彩预测网站除了传统的彩票网站外,还有不少体育媒体,甚至资深的体育记者、博客参与。● 竞彩足球专家推荐_数字彩票专家预测_彩票专家预测-中国足彩

网, http://cp.zgzcw.com/zjtj/index.jsp。● 足球专家&高手推荐_竞彩专家预测-中国足彩网,http://

cp.zgzcw.com/zjtj/jc/ expertList.jsp。● 足彩八方预测—中国足彩网(注意每场ID不同),http://

fenxi.zgzcw.com/2058369/bfyc。● 足彩八方预测—中国足彩网八方预测,http://fenxi.zgzcw.com/。● 搜狐足彩预测,足彩专家推荐—搜狐,http://caipiao.sohu.com/

s2013/sohuyuce/。● 足彩分析预测—搜狐,http://caipiao.sohu.com/sports/yuce/。● 足彩预测、足彩专家预测—彩客网http://www.310win.com/tag/

zucaiyuce/。● 足彩专家预测_足球彩票预测_足彩推荐_足彩分析_大彩网,

http://www.dacai. com/news/zc/zjyc/。● 足彩媒体预测_足球彩票预测_足彩推荐_足彩分析_大彩网,

http://www.dacai. com/news/zc/mtyc/。1.7 主要在线足彩数据源

这几年大数据、云计算风生水起,开放的数据源API接口越来越多,也有不少机构提供了足彩等体育数据接口。此类数据源API从收费模式来看,分为收费API与免费API两种。

从行业背景来看,分为大数据综合API和专业体育数据API。专业体育数据API价格非常昂贵,广大个人用户难以承受,在此,只简单介绍一些综合性的大数据API网站,如图1-3所示。图1-3 大数据API网站示例

常用的数据网站如下。● 开发者数据,http://www.haoservice.com/。● 聚合数据,https://www.juhe.cn/。● 阿凡达数据,http://www.avatardata.cn/。● 免费接口API汇集,http://www.apifree.net/。● 91查,http://www.91cha.com/。● 云聚数据,http://www.36wu.com/。● JSON API免费接口,http://www.bejson.com/knownjson/

webInterface/。● 数据堂,http://www.datatang.com/。● 数据堂−数+,API http://www.apiinside.com/。● Baidu—API集市,http://apistore.baidu.com/。

在这些综合性的大数据网站中,有关的体育数据、足彩数据、足球联赛数据经常调整,请读者在使用前专门下载相关的API文档和案例程序。1.8 足彩基础知识

500彩票网站等大型的彩票网站中都有相关的足彩和赔率基础知识介绍,为节省篇幅,本书对于这些基础知识不再重复介绍。

笔者推荐读者通过500彩票网站的500研究院,如图1-4所示,系统学习足彩的基本知识。图1-4 500研究院网页截图

500研究院网址:http://zx.500.com/zhuanti/school/。1.9 学习路线图

本书是“零起点Python”系列图书,要更好地学习本书,掌握相关的配套程序,最好具备以下基础。● Python编程基础,不懂Python语言的读者,先用一周时间学习

Python基本知识。● 掌握足彩赔率等博彩基础知识,参见上一节的内容。● 花几天时间学习Pandas(潘达思)数据分析软件基础操作。

足彩大数据分析与金融量化分析类似,都属于大数据的范畴,有关的学习路线图、参考资料、图书也大体相似。

其中差异较大的是行业背景知识,量化强调的是金融知识,足彩知识相对简单很多,大型的彩票网站都有相关的基础知识介绍。

Top极宽量化社区有“Python量化与zwQuant学习路线图”,读者可以参考,网址是http://topquant.vip/forum.php?mod=viewthread&tid=6&extra=page%3D1。第2章开发环境2.1 数据分析首选Python2.1.1 大数据,why Python

足彩与金融量化类似,都属于数据分析领域,而数据分析,笔者首选的编程工具就是Python语言。

在与网友的互动中,经常有网友认为自己投资失败或者量化策略失效,是因为Python开发环境不好,希望能重新设计一个,甚至希望用C、Java来重新开发量化软件。

这种观点是绝对错误的,对于这类问题,笔者曾经这样答复:“这里面有个误区,量化的核心是策略,至于量化软件的运行速度、用户GUI界面等是程序员的事情;大家是做金融的、是操盘的,会写策略就好了。就像会计,你觉得Excel、用友软件或金蝶软件的某些功能不好用,另外再选一套财务软件就是了,完全没必要自己也去写一套财务软件。”

在软件工程领域,有一句名言“Don't Reinvent the Wheel”(不要重复发明轮子),这句话说得非常经典,也非常有道理。

至于为什么选择Python语言作为数据分析和量化分析的首选开发平台,读者可以参考极宽Top量化社区的介绍:“zwPython史前故事”(http://ziwang.com/forum. php?mod=viewthread&tid=61)。

在“zwPython史前故事”中,这样写到:

伴随《零起点Python大数据与量化交易》一书的出版,以及zwQaunt量化开源软件、zw-dat开源金融大数据项目的成功与普及,其背后的功臣zwPython集成式Python开发平台,也逐渐被广大用户认可与接受。

今天,恰好是2016年圣诞节,回顾几年前的艰难抉择,非常庆幸选择了Python语言,选择了成功。

2012—2013年是R语言最辉煌的时候,也是Python2版本向Python3版本过渡的艰难时刻,真可谓是青黄不接。

那时,新一代数据分析神器Pandas(潘达思),以及Python现代风格的数据可视化模块绘图plotly、seaborn都还在萌芽之中。

在当年的博文“2013年字库产业感悟及资料书单”(http://blog.sina.com.cn/s/blog_7100d4220101dtvz.html)中,笔者曾经写道:

字王新一代智能字模sdk(zwPython前身),准备采用1k~2k像素点阵的字模,数据处理量是256点阵的10~100倍,目前正在做前期规划,大体有以下三个框架。● MATLAB,无疑是首选,支持CUDA加速,处理速度可以提升10

~200倍,可以达到超算中心小型机的速度,可惜软件太大,

2013新版本有2张DVD,安装耗时,且正版价格太贵。● R语言,是如今大数据的热选,是统计行业、精算师的

Photoshop,今年最小的V3版本才50MB,而且是免费开源软

件,图像支持也不错,正在考察中。● Python无所不在,也是开源软件,而且有PythonXY,是专业的

Python图像、数据处理计算整合包。开源的字库设计软件

FontForge,其主体模块也是采用Python编写的。问题是,

Python目前正处于2.0到3.0版本的大变迁时代,Python 3.0语法

虽然变动不多,但部分语句不兼容2.0版本,这也是个大问题。

PythonXY目前貌似采用的还是2.x版本,因为PythonXY集成的第

三方数学模块太多了,全部升级到3.0版,估计至少要3~5年。

统计学与量化分析的关系本质上就是统计学与数据分析的关系,笔者当时在博文中这样写道:

字库设计与统计学从表面上看毫无关系。

其实不然,数字化后的字模是100%的纯数据处理,而数据处理,正是统计学的领域,也是R语言的“拿手好戏”。

以前字王的字模sdk,关于字型轮廓的间距模块,只涉及到最短路径和绝对距离两种类型算法。

这次看过R语言才发现,统计行业的间距模块种类甚多,而且都有现成的模块,如基本距离、绝对距离、曼哈顿距离、欧氏距离、明氏距离、马氏距离和二值定性距离。

在《零起点Python大数据与量化交易》一书的前言中,笔者也写到:

2014年,高盛、大摩的雅典娜和黑石计划都不约而同地选择了Python作为金融行业的标准编程语言。

资本的力量是强大的,也是冷酷无情的。

2016年5月,《华尔街日报》报道,目前华尔街的三大编程语言是:C、Java与Python。其中,C与Java成为三大语言之一有两方面原因:一方面是由于历史积累,另一方面是系统架构设计的需要。而在应用领域Python更胜一筹,因为Python已经成为金融行业量化领域的标准编程语言。

回顾几年前的艰难抉择,笔者再一次庆幸当时选择了Python,选择了成功。

正是因为经历了这样一个艰难曲折的过程,所以笔者对于软件工程的这句名言“Don't Reinvent the Wheel”(不要重复发明轮子)更加深有体会。

足彩和量化分析一样,本质上都是数据分析,如果读者有兴趣,还可以浏览笔者的博客《大数据, why Python》,网址是http://ziwang.com/forum.php?mod= viewthread&tid=58&extra=page%3D1。2.1.2 入门简单,功能强大

Python是最适合初学者学习的编程语言之一,也是目前IT行业唯一的入门简单、功能强大的工业级开发平台。

事实上,目前Python已经超越普通编程语言,几乎成为IT行业的万能开发平台。

1.入门简单

任何熟悉JavaScript脚本、VB、C语言、Delphi的用户,通常一天即可学会Python。

即使是不会编程的设计师、打字员,一周内也能熟练掌握Python,其学习难度绝对不会高于Photoshop、五笔,至少笔者现在还不会使用五笔字型。

2.功能强大

海量级的Python模块库提供了IT行业最前沿的开发功能。● 大数据方面,Pandas已经逐步碾压R语言。● CUDA编程方面,Python与C(C++)、Fortran是NV官方认可的

三种编程语言,也是目前唯一适合PC平台的CUDA编程工具。● 机器学习方面,TensorFlow、PyTorch、Scikit-learn、Theano是

国际上最热门的机器学习平台。● 自然语言方面,NLTK是全球首选的自然语言处理平台;spaCy

是工业级NLP平台。● 人脸识别方面,OpenCV有光流算法、图像匹配和人脸算法,使

用Python简单而且优雅。● 游戏开发方面,Pygame提供图像、音频、视频、手柄、AI等全

套游戏开发模块库。● 字体设计方面,FontForge是唯一商业级的字体设计开源软件,

内置脚本和底层核心的Fonttools,都是使用Python开发的。● 电脑设计方面,Blend、GIMP、Inkscape、Maya、3ds Max都内

置或扩展了Python语言支持。

上述Pandas、CUDA、TensorFlow、PyTorch、Scikit-learn、Theano均为Python模块库或IT行业术语。

目前热门的iOS、安卓、WP等手机App应用开发,也可以用Python开发,但基本都是商业收费模块,因此未集成到zwPython软件包,读者可以自行查询。

吉多·范罗苏姆(Guido van Rossum)是一名荷兰计算机程序员,他作为Python程序设计语言的作者而为人们所熟知。

他为Python设计的目标是:● 一门简单、直观的语言并与主要竞争者一样强大;● 开源,以便任何人都可以为它做贡献;● 代码像纯英语那样容易理解;● 适用于短期开发的日常任务。

既然Python如此美好,并且是100%免费的开源软件,学习Python的人也越来越多,那么为什么Python始终还只是一种小众语言呢(相对VB、C、C#、JavaScript)?

笔者认为,Python的“大众化”之路,存在以下两个瓶颈。● 配置,软件行业有句俗话,“搞懂了软件配置,就学会了一

半”。对于Python、Linux及许多开源项目而言,80%的问题都出

现在配置方面,尤其是模块库的配置。● OOP(面向对象程序设计),大部分人都认为Python是一种“面

向对象”的编程语言,而OOP的编程风格,业界公认比较繁

杂。

如果能够解决好以上两个问题,那么Python的学习难度可以降低90%,而应用领域和开发效能可以瞬间提升10倍,而且这种提升是零成本的。2.1.3 难度降低90%,性能提高10倍

为此,笔者在winPython软件包的基础上,推出了“zwPython”——字王集成式Python开发平台。● 业界首次提出“零配置、零对象”研发理念,绿色软件封装模式,

类似Mac开箱即用风格,无需安装,解压即可直接使用,还可以

可以放入U盘,支持Mob-App移动式开发编程。●“ 外挂”式“核弹”级开发功能,内置很多功能强大、IT前沿的

开发模块库,例如OpenCV视觉/人脸识别、CUDA高性能GPU并

行计算(OpenCL)、Pandas大数据分析、TensorFlow、PyTorch

机器学习、NLTK自然语言处理。● 便于扩展,用户可以轻松增删相关模块库,全程智能配置,无需

用户干预,就好像复制文件一样简单,而且支持U盘移动便携模

式,真正实现了“一次安装,随处可用”。● 针对中文开发文档缺乏、零散的问题,内置多部中文版OpenCV、

FontForge和Python入门教材。● 内置多款中文开源Truetype字库。● 大量示例脚本源码,涵盖OpenCV、CUDA/OpenCL、Pygame等。

如此种种,只是为了便于IT行业外的用户能够零起步、快速入门,并且在短时间内能够应用到生产环节中。

ZwPython的前身是zw2015sdk,即字王智能字模设计平台,原设计目标是为广大设计师提供一款统一的、可编程的字体设计平台,便于大家交流。

设计师、美工都是文艺青年,所以简单是必须的,开箱即用也必须是标配。● 用来做设计,图像处理PIL和Matplotlib模块是必须的。● 集成了OpenCV作为图像处理、匹配模块,自然也提供了机器学

习功能。● 字模处理数据量很大,属于大数据范畴,必须集成Scipy、

Numpy及Pandas数据分析模块。● 由于原生Python速度慢,所以增加了PyCUDA、OpenCL高性能

GPU计算模块。

如此等等,一而再、再而三地扩充,发现zwPython已经基本覆盖了目前Python和IT编程领域90%的应用,因此又增加了部分模块,将zwPython扩展成为一个通用的、集成式Python开发平台。2.1.4 “零对象”编程模式

虽然很多人都认为Python是一种“面向对象”的编程语言,但对初学者而言,把Python视为一种BASIC风格的、过程式入门语言,学习难度可以降低90%,基本上学习一小时即可动手编写学习代码。

有人说,“面向对象”最大的好处是方便把人脑子搅乱。

Windows、Linux、UNIX、Mac OS X内核都是C语言、汇编语言写的。有一种系统是C++语言写的内核,就是诺基亚的塞班系统,现在已经“死”掉了,据说代码量比Windows XP还大,连他们自己的程序员都无法维护。

零对象编程模式,就是用BASIC的方式学习Python。

这只是笔者向Python等编程语言的入门用户,提出的一种全新的学习理论,一家之言,仅供参考。“零配置”很容易理解,关于“零对象”,下面再补充几点。● 不写“面向对象”风格的代码,不等于不能使用,对于各种采用“对象”模式开发的模块库,我们仍然可以直接调用。● 将Python视为非“面向对象”语言,并非“大逆不道”,事实上,

许多人认为Python也是一种类似lisp的“函数”编程语言。● 笔者编程十多年,从未用过“面向对象”模式,编写过一行“class”(类对象)代码,依然可以应对各种编程工作。●“ 面向对象”编程理论目前在业界仍然争论不休,入门者功力不

够,最好避开强者间的火力杀伤。●“ 面向对象”的鼻祖C++ 11标准,直到2015年,依然处于推广阶

段,而且争议纷纷。●“ 面向对象”过于复杂,与Python的优雅风格天生不合。2.2 用户运行平台

本节主要讲解Python开发环境和数据包的配置、应用流程方面的知识。

本书所有案例程序均采用纯Python语言开发,除特别指明外,默认使用Python 3语法,均经过zwPython平台测试。

zwPython是极宽公司推出的一个Python集成版本,功能强大,是国内免费开源软件,其用户手册封面如图2-1所示。系统内置了数百种专业的Python模块库,无需安装,解压即用。有关zwPython的使用,可参考软件自带的《zwPython用户手册》。

试读结束[说明:试读内容隐藏了图片]

下载完整电子书


相关推荐

最新文章


© 2020 txtepub下载