用马尔可夫模型预测足球比赛赛果
18年夏天,时值火热的世界杯,为了看球的时候更有(fa)参(cai)与(zhi)感(fu),我买了几场没什么悬念的比赛
比如说
韩国VS德国
在为中国的福利事业贡献了几十块钱之后,我想到了那句话
科学技术是第一生产力
于是就看见了这篇文章
我是文科生,大学学的也是文科专业,虽然为考研自学过概率论,但是马尔可夫模型对我来说还是太深了些。
不过这是一篇硕士论文,文中自然少不了对模型的介绍。再加上本科就读于财经大学,数理统计方面的资源并不难找,一天以后,我弄懂了论文。
翻译成人话就是,假设你一共喝了十次冰红茶,在这之后,你有两次喝了七喜,那么冰红茶后一次喝七喜的概率就是2/10,0.2,这个概率被称为转移概率。如果冰红茶后隔了一次第三次喝的饮料中有四次是雪碧,那么冰红茶转移到雪碧的概率就是4/10,因为隔了一次,是喝冰红茶之后第二次喝饮料,所以这被称为二阶转移概率,当然,刚才那个转移到七喜的0.2也就是一阶转移概率。如果我们要用这个模型测第六次你喝什么饮料。就要先知道你第一二三四五次分别喝了什么饮料。然后列出一个你喝饮料的历史记录,组成一个序列,类似于这样。
然后在这个序列中统计出各种饮料转移到其他饮料的一二三四五阶概率,找到近五次你喝的饮料种类,选取相应的转移概率。比如说你倒数第五次喝的是雪碧,你就要选取雪碧转移到其他饮料的五阶转移概率,相应的,倒数第四次是可乐,选取可乐转移到其他饮料四阶转移概率。直到倒数第一次也就是上一次
然后对各阶转移概率按照归一化的各阶自相关系数进行加权求和,就可以得到第六次各种饮料的概率。当然,这首先要求饮用饮料的序列具有马尔可夫性。
而这篇文章则是把历史上中国体彩开出的足球比赛的赛果赔率化成了五个区间,赛果赔率所在区间作为饮用的饮料种类,然后选择最近的一百多场比赛的赛果赔率作为历史序列,最终选择要测算的比赛胜平负赔率中其所在区间概率最高的一个。
我搞懂的时候,脑子里只出现了两个字
扯淡
不是
捐楼
按照论文里的说法,论文里这个预测模型的准确率能达到六中五,百分之八十多。按照平均赔率2.5算,一次的期望收益率就是2.5*0.8=2。以2为底的指数函数长什么样来着?
最关键的是,理论上来讲,模型的准确率不因其所得出结果的赔率高低而变化,换句话说,我可以只买他它预测出的高赔率赛果,而准确率还是百分之八十。照这样发展下去,我就能成为我这届第一个给学校捐楼的优秀校友了啊(当时我刚刚毕业一个月)
虽然我也想过,这要是真的可以,不大可能发表出来,但是毕业一个月就给学校捐楼,这个成就实在太有诱惑力。
为了早日让母校搬进我捐的新大楼,我用excel搭建了一个半自动的预测平台,随后对体彩接下来的三场比赛进行了预测
事情顺利得出奇,一个都不对
当然,这并不能动摇我急于给学弟学妹改善学习环境的初心,毕竟论文里的验证过程是一步一步写在上面的,厦门大学的硕士论文总不会有错,我对预测平台进行了检查,然后又测了三场
这应该不能改变什么……
全对了。
在接下来的一周里,我利用空闲时间验证了差不多一百多场比赛,基本就是上面这个过程的重复。一系列的连对让我开始规划母校新校区的选址,随后一系列的连错又让我思考人生的意义。在收集了足够多的样本之后,我得到了这个模型的准确率:百分之五十。
虽然比百分之八十差了很多,但是也比纯瞎蒙的百分之三十三也就是三分之一强。
但随着验证的深入,我得出了一个比较严谨的结论
全TM是瞎扯淡
从我验证的样本来看,整体的准确率是百分之五十。而大部分比赛,它们的胜平负赔率所在区间的数量是,两个。
也就是说,在这里这个模型的一系列运算,并不比另一种方法更准确。而这个方法有个学名,叫瞎JB选。
而模型能比纯粹瞎蒙得到更高的准确率原因,纯粹是因为他把备选结果从三个,化成了两个。二选一,准确率百分之五十,看上去比三选一的百分之三十三强,对吧?但是赔率也相应调低了,最后期望收益率还是赔钱。
虽然马尔科夫链在股市预测方面具有应用价值,但那是因为股市的前后走势的相关性有其内在逻辑,可以被大众心理政策走势大宗商品价格调整等现实原因所解释。但是这里,体彩中心排列序号上的前一场比赛和后一场比赛的联系,只能用两个字来概括:玄学。
但是我还是不死心,毕竟论文里是举了六个例子,把每一步都明确列出才得出准确率百分之八十这个结论的。就算是因为样本数量小,验证过程中我也从没遇到过六中五的情况。于是我又找来了论文中选取的历史序列,验证了一下论文里的样本。
结果是,六个错了四个。。。
这哪里是准确率百分之八十,错误率都快百分之八十了好吧
一番对比之后,我找到了问题的所在
这是论文里的近五场比赛
而当天,体彩的排列的比赛顺序是这样的
2014年1月16日的第一场比赛葡联杯的费雷拉对科维良被删除了,然后后面的几场比赛和体彩的序列可以用一句术语来形容:满不挨着。
也就是说,论文里的结果,是被凑出来的,而凑的方法不难掌握,知道比赛结果就行。
知网上最不得了的当然是这个:
学术翻译必备网站……
在知乎发现一个在中国知网、万方下载论文和专利的方法:
必然是北京大学冯军旗博士在河南南阳市新野县挂职两年,采访数百人,厘清该县数十年官场生态、关系和晋升的雄文:中县干部!
然而查遍知网都没有,冯博士待遇竟然和另外两位清华大学博士相同。
放一张最有趣的
再放一张采访对象名单,一共三页多,只放第一页,感受一下,这篇文章的研究内容和深度绝对空前绝后。北山市是南阳市,中县即新野县。
匿名回答,不为涨粉和热度,只求大家赞同和关注。
洁洁良事件过去两月有余,厦大和辽师两校都在事件之初发布声明,表示将进行调查。如今辽师一直装死,厦大因为其“错误言论”给予留校察看和留党察看处分。
这件事貌似就这么过去了,但却又不应该这样沉寂。因为,跟精日言论一样需要处理的,还有洁洁良本人严重的学术造假。
洁洁良在2014年于《北方经贸》(野鸡杂志)上发表了一篇文章《中国水市场的运作模型研究》,被网友查出存在极其严重抄袭行为(当然,她被扒出造假的问题不止这一篇,目前被发现的还有《辽西港口建设对城市发展的影响分析》这篇文章)。
之所以说她的抄袭式极其严重的,那是因为她的文章从头到尾,包括论文提出,皆无一字是洁洁良本人所原创。论文的主体涉(fu)嫌(zhi)抄(zhan)袭(tie)了一篇十几年前发表了的文章,此外再加上从另两篇文章里的东拼西凑来的文字,就变成了她本人的大作。
这篇文章至今还能在知网上被检索到,看着两篇题目相同的文章,我只能说洁洁良这孩子真的是不得了。这些年来,抄袭不是没见过,但多这种100%抄袭真的是不多见。这种吃相真的可以说是毫无顾忌,有恃无恐了。
记得,去年年初,复旦一博士也爆出抄袭,程度和洁洁良类似。在复旦的调查后,给予了撤销学位的处理。
“论文抄袭达到99.9%,不仅目录、内文、参考文献全部复制抄袭,甚至连后面的致谢也抄袭部分。”
但反观洁洁良,在如此强大的舆论关注下,她学术造假的事情居然戏剧性的没人管了。我们不能要求用博士毕业论文的标准去要求本科生,但再怎么说,洁洁良的事情也不应该没人管吧?
我们捋一捋,首先这些抄来的文章是她本科期间所发,理应由辽师处理,但这所学校摆明了是要用“拖字诀”,反正有更有名望的厦门大学在前面扛着,它自己完全拖到大家都忘了这件事情。事实上,此事中厦大承担了大部分压力,辽师的关注度反而不高。
然而,厦门大学也很让人失望,即使洁洁良抄袭论文是本科期间所为,但很多问题厦大也有义务调查清楚,做出公开回应。比如洁洁良从一个野鸡学校保研到厦大的过程中,这些文章有没有写入提交给厦大的简历之中?对保研结果有没有起到影响?如果简历里有造假文章,是否应该取消录取资格?这不仅仅是我的疑问,也代表了很多很多网友,其中就包括很多向往厦大的学生。遗憾的是,但这些问题厦大完全没有正视。
至于《北方经贸》杂志社反而不那么令人失望了,因为它本来就是个野鸡期刊,我也没对它报以多高要求。此事说明该期刊的审稿和查重完全如同虚设,而且事件发生这么久,该论文仍然出现在知网上,这说明期刊编委根本没有对文章进行撤稿处理,或是没有联系知网撤稿。这种垃圾期刊投了真的是有损身份。
我知道中国现阶段的学术环境并不算太好,除了名校外,我相信大多数学校仔细查都能找出些洁洁良式的造假,所以很多时候我对此都是见怪不怪,睁一眼闭一眼就行了。但此事之所以让我愤慨,乃是洁洁良不同于一般人,她的造假极其严重,同时民愤极大。所以在这么多人的关注下,洁洁良的学术造假都没有得到惩罚,甚至我怀疑都没有被调查。
校方的纵容,期刊的失职,让我心生悲凉。如果洁洁良的如此严重造假,在得到了大量关注后仍然没有人管,那真是中国学术界和教育界的悲哀,那么大家需要论文但写不出来时就也跟着抄吧,做的别比洁洁良还过分就行,反正也没人会管。
真抓实干
2019-08-28更新:
啊爽爽爽爽爽破k啦!小透明翻身啦!吃火锅庆祝一下!!
2018-07-23更新:
是的是的我已经知道里面有一道黑暗料理了……
____________________________
2018-07-11更新:
这是我第一个达到0.1k赞的回答,虽然是个抖机灵的回答,但作为小透明还是灰常高兴,所以赶紧滚来更新了一把。
————————分割线—————————
以下是原答案:
对不起>人<……没文化的吃货只注意到了这个……
来源见各期刊/作者相关信息…
对这个答案,只做了一点微小的贡献,很惭愧。
以上
不请自来答一发
可能有点跑题哈。。。
哥们有个同事妹子
属于大龄(31岁)单身女神型
性格女汉子
而且酒量深不可测
属于普通男生降不住型
给她介绍相亲的踏破门槛
可基本都被妹子婉拒
有一次妹子叫哥们喝酒
酒过三巡又聊到她的人生大事
妹子摇摇头:我觉得我还没准备好。
哥们:你是还没走出来吧?
妹子:算是吧,打算跟他一起考研,结果那年他爸爸出事,情绪低落没考上,后来说怕耽误我就分了。。
哥们:啥怕耽误你,就是劈腿了肯定。。
妹子:老娘看人有那么不准吗!
哥们:那后来呢?
妹子:怕我联系他再心软,邮箱停用,手机停机,QQ黑名单。。。后来我也一气之下全换了!
哥们:去他家泼油漆去呀!跑得了和尚跑不了庙,有能耐连家也搬了!
妹子:我就没去过他家,就知道他在xx省xx市
哥们:那你跟哥们说他叫什么,我帮你打听打听
妹子:能耐的你,他叫xx,打听去吧!
哥们:名还算不太大众,还有别的线索么。。。
妹子:跟我大学同学。。。
哥们:有啥共同好友么?
妹子:没。。。起初不想联系,看到他们就会想起他。。。后来这么多年换号码换城市。。。都断了联系了。。。算了,大海捞针的,而且捞到了也未必能怎么样。。。
哥们:别泄气呀,我妹咂看上的爷们儿,哥哥怎么都得给你翻出来。。。
妹子:成啊!你只要找着,他没结婚我就嫁他!
哥们:你看哈,那爷们能被你看上估计不会是个轻易服输的主儿对吧。
妹子:那必须!
哥们:一次考不上得不得再考两次试试?
妹子:有可能!屁!就他的脑子,要考研的话需要再考两次,不是我瞎了就是阅卷的瞎了。。
哥们:那你说,如果考上研究生得不得发文章,写毕业论文?
妹子:对呀!
哥们:知网搜过他的文章么?
妹子:没。。那你快搜搜!
哥们:看哈,满知网叫这名的有十六个人,他大学学啥的?
妹子:跟我一样,英语文学。。。
哥们:。。。那就是所有文科都有可能。。。
妹子:好吧。。。其实理科也有可能。。。他当年数学特好,还自学过编程。。。
哥们:。。。专业排除不了,那就搜硕博毕业论文,看毕业时间。。。比你晚一年毕业的就仨人。。。一个草业科学、一个法学、一个古代史。。
妹子:古代史古代史。。。
哥们:好嘞,这个是xx大学历史学院的硕士,很多小文章作者简介里有籍贯和邮箱。。。
妹子:(快哭了,手都是抖的)好!
哥们:嗯!是不是这个?
妹子:不是。。。
哥们:那这个排除了,再看看那俩呢。。。
妹子:都不是。。。。。。
哥们:那再看看是不是其他年份毕业的。。。
妹子:不可能了。。。他如果第二年考不上我觉得就不会再考了。。。算了吧。。。
哥们:别急呀,还有一种可能。。。他有没有可能就没写硕士毕业论文?
妹子:你是说。。。硕博连读!
哥们:Bingo!我搜下跟你同年毕业的博士毕业论文。。。有一篇xx大学统计方向的!
妹子:就是他就是他!
哥们:路子够野的呀,本科英语文学,硕博学数学。。。
妹子:(又快哭了)我觉得一定是他!
哥们:那继续搜小论文确认身份。。。xxx,198x年x月出生,xx省xx市人。。。邮箱号。。。。
妹子:(捂着嘴失声痛哭)是他。。。
哥们:联系方式也有了,发邮件吧!
妹子:等下,他如果结婚生子了,我联系他不好。。。
哥们:好办,把他博士毕业论文的致谢下下来看看。。。
妹子:为什么?
哥们:傻问题,致谢一般先谢导师再谢老师再再谢同学再再再谢父母最后谢配偶。。。
妹子:我就没谢配。。。
哥们:废话,你得有才行啊!这哥们貌似。。也没有!
妹子:那就是说。。。就是说。。。(又哭了。。。)
哥们:高兴别太早!跟你同年毕业,这都已然工作两年了,你没找你怎么确认对方也没找。。
妹子:那怎么办。。。
哥们:先确定他在哪工作,然后看看能不能打听到。。。
妹子:他如果不留校任教那怎么知道他去了哪。。。
哥们:挺聪明个妹子,遇到感情问题就傻了。。。搜他这两年的文章啊。。。你看这篇,xx大学xx博士后流动站。。。流弊呀,博后。。xx大学我有个师弟,待我打个电话。。喂那个谁,我是你大哥!开毛会,有事找你打听下,你帮我打听下那个xx流动站的xx。。。你听说过?那哥们现在。。。也油盐不进?那就对了!有联系方式吗?邮箱还用你要。。。电话!好嘞,待会发给我哈!
妹子:怎么样怎么样?
哥们:别提了。。大龄未婚男神,谁劝都不好使。。。
妹子:我就知道。。。
哥们:喏,电话发过来了,打个电话过去说明白的吧!
妹子:不打!
哥们:这好容易找着的。。。
妹子:我现在就订票去找他!
一周后。。。
哥们:咋样妹咂?涛声依旧了?滚床单了没?
妹子:滚。。。他说今年下半年出站就直接来咱们这。。
哥们:捎带手还为咱们吸引人才了。。。
于是
我又相信爱情了。。。
一更:
关于去医存药之争,先不说话,上图,这是老衲的书架一角:
老衲反复强调:
“千万不要用你的爱好去挑战别人的吃饭的本事,你对那种力量一无所知。”
很多人谈去医存药……老衲也是哔了狗了……老衲哪只嘴巴说过去医存药?你是猴子请来的逗比吧?
中国以《伤寒论》立论,六经辨证,讲了两千年,嗯。
(我擦……不按套路出牌啊……不是说好靶点基因的吗?)
取自:祝谌予. 施今墨先生的中西医结合思想和我对中西医结合的看法[J]. 中国中西医结合杂志, 1985(9):518-519.
结论:医是精髓,药是延伸,两者缺一不可。
嗯,本人搞中药的……现在的方向是:网络药理学+生物信息学+多组学
最近写标书,有幸查到了一篇1977年的文献。国医大师岳美中的一篇论文:
岳美中. 如何开展中药研究的我见[J]. 中医杂志, 1977(3):39-41
很多人都说中药复方是一锅汤,什么都往里面装。其实,搞中药的人,一直在努力的告诉世人,这个汤是如何起作用的。
犹记得2002年,王喜军教授的国家科技进步二等奖《中药血清药物化学研究方法的建立与实施》,看罢后,老衲真的衷心佩服。接触过分析化学,玩过HPLC的人,就知道,这个分析强度有多大,在没有组学的支持下,搞血清药化,不敢说大海捞针,池塘捞针的强度是有的了。
王喜军, 张宁, 孙晖,等. 六味地黄丸的血清药物化学研究[J]. Chinese Journal of Natural Medicines中国天然药物, 2004, 2(4):219-222.
已经无限接近岳美中先生想证实的东西。
而随着多组学的发展,伴随生物信息学,重要的复方研究,早已经摆脱传统药理机制复杂,研究难于精准的掣肘,大踏步向基因和蛋白水平迈进。
当初困扰岳美中老先生的问题,现在其实花几万块钱做转录组+代谢组学研究就能验证了。
另外,你们认为的中药研究是:
其实,我们研究的是:
你们认为中药的研究是:
其实,我们的研究是:
港真,现在中医喷子们,真的人嘴两张皮……话拿过来就喷……
但是,喷中医的门槛挺高的。
去NCBI上找个基因估计都分不清内含子和外显子,string找一套互作蛋白都解释不清。更甭说用R去挖掘数据了……就上面省自然基金的项目,亲~你能知道,俺们在干嘛吗?
哦对了~你们会喷……中药研究,不是讲君臣佐使吗?给你:
哦,对了,你不说中药治病,基本都是安慰剂吗?拿走不谢
喜欢在网上乱嚼舌根子的……搞中医药研究的,特指研究人员。生物化学,分子生物学,细胞生物学,药理学,药物化学,病理学,生理学,解剖学,内外妇儿科,微生物与免疫。虽然不敢说赶得上西医院校的研究者,但是,基础是肯定不落下风的。
当然,对于大部分中医黑子来说,绝对的碾压一样的存在。借用韩寒同学的一句话:
“千万不要用你的爱好去挑战别人的吃饭的本事,你对那种力量一无所知。”
可能在某些手艺活方面,的确高手在民间,但我相信那也是经过了大量的学习与准专业训练,绝不是一朝一日可以练就,另外一方面,竞技体育以及科研科技等领域,所谓民间高手更不可能与专业人员抗衡。
对于大部分黑子来说,你在从业者眼中,其实就是民间高手。
当然,这些都不是重点。重点是,前辈老先生的想法,能被后人证实,谈不上传承或告慰。
能证明先人的想法和推测,难道不也是一件很快乐的事情吗?
你知道大唐的国教是什么吗?道教?no no no!这位学者的论文给出了答案。
7.16补充:鉴于很多小伙伴放假在家,读不到原文,这里借马伯庸当年的总结,补充一下该文的论证思路。
更有学者所见略同,用知识琼浆滋养少年学子。。
看到这个问题的时候,我回想起多年前自己发的一条朋友圈:
各位大概看不清图片上的字,我又努力回忆了下这到底是哪篇论文,然后在知网找到了,叫做
说起来我当时应该是在准备毕业论文,打算观摩下大神们是怎么写参考文献的。
可是我至今没想明白为啥我一个学化学的跑去找了一篇力学领域的论文( ╯□╰ )
大概是看到作者比较碉吧。
大家知道caj格式的论文用caj浏览器打开是需要一点时间的
我当时的状态就和这个表情差不多
好了论文终于打开了,反正正文我也看不懂,就立刻往下拉到「参考文献」那一节:
???
本文不必参考任何文献???
其实理由......还挺充分,我忍了
可这不是在讨论宁波甬江大桥吗???
为什么是「本人未见过宁波甬江大桥的设计」???
我觉得最后的「目测估计」才是最骚的
不过我觉得作者确实有任性的资本
看名字你就懂了
有兴趣自己去搜(逃