您现在的位置是: 首页 > 城市预报 城市预报
贝叶斯分析在天气预报中的应用_贝叶斯估计及其应用研究分析
tamoadmin 2024-07-23 人已围观
简介1.概率论的相关研究内容有哪些?2.陈静的学术简介3.概率分配函数与概率相同吗4.中文的来历5.我预判了你预判我的预判——关于预测的思维模型阶段一:Python开发基础Python全栈开发与人工智能之Python开发基础知识学习内容包括:Python基础语法、数据类型、字符编码、文件操作、函数、装饰器、迭代器、内置方法、常用模块等。阶段二:Python高级编程和数据库开发Python全栈开发与人工
1.概率论的相关研究内容有哪些?
2.陈静的学术简介
3.概率分配函数与概率相同吗
4.中文的来历
5.我预判了你预判我的预判——关于预测的思维模型
阶段一:Python开发基础
Python全栈开发与人工智能之Python开发基础知识学习内容包括:Python基础语法、数据类型、字符编码、文件操作、函数、装饰器、迭代器、内置方法、常用模块等。
阶段二:Python高级编程和数据库开发
Python全栈开发与人工智能之Python高级编程和数据库开发知识学习内容包括:面向对象开发、Socket网络编程、线程、进程、队列、IO多路模型、Mysql数据库开发等。
阶段三:前端开发
Python全栈开发与人工智能之前端开发知识学习内容包括:Html、CSS、JaScript开发、Jquery&bootstrap开发、前端框架VUE开发等。
阶段四:WEB框架开发
Python全栈开发与人工智能之WEB框架开发学习内容包括:Django框架基础、Django框架进阶、BBS+Blog实战项目开发、缓存和队列中间件、Flask框架学习、Tornado框架学习、Restful API等。
阶段五:爬虫开发
Python全栈开发与人工智能之爬虫开发学习内容包括:爬虫开发实战。
阶段六:全栈项目实战
Python全栈开发与人工智能之全栈项目实战学习内容包括:企业应用工具学习、CRM客户关系管理系统开发、路飞学城在线教育平台开发等。
阶段七:算法&设计模式
阶段八:数据分析
Python全栈开发与人工智能之数据分析学习内容包括:金融量化分析。
阶段九:机器学习、图像识别、NLP自然语言处理
Python全栈开发与人工智能之人工智能学习内容包括:机器学习、图形识别、人工智能玩具开发等。
阶段十:Linux系统&百万级并发架构解决方案
阶段十一:高并发语言GO开发
Python全栈开发与人工智能之高并发语言GO开发学习内容包括:GO语言基础、数据类型与文件IO操作、函数和面向对象、并发编程等。
概率论的相关研究内容有哪些?
设D1,D2,……,Dn为样本空间S的一个划分,如果以P(Di)表示Di发生的概率,且P(Di)>0(i=1,2,…,n)。对于任一x,P(x)>0,则有:
n
P(Dj/x)=p(x/Dj)P(Dj)/∑P(X/Di)P(Di)
i=1
color=red][/color]案例:
a:先验概率P(Di)
D1,D2....Dn是样本空间的S的一个划分P(Di)
定D1,D2...是某个过程的若干可能的前提,则p(x/Dj)是各个前提条件出现可能性大小的估计
b:后验概率P(Dj/x)
在先验的情况下得到一个结果A,那么贝叶斯公式提供了我们根据A的出现对前提条件做出的新评论的方法。
是对以A为前提下Bi的出现概率的重新的认识。
c:前提各种属性之间互相没有什么影响,这样挖掘的速度很快,但是处理的结果不是很准确。
设D1,D2,……,Dn为样本空间S的一个划分,如果以P(Di)表示Di发生的概率,且P(Di)>0(i=1,2,…,n)。对于任一x,P(x)>0,则有: j是针对一个样本
n
P(Dj/x)=p(x/Dj)P(Dj)/∑P(X/Di)P(Di)
i=1
陈静的学术简介
概率论是数学的一个分支,主要研究随机现象和不确定件的规律性。其研究内容广泛,主要包括以下几个方面:
1.概率基本理论:包括概率的定义、性质、运算规则等基本概念和理论。
2.随机变量及其分布:研究随机变量的分类、性质、分布函数、密度函数等。
3.大数定律和中心极限定理:这是概率论的两个重要定理,描述了随机变量的长期行为和大量独立随机变量之和的分布。
4.条件概率和独立性:研究在给定其他发生的条件下,某一发生的概率,以及之间的独立性。
5.期望值、方差和协方差:这些是描述随机变量特性的重要参数。
6.极大似然估计和贝叶斯推断:这是统计学中常用的两种参数估计方法。
7.马尔科夫链和随机过程:研究具有“无后效性”的随机现象,如布朗运动、泊松过程等。
8.随机模拟:通过计算机模拟来研究和解决实际问题。
9.统计决策理论:研究如何在不确定条件下做出最优决策。
10.风险分析和金融工程:在金融、保险等领域,概率论被用来评估和管理风险。
以上就是概率论的主要研究内容,它在实际生活中有着广泛的应用,如天气预报、金融市场分析、医学诊断等。
概率分配函数与概率相同吗
研究方向
1.集合预报
2.大气数值模拟
在研项目
1、“延伸期数值预报预测关键技术研究”,2009年度国家科技支撑项目“持续性异常气象预测业务技术研究”第三课题,课题主持人
2、基于多模式集合预报的交互式应用技术研究,2009年度中国气象局公益性行业专项,项目负责人
3、2010年国家自然科学基金面上项目“基于贝叶斯统计理论的降水集合预报概率化方法研究”,第一主研人
完成项目
1.面向TIGGE的集合预报关键应用技术研究,中国气象局公益性行业专项,项目联系人,课题负责人;2010年完成
2.中尺度暴雨集合预报初值扰动方法研究,国家自然科学基金面上项目(代码,40675061),项目负责人;2009年完成
3.长江上游暴雨超级集合预报与预警技术研究,科技部社会公益研究专项,项目负责人,2007年完成
4.精细化GRAPES模式高原地形优化方案研究,中国气象局数值模式创新基地基金项目,项目负责人,2008年完成
5.数值集合预报技术研发与业务应用开发,四川省气象局重大项目,项目负责人,2007年完成
6.西南地区资料同化与中尺度数值预报业务系统,中国气象局2007年多轨道业务建设项目,专题负责人,2007年完成
7.数值集合预报技术研发与业务应用开发,四川省气象局重大项目,项目负责人,项目负责人,2007年完成
8.中尺度暴雨集合预报初值扰动方法研究,国家自然科学基金面上项目(代码:40475045),项目负责人,2005年12月完成
9.“奥运气象保障技术研究,国家科技部,2006年1月完成,主研人员
发表论文
1、Hey Rainfall Ensemble Prediction:Initial Condition Perturbation vs Multi-Physics Perturbation. 气象学报(英文版), 2009,23(1):53-67. 核心期刊(SCIE收录),第一作者
2、 A Diagnostic Analysis of the Impact of Complex Terrain in the Eastern Tibetan Plateau. China, on a Severe Storm, Arctic Antarctic and Alpine Research, 2007,39(4):699-707 ,核心期刊(SCI收录),第一作者
3、一种新型的中尺度暴雨集合预报初值扰动方法研究. 大气科学,2005,29(5):717-726. 核心期刊(SCIE收录),第一作者
4、The uncertainty of hey rainfall of South China and experiments of ensemble prediction. Acta Meteorological Sinica,2005,19(1):1-18. SCIE核心期刊(SCIE收录),第一作者
5、数值预报产品对强天气预报的技术支持和应用,气象,2010,36(12):41-49,核心期刊,第一作者
6、青藏高原东侧“2003.8.28”暴雨的集合预报试验.高原气象,2004,增刊:6-14,核心期刊,第一作者
7、非绝热物理过程对北京暴雨数值预报不确定性影响. 应用气象学报, 2006,17(8):18-27. 核心期刊,第一作者
8、华南中尺度暴雨数值预报的不确定性与集合预报试验. 气象学报,2003,61(4):432-446,核心期刊,第一作者
9、物理过程参数化方案对中尺度暴雨数值预报影响的研究. 气象学报, 2003, 61(2):203-208. 核心期刊,第一作者
10、集合数值预报的发展与研究进展. 应用气象学报, 2002,13(8):4—507. 核心期刊,第一作者
11、杜钧,陈静 《单一值预报向概率预报转变的基础: 谈谈集合预报及其带来的变革》,气象,2010,36(11):1-11,核心期刊,第二作者
12、杜钧,陈静. 天气预报的公众评价与发布形式的变革. 气象,2010,36(1):1-6. 核心期刊,第二作者
获奖情况
1、数值集合预报技术研究与业务应用开发获2009年四川省科技进步一等奖,第二完成人。
2.2007年获第四届四川省十大女杰荣誉称号
3.2006年获四川省“五一劳动奖章”
4.2006年获第六届“全国优秀青年气象科技工作者”
5.2005年获四川省直机关“三八红旗手”
6.2004年获第四届四川省直机关“十佳青年”
7.2004年第5批“四川省学术与技术带头人后备人选”
8.2003年获中国气象科学研究院“优秀博士论文”
9.1999年获中国气象局“优秀预报值班员”
中文的来历
概率分配函数和概率是两个不同的概念,尽管它们在某些方面可能相似,但它们有着不同的定义和用途。
概率是一个发生的可能性,通常用数值表示。在数学和统计学中,概率通常是一个发生的比例,或者说是该发生的次数与所有可能的总次数的比值。例如,在掷一个六面的骰子时,每个数字出现的概率都是1/6。
而概率分配函数是用于描述在有限个可能结果集合中,某个发生的概率分布情况。这个函数将可能的结果映射到它们各自的概率值。它是一个函数的定义,将每个可能的结果映射到其相应的概率值。
概率分配函数和概率的关系在于,它们都是用来描述或衡量的概率分布情况。但是,概率是一个单一的数值,而概率分配函数则是一个函数,它为每个可能的结果分配一个概率值。
在实际应用中,概率和概率分配函数都用于预测和分析不确定性。
概率分配函数的应用:
1、金融风险管理:在金融领域,概率分配函数被用来描述和预测可能的风险和回报。例如,在投资组合理论中,概率分配函数可以用来评估不同投资项目的风险水平,以帮助投资者做出更明智的投资决策。
2、天气预报:在气象学中,概率分配函数被用来描述和预测天气的概率分布情况。例如,概率分配函数可以用来预测某地未来几天下雨的概率,以便人们可以做出相应的安排。
3、医学研究:在医学研究中,概率分配函数被用来评估疾病的发病风险和治疗效果。例如,在临床试验中,概率分配函数可以用来评估新药与现有药物相比的疗效和风险水平。
4、社会科学:在社会科学中,概率分配函数被用来描述和预测社会现象的概率分布情况。例如,概率分配函数可以用来预测某地区选举结果、人口迁移趋势等。
5、机器学习:在机器学习中,概率分配函数被用来描述和预测数据的概率分布情况。例如,概率分配函数可以用来训练贝叶斯网络、朴素贝叶斯分类器等模型,以便这些模型能够更好地学习和预测数据的概率分布情况。
我预判了你预判我的预判——关于预测的思维模型
中文
中文——作为一个民族的母语,中文是当今世界流行语言体系里最大的一个分支。始创于公元前黄帝在世的时代,成就于公元二十世纪后期。是一种发源最早而成熟最晚的一个语言体系。是东方文明的一种标志与成果,是人类用来精确命名与定义万事万物的一种重要信息载体。体系包括几千个常用单字和上万个字词成语,是文明社会不可缺少的重要组成。 自一名京人编辑
从20世纪50年代初机器翻译课题被提出算起,自然语言处理(NLP)的研发历史至少也有50年了。90年代初,NLP的研究目标开始从小规模受限语言处理走向大规模真实文本处理。把这个新目标正式列入大会主题的是1990年在赫尔辛基举行的“第13届国际计算语言学大会”。那些只有几百个词条和数十条语法规则的受限语言分析系统,通常被业内人士戏称为“玩具”,不可能有什么实用价值。、企业和广大计算机用户期盼的是像汉字输入、语音听写机、文-语转换(TTS)、搜索引擎、信息抽取(IE)、信息安全和机器翻译(MT)那样的、有能力处理大规模真实文本的实用化系统。
正是基于对这个里程碑式转折的关注,笔者在1993年就列举了四种大规模真实文本处理的应用前景:新一代信息检索系统;按客户要求编辑的报纸;信息抽取,即把非结构化的文本转化为结构化的信息库;大规模语料库的自动标注。值得庆幸的是,今天所有这四个方向都有了实用化或商品化的成果。
尽管全世界都把大规模真实文本处理看做是NLP的一个战略目标,但这不等于说受限领域的机器翻译、语音对话、电话翻译和其他一些基于深层理解的自然语言分析技术或理论研究,就不应当再搞了。目标和任务的多样化是学术界繁荣昌盛的一个标志。问题是要考虑清楚NLP的主战场在哪里,我们的主力应当部署在哪里。
中文难办吗?
谈到中文信息处理所面临的重大应用课题,如企业和广大计算机用户所期盼的汉字输入、语音识别等,大家似乎并没有什么分歧。但是当讨论深入到实现这些课题的方法或技术路线时,分歧马上就泾渭分明了。第一种意见认为,中文信息处理的本质是汉语理解,也就是要对汉语真实文本实施句法-语义分析。持这种意见的学者主张,以往在中文信息处理中使用的概率统计方法已经走到了尽头,为了在理解或语言层面上解决中文信息处理问题,就必须另辟蹊径,这条蹊径便是语义学。据说这是因为汉语不同于西方语言,汉语的句法相当灵活,汉语本质上是一种意合语言等。
与上述意见相对立的观点是:前面提到的绝大多数应用系统(MT除外)其实都是在没有句法-语义分析的情况下实现的,因此谈不上“理解”。 如果一定要说“理解”,那么只是用图灵实验来证实的所谓“理解”。
上述双方争论的焦点是方法,但目标和方法通常是密不可分的。如果我们同意把大规模真实文本处理作为NLP的战略目标,那么实现这一目标的理论和方法也必然要跟着变化。无独有偶,1992年在蒙特利尔召开的“第四届机器翻译的理论和方法国际会议(TMI-92)”宣布大会的主题是“机器翻译中的经验主义和理性主义方法”。这就是公开承认,在传统的基于语言学和人工智能方法(即理性主义)的NLP技术以外,还有一种基于语料库和统计语言模型的新方法(即经验主义)正在迅速崛起。
NLP的战略目标和相应的语料库方法都是从国际学术舞台的大视野中获得的,中文信息处理自然也不例外。那种认为中文文本处理特别困难,以至要另辟蹊径的观点,缺少有说服力的事实根据。拿信息检索(IR)来说,它的任务是从一个大规模的文档库中寻找与用户的查询相关的文档。怎样表示文档和查询的内容,以及如何度量文档和查询之间的相关程度,就成为IR技术需要解决的两个基本问题。召回率和精确率则是评价一个IR系统的两个主要指标。由于文档和查询都是用自然语言表述的,这个任务可以用来说明中文和西方语言所面临的问题和所用的方法其实是十分相似的。一般来说,各文种的IR系统都用文档和查询中的词频(tf)和倒文档频率(idf)来表示文档和查询的内容,所以本质上是一种统计方法。
世界文本检索大会TREC (://trec.nist.gov/) 的最大特点是通过提供大规模训练语料和统一评测方法来支持IR技术的研发。研究团队必须通过大会的统一评测并名列前茅,才能获准到会上来做报告。1992年起TREC每年举办一届大会,并得到美国国防部(DARPA)和国家标准技术局(NIST)的资助。会议对包括中文、日文在内的多文种文档库开展了IR评测。结果表明,中文IR并没有因为存在分词问题就比其他文种做得差,而且迄今没有证据表明各语种的NLP,包括基于概念的或基于句法-语义分析的技术,能明显提高IR系统的性能。
什么是主流技术?
语料库方法和统计语言模型不但没有过时,而且在可比的统一评测中被证明是当前各国语言信息处理的一种主流技术。
1. N元模型
设wi是文本中的任意一个词,如果已知它在该文本中的前两个词 wi-2w-1,便可以用条件概率P(wi|wi-2w-1)来预测wi出现的概率。这就是统计语言模型的概念。一般来说,如果用变量W代表文本中一个任意的词序列,它由顺序排列的n个词组成,即W=w1w2...wn,则统计语言模型就是该词序列W在文本中出现的概率P(W)。利用概率的乘积公式,P(W)可展开为:
P(W) = P(w1)P(w2|w1)P(w3| w1 w2)...P(wn|w1 w2...wn-1)
不难看出,为了预测词wn的出现概率,必须知道它前面所有词的出现概率。从计算上来看,这种方法太复杂了。如果任意一个词wi的出现概率只同它前面的两个词有关,问题就可以得到极大的简化。 这时的语言模型叫做三元模型 (tri-gram):
P(W)≈P(w1)P(w2|w1)∏i(i=3,...,nP(wi|wi-2w-1)
符号∏i i=3,...,n P(...) 表示概率的连乘。一般来说,N元模型就是设当前词的出现概率只同它前面的N-1个词有关。重要的是这些概率参数都是可以通过大规模语料库来计算的。比如三元概率有
P(wi|wi-2wi-1) ≈ count(wi-2wi-1wi) /count(wi-2wi-1)
式中count(...) 表示一个特定词序列在整个语料库中出现的累计次数。
统计语言模型有点像天气预报中使用的概率方法,用来估计概率参数的大规模语料库好比是一个地区历年积累起来的气象记录。而用三元模型来做天气预报,就好比是根据前两天的天气情况来预测今天的天气。天气预报当然不可能百分之百准确,但是我们大概不会因此就全盘否定这种实用的概率方法吧。
2. 语音识别
语音识别作为计算机汉字输入的另一种方式越来越受到业内人士的青睐。所谓听写机就是语音识别的一种商品。那么当前商品化的听写机用的是什么技术呢?
其实,语音识别任务可视为对以下条件概率极大值的计算问题:
W*= argmaxW P(W|speech signal)
= argmaxW P(speech signal|W) P(W) / P(speech signal)
= argmaxW P(speech signal|W) P(W)
式中数学符号argmaxW 表示对不同的候选词序列W计算条件概率P(W|speech signal)的值,从而使W*成为条件概率值最大的词序列。它也就是当前输入语音信号speech signal所对应的输出词串了。
公式第二行是利用贝叶斯定律转写的结果,因为条件概率P(speech signal|W)比较容易估值。公式的分母P(speech signa ) 对给定的语音信号是一个常数,不影响极大值的计算,故可以从公式中删除。在公式第三行所示的结果中,P(W)叫做统计语言模型;P(speech signal|W) 叫做声学模型。
据调查,目前市场上中文和英文的听写机产品都是用词的三元模型实现的, 几乎完全不用句法-语义分析手段。这说明不同语言的产品技术往往是相通的。没有证据表明,中、英两种语言的听写机在性能指标上有显著的差异。所以那种断言中文信息处理一定比西方语言困难,实现中文信息处理必须另辟蹊径的说法,其实是站不住脚的。
三元模型(或一般的N元模型)只利用了语言的表层信息(或知识),即符号(字、词、词性标记等)序列的同现信息。谁也没有说它是十全十美的。在这一领域中,下一个研究目标应当是结构化对象(如句法树或语义框架)的统计模型。当然能做到语言理解是了不起的成果,它肯定会比目前这种统计语言模型强得多,这是不争的事实。问题是目前国内外还没有哪一种语言的句法-语义分析系统可以胜任大规模真实文本处理的重任。因此,对于世界各国的语言来说,当前的主流技术仍是语料库方法和统计语言模型。
3. 词性标注
至少像短语结构文法这样一类的语法规则是建立在词类基础上的。无怪乎语言学界有句行话说,没有词类就没法讲语法了。所以在自然语言的句法分析过程中,大概都有一个词性标注的阶段。不难理解,汉语的自动分词和词性标注的精确率,将直接影响到后续的句法分析结果。据观察,在汉语句法分析结果中,有高达60%的分析错误来源于分词和词性标注的错误。
在英语的词库中约 14% 的词形(type)具有不只一个词性,而在一个语料库中,总词次数(tockens)中约 30% 是兼类词。从这个统计数字中可以估计出词性标注任务的难度。历史上曾经先后出现过两个方法迥异的英语词性标注系统:TGIT系统拥有3000条上下文相关规则, 而CLAWS系统完全用概率统计方法。两个系统各自完成了100万词次的英语语料库的自动词性标注任务。评则结果(见下表)表明,用概率统计方法的CLAWS系统的标注精度达到96%,比TGIT系统提高了近20个百分点。经过改进的CLAWS系统日后承担了英国国家语料库BNC一亿条英语词的词性标注任务。
具体来说,CLAWS系统用的是词类标记的二元模型。如果令 C = c1...cn 和 W = w1...wn分别代表词类标记序列和词序列,则词性标注任务可视为在已知词序列W的情况下,计算如下条件概率极大值的问题:
C*= argmaxC P(C|W)
= argmaxC P(W|C)P(C) / P(W)
≈ argmaxC ∏i i=1,...,nP(wi|ci)P(ci|ci-1 )
P(C|W) 表示:已知输入词序列W的情况下,出现词类标记序列C的条件概率。数学符号argmaxC 表示通过考察不同的候选词类标记序列C, 来寻找使条件概率P(C|W) 取最大值的那个词序列W*。后者应当就是对W的词性标注结果。
公式第二行是利用贝叶斯定律转写的结果,由于分母P(W) 对给定的W是一个常数,不影响极大值的计算,故可以从公式中删除。接着对公式进行近似。首先,引入独立性设,认为词序列中的任意一个词wi的出现概率近似,只同当前词的词性标记ci有关,而与周围(上下文)的词类标记无关。即词汇概率
P(W|C) ≈ ∏i i=1,...,nP(wi|ci )
其次,用二元设,即近似认为任意词类标记 ci的出现概率只同它紧邻的前一个词类标记ci-1有关。因此有:
P(C) ≈∏i i=,...,n P(ci|ci-1)
P(ci|ci-1) 是词类标记的转移概率,也叫做二元模型。
上述这两个概率参数也都可以通过带词性标记的语料库来分别估计:
P(wi|ci) ≈ count(wi,ci) / count(ci)
P(ci|ci-1) ≈ count(ci-1ci) / count(ci-1)
顺便指出,国内外学者用词类标记的二元或三元模型实现的中、英文词性自动标注都达到了约95%的标注精确率。
评测为什么是惟一的评判标准
有评测才会有鉴别。评判一种方法优劣的惟一标准是相互可比的评测,而不是设计人员自己设计的“自评”,更不是人们的直觉或某个人的“远见”。近年来,在语言信息处理领域,通过评测来推动科学技术进步的范例很多。国家“863”智能计算机专家组曾对语音识别、汉字(印刷体和手写体)识别、文本自动分词、词性自动标注、自动文摘和机器翻译译文质量等课题进行过多次有统一测试数据和统一计分方法的全国性评测,对促进这些领域的技术进步发挥了非常积极的作用。
在国际上,美国国防部先后发起的TIPSTER 和 TIDES两个和语言信息处理相关的,就被称为“评测驱动的”。它们在信息检索(TREC)、信息抽取(MUC)、命名实体识别(MET-2)等研究课题上,既提供大规模的训练语料和测试语料,又提供统一的计分方法和评测软件,以保证每个研究小组都能在一种公平、公开的条件下进行研究方法的探讨,推动科学技术的进步。TREC、MUC和MET-2等会议所组织的多文种评比活动也有力地说明,其他语言用并证明有效的方法,对中文也一样适用,不同文种应用系统的性能指标大体相当。固然,每种语言都有它自己的个性,然而这些个性不应当被用来否定语言的共性,并在事实不足的情况下做出错误的判断。
为了推动中文信息处理的发展,让我们拿起评测这个武器,扎扎实实地研究其适用技术,不要再想当然了。建议科研主管部门在制定项目时,至少要在一个项目的总经费中拿出10%左右的拨款用于资助该项目的评测。没有统一评测的研究成果,终究不是完全可信的
三体星人是不存在面壁破壁预判这类事的,他们的思维向内向外都是透明的。
地球生物就比他们多了一种乐趣,“你猜——你猜我猜不猜——你猜我猜你猜不猜”,“口是心非”,“口嫌体直”,“我预判了你预判我的预判”。
预测和预判在日常生活中经常遇到:
天气预报、地震预警;
大行调高调低预期;
这会儿普京和谈了什么;
今晚美联储议息要拿出什么结果,全球要怎么应对这个结果;
排队的时候哪条队列会更快;
高考结束报哪个专业未来发展会更好;
谈判时对手的底线在哪里;
吵架时下一句说什么会让对方更吃瘪而自己更爽;
……
我们时时刻刻都生活在上一秒的结果和下一秒的前提中。
博弈的基础是合作。博弈讨论的问题是合作过程中责、权、利的划分。
零和博弈中 ,每个博弈参与者选择一个行动,并根据博弈参与者自己的行动和另一个博弈参与者的行动获得一定收益。且,博弈参与者双方的收益总和为零。
博弈的纳什均衡(Nash equilibrium)是这样一种策略:它们能够使每个博弈参与者的策略在给定其他博弈参与者策略的情况下是最优的。存在一个唯一的均衡策略,那就是,博弈参与者都以相同的概率在 几个行动之间进行随机化 。
随机化策略的最优性,对策略互动环境中的行为有很大的意义。
体育运动是零和博弈:一方获胜,另一方就要落败:
在点球大战中,一名前锋希望在瞄准球门左侧与球门右侧之间进行随机选择;
在网球比赛中,发球方要随机将球发到内角或外角;
在足球比赛中,进攻方希望在跑动与传球之间随机选择;
在所有这些比赛中,对战双方都倾向于随机化自己的行为,使对手无法对自己进行预判。
一个优秀的玩家会随机地虚张声势。如果他一直虚张声势,对手就会了解这种策略,他就会落败。例如美国近几年历次贸易谈判前都习惯对谈判对象进行制裁,这种非随机的行为在博弈论的语境下,并非最优策略。
序贯博弈中 ,博弈参与者按照某个特定的顺序取行动。由此,可以用一棵博弈树(game tree)来表示一个序贯博弈。博弈树由节点和边组成,每个节点对应于博弈参与者必须取行动的时刻,该节点的每条边分别表示可以取的某个行动。在博弈树最末尾的分支上,我们写下相应行动路径的收益。
在市场进入博弈中,有两个博弈参与者:拟进入者和现有企业。
如果拟进入者选择不进入市场(博弈树的左侧分支),那么它的收益为零,现有企业的收益为5;
如果拟进入者决定进入市场,那么现有企业必须做出选择:是接受新进入者,同时自己的收益从5下降为2,还是发动与新进入者的商战,但这会导致自己的收益变为零,同时令新进入者的收益为负。之所以设这种情况下新进入者的收益为负,因为它必须为进入市场付出一定的成本。
在序贯博弈中,策略对应于每个节点处的行动选择。设现有企业在发现有新企业进入时决定发动商战。那么,如果拟进入者知道这一点,就不会选择进入,因为这种情况下进入会产生负收益。这个行动序列——拟进入者选择不进入、现有企业在拟进入者进入时就会发动商战,是一个纳什均衡。
然而,这并不是唯一的纳什均衡,也不是最有可能出现的结果。拟进入者选择进入市场,现有企业决定接受(不发动商战),这是第二个均衡。
这个博弈在重复进行时会变得更加有趣。试想一下,现有企业也可能存在于许多个市场中。也许它是一家连锁企业,在几十个城市都有门店。再设存在一系列的拟进入者。那么,这个企业将陆续地进行一系列市场进入博弈。
“黑天鹅”描述了令人的认知、视角和理解发生巨大变化的不可预测的,它的存在是不应该改变认知或公认的知识的,因为这只是异常值而已,只是令人意识到可能性的存在,但大多数黑天鹅都不值得在日常生活中纳入考虑。
举一个简单的例子,我们得知闪电击中了附近一棵树,可能会感到害怕,想要给房子装上避雷针。但这样的一次件是否应该影响到你的生活方式,让你每逢下雨都躲在屋内,随时随地拿着一个金属屏蔽罩,或者搬到像沙漠一样干旱无雨的地方呢?这是否意味着我们都应该像流浪汉一样,在地下生活呢?答案是否定的,这件事不应该产生这样的影响。
黑天鹅具有三大特性:
特征一: 具有意外性 。发生的事必须是完全不可预测的。观察者不可能提前预见到。
特征二: 产生重大影响 。黑天鹅一定会带来灾难性或巨大的后果,无论是对实体、结构,还是情绪方面的影响。
特征三: 人们在事后为它的发生编造理由 。在黑天鹅首次发生后,受影响的人可能会寻找“错过的蛛丝马迹”,或者事后诸葛亮,解释说人们本来应该可以预见到的发生。这个特征就是我们遇到的麻烦所在。黑天鹅可能会产生全方位严重性的影响,迫使人们的信念或个人认知发生重大变化。
根据此特征判断 “肺炎疫情是否属于黑天鹅?”
结果是否定的。
第一个特征:肺炎可预测,因为全球气候变化,气温上升,生态遭到破坏,南极北极冰盖融化等问题,大型传染病发生的可能性也在不断上升。甚至, 自2019年1月起,美国至少有组织地进行了两场以上公共卫生安全方面的演习,都是以出现新型引发流行病为模拟情景。这场灾难是有人事先预测到的。
第二个特征:肺炎产生了重大影响,符合特征。如我们所见,不再赘述。
第三个特征:全球范围来看,这次的大流行,尚未对人类的认知带来太大的影响。重视防疫的依然重视,认为是的依然如此相信,靠着恒河水和牛尿治百病的依然这样治疗。不然呢?如果人们的信念和认知早早改变,疫情应该早就控制住了。
人类知道这种事情会发生,会很严重,但依然没有阻止它的发生和发展。
让自己想一下最坏的情况,但还是要回到现实。这件事再次发生的可能性有多大?在多大程度上只是异常值?合理地说,我们有什么办法吗?如果这必然会不时发生,我们应该为此改变自己的做法吗?如果我们10年里会遇到几次闪电,是否值得为此升级改造你的整个运营设施和房子?换言之,你是否应该因为听到朋友出了,就不再开车呢?
你在做明智的规划时,应该了解风险因素,但必须是准确地了解。生活充满了风险——我们每天过马路就是在承担风险,但生活还是要继续。你不应该活在对黑天鹅的恐惧之中,而是要花一点时间考虑这些可能会怎样发生,到时你需要怎样做。
做出大部分预判时,不需要把“黑天鹅”放进考虑的篮子里。
与“黑天鹅”相对应的是“均值回归”的概念。
均值 ,基本上类似“平均数”:是一个中点,代表着常态,是一个代表性数值。在我们的定义中,均值意味着特定情境中通常或最常见的状态。
均值回归 ,是在受不同状况或变量(例如环境、情绪和纯属运气)影响的一连串中,异常之后通常跟随着较为普通、典型的。因此,反常、异常或非典型的发生后,多半不会有规律地再度发生,更有可能回归的模式是“常态”。
均值回归会出现在生活的方方面面。一对恋人刚开始在一起时,会对对方痴迷不已,对这段关系充满乐观,这称为“蜜月期”,充满了刚坠入爱河的甜蜜。但不要以为这样的爱意和痴迷能够真正代表这段关系。双方的爱意很快会回归到可持续的正常状态——这才是可以预期的真正的爱。这时你才知道,这段关系是否只是荷尔蒙分泌的产物。
如果你是篮球运动员,长期以来的投篮命中率是40%,这就是你的均值。如果你最近一场球的投篮命中率是50%,这并不代表你的球技突飞猛进了,因为你最终还是会回归均值。看似规律的异常值或偏差可能会误导我们。
这个思维模型表明,你应该静观其变。如果有极端发生,等着看一下恢复情况。如果有意外或不可预测的发生,等着看一下后果。如果出现了一阵风潮,等着看一下这阵风潮过去以后会发生什么事。
观察整个周期的变化,评估在这期间遇到的所有信息。不要因为发生了异常的大事,就突然调整或改变。保持耐心,等待回归正常状态,届时你才能更好地掌握发生了什么变化。从统计学上来说,多半不会发生多少改变。
要纵观全局,一大关键在于明白事物之间何时是有关联性或相关性的,何时是毫无关联或毫不相关的。我们倾向在明明不存在因果关系的情况下,编造出因果关系。
在掌握信息足够充分的情况下,用均值进行预判。
贝叶斯——就是根据实际计算概率,预测未来。
尽管我们预测未来的能力糟糕透顶,但我们还是会去尝试。有时候,我们渴望就未来会发生什么事寻求保证,依赖媒体上的“专家”意见,这些专家无畏地上电视和电台节目,发表对明天、下周或明年会发生什么事的“专业”看法。
问题在于,这些专家预测未来的能力并不比我们强多少。想一下在过去25年里发生的所有重大意外——最重大的那些多半是没有人预料到的,尤其是那些屏幕上靠预测谋生的分析师没有预料到的。他们的作用只是提高收视率,让人暂时对未来至少比较安心。
但无论如何,他们的预测通常是错误的。努力了解不久的将来会发生什么事,成了凭空猜测,而不是真诚地努力预测。
贝叶斯定理谈的是概率,因为当然没有什么是肯定或不可避免的:如果A发生了,而A与B相关,那么你就可以推出B发生的实际概率。
P(A/B)是指在B发生的条件下, A发生的概率。 A是求解的对象,是你想要预测的。
P(B/A)是指在A发生的条件下, B发生的概率。
P(A)是指A发生的概率,不考虑任何B方面的因素。
P(B)是指B发生的概率,不考虑任何A方面的因素。
你只需要三个数字就能够得出某件事在未来发生的大致概率。你需要A发生的概率,B发生的概率,以及在A发生的条件下、B发生的概率。
龙卷风是罕见的(概率为1%),但大风是相当常见的(10%), 90%的龙卷风会导致大风。你想知道如果刮起了大风,发生龙卷风的概率。
由此得出,在刮起大风时,发生龙卷风的概率是9%。
无论是无关紧要的小事还是足以改变一生的大事,很多都适用于这个公式。贝叶斯公式是一个强大的工具,因为这个公式实际上让我们单凭少数的变量,就可以量化不确定性和确定性。这个公式模拟了我们通常只会事后进行的现实生活分析,所提供的信息有助我们理解现实。
毕竟,数据不会说谎。
这个公式让我们可以滤除装有影响力的噪声,专注于真实而又重要的方面。
虽然一切都是不确定的,但比你想象的更加确定。
贝叶斯选择停止设。