
博弈论读后感
当仔细品读一部作品后,你心中有什么感想呢?现在就让我们写一篇走心的读后感吧。那要怎么写好读后感呢?以下是小编帮大家整理的博弈论读后感,仅供参考,希望能够帮助到大家。
博弈论读后感1我阅读的书是《博弈论教程》,王则柯、李杰编著,中国人民大学出版社。此书一共分为九章,我自学了前七章,总结了一下学习心得。
博弈大致有以下两种分类:按照博弈各方是否同时决策可以分为:同时决策博弈(静态博弈)、序贯决策博弈(动态博弈)、同时决策博弈与序贯决策博弈的混合博弈。按照大家是否清楚各种对局情况下每个人的得益分为:完全信息博弈和不完全信息博弈。自由组合一下啊,就会发现博弈的四大部分:完全信息的静态博弈、不完全信息的静态博弈、完全信息的动态博弈、不完全信息的动态博弈。
同时决策博弈
纳什均衡:局中人单独改变策略不会得到好处的对局即策略组合,就是纳什均衡。设 是 人博弈 的一个策略组合。如果对于每个局中人 , ,对于所有的 都成立,则我们称策略组合 是该博弈的一个纳什均衡。
优势策略有严格优势策略和弱优势策略之分,可以用严格劣势策略逐次消去法寻找纳什均衡。相对优势策略可以利用相对优势策略划线法或者箭头指向法寻找纳什均衡。
混合策略纳什均衡
对于有时候纳什均衡不是唯一的,有时候纳什均衡是不存在的,按照上述方法寻找博弈的结果有时候不能实现,所以需要展开纳什均衡。
混合策略与纯策略的区别在于,混合策略是局中人可以按照一定的概率,随机的从策略组合中选择一种纯策略作为实际的行动。
混合策略:有一个有N个局中人参与的策略式博弈 中,假定局中人 有 个纯策略,即 则概率分布 ,其中 , ,称为局中人 的一个混合策略,这里 表示局中人 选择纯策略 的概率。
混合策略纳什均衡:是指给定对方选择该相对最优混合策略的条件下,能使局中人自身的期望支付达到最大的混合策略,必须满足的条件如下:
1 ,对于任意的
2 ,对于任意的
利用反应函数法和直线交叉法,寻找同时决策有限博弈的混合策略纳什均衡。当存在多重纳什均衡时,需要用帕累托优势标准或者风险优势标准来筛选。
帕累托效率标准:经济的效率体现在配置社会资源以及改善人们的情况,主要看资源是否被充分利用,要想再改善某个人的利益,就必须损害其他局中人的利益,这时候就说一个经济已经实现了帕累托效率,相反,如果还可以在不损害别人的情况下改善任何人,就认为经济资源尚未被充分利用,就不能说经济已达到帕累托最优。
序贯决策博弈
序贯决策博弈的一个重要特征是总有一个局中人率先采取行动,因此衍生出先动优势和后动优势。先动优势:虽然双方都得到好处,但是先决策先行动的一方得益多一些(比如情侣博弈)。后动优势:虽然双方都得到好处,但是后决策后行动的一方得益多一些(比如分蛋糕、产品定价)。在这一节中,要准确把握了“先动优势”和“后动优势”的概念,摒弃“先动者得益大于后动者得益即为先动优势”和“后动者得益大于先动者得益即为后动优势”的观念。
利用倒推法寻找序贯决策博弈的纳什均衡。
同时博弈与序贯博弈
子博弈:在一个 人展开型博弈 中,满足如下3个条件的一个博弈 ,称为 的一个子博弈:(1) 的博弈树是 的博弈树的一支;(2)博弈 不能分割博弈 的信息集,具体来说,只要博弈 的某个信息集的任何一个决策节点是博弈 的一个决策节点,那么博弈 的这个信息集的每一个决策节点都必须是博弈 的决策节点;(3)博弈 的末端节点处的支付向量,与博弈 在这些末端节点上的支付向量的有关部分重合。
重复博弈和策略性行动
子博弈精练纳什均衡:令 表示阶段博弈, 是 重复 次的重复博弈, ,如果 有唯一的纳什均衡,那么重复博弈 的唯一的子博弈精练纳什均衡结果,是阶段博弈 的纳什均衡重复 次,即在每个阶段博弈出现的都是一次性博弈的那个均衡结果。
对于无限次重复的囚徒困境博弈,存在触发策略,两个著名的触发策略分别是冷酷策略和礼尚往来策略。冷酷策略:指双方一开始的时候选择合作,然后继续选择合作,直到有一方选择背叛,从此永远选择背叛,这个策略之所以冷酷,是因为任何局中人的一次性背叛将触犯永远的不合作。礼尚往来策略:开始的.时候和冷酷策略一样,即双方都选择合作,在以后的每个阶段,如果你的对手在最近的一次博弈采取合作策略或者在最近联系k次策略中都选择合作策略,则你继续合作,如果你的对手在上一个阶段的博弈中采取背叛策略,则你在下一阶段博弈中采取背叛策略报复,或者在以后k次策略中选择背叛进行报复。
对手是否采取背叛策略,取决于有效收益率 。
零和博弈
零和博弈又称“零和游戏”,与非零和博弈相对,属非合作博弈,指参与博弈的各方,在严格竞争下,一方的收益必然意味着另一方的损失,博弈各方的收益和损失相加总和永远为“零”。双方不存在合作的可能。
寻求二人零和博弈的纯策略纳什均衡,可以采用相对优势策略划线法,也可以采用最小最大法,最小最大法依托的思想是:局中人在进行零和博弈时对他们自己去得好结果的机会报“悲观”的态度,行局中人采用maximin的决策原则,列局中人采用minimax的决策原则。此方法只是用于零和博弈的纯策略纳什均衡。
博弈论读后感2最近,我读了一本关于博弈论的书。从中,我学到了很多关于人类决策行为的奥秘以及如何在竞争中获得胜利的策略。博弈论概念的应用范围广泛,不仅限于经济学领域,而是可以在生活中的所有方面都有用武之地。
在这本书中,我了解了博弈论是什么,以及它为什么在决策分析中如此重要。博弈论是研究人类决策行为的一种学科,其核心观点可以归纳为“我所做的和别人所做的如何相互作用和影响”。博弈论的目的是通过分析各种不同情境下的决策选择来确定最佳策略,以最大限度地提高自己的利益。
我也学到了博弈论在生活中的实际应用。在现实生活中,博弈论是关于人们如何在决策中竞争和合作的学问。例如,在竞选活动中,一位候选人面临的决策不仅考虑自己的竞争者,还要考虑投票者的决定,而这些投票者的决策往往取决于不同的情况。因此,候选人必须制定策略,以增加他们的胜算,从而在竞选中获得胜利。
另外一个博弈论的应用是在商业领域。企业也需要考虑其他竞争对手的'决策,并且需要制定出最优策略来增加自身市场份额。博弈论的概念可以应用于制定营销策略、产品定价以及竞争战略等方面。
除了经济学和商业领域,博弈论还可以用于其他方面。例如,在司法领域,律师需要考虑其他方的决策,以指导他们的客户制定决策策略。在国际关系中,博弈论也可以应用于国家与国家之间的谈判和协商。
最后,在学习博弈 ……此处隐藏8744个字……(
网络的外部性也不是坚不可摧的,至少在计算机领域,计算机产品的快速淘汰会限制网络外部性的好处。如果你的公司开发了一种新的计算机,而且不想使用现有的软件,但是你能够让软件公司相信你的计算机能够一炮走红,他们就会愿意编写新的软件让你的计算机使用。另外,技术的快速进步带来的向后兼容性问题也会对目前的领先者造成挑战。兼容性的要求使得微软和因特尔的产品非常的臃肿,而新的进入者反而没有这些的束缚,因而可以提供更小巧灵活的产品。看起来向后兼容性像是一个幸福的烦恼。
博弈论读后感14“博弈”这个词我们经常在新闻中听到,但是对我们普通人好像又是很远的事情。是这样吗?让我们看看下面的情况吧。
你想谈一场恋爱了,这时正好也有一个你欣赏的男孩出现在你面前,这时你就出现了两种选择,你是全情的投入自己的感情去爱呢?还是抱着玩乐的心态去敷衍,等着男孩全情的投入感情来爱你呢?其实这就是一场博弈,和你恋爱的对象的一场心理博弈。你无法确定男孩是真的爱你,还是在玩弄你的感情。这其实就是囚徒困境的情形,囚徒困境下可能出现的结果有三种。
一、就是你爱他,他也爱你,皆大欢喜。这也是帕累托最优的情况。
二、你投入感情爱他,他却在玩弄你,或者他投入感情爱你,你却在玩弄他。这是你们自己都选择的压倒性策略,保证自己的选择不受伤害,但对方都受到了伤害,这种关系也就维持不下去了。
三、你玩弄他,他玩弄你。这种关系是最没有感情的,虽然可以一直维持下去,可以又有什么意思呢。在保证自己不收伤害的情况下,不投入感情是自己的最佳方案,但对方也一样会选择这种方案在这场博弈中可以达成纳什均衡,可以稳定发展,但这显然不是我们所要的'方案。
所以还是要对学点博弈的知识,在这次博弈中加入其他的砝码,增加对方选择玩弄感情的惩罚成本,让对方选择投入感情才是最优方案。打成混合策略的纳什均衡。比如,可以让对方把这段感情宣之于众,让大家都知道,如果对方背叛,就会受到对方身边人的谴责,增加对方背叛的人格损失成本。又比如让对方送自己一下小礼物,即可以让对方表达爱你又可以增加对方背叛的经济损失,等等。只有做的混合策略下纳什均衡,这种均衡才能稳定下去。当然,任何稳定都是相对的稳定,在有新的情况出现的时候,我们也需要有新的应对策略,这才是博弈论的精髓,不断的在演化过程中进行博弈。
所有的恋爱关系都是博弈关系,很多博弈的策略也在恋人之间使用着。而且不止在恋爱关系中,在我们的身边的社会经济生活中,博弈也是无处不在的。反而博弈论的理论出现的却很晚,直达1928年,冯·诺依曼才证明了博弈论的原理,宣告博弈论的正式诞生,但博弈论的各种观点却也是在总结前人的经验的基础上提出的,是我们一直在应用的一些方式方法的升华总结。博弈论的提出使得我们的使用策略都有了理论基础,在博弈环境中有了更好的应对方法,有了更有效的工具。
万维钢的这本《博弈论究竟是什么》,可以说是一本关于博弈论的科普读物,他省去了哪些繁复的数学算法,让我们每个人都可以读懂,明白博弈论的基本概念,了解其基本原理,掌握其基本方法。在读了这本书之后,我们在生活中就可以用博弈论的思维来处理或看待身边的事情,很多社会现象就会让我们理解的更明白,做事情也就更简单。
这本书是网络专栏文章的整理,因此更加的贴近生活。而且引用了大量的网友提问的回答,给出了很多社会现象的博弈论方面的解释,让我们读起来兴趣盎然。而且这本书的尺寸设计正好可以装在口袋里面,让读者可以随手携带,方便的时候拿出来第一段,即是消遣又能增加知识,何乐而不为呢?正所谓“开卷有益”啊!
博弈论读后感15近日整理书橱时,我偶然看到了在东北财经大学学习研究生课程时所学的《博弈论》这本书。当时我们很幸运,学院特意选了东北财经大学优秀教师 史永东 教授来讲授这门课。 史 教授是当时东北财经大学最年轻的教授(时年 35 岁, 32 岁时就破格晋升为教授),他把 一门很深的学问给我们讲得惟妙惟肖,非常生动。直至今日随手翻阅时,仍能清楚地记起他讲课时激情洋溢的风采,但如今重新阅读这本书却有了不同的感受,当时是为了掌握其中的理论,现在则可以比较从容地去体会其中的道理了。
博弈论是一门很深的学问,主要研究个体如何在错综复杂的相互影响中得出最合理的策略,其应用的领域也非常广,最通常的应用该是经济学吧。这本书中的理论很深奥,其数学模型的推导更是复杂,然而书中的案例却既浅显又生动,很值得一看。现在拿出一个例子来,和大家一起分析其中的道理、分享其中的趣味。
这个例子是“智猪博弈”的故事,讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的`。规则的核心指标是:每次落下的食物数量和踏板与投食口之间的距离。 如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。
改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。
改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。
改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。
这个故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。
书中还有很多例子,并进行了分析,我们都能悟出些道理。所以读的时候会有一个感觉,那就是先有事实,后由理论。也就是我们常说的理论来源于实践。感觉就像是先有这个社会现象,然后才有这个理论去分析,这个理论套在这个社会现象上恰好合适。



