下载
登录/ 注册
主页
论坛
视频
热股
可转债
下载
下载

徐生章生之囚徒困境

10-01-09 20:22 8065次浏览
ralph2007
+关注
博主要求身份验证
登录用户ID:
囚徒困境,这个是非零和博弈中的经典问题。两个囚徒单独接受审讯:

“现在如果你保持沉默,我们可以关你一年,但是,如果你承认有过贩毒,并且供出你的同伙,就可以免除对你的监禁,你的同伙将被判10年。但是如果你们两人都承认罪行,我们就不需要你的供词了,你们二人都可能面临5年的监禁。”

很显然,如果两人都保持沉默,两人都将获得1年最短的刑期,合起来只有2年。两人有一个人认罪,另外一个沉默,那么一个会判10年,另外一个会免罪,加起来是10年。而两个人都承认的话,2个人各面临5年监禁。

面对审讯,两位囚徒会做什么呢?每个囚徒都有两种策略,承认或保持沉默。两人的刑期取决于他们所选择的策略,以及他同伙的策略。按照博弈论,无论另一个囚犯采取什么策略,坦白交代都是他所遵循的最好策略。反过来,第二个囚犯也面临着同样的选择,他的推理与前一人完全相似,无论前个囚犯怎么做,只要他自己坦白了,就可以减少呆在狱中的时间,也就是说,他也必须这样考虑问题:坦白对自己来说是最好的策略。事实上即使他们之间有了“打死也不说”的协议,一旦被分别审问,利己的逻辑就会发生作用,并使他们坦白交代。这个结果是一个平衡的结果,可从整体来看却不是一个最优策略。

这是一个只有1局的囚徒困境。而假如将囚徒困境的情况进行有限次呢?结果其实一样,就算他们前几局达成了默契都选择沉默,他们迟早都会交代,只要他们知道哪一局是最后一局。

但如果我们不断重复,而又无法确认重复的次数时呢?如何的策略才是对个人最优的策略呢?股票就是这样的情形,当你每天都是在隔日交易追涨停买入一个股票,而你的交易对手也在当天涨停追入同一个股票,第二天用如何的策略才是对个人最优的策略呢?这个才是我写这篇文章想阐述和讨论的重点。

类似的问题已经有长达20年的计算机模拟比赛。比赛出来的较佳确定性策略是”以牙还牙“。这个策略是在重复博弈的开头采取沉默,然后,采取你的对手前一回合的策略。一个变种是”宽恕地以牙还牙“,当你的对手认罪,在下一回合你无论如何要以小概率(1%-5%)时而沉默一下。这是考虑到偶尔要从循环认罪的受骗中复原。这意味着有时你的动作被错误地传达给你的对手:你沉默但是你的对手听说你认罪了。通过对这样的最佳策略的分析,得到以下策略成功的必要条件:

友善
最重要的条件是策略必须“友善”,这就是说,不要在对手认罪之前先认罪。几乎所有的高分策略都是友善的。因此,完全自私的策略仅仅出于自私的原因,也永远不会首先打击其对手。

报复
成功的策略必须不是一个盲目乐观者。要始终报复。一个非报复策略的例子是始终沉默。这是一个非常糟糕的选择,因为“下流”策略将残酷地剥削这样的傻瓜。

宽恕
成功策略的另一个品质是必须要宽恕。虽然它们不报复,但是如果对手不继续认罪,它们会一再退却到沉默。这停止了报复和反报复的长期进行,最大化了得分点数。

不嫉妒
最后一个品质是不嫉妒,就是说不去争取得到高于对手的分数(对于“友善”的策略来说这也是不可能的,也就是说“友善”的策略永远无法得到高于对手的分数)。

结论给人乌托邦的感觉,那就是自私的个人为了其自私的利益会趋向友善、宽恕和不嫉妒,友善的家伙能先完成交易。

将此映射到我们之前提到的股票超短策略。我们当然希望买入时候能够买到足够的筹码,也希望第二天或者第三天能够在尽量高的高位出掉。但问题是:

1. 在我买入的时候,买得多了,想吃独食,第二天别的游资就会有顾忌,怕给砸死,不敢接盘。这样我就无法顺利出货。
2. 如果我涨停买少了,撤单了,可能引出抛盘,导致封不住涨停,更导致第二天直接低开,可能会亏损。如果其他游资帮忙封住了涨停,为了兑现利润,第二天更要比赛谁跑得快。

3. 在我卖出的时候,我考虑第二天一旦有资金拉高就直接大幅挂低一个价格出。这样结果是我能顺利兑现,但是接盘资金被砸死,以后就没人敢陪你玩了。
4. 为了让接盘资金能尝到甜头以后继续帮我接盘,我不得不考虑自己买入的第二天暂时不出。但是这样也会导致这批接盘资金想在我第三天出之前先出,而直接导致低开,降低了我的利润率。

以上只是考虑了一些简单的情形。在处理这些情形的时候,徐生章生是采取什么策略呢?我们有没有看到以上提到的几个品质呢.
打开淘股吧APP
15
评论(57)
收藏
展开
热门 最新
圣塔菲

11-05-02 20:28

1
徐章采取的策略可能是不自觉的,就象坛中一个高手所言:”把形态做得好看点,再出货“,久而久之,这成了一种规则,这个规则被更大的系统所支持,凡不尊守这个规则的玩家将被淘汰。
我们所要思考的是,这个更大的系统会鼓励和支持那些规则。
强者恒强,诚然是一个。
但也留下了一个由弱转强的后门。
我们相信存在这样的一个后门,也相信自己能找到这样一个后门,象黑客帝国中莫菲斯说的,锡安必由信念之门得救。
诸神de黄昏

11-05-02 20:10

0
投机市场,囚徒困境的说法好像起因于熊市里的抱团取暖,试想,如果大家都不抛,股价就能守住并维持暂时的平衡,很多基金经理喜欢抱团取暖,聪明点的不陪你们玩了,我先冲出去,同盟瓦解,高空瀑布,把其他人套在高位。

本帖的很多内容出自它处,纳什均衡,诺贝尔奖,说书生气的坛友大约是没有这方面的阅读和理解。
对自己最佳的策略最后的效果往往并不好,如贴里说的例子,大家都采用最佳策略的话,得判5年,能看明白什么是最佳策略的再来发表点看法比较好,:) 。

善意策略是牺牲自己的策略,事实上这确实是对团体最有利的策略。

往往一些基本面好的品种要过几个周期才被大众认识到它的价值,然后向上,再然后疯狂,以中线角度注重价值分析的投资人其实扮演的就是善意投资的策略,短期看来是吃亏的,中长线未必。

股票市场,参与的人懂得采用对自己最佳策略的人已经很少了,采用善意策略的就更少了,多数都是跟风或随机运动。与其思考这样的命题,不如从索罗斯的反射多一些思索,当然所有的思索从实践中来才有价值,否则就是空中楼阁。

徐章得策略我以为不会那么复杂,行情好博到尽,这个大资金有优势,你不可能把每个市场的参与者都看成等价的,徐章好比正规军,有组织有纪律,散户好比游兵土匪,虽然游兵数量十倍百倍徐章,但互相拆台,都是随机的苍蝇,被正规军牵到走,涨停板点火就是他们策略的最好演绎,要想把他们拖入囚徒困境,难,他们总是第一个脱离战场,所以根本不用思考这个命题,需要思考这个命题的多数是仓鼠很多的那些资金,比如部分基金。

解释很清楚了,还看不懂的坛友表动不动举“等你有那么多钱”的大棒子,人和人有时候是不平等的,比如智商,我很后悔这辈子没好好读书,否则比赌博好玩的领域多了去了。
圣塔菲

11-05-02 17:40

0
第一层次,建立并改进自己的交易系统。
第二层次,关注并琢磨他人的交易系统。
第三层次,在不同交易系统的重复博弈中,找出均、优与劣解。
第四层次。。。。。。。。。。
楼主已进入第二层次,向第三层次靠拢。
关注。。。。。。。。。。。。。
七分等待

10-05-30 13:54

0
推荐,学,收藏。
小牛一刀

10-05-30 12:45

0
先解决自己的困境吧,心理医生
gilbert0709

10-05-30 11:16

0
可惜了,这么好的一个帖子现在才看到!
楼主继续啊,这确实是一个很有实战意义的话题!
喜乐的羊

10-05-29 23:42

0
无油干推!
ralph2007

10-05-29 22:23

0
没有老大,老大是给人用枪打的。
jgy6789

10-05-21 21:05

0
老大,冒个泡啊,还久不见了。
zhangyijie

10-04-26 14:10

0
就是成功的引领市场合力往一个方向,
我印象最深的就是600026和600030
刷新 首页上一页 下一页 末页
提交