考虑一个双方具有完全一致策略侧重点的博弈.
所以完全一致策略是指对于一个行为的评价函数一致.
也就是对于同一情况具有同样的决策选择.
即某种意义上的完全"理性"的"可确定性"的情况.
那么这种情况下的博弈是可预测的么.
并不一定.
因为决策函数可能并不是一个确定性的函数.
而是觉有某种随机性/随意性.
这样的话,在给定条件constrain和objective的情况下,并不一定存在确定的求解路径.
因为每个条件分支的概率分布觉有不确定性,从而是得代价计算具有不确定性.
即对于一个策略没有对应的稳定的评估函数.
于是一定传统意义上理性假设并不一定能带来预期上的所谓最优解的存在.
换个角度想.
所谓的理性假设不过是在某种特定的"世界观"之下,对于一个行为回报的解释函数相一致的问题.
也就是在给定constrain C的情况下,A基于某种策略对B进行predicate的时候,跟B对自身进行predicate的结果具有一致性.
类似地,不理性的情况即使predicate函数存在不确定性或者说不存在.
那么,合并一下的话,理性就是不理性的一种情况.
即后者的predicate的不确定性是0%的一种特殊解.
这样的话,一个泛化的描述就是对于一个博弈而言,以其中一个参与者的立场来说的话.
它的cost function是一个概率性的函数.
而这个概率性函数的性质要么是有某种确定性的概率分布.
要么是一个不确定性的函数分布.
前者因为确定性,在重复的情况下存在一个确定的预期收益.
而后者因为不可重复性,带来是完全的随机性的收益,从而是的决策不具有收益函数支持的确定性特征.
于是对于后者来说就不存在所谓的最优解.
或者说给定一个条件下的一个dominated的strategy是不存在的.
发过来用这个来定义所谓的irrational的话呢?
比如当你喜欢一个人或者喜欢一个事物.
然后投入不可理喻的时间和精力的情况,改如何解释呢?
之前的一个思路是在一个rational的valuation函数之上加一个bias.
也即是隐含假设存在一个确定性理性决策的情况.
换成非确定性,也即是概率分布的情况的话.
实际的行为就是某种概率区间内的解的具体体现而已.
而如果用非确定性的概率分布来解释的话,就纯粹是whatever happened,happened的meaningless了.
从相对没有那么悲观的角度来说的话,认为实际是有某种概率性分布的话,理论上还是存在一种可计算可能的.
毕竟,这种概率决策树虽然无限拆分,但总归存在某种可描述的模式.
兴许还是存在可解的情况的.
没有评论:
发表评论