大概去年4月份的时候吧.
当时还在某卖保险公司.
接到个猎头电话,问能不能谈下某司跟某司的情况.
说手上有个候选人有这两家的offer,刚好在linkedin上看到在这两家都呆过.
所以想详细了解下.
想了想,应该是一个开始在Linkedin然后通过Google+/handout/Twitter问了微信和电话才有了以上的.
不管怎样,大概就是有了这通电话.
电话那头听起来就是一个明显刚毕业或者工作不久的 妹子声音.
有略微明显的情绪升降带来的语调细微 起伏,以及若有若无的 生涩感.
不像一些工作多年的人,听起来积极健康不卑不亢而略显空洞.
内容大概就是问两家公司的环境氛围之类的.
频率比较高的"一个朋友如何如何,觉得这样但又怕那样"的摇摆不定的选择鼓励.
当时的一个印象大概就是刚毕业的妹子做猎头,然后帮男朋友问工作背景帮做决策的感觉.
觉得还蛮有趣的.
也就是顺着"你朋友"如果是如何如何的话,A公司是怎样,B公司能怎样之类的对了起来.
大概就一个午休的时长.
末了礼节性地问是不是最近想换工作,因为看twitter timeline有类似表达.
当时在 某司虽然才一两个月,不过恶心的事确实不少.
加上当时也没现在这么无所谓,于是也礼节性地麻烦留意.
挂了.
便算一段落.
过两天接到小猎头的电话.
还是之前那些问题.
再就是问认不认识某司的某人之类的.
大概是觉得人好,可以套话吧.
想想前面从基本渠道拿到联系方式,倒也是个有思路的会灵活变通的人.
一来当时在职,也确实时间不长,只是知道也谈不上说认识.
二来也算避嫌,便没有深入谈下去.
也算回避了正面回答.
后来一些有的没的,说要请吃个饭,算感谢.
出于宅和懒惧于社交,也就说不用了吧.
忘了是当次后续还是后面还有另外个交流.
总之,大概也就是答应了.
可能约了五,六月份的某个周末.
见了个面,边走边聊.
从某司的一些情况到工作的琐碎和吐槽再到私人的一些状况.
大概就是她问此大的被动应激模式.
算略活泼和外向的一个妹子.
毕竟能这样撑一下午.
晚上吃饭的时候开始爆情史和感情观.
礼尚往来地,也就谈了谈9点20的故事和一些感受想法.
末了,虽然名义上是她要请客吃饭.
不过礼节上来说还是先买了单.
于是回地铁的路上又基于此展开了一些所谓男女思维差异之类的对话吧.
分别的时候说有空去找她玩啊.
笑笑说不觉得自己无聊的话.
不会呀.
就此别过.
某个周末想起这段话.
又想起了9点20.
问自己到底还在意不在意呢.
要不要约约看呢.
也算是了了件事.
于是问要不要看个电影.
答曰好.
就看了.
完了她说想去海边走走,便去着.
然而走错路,便晃悠了一圈.
回去了路上说要要把上次的饭前和这次的开销AA回来.
笑了笑说不用了.
推脱再三,心想分寸感还是挺强的,便说随便吧.
也算收到了可能是第一笔微信转账还是红包吧.
后来便是会问一些某司的情况和联系方式等.
出于职业道德,也就不方便多说什么.
想,大概就是当成一个活查询入口了.
某种程度上来说,也算毫不掩饰地坦白过头了.
接着的日常大概就是忙着想如何离开某司.
从一个火坑跳到另外一个火坑.
至于某天也终于更新了Linkedin.
想着当时帮进某司的某猎头也算把自己从无业游民的道路上拉了回来.
而自己连试用期都没呆满就跑了,于情于理对于他来说都太好.
尽管以自己的收入来说,对对方的佣金也造成不了多少损失就是了.
但请吃个饭应该还算必须.
虽然想到要两个人尴尬地吃还是有些头皮发麻.
于是,还是硬着头皮邀了约.
还好对方也答应了.
小猎头大概是看到状态更新通知便来问了问.
聊的时候提到了上面那位,便问能不能一起吃介绍她认识.
可以晚些到,说就是妹妹一起蹭吃的.
想了想,还挺拼的.
一来她不怕尴尬.
二来自己也算某种程度上送了口气,毕竟不用想着如何避免空气忽然的安静.
便说了好.
生活的戏剧性大概就在于本来三个人的饭局,当天对方有事,于是变成了两个人.
于是又变成了她谈工作生活倒苦水,这边只管听的局面.
由于地方离海边不远.
也就终于在海边走了走,坐了坐.
聊的时候自言自语地翻着手机问一些意见.
可能是气氛像闺蜜的情况,没知觉地冒出一句亲爱的你看觉得这个如何如何之类的问句.
瞬间的尴尬选择了假装没听到这句回了一下.
后面还是前面又问起了9点20故事的一些点.
可能自己入戏太久,编的感觉太真实倒引起了八卦剧的好奇心的原因.
一边听一边偶尔忽然噗嗤的笑.
大概可能各方面各层面来说挺典型挺有趣的一个故事吧.
心情微妙地好像在跟现任谈前任.
那晚过完的一两个月还是两三个月.
可能每周或者隔周会看个电影吃个饭什么的.
就好像真地在谈恋爱一样.
事实上,可能除了没有肢体接触确实看上去是那么回事.
应该是中秋的时候吃饭.
她问"你觉得现在是什么关系"
"你觉得呢?"
"在问你呀.那换个问法,你觉得男女之间有没纯洁的关系".
"有吧..."
大概就是回避了正面的回应吧.
某种程度上来说,不否认是在当作女朋友相处的.
但用她的话说,也没当是男的看.
大概,可能就是男闺蜜?
虽然说想和喜欢的人kiss之类的.
可能只是喝了点酒的关系.
不过也只能笑笑.
如果没有9点20的经历.
可能会回句要不借你亲下之类的.
毕竟牵牵手就像旅游.
但是没有.
因为不知道有没有/算不算放下.
或者纯粹只是根本不想再主动了.
假如是9点20这么说,至少以上是没有成立的理由的.
所以,除了笑笑还能怎样.
也所以想,能不能认真点.
毕竟小猎头也没什么不好.
差的可能只是自己的态度.
于是11月的时候她生日.
准备了个礼物,上面一个银手镯.
掀开下面是个钥匙卡住发条的星之所在音乐盒.
场景可能是二次惊喜和可能只有自己知道的寓意吧.
或者可能纯粹是把选择丢出去还是求解脱之类的.
大概就是又一次的"该做的都做了,该你了"之类的逃避选择模式.
她收到大概也还是挺开心的.
或者至少回应地挺开心的.
但生活的有趣点就在于,你不确定的事情,并不会因为丢出去了而变得确定.
或者说并不会变得结果显而易见.
后来越小猎头大概就是有各种事脱不开身.
朋友圈偶尔也对应的有各种事件照.
但于己来说,是如何已经无所谓了.
因为很奇怪也可能有些理所当然的有种解脱感.
自己这么做,就好像9点20忽然翻过去了.
小猎头也无所谓了.
就像某种意义上的贤者时间.
忽然的一种"能做的就做咯,结果怎么样其实不关自己事"的心态挥之不去.
也就可能从那时候起觉得无所谓了,有空构造负面不如想想怎么讲段子.
对于9点20,喜欢过或者可以说迷恋过.
但那个她真的是她么,还是喜欢又如何都已经无所谓了.
毕竟喜欢是一个事实,也只是一个单一的事实.
并没有其他什么衍生附加品.
对于小猎头,至少能编造出自己该做的都做了的理由.
就像她自己说的各种别人追她的有趣的事.
至少可以给个理由心安理得.
何况可能只是她当自己闺蜜,自己当她女友游戏的一种微妙的平衡.
事情本来是可以这么简单的.
或者本来就是这么简单.
今年大概跟小猎头接触了4次.
一次过年的时候礼节性地来问候.
后续两次大概就是年中换工作的时候点赞然后吃饭看电影了两次.
还有就是今天还是昨天吧,问要不要爬山.
大概主题就是失眠焦虑,家里催找男朋友,想回广州但深圳又还有留恋的东西.
坦白说,这算不算暧昧,事实是不是暧昧还是纯粹朋友间闺蜜间想倾诉一下.
这根本不重要.
重要的是,自己真地在考虑是不是暧昧这才是问题所在.
而问题的核心在于,自己是真得喜欢她了还是说考虑的是如何选立场面对的问题.
下午爬完山在她家.
依然谈了下这些问题.
然后忽然就觉得自己这样算不算渣男.
毕竟不管事实是什么.
再假设对方又这样心意的情况下,考虑对策的思路都不算是要解决问题.
而是想的如何保持现状.
尤其自己可能只是存粹享受约会这种游戏的情况下.
而不是基于有以后.
晚上她手机碎片.
Apple Store没预约了于是到街边小店修.
等的时候聊天.
更确切得说还是她问自己答的形式.
"心情不好能不能给个拥抱安慰下啊".
笑笑,看了眼转会柜台.
安静了一会,唉.
"好困,能不能靠一下啊".
在柜台挪了过去.
额头贴在右手手臂上.
然后左手翻开了群氓之族.
大概事实不管怎样.
想,已经是这么想了.
2017-11-06
2017-10-18
关于overfitting
中午翻到篇论文,讲模拟人脑神经网络结构的.
其中有个地方提到了一个delay的概念.
大意就是神经网络力有个比较重要的特性就是信号传达的延时.
一个马上的联想就是artificial neural network/ANN.
把某一个粒度的神经网络信号传播延迟考虑一个time frame/tick之类的东西.
那么每一个信号的释放和响应就存在一个t的延时.
对应于ANN就是一个activation delay了几个cycle/batch之后再参与进来.
类比LSTM的话就是类似于
c_t = \sum_i f_i(c_{t-1}*W_i)的形式.
但是拆开来动态一点想的话.
在每一个cycle其实就是一个确定的graph的dataflow的东西.
而不过把不同delay按照某种基本cycle单元分组的话.
也就是做类似周期频率的等价意义的话.
最终的实际dataflow就可以考虑为各种周期的graph形态的dataflow composite而成的.
类似于傅立叶变换.
反过来说,每一个简单的dataflow就代表了某种类似feature或者说决策的东西.
于是把ANN的结构考虑为一组并列的decision tree的形态的话.
每一个cell其实还是类似于某种策略选择.
只不过具体意义是相对隐式的.
那么,如果把已知的一些可解释的描述变量放到一个傅立叶变换里,拟合出对应的参数的话呢?
一种结果可能就是跟样本的多样性有关.
因为毕竟拟合代表是某个集合的summary特征.
除非说涵盖了多数情况,不然overfitting是难免的.
于是一个问题就是表达式的外延性或者说类似out of vocabulary/generalization的问题如何定义呢?
generative adversarial的考虑是negative sampling.
直觉上这是类似于bounding/constrain的做法.
即是定义出一个类似函数边界的东西.
某种意义上来说可以理解为是一种定向的prune.
underfitting的问题可以从拟合的准确度来比较直观地看到.
overfitting本质上来说是过多地capture了training set的一些细微的差异.
考虑实际上是存在一个确定的多项表达式描述预期函数的.
对于一个ture negative的input来说,实际上对于这个具体的表达式而言应该是被接受的.
而拟合函数给予拒绝的话说明从表达构成来说,比真实预期函数多了一些不必要的余项.
形式上来说,regularization/bias是有可能去掉这些项目的.
当并不确切.
因为理论上上说,这个效用只在于不同的拟合之间可以作为一个参考.
在一个拟合内,其实是可以理解为多input的一定程度的transform而已.
实际还是存在某种deterministic的.
如果是一个符合某种分布的区间值呢?
也就是bias是一个每次regression的时候是概率性的有一定范围bound的值呢?
因为服从一个既定概率分布,所以期望应该还是确定的.
对于单个update的收敛性的性质应该不会有什么影响.
对于整体呢?
如果真实的表达式是
G=\sum_i g_i(x)
的话
拟合为
F = G+Bias
->
G = F - Bias
->
G = \sum_i f_i(x) - p_i*bias
从形式上来说,跟不用概率分布是一样的.
所以这也不能用来衡量是否过度表达.
实际上,把negative sampling换个思路理解的话,其实是某种副作用在减少overfiting.
因为包含的bounding约束,可能一定程度上会使得出来的余项相对较小.
如果不能减小的话,说明negative sample里也能capture到这些余项所代表的特征.
因为形式上是
maximize(positive) + minimize(negetive)
->
w*x_n + b_n + n_p
->
reminder = b_n + n_p
reminder不减小的话,就因为这b_n和n_p都有贡献.
其中有个地方提到了一个delay的概念.
大意就是神经网络力有个比较重要的特性就是信号传达的延时.
一个马上的联想就是artificial neural network/ANN.
把某一个粒度的神经网络信号传播延迟考虑一个time frame/tick之类的东西.
那么每一个信号的释放和响应就存在一个t的延时.
对应于ANN就是一个activation delay了几个cycle/batch之后再参与进来.
类比LSTM的话就是类似于
c_t = \sum_i f_i(c_{t-1}*W_i)的形式.
但是拆开来动态一点想的话.
在每一个cycle其实就是一个确定的graph的dataflow的东西.
而不过把不同delay按照某种基本cycle单元分组的话.
也就是做类似周期频率的等价意义的话.
最终的实际dataflow就可以考虑为各种周期的graph形态的dataflow composite而成的.
类似于傅立叶变换.
反过来说,每一个简单的dataflow就代表了某种类似feature或者说决策的东西.
于是把ANN的结构考虑为一组并列的decision tree的形态的话.
每一个cell其实还是类似于某种策略选择.
只不过具体意义是相对隐式的.
那么,如果把已知的一些可解释的描述变量放到一个傅立叶变换里,拟合出对应的参数的话呢?
一种结果可能就是跟样本的多样性有关.
因为毕竟拟合代表是某个集合的summary特征.
除非说涵盖了多数情况,不然overfitting是难免的.
于是一个问题就是表达式的外延性或者说类似out of vocabulary/generalization的问题如何定义呢?
generative adversarial的考虑是negative sampling.
直觉上这是类似于bounding/constrain的做法.
即是定义出一个类似函数边界的东西.
某种意义上来说可以理解为是一种定向的prune.
underfitting的问题可以从拟合的准确度来比较直观地看到.
overfitting本质上来说是过多地capture了training set的一些细微的差异.
考虑实际上是存在一个确定的多项表达式描述预期函数的.
对于一个ture negative的input来说,实际上对于这个具体的表达式而言应该是被接受的.
而拟合函数给予拒绝的话说明从表达构成来说,比真实预期函数多了一些不必要的余项.
形式上来说,regularization/bias是有可能去掉这些项目的.
当并不确切.
因为理论上上说,这个效用只在于不同的拟合之间可以作为一个参考.
在一个拟合内,其实是可以理解为多input的一定程度的transform而已.
实际还是存在某种deterministic的.
如果是一个符合某种分布的区间值呢?
也就是bias是一个每次regression的时候是概率性的有一定范围bound的值呢?
因为服从一个既定概率分布,所以期望应该还是确定的.
对于单个update的收敛性的性质应该不会有什么影响.
对于整体呢?
如果真实的表达式是
G=\sum_i g_i(x)
的话
拟合为
F = G+Bias
->
G = F - Bias
->
G = \sum_i f_i(x) - p_i*bias
从形式上来说,跟不用概率分布是一样的.
所以这也不能用来衡量是否过度表达.
实际上,把negative sampling换个思路理解的话,其实是某种副作用在减少overfiting.
因为包含的bounding约束,可能一定程度上会使得出来的余项相对较小.
如果不能减小的话,说明negative sample里也能capture到这些余项所代表的特征.
因为形式上是
maximize(positive) + minimize(negetive)
->
w*x_n + b_n + n_p
->
reminder = b_n + n_p
reminder不减小的话,就因为这b_n和n_p都有贡献.
2017-10-15
概率性理性
考虑一个双方具有完全一致策略侧重点的博弈.
所以完全一致策略是指对于一个行为的评价函数一致.
也就是对于同一情况具有同样的决策选择.
即某种意义上的完全"理性"的"可确定性"的情况.
那么这种情况下的博弈是可预测的么.
并不一定.
因为决策函数可能并不是一个确定性的函数.
而是觉有某种随机性/随意性.
这样的话,在给定条件constrain和objective的情况下,并不一定存在确定的求解路径.
因为每个条件分支的概率分布觉有不确定性,从而是得代价计算具有不确定性.
即对于一个策略没有对应的稳定的评估函数.
于是一定传统意义上理性假设并不一定能带来预期上的所谓最优解的存在.
换个角度想.
所谓的理性假设不过是在某种特定的"世界观"之下,对于一个行为回报的解释函数相一致的问题.
也就是在给定constrain C的情况下,A基于某种策略对B进行predicate的时候,跟B对自身进行predicate的结果具有一致性.
类似地,不理性的情况即使predicate函数存在不确定性或者说不存在.
那么,合并一下的话,理性就是不理性的一种情况.
即后者的predicate的不确定性是0%的一种特殊解.
这样的话,一个泛化的描述就是对于一个博弈而言,以其中一个参与者的立场来说的话.
它的cost function是一个概率性的函数.
而这个概率性函数的性质要么是有某种确定性的概率分布.
要么是一个不确定性的函数分布.
前者因为确定性,在重复的情况下存在一个确定的预期收益.
而后者因为不可重复性,带来是完全的随机性的收益,从而是的决策不具有收益函数支持的确定性特征.
于是对于后者来说就不存在所谓的最优解.
或者说给定一个条件下的一个dominated的strategy是不存在的.
发过来用这个来定义所谓的irrational的话呢?
比如当你喜欢一个人或者喜欢一个事物.
然后投入不可理喻的时间和精力的情况,改如何解释呢?
之前的一个思路是在一个rational的valuation函数之上加一个bias.
也即是隐含假设存在一个确定性理性决策的情况.
换成非确定性,也即是概率分布的情况的话.
实际的行为就是某种概率区间内的解的具体体现而已.
而如果用非确定性的概率分布来解释的话,就纯粹是whatever happened,happened的meaningless了.
从相对没有那么悲观的角度来说的话,认为实际是有某种概率性分布的话,理论上还是存在一种可计算可能的.
毕竟,这种概率决策树虽然无限拆分,但总归存在某种可描述的模式.
兴许还是存在可解的情况的.
所以完全一致策略是指对于一个行为的评价函数一致.
也就是对于同一情况具有同样的决策选择.
即某种意义上的完全"理性"的"可确定性"的情况.
那么这种情况下的博弈是可预测的么.
并不一定.
因为决策函数可能并不是一个确定性的函数.
而是觉有某种随机性/随意性.
这样的话,在给定条件constrain和objective的情况下,并不一定存在确定的求解路径.
因为每个条件分支的概率分布觉有不确定性,从而是得代价计算具有不确定性.
即对于一个策略没有对应的稳定的评估函数.
于是一定传统意义上理性假设并不一定能带来预期上的所谓最优解的存在.
换个角度想.
所谓的理性假设不过是在某种特定的"世界观"之下,对于一个行为回报的解释函数相一致的问题.
也就是在给定constrain C的情况下,A基于某种策略对B进行predicate的时候,跟B对自身进行predicate的结果具有一致性.
类似地,不理性的情况即使predicate函数存在不确定性或者说不存在.
那么,合并一下的话,理性就是不理性的一种情况.
即后者的predicate的不确定性是0%的一种特殊解.
这样的话,一个泛化的描述就是对于一个博弈而言,以其中一个参与者的立场来说的话.
它的cost function是一个概率性的函数.
而这个概率性函数的性质要么是有某种确定性的概率分布.
要么是一个不确定性的函数分布.
前者因为确定性,在重复的情况下存在一个确定的预期收益.
而后者因为不可重复性,带来是完全的随机性的收益,从而是的决策不具有收益函数支持的确定性特征.
于是对于后者来说就不存在所谓的最优解.
或者说给定一个条件下的一个dominated的strategy是不存在的.
发过来用这个来定义所谓的irrational的话呢?
比如当你喜欢一个人或者喜欢一个事物.
然后投入不可理喻的时间和精力的情况,改如何解释呢?
之前的一个思路是在一个rational的valuation函数之上加一个bias.
也即是隐含假设存在一个确定性理性决策的情况.
换成非确定性,也即是概率分布的情况的话.
实际的行为就是某种概率区间内的解的具体体现而已.
而如果用非确定性的概率分布来解释的话,就纯粹是whatever happened,happened的meaningless了.
从相对没有那么悲观的角度来说的话,认为实际是有某种概率性分布的话,理论上还是存在一种可计算可能的.
毕竟,这种概率决策树虽然无限拆分,但总归存在某种可描述的模式.
兴许还是存在可解的情况的.
2017-09-09
近似的精确性
对于一条曲线y=f(x).
给定区间R \in [x_left,x_right]内,df(x) = dy恒定的话.
则可以表示为y=f(x)=Wx+b的形式.
于是扩展下就是对于任意一条曲线,可以认为是由一组这样区间的f(x)构成的.
也就是分段的线性组合/集合S(f)构成.
考虑S(f)是个有限集合.
y=f(x)就可以表述为
y=f(x) = a_0*f_0(x) + a_1*f_1(x) + ... + a_n*f_n(x)
其中f_i(x) \in S(f),a_i = {0,1}
->
y=f(x) = \sum a_i*f_i(x)
这个形式就有限眼熟了.
如果把a_i = {0,1}放宽一点,为[0,1]之类的话.
a_i = sigmoid(f_i(x))
也就是所谓的activation function的形式.
或者更换下符号
a_i = sigmoid(g_i(x))
->
y=f(x) = \sum sigmoid(g_i(x)) * f_i(x)
->
y=f(x) = \vec{sigmoid(g_i(x))} * \vec{f_i(x)}
->
y=f(x) = hidden(x) * output(x)
也就是说,某种程度上来说,multi layer/deep neural network更像是一组分段函数描述.
通过一种局部的简单近似取描述一条整体复杂的曲线.
从这个角度来说,DNN并不能算得上说是一种智能甚至说算法.
而只是一种某种形式的经验的累加.
它可以逼近现有已知的各种事实.
但对于事实外或者预见外的,就可能并不能存在所谓的有效性.
这里隐含的一个论调就是,这个世界的运作规则是有一些简洁有力的描述构成的.
就像y=ax+b足够描述一条,而不是把所以点"罗列"出来才能表达一样.
而且这里更深的一个隐含假设就是这种简洁的基本描述是有限的.
也就是说,只需要有限的几条公式就能够完整地描述各种状态和存在.
反过来说,即使这个世界确实是由一些既定的数学来描述的话.
如果这种数学的存在性是无限的,那也是没有意义的.
因为可能并不能通过罗列S(f)的方式来具体确定地描述一个东西.
而只能在一个子集内有限地逼近真实.
或者可能需要一种结构去描述这种无限状态构成的确定的具体概念?
就像泰勒展开一样.
如何系统地描述这种无限的表述空间.
或者可能这就是这个世界并不是某种模拟的结果的证据.
因为对于这个展开式,永远存在一个可以继续展开的无穷小精度.
也就是说,永远存在某种未发现的规律剂量,去表面还有未知的空间.
就像从引力印象一样.
在理论发展之前,这是一个不会被测量和考虑的某阶无穷小因素.
而在理论框架之后,又有了测量和确认的形式方式.
这么想的话,好像DNN也不是那么不堪.
给定区间R \in [x_left,x_right]内,df(x) = dy恒定的话.
则可以表示为y=f(x)=Wx+b的形式.
于是扩展下就是对于任意一条曲线,可以认为是由一组这样区间的f(x)构成的.
也就是分段的线性组合/集合S(f)构成.
考虑S(f)是个有限集合.
y=f(x)就可以表述为
y=f(x) = a_0*f_0(x) + a_1*f_1(x) + ... + a_n*f_n(x)
其中f_i(x) \in S(f),a_i = {0,1}
->
y=f(x) = \sum a_i*f_i(x)
这个形式就有限眼熟了.
如果把a_i = {0,1}放宽一点,为[0,1]之类的话.
a_i = sigmoid(f_i(x))
也就是所谓的activation function的形式.
或者更换下符号
a_i = sigmoid(g_i(x))
->
y=f(x) = \sum sigmoid(g_i(x)) * f_i(x)
->
y=f(x) = \vec{sigmoid(g_i(x))} * \vec{f_i(x)}
->
y=f(x) = hidden(x) * output(x)
也就是说,某种程度上来说,multi layer/deep neural network更像是一组分段函数描述.
通过一种局部的简单近似取描述一条整体复杂的曲线.
从这个角度来说,DNN并不能算得上说是一种智能甚至说算法.
而只是一种某种形式的经验的累加.
它可以逼近现有已知的各种事实.
但对于事实外或者预见外的,就可能并不能存在所谓的有效性.
这里隐含的一个论调就是,这个世界的运作规则是有一些简洁有力的描述构成的.
就像y=ax+b足够描述一条,而不是把所以点"罗列"出来才能表达一样.
而且这里更深的一个隐含假设就是这种简洁的基本描述是有限的.
也就是说,只需要有限的几条公式就能够完整地描述各种状态和存在.
反过来说,即使这个世界确实是由一些既定的数学来描述的话.
如果这种数学的存在性是无限的,那也是没有意义的.
因为可能并不能通过罗列S(f)的方式来具体确定地描述一个东西.
而只能在一个子集内有限地逼近真实.
或者可能需要一种结构去描述这种无限状态构成的确定的具体概念?
就像泰勒展开一样.
如何系统地描述这种无限的表述空间.
或者可能这就是这个世界并不是某种模拟的结果的证据.
因为对于这个展开式,永远存在一个可以继续展开的无穷小精度.
也就是说,永远存在某种未发现的规律剂量,去表面还有未知的空间.
就像从引力印象一样.
在理论发展之前,这是一个不会被测量和考虑的某阶无穷小因素.
而在理论框架之后,又有了测量和确认的形式方式.
这么想的话,好像DNN也不是那么不堪.
2017-07-23
制度与拉格朗日乘数
晚上看到18if在B站的第二话选择性下架了.
然后追述了下原因看到知乎上的这个话题.
https://zhihu.com/question/62443727
然后想了几点.
如果把这些回答/猜测/解释作为广电的一种官方意见放出来的话.
是一种什么样的感受.
这里的一个点其实是自我审查与审查的区别.
形态上来说,自我审查和审查其实算是同一类决策思路.
不同的只是一种半主动半被动和主动的区别.
自我审查被人诟病的一点就是审查范围的无限制和边界的浮动.
当然,这一点可以说是审查制度本身的主观性太强客观尺度不成文造成的.
但从客观上来说,也反映了审查不管是主动还是被动都存在一种尺度飘忽的问题.
也就是应该审查什么的问题.
或者说什么是应该被审查的问题.
审查的目的是什么呢?
某种程度上来说,审查是一种对内容的剪裁技术.
广义上来说,导演的剪辑以及重剪版本都可以算是一种审查.
目的是对内容的重新规划和限定.
就像东邪西毒原版和后来的重新剪辑版一样.
前者是用零碎表征零碎.
后者则是纯粹的故事线索梳理.
所试图呈现的侧面和重点的区别.
当然,用这个类比多少是有些诡辩味道的.
但不管怎么样,内容操纵这点是共同的.
那么内容操控的目的是什么呢.
像剔除血腥暴力色情等.
具体来说是剔除什么呢?
这个某种程度上来说也是伪命题.
因为就表现手法和目的来说,有些恰恰就是为了表现这些想要控制的内容.
如果说剔除这部分算是制度正确的话.
那么对于那么并不以表现血腥暴力色情等内容为目的,而只是恰巧使用了对应手法的类别呢?
退一步来说,也可以说因为不是必要手段,可以使用其他表现方式.
那么这里有什么问题么?
问题在于执行的尺度.
就色情来说.
什么程度算色情呢?
就好像某段子一样.
内衣和泳衣的区别界限.
这个虽然调侃意味比较浓,但也多多少少能说明一些问题.
由于存在个体的接受广度深度方面的差异,人与人之间对内容的容忍和划分程度也是不同的.
即使是放大到人群当中,群体之间的差异也是明显的.
就像所谓的二次元文化,甚至于这些二次元文化下面的各层次的次级文化之间,也常常有冲突.
所以客观上来说,可能并不存在一个所谓的广泛的社会道德层面的尺度agreement.
有人觉得分级制度可能解决审查问题的.
需要考虑的矛盾点也就在此.
纯粹以年龄层面来分级的话,对于各种不同的表现手法适用度是有限的.
而且对于作品思想的表达接受能力,可能并不跟年龄有直接关系.
如果使用含代考核评测性质的分级制度的话,可能又不是一些群体认可的符合普世价值的解决方案.
因此,分级制度的矛盾点在于,制度可以很好地解决内容接受度和定向传播.
但问题在于,它的核心在于将如何控制内容的定向传播转变为了如何对内容进行定向分级.
一个类似纯粹的概念变换.
并没有提供具体真实的解决方案.
回到审查本身.
审查的目的是一种内容控制.
从形式上来说,是一种过滤机制.
过滤本质上来说,是一种选择性的内容许可.
借用generative adversary network的思路的话.
其实就是用审查过滤这种negative sampling去辅助objective function的拟合.
也就是说内容审查和过滤只是作为内容定向的一种实现方式realization而已.
反过来说,实际目的其实是定向的内容输送.
中立地说,纯字面意义的中国梦正能量爱国情怀等并不是什么难堪的东西.
如果社会确实这个所述的话也并没什么太大的问题.
那么,这里的问题冲突在哪里呢?
一方的强行灌输也就意味着一方的抵抗.
抵抗的点无非在于不切实际或者说有些自欺欺人或者其他因素带来的不现实性.
某种形式的所谓的人民群众日益增长的物质文化需求与落后生产力之间的矛盾.
形式上来说.
就是如何将两种objective function约束在一起求解的问题.
比如要复兴国学礼义廉耻,那么在教育层面作为一种升学指标.
解决人口结构附带的社会抚养问题,那么可以将社保公积金组合加在房地产方面.
科研自主能力方面,就附带地提升国内期刊的地位和重要性等.
所以,与其说是一种objective function的糅合.
不如说是一种政治经济学上的拉格朗日乘数.
在一个社会国家层面,给定一个目标之后.
剩下的不过是一种诱导变化.
然后追述了下原因看到知乎上的这个话题.
https://zhihu.com/question/62443727
然后想了几点.
如果把这些回答/猜测/解释作为广电的一种官方意见放出来的话.
是一种什么样的感受.
这里的一个点其实是自我审查与审查的区别.
形态上来说,自我审查和审查其实算是同一类决策思路.
不同的只是一种半主动半被动和主动的区别.
自我审查被人诟病的一点就是审查范围的无限制和边界的浮动.
当然,这一点可以说是审查制度本身的主观性太强客观尺度不成文造成的.
但从客观上来说,也反映了审查不管是主动还是被动都存在一种尺度飘忽的问题.
也就是应该审查什么的问题.
或者说什么是应该被审查的问题.
审查的目的是什么呢?
某种程度上来说,审查是一种对内容的剪裁技术.
广义上来说,导演的剪辑以及重剪版本都可以算是一种审查.
目的是对内容的重新规划和限定.
就像东邪西毒原版和后来的重新剪辑版一样.
前者是用零碎表征零碎.
后者则是纯粹的故事线索梳理.
所试图呈现的侧面和重点的区别.
当然,用这个类比多少是有些诡辩味道的.
但不管怎么样,内容操纵这点是共同的.
那么内容操控的目的是什么呢.
像剔除血腥暴力色情等.
具体来说是剔除什么呢?
这个某种程度上来说也是伪命题.
因为就表现手法和目的来说,有些恰恰就是为了表现这些想要控制的内容.
如果说剔除这部分算是制度正确的话.
那么对于那么并不以表现血腥暴力色情等内容为目的,而只是恰巧使用了对应手法的类别呢?
退一步来说,也可以说因为不是必要手段,可以使用其他表现方式.
那么这里有什么问题么?
问题在于执行的尺度.
就色情来说.
什么程度算色情呢?
就好像某段子一样.
内衣和泳衣的区别界限.
这个虽然调侃意味比较浓,但也多多少少能说明一些问题.
由于存在个体的接受广度深度方面的差异,人与人之间对内容的容忍和划分程度也是不同的.
即使是放大到人群当中,群体之间的差异也是明显的.
就像所谓的二次元文化,甚至于这些二次元文化下面的各层次的次级文化之间,也常常有冲突.
所以客观上来说,可能并不存在一个所谓的广泛的社会道德层面的尺度agreement.
有人觉得分级制度可能解决审查问题的.
需要考虑的矛盾点也就在此.
纯粹以年龄层面来分级的话,对于各种不同的表现手法适用度是有限的.
而且对于作品思想的表达接受能力,可能并不跟年龄有直接关系.
如果使用含代考核评测性质的分级制度的话,可能又不是一些群体认可的符合普世价值的解决方案.
因此,分级制度的矛盾点在于,制度可以很好地解决内容接受度和定向传播.
但问题在于,它的核心在于将如何控制内容的定向传播转变为了如何对内容进行定向分级.
一个类似纯粹的概念变换.
并没有提供具体真实的解决方案.
回到审查本身.
审查的目的是一种内容控制.
从形式上来说,是一种过滤机制.
过滤本质上来说,是一种选择性的内容许可.
借用generative adversary network的思路的话.
其实就是用审查过滤这种negative sampling去辅助objective function的拟合.
也就是说内容审查和过滤只是作为内容定向的一种实现方式realization而已.
反过来说,实际目的其实是定向的内容输送.
中立地说,纯字面意义的中国梦正能量爱国情怀等并不是什么难堪的东西.
如果社会确实这个所述的话也并没什么太大的问题.
那么,这里的问题冲突在哪里呢?
一方的强行灌输也就意味着一方的抵抗.
抵抗的点无非在于不切实际或者说有些自欺欺人或者其他因素带来的不现实性.
某种形式的所谓的人民群众日益增长的物质文化需求与落后生产力之间的矛盾.
形式上来说.
就是如何将两种objective function约束在一起求解的问题.
比如要复兴国学礼义廉耻,那么在教育层面作为一种升学指标.
解决人口结构附带的社会抚养问题,那么可以将社保公积金组合加在房地产方面.
科研自主能力方面,就附带地提升国内期刊的地位和重要性等.
所以,与其说是一种objective function的糅合.
不如说是一种政治经济学上的拉格朗日乘数.
在一个社会国家层面,给定一个目标之后.
剩下的不过是一种诱导变化.
2017-07-16
信用货币与计划经济
考虑货币作为一种信用媒介.
比较传统或者所古典的理论当中,货币是当作一种所谓一般等价物处理的.
也即使作为交易当中的一个通用中介符号.
现代理论中,货币的产生是作为一种信贷扩张的结果.
它跟传统的区别在于,前者的产生或者说需求数量依赖的是交易的频率/频度.
或者说货币乘数周转率之类的.
体现在交易过程中的出现频率.
而信贷理论的基础是一种借记关系.
或者所谓的记账式.
一个可能比较贴切的例子就是所谓的月饼券.
在一定周期内完成的纯记账式的债务权利交割.
至于里面有没有涉及到具体的实物清算或者说参与,则不在理论框架范围内.
这里有一个问题.
那就是这种定义下的货币的存在意义.
考虑AB两方参与的一个交易.
最后的结果无非是AB交换一下账目所有.
"货币"在里面的作用不过是一个价格计量性质的单位.
把它去掉并不会影响交易的成功与否.
本质上,就是原始的以物易物.
放在任何双方参与的合理理性的交换行为当中,这种交易里面的"货币"存在意义是很微弱的.
因为在这种情况下,都可以规约回两两交易的对等交换情况下.
这种情况下的货币不过是一种公共计价方式.
但公允么?
考虑物品X从A到B到C的一个交易链条.
以物物交换的角度看,不过是X的所有权由A->C的一个转换过程.
考虑.
A->B的交换是B以一个溢价Y得到的.
即在A->B的实际交易价格是X+Y.
B->C的交换是C以一个溢价Z得到的.
即在B->C的实际交易价格是X+Z.
那么考虑,X+Y = X+Z
->
Y = Z么.
不一定.
因为B C对溢的private valuation并不总是相同.
也就是说,如果把货币考虑为这些信用交换过程中的一个计量单位的话.
可能并不具有任何现实意义.
因为价值估计是一个个体差异相当大的东西.
也就是说,这种计量并不具有公允性.
也就是说,存在C直接跟A交换X的话,付出的要比通过B交换来得少或者多.
这个会有什么问题呢?
只要交易始终是你情我愿的,那么这种计量浮动/偏差有什么影响呢?
考虑公允价值的市场性质.
公允价值或者说具体价值是作为一个某种特定商品交换的计价的一个体现.
简单说,就是一种类似的平均价格的存在.
它的作用是为同类交易做一种计量锚定作用.
约束同类交易尽可能地在同水平附近浮动.
在纯信用记账的范畴内,这个问题在于平均水平是受制于具体的交易的.
也就是说,这个平均价格是以某个时期内的实际发生的交易作为一个参照系得出的.
一个直观的例子就是股票市场的交易价格的形成.
里面价格的波动除了受买卖双方的预期影响之外,更多的是由实际的买卖行为决定的.
一个极端的例子就是,即便说都预期某个股票的价值应该低于某一点的话.
但只要有足够的买入流动性,也依然能够推高价格.
所以,如果以信贷作为货币理解的基础的话,那么流动性是一个隐含的必要因素.
另外一个极端的例子就是,当市场上某种产品只有一次交易成立的话.
那么其价格就有可能被认为是一种公允/平均价格.
这点是跟传统的一般等价物概念有很大区别的.
某种程度上来说,货币在这里不过是一个复杂的记账传递网络里的一个数值化体现.
它并不需要一定是对等的,或者说反映供需关系.
本质上来说,有点类似于一个单向的拟合预测函数.
基于过去的数据给出当前的一个估计.
至于是否符合实际的曲线,那就是另外一回事了.
然后基于这个思路考虑一下信贷扩张问题.
或者更确切地说固定资产或者说房地产的问题.
一个成交就意味着对市场公允价格的一次加权调整.
以资产证券或者数值化的角度看的化,随之而来的就是同等/同类资产所有者的一次重新计量过程.
也就是说,但一个200w的房子以300w的价格成交的时候,拥有同等同类房子的人资产就增加的100w.
换算成百分比的化就是50%.
那么,以记账方式考虑的话,全社会的货币就相应地在账目上增加了50%.
具体的实现方式可能是抵押/在抵押贷款等,创造出新的货币账目.
当然,实际是并不是所有的增加账目都会马上变现进入流动.
但从纯账目上来说,以公允价值计量的话,就是相当于再发行了50%的货币.
而也正因为并不是所有的新发行都会马上变成现金流进入传统意义的流通领域,所以才没有通胀的事实感觉.
某种形式的滞后效应.
考虑变现的一部分.
如果把没有进入流通的"增发"考虑为实际的增发的话,即假设只有N%的进行了变现.
那么流通领域就增加了这N%的现金.
对于这部分人来说,就是实现了固定资产向现金资产的一个转换.
假设市场永远是滞后的或者说变现的永远是少数一部分人.
那么这部分人相当于在不断的自行发新钞.
因为实际上的效果就相当于把账目推入流动领域.
那么,能无限的增发下去么?
实际上的货币供应量还是受制于对应的货币政策的.
也就是说,这里存在一个转移的上限.
因为上面的增发游戏本质上是对现有资产负债表做的一种定向腾挪.
由买房者向房产所有者做的一个现金和固定资产的交换.
一个极端的结果就是代表流动性的现金资产集中在一部分人手里.
而另一部分人持有的是等额的低流动性资产.
也就是一种事实上的一部分人有资产而无现金.
于是,考虑经济发展的信贷扩张理论.
它要求的是通过提高负债率,提高消费周转的效率,进而带动经济链条的发展.
然而上面的无流动资产的情况则是,扩张信贷的对无现金人群并无任何实际刺激.
而对于现金持有者来说,边际效用是递减的.
因此这种情况下的一个必然现象就是扩张的疲惫或者说所谓的滞涨.
即无论如何宽松,也没办法再对经济周转效率产生积极的影响.
而由于缺乏现金,各个资产层级之间理论上就存在一个"增发"能力的上限.
也就是说,由于资产数量的差异,和现金的缺乏,使得到了阶层内的一定位置之后.
拥有的现金不在具有往上一层级靠拢的趋势.
或者说,存在一个"增发"能力的效率/增长率差异带来的曲线上的分段函数表征.
即所谓的阶级固化.
这会有什么问题么?
由于存在现金流动资产的层级隔离,而由于没个层级内的现金资产的边际效用是递减的.
那么理论上就存在一个分布使得每个层级的天花板层级对"增发"的追逐动机依次下降.
这样的话,动态地考虑,层级内和层级间从长期来看是不太可能有一个稳态的.
所谓的经济周期变动.
回过头来.
这里问题的本质是信用机制下面,货币记账的不对等性造成的.
即脱离了一般等价物锚定的货币,更多的是受到各个零碎交易结果影响的.
而且由于交易的不对称性和人的决策最优解定义的差异性,整个动态系统基本上是很难可控可预测的.
所有,某种程度上来说.
求解于计划经济的某些思路,也不是一件离谱的事情.
比较传统或者所古典的理论当中,货币是当作一种所谓一般等价物处理的.
也即使作为交易当中的一个通用中介符号.
现代理论中,货币的产生是作为一种信贷扩张的结果.
它跟传统的区别在于,前者的产生或者说需求数量依赖的是交易的频率/频度.
或者说货币乘数周转率之类的.
体现在交易过程中的出现频率.
而信贷理论的基础是一种借记关系.
或者所谓的记账式.
一个可能比较贴切的例子就是所谓的月饼券.
在一定周期内完成的纯记账式的债务权利交割.
至于里面有没有涉及到具体的实物清算或者说参与,则不在理论框架范围内.
这里有一个问题.
那就是这种定义下的货币的存在意义.
考虑AB两方参与的一个交易.
最后的结果无非是AB交换一下账目所有.
"货币"在里面的作用不过是一个价格计量性质的单位.
把它去掉并不会影响交易的成功与否.
本质上,就是原始的以物易物.
放在任何双方参与的合理理性的交换行为当中,这种交易里面的"货币"存在意义是很微弱的.
因为在这种情况下,都可以规约回两两交易的对等交换情况下.
这种情况下的货币不过是一种公共计价方式.
但公允么?
考虑物品X从A到B到C的一个交易链条.
以物物交换的角度看,不过是X的所有权由A->C的一个转换过程.
考虑.
A->B的交换是B以一个溢价Y得到的.
即在A->B的实际交易价格是X+Y.
B->C的交换是C以一个溢价Z得到的.
即在B->C的实际交易价格是X+Z.
那么考虑,X+Y = X+Z
->
Y = Z么.
不一定.
因为B C对溢的private valuation并不总是相同.
也就是说,如果把货币考虑为这些信用交换过程中的一个计量单位的话.
可能并不具有任何现实意义.
因为价值估计是一个个体差异相当大的东西.
也就是说,这种计量并不具有公允性.
也就是说,存在C直接跟A交换X的话,付出的要比通过B交换来得少或者多.
这个会有什么问题呢?
只要交易始终是你情我愿的,那么这种计量浮动/偏差有什么影响呢?
考虑公允价值的市场性质.
公允价值或者说具体价值是作为一个某种特定商品交换的计价的一个体现.
简单说,就是一种类似的平均价格的存在.
它的作用是为同类交易做一种计量锚定作用.
约束同类交易尽可能地在同水平附近浮动.
在纯信用记账的范畴内,这个问题在于平均水平是受制于具体的交易的.
也就是说,这个平均价格是以某个时期内的实际发生的交易作为一个参照系得出的.
一个直观的例子就是股票市场的交易价格的形成.
里面价格的波动除了受买卖双方的预期影响之外,更多的是由实际的买卖行为决定的.
一个极端的例子就是,即便说都预期某个股票的价值应该低于某一点的话.
但只要有足够的买入流动性,也依然能够推高价格.
所以,如果以信贷作为货币理解的基础的话,那么流动性是一个隐含的必要因素.
另外一个极端的例子就是,当市场上某种产品只有一次交易成立的话.
那么其价格就有可能被认为是一种公允/平均价格.
这点是跟传统的一般等价物概念有很大区别的.
某种程度上来说,货币在这里不过是一个复杂的记账传递网络里的一个数值化体现.
它并不需要一定是对等的,或者说反映供需关系.
本质上来说,有点类似于一个单向的拟合预测函数.
基于过去的数据给出当前的一个估计.
至于是否符合实际的曲线,那就是另外一回事了.
然后基于这个思路考虑一下信贷扩张问题.
或者更确切地说固定资产或者说房地产的问题.
一个成交就意味着对市场公允价格的一次加权调整.
以资产证券或者数值化的角度看的化,随之而来的就是同等/同类资产所有者的一次重新计量过程.
也就是说,但一个200w的房子以300w的价格成交的时候,拥有同等同类房子的人资产就增加的100w.
换算成百分比的化就是50%.
那么,以记账方式考虑的话,全社会的货币就相应地在账目上增加了50%.
具体的实现方式可能是抵押/在抵押贷款等,创造出新的货币账目.
当然,实际是并不是所有的增加账目都会马上变现进入流动.
但从纯账目上来说,以公允价值计量的话,就是相当于再发行了50%的货币.
而也正因为并不是所有的新发行都会马上变成现金流进入传统意义的流通领域,所以才没有通胀的事实感觉.
某种形式的滞后效应.
考虑变现的一部分.
如果把没有进入流通的"增发"考虑为实际的增发的话,即假设只有N%的进行了变现.
那么流通领域就增加了这N%的现金.
对于这部分人来说,就是实现了固定资产向现金资产的一个转换.
假设市场永远是滞后的或者说变现的永远是少数一部分人.
那么这部分人相当于在不断的自行发新钞.
因为实际上的效果就相当于把账目推入流动领域.
那么,能无限的增发下去么?
实际上的货币供应量还是受制于对应的货币政策的.
也就是说,这里存在一个转移的上限.
因为上面的增发游戏本质上是对现有资产负债表做的一种定向腾挪.
由买房者向房产所有者做的一个现金和固定资产的交换.
一个极端的结果就是代表流动性的现金资产集中在一部分人手里.
而另一部分人持有的是等额的低流动性资产.
也就是一种事实上的一部分人有资产而无现金.
于是,考虑经济发展的信贷扩张理论.
它要求的是通过提高负债率,提高消费周转的效率,进而带动经济链条的发展.
然而上面的无流动资产的情况则是,扩张信贷的对无现金人群并无任何实际刺激.
而对于现金持有者来说,边际效用是递减的.
因此这种情况下的一个必然现象就是扩张的疲惫或者说所谓的滞涨.
即无论如何宽松,也没办法再对经济周转效率产生积极的影响.
而由于缺乏现金,各个资产层级之间理论上就存在一个"增发"能力的上限.
也就是说,由于资产数量的差异,和现金的缺乏,使得到了阶层内的一定位置之后.
拥有的现金不在具有往上一层级靠拢的趋势.
或者说,存在一个"增发"能力的效率/增长率差异带来的曲线上的分段函数表征.
即所谓的阶级固化.
这会有什么问题么?
由于存在现金流动资产的层级隔离,而由于没个层级内的现金资产的边际效用是递减的.
那么理论上就存在一个分布使得每个层级的天花板层级对"增发"的追逐动机依次下降.
这样的话,动态地考虑,层级内和层级间从长期来看是不太可能有一个稳态的.
所谓的经济周期变动.
回过头来.
这里问题的本质是信用机制下面,货币记账的不对等性造成的.
即脱离了一般等价物锚定的货币,更多的是受到各个零碎交易结果影响的.
而且由于交易的不对称性和人的决策最优解定义的差异性,整个动态系统基本上是很难可控可预测的.
所有,某种程度上来说.
求解于计划经济的某些思路,也不是一件离谱的事情.
2017-07-01
自私倾向
前两天看到的一个现象.
对于这样一张损益表:
+---------------+---------------+---------------+
| choice | red | black |
+---------------+---------------+---------------+
| 6 red 0 black | +64 | 0 |
+---------------+---------------+---------------+
| 5 red 1 black | -4 | +64 |
+---------------+---------------+---------------+
| 4 red 2 black | -8 | +32 |
+---------------+---------------+---------------+
| 3 red 3 black | -16 | +16 |
+---------------+---------------+---------------+
| 2 red 4 black | -32 | +8 |
+---------------+---------------+---------------+
| 1 red 5 black | -64 | +4 |
+---------------+---------------+---------------+
| 0 red 6 black | 0 | -64 |
+---------------+---------------+---------------+
给定6人决策,red/black分别为对于决策的reward.
比如5人选择red,1人选择black的话.
结果就是选择red的分别得到-4的reward,black的得到+64的reward.
对应的最终winning是maximize reward并且有reward >= 0的约束.
这个本来觉得应该是没有什么悬念的.
选择black是相对唯一的理性选择.
因为选择red的话,最好的结果也只是最后equally rewarded,没有一个winning存在.
而对应的,这个是选择black的最差结果.
尤其如果以等概率考察等话,black的 strategy期望正的.
即使考虑到有概率偏差.
Earning = W_1*64 + W_2*32 ....
->
Earning = W_positive*Positive_constant + W_negative*(-64)
->
Earning_black = W_positive*Positive_constant + W_negative*(-64)
Earning_red = W_positive*(-Positive_constant) + W_negative*(64)
要使得red dominate black的话,就需要
Earning_red > Earning_black
-> W_positive*(-Positive_constant) + W_negative*(64) > W_positive*Positive_constant + W_negative*(-64)
-> W_positive*(-Positive_constant) + W_negative*(64) > 0
-> Earning_red > 0
这就是只有cooperate的时候才优于black,但此时并不存在满足winning情况(ordered reward)的可能.
所以,这个直觉上来说应该是没有人会选择red的.
但实际看到的结果是首轮甚至第二轮都是全员选择red的情况.
这个就有意思了.
补充一点就是,这里其实还有个隐藏要素.
就是,在某几轮的reward会有penalty/amplify.
但这个对于基本的逻辑不会有什么实质影响.
这里大概问了下对应人员的思考思路.
一个点就是这里的strategy的focus点在于先保障最终reward>0这点.
也就是在给定的有限轮博弈中,先试图保障一个比较安全的正向收益,然后在择机削减对手.
所以这个思路实际上是 对winning条件加了一个新的约束.
至少让social reward>0.
这点在后面的培训鸡汤解释中反馈除了这歌隐含假设.
这样的话,对应的social损益表就变为:
+---------------+---------------+
| choice | social reward |
+---------------+---------------+
| 6 red 0 black | +384 |
+---------------+---------------+
| 5 red 1 black | +44 |
+---------------+---------------+
| 4 red 2 black | +32 |
+---------------+---------------+
| 3 red 3 black | 0 |
+---------------+---------------+
| 2 red 4 black | -32 |
+---------------+---------------+
| 1 red 5 black | -44 |
+---------------+---------------+
| 0 red 6 black | -384 |
+---------------+---------------+
单纯看这个的话,选择red的gradient是偏向对于reward positive的.
也就是单纯只看social optimal的话,选择red应该是属于dominated的decision.
考虑复合情况.
选择红的动机在于用personal winning去tradeoff social optimal.
放一起就是
+---------------+---------------+---------------+---------------+
| choice | social reward | trade off + effective |
+---------------+---------------+---------------+---------------+
| 6 red 0 black | +384 | +64 + +448 |
+---------------+---------------+---------------+---------------+
| 5 red 1 black | +44 | -4 | +40 |
+---------------+---------------+---------------+---------------+
| 4 red 2 black | +32 | -8 | +24 |
+---------------+---------------+---------------+---------------+
| 3 red 3 black | 0 | -16 | -16 |
+---------------+---------------+---------------+---------------+
| 2 red 4 black | -32 | -32 | -64 |
+---------------+---------------+---------------+---------------+
| 1 red 5 black | -44 | -64 | -108 |
+---------------+---------------+---------------+---------------+
| 0 red 6 black | -384 | 0 | -384 |
+---------------+---------------+---------------+---------------+
这样的话,对于某一轮来说的game setting情况就是.
一个共同的social reward值,和一个差异化的 personal reward分布P.
对于一个分布P靠后的参与者来说,是没有修复social reward的动机的.
因为让social reward>0并不会对winning有任何帮助.
而同时,由于选择red的gradian是趋向于正的.
因此,这时候依然会是选择black成为一种dominated的strategy.
这样的话,动态地考虑,只要出现了一个暂时的winer的话,其他人就会迅速地切换到black strategy.
而在没有winner的时候,black strategy本身就是一个dominated的情况.
因此,即便是加入了这个social constrain,最终的趋势也依然是负收益.
也就是说,即使是加入了这个约束,理性情况下,也不会有人选择red strategy.
但事实就是出现了不但存在并且是全员red的情况.
即便是考虑到有轮数限制,但从上面的策略上来说,也依然不存在选择red的情况.
所以这大概就是为什么人类社会比较复杂难以描述的原因.
而且考虑到即便都是理性的,由于各自的模型和隐含约束不一定一致,也可能导致结果的不确定性和偏差.
于是,从这个角度上来说,social optimal本身就算是一个伪命题.
形式上来说,是不太存在可解性的.
对于这样一张损益表:
+---------------+---------------+---------------+
| choice | red | black |
+---------------+---------------+---------------+
| 6 red 0 black | +64 | 0 |
+---------------+---------------+---------------+
| 5 red 1 black | -4 | +64 |
+---------------+---------------+---------------+
| 4 red 2 black | -8 | +32 |
+---------------+---------------+---------------+
| 3 red 3 black | -16 | +16 |
+---------------+---------------+---------------+
| 2 red 4 black | -32 | +8 |
+---------------+---------------+---------------+
| 1 red 5 black | -64 | +4 |
+---------------+---------------+---------------+
| 0 red 6 black | 0 | -64 |
+---------------+---------------+---------------+
给定6人决策,red/black分别为对于决策的reward.
比如5人选择red,1人选择black的话.
结果就是选择red的分别得到-4的reward,black的得到+64的reward.
对应的最终winning是maximize reward并且有reward >= 0的约束.
这个本来觉得应该是没有什么悬念的.
选择black是相对唯一的理性选择.
因为选择red的话,最好的结果也只是最后equally rewarded,没有一个winning存在.
而对应的,这个是选择black的最差结果.
尤其如果以等概率考察等话,black的 strategy期望正的.
即使考虑到有概率偏差.
Earning = W_1*64 + W_2*32 ....
->
Earning = W_positive*Positive_constant + W_negative*(-64)
->
Earning_black = W_positive*Positive_constant + W_negative*(-64)
Earning_red = W_positive*(-Positive_constant) + W_negative*(64)
要使得red dominate black的话,就需要
Earning_red > Earning_black
-> W_positive*(-Positive_constant) + W_negative*(64) > W_positive*Positive_constant + W_negative*(-64)
-> W_positive*(-Positive_constant) + W_negative*(64) > 0
-> Earning_red > 0
这就是只有cooperate的时候才优于black,但此时并不存在满足winning情况(ordered reward)的可能.
所以,这个直觉上来说应该是没有人会选择red的.
但实际看到的结果是首轮甚至第二轮都是全员选择red的情况.
这个就有意思了.
补充一点就是,这里其实还有个隐藏要素.
就是,在某几轮的reward会有penalty/amplify.
但这个对于基本的逻辑不会有什么实质影响.
这里大概问了下对应人员的思考思路.
一个点就是这里的strategy的focus点在于先保障最终reward>0这点.
也就是在给定的有限轮博弈中,先试图保障一个比较安全的正向收益,然后在择机削减对手.
所以这个思路实际上是 对winning条件加了一个新的约束.
至少让social reward>0.
这点在后面的培训鸡汤解释中反馈除了这歌隐含假设.
这样的话,对应的social损益表就变为:
+---------------+---------------+
| choice | social reward |
+---------------+---------------+
| 6 red 0 black | +384 |
+---------------+---------------+
| 5 red 1 black | +44 |
+---------------+---------------+
| 4 red 2 black | +32 |
+---------------+---------------+
| 3 red 3 black | 0 |
+---------------+---------------+
| 2 red 4 black | -32 |
+---------------+---------------+
| 1 red 5 black | -44 |
+---------------+---------------+
| 0 red 6 black | -384 |
+---------------+---------------+
单纯看这个的话,选择red的gradient是偏向对于reward positive的.
也就是单纯只看social optimal的话,选择red应该是属于dominated的decision.
考虑复合情况.
选择红的动机在于用personal winning去tradeoff social optimal.
放一起就是
+---------------+---------------+---------------+---------------+
| choice | social reward | trade off + effective |
+---------------+---------------+---------------+---------------+
| 6 red 0 black | +384 | +64 + +448 |
+---------------+---------------+---------------+---------------+
| 5 red 1 black | +44 | -4 | +40 |
+---------------+---------------+---------------+---------------+
| 4 red 2 black | +32 | -8 | +24 |
+---------------+---------------+---------------+---------------+
| 3 red 3 black | 0 | -16 | -16 |
+---------------+---------------+---------------+---------------+
| 2 red 4 black | -32 | -32 | -64 |
+---------------+---------------+---------------+---------------+
| 1 red 5 black | -44 | -64 | -108 |
+---------------+---------------+---------------+---------------+
| 0 red 6 black | -384 | 0 | -384 |
+---------------+---------------+---------------+---------------+
这样的话,对于某一轮来说的game setting情况就是.
一个共同的social reward值,和一个差异化的 personal reward分布P.
对于一个分布P靠后的参与者来说,是没有修复social reward的动机的.
因为让social reward>0并不会对winning有任何帮助.
而同时,由于选择red的gradian是趋向于正的.
因此,这时候依然会是选择black成为一种dominated的strategy.
这样的话,动态地考虑,只要出现了一个暂时的winer的话,其他人就会迅速地切换到black strategy.
而在没有winner的时候,black strategy本身就是一个dominated的情况.
因此,即便是加入了这个social constrain,最终的趋势也依然是负收益.
也就是说,即使是加入了这个约束,理性情况下,也不会有人选择red strategy.
但事实就是出现了不但存在并且是全员red的情况.
即便是考虑到有轮数限制,但从上面的策略上来说,也依然不存在选择red的情况.
所以这大概就是为什么人类社会比较复杂难以描述的原因.
而且考虑到即便都是理性的,由于各自的模型和隐含约束不一定一致,也可能导致结果的不确定性和偏差.
于是,从这个角度上来说,social optimal本身就算是一个伪命题.
形式上来说,是不太存在可解性的.
订阅:
博文 (Atom)
人类本质是LLM
最近看到一些比较有意思的新词. 比如苹果小区. 还有一些就是比较热点的话题. 比如预制菜. 然后发散了下,想到了解构主义这个词. 本质上来说,之前的所谓互联网黑话体系,其实也是某种解构主义. 甚至往大了说,短视频以及互联网本身都是依靠某种形式的解构主义支撑的. 用某种冲击性,或者...
-
下午查了下关于仿制药的一点东西. 首先是关于一致性定义的相关文件. 简单的Google一般会指向NMPA/国家药监局的一些关于 化学药品注射剂仿制药质量和疗效一致性评价技术要求 的相关政策公告或者是更早期一些的关于这个文件起草意见稿. 一般理解的西药就是指化学药品. 这个文件本...
-
去看了好东西. 坦白说,多少是带着点挑刺的味道去的. 毕竟打着爱情神话和女性题材的气质,多多少少是热度为先了. 看完之后倒是有些新的想法. 某种程度上来说,现在的年轻人或者说声音就像小叶. 只要说点贴心的话就能哄好. 也是那种可以不用很努力了. 留在自己的舒适区避难所小圈子抱团就...
-
看完死侍与金刚狼. 倒也不是有什么太大的粉丝热情,只是有些感慨. 算一下,人生也差不多过半了. 有些想法可能也在不知不觉中变化. 就像想用随着年纪增长这个表达的时候,也会犹豫退却下. 尝试用随着时间之类的表达. 年龄是个什么意义? 可能更多的是一种经历与日渐消失的新鲜感之间的拉锯...