2015-02-23

系统化社交

某种程度上来说,微信抢红包的行为模式还是挺有代表性的.

"抢"的动作实质上是某种方式的reward function.
然后就是根据各自的reward promote/elect出新的activator,而后继续下一轮的reward.

也就是纯粹的reward -> elect -> reward 这种类feedforward的形式.

类似的还有某些诸如劝酒等酒桌文化的一些东西.

而原则上了来说,这些场景下的所谓氛围如何,实际上就是这个pattern repeat的次数和周期如何.
也就是这系列的function是衰减的还是稳态的抑或增长的.

从构成形式上,主要是reward和elect两个layer的共同作用的结果.

换句话说,最终social sphere如何,取决于这两个layer之间的互相调整的结果.

就像赌钱.
如果某个参与者的reward低于一定程度,那么就有可能发生退出,从而需要对feedforward的计算形式进行重新调整.

而即使参与人数的变化不会对reward function及其相关过程产生影响,但是如果elect出来的新的activator有问题,或者根本elect不出来的话.
那么,对最终的结果也是有影响的.

比如抢完红包之后,没有promote出新的人选出来.
这样自然也就没有所谓的新的reward了.

所以,如果给定一个objective的话,如何设计一个尽可能理想的crowd behavior呢?

因为存在两个互为input/output的layer.
所以,如果两者是相互独立的,或者说不相关的,那么某种程度上来说,就等价于是接受一个random input的layer.

也就是说,在这种情况下,如果有一个既定的objective的话,那么运气的成分可能占主要部分.

而如果两个是dependent的,比如是简单的线性变换的话,那么其实就等价于一个有着确定input的transform layer.
在一些情况下,就是类似time serial的问题了.

也就是说,如果在给定一个activator的情况下,各个参与者的reward也是已知的,那么要达到既定的objective的话,只要适时调整elect的策略即可.
反过来说,如果elect的策略是deterministic的,那么,只要调整reward的策略也有可能逼近objective.

比如如果赌博的objective是维持各方帐目均衡的话,且elect是赢家开局的话,那么reward的策略就可能要考虑到输赢的倍数问题.

而像微信红包的话,尽管看上去reward是随机的,但是,概率分布是确定的.
所以,如果考虑的参与者的定义从具体的人,变换到某个分布上的人的话,这个reward就是"已知"的.
那么,elect的策略的制定应该也是以这个"参与者"的定义来决定的.

换句话说,这种"社交"是可以设计出来的.

也就是说,本质上来说,这种设计出来的机制并不直接依赖人与人的关系.
而纯粹是规则运作/保障的交互.

所谓的系统化社交.

聊聊卡布里尼

最近看了部片叫卡布里尼,算是可能这段时间来比较有意思的一部电影. 故事也不算复杂,就是一个意大利修女去美国传教,建立慈善性质医院的故事. 某种程度上来说,也很一般的西方普世价值主旋律. 但是如果换一套叙事手法,比如共产国际的社会主义革命建立无产阶级广厦千万间的角度来看的话,也不是...