某种程度上来说,微信抢红包的行为模式还是挺有代表性的.
"抢"的动作实质上是某种方式的reward function.
然后就是根据各自的reward promote/elect出新的activator,而后继续下一轮的reward.
也就是纯粹的reward -> elect -> reward 这种类feedforward的形式.
类似的还有某些诸如劝酒等酒桌文化的一些东西.
而原则上了来说,这些场景下的所谓氛围如何,实际上就是这个pattern repeat的次数和周期如何.
也就是这系列的function是衰减的还是稳态的抑或增长的.
从构成形式上,主要是reward和elect两个layer的共同作用的结果.
换句话说,最终social sphere如何,取决于这两个layer之间的互相调整的结果.
就像赌钱.
如果某个参与者的reward低于一定程度,那么就有可能发生退出,从而需要对feedforward的计算形式进行重新调整.
而即使参与人数的变化不会对reward function及其相关过程产生影响,但是如果elect出来的新的activator有问题,或者根本elect不出来的话.
那么,对最终的结果也是有影响的.
比如抢完红包之后,没有promote出新的人选出来.
这样自然也就没有所谓的新的reward了.
所以,如果给定一个objective的话,如何设计一个尽可能理想的crowd behavior呢?
因为存在两个互为input/output的layer.
所以,如果两者是相互独立的,或者说不相关的,那么某种程度上来说,就等价于是接受一个random input的layer.
也就是说,在这种情况下,如果有一个既定的objective的话,那么运气的成分可能占主要部分.
而如果两个是dependent的,比如是简单的线性变换的话,那么其实就等价于一个有着确定input的transform layer.
在一些情况下,就是类似time serial的问题了.
也就是说,如果在给定一个activator的情况下,各个参与者的reward也是已知的,那么要达到既定的objective的话,只要适时调整elect的策略即可.
反过来说,如果elect的策略是deterministic的,那么,只要调整reward的策略也有可能逼近objective.
比如如果赌博的objective是维持各方帐目均衡的话,且elect是赢家开局的话,那么reward的策略就可能要考虑到输赢的倍数问题.
而像微信红包的话,尽管看上去reward是随机的,但是,概率分布是确定的.
所以,如果考虑的参与者的定义从具体的人,变换到某个分布上的人的话,这个reward就是"已知"的.
那么,elect的策略的制定应该也是以这个"参与者"的定义来决定的.
换句话说,这种"社交"是可以设计出来的.
也就是说,本质上来说,这种设计出来的机制并不直接依赖人与人的关系.
而纯粹是规则运作/保障的交互.
所谓的系统化社交.
没有评论:
发表评论