2019-07-29

从排序想起

考虑,从set S中根据偏好P选取一个元素E.
本质上就是用P对S进行排序的问题.

或者说order的问题.

考虑通常意义上的三个关系.
大于,等于,小于.

考虑没有symmetry/cyclic的情况.
即,大于小于的一个order chain不构成一个环.

那么大于小于可以合并为一个符号.

定义等于为=,非对称的大于小于为!=.

则给定任意a,b.
两者要么是=,要么是!=.

换一套符号表示的话.
f({a,b})= {=,!=} = {0,1}就算某种形式的binary classification.

考虑到前面的非对称限定,f({a,b})可能undefined的话.
回归三值,=,>和<,就是triple/muti classification. 那么从这个角度看. 排序的数组就是某种形式的index结构. 索引的是所有可能组合的分类结果情况. 也就是从element e->number index -> {=,>,<}的一个路径.

formalize的话.
就是给定一个set X,如果存在一个映射f.
满足f(x \in X) = N.
使得C(f(a),f(b)) = {=,!=} = {0,1}

如果是一个multi class的话,给定number of class=K
C(f(a),f(b)) = C_k(f(a),f(b)) = 1; C_{k-1}(f(a),f(b)) = 0.
也就是将为零的递归下去.

但是这个f不一定存在.
因为可能根本不是有序定义的.

但如果存在的话,如何去寻找这一个f呢?

如果ab所在的set S是有限的话.
那么实际上C是一个确定的集合.

此时的f只要任意一组满足C的数列就行了.
而这样的数列可以在排序过程中构建.

如果S是不确定的呢?

这样的S可以分开为一个确定的集合S_0和一个非确定的集合S_u.
确定的部分如上构建.

S_u的元素可以是S_0中相邻gap之间的任意一个数.
因为未知的S_u的元素必然是在S_0的L(S_0)+1的区间内.

于是未知元素的问题就是对于这几个区间归属的概率问题.

实际上,如果这个f确实存在,且是严格有序的.
那么新元素的问题实际上是一个插入问题.

所以f_u实际上是一个关于f的插入生成.

如果f不存在呢?

考虑S都是可比较的情况.

f不存在以图视角看待的话,S的路径存在回环.

因为如果不存在的回环的话,意味着元素都存在单向路径.
也就是存在严格的有序状态.

那么一个近似的解自然就是切断回环路径.

这样的话,主要就是图的partition问题了.

但这可能没有一个很好的方式去估算?
因为实际上这个图是fully connected的.
每一条边的移除都可能影响每一对节点的最短路径开销.

所以可能更实际的方式是做子图划分.
以期望得到的子图是符合预期的.

尽管同样地,似乎这种划分也不见得就有一个很好的代价衡量方式.

2019-07-21

自生长的动物园

微博timeline上看到这么句评论:
"不是,我们听周杰伦被嘲笑的时候,那些嘲笑的人还在听伟光正呢"

这是个蛮有趣的角度.

这一代人在成长的时候可能也没少冲突过.
最明显的就是当初对于韩寒的各种评价和所谓80后的各种stereotype.
只不过冲突的媒体平台是在纸媒和广播电视.

而现在的刷周杰伦,与其是说周杰伦不如是目标的蔡徐坤.
因为实际上一致存在的行为群体是蔡的粉丝团,以及其固有的榜单行为.

80后的这波行为更多地像是一种对既有话语权威的一种可能是最后宣誓主权.
或者说挣扎.

就像上一代对80后的批判攻击一样.
80后对后代的这种冲突也是基于他们自己构建的互联网社交平台之上的.

某种程度上来说,每一代人都在构建属于自己特色的一种交流沟通媒介.
而每一代的下一代都在这个媒介上或创新或颠覆出自由独有的文化圈子.

两者的冲突可能更像是一种意识形态上的冲突.

如果把时间拉回几年,从贾君鹏开始.
对比现在这场狂欢性质的群体行为的话,其实算是一种复刻的行为.

一种无厘头的群体式的兴奋与模仿.

它产生的是一种自发的,带有莫名激励性的一种传播扩散方式.
本身并没有很明确的功利性的目的.
甚至于从根本上来说,这是一种随机性很强的娱乐方式.

你知道它产生的特点和要素.
但并不一定能够体量级地工业化复制.

所以在80后打造这这个互联网社会里,这种被成为现象级的群体行为被赋予了一种mysterious的性质.
靠广告流量腾挪借力出来的互联网经济模式对于这种大范围的自发性参与有着天然的向往和需求.

而在这10几年间,流量/规模几乎是互联网社会所有商业模式的基础.

也因为此才有了数据驱动的运营方式.
作为一种简洁直观,有时候确实高效的衡量方式.

本质上来说,刷数据这一套游戏规则就是80后自己创造和鼓励出来了.
而稍显讽刺的是,被大规模应用的实际场景却并不是80后自己的偶像/娱乐需求.

就像最初那句一样.
周杰伦的数据并不好看.

这是在80后自己缔造的规则上成长起来的用户的一种常识.
是他们用于评论和衡量一个明星或者更宽泛的,一件事情价值的最原始最直观的本能反应.

恰恰是这点,作为的规则创造者的80后却反而认为是有违常规的,不合逻辑的.

就像当初韩寒退学走自己认为对的道路一样.
独立自主和你应该如何之间的意识形态的矛盾.

所以这场冲突的吊诡点就在于.
规则缔造者本身对于规则的自然执行者间会有如此对立矛盾的立场.

或者说,形式上地,规则对于最初的制定者来说已经失控到他们自己无法接受或者说适应的情况了.

又或者说,文化的演变到现在其实是一种不可避免会有冲突的地步.
因为互联网本身的出现使得任意两点之间的交流成为可能.

就像以前贴吧的各种亚文化圈子.
它们可能甚至不能被主流接受,或者说根本不被主流道德所容忍.
但是从观察的角度来说,确确实实有着数量不少的同类人.

一个可能更明显但在今天来说稍显不太合时宜的例子就是ACG/二次元圈子.

这个本来是一个非主流的文化元素.
但是放在今天来说,已经可能说是主流的一部分了.

甚至于从趋势上来说,更多的商业投入是倾向于这种新开发的文化领域的.

背后的逻辑可能各种各样.
但至少,这个本来亚文化的圈子逐渐成为社会中坚力量的时候.
文化的代次更迭让曾经的非主流变为常态应该也是其中一个因素.

所以粉丝刷榜单刷流量,从这种分类思路上来说,无非就是另外一种新生的亚文化圈子.

所不同的是,它作为一个非当前主流的典型被拉出来做了对比样本.
而从发展的角度来说,可能更说明这个群体正在成为一种主流文化的冲击和替补因素.

因为从结果上来说,这场文化上的冲突狂欢并没有显示出一方的压倒性的胜利.

这里可能必须承认的就是,也许80后认为这种刷榜单刷流量的行为并不怎么正确.
但事实上执行这一种价值观和行为准则的人并不能算是一个社会的小规模群体.

而且更重要的是,这种结果多多少少是80后自己一手造就的.

至于对不对,就是一个相对复杂的问题了.

刷话题刷榜单可能并不比参加演唱会买专辑来得又道德负罪性.
本质上是一种个体所能承受/付出范围内的一种方式表达.

甚至于打榜本身并不算是一个新的运营概念.

那么这种排斥感的根源是什么呢?

从结果上来说,流量明星吸收了更多的文娱资源.
这个是主动的也是被动的过程.

在给定一个相对静态固定的文娱投入的前提下.
一方的倾斜也就意味着另一方的退让.

从市场的表现上来说就是文化符号的次代更迭带来的不适应感.

因为目之所及的商业目标是一个更为新兴的消费群体.
是一个有异于自身的一个文化载体/社群.

所以说,这可能更像一种困兽之斗.

而讽刺的是,制造这种指标性牢笼的人,正好是其自身.

宛如一个自生长的动物园.





聊聊卡布里尼

最近看了部片叫卡布里尼,算是可能这段时间来比较有意思的一部电影. 故事也不算复杂,就是一个意大利修女去美国传教,建立慈善性质医院的故事. 某种程度上来说,也很一般的西方普世价值主旋律. 但是如果换一套叙事手法,比如共产国际的社会主义革命建立无产阶级广厦千万间的角度来看的话,也不是...