显示标签为“数据分析”的博文。显示所有博文
显示标签为“数据分析”的博文。显示所有博文

2014-01-29

微信是什么

最近微信因为新年红包的事情又热闹了一下.
于是随手查了下最近报道的微信用户数,大概是6亿.
再顺手查了下QQ的用户数,有意义的活跃用户数是7.5亿.

这两个数据倒是有些巧合的一致.

就性质而言,微信大抵是比较一致的.
毕竟,处于账号本身的原因,一个人大概就会对应一个微信账号吧.
这点不像QQ,可能存在这冗余.

这样想的话,大概可以认为这两个数据是合理的.
就是实际的有有效户数都在6亿上下.

考虑到QQ账号可以随手注册,加上一些诸如公私账号分明的用法.
如果说微信用户数已经超过QQ了的话,也不是不可能.

考虑到微信比较独立的发展历程,或者说假设QQ IM对微信的推广左右忽略的话.
那么一个问题就是,为什么这两个数字那么接近?

根据CNNIC 2013年中的一份数字是,中国互联网用户数是5.91亿,移动用户4.64亿.

先不管这个统计的渠道和形式问题,姑且认为是准确有效的.
那么,就说明QQ和微信大概就是人手一个账号的样子.

那么是不是可以认为说,一个互联网产品理想状态下应该有的用户数就是6亿呢?

查了一下2013年新浪微博的相关报道,有数据提到2013年3月底是5.56亿.
另一个是淘宝,about页上是近5亿,考虑到实效性的话,应该还要往上.

于是,貌似确实可以这么理解.
6亿是中国互联网用户的实际活跃上限.

那么,如果这么认为的话,反过来看新浪微博的僵尸用户数的话,也许没想象中那么高.

这里面除了淘宝之外,其他都可以算作是广义的社交工具.
也就是说,人数在重合并不是单纯的因为功能需求的重合.

换句话说,就是一个活跃的会上网的人,无论因为什么理由,最终都会接触到这些产品.

以前有这么一种观点.

互联网上活跃的有声音的都是一些所谓的精英用户,积极尝鲜.
尤其是面对一个新产品,一群产品经理和自以为产品经理的总是第一时间接触.
而这种"喜新厌旧"的人不代表最终用户的意见.

如果综合6亿人这个现象考虑呢?

不管喜新厌旧的这个观点是否正确.
至少特定于前面提到的几个产品而言,它们是事实上抵达了每一个人.

本质上来说,"喜新厌旧"的观点隐含的意思就是互联网用户是分层次的.
也就是说,有些是抵达不了的用户.

而6亿上限这个数字则说明,即使功能不同,也是有可能全部纳入到.

换个角度看的话,也就意味这,对于某一些特定的功能集合,它是没有所谓的用户层级的概念的.
反过来说,就是存在一个取悦所有用户的特定功能集合.

进一步来说,前面那些产品能达到这个共同的数量级,也就意味这他们之间存在一个公有的功能集合的super set.

淘宝解决的交易担保和买卖.
QQ解决的是沟通.
这两个都是浅显的显而易见的基本需求.

尽管从淘宝的角度来看,有阿里旺旺这个类似QQ IM的沟通存在.
但是从基本出发点来说,阿里旺旺只是沟通需求里的一个交易子集而已.

作为一个细分场景,是没有能力取代全景需求的.

那么,财付通和拍拍呢?

原则上来说,完全可以是阿里的等价替代品.
没有替代的原因大概不是因为功能不对,只是因为没有足够的动力去促成参与者选择/博弈结局的改变.

但微博解决的是什么问题呢?

在这方面新浪的思路和立场应该还是正确的.
资讯的需求.
或者说媒体属性.

所以它用门户媒体的思维,请明星,推媒体,尤其是把原本零散地门户里的新闻消息,通过一个比较轻的方式聚合起来了.

因此,看上去跟QQ一样同是社交属性,但也只是形似而神不似而已.

从这一点反观的话,腾讯微博重纯粹的沟通社交这点就类似拍拍的局面了.
无力改变博弈的均衡点.

最后是微信.

微信改变了什么?
或者说微信解决了什么问题?

如果没有明确答案的话,也就说明,对于所有用户而言,存在不存在公有功能的集合的super set这点毫无意义.
换句话说,就是用户是什么层次的这个问题也毫无存在价值.
进一步说,用户对于选择用什么,根本就没有一个标准,完全是随机事件.

这样的话,就有趣了.

于是.

微信是什么?


2011-02-23

浅谈用户价值模型

  某天被某叫去谈了某些事情.
  大体是什么打算云云.
  然后又说到了某部门以后要做的计划之类的.
  其中一个是所谓用户价值模型.

  听到这个词其实不只一次了.
 
  早前也想过,但没定论以及具体的实践还不好着手.

  最简单的衡量标准莫过于ARPU了.
  
  ARPU的问题在于,对于social game或者类似的用户流失很常见的领域来说,这提取有效用户数.
  当然,DAU/DMU可以一定程度解决这个问题.
  但即便以这两个为基础,还是避免不了每个月可能N%的用户是属于"新陈代谢"的.

  当然,如果用户的付费行为跟游戏时间经历无关,上面这个问题意义不大.

  所以,对于要不要修正用户基数的计算方式以使ARPU更精确,这需要看下首次用户的首次付费时间跟注册时间的关系分布.

  ARPU的另一个问题是,revenue的取舍.
  取所有历史数据当然最简单,但也比较没意义.
  因为如果这样的话,对于如果实际revenue衰减的话,可能在ARPU上反映不出来.
  
  所以通常的做法都是采用一定周期内的revenue来计算.
  
  这样的话,周期长短选择就需要些考虑了.
  毕竟,这个个消费周期的长短有关.
  比如一件商品可能固定在一个时期内没有多少销售,那么将这段时期作为一个独立计算周期来考虑的话,意义就不是很明显了.

  所以,ARPU的计算周期也应该是跟消费方式有所联系的.

  但是,很多时候,消费行为是无固定模式的.
  如何解决呢?

  其实换个角度,借鉴下AMPU的某些思路也许就可以解决.

  ARPU的目的是衡量用户revenue的平均水平.
  换句话说,对于包含付费和非付费用户的系统来说,其实讲述的就是将付费用户的revenue"分配"到非付费用户身上.
  于是,通过对于ARPU的计算就归结到:
  对于任意时间段t,可以有total revenue Revenue(t).
  而根据付费记录历史和用户创建/活跃时间,可以得到一个比较准确的T时段内的paid比率P.
  即ARPU=Revenue(t) * Paid

  从这个指标等式的两个因素可以看出,
  如果能维持一个相对固定的付费比的话,提高单价是简单快捷的提高ARPU的方式.

  当然,提高单价也许可能会影响付费比.
 
  但如果用户对价格的sensitive是可以衡量的话.
  假设销售价格p跟数量Amount的关系为Amount=Trade(p),
  价格对付费比Paid的影响为Paid=Sensitive(p)

  于是ARPU就可以修正为:
  ARPU=(Amount*p)*Sensitive(p) = Trade(p)*p*Sensitive(p) 
  
  从这里,如果有数据表明付费行为跟商品定价有关的话.
  那么可以很直接地从上面等式可以有
  ARPU=Function(p)
  即ARPU跟价格直接相关.

  那么Function应该是大致是怎样一条曲线呢?
  考虑
  Amount=Trade(p),价格和数量关系.以及 
  Paid=Sensitive(p),价格对付费欲望的影响.

  假设,对于这两个等式的认识都是常识性的.即价格提高消费数量增多,消费欲望降低.
  于是曲线Function(p)的趋势就取决于,是Sensitive占主导呢还是Trade占主导.

  对于Sensitive的取样,也许可以对销售物品价格和付费人数的关系做个计算.
  对于Trade的取样,也许可以对销售品价格和付费次数的关系做个计算.

  但最终ARPU不能解决的问题是,它支持纯粹考虑直接的revenue.
  它没办法衡量非付费用户,甚至付费用户本身的价值.
  它只是一个平均观测.

  那么,如何建立一个比较全面的用户价值参考呢?
  对于付费用户,相对简单,可以直接对其群体套用ARPU.
  但是对于非付费用户也许就要花些时间.

  比如,一个用户也许不直接付费,但是通过它的渠道过来的可能付费用户占了相当一部分.
  但是因为它没有直接的付费计算,所以价值被低估了.
  
  再比如,有些用户也许不付费,渠道也不怎么样,但是可能扩散性很好,或者活跃度很高,对于这类用户又该如何评价呢?

  这个其实可以参考adsense或者之类的思路.
  付费用户的每一次付费行为其实就算是一次点击,于是,对于其他非付费用户来说,就是参考content provider,或者campaign什么的.

  但是问题还是在于,如何把付费用户的付费行为转换为非付费用户的"广告分成".

  换句话说,就是付费行为跟非付费用户的相关度有多大?
  这么衡量这个相关度?

  一个简单但未必有效的方案就是.
  加入某个付费用户有n个好友,一次付费m的话,那么可以简单的对每个好友增减n/m的rank.
  这样的话,理论上,每个用户都会得到相应的价值rank.
  
  这样的话,一个问题就是,对于有很多付费好友的用户来说,它的rank很高.
  但它未必是有价值的用户.
  比如,它可以是故意加很多付费用户.
  或者它是一个沉默/不活跃/流失用户.
  这时候,即便它没有任何行动,rank也可能很高.

  如何过滤掉和谐噪音呢?

  可以考虑加入活跃度和交互亲密性来过滤掉.
  即在上面的rank的基础上,乘以有活跃度和亲密性生成的weight.

  随着而来的一个问题是,活跃度和亲密性如何量化.
  还有就是,能否把两者合并一下,变成一个普适的参考量.

  这是一个问题.
  
  对于合并普适的问题比较容易解决,可以转化为对行为的rank.
  参考下诸如豆瓣等的recommended就有大概模式.
  即,每一个行为都会得到一个rank.

  但,
  但是,
  如何定量?

  回到那个问题,要过滤的是那些实际跟付费用户没关系的人的rank.
  那么,什么是有关系的人呢?
   
  1.有相互访问行为.
  2.共同好友有显著重叠.

  这样的话,就简单多了.
  一共同好友所占的比例为基数,然后通过对访问行为通过类似facebook的like算法可以得到一个应该比较合理的weight,于是,算rank和用户价值就很直接明了了.

  一个有趣的问题就是共同好友衍生出来的其他一些东西.
  诸如social graph,不同游戏里同一帮好友的付费情况,交互情况等.
  以及,到底这个整个用户的graph是"联通"的还是..."移动"的...
  即,所谓的"6度"具体到某个特定群体是怎样的展现..

  诸如此类,不一而述  

何乐不为

去看了长安的荔枝. 前半段还可以,尤其像荔枝林里不知道是笑还是哭的几个镜头表演算是相当出色了. 结合人物背景的那种对目标的绝望与对当下人际环境的希望的交叉矛盾心理. 后半段就有些过滤潦草了. 如果说整片是对于一骑红尘妃子笑,无人知是荔枝来的解构的话. 带入民生潦倒涂炭这点是没问题...