



人类行为层级的大数据
人类的行为有差异和层级。对大数据源头公司,如亚马逊、谷歌或者推特、facebook的称谓,实质是混沌的概念,需要分清这些公司数据性质的迥异,就像不同的矿,有的是很轻易提炼出人的行为偏好、认知特征,是富矿。有的是很难提炼出人的行为偏好,人的行动逻辑,就像贫矿,很难。按照人在互联网的行为的差异和层级,互联网行为的可以按照下面层级分类。
1、微博行为。发微博(twitter)就是一种随意式的漫谈,没有任何固定的或者在当下感到紧迫的目标。从微博中很难发现那些紧迫的需求,以及稳定的偏好。中国微博市场已经变成了话语竞争市场,更多地收敛到公知那里,他们垄断了相当部分。
2、搜索行为。打开搜索框,关键词至少代表自己当时最感兴趣的东西,哲学上称之为“可欲”,它比漫谈要更聚焦也更迫切。它至少代表着一种真实的可度量的感觉。
3、网购行为。当人用真金白银去换取某个物品的时候,物品的各种性质反映着该人在这个时点上的所有意图和欲望,经济学意义上,购买行为产生“消费者剩余”,反映购买行为是值得的。
4、金融行为。当一个人将自己的财富从一个地方转移到另外一个地方,或者一个企业将自己的大量资金出借给另外一家企业,等等。它的行为含义更丰富也更确定。
几行为都会产生点击,产生大数据,大数据也变得有层级和有递进。微博“电火桶”,炭火桶是南方过冬必备物,微博提问“好用吗?”,得到好用的回复。——搜索框搜索 “电火桶”,了解外观、工作机理。——该不该买,价位如何?——看电商的价格及销量评价——如果OK——拍下。这是一个行为的递进,行为意图变得越来越清晰化的过程。从漫谈了解(微博)到兴趣诱致(搜索)到实际购买(电商)。
“购买才能确定真实偏好排序”,著名的谚语:“看一个人做什么而不是听他说什么。”
《大数据》中维克托用了两个故事,一个是谷歌根据搜索量提前发现疾病疫情。一个是百货公司给未成年少女寄孕妇产品目录。
对于疫情发现案例,印度不久前发生一次大流感。根据当地谷歌的搜索显示,“流感”搜索量最多的时候,并不是当地流感爆发加速的时候。因为这场流感是从乡村开始的,然后传到城市的。流感最厉害的时候感染了很多乡村的人,这些人很少上网,谷歌体现不出来。随后,城市开始流行,农村已经衰减,整体上流感已趋于下坡路,印度城市互联网很发达,很多人开始在网上疯狂搜索,造成不断加速的搜索量和疫情加剧的感觉。实际上,流感正在减弱。
案例说明大数据在第3级的超常稳定,第1级是很难提炼的,第2级有参考价值,由此,推特和facebook的独立价值存疑。人类行为是有排序和层级关系的,决定“大数据矿”的提炼。推特和微博独立的商业模式很难?漫谈信息作为大数据提炼,矿的成色太差,谷歌的搜索信息好一些,“可欲”至少意味着聚焦,所以谷歌推送“关键词广告”。亚马逊、阿里的数据成色是更好,代表着真实偏好。最好的数据是银行的财富转移数据、大借贷数据,代表更高的价值。
扫二维码用手机看


版权所有 北京裕润立达股权投资管理有限公司 京ICP备12032880号-1 网站建设:中企动力 北二分