为什么这段话饱含泪水为我对大数据爱得深沉。
在当今的中国,你不能把大数据仅仅看成一项技术,它已经成为互联 时代一种新宗教。现在,IT 相关或不相关从业者们最关心的三个终极哲学问题就是:我从哪里来要到哪里去为什么会出现在大数据群里(见下图)然,笔者并非此教的神职人员,因此更多的是从旁观者的角度,来探讨“大数据教”的源流与发展。

首先,要解释一下“Big Data”这个词本身。大多数读者可能并不知道,其中的“big”这个词,实际上是音译自汉语的借词,而原文诸位都不陌生,就是“逼格”。为什么要在“data”前面加上这样的定语呢数据在宗教化之前有什么实际功用么数据相关的 会阶级现状与诉求又如何呢着急,听我慢慢道来。
我们先来看看历史上狭义的大数据是什么样的。在互联 纪元之前,主要的数据处理是针对交易数据。什么是交易数据呢就是业务运营过程中不得不记录的数据,例如银行的转帐、存款、利息,运营商的充值、流量减免等。由于一致性要求高、时延控制严格、价值密度高,交易数据的加工和处理并不简单,而传统的 IT 厂商,特别是 IOE(IBM、Oracle、EMC),在这方面积累了大量的产品和经验。
而互联 诞生以后,以用户上 行为为代表的行为数据,也被无心插柳地记录下来了。这些行为数据的体量巨大,但在一开始并没有得到真正的重视。不过,随着个性化推荐、计算广告、个人征信等业务优化和变现应用的开展,大家发现,这些行为数据里也蕴含着巨大的总量价值。不过,由于价值密度低、一致性要求不高,行为数据的加工处理,往往并不适用 IOE 的方案,而是为成本大大降低、吞吐量大大提高的开源框架所替代,并且其输出的结果一般是服务于自动的机器,而非领导与人工决策者。
简单来说,以开源框架为基础,大规模地处理用户行为数据,并服务于自动化的决策过程,是大数据在宗教化之前基本的外延。
然而,当主流媒体和专家讨论大数据时,你看到的却往往是这样的语录:
-
大数据科学家=统计学家+程序员+讲故事的人+艺术家
-
“体会、体验、直觉、灵机一动、内省”这些看似与大数据无关的东西有可能恰恰就是大数据的核心
-
全球数据量每 18 个月翻番,到2015年,中国专用大数据人才预计缺口将达到 1400 万
-
大数据将改变{你的生活|全球贸易|传统教育|石油开采|…}
如果将这些语录收集在一起,一本新的经书就诞生了。与《圣经》或《古兰经》一样,它涉及你生活的方方面面,从灵魂深处对中午吃面应该打什么卤、出门应该先迈哪只脚,以及是否应该带着尿布喝啤酒等问题(编者注:沃尔玛通过大数据分析发现年轻的爸爸买完尿布通常会买一瓶啤酒犒劳自己,因此沃尔玛就把啤酒和尿布放在一块销售),给予哲学上和方法论的指导。这就是让每一个互联 人疯狂的大数据教。
大数据教的影响已经渗透到了我们身边的每一个细节之中:去年,一位快板表演艺术家曾经找到我,跟我探讨是不是能把他们这种艺术形式改名为“大数来宝”;前两天,我几岁的儿子困惑于我和别人通话时经常提到的“大数据”一词,满脸狐疑地问我:“爸爸,你为什么要把大树锯了啊
大数据能够在中国的土壤上开枝散叶,取代阴阳五行成为解释和指导世间万物的第一法则,并不是偶然的,这与中国人的宗教观大有关系。笔者有位朋友的远方亲戚,在西北三次皈依某教,因为每皈依一次可以领一袋面。听说不明真相的教皇老人家,看着中国教徒数量的增长沾沾自喜。我有点莫名的悲哀:难道他连积分墙的留存差都不懂么/p>
既然宗教已经由目的变成了手段,那么信什么,怎么信,就不再是一成不变的,而且可以与时俱进,不断发展和演变。这样的宗教观在越南人的高台教那里达到了顶峰,看看他们的诸神列表就明白了:高台仙翁大菩萨摩柯萨、释迦牟尼、耶稣、老子、孔子、观世音、李白、关公、姜太公、牛顿、维克多·雨果、莎士比亚、丘吉尔、克里孟梭、孙中山。您还打算信什么给您预备齐了!那么大数据这样一个让万民兴奋的概念,自然不会被中国的宗教缔造者们放过。
一门宗教的兴起,少不了两个必要的条件:
首先,要有大多数人的认知层次不能解释的自然或 会现象;
在中国传统的商业运营中,数据的作用是被严重忽视了的。大量以个人崇拜和价值观为核心竞争力的中小企业,从来没有想到过用数据来辅助老板们的神谕。因此,当他们听说大洋彼岸的互联 众巨头居然在数据神的帮助下,建立起一套躺着挣钱的商业体系,顿时感到无比错愕。
于是,他们在生命中第一次拿起了计算器,打开了 Excel,面对着跳动的小数点激动地流下泪来。“I got it! I got it! Big data! My god!”而大数据,也就理所当然地成为他们心目中的神祗,和自己后半生财富无可替代的守护者。至于 Hadoop、Spark 这些神物,就如同新宗教里的云、罗、伞、盖、花、罐、鱼、肠,无需窥视其中天机,只要虔心礼赞与宣传。
其次,某些特定的人或阶级能够从中获得权力或利益。
大数据这样一个宗教化概念,能够为其教士群体带来什么样的利益呢中国,一个概念要想成功宗教化,成为政府、企业、资本和不明真相的群众共同膜拜的对象,关键要看其是否能“落地”。这里的落地,指的是落实到房地产行业。对下层信众而言,管你是基督教、天主教还是印度教,谁能分给我一袋面,我就信谁!
对上层教士而言,管你是物联 、电子商务还是云计算、大数据,谁能让我找个由头拿地,我就传谁的教!你看看这些概念,电子商务,可以建仓储基地;云计算,可以建计算中心;而大数据,可以建数据中心。管他是仓储基地还是数据中心,总免不了有些配套的写字楼乃至住宅,这才是整个体系关键的杵门子。
于是,在万民顶礼大数据的时代狂欢中,上层集团通过对教义(白皮书)、教会(行业联盟)、教主(大数据专家)的组织与控制,可以获得土地与财富,尽情地享受供养的特权;而中层教士们通过宣教大数据乌托邦,为各品种的猪插上数据的双翼,顺利地飞上风口,自己也可以在大数据时代守住中产与 会的中坚地位。
大数据教兴起的时间虽然不长,却诞生了错综复杂的诸多流派。除了共同信仰大数据神,他们在教义和戒律方面几乎互无关联,特别需要一次系统的论战与总结。大数据教的主要流派包括:数据中心派、Excel 派、解决方案派、开源工具派、形而上学派、精品购物指南派等等。
令人遗憾的是,在这样的时代里,还有部分企业和伪专家,置改造世界的伟业于不顾,拘泥于站在阴暗面上 Hadoop 和 Spark 的 Bug、指摘个性化推荐算法的局限性,深深地陷入工具主义和实用主义的泥潭。这样狭隘的视野与思维,恐怕迟早为行业洪流所淘汰。
@北冥乘海生 2018.9
——————
推荐阅读:
《The Coder》9 月刊聚焦程序员的职场江湖
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!