善用大数据
作者: 安之
2013.11.05来源: 经济日报
美国奈飞公司利用大数据技术拍摄《纸牌屋》的案例几乎已成为行业中最著名的励志故事。作为全美最大的DVD和网络视频租赁网站,奈飞通过数据分析技术判断出观众们喜欢导演大卫·芬奇和演员凯文·史派西,甚至通过他们按下暂停截图的时间点,来判断观众更喜欢哪些布景和画面。
然而,《纸牌屋》的拍摄方法也引发了人们对大数据技术的思考。如果仅仅按照大众对某种文化产品的兴趣和取向来制作商品,也许在市场上更容易取得成功,但另一些更有创意的产品可能一开始就会遭到抛弃,只因为它们尚不为人所知。有人将之精确地概括为“大数据偏爱潮流,但忽视杰作”。
大数据技术中的能量让人目眩,但它也并非是万能灵药,过分迷信大数据,则很可能过犹不及。
比如数据噪音问题,被分析的数据越多,它们在统计上能够呈现出的相关关系也必然越多,但在这些相关关系中,许多并没有实际意义,很有可能会将人们引入歧途,这种欺骗性有可能使真正重要的线索被隐藏在数据扩张的噪音之中。
此外,大数据的使用还有个边界问题。对大数据的迷恋还可能带来对“数字隐私”的侵犯。毫无疑问,可以获得的个人数据越多,其中蕴含的信息量就越大,从这个角度出发,一方面要从技术层面来保障大数据时代的隐私安全,完善用户保障体系;而在另一方面,对大数据采集的监管必须提上日程,个人信息保护的相关法律条文还应在操作层面上进一步细化,在确保用户知情权的前提下避免个人数据的滥用和非法售卖。
大数据是把“双刃剑”,《大数据时代》的作者之一舍恩伯格最近表示,人们必须以一种不仅欣赏其力量,而且承认其局限的态度来接纳大数据技术。使用者对大数据技术的态度和认识程度,将直接决定这一技术对未来的影响方向。