文本挖掘:预测未来的水晶球
2011年07月06日 来源: 科学时报
未来十年,哪些技术会对我们的生活产生重大影响?近日,英国《新科学家》杂志遴选出了七项技术,并作了解读。今天我们介绍其中的第四项技术。
从20世纪80年代开始,政治科学家Philip Tetlock就致力于从那些有远见卓识的人们那里搜集预言。他的关注对象主要是280位专家,他们大多是电视评论家或者政府顾问,能够就诸如中国崛起或中东安全等问题作出自己的预测。
随着时间的流逝,Philip Tetlock会检查他们的预言是否已变为现实,其结果却往往令人沮丧。“那些花费了毕生时光研究世界发展态势的人,其预言的准确程度甚至还不如一只猴子投掷飞镖的命中率高。”一位对Tetlock的研究知情的人士这样评价。
但是,现在出现了一种新型的强大的预测方法——“文本挖掘”,使得情况有了很大的不同。这项技术能够将网络上海量的信息汇集到一起,包括人们发表在博客上的各种评论、意见,以及贴在Facebook等社交网络上的各式言论等,对这些信息进行取样分析,从而获得对于世界局势的洞察力,并据此对世界的未来作出预测。
研究者们还发明了一种对国民焦虑程度进行测量的方法,这种方法非常有效,足以提高对股票市场动向预测的准确度。还有人将谷歌搜索作为一种预测工具来使用。例如,他们搜索出的大量与工作有关的条目显示出失业率正在上升。
这仅仅还只是个开端。目前有几家公司正致力于将整个互联网的信息一网打尽,分类存档后进行分析,以作出更加有力的预测。位于美国加州尔湾的WiseWindow公司,宣称他们正在监测Facebook以及其他社交网站上人们发表的超过7700万条评论。这家公司从这些浩如烟海的信息中搜寻数据,从中找到能够显示消费者意见的线索以及一些潜在的趋势。不少公司和制造商前来购买这些信息,将其视为打败竞争对手的制胜法宝。
上述由公司作出的预测并没有经过深度检测,至少没有公开地被检测过。但是,如果人们能够证实这些由公司作出的预测,其准确度与专业人员在网民言论和词条搜索的基础上所作的研究同样成功有效,网络预测将会被大大地推进一步。
这对于我们所有人来说都是一个好消息。比如说,利用它,政府如果能够更有效地控制经济趋势,他们或许能把经济衰退扼杀在萌芽状态:一个基于社交媒体的预测体系也许能对阻止2008年的金融危机有所帮助?现在做出这样一个大胆的判断可能还为时过早,但到目前为止网络预测所取得的成就显示,上述愿望并非不着边际的幻想。
当然,任何事物都有不好的一面。如今,人们在博客上贴出的那些分享彼此想法的意见和言谈,早已变成了广告商的目标。不管喜不喜欢,事实上所有网民都已成了一个巨大的市场研究项目的组成部分。(郭勉愈/编译)