站在大数据的最前沿
2014年11月04日 来源:中国科学报 ■本报记者 计红梅
10月24日,谷歌公司传来一则消息,这家搜索巨头刚刚聘请了7位牛津大学学者来帮助其开发DeepMind人工智能系统。
这则在圈外人看来并不起眼的新闻其实颇有玄机。
此前,5月16日,百度宣布,聘请原斯坦福大学教授吴恩达(Andrew Ng)出任该公司首席科学家,全面负责百度研究院。吴恩达是著名的“谷歌大脑”项目发起人。9月10日,百度又正式宣布,聘请前微软全球资深副总裁、微软亚太研发集团主席张亚勤担任总裁。而张亚勤近期在百度的主要精力将集中在人工智能的开发。
种种迹象表明,人工智能领域的人才大战硝烟弥漫。
为什么人工智能突然这么火了?
在10月23日~25日于河南郑州举行的2014中国计算机大会上,2013年6月加入百度负责大数据实验室的原美国新泽西州立大学教授张潼对其中的原因进行了揭秘:因为大数据确实来了。
大数据落地
“我们以前谈了很多虚的概念,但大数据确实是非常真实的,而且互联网企业已经把它真正做起来了,让它落地了。”10月24日,一向低调的张潼出现在2014中国计算机大会的现场。这位机器学习、大数据分析领域“大牛”的出现,让现场很多人颇感兴奋。
实际上,大数据是今年中国计算机大会当仍不让的“红星”。中国工程院院士赵沁平、IBM中国研究院院长沈晓卫等很多与会的信息领域知名学者的报告中都提到了大数据。
他们站在大数据研究的最前沿,对大数据汹涌而来的力量感受也最为深刻。
“人工智能领域有四位知名的学者,原本都在学术界的,现在三位已经被企业重金聘走了,这其中包括神经网络先驱Geoffrey Hinton和Andrew Ng。”在张潼看来,这些学者之所以为企业所看重,是因为将他们的技术应用于产品,确实取得了巨大的成功。而人工智能之所以在经历了上世纪60年代和80年代两次兴起又没落之后再次异军突起,则要归功于大数据的到来。
“与上世纪80年代相比,现在的数据收集能力、计算能力都有了很大的提高,再加上新的算法的出现,人工智能技术才产生了巨大的价值。”
沈晓卫也认为,目前信息技术领域有3个大的趋势,即大数据、云计算和移动通信。它们代表了IT行业三方面重要的变革,对我们的行业、工作和生活都产生了非常深刻的影响。单从行业来看,大数据就正在推动很多行业的转型,例如能源行业、零售业等。而数据的来源则除了传统的商业运营的数据外,还有来自社交媒体和物联网的数据。其中,来自物联网的数据大概占了80%。
黄金时代来了
“一方面是数据的爆发式增长,一方面是机器资源和数据处理能力的提高,其最终结果是产生了很多的价值。”张潼认为,现在是学习机器学习和数据分析的黄金时代。
事实也是如此。
1997年5月11日,早晨 4时 50分,国际象棋世界冠军卡斯帕罗夫在与一台名为“深蓝”的IBM超级计算机经过六局的对抗后,最终拱手称臣。
当时,沈晓卫还在读研究生。他觉得,虽然这一事件引起了全球很多媒体的关注,而且“深蓝”确实运用了很先进的深度搜索技术,但并没有超乎他的想象。此时的他,却很难设想在14年后,IBM的计算机系统“沃森”(Watson)能够以77147分的总分战胜美国智力竞赛节目“危险游戏”的冠军,在认知计算领域取得真正的突破。
之所以能够取得这样的成绩,沈晓卫表示,最核心的技术有两点,一是自然语言理解,即机器理解人类语言的程度;二是机器具有自我学习的能力,能够不断地从实例中学习。
而今,沃森又有了新的进步。它能够跟人类互动和配合,来解决人类或计算机独自不能解决的问题,从而帮助人类有新的发现或形成决策。而在沈晓卫看来,所谓大数据,从根本上讲就是要从数据中产生洞察力,从而为我们提供更好的决策支持。“从这一点来看,沃森系统已经让我们看到了未来的曙光,这本身是一个非常重要的里程碑式的突破。”沈晓卫说。
大数据带来的突破还远不止于此。
赵沁平在谈到虚拟现实技术的发展时,就一再强调大数据的重要性。赵沁平认为,虚拟人体是虚拟现实的终极目标。而虚拟现实的基础是数据,如果没有越来越多的科学数据,以及强大的计算能力,虚拟人体这样一个目标就无法实现。
面临无边界的安全挑战
大数据所带来的,不止是技术上的进步,还有网络安全方面的严峻挑战。
杜跃进原来是国家网络信息安全技术研究所所长,现在则调到了正在筹建中的中央网络安全和信息化领导小组办公室。在他看来,随着大数据时代的到来,信息安全经历了一个螺旋式进化的阶段。从传统来看,信息安全从数据安全开始,发展到系统安全、网络安全。而现在,在大数据的背景下,又要重新开始审视什么是数据安全、系统安全和网络安全了。
一个例子是,在今年7月举行的SyScan360“特斯拉破解挑战赛”上,特斯拉电动汽车实际上是被成功破解了。360公司副总裁谭晓生透露,“虽然当时对外公布的仅仅是开了车门、天窗和后备箱,但没有公布的是把引擎打着了,不用钥匙就可以把车开走。”而之所以没有当即公布,是因为白帽子这个圈子的规则是,必须要等对方把漏洞修复之后才可以说。
谭晓生表示,传统的安全观认为,安全即边界。但随着互联网向“万物互联”的后移动互联网进化,现在的世界已是一个无边界的网络。边界思想也由此越来越不适应整个网络发展的现状,因为“万物”都已成为黑客破解的对象。
杜跃进也认为,随着大数据的发展,现在信息安全的空间比过去扩大了,而对抗的焦点也成了信息社会下的数据保护。网络安全对抗,不再仅仅是科学家和工程师的事,而是需要政治家、外交家、企业家、经济学家、心理学家和教育家等一起努力。更重要的是,大家要有全局视角下的安全思维。