多媒体大数据时代须解决四大问题
来源:科学时报:2013年08月22日
“不管你同意还是不同意,多媒体大数据时代已经到来。”日前,中国工程院院士、北京大学信息科学技术学院教授高文在北京举行的第五届中国云计算大会上如是说。他还认为,在多媒体大数据时代,传输、存储、处理、应用是四个需要解决的问题。
“对于多媒体大数据时代,我相信大家都已身处其中。一个最典型的感觉,不管我们把它叫做‘云’,还是叫做‘大数据’,现在数据量都增加得非常快。”高文表示,预计到2020年,整个网络中的各种数据量会比现在增加50倍。网络时代数据量的急剧增加,既可以给人们的生活带来很多好处,也会给数据处理带来很大的麻烦。
高文进一步指出,实际上,人们处理数据乃至生活、工作的方式都已经被大数据改变,具体体现在五个方面。
首先,数据产生的方式被极大地改变。“以前的数据生产都是由专业团体完成,但现在数据更多来自个体行为,每个人都可以使用手机、电脑等产生大量的数据。”
第二,数据的传播途径发生了很大变革,以前人们获取信息的渠道基本上是报刊、电视、广播等传统媒体,但现在互联网已经变成媒体传播的主要途径。
第三,社交环境发生网络化变革。以前人们交朋友主要依靠身边的生活圈子,现在则更多依靠互联网。
第四,数据存储的习惯发生变化,以前人们都希望将数据存在电脑上,或者存储到软盘上,但现在大多数人会选择将数据“丢”到网上,进行云存储。
第五,社会安保系统发生变革。城市里有很多的传感器、摄像头,在案件发生后,调用这些数据即可加快破案,“虽然这个系统现在还没有真正实现,但实现之后会使我们的生活产生非常大的变化”。
在数量庞大的大数据中,图像和视频数据占据的比例最大。2012年的统计结果显示,图像和视频数据已经占到整个大数据的80%。“今年图像和视频数据在整个大数据中的比例已经接近90%。数据大了以后怎么处理、怎么挖掘出有价值的规律,是我们首先需要解决的问题。”高文认为,如何处理这两个最大的数据是一个巨大的挑战。
在高文看来,大数据的传输、存储、处理、应用是4个需要解决的问题,尤其是和图像、视频有关的数据。“以数据存储为例,现在街上的摄像头所拍下来的东西不会被永远保存,有的会存三个月,有的存一个月就会被覆盖掉,这是很可惜的事情。为什么会这样呢?因为存不起,费用太高。”他表示,为了解决这一问题,目前科研人员正在从事第三代编码技术的研究,以提高视频的压缩效率。