新技术,瞄准网上内容难找难管问题
2018-01-19 来源: 新华网
实现全民科学共享内容大数据面临服务如何匹配个人,内容如何安全可信,国家如何依法管理等挑战,需建立对内容大数据进行有效标识的创新方法和技术标准。中国工程院院士、东南大学未来网络研究中心主任李幼平提出一种“标识网页内容”的“统一内容标签”(UCL),用短数据“内容标签”引领大数据共享,弥补“统一资源定位符”的语义缺失和管理缺失。
据了解,UCL技术通过预先设定的标准对网络内容进行自动归类并贴上标签,通常是对内容的类别、主题、出处、作者、关键词、话题等作出多维度的标引,帮助用户在搜索时剔除大部分无效信息,再根据用户访问习惯、偏好等精确抓取用户兴趣点,推送用户感兴趣的内容,建立“内容自寻网民”的主动服务机制。
据东南大学未来网络研究中心副主任杨鹏介绍,针对目前互联网信息真假难辨的状况,“统一内容标签”还能通过给门户网站内容标注“一级来源”、“二级来源”等溯源信息,把关联的各方观点“打包推送”给用户,给用户更全面的参考,便于他们辨别。
据悉,历时5年完成的《统一内容标签格式规范》于2017年12月29日由国家质检总局、国家标准化管理委员会正式批准颁布,为统一内容标签的推广、普及和应用,以及内容大数据的规范标引、高效共享与依法治理等,提供了标准支持。