“万万亿”次计算机当定何名?
作者:田淼 郭金海
2013年03月18日 来源:光明日报
大数定名,适逢其时
当前,人类已经步入了数字时代,我们经常可以看见用到大数据的报道,例如“天河一号超级计算机的峰值速度为每秒1206万亿次运算”、“人类未来可采剩余石油储量大致只有14000亿桶”……然而,由于东西方文化差异及历史方面的原因,中国社会在超大数字的实际使用过程中遇到了诸多新的问题:
一是尽快为超大规模数词命名。针对我国古代和现代国际上已有的数词,应当尽快确定相应的中文名称。
二是确定数词的定名原则。自明清以来,中国“万”以上的数词都采用四位进制(如万、亿、兆等),而国际上则采用三位进制(如千、百万、十亿等),导致在相互交流与文献互译方面产生了种种障碍。应当确定一个统一的数词定名原则,以有利于科学知识在公众间的传播,不致造成混乱。
三是需要对一些重要的常用数词尽快取得共识。例如,信息技术领域中,“兆”已经被普遍接受,人们也已习惯以“兆”表示“百万”(106),如“兆瓦”“兆赫兹”“兆字节”等。但是,在中国台湾地区则是用“兆”表示“万亿”(1012),因此在使用过程容易出现混淆的现象。
为逐步解决与科研工作乃至人民生活密切相关的数字使用问题,全国科学技术名词审定委员会召开了数词定名研讨会,请数学家牵头,组织天文学、微生物学、计量学、计算机技术、纳米技术等领域专家学者共同讨论,争取获得统一认识和意见。
经与会专家热烈讨论,全国科学技术名词审定委员会进行整理,取长补短,提出了有关数词定名的初步建议:
1.考虑到在实际生活中数词使用范围的可能性,数词定名的上下范围限定在1024和10-24。在此范围之外的数词定名建议使用科学计数法进行称谓,例如,1030就称为“10的30次方”,10-26称为“10的负26次方”。
2.数词和词头两套系统并行,词头系统执行《中华人民共和国法定计量单位》(1984年发布)的相关规定,数词可沿用中国古称。由于数词和词头的定名大不相同,所以建议应在初等教育阶段即将数词和词头系统进行区别教授。
3.建议依循“尊重历史、避免混淆、改动最小”的原则进行数词定名。即:106的词头仍用“兆”表示,而106的数词采用“百万”表示。为避免与“兆”混淆,1012的数词用“万亿”表示,1012的词头用“太”表示。从中国古代数词的词序来看,“兆”的量级一直大于“亿”,现在中国大陆地区用“亿”表示108的数词,因此用“兆”表示106的词头,在量级上与中国传统用法不一致。但目前“兆”在中国大陆地区的社会生活中已经成为习惯用法,故在词头系统中保留“兆”符合改动最小的原则。
4.为尊重历史、沿用传统,不建议中国“千”以上的数词定名采用三位进制,同时,为了避免与已定为词头的“兆”混淆,1012的数词直接称为“万亿”。即采用中国社会比较习惯的四位进制与八位进制的混合命名法,“亿”以下采用四位进制,“亿”以上使用八位进制进行命名。以此原则,1016的数词定名为“京”;1020的数词定名为“万京”;1024的数词定名为“秭”。(《中国科技术语》编辑部)
有关中文大数词问题的缘由和建议
2010年7月16日,计算机学会理事长李国杰院士给我发来电子邮件。大意如下:
“计算机的速度已经超出了中文常用的计数范围,目前在关于超级计算机的新闻报道中常出现一些不规范的计数。例如,同样的数值1018,有的写作百亿亿次,有的写作百万万亿次等。如果计算机速度达到1024,真不知中文该如何表达!
……
统一规范大数字的读法将越来越成为大众的需求……中国是有几千年文明的古国,连十几位的大数都没有一个标准统一的读法,实在说不过去。”
我向全国科学技术名词审定委员会说明了李院士的提议。为此,全国科技名词委专门召集各学科专家开会讨论大数定名问题。
会议所达成的共识非常有意义,对于目前大数词使用上的一些问题给出了基本合理的解决方案。不过,从长远看,这还是一个过渡性方案,一些根本性矛盾仍然没有解决。为此,提出以下建议:
1.保留两套数词体系,其中数词词头体系采用国际单位制(SI)并翻译成对应的中文数词词头,日常生活中的大数词(京、垓以上)最好也以某种国家标准的形式确定下来;
2.两套数词体系可以并行,前提是没有冲突,即不允许同一个数词在两套体系中表示不同的含义;但有时同一个数值可以用两套体系分别表示。比如计算机速度是每秒1京次,也可表示为每秒10拍次,具体使用哪个用法取决于具体应用场合和社会公众的接受程度;
3.两套数词体系的使用场合尽量加以区分,数词词头体系只在科学技术领域以及与国际交流的必要场合使用,其他场合都使用传统的数词体系;
4.数词词头严格限制只能与单位名词结合使用,不单独使用。比如计算机运算速度可以说是每秒1艾次,或者说是艾次级计算机,但不要说每秒1艾,或者艾级计算机。
此外,从长远看,“兆”解释为“百万”是不合理的,必须改变。建议尽量限制“兆”的使用,在时机成熟时,修订《中华人民共和国法定计量单位》,取消“兆”作为表示“百万”词头的含义。这时表示“百万”可以有两种方法:一是像台湾地区那样,不另定义词头,就用“百万”表示;二是另外定义一个表示“百万”的词头。我建议采用第二种做法,以加快“兆(百万)”作为词头的退出速度。另外定义的新“百万”词头,可以跟其他词头一样,采用音译法,比如说,把“mega-”翻译成“迈”。(作者为中国科学院计算技术研究所研究员 刘 群)
中国大数进位法之历史
在中国古代,大数是指亿以上的数字。古代文献中涉及大数单位的记载并不少见。最早的传世数学著作《九章算术》便含以亿为单位的数字。虽然有不同的进位体系,但我们所见的典籍中对亿的界定较为统一,多取万万为亿。然而,亿以上单位的界定并不一致。
民国期间,由于古代进位制的不统一及以四或八为基数的进位方式与国际通行的三位分节法的不同,大数命名问题引起学界的关注及争论。建议主体均取亿以下以十进位,至百万为兆,其后则采取千进,以与国际通用的数字三位分节一致,并使兆以上的单位可与英文单位名对应。然而,一直有学者和专家对此持反对意见。例如1933年4月,教育部刚刚制定提案便在其主办的天文、数学、物理讨论会上被修订为“个、十、百、千、万用十进法,万以上亿、兆、京、垓等用万进法”。再如1944年9月,国民参政会接受张伯苓的建议,通令采用新的大数命名标准,采取四位进制,于万以上仅设单位亿。民国以后各方对大数单位认定的歧议,导致了当今“兆为百万、亿为万万”这种与传统计数单位次序相反的现象。
1949年以后,大数名称及进位制仍较混乱。1986年12月31日,《人民日报》公布《关于出版物上数字用法的试行规定》:“4位和4位以上的数字,采用国际通行的三位分节法”;“4位以上的数字,尾数零多的,可改写为以万、亿作单位的数”。对此规定,学界亦不乏反对的声音。
如今,随着信息技术的发展,大数不仅出现于科学家、统计学家的研究和工作中,而开始进入日常生活,确立亿、兆以上的大数单位名及进位制的问题再一次引起社会广泛关注。
各方观点
中国科学院数学与系统科学研究院研究员严加安:
我认为,可以从“亿”开始采用“八位进制”(即乘以108)来规定更大的数词单位,在“亿”和“京”之间直接用“万亿”来表示1012就可以了。这样,直到1023的大数均可用“十、百、千、万、亿、京”来表示了。
后来,我又想到,何必拘泥于“八位进制”呢?直接用“亿京”表示1024(=108+16)不是比另外规定一个汉字来表示1024更方便和更容易理解吗?依次类推,可以用“百亿京”表示1026(=102+8+16),用“万亿京”表示1028(=104+8+16)。这样一来,用“十、百、千、万、亿、京” 这几个数词单位就可以表示直到万亿京1028(=104+8+16)这样的大数了。至于更大的数,譬如1030,当然也可以说成“百万亿京”,但用四个汉字叠加显得太拗口了,不如直接说成“10的30次方”更好理解,而且用这种方式可以表达任意大的数。
北京大学物理学院教授阎守胜:
大众普遍认可和使用的定名基本上应予保留。超出这一范围,主要是科技人员等专业人士涉及的部分,命名则要和国际接轨。
按此原则,一直到1012,普遍采用的“万”、“亿”必须保留,相应的有十万,百万,千万;万万为“亿”,随后有十亿,百亿,千亿,万亿。这里,问题最大的是“百万”。根据1962年中国物理学会对大小数命名法的建议,定名为“兆”,并在信息产业界得到认可和广泛的应用。建议处理为:106,定名为百万,又称兆,因为相对而言,“百万”用得更多,更为大众所认可。对于109,可定名为十亿,又称吉[咖]。对于1012,按照中文古称,应定名为“兆”,也和台湾地区用语一致,便于交流,但“兆”已用在百万处,为避免混淆和误解,建议1012定名万亿,又称太[拉]。
中国科学院数学与系统科学研究院研究员李文林:
表示百万的“兆”字已深入千家万户,如果改称“百万”或其他的字,人们会感到很不习惯从而造成某种程度的混乱。在目前的情况下,权宜之计是两套系统暂时并存,但逐渐弱化表示百万的“兆”。实际上,信息产品使用的“兆”为字头,而与其并列的其他字头目前均用外文字头的汉语谐音字来表示,如“吉”-G(Giga)、“太”- T(Tera),唯独表示百万的Mega使用了中国古代大数名“兆”。因此,逐渐弱化“兆”,突出缩写M,最终以一谐音字来替代,不失为一种过渡方案。
中国科学院计算技术研究所研究员张伟:
当务之急,是给“万亿”起个名字,因为“兆”字被挪用,用“万亿”来表示原本应当以“兆”表示的数量单位,是不得已的办法,且与传统的单个汉字表示法不协调。只要给“万亿”起个单名,四位进制方法就可顺利地推广使用了。最好找一个与兆音(zhao)相同或相近的汉字,例如,“炤”。
计量单位或单位词头,继续贯彻使用国家法定标准,特别是科技计量单位。
航天科工集团203所研究员叶德培:
建议保留汉字数字名称:拾、佰、千、万和亿。在表示如人民币大写数字金额等场合时,有常用汉字数字名称的按此名称,没有的则不必专门再造一个或再从古书中找一个字,可以沿用法定计量单位的词头表示。例如:104称万,108称亿,1012称太。万和亿是已有的常用汉字数字名称,1012没有常用汉字数字名称,则可用法定计量单位的词头“太”表示。目前来说,还没有将数词名称写到1016(即1万太)以上的需求。