Internet网络上的多语言共存_互动科普

使用社交账号登录

购买价格:
付款方式:

互动科普

主页 > 科普纵览 > 信息 • 能源

Internet网络上的多语言共存

admin  发表于 2017年09月22日

最近几年中,通过国际贸易和好莱坞的作品,美国文化在世界各地的影响有所增强。随着Internet网络延伸到地球上越来越遥远的角落,出现了一个显而易见的问题:该网络是否会强化这一趋势,从而使英语的使用扩展到所有地方?或者是否会出现多种语言的共存使网上世界更加丰富多彩这样一种局面呢?某些观察家预言,地方语言将无法在网络上立足,英语将占统治地位。

英语占压倒优势的局面有若干缺陷。大多数人以英语为第二语言,他们对英语的掌握可能是相当粗浅的——仅足以理解一些最基本的东西,如天气预报等,有时甚至连这样简单的东西都还懂不了。对于稍微深入一些的讨论,几乎每个人都是倾向于使用自己的母语。如果Internet网络上不允许用多种语言对话那么它的促进国际交流的作用就将大打折扣。错误和误解将多如牛毛,许多用户将失去国际交流理应为他们提供的大量机会。

图片228.png

若干种因素将对未来Internet网络上最有可能出现的语言多样性产生影响。目前Internet网络的主机约有60 %在美国。除了北美和某些欧洲国家以外,世界上其它地方接入Internet网络的线路大多数都是最近才出现且很有限。但是各地的计算机正在越来越多地接入网络。随着通信网络的安装费用持续下降,Internet网络用户的分布将逐渐趋向于与计算机的分布一致。

Internet网络技术的成本低,而且从理论上说使用简便、使得某些作者——特别是使用拉丁字母的作者——能够用自己的母语发布或交换信息。某些主张用本地语言的人已经借助此网络来获取好处。例如,用法语发布的所有万维网网页中,约有30%来自魁北克、尽管说法语的加拿大人仅占全部讲法语者的5%。但是Internet网络在全世界无孔不入,这就有利于使用一种(至少在表面上)能被大多数人所理解的语言。因此我相信,Internet网络将会用多种语言进行局部交流,而用英语进行比较有限的国际交流。

当然,用世界上的大多数语言在网络上进行交流所遇到的技术困难绝不是微不足道的。最初设计的硬件和软件是用来处理英语文本的。但是,即使对标准的拉丁字符也存在麻烦。在Arpanet网络——Internet网络前身——的早期,该网络只能发送用7位ASCⅡ文本编码的电子邮件。(这种编码采用128个字符,每个字符均用7个二进制数字来规定。)而现在“扩充的简单信件发送协议”(Extended Simple Mail Transport Protocol)允许处理用国际标准化组织(ISO)规定的ISO一拉丁标准进行的通信所需要的8个数据位。ISO一拉丁标准采用256个字符,因此所有西欧语言中的区分符号(如高音符号和抑音符号)均可显示出来。但是,由于网络上的许多互联计算机的软件己经过时,因此第8个数据位有时会被遗漏,使得信息几乎无法让人看懂。1995年,我曾通过Internet网络向12000名用户发送每日法语新闻,其中有8500位用户要求他们接收的新闻用7位的ASGⅡ编码而不用毛病百出的ISO-拉丁编码。

虽然某些较新的程序可以用多种不同文字显示其输出,但大多数程序实际上是双语的。软件只能处理一种当地语言(如日语)和英语。有人可能会争辩说,显示其它字母的技术性障碍只不过是暂时的。万能码(ISO 10646)——用于世界上大多数文字的一种编码方案——的实施正在逐步取得进展。此种编码方案使用户可以接收几乎任何一种语言(虽然可能并不总是显示得正确)。

然而,我们还需要走很长一段路才能得到一个真正多语言的Internet网络。在这种网络中,一位作者可以在比如说一段俄文文字中加入一条希腊语录,并在南美读者的计算机上正确地显示出来。具有这样一种能力的软件标准已经出现。但是忙于抢夺市场的各大软件生产商正接二连三地不停推出新软件版本,使得开发多语言软件产品的厂商——这多半是些小企业——几乎没有机会跟上它们。

在现实生活中,译员帮助人们克服语言上的障碍。Internet网络上也可以使用翻译人员。但是由于网络上交流的资料数量极大,种类繁多,因此翻译人员的作用将是很有限的。只有机器翻译才有可能使我们更接近这样一种境地(或许是无法实现的幻想)。出席一次虚拟联合国大会的所有与会者都可以使用自己的母语,通过机器同步翻译为其已所有各种语言。

机器翻译的研究工作已经进行50多年,既有成功的经验,也有失败的教训。前实际投入的机器翻译系统数量不多,主要分布在日本、加拿大和欧洲(欧洲的多语言互译工作量是世界上最大的)。电子译员通常都是双语的,而且只能进行高度专业化的翻译,这样它们才能得出质量说得过去的初步译文以供编辑人员进一步修改。

第一种可供广泛的公开使用的系统是System,它可以翻译14对语言。早在1983年,此系统就在法国的家庭视频终端机网络(Internet网络上使用了。目前欧洲委员会使用的System每年要翻译数十万页文件。另一个成功的例子是Metoo系统,它用来对加拿大的气象报告进行英语和法语之间的互译。每天该系统一可翻译80000个词(约400份报告),每100个词需要编辑仪员作3至5处编辑。

多语言翻译将得益于若干小组目前正在开发的一种两步方法。第一步是把待翻译的文本全部分解为其各个组成部分(标题、段落、句子等),有可能时通过与作者联系加以澄清。然而把文木转换为一种中间的抽象表达形式,再用这种抽象形式得出各种不同语言的译文。如果需要把文本翻译成10种以上的语言,这项工作就是划算的。东京联合国大学最近宣布了一项旨在实现这一两步方案的10年合乍研究计划。

但是真正多语言的Internet网络只有经过国际上协调一致的努力才能实现。我们会对这个问题给予足够重视吗?答案是不明朗的。我们实在是太容易倾向于把英语作为一种唯一的公共语言了。

〔郭凯声 译 王世德 校〕


全部评论

你的评论