| 蒙古文没有统一编码一直是阻碍蒙古文互联网发展的最大制约因素。许多蒙古文互联网爱好者也渴望有关部门通过召开互联网大会,统一净化市场,实现蒙古文编码的硬性统一。近日,内蒙古首个蒙古文搜索引擎qgool主要技术负责人郭刚向记者介绍,经过2个多月的测试,一种可以实现多种蒙古文编码统一的转换技术被成功应用到蒙古文互联网中进行测试。蒙古文编码的统一转换成为目前蒙古文互联网发展的另一种有效形式。
蒙古文编码有了转换平台
过去,蒙古文互联网使用者从一个蒙古文网站上下载的内容往往显示为一堆乱码。现在,用户只要打开http://www/nm cartoon.com/m eng/login.asp网址,就可以看见一个用来转换的文件格式,下面标有赛因、明安图、蒙科立等6种经常使用的蒙古文编码名称。将自己所要下载的蒙古文信息复制之后免费粘贴在文件格式内,根据信息来源采用的编码形式选择对应的编码名称摁下提交,复制的内容便不再是一堆乱码,显示为清晰的蒙古文了。在众多蒙古文互联网的帮助支持下,内蒙古电视台《动漫驿站》网络部实现了蒙古文编码的统一转换技术。
转换平台意义重大
“目前微软的多个系统对蒙古文不支持,蒙古文竖排书写形式无疑加重了蒙古文互联网发展的困难。在互联网飞速发展的今天,做蒙古文搜索引擎就好比盖房子没有根基。”内蒙古电视台《动漫驿站》栏目制片人包银峰这样说。他告诉记者,蒙古文的统一转换技术不仅有效解决了普通互联网使用者过去不能随意使用蒙古文网络信息的难题,对蒙古文搜索引擎的发展更具有重要的意义。目前市场上有赛因、蒙科立、明安图等十几种蒙古文编码,各网站采用的编码各不相同,蒙古文互联网使用者就不能像中文互联网使用者那样自如的进行复制下载、变换输入法等操作,总是会遇到显示乱码的情况。转换技术正好解决了这一难题。而在搜索引擎中的运用,使得蒙古文搜索的效果不再停留在仅有的几个网站之间,原本有限的蒙古文网络资源也得到了有效的利用。
面临很多问题
郭刚说,计算机语言都是通过编码来实现的,而蒙古文一种语言就有多种编码。目前的编码转换技术实质就是在多种原有编码的基础上新发明一种编码。新编码和多种编码实现了一对一的有效转换和识别,这项工作无疑是非常繁琐和沉重的。然而,目前市场上一些软件开发商还在不断地开发新的编码,这是由于当前整个蒙古文互联网发展不统一、市场非常混乱的状况决定的,谁都想用自己的编码赚取商机。而事实上,现在几种使用率比较高的编码技术已经比较完善,完全能够满足市场的需求。同时,蒙古文中特有的字形和读音也是转换中很大的技术难题。
曾被作为重要研究课题
内蒙古科技信息网络工程技术研究中心技术开发部研究人员马换说,目前,国际上没有统一的蒙古文编码,微软新开发的vista系统虽然已经支持蒙古文,但是这个系统不是很完善,使用率很低。2005~2006年,研究中心还将此问题作为重要研究课题。当时,自治区相关单位、部门的重要研究人员一起讨论过统一的问题。但是一旦涉及统一标准,一些软件开发商在此基础上发展的许多系统、软件将不再被使用,他们的利益将直接受损,统一问题便迟迟未能解决。他们正在做的内蒙古自治区政府网蒙古文版也采用了自己的编码,也有自己的转换平台,其中竖排书写等技术难题已经攻破,正在开发新的技术。他觉得,转换技术仅仅是一种发展形式,最终编码的统一还是要靠市场去淘汰和选择。
该中心技术开发部主任王晓瑾说,在国际互联网飞速发展的今天,蒙古文作为小语种的少数民族语言是世界上唯一一种竖排书写的文字,显然处于弱势地位。然而互联网快捷和有效的传播功能对民族的文化、艺术起着重要的传承和保护作用,发展民族互联网业的意义非常深远。 (文/郝少英) |