简体中文
繁体中文
当前位置:西藏文化网中文版 > 文化博览 > 传统文化 > 语言文字
 
 
现代化进程中的藏语文信息处理
   2008-04-09   来源:   作者:周炜

[摘要] 从上世纪80、90年代起,藏语文信息处理工作取得突破性进展,藏文软件如藏文文字处理及激光编辑排版印刷系统等,得以开发、利用。2l世纪后,信息产业部把统一制定藏文编码标准工作放在首位,组织力量联合攻关,同时藏文网站也相继开通使用。这些都推动着藏区经济社会和文化教育的全面发展。

[关键词] 藏语文信息处理;藏文软件;藏文网站;藏文信息技术专用术语标准
[中图分类号] H214+TP391
[文献标识码]A
[文章编号] 1002—557(x)(2006)02—0260—06
  
  20世纪70年代,在周恩来总理的关怀下,“汉字信息处理技术工程”被列入国家科研规划,从此开始了出版印刷事业告别铅与火的攻坚阶段。但真正将语言文字信息管理工作提上国家语言文字工作日程,却是在上个世纪80年代的中后期。1986年,全国语言文工作会议提出:“汉语汉字的信息处理是一门新兴的边缘学科,有广阔的前景,加强这方面的研究,对经济、文化、科学技术的发展具有长远的意义。因此,当前语言文字工作的任务必须包括这项内容。”1994年国务院明确规定国家语委在语言文字信息处理领域的职责和任务,是加强对语言文字信息处理工作的宏观管理。1995年,国家语委设立了专门的职能部门——中文信息司。1998年国务院机构改革,国家语委并入教育部,原中文信息司重组为教育部语言文字信息管理司,具体负责语言文字规范标准建设和语言文字信息处理的宏观管理工作。在党中央、国务院的关怀下,经过不懈努力,我国语言文字信息处理取得了骄人成就。这些成就主要表现在两个方面。一是国家通用语言文字中文的信息化工作成就,二是我国少数民族语言文字的信息化工作成就。

  从20世纪80年代开始,在国家民委、国家技术监督局、国家科委、电子工业部等有关部门的关心支持和帮助下,集结起各方面的力量协同攻关,使少数民族文字信息处理工作取得突破性进展。90年代我国启动的“少数民族文字处理技术开发”项目陆续推出藏、蒙古、维吾尔、哈萨克、朝鲜、彝、壮以及柯尔克孜、锡伯等少数民族文字的字处理系统,西藏、新疆、青海、甘肃、四川、吉林等省区的专家学者也在国家的扶持下,开发了多种民族文字处理技术和应用系统,主要包括国家标准和国际标准的研制与开发、操作系统和电子出版系统的研制和应用、民族文字数据库的研制和应用、少数民族文字其他信息处理系统的开发和研制等五个层面的项目。 

  为推进我国的少数民族文字信息处理技术,使我国各少数民族在跨入信息社会和知识经济时代的关键一环上,紧跟时代前进的步伐,我国政府正在加大资金的投入和研制的力度,在未来的5到10年间,我国少数民族语言文字信息技术的研制和应用必将上升到更高的高度,并与中文信息技术的研制和应用一起,共同开创中华民族新的信息时代。

  一、藏文信息软件的开发和利用

  语言文字的信息处理技术是人类社会现代化的重要成果。信息处理技术的水平已成为一个国家、一个民族发展进步的重要标志。改革开放以来,在实现汉语言文字信息处理技术的同时,我国少数民族语言文字信息处理技术也取得了巨大成就,先后有多种少数民族语言文字实现了信息处理,民族语言文字软件技术的开发和推广应用,对少数民族和民族地区经济发展、社会进步起到了积极的促进作用。

  民族文字在计算机信息处理方面的开发应用,不仅标志着我国民族语文的社会功能在这一领域的扩展,而且为民族语言文字的繁荣和发展,为民族语言文字的现代化开辟了广阔的前景,有利于促进民族地区的政治、经济、文化的全面发展。我国民族语文信息处理技术的研究起步晚,加之我国少数民族语言在信息处理技术方面还大大落后于汉语文,但可以肯定,随着民族地区经济文化的发展,民族语文在信息处理技术的应用上也必将得到更大范围的发展。实际上,早在lO多年前,在藏语言文字逐步实现规范化、标准化的同时,藏语言文字信息处理技术的研发工作已经初见端倪,并在此后的发展中取得了重大突破。

  第一、20世纪80年代藏文软件的开发和利用  1986年由青海师范大学研究开发的TCDOS2.0版藏文系统通过了鉴定。这是第一个投入使用的藏文系统,该系统经不断改进,现已升级为TCDOS2RM和基于WINDoS的藏文操作系统TCDOS FOR WIN,以上系统可挂接在CCDoS或UCDoS汉文系统上,可实现英汉藏混合处理。同年西北民族学院数学系研发了《兰海藏文系统》。此外,在1986到1987年两年的时间里,在西北民族学院于洪志教授的带领下,开发完成了《藏文输入系统》、《藏文操作系统》和《藏文信息处理系统》三个项目。中国藏学研究中心和航天部70l所于1988年8月推出了藏文文字处理及激光编辑排版印刷系统。该系统后来与潍坊华光合作开发出了华光书林藏文排版和激光照排系统,中国藏学出版社出版的藏文版《中华大藏经》就是用这个系统排版及进行激光照排的;华光V型藏文电子出版系统是在原华光V型汉字电子出版系统全部功能的基础上,增加藏文和梵文的处理功能研制成功的,是当时国内外最先进、最完善、最实用和最具有普及意义的藏文系统。藏文版华光藏文软件的特点是:类似于北大方正藏文系统,有For Dos 和 FOR WINDOWS,带有加密卡;字体有九种,六种正楷和三种草写体;有独立的编辑器,有两种编辑方式:可视化和BD语言方式;也可在Word里进行编辑。可编辑藏、梵、汉、英四种文字,可处理公文、报刊、藏经等,全自动排版,字体好看。此项成果曾荣获中国国货精品金奖。

  第二、20世纪90年代藏文软件的开发和利用  进入20世纪的90年代以后,藏文软件的开发利用进入了一个新的时期。早在1997年之前,中国计算机软件与技术服务总公司、民族印刷厂、北京大学计算机研究所、中国民族语文翻译中心联合推出了北大方正藏文书版系统。这套系统是应用最广的一套藏文软件,带有加密卡或加密狗,版本比较多,字体有两种的、三种的、五种的、七种等,字体很好看,编辑在DoS下,输出可在WINDoWS下;可编辑藏、梵、汉、英四种文字,可处理公文、报刊、藏经、各种复杂表格等,全自动排版,各大印刷厂和出版系统都在使用这套软件。1997年北大方正又推出了基于WIN3l的藏文维思彩色印刷系统(北大方正的藏文书版系统在藏区占有相当大的市场)。而西南民族学院计算机研究室则开发了基于DoS平台的SPDoS汉藏文版操作系统和WIN95藏文文字平台。

  1999年,为了尽快使科研成果转化为产品,直接服务于民族地区,基于西北民族学院在藏文信息技术研究领域所做的工作,以及国家倡导高等院校走“产、学、研一体化”的政策,甘肃省经济贸易委员会和西北民族学院联合成立了产、学、研一体化的“甘肃省同元信息系统技术有限责任公司”。公司下设技术中心、西北民族语言文字信息技术研究所和藏文信息技术实验室。该公司致力于中国少数民族信息产业的发展,主要面向少数民族语言文字研究与开发:计算机系统平台,多媒体产品,Web网站、网页、网络系统集成,办公自动化软件产品,大型数据库、电子图书、电子词典,语言、文字识别系统,少数民族语言文字在电子、信息产品上的应用与开发。1999年,在国家民委、甘肃省经贸委西北民院的大力支持下,公司研制成功了藏文信息处理的系列科技成果,同年12月,由国家民委和甘肃省经贸委资助的《藏文视窗平台》、《藏文字处理软件》、《藏文Internet》三大课题15个项目,通过甘肃省科委、国家民委、甘肃省经贸委的鉴定,认为这些成果达到国际领先水平,同时验收通过了5项新技术、新产品。

  2000年,由清华大学电子工程系丁晓青教授领导的智能图文信息处理研究室,与西北民族大学于洪志教授领导的中国民族信息技术研究院联合研制的“多字体印刷藏文(混排汉英)文档识别系统”的问世,填补了藏文文本识别研究和系统开发的空白,标志着我国中文信息处理领域又取得重要研究成果,拉开了藏文识别应用于藏文数字化建设的序幕。据专家介绍,“多字体印刷藏文(混排汉英)文档识别系统”首次解决了多字体印刷藏文文本的识别问题,以及首创实现藏、汉、英混排文本的识别系统,其整体性能达到了国际领先水平。经鉴定委员会测试组测试,藏文白体、黑体、圆体、长体、竹体、通用体6种字体单字平均识别率达到99.83%,实际藏汉英混排文本的平均识别率达到97.28%以上符合实用要求。清华大学电子工程系智能图文信息处理研究室发挥多年致力于东方文字及其与英文混排文档识别研究方面的技术优势,西北民族大学中国民族信息技术研究院则发挥其藏文基础平台开发,以及藏文字体样本库设计、语言理解和处理方面的优势,经过近三年的合作,完成了该软件系统。该项目的完成,为进一步实现藏文经书识别奠定了基础。“多字体印刷藏文(混排汉英)文档识别系统”是清华大学和西北民族大学在2000年签订的“全面合作协议”后的第一个科技研究成果,是清华大学充分发挥科技优势,为加快民族地区信息技术的发展做出的实质性贡献。

  第三、21世纪初藏文软件的开发和利用  2001年成立的成都易华信息科技开发有限公司一直致力于易华藏文输入法及藏汉、藏英翻译系统的研制和开发工作,并于当年实现了在Windows平台下的藏文信息系统、使藏族人民可以对本民族语言文字进行计算机处理、为促进藏族同胞与国内其他备民族以及世界各民族的经济和文化交流提供了最先进的手段。该系统的特点包括九个方面:面向对象的设计;通用性好,可靠性高;良好的Windows系统人机界面,美观易用;采用藏文国家标准编码体系,完全兼容中文Wiridows 95/98/Me/NT/2000操作系统;藏文字库均采用TrueType字体制作;强大的词库管理功能:预留升级专用接口,系统升级简单方便;能通过控制面板中的输入法配置添加、删除、打开、关闭、切换词库量大,涵盖2亿多字及600多万个专业词条;允许用户定义自己的词库,并具备对自定义词库的添加、查看、删除、导入、导出等功能;翻译结果可复制和打印。该系统的软件模块包括藏文输入;藏汉、汉藏翻译;藏英、英藏翻译。系统要求方面为:CPU:Pentium 200或以上;内存:32M或以上;操作系统为Windows 95/98/Me/NT/2000。

  同年,由西北民族学院于洪志教授主持的在计算机视窗平台下开发出的藏文软件《藏、汉、英多功能组合软件》通过相关部门专家的鉴定,首先在国内外完成了藏、汉、英系列工具软件与通用软件的研制工作。该科研成果中的藏、汉、英与拉丁转写全文转换系统和藏汉英Lotus Domino/Notes两个软件达到国际领先水平;藏、汉、英视频软件等十个软件在藏文信息技术领域达到国际领先水平。上个世纪的藏文软件主要具有藏文字处理功能,用户将计算机看作是藏文录入、编辑、排版的工具,主要用于打字、出书、出报,很少使用计算机的其他功能。随着国家政府上网工程的进行,教育部远程教育计划的实施,藏族地区学校纷纷要求采用藏文软件进行计算机教学,《藏、汉、英多功能组合软件》正是在这种背景下诞生的。该组软件是我国藏文信息化技术继成功研制出藏文国际编码标准和《藏汉双语信息处理系统》之后,取得又一重大成果。该组合软件是国内首批少数民族文字的工具软件和通用软件。其研制历时两年,共由《藏、汉、英视频软件》、《藏文与拉丁转写全文转换系统》、《藏、汉、英多媒体教学课件》、《藏、汉、英电子邮件》等12个系列工具软件和通用软件组成。这些软件的运行环境要求使用奔腾系列计算机,并安装由该软件研究课题组两年前研制成功的藏文视窗平台系统。懂计算机和上网技术的藏族群众可以通过这些多功能组合软件自行编制藏文应用软件。

  2003年11月国家教育部组织并委托清华大学主持在清华大学召开了“多字体印刷藏文(混排汉英)文档识别系统”技术鉴定会。该系统实现了多字体现代藏文以及藏汉英混排文本的识别,为藏文纸介质文档转化为计算机可查询的电子文档提供了有力的工具,将为藏文文献整理、编辑等数字化工作发挥重要的作用。因此,这项成果不仅在中文信息技术理论研究方面有重要的学术价值和广泛的应用领域,更具有其久远的社会效益。

  2004年,针对我国藏文软件严重落后,且不同单位低水平开发、各自为阵无法兼容的现状,信息产业部8月14日启动藏文软件开发专项方案,组织力量联合攻关。据信息产业部介绍,这一藏文软件开发专项方案已把统一制定藏文编码标准放在首位。其他内容还包括检测系统的研发、跨平台操作系统的研发、跨平台输入法的研发、字处理软件研发、互联网浏览器的改造和研发、藏文网站制作和管理工具的开发、藏文电子出版系统升级等。一份由信息产业部牵头组织国内力量共同开发、由西藏自治区主要负责推广应用的部区合作协议也在同日签署。藏族地区由于受自然条件和经济发展水平的制约,信息化水平相当于全国平均水平的20%。语言文字信息化是信息化的基础,目前,藏族地区使用的很多软件还停留在DOS水平,少数WINDOWS版的软件也在功能和性能上与汉语软件存在较大差距。2004年由国家出资启动的藏文软件开发专项方案对彻底改变这种现象将起到至关重要的作用。为了进一步落实这项计划,信息产业部副部长娄勤俭于8月中旬专程前往西藏自治区,在拉萨与西藏自治区副主席吴英杰正式签署了藏文软件开发和推广应用合作协议。这标志着我国藏文软件开发应用工作已提上议事日程。双方就藏文软件开发和推广应用工作达成共识,信息产业部牵头负责软件开发,西藏自治区负责推广应用,建立有效工作机制,明确了职责分工,计划用两年左右的时间,开发出藏文信息化方面急需的基础软件,以初步满足藏区信息化的需要。

  第四、藏文网站的布局与开发  为使民族文字信息处理技术有一个比较大的发展,尽快赶上先进民族的发展水平,把我国备少数民族的优秀文化送上互联网,让我国各民族的优秀文化都能同步走向世界,并让世界了解一个完整的中国,使我国各少数民族在跨入信息社会和知识经济时代,国家从上个世纪末就已经开始加大技术开发的资金投入,力争把民族语文信息技术的开发和运用提高到一个新的水平。

  根据调查,2000年初,世界上第一个藏文网站——同元藏文网站在兰州西北民族学院建成,这是中国第一个少数民族网站。由西北民族学院于洪志教授主持开发的这一藏文信息技术,内容涉及系统平台、文字处理、藏文网站、藏文多媒体等。“藏文视窗平台”的建立,使藏族人民可以运用本民族语言文字进行计算机操作,为藏文信息产业化奠定了技术基础。其“藏文文字处理软件”具有文字处理软件的各种功能,能支持众多的文字处理环境,是藏区推广使用计算机最基础的软件;“藏文INTERNET”在藏文网页设计和藏文多媒体制作方面达到了国际领先水平。该网站的建立、开通与藏文多媒体软件的研制应用,为藏族地区经济、社会、教育、科技、文化的繁荣发展,为藏民族与世界的交流开创了新的途径。该网站第一次用藏、汉、英三种文字系统地宣传介绍了藏族悠久的历史、语言、文字、宗教等。2000年,江泽民同志视察甘肃省兰州市高新技术开发区时,详细询问了藏文信息技术的研发情况,对西北民族学院在藏文信息技术方面取得的成绩给予了极高的评价。进入本世纪以后,藏文网站开始逐年增多。目前,国内已经开通的藏文网站还有中国西藏信息中心藏文网站和《中国西藏》藏文网站等。

  第五、藏文信息技术的开发在民族语文现代化进程中的作用  20世纪90年代以来,随着信息、网络技术的发展,在文化全球化成为一种不可阻挡的发展趋势的同时,必须看到由于“数字鸿沟”使一些发达国家利用信息网络技术进行文化渗透、文化侵略的现实。在这种背景下,西方敌对势力和分裂势力利用藏文软件技术从事分裂活动的事例已经越来越多。因此,为了维护祖国统一、反对分裂,保证西藏的稳定和发展,抵制国外敌对势力的藏文软件在我国藏族地区的推广,已经成为藏语文在现代化进程中的一个重要任务。

  根据藏学界的普遍反映,近年来,经美国、英国、瑞士、德国等国家和地区研制的,通过民间渠道向我国藏区免费赠送的藏文软件已多达数千套。根据对群众中使用的软件技术的研究和分析,一是国外软件通过对英文WORD的定制实现藏文的处理,没有也不可能考虑到中文平台中藏文的处理特点,强制该软件在中文WORD中使用会带来许多问题,如在字体列表中样本字为藏文构件既非英文也非藏文;藏汉英三种输入切换不便等等。二是藏文构件字库占用英文字符码位,使得必须用十多个字库文件容纳藏文构件,常用的英文字符不能在藏文构件库中出现。三是软件没有对操作系统进行控制,仅对英文WORD加以控制,因此在非WORD的软件中藏文构件不能叠加,也就不能正确地显示藏文,更不能输入藏文,其使用藏文只能在WORD下进行。四是有的藏文软件在运行过程中会出现一些与分裂行径相关的内容。对此,国家应加大对藏文应用软件扶持开发、推广应用的力度,抵制国外劣质软件的传播和文化渗透,争取以较小的代价避免未来更大的经济损失和政治损失。

  二、21世纪初藏语文信息处理工作的新走向

  进入2l世纪之后我国的藏语文信息处理工作进入了一个新的历史阶段。主要体现在以下两个方面。

  第一、藏文媒体网络化继续发展  我国政府一贯重视少数民族语言文字和少数民族文化多样性的保护与发展,也非常重视少数民族地区的社会、经济发展的稳定,为了推动西藏和其他藏族地区经济社会和文化教育的全面发展,党和国家一直对藏语文的标准化和藏文信息的传播给予高度关注,经过多年的努力,这两方面的研究和工作都取得了新的突破,藏文媒体的网络化和信息化得到了进一步的发展。2005年11月24日,由我国研发的手持电子通讯设备藏文信息处理系统正式开通。2003年11月西藏大学、西藏电信公司和深圳润汇科技有限公司联合启动了藏文无线通信系统和手持电子设备的藏文化研究,经过近两年的时间,攻克多项技术难题,于2005年8月成功开发出全藏文界面、完整藏文输入输出功能和藏文短信收发功能的好易通手机和车载电话,在国内外首次实现了手持电子通讯设备的藏文信息处理。这项系统的开发在国内外多个领域取得了创新和突破,首次设计和生成了符合藏文字体特性的点阵藏文字库,首次独创了藏文短信的编码和解码技术。此外,这项系统还具有重码率低、翻页少等优点。

  2005年12月18日,西藏藏语言文字网网站正式开通。它不仅是藏语言文字信息化建设过程中的一件大事,也标志着西藏藏语言文字从此迈上了信息化、网络化的道路,必将对进一步繁荣民族传统文化,促进民族语言文字发展,大力宣传西藏,让世界了解西藏,加强各民族之间相互沟通和交流合作发挥积极作用。西藏藏语言文字网自2001年开始筹备,得到了国家教育部语信司、上海市语委办等有关部门和单位的指导帮助。2005年5月上海市语委支援西藏藏语委建设“藏语言文字”网站签约仪式在上海市普通话水平测试中心举行,该项目正式启动,并如期完成。西藏藏语言文字网以www.XZZyw.cn为域名发布于互联网上,提供藏语言文字方面的相关知识,它不仅是学习藏语和促进藏语文学术交流的平台,同时也将对西藏自治区的经济发展,文化繁荣,教育进步以及加快信息交流起到积极的促进作用。

  2005年12月20日,由中国国际广播电台和西藏人民广播电台联手打造的《中国西藏之声》藏、汉语网站在北京正式开通。《中国西藏之声》藏、汉语网站包括中文首页以及汉语新闻综合频率、藏语新闻综合频率、康巴语频率、都市生活频率等四个频率页,内容涉及西藏新闻、西藏旅游、西藏风情、西藏音乐等。藏语广播网的推出弥补了藏语无线广播在播出时间和覆盖地域等方面受到的局限,不仅为西藏自治区少数民族群众开辟了一个了解世界的新窗口,也为生活在海外的藏族同胞提供了了解祖国,特别是了解今日西藏发展变化最便利的渠道。

  第二、藏文信息处理系统工作继续向纵深发展  2005年7月由中国科学院软件研究所、西藏自治区藏语文工作委员会办公室、西藏大学共同承担完成的中国科学院西部行动高新技术项目《基于Linux的跨半台藏文信息处理系统》在北京通过验收。

  该项目是中国科学院软件研究所积极响应国家实施“西部大开发”战略和“全国支援西藏”的号召,根据国家关于加快发展信息技术的有关政策和决定,与西藏合作开发的一项高新技术项目。自2003年3月该项目正式启动以来,紧紧围绕主要研究目标和研究任务,项目组深入分析比较了各种藏文字符集编码方案,针对多语言计算的共通性问题,建立了我国民族语言规范化、标准化的统一文字处理体系,在此基础上,成功研制了Linux藏文处理系统和Linux/Windows跨平台藏文办公套件,并在西藏大学、西藏编译局、西藏社科院民族研究所等单位试用,反响热烈,得到了用户的好评。该项目的研制成功,使我国有了第一个具有自己知识产权的跨平台藏文处理系统,同时具有良好的应用推广前景。

  2005年3月由中国藏学研究中心主持,国家技术监督局中国标准化研究院、信息产业部中国中文信息学会和西藏自治区藏语文工作委员会协助参与的重点项目《藏文信息技术专用术语国家标准和国际标准》正式启动。在信息化建设的过程中,信息技术编码字符集的标准化和信息技术专用术语的标准化是两个重要的基础标准,仅有信息技术编码字符集的标准而没有信息技术专用术语的标准,开发出来的信息产品及软件都是不完整的。

  对藏文信息技术专用术语标准的制定,国外(主要是美国)早就有一些研究机构和院校开始在做这方面的工作,并且已经有了一些阶段性的成果。众所周知,藏文的用户在中国,藏文的故乡在中国。《藏文信息技术专用术语的标准》理应由我国自己来制定。它涉及到我国的信息和民族文字安全等多方面的问题,这项工作关系我国的语言文字工作的全局,关系我国的国家利益。因此,在这样的背景下,由我国在2006年5月之前完成《藏文信息技术专用术语国家标准和国际标准》的制定,就可以用我国制定的国家标准名正言顺地要求微软在其新的产品中正确、完整地支持我国的藏文。目前,该项目的前期工作已经顺利完成,相关成果的审定和申报工作也在按计划进行。

  [本文责任编辑  黄维忠]

  [作者简介] 周炜,中国藏学研究中心社会经济研究所所长,研究员。(北京  100101)

 
 
  相关文档
 
 
无标题文档

关于我们 联系我们

  中国西藏文化保护与发展协会 Copyright by CAPDTC
地址 : 北京广安门外大街 305 号 荣丰 2008-8 区 A2 楼  邮编 :100055
京 ICP 证 05025353 号