您所在的位置:四川党建期刊集团  >>  融合之窗
浅谈数字化技术在民族古籍出版上的应用
时间:2016/5/10 10:55:14        信息来源:          点击次数: 1115 次
fiogf49gjkf0d

 四川民族出版社汉文编辑部副主任   周文炯


  中国古籍浩如烟海,要将其全部进行整理出版,工程量庞大,且出版物数量有限,重印再版成本较高。而古籍数字化出版,则是利用数字化技术,对古籍文献进行加工,制成古籍文献书目数据库和文献数据库,并将其出版。这有利于古籍资料得到更有效的开发和利用。
  虽然我国古籍数字化出版取得了一些成就,但是一直以来,少数民族古籍数字化的进展却相对缓慢。要想在民族古籍出版上,真正运用到数字化技术,则必须得认清问题、思索对策、找到出路。

民族古籍数字化出版目前面临的问题
  1. 技术问题
  古籍输入的主要方法目前有两个:键盘输入与光学字符识别(OCR)扫描输入。键盘输入属于手工作业,效率低,成本高。0CR则是一种较为先进的自动化信息资源输入技术,但也存在一些诸如图像质量不高,扫描速度低,单位成本高,识别率低等技术性问题。并且,现有的汉字识别系统多数是针对简体的,识别字数一般只有4000字左右,识别竖排繁体古籍效果非常不理想。
  2.版本和字的问题
  少数民族古籍出版物由于诸多的原因,因为社会发展阶段的不同,常常形成不同的版本,选用不同的版本,某些内容的文字会有较大的差别,且文字多种,载体多样,行文格式繁琐,计算机的文字编码不敷应用,接受简体字训练的现代读者也容易产生较大的阅读障碍。现在虽能通过某种解读器进行转换,但目前的转换技术,只是一种机械的转变,缺乏特定文字原始意义上的修正,从而在转换时,有时会发生一些字义上的混淆。
  3.盈利模式问题
  就目前来看,中国的各大出版社,尤其是民族类出版社就少数民族古籍数字化出版尚未寻求到合适的盈利模式,仅仅是单纯地制作光盘,或者售卖电子书,且版本参差不齐,很多出版单位各自为阵,但由于技术支持不够,制作出的数字化产品质量不佳,并未取得较好的市场效益。
 

针对民族古籍数字化出版提供的对策
  1.建立统一标准,实现图文对照
  规范、统一的数据库形式是数据库的生命所在。全文本的数字化古籍有必要建立统一的标准,包括古籍的分类法、著录规则等,如使用ISO 10646超大字符集(7万汉字,国际标准内码),较好地解决了绝大多数古籍的用字问题。2008年底,古籍整理软件平台在首都师大电子文献研究所开发完成。此平台展开的“古籍电子定本工程”不仅以学界公认的权威版本为底本,组织古籍专业人员反复精校,同时对数据库进行标准化处理,安装规范的检索平台,有效推动了古籍数据库的规范化和标准化。另外,还可以实现图文关联,将文本放在与之相匹配的图像之下,建立索引关系,实现图文对照,即可以弥补图像在检索和内容编辑上的不足,又可以校对文本的准确性。
  2.民族古籍专家主导,编辑全面认识和应用
  整理出版一部古籍,既要选择一部合适的底本,又要广校众本,既要精心标点,又要广徵群籍,拾遗补缺,界定其学术地位和学术价值。根据少数民族古籍的特殊性,民族古籍数字化出版必须以相关领域的学者为主导,确定数字化的内容,标引的深度,检索工具的配置等,只有精通民族文字,熟悉古籍,懂得古籍整理,才有能力决定民族古籍数字化出版的基本思路。同时,需要培养既懂得古籍整理,又懂得计算机技术的编辑,充分利用数字化古籍方便检索查证的特点,发现数字化版本中的问题,仍有疑问时,应找来权威的有关古籍进一步查证,还可以与专家交流利用数字化古籍的经验,借助专家的专业特长识别稿件中所存在的问题。
  3.民族古籍数字化出版模式的重构
  (1) 充分运用XML语言 。
  XML语言是跨媒体出版业最重要的规范,它已成为移动互联网世界事实上的内容载体。无论该内容在何时、何地、以何种方式释放,一旦内容选择了XML格式,那么它将可以独立于设备、软件、硬件及供应商而存在。XML模糊了不同媒体之间的界限,并实现了多种媒体的跨界操作。它灵活的用户定义功能在出版业中具有强大的优势,并有助于建立全球性的同步。因此,在民族文字及民族文化的数字化建设中,研究和制定适合各语种特性的基于XML的图书元数据格式规范、制定相应的数据加工规范,有利于数据的重复利用;研发基于UNICODE编码规范的民族文字数据加工软件和全文检索系统,有助于提升少数民族文字在多文种内容资源库中的检索效率。
  (2)加强国际交流与合作
  在国外,如日本、印度、俄罗斯及欧美各国都建立了许多研究所、学会和国际常设机构,研究蒙古学、藏学、满学、突厥学、敦煌学等,并出版了大量的中国少数民族古籍书目。在民族古籍书目数字化方面也取得了很大成就。比如美国国会图书馆网上可以看到藏文、蒙古文的目录;日本东洋文库的网上有藏文的数据库。而美国哥伦比亚大学东亚图书馆与我国国家图书馆最近合作的哥伦比亚大学东亚图书馆所藏的中国少数民族古籍目录将在RLN和CLOT网上发布。另外值得一提的是正在进行的“国际敦煌项目(IDP)”。这是一个由英国大英图书馆主持的国际合作项目,它将把世界上所有的敦煌文献数字化,其中包括西夏文、藏文等中国少数民族文献。“国际敦煌项目(IDP)”的开展给了我们许多启发和借鉴。我们应充分利用独特的地理位置环境和特殊政策,广辟国际信息渠道,广泛开展国际交往。其内容大致包括:各国共同编辑标准化的民族古籍书目及民族古籍研究刊物;及时交流民族古籍书目数字化工作经验;合作进行民族古籍书目人员培训;合作购置和共同开发运用大型的现代化设施,如建立公用的民族古籍书目数据库;制定共同的民族古籍书目规范,比如规定统一模式;协调文字模式;协调MARC格式;确立网络系统;统一拉丁转写方案;确定著录要求等,便于国际通用;互相聘请民族古籍书目专家或互派访问学者;建立共建共享机制,为有藏书但没有专业人员的藏书单位提供专业编目服务;与有藏书也有专业技术人员的藏书单位或著有相关专题目录的学者专家协商建立网上国际联合目录。 
  (3)向辐射状出版模式转变
  即民族出版社向内容提供商转变,传统的读者逐步演变为内容消费者。突破传统的编辑-印刷-发行模式,数字化出版也不应该局限于传统光盘的销售,而应该向印刷版,网络版,手机版,光盘版等多角度辐射,包括采用数字内容前置审查平台和可再生数字资源多次开发平台等技术,编辑随时和读者交流。
 (4)采用热门技术,实现工具和内容的统一
   未来的民族类古籍出版物将不再是单纯意义上的图书,而是现代工具与传统内容完美结合的统一体。针对文史专业研究人员、教学人员和一般读者的不同需求,这个工具与内容的统一体可以为之提供相应的研究平台、教学平台和文化休闲平台,还可嵌入远程教育网络,借助平面图像、三维动画、立体声响、虚拟现实等各种多媒体技术手段,从感官上带给人们全方位的精神体验.为人们搭建一个文化休闲平台。
   (5)数字化印刷,为民族古籍出版量身定制嫁衣
   数字化印刷的核心理念是个性化服务,由此民族出版社可根据读者的不同需求,对已有传统产品线加以分解、重组。如岳麓书社在所承担的《湖湘文库》项目中,其中地方志版块、寺庙版块以及与旅游景点相关的文化典籍版块,根据各县(寺院、景点)的当下独立成册,根据其需要规模制订印数计划,先预订,再印刷。虽然民族类古籍和传统古籍有所区别,但是此类方式值得借鉴。此外,可借力数字化印刷,开拓民族古籍出版的个性化服务新领域。这些领域包括:为满足知名企业文化建设的需要,为其量身打造普及读本;为大专院校不同的民族语言专业量身设计教育读本;为不同的年龄群体量身订制传统文化读本等等。

对四川民族出版社民族古籍数字化发展的一点建议
   四川民族出版社在业内小有名气,也掌握了不少西南地区学术界的重要资源,故在数字化出版发展上应因地制宜,和上述讨论对策有所区别,笔者根据几年来从事数字出版的工作经历,提出下列建议。
  1.建立内容资源数据库
  将现今出版的民族古籍和学术著作,每一种的电子版本均打包收藏,通过照排公司的排版文件和PS文件,按语言门类分类,转化为PDF文档,收集到一起备用,为下一步的发展打下基础。同时,对曾经出版但并未保存有电子版本的古籍,进行有针对性地OCR识别,转化为文本文件,予以保存。
  2.寻求多方面的合作
  一方面,可以借助数字公司(如文轩旗下的数字传媒有限公司)的技术支持和商务营销,对已有电子版本的民族古籍进行再加工,通过移动书包等多种手段进行销售,另一方面,还可以与针对海外图书馆的电子版权代理商合作,向海外推出民族古籍的电子版本。
  3.注重网络营销平台
  与电子书运营商和知名网站合作,建立专业的数据包规模销售。并借此平台完成本社优势核心内容资源的数字化,并建立分级有偿阅读系统。
<上一页  1  下一页 >
关键字:  
公示 版权申明  |  联系我们  |  关于我们  |  网站地图  |  订购中心  |  广告刊例 |  公示  |
 四川党建期刊集团网站  |  蜀ICP备07000205号 
 地址:成都市商业后街3号   邮编:610000   电话:028-86985311   传真:028-86985311 
Copyright © 2010-2011 四川党建期刊集团 All rights reserved