国家数字图书馆是数字化的资料库,是保存大量结构化的数字化资源库,由软件和计算机群通过互联网连接在一起的高级信息系统。
文献数字化加工作为国家数字图书馆项目的数字化资料来源,是数字图书馆的重要组成部分。并且是国家图书馆与国家数字图书馆之间相互转换和衔接的纽带,并可与其他地区性或其他行业性图书馆实现数字资源馆际交互,推进将来建立中文信息库,保存中国重要的资料信息、网络信息、网页信息供公众查询使用。由此可见数字化对于国家图书馆以及数字图书馆建设的重要性,由于图书馆资源的广泛,其对于视音频、图片、文字等数字化文件的融合性要求极高。
国家数字图书馆的建设就是要完成我国中文文献的书目数据库建设,通过网络通道向公众全面提供中文二次、三次文献的检索(包括图书、期刊、报纸的名称及篇名数据);完成馆藏特色资源库的建设,向公众提供具有中国文化特色的信息资源,包括:甲骨资源库、金石拓片资源库、敦煌资源库、地方志资源库、图书馆学资源库、中国国情资源库、中国博士论文资源库、中国学资源库等;建立中文互联网信息资源库,保存中国重要的网站网页信息,并向公众提供查询服务;与其他行业性、地区性数字图书馆系统连通,向公众提供全方位的知识信息库,使国家数字图书馆成为世界中文数字信息资源的权威查询中心和服务中心。
从业务角度来讲,数字图书馆分为数字资源的采集、数字资源的加工、数字资源的存储、数字资源的发布与服务,这是通常所说的数字图书馆的四大核心业务系统。
结合数字图书馆的四大核心业务,图书馆图音视文献数字化系统整体架构将充分体现SOA设计理念,即开放性、松耦合、组件化。数字化加工系统通过基于ESB的应用支撑平台与数字图书馆其他系统相互衔接,实现各业务系统间元数据信息、管理控制信息等业务数据交换,实现跨系统对象数据的交换和处理,与ESB间采用松耦合的方式进行连接。图音视文献数字化系统由以下几个系统组成:
数字化生产系统:对图音视文献进行数字化生产及加工,其包含了预处理、数字化采家集工、数字水印、以及数字化加工管理子系统。数字化生产系统作为整个图音视文献数字化系统的数字化资源生产环节,对各类文献通过一系列流程工作处理,最后形成可供移交的数字对象资源,以及相关的元数据。
数字化编目组织生产管理系统:包含文献入库、编目、检索、编目生产管理子系统。此系统的任务是对文献数字化生产所得到的数字资源进行二次加工,包括编辑加工目录、篇名数据、摘要、全文登,形成或完善相应的元数据。并且此系统是对生产流程的控制管理,流程工序包括任务分配、工序设置,文献对象的加工、编目、审核、数据整合、数据输出等,从而完成文献数字化编目生产工序的各生产环节提供软件支持,提高编目生产的自动化程度,从而提高编目生产的效率和数字化成品质量。
数字化中心管理系统:包含统一用户管理、任务管理、接收管理、工艺工序管理、数字化成片管理、版权信息登记、数字化产品移交管理、数据输出管理、统计管理、软硬件接口参数管理、快速印刷、帮助和自我学习支持、数据库管理、文件管理。从业务角度讲,系统管理的目的,就是要对文献数字化生产和文献数字化编目提供全局性的配置、管理和控制功能,提供数字成品管理功能,并通过统计分析为生产决策服务。
其中数字化生产系统、数字化组织编目组织生产管理系统作为前台操作及应用实现层,数字化中心管理系统作为后台管理服务系统为数字化生产中心工作提供底层支持。
本次项目以图音视文献资料的数字化为核心,充分发挥了文献数字化管理系统的优势和强大的功能,完成对图音视文献的数字化采集、编目、管理等功能。整套设计方案本着可靠、先进、实用、安全、开放、经济、可扩展和可维护的原则,实现了对微缩胶片、特殊文献、音频、视频等文献的数据采集;通过一整套完整而细致的工作流程,实现了对音响图书资料的质检、记录统计、分发;数字化加工、QC;入库、编目、检索和输出以及数字化管理等功能。