一、功能简述
青典数字化系统主要用于信息的加工、检索和浏览等,适用于建立数字图书馆、专题数据库和网站,特别为将纸质的资料转化为数字化的工作提供了强大的支持。由于有完全自主开发的、技术领先的汉字识别引擎、全文检索引擎、元数据处理等核心技术,使得该产品能极大地提高用户建立资料库和专题网站的效率,并且具有高度的灵活性,可以很容易地依据用户的不同需要做自由的改变。
二、系统构成
1.以汉字识别引擎为核心的数据加工子系统
主要功能:将纸质的资料利用版面分析、汉字识别、元数据识别等技术转化为数字化的档案,并按照一定的标准打包成其它系统可以利用的格式,也可以将现有的文档如WORD文件、PDF文件自动转化成该系统可用的格式。数据加工子系统按照客户/服务器方式组织,多人可以协同工作。
包括:服务器、管理器、识别精灵、校对器、核查器、生成器。
2.以全文检索引擎为核心的信息检索子系统。
主要功能:对于加入该系统的文档进行分类、整理,并可以使用关键词及其组合对系统中的文档进行检索。
包括:发布系统、阅读器。
3.以元数据技术为核心的数据浏览子系统。
主要功能:通过访问信息检索子系统,对系统中的资料进行题名、作者、关键词、分类等项检索,并通过检索结果提取出原始数据,按照复原格式进行显示,并且将关键词加亮。整个系统各模块之间互相衔接,组成一个无缝的完整系统,为用户带来全新的数字加工理念。
包括:元数据编辑器、发布系统、阅读器。
三、软件状况
青典数字化系统已于2003年12月开发完成,目前已有台湾、日本、国内多家用户进行使用和试用,用户评价良好,认为该产品的创新性和实用性均很突出,极大地方便了他们的工作,并且使他们原来不能想象的工作变成了现实。
四、软件的应用领域和前景
青典数字化系统可用于图书馆、学术团体、大学或企业的信息部门做专题资料库和数字图书馆。软件的应用前景极为乐观。目前,随着互联网的迅猛发展,国家对于信息化的重视,数字化是大势所趋。但是数字化的工作艰辛,错误率高又阻碍了其进程的发展,该系统成功地解决了这个难题,必然会有极大地发展。