电信 教育 政务 机械 汽车 船舶 交通 石化 烟草 服装 电力 金融 外贸 冶金 电子

中央档案馆知识库管理系统

2004-8-12 发布方:国信贝斯 网友评论 0 条 点击进入论坛

    作为全国规模最大的中央级综合性档案馆,中央档案馆的馆藏涉及政治、经济、文化、教育等各个方面,内容丰富,价值珍贵;同时在档案管理的现代化建设中一直走在国内档案行业的前列。但随着档案资料数量的不断增加,如何在档案资料有效管理的基础上,根据需要从原始档案信息中实现对某一专题数据的深层发掘,以为中央领导决策提供更详尽、快捷和高效的信息服务,成为中央档案馆信息管理部门的重点考虑的问题。

    在考察和试用国内、国外多家软件厂商包括国内最主要的全文检索软件厂商后,中央档案馆最终选定了北京国信贝斯软件有限公司的iBASE数据库产品建立了中央档案馆的知识库管理系统。该系统以档案信息数据库为基础,结合iBASE数据库提供的强大数据挖掘和统计工具,并集合专家在线评价和研究系统,实现对原始档案资料深层处理和分析,从而帮助中央档案馆从丰富的档案资料中提炼出有意义的、简洁的知识,直接向中央领导报告。该系统主要由数据库管理、档案检索、分类统计和信息挖掘等四个主要功能模块构成。

数据库管理模块
    数据库是管理档案的最佳方式。因此,档案数据库管理子系统是中央档案馆知识库管理系统的基础。利用iBASE数据库强大的数据管理能力和开放的数据接口,中央档案馆将原来用dBASE、Poxbase以及SQL Server等关系数据库建立的各种档案数据库,统一倒入iBASE数据库中进行统一集中管理。这样,既解决原来不同系统间档案数据无法共享和互操作的问题,又保护了原有系统的投资,更为档案资料信息的挖掘奠定了基础。

    根据馆藏档案的情况,中央档案馆利用iBASE数据库管理系统建立了《中国明清史档案文献库》、《中华民国史档案文献库》、《中国革命史档案文献库》三个主要数据库。整个档案数据库管理系统采用标准的B/S结构,数据库均放在服务器端,中央档案馆人员可以通过浏览器,在经过系统用户密码、权限认证后,就可以根据具体情况在本地或者远程对档案数据库中的档案数据进行浏览、增加、修改、删除等数据维护工作。由于数据维护采用标准的浏览器界面,因此界面友好、操作简单,非常便于使用。

检索系统模块
    档案检索系统模块分为“分类检索”和“全文检索”两个模块。其中“分类检索”主要利用中央档案馆馆员对档案库的充分了解及其专业知识,为用户查找档案提供的导航工具。分类检索充分利用了中央档案馆长期对档案分类管理积累的经验,将档案进行分类、分面、关键词三级分类,用户只需选择已经分好的类及相关类目词,就和进入相应的面,每个分类都有15个面;而每个面都有中央档案馆馆员为用户标注的说明和关键词。这样,的用户无需输入任何检索词,只需根据系统分类按需查找,即可查找到相关档案。

    为进一步增强用户查找档案的准确性,分类检索还引入专家档案编写系统。对于每一个具体分类和类目词,系统都有一个由档案管理及相关专家针对分类档案的档案编写摘要。该摘要可以由专家通过浏览器随时对该档案编写摘要进行增、删、改维护工作。通过利用专家的专业知识和技能,用户可以更快捷、更方便、更准确地查找到所需要的档案。这也是中央档案馆知识库管理系统最与众不同的亮点。

    “全文检索”模块则充分利用了iBASE数据库强大的智能全文检索引擎,实现了档案信息及档案全文的简单、渐进与任意项的组配检索。系统设置了任意多项单项快速检索与自由组合检索,支持国内外各种成熟检索方法,如基于自然语言的全文检索、字段限定检索、布尔检索、前方一致检索、相邻检索、基于内容的全文检索以及后控词表检索等,检索方式灵活,检索途径多且十分灵活方便。对数以百万份档案的检索速度仅在1秒钟范围内,大大提高用户查找档案效率。

分类统计模块
    “分类统计”是中央档案馆知识库管理系统的一个重要模块。由于中央档案馆档案分类众多,而每个分类下又有15个“面”的分类,“面”下级又按照关键词分类,因此如用人工统计每一类档案的分类数据难度非常大,错误更难以避免。因此系统提供了“所有类目统计”、“选择类目统计”和“重叠记录统计”三个模块,以对档案进行综合分类统计。

    通过“分类统计”模块,中央档案馆不仅可以清楚地知道每种分类档案的数量及其所占数量的比例,而且还可以知道不同分类里相同档案及不同档案的数量及所占比例,从而对馆藏档案资料情况进行全方位的了解。同时通过档案数据的统计分析,还可以确定每条档案数据在使用频率,从而分出每个或者某一类历史档案数据的重要性。

信息挖掘模块
    信息挖掘的目的是从大量数据中寻找有用的信息,其挖掘的过程就是查找信息的过程,即根据确定的需求,对过去的数据进行查询和遍历,并找出过去的数据之间潜在联系,以促进信息的传递和重新利用。因此,“信息挖掘”功能模块是于“检索模块”紧密结合起来的。通过用户对档案库数据的检索,形成相关数据新的集合,进而形成针对具体需求的某一专题,以方便用户对档案的深层次开发和利用。

    由于档案信息一般都是非结构化数据,其包含的重要内容不是显示的,而是隐含在档案内部,因此对档案信息的挖掘必须采用深层次的文本分析与索引方法,要求系统支持全文搜索及索引搜索,且搜索的条件可以是自然语言和布尔逻辑条件。iBASE数据库内嵌的强大智能全文搜索引擎提供了基于自然语言理解和后控词表检索机制,为档案信息的挖掘提供了强有力的工具。通过“全文检索”模块,中央档案馆可对检索结果按主题创建新分类,或加入已有分类并创建索引,以便对档案信息进行进一步检索查询,加强档案利用深度。

已有 0 位对此文章感兴趣的网友发布了看法    
我来评两句 登录邮箱: 密码:
  匿名发表
相关案例
解决方案速查(共有 14387 个方案)
基础软件
安全保密
管理软件
办公软件
软件开发
系统网络
图形多媒体
辅助设计
行业专用
教育教学
电子政务
其他软件
接入
通信
网络
存储
IT服务
电子杂志订阅
点击电子杂志名称查看样刊
输入E-mail地址即可订阅
E-mail
赞助商链接