| 电信 教育 政务 机械 汽车 船舶 交通 石化 烟草 服装 电力 金融 外贸 冶金 电子 |
自动分类系统(Metadata Aurora) 随着当今科学技术的飞速发展,各种信息层出不穷,由此产生的各种科技文献、新闻语料乃至互联网上的信息可谓是爆炸式的。人们要在如此众多的的信息中要找到自己所需的信息,则还须对它们进行分类。但是,传统的手工文本分类,由于周期长、费用高、效率低,而且往往需要具有专业知识的人员才能胜任,所以难以满足当今的实际需要;而现在的很多系统,由于对样本文档的数量要求较大,而造成系统效率的下降,或是由于不能满足样本文档的数量,造成分类不全、含义不清、缺乏学习能力等问题。因此,研究有效的自动文本分类就显得十分必要,并且它在文本检索、信息获取、信息过滤、数据组织、信息管理乃至互联网上的搜索都有十分广泛的应用。
在文档的分类过程中,实例对分类起着非常重要的影响,实例越多越准确,文档分类也就越精确。然而对于大批量的文档分类来说,要精确分类,对实例数量的要求非常大,这大大降低了分类的效率。鉴于此,我们在EM ( Expectation-Maximization )算法的基础上,考虑到未分类文档对分类的影响因素,结合成 Metadata自动分类系统。Metadata自动分类系统结合了未分类文档对分类的贡献效果,达到了以较少量的实例来取得较准确的分类的效果。同时考虑到未分类文档影响因素的不确定性,添加了系数λ,可对其加以调整。通过对现有的一些实例的测试,本系统能够达到很好的分类效果,能够满足信息分类精确度的需求。在基于实例分类的基础上,我们对其部分进行改进,使用户仅提供每个类的关键词就能对未分类文档进行有效的分类。 Metadata Aurora系统具有以下特点: 1、对样本(或关键词)的需求量少,容易实现对海量文档的分类 2、智能化分类,结果精确 3、分类的可靠性高 4、综合考虑了未分类文档对分类的作用,使其达到最优状态 5、分类速度快 6、具有多方面的用途 Metadata 自动分类系统概要图如下所示:
相关案例
|
解决方案速查(共有 14131 个方案) 基础软件
安全保密
管理软件
办公软件
软件开发
系统网络
图形多媒体
辅助设计
行业专用
教育教学
电子政务
其他软件
接入
通信
网络
存储
IT服务
推荐解决方案
领军企业实施案例
+更多领军企业案例
电子杂志订阅
赞助商链接
| ||||||||||