| 电信 教育 政务 机械 汽车 船舶 交通 石化 烟草 服装 电力 金融 外贸 冶金 电子 |
北京清华紫光文通信息技术有限公司TH-OCR2003录入工厂TH-OCR2003录入工厂 随着计算机网络的飞速发展,许多信息已经电子化,文字是信息最重要、最集中的载体,实现文字的电子化,OCR技术是其中最重要的环节。世界各地出现了许多"电子版"的报纸、杂志等出版物。但是我们可以看到印刷材料的数量也大大地增加了,一些专业单位如新闻社、图书馆、古籍出版社、档案馆等所接触的印刷材料更是浩如烟海,面对大量的纸介质信息,用什么工具或者通过何种手段将所有信息输入计算机? TH-OCR2003录入工厂能做到: 1、实现计算机自动电子化处理--系统能够实现对图像资源的动态监视,实时自动进行数据转换 TH-OCR2003录入工厂的构成: 1、识别模块: 具有超强的识别核心,可以识别简、繁体汉字2万多,识别的语言包括中文简、繁体、英文、日文、韩文,自动版面分析能力大大增强,最大限度减少手工操作量。
2、纵向校对模块: A、可以将成百上千张图像一起校对; B、将识别成同一个字的图像块集中在一个窗口内,这样很容易查错,操作者不会陷入到具体的语言环境中; C、窗口的尺寸是根据人机距离以及人的眼距来设定的,这样可以使操作者"一目了然",避免眼疲劳
3、版面恢复模块: 通过版面恢复编辑器,可以将原始图像的所有信息恢复过来。比如:字体、颜色、花边等。
4、自动处理模块: 可以实现图像文件到PDF文件的自动转换,生成的PDF文件能够实现全文检索,可以复制粘贴;也可以对某个指定目录进行长期监视,真正实现无人操作。
5、版面拼接模块: 确保在没有大幅面扫描仪的情况下仍然可以获得大幅面图像。
6、HTML编辑器: 超值赠送HTML编辑器,对识别后导出的HTML文件进行排版编辑,得到较好的浏览效果。
7、自动转换模块: 实现从图像PDF文件中抽出图像文件,保存为TIF文件,再对TIF文件进行识别处理。
相关案例
|
解决方案速查(共有 14231 个方案) 基础软件
安全保密
管理软件
办公软件
软件开发
系统网络
图形多媒体
辅助设计
行业专用
教育教学
电子政务
其他软件
接入
通信
网络
存储
IT服务
推荐解决方案
领军企业实施案例
+更多领军企业案例
电子杂志订阅
赞助商链接
| |||||||||||||||