电信 教育 政务 机械 汽车 船舶 交通 石化 烟草 服装 电力 金融 外贸 冶金 电子

北京清华紫光文通信息技术有限公司TH-OCR2003录入工厂

2004-10-20 发布方:清华紫光 网友评论 0 条 点击进入论坛

    TH-OCR2003录入工厂

    随着计算机网络的飞速发展,许多信息已经电子化,文字是信息最重要、最集中的载体,实现文字的电子化,OCR技术是其中最重要的环节。世界各地出现了许多"电子版"的报纸、杂志等出版物。但是我们可以看到印刷材料的数量也大大地增加了,一些专业单位如新闻社、图书馆、古籍出版社、档案馆等所接触的印刷材料更是浩如烟海,面对大量的纸介质信息,用什么工具或者通过何种手段将所有信息输入计算机?
    把汉字输入到计算机里一般有两种方法:人工键入和自动输入。使用OCR文字识别技术,能大大提高文字的自动化录入速度。北京清华紫光文通信息技术有限公司作为一家拥有自主知识产权,以清华光学字符识别TH-OCR及手写识别两大核心技术为先导的独立软件开发商和行业解决方案提供商。一直致力于文字识别技术的发展,依托清华大学的技术后盾,沉淀积累了卓越的识别技术,为我国的信息化建设做出了巨大贡献。

    TH-OCR2003录入工厂能做到:

    1、实现计算机自动电子化处理--系统能够实现对图像资源的动态监视,实时自动进行数据转换
   
    2、 保证每人每天能够录入10万字--具有超大字符集(2万多汉字)的识别核心,使识别率更高,减少校对工作量
   
    3、 文件错误率降到万分之三以下--特有的校对工具,在2小时之内可以实现20万汉字的校对
   
    4、 得到高保真全息数字化文件--独有的恢复版面工具,可以恢复原图像的任何一点细节,使信息得到最完整的保留
   
    5、 支持A0幅面图像的识别--系统附加的版面拼接功能,在没有大幅面扫描仪的情况下,依然可以获得大幅面图像
   
    6、 节约成本,一套搞定--只需购买一套,就可以保证每个同事都能使用,不必重复购买
   
    7、 可以生成任何需要的格式--系统除去可以生成HTML、RTF、TXT和PDF等这些常规格式文件外,还提供一个JDA中间格式文件,支持转换其他专有格式打印。
   
    TH-OCR2003录入工厂型号:
   
    运行版、增强版、网络版
   
    TH-OCR2003典型用户:
   
    中国国家图书馆
    中国期刊网
    青苹果数据公司
    中海石油渤海分公司
    国家安全部九局
    清华大学图书馆
    上海交大图书馆
    天津南开大学图书馆


    TH-OCR2003录入工厂的构成:
   
    1、识别模块:
    具有超强的识别核心,可以识别简、繁体汉字2万多,识别的语言包括中文简、繁体、英文、日文、韩文,自动版面分析能力大大增强,最大限度减少手工操作量。
    

    2、纵向校对模块:
   
    A、可以将成百上千张图像一起校对;
   
    B、将识别成同一个字的图像块集中在一个窗口内,这样很容易查错,操作者不会陷入到具体的语言环境中;
   
    C、窗口的尺寸是根据人机距离以及人的眼距来设定的,这样可以使操作者"一目了然",避免眼疲劳
    

    
    3、版面恢复模块:
    通过版面恢复编辑器,可以将原始图像的所有信息恢复过来。比如:字体、颜色、花边等。

    4、自动处理模块:
    可以实现图像文件到PDF文件的自动转换,生成的PDF文件能够实现全文检索,可以复制粘贴;也可以对某个指定目录进行长期监视,真正实现无人操作。
   

    5、版面拼接模块:
    确保在没有大幅面扫描仪的情况下仍然可以获得大幅面图像。
   

    6、HTML编辑器:    
    超值赠送HTML编辑器,对识别后导出的HTML文件进行排版编辑,得到较好的浏览效果。
     

    7、自动转换模块:
    实现从图像PDF文件中抽出图像文件,保存为TIF文件,再对TIF文件进行识别处理。
已有 0 位对此文章感兴趣的网友发布了看法    
我来评两句 登录邮箱: 密码:
  匿名发表
相关案例
解决方案速查(共有 14231 个方案)
基础软件
安全保密
管理软件
办公软件
软件开发
系统网络
图形多媒体
辅助设计
行业专用
教育教学
电子政务
其他软件
接入
通信
网络
存储
IT服务
电子杂志订阅
点击电子杂志名称查看样刊
输入E-mail地址即可订阅
E-mail
赞助商链接