当前位置:Linux教程 - Linux文化 - 促进信息整合 Google发布开源版OCR软件

促进信息整合 Google发布开源版OCR软件


据外电报道,Google公司近日重新发布了开放源代码版光学字符识别软件(OCR),该软件原来是惠普公司开发的。

  Tessetact OCR软件是惠普公司在1985--1995年间开发的,它曾在拉斯维加斯大学组织的OCR软件竞赛中获前三名最佳软件排名。

  Google公司发表声明称,虽然有些人可能疑问为何搜索巨头对OCR技术发生兴趣,但OCR技术是与Google的目标一致的:让人们通过在线方式获得信息。

  Google公司官员Case在公司软件博客中写道:我们全力让用户获得信息,当信息载体是纸质文档时,通过OCR方式就可以将文档页面转换为可用于分类搜索的文本。

  惠普公司在1995年停止了Tessetact OCR软件的开发,并将其转让给拉斯维加斯大学的信息科学研究所,从而使其成为开源软件。

  Google公司官员称,公司在数月前评估了一些最有名软件,然后做出了决定,Tesseract OCR软件的稳定性好,可以作为开源软件重新发布。