据外电报道,Google公司近日重新发布了开放源代码版光学字符识别软件(OCR),该软件原来是惠普公司开发的。
Tessetact OCR软件是惠普公司在1985--1995年间开发的,它曾在拉斯维加斯大学组织的OCR软件竞赛中获前三名最佳软件排名。
Google公司发表声明称,虽然有些人可能疑问为何搜索巨头对OCR技术发生兴趣,但OCR技术是与Google的目标一致的:让人们通过在线方式获得信息。
Google公司官员Case在公司软件博客中写道:我们全力让用户获得信息,当信息载体是纸质文档时,通过OCR方式就可以将文档页面转换为可用于分类搜索的文本。
惠普公司在1995年停止了Tessetact OCR软件的开发,并将其转让给拉斯维加斯大学的信息科学研究所,从而使其成为开源软件。
Google公司官员称,公司在数月前评估了一些最有名软件,然后做出了决定,Tesseract OCR软件的稳定性好,可以作为开源软件重新发布。
原文链接:http://net.chinabyte.com/318/2562818.shtml