火山安卓源码 本类为所封装的tesseract-ocr版本为3.5.
相关语言包的生成和训练工具软件及火山文字识别类语言包制作教程请到此网址下载:
https://pan.baidu.com/s/14vsJcMccRDUwgCgSS4qC6g
官方关于提高识别质量的意见:https://github.com/tesseract-ocr/tesseract/wi
ki/ImproveQuality
官方所提供多个国家的语言包:https://github.com/tesseract-ocr/tessdata
官方所提供语言包训练的配置:https://github.com/tesseract-ocr/langdata

请注意: 本类所使用的语言包,必须存放在”/tessdata/”目录中.
本类中所有方法,都需要在”初始化”之后使用.
本类为二次封装”tesseract-ocr”识别引擎,通过本类可以快速识别图像中的文字.
请注意: 同本类所附带的语言字库为官方提供的字库,英文识别准确率可达到98%,
对于中文识别率偏低,如果想要提高中文识别率和识别速度,您可以自行训练中文字
库,字库内只包含常用中文汉字(或您行业常用的汉字),这样可以大幅度提高识别率
和识别速度.
在您使用本类时,请你注意下两点:
1.所欲识别的文字和背景色最好有明显对比.
2.如果所欲识别的文字为花式字体,请自行训练该字体的字库.

发表评论

后才能评论