ocr算法简介

OCR英文全称是Optical Character Recognition,中文叫做光学字符识别。

它是通过扫描等光学技术与计算机技术结合的方式将各种证件、票据、文件及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。

也就是说,OCR识别技术直接从影像中提取各类数据,省去人工录入,节约成本。

基本原理说明--为了识别一张图片中的文字,通常包含两个步骤:

文本检测:检测出图片中文字所在的位置 ;

文字识别:识别包含文字的图片局部,预测具体的文字。

这个算法的主要流程呢包括两个步骤