1. OCR文字识别简介
文字识别也是图像领域一个常见问题。然而,对于自然场景图像,首先要定位图像中的文字位置,然后才能进行文字的识别。所以一般包含两个步骤:
文字检测:解决的问题是哪里有文字,文字的范围有多少。
文字识别:对定位好的文字区域进行识别,主要解决的问题是每个文字是什么,将图像中的文字区域进转化为字符信息。
我们的OCR算法是基于CTPN+CRNN设计的。CTPN是一种文字检测算法,能有效的检测出复杂场景的横向分布的文字,是目前比较好的文字检测算法。CRNN算法主要用于端到端地对不定长的文本序列进行识别,不用先对单个文字进行切割,而是将文本识别转化为时序依赖的序列学习问题,就是基于图像的序列识别。
基于EASY-EAI-Nano-TB硬件主板的运行效率:
2. 快速上手
2.1 开发环境准备
如果您初次阅读此文档,请阅读《入门指南/开发环境准备/Easy-Eai编译环境准备与更新》,并按照其相关的操作,进行编译环境的部署。
在PC端Ubuntu系统中执行run脚本,进入EASY-EAI编译环境,具体如下所示。
cd ~/develop_environment
./run.sh
2.2 源码下载
在EASY-EAI编译环境下创建存放源码仓库的管理目录:
cd /opt
mkdir EASY-EAI-Toolkit
cd EASY-EAI-Toolkit
通过git工具,在管理目录内克隆远程仓库
git clone https://github.com/EASY-EAI/EASY-EAI-Toolkit-1126B.git
注:
* 此处可能会因网络原因造成卡顿,请耐心等待。
* 如果实在要在gitHub网页上下载,也要把整个仓库下载下来,不能单独下载本实例对应的目录。
2.3 模型部署
要完成算法Demo的执行,需要先下载OCR算法模型。
百度网盘链接为:https://pan.baidu.com/s/1imI86u1O9xH6T6V_0k2jxw?pwd=1234 (提取码:1234 )。
同时需要把下载的OCR算法模型复制粘贴到Release/目录:
2.4 例程编译
进入到对应的例程目录执行编译操作,具体命令如下所示:
cd EASY-EAI-Toolkit-1126B/Demos/algorithm-ocr/
./build.sh cpres
注:
* 由于依赖库部署在板卡上,因此交叉编译过程中必须保持/mnt挂载。
* 若build.sh脚本带有cpres参数,则会把Release/目录下的所有资源都拷贝到开发板上。
2.5 例程运行及效果
通过串口调试或ssh调试,进入板卡后台,定位到例程部署的位置,如下所示:
cd /userdata/Demo/algorithm-ocr/
运行例程命令如下所示:
sudo ./test-ocr test.jpg
在EASY-EAI编译环境可以取回测试图片:
cp /mnt/userdata/Demo/algorithm-ocr/result.jpg .
结果图片如下所示:
API的详细说明,以及API的调用(本例程源码),详细信息见下方说明。
3. OCR文字识别API说明
3.1 引用方式
为方便客户在本地工程中直接调用我们的EASY EAI api库,此处列出工程中需要链接的库以及头文件等,方便用户直接添加。
3.2 OCR检测初始化函数
设置OCR检测初始化函数原型如下所示。
int ocr_det_init(const char* model_path, rknn_app_context_t* app_ctx);
具体介绍如下所示。
3.3 OCR检测运行函数
设置OCR检测运行原型如下所示。
int ocr_det_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_det_postprocess_params* params, ocr_det_result* out_result);
具体介绍如下所示。
3.4 OCR检测释放函数
设置OCR检测释放原型如下所示。
int ocr_det_release(rknn_app_context_t* app_ctx);
具体介绍如下所示。
3.5 OCR识别初始化函数
OCR识别初始化函数原型如下所示。
int ocr_rec_init(const char* model_path, rknn_app_context_t* app_ctx);
具体介绍如下所示。
3.6 OCR识别运行函数
OCR识别运行函数原型如下所示。
int ocr_rec_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_rec_result* out_result);
具体介绍如下所示。
3.7 OCR识别释放函数
OCR识别释放函数原型如下所示。
int ocr_rec_release(rknn_app_context_t* app_ctx);
具体介绍如下所示。
4. OCR检测算法例程
例程目录为Demos/algorithm-ocr/test-ocr.cpp,操作流程如下。
#include
#include
#include
#include"ocr.h"
using namespace cv;
using namespace std;
#define INDENT " "
#define THRESHOLD 0.3 // pixel score threshold
#define BOX_THRESHOLD 0.9 // box score threshold
#define USE_DILATION false // whether to do dilation, true or false
#define DB_UNCLIP_RATIO 1.5 // unclip ratio for poly type
int main(int argc, char **argv)
{
if (argc != 2) {
printf("%s \n", argv[0]);
return -1;
}
/* 参数初始化 */
const char *img_path = argv[1];
Mat input_image, rgb_img;
input_image = imread(img_path);
if (input_image.empty()) {
cout << "Error: Could not load image" << endl;
return -1;
}
cv::cvtColor(input_image, rgb_img, COLOR_BGR2RGB);
rknn_app_context_t ocr_det_ctx, ocr_rec_ctx;
memset(&ocr_det_ctx, 0, sizeof(rknn_app_context_t));
memset(&ocr_rec_ctx, 0, sizeof(rknn_app_context_t));
/* OCR算法检测模型&识别模型初始化 */
ocr_det_init("ocr-det.model", &ocr_det_ctx);
ocr_rec_init("ocr-rec.model", &ocr_rec_ctx);
struct timeval start;
struct timeval end;
float time_use=0;
/* OCR算法检测模型运行 */
ocr_det_result results;
ocr_det_postprocess_params params;
params.threshold = THRESHOLD;
params.box_threshold = BOX_THRESHOLD;
params.use_dilate = USE_DILATION;
params.db_score_mode = (char*)"slow";
params.db_box_type = (char*)"poly";
params.db_unclip_ratio = DB_UNCLIP_RATIO;
gettimeofday(&start,NULL);
int ret;
ret = ocr_det_run(&ocr_det_ctx, rgb_img, ¶ms, &results);
if (ret != 0) {
printf("inference_ppocr_rec_model fail! ret=%d\n", ret);
}
gettimeofday(&end,NULL);
time_use=(end.tv_sec-start.tv_sec)*1000000+(end.tv_usec-start.tv_usec);//微秒
printf("time_use is %f\n",time_use/1000);
/* 截取文字信息和画框 */
printf("DRAWING OBJECT\n");
for (int i = 0; i < results.count; i++)
{
printf("[%d]: [(%d, %d), (%d, %d), (%d, %d), (%d, %d)] %f\n", i,
results.box[i].left_top.x, results.box[i].left_top.y, results.box[i].right_top.x, results.box[i].right_top.y,
results.box[i].right_bottom.x, results.box[i].right_bottom.y, results.box[i].left_bottom.x, results.box[i].left_bottom.y,
results.box[i].score);
line(input_image, Point(results.box[i].left_top.x, results.box[i].left_top.y), Point(results.box[i].right_top.x, results.box[i].right_top.y),
Scalar(0, 255, 0), 1, LINE_AA);
line(input_image, Point(results.box[i].right_top.x, results.box[i].right_top.y), Point(results.box[i].right_bottom.x, results.box[i].right_bottom.y),
Scalar(0, 255, 0), 1, LINE_AA);
line(input_image, Point(results.box[i].right_bottom.x, results.box[i].right_bottom.y), Point(results.box[i].left_bottom.x, results.box[i].left_bottom.y),
Scalar(0, 255, 0), 1, LINE_AA);
line(input_image, Point(results.box[i].left_bottom.x, results.box[i].left_bottom.y), Point(results.box[i].left_top.x, results.box[i].left_top.y),
Scalar(0, 255, 0), 1, LINE_AA);
cv::Mat rgb_crop_image = GetRotateCropImage(rgb_img, results.box[i]);
/* OCR算法识别模型运行 */
ocr_rec_result rec_results;
ocr_rec_run(&ocr_rec_ctx, rgb_crop_image, &rec_results);
// print text result
printf("regconize result: %s, score=%f\n", rec_results.str, rec_results.score);
}
cv::imwrite("result.jpg", input_image);
return 0;
}- 随机文章
- 热门文章
- 热评文章
- 河南粮食重点领域贷款余额超2595亿元,河南粮食重点领域贷款余额超2595亿元
- 上海国际电影节“一带一路”电影周启幕,上海国际电影节“一带一路”电影周启幕
- 东西问丨阿依达尔·阿姆列巴耶夫:为什么说“上海精神”是上合组织的“发展密码”?,东西问丨阿依达尔·阿姆列巴耶夫:为什么说“上海精神”是上合组织的“发展密码”?
- “未来医院”照进现实:132项医疗前沿科创成果决赛雄安,“未来医院”照进现实:132项医疗前沿科创成果决赛雄安
- 第二届“圆梦盲童 通向未来”读说写训练营举办 保障盲童阅读权益,第二届“圆梦盲童 通向未来”读说写训练营举办 保障盲童阅读权益
- 毕业典礼特写:百廿山大“青春”不散场,毕业典礼特写:百廿山大“青春”不散场
- 解码黄金产业发展路径 《2025中国黄金产业区域发展指数白皮书》在蓉首发,解码黄金产业发展路径 《2025中国黄金产业区域发展指数白皮书》在蓉首发
- 全球化能力持续进阶:海信连续9年位居中国全球化品牌十强,全球化能力持续进阶:海信连续9年位居中国全球化品牌十强
- 1[风险]嘉实原油LOF (160723): 嘉实原油证券投资基金(QDII-LOF)溢价风险提示公告
- 2广西三地接连发布公告:禁止前往!后果自负!
- 3甜蜜的事业,幸福的滋味……
- 4SCADA系统的NAT转换与网段隔离解决方案
- 5芦苇任中国邮政集团副总经理
- 6A股三大股指集体收涨,沪指续创10年新高,A股三大股指集体收涨,沪指续创10年新高
- 7穆勒矩阵椭偏仪:DVRMME技术的系统误差建模与校准补偿
- 8政策定调催生新主线,A股跨年行情蓄势待发
- 1废砖瓦里砌出风景线 湖南靖州深山村寨美丽嬗变,废砖瓦里砌出风景线 湖南靖州深山村寨美丽嬗变
- 2文科生也可以学医了!多所高校中医学类专业选科放宽,文科生也可以学医了!多所高校中医学类专业选科放宽
- 3湖南零陵发展数字农业 现代农民种粮更轻松,湖南零陵发展数字农业 现代农民种粮更轻松
- 4上午买食材、下午逛潮店 古城老菜场人气足,上午买食材、下午逛潮店 古城老菜场人气足
- 5广东怀集所有国省道主线均已抢通,广东怀集所有国省道主线均已抢通
- 6520分钟攻坚!成渝中线高铁成都站改建工程进度过半,520分钟攻坚!成渝中线高铁成都站改建工程进度过半
- 7广东清远连山紧急转移8名村民 避险山体滑坡,广东清远连山紧急转移8名村民 避险山体滑坡
- 8中意经典著作互译出版项目启动 四部重磅作品首批入选,中意经典著作互译出版项目启动 四部重磅作品首批入选
