瑞芯微(EASY EAI)RV1126B OCR文字识别

1. OCR文字识别简介

文字识别也是图像领域一个常见问题。然而，对于自然场景图像，首先要定位图像中的文字位置，然后才能进行文字的识别。所以一般包含两个步骤：

文字检测：解决的问题是哪里有文字，文字的范围有多少。

文字识别：对定位好的文字区域进行识别，主要解决的问题是每个文字是什么，将图像中的文字区域进转化为字符信息。

我们的OCR算法是基于CTPN+CRNN设计的。CTPN是一种文字检测算法，能有效的检测出复杂场景的横向分布的文字，是目前比较好的文字检测算法。CRNN算法主要用于端到端地对不定长的文本序列进行识别，不用先对单个文字进行切割，而是将文本识别转化为时序依赖的序列学习问题，就是基于图像的序列识别。

基于EASY-EAI-Nano-TB硬件主板的运行效率：

2. 快速上手

2.1 开发环境准备

如果您初次阅读此文档，请阅读《入门指南/开发环境准备/Easy-Eai编译环境准备与更新》，并按照其相关的操作，进行编译环境的部署。

在PC端Ubuntu系统中执行run脚本，进入EASY-EAI编译环境，具体如下所示。

cd ~/develop_environment
./run.sh

2.2 源码下载

在EASY-EAI编译环境下创建存放源码仓库的管理目录：

cd /opt
mkdir EASY-EAI-Toolkit
cd EASY-EAI-Toolkit

通过git工具，在管理目录内克隆远程仓库

git clone https://github.com/EASY-EAI/EASY-EAI-Toolkit-1126B.git

注：

* 此处可能会因网络原因造成卡顿，请耐心等待。

* 如果实在要在gitHub网页上下载，也要把整个仓库下载下来，不能单独下载本实例对应的目录。

2.3 模型部署

要完成算法Demo的执行，需要先下载OCR算法模型。

百度网盘链接为：https://pan.baidu.com/s/1imI86u1O9xH6T6V_0k2jxw?pwd=1234 （提取码：1234 ）。

同时需要把下载的OCR算法模型复制粘贴到Release/目录：

2.4 例程编译

进入到对应的例程目录执行编译操作，具体命令如下所示：

cd EASY-EAI-Toolkit-1126B/Demos/algorithm-ocr/
./build.sh cpres

注：

* 由于依赖库部署在板卡上，因此交叉编译过程中必须保持/mnt挂载。

* 若build.sh脚本带有cpres参数，则会把Release/目录下的所有资源都拷贝到开发板上。

2.5 例程运行及效果

通过串口调试或ssh调试，进入板卡后台，定位到例程部署的位置，如下所示：

cd /userdata/Demo/algorithm-ocr/

运行例程命令如下所示：

sudo ./test-ocr test.jpg

在EASY-EAI编译环境可以取回测试图片:

cp /mnt/userdata/Demo/algorithm-ocr/result.jpg .

结果图片如下所示：

API的详细说明，以及API的调用（本例程源码），详细信息见下方说明。

3. OCR文字识别API说明

3.1 引用方式

为方便客户在本地工程中直接调用我们的EASY EAI api库，此处列出工程中需要链接的库以及头文件等，方便用户直接添加。

3.2 OCR检测初始化函数

设置OCR检测初始化函数原型如下所示。

int ocr_det_init(const char* model_path, rknn_app_context_t* app_ctx);

具体介绍如下所示。

3.3 OCR检测运行函数

设置OCR检测运行原型如下所示。

int ocr_det_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_det_postprocess_params* params, ocr_det_result* out_result);

具体介绍如下所示。

3.4 OCR检测释放函数

设置OCR检测释放原型如下所示。

int ocr_det_release(rknn_app_context_t* app_ctx);

具体介绍如下所示。

3.5 OCR识别初始化函数

OCR识别初始化函数原型如下所示。

int ocr_rec_init(const char* model_path, rknn_app_context_t* app_ctx);

具体介绍如下所示。

3.6 OCR识别运行函数

OCR识别运行函数原型如下所示。

int ocr_rec_run(rknn_app_context_t* app_ctx, cv::Mat input_image, ocr_rec_result* out_result);

具体介绍如下所示。

3.7 OCR识别释放函数

OCR识别释放函数原型如下所示。

int ocr_rec_release(rknn_app_context_t* app_ctx);

具体介绍如下所示。

4. OCR检测算法例程

例程目录为Demos/algorithm-ocr/test-ocr.cpp，操作流程如下。

#include 
#include 
#include 
#include"ocr.h"

using namespace cv;
using namespace std;

#define INDENT "    "
#define THRESHOLD 0.3 // pixel score threshold
#define BOX_THRESHOLD 0.9 // box score threshold
#define USE_DILATION false // whether to do dilation, true or false
#define DB_UNCLIP_RATIO 1.5 // unclip ratio for poly type

int main(int argc, char **argv)
{
	if (argc != 2) {
		printf("%s \n", argv[0]);
		return -1;
	}
	/* 参数初始化 */
	const char *img_path = argv[1];
	Mat input_image, rgb_img;
	input_image = imread(img_path);
	if (input_image.empty()) {
		cout << "Error: Could not load image" << endl;
		return -1;
	}

	cv::cvtColor(input_image, rgb_img, COLOR_BGR2RGB);

	rknn_app_context_t ocr_det_ctx, ocr_rec_ctx;
	memset(&ocr_det_ctx, 0, sizeof(rknn_app_context_t));
	memset(&ocr_rec_ctx, 0, sizeof(rknn_app_context_t));

	/* OCR算法检测模型&识别模型初始化 */
	ocr_det_init("ocr-det.model", &ocr_det_ctx);
	ocr_rec_init("ocr-rec.model", &ocr_rec_ctx);  

	struct timeval start;
    struct timeval end;
    float time_use=0;

	/* OCR算法检测模型运行 */
	ocr_det_result results;
    ocr_det_postprocess_params params;
    params.threshold = THRESHOLD;
    params.box_threshold = BOX_THRESHOLD;
    params.use_dilate = USE_DILATION;
    params.db_score_mode = (char*)"slow";
    params.db_box_type = (char*)"poly";
    params.db_unclip_ratio = DB_UNCLIP_RATIO;

	gettimeofday(&start,NULL); 
	int ret;
    ret = ocr_det_run(&ocr_det_ctx, rgb_img, &params, &results);
    if (ret != 0) {
        printf("inference_ppocr_rec_model fail! ret=%d\n", ret);
    }

    gettimeofday(&end,NULL);
    time_use=(end.tv_sec-start.tv_sec)*1000000+(end.tv_usec-start.tv_usec);//微秒
    printf("time_use is %f\n",time_use/1000);

	/* 截取文字信息和画框 */
    printf("DRAWING OBJECT\n");
    for (int i = 0; i < results.count; i++)
    {
        printf("[%d]: [(%d, %d), (%d, %d), (%d, %d), (%d, %d)] %f\n", i,
            results.box[i].left_top.x, results.box[i].left_top.y, results.box[i].right_top.x, results.box[i].right_top.y, 
            results.box[i].right_bottom.x, results.box[i].right_bottom.y, results.box[i].left_bottom.x, results.box[i].left_bottom.y,
            results.box[i].score);

        line(input_image, Point(results.box[i].left_top.x, results.box[i].left_top.y), Point(results.box[i].right_top.x, results.box[i].right_top.y),
             Scalar(0, 255, 0), 1, LINE_AA);
        line(input_image, Point(results.box[i].right_top.x, results.box[i].right_top.y), Point(results.box[i].right_bottom.x, results.box[i].right_bottom.y), 
             Scalar(0, 255, 0), 1, LINE_AA);
        line(input_image, Point(results.box[i].right_bottom.x, results.box[i].right_bottom.y), Point(results.box[i].left_bottom.x, results.box[i].left_bottom.y), 
             Scalar(0, 255, 0), 1, LINE_AA);
        line(input_image, Point(results.box[i].left_bottom.x, results.box[i].left_bottom.y), Point(results.box[i].left_top.x, results.box[i].left_top.y), 
             Scalar(0, 255, 0), 1, LINE_AA);

		cv::Mat rgb_crop_image = GetRotateCropImage(rgb_img, results.box[i]);

		/* OCR算法识别模型运行 */
		ocr_rec_result rec_results;
		ocr_rec_run(&ocr_rec_ctx, rgb_crop_image, &rec_results);

		// print text result
    		printf("regconize result: %s, score=%f\n", rec_results.str, rec_results.score);
    }
    cv::imwrite("result.jpg", input_image);
	return 0;
}

随机文章
热门文章
热评文章

瑞芯微(EASY EAI)RV1126B OCR文字识别

1. OCR文字识别简介

2. 快速上手

2.1 开发环境准备

2.2 源码下载

2.3 模型部署

2.4 例程编译

2.5 例程运行及效果

3. OCR文字识别API说明

3.1 引用方式

3.2 OCR检测初始化函数

3.3 OCR检测运行函数

3.4 OCR检测释放函数

3.5 OCR识别初始化函数

3.6 OCR识别运行函数

3.7 OCR识别释放函数

4. OCR检测算法例程

相关推荐