CN112041851A - 一种识别文本的方法及终端设备 - Google Patents

一种识别文本的方法及终端设备 Download PDF

Info

Publication number
CN112041851A
CN112041851A CN201880092800.7A CN201880092800A CN112041851A CN 112041851 A CN112041851 A CN 112041851A CN 201880092800 A CN201880092800 A CN 201880092800A CN 112041851 A CN112041851 A CN 112041851A
Authority
CN
China
Prior art keywords
text line
image
text
area
coordinate information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880092800.7A
Other languages
English (en)
Inventor
谢淼
施烈航
姚恒志
勾军委
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN112041851A publication Critical patent/CN112041851A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/2163Partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/166Normalisation of pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18105Extraction of features or characteristics of the image related to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本申请实施例涉及一种识别文本的方法,方法包括:按照第一缩放比例缩放待识别图像;确定缩放后待识别图像中的文本行区域对应的第一坐标信息;按照第一缩放比例确定第一坐标信息对应的第二坐标信息,第二坐标信息为待识别图像中文本行区域的坐标信息;通过识别模型对第二坐标信息对应的文本行图像进行文字识别,确定文本行图像对应的文本行内容;待识别图像包括文本行图像。本申请实施例避免了使用滑窗分割出的子图多次调用NPU造成的资源浪费。结合移动终端应用低响应延时、低功耗的实际需求,基于NPU技术规格,使得能够发挥端侧AI专用芯片的优势,可并发一次处理多文本行、提升NPU使用率,并提高OCR产品用户体验。

Description

PCT国内申请,说明书已公开。

Claims (24)

  1. PCT国内申请,权利要求书已公开。
CN201880092800.7A 2018-12-29 2018-12-29 一种识别文本的方法及终端设备 Pending CN112041851A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2018/125715 WO2020133442A1 (zh) 2018-12-29 2018-12-29 一种识别文本的方法及终端设备

Publications (1)

Publication Number Publication Date
CN112041851A true CN112041851A (zh) 2020-12-04

Family

ID=71128228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880092800.7A Pending CN112041851A (zh) 2018-12-29 2018-12-29 一种识别文本的方法及终端设备

Country Status (4)

Country Link
US (1) US20210326655A1 (zh)
EP (1) EP3879450A4 (zh)
CN (1) CN112041851A (zh)
WO (1) WO2020133442A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112541505A (zh) * 2020-12-11 2021-03-23 上海云从企业发展有限公司 文本识别方法、装置以及计算机可读存储介质
CN112860888A (zh) * 2021-01-26 2021-05-28 中山大学 一种基于注意力机制的双模态情感分析方法
CN112926565A (zh) * 2021-02-25 2021-06-08 中国平安人寿保险股份有限公司 图片文本的识别方法、系统、设备和存储介质
CN114065868A (zh) * 2021-11-24 2022-02-18 马上消费金融股份有限公司 文本检测模型的训练方法、文本检测方法及装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112818979B (zh) * 2020-08-26 2024-02-02 腾讯科技(深圳)有限公司 文本识别方法、装置、设备及存储介质
CN112085022B (zh) * 2020-09-09 2024-02-13 上海蜜度科技股份有限公司 一种用于识别文字的方法、系统及设备
CN112115948A (zh) * 2020-09-15 2020-12-22 电子科技大学 一种基于深度学习的芯片表面字符识别方法
CN113191345A (zh) * 2021-04-28 2021-07-30 北京有竹居网络技术有限公司 一种文本行方向确定方法及其相关设备
CN113673516A (zh) * 2021-08-20 2021-11-19 平安科技(深圳)有限公司 检测区域合并方法、文字识别方法、系统、电子设备及存储介质
CN114495080A (zh) * 2022-01-10 2022-05-13 北京有竹居网络技术有限公司 字体识别方法、装置、可读介质及电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6922487B2 (en) * 2001-11-02 2005-07-26 Xerox Corporation Method and apparatus for capturing text images
US9208550B2 (en) * 2012-08-15 2015-12-08 Fuji Xerox Co., Ltd. Smart document capture based on estimated scanned-image quality
CN107066999A (zh) * 2013-05-22 2017-08-18 华为终端有限公司 一种文字识别方法及用户终端
CN105139042A (zh) * 2015-09-08 2015-12-09 携程计算机技术(上海)有限公司 图像识别方法及系统
CN105678301B (zh) * 2016-01-05 2019-12-13 珠海全志科技股份有限公司 一种自动识别并分割文本图像的方法、系统及装置
US10262235B1 (en) * 2018-02-26 2019-04-16 Capital One Services, Llc Dual stage neural network pipeline systems and methods

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112541505A (zh) * 2020-12-11 2021-03-23 上海云从企业发展有限公司 文本识别方法、装置以及计算机可读存储介质
CN112541505B (zh) * 2020-12-11 2021-07-23 上海云从企业发展有限公司 文本识别方法、装置以及计算机可读存储介质
CN112860888A (zh) * 2021-01-26 2021-05-28 中山大学 一种基于注意力机制的双模态情感分析方法
CN112860888B (zh) * 2021-01-26 2022-05-06 中山大学 一种基于注意力机制的双模态情感分析方法
CN112926565A (zh) * 2021-02-25 2021-06-08 中国平安人寿保险股份有限公司 图片文本的识别方法、系统、设备和存储介质
CN112926565B (zh) * 2021-02-25 2024-02-06 中国平安人寿保险股份有限公司 图片文本的识别方法、系统、设备和存储介质
CN114065868A (zh) * 2021-11-24 2022-02-18 马上消费金融股份有限公司 文本检测模型的训练方法、文本检测方法及装置
CN114065868B (zh) * 2021-11-24 2022-09-02 马上消费金融股份有限公司 文本检测模型的训练方法、文本检测方法及装置

Also Published As

Publication number Publication date
EP3879450A4 (en) 2021-12-22
US20210326655A1 (en) 2021-10-21
WO2020133442A1 (zh) 2020-07-02
EP3879450A1 (en) 2021-09-15

Similar Documents

Publication Publication Date Title
CN112041851A (zh) 一种识别文本的方法及终端设备
CN110738207B (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
CN110458095B (zh) 一种有效手势的识别方法、控制方法、装置和电子设备
CN111681273B (zh) 图像分割方法、装置、电子设备及可读存储介质
CN112508975A (zh) 一种图像识别方法、装置、设备及存储介质
CN111126514A (zh) 图像多标签分类方法、装置、设备及介质
CN111027539A (zh) 一种基于空间位置信息的车牌字符分割方法
CN111199541A (zh) 图像质量评价方法、装置、电子设备及存储介质
CN113822116A (zh) 文本识别方法、装置、计算机设备和存储介质
CN114663904A (zh) 一种pdf文档布局检测方法、装置、设备及介质
CN111507337A (zh) 基于混合神经网络的车牌识别方法
CN109978044B (zh) 训练数据生成方法和装置、以及模型的训练方法和装置
CN114519717A (zh) 一种图像处理方法及装置、计算机设备、存储介质
CN114067339A (zh) 图像识别方法及其装置、电子设备、计算机可读存储介质
CN111476226B (zh) 一种文本定位方法、装置及模型训练方法
US20220309610A1 (en) Image processing method and apparatus, smart microscope, readable storage medium and device
CN115953744A (zh) 一种基于深度学习的车辆识别追踪方法
CN114429628A (zh) 图像处理方法、装置、可读存储介质及电子设备
CN112749293A (zh) 一种图像分类方法、装置及存储介质
CN114399657A (zh) 车辆检测模型训练方法、装置、车辆检测方法及电子设备
CN114387600A (zh) 文本特征识别方法、装置、计算机设备和存储介质
CN114511862A (zh) 表格识别方法、装置及电子设备
CN113221718A (zh) 公式识别方法、装置、存储介质和电子设备
CN111753836A (zh) 文字识别方法、装置、计算机可读介质及电子设备
CN113255668B (zh) 文本识别方法、装置、电子设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination