CN110188748B - 图像内容识别方法、装置以及计算机可读存储介质 - Google Patents

图像内容识别方法、装置以及计算机可读存储介质 Download PDF

Info

Publication number
CN110188748B
CN110188748B CN201910362067.2A CN201910362067A CN110188748B CN 110188748 B CN110188748 B CN 110188748B CN 201910362067 A CN201910362067 A CN 201910362067A CN 110188748 B CN110188748 B CN 110188748B
Authority
CN
China
Prior art keywords
content
image
recognition
target content
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910362067.2A
Other languages
English (en)
Other versions
CN110188748A (zh
Inventor
李奇倚
温舒
胡宏辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Shanghu Information Technology Co ltd
Original Assignee
Shanghai Shanghu Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Shanghu Information Technology Co ltd filed Critical Shanghai Shanghu Information Technology Co ltd
Priority to CN201910362067.2A priority Critical patent/CN110188748B/zh
Publication of CN110188748A publication Critical patent/CN110188748A/zh
Application granted granted Critical
Publication of CN110188748B publication Critical patent/CN110188748B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

一种图像内容识别方法、装置以及计算机可读存储介质,所述方法包括:定位得到所述目标内容的位置范围后;对所述目标内容的位置范围进行多次调整,针对每次调整后的所述目标内容的位置范围内的内容进行识别,得到多个识别结果;将多个识别结果进行归类,选取识别结果数量最多的类别作为最终识别结果。采用上述方案,在定位目标内容的位置后,通过对目标内容的位置进行多次调整,针对每次调整后的位置进行识别,在识别结果中筛选得到最终识别结果,以提升图像内容识别的准确度。

Description

图像内容识别方法、装置以及计算机可读存储介质
技术领域
本发明涉及图像识别领域,尤其涉及一种图像内容识别方法、装置以及计算机可读存储介质。
背景技术
现今,基于深度学习的图像识别技术在工业界得到越来越广泛的应用。
对于目标识别、文字识别、人脸识别等多种图像识别的应用场景中,现有技术中采用的方案分为以下两步:1、先定位目标内容的位置;2、对框选的目标进行识别。
然而,现有技术中采用的方案在实际应用过程中,在定位目标内容这一步骤中会产生误差,而目标内容定位的准确性会影响后续的识别结果。
发明内容
本发明解决的技术问题是目标内容定位不准确导致识别结果产生误差。
为解决上述技术问题,本发明实施例提供一种图像内容识别方法,包括:在原始图像上定位目标内容,定位得到所述目标内容的位置范围;对所述目标内容的位置范围进行多次调整,针对每次调整后的所述目标内容的位置范围内的内容进行识别,得到多个识别结果;将多个识别结果进行归类,选取识别结果数量最多的类别作为最终识别结果。
可选的,所述目标内容包括以下至少一种:文字内容、图像内容。
可选的,根据目标内容的性质,使用相应的定位算法于所述原始图像上定位目标内容。
可选的,对所述原始图像进行图像处理。
可选的,所述图像处理包括以下至少一种:锐化处理、亮度调整。
可选的,将相同的识别结果归于同一类别。
可选的,将识别结果数量最多的类别内的识别结果作为最终识别结果。
本发明实施例还提供一种图像内容识别装置,包括:定位单元,用于在原始图像上定位目标内容,定位得到所述目标内容的位置范围;识别单元,用于对所述目标内容的位置范围进行多次调整,针对每次调整后的所述目标内容的位置范围内的内容进行识别,得到多个识别结果;筛选单元,用于将多个识别结果进行归类,选取识别结果数量最多的类别作为最终识别结果。
可选的,所述目标内容包括以下至少一种:文字内容、图像内容。
可选的,所述定位单元,用于根据目标内容的性质,使用相应的定位算法于所述原始图像上定位目标内容。
可选的,所述识别单元,用于对所述原始图像进行图像处理。
可选的,所述图像处理包括以下至少一种:锐化处理、亮度调整。
可选的,所述筛选单元,用于将相同的识别结果归于同一类别。
可选的,所述筛选单元,用于将识别结果数量最多的类别内的识别结果作为最终识别结果。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机指令,所述计算机可读存储介质为非易失性存储介质或非瞬态存储介质,所述计算机指令运行时执行本发明实施例提供的图像内容识别方法的步骤。
本发明实施例还提供一种图像内容识别装置,包括存储器和处理器,所述存储器上存储有计算机指令,所述计算机指令运行时所述处理器执行本发明实施例提供的图像内容识别方法的步骤。
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
通过定位得到所述目标内容的位置范围后;对所述目标内容的位置范围进行多次调整,针对每次调整后的所述目标内容的位置范围内的内容进行识别,得到多个识别结果;将多个识别结果进行归类,选取识别结果数量最多的类别作为最终识别结果。采用上述方案,在定位目标内容的位置后,通过对目标内容的位置进行多次调整,针对每次调整后的位置进行识别,在识别结果中筛选得到最终识别结果,从而可以提升图像内容识别的准确度。
附图说明
图1是本发明实施例中的一种图像内容识别方法的流程示意图;
图2是本发明实施例中的一种图像内容识别装置的结构示意图。
具体实施方式
对于目标识别、文字识别、人脸识别等多种图像识别的应用场景中,现有技术中采用的方案分为以下两步:1、先定位目标内容的位置;2、对框选的目标进行识别。
然而,现有技术中采用的方案在实际应用过程中,在定位目标内容这一步骤中会产生误差,而目标内容定位的准确性会影响后续的识别结果。
本发明实施例中,通过定位得到所述目标内容的位置范围后;对所述目标内容的位置范围进行多次调整,针对每次调整后的所述目标内容的位置范围内的内容进行识别,得到多个识别结果;将多个识别结果进行归类,选取识别结果数量最多的类别作为最终识别结果。采用上述方案,在定位目标内容的位置后,通过对目标内容的位置进行多次调整,针对每次调整后的位置进行识别,在识别结果中筛选得到最终识别结果,以提升图像内容识别的准确度。
为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
参阅图1,其为本发明实施例中的一种图像内容识别方法的流程示意图,以下结合具体步骤进行详细说明。
步骤S101,在原始图像上定位目标内容,定位得到所述目标内容的位置范围。
在具体实施中,原始图像可以为包括待识别内容的图像,待识别内容即为目标内容。对原始图像上的目标内容进行定位,若目标内容分散于所述原始图像的多处区域时,可以逐一对处于各个区域的目标内容进行定位。
本发明实施例中,所述目标内容包括以下至少一种:文字内容、图像内容。
在具体实施中,目标内容可以仅为文字内容或图像内容,也可以为文字内容与图像内容的结合。
本发明实施例中,可以根据目标内容的性质,使用相应的定位算法于所述原始图像上定位目标内容。
在具体实施中,可以使用定位算法对目标内容进行定位,当目标内容的性质不同时,使用的定位算法可以不相同。在目标内容的性质为文字时,可以使用文字定位算法;在目标内容的性质为图像时,可以使用图像定位算法;在目标内容的性质为图像和文字结合时,可以分别使用文字定位算法和图像定位算法。
步骤S102,对所述目标内容的位置范围进行多次调整,针对每次调整后的所述目标内容的位置范围内的内容进行识别,得到多个识别结果;
在具体实施中,由于定位算法的定位结果存在出现误差的情况,在定位结果存在误差的情况下,识别结果会产生更大的误差。因此,在定位得到所述目标内容的位置范围后,可以对所述目标内容的位置范围进行多次调整。
在具体实施中,所述目标内容的位置范围的调整可以是将获得的位置范围整体右移、左移、上移、下移、扩大等,具体调整的方式和程度可以由用户根据实际应用场景进行相应的设定。
在具体实施中,在每次调整所述目标内容的位置范围后进行识别,可以获得多个识别结果,以此可以避免将出现误差的结果进行输出,进而提升图像内容识别的准确度。
本发明实施例中,在所述针对每次调整后的所述目标内容的位置范围内的内容进行识别,得到多个识别结果之前,还可以对所述原始图像进行图像处理。
本发明实施例中,所述图像处理包括以下至少一种:锐化处理、亮度调整。
在具体实施中,通过对原始图像进行图像处理,使得原始图像上的目标内容的可识别度提升。在使用识别算法对所述目标内容的位置范围内的内容进行识别时,可以更加高效、准确地获取位置范围内的内容,避免在识别阶段出现误差,进而提升图像内容识别的准确度。
步骤S103,将多个识别结果进行归类,选取识别结果数量最多的类别作为最终识别结果。
本发明实施例中,将相同的识别结果归于同一类别。
本发明实施例中,将识别结果数量最多的类别内的识别结果作为最终识别结果。
在具体实施中,在获得多个识别结果后,以是否相同作为划分标准,将识别结果数量最多的内容作为最终识别结果。例如,获得以下三个识别结果:“显示更多”、“显示更多”、“目示更多”,其中“显示更多”这一识别结果数量最多,将“显示更多”作为最终识别结果。
参阅图2,其为本发明实施例中的一种图像内容识别装置20的结构示意图,具体包括:
定位单元201,用于在原始图像上定位目标内容,定位得到所述目标内容的位置范围;
识别单元202,用于对所述目标内容的位置范围进行多次调整,针对每次调整后的所述目标内容的位置范围内的内容进行识别,得到多个识别结果;
筛选单元203,用于将多个识别结果进行归类,选取识别结果数量最多的类别作为最终识别结果。
本发明实施例中,所述目标内容可以包括以下至少一种:文字内容、图像内容。
本发明实施例中,所述定位单元201,还可以用于根据目标内容的性质,使用相应的定位算法于所述原始图像上定位目标内容。
本发明实施例中,所述识别单元202,还可以用于对所述原始图像进行图像处理。
本发明实施例中,所述图像处理可以包括以下至少一种:锐化处理、亮度调整。
本发明实施例中,所述筛选单元203,还可以用于将相同的识别结果归于同一类别。
本发明实施例中,所述筛选单元203,还可以用于将识别结果数量最多的类别内的识别结果作为最终识别结果。
本发明实施例中还提供一种计算机可读存储介质,其上存储有计算机指令,所述计算机可读存储介质为非易失性存储介质或非瞬态存储介质,所述计算机指令运行时执行本发明实施例中提供的图像内容识别方法的步骤。
本发明实施例中还提供一种图像内容识别装置,包括存储器和处理器,所述存储器上存储有计算机指令,所述计算机指令运行时所述处理器执行本发明实施例中提供的图像内容识别方法的步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指示相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims (14)

1.一种图像内容识别方法,其特征在于,包括:
在原始图像上定位目标内容,定位得到所述目标内容的位置范围;
对所述目标内容的位置范围进行多次调整,针对每次调整后的所述目标内容的位置范围内的内容进行识别,得到多个识别结果;
将多个识别结果进行归类,选取识别结果数量最多的类别作为最终识别结果。
2.根据权利要求1所述的图像内容识别方法,其特征在于,所述目标内容包括以下至少一种:文字内容、图像内容。
3.根据权利要求1所述的图像内容识别方法,其特征在于,所述在原始图像上定位目标内容,包括:
根据目标内容的性质,使用相应的定位算法于所述原始图像上定位目标内容。
4.根据权利要求1所述的图像内容识别方法,其特征在于,在所述针对每次调整后的所述目标内容的位置范围内的内容进行识别,得到多个识别结果之前,还包括:
对所述原始图像进行图像处理。
5.根据权利要求4所述的图像内容识别方法,其特征在于,所述图像处理包括以下至少一种:锐化处理、亮度调整。
6.根据权利要求1所述的图像内容识别方法,其特征在于,所述将多个识别结果进行归类,包括:
将相同的识别结果归于同一类别。
7.一种图像内容识别装置,其特征在于,包括:
定位单元,用于在原始图像上定位目标内容,定位得到所述目标内容的位置范围;
识别单元,用于对所述目标内容的位置范围进行多次调整,针对每次调整后的所述目标内容的位置范围内的内容进行识别,得到多个识别结果;
筛选单元,用于将多个识别结果进行归类,选取识别结果数量最多的类别作为最终识别结果。
8.根据权利要求7所述的图像内容识别装置,其特征在于,所述目标内容包括以下至少一种:文字内容、图像内容。
9.根据权利要求7所述的图像内容识别装置,其特征在于,所述定位单元,用于根据目标内容的性质,使用相应的定位算法于所述原始图像上定位目标内容。
10.根据权利要求7所述的图像内容识别装置,其特征在于,所述识别单元,用于对所述原始图像进行图像处理。
11.根据权利要求10所述的图像内容识别装置,其特征在于,所述图像处理包括以下至少一种:锐化处理、亮度调整。
12.根据权利要求7所述的图像内容识别装置,其特征在于,所述筛选单元,用于将相同的识别结果归于同一类别。
13.一种计算机可读存储介质,其上存储有计算机程序,所述计算机可读存储介质为非易失性存储介质或非瞬态存储介质,其特征在于,所述计算机程序被处理器运行时执行权利要求1~6任一项所述的图像内容识别方法的步骤。
14.一种图像内容识别装置,包括存储器和处理器,所述存储器上存储有计算机程序,其特征在于,所述计算机程序运行时所述处理器执行权利要求1~6任一项所述的图像内容识别方法的步骤。
CN201910362067.2A 2019-04-30 2019-04-30 图像内容识别方法、装置以及计算机可读存储介质 Active CN110188748B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910362067.2A CN110188748B (zh) 2019-04-30 2019-04-30 图像内容识别方法、装置以及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910362067.2A CN110188748B (zh) 2019-04-30 2019-04-30 图像内容识别方法、装置以及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110188748A CN110188748A (zh) 2019-08-30
CN110188748B true CN110188748B (zh) 2021-07-13

Family

ID=67715495

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910362067.2A Active CN110188748B (zh) 2019-04-30 2019-04-30 图像内容识别方法、装置以及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110188748B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111340070B (zh) * 2020-02-11 2024-03-26 杭州睿琪软件有限公司 植物病虫害诊断方法和系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573637A (zh) * 2014-12-18 2015-04-29 厦门翼歌软件科技有限公司 一种基于多摄像头的车牌识别方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10973344B2 (en) * 2012-04-30 2021-04-13 Xsensor Technology Corporation Bedding system with a CNN based machine vision process
US9509970B2 (en) * 2012-07-18 2016-11-29 Qualcomm Incorporated Crosstalk reduction with location-based adjustment in multiview video processing
CN104899611B (zh) * 2015-06-26 2018-09-25 小米科技有限责任公司 确定图像中卡片位置的方法及装置
US10186036B1 (en) * 2016-11-04 2019-01-22 Gopro, Inc. Systems and methods for horizon identification in an image
CN107492115B (zh) * 2017-08-30 2021-01-01 北京小米移动软件有限公司 目标对象的检测方法及装置
CN107808152A (zh) * 2017-11-23 2018-03-16 高域(北京)智能科技研究院有限公司 提升人脸识别准确率的方法和人脸识别系统
CN108111763B (zh) * 2017-12-28 2020-09-08 Oppo广东移动通信有限公司 图像处理方法、装置、存储介质及电子设备
CN108345942B (zh) * 2018-02-08 2020-04-07 重庆理工大学 一种基于嵌入编码学习的机器学习识别方法
CN108830266B (zh) * 2018-03-23 2020-12-08 创新先进技术有限公司 一种图像识别的方法、装置及设备
CN108875608B (zh) * 2018-06-05 2021-12-17 合肥湛达智能科技有限公司 一种基于深度学习的机动车交通信号识别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573637A (zh) * 2014-12-18 2015-04-29 厦门翼歌软件科技有限公司 一种基于多摄像头的车牌识别方法

Also Published As

Publication number Publication date
CN110188748A (zh) 2019-08-30

Similar Documents

Publication Publication Date Title
CN109117831B (zh) 物体检测网络的训练方法和装置
CN109685199B (zh) 创建包含关于池化类型的信息的表的方法和装置及使用其的测试方法和测试装置
KR20190026641A (ko) 클레임 서류의 문자 인식 방법, 장치, 서버 및 저장매체
US10013613B2 (en) Identifying objects in an image
US9613299B2 (en) Method of identifying pattern training need during verification of recognized text
US9471836B1 (en) Method for learning rejector by forming classification tree in use of training images and detecting object in test images, and rejector using the same
CN104182335A (zh) 软件测试方法和装置
CN104239909A (zh) 一种图像的识别方法和装置
CN107273883B (zh) 决策树模型训练方法、确定ocr结果中数据属性方法及装置
US20160098615A1 (en) Apparatus and method for producing image processing filter
CN104142912A (zh) 一种精确的语料类别标注方法及装置
CN111210402A (zh) 人脸图像质量评分方法、装置、计算机设备及存储介质
CN111243601A (zh) 声纹聚类方法、装置、电子设备和计算机可读存储介质
CN110928971A (zh) 一种提高地址识别精确度的方法及装置
RU2014103156A (ru) Способы и системы эффективного автоматического распознавания символов, использующие множество кластеров эталонов символов
CN111222368A (zh) 一种识别文档段落的方法、装置及电子设备
US7668336B2 (en) Extracting embedded information from a document
US8750571B2 (en) Methods of object search and recognition
US11544568B2 (en) Method for optimizing a data model and device using the same
CN110188748B (zh) 图像内容识别方法、装置以及计算机可读存储介质
CN111242158A (zh) 神经网络训练方法、图像处理方法及装置
CN111783812A (zh) 违禁图像识别方法、装置和计算机可读存储介质
CN113780365A (zh) 样本生成方法和装置
JPWO2019180868A1 (ja) 画像生成装置、画像生成方法および画像生成プログラム
CN112506897A (zh) 一种分析、定位数据质量问题的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant