CN106295514A - 一种图像识别题目显示答案的方法及装置 - Google Patents

一种图像识别题目显示答案的方法及装置 Download PDF

Info

Publication number
CN106295514A
CN106295514A CN201610602731.2A CN201610602731A CN106295514A CN 106295514 A CN106295514 A CN 106295514A CN 201610602731 A CN201610602731 A CN 201610602731A CN 106295514 A CN106295514 A CN 106295514A
Authority
CN
China
Prior art keywords
image
system server
similarity
image information
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610602731.2A
Other languages
English (en)
Inventor
秦曙光
吴伟旺
傅元弟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZHONGSHAN READBOY ELECTRONICS CO Ltd
Original Assignee
ZHONGSHAN READBOY ELECTRONICS CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZHONGSHAN READBOY ELECTRONICS CO Ltd filed Critical ZHONGSHAN READBOY ELECTRONICS CO Ltd
Priority to CN201610602731.2A priority Critical patent/CN106295514A/zh
Publication of CN106295514A publication Critical patent/CN106295514A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图像识别题目显示答案的方法及装置,该方法包括以下步骤:S1:一终端设备通过其摄像头采集目标区域的图像;S2:终端设备将采集到的图像上传至一系统服务器;S3:系统服务器将接收到的图像与资源数据库中的图像信息进行匹配,得到相似度最高的图像信息;S4:系统服务器将所得的图像信息传送至终端设备进行显示。本发明能够有效地节省用户的时间和流量;通过应用扫描课本图片识别技术的APP,在进行同步学习辅导或搜索教材某页内容时,无需按书本科目、版本和年级来搜索教材,再逐页寻找所需的内容,无需浪费流量整本下载,只需要轻轻一扫就能精准定位到需要的课文页面,进行同步作业辅导。

Description

一种图像识别题目显示答案的方法及装置
技术领域
本发明属于图像识别技术领域,尤其涉及一种图像识别题目显示答案的方法及装置。
背景技术
现在电子产品越来越普及,用智能终端产品,如手机和平板电脑等摄像功能将难题拍摄下来并寻求网络答疑的方法得到了广泛的应用,但是现有方法在拍摄到难题之后,需要用户手动拉拽剪贴框选来选择目标区域,这个操作往往需要很多的时间和精力,而且拖拽选取题目不易操作并且也不够准确,手动拖拽往往容易造成框多或者框少的问题,导致寻求答案过程变得困难、缓慢甚至还会造成解答错误的情况,如今学生学业繁重,应尽量减轻学生寻求答疑的难度。
国内流行的学习类APP只能做到识别题目,甚至每次只能识别一道题目,并不能识别整个页面的所有内容。
发明内容
为了克服现有技术的不足,本发明的目的之一在于提供一种图像识别题目显示答案的方法,其能解决整页识别教材并显示答案的技术问题。
本发明的目的之二在于提供一种图像识别题目显示答案的装置,其能解决整页识别教材并显示答案的技术问题。
本发明的目的之一采用以下技术方案实现:
一种图像识别题目显示答案的方法,包括以下步骤:
S1:一终端设备通过其摄像头采集目标区域的图像;
S2:终端设备将采集到的图像上传至一系统服务器;
S3:系统服务器将接收到的图像与资源数据库中的图像信息进行匹配,得到相似度最高的图像信息;
S4:系统服务器将所得的相似度最高的图像信息传送至终端设备进行显示。
优选地,步骤S3具体包括以下子步骤:
S31:系统服务器对接收到的图像进行预处理;
S32:系统服务器通过特征提取算法提取图像的特征数据;
S33:系统服务器通过相似性度量算法计算图像特征数据与资源数据库中图像信息对应的特征数据的相似度,并将相似度由大至小依次排序;
S34:系统服务器选取相似度最高的图像信息。能够进一步公开图像信息匹配的具体步骤。
本发明的目的之二采用以下技术方案实现:
一种图像识别题目显示答案的装置,包括以下模块:
数据采集模块:设置于终端设备,用于通过其摄像头采集目标区域的图像;
数据上传模块:设置于终端设备,用于将采集到的图像上传至一系统服务器;
图像匹配模块:设置于系统服务器,用于将接收到的图像与资源数据库中的图像信息进行匹配,得到相似度最高的图像信息;
答案显示模块:设置于终端设备,用于对所得的相似度最高的图像信息进行显示。
优选地,图像匹配模块具体包括以下子模块:
图像预处理模块:设置于系统服务器,用于对接收到的图像进行预处理;
特征数据提取模块:设置于系统服务器,用于通过特征提取算法提取图像的特征数据;
相似度计算模块:设置于系统服务器,用于通过相似性度量算法计算图像特征数据与资源数据库中图像信息对应的特征数据的相似度,并将相似度由大至小依次排序;
图像选取模块:设置于系统服务器,用于选取相似度最高的图像信息。能够进一步公开图像匹配模块的具体结构。
相比现有技术,本发明的有益效果在于:
本发明能够有效地节省用户的时间和流量;通过应用扫描课本图片识别技术的APP,在进行同步学习辅导或搜索教材某页内容时,无需按书本科目、版本和年级来搜索教材,再逐页寻找所需的内容,无需浪费流量整本下载,只需要轻轻一扫就能精准定位到需要的课文页面,进行同步作业辅导。
附图说明
图1为本发明一种图像识别题目显示答案的方法的流程图;
图2为本发明一种图像识别题目显示答案的装置的原理框图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述:
如图1所示,本发明提供了一种图像识别题目显示答案的方法,包括以下步骤:
S1:一终端设备通过其摄像头采集目标区域的图像;在此步骤中,主要的是终端设备通过摄像头来采集目标区域的图像,以供后期图像特征提取使用;所述目标区域指的是课本的整页的内容;
S2:终端设备将采集到的图像上传至一系统服务器;
S3:系统服务器将接收到的图像与资源数据库中的图像信息进行匹配,得到相似度最高的图像信息;步骤S3具体包括以下子步骤:
S31:系统服务器对接收到的图像进行预处理;
S32:系统服务器通过特征提取算法提取图像的特征数据;
S33:系统服务器通过相似性度量算法计算图像特征数据与资源数据库中图像信息对应的特征数据的相似度,并将相似度由大至小依次排序;
S34:系统服务器选取相似度最高的图像信息;在步骤S3中,先对图像进行预处理,包括格式转换和图像增强等,来使得系统服务器对图像特征的提取更加的方便,其中格式转换主要是将图片灰度化,图像增强主要是将图像的对比度增强、色阶增强、边缘过滤和模糊过滤等,然后利用特征提取算法来提取图片特征码,主要包括图像的形状、纹理等特征的提取,利用提取到的图片特征比对资源数据库中存储的信息;资源数据库中包括了国内中小学各个版本各个阶段各科的教材的信息,通过对各种教材用算法提取图像特征,来得到资源数据库,以供与用户提取到的图像特征进行比对,然后得到用户所需要的页面的答案信息。本发明的识别采用的识别整个页面图像特征,而不是采用图像识别单道题目,然后去题库里面匹配答案解析,识别采用的技术不同,本发明的图像采集依靠的是基于内容的图像检索系统DOIR(Distributed Optical Image Recognition)分布式光学图像识别来实现此功能,其主要是度图像的可视特征进行检索。
S4:系统服务器将所得的相似度最高的图像信息传送至终端设备进行显示。此处的图像信息即为用户扫描页面的对应习题的答案,通过本发明能够进行同步学习辅导或搜索教材某页内容,而无需按书本、科目和年级来搜索,并且也不需要耗费大量流量整本下载,只需要轻轻一扫进行准确定位,大大提高了学习辅导的效率。
如图2所示,本发明提供了一种图像识别题目显示答案的装置,包括以下模块:
数据采集模块:设置于终端设备,用于通过其摄像头采集目标区域的图像;
数据上传模块:设置于终端设备,用于将采集到的图像上传至一系统服务器;
图像匹配模块:设置于系统服务器,用于将接收到的图像与资源数据库中的图像信息进行匹配,得到相似度最高的图像信息;所述图像匹配模块具体包括以下子模块:
图像预处理模块:设置于系统服务器,用于对接收到的图像进行预处理;
特征数据提取模块:设置于系统服务器,用于通过特征提取算法提取图像的特征数据;
相似度计算模块:设置于系统服务器,用于通过相似性度量算法计算图像特征数据与资源数据库中图像信息对应的特征数据的相似度,并将相似度由大至小依次排序;
图像选取模块:设置于系统服务器,用于选取相似度最高的图像信息;
答案显示模块:设置于终端设备,用于对所得相似度最高的图像信息进行显示。
对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。

Claims (4)

1.一种图像识别题目显示答案的方法,其特征在于,包括以下步骤:
S1:一终端设备通过其摄像头采集目标区域的图像;
S2:终端设备将采集到的图像上传至一系统服务器;
S3:系统服务器将接收到的图像与资源数据库中的图像信息进行匹配,得到相似度最高的图像信息;
S4:系统服务器将所得的相似度最高的图像信息传送至终端设备进行显示。
2.如权利要求1所述的图像识别题目显示答案的方法,其特征在于,步骤S3具体包括以下子步骤:
S31:系统服务器对接收到的图像进行预处理;
S32:系统服务器通过特征提取算法提取图像的特征数据;
S33:系统服务器通过相似性度量算法计算图像特征数据与资源数据库中图像信息对应的特征数据的相似度,并将相似度由大至小依次排序;
S34:系统服务器选取相似度最高的图像信息。
3.一种图像识别题目显示答案的装置,其特征在于,包括以下模块:
数据采集模块:设置于终端设备,用于通过其摄像头采集目标区域的图像;
数据上传模块:设置于终端设备,用于将采集到的图像上传至一系统服务器;
图像匹配模块:设置于系统服务器,用于将接收到的图像与资源数据库中的图像信息进行匹配,得到相似度最高的图像信息;
答案显示模块:设置于终端设备,用于对所得相似度最高的图像信息进行显示。
4.如权利要求3所述的图像识别题目显示答案的装置,其特征在于,图像匹配模块具体包括以下子模块:
图像预处理模块:设置于系统服务器,用于对接收到的图像进行预处理;
特征数据提取模块:设置于系统服务器,用于通过特征提取算法提取图像的特征数据;
相似度计算模块:设置于系统服务器,用于通过相似性度量算法计算图像特征数据与资源数据库中图像信息对应的特征数据的相似度,并将相似度由大至小依次排序;
图像选取模块:设置于系统服务器,用于选取相似度最高的图像信息。
CN201610602731.2A 2016-07-27 2016-07-27 一种图像识别题目显示答案的方法及装置 Pending CN106295514A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610602731.2A CN106295514A (zh) 2016-07-27 2016-07-27 一种图像识别题目显示答案的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610602731.2A CN106295514A (zh) 2016-07-27 2016-07-27 一种图像识别题目显示答案的方法及装置

Publications (1)

Publication Number Publication Date
CN106295514A true CN106295514A (zh) 2017-01-04

Family

ID=57662864

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610602731.2A Pending CN106295514A (zh) 2016-07-27 2016-07-27 一种图像识别题目显示答案的方法及装置

Country Status (1)

Country Link
CN (1) CN106295514A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107845048A (zh) * 2017-11-24 2018-03-27 合肥立腾信息科技有限责任公司 一种基于人工智能的学习管理系统
CN108038195A (zh) * 2017-12-12 2018-05-15 广东小天才科技有限公司 一种智能终端搜题的方法、装置、智能终端及存储介质
CN109243215A (zh) * 2018-08-31 2019-01-18 广东小天才科技有限公司 一种基于智能装置的交互方法、智能装置及系统
CN110174988A (zh) * 2018-11-06 2019-08-27 广东小天才科技有限公司 一种基于可穿戴设备的学习方法及可穿戴设备
CN112307158A (zh) * 2019-08-30 2021-02-02 北京字节跳动网络技术有限公司 一种信息检索方法、装置、设备及介质
CN112632317A (zh) * 2021-01-13 2021-04-09 深圳市万物志科技有限公司 基于用户图片的多目标交互方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090142742A1 (en) * 2007-11-29 2009-06-04 Adele Goldberg Analysis for Assessing Test Taker Responses to Puzzle-Like Questions
CN103678637A (zh) * 2013-12-19 2014-03-26 北京快乐学网络科技有限公司 一种获取试题信息的方法及装置
CN103914567A (zh) * 2014-04-23 2014-07-09 北京奇虎科技有限公司 匹配目标试题答案的方法和装置
CN103927552A (zh) * 2014-04-23 2014-07-16 北京奇虎科技有限公司 匹配目标试题答案的方法和装置
CN103955525A (zh) * 2014-05-09 2014-07-30 北京奇虎科技有限公司 一种搜索试题答案的方法及客户端
CN105426479A (zh) * 2015-11-19 2016-03-23 广东小天才科技有限公司 一种通过图片快速搜题的方法及系统
CN105426390A (zh) * 2015-10-23 2016-03-23 广东小天才科技有限公司 一种基于图像识别的试题搜索方法和系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090142742A1 (en) * 2007-11-29 2009-06-04 Adele Goldberg Analysis for Assessing Test Taker Responses to Puzzle-Like Questions
CN103678637A (zh) * 2013-12-19 2014-03-26 北京快乐学网络科技有限公司 一种获取试题信息的方法及装置
CN103914567A (zh) * 2014-04-23 2014-07-09 北京奇虎科技有限公司 匹配目标试题答案的方法和装置
CN103927552A (zh) * 2014-04-23 2014-07-16 北京奇虎科技有限公司 匹配目标试题答案的方法和装置
CN103955525A (zh) * 2014-05-09 2014-07-30 北京奇虎科技有限公司 一种搜索试题答案的方法及客户端
CN105426390A (zh) * 2015-10-23 2016-03-23 广东小天才科技有限公司 一种基于图像识别的试题搜索方法和系统
CN105426479A (zh) * 2015-11-19 2016-03-23 广东小天才科技有限公司 一种通过图片快速搜题的方法及系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107845048A (zh) * 2017-11-24 2018-03-27 合肥立腾信息科技有限责任公司 一种基于人工智能的学习管理系统
CN108038195A (zh) * 2017-12-12 2018-05-15 广东小天才科技有限公司 一种智能终端搜题的方法、装置、智能终端及存储介质
CN109243215A (zh) * 2018-08-31 2019-01-18 广东小天才科技有限公司 一种基于智能装置的交互方法、智能装置及系统
CN110174988A (zh) * 2018-11-06 2019-08-27 广东小天才科技有限公司 一种基于可穿戴设备的学习方法及可穿戴设备
CN112307158A (zh) * 2019-08-30 2021-02-02 北京字节跳动网络技术有限公司 一种信息检索方法、装置、设备及介质
CN112632317A (zh) * 2021-01-13 2021-04-09 深圳市万物志科技有限公司 基于用户图片的多目标交互方法及装置
CN112632317B (zh) * 2021-01-13 2024-06-04 深圳市万物志科技有限公司 基于用户图片的多目标交互方法及装置

Similar Documents

Publication Publication Date Title
CN106295514A (zh) 一种图像识别题目显示答案的方法及装置
CN109993160B (zh) 一种图像矫正及文本与位置识别方法及系统
US11270099B2 (en) Method and apparatus for generating facial feature
CN109284729B (zh) 基于视频获取人脸识别模型训练数据的方法、装置和介质
CN103942705A (zh) 一种基于人脸识别的广告分类匹配推送方法及系统
CN106203454B (zh) 证件版式分析的方法及装置
CN103116754A (zh) 基于识别模型的批量图像分割方法及系统
CN106611015B (zh) 标签的处理方法及装置
CN109299663A (zh) 手写字体识别方法、系统以及终端设备
CN106548169A (zh) 基于深度神经网络的模糊文字增强方法及装置
US11455783B2 (en) Image recognition method and apparatus, device and non-volatile computer storage medium
CN108921038A (zh) 一种基于深度学习人脸识别技术的课堂快速点名签到方法
CN110245573A (zh) 一种基于人脸识别的签到方法、装置及终端设备
CN114170468B (zh) 文本识别方法、存储介质及计算机终端
CN106326454A (zh) 一种图像识别方法
CN113706562B (zh) 图像分割方法、装置、系统及细胞分割方法
CN105631461A (zh) 一种图像识别系统及方法
CN105678301B (zh) 一种自动识别并分割文本图像的方法、系统及装置
CN106203406A (zh) 一种基于云计算的识别系统
CN115083006A (zh) 虹膜识别模型训练方法、虹膜识别方法及装置
CN103605687A (zh) 一种移动终端的拍照识图系统和方法
WO2020199512A1 (zh) 一种题目信息采集的方法及系统
CN110288598A (zh) 一种基于深度学习的模糊照片检测方法
CN105512119A (zh) 一种实现图片排序的方法及终端
CN110879987B (zh) 一种识别试题作答内容的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 528400 Guangdong province Zhongshan city mayor Shan five life water Industrial Park

Applicant after: Reading Lang Education Technology Co., Ltd.

Address before: 528400 Guangdong province Zhongshan city mayor Shan five life water Industrial Park

Applicant before: ZHONGSHAN READBOY ELECTRONICS CO., LTD.

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170104