CN107463681B - 一种待搜题目的识别方法及装置 - Google Patents

一种待搜题目的识别方法及装置 Download PDF

Info

Publication number
CN107463681B
CN107463681B CN201710670269.4A CN201710670269A CN107463681B CN 107463681 B CN107463681 B CN 107463681B CN 201710670269 A CN201710670269 A CN 201710670269A CN 107463681 B CN107463681 B CN 107463681B
Authority
CN
China
Prior art keywords
searched
character
feature
ending
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710670269.4A
Other languages
English (en)
Other versions
CN107463681A (zh
Inventor
刘小兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN201710670269.4A priority Critical patent/CN107463681B/zh
Publication of CN107463681A publication Critical patent/CN107463681A/zh
Application granted granted Critical
Publication of CN107463681B publication Critical patent/CN107463681B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种待搜题目的识别方法及装置,该方法包括:获取包括有待搜题目的原始题目图像;在所述原始题目图像中,识别所述待搜题目的起始位置和结束位置;根据所述起始位置和结束位置对所述原始题目图像进行裁剪,并根据裁剪结果对所述待搜题目进行网络搜索。本发明实施例能够在用户拍摄题目时简化调整选题框的步骤,节约了调整选题框所耗费的时间,提升了用户的拍题效率,有效地改善了用户体验。

Description

一种待搜题目的识别方法及装置
技术领域
本发明实施例涉及图像处理技术,尤其涉及一种待搜题目的识别方法及装置。
背景技术
随着教育资源和互联网技术的有效整合,出现了越来越多的高互动性和鼓励个性化学习的在线教育服务及产品,在线教育逐渐成为中国教育信息化发展最快的领域。目前,关于在线教育的应用程序越来越多,尤其是关于拍摄题目进行答疑类的应用程序,通过拍照或扫描的方式输入题目并上传至网络,获取相应的题目解析,对帮助学生完成作业中的难题提供了很大裨益。
现有技术中,开启应用程序进入题目拍摄模式之后,应用程序会向用户推送一个矩形选题框,需要用户手动调节矩形选题框的大小,使矩形选题框能够将题目框住以完成题目拍摄。但是,用户调节矩形选题框的过程十分麻烦,会耗费大量时间,影响了题目拍摄和识别的效率,造成用户体验感不佳。
发明内容
本发明实施例提供一种待搜题目的识别方法,以解决现有技术中待搜题目识别效率低的问题。
第一方面,本发明实施例提供了一种待搜题目的识别方法,包括:
获取包括有待搜题目的原始题目图像;
在所述原始题目图像中,识别所述待搜题目的起始位置和结束位置;
根据所述起始位置和结束位置对所述原始题目图像进行裁剪,并根据裁剪结果对所述待搜题目进行网络搜索。
进一步地,获取包括有待搜题目的原始题目图像,包括:
在确定用户启动题目拍摄功能时,开启摄像头,并获取所述摄像头捕捉的当前拍摄图像;
根据用户基于触摸屏的划屏操作,在所述当前拍摄图像中获取所述原始题目图像。
进一步地,根据用户基于触摸屏的划屏操作,在所述当前拍摄图像中获取所述原始题目图像,包括:
识别用户基于触摸屏的由左上角划至右下角,和/或由右上角划至左下角的划屏操作;
根据所述划屏操作,获取划屏区域,作为所述原始题目图像。
进一步地,在根据所述划屏操作,获取划屏区域,作为所述原始题目图像之后,还包括:
将所述当前拍摄图像中除去所述划屏区域之外的区域进行遮罩显示。
进一步地,在所述原始题目图像中,识别所述待搜题目的起始位置和结束位置,包括:
根据题目的结构属性,获取所述待搜题目的起始特征以及所述待搜题目的结束特征;
根据所述起始特征确定待搜题目的起始位置;
根据所述结束特征确定待搜题目的结束位置。
进一步地,根据题目的结构属性,获取所述待搜题目的起始特征以及所述待搜题目的结束特征包括下述至少一项:
根据所述待搜题目的字符高度和字符行间距确定所述起始特征以及所述结束特征;
根据所述待搜题目的段落缩进特征确定所述起始特征以及所述结束特征;
根据所述待搜题目的字符行的字符长度确定所述起始特征以及所述结束特征。
进一步地,根据所述待搜题目的字符高度和字符行间距确定所述起始特征以及所述结束特征,包括:
获取待搜题目的字符高度和字符行间距;
根据设定方向扫描所述待搜题目,获取所述待搜题目中满足第一预设条件的第一目标字符以及第二目标字符,其中,所述第一预设条件包括预设字符列的相邻字符行之间的距离大于所述字符行间距;
如果所述第一目标字符的行信息值小于所述第二目标字符的行信息值,则将所述第一目标字符确定为所述起始特征,将所述第二目标字符确定为所述结束特征;
如果所述第一目标字符的行信息值大于所述第二目标字符的行信息值,则将所述第二目标字符确定为所述起始特征,将所述第一目标字符确定为所述结束特征。
进一步地,根据所述待搜题目的段落缩进特征确定所述起始特征以及所述结束特征,包括:
如果检测到所述待搜题目中存在所述段落缩进格式,则将所述段落缩进格式之后的第一个字符确定为所述起始特征;
查找所述第一个字符之后的所有字符,根据预设字符和/或下一个段落缩进格式确定所述待搜题目的结束特征。
进一步地,根据所述待搜题目的字符行的字符长度确定所述起始特征以及所述结束特征,包括:
获取所述待搜题目中字符行的数量;
当所述字符行的数量大于阈值时,获取所述待搜题目中全部字符行的字符长度,并确定所述字符行的标准字符长度;
获取所述待搜题目中满足第二预设条件的第一字符行以及第二字符行,其中,所述第二预设条件包括字符行的字符长度小于所述字符行的标准字符长度;
如果所述第一字符行的行信息值小于所述第二字符行的行信息值,则将所述第一字符行确定为所述起始特征,将所述第二字符行确定为所述结束特征;
如果所述第一字符行的行信息值大于所述第二字符行的行信息值,则将所述第二字符行确定为所述起始特征,将所述第一字符行确定为所述结束特征。
第二方面,本发明实施例还提供了一种待搜题目的识别装置,包括:
图像获取模块,用于获取包括有待搜题目的原始题目图像;
位置识别模块,用于在所述原始题目图像中,识别所述待搜题目的起始位置和结束位置;
裁剪模块,用于根据所述起始位置和结束位置对所述原始题目图像进行裁剪,并根据裁剪结果对所述待搜题目进行网络搜索。
本发明实施例通过用户的划屏操作获取待搜题目的原始题目图像,根据题目的结构属性在原始题目图像中识别出待搜题目的起始位置和结束位置之后,裁剪出待搜题目并进行网络搜索,本发明实施例能够在用户拍摄题目时简化调整选题框的步骤,节约了调整选题框所耗费的时间,不需要在拍摄前进行人工准备工作,而是在用户拍摄题目后进行题目识别和裁剪的操作,提升了用户拍题以及搜题的效率,有效地改善了用户体验,同时,提高了用户的学习效率。
附图说明
图1是本发明实施例一中的一种待搜题目的识别方法的流程图;
图2是本发明实施例二中的一种待搜题目的识别方法的流程图;
图3是本发明实施例三中的一种待搜题目的识别方法的流程图;
图4是本发明实施例四中的一种待搜题目的识别方法的流程图;
图5是本发明实施例五中的一种待搜题目的识别方法的流程图;
图6是本发明实施例六中的一种待搜题目的识别方法的流程图;
图7是本发明实施例七中的一种待搜题目的识别装置的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种待搜题目的识别方法的流程图,本实施例可适用于通过拍摄待搜题目的图像来进行识别题目并裁剪题目的情况,该方法可以由一种待搜题目的识别装置来执行,该装置可以采用软件和/或硬件的方式实现,一般集成于移动终端的应用程序中,例如:手机或者平板电脑等移动智能终端设备的应用程序中。
本发明实施例一的方法具体包括:
S110、获取包括有待搜题目的原始题目图像。
具体的,用户使用移动终端对题目进行拍摄,将当前拍摄的图像显示于移动终端的屏幕上,用户可以在移动终端的触摸屏上对拍摄后的题目图像进行简单的划屏操作,选中题目所在的图像区域,识别用户的划屏操作确定包括有待搜题目的原始题目图像。或者,可以在移动终端的触摸屏上对移动终端接收的图像或者本地存储的图像进行划屏操作,根据用户的需求选中目标区域,将目标区域作为待搜题目的原始图像。其中,移动终端可以为手机、平板电脑等移动智能终端设备。
S120、在所述原始题目图像中,识别所述待搜题目的起始位置和结束位置。
具体的,在原始题目图像中,根据题目的结构属性识别出待搜题目的起始特征和结束特征,根据起始特征确定待搜题目的起始位置,根据结束特征确定待搜题目的结束位置,以确定出待搜题目的完整内容。
S130、根据所述起始位置和结束位置对所述原始题目图像进行裁剪,并根据裁剪结果对所述待搜题目进行网络搜索。
具体的,按照待搜题目的起始位置和结束位置对原始题目图像进行裁剪,裁剪出待搜题目的完整内容。对裁剪结果进行修正操作,其中,修正操作可以包括增强图像的对比度、校正图像中的非均匀光照、图像锐化、滤除图像噪声等增强待搜题目的图像质量的操作,将修正结果上传至服务器,对待搜题目进行网络搜索,并接收服务器基于裁剪结果返回的题目解析结果,基于移动终端的显示屏将题目解析结果显示给用户。
本发明实施例一提供的一种待搜题目的识别方法,能够在用户拍摄题目时简化调整选题框的步骤,节约了调整选题框所耗费的时间,不需要在拍摄前进行人工准备工作,而是在用户拍摄题目后进行题目识别和裁剪的操作,提升了用户拍题效率,有效地改善了用户体验,同时,提高了用户的学习效率。
实施例二
图2为本发明实施例二提供的一种待搜题目的识别方法的流程图,本发明实施例二以实施例一为基础进行了优化,具体是对获取包括有待搜题目的原始题目图像的操作进一步优化,如图2所示,本发明实施例二的具体包括:
S210、在确定用户启动题目拍摄功能时,开启摄像头,并获取所述摄像头捕捉的当前拍摄图像。
S220、根据用户基于触摸屏的划屏操作,在所述当前拍摄图像中获取所述原始题目图像。
优选的,根据用户基于触摸屏的划屏操作,在所述当前拍摄图像中获取所述原始题目图像,包括:
识别用户基于触摸屏的由左上角划至右下角,和/或由右上角划至左下角的划屏操作;
根据所述划屏操作,获取划屏区域,作为所述原始题目图像。
具体的,移动终端在确定用户启动题目拍摄功能时,开启摄像头,根据用户的实际需求,对待搜题目进行拍摄操作,获取拍摄的待搜题目的图像作为当前拍摄图像。用户基于移动终端的触摸屏对当前拍摄图像进行划屏操作,用户可以根据待搜题目的位置由左上角划至右下角,以获取划屏区域。用户也可以根据待搜题目的位置由右上角划至左下角,以获取划屏区域。用户还可以根据待搜题目的位置由左上角划至右下角,并且由右上角划至左下角,以获取划屏区域。在当前拍摄图像中识别用户操作的划屏区域,将划屏区域的图像作为原始题目图像。
优选的,在根据所述划屏操作,获取划屏区域,作为所述原始题目图像之后,还包括:
将所述当前拍摄图像中除去所述划屏区域之外的区域进行遮罩显示。
具体的,在用户完成划屏操作后,对当前拍摄图像中除去划屏区域之外的区域进行遮罩操作,即当前拍摄图像中的划屏区域对于用户是可见的,非划屏区域对于用户是不可见的,并将遮罩后的结果显示给用户便于用户确定划屏区域的准确性。
示例性地,如果用户执行的划屏操作没有包括待搜题目的全部内容,根据遮罩后的结果,可以提示用户重新进行划屏操作,以确定原始题目图像包括待搜题目的全部内容。
S230、在所述原始题目图像中,识别所述待搜题目的起始位置和结束位置。
S240、根据所述起始位置和结束位置对所述原始题目图像进行裁剪,并根据裁剪结果对所述待搜题目进行网络搜索。
本发明实施例二提供的一种待搜题目的识别方法,通过简单的划屏操作获取待搜题目所在的区域,节省了调整选题框的繁琐步骤,即使用户拍摄了除待搜题目之外的其它内容,通过划屏操作即可获取原始题目图像,不局限于用户的拍照技术,节约了调整选题框所耗费的时间。
实施例三
图3为本发明实施例三提供的一种待搜题目的识别方法的流程图,本发明实施例三以上述各实施例为基础进行了优化改进,对在所述原始题目图像中,识别所述待搜题目的起始位置和结束位置进行了进一步说明,如图3所示,本发明实施例三的方法具体包括:
S310、获取包括有待搜题目的原始题目图像。
S320、根据题目的结构属性,获取所述待搜题目的起始特征以及所述待搜题目的结束特征。
S330、根据所述起始特征确定待搜题目的起始位置。
S340、根据所述结束特征确定待搜题目的结束位置。
优选的,根据待搜题目的结构属性,获取所述待搜题目的起始特征以及所述待搜题目的结束特征包括下述至少一项:
根据所述待搜题目的字符高度和字符行间距确定所述起始特征以及所述结束特征;
根据所述待搜题目的段落缩进特征确定所述起始特征以及所述结束特征;
根据所述待搜题目的字符行的字符长度确定所述起始特征以及所述结束特征。
具体的,在原始题目图像中,根据题目的结构属性获取待搜题目的起始特征以及结束特征,可以根据待搜题目的字符高度和字符行间距确定起始特征以及结束特征,也可以根据待搜题目的段落缩进特征确定起始特征以及结束特征,还可以根据待搜题目的字符行的字符长度确定起始特征以及结束特征。如果通过待搜题目的字符高度和字符行间距无法获取起始特征或者结束特征,则可以进一步根据待搜题目的段落缩进特征确定起始特征和/或结束特征,或者根据待搜题目的字符行的字符长度确定起始特征和/或结束特征。同理,上述三种确定起始特征以及结束特征的方法,在使用一种方法无法获取起始特征和/或结束特征时,可以进一步地通过其它两种方法确定起始特征和/或结束特征,本发明实施例对此不做限制。通过起始特征可以确定待搜题目的起始位置,通过结束特征可以确定待搜题目的结束位置。
S350、根据所述起始位置和结束位置对所述原始题目图像进行裁剪,并根据裁剪结果对所述待搜题目进行网络搜索。
本发明实施例三提供的一种待搜题目的识别方法,通过起始特征和结束特征识别待搜题目的起始位置和结束位置,确定待搜题目的完整内容范围,以便于提升待搜题目的搜索准确性,同时,提高了用户的拍题效率。
实施例四
图4为本发明实施例四提供的一种待搜题目的识别方法的流程图,本发明实施例四以上述各实施例为基础进行了优化改进,对根据所述待搜题目的字符高度和字符行间距确定所述起始特征以及所述结束特征进行了进一步说明,如图4所示,本发明实施例四的方法具体包括:
S410、获取包括有待搜题目的原始题目图像。
S420、获取待搜题目的字符高度和字符行间距。
S430、根据设定方向扫描所述待搜题目,获取所述待搜题目中满足第一预设条件的第一目标字符以及第二目标字符,其中,所述第一预设条件包括预设字符列的相邻字符行之间的距离大于所述字符行间距。
S440、判断所述第一目标字符的行信息值是否小于所述第二目标字符的行信息值:若是,则执行S450;否则,执行S460。
S450、将所述第一目标字符确定为所述起始特征,将所述第二目标字符确定为所述结束特征,执行S470。
S460、将所述第二目标字符确定为所述起始特征,将所述第一目标字符确定为所述结束特征,执行S470。
具体的,待搜题目的结构属性包括字符高度以及字符行间距,获取待搜题目的字符高度,并根据字符高度确定字符行间距。按照设定方向扫描待搜题目,例如,可以从左至右、从上至下地扫描待搜题目的行和列,获取待搜题目中预设字符列的相邻字符行之间的距离,并比较该距离与字符行间距的大小,如果预设字符列的相邻字符行之间的距离大于字符行间距,即字符行之间存在除了行间距之外的间隔,该间隔可以理解为字符高度为零,则获取第一目标字符以及第二目标字符。
示例性地,原始题目图像中包括待搜题目的起始位置、待搜题目的结束位置以及当前待搜题目的上一题目内容和/或当前待搜题目的下一题目内容,预设字符列可以为每一字符行的前两个字符所在的列,如果预设字符列的相邻字符行之间的距离大于字符行间距,则获取第一目标字符以及第二目标字符。如果第一目标字符的行信息值小于第二目标字符的行信息值,则将第一目标字符确定为起始特征,将第二目标字符确定为结束特征。如果第一目标字符的行信息值大于第二目标字符的行信息值,则将第二目标字符确定为起始特征,将第一目标字符确定为结束特征。其中,行信息值可以理解为字符行的行数,例如,第一行、第二行、第三行等行标识。
此外,如果检测到第一个字符行的预设字符列的内容为空,则确定所述内容为空的特征为起始特征。如果最后一个字符行的预设字符列不为空,则确定最后一个字符行的最后一个字符为结束特征。
示例性地,可以通过检测预设字符列是否存在数字字符与符号字符的组合,来确定起始特征。预设字符列可以为每一字符行的前四个字符所在的列,检测每一字符行的预设字符列是否存在数字字符与符号字符的组合,例如“1、”、“2、”等能够表明待搜题目起始特征的标识,如果存在,则确定为起始特征。
S470、根据所述起始特征确定待搜题目的起始位置。
S480、根据所述结束特征确定待搜题目的结束位置。
S490、根据所述起始位置和结束位置对所述原始题目图像进行裁剪,并根据裁剪结果对所述待搜题目进行网络搜索。
本发明实施例四提供的一种待搜题目的识别方法,能够获取待搜题目的起始特征以及结束特征,以便于获取待搜题目的准确内容,能够提升待搜题目的识别效率和识别的准确性,有效地改善了用户体验。
实施例五
图5为本发明实施例五提供的一种待搜题目的识别方法的流程图,本发明实施例五以上述各实施例为基础进行了优化改进,对根据所述待搜题目的段落缩进特征确定所述起始特征以及所述结束特征进行了进一步说明,如图5所示,本发明实施例五的方法具体包括:
S510、获取包括有待搜题目的原始题目图像。
S520、如果检测到所述待搜题目中存在所述段落缩进格式,则将所述段落缩进格式之后的第一个字符确定为所述起始特征;
S530、查找所述第一个字符之后的所有字符,根据预设字符和/或下一个段落缩进格式确定所述待搜题目的结束特征。
具体的,检测待搜题目中是否存在段落缩进格式,如果检测到待搜题目中存在段落缩进格式,则确定段落缩进格式之后的第一个字符为起始特征。在确定起始特征之后,查找当前字符行的第一个字符之后的全部字符,在当前字符行查找结束之后,从下一字符行开始继续查找,以此类推,按照字符行的行信息值顺序查找,可以根据预设字符和/或下一个段落缩进格式确定待搜题目的结束特征。示例性地,预设字符可以为最后一个句号,如果检测到最后一个句号则确定为结束特征。如果检测到待搜题目中不存在段落缩进格式,可以进一步地通过获取待搜题目的字符高度和字符行间距和/或待搜题目中字符行的数量的方法确定起始特征和/或结束特征,本发明实施例对此不做限制。如果上述三种方法均不能确定待搜题目的起始特征和/或结束特征,则可以通过向用户推送提示信息的方式提醒用户重新进行划屏操作或者拍摄操作。
S540、根据所述起始特征确定待搜题目的起始位置。
S550、根据所述结束特征确定待搜题目的结束位置。
S560、根据所述起始位置和结束位置对所述原始题目图像进行裁剪,并根据裁剪结果对所述待搜题目进行网络搜索。
本发明实施例五提供的一种待搜题目的识别方法,能够根据待搜题目的结构属性确定待搜题目的起始位置和结束位置,便于后续的网络搜索工作,有效地改善了用户体验,同时,提高了用户的学习效率。
实施例六
图6为本发明实施例六提供的一种待搜题目的识别方法的流程图,本发明实施例六以上述各实施例为基础进行了优化改进,对根据所述待搜题目的字符行的字符长度确定所述起始特征以及所述结束特征进行了进一步说明,如图6所示,本发明实施例六的方法具体包括:
S610、获取包括有待搜题目的原始题目图像。
S620、获取所述待搜题目中字符行的数量。
S630、当所述字符行的数量大于阈值时,获取所述待搜题目中全部字符行的字符长度,并确定所述字符行的标准字符长度。
S640、获取所述待搜题目中满足第二预设条件的第一字符行以及第二字符行,其中,所述第二预设条件包括字符行的字符长度小于所述字符行的标准字符长度。
S650、判断所述第一字符行的行信息值是否小于所述第二字符行的行信息值:若是,则执行S660;否则,执行S670。
S660、将所述第一字符行确定为所述起始特征,将所述第二字符行确定为所述结束特征,执行S680。
S670、将所述第二字符行确定为所述起始特征,将所述第一字符行确定为所述结束特征,执行S680。
具体的,获取待搜题目中字符行的数量,将字符行的数量与阈值进行比较,如果字符行的数量大于阈值,则获取待搜题目中全部字符行的字符长度,并确定字符行的标准字符长度。示例性地,阈值可以设置为2行,当字符行的数量大于2行时,即待搜题目所占多个字符行,获取每一字符行的字符长度,并将最大的字符长度确定为字符行的标准字符长度。若字符行的字符长度小于字符行的标准长度,则确定可能为起始特征或结束特征的第一字符行以及第二字符行。如果第一字符行的行信息值小于第二字符行的行信息值,则将第一字符行的开头确定为起始特征,将第二字符行的结尾确定为结束特征。如果第一字符行的行信息值大于第二字符行的行信息值,则将第二字符行的开头确定为起始特征,将第一字符行的结尾确定为结束特征。
S680、根据所述起始特征确定待搜题目的起始位置。
S690、根据所述结束特征确定待搜题目的结束位置。
S6100、根据所述起始位置和结束位置对所述原始题目图像进行裁剪,并根据裁剪结果对所述待搜题目进行网络搜索。
本发明实施例六提供的一种待搜题目的识别方法,能够根据题目的结构属性在原始题目图像中识别出待搜题目的起始位置和结束位置,裁剪出待搜题目并进行网络搜索,在用户拍摄题目时简化调整选题框的步骤,节约了调整选题框所耗费的时间,提升了用户拍题效率。
实施例七
图7是本发明实施例七中的一种待搜题目的识别装置的结构示意图,该装置应用于通过拍摄待搜题目的图像来进行识别待搜题目的情况,该装置可以采用软件和/或硬件的方式实现,一般集成于移动终端的应用程序中,例如:手机或者平板电脑等移动智能终端设备的应用程序中。如图7所示,装置包括:图像获取模块710、位置识别模块720以及裁剪模块730。
图像获取模块710,用于获取包括有待搜题目的原始题目图像;
位置识别模块720,用于在所述原始题目图像中,识别所述待搜题目的起始位置和结束位置;
裁剪模块730,用于根据所述起始位置和结束位置对所述原始题目图像进行裁剪,并根据裁剪结果对所述待搜题目进行网络搜索。
本发明实施例通过用户的划屏操作获取待搜题目的原始题目图像,根据题目的结构属性在原始题目图像中识别出待搜题目的起始位置和结束位置之后,裁剪出待搜题目并进行网络搜索,本发明实施例能够在用户拍摄题目时简化调整选题框的步骤,节约了调整选题框所耗费的时间,不需要在拍摄前进行人工准备工作,而是在用户拍摄题目后进行题目识别和裁剪的操作,提升了用户拍题以及搜题的效率,有效地改善了用户体验,同时,提高了用户的学习效率。
在上述实施例的基础上,所述图像获取模块710可以包括:
捕捉单元,用于在确定用户启动题目拍摄功能时,开启摄像头,并获取所述摄像头捕捉的当前拍摄图像;
划屏单元,用于根据用户基于触摸屏的划屏操作,在所述当前拍摄图像中获取所述原始题目图像。
在上述实施例的基础上,所述位置识别模块720可以包括:
特征获取单元,用于根据题目的结构属性,获取所述待搜题目的起始特征以及所述待搜题目的结束特征;
起始位置确定单元,用于根据所述起始特征确定待搜题目的起始位置;
结束位置确实单元,用于根据所述结束特征确定待搜题目的结束位置。
在上述实施例的基础上,所述特征获取单元可以包括下述至少一项:
第一特征获取子单元,用于根据所述待搜题目的字符高度和字符行间距确定所述起始特征以及所述结束特征;
第二特征获取子单元,用于根据所述待搜题目的段落缩进特征确定所述起始特征以及所述结束特征;
第三特征获取子单元,用于根据所述待搜题目的字符行的字符长度确定所述起始特征以及所述结束特征。
本实施例中,在确定用户启动题目拍摄功能时,开启摄像头,在图像获取模块的捕捉单元获取摄像头捕捉的当前拍摄图像,可以识别用户基于触摸屏的由左上角划至右下角,和/或由右上角划至左下角的划屏操作,基于用户根据触摸屏的划屏操作,通过划屏单元,利用用户在当前拍摄图像中的划屏区域获取原始题目图像。利用位置识别模块的特征获取单元,在原始题目图像中,获取待搜题目的起始特征以及结束特征,具体的,在第一特征获取子单元中,根据待搜题目的字符高度以及字符行间距确定起始特征以及结束特征,在第二特征获取子单元中,根据待搜题目的段落缩进特征确定起始特征以及结束特征,在第三特征获取子单元中,根据待搜题目的字符行的字符长度确定起始特征以及结束特征。在起始位置确定单元中,根据起始特征确定待搜题目的起始位置,在结束位置确定单元中,根据结束特征确定待搜题目的结束位置。通过裁剪模块,根据起始位置和结束位置对原始题目图像进行裁剪,将裁剪结果上传至服务器,对待搜题目进行网络搜索,接收并显示服务器返回的搜索结果。
本发明实施例七提供了一种待搜题目的识别装置,通过简单的划屏操作获取待搜题目所在的区域,节省了调整选题框的繁琐步骤,节约了调整选题框所耗费的时间,自动识别出待搜题目的起始位置以及结束位置并裁剪之后,将裁剪后的待搜题目进行网络搜索,提升了用户搜题的效率。
本发明实施例提供的待搜题目的识别装置可执行本发明任意实施例提供的待搜题目的识别方法,具备执行方法相应的功能模块和有益效果。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (6)

1.一种待搜题目的识别方法,其特征在于,包括:
在确定用户启动题目拍摄功能时,开启摄像头,并获取所述摄像头捕捉的当前拍摄图像;
识别用户基于触摸屏的由左上角划至右下角,和/或由右上角划至左下角的划屏操作;
根据所述划屏操作,获取划屏区域,作为原始题目图像;
在所述原始题目图像中,根据所述待搜题目的字符高度和字符行间距确定所述待搜题目的起始特征以及结束特征;
根据所述待搜题目的段落缩进特征确定所述待搜题目的起始特征以及结束特征;
根据所述待搜题目的字符行的字符长度确定所述待搜题目的起始特征以及结束特征;上述三种确定起始特征以及结束特征的方法,在使用一种方法无法获取起始特征和/或结束特征时,进一步地通过其它两种方法确定起始特征和/或结束特征;
根据所述起始特征确定待搜题目的起始位置;
根据所述结束特征确定待搜题目的结束位置;
根据所述起始位置和结束位置对所述原始题目图像进行裁剪,对裁剪结果进行修正操作,其中,所述修正操作为增强待搜题目的图像质量的操作,包括增强图像的对比度、校正图像中的非均匀光照、图像锐化和滤除图像噪声;并根据裁剪结果对所述待搜题目进行网络搜索。
2.根据权利要求1所述的方法,其特征在于,在根据所述划屏操作,获取划屏区域,作为所述原始题目图像之后,还包括:
将所述当前拍摄图像中除去所述划屏区域之外的区域进行遮罩显示。
3.根据权利要求1所述的方法,其特征在于,根据所述待搜题目的字符高度和字符行间距确定所述起始特征以及所述结束特征,包括:
获取待搜题目的字符高度和字符行间距;
根据设定方向扫描所述待搜题目,获取所述待搜题目中满足第一预设条件的第一目标字符以及第二目标字符,其中,所述第一预设条件包括预设字符列的相邻字符行之间的距离大于所述字符行间距;
如果所述第一目标字符的行信息值小于所述第二目标字符的行信息值,则将所述第一目标字符确定为所述起始特征,将所述第二目标字符确定为所述结束特征;
如果所述第一目标字符的行信息值大于所述第二目标字符的行信息值,则将所述第二目标字符确定为所述起始特征,将所述第一目标字符确定为所述结束特征。
4.根据权利要求1所述的方法,其特征在于,根据所述待搜题目的段落缩进特征确定所述起始特征以及所述结束特征,包括:
如果检测到所述待搜题目中存在所述段落缩进格式,则将所述段落缩进格式之后的第一个字符确定为所述起始特征;
查找所述第一个字符之后的所有字符,根据预设字符和/或下一个段落缩进格式确定所述待搜题目的结束特征。
5.根据权利要求1所述的方法,其特征在于,根据所述待搜题目的字符行的字符长度确定所述起始特征以及所述结束特征,包括:
获取所述待搜题目中字符行的数量;
当所述字符行的数量大于阈值时,获取所述待搜题目中全部字符行的字符长度,并确定所述字符行的标准字符长度;
获取所述待搜题目中满足第二预设条件的第一字符行以及第二字符行,其中,所述第二预设条件包括字符行的字符长度小于所述字符行的标准字符长度;
如果所述第一字符行的行信息值小于所述第二字符行的行信息值,则将所述第一字符行确定为所述起始特征,将所述第二字符行确定为所述结束特征;
如果所述第一字符行的行信息值大于所述第二字符行的行信息值,则将所述第二字符行确定为所述起始特征,将所述第一字符行确定为所述结束特征。
6.一种待搜题目的识别装置,其特征在于,包括:
图像获取模块,用于获取包括有待搜题目的原始题目图像;
位置识别模块,用于在所述原始题目图像中,识别所述待搜题目的起始位置和结束位置;
裁剪模块,用于根据所述起始位置和结束位置对所述原始题目图像进行裁剪,对裁剪结果进行修正操作,其中,所述修正操作为增强待搜题目的图像质量的操作,包括增强图像的对比度、校正图像中的非均匀光照、图像锐化和滤除图像噪声;并根据裁剪结果对所述待搜题目进行网络搜索;
所述图像获取模块包括:
捕捉单元,用于在确定用户启动题目拍摄功能时,开启摄像头,并获取所述摄像头捕捉的当前拍摄图像;
划屏单元,用于根据用户基于触摸屏的划屏操作,在所述当前拍摄图像中获取所述原始题目图像,所述划屏单元具体用于识别用户基于触摸屏的由左上角划至右下角,和/或由右上角划至左下角的划屏操作;根据所述划屏操作,获取划屏区域,作为所述原始题目图像;
所述位置识别模块包括:
第一特征获取子单元,用于根据所述待搜题目的字符高度和字符行间距确定所述待搜题目的起始特征以及结束特征;
第二特征获取子单元,用于根据所述待搜题目的段落缩进特征确定所述待搜题目的起始特征以及结束特征;
第三特征获取子单元,用于根据所述待搜题目的字符行的字符长度确定所述待搜题目的起始特征以及结束特征;上述三种确定起始特征以及结束特征的方法,在使用一种方法无法获取起始特征和/或结束特征时,进一步地通过其它两种方法确定起始特征和/或结束特征;
起始位置确定单元,用于根据所述起始特征确定待搜题目的起始位置;
结束位置确实单元,用于根据所述结束特征确定待搜题目的结束位置。
CN201710670269.4A 2017-08-08 2017-08-08 一种待搜题目的识别方法及装置 Active CN107463681B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710670269.4A CN107463681B (zh) 2017-08-08 2017-08-08 一种待搜题目的识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710670269.4A CN107463681B (zh) 2017-08-08 2017-08-08 一种待搜题目的识别方法及装置

Publications (2)

Publication Number Publication Date
CN107463681A CN107463681A (zh) 2017-12-12
CN107463681B true CN107463681B (zh) 2021-03-19

Family

ID=60548531

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710670269.4A Active CN107463681B (zh) 2017-08-08 2017-08-08 一种待搜题目的识别方法及装置

Country Status (1)

Country Link
CN (1) CN107463681B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109697242B (zh) * 2018-12-27 2022-03-08 网易有道信息技术(北京)有限公司 拍照搜题方法、装置、存储介质和计算设备
CN111462548A (zh) * 2019-01-21 2020-07-28 北京字节跳动网络技术有限公司 一种段落点读方法、装置、设备和可读介质
CN110135429A (zh) * 2019-04-18 2019-08-16 深圳壹账通智能科技有限公司 扫描文字分段方法、装置、计算机设备和存储介质
CN113723543B (zh) * 2021-09-02 2024-01-09 成都东方闻道科技发展有限公司 一种自动裁题展示方法、装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105094588A (zh) * 2014-05-22 2015-11-25 北京三星通信技术研究有限公司 用于移动终端的数据处理方法和装置以及移动终端
CN105956096A (zh) * 2016-04-29 2016-09-21 广东小天才科技有限公司 基于移动终端的题目快速搜索方法及装置
CN105975550A (zh) * 2016-04-29 2016-09-28 广东小天才科技有限公司 一种智能设备的题目搜索方法和装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101866415A (zh) * 2009-08-24 2010-10-20 深圳市海云天科技股份有限公司 一种计算机阅卷系统的答题卡识别装置及方法
CN102779027B (zh) * 2011-05-09 2016-08-10 腾讯科技(深圳)有限公司 一种基于即时通信软件实现屏幕截取的方法及装置
CN103150745B (zh) * 2011-12-06 2018-03-20 腾讯科技(深圳)有限公司 在线编辑图片的方法和装置
CN103927552A (zh) * 2014-04-23 2014-07-16 北京奇虎科技有限公司 匹配目标试题答案的方法和装置
CN103914567A (zh) * 2014-04-23 2014-07-09 北京奇虎科技有限公司 匹配目标试题答案的方法和装置
CN105975552B (zh) * 2016-04-29 2020-01-03 广东小天才科技有限公司 一种智能设备的题目搜索方法和装置
CN106294659B (zh) * 2016-08-03 2019-07-19 广东小天才科技有限公司 基于智能终端的搜题方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105094588A (zh) * 2014-05-22 2015-11-25 北京三星通信技术研究有限公司 用于移动终端的数据处理方法和装置以及移动终端
CN105956096A (zh) * 2016-04-29 2016-09-21 广东小天才科技有限公司 基于移动终端的题目快速搜索方法及装置
CN105975550A (zh) * 2016-04-29 2016-09-28 广东小天才科技有限公司 一种智能设备的题目搜索方法和装置

Also Published As

Publication number Publication date
CN107463681A (zh) 2017-12-12

Similar Documents

Publication Publication Date Title
CN107463681B (zh) 一种待搜题目的识别方法及装置
KR102212355B1 (ko) 현재 재생되는 텔레비젼 프로그램들과 연관된 인터넷-액세스가능 컨텐츠의 식별 및 제시
EP3188034A1 (en) Display terminal-based data processing method
CN103079092B (zh) 在视频中获取人物信息的方法和装置
CN108712667B (zh) 一种智能电视、其截屏应用方法、装置及可读性存储介质
WO2014032420A1 (zh) 一种获得互动信息的方法和系统
KR102370699B1 (ko) 영상에 기반한 정보 획득 방법 및 장치
CN107748615B (zh) 屏幕的控制方法、装置、存储介质及电子设备
CN102263907A (zh) 比赛视频的播放控制方法及其片段信息的生成方法和装置
CN105975550B (zh) 一种智能设备的题目搜索方法和装置
CN113038167B (zh) 页面显示方法、装置、计算机可读存储介质及电子设备
CN111263235A (zh) 一种视频播放方法、装置、电子设备及存储介质
US20190297297A1 (en) Video playing method and device
CN105847413A (zh) 相机参数处理方法、装置、系统及服务器
CN110881134A (zh) 数据处理方法、装置、电子设备及存储介质
CN111401238A (zh) 一种视频中人物特写片段的检测方法及装置
CN108401173B (zh) 移动直播的互动终端、方法及计算机可读存储介质
CN111077992B (zh) 一种点读方法、电子设备及存储介质
CN105975552B (zh) 一种智能设备的题目搜索方法和装置
US9113002B2 (en) Method and system for automatically capturing an object using a mobile terminal
CN112348077A (zh) 图像识别方法、装置、设备及计算机可读存储介质
CN107391661B (zh) 推荐词显示方法及装置
US10489460B2 (en) Method and apparatus for providing local search suggestion
JP2009188886A (ja) 情報処理装置および情報処理装置用のプログラム
CN111915637A (zh) 一种图片展示方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant