CN107908801A - 一种基于语音的题目搜索方法及电子设备 - Google Patents
一种基于语音的题目搜索方法及电子设备 Download PDFInfo
- Publication number
- CN107908801A CN107908801A CN201711422303.2A CN201711422303A CN107908801A CN 107908801 A CN107908801 A CN 107908801A CN 201711422303 A CN201711422303 A CN 201711422303A CN 107908801 A CN107908801 A CN 107908801A
- Authority
- CN
- China
- Prior art keywords
- topic
- page
- images
- electronic equipment
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000004044 response Effects 0.000 claims description 38
- 238000001514 detection method Methods 0.000 claims description 28
- 230000004913 activation Effects 0.000 claims description 8
- 230000005611 electricity Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 238000013497 data interchange Methods 0.000 claims description 2
- 230000010365 information processing Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 11
- 238000003860 storage Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 3
- 244000078534 Vaccinium myrtillus Species 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 235000017848 Rubus fruticosus Nutrition 0.000 description 1
- 235000003095 Vaccinium corymbosum Nutrition 0.000 description 1
- 235000017537 Vaccinium myrtillus Nutrition 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 235000021029 blackberry Nutrition 0.000 description 1
- 235000021014 blueberries Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明实施例涉及信息处理技术领域,公开了一种基于语音的题目搜索方法及电子设备,该方法包括:启动电子设备的摄像头拍摄包含至少一道题目的页面图像;检测用户输入的语音搜索指令;判断该页面图像是否存在语音搜索指令相匹配的某一道题目;在该页面图像存在语音搜索指令相匹配的某一道题目时,搜索该某一道题目相匹配的搜索结果并显示;实施本发明实施例,能够减少对焦的难度,简化搜索过程,提高搜索效率。
Description
技术领域
本发明涉及信息处理技术领域,具体涉及一种基于语音的题目搜索方法及电子设备。
背景技术
目前,电子设备类产品都设置有解决学生作业难题的搜题应用程序(Application,简称APP),如小猿搜题、学霸君、作业帮等等,通过电子设备摄像头对题目内容拍照,将拍照内容输入搜题APP,搜题APP在题库中搜索到相应的解题答案,然后输出给学生参考学习。但是,目前的电子设备在进行题目搜索时,需要打开摄像头,然后利用预览区域对单个题目进行精确对焦拍照,才能对拍照的内容进行识别,这种搜索方式较为繁琐,搜索效率较低。
发明内容
本发明实施例公开了一种基于语音的题目搜索方法及电子设备,用于解决现有技术中题目搜索过程繁琐导致搜索效率较低的技术问题。
本发明第一方面公开了一种基于语音的题目搜索方法,可包括:
启动电子设备的摄像头拍摄包含至少一道题目的页面图像;
检测用户输入的语音搜索指令;
判断所述页面图像是否存在所述语音搜索指令相匹配的某一道题目;
在所述页面图像存在所述语音搜索指令相匹配的所述某一道题目时,搜索所述某一道题目相匹配的搜索结果并显示。
作为一种可选的实施方式,在本发明第一方面中,所述启动电子设备的摄像头拍摄包含至少一道题目的页面图像之后,以及所述检测用户输入的语音搜索指令之前,所述方法还包括:
对所述页面图像进行扫描识别,以获得非图像识别信息,所述非图像识别信息包括所述至少一道题目;
所述判断所述页面图像是否存在所述语音搜索指令相匹配的某一道题目,包括:
判断所述非图像识别信息是否存在所述语音搜索指令相匹配的某一道题目。
作为一种可选的实施方式,在本发明第一方面中,所述检测用户输入的语音搜索指令,包括:
响应于用户输入的题目搜索指令,检测用户输入的语音搜索指令;
将所述语音搜索指令转换成文字搜索指令;
所述判断所述非图像识别信息是否存在所述语音搜索指令相匹配的某一道题目,包括:
判断所述非图像识别信息是否存在所述文字搜索指令相匹配的某一道题目。
作为一种可选的实施方式,在本发明第一方面中,所述在所述页面图像存在所述语音搜索指令相匹配的所述某一道题目时,搜索所述某一道题目相匹配的搜索结果并显示之后,所述方法还包括:
响应于用户输入的返回题目搜索指令,执行所述检测用户输入的语音搜索指令的步骤;
或者,响应于用户输入的重拍指令,执行所述启动电子设备的摄像头拍摄包含至少一道题目的页面图像的步骤。
作为一种可选的实施方式,在本发明第一方面中,所述启动电子设备的摄像头拍摄包含至少一道题目的页面图像,包括:
响应于用户输入的语音启动指令,启动所述电子设备的摄像头,以利用预览区域对包含至少一道题目的页面图像进行拍摄预览;
检测用户输入的语音拍摄执行指令;
在检测到所述语音拍摄执行指令时,拍摄所述预览区域获得所述页面图像。
本发明第二方面公开了一种电子设备,可包括:
拍摄单元,用于启动电子设备的摄像头拍摄包含至少一道题目的页面图像;
检测单元,用于检测用户输入的语音搜索指令;
判断单元,用于判断所述页面图像是否存在所述语音搜索指令相匹配的某一道题目;
搜索单元,用于在所述判断单元确定所述页面图像存在所述语音搜索指令相匹配的所述某一道题目时,搜索所述某一道题目相匹配的搜索结果并显示。
作为一种可选的实施方式,在本发明第二方面中,所述电子设备包括:
图像识别单元,用于在所述拍摄单元启动电子设备的摄像头拍摄包含至少一道题目的页面图像之后,以及所述检测单元检测用户输入的语音搜索指令之前,对所述页面图像进行扫描识别,以获得非图像识别信息,所述非图像识别信息包括所述至少一道题目;
所述判断单元用于判断所述页面图像是否存在所述语音搜索指令相匹配的某一道题目的方式具体为:
所述判断单元用于判断所述非图像识别信息是否存在所述语音搜索指令相匹配的某一道题目。
作为一种可选的实施方式,在本发明第二方面中,所述检测单元包括:
转换单元,用于响应于用户输入的题目搜索指令,检测用户输入的语音搜索指令;以及,将所述语音搜索指令转换成文字搜索指令;
所述判断单元用于判断所述非图像识别信息是否存在所述语音搜索指令相匹配的某一道题目的方式具体为:
所述判断单元用于判断所述非图像识别信息是否存在所述文字搜索指令相匹配的某一道题目。
作为一种可选的实施方式,在本发明第二方面中,所述检测单元还用于,在所述搜索单元在所述页面图像存在所述语音搜索指令相匹配的所述某一道题目时,搜索所述某一道题目相匹配的搜索结果并显示之后,响应于用户输入的返回题目搜索指令,检测用户输入的语音搜索指令;
或者,所述拍摄单元还用于,在所述搜索单元在所述页面图像存在所述语音搜索指令相匹配的所述某一道题目时,搜索所述某一道题目相匹配的搜索结果并显示之后,响应于用户输入的重拍指令,启动电子设备的摄像头拍摄包含至少一道题目的页面图像。
作为一种可选的实施方式,在本发明第二方面中,所述拍摄单元用于启动电子设备的摄像头拍摄包含至少一道题目的页面图像的方式具体为:
所述拍摄单元,用于响应于用户输入的语音启动指令,启动所述电子设备的摄像头,以利用预览区域对包含至少一道题目的页面图像进行拍摄预览;以及,检测用户输入的语音拍摄执行指令;以及,在检测到所述语音拍摄执行指令时,拍摄所述预览区域获得所述页面图像。
本发明第三方面公开了一种电子设备,可包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如本发明第一方面所述的基于语音的题目搜索方法。
本发明第四方面公开了一种计算机可读存储介质,其存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如本发明第一方面所述的基于语音的题目搜索方法。
与现有技术相比,本发明实施例具有以下有益效果:
在本发明实施例中,通过启动电子设备的摄像头拍摄包含至少一道题目的页面图像,然后检测用户输入的语音搜索指令,进一步判断页面图像是否存在语音搜索指令相匹配的某一道题目,在页面图像存在语音搜索指令相匹配的某一道题目时,搜索某一道题目相匹配的搜索结果并显示;可以看出,实施本发明实施例,能够通过将包含有至少一道题目的页面图像先拍摄下来,这种拍摄方式能够减少对焦的难度,从而快速准确地对焦到包含至少一道题目的页面,摈弃了传统技术中单独对某一道题目对焦的拍摄方式,提高题目获取速度,进一步地,用户通过语音搜索指令智能地从拍摄的页面图像的至少一道题目中选择出某一道题目,然后搜索该某一道题目相匹配的搜索结果并显示,利用语音搜索指令简化了选取题目的操作,实现智能化快速选题,从而达到提高搜索效率的目的。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例公开的基于语音的题目搜索方法的流程示意图;
图2为本发明一些实施例提供的页面图像的示意图;
图3为本发明实施例公开的基于语音的题目搜索方法的另一流程示意图;
图4为本发明实施例公开的电子设备的结构示意图;
图5为本发明实施例公开的电子设备的另一结构示意图;
图6为本发明实施例公开的电子设备的另一结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了一种基于语音的题目搜索方法,用于简化搜索过程,实现智能化搜索,提高搜索效率。本发明实施例还相应公开了一种电子设备。
本发明实施例提供的电子设备包括但不仅限于家教机、平板电脑、智能手机等,其中,电子设备的操作系统包括但不限于Android操作系统、IOS操作系统、Symbian(塞班)操作系统、Black Berry(黑莓)操作系统、Windows Phone8操作系统等等,本发明实施例不做限定。下面将从电子设备角度出发,结合具体实施例,对本发明技术方案进行详细说明。
实施例一
请参阅图1,图1为本发明实施例公开的基于语音的题目搜索方法的流程示意图;如图1所示,一种基于语音的题目搜索方法可包括:
101、电子设备启动电子设备的摄像头拍摄包含至少一道题目的页面图像。
其中,每一道题目至少包括题干,还可以包括答案选项等。其中,题干可以包括题目编号和题干内容,在本发明实施例中,可以把需要进行搜题的某一道题目所在的整个页面或者部分页面一起拍摄下来,使得拍摄得到的页面图像包括至少一道题目,请参阅图2,图2为本发明一些实施例提供的页面图像的示意图,页面图像包括N道题目,每道题目包括题干和答案选项,该页面图像可以从纸质题目页面中拍摄得到,或者从电子版题目页面中拍摄得到,本发明实施例对此不作具体限定,其中,N为正整数。
可以理解,在电子设备中设置有搜题APP,比如小猿搜题、学霸君、作业帮等等。那么,电子设备启动电子设备的摄像头拍摄包含至少一道题目的页面图像具体实现为:电子设备检测对任一个搜题APP的打开操作,响应于该打开操作打开该任一个搜题APP,进一步检测用户输入的搜题开始指令,响应于该搜题开始指令,启动电子设备的摄像头,通过摄像头的预览区域对包含有至少一道题目的页面进行拍摄预览,并响应于用户输入的拍摄指令,拍摄预览区域对应的页面以获得页面图像。
进一步地,在本发明实施例中,还可以实现更智能化地控制,那么电子设备启动电子设备的摄像头拍摄包含至少一道题目的页面图像具体包括:电子设备响应于用户输入的语音启动指令,启动该电子设备的摄像头,以利用预览区域对包含至少一道题目的页面图像进行拍摄预览;检测用户输入的语音拍摄执行指令;在检测到该语音拍摄执行指令时,拍摄预览区域获得页面图像。通过该实施方式,用户可以采用语音控制拍摄页面图像,操作更加简单和准确,而无需强制用户采用双手来实现操作。
在一些可实施的方式中,电子设备启动电子设备的摄像头拍摄包含至少一道题目的页面图像还具体包括:电子设备检测对任一个搜题APP的打开操作,响应于该打开操作打开该任一个搜题APP,进一步检测用户输入的搜题开始指令,响应于该搜题开始指令,启动电子设备的摄像头,通过摄像头的预览区域对包含有至少一道题目的页面进行拍摄预览;检测用户输入的语音拍摄执行指令;在检测到该语音拍摄执行指令时,拍摄预览区域获得页面图像。在该实施例中,用户打开搜题APP后,启动摄像头,在通过预览区域预览到页面图像后,通过语音控制拍摄页面图像。
102、电子设备检测用户输入的语音搜索指令。
需要说明的是,在步骤101中拍摄得到的页面图像缓存到预设内存中,然后用户可以通过语音搜索指令从缓存的页面图像中选择某一道题目。另外,电子设备还可以在当前APP的显示界面上显示页面图像,以便用户可以参照显示的页面图像输入语音搜索指令。
其中,语音搜索指令包括两部分内容,其中一部分内容用于指示该指令为搜题指令,另一部分内容为题目题干内容,即语音搜索指令的格式为:搜索+题干内容,为了搜索更加准确,语音搜索指令中包括的题干内容越全面越好,例如,搜索第2题下列等式正确的是:xxxx。
103、电子设备判断该页面图像是否存在语音搜索指令相匹配的某一道题目。其中,在页面图像存在该语音搜索指令相匹配的某一道题目时,转向步骤104;在页面图像不存在该语音搜索指令相匹配的某一道题目,结束该流程。
电子设备根据语音搜索指令,从页面图像中判断是否存在相匹配的某一道题目。另外,在页面图像不存在该语音搜索指令相匹配的某一道题目时,可以结束该流程,或者提示用户:页面图像中不存在相匹配的某一道题目。当然,在一些实施例中,在页面图像中不存在相匹配的某一道题目时,进一步分析该语音搜索指令中输入的题干内容是否详细清楚,在不够详细清楚时,可以提示用户输入更加详细的题干内容进行搜索。
104、电子设备搜索该某一道题目相匹配的搜索结果并显示。
可以理解,搜索到该某一道题目相匹配的搜索结果后,将该搜索结果显示出来,可以在电子设备显示界面上弹出另一窗口显示该搜索结果,或者,在搜题APP的当前显示界面的预设区域显示该搜索结果。
搜索结果包括题干内容、答案内容和题目分析过程内容等。
在本发明实施例中,通过启动电子设备的摄像头拍摄包含至少一道题目的页面图像,然后检测用户输入的语音搜索指令,进一步判断页面图像是否存在语音搜索指令相匹配的某一道题目,在页面图像存在语音搜索指令相匹配的某一道题目时,搜索某一道题目相匹配的搜索结果并显示;可以看出,实施本发明实施例,能够通过将包含有至少一道题目的页面图像先拍摄下来,这种拍摄方式能够减少对焦的难度,从而快速准确地对焦到包含至少一道题目的页面,摈弃了传统技术中单独对某一道题目对焦的拍摄方式,提高题目获取速度,进一步地,用户通过语音搜索指令智能地从拍摄的页面图像的至少一道题目中选择出某一道题目,然后搜索该某一道题目相匹配的搜索结果并显示,利用语音搜索指令简化了选取题目的操作,实现智能化快速选题,从而达到提高搜索效率的目的。
实施例二
请参阅图3,图3为本发明实施例公开的基于语音的题目搜索方法的另一流程示意图;图3所示的一种基于语音的题目搜索方法可包括:
301、电子设备启动摄像头拍摄包含至少一道题目的页面图像。
302、电子设备对页面图像进行扫描识别,以获得非图像识别信息,该非图像识别信息包括至少一道题目。
在步骤302中,电子设备先对页面图像进行扫描识别,将页面图像中的题目分别识别出来,然后得到非图像识别信息,该非图像识别信息包括页面图像中的所有题目,在非图像识别信息中每一道题目包括文字、数学符号、数学公式等等中的至少一种。
303、电子设备检测用户输入的语音搜索指令。
在一些可实施的方式中,电子设备响应于用户输入的题目搜索指令,检测用户输入的语音搜索指令。
还需要说明的是,步骤302和步骤303的执行顺序不受限制,可以先执行步骤302,再执行步骤303;或者,先执行步骤303,再执行步骤302;或者,同时执行步骤302和步骤303,本发明实施例对此不作限定。
304、电子设备判断该非图像识别信息是否存在语音搜索指令相匹配的某一道题目。其中,在非图像识别信息存在语音搜索指令相匹配的某一道题目时,转向步骤305;在非图像识别信息不存在语音搜索指令相匹配的某一道题目时,结束该流程。
其中,电子设备根据语音搜索指令,从非图像识别信息中判断是否存在相匹配的某一道题目。另外,在非图像识别信息中不存在该语音搜索指令相匹配的某一道题目时,可以结束该流程,或者提示用户:非图像识别信息中不存在相匹配的某一道题目。当然,在一些实施例中,在非图像识别信息中不存在相匹配的某一道题目时,进一步分析该语音搜索指令中输入的题干内容是否详细清楚,在不够详细清楚时,可以提示用户输入更加详细的题干内容进行搜索。
在一些可实施的方式中,在步骤303中,电子设备检测用户输入的语音搜索指令具体包括:电子设备响应于用户输入的题目搜索指令,检测用户输入的语音搜索指令,将语音搜索指令转换成文字搜索指令。在该实施方式中,电子设备在检测到语音搜索指令后,将语音搜索指令转换成更容易识别的文字搜索指令。
进而,电子设备判断非图像识别信息是否存在该文字搜索指令相匹配的某一道题目具体包括:电子设备判断该非图像识别信息是否存在文字搜索指令相匹配的某一道题目。通过该实施方式,电子设备先将页面图像中的题目识别出来,获得非图像识别信息,然后再将语音搜索指令转换成文字搜索指令,对非图像识别信息和文字搜索指令进行匹配,如果能够从非图像识别信息中匹配出文字搜索指令对应的某一道题目,则完成页面图像中某一道题目的选取。
305、电子设备搜索该某一道题目相匹配的搜索结果并显示。
可以理解,搜索到该某一道题目相匹配的搜索结果后,将该搜索结果显示出来,可以在电子设备显示界面上弹出另一窗口显示该搜索结果,或者,在搜题APP的当前显示界面的预设区域显示该搜索结果。
306、电子设备响应于用户输入的返回题目搜索指令,返回步骤303。
可以理解,电子设备在完成某一道题目的搜索后,用户可以继续针对该页面图像上的其它题目输入语音搜索指令,然后对其它题目进行搜题。
在一些可实施的方式中,在搜题APP当前显示界面上还设置有返回按键,电子设备检测用户对该返回按键的触及操作,以获得返回题目搜索指令,然后转向步骤303。
在一些可实施的方式中,电子设备在完成步骤305之后,电子设备检测用户输入的重拍指令,并响应于该重拍指令,回到步骤301,执行启动电子设备的摄像头拍摄包含至少一道题目的页面图像,以进入下一轮搜题。
具体地,电子设备监测用户对重拍按钮的触及操作,在监测到该触及操作时,确定检测到重拍指令,则响应于该重拍指令,启动电子设备的摄像头拍摄包含至少一道题目的页面图像,以进入下一轮搜题。
在本发明实施例中,电子设备在拍摄页面图像之后,先将页面图像中的题目都识别出来,以获得非图像识别信息,该非图像识别信息包括至少一道题目,然后从非图像识别信息中匹配出语音搜索指令对应的某一道题目,然后搜索该某一道题目的搜索结果来显示。进一步地,用户可以继续搜索页面图像中的其它题目,可以看出,一次性将包含至少一道题目的页面图像拍摄下来,然后可以分别对页面图像上的题目进行搜索,相比传统技术中每搜索一道题目就要重新对焦拍摄该道题目而言,能够减少流程,提高搜索效率。
在本发明另一些实施例中,电子设备拍摄得到页面图像后,电子设备逐一识别页面图像中的每一道题目,然后对搜索该道题目相匹配的搜索结果并显示,实现完全智能化。
在本发明另一些实施例中,电子设备拍摄得到页面图像后,电子设备先将页面图像中的每一道题目识别出来,获得非图像识别信息,然后依次搜索非图像识别信息中每一道题目,获得搜索结果并显示。
实施例三
请参阅图4,图4为本发明实施例公开的电子设备的结构示意图;如图4所示,一种电子设备可包括:
拍摄单元410,用于启动电子设备的摄像头拍摄包含至少一道题目的页面图像;
检测单元420,用于检测用户输入的语音搜索指令;
判断单元430,用于判断该页面图像是否存在语音搜索指令相匹配的某一道题目;
搜索单元440,用于在判断单元430确定页面图像存在语音搜索指令相匹配的某一道题目时,搜索该某一道题目相匹配的搜索结果并显示。
在本发明实施例中,拍摄单元410通过启动电子设备的摄像头拍摄包含至少一道题目的页面图像,然后检测单元420检测用户输入的语音搜索指令,判断单元430进一步判断页面图像是否存在语音搜索指令相匹配的某一道题目,在判断单元430确定页面图像存在语音搜索指令相匹配的某一道题目时,搜索单元440搜索某一道题目相匹配的搜索结果并显示;可以看出,实施本发明实施例,能够通过将包含有至少一道题目的页面图像先拍摄下来,这种拍摄方式能够减少对焦的难度,从而快速准确地对焦到包含至少一道题目的页面,摈弃了传统技术中单独对某一道题目对焦的拍摄方式;并且用户可以通过语音指令智能地从页面图像的题目中选择某一道题目,然后搜索该某一道题目相匹配的搜索结果并显示,利用语音指令简化了选取题目的操作,实现智能化选题,提高搜索效率。
作为一种可选的实施方式,拍摄单元410具体用于,检测对任一个搜题APP的打开操作,响应于该打开操作打开该任一个搜题APP,进一步检测用户输入的搜题开始指令,响应于该搜题开始指令,启动电子设备的摄像头,通过摄像头的预览区域对包含有至少一道题目的页面进行拍摄预览,并响应于用户输入的拍摄指令,拍摄预览区域对应的页面以获得页面图像。
进一步地,拍摄单元410具体用于,响应于用户输入的语音启动指令,启动该电子设备的摄像头,以利用预览区域对包含至少一道题目的页面图像进行拍摄预览;检测用户输入的语音拍摄执行指令;在检测到该语音拍摄执行指令时,拍摄预览区域获得页面图像。通过该实施方式,用户可以采用语音控制拍摄页面图像,操作更加简单和准确,而无需强制用户采用双手来实现操作。
再进一步地,上述拍摄单元410具体用于,检测对任一个搜题APP的打开操作,响应于该打开操作打开该任一个搜题APP,进一步检测用户输入的搜题开始指令,响应于该搜题开始指令,启动电子设备的摄像头,通过摄像头的预览区域对包含有至少一道题目的页面进行拍摄预览;检测用户输入的语音拍摄执行指令;在检测到该语音拍摄执行指令时,拍摄预览区域获得页面图像。在该实施例中,用户打开搜题APP后,启动摄像头,在通过预览区域预览到页面图像后,通过语音控制拍摄页面图像。
可以理解的是,图4所示的电子设备可用于执行步骤101-步骤104所示的基于语音的题目搜索方法。
实施例四
请参阅图5,图5为本发明实施例公开的电子设备的另一结构示意图;图5所示的电子设备是在图4所示的电子设备的基础上进行优化得到的,图5所示的电子设备还包括:
图像识别单元510,用于在拍摄单元410启动电子设备的摄像头拍摄包含至少一道题目的页面图像之后,以及检测单元420检测用户输入的语音搜索指令之前,对该页面图像进行扫描识别,以获得非图像识别信息,该非图像识别信息包括至少一道题目;
上述判断单元430用于判断页面图像是否存在所述语音搜索指令相匹配的某一道题目的方式具体为:
上述判断单元430用于判断该非图像识别信息是否存在语音搜索指令相匹配的某一道题目。
在图5所示的电子设备中,上述检测单元420包括:
转换单元520,用于响应于用户输入的题目搜索指令,检测用户输入的语音搜索指令;以及,将所述语音搜索指令转换成文字搜索指令;
上述判断单元430用于判断该非图像识别信息是否存在语音搜索指令相匹配的某一道题目的方式具体为:
上述判断单元430用于判断该非图像识别信息是否存在所述文字搜索指令相匹配的某一道题目。
请结合上述图4和图5,上述检测单元420还用于,在上述搜索单元440在该页面图像存在语音搜索指令相匹配的某一道题目时,搜索该某一道题目相匹配的搜索结果并显示之后,响应于用户输入的返回题目搜索指令,检测用户输入的语音搜索指令;
或者,上述拍摄单元410还用于,在上述搜索单元440在页面图像存在语音搜索指令相匹配的某一道题目时,搜索该某一道题目相匹配的搜索结果并显示之后,响应于用户输入的重拍指令,启动电子设备的摄像头拍摄包含至少一道题目的页面图像。
请结合上述图4和图5,上述拍摄单元410用于启动电子设备的摄像头拍摄包含至少一道题目的页面图像的方式具体为:
上述拍摄单元410,用于响应于用户输入的语音启动指令,启动该电子设备的摄像头,以利用预览区域对包含至少一道题目的页面图像进行拍摄预览;以及,检测用户输入的语音拍摄执行指令;以及,在检测到该语音拍摄执行指令时,拍摄该预览区域对应的页面图像。
可以理解的是,图5所示的电子设备可用于执行步骤301-步骤306所示的基于语音的题目搜索方法。
实施例五
请参阅图6,图6为本发明实施例公开的电子设备的另一结构示意图;图6所示的电子设备可包括:至少一个处理器610,例如CPU,存储器620,至少一个通信总线630,输入装置640,输出装置650。其中,通信总线630用于实现这些组件之间的通信连接。存储器620可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器620可选的还可以是至少一个位于远离前述处理器610的存储装置。其中,处理器610可以结合图4至图5所描述的电子设备,存储器620中存储一组程序代码,且处理器610调用存储器620中存储的程序代码,用于执行以下操作:
启动电子设备的摄像头拍摄包含至少一道题目的页面图像;
检测用户输入的语音搜索指令;
判断所述页面图像是否存在所述语音搜索指令相匹配的某一道题目;
在所述页面图像存在所述语音搜索指令相匹配的所述某一道题目时,搜索所述某一道题目相匹配的搜索结果并显示。
可选的,上述处理器610还用于执行以下操作:
对所述页面图像进行扫描识别,以获得非图像识别信息,所述非图像识别信息包括所述至少一道题目;以及
判断所述非图像识别信息是否存在所述语音搜索指令相匹配的某一道题目。
可选的,上述处理器610还用于执行以下操作:
响应于用户输入的题目搜索指令,检测用户输入的语音搜索指令;
将所述语音搜索指令转换成文字搜索指令;
以及,判断所述非图像识别信息是否存在所述文字搜索指令相匹配的某一道题目。
可选的,上述处理器610还用于执行以下操作:
响应于用户输入的返回题目搜索指令,检测用户输入的语音搜索指令。
可选的,上述处理器610还用于执行以下操作:
响应于用户输入的语音启动指令,启动所述电子设备的摄像头,以利用预览区域对包含至少一道题目的页面图像进行拍摄预览;
检测用户输入的语音拍摄执行指令;
在检测到所述语音拍摄执行指令时,拍摄所述预览区域获得所述页面图像。
实施上述电子设备,能够在拍摄时减少对焦的难度,从而快速准确地对焦到包含至少一道题目的页面,摈弃了传统技术中单独对某一道题目对焦的拍摄方式;并且用户可以通过语音指令智能地从页面图像的题目中选择某一道题目,然后搜索该某一道题目相匹配的搜索结果并显示,利用语音指令简化了选取题目的操作,实现智能化选题,提高搜索效率。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种基于语音的题目搜索方法及电子设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (12)
1.一种基于语音的题目搜索方法,其特征在于,包括:
启动电子设备的摄像头拍摄包含至少一道题目的页面图像;
检测用户输入的语音搜索指令;
判断所述页面图像是否存在所述语音搜索指令相匹配的某一道题目;
在所述页面图像存在所述语音搜索指令相匹配的所述某一道题目时,搜索所述某一道题目相匹配的搜索结果并显示。
2.根据权利要求1所述的方法,其特征在于,所述启动电子设备的摄像头拍摄包含至少一道题目的页面图像之后,以及所述检测用户输入的语音搜索指令之前,所述方法还包括:
对所述页面图像进行扫描识别,以获得非图像识别信息,所述非图像识别信息包括所述至少一道题目;
所述判断所述页面图像是否存在所述语音搜索指令相匹配的某一道题目,包括:
判断所述非图像识别信息是否存在所述语音搜索指令相匹配的某一道题目。
3.根据权利要求2所述的方法,其特征在于,所述检测用户输入的语音搜索指令,包括:
响应于用户输入的题目搜索指令,检测用户输入的语音搜索指令;
将所述语音搜索指令转换成文字搜索指令;
所述判断所述非图像识别信息是否存在所述语音搜索指令相匹配的某一道题目,包括:
判断所述非图像识别信息是否存在所述文字搜索指令相匹配的某一道题目。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述在所述页面图像存在所述语音搜索指令相匹配的所述某一道题目时,搜索所述某一道题目相匹配的搜索结果并显示之后,所述方法还包括:
响应于用户输入的返回题目搜索指令,执行所述检测用户输入的语音搜索指令的步骤;
或者,响应于用户输入的重拍指令,执行所述启动电子设备的摄像头拍摄包含至少一道题目的页面图像的步骤。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述启动电子设备的摄像头拍摄包含至少一道题目的页面图像,包括:
响应于用户输入的语音启动指令,启动所述电子设备的摄像头,以利用预览区域对包含至少一道题目的页面图像进行拍摄预览;
检测用户输入的语音拍摄执行指令;
在检测到所述语音拍摄执行指令时,拍摄所述预览区域获得所述页面图像。
6.一种电子设备,其特征在于,包括:
拍摄单元,用于启动电子设备的摄像头拍摄包含至少一道题目的页面图像;
检测单元,用于检测用户输入的语音搜索指令;
判断单元,用于判断所述页面图像是否存在所述语音搜索指令相匹配的某一道题目;
搜索单元,用于在所述判断单元确定所述页面图像存在所述语音搜索指令相匹配的所述某一道题目时,搜索所述某一道题目相匹配的搜索结果并显示。
7.根据权利要求6所述的电子设备,其特征在于,所述电子设备包括:
图像识别单元,用于在所述拍摄单元启动电子设备的摄像头拍摄包含至少一道题目的页面图像之后,以及所述检测单元检测用户输入的语音搜索指令之前,对所述页面图像进行扫描识别,以获得非图像识别信息,所述非图像识别信息包括所述至少一道题目;
所述判断单元用于判断所述页面图像是否存在所述语音搜索指令相匹配的某一道题目的方式具体为:
所述判断单元用于判断所述非图像识别信息是否存在所述语音搜索指令相匹配的某一道题目。
8.根据权利要求7所述的电子设备,其特征在于,所述检测单元包括:
转换单元,用于响应于用户输入的题目搜索指令,检测用户输入的语音搜索指令;以及,将所述语音搜索指令转换成文字搜索指令;
所述判断单元用于判断所述非图像识别信息是否存在所述语音搜索指令相匹配的某一道题目的方式具体为:
所述判断单元用于判断所述非图像识别信息是否存在所述文字搜索指令相匹配的某一道题目。
9.根据权利要求6至8任一项所述的电子设备,其特征在于,
所述检测单元还用于,在所述搜索单元在所述页面图像存在所述语音搜索指令相匹配的所述某一道题目时,搜索所述某一道题目相匹配的搜索结果并显示之后,响应于用户输入的返回题目搜索指令,检测用户输入的语音搜索指令;
或者,所述拍摄单元还用于,在所述搜索单元在所述页面图像存在所述语音搜索指令相匹配的所述某一道题目时,搜索所述某一道题目相匹配的搜索结果并显示之后,响应于用户输入的重拍指令,启动电子设备的摄像头拍摄包含至少一道题目的页面图像。
10.根据权利要求6至8任一项所述的电子设备,其特征在于,所述拍摄单元用于启动电子设备的摄像头拍摄包含至少一道题目的页面图像的方式具体为:
所述拍摄单元,用于响应于用户输入的语音启动指令,启动所述电子设备的摄像头,以利用预览区域对包含至少一道题目的页面图像进行拍摄预览;以及,检测用户输入的语音拍摄执行指令;以及,在检测到所述语音拍摄执行指令时,拍摄所述预览区域获得所述页面图像。
11.一种电子设备,其特征在于,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1至权利要求5任一项所述的基于语音的题目搜索方法。
12.一种计算机可读存储介质,其特征在于,其存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1至权利要求5任一项所述的基于语音的题目搜索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711422303.2A CN107908801A (zh) | 2017-12-25 | 2017-12-25 | 一种基于语音的题目搜索方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711422303.2A CN107908801A (zh) | 2017-12-25 | 2017-12-25 | 一种基于语音的题目搜索方法及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107908801A true CN107908801A (zh) | 2018-04-13 |
Family
ID=61871163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711422303.2A Pending CN107908801A (zh) | 2017-12-25 | 2017-12-25 | 一种基于语音的题目搜索方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107908801A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108647354A (zh) * | 2018-05-16 | 2018-10-12 | 广东小天才科技有限公司 | 一种辅导学习的方法及照明设备 |
CN109271480A (zh) * | 2018-08-30 | 2019-01-25 | 广东小天才科技有限公司 | 一种语音搜题方法及电子设备 |
CN109510858A (zh) * | 2018-07-31 | 2019-03-22 | 西安艾润物联网技术服务有限责任公司 | 服务信息推送方法以及相关产品 |
CN109522437A (zh) * | 2018-11-30 | 2019-03-26 | 珠海格力电器股份有限公司 | 一种纸质文件的信息搜索方法、装置、存储介质及终端 |
CN109582882A (zh) * | 2018-11-15 | 2019-04-05 | 百度在线网络技术(北京)有限公司 | 搜索结果的展现方法、装置和电子设备 |
CN111026889A (zh) * | 2019-02-18 | 2020-04-17 | 广东小天才科技有限公司 | 一种学习内容搜索方法及学习设备 |
CN112307158A (zh) * | 2019-08-30 | 2021-02-02 | 北京字节跳动网络技术有限公司 | 一种信息检索方法、装置、设备及介质 |
CN113590864A (zh) * | 2020-04-30 | 2021-11-02 | 百度在线网络技术(北京)有限公司 | 获取搜索结果的方法、装置、电子设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100250241A1 (en) * | 2007-08-31 | 2010-09-30 | Naoto Iwahashi | Non-dialogue-based Learning Apparatus and Dialogue-based Learning Apparatus |
CN105138618A (zh) * | 2015-08-11 | 2015-12-09 | 百度在线网络技术(北京)有限公司 | 在图像搜索中结合语音进行二次搜索的方法和装置 |
CN106294871A (zh) * | 2016-08-24 | 2017-01-04 | 广东小天才科技有限公司 | 一种拍照搜题的方法及装置 |
CN106775561A (zh) * | 2016-12-07 | 2017-05-31 | 广东小天才科技有限公司 | 一种截题方法、装置及智能设备 |
CN107464457A (zh) * | 2017-08-15 | 2017-12-12 | 安徽状元郎电子科技有限公司 | 一种带有搜题功能的智能点读笔 |
-
2017
- 2017-12-25 CN CN201711422303.2A patent/CN107908801A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100250241A1 (en) * | 2007-08-31 | 2010-09-30 | Naoto Iwahashi | Non-dialogue-based Learning Apparatus and Dialogue-based Learning Apparatus |
CN105138618A (zh) * | 2015-08-11 | 2015-12-09 | 百度在线网络技术(北京)有限公司 | 在图像搜索中结合语音进行二次搜索的方法和装置 |
CN106294871A (zh) * | 2016-08-24 | 2017-01-04 | 广东小天才科技有限公司 | 一种拍照搜题的方法及装置 |
CN106775561A (zh) * | 2016-12-07 | 2017-05-31 | 广东小天才科技有限公司 | 一种截题方法、装置及智能设备 |
CN107464457A (zh) * | 2017-08-15 | 2017-12-12 | 安徽状元郎电子科技有限公司 | 一种带有搜题功能的智能点读笔 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108647354A (zh) * | 2018-05-16 | 2018-10-12 | 广东小天才科技有限公司 | 一种辅导学习的方法及照明设备 |
CN109510858A (zh) * | 2018-07-31 | 2019-03-22 | 西安艾润物联网技术服务有限责任公司 | 服务信息推送方法以及相关产品 |
CN109271480A (zh) * | 2018-08-30 | 2019-01-25 | 广东小天才科技有限公司 | 一种语音搜题方法及电子设备 |
CN109582882A (zh) * | 2018-11-15 | 2019-04-05 | 百度在线网络技术(北京)有限公司 | 搜索结果的展现方法、装置和电子设备 |
CN109522437A (zh) * | 2018-11-30 | 2019-03-26 | 珠海格力电器股份有限公司 | 一种纸质文件的信息搜索方法、装置、存储介质及终端 |
CN111026889A (zh) * | 2019-02-18 | 2020-04-17 | 广东小天才科技有限公司 | 一种学习内容搜索方法及学习设备 |
CN112307158A (zh) * | 2019-08-30 | 2021-02-02 | 北京字节跳动网络技术有限公司 | 一种信息检索方法、装置、设备及介质 |
CN113590864A (zh) * | 2020-04-30 | 2021-11-02 | 百度在线网络技术(北京)有限公司 | 获取搜索结果的方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107908801A (zh) | 一种基于语音的题目搜索方法及电子设备 | |
CN108021320A (zh) | 一种电子设备题目搜索方法及电子设备 | |
CN103824481B (zh) | 一种检测用户背诵的方法及装置 | |
JP6591217B2 (ja) | 音声認識テキスト化システムの制御方法 | |
US20120176313A1 (en) | Display apparatus and voice control method thereof | |
CN109634552A (zh) | 一种应用于听写的报读控制方法及终端设备 | |
CN104463119B (zh) | 基于超声与视觉的复合式手势识别设备及其控制方法 | |
JPWO2016103988A1 (ja) | 情報処理装置、情報処理方法およびプログラム | |
CN107977146A (zh) | 一种基于蒙版的题目搜索方法及电子设备 | |
CN109597943A (zh) | 一种基于场景的学习内容推荐方法及学习设备 | |
CN109753583A (zh) | 一种搜题方法及电子设备 | |
CN108287903A (zh) | 一种与投影相结合的搜题方法及智能笔 | |
CN107193914A (zh) | 一种语音输入方法及移动终端 | |
CN111078829B (zh) | 一种点读控制方法及系统 | |
CN111077996B (zh) | 一种基于点读的信息推荐方法及学习设备 | |
CN109087225A (zh) | 一种基于家教设备的学习控制方法及家教设备 | |
WO2016152200A1 (ja) | 情報処理システムおよび情報処理方法 | |
CN106293403A (zh) | 一种黑屏待机状态下的学习操控方法及装置、移动终端 | |
CN109783613A (zh) | 一种搜题方法及系统 | |
CN108287900A (zh) | 一种手持拍照设备的搜题方法、系统及手持拍照设备 | |
CN111479079A (zh) | Ui列表操作方法、装置、智慧屏和可读存储介质 | |
CN109033448A (zh) | 一种学习引导方法及家教设备 | |
JP2005345616A (ja) | 情報処理装置及び情報処理方法 | |
CN106407386B (zh) | 提高题目搜索效率的方法和装置 | |
CN109766413B (zh) | 一种应用于家教设备的搜索方法及家教设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180413 |
|
RJ01 | Rejection of invention patent application after publication |