CN111461103A - 一种点读场景去干扰的方法、装置、电子设备和存储介质 - Google Patents
一种点读场景去干扰的方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN111461103A CN111461103A CN202010409426.8A CN202010409426A CN111461103A CN 111461103 A CN111461103 A CN 111461103A CN 202010409426 A CN202010409426 A CN 202010409426A CN 111461103 A CN111461103 A CN 111461103A
- Authority
- CN
- China
- Prior art keywords
- image
- target image
- operation body
- preview image
- preview
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- User Interface Of Digital Computer (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明实施例涉及图像处理技术领域,公开了一种点读场景去干扰的方法、装置、电子设备和存储介质。该方法包括:在电子设备处于点读场景时,生成第一互动指令指引用户将操作体置于承载体的规定区域;对所述承载体进行拍照,获取带有操作体的目标图像;识别所述操作体在目标图像中的触及区域,并提取所述目标图像的背景颜色;将所述背景颜色覆盖所述触及区域。实施本发明实施例,可以通过人机交互的方式将操作体置于承载体的规定区域,该规定区域不遮挡题目内容,进而对目标图像中触及区域进行背景涂抹,实现去干扰的目的,提高搜题的准确性和展示效果。
Description
技术领域
本发明涉及图像处理技术领域,具体涉及一种点读场景去干扰的方法、装置、电子设备和存储介质。
背景技术
点读设备可以实现对承载体例如书本或练习册等的内容进行朗读、释义以及收录题目等。在点读场景下,点读设备都是根据操作体例如手指或触控笔等的位置采集图像,进而执行后续的搜题或收录操作。由于采集图像中带有操作体,一方面影响展示效果和收录效果,另一方面如果操作体遮挡题干,则可能影响后续搜题结果的准确性或搜不到相应的搜索内容,造成不好的用户体验。
发明内容
针对所述缺陷,本发明实施例公开了一种点读场景去干扰的方法、装置、电子设备和存储介质,其可以通过电子设备与用户的交互,实现对操作体的识别和涂抹,提高搜题准确性和展示效果。
本发明实施例第一方面公开一种点读场景去干扰的方法,所述方法包括:
在电子设备处于点读场景时,生成第一互动指令指引用户将操作体置于承载体的规定区域;
对所述承载体进行拍照,获取带有操作体的目标图像;
识别所述操作体在目标图像中的触及区域,并提取所述目标图像的背景颜色;
将所述背景颜色覆盖所述触及区域。
作为一种可选的实施方式,在本发明实施例第一方面中,识别所述操作体在目标图像中的触及区域,并提取所述目标图像的背景颜色,包括:
通过颜色特征识别操作体在目标图像中的位置,确定所述触及区域;
检测所述触及区域的预设边缘是否与题目是否重叠,如果不重叠,则提取所述目标图像的背景颜色;
如果重叠,获取所述目标图像关联的无操作体的预览图像,利用所述预览图像替换所述目标图像。
作为一种可选的实施方式,在本发明实施例第一方面中,获取所述目标图像关联的无操作体的预览图像,包括:
在生成第一互动指令前对所述承载体进行拍照,得到初始图像,对所述初始图像进行操作体识别,在所述初始图像中不包含操作体时,保存所述初始图像为预览图像;
或者,
当检测到触及区域的预设边缘与题目有重叠后,生成第二互动指令指引用户将操作体从承载体移出后对所述承载体拍照,得到初始图像,对所述初始图像进行操作体识别,在所述初始图像中不包含操作体时,保存所述初始图像为预览图像。
作为一种可选的实施方式,在本发明实施例第一方面中,利用所述预览图像替换所述目标图像,包括:
将预览图像整体替换所述目标图像;
或者,
通过坐标变换获取所述触及区域在预览图像中对应的关联区域;
提取预览图像在关联区域内的部分作为第一图像;
提取目标图像中不包括触及区域的部分作为第二图像,将所述第一图像和第二图像合成新的目标图像。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法,还包括:
在检测到所述承载体被用户执行翻页操作或/和移动操作时,删除所述预览图像,重新获取目标图像和预览图像。
作为一种可选的实施方式,在本发明实施例第一方面中,识别所述操作体在目标图像中的触及区域,并提取所述目标图像的背景颜色,包括:
通过颜色特征识别操作体在目标图像中的位置,确定所述触及区域;
检测所述触及区域的预设边缘是否与题目是否重叠,如果不重叠,则提取所述目标图像的背景颜色;
如果重叠,生成第三互动指令重新指引用户将操作体置于承载体的规定区域。
本发明实施例第二方面公开一种点读场景去干扰的装置,所述装置包括:
生成单元,用于在电子设备处于点读场景时,生成第一互动指令指引用户将操作体置于承载体的规定区域;
拍照单元,用于对所述承载体进行拍照,获取带有操作体的目标图像;
识别单元,用于识别所述操作体在目标图像中的触及区域,并提取所述目标图像的背景颜色;
涂抹单元,用于将所述背景颜色覆盖所述触及区域。
作为一种可选的实施方式,在本发明实施例第二方面中,所述识别单元,包括:
确定子单元,用于通过颜色特征识别操作体在目标图像中的位置,确定所述触及区域;
检测子单元,用于检测所述触及区域的预设边缘是否与题目是否重叠,如果不重叠,则提取所述目标图像的背景颜色;
替换子单元,用于如果重叠,获取所述目标图像关联的无操作体的预览图像,利用所述预览图像替换所述目标图像。
作为一种可选的实施方式,在本发明实施例第二方面中,所述替换子单元,包括:
第一孙单元,用于在生成第一互动指令前对所述承载体进行拍照,得到初始图像,对所述初始图像进行操作体识别,在所述初始图像中不包含操作体时,保存所述初始图像为预览图像;
或者,
第二孙单元,用于当检测到触及区域的预设边缘与题目有重叠后,生成第二互动指令指引用户将操作体从承载体移出后对所述承载体拍照,得到初始图像,对所述初始图像进行操作体识别,在所述初始图像中不包含操作体时,保存所述初始图像为预览图像。
作为一种可选的实施方式,在本发明实施例第二方面中,所述替换子单元,还包括:
第三孙单元,用于将预览图像整体替换所述目标图像;
或者,
第四孙单元,用于通过坐标变换获取所述触及区域在预览图像中对应的关联区域;提取预览图像在关联区域内的部分作为第一图像;提取目标图像中不包括触及区域的部分作为第二图像,将所述第一图像和第二图像合成新的目标图像。
作为一种可选的实施方式,在本发明实施例第二方面中,所述装置还包括删除单元,用于在检测到所述承载体被用户执行翻页操作或/和移动操作时,删除所述预览图像,重新获取目标图像和预览图像。
作为一种可选的实施方式,在本发明实施例第二方面中,所述识别单元,包括:
确定子单元,用于通过颜色特征识别操作体在目标图像中的位置,确定所述触及区域;
检测子单元,用于检测所述触及区域的预设边缘是否与题目是否重叠,如果不重叠,则提取所述目标图像的背景颜色;
重选子单元,用于如果重叠,生成第三互动指令重新指引用户将操作体置于承载体的规定区域。
本发明实施例第三方面公开一种电子设备,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行本发明实施例第一方面公开的一种点读场景去干扰的方法的部分或全部步骤。
本发明实施例第四方面公开一种计算机可读存储介质,其存储计算机程序,其中,所述计算机程序使得计算机执行本发明实施例第一方面公开的一种点读场景去干扰的方法的部分或全部步骤。
本发明实施例第五方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本发明实施例第一方面公开的一种点读场景去干扰的方法的部分或全部步骤。
本发明实施例第六方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本发明实施例第一方面公开的一种点读场景去干扰的方法的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,在电子设备处于点读场景时,生成第一互动指令指引用户将操作体置于承载体的规定区域;对所述承载体进行拍照,获取带有操作体的目标图像;识别所述操作体在目标图像中的触及区域,并提取所述目标图像的背景颜色;将所述背景颜色覆盖所述触及区域。可见,实施本发明实施例,可以通过人机交互的方式将操作体置于承载体的规定区域,该规定区域不遮挡题目内容,进而对目标图像中触及区域进行背景涂抹,实现去干扰的目的,提高搜题的准确性和展示效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种点读场景去干扰的方法的流程示意图;
图2是本发明实施例公开的另一种点读场景去干扰的方法的流程示意图;
图3是本发明实施例公开的又一种点读场景去干扰的方法的流程示意图;
图4是本发明实施例公开的一种点读场景去干扰的装置的结构示意图;
图5是本发明实施例公开的另一种点读场景去干扰的装置的结构示意图;
图6是本发明实施例公开的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,示例性地,包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开了一种点读场景去干扰的方法、装置、电子设备和存储介质,其可以通过人机交互的方式将操作体置于承载体的规定区域,该规定区域不遮挡题目内容,进而对目标图像中触及区域进行背景涂抹,实现去干扰的目的,提高搜题的准确性和展示效果,以下结合附图进行详细描述。
实施例一
请参阅图1,图1是本发明实施例公开的一种点读场景去干扰方法的流程示意图。如图1所示,该点读场景去干扰方法包括以下步骤:
110、在电子设备处于点读场景时,生成第一互动指令指引用户将操作体置于承载体的规定区域。
本发明实施例中,电子设备可以为家教机、点读机、学习平板等。点读场景可以是电子设备实时监测用户是否对承载体上的学习区域通过操作体执行面触操作,如果是,电子设备可以从学习区域中获取点触操作对应的点读内容,并输出点读内容对应的图像或/和搜题结果,其中,图像用于收录题目,搜题结果是根据图像在题库中选取相应的读音、释义或者答案等,具体根据用户输入指令进行,用户的输入指令可以是通过文字输入方式或者按键选择方式或者语音输入方式等进行。示例性地,用户可以通过语音方式输入“请问这个单词怎么读”,则电子设备(或电子设备经由服务器)根据拍摄图像在题库中搜索面触位置的单词的读音,以标准音频方式输出。
电子设备可以通过图像采集设备采集用户操作体处于学习区域时的图像,图像采集设备可以为摄像头、相机等,且图像采集设备可以设置在电子设备上的任意位置,也可以设置在电子设备以外的地方,且图像采集设备可以与电子设备通过无线或有线的方式进行通讯连接,以使图像采集设备可以将采集到的图像传输至电子设备。
操作体可以是手指、触控笔、铅笔以及小棍等任意结构,优选操作体的颜色与承载体学习区域的题目颜色不同,以便于对操作体位置进行识别。承载体为用户学习内容的载体,可以是书本、练习册以及试卷等。
电子设备生成的第一互动指令可以是在显示屏幕上的文字互动指令或/和发出的语音互动指令,规定区域根据具体的收录算法确定,可以是将操作体放置于待学习内容(称为目标题目)的下方、左侧或右侧,以不遮挡题目内容为基础。示例性地,当规定区域为待学习内容的下方时,则收录算法为拍摄图像后,最终获取手指上方的题目。
第一互动指令可以在用户的输入指令之前或之后,对于用户一段时间内例如启动电子设备进入点读场景后的两个小时内,仅输出一次第一互动指令即可,当然,也可以针对用户的每次输入指令均生成第一互动指令。
120、对所述承载体进行拍照,获取带有操作体的目标图像。
发出第一互动指令后的预设时间后,可以认为用户按照第一互动指令的指引进行了相关操作,则可以通过图像采集设备对承载体进行拍照,得到带有操作体的目标图像。可以先对目标图像进行操作体识别,操作体识别可以通过颜色特征实现,如果目标图像中不含有操作体,则电子设备可以发出提醒指令例如通过语音向用户发出“请将手指放于题目的下方”,最终得到的目标图像中含有操作体。
目标图像是根据用户指令基于一定的算法得到,其可以是承载体的整个页面,也可以是承载体的部分区域。
130、识别所述操作体在目标图像中的触及区域,并提取所述目标图像的背景颜色。
识别操作体的触及区域可以通过颜色特征实现。示例性地,通过机器学习的方式构建颜色特征识别模型对操作体进行识别。操作体和承载体的接触为面接触,采用手指的操作体时,则识别手指指尖的位置。得到操作体的位置坐标,则可以确定操作体在目标图像中的触及区域。
提取目标图像的背景颜色可以通过颜色直方图进实现,一般地,背景颜色的RGB颜色特征一般趋向于白色(255,255,255),提取直方图中趋向于(255,255,255)的颜色峰值(为滤除干扰,峰值数量大于预设阈值)为背景颜色。当然,还可以直接提取目标图像中任意边缘的颜色特征,然后将该颜色特征与白色的颜色特征进行余弦相似度比对,当相似度大于预设相似度时,则提取的颜色特征即为背景颜色。
140、将所述背景颜色覆盖所述触及区域。
在步骤110生成的第一互动指令指引用户将操作体置于承载体的规定区域的情况下,可以视为用户将操作体放于不遮挡题目的区域,则可以直接将触及区域的颜色特征用背景颜色的颜色特征进行替换,从而得到不包含干扰的目标图像,用于展示或者搜题。如果搜题,则可以基于预设规则或相应的算法根据原触及区域的位置进一步缩小目标图像的范围,达到精确框题的目的。示例性地,相应的算法可以是机器学习识别模型确定精选框,通过精选框得到目标题目。
实施本发明实施例,可以通过人机交互的方式将操作体置于承载体的规定区域,该规定区域不遮挡题目内容,进而对目标图像中触及区域进行背景涂抹,实现去干扰的目的,提高搜题的准确性和展示效果。
实施例二
请参阅图2,图2是本发明实施例公开的另一种点读场景去干扰方法的结构示意图。如图2所示,该方法可以包括:
210、在电子设备处于点读场景时,生成第一互动指令指引用户将操作体置于承载体的规定区域。
220、对所述承载体进行拍照,获取带有操作体的目标图像。
230、识别所述操作体在目标图像中的触及区域。
240、检测触及区域的预设边缘是否与题目重叠,如果不重叠,则执行步骤250,如果重叠,则执行步骤260。
250、提取所述目标图像的背景颜色,将所述背景颜色覆盖所述触及区域。
260、生成第三互动指令重新指引用户将操作体置于承载体的规定区域。
步骤210-230以及步骤250可以与实施例一中步骤110-140类似,这里不再赘述。
在一些场景中,用户没有按照第一互动指令的指引进行操作或者按照第一互动指令的指引进行操作,但是由于其他原因,例如拍照时手指还在动作等,可能会导致触及区域遮挡题目内容,因此,在本发明实施例的步骤240中,通过检测触及区域的预设边缘与题目的重叠情况来判断操作体是否遮挡目标题目。
预设边缘根据第一互动指令确定,示例性地,如果第一互动指令是指引用户将操作体置于目标题目的下方,则预设边缘可以是触及区域的上半部分的边缘。如果预设边缘与题目重叠,可以确定触及区域遮挡目标题目。
预设边缘与题目是否重叠的判断是基于坐标确定。示例性地,获取预设边缘坐标,将目标图像二值化(背景和操作体置于相同的值,例如0),检测预设边缘坐标的值中是否存在1,如果存在1,则说明预设边缘和题目重叠。
在步骤260中,生成的第三互动指令可以与第一互动指令相同,也可以是在第一互动指令的基础上增加一些细节性说明,例如“请将手指放于题目的下方,并注意不要遮挡题目”。发出第三互动指令后的预设时间后,可以认为用户按照第三互动指令的指引进行了相关操作,则可以重新执行步骤220-260,通过图像采集设备重新对承载体进行拍照,重新得到带有操作体的目标图像。
实施本发明实施例,可以通过人机交互的方式将操作体置于承载体的规定区域,并检测规定区域是否遮挡题目内容,进而对目标图像中触及区域进行背景涂抹或者重新指引用户放置操作体,达到去干扰的目的,提高搜题的准确性和展示效果。
实施例三
请参阅图3,图3是本发明实施例公开的另一种点读场景去干扰方法的结构示意图。如图3所示,该方法可以包括:
310、在电子设备处于点读场景时,生成第一互动指令指引用户将操作体置于承载体的规定区域。
320、对所述承载体进行拍照,获取带有操作体的目标图像。
330、识别所述操作体在目标图像中的触及区域。
340、检测触及区域的预设边缘是否与题目重叠,如果不重叠,则执行步骤350,如果重叠,则执行步骤360。
350、提取所述目标图像的背景颜色,将所述背景颜色覆盖所述触及区域。
步骤310-350可以与实施例二中步骤210-250类似,这里不再赘述。
360、获取所述目标图像关联的无操作体的预览图像,利用所述预览图像替换所述目标图像。
预览图像可以是在第一互动指令前对承载体进行拍照得到,或者当检测到触及区域的预设边缘与题目有重叠后,生成第二互动指令指引用户将操作体从承载体移出后对所述承载体拍照,得到的图像称为初始图像。
电子设备生成的第二互动指令可以是在显示屏幕上的文字互动指令或/和发出的语音互动指令,目的在于指引用户将操作体从承载体中移走,示例性地,通过语音交互指令“请将手指移到练习册外”等。
初始图像内应该不包含操作体,因此,需要对初始图像进行操作体识别,操作体识别的方式也可以通过颜色特征实现,如果初始图像中不包含操作体,则初始图像即为预览图像,如果初始图像中包含操作体,则可以通过再次发出第二互动指令的方式指引用户进行相应的操作。
预览图像一般为对应承载体的整个页面。在目标图像操作体所在的整个页面时,直接将预览图像替换目标图像,用于展示或搜题,如果用于搜题,则需要将目标图像中触及区域的坐标转换到预览图像中,基于触及区域坐标以及预设规则或相应的算法得到目标题目。如果用于展示,则可以直接展示该预览图像。
在预览图像整体替换目标图像之前,需要先对预览图像是否与目标图像相对应进行检测,检测的方法可以基于轮廓信息特征的相似度比对,如果相似度大于预设值,则可以认为预览图像和目标图像对应承载体同一页内容。
当然,还可以将通过坐标变换方法例如仿射变换的方式获取预览图像上与触及区域对应的关联区域,触及区域和关联区域的比例关系与目标图像和预览图像的比例关系相同。提取关联区域内的预览图像的部分形成第一图像,提取目标图像中不包括触及区域的部分作为第二图像,将第一图像和第二图像合成新的目标图像,用于展示或搜题。
如果目标图像不是整体页面,则可以通过OpenCV通过相应的语言编译获取目标图像在预览图像中相应的位置,并将该预览图像中相应的位置替换目标图像,或者可以通过OpenCV通过相应的语言编译获取触及区域在预览图像中相应的区域,并将该预览图像中相应的区域内的图像替换触及区域图像。
在一些实施例中,如果电子设备检测到用户翻页或移动承载体,则删除预览图像,重新执行步骤310-360的操作,即获取承载体新的页面或/和位置下拍照得到的新的预览图像和目标图像,进行相应的涂抹。
翻页操作的检测可以通过预设时间内拍摄的两帧预览图像的相似度实现,如果在后的一帧预览图像与在前的一帧预览图像的相似度大于或等于预设阈值,则删除在后的一帧预览图像,仍以在前的一帧预览图像与目标图像进行相应的替换操作,如果在后的一帧预览图像与在前的一帧预览图像的相似度小于预设阈值,则说明存在翻页操作,删除在先的预览图像,保留在后的预览图像与目标图像进行相应的替换操作。
同样地,移动操作体的检测可以通过预设时间内拍摄的两帧预览图像的尺寸比对,如果在后的一帧预览图像与在前的一帧预览图像的尺寸相同,则认为承载体未被移动,则删除在后的一帧预览图像,仍以在前的一帧预览图像与目标图像进行相应的替换操作,如果在后的一帧预览图像与在前的一帧预览图像的尺寸不同,则认为承载体被移动,删除在先的预览图像,保留在后的预览图像与目标图像进行相应的替换操作。
实施本发明实施例,可以通过人机交互的方式将操作体置于承载体的规定区域,并检测规定区域是否遮挡题目内容,进而对目标图像中触及区域进行背景涂抹或者采用预览图像替换目标图像,达到去干扰的目的,提高搜题的准确性和展示效果。
实施例四
请参阅图4,图4是本发明实施例公开的一种点读场景去干扰装置的结构示意图。如图4所示,该点读场景去干扰装置可以包括:
生成单元410,用于在电子设备处于点读场景时,生成第一互动指令指引用户将操作体置于承载体的规定区域;
拍照单元420,用于对所述承载体进行拍照,获取带有操作体的目标图像;
识别单元430,用于识别所述操作体在目标图像中的触及区域,并提取所述目标图像的背景颜色;
涂抹单元440,用于将所述背景颜色覆盖所述触及区域。
作为一种可选的实施方式,所述识别单元430,包括:
确定子单元431,用于通过颜色特征识别操作体在目标图像中的位置,确定所述触及区域;
检测子单元432,用于检测所述触及区域的预设边缘是否与题目是否重叠,如果不重叠,则提取所述目标图像的背景颜色;
重选子单元433,用于如果重叠,生成第三互动指令重新指引用户将操作体置于承载体的规定区域。
图4所示的点读场景去干扰装置,可以通过人机交互的方式将操作体置于承载体的规定区域,并检测规定区域是否遮挡题目内容,进而对目标图像中触及区域进行背景涂抹或者重新指引用户放置操作体,达到去干扰的目的,提高搜题的准确性和展示效果。
实施例五
请参阅图5,图5是本发明实施例公开的另一种点读场景去干扰装置的结构示意图。如图5所示,该点读场景去干扰装置可以包括:
生成单元510,用于在电子设备处于点读场景时,生成第一互动指令指引用户将操作体置于承载体的规定区域;
拍照单元520,用于对所述承载体进行拍照,获取带有操作体的目标图像;
识别单元530,用于识别所述操作体在目标图像中的触及区域,并提取所述目标图像的背景颜色;
涂抹单元540,用于将所述背景颜色覆盖所述触及区域。
作为一种可选的实施方式,所述识别单元530,可以包括:
确定子单元531,用于通过颜色特征识别操作体在目标图像中的位置,确定所述触及区域;
检测子单元532,用于检测所述触及区域的预设边缘是否与题目是否重叠,如果不重叠,则提取所述目标图像的背景颜色;
替换子单元533,用于如果重叠,获取所述目标图像关联的无操作体的预览图像,利用所述预览图像替换所述目标图像。
作为一种可选的实施方式,所述替换子单元533,可以包括:
第一孙单元5331,用于在生成第一互动指令前对所述承载体进行拍照,得到初始图像,对所述初始图像进行操作体识别,在所述初始图像中不包含操作体时,保存所述初始图像为预览图像;
或者,
第二孙单元5332,用于当检测到触及区域的预设边缘与题目有重叠后,生成第二互动指令指引用户将操作体从承载体移出后对所述承载体拍照,得到初始图像,对所述初始图像进行操作体识别,在所述初始图像中不包含操作体时,保存所述初始图像为预览图像。
作为一种可选的实施方式,所述替换子单元533,还可以包括:
第三孙单元5333,用于将预览图像整体替换所述目标图像;
或者,
第四孙单元5334,用于通过坐标变换获取所述触及区域在预览图像中对应的关联区域;提取预览图像在关联区域内的部分作为第一图像;提取目标图像中不包括触及区域的部分作为第二图像,将所述第一图像和第二图像合成新的目标图像。
作为一种可选的实施方式,所述装置还包括删除单元550,用于在检测到所述承载体被用户执行翻页操作或/和移动操作时,删除所述预览图像,重新获取目标图像和预览图像。
图5所示的点读场景去干扰装置,可以通过人机交互的方式将操作体置于承载体的规定区域,并检测规定区域是否遮挡题目内容,进而对目标图像中触及区域进行背景涂抹或者采用预览图像替换目标图像,达到去干扰的目的,提高搜题的准确性和展示效果。
实施例六
请参阅图6,图6是本发明实施例公开的一种电子设备的结构示意图。如图6所示,该电子设备可以包括:
存储有可执行程序代码的存储器610;
与存储器610耦合的处理器620;
其中,处理器620调用存储器610中存储的可执行程序代码,执行实施例一至实施例三任意一种点读场景去干扰的方法中的部分或全部步骤。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行实施例一至实施例三任意一种点读场景去干扰的方法中的部分或全部步骤。
本发明实施例还公开一种计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行实施例一至实施例三任意一种点读场景去干扰的方法中的部分或全部步骤。
本发明实施例还公开一种应用发布平台,其中,应用发布平台用于发布计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行实施例一至实施例三任意一种点读场景去干扰的方法中的部分或全部步骤。
在本发明的各种实施例中,应理解,所述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例所述方法的部分或全部步骤。
在本发明所提供的实施例中,应理解,“与A对应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。
本领域普通技术人员可以理解所述实施例的各种方法中的部分或全部步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDiscRead-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种点读场景去干扰的方法、装置、电子设备和存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (14)
1.一种点读场景去干扰的方法,其特征在于,包括:
在电子设备处于点读场景时,生成第一互动指令指引用户将操作体置于承载体的规定区域;
对所述承载体进行拍照,获取带有操作体的目标图像;
识别所述操作体在目标图像中的触及区域,并提取所述目标图像的背景颜色;
将所述背景颜色覆盖所述触及区域。
2.根据权利要求1所述的方法,其特征在于,识别所述操作体在目标图像中的触及区域,并提取所述目标图像的背景颜色,包括:
通过颜色特征识别操作体在目标图像中的位置,确定所述触及区域;
检测所述触及区域的预设边缘是否与题目是否重叠,如果不重叠,则提取所述目标图像的背景颜色;
如果重叠,获取所述目标图像关联的无操作体的预览图像,利用所述预览图像替换所述目标图像。
3.根据权利要求2所述的方法,其特征在于,获取所述目标图像关联的无操作体的预览图像,包括:
在生成第一互动指令前对所述承载体进行拍照,得到初始图像,对所述初始图像进行操作体识别,在所述初始图像中不包含操作体时,保存所述初始图像为预览图像;
或者,
当检测到触及区域的预设边缘与题目有重叠后,生成第二互动指令指引用户将操作体从承载体移出后对所述承载体拍照,得到初始图像,对所述初始图像进行操作体识别,在所述初始图像中不包含操作体时,保存所述初始图像为预览图像。
4.根据权利要求2所述的方法,其特征在于,利用所述预览图像替换所述目标图像,包括:
将预览图像整体替换所述目标图像;
或者,
通过坐标变换获取所述触及区域在预览图像中对应的关联区域;
提取预览图像在关联区域内的部分作为第一图像;
提取目标图像中不包括触及区域的部分作为第二图像,将所述第一图像和第二图像合成新的目标图像。
5.根据权利要求2-4任一项所述的方法,其特征在于,所述方法,还包括:
在检测到所述承载体被用户执行翻页操作或/和移动操作时,删除所述预览图像,重新获取目标图像和预览图像。
6.根据权利要求1所述的方法,其特征在于,识别所述操作体在目标图像中的触及区域,并提取所述目标图像的背景颜色,包括:
通过颜色特征识别操作体在目标图像中的位置,确定所述触及区域;
检测所述触及区域的预设边缘是否与题目是否重叠,如果不重叠,则提取所述目标图像的背景颜色;
如果重叠,生成第三互动指令重新指引用户将操作体置于承载体的规定区域。
7.一种点读场景去干扰的装置,其特征在于,包括:
生成单元,用于在电子设备处于点读场景时,生成第一互动指令指引用户将操作体置于承载体的规定区域;
拍照单元,用于对所述承载体进行拍照,获取带有操作体的目标图像;
识别单元,用于识别所述操作体在目标图像中的触及区域,并提取所述目标图像的背景颜色;
涂抹单元,用于将所述背景颜色覆盖所述触及区域。
8.根据权利要求7所述的装置,其特征在于,所述识别单元,包括:
确定子单元,用于通过颜色特征识别操作体在目标图像中的位置,确定所述触及区域;
检测子单元,用于检测所述触及区域的预设边缘是否与题目是否重叠,如果不重叠,则提取所述目标图像的背景颜色;
替换子单元,用于如果重叠,获取所述目标图像关联的无操作体的预览图像,利用所述预览图像替换所述目标图像。
9.根据权利要求8所述的装置,其特征在于,所述替换子单元,包括:
第一孙单元,用于在生成第一互动指令前对所述承载体进行拍照,得到初始图像,对所述初始图像进行操作体识别,在所述初始图像中不包含操作体时,保存所述初始图像为预览图像;
或者,
第二孙单元,用于当检测到触及区域的预设边缘与题目有重叠后,生成第二互动指令指引用户将操作体从承载体移出后对所述承载体拍照,得到初始图像,对所述初始图像进行操作体识别,在所述初始图像中不包含操作体时,保存所述初始图像为预览图像。
10.根据权利要求8所述的装置,其特征在于,所述替换子单元,还包括:
第三孙单元,用于将预览图像整体替换所述目标图像;
或者,
第四孙单元,用于通过坐标变换获取所述触及区域在预览图像中对应的关联区域;提取预览图像在关联区域内的部分作为第一图像;提取目标图像中不包括触及区域的部分作为第二图像,将所述第一图像和第二图像合成新的目标图像。
11.根据权利要求8-10任一项所述的装置,其特征在于,所述装置还包括删除单元,用于在检测到所述承载体被用户执行翻页操作或/和移动操作时,删除所述预览图像,重新获取目标图像和预览图像。
12.根据权利要求7所述的装置,其特征在于,所述识别单元,包括:
确定子单元,用于通过颜色特征识别操作体在目标图像中的位置,确定所述触及区域;
检测子单元,用于检测所述触及区域的预设边缘是否与题目是否重叠,如果不重叠,则提取所述目标图像的背景颜色;
重选子单元,用于如果重叠,生成第三互动指令重新指引用户将操作体置于承载体的规定区域。
13.一种电子设备,其特征在于,包括:存储有可执行程序代码的存储器;与所述存储器耦合的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行权利要求1至6任一项所述的一种点读场景去干扰的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行权利要求1至6任一项所述的一种点读场景去干扰的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010409426.8A CN111461103B (zh) | 2020-05-14 | 2020-05-14 | 一种点读场景去干扰的方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010409426.8A CN111461103B (zh) | 2020-05-14 | 2020-05-14 | 一种点读场景去干扰的方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111461103A true CN111461103A (zh) | 2020-07-28 |
CN111461103B CN111461103B (zh) | 2023-05-16 |
Family
ID=71682721
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010409426.8A Active CN111461103B (zh) | 2020-05-14 | 2020-05-14 | 一种点读场景去干扰的方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111461103B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107580184A (zh) * | 2017-10-31 | 2018-01-12 | 维沃移动通信有限公司 | 一种拍摄方法及移动终端 |
CN109191403A (zh) * | 2018-09-07 | 2019-01-11 | Oppo广东移动通信有限公司 | 图像处理方法和装置、电子设备、计算机可读存储介质 |
CN109461191A (zh) * | 2018-10-26 | 2019-03-12 | 北京小米移动软件有限公司 | 区域配色方法及装置、电子设备、计算机可读存储介质 |
US20200059595A1 (en) * | 2016-05-25 | 2020-02-20 | Sony Corporation | Computational processing device and computational processing method |
CN111079726A (zh) * | 2019-06-09 | 2020-04-28 | 广东小天才科技有限公司 | 一种图像处理方法及电子设备 |
-
2020
- 2020-05-14 CN CN202010409426.8A patent/CN111461103B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200059595A1 (en) * | 2016-05-25 | 2020-02-20 | Sony Corporation | Computational processing device and computational processing method |
CN107580184A (zh) * | 2017-10-31 | 2018-01-12 | 维沃移动通信有限公司 | 一种拍摄方法及移动终端 |
CN109191403A (zh) * | 2018-09-07 | 2019-01-11 | Oppo广东移动通信有限公司 | 图像处理方法和装置、电子设备、计算机可读存储介质 |
CN109461191A (zh) * | 2018-10-26 | 2019-03-12 | 北京小米移动软件有限公司 | 区域配色方法及装置、电子设备、计算机可读存储介质 |
CN111079726A (zh) * | 2019-06-09 | 2020-04-28 | 广东小天才科技有限公司 | 一种图像处理方法及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111461103B (zh) | 2023-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110225387A (zh) | 一种信息搜索方法、装置及电子设备 | |
US9313444B2 (en) | Relational display of images | |
KR101929077B1 (ko) | 이미지 식별 방법 및 이미지 식별 장치 | |
JP2010250464A (ja) | 情報処理装置、情報処理方法及びプログラム | |
TW201322050A (zh) | 電子設備及其文本導讀方法 | |
US9129177B2 (en) | Image cache | |
CN106649629B (zh) | 一种关联书本与电子资源的系统 | |
CN111353501A (zh) | 一种基于深度学习的书本点读方法及系统 | |
CN105956079B (zh) | 一种应用于电子终端的试题搜索方法和装置 | |
TW201322049A (zh) | 電子設備及其文本導讀方法 | |
EP2806336A1 (en) | Text prediction in a text input associated with an image | |
CN103248814A (zh) | 运动图像记录设备及其控制方法 | |
CN111753120A (zh) | 一种搜题的方法、装置、电子设备和存储介质 | |
CN111711757B (zh) | 防手指遮挡的试题拍摄方法、装置、电子设备和存储介质 | |
CN111652142A (zh) | 基于深度学习的题目分割方法、装置、设备和介质 | |
CN108121987B (zh) | 一种信息处理方法和电子设备 | |
CN107977146B (zh) | 一种基于蒙版的题目搜索方法及电子设备 | |
CN111680177A (zh) | 数据搜索方法及电子设备、计算机可读存储介质 | |
CN105204752B (zh) | 投影式阅读中实现交互的方法和系统 | |
CN111079777B (zh) | 一种基于书页定位的点读方法及电子设备 | |
CN110795918B (zh) | 确定阅读位置的方法、装置及设备 | |
CN111711758B (zh) | 多指定位的试题拍摄方法、装置、电子设备和存储介质 | |
CN109685079B (zh) | 一种特征图像类别信息的生成方法和装置 | |
CN111461103B (zh) | 一种点读场景去干扰的方法、装置、电子设备和存储介质 | |
CN111582281B (zh) | 一种图片显示优化的方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |