CN111639635B - 一种拍摄图片的处理方法及装置、电子设备、存储介质 - Google Patents
一种拍摄图片的处理方法及装置、电子设备、存储介质 Download PDFInfo
- Publication number
- CN111639635B CN111639635B CN202010454848.7A CN202010454848A CN111639635B CN 111639635 B CN111639635 B CN 111639635B CN 202010454848 A CN202010454848 A CN 202010454848A CN 111639635 B CN111639635 B CN 111639635B
- Authority
- CN
- China
- Prior art keywords
- picture
- content
- user
- unit
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 33
- 238000012937 correction Methods 0.000 claims abstract description 64
- 238000012545 processing Methods 0.000 claims abstract description 51
- 238000012015 optical character recognition Methods 0.000 claims abstract description 26
- 238000000034 method Methods 0.000 claims abstract description 23
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 13
- 238000011156 evaluation Methods 0.000 claims description 224
- 238000001514 detection method Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 15
- 230000009286 beneficial effect Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 210000000707 wrist Anatomy 0.000 description 5
- 238000012854 evaluation process Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 210000000988 bone and bone Anatomy 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/80—Geometric correction
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B19/00—Teaching not covered by other main groups of this subclass
- G09B19/04—Speaking
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B5/00—Electrically-operated educational appliances
- G09B5/06—Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
- G09B5/065—Combinations of audio and video presentations, e.g. videotapes, videodiscs, television systems
Landscapes
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Multimedia (AREA)
- Educational Technology (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请实施例涉及计算机技术领域,公开了一种拍摄图片的处理方法及装置、电子设备、存储介质,该方法包括:控制摄像设备分别从多个角度去拍摄同一书页,获得所述多个角度对应的图片;判断所述多个角度对应的图片中是否存在符合梯形矫正要求的至少一张图片,若不存在,检测所述多个角度对应的图片中是否存在至少一张显示有所述书页的完整内容的图片;若不存在,将所述多个角度对应的图片进行合成,获得第一合成图片;对所述第一合成图片进行光学字符识别之后再进行内容去重处理,获得识别内容。能够减少图片内容缺失的问题出现,有利于降低对搜索的准确率的影响。
Description
技术领域
本申请涉及计算机技术领域,具体涉及一种拍摄图片的处理方法及装置、电子设备、存储介质。
背景技术
在基于图片进行内容(如习题)搜索时,若摄像头拍摄的图片存在过大的倾斜角度,则很容易出现图片内容缺失的问题,从而会影响搜索的准确率。
发明内容
本申请实施例公开了一种拍摄图片的处理方法及装置、电子设备、存储介质,能够减少图片内容缺失的问题出现,有利于降低对搜索的准确率的影响。
本申请实施例第一方面公开一种拍摄图片的处理方法,所述方法包括:
控制摄像设备分别从多个角度去拍摄同一书页,获得所述多个角度对应的图片;
判断所述多个角度对应的图片中是否存在符合梯形矫正要求的至少一张图片,若不存在,检测所述多个角度对应的图片中是否存在至少一张显示有所述书页的完整内容的图片;
若不存在,将所述多个角度对应的图片进行合成,获得第一合成图片;
对所述第一合成图片进行光学字符识别之后再进行内容去重处理,获得识别内容。
结合本申请实施例第一方面,在一些可选实施例中,若判断出所述多个角度对应的图片中存在符合梯形矫正要求的至少一张图片,所述方法还包括:
对所述存在符合梯形矫正要求的至少一张图片进行梯形矫正;
将所述存在符合梯形矫正要求的至少一张图片进行梯形矫正后得到的图片与所述多个角度对应的图片中除所述存在符合梯形矫正要求的至少一张图片之外的图片进行合成,获得第二合成图片;
对所述第二合成图片进行光学字符识别之后再进行内容去重处理,获得识别内容。
结合本申请实施例第一方面,在一些可选实施例中,若检测出所述多个角度对应的图片中存在至少一张显示有所述书页的完整内容的图片,所述方法还包括:
对所述显示有所述书页的完整内容的图片中的任意一张图片进行光学字符识别,获得识别内容。
结合本申请实施例第一方面,在一些可选实施例中,所述方法还包括:
在屏幕展示所述识别内容;
在检测到所述识别内容中的部分内容被用户选取作为口语测评内容后,控制所述屏幕隐藏所述识别内容,并在靠近所述屏幕的任意一侧边缘展示所述口语测评内容;所述口语测评内容由若干内容单元组成;
以及,控制所述屏幕展示捕获到的所述用户的实时画像;
从所述屏幕展示的所述用户的实时画像中捕捉到所述用户的嘴部;
在靠近所述用户的嘴部的指定位置呈现所述用户当前所读的测评单元;所述测评单元属于所述若干内容单元中的任一内容单元;
根据拾取到的所述用户读所述测评单元时的口语发音,对所述用户读所述测评单元进行口语测评,获得所述用户读所述测评单元的口语测评结果;
控制呈现的所述测评单元显示出与所述口语测评结果相对应的颜色。
其中,实施上述可选实施例,可以提升口语测评过程中的人机互动性,从而可以更好的引导用户对测评内容(如单词)进行口语测评,有利于提升用户对测评内容(如单词)发音的准确性。
结合本申请实施例第一方面,在一些可选实施例中,所述控制呈现的所述测评单元显示出与所述口语测评结果相对应的颜色之后,所述方法还包括:
根据所述用户读所述测评单元的口语测评结果,识别出所述用户读所述测评单元的口语发音是否准确;
若准确,控制所述测评单元按照所述屏幕预设的滑出方向从所述指定位置滑出所述屏幕;
若不准确,控制所述测评单元滑动至所述屏幕的被选定区域进行显示。
结合本申请实施例第一方面,在一些可选实施例中,所述方法还包括:
在所述用户读完毕所述若干内容单元之后,检测所述口语测评内容是否关联有待解锁对象;
若所述口语测评内容关联有待解锁对象,获取所述待解锁对象被配置的解锁允许阈值;其中,所述解锁允许阈值为口语发音准确的内容单元的指定数量;
统计所述若干内容单元中的口语发音准确的测评单元的总数量;
对比所述总数量是否超过所述指定数量,若超过,对所述待解锁对象进行解锁。
本申请实施例第二方面公开一种拍摄图片的处理装置,包括:
第一控制单元,用于控制摄像设备分别从多个角度去拍摄同一书页,获得所述多个角度对应的图片;
判断单元,用于判断所述多个角度对应的图片中是否存在符合梯形矫正要求的至少一张图片;
第一检测单元,用于在所述判断单元判断出所述多个角度对应的图片中不存在符合梯形矫正要求的至少一张图片时,检测所述多个角度对应的图片中是否存在至少一张显示有所述书页的完整内容的图片;
合成单元,用于在所述第一检测单元检测出所述多个角度对应的图片中不存在至少一张显示有所述书页的完整内容的图片时,将所述多个角度对应的图片进行合成,获得第一合成图片;
第一识别单元,用于对所述第一合成图片进行光学字符识别之后再进行内容去重处理,获得识别内容。
结合本申请实施例第二方面,在一些可选实施例中,所述装置还包括:
矫正单元,用于在所述判断单元判断出所述多个角度对应的图片中存在符合梯形矫正要求的至少一张图片时,对所述存在符合梯形矫正要求的至少一张图片进行梯形矫正;
所述合成单元,还用于将所述存在符合梯形矫正要求的至少一张图片进行梯形矫正后得到的图片与所述多个角度对应的图片中除所述存在符合梯形矫正要求的至少一张图片之外的图片进行合成,获得第二合成图片;
所述第一识别单元,还用于对所述第二合成图片进行光学字符识别之后再进行内容去重处理,获得识别内容。
结合本申请实施例第二方面,在一些可选实施例中:
所述第一识别单元,还用于在所述第一检测单元检测出所述多个角度对应的图片中存在至少一张显示有所述书页的完整内容的图片时,对所述显示有所述书页的完整内容的图片中的任意一张图片进行光学字符识别,获得识别内容。
结合本申请实施例第二方面,在一些可选实施例中,所述装置还包括:
第二控制单元,用于在屏幕展示所述识别内容;以及,在检测到所述识别内容中的部分内容被用户选取作为口语测评内容后,控制所述屏幕隐藏所述识别内容,并在靠近所述屏幕的任意一侧边缘展示所述口语测评内容;所述口语测评内容由若干内容单元组成;
第三控制单元,用于控制所述屏幕展示捕获到的所述用户的实时画像;
捕捉单元,用于从所述屏幕展示的所述用户的实时画像中捕捉到所述用户的嘴部;
所述第二控制单元,还用于在靠近所述用户的嘴部的指定位置呈现所述用户当前所读的测评单元;所述测评单元属于所述若干内容单元中的任一内容单元;
测评单元,用于根据拾取到的所述用户读所述测评单元时的口语发音,对所述用户读所述测评单元进行口语测评,获得所述用户读所述测评单元的口语测评结果;
第四控制单元,用于控制呈现的所述测评单元显示出与所述口语测评结果相对应的颜色。
结合本申请实施例第二方面,在一些可选实施例中,所述装置还包括:
第二识别单元,用于在所述第四控制单元控制呈现的所述测评单元显示出与所述口语测评结果相对应的颜色之后,根据所述用户读所述测评单元的口语测评结果,识别出所述用户读所述测评单元的口语发音是否准确;
第五控制单元,用于在所述第二识别单元识别出所述用户读所述测评单元的口语发音准确时,控制所述测评单元按照所述屏幕预设的滑出方向从所述指定位置滑出所述屏幕;或者,用于在所述第二识别单元识别出所述用户读所述测评单元的口语发音不准确时,控制所述测评单元滑动至所述屏幕的被选定区域进行显示。
结合本申请实施例第二方面,在一些可选实施例中,所述装置还包括:
第二检测单元,用于在所述用户读完毕所述若干内容单元之后,检测所述口语测评内容是否关联有待解锁对象;
获取单元,用于在所述口语测评内容关联有待解锁对象时,获取所述待解锁对象被配置的解锁允许阈值;其中,所述解锁允许阈值为口语发音准确的内容单元的指定数量;
统计单元,用于统计所述若干内容单元中的口语发音准确的测评单元的总数量;
对比单元,用于对比所述总数量是否超过所述指定数量;
解锁单元,用于在所述对比单元对比出所述总数量超过所述指定数量时,对所述待解锁对象进行解锁。
本申请实施例第三方面公开一种电子设备,包括本申请实施例第二方面或第二方面任一可选实施例描述的拍摄图片的处理装置。
本申请实施例第四方面公开一种电子设备,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本申请实施例第一方面或第一方面任一可选实施例描述的所述拍摄图片的处理方法的全部或部分步骤。
本申请实施例第五方面一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机指令,所述计算机指令运行时使计算机执行本申请实施例第一方面或第一方面任一可选实施例描述的所述拍摄图片的处理方法的全部或部分步骤。
与现有技术相比,本申请实施例具有以下有益效果:
本申请实施例中,在获得同一书页的多个角度对应的图片后,若判断多个角度对应的图片中既不存在符合梯形矫正要求的至少一张图片,又不存在至少一张显示有该书页的完整内容的图片,那么可以将多个角度对应的图片合成第一合成图片,并对第一合成图片进行光学字符识别之后再进行内容去重处理,从而获得识别内容。可见,实施本申请实施例,能够减少图片内容缺失的问题出现,有利于降低对搜索的准确率的影响。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例公开的拍摄图片的处理方法的第一实施例的流程示意图;
图2是本申请实施例公开的拍摄图片的处理方法的第二实施例的流程示意图;
图3是本申请实施例公开的拍摄图片的处理方法的第三实施例的流程示意图;
图4是本申请实施例公开的屏幕的界面示意图;
图5是本申请实施例公开的拍摄图片的处理装置的第一实施例的结构示意图;
图6是本申请实施例公开的拍摄图片的处理装置的第二实施例的结构示意图;
图7是本申请实施例公开的拍摄图片的处理装置的第三实施例的结构示意图;
图8是本申请实施例公开的电子设备的第一实施例的结构示意图;
图9是本申请实施例公开的电子设备的第二实施例的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例公开了一种拍摄图片的处理方法及装置、电子设备、存储介质,能够减少图片内容缺失的问题出现,有利于降低对搜索的准确率的影响。以下进行结合附图进行详细描述。
请参阅图1,图1是本申请实施例公开的拍摄图片的处理方法的第一实施例的流程示意图。其中,图1所描述的拍摄图片的处理方法适用于教育类设备(如家教设备、课堂电子设备)、电脑(如学生平板、个人PC)、移动手机、智能居家设备(如智能电视、智能音箱、智能机器人)等各类电子设备,本申请实施例不作限定。在图1所描述的拍摄图片的处理方法中,以电子设备作为执行主体对所述拍摄图片的处理方法进行描述。如图1所示,所述拍摄图片的处理方法可以包括以下步骤:
101、电子设备控制摄像设备分别从多个角度去拍摄同一书页,获得所述多个角度对应的图片。
示例性的,电子设备可以控制摄像设备(如摄像头)分别从朝上、朝下、朝左以及朝右四个角度去拍摄同一书页,获得四个角度对应的图片。
102、电子设备判断所述多个角度对应的图片中是否存在符合梯形矫正要求的至少一张图片,若不存在,执行步骤103;若存在,执行步骤107~步骤109。
示例性的,电子设备可以设置有明确的符合梯形矫正要求的倾斜角度范围,当摄像设备拍摄到的某一图片的倾斜角度处于该符合梯形矫正要求的倾斜角度范围中时,需要对这一图片进行梯形矫正。例如,符合梯形矫正要求的倾斜角度范围为超过20度,当摄像设备拍摄到的某一图片的倾斜角度超过20度时,对图片中的字符的识别会有很大的影响,因此,需要对图片进行梯形矫正,以获得标准的矩形,从而可以减少对图片中的字符的识别的影响。
103、电子设备检测所述多个角度对应的图片中是否存在至少一张显示有所述书页的完整内容的图片;若存在,执行步骤104;若不存在,执行步骤105~步骤106。
示例性的,所述书页上的内容可以位于内容框中,相应地所述显示有所述书页的完整内容的图片可以理解为:图片上显示有所述书页的完整的、框有内容的内容框。
104、电子设备对所述显示有所述书页的完整内容的图片中的任意一张图片进行光学字符识别,获得识别内容;结束本流程。
105、电子设备将所述多个角度对应的图片进行合成,获得第一合成图片。
示例性的,电子设备可以通过现有的图像处理技术将所述多个角度对应的图片进行合成,获得第一合成图片。
106、电子设备对所述第一合成图片进行光学字符识别之后再进行内容去重处理,获得识别内容;结束本流程。
示例性的,电子设备对所述第一合成图片进行光学字符识别之后,可以对重叠的部分内容进行去重处理,获得识别内容。
107、电子设备对所述存在符合梯形矫正要求的至少一张图片进行梯形矫正。
示例性的,电子设备可以采用软件的方法对所述存在符合梯形矫正要求的至少一张图片进行梯形矫正,从而可以获得标准的矩形。
108、电子设备将所述存在符合梯形矫正要求的至少一张图片进行梯形矫正后得到的图片与所述多个角度对应的图片中除所述存在符合梯形矫正要求的至少一张图片之外的图片进行合成,获得第二合成图片。
109、电子设备对所述第二合成图片进行光学字符识别之后再进行内容去重处理,获得识别内容。
可见,实施图1所描述的处理方法,能够减少图片内容缺失的问题出现,有利于降低对搜索的准确率的影响。
请参阅图2,图2是本申请实施例公开的拍摄图片的处理方法的第二实施例的流程示意图。在图2所描述的拍摄图片的处理方法中,以电子设备作为执行主体对所述拍摄图片的处理方法进行描述。如图2所示,所述拍摄图片的处理方法可以包括以下步骤:
201、电子设备控制摄像设备分别从多个角度去拍摄同一书页,获得所述多个角度对应的图片。
202、电子设备判断所述多个角度对应的图片中是否存在符合梯形矫正要求的至少一张图片,若不存在,执行步骤203;若存在,执行步骤207~步骤216。
203、电子设备检测所述多个角度对应的图片中是否存在至少一张显示有所述书页的完整内容的图片;若存在,执行步骤204;若不存在,执行步骤205~步骤206。
204、电子设备对所述显示有所述书页的完整内容的图片中的任意一张图片进行光学字符识别,获得识别内容;以及,执行步骤210~步骤216。
205、电子设备将所述多个角度对应的图片进行合成,获得第一合成图片。
206、电子设备对所述第一合成图片进行光学字符识别之后再进行内容去重处理,获得识别内容;以及,执行步骤210~步骤216。
207、电子设备对所述存在符合梯形矫正要求的至少一张图片进行梯形矫正。
208、电子设备将所述存在符合梯形矫正要求的至少一张图片进行梯形矫正后得到的图片与所述多个角度对应的图片中除所述存在符合梯形矫正要求的至少一张图片之外的图片进行合成,获得第二合成图片。
209、电子设备对所述第二合成图片进行光学字符识别之后再进行内容去重处理,获得识别内容。
210、电子设备在屏幕展示所述识别内容。
211、电子设备在检测到所述识别内容中的部分内容被用户选取作为口语测评内容后,控制所述屏幕隐藏所述识别内容,并在靠近所述屏幕的任意一侧边缘展示所述口语测评内容;所述口语测评内容由若干内容单元组成。
示例性的,电子设备可以检测出被用户(如学生)手指、书写笔或语音从所述识别内容中选取的部分内容作为口语测评内容。
又示例性的,电子设备可以预先与用户的监管者(如课堂教师或家长)佩戴的腕式穿戴设备建立通信连接,该监管者将其佩戴腕式穿戴设备的手腕所在手掌的某一手指顶住耳部根部以使耳部行成密闭音腔,并且该监管者可以发出音量低于某一阈值的、用于为所述用户从所述识别内容中选取部分内容作为口语测评内容的语音信号;其中,该语音信号作为一种振动信号通过手掌的骨介质传导入该腕式穿戴设备,由该腕式穿戴设备将该语音信号传递给电子设备,使得电子设备可以根据该语言信号检测到所述识别内容中的部分内容被选取作为口语测评内容。其中,实施这种实施方式,所述用户的监管者(如课堂教师或家长)可以灵活的为所述用户从所述识别内容中选取部分内容作为口语测评内容,并且不会造成对周围人的声音干扰。
在一些示例中,当上述腕式穿戴设备可以为课堂教师佩戴的腕式穿戴设备,该腕式穿戴设备可以同时与课堂上的多个用户(即学生)各自使用的电子设备建立通信连接,相应地,该监管者发出的音量低于某一阈值的、用于为所述用户从所述识别内容中选取部分内容作为口语测评内容的语音信号可以包含被选取的部分内容的标准发音和所述用户的身份标识(如姓名和/或座位号);进一步的,该腕式穿戴设备可以根据所述用户的身份标识(如姓名和/或座位号),将所述语音信号传递给所述用户使用的电子设备,使得所述用户使用的电子设备可以根据所述语音信号包含的被选取的部分内容的标准发音确定出为所述用户选取的作为口语测评内容的部分内容。其中,实施这种实施方式,课堂教师可以根据课堂(如培训课堂)上的多个用户各自的不同学习进度分别为课堂上的多个用户选取不同的口语测评内容,从而可以提升为课堂上的多个用户分别选取不同的口语测评内容时的灵活性和便捷性。
示例性的,电子设备控制所述屏幕隐藏所述识别内容之后,并在靠近所述屏幕的下侧边缘横向展示所述口语测评内容。
示例性的,所述口语测评内容可以是口语测评外语句子(如英语句子、俄语句子等),而组成口语测评外语句子的若干内容单元可以是口语测评外语句子包含的各个单词(如英语单词、俄语单词等)。
又示例性的,所述口语测评内容可以是中文句子,而组成该中文句子的若干内容单元可以是该中文句子包含的各个汉字。
又示例性的,所述口语测评内容还可以是音符串(如音乐符号1-7组成的音符串),而组成该音符串的若干内容单元可以是该音符串包含的各个音乐符号。
212、电子设备控制所述屏幕展示捕获到的所述用户的实时画像。
213、电子设备从所述屏幕展示的所述用户的实时画像中捕捉到所述用户的嘴部。
示例性的,电子设备可以通过摄像设备(如摄像头)拍摄用户的实时画像,并将拍摄到的用户的实时画像输出至屏幕(如电子设备设置的显示屏幕或电子设备通信连接的外部的显示屏幕)进行展示。进一步地,电子设备可以结合面部识别技术,从屏幕展示的用户的实时画像中捕捉到该用户的嘴部。
214、电子设备在靠近所述用户的嘴部的指定位置呈现所述用户当前所读的测评单元;所述测评单元属于所述若干内容单元中的任一内容单元。
215、电子设备根据拾取到的所述用户读所述测评单元时的口语发音,对所述用户读所述测评单元进行口语测评,获得所述用户读所述测评单元的口语测评结果。
其中,电子设备可以将拾取到的该用户读该测评单元时的口语发音与该测评单元的标准读音进行对比,从而可以获得该用户读该测评单元的口语测评结果。示例性的,该用户读该测评单元的口语测评结果可以分为准确和不准确两类。
216、电子设备控制呈现的所述测评单元显示出与所述口语测评结果相对应的颜色。
示例性的,若该口语测评结果为准确,那么电子设备可以控制屏幕呈现的该测评单元显示出与该口语测评结果相对应的绿色;反之,若该口语测评结果为不准确,那么电子设备可以控制屏幕呈现的该测评单元显示出与该口语测评结果相对应的红色。
可见,实施图2所描述的处理方法,不仅能够减少图片内容缺失的问题出现,有利于降低对搜索的准确率的影响;而且,还可以提升口语测评过程中的人机互动性,从而可以更好的引导用户(如学生)对图片中的识别内容包含的口语测评内容(如单词)进行口语测评,有利于提升学生对图片中的识别内容包含的口语测评内容(如单词)发音的准确性。
请参阅图3,图3是本申请实施例公开的拍摄图片的处理方法的第三实施例的流程示意图。在图3所描述的拍摄图片的处理方法中,以电子设备作为执行主体对所述拍摄图片的处理方法进行描述。如图3所示,所述拍摄图片的处理方法可以包括以下步骤:
301、电子设备控制摄像设备分别从多个角度去拍摄同一书页,获得所述多个角度对应的图片。
302、电子设备判断所述多个角度对应的图片中是否存在符合梯形矫正要求的至少一张图片,若不存在,执行步骤303;若存在,执行步骤307~步骤317。
303、电子设备检测所述多个角度对应的图片中是否存在至少一张显示有所述书页的完整内容的图片;若存在,执行步骤304;若不存在,执行步骤305~步骤306。
304、电子设备对所述显示有所述书页的完整内容的图片中的任意一张图片进行光学字符识别,获得识别内容;以及,执行步骤310~步骤317。
305、电子设备将所述多个角度对应的图片进行合成,获得第一合成图片。
306、电子设备对所述第一合成图片进行光学字符识别之后再进行内容去重处理,获得识别内容;以及,执行步骤310~步骤317。
307、电子设备对所述存在符合梯形矫正要求的至少一张图片进行梯形矫正。
308、电子设备将所述存在符合梯形矫正要求的至少一张图片进行梯形矫正后得到的图片与所述多个角度对应的图片中除所述存在符合梯形矫正要求的至少一张图片之外的图片进行合成,获得第二合成图片。
309、电子设备对所述第二合成图片进行光学字符识别之后再进行内容去重处理,获得识别内容。
310、电子设备在屏幕展示所述识别内容。
311、电子设备在检测到所述识别内容中的部分内容被用户选取作为口语测评内容后,控制所述屏幕隐藏所述识别内容,并在靠近所述屏幕的任意一侧边缘展示所述口语测评内容;所述口语测评内容由若干内容单元组成。
以图4所示的屏幕的界面示意图为例,电子设备在检测到所述识别内容中的部分内容“I like to walk to the office”被用户选取作为口语测评内容后,控制所述屏幕隐藏所述识别内容,并在靠近所述屏幕的下侧边缘横向展示所述口语测评内容“I like towalk to the office”;所述口语测评内容“I like to walk to the office”由从左到右依次排列的“I”、“like”、“to”、“walk”、“to”、“the”以及“office”7个内容单元组成。其中,电子设备可以按照读的顺序,控制展示的口语测评内容中的即将被读的排列次序为第5个的测评单元“to”以加粗形式突出显示。在一些实施方式中,即将被读的测评单元以可以采用指定颜色突出显示或者采用指定字体突出显示,本申请实施例不作限定。
312、电子设备控制所述屏幕展示捕获到的所述用户的实时画像。
313、电子设备从所述屏幕展示的所述用户的实时画像中捕捉到所述用户的嘴部。
314、电子设备在靠近所述用户的嘴部的指定位置呈现所述用户当前所读的测评单元;所述测评单元属于所述若干内容单元中的任一内容单元。
以图4所示的屏幕的界面示意图为例,电子设备可以在靠近所述用户的嘴部的指定位置呈现所述用户当前所读的测评单元“walk”;其中,测评单元“walk”属于上述“I”、“like”、“to”、“walk”、“to”、“the”以及“office”7个内容单元中的第4个内容单元。
315、电子设备根据拾取到的所述用户读所述测评单元时的口语发音,对所述用户读所述测评单元进行口语测评,获得所述用户读所述测评单元的口语测评结果。
以图4所示的屏幕的界面示意图为例,电子设备可以根据拾取到的所述用户读所述测评单元“walk”时的口语发音,对所述用户读所述测评单元“walk”进行口语测评,获得所述用户读所述测评单元“walk”的口语测评结果。
316、电子设备控制呈现的所述测评单元显示出与所述口语测评结果相对应的颜色。
以图4所示的屏幕的界面示意图为例,若所述用户读所述测评单元“walk”的口语测评结果为准确,那么电子设备可以控制屏幕呈现的所述测评单元“walk”显示出与所述口语测评结果相对应的绿色(图4未显示色彩);反之,若所述用户读所述测评单元“walk”的口语测评结果为不准确,那么电子设备可以控制屏幕呈现的所述测评单元“walk”显示出与所述口语测评结果相对应的红色(图4未显示色彩)。
317、电子设备根据所述用户读所述测评单元的口语测评结果,识别出所述用户读所述测评单元的口语发音是否准确;若准确,执行步骤318;若不准确,执行步骤319~步骤323。
以图4所示的屏幕的界面示意图为例,电子设备可以根据所述用户读所述测评单元“walk”的口语测评结果,识别出所述用户读所述测评单元“walk”的口语发音是否准确;若准确,执行步骤318;若不准确,执行步骤319~步骤323。
318、电子设备控制所述测评单元按照所述屏幕预设的滑出方向从所述指定位置滑出所述屏幕,并执行步骤320~步骤323。
其中,测评单元按照屏幕预设的滑出方向从该指定位置滑出屏幕时,用户可以从屏幕上观赏到测评单元按照屏幕预设的滑出方向从该指定位置滑出屏幕时的动画。
示例性的,该屏幕预设的滑出方向可以是从该指定位置朝向(如竖直向下朝向或斜向下朝向)屏幕的下侧边缘的方向;或者,该屏幕预设的滑出方向也可以是从该指定位置朝向(如竖直向上朝向或斜向上朝向)屏幕的上侧边缘的方向;或者,该屏幕预设的滑出方向也可以是从该指定位置朝向(如水面向左朝向或斜向左朝向)屏幕的左侧边缘的方向;又或者,该屏幕预设的滑出方向也可以是从该指定位置朝向(如水面向右朝向或斜向右朝向)屏幕的右侧边缘的方向;本申请实施例不作限定。
在一些实施方式中,屏幕预设的滑出方向可以被电子设备灵活的调整。例如,电子设备可以确定出该用户的嘴部中心分别到屏幕的下侧边缘、上侧边缘、左侧边缘以及右侧边缘的四个距离值,并从这四个距离值中确定出最大距离值,并将从该指定位置朝向该最大距离值对应的某一侧边缘(如下侧边缘)的方向调整为屏幕预设的滑出方向。可见,实施这种实施方式,即使该用户的嘴部中心发生偏移,也可以使得用户尽可能长时间地观赏到测评单元按照屏幕预设的滑出方向从该指定位置滑出屏幕时的动画,从而可以提高人机交互的时效性。
以图4所示的屏幕的界面示意图为例,若电子设备识别出所述用户读所述测评单元“walk”的口语发音准确,电子设备可以控制显示出与所述口语测评结果相对应的颜色的所述测评单元“walk”按照屏幕预设的滑出方向(以带箭头的弧线表示滑出方向)从所述指定位置滑出屏幕。
319、电子设备控制所述测评单元滑动至所述屏幕的被选定区域进行显示。
以图4所示的屏幕的界面示意图为例,若电子设备识别出所述用户读测评单元“like”的口语发音不准确,电子设备可以将显示出与该口语测评结果相对应的颜色的该测评单元“like”滑动至该屏幕的右上角的被选定区域。
其中,实施上述步骤319,可以在该屏幕的被选定区域为用户集中的显示的其口语发音不准确的测评单元,从而有利于用户反复地练习口语发音不准确的测评单元的口语发音,提升用户口语发音的准确性。
320、电子设备在所述用户读完毕所述若干内容单元之后,检测所述口语测评内容是否关联有待解锁对象;若所述口语测评内容关联有待解锁对象,执行步骤321;若所述口语测评内容未关联有待解锁对象,结束本流程。
示例性的,待解锁对象可以是待解锁APP、待解锁电子屏幕、待解锁智能门锁等,本申请实施例不作限定。特别地,当所述待解锁对象为待解锁智能门锁时,使用所述电子设备的所述用户被要求唯有在通过所述口语测评内容的口语测评才能解锁所述待解锁智能门锁出门玩耍。
321、电子设备获取所述待解锁对象被配置的解锁允许阈值;其中,所述解锁允许阈值为口语发音准确的内容单元的指定数量。
其中,待解锁对象可以被电子设备配置解锁允许阈值,或者,待解锁对象可以被电子设备的用户的监管者(如课堂教师或家长)佩戴的腕式穿戴设备配置解锁允许阈值。
322、电子设备统计所述若干内容单元中的口语发音准确的测评单元的总数量。
323、电子设备对比所述总数量是否超过所述指定数量,若超过,执行步骤324;若未超过,结束本流程。
324、电子设备对所述待解锁对象进行解锁。
在一些应用场景中,电子设备可以位于某一室内学习环境中,当电子设备在屏幕展示所述识别内容之后,电子设备的用户的监管者(如课堂教师或家长)可以为所述识别内容包含的所述口语测评内容指定待解锁智能门锁作为待解锁对象,要求所述用户唯有在通过所述口语测评内容的口语测评才能启动对所述待解锁智能门锁的解锁验证工作。在这种应用场景下,上述步骤324中电子设备对待解锁对象进行解锁的方式可以为:
电子设备基于待解锁智能门锁的内部摄像机拍摄到的室内图像确定使用电子设备的用户的当前空间位置信息;
以及,电子设备可以校验使用电子设备的用户的当前空间位置信息是否与该用户的监管者(如家长)针对该用户(属于被监护对象)专门配置的被监护对象相对于待解锁智能门锁的内部摄像机的三维位置信息相匹配,若匹配,才控制待解锁智能门锁进行解锁;其中,当该用户位于该用户的监管者(如家长)针对该用户(属于被监护对象)专门配置的被监护对象相对于待解锁智能门锁的内部摄像机的三维位置信息时,该用户的监管者在该室内环境中可以直接观察到该用户。从而可以要求电子设备的用户在监管者专门配置的、该监管者看得见该用户的某一空间位置上才允许使用电子设备控制待解锁智能门锁进行解锁,让监管者可以直观地知道待解锁智能门锁被哪个被监护对象解锁,从而可以提升电子设备的用户对待解锁智能门锁进行解锁时的可见性,防止电子设备的用户在监管者不知情的情况下偷偷解锁待解锁智能门锁外出。
其中,实施图4所描述的处理方法,不仅能够减少图片内容缺失的问题出现,有利于降低对搜索的准确率的影响;而且,还可以提升口语测评过程中的人机互动性,从而可以更好的引导用户(如学生)对图片中的识别内容包含的口语测评内容(如单词)进行口语测评,有利于提升学生对图片中的识别内容包含的口语测评内容(如单词)发音的准确性。
此外,实施图4所描述的处理方法,对于室内环境中的孩子而言,若要解锁待解锁智能门锁外出,除了被要求位于该监管者看得见的某一空间位置之外,还被要求口语发音准确的测评单元的总数量超过指定数量,从而可以起到敦促室内孩子练习口语发音,以提升口语发音的准确性的目的。
请参阅图5,图5是本申请实施例公开的拍摄图片的处理装置的第一实施例的结构示意图。该拍摄图片的处理装置可以包括:
第一控制单元501,用于控制摄像设备分别从多个角度去拍摄同一书页,获得所述多个角度对应的图片;
判断单元502,用于判断所述多个角度对应的图片中是否存在符合梯形矫正要求的至少一张图片;
第一检测单元503,用于在所述判断单元502判断出所述多个角度对应的图片中不存在符合梯形矫正要求的至少一张图片时,检测所述多个角度对应的图片中是否存在至少一张显示有所述书页的完整内容的图片;
合成单元504,用于在所述第一检测单元检测出所述多个角度对应的图片中不存在至少一张显示有所述书页的完整内容的图片时,将所述多个角度对应的图片进行合成,获得第一合成图片;
第一识别单元505,用于对所述第一合成图片进行光学字符识别之后再进行内容去重处理,获得识别内容。
其中,实施图5所描述的处理装置,能够减少图片内容缺失的问题出现,有利于降低对搜索的准确率的影响。
请一并参阅图6,图6是本申请实施例公开的拍摄图片的处理装置的第二实施例的结构示意图。其中,图6所示的拍摄图片的处理装置是由图5所示的拍摄图片的处理装置优化得到的。在图6所示的拍摄图片的处理装置中,还包括:
矫正单元506,用于在所述判断单元502判断出所述多个角度对应的图片中存在符合梯形矫正要求的至少一张图片时,对所述存在符合梯形矫正要求的至少一张图片进行梯形矫正;
所述合成单元504,还用于将所述存在符合梯形矫正要求的至少一张图片进行梯形矫正后得到的图片与所述多个角度对应的图片中除所述存在符合梯形矫正要求的至少一张图片之外的图片进行合成,获得第二合成图片;
所述第一识别单元505,还用于对所述第二合成图片进行光学字符识别之后再进行内容去重处理,获得识别内容。
作为另一些可选的实施方式,在图6所示的拍摄图片的处理装置中:
所述第一识别单元505,还用于在所述第一检测单元503检测出所述多个角度对应的图片中存在至少一张显示有所述书页的完整内容的图片时,对所述显示有所述书页的完整内容的图片中的任意一张图片进行光学字符识别,获得识别内容。
作为另一些可选的实施方式,图6所示的拍摄图片的处理装置还包括:
第二控制单元507,用于在屏幕展示所述识别内容;以及,在检测到所述识别内容中的部分内容被用户选取作为口语测评内容后,控制所述屏幕隐藏所述识别内容,并在靠近所述屏幕的任意一侧边缘展示所述口语测评内容;所述口语测评内容由若干内容单元组成;
第三控制单元508,用于控制所述屏幕展示捕获到的所述用户的实时画像;
捕捉单元509,用于从所述屏幕展示的所述用户的实时画像中捕捉到所述用户的嘴部;
所述第二控制单元507,还用于在靠近所述用户的嘴部的指定位置呈现所述用户当前所读的测评单元;所述测评单元属于所述若干内容单元中的任一内容单元;
测评单元510,用于根据拾取到的所述用户读所述测评单元时的口语发音,对所述用户读所述测评单元进行口语测评,获得所述用户读所述测评单元的口语测评结果;
第四控制单元511,用于控制呈现的所述测评单元显示出与所述口语测评结果相对应的颜色。
其中,实施图6所描述的处理装置,不仅能够减少图片内容缺失的问题出现,有利于降低对搜索的准确率的影响;而且,还可以提升口语测评过程中的人机互动性,从而可以更好的引导用户(如学生)对图片中的识别内容包含的口语测评内容(如单词)进行口语测评,有利于提升学生对图片中的识别内容包含的口语测评内容(如单词)发音的准确性。
请一并参阅图7,图7是本申请实施例公开的拍摄图片的处理装置的第三实施例的结构示意图。其中,图7所示的拍摄图片的处理装置是由图6所示的拍摄图片的处理装置优化得到的。在图7所示的拍摄图片的处理装置中,还包括:
第二识别单元512,用于在所述第四控制单元11控制呈现的所述测评单元显示出与所述口语测评结果相对应的颜色之后,根据测评单元510获得的所述用户读所述测评单元的口语测评结果,识别出所述用户读所述测评单元的口语发音是否准确;
第五控制单元513,用于在所述第二识别单元512识别出所述用户读所述测评单元的口语发音准确时,控制所述测评单元按照所述屏幕预设的滑出方向从所述指定位置滑出所述屏幕;或者,用于在所述第二识别单元512识别出所述用户读所述测评单元的口语发音不准确时,控制所述测评单元滑动至所述屏幕的被选定区域进行显示。
在另一些实施方式中,图7所示的拍摄图片的处理装置还包括:
第二检测单元514,用于在所述用户读完毕所述若干内容单元之后,检测所述口语测评内容是否关联有待解锁对象;
获取单元515,用于在所述口语测评内容关联有待解锁对象时,获取所述待解锁对象被配置的解锁允许阈值;其中,所述解锁允许阈值为口语发音准确的内容单元的指定数量;
统计单元516,用于统计所述若干内容单元中的口语发音准确的测评单元的总数量;
对比单元517,用于对比所述总数量是否超过所述指定数量;
解锁单元518,用于在所述对比单元对比出所述总数量超过所述指定数量时,对所述待解锁对象进行解锁。
在一些应用场景中,所述拍摄图像的处理装置被应用于电子设备,并且电子设备可以位于某一室内学习环境中,当第二控制单元507在屏幕展示所述识别内容之后,电子设备的用户的监管者(如课堂教师或家长)可以为所述识别内容包含的所述口语测评内容指定待解锁智能门锁作为待解锁对象,要求所述用户唯有在通过所述口语测评内容的口语测评才能启动对所述待解锁智能门锁的解锁验证工作。在这种应用场景下,解锁单元518对待解锁对象进行解锁的方式可以为:
基于待解锁智能门锁的内部摄像机拍摄到的室内图像确定使用电子设备的用户的当前空间位置信息;
以及,可以校验使用电子设备的用户的当前空间位置信息是否与该用户的监管者(如家长)针对该用户(属于被监护对象)专门配置的被监护对象相对于待解锁智能门锁的内部摄像机的三维位置信息相匹配,若匹配,才控制待解锁智能门锁进行解锁;其中,当该用户位于该用户的监管者(如家长)针对该用户(属于被监护对象)专门配置的被监护对象相对于待解锁智能门锁的内部摄像机的三维位置信息时,该用户的监管者在该室内环境中可以直接观察到该用户。从而可以要求电子设备的用户在监管者专门配置的、该监管者看得见该用户的某一空间位置上才允许使用电子设备控制待解锁智能门锁进行解锁,让监管者可以直观地知道待解锁智能门锁被哪个被监护对象解锁,从而可以提升电子设备的用户对待解锁智能门锁进行解锁时的可见性,防止电子设备的用户在监管者不知情的情况下偷偷解锁待解锁智能门锁外出。
请参阅图8,图8是本申请实施例公开的电子设备的第一实施例的结构示意图。如图8所示,该电子设备可以包括上述实施例中任意一种拍摄图片的处理装置。
请参阅图9,图9是本申请实施例公开的电子设备的第二实施例的结构示意图。如图9所示,可以包括:
存储有可执行程序代码的存储器901
与存储器耦合的处理器902;
其中,处理器902调用存储器901中存储的可执行程序代码,执行上述拍摄图片的处理方法的全部或部分步骤。
需要说明的是,本申请实施例中,图9所示的电子设备还可以包括扬声器模组、显示屏、光投射模组、电池模组、无线通信模组(如移动通信模块、WIFI模块、蓝牙模块等)、传感器模组(如接近传感器等)、输入模组(如麦克风、按键)以及用户接口模组(如充电接口、对外供电接口、卡槽、有线耳机接口等)等未显示的部件。
本发明实施例公开一种计算机可读存储介质,其上存储有计算机指令,该计算机指令运行时使计算机执行上述拍摄图片的处理方法的全部或部分步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的上述拍摄图片的处理方法及装置、电子设备,存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (11)
1.一种拍摄图片的处理方法,其特征在于,所述方法包括:
控制摄像设备分别从多个角度去拍摄同一书页,获得所述多个角度对应的图片;
判断所述多个角度对应的图片中是否存在符合梯形矫正要求的至少一张图片,若不存在,检测所述多个角度对应的图片中是否存在至少一张显示有所述书页的完整内容的图片;
若不存在,将所述多个角度对应的图片进行合成,获得第一合成图片;
对所述第一合成图片进行光学字符识别之后再进行内容去重处理,获得识别内容;
若检测出所述多个角度对应的图片中存在至少一张显示有所述书页的完整内容的图片,则对所述显示有所述书页的完整内容的图片中的任意一张图片进行光学字符识别,获得识别内容。
2.根据权利要求1所述的处理方法,其特征在于,若判断出所述多个角度对应的图片中存在符合梯形矫正要求的至少一张图片,所述方法还包括:
对所述存在符合梯形矫正要求的至少一张图片进行梯形矫正;
将所述存在符合梯形矫正要求的至少一张图片进行梯形矫正后得到的图片与所述多个角度对应的图片中除所述存在符合梯形矫正要求的至少一张图片之外的图片进行合成,获得第二合成图片;
对所述第二合成图片进行光学字符识别之后再进行内容去重处理,获得识别内容。
3.根据权利要求1或2所述的处理方法,其特征在于,所述方法还包括:
在屏幕展示所述识别内容;
在检测到所述识别内容中的部分内容被用户选取作为口语测评内容后,控制所述屏幕隐藏所述识别内容,并在靠近所述屏幕的任意一侧边缘展示所述口语测评内容;所述口语测评内容由若干内容单元组成;
以及,控制所述屏幕展示捕获到的所述用户的实时画像;
从所述屏幕展示的所述用户的实时画像中捕捉到所述用户的嘴部;
在靠近所述用户的嘴部的指定位置呈现所述用户当前所读的测评单元;所述测评单元属于所述若干内容单元中的任一内容单元;
根据拾取到的所述用户读所述测评单元时的口语发音,对所述用户读所述测评单元进行口语测评,获得所述用户读所述测评单元的口语测评结果;
控制呈现的所述测评单元显示出与所述口语测评结果相对应的颜色。
4.根据权利要求3所述的处理方法,其特征在于,所述控制呈现的所述测评单元显示出与所述口语测评结果相对应的颜色之后,所述方法还包括:
根据所述用户读所述测评单元的口语测评结果,识别出所述用户读所述测评单元的口语发音是否准确;
若准确,控制所述测评单元按照所述屏幕预设的滑出方向从所述指定位置滑出所述屏幕;
若不准确,控制所述测评单元滑动至所述屏幕的被选定区域进行显示。
5.一种拍摄图片的处理装置,其特征在于,包括:
第一控制单元,用于控制摄像设备分别从多个角度去拍摄同一书页,获得所述多个角度对应的图片;
判断单元,用于判断所述多个角度对应的图片中是否存在符合梯形矫正要求的至少一张图片;
第一检测单元,用于在所述判断单元判断出所述多个角度对应的图片中不存在符合梯形矫正要求的至少一张图片时,检测所述多个角度对应的图片中是否存在至少一张显示有所述书页的完整内容的图片;
合成单元,用于在所述第一检测单元检测出所述多个角度对应的图片中不存在至少一张显示有所述书页的完整内容的图片时,将所述多个角度对应的图片进行合成,获得第一合成图片;
第一识别单元,用于对所述第一合成图片进行光学字符识别之后再进行内容去重处理,获得识别内容;
所述第一识别单元,还用于在所述第一检测单元检测出所述多个角度对应的图片中存在至少一张显示有所述书页的完整内容的图片时,对所述显示有所述书页的完整内容的图片中的任意一张图片进行光学字符识别,获得识别内容。
6.根据权利要求5所述的处理装置,其特征在于,还包括:
矫正单元,用于在所述判断单元判断出所述多个角度对应的图片中存在符合梯形矫正要求的至少一张图片时,对所述存在符合梯形矫正要求的至少一张图片进行梯形矫正;
所述合成单元,还用于将所述存在符合梯形矫正要求的至少一张图片进行梯形矫正后得到的图片与所述多个角度对应的图片中除所述存在符合梯形矫正要求的至少一张图片之外的图片进行合成,获得第二合成图片;
所述第一识别单元,还用于对所述第二合成图片进行光学字符识别之后再进行内容去重处理,获得识别内容。
7.根据权利要求5或6所述的处理装置,其特征在于,还包括:
第二控制单元,用于在屏幕展示所述识别内容;以及,在检测到所述识别内容中的部分内容被用户选取作为口语测评内容后,控制所述屏幕隐藏所述识别内容,并在靠近所述屏幕的任意一侧边缘展示所述口语测评内容;所述口语测评内容由若干内容单元组成;
第三控制单元,用于控制所述屏幕展示捕获到的所述用户的实时画像;
捕捉单元,用于从所述屏幕展示的所述用户的实时画像中捕捉到所述用户的嘴部;
所述第二控制单元,还用于在靠近所述用户的嘴部的指定位置呈现所述用户当前所读的测评单元;所述测评单元属于所述若干内容单元中的任一内容单元;
测评单元,用于根据拾取到的所述用户读所述测评单元时的口语发音,对所述用户读所述测评单元进行口语测评,获得所述用户读所述测评单元的口语测评结果;
第四控制单元,用于控制呈现的所述测评单元显示出与所述口语测评结果相对应的颜色。
8.根据权利要求7所述的处理装置,其特征在于,还包括:
第二识别单元,用于在所述第四控制单元控制呈现的所述测评单元显示出与所述口语测评结果相对应的颜色之后,根据所述用户读所述测评单元的口语测评结果,识别出所述用户读所述测评单元的口语发音是否准确;
第五控制单元,用于在所述第二识别单元识别出所述用户读所述测评单元的口语发音准确时,控制所述测评单元按照所述屏幕预设的滑出方向从所述指定位置滑出所述屏幕;或者,用于在所述第二识别单元识别出所述用户读所述测评单元的口语发音不准确时,控制所述测评单元滑动至所述屏幕的被选定区域进行显示。
9.一种电子设备,其特征在于,包括权利要求5~8任一项所述的处理装置。
10.一种电子设备,其特征在于,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行权利要求1~4任一项所述处理方法的全部或部分步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令运行时使计算机执行权利要求1~4任一项所述处理方法的全部或部分步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010454848.7A CN111639635B (zh) | 2020-05-26 | 2020-05-26 | 一种拍摄图片的处理方法及装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010454848.7A CN111639635B (zh) | 2020-05-26 | 2020-05-26 | 一种拍摄图片的处理方法及装置、电子设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111639635A CN111639635A (zh) | 2020-09-08 |
CN111639635B true CN111639635B (zh) | 2024-02-27 |
Family
ID=72330928
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010454848.7A Active CN111639635B (zh) | 2020-05-26 | 2020-05-26 | 一种拍摄图片的处理方法及装置、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111639635B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101114943A (zh) * | 2007-09-14 | 2008-01-30 | 中兴通讯股份有限公司 | 一种对网管数据上载比较结果进行优化展现的方法 |
CN102622593A (zh) * | 2012-02-10 | 2012-08-01 | 北方工业大学 | 一种文本识别方法及系统 |
CN104835361A (zh) * | 2014-02-10 | 2015-08-12 | 陈旭 | 一种电子词典 |
CN205581907U (zh) * | 2016-01-26 | 2016-09-14 | 北京纽思曼教育科技有限公司 | 一种扫描翻译笔 |
CN107742446A (zh) * | 2013-01-25 | 2018-02-27 | 陈旭 | 图书阅读器 |
CN107766809A (zh) * | 2017-10-09 | 2018-03-06 | 平安科技(深圳)有限公司 | 电子装置、票据信息识别方法和计算机可读存储介质 |
CN109272992A (zh) * | 2018-11-27 | 2019-01-25 | 北京粉笔未来科技有限公司 | 一种口语测评方法、装置及一种生成口语测评模型的装置 |
CN109919147A (zh) * | 2019-03-04 | 2019-06-21 | 上海宝尊电子商务有限公司 | 服装吊牌图像中文本识别的方法 |
CN110379221A (zh) * | 2019-08-09 | 2019-10-25 | 陕西学前师范学院 | 一种英语发音测试与评价系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8320708B2 (en) * | 2004-04-02 | 2012-11-27 | K-Nfb Reading Technology, Inc. | Tilt adjustment for optical character recognition in portable reading machine |
-
2020
- 2020-05-26 CN CN202010454848.7A patent/CN111639635B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101114943A (zh) * | 2007-09-14 | 2008-01-30 | 中兴通讯股份有限公司 | 一种对网管数据上载比较结果进行优化展现的方法 |
CN102622593A (zh) * | 2012-02-10 | 2012-08-01 | 北方工业大学 | 一种文本识别方法及系统 |
CN107742446A (zh) * | 2013-01-25 | 2018-02-27 | 陈旭 | 图书阅读器 |
CN104835361A (zh) * | 2014-02-10 | 2015-08-12 | 陈旭 | 一种电子词典 |
CN205581907U (zh) * | 2016-01-26 | 2016-09-14 | 北京纽思曼教育科技有限公司 | 一种扫描翻译笔 |
CN107766809A (zh) * | 2017-10-09 | 2018-03-06 | 平安科技(深圳)有限公司 | 电子装置、票据信息识别方法和计算机可读存储介质 |
CN109272992A (zh) * | 2018-11-27 | 2019-01-25 | 北京粉笔未来科技有限公司 | 一种口语测评方法、装置及一种生成口语测评模型的装置 |
CN109919147A (zh) * | 2019-03-04 | 2019-06-21 | 上海宝尊电子商务有限公司 | 服装吊牌图像中文本识别的方法 |
CN110379221A (zh) * | 2019-08-09 | 2019-10-25 | 陕西学前师范学院 | 一种英语发音测试与评价系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111639635A (zh) | 2020-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109960809B (zh) | 一种听写内容的生成方法及电子设备 | |
CN109637286A (zh) | 一种基于图像识别的口语训练方法及家教设备 | |
CN105205479A (zh) | 人脸颜值评估方法、装置及终端设备 | |
US10824890B2 (en) | Living body detecting method and apparatus, device and storage medium | |
KR101795556B1 (ko) | 얼굴 인식과 얼굴 모션 패턴 인식을 통한 개인 인증 방법 및 장치 | |
CN109478227A (zh) | 计算设备上的虹膜或其他身体部位识别 | |
KR20150008621A (ko) | 콘텐츠 디스플레이 장치 및 방법 | |
CN112101123B (zh) | 一种注意力检测方法及装置 | |
JP2007122400A (ja) | 認証装置、プログラムおよび記録媒体 | |
CN103902029A (zh) | 一种移动终端及其解锁方法 | |
US11216648B2 (en) | Method and device for facial image recognition | |
KR20130109777A (ko) | 얼굴 인식 기반의 근태 관리를 위한 장치 및 방법 | |
US11893098B2 (en) | Authenticating a user subvocalizing a displayed text | |
CN114241604A (zh) | 姿态检测的方法、装置、电子设备和存储介质 | |
CN111639635B (zh) | 一种拍摄图片的处理方法及装置、电子设备、存储介质 | |
CN105427228A (zh) | 照片水印处理方法及装置 | |
KR102482841B1 (ko) | 인공지능 미러링 놀이 가방 | |
CN110971924B (zh) | 一种直播过程中美颜的方法、设备、存储介质及系统 | |
JP4883530B2 (ja) | 画像認識による機器制御方法それを用いたコンテンツ作成方法および装置 | |
CN111553356B (zh) | 字符识别方法及装置、学习设备、计算机可读存储介质 | |
CN111639567B (zh) | 一种三维模型的互动显示方法、电子设备及存储介质 | |
CN111563514B (zh) | 一种三维字符的显示方法及装置、电子设备、存储介质 | |
CN111639227B (zh) | 一种虚拟角色的口语控制方法、电子设备及存储介质 | |
CN107241548A (zh) | 一种光标控制方法、装置、终端及存储介质 | |
CN111638781B (zh) | 基于ar的发音引导方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |