CN117953499A - 辅助阅读方法、电子设备及计算机可读存储介质 - Google Patents
辅助阅读方法、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN117953499A CN117953499A CN202211296009.2A CN202211296009A CN117953499A CN 117953499 A CN117953499 A CN 117953499A CN 202211296009 A CN202211296009 A CN 202211296009A CN 117953499 A CN117953499 A CN 117953499A
- Authority
- CN
- China
- Prior art keywords
- text
- camera
- image
- electronic device
- content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 238000003708 edge detection Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 12
- 208000033748 Device issues Diseases 0.000 claims description 9
- 230000000903 blocking effect Effects 0.000 claims description 6
- 238000004891 communication Methods 0.000 abstract description 35
- 230000006854 communication Effects 0.000 abstract description 35
- 230000006870 function Effects 0.000 description 35
- 238000010586 diagram Methods 0.000 description 29
- 239000010410 layer Substances 0.000 description 20
- 238000001514 detection method Methods 0.000 description 18
- 230000033001 locomotion Effects 0.000 description 17
- 238000007726 management method Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 13
- 230000005236 sound signal Effects 0.000 description 13
- 238000010295 mobile communication Methods 0.000 description 12
- 210000000988 bone and bone Anatomy 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 8
- 239000003814 drug Substances 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 230000001771 impaired effect Effects 0.000 description 6
- 230000006735 deficit Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 230000001133 acceleration Effects 0.000 description 3
- 239000008186 active pharmaceutical agent Substances 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 229920001621 AMOLED Polymers 0.000 description 2
- 230000003416 augmentation Effects 0.000 description 2
- 230000036772 blood pressure Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 239000012792 core layer Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000002138 osteoinductive effect Effects 0.000 description 1
- 230000010349 pulsation Effects 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003238 somatosensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B3/00—Audible signalling systems; Audible personal calling systems
- G08B3/10—Audible signalling systems; Audible personal calling systems using electric transmission; using electromagnetic transmission
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Electromagnetism (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Studio Devices (AREA)
Abstract
本申请涉及通信计算机技术领域,提供一种辅助阅读方法、电子设备及计算机可读存储介质,该方法包括:电子设备使用摄像头对文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上;当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本;电子设备使用摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上;当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。本申请避免辅助阅读失败,提高了辅助阅读效率,提高了用户体验。
Description
技术领域
本申请涉及通信计算机技术领域,尤其涉及一种辅助阅读方法、电子设备及计算机可读存储介质。
背景技术
视障人群在日常生活中,由于视力原因,难以正常读取纸质书籍、合同,药品说明等文本中的内容,如何辅助视障人群获取文本中的内容成为值得研究的技术问题。
目前辅助视障人群获取文本中的内容的方法,主要是:基于电子设备的摄像头对需要读取的纸质书籍、合同,药品说明等文本的内容进行图像采集,并基于电子设备语音输出对应图像中文本的内容。
但是,在辅助视障人群获取文本内容的过程中,易出现只采集到纸质书籍、合同、药品说明中等文本相应部分内容的情况,致使辅助阅读失败。
前面的叙述在于提供一般的背景信息,并不一定构成现有技术。
发明内容
本申请提供一种辅助阅读方法、电子设备及计算机可读存储介质,目的在于避免辅助阅读失败,提高辅助阅读效率,并提高用户体验。
第一方面,本申请提供了一种辅助阅读方法,该方法包括:电子设备使用摄像头对文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上;当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本;电子设备使用摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上;当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。这样,在需要辅助阅读而电子设备未完整摄取文本的全部内容时,所述电子设备发出语音提示,所述语音提示指示移动所述电子设备和/或者移动所述文本,在移动所述电子设备和/或者移动所述文本后,电子设备继续使用摄像头对所述文本进行图像采集,得到第二图像,并将所述二图像显示到屏幕上;进而实现当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读,即通过语音提示后,使得电子设备能够朗读文本的全部内容,进而避免辅助阅读失败,造成辅助阅读效率低下的技术问题。
在一种可能的实现方式中,所述电子设备使用摄像头对文本进行图像采集的步骤,包括:
在电子设备处于辅助模式下时,电子设备使用摄像头对文本进行图像采集。
在另一种可能的实现方式中,若检测到辅助模式的触发条件时,确定所述电子设备处于辅助模式下。
在另一种可能的实现方式中,所述在电子设备处于辅助模式下时,电子设备使用摄像头对文本进行图像采集的步骤,包括:
在电子设备处于辅助模式下时,若检测到使用摄像头对文本进行图像采集的触发条件,电子设备使用摄像头对文本进行图像采集;
其中,所述使用摄像头对文本进行图像采集的触发条件区别于摄像头摄像的触发条件。
在另一种可能的实现方式中,所述摄像头至少包括第一摄像头和第二摄像头,所述第一摄像头的视场角大于所述第二摄像头;
所述电子设备使用摄像头对文本进行图像采集的步骤,包括:
电子设备使用第一摄像头和/或者第二摄像头对文本进行图像采集。
在另一种可能的实现方式中,所述电子设备使用第一摄像头和/或者第二摄像头对文本进行图像采集的步骤,包括:
电子设备同时使用或者先后使用第一摄像头和第二摄像头分别对文本进行图像采集;
所述当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示的步骤之前,包括:
所述电子设备在未成功识别出所述第一摄像头或者所述第二摄像头所采集图像中文本的内容时,所述电子设备基于所述第一摄像头所采集图像和所述第二摄像头所采集图像确定所述第一图像是否仅包括所述文本的部分内容。
在另一种可能的实现方式中,所述电子设备在未成功识别出所述第一摄像头或者所述第二摄像头所采集图像中文本的内容时,所述电子设备基于所述第一摄像头所采集图像和所述第二摄像头所采集图像确定所述第一图像是否仅包括所述文本的部分内容的步骤之前,包括:
所述电子设备对所述第一摄像头或者所述第二摄像头所采集图像进行识别,若确定所述第一摄像头或者所述第二摄像头所采集图像中包括所述文本的内容,则对所述所采集图像的文本进行边缘检测;
若确定所述所采集图像的文本的边缘不在对应摄像头的预览流区域内,则所述电子设备确定未成功识别出所述所采集图像中文本的内容。
在另一种可能的实现方式中,所述电子设备基于所述第一摄像头所采集图像和所述第二摄像头所采集图像确定所述第一图像是否仅包括所述文本的部分内容的步骤,包括:
所述电子设备对所述第一摄像头所采集图像进行是否包括所述文本的内容进行检测,在检测到所述第一摄像头所采集图像中包括所述文本的内容时,所述电子设备对所述第二摄像头所采集图像中的所述文本进行边缘检测;
若所述第二摄像头所采集图像中所述文本的边缘不在所述第二摄像头的预览流区域内,则所述电子设备确定所述第一摄像头所采集图像中所述文本的边缘是否在第一摄像头的预览流区域内;
所述电子设备若确定所述第一摄像头所采集图像中所述文本的边缘不在第一摄像头的预览流区域内,则确定所述第一图像仅包括所述文本的部分内容。
在另一种可能的实现方式中,若所述第二摄像头所采集图像中所述文本的边缘不在所述第二摄像头的预览流区域内,则所述电子设备确定所述第一摄像头所采集图像中所述文本的边缘是否在第一摄像头的预览流区域内的步骤之后,包括:
所述电子设备若确定所述第一摄像头所采集图像中所述文本的边缘在第一摄像头的预览流区域内,则确定所述第二摄像头所采集图像中文本的清晰度是否大于清晰度阈值;
若不大于清晰度阈值,则所述电子设备确定所述第一图像仅包括所述文本的部分内容。
在另一种可能的实现方式中,所述当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本的步骤,包括:
当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本,所述语音提示还指示所述电子设备的第一移动方向和第一目标距离,或者所述语音提示还指示移动所述文本的第二移动方向和第二目标距离,所述第一移动方向、第一目标距离、第二移动方向和第二目标距离均与位置关系关联,所述位置关系为文本的边缘和对应摄像头预览流区域的边缘之间的位置关系。
在另一种可能的实现方式中,所述当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读的步骤之后,所述方法还包括:
所述电子设备发出语音指示,所述语音指示提示无需再对所述文本进行图像采集。
在另一种可能的实现方式中,所述当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本的步骤,包括:
当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示平移、旋转或者转动所述电子设备,或者所述语音提示还指示所述电子设备靠近或者远离所述文本;
和/或者当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示平移、旋转或者转动所述文本,或者所述语音提示还指示所述文本靠近或者远离所述电子设备。
在另一种可能的实现方式中,所述当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,所述语音提示指示移动所述电子设备和/或者移动所述文本的步骤,包括:
当所述第一图像仅包括所述文本的部分内容,且所述第一图像中所述文本的另一部分内容被遮挡时,所述电子设备发出语音提示,所述语音提示指示移动所述电子设备和/或者移动所述文本,所述语音提示还指示去除遮挡所述文本的遮挡物。
第二方面,本申请提供了一种辅助阅读装置,包括:第一显示模块、提示模块,第二显示模块以及朗读模块;
电子设备中的第一显示模块,用于使用摄像头对文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上;
电子设备中的提示模块,用于当所述第一图像仅包括所述文本的部分内容时,发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本;
电子设备中的第二显示模块,用于使用摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上;
电子设备中的朗读模块,用于当所述第二图像包括所述文本的全部内容时,对所述文本的全部内容进行朗读。
第三方面,本申请提供了一种电子设备,包括:
一个或多个处理器;存储器;以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述电子设备执行时,使得所述电子设备执行如上述第一方面或第一/方面的可能的实现方式中任一项所述的辅助阅读方法。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质中存储了计算机程序,当所述计算机程序被处理器执行时,使得处理器执行如上述第一方面或第一方面的可能的实现方式中任一项所述的辅助阅读方法。
第五方面,本申请提供了一种芯片,所述芯片包括处理器与数据接口,所述处理器通过所述数据接口读取存储器上存储的指令,执行第一方面或第一方面的可能的实现方式中任一项所述的辅助阅读方法。
可选的,作为一种可能的实现方式,所述芯片还可以包括存储器,所述存储器中存储有指令,所述处理器用于执行所述存储器上存储的指令,当所述指令被执行时,所述处理器用于执行第一方面或第一方面的可能的实现方式中任一项所述的辅助阅读方法。
附图说明
图1为现有技术中辅助阅读时的一个示意性场景图;
图2为本申请实施例提供的电子设备的一种结构示意图;
图3为本申请实施例提供的电子设备的一种软件结构框图;
图4为本申请一个实施例提供的辅助阅读方法的流程图;
图5为本申请一个实施例提供的辅助阅读方法的模块交互图;
图6为本申请另一个实施例提供的辅助阅读方法的流程图;
图7为本申请又一个实施例提供的辅助阅读方法的流程图;
图8为本申请再一个实施例提供的辅助阅读方法的流程图;
图9为本申请提供的一种辅助阅读装置的结构示意图;
图10为本申请另一个实施例提供的辅助阅读方法的模块交互图;
图11为本申请中电子设备中文本的各边缘与摄像头预览流区域对应边缘之间的目标距离的示意图一;
图12为本申请中电子设备基于文本的各边缘与摄像头预览流区域对应边缘之间的目标距离进行移动的示意图一;
图13为本申请中电子设备基于文本的各边缘与摄像头预览流区域对应边缘之间的目标距离进行移动的示意图二;
图14为本申请中电子设备基于文本的各边缘与摄像头预览流区域对应边缘之间的目标距离进行移动的示意图三;
图15为本申请中电子设备基于文本的各边缘与摄像头预览流区域对应边缘之间的目标距离进行移动的示意图四;
图16为本申请中电子设备基于文本的各边缘与摄像头预览流区域对应边缘之间的目标距离进行移动的示意图五;
图17为本申请中电子设备基于文本的各边缘与摄像头预览流区域对应边缘之间的目标距离进行移动的示意图六;
图18为本申请中电子设备基于文本的各边缘与摄像头预览流区域对应边缘之间的目标距离进行移动的示意图七;
图19为本申请中电子设备基于文本的各边缘与摄像头预览流区域对应边缘之间的目标距离进行移动的示意图九;
图20为本申请中电子设备提示前和提示后的效果示意图一;
图21为本申请中电子设备的第一摄像头采集文本图像的第一场景示意图;
图22为本申请中电子设备的第二摄像头采集文本图像的第二场景示意图;
图23为本申请中电子设备的第一摄像头结合第二摄像头采集文本图像的第三场景示意图;
图24为本申请中电子设备辅助识别药品说明的第一场景示意图;
图25为本申请中电子设备辅助识别平面非正向文本的第二场景示意图;
图26为本申请中电子设备采集被遮挡文本图像的第一示意图;
图27为本申请再一个实施例提供的辅助阅读方法的流程图;
图28为本申请再一个实施例提供的辅助阅读方法的模块交互图;
图29为本申请再一个实施例提供的第二摄像头结合第二摄像头采集文本图像的第一场景示意图;
图30为本申请电子设备进入辅助阅读模式的第一界面示意图;
图31为本申请电子设备进入辅助阅读模式的第二界面示意图。
具体实施方式
本申请说明书和权利要求书及附图说明中的术语“第一”、“第二”和“第三”等是用于区别不同文本,而不是用于限定特定顺序。
在本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
为了下述各实施例的描述清楚简洁,首先给出一种辅助阅读的实现方案的简要介绍:
目前,手机、平板电脑等电子设备成为视力障碍人群生活中不可缺少的一部分,在视力障碍人群使用电子设备时,电子设备使用摄像头对文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上;此时,容易出现第一图像仅包括所述文本的部分内容,当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本;电子设备使用摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上;当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。或者用户可以先打开电子设备专门针对视力障碍人群的辅助模式,或者在视力障碍人群使用电子设备时,启动辅助视力障碍的相关应用程序APP,如相机、读屏软件、助视器,助读等应用程序APP,基于此,电子设备使用摄像头对文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上;当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本;电子设备使用摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上;当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。
图1为现有技术中辅助阅读时,电子设备使用摄像头采集的第一图像仅包括文本的部分内容,致使辅助失败的一个示意性场景图。现有技术中,如图1所示,若电子设备需要辅助阅读相应的书籍页面中文本的内容,电子设备使用摄像头对书籍页面中文本进行图像采集(拍摄),并基于OCR等技术手段,提取出所采集图像文本的内容,但是在用户是视障人士时,并不能确定是否可以获取文本的全部内容(如图1中左图摄像头只是采集书籍页面左上角的内容,右图中只采集药品说明的一部分内容),这导致电子设备只能获取文本的部分内容,将文本的部分内容发送给电子设备内的语音TTS模块,语音TTS模块输出的是文本的部分内容而不是全部内容,致使用户不能准确获取到需要获取的内容。
基于上述技术方案中存在的问题,本申请提供了一种辅助阅读方法,可以在辅助视障人群阅读或者获取文本相应内容的过程中,提示用户移动所述电子设备和/或者移动所述文本,直至电子设备获取文本的全部内容并朗读,提升辅助效率,并提高用户体验。所提供的辅助阅读方法,可以适用于手机、平板电脑、桌面型、膝上型、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、手持计算机、上网本、个人数字助理(Personal Digital Assistant,PDA)、可穿戴电子设备、智能手表等电子设备。其中,适用该辅助阅读方法的电子设备,其结构可以如图2所示。
如图2所示,图2为本申请提供的一种电子设备的组成示例图,电子设备200可以包括处理器210,外部存储器接口220,内部存储器221,通用串行总线(universal serialbus,USB)接口230,充电管理模块240,电源管理模块241,电池242,天线1,天线2,移动通信模块250,无线通信模块260,音频模块270,扬声器270A,受话器270B,麦克风270C,耳机接口270D,传感器模块280,按键290,马达291,指示器292,摄像头293,显示屏294,以及用户标识模块(subscriber identification module,SIM)卡接口295等。其中传感器模块280可以包括压力传感器280A,陀螺仪传感器280B,气压传感器280C,磁传感器280D,加速度传感器280E,距离传感器280F,接近光传感器280G,指纹传感器280H,温度传感器280J,触摸传感器280K,环境光传感器280L,骨传导传感器280M等。
可以理解的是,本实施例示意的结构并不构成对该电子设备200的具体限定。在另一些实施例中,该电子设备200可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器210可以包括一个或多个处理单元,例如:处理器210可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
其中,控制器可以是电子设备200的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器210中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器210中的存储器为高速缓冲存储器。该存储器可以保存处理器210刚用过或循环使用的指令或数据。如果处理器210需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器210的等待时间,因而提高了系统的效率。
在一些实施例中,处理器210可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器210可以包含多组I2C总线。处理器210可以通过不同的I2C总线接口分别耦合触摸传感器280K,充电器,闪光灯,摄像头293等。例如:处理器210可以通过I2C接口耦合触摸传感器280K,使处理器210与触摸传感器280K通过I2C总线接口通信,实现电子设备200的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器210可以包含多组I2S总线。处理器210可以通过I2S总线与音频模块270耦合,实现处理器210与音频模块270之间的通信。在一些实施例中,音频模块270可以通过I2S接口向无线通信模块260传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块270与无线通信模块260可以通过PCM总线接口耦合。在一些实施例中,音频模块270也可以通过PCM接口向无线通信模块260传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器210与无线通信模块260。例如:处理器210通过UART接口与无线通信模块260中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块270可以通过UART接口向无线通信模块260传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器210与显示屏294,摄像头293等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器210和摄像头293通过CSI接口通信,实现电子设备200的拍摄功能。处理器210和显示屏294通过DSI接口通信,实现电子设备200的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器210与摄像头293,显示屏294,无线通信模块260,音频模块270,传感器模块280等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
USB接口230是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USBTypeC接口等。USB接口230可以用于连接充电器为电子设备200充电,也可以用于电子设备200与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他电子设备,例如AR设备等。
可以理解的是,本实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备200的结构限定。在本申请另一些实施例中,电子设备200也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块240用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块240可以通过USB接口230接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块240可以通过电子设备200的无线充电线圈接收无线充电输入。充电管理模块240为电池242充电的同时,还可以通过电源管理模块241为电子设备200供电。
电源管理模块241用于连接电池242,充电管理模块240与处理器210。电源管理模块241接收电池242和/或充电管理模块240的输入,为处理器210,内部存储器221,显示屏294,摄像头293,和无线通信模块260等供电。电源管理模块241还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块241也可以设置于处理器210中。在另一些实施例中,电源管理模块241和充电管理模块240也可以设置于同一个器件中。
电子设备200的无线通信功能可以通过天线1,天线2,移动通信模块250,无线通信模块260,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备200中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块250可以提供应用在电子设备200上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块250可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块250可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块250还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块250的至少部分功能模块可以被设置于处理器210中。在一些实施例中,移动通信模块250的至少部分功能模块可以与处理器210的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器270A,受话器270B等)输出声音信号,或通过显示屏294显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器210,与移动通信模块250或其他功能模块设置在同一个器件中。
无线通信模块260可以提供应用在电子设备200上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块260可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块260经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器210。无线通信模块260还可以从处理器210接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,电子设备200的天线1和移动通信模块250耦合,天线2和无线通信模块260耦合,使得电子设备200可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
电子设备200通过GPU,显示屏294,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏294和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器210可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏294用于显示图像,视频等。显示屏294包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oled,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备200可以包括1个或N个显示屏294,N为大于1的正整数。
电子设备200的显示屏294上可以显示一系列图形用户界面(graphical userinterface,GUI),这些GUI都是该电子设备200的主屏幕。一般来说,电子设备200的显示屏294的尺寸是固定的,只能在该电子设备200的显示屏294中显示有限的控件。控件是一种GUI元素,它是一种软件组件,包含在应用程序中,控制着该应用程序处理的所有数据以及关于这些数据的交互操作,用户可以通过直接操作(direct manipulation)来与控件交互,从而对应用程序的有关信息进行读取或者编辑。一般而言,控件可以包括图标、按钮、菜单、选项卡、文本框、对话框、状态栏、导航栏、Widget等可视的界面元素。例如,在本申请实施例中,显示屏291可以显示虚拟按键(一键编排、开始编排、场景编排)。
电子设备200可以通过ISP,摄像头293,视频编解码器,GPU,显示屏294以及应用处理器等实现拍摄功能。
ISP用于处理摄像头293反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头293中。
摄像头293用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,电子设备200可以包括1个或N个摄像头293,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当电子设备200在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。电子设备200可以支持一种或多种视频编解码器。这样,电子设备200可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现电子设备200的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口220可以用于连接外部存储卡,例如MicroSD卡,实现扩展电子设备200的存储能力。外部存储卡通过外部存储器接口220与处理器210通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器221可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器210通过运行存储在内部存储器221的指令,从而执行电子设备200的各种功能应用以及数据处理。例如,在本实施例中,处理器210可以通过执行存储在内部存储器221中的指令,进行场景编排。内部存储器221可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储电子设备200使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器221可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。处理器210通过运行存储在内部存储器221的指令,和/或存储在设置于处理器中的存储器的指令,执行电子设备200的各种功能应用以及数据处理。
电子设备200可以通过音频模块270,扬声器270A,受话器270B,麦克风270C,耳机接口270D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块270用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块270还可以用于对音频信号编码和解码。在一些实施例中,音频模块270可以设置于处理器210中,或将音频模块270的部分功能模块设置于处理器210中。
扬声器270A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备200可以通过扬声器270A收听音乐,或收听免提通话。
受话器270B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备200接听电话或语音信息时,可以通过将受话器270B靠近人耳接听语音。
麦克风270C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风270C发声,将声音信号输入到麦克风270C。电子设备200可以设置至少一个麦克风270C。在另一些实施例中,电子设备200可以设置两个麦克风270C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备200还可以设置三个,四个或更多麦克风270C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口270D用于连接有线耳机。耳机接口270D可以是USB接口230,也可以是3.5mm的开放移动电子设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
压力传感器280A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器280A可以设置于显示屏294。压力传感器280A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器280A,电极之间的电容改变。电子设备200根据电容的变化确定压力的强度。当有触摸操作作用于显示屏294,电子设备200根据压力传感器280A检测所述触摸操作强度。电子设备200也可以根据压力传感器280A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器280B可以用于确定电子设备200的运动姿态。在一些实施例中,可以通过陀螺仪传感器280B确定电子设备200围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器280B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器280B检测电子设备200抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消电子设备200的抖动,实现防抖。陀螺仪传感器280B还可以用于导航,体感游戏场景。
气压传感器280C用于测量气压。在一些实施例中,电子设备200通过气压传感器280C测得的气压值计算海拔高度,辅助定位和导航。
磁传感器280D包括霍尔传感器。电子设备200可以利用磁传感器280D检测翻盖皮套的开合。在一些实施例中,当电子设备200是翻盖机时,电子设备200可以根据磁传感器280D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。
加速度传感器280E可检测电子设备200在各个方向上(一般为三轴)加速度的大小。当电子设备200静止时可检测出重力的大小及方向。还可以用于识别电子设备200姿态,应用于横竖屏切换,计步器等应用。
距离传感器280F,用于测量距离。电子设备200可以通过红外或激光测量距离。在一些实施例中,拍摄场景,电子设备200可以利用距离传感器280F测距以实现快速对焦。
接近光传感器280G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。电子设备200通过发光二极管向外发射红外光。电子设备200使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定电子设备200附近有物体。当检测到不充分的反射光时,电子设备200可以确定电子设备200附近没有物体。电子设备200可以利用接近光传感器280G检测用户手持电子设备200贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器280G也可用于皮套模式,口袋模式自动解锁与锁屏。
环境光传感器280L用于感知环境光亮度。电子设备200可以根据感知的环境光亮度自适应调节显示屏294亮度。环境光传感器280L也可用于拍照时自动调节白平衡。环境光传感器280L还可以与接近光传感器280G配合,检测电子设备200是否在口袋里,以防误触。
指纹传感器280H用于采集指纹。电子设备200可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
温度传感器280J用于检测温度。在一些实施例中,电子设备200利用温度传感器280J检测的温度,执行温度处理策略。例如,当温度传感器280J上报的温度超过阈值,电子设备200执行降低位于温度传感器280J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,电子设备200对电池242加热,以避免低温导致电子设备200异常关机。在其他一些实施例中,当温度低于又一阈值时,电子设备200对电池242的输出电压执行升压,以避免低温导致的异常关机。
触摸传感器280K,也称“触控器件”。触摸传感器280K可以设置于显示屏294,由触摸传感器280K与显示屏294组成触摸屏,也称“触控屏”。触摸传感器280K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏294提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器280K也可以设置于电子设备200的表面,与显示屏294所处的位置不同。
骨传导传感器280M可以获取振动信号。在一些实施例中,骨传导传感器280M可以获取人体声部振动骨块的振动信号。骨传导传感器280M也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器280M也可以设置于耳机中,结合成骨传导耳机。
音频模块270可以基于所述骨传导传感器280M获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。应用处理器可以基于所述骨传导传感器280M获取的血压跳动信号解析心率信息,实现心率检测功能。
按键290包括开机键,音量键等。按键290可以是机械按键。也可以是触摸式按键。电子设备200可以接收按键输入,产生与电子设备200的用户设置以及功能控制有关的键信号输入。
马达291可以产生振动提示。马达291可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏294不同区域的触摸操作,马达291也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器292可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口295用于连接SIM卡。SIM卡可以通过插入SIM卡接口295,或从SIM卡接口295拔出,实现和电子设备200的接触和分离。电子设备200可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口295可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口295可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口295也可以兼容不同类型的SIM卡。SIM卡接口295也可以兼容外部存储卡。电子设备200通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,电子设备200采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在电子设备200中,不能和电子设备200分离。
另外,在上述部件之上,运行有操作系统。例如鸿蒙系统,iOS操作系统,Android开源操作系统,Windows操作系统等。在该操作系统上可以安装运行应用程序。
图3为本申请实施例提供的电子设备的一种软件结构框图。
分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在本申请的一些实施例中,电子设备的软件架构至少包括五层,从上至下分别为应用程序层,应用程序框架层,算法引擎层、系统库层以及内核层。
应用程序层可以包括一系列应用程序包。这些应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。在本申请实施例中,应用程序层中包含相机APP,该相机APP可以启动不同的摄像头,如启动广角摄像头,主摄摄像头,前置摄像头,后置摄像头等,在启动不同的摄像头时,相机具有不同的预览流区域,如广角预览流区域,主摄预览流区域。
可理解的,应用程序层包括的应用并不构成对电子设备200的具体限定。在本申请另一些实施例中,相较于图3所示应用程序层包含的应用,电子设备200可包括更多或更少的应用,不同的电子设备200可以包括相同的应用,也可包括完全不同的应用。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。如图3所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。例如,在本申请的一些实施例中,应用程序框架层还可以包括语音TTS模块。其中,语音TTS模块用于发出语音提示,所述语音TTS模块还用于对所述文本的内容进行朗读。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
活动管理器(Activity Manager),可以用于管理应用程序的周期,并提供常用的导航回退功能。
算法引擎层,算法引擎层为应用程序提供一些算法接口和框架,算法接口包括预先定义的函数和正则表达式等。如图3所示,算法引擎层包括文本检测模块、边缘检测模块、距离计算模块等,其中,文本检测模块用于实现文本内容的检测,具体地,在电子设备实现对摄像头所采集的图像进行文本检测,如检测到文本或者未检测到文本,边缘检测模块,用于实现边缘检测,具体地,在文本检测模块检测到文本后,边缘检测模块,用于确定文本的边缘是否完整(是否完整呈现在电子设备的预览流区域内,或者确定文本的边缘是否均在对应摄像头的预览流区域内),距离计算模块,用于实现计算边缘检测模块检测到的文本的边缘和摄像机预览流区域的边缘之间的位置关系如距离关系(目标距离)。
系统库层,系统库可以包括多个功能模块。例如:媒体库,图形处理库(例如:OpenGL ES),安卓运行时等。
媒体库用于实现不同流媒体的输入;示例性的,媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。在一些实施例中,媒体库包括Med iaLibrary(媒体信息库)和Med iaProvider(媒体数据库),Med iaLibrary为图库的Photo数据接口的数据查询API提供查询数据库筛选符合要求的数据的功能;Med iaProvider为图库的Photo数据接口的数据更新API提供发起媒体扫描,更新数据库的功能。
图形处理库用于实现图形绘图,图像渲染,合成和图层处理等;
Android Runt ime(安卓运行时)包括核心库和虚拟机。安卓运行时负责安卓系统的跳读和管理。核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。其中,该硬件可以包括摄像头、显示屏,麦克风,处理器,以及存储器等器件。
需要说明的是,本申请实施例虽然以Android系统为例进行说明,但是其基本原理同样适用于基于鸿蒙、iOS、Windows等操作系统的电子设备。
为了便于理解,本申请以下实施例将以具有图2和图3所示结构的电子设备200为例,结合附图和应用场景,对本申请实施例提供的辅助阅读方法进行具体阐述。
图4为本申请一个实施例提供的辅助阅读方法的流程图,图5为本申请一个实施例提供的辅助阅读方法的模块交互图。
如图4和图5所示,该辅助阅读方法应用于电子设备,上述辅助阅读方法可以包括:
步骤S401,电子设备使用摄像头对文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上;
步骤S402,当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本;
步骤S403,电子设备使用摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上;
步骤S404,当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。
作为一种示例,电子设备要辅助阅读的文本可以是图文,图片,文档,识别码等内容,具体不做限定。
作为一种示例,识别码可以是二维码,条形码、异形码、小程序码、QR code以及一维码等。
作为一种示例,文档可以是exce l,word,ppt,记事本,名片等内容,具体不做限定。
作为一种示例,文档还可以是纸质文档、彩页、名片、幻灯片、试卷、发票,卡证等。
作为一种示例,卡证可以是身份证,银行卡,驾驶证等。
本实施例中,电子设备使用摄像头对书籍,合同,药品说明,图文,图片,文档,识别码等文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上,之后,电子设备基于电子设备内的文本检测模块,对第一图像进行文本检测,若检测到文本,则基于电子设备的边缘检测模块,确定文本的边缘是否在摄像头的预览流区域内,若不在(图21),则基于电子设备的距离计算模块,确定文本的边缘与预览流区域对应边缘之间的目标距离(各文本的边缘与所述摄像头预览流区域对应边缘之间的距离为目标距离),并确定目标距离和对应预设距离之间的位置关系,以基于位置关系确定用户移动所述电子设备的第一移动方向,和/或者确定所述用户移动所述文本的第二移动方向,在确定第一移动方向和第二移动方向后,基于者语音TTS模块,进行提示,其中,若检测到语音输出触发条件,则基于语音TTS模块进行语音提示。
作为一种示例,若基于语音TTS模块,进行提示,则需要距离计算模块将相应的提示内容发送给语音TTS模块,以供语音TTS模块输出。
作为一种示例,在电子设备发出语音提示后(所述语音提示指示移动所述电子设备和/或者移动所述文本),用户基于语音提示移动所述电子设备和/或者移动所述文本,电子设备在用户移动所述电子设备和/或者移动所述文本的过程中,还使用相应的采集规则如使用相应的采集频率,使用摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上,当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。
作为一种示例,电子设备只有在采集到的第二图像包括所述文本的全部内容时,才会停止采集。
作为一种示例,电子设备将获取到的文本的全部内容发送给语音TTS模块,以供语音TTS模块输出文本的全部内容。
具体步骤如下;
步骤S401,电子设备使用摄像头对文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上;
作为一种示例,摄像头可以为1个,2个,或者多个,该多个摄像头的类型可以相同,也可以不同。
作为一种示例,电子设备可以使用多个摄像头对文本进行图像采集,得到多个第一图像后,只将一个第一图像显示到屏幕上。
作为一种示例,电子设备使用多个摄像头对文本进行图像采集时,其中一个摄像头为广角摄像头。
作为一种示例,电子设备先后或者同时启动多个摄像头对文本进行图像采集,得到第一图像。
作为一种示例,电子设备先使用广角摄像头对文本进行图像采集,然后使用主摄摄像头对文本进行图像采集;
作为一种示例,电子设备先使用广角摄像头对文本进行图像采集,若得到的第一图像中仅包括文本的部分内容,此时,才使用主摄摄像头对文本进行图像采集后得到的图像,进行包括文本的全部内容或者包括文本的部分内容的确定。
作为一种示例,电子设备先使用广角摄像头对文本进行图像采集,若不能识别得到第一图像中文本的内容,才使用主摄摄像头对文本进行图像采集后得到的图像,进行包括文本的全部内容或者包括文本的部分内容的确定。
作为一种示例,电子设备先使用广角摄像头对文本进行图像采集,若第一图像中文本的内容的清晰度小于清晰度阈值,才使用主摄摄像头对文本进行图像采集后得到的图像,进行包括文本的全部内容或者包括文本的部分内容的确定;
作为一种示例,电子设备先使用主摄摄像头对文本进行图像采集,若得到的第一图像中仅包括文本的部分内容,此时,才使用主摄摄像头对文本进行图像采集后得到的图像,进行包括文本的全部内容或者包括文本的部分内容的确定。
作为一种示例,电子设备先使用主摄摄像头对文本进行图像采集,若得到的第一图像中仅包括文本的部分内容,此时,使用主摄摄像头和广角摄像头同时对文本进行图像采集后得到的图像,进行包括文本的全部内容或者包括文本的部分内容的确定。
作为一种示例,电子设备先使用广角摄像头对文本进行图像采集,若得到的第一图像中仅包括文本的部分内容,此时,使用主摄摄像头和广角摄像头同时对文本进行图像采集后得到的图像,进行包括文本的全部内容或者包括文本的部分内容的确定。
作为一种示例,电子设备同时使用广角摄像头和主摄摄像头对文本进行图像采集,若基于广角摄像头得到的第一图像中仅包括文本的部分内容,此时,使用主摄摄像头和广角摄像头同时对文本进行图像采集后得到的图像,进行包括文本的全部内容或者包括文本的部分内容的确定。
作为一种示例,电子设备同时使用广角摄像头和主摄摄像头对文本进行图像采集,若基于主摄摄像头得到的第一图像中仅包括文本的部分内容,此时,使用主摄摄像头和广角摄像头同时对文本进行图像采集后得到的图像,进行包括文本的全部内容或者包括文本的部分内容的确定。
作为一种示例,所述电子设备使用摄像头对文本进行图像采集的步骤,包括以下步骤A1:
步骤A1,在电子设备处于辅助模式下时,电子设备使用摄像头对文本进行图像采集。
作为一种示例,辅助模式具体包含辅助阅读模式,无障碍模式、视障模式,屏幕朗读(模式)等等;
作为一种示例,辅助模式或者屏幕朗读(模式)可以通过模式(功能)按钮开启或者关闭,具体地,电子设备内直接设置模式功能按钮,直接通过点击该功能按钮,进入辅助模式;
作为一种示例,图30为进入辅助模式的界面示意图,具体地,用户通过点击电子设备主界面上的设置图标,使得电子设备显示图30(a)界面,用户在图30(a)界面查找得到辅助功能图标,并点击该辅助功能图标,使得电子设备显示图30(b)界面,用户在图30(b)界面查找得到无障碍图标,并点击该无障碍图标,使得电子设备显示图30(c)界面,用户在图30(c)界面查找得到屏幕朗读图标,并点击该屏幕朗读图标,此时,电子设备处于屏幕朗读(模式,图30(d))。
作为一种示例,图31为通过摄像头功能按钮进入辅助模式的界面示意图,具体地,用户通过点击电子设备主界面上的相机图标,进入采集或者拍摄界面,并在采集或者拍摄界面点击相应辅助模式或者阅读辅助模式按钮即可。
作为一种示例,电子设备还可以通过点击预先设置的辅助应用,进入辅助模式,例如,预先设置的辅助应用可以是屏幕朗读(应用名称),通过点击该辅助应用屏幕朗读进入辅助模式。
作为一种示例,辅助模式还可以是通过点击快捷键触发进入。
作为一种示例,辅助模式还可以定时自动开启。
作为一种示例,电子设备在得到第一图像后,对第一图像进行识别。
电子设备对第一图像进行识别的过程可以是:
所述电子设备确定所述第一图像中是否包括所述文本的内容,若不包括,则不执行后续步骤,若包括,则电子设备对所述第一图像进行边缘检测;
作为一种示例,确定文本对应边缘线,以对对应文本的边缘进行检测。
若确定所述第一图像的边缘(线)不在对应摄像头预览流区域内,则所述电子设备确定所述第一图像仅包括所述文本的部分内容(未成功识别出所述文本);若确定所述第一图像中文本的在对应摄像头预览流区域内,则所述电子设备确定所述第一图像中文本的内容的清晰度,若清晰度大于清晰度阈值,则电子设备可以提取文本的全部内容,此时,电子设备确定成功识别出所述第一图像中文本的内容,若清晰度不大于清晰度阈值,则电子设备无法提取文本的全部内容,此时,则确定电子设备未成功识别出所述第一图像中文本的内容。
步骤S402,当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本;
当所述第一图像仅包括所述文本的部分内容时,此时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本。
作为一种示例,语音提示指示移动所述电子设备;
作为一种示例,语音提示指示移动所述文本。
作为一种示例,语音提示指示移动所述文本和所述电子设备。
作为一种示例,提示的内容可以为:向左,向右,向上,向下,远一点,近一点以及慢一点等内容。
作为一种示例,还可以提示具体移动的内容,如移动多少距离。
作为一种示例,是通过提示模块输出移动的内容,也可以是语音TTS模块输出移动的内容,具体不做限定。
作为一种示例,在通过语音TTS模块输出移动的内容时,需要先确定具体移动的内容,并将具体移动的内容发送给语音TTS模块输出。
作为一种示例,若文本为页面内容,在将第一图像显示到屏幕上后,若检测到所述文本的边缘在相应摄像头的预览流区域内,且检测到辅助阅读所述文本所在页全貌内容的触发条件,确定所述文本所在页的边缘是否在相应摄像头的预览流区域内,若未在相应摄像头的预览流区域内,则提示移动所述电子设备或者所述文本。
作为一种示例,在检测到文本的边缘在相应摄像头的预览流区域内后,如图28所示,如果进一步检测到用户查看或者辅助阅读所述文本所在页全貌内容的请求(用户通过触发条件触发相应的请求),则进一步确定文本所在页的边缘是否全部呈现在摄像头的预览流或者取景框中,若未全部呈现在摄像头的预览流或者取景框中,此时,提示用户继续移动电子设备或者移动文本,直至文本所在页的边缘完全显示在相机预览流或者取景框中。
作为一种示例,若文本为卡证,在将第一图像显示到屏幕上后,若检测到所述文本的边缘在相应摄像头的预览流区域内,且检测到辅助阅读所述卡证所在证件全貌内容的触发条件,确定所述卡证所在证件的边缘是否在相应摄像头的预览流区域内,若未在相应摄像头的预览流区域内,则提示移动所述电子设备或者所述证件。
作为一种示例,提示移动所述电子设备或者所述证件后,电子设备使用摄像头对所述文本所在页进行图像采集,得到第二图像,将所述二图像显示到屏幕上;在检测到所述文本的边缘在相应摄像头的预览流区域内后,进一步确定文本所在页的边缘是否全部呈现在摄像头的预览流或者取景框中(确定是否完整扫描或者采集所述文本所在页的边缘),若全部呈现在摄像头的预览流或者取景框中,所述电子设备对所述文本所在页的全部内容进行朗读。
一种可能实现的方式中,若检测到辅助模式的触发条件时,确定所述电子设备处于辅助模式下。
作为一种示例,图30为进入辅助模式的界面示意图,具体地,用户通过点击电子设备主界面上的设置图标,使得电子设备显示图30(a)界面,用户在图30(a)界面查找得到辅助功能图标,并点击该辅助功能图标,使得电子设备显示图30(b)界面,用户在图30(b)界面查找得到无障碍图标,并点击该无障碍图标,使得电子设备显示图30(c)界面,用户在图30(c)界面查找得到屏幕朗读图标,并点击该屏幕朗读图标,此时,电子设备处于屏幕朗读(模式)30(d)。
作为一种示例,图31为通过摄像头功能按钮进入辅助模式的界面示意图,具体地,用户通过点击电子设备主界面上的相机图标,进入图像采集或者拍摄界面,并在图像采集或者拍摄界面点击相应辅助模式或者阅读辅助模式按钮即可。
作为一种示例,电子设备处于辅助模式是可以设置的;
作为一种示例,基于点击辅助模式快捷键即可设置辅助模式。
作为一种示例,辅助模式还可以通过点击应应用图标等触发操作触发。
作为一种示例,针对视障人士设计的电子设备可在出厂设置时,即设置为辅助模式。
作为一种示例,只要检测到辅助模式的触发条件时,确定所述电子设备处于辅助模式下。
作为一种示例,触发条件可以根据实际情况确定,只要是触发条件均在本申请的保护范围内。
一种可能实现的方式中,所述在电子设备处于辅助模式下时,电子设备使用摄像头对文本进行图像采集的步骤,包括以下步骤B1:
步骤B1,在电子设备处于辅助模式下时,若检测到使用摄像头对文本进行图像采集的触发条件,电子设备使用摄像头对文本进行图像采集;
其中,所述使用摄像头对文本进行图像采集的触发条件区别于摄像头摄像的触发条件。
作为一种示例,在电子设备处于辅助模式下时,若检测到使用摄像头对文本进行图像采集的触发条件,电子设备使用摄像头对文本进行图像采集;
作为一种示例,所述使用摄像头对文本进行图像采集的触发条件区别于摄像头摄像的触发条件;
作为一种示例,所述使用摄像头对文本进行图像采集的触发条件区别于摄像头摄像的触发条件的一个原因在于:避免摄像头拍摄和进入辅助阅读模式被混淆。
作为一种示例,如图20所示,用户被提示后,按照箭头方向移动电子设备,直至电子设备摄像头所采集的图像中文本的全部内容被识别。
作为一种示例,本实施例中,提示移动所述电子设备和/或者移动所述文本的提示文本可以是用户,还可以是其他设备。
作为一种示例,本实施例应用的场景可以是:电子设备提示无人机或者其他设备移动。
也即,作为一种示例,本实施例应用的场景可以是:电子设备所采集图像对应的文本在机械臂或者机械手等其他设备上,此时,若所述第一图像仅包括所述文本的部分内容,则电子设备提示机械臂或者机械手等其他设备移动。
步骤S403,电子设备使用摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上;
作为一种示例,在提示后,用户移动电子设备或者文本,同时,电子设备使用摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上;
作为一种示例,电子设备使用摄像头按照一定的采集频率对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上。
作为一种示例,电子设备使用多个摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上。
作为一种示例,在第一图像是使用多个摄像头进行采集得到的,则所述第二图像使用同样的摄像头,使用同样的采集方式进行采集。
步骤S404,当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。
作为一种示例,当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。
作为一种示例,朗读的音量可以进行调节。
作为一种示例,若所述第二图像包括所述文本的全部内容,则通过语音TTS模块,输出所述文本的全部内容,以便用户及时获取对应的内容。
一种可能实现的方式中,所述当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读的步骤之后,所述方法还包括以下步骤S405:
步骤S405,所述电子设备发出语音指示,所述语音指示提示无需再对所述文本进行图像采集。
作为一种示例,当所述第二图像包括所述文本的全部内容时,则提示无需再对所述文本进行图像采集,避免用户一直使用电子设备而造成手抖或者手酸软,因而,提升用户体验。
作为一种示例,所述电子设备发出语音指示,所述语音指示包括:请放下电子设备,已完成采集等内容。
作为一种示例,无需再对所述文本进行图像采集,因而,可以避免电子设备不断进行图像采集而造成的资源浪费。
作为一种示例,需要先确定当所述第二图像包括所述文本的全部内容时,所述电子设备才对所述文本的全部内容进行朗读,而不是同时,以避免降低用户体验(需要一直使用电子设备进行图像采集)。
一种可能实现的方式中,当所述第二图像包括所述文本的全部内容时,则在检测到所述文本的全部内容的朗读触发条件时,所述电子设备对所述文本的全部内容进行朗读
作为一种示例,设置朗读触发条件的目的在于:
满足特殊情况下,不需要语音方式输出所述文本的内容的场景。
作为一种示例,若当前是静默场景,则不需要对文本的全部内容进行朗读。
作为一种示例,文本还可以分为不同的部分,如文本为合同,合同总共有5个部分,若用户只关注第3部分的合同,则应于用户的选择操作,电子设备朗读第3页合同的内容。
本申请电子设备使用摄像头对文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上;当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本;电子设备使用摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上;当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。本申请避免第一图像仅包括所述文本的部分内容而导致辅助阅读失败,造成辅助阅读效率低下的技术问题。
图6为本申请另一个实施例提供的辅助阅读方法的流程图,如图6所示,所述摄像头至少包括第一摄像头和第二摄像头,所述第一摄像头的视场角大于所述第二摄像头;
上述辅助阅读方法可以包括:
步骤S601,电子设备使用第一摄像头和/或者第二摄像头对文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上;
步骤S602,当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本;
步骤S603,电子设备使用第一摄像头和/或者第二摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上;
步骤S604,当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。
本实施例中,如图10所示,电子设备使用第一摄像头和/或者第二摄像头对文本(书籍,合同,药品说明等)进行图像采集,得到第一图像,将所述第一图像显示到屏幕上,同时电子设备基于其内部的文本检测模块,对第一图像进行文本的内容的检测,若未检测到文本的内容,则结束,若检测到文本的内容,则基于电子设备的边缘检测模块,确定第一图像的文本的边缘是否在对应摄像头预览流区域内,若在对应摄像头预览流区域内,则朗读文本的全部内容,若不在对应摄像头预览流区域内,则确定第一图像仅包括所述文本的部分内容,当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本(如图20所示),电子设备使用第一摄像头和/或者第二摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上(图22所述),当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。
具体步骤如下:
步骤S601,电子设备使用第一摄像头和/或者第二摄像头对文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上;
具体地,(在电子设备处于辅助模式下时),电子设备使用第一摄像头和/或者第二摄像头对文本进行图像采集,得到第一图像包括:(在电子设备处于辅助模式下时),电子设备使用第一摄像头,对文本进行图像采集,得到第一图像;(在电子设备处于辅助模式下时),电子设备使用第二摄像头,对文本进行图像采集,得到第一图像;(在电子设备处于辅助模式下时),电子设备使用第一摄像头和第二摄像头,均对文本进行图像采集,得到不同的第一图像。
作为一种示例,电子设备先使用广角摄像头对文本进行图像采集,然后使用主摄摄像头对文本进行图像采集;
作为一种示例,如图23以及如图29所示,虽然主摄摄像头所采集的第一图像不能包括文本的全部内容,但是由于第一摄像头(超广角摄像头)的视场角更广(采集区域更大,可以最大限度的一次性采集出包括文本全部内容的图像),因而,先启动第一摄像头(超广角摄像头)采集图像,在第一摄像头(超广角摄像头)所采集的图像不能包括文本的全部内容,和/或者在第一摄像头(超广角摄像头)所采集的图像不能包括文本的全部内容时,才启动第二摄像头(主摄摄像头)采集,可以节约流程。
作为一种示例,电子设备先使用广角摄像头对文本进行图像采集,若得到的第一图像中仅包括文本的部分内容,此时,才使用主摄摄像头对文本进行图像采集后得到的图像,进行包括文本的全部内容或者包括文本的部分内容的确定。
作为一种示例,电子设备先使用广角摄像头对文本进行图像采集,若不能识别得到第一图像中文本的内容,才使用主摄摄像头对文本进行图像采集后得到的图像,进行包括文本的全部内容或者包括文本的部分内容的确定。
作为一种示例,电子设备先使用广角摄像头对文本进行图像采集,若第一图像中文本的内容的清晰度小于清晰度阈值,才使用主摄摄像头对文本进行图像采集后得到的图像,进行包括文本的全部内容或者包括文本的部分内容的确定;
作为一种示例,电子设备先使用主摄摄像头对文本进行图像采集,若得到的第一图像中仅包括文本的部分内容,此时,才使用主摄摄像头对文本进行图像采集后得到的图像,进行包括文本的全部内容或者包括文本的部分内容的确定。
作为一种示例,由于电子设备可能优先使用主摄摄像头进行图像采集,因而,在本实施例中,电子设备先使用主摄摄像头对文本进行图像采集,若得到的第一图像中仅包括文本的部分内容,此时,才使用主摄摄像头对文本进行图像采集后得到的图像,进行包括文本的全部内容或者包括文本的部分内容的确定,这样符合电子设备固有的或者设定的采集流程,避免资源的浪费。
步骤S602,当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本;
作为一种示例,当所述第一图像仅包括所述文本的部分内容如仅包括所述文本的二分之一内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本。
其中,所述当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示的步骤之前,包括:
步骤D1,所述电子设备在未成功识别出所述第一摄像头或者所述第二摄像头所采集图像中文本的内容时,所述电子设备基于所述第一摄像头所采集图像和所述第二摄像头所采集图像确定所述第一图像是否仅包括所述文本的部分内容。
作为一种示例,电子设备先使用主摄摄像头对文本进行图像采集,若得到的第一图像中仅包括文本的部分内容,此时,使用主摄摄像头和广角摄像头同时对文本进行图像采集后得到的图像,进行包括文本的全部内容或者包括文本的部分内容的确定。
作为一种示例,电子设备先使用广角摄像头对文本进行图像采集,若得到的第一图像中仅包括文本的部分内容,此时,使用主摄摄像头和广角摄像头同时对文本进行图像采集后得到的图像,进行包括文本的全部内容或者包括文本的部分内容的确定。
作为一种示例,电子设备同时使用广角摄像头和主摄摄像头对文本进行图像采集,若基于广角摄像头得到的第一图像中仅包括文本的部分内容,此时,使用主摄摄像头和广角摄像头同时对文本进行图像采集后得到的图像,进行包括文本的全部内容或者包括文本的部分内容的确定。
作为一种示例,电子设备同时使用广角摄像头和主摄摄像头对文本进行图像采集,若基于主摄摄像头得到的第一图像中仅包括文本的部分内容,此时,使用主摄摄像头和广角摄像头同时对文本进行图像采集后得到的图像,进行包括文本的全部内容或者包括文本的部分内容的确定。
作为一种示例,所述电子设备在成功识别出所述第一摄像头或者所述第二摄像头所采集图像中文本的内容时,不执行后续步骤。
其中,所述电子设备在未成功识别出所述第一摄像头或者所述第二摄像头所采集图像中文本的内容时,所述电子设备基于所述第一摄像头所采集图像和所述第二摄像头所采集图像确定所述第一图像是否仅包括所述文本的部分内容的步骤之前,包括以下步骤E1-步骤E2:
步骤E1,所述电子设备对所述第一摄像头或者所述第二摄像头所采集图像进行识别,若确定所述第一摄像头或者所述第二摄像头所采集图像中包括所述文本的内容,则对所述所采集图像的文本进行边缘检测;
作为一种示例,所述电子设备对所述第一摄像头所采集图像进行识别,若确定所述第一摄像头所采集图像中包括所述文本的内容,则对所述所采集图像的文本进行边缘检测;
作为一种示例,所述电子设备对所述第二摄像头所采集图像进行识别,若确定所述第二摄像头所采集图像中包括所述文本的内容,则对所述所采集图像的文本进行边缘检测。
步骤E2,若确定所述所采集图像的文本的边缘不在对应摄像头的预览流区域内,则所述电子设备确定未成功识别出所述所采集图像中文本的内容。
在本实施例中,若确定所述所采集图像的文本的边缘在对应摄像头的预览流区域内,则所述电子设备确定成功识别出所述所采集图像中文本的内容。
在本实施例中,若确定所述所采集图像的文本的边缘不在对应摄像头的预览流区域(所采集图像的摄像头为第一摄像头,则预览流区域为第一摄像头的预览流区域,所采集图像的摄像头为第二摄像头,则预览流区域为第二摄像头的预览流区域)内,则所述电子设备确定未成功识别出所述所采集图像中文本的内容。
其中,所述电子设备基于所述第一摄像头所采集图像和所述第二摄像头所采集图像确定所述第一图像是否仅包括所述文本的部分内容的步骤,包括以下步骤F1-F3:
步骤F1,所述电子设备对所述第一摄像头所采集图像进行是否包括所述文本的内容进行检测,在检测到所述第一摄像头所采集图像中包括所述文本的内容时,所述电子设备对所述第二摄像头所采集图像中的所述文本进行边缘检测;
在本实施例中,阐述电子设备如何对所述第一摄像头所采集图像和所述第二摄像头所采集图像进行联合检测,并确定第一图像是否仅包括所述文本的部分内容。
作为一种示例,如图28所示,电子设备首先基于文本检测模块对所述第一摄像头所采集图像进行是否包括所述文本的内容进行检测,在检测到所述第一摄像头所采集图像中包括所述文本的内容时,所述电子设备基于边缘检测模块对所述第二摄像头所采集图像中的所述文本进行边缘检测。
步骤F2,若所述第二摄像头所采集图像中所述文本的边缘不在所述第二摄像头的预览流区域内,则所述电子设备确定所述第一摄像头所采集图像中所述文本的边缘是否在第一摄像头的预览流区域内;
作为一种示例,如图28所示,若所述第二摄像头所采集图像中所述文本的边缘不在所述第二摄像头的预览流区域内,则所述电子设备基于边缘检测模块确定所述第一摄像头所采集图像中所述文本的边缘是否在第一摄像头的预览流区域内。
步骤E3,所述电子设备若确定所述第一摄像头所采集图像中所述文本的边缘不在第一摄像头的预览流区域内,则确定所述第一图像仅包括所述文本的部分内容。
作为一种示例,所述电子设备若确定所述第一摄像头所采集图像中所述文本的边缘不在第一摄像头的预览流区域内,则确定所述第一图像仅包括所述文本的部分内容。
作为一种示例,所述电子设备若确定所述第一摄像头所采集图像中所述文本的边缘在第一摄像头的预览流区域内,则需要进一步的判断。
若所述第二摄像头所采集图像中所述文本的边缘不在所述第二摄像头的预览流区域内,则所述电子设备确定所述第一摄像头所采集图像中所述文本的边缘是否在第一摄像头的预览流区域内的步骤之后,包括以下步骤G1-步骤G2:
步骤G1,所述电子设备若确定所述第一摄像头所采集图像中所述文本的边缘在第一摄像头的预览流区域内,则确定所述第二摄像头所采集图像中文本的清晰度是否大于清晰度阈值;
步骤G2,若不大于清晰度阈值,则所述电子设备确定所述第一图像仅包括所述文本的部分内容。
作为一种示例,所述电子设备若确定所述第一摄像头所采集图像中所述文本的边缘在第一摄像头的预览流区域内,则确定所述第二摄像头所采集图像中文本的清晰度是否大于清晰度阈值,若不大于清晰度阈值,则所述电子设备确定所述第一图像仅包括所述文本的部分内容。若大于清晰度阈值,则所述电子设备确定所述第一图像包括所述文本的全部内容。
步骤S603,电子设备使用第一摄像头和/或者第二摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上;
作为一种示例,在提示后,用户移动电子设备或者文本,同时,电子设备使用第一摄像头和/或者第二摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上;
作为一种示例,电子设备使用第一摄像头和/或者第二摄像头按照一定的采集频率对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上。
作为一种示例,电子设备使用多个摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上。
作为一种示例,在第一图像是使用多个摄像头进行采集得到的,则所述第二图像使用同样的摄像头,使用同样的采集方式进行采集。
步骤S604,当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。
作为一种示例,当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。
作为一种示例,朗读的音量可以进行调节。
作为一种示例,若所述第二图像包括所述文本的全部内容,则通过语音TTS模块,输出所述文本的全部内容,以便用户及时获取对应的内容。
作为一种示例,图27为本申请再一个实施例提供的辅助阅读方法的整体流程图(第一摄像头和第二摄像头一起辅助阅读文本),具体地,电子设备为手机,手机包括多个摄像头,手机启动多个摄像头后,以fov最大的摄像头(摄像头)为第一摄像头,主摄(主摄摄像头,第二镜头)为第二摄像头,其中,主摄及摄像头同时工作,在手机屏幕上可以只显示主摄内容或同时显示主摄及超广角内容(201)。
作为一种示例,第一摄像头(超广角摄像头、第一镜头)将摄取的文本的图像发送给(电子设备)的文字检测模块进行检测,并判断文字检测模块是否检测到文字或者文本的内容(202),如果检测到文字或者文本的内容继续后续的流程(后续的流程起始为203或者210),如果未检测到文字或者文本的内容,则通过文字检测模块检测第二摄像头所采集图像是否包括文字或者文本(209),如果包括则继续后续的流程(后续的流程起始为203),如果不包括则退出。
作为一种示例,第一摄像头(摄像头、第一镜头)将摄取的文本的图像发送给(电子设备)的文字检测模块进行检测,并判断文字检测模块是否检测到文字或者文本的内容(202),如果检测到文字或者文本的内容,且基于电子设备的清晰度检测模块确定文字或者文本内容的清晰度大于预设清晰度阈值,则提取文本中的文字或者文本的全部内容、读出文本中的文字或者全部内容(204)。
作为一种示例,电子设备的边缘检测模块对第二摄像头所采集图像对应文本的边缘进行检测,检测文本边缘是否完整(文本的边缘是否在第二摄像头的预览流区域内)(203),如果完整(文本的边缘在第二摄像头的预览流区域内),则提取文本中的文字或者文本中的全部内容、读出文本中的文字或者全部内容(204)。
作为一种示例,如果电子设备的边缘检测模块检测到第二摄像头(主摄摄像头)所采集图像的文本边缘不完整(文本的边缘你在第二摄像头的预览流区域内),则确定基于电子设备的边缘检测模块检测第一摄像头(摄像头所采集图像对应的的文本边缘或者所扫描的文本是否完整(205)(文本的各边缘在相应摄像头预览流区域内),如果第一摄像头(摄像头)所采集图像中的文本的内容不完整(所采集图像中仅包括文本的部分内容),则按照上述实施例中计算目标距离的方法(各文本的各边缘与相应摄像头预览流区域对应边缘之间的距离为目标距离),提示用户移动电子设备或者提示用户移动文本(基于目标距离和对应预设距离之间的比对结果,确定目标距离和移动方向),直到第一镜头(超广角摄像头)扫描到整个文本(207)。
作为一种示例,如果电子设备的边缘检测模块检测到第一镜头(超光角摄像头)所采集图像的文本边缘完整(文本的各边缘在相应超光角摄像头预览流区域内),则基于清晰度计算模块判断第一镜头(超广角摄像头)所采集图像中文本的内容或者文字的清晰度是否大于一定的阈值(206),如果大于,则读取所采集图像中文本中的文字胡总和全部内容(204)。
作为一种示例,如果确定第一镜头(摄像头)所采集图像中的文本的内容不清晰,按照上述方案中计算目标距离的方法(各文本的各边缘与对应摄像头预览流区域对应边缘之间的距离为目标距离),提示用户移动电子设备或者移动文本,直到主摄摄像头扫描到整个文本(208)。
在本申请电子设备使用第一摄像头和/或者第二摄像头对文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上;当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本;电子设备使用第一摄像头和/或者第二摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上;当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。本申请可以避免资源的浪费。
图7为本申请又一个实施例提供的辅助阅读方法的流程图。如图7所示,上述辅助阅读方法可以包括:
步骤S701,电子设备使用摄像头对文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上;
步骤S702,当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示平移、旋转或者转动所述电子设备,或者所述语音提示还指示所述电子设备靠近或者远离所述文本;
和/或者步骤S703,当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示平移、旋转或者转动所述文本,或者所述语音提示还指示所述文本靠近或者远离所述电子设备;
步骤S704,电子设备使用摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上;
步骤S705,当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。
也即,在本实施例中,移动包括平移、旋转、转动、靠近或者远离。
作为一种示例,移动可以是:指示平移、旋转、转动所述电子设备、指示所述电子设备靠近文本或者指示所述电子设备远离所述文本。
作为一种示例,移动可以是:指示平移、旋转、转动所述文本、指示所述电子设备靠近文本或者指示所述文本远离所述电子设备
作为一种示例,如图25所示,电子设备使用摄像头对文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上,当所述第一图像仅包括所述文本(文本为平面且正向的文本)的部分内容时,则语音提示指示旋转所述电子设备,语音提示还指示旋转所述电子设备时的第一移动(旋转)方向和第一移动(旋转)距离,或者语音提示指示旋转所述文本,语音提示指示还旋转所述文本时的第二移动(旋转)方向和第二移动(旋转)距离。在旋转后,电子设备使用摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上,当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。
作为一种示例,如图25所示,电子设备使用摄像头对文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上,当所述第一图像仅包括所述文本(文本为平面且非正向的文本)的部分内容时,则语音提示指示旋转所述电子设备,语音提示还指示旋转所述电子设备时的第一移动(旋转)方向和第一移动(旋转)距离,或者语音提示指示旋转所述文本,语音提示指示还旋转移动所述文本时的第二移动(旋转)方向和第二移动(旋转)距离。在旋转后,电子设备使用摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上,当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。
作为一种示例,如图24所示,电子设备使用摄像头对文本(曲面文本)进行图像采集,得到第一图像,将所述第一图像显示到屏幕上,当所述第一图像仅包括所述文本(文本为曲面文本)的部分内容时,则语音提示指示转动所述电子设备,语音提示还指示转动所述电子设备时的第一移动(转动)方向和第一移动(转动)距离,或者语音提示指示转动所述文本,语音提示指示还转动移动所述文本时的第二移动(转动)方向和第二移动(转动)距离。在移动后,电子设备使用摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上,当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。
作为一种示例,文本可能被其他遮挡物遮挡,如图26所示,此时,所述当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本的步骤,包括:
步骤N1,当所述第一图像仅包括所述文本的部分内容,且所述第一图像中所述文本的另一部分内容被遮挡时,所述电子设备发出语音提示,所述语音提示指示移动所述电子设备和/或者移动所述文本,所述语音提示还指示去除遮挡所述文本的遮挡物。
作为一种示例,所采集图像中的文本可能本身被其他遮挡物如脏污(墨水)遮挡,如图26所示,此时,电子设备检测第一图像中的文本的内容是否存在残缺或者磨损,若文本的内容残缺或者被磨损,则语音提示指示移动所述电子设备和/或者移动所述文本之外,所述语音提示还指示去除遮挡所述文本的遮挡物。
图8为本申请再一个实施例提供的辅助阅读方法的流程图,上述辅助阅读方法可以包括:
步骤S801,电子设备使用摄像头对文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上;
步骤S802,当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本,所述语音提示还指示所述电子设备的第一移动方向和第一移动距离,或者所述语音提示还指示移动所述文本的第二移动方向和第二移动距离,所述第一移动方向、第一移动距离、第二移动方向和第二移动距离与所述文本的边缘和对应摄像头预览流区域之间的位置关系关联;
步骤S803,电子设备使用摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上;
和/或者步骤S804,当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。
作为一种示例,第一移动方向、第一移动距离、第二移动方向和第二移动距离与所述文本的边缘和对应摄像头预览流区域之间的位置关系关联。
作为一种示例,如图11所示,各文本的各边缘可以为第一边缘(对应上边界),第二边缘(对应左边界),第三边缘(对应右边界),第四边缘(对应下边界),其中,第一边缘与对应摄像头预览流区域对应边缘之间的目标距离为第一目标距离d1,第二边缘与对应摄像头预览流区域对应边缘之间的距离目标距离为第二目标距离d2,第三边缘与对应摄像头预览流区域对应边缘之间的距离目标距离为第三目标距离d3,第四边缘与对应摄像头预览流区域对应边缘之间的距离目标距离为第四目标距离d4。
则第一移动和第二移动方向具体如下(1)所示:
表(1)
作为一种示例,不同方向上的阈值可以相同,也可以不同,也可以自定义,如图11-图19所示,横向阈值(第二阈值和第三阈值关联)可定义为50:纵向阈值(第一阈值和第四阈值关联)可定义为:100,预览流区域的高宽为:1280*720。
需要说明的是,在本实施例中,语音提示指示旋转所述电子设备时的第一移动(旋转)方向和第一移动(旋转)距离,和语音提示指示旋转所述文本时的第二移动(旋转)方向和第二移动(旋转)距离部分是相对的。
作为一种示例,当提示电子设备向左移动时,提示文本向右移动。
作为一种示例,需要通过提示模块或者通过语音TTS模块进行提示。
作为一种示例,在通过语音TTS模块输出移动的内容时,需要先确定具体移动的内容,并将具体移动的内容发送给语音TTS模块输出。
作为一种示例,本实施例还提示具体的目标距离,使得用户可以更精准地进行提示,提升用户体验。
图9示出了本申请提供的一种辅助阅读装置的结构示意图。本申请提供的辅助阅读装置900包括:第一显示模块901、提示模块902,第二显示模块903以及语音TTS模块904;
电子设备中的第一显示模块901,用于使用摄像头对文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上;
电子设备中的提示模块902,用于当所述第一图像仅包括所述文本的部分内容时,发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本;
电子设备中的第二显示模块903,用于使用摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上;
电子设备中的语音TTS模块904,用于当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。
应理解的是,这里的电子设备以功能模块的形式体现。这里的术语“模块”可以通过软件和/或硬件形式实现,对此不作具体限定。例如,“模块”可以是实现上述功能的软件程序、硬件电路或二者结合。所述硬件电路可能包括应用特有集成电路(applicationspecific integrated circuit,ASIC)、电子电路、用于执行一个或多个软件或固件程序的处理器(例如共享处理器、专有处理器或组处理器等)和存储器、合并逻辑电路和/或其它支持所描述的功能的合适组件。
本申请还提供一种电子设备,包括:一个或多个处理器;存储器;以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述电子设备执行时,使得所述电子设备执行如上述第一方面或第一方面的可能的实现方式中任一项所述的辅助阅读方法。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质中存储了计算机程序,当所述计算机程序被处理器执行时,使得处理器执行如上述第一方面或第一方面的可能的实现方式中任一项所述的辅助阅读方法。
本申请还提供一种芯片,所述芯片包括处理器与数据接口,所述处理器通过所述数据接口读取存储器上存储的指令,执行第一方面或第一方面的可能的实现方式中任一项所述的辅助阅读方法。
可选的,该芯片还可以包括存储器,所述存储器中存储有指令,所述处理器用于执行所述存储器上存储的指令,当所述指令被执行时,所述处理器用于执行第一方面或第一方面的可能的实现方式中任一项所述的辅助阅读方法。
存储器可以是只读存储器(read-only memory,ROM)、可存储静态信息和指令的其它类型的静态存储设备、随机存取存储器(random access memory,RAM)或可存储信息和指令的其它类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、只读光盘(compact disc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其它磁存储设备,或者还可以是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其它介质等。
本申请实施例中,“和/或”,描述关联文本的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示单独存在A、同时存在A和B、单独存在B的情况。其中A,B可以是单数或者复数。字符“/”一般表示前后关联文本是一种“或”的关系。“以下至少一项”及其类似表达,是指的这些项中的任意组合,包括单项或复数项的任意组合。例如,a,b和c中的至少一项可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。
本领域普通技术人员可以意识到,本文中公开的实施例中描述的各单元及算法步骤,能够以电子硬件、计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,任一功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。本申请的保护范围应以所述权利要求的保护范围为准。
Claims (15)
1.一种辅助阅读方法,其特征在于,所述辅助阅读方法包括以下步骤:
电子设备使用摄像头对文本进行图像采集,得到第一图像,将所述第一图像显示到屏幕上;
当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本;
电子设备使用摄像头对所述文本进行图像采集,得到第二图像,将所述二图像显示到屏幕上;
当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读。
2.如权利要求1所述的辅助阅读方法,其特征在于,所述电子设备使用摄像头对文本进行图像采集的步骤,包括:
在电子设备处于辅助模式下时,电子设备使用摄像头对文本进行图像采集。
3.如权利要求2所述的辅助阅读方法,其特征在于,若检测到辅助模式的触发条件时,确定所述电子设备处于辅助模式下。
4.如权利要求2所述的辅助阅读方法,其特征在于,所述在电子设备处于辅助模式下时,电子设备使用摄像头对文本进行图像采集的步骤,包括:
在电子设备处于辅助模式下时,若检测到使用摄像头对文本进行图像采集的触发条件,电子设备使用摄像头对文本进行图像采集;
其中,所述使用摄像头对文本进行图像采集的触发条件区别于摄像头摄像的触发条件。
5.如权利要求1所述的辅助阅读方法,其特征在于,所述摄像头至少包括第一摄像头和第二摄像头,所述第一摄像头的视场角大于所述第二摄像头;
所述电子设备使用摄像头对文本进行图像采集的步骤,包括:
电子设备使用第一摄像头和/或者第二摄像头对文本进行图像采集。
6.如权利要求5所述的辅助阅读方法,其特征在于,所述电子设备使用第一摄像头和/或者第二摄像头对文本进行图像采集的步骤,包括:
电子设备同时使用或者先后使用第一摄像头和第二摄像头分别对文本进行图像采集;
所述当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示的步骤之前,包括:
所述电子设备在未成功识别出所述第一摄像头或者所述第二摄像头所采集图像中文本的内容时,所述电子设备基于所述第一摄像头所采集图像和所述第二摄像头所采集图像确定所述第一图像是否仅包括所述文本的部分内容。
7.如权利要求6所述的辅助阅读方法,其特征在于,所述电子设备在未成功识别出所述第一摄像头或者所述第二摄像头所采集图像中文本的内容时,所述电子设备基于所述第一摄像头所采集图像和所述第二摄像头所采集图像确定所述第一图像是否仅包括所述文本的部分内容的步骤之前,包括:
所述电子设备对所述第一摄像头或者所述第二摄像头所采集图像进行识别,若确定所述第一摄像头或者所述第二摄像头所采集图像中包括所述文本的内容,则对所述所采集图像的文本进行边缘检测;
若确定所述所采集图像的文本的边缘不在对应摄像头的预览流区域内,则所述电子设备确定未成功识别出所述所采集图像中文本的内容。
8.如权利要求6所述的辅助阅读方法,其特征在于,所述电子设备基于所述第一摄像头所采集图像和所述第二摄像头所采集图像确定所述第一图像是否仅包括所述文本的部分内容的步骤,包括:
所述电子设备对所述第一摄像头所采集图像进行是否包括所述文本的内容进行检测,在检测到所述第一摄像头所采集图像中包括所述文本的内容时,所述电子设备对所述第二摄像头所采集图像中的所述文本进行边缘检测;
若所述第二摄像头所采集图像中所述文本的边缘不在所述第二摄像头的预览流区域内,则所述电子设备确定所述第一摄像头所采集图像中所述文本的边缘是否在第一摄像头的预览流区域内;
所述电子设备若确定所述第一摄像头所采集图像中所述文本的边缘不在第一摄像头的预览流区域内,则确定所述第一图像仅包括所述文本的部分内容。
9.如权利要求8所述的辅助阅读方法,其特征在于,若所述第二摄像头所采集图像中所述文本的边缘不在所述第二摄像头的预览流区域内,则所述电子设备确定所述第一摄像头所采集图像中所述文本的边缘是否在第一摄像头的预览流区域内的步骤之后,包括:
所述电子设备若确定所述第一摄像头所采集图像中所述文本的边缘在第一摄像头的预览流区域内,则确定所述第二摄像头所采集图像中文本的清晰度是否大于清晰度阈值;
若不大于清晰度阈值,则所述电子设备确定所述第一图像仅包括所述文本的部分内容。
10.如权利要求1所述的辅助阅读方法,所述当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本的步骤,包括:
当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本,所述语音提示还指示所述电子设备的第一移动方向和第一目标距离,或者所述语音提示还指示移动所述文本的第二移动方向和第二目标距离,所述第一移动方向、第一目标距离、第二移动方向和第二目标距离均与位置关系关联,所述位置关系为文本的边缘和对应摄像头预览流区域的边缘之间的位置关系。
11.如权利要求1所述的辅助阅读方法,其特征在于,所述当所述第二图像包括所述文本的全部内容时,所述电子设备对所述文本的全部内容进行朗读的步骤之后,所述方法还包括:
所述电子设备发出语音指示,所述语音指示提示无需再对所述文本进行图像采集。
12.如权利要求1所述的辅助阅读方法,其特征在于,所述当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示移动所述电子设备和/或者移动所述文本的步骤,包括:
当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示平移、旋转或者转动所述电子设备,或者所述语音提示还指示所述电子设备靠近或者远离所述文本;
和/或者当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,其中,所述语音提示指示平移、旋转或者转动所述文本,或者所述语音提示还指示所述文本靠近或者远离所述电子设备。
13.如权利要求1所述的辅助阅读方法,其特征在于,所述当所述第一图像仅包括所述文本的部分内容时,所述电子设备发出语音提示,所述语音提示指示移动所述电子设备和/或者移动所述文本的步骤,包括:
当所述第一图像仅包括所述文本的部分内容,且所述第一图像中所述文本的另一部分内容被遮挡时,所述电子设备发出语音提示,所述语音提示指示移动所述电子设备和/或者移动所述文本,所述语音提示还指示去除遮挡所述文本的遮挡物。
14.一种电子设备,其特征在于,包括:一个或多个处理器;存储器;以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述电子设备执行时,使得所述电子设备执行如权利要求1至13中任一项所述的辅助阅读方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储了计算机程序,当所述计算机程序被处理器执行时,使得处理器执行权利要求1至13中任一项所述的辅助阅读方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211296009.2A CN117953499A (zh) | 2022-10-21 | 2022-10-21 | 辅助阅读方法、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211296009.2A CN117953499A (zh) | 2022-10-21 | 2022-10-21 | 辅助阅读方法、电子设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117953499A true CN117953499A (zh) | 2024-04-30 |
Family
ID=90802048
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211296009.2A Pending CN117953499A (zh) | 2022-10-21 | 2022-10-21 | 辅助阅读方法、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117953499A (zh) |
-
2022
- 2022-10-21 CN CN202211296009.2A patent/CN117953499A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11785329B2 (en) | Camera switching method for terminal, and terminal | |
CN114467297B (zh) | 一种应用于电子设备的视频通话的显示方法及相关装置 | |
CN115866121B (zh) | 应用界面交互方法、电子设备和计算机可读存储介质 | |
US20220253144A1 (en) | Shortcut Function Enabling Method and Electronic Device | |
CN112714901B (zh) | 系统导航栏的显示控制方法、图形用户界面及电子设备 | |
CN110543287B (zh) | 一种屏幕显示方法及电子设备 | |
WO2020073959A1 (zh) | 图像捕捉方法及电子设备 | |
CN111176506A (zh) | 一种屏幕显示方法及电子设备 | |
US11994918B2 (en) | Electronic device control method and electronic device | |
WO2020029306A1 (zh) | 一种图像拍摄方法及电子设备 | |
CN112751954B (zh) | 一种操作提示的方法和电子设备 | |
CN112600961A (zh) | 一种音量调节方法及电子设备 | |
CN110138999B (zh) | 一种用于移动终端的证件扫描方法及装置 | |
CN114089932B (zh) | 多屏显示方法、装置、终端设备及存储介质 | |
CN113641271A (zh) | 应用窗口的管理方法、终端设备及计算机可读存储介质 | |
CN116048358B (zh) | 悬浮球的控制方法和相关装置 | |
CN113472861B (zh) | 一种文件传输方法及电子设备 | |
US20220317841A1 (en) | Screenshot Method and Related Device | |
CN116152814A (zh) | 一种图像识别方法以及相关设备 | |
CN114584652B (zh) | 一种用户图形界面显示方法、装置、计算机设备及存储介质 | |
CN115291779A (zh) | 一种窗口控制方法及其设备 | |
CN117953499A (zh) | 辅助阅读方法、电子设备及计算机可读存储介质 | |
CN116233599B (zh) | 一种录像模式推荐方法和电子设备 | |
CN118550657A (zh) | 解决感知服务冲突的方法和装置 | |
CN118444832A (zh) | 一种触控操作方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |