CN111506744A - 一种点读的方法及终端设备 - Google Patents

一种点读的方法及终端设备 Download PDF

Info

Publication number
CN111506744A
CN111506744A CN202010266681.1A CN202010266681A CN111506744A CN 111506744 A CN111506744 A CN 111506744A CN 202010266681 A CN202010266681 A CN 202010266681A CN 111506744 A CN111506744 A CN 111506744A
Authority
CN
China
Prior art keywords
picture
read
sentence
determining
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010266681.1A
Other languages
English (en)
Other versions
CN111506744B (zh
Inventor
张少杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Genius Technology Co Ltd
Original Assignee
Guangdong Genius Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Genius Technology Co Ltd filed Critical Guangdong Genius Technology Co Ltd
Priority to CN202010266681.1A priority Critical patent/CN111506744B/zh
Publication of CN111506744A publication Critical patent/CN111506744A/zh
Application granted granted Critical
Publication of CN111506744B publication Critical patent/CN111506744B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/44Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/483Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0483Interaction with page-structured environments, e.g. book metaphor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • G09B5/062Combinations of audio and printed presentations, e.g. magnetically striped cards, talking books, magnetic tapes with printed texts thereon

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Library & Information Science (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例公开了一种点读的方法、终端设备以及可读存储介质,用于终端设备准确的判断用户是否翻页,若翻页,还可以根据用户的点读操作,进行准确、高效的点读播放,提高用户体验。本发明实施例方法包括:监听用户在点读过程中的提示音;判断所述提示音与预置的翻页语音库中的声音是否匹配;若匹配,则确定书本已翻页,将所述已翻页的当前页面以图片形式进行缓存,得到缓存图片;提取用户在所述当前页面的点击坐标;根据所述点击坐标和所述缓存图片确定待点读语句;播放所述待点读语句。

Description

一种点读的方法及终端设备
技术领域
本发明涉及教育技术领域,尤其涉及一种点读的方法、终端设备以及可读存储介质。
背景技术
现有技术方案的翻页检测是通过实时检测预览画面,通过不同时间的预览画面对比判断书本是否翻页。此方案的缺点是容易把书本的误触和移动判定成书本翻页,体验较差。而且,在翻页后,因为用户在点读的过程中,手指或者其他点读笔会遮挡点读的内容,导致终端设备无法正常点读,或者点读存在延误。
发明内容
本发明实施例提供了一种点读的方法、终端设备以及可读存储介质,用于终端设备准确的判断用户是否翻页,若翻页,还可以根据用户的点读操作,进行准确、高效的点读播放,提高用户体验。
有鉴于此,本发明实施例第一方面提供一种点读的方法,可以包括:
监听用户在点读过程中的提示音;
判断所述提示音与预置的翻页语音库中的声音是否匹配;
若匹配,则确定书本已翻页,将所述已翻页的当前页面以图片形式进行缓存,得到缓存图片;
提取用户在所述当前页面的点击坐标;
根据所述点击坐标和所述缓存图片确定待点读语句;
播放所述待点读语句。
可选的,在本发明的一些实施例中,所述根据所述点击坐标和所述缓存图片确定待点读语句,包括:
在所述缓存图片中确定所述点击坐标对应的待点读语句。
可选的,在本发明的一些实施例中,
所述根据所述点击坐标和所述缓存图片确定待点读语句,包括:
判断所述缓存图片与预置的书本图片数据库中的图片是否匹配;
若匹配,则获取对应的目标图片的信息,所述目标图片的信息包括所述目标图片中的点读语句;
根据所述点击坐标,确定所述目标图片的信息中对应的待点读语句。
可选的,在本发明的一些实施例中,所述根据所述点击坐标,确定所述目标图片的信息中对应的待点读语句,包括:
将所述点击坐标通过图搜转换算法转换成所述目标图片上的目标坐标;
根据所述目标坐标确定所述目标图片的信息中对应的待点读语句,所述目标图片的信息包括所述目标图片中的点读语句。
可选的,在本发明的一些实施例中,所述播放所述待点读语句,包括:
监听所述用户在点读过程中的环境音;
判断所述环境音是否大于预置阈值;
若大于,则检测终端设备是否连接无线耳机;
若连接,则通过所述无线耳机播放所述待点读语句。
本发明实施例第二方面提供一种终端设备,可以包括:
监听模块,用于监听用户在点读过程中的提示音;
判断模块,用于判断所述提示音与预置的翻页语音库中的声音是否匹配;
缓存模块,用于若匹配,则确定书本已翻页,将所述已翻页的当前页面以图片形式进行缓存,得到缓存图片;
提取模块,用于提取用户在所述当前页面的点击坐标;
确定模块,用于根据所述点击坐标和所述缓存图片确定待点读语句;
播放模块,用于播放所述待点读语句。
可选的,在本发明的一些实施例中,
所述确定模块,具体用于在所述缓存图片中确定所述点击坐标对应的待点读语句。
可选的,在本发明的一些实施例中,
所述确定模块,具体用于判断所述缓存图片与预置的书本图片数据库中的图片是否匹配;若匹配,则获取对应的目标图片的信息,所述目标图片的信息包括所述目标图片中的点读语句;根据所述点击坐标,确定所述目标图片的信息中对应的待点读语句。
可选的,在本发明的一些实施例中,
所述确定模块,具体用于将所述点击坐标通过图搜转换算法转换成所述目标图片上的目标坐标;根据所述目标坐标确定所述目标图片的信息中对应的待点读语句,所述目标图片的信息包括所述目标图片中的点读语句。
可选的,在本发明的一些实施例中,
所述播放模块,用于监听所述用户在点读过程中的环境音;判断所述环境音是否大于预置阈值;若大于,则检测终端设备是否连接无线耳机;若连接,则通过所述无线耳机播放所述待点读语句。
本发明第三方面提供一种终端设备,包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,用于执行如本发明第一方面及第一方面任一可选实现方式中所述的点读的方法的步骤。
本发明实施例第四方面提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如本发明第一方面及第一方面任一可选实现方式中所述的点读的方法的步骤。
本发明实施例第五方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本发明实施例第一方面公开的任意一种点读的方法的部分或全部步骤。
本发明实施例第六方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本发明实施例第一方面公开的任意一种点读的方法的部分或全部步骤。
从以上技术方案可以看出,本发明实施例具有以下优点:
在本发明实施例中,监听用户在点读过程中的提示音;判断所述提示音与预置的翻页语音库中的声音是否匹配;若匹配,则确定书本已翻页,将所述已翻页的当前页面以图片形式进行缓存,得到缓存图片;提取用户在所述当前页面的点击坐标;根据所述点击坐标和所述缓存图片确定待点读语句;播放所述待点读语句。终端设备根据提示音与预置的翻页语音库中的声音是否匹配,从而准确的判断用户是否翻页,若翻页,还可以根据用户的点读操作,进行准确、高效的点读播放,提高用户体验。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例和现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,还可以根据这些附图获得其它的附图。
图1为本发明实施例中点读的方法的一个实施例示意图;
图2为本发明实施例中点读的方法的另一个实施例示意图;
图3为本发明实施例中终端设备的一个实施例示意图;
图4为本发明实施例中终端设备的另一个实施例示意图。
具体实施方式
本发明实施例提供了一种点读的方法、终端设备以及可读存储介质,用于终端设备准确的判断用户是否翻页,若翻页,还可以根据用户的点读操作,进行准确、高效的点读播放,提高用户体验。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,都应当属于本发明保护的范围。
在本发明实施例中,示例性的,终端设备可以包括一般的手持电子终端,诸如智能电话、便携式终端、终端、个人数字助理(Personal Digital Assistant,PDA)、便携式多媒体播放器(Personal Media Player,PMP)装置、笔记本电脑、笔记本(Note Pad)、无线宽带(Wireless Broadband,Wibro)终端、平板电脑(personal computer,PC)和智能PC。本申请还可应用于非便携式电子装置,诸如提供相机功能的智能电视。
终端设备也可以包括可穿戴设备。可穿戴设备即可以直接穿戴在用户身上,或是整合到用户的衣服或配件的一种便携式电子设备。可穿戴设备不仅仅是一种硬件设备,更可以通过软件支持以及数据交互、云端交互来实现强大的智能功能,比如:计算功能、定位功能、报警功能,同时还可以连接手机及各类终端。可穿戴设备可以包括但不限于以手腕为支撑的watch类(比如手表、手腕等产品),以脚为支撑的shoes类(比如鞋、袜子或者其他腿上佩戴产品),以头部为支撑的Glass类(比如眼镜、头盔、头带等)以及智能服装,书包、拐杖、配饰等各类非主流产品形态。
下面以实施例的方式对本发明技术方案做进一步的说明,如图1所示,为本发明实施例中点读的方法的一个实施例示意图,可以包括:
101、监听用户在点读过程中的提示音。
在本发明实施例中,终端设备监听用户在点读过程中的提示音。示例性的,终端设备可以通过麦克风监听并保存用户在点读过程中的提示音。
可以理解的是,本发明实施例中所涉及的点读过程,可以应用于电子书籍,也可以应用于纸质书籍,具体不做限定。采集到的提示音可以
这里需要说明的是,在通过麦克风采集所述提示音之前,需要基于语言选择操作设定所述提示音的语种类型。也就是通过.putExtra()方法还需要输入RecognizerIntent.EXTRA_LANGUAGE_MODE语言类型,所述语言类型是客户端语言识别系统能够识别出的语言,其可以是英文,也可以是中文。所述语言类型的设定可以是出厂时就设定好的,当然也可以由用户自行进行设定。例如,当设定的语言类型为英文时,对于用户以中文设定翻页提示音而言,则android.speech.Recognizer Intent会由于无法识别中文的声音信息进而无法完成提示音的设定。
可选的,在本发明的一些实施例中,终端设备监听用户在点读过程中的提示音可以包括:终端设备监听用户在点读过程中的向前翻页的提示音、向后翻页的提示音。
可选的,在本发明的一些实施例中,终端设备从获取到的提示音中过滤环境音对应的声音信息,可以包括:终端设备删除音量小于第一预设音量阈值的声音信息,得到删除后的提示音。判断删除后的提示音与预置的翻页语音库中的声音是否匹配,若匹配,则确定书本已翻页,将所述已翻页的当前页面以图片形式进行缓存,得到缓存图片。
可选的,在本发明的一些实施例中,可以检测终端设备的剩余存储空间,如果剩余存储空间大于特定阈值,则可以直接缓存,得到缓存图片。如果剩余存储空间小于该特定阈值,则可以对存储空间进行清理,得到清理后的存储空间,将已翻页的当前页面以图片形式保存在清开后的存储空间中,得到缓存图片。
102、判断所述提示音与预置的翻页语音库中的声音是否匹配。
在本发明实施例中,终端设备可以判断采集到的提示音与预置的翻页语音库中的声音是否匹配,该提示音包括用户发出的声音信息;在确认所述提示音与预置的翻页语音库是否匹配的过程中,需要将所述提示音进行识别,只有当其识别结果与预置的翻页语音库对应的识别结果相同时,才能确认所述提示音与翻页语音库相匹配。当确认所述提示音与预置的翻页语音库相匹配时,说明用户进行了翻页,此时需要触发与所述提示音对应的翻页操作。
103、若匹配,则确定书本已翻页,将所述已翻页的当前页面以图片形式进行缓存,得到缓存图片。
若所述提示音与预置的翻页语音库中的声音匹配,则终端设备确定书本已翻页,将已翻页的当前页面以图片形式进行缓存,得到缓存图片。
104、提取用户在所述当前页面的点击坐标。
在本发明实施例中,终端设备提取用户在所述当前页面的点击坐标。可以理解的是,该点击坐标可以是用户的手指点击坐标,也可以是点读笔点击坐标,也可以是其他点击坐标,此处具体不做限定。
终端设备包括可承载书本的面板,该面板设置有感应阵列,用于感应点读笔或者手指的触碰动作,在终端设备的内部设置用于定位坐标及响应点读功能的若干模块。终端设备可以根据该定位坐标以及响应点读功能的若干模块,提取用户在当前页面的点击坐标。
105、根据所述点击坐标和所述缓存图片确定待点读语句。
终端设备根据所述点击坐标和所述缓存图片确定待点读语句,可以包括但不限于以下的实现方式:
(1)终端设备在所述缓存图片中确定所述点击坐标对应的待点读语句。
或者,
(2)终端设备判断所述缓存图片与预置的书本图片数据库中的图片是否匹配;若匹配,则终端设备获取对应的目标图片的信息,所述目标图片的信息包括所述目标图片中的点读语句;终端设备根据所述点击坐标,确定所述目标图片的信息中对应的待点读语句。
可以理解的是,该待点读语句可以是点击坐标对应的一段内容,也可以是点击坐标对应行的一行内容,也可以是点击坐标对应的一句内容等,具体不做限定。
106、播放所述待点读语句。
终端设备播放可以在屏幕上突出显示并播放待点读语句,或者,终端设备直接播放待点读语句。可以理解的是,该突出显示的方式,可以是加粗显示、不同颜色显示、不同大小字体显示、不同类型字体显示、加底色显示等方式,具体此处不做限定。在本发明实施例中,因为突出显示并播放待点读语句,可以提高用户的注意力,从而进行高效的学习。
可选的,终端设备播放该待点读语句时,可以检测终端设备的屏幕亮度,如果所述屏幕亮度大于第一预置阈值,则可以将屏幕亮度调低,如果所述屏幕亮度小于第二预置阈值,则可以将屏幕亮度调高。在本发明实施例中,对终端屏幕亮度的调整,使得用户在学习的过程中,也可以起到保护眼睛的作用。
可选的,终端设备播放该待点读语句时,可以检测终端设备的屏幕亮度、也可以检测周围环境的亮度,其中,周围环境的亮度与终端设备的屏幕亮度是成正比的关系。在本发明实施例中,对终端屏幕亮度的调整,使得用户在学习的过程中,也可以起到保护眼睛的作用。
在本发明实施例中,监听用户在点读过程中的提示音;判断所述提示音与预置的翻页语音库中的声音是否匹配;若匹配,则确定书本已翻页,将所述已翻页的当前页面以图片形式进行缓存,得到缓存图片;提取用户在所述当前页面的点击坐标;根据所述点击坐标和所述缓存图片确定待点读语句;播放所述待点读语句。终端设备根据提示音与预置的翻页语音库中的声音是否匹配,从而准确的判断用户是否翻页,若翻页,还可以根据用户的点读操作,进行准确、高效的点读播放,提高用户体验。
如图2所示,为本发明实施例中点读的方法的另一个实施例示意图,可以包括:
201、监听用户在点读过程中的提示音。
202、判断所述提示音与预置的翻页语音库中的声音是否匹配。
203、若匹配,则确定书本已翻页,将所述已翻页的当前页面以图片形式进行缓存,得到缓存图片。
204、提取用户在所述当前页面的点击坐标。
205、根据所述点击坐标和所述缓存图片确定待点读语句。
需要说明的是,本发明实施例中的步骤201-205与图1所示实施例中的步骤101-105类似,此处不再赘述。
206、终端设备监听所述用户在点读过程中的环境音。
示例性的,终端设备可以通过麦克风监听并保存用户在点读过程中的环境音。
207、终端设备判断所述环境音是否大于预置阈值。
208、若大于,则终端设备检测终端设备是否连接无线耳机。
终端设备可以检测是否连接无线耳机,因为环境音如果太大的话,通过终端设备的扬声器播放的话,播放的效果不好,用户可能听不清楚。所以,如果终端设备判断环境音大于预置阈值的话,可以检测是否连接无线耳机。
209、若连接,则终端设备通过所述无线耳机播放所述待点读语句。
若连接,则终端设备可以通过所述无线耳机播放所述待点读语句,这样的话,用户听到的内容很清晰,提高了用户学习的效率。
可选的,在本发明的一些实施例中,终端设备剔除音量小于第二预设音量阈值的环境音,得到删除后的环境音。终端设备判断所述删除后的环境音是否大于预置阈值;若大于,则终端设备检测终端设备是否连接无线耳机;若连接,则终端设备通过所述无线耳机播放所述待点读语句。
在本发明实施例中,监听用户在点读过程中的提示音;判断所述提示音与预置的翻页语音库中的声音是否匹配;若匹配,则确定书本已翻页,将所述已翻页的当前页面以图片形式进行缓存,得到缓存图片;提取用户在所述当前页面的点击坐标;根据所述点击坐标和所述缓存图片确定待点读语句;播放所述待点读语句。终端设备根据提示音与预置的翻页语音库中的声音是否匹配,从而准确的判断用户是否翻页,若翻页,还可以根据用户的点读操作,进行准确、高效的点读播放,提高用户体验。进一步的,当环境音过大的时候,可以使用无线耳机来播放待点读语句,使得用户更清楚的听到待点读语句。
可选的,在本发明的一些实施例中,终端设备提取用户在所述当前页面的点击坐标,可以包括:当接收到用户触发的点击指令时,根据所述点击指令获取对应的点击坐标。进一步的,终端设备根据所述点击坐标查找对应的视图ID,并通过所述视图ID获取对应的视图。
在本发明实施例中,当接收到用户触发的点击指令时,根据该点击指令获取对应的点击坐标信息,然后可以通过该点击坐标信息查找到目标点击对象所在的窗口,进而通过逐层查找,查找到该点击坐标信息对应的视图ID,最后通过该视图ID获取到对应的视图。需要说明的是,终端设备中的窗口是由一系列的视图按照一定的布局组织起来的,每个视图各对应一个视图ID,因此查找到视图ID即可获取到对应的视图。例如,用户接收到某一短信息时,点击该条短信息,即可触发点击指令,然后根据用户触发的点击坐标信息,即用户进行点击操作时的坐标信息,然后根据该点击坐标信息查找到该短信息所在窗口,即为短信阅读窗口,该短信阅读窗口可以包括多个视图,例如发件人信息对应的文字视图、发件人头像对应的图片视图和手机屏幕内显示的多条短信息分别对应的多个文字视图等。然后通过逐层查找,查找到该点击坐标信息对应的视图ID,进而通过该视图ID获取到对应的视图。
终端设备根据所述视图的属性判断所述视图是否为文字视图;当所述视图为文字视图时,终端设备根据所述视图获取对应的文字信息。
在本发明实施例中,当获取到对应的视图时,根据视图的属性判断该视图是否为文字视图,当该视图为文字视图时,根据该视图获取对应的文字信息。例如当用户在短信息阅读窗口点击某一短信息时,根据视图的属性可以判断该短信息对应的视图为文字视图,进而根据该视图获取到对应的文字信息,即该短信息。当用户在短信息阅读窗口点击发件人头像时,则根据视图的属性可以判断该发件人头像对应的视图为图片视图,此时,停止后续点读程序的运行。
可选的,在本发明的一些实施例中,高亮显示所述文字信息。即当终端设备接收到用户触发的点击指令时,高亮显示对应的文字信息,从而提示用户再次确认自己所选择的目标点读对象。其中,高亮显示颜色可以采用系统默认的颜色,也可以采用用户预先设定的颜色。
可选的,在本发明的一些实施例中,通过终端设备的文字转语音模组将该文字信息转换成对应的音频文件并进行播放。因此,本发明无需预置对应的音频文件,可节约终端内存,降低内存开销。而且,本发明只需用户触发的点击指令所对应的视图为文字视图时,即可获取到文字视图内的文字信息,并通过终端设备的文字转语音模组将文字信息转换成对应的音频文件,可适用于各种文字信息的阅读场景,如电子书阅读、聊天信息阅读、网页文字信息阅读灯,解决了现有的终端只适用于点读预置有对应音频文件的文字信息,适用场景较少的技术问题。
可选的,在本发明的一些实施例中,确定所述文字信息的字符数及所述音频文件的时长;在播放所述音频文件时,根据所述文字信息的字符数及所述音频文件的时长按预设规则显示对应的点读进度。
在本发明实施例中,当根据文字信息转换成对应的音频文件后,获取该文字信息的字符数及该音频文件的时长,然后在播放音频文件时,根据文字信息的字符数及音频文件的时长按预设规则显示对应的点读进度。具体的,可以根据文字信息的字符数及音频文件的时长可计算出每个字符占用的播放时间,每个字符占用的播放时间=音频文件的时长/文字信息的字符数,此外,在将文字信息转换成音频文件时可能不识别转化文字信息中的标点符号、空格等,此时,文字信息的字符数可以为减去标点符号、空格等占用字符数后的剩余字符数。此外,点读进度的显示方式可以包括改变文字字体颜色,还可以包括加粗、添加文字背景颜色、添加下划线等方式。例如,当获得的文字信息为“确定所述文字信息的字符数及所述音频文件的时长”,字符数为22个,对应的音频文件的时长为22s时,则每1s播报一个字符,当文字信息的字体颜色为黑色时,在播放时,当播到第7s时,即“信”字时,可以单独改变“信”字的字体颜色为黄色,也可以每播报一个字时,均改变其字体颜色为黄色,当播到第7s时,则前7个字“确定所述文字信”的字体颜色均为黄色。本发明实施例可适用于阅读、识字等场景,可帮助用户(尤其是小孩)识字、学习,也可以帮助用户快速了解点读进度。
可选的,在本发明的一些实施例中,当再次接收到所述点击指令时,调用所述音频文件并进行播放。
在本发明实施例中,当终端再次接收到所述点击指令时,调用该音频文件并进行播放,本发明是实施例可以在用户未听清或用户想要重复播放的情况下,可以直接调用该音频文件进行播放,无需重新转换,从而可提高音频文件的加载速度。需要说明的是,再次接收到所述点击指令是指在同一文字信息(即目标点读对象)所在区域内,再次接收到用户触发的点读操作(如点击或其他预设的特定方法),而并不仅仅限于在手机屏幕的同一坐标位置上再次接收到用户触发的点读操作。
可选的,在本发明的一些实施例中,当检测到用户退出所述点击指令对应的窗口时,删除所述音频文件。
在本发明实施例中,当用户退出该点击指令所对应的窗口时,删除该音频文件,从而释放移动终端的内存资源,有利于移动终端的快速运行。当然,在具体实施例中,还可以暂时将该音频文件保存在某一内存区,以防用户近期还需点读该文字信息时,可以直接调用该音频文件,从而无需重新将文字信息转换成音频文件,可提高音频文件的加载速度,然后,在预设时间后,删除该内存区的音频文件,其中,预设时间可以用户根据自身的需要进行选择设置。
可选的,在本发明的一些实施例中,确定所述文字信息的语种;当所述文字信息的语种为中文时,对所述文字信息进行拼音标注;当所述文字信息的语种为英文时,对所述文字信息进行音标标注。
本发明实施例中主要适用于用户进行语言学习的场景,当终端获取到对应的文字信息后,进一步确定该文字信息的语种,当所述文字信息的语种为中文时,对所述文字信息进行拼音标注;当所述文字信息的语种为英文时,对所述文字信息进行音标标注。通过标注读音的方式,方便用户进行语言学习,提升用户体验。
需要说明的是,具体实施例中,文字信息的语种并不仅限于中文和英文,还可以包括其他种类的语言,例如韩文、日文等,当确定出文字信息的语种后,对应的进行读音标注。
如图3所示,为本发明实施例中终端设备的一个实施例示意图,可以包括:
监听模块301,用于监听用户在点读过程中的提示音;
判断模块302,用于判断所述提示音与预置的翻页语音库中的声音是否匹配;
缓存模块303,用于若匹配,则确定书本已翻页,将所述已翻页的当前页面以图片形式进行缓存,得到缓存图片;
提取模块304,用于提取用户在所述当前页面的点击坐标;
确定模块305,用于根据所述点击坐标和所述缓存图片确定待点读语句;
播放模块306,用于播放所述待点读语句。
可选的,在本发明的一些实施例中,
确定模块305,具体用于在所述缓存图片中确定所述点击坐标对应的待点读语句。
可选的,在本发明的一些实施例中,
确定模块305,具体用于判断所述缓存图片与预置的书本图片数据库中的图片是否匹配;若匹配,则获取对应的目标图片的信息,所述目标图片的信息包括所述目标图片中的点读语句;根据所述点击坐标,确定所述目标图片的信息中对应的待点读语句。
可选的,在本发明的一些实施例中,
确定模块305,具体用于将所述点击坐标通过图搜转换算法转换成所述目标图片上的目标坐标;根据所述目标坐标确定所述目标图片的信息中对应的待点读语句,所述目标图片的信息包括所述目标图片中的点读语句。
可选的,在本发明的一些实施例中,
播放模块306,用于监听所述用户在点读过程中的环境音;判断所述环境音是否大于预置阈值;若大于,则检测终端设备是否连接无线耳机;若连接,则通过所述无线耳机播放所述待点读语句。
如图4所示,为本发明实施例中终端设备的另一个实施例示意图,可以包括:
存储有可执行程序代码的存储器401;
与存储器401耦合的处理器402;
处理器402调用存储器401中存储的所述可执行程序代码,用于执行如下步骤:
监听用户在点读过程中的提示音;
判断所述提示音与预置的翻页语音库中的声音是否匹配;
若匹配,则确定书本已翻页,将所述已翻页的当前页面以图片形式进行缓存,得到缓存图片;
提取用户在所述当前页面的点击坐标;
根据所述点击坐标和所述缓存图片确定待点读语句;
播放所述待点读语句。
可选的,在本发明的一些实施例中,处理器402具体用于执行如下步骤:
在所述缓存图片中确定所述点击坐标对应的待点读语句。
可选的,在本发明的一些实施例中,处理器402具体用于执行如下步骤:
判断所述缓存图片与预置的书本图片数据库中的图片是否匹配;
若匹配,则获取对应的目标图片的信息,所述目标图片的信息包括所述目标图片中的点读语句;
根据所述点击坐标,确定所述目标图片的信息中对应的待点读语句。
可选的,在本发明的一些实施例中,处理器402具体用于执行如下步骤:
将所述点击坐标通过图搜转换算法转换成所述目标图片上的目标坐标;
根据所述目标坐标确定所述目标图片的信息中对应的待点读语句,所述目标图片的信息包括所述目标图片中的点读语句。
可选的,在本发明的一些实施例中,处理器402具体用于执行如下步骤:
监听所述用户在点读过程中的环境音;
判断所述环境音是否大于预置阈值;
若大于,则检测终端设备是否连接无线耳机;
若连接,则通过所述无线耳机播放所述待点读语句。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种点读的方法,其特征在于,包括:
监听用户在点读过程中的提示音;
判断所述提示音与预置的翻页语音库中的声音是否匹配;
若匹配,则确定书本已翻页,将所述已翻页的当前页面以图片形式进行缓存,得到缓存图片;
提取用户在所述当前页面的点击坐标;
根据所述点击坐标和所述缓存图片确定待点读语句;
播放所述待点读语句。
2.根据权利要求1所述的方法,其特征在于,所述根据所述点击坐标和所述缓存图片确定待点读语句,包括:
在所述缓存图片中确定所述点击坐标对应的待点读语句。
3.根据权利要求1所述的方法,其特征在于,所述根据所述点击坐标和所述缓存图片确定待点读语句,包括:
判断所述缓存图片与预置的书本图片数据库中的图片是否匹配;
若匹配,则获取对应的目标图片的信息,所述目标图片的信息包括所述目标图片中的点读语句;
根据所述点击坐标,确定所述目标图片的信息中对应的待点读语句。
4.根据权利要求3所述的方法,其特征在于,所述根据所述点击坐标,确定所述目标图片的信息中对应的待点读语句,包括:
将所述点击坐标通过图搜转换算法转换成所述目标图片上的目标坐标;
根据所述目标坐标确定所述目标图片的信息中对应的待点读语句,所述目标图片的信息包括所述目标图片中的点读语句。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述播放所述待点读语句,包括:
监听所述用户在点读过程中的环境音;
判断所述环境音是否大于预置阈值;
若大于,则检测终端设备是否连接无线耳机;
若连接,则通过所述无线耳机播放所述待点读语句。
6.一种终端设备,其特征在于,包括:
监听模块,用于监听用户在点读过程中的提示音;
判断模块,用于判断所述提示音与预置的翻页语音库中的声音是否匹配;
缓存模块,用于若匹配,则确定书本已翻页,将所述已翻页的当前页面以图片形式进行缓存,得到缓存图片;
提取模块,用于提取用户在所述当前页面的点击坐标;
确定模块,用于根据所述点击坐标和所述缓存图片确定待点读语句;
播放模块,用于播放所述待点读语句。
7.根据权利要求6所述的终端设备,其特征在于,
所述确定模块,具体用于在所述缓存图片中确定所述点击坐标对应的待点读语句。
8.根据权利要求6所述的终端设备,其特征在于,
所述确定模块,具体用于判断所述缓存图片与预置的书本图片数据库中的图片是否匹配;若匹配,则获取对应的目标图片的信息,所述目标图片的信息包括所述目标图片中的点读语句;根据所述点击坐标,确定所述目标图片的信息中对应的待点读语句。
9.根据权利要求8所述的终端设备,其特征在于,
所述确定模块,具体用于将所述点击坐标通过图搜转换算法转换成所述目标图片上的目标坐标;根据所述目标坐标确定所述目标图片的信息中对应的待点读语句,所述目标图片的信息包括所述目标图片中的点读语句。
10.根据权利要求6-9中任一项所述的终端设备,其特征在于,
所述播放模块,用于监听所述用户在点读过程中的环境音;判断所述环境音是否大于预置阈值;若大于,则检测终端设备是否连接无线耳机;若连接,则通过所述无线耳机播放所述待点读语句。
CN202010266681.1A 2020-04-07 2020-04-07 一种点读的方法及终端设备 Active CN111506744B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010266681.1A CN111506744B (zh) 2020-04-07 2020-04-07 一种点读的方法及终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010266681.1A CN111506744B (zh) 2020-04-07 2020-04-07 一种点读的方法及终端设备

Publications (2)

Publication Number Publication Date
CN111506744A true CN111506744A (zh) 2020-08-07
CN111506744B CN111506744B (zh) 2024-03-19

Family

ID=71877451

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010266681.1A Active CN111506744B (zh) 2020-04-07 2020-04-07 一种点读的方法及终端设备

Country Status (1)

Country Link
CN (1) CN111506744B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09161453A (ja) * 1995-12-13 1997-06-20 Nec Corp 音声出力制御装置
WO2010002275A2 (en) * 2008-07-04 2010-01-07 Isoundtrack Limited Method and system for making and playing soundtracks
CN105447499A (zh) * 2015-10-23 2016-03-30 北京爱乐宝机器人科技有限公司 一种图书互动方法、装置和设备
CN107205076A (zh) * 2016-03-16 2017-09-26 广州阿里巴巴文学信息技术有限公司 一种电子书的翻页方法及装置
CN107748645A (zh) * 2017-09-27 2018-03-02 努比亚技术有限公司 点读方法、移动终端及计算机可读存储介质
CN107967110A (zh) * 2017-11-30 2018-04-27 广东小天才科技有限公司 播放方法、播放装置、电子设备及计算机可读存储介质
CN109240582A (zh) * 2018-08-30 2019-01-18 广东小天才科技有限公司 一种点读控制方法及智能设备
CN110766996A (zh) * 2019-10-14 2020-02-07 广东小天才科技有限公司 一种点读内容定位方法、装置、电子设备及存储介质
CN110956138A (zh) * 2019-12-02 2020-04-03 广东小天才科技有限公司 一种基于家教设备的辅助学习方法及家教设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09161453A (ja) * 1995-12-13 1997-06-20 Nec Corp 音声出力制御装置
WO2010002275A2 (en) * 2008-07-04 2010-01-07 Isoundtrack Limited Method and system for making and playing soundtracks
CN105447499A (zh) * 2015-10-23 2016-03-30 北京爱乐宝机器人科技有限公司 一种图书互动方法、装置和设备
CN107205076A (zh) * 2016-03-16 2017-09-26 广州阿里巴巴文学信息技术有限公司 一种电子书的翻页方法及装置
CN107748645A (zh) * 2017-09-27 2018-03-02 努比亚技术有限公司 点读方法、移动终端及计算机可读存储介质
CN107967110A (zh) * 2017-11-30 2018-04-27 广东小天才科技有限公司 播放方法、播放装置、电子设备及计算机可读存储介质
CN109240582A (zh) * 2018-08-30 2019-01-18 广东小天才科技有限公司 一种点读控制方法及智能设备
CN110766996A (zh) * 2019-10-14 2020-02-07 广东小天才科技有限公司 一种点读内容定位方法、装置、电子设备及存储介质
CN110956138A (zh) * 2019-12-02 2020-04-03 广东小天才科技有限公司 一种基于家教设备的辅助学习方法及家教设备

Also Published As

Publication number Publication date
CN111506744B (zh) 2024-03-19

Similar Documents

Publication Publication Date Title
CN106251869B (zh) 语音处理方法及装置
US11917344B2 (en) Interactive information processing method, device and medium
CN111898388B (zh) 视频字幕翻译编辑方法、装置、电子设备及存储介质
CN104078038B (zh) 一种页面内容朗读方法和装置
CN110781813B (zh) 图像识别方法及装置、电子设备和存储介质
CN108304412B (zh) 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置
CN110989847B (zh) 信息推荐方法、装置、终端设备及存储介质
CN113343675B (zh) 一种字幕生成方法、装置和用于生成字幕的装置
CN108538284A (zh) 同声翻译结果的展现方法及装置、同声翻译方法及装置
KR20090068380A (ko) 개선된 이동 통신 단말
CN110633017A (zh) 一种输入方法、装置和用于输入的装置
CN111128254B (zh) 音频播放方法、电子设备及存储介质
CN113255377A (zh) 一种翻译方法、装置、电子设备及存储介质
CN110379406B (zh) 语音评论转换方法、系统、介质和电子设备
JP2024064941A (ja) 表示方法、装置、ペン型電子辞書、電子機器及び記憶媒体
CN111523532A (zh) 一种矫正ocr文字识别错误的方法及终端设备
CN113033163B (zh) 一种数据处理方法、装置和电子设备
CN112163433B (zh) 关键词汇的匹配方法、装置、电子设备及存储介质
CN114241471A (zh) 视频文本识别方法、装置、电子设备及可读存储介质
CN112381091B (zh) 视频内容识别方法、装置、电子设备及存储介质
CN114745585B (zh) 字幕显示方法、装置、终端和存储介质
CN110780749B (zh) 一种字符串纠错方法和装置
CN111506744B (zh) 一种点读的方法及终端设备
CN114154467B (zh) 结构图片还原方法、装置、电子设备、介质及程序产品
US20140297285A1 (en) Automatic page content reading-aloud method and device thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant