CN105824428A - 一种有声阅读方法 - Google Patents

一种有声阅读方法 Download PDF

Info

Publication number
CN105824428A
CN105824428A CN201610204832.4A CN201610204832A CN105824428A CN 105824428 A CN105824428 A CN 105824428A CN 201610204832 A CN201610204832 A CN 201610204832A CN 105824428 A CN105824428 A CN 105824428A
Authority
CN
China
Prior art keywords
time
time length
reading method
determination
text data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610204832.4A
Other languages
English (en)
Other versions
CN105824428B (zh
Inventor
苏鹰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou Changle District Extremely Micro Information Technology Co., Ltd.
Original Assignee
Fuzhou Mawei District Small And Micro Invention Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou Mawei District Small And Micro Invention Information Technology Co ltd filed Critical Fuzhou Mawei District Small And Micro Invention Information Technology Co ltd
Priority to CN201610204832.4A priority Critical patent/CN105824428B/zh
Publication of CN105824428A publication Critical patent/CN105824428A/zh
Application granted granted Critical
Publication of CN105824428B publication Critical patent/CN105824428B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • G06F3/015Input arrangements based on nervous system activity detection, e.g. brain waves [EEG] detection, electromyograms [EMG] detection, electrodermal response detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/02Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators
    • G06F15/025Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators adapted to a specific application
    • G06F15/0291Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators adapted to a specific application for reading, e.g. e-books
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/01Indexing scheme relating to G06F3/01
    • G06F2203/011Emotion or mood input determined on the basis of sensed human body parameters such as pulse, heart rate or beat, temperature of skin, facial expressions, iris, voice pitch, brain activity patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • Neurology (AREA)
  • Dermatology (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Neurosurgery (AREA)
  • Biomedical Technology (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Computing Systems (AREA)
  • Telephone Function (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明实施例提供一种有声阅读方法,其特征在于,包括以下步骤:获取文本数据;播放语音数据:将所述文本数据转换为语音数据播放;给出判定提示信息;检测判定触发信号;第一判定步骤:根据执行所述检测判定触发信号步骤的检测结果,对使用者是否已入睡进行判定;如果所述第一判定步骤的判定结果为使用者已入睡,则停止播放所述语音数据。本发明实施例通过引入交互式操作并检测判定触发信号的方式,有效地实现了入睡检测功能,并以此控制有声阅读是否停止,具有较优的用户体验。

Description

一种有声阅读方法
技术领域
本发明涉及移动设备阅读领域,特别涉及一种具有入睡检测功能的移动设备阅读方法。
背景技术
随着移动设备,包括手机、平板等的普及,越来越多的使用者开始使用移动设备阅读电子书籍。由于长时间阅读容易产生眼睛疲劳,开发者引入了语音合成技术,将文本数据转换为语音播放,使得主流移动设备阅读应用具有了有声阅读的功能,也让许多使用者产生了利用碎片化时间,例如临睡前,以有声阅读的方式听书的习惯。其中,在临睡前听书的应用场景下,由于移动设备通常并不具有入睡检测功能,因此无法在使用者入睡后自动有声阅读,造成了使用上的不便。
发明内容
为此,本发明实施例提供一种有声阅读方法,其特征在于,包括以下步骤:
获取文本数据;
播放语音数据:将所述文本数据转换为语音数据播放;
给出判定提示信息;
检测判定触发信号;
第一判定步骤:根据执行所述检测判定触发信号步骤的检测结果,对使用者是否已入睡进行判定;
如果所述第一判定步骤的判定结果为使用者已入睡,则停止播放所述语音数据。
本发明实施例通过引入交互式操作并检测判定触发信号的方式,有效地实现了入睡检测功能,并以此控制有声阅读是否停止,具有较优的用户体验。
附图说明
图1为本发明一种有声阅读方法的一个实施例的流程示意图。
具体实施方式
为详细说明技术方案的技术内容、构造特征、所实现目的及效果,以下结合具体实施例并配合附图详予说明。
实施例101
图1为本发明的一种有声阅读方法的一个实施例(以下简称实施例101)的流程示意图,该实施例包括以下步骤:
获取文本数据,获取方式可以是由使用者输入或指定,通过服务端下载,读取本地文件等,譬如,读取移动设备SD卡上的文本文件;
播放语音数据:将所述文本数据转换为语音数据播放,例如,使用本地语音合成引擎或云端语音合成引擎,譬如使用讯飞语音、百度语音等第三方云端语音合成引擎,将文本数据转换为语音数据播放;
给出判定提示信息,例如,播放提示音;
检测判定触发信号,譬如可以包括通过移动设备传感器检测所述移动设备是否被敲击、移动或振动,也可以包括使用距离传感器检测使用者是否将用手靠近设备,还可以包括使用摄像头检测使用者是否将手掠过摄像头上方,以及利用触控屏幕检测用户是否触摸屏幕等;
第一判定步骤:根据执行所述检测判定触发信号步骤的检测结果,对使用者是否已入睡进行判定,譬如,如果在一定时长T内未检测到所述判定触发信号,则判定结果为使用者已入睡,反之,如果在所述时长T内检测到所述判定触发信号,则判定结果为使用者未入睡,T取值范围为(0,10],可以为3、5、7、9等(单位:秒);
如果所述第一判定步骤的判定结果为使用者已入睡,则停止执行所述播放语音数据的步骤。
该实施例通过引入交互式操作并检测判定触发信号的方式控制有声阅读的停止,可以有效实现在使用者入睡时停止有声阅读的功能,提升用户体验。
实施例102
下面给出本发明的实施例102,该实施例是在实施例101基础上的优选和/或改进,包括以下步骤:
获取第一时间长度,所述第一时间长度为一固定或可变的时间长度;
获取第二时间长度,所述第二时间长度为一固定或可变的时间长度;
其中,所述第一时间长度和第二时间长度可以由多种方式获得,可以包括直接写入程序代码,运行时以读取变量值的方式获取,也可以包括由本地的配置文件获取,或根据用户设置获取,也可以是保存在服务器由通过网络获取,还可以是根据初始值及相应算法策略在本地或服务端计算获得;
并且:
所述给出判定提示信息的步骤执行于执行所述播放语音数据步骤的期间,并以时间长度为所述第一时间长度的时间间隔重复多次执行;
所述第一判定步骤被执行多次,并且每次执行均开始于开始执行所述给出判定提示信息步骤之后的第二时间长度内;
其中,所述第一时间长度的取值范围可以是[30,600],譬如30、45、60、90、120、180、240、300、400、500等(单位:秒),所述第二时间长度的取值范围可以是[0,10],譬如0、0.1、0.5、1、2、5、7、9等(单位:秒),具体来说,以应用于移动设备为例,可以以300秒的时间间隔重复执行所述给出判定提示信息的步骤,并在开始执行所述给出判定提示信息的步骤之后10秒内开始执行所述第一判定步骤;以上步骤被重复执行,可以在所述第一判定步骤给出使用者已入睡的判定结果时停止以上步骤的重复执行。
通过以上方式,可以更加有效地实现入睡检测功能,并使用入睡检测的结果产生更优的用户体验。
实施例103
下面给出本发明的实施例103,该实施例是在实施例102基础上的优选和/或改进,包括:
保存位置记录点,所述位置记录点用于记录所述文本数据已被转换为语音数据播放的位置,所述位置记录点可以表示为文本数据的字符位置,譬如,当前文本数据已被转换为语音数据并播放了200个字符,那么就可以将200作为位置记录点保存,所述位置记录点还可以表示为结构化的记录,譬如,以集合{2,3,1}表示第2章第3段第1行、以集合{5,1,3}表示第5章第1段第3行等等;所述位置记录点也可以表示为文件的字节位置,或者对应语音播放的时间位置等待。
所述位置记录点落在第一位置与第二位置之间,其中:
所述第一位置的获取方法具体为:当执行所述第一判定步骤获取的判定结果为使用者已入睡时,将该时刻所述文本数据已被转换为语音数据播放的位置记为所述第一位置;
譬如,在某一次执行第一判定步骤时,由于在一定时长内未检测到所述判定触发信号,判定结果为使用者已入睡,停止执行所述播放语音数据的步骤,此时所述文本数据已经被转换为语音数据播放的位置,譬如已被转换为语音数据播放至第300个字符、第3章第4段第5行等等,即为所述第一位置。
所述第二位置的获取方法具体为:以所述第一位置对应的执行所述第一判定步骤的时刻为基准,将在该时刻之前,最近一次执行所述第一判定步骤时所述文本数据已被转换为语音数据播放的位置记为所述第二位置;
譬如,所述第一判定步骤一共执行了5次,其中第5次执行的判定结果为使用者已入睡,并停止执行所述播放语音数据的步骤,此时所述第一位置与所述第一判定步骤的第5次执行相对应,以所述第一判定步骤的第5次执行的时刻为基准,将在该时刻之前,最近一次执行所述第一判定步骤时,也就是第4次执行所述第一判定步骤时所述文本数据已被转换为语音数据播放的位置记为所述第二位置;
如果所述第一位置对应的所述第一判定步骤的执行为首次执行,则将所述文本数据的起始位置记为所述第二位置;
譬如,如果第一位置对应的所述第一判定步骤的执行恰好是第1次执行,无法往前追溯上一次执行所述第一判定步骤的时刻,那么直接将所述文本数据的起始位置即为所述第二位置,譬如第1个字符、第1章第1段第1行等等。
通过以上方式,可以更好地利用入睡检测的结果,估计出入睡时有声阅读的位置,方便下次使用。
实施例104
下面给出本发明的实施例104,该实施例是在实施例103基础上的优选和/或改进,包括:
保存多个位置记录点;
显示所述多个位置记录点,譬如以移动设备应用为例,可以呈现一个UI界面,并以列表方式将所述多个位置记录点展示给用户;
所述多个位置记录点包括:
第一位置记录点:记录所述第一位置;
第二位置记录点:记录所述第二位置;
第三位置记录点:记录处于所述第一位置与第二位置之间的所述文本数据已被转换为语音数据并播放的位置。
通过以上方式,可以在估计入睡时间不够精确时,也能让使用者自行选择可能正确的位置,方便使用。
实施例105
下面给出本发明的实施例105,该实施例是在实施例102基础上的优选和/或改进,包括:
所述第一时间长度不小于人脑EEG中Delta波的最大周期的时间长度。
脑电波是是一些自发的有节律的神经电活动,其频率变动范围在每秒1-30次之间的,可划分为四个波段,即δ(1-3Hz)、θ(4-7Hz)、α(8-13Hz)、β(14-30Hz)。请注意本发明中所述Delta波指上述δ(1-3Hz)波段,Delta波通常表征极度疲劳和昏睡或麻醉状态,其最大和最小周期的时间长度相应地分别为1s和0.33s。
实施例106
下面给出本发明的实施例106,该实施例是在实施例102基础上的优选和/或改进,包括:
所述第一时间长度不小于短时记忆在无复述情况下的最大保持时间。
短时记忆(short-termmemory)简称STM,是一种认知资源集中于一小部分心理表征的内在机制,短时记忆在无复述情况下的最大保持时间为1分钟。
实施例107
下面给出本发明的实施例107,该实施例是在实施例102基础上的优选和/或改进,包括:
判定是否增加或减少所述第一时间长度,并根据判定结果增加所述第一时间长度或减少所述第一时间长度。
实施例108
下面给出本发明的实施例108,该实施例是在实施例107基础上的优选和/或改进,包括:
设所述第一时间长度当前为Xi秒,令Xi+1=Xi+A*(B-Xi)p(C-Xi)1-p+N(0,D),其中p=1或0,0<A≤1,60≤B≤300,0<C≤30,N(0,D)表示一个随机数,该随机数由均值为0,方差为D的高斯分布产生,其中0<D≤10;然后将Xi+1约束在区间[C,B]内,即如果Xi+1大于B,则将Xi+1置为B,如果Xi+1小于C,则将Xi+1置为C;执行所述增加所述第一时间长度的步骤包括:将p置为1,计算Xi+1并将所述第一时间长度由Xi秒变化为Xi+1秒;执行所述减少所述第一时间长度的步骤包括:将p置为0,计算Xi+1并将所述第一时间长度由Xi秒变化为Xi+1秒;其中所述第一时间长度初始值取值在区间[C,B]内(单位:秒)。优选地,所述第一时间长度初始值取值为30秒,A取值为0.2、0.3或0.5,B取值为90、120、150、180或240,D取值3、4、5或6,C取值为5、7、9、10、12、15、20或25。
通过以上方式,可以在减少对使用者打扰及较准确估计入睡时间之间取得较好的平衡。
实施例109
下面给出本发明的实施例109,该实施例是在实施例101基础上的优选和/或改进,包括:所述给出判定提示信息的步骤包括控制终端设备或其部件运动或振动、播放提示音、显示图像、播放视频和/或控制一个或多个指示灯变化。
实施例110
下面给出本发明的实施例110,该实施例是在实施例109基础上的优选和/或改进,包括:
所述给出判定提示信息的步骤包括播放提示音,并且执行所述播放提示音的步骤时,与用于播放所述提示音的扬声器的直线距离50CM处的声压测量值不超过2.1×10-3Pa,譬如可以是1.1×10-3Pa、3.1×10-4Pa或者7.1×10-5Pa等,优选地,该参数可通过允许音量调整等方式让使用者可配置;如有多个扬声器,设一共有Nsp2个扬声器,则对于其中任意一个扬声器SP2,在其他扬声器静音时,与所述扬声器SP2的直线距离50CM处的声压测量值不超过2.1×(log2Nsp2)-1×10-3Pa,譬如,一共有4个扬声器,则对于其中任意一个扬声器SP2,在其他扬声器静音时,与所述扬声器SP2的直线距离50CM处的声压测量值为1.5×(log24)-1×10-3Pa、2.3×(log24)-1×10-4Pa或者9.1×(log24)-1×10-5Pa等,再譬如,一共有3个扬声器,则对于其中任意一个扬声器SP2,在其他扬声器静音时,与所述扬声器SP2的直线距离50CM处的声压测量值为1.2×(log23)-1×10-3Pa、4.8×(log23)-1×10-4Pa或者5.9×(log23)-1×10-5Pa等。
由于播放提示音时,使用者可能已经处于入睡或将要入睡阶段,采用上述方案可以达到较好的用户体验。
实施例111
下面给出本发明实施例111,该实施例是在实施例109基础上的优选和/或改进,包括:
所述给出判定提示信息的步骤具体包括播放提示音频,所述提示音频的主频率不小于人脑EEG中Alpha波的频率上限。
脑电波是是一些自发的有节律的神经电活动,其频率变动范围在每秒1-30次之间的,可划分为四个波段,即δ(1-3Hz)、θ(4-7Hz)、α(8-13Hz)、β(14-30Hz)。请注意本专利中Alpha波及指上述α(8-13Hz)波段。
实施例112
下面给出本发明实施例112,该实施例是在实施例101~111任一基础上的优选和/或改进,包括:
所述检测判定触发信号的步骤具体为,使用摄像头检测物体运动。
所述第一判定步骤具体为,当使用摄像头检测到物体运动时,譬如使用者用手掠过摄像头正面,给出使用者未入睡的判定结果;如果在一定时长内未检测到物体运动,则给出使用者已入睡的判定结果。
实施例113
下面给出本发明实施例113,该实施例是在实施例101~111任一基础上的优选和/或改进,包括:
第一判定步骤具体为:获取检测时间窗长度,所述时间窗长度为一时间长度,取值范围为[1,30](单位:秒);如果在所述检测时间窗长度内检测到所述判定触发信号,则给出使用者未入睡的判定结果;如果在所述检测时间窗长度内未检测到所述判定触发信号,则给出使用已入睡的判定结果。
实施例114
下面给出本发明实施例114,该实施例是在实施例101~111任一基础上的优选和/或改进,包括:
所述检测判定触发信号的步骤具体为,使用距离传感器获取传感数据,距离传感器又叫位移传感器,距离传感器一般都在手机听筒的两侧或者是在手机听筒凹槽中,这样便于它的工作。当用户在接听或拨打电话时,将手机靠近头部,距离传感器可以测出之间的距离到了一定程度后便通知屏幕背景灯熄灭,拿开时再度点亮背景灯,这样更方便用户操作也更为节省电量。
所述第一判定步骤具体为,当所述距离传感器检测到物体接近时,譬如使用者用手接近所述距离传感器时,给出使用者未入睡的判定结果;如果所述距离传感器在一定时长内未检测到物体接近,则给出使用者已入睡的判定结果。
实施例115
下面给出本发明实施例115,该实施例是在实施例109基础上的优选和/或改进,包括:
所述给出判定提示信息的步骤包括播放提示音,所述提示音的频谱平衡点高于所述文本数据转换得到的语音数据的频谱平衡点;所述频谱平衡点的计算方法为:给定音频,在所述音频频谱范围中搜索一个频率点,使高于该频率点部分的能量与低于该频点部分的能量大致相等,则所述频率点为所述音频的频谱平衡点。
通过以上方式,可以使所述提示音更容易被使用者感知,特别是当所述提示音的音量被限制时效果尤为明显。
实施例116
下面给出本发明的实施例116,该实施例是在实施例107基础上的优选和/或改进,包括:
获取第三时间长度,所述第三时间长度可以由多种方式获得,可以包括直接写入程序代码,运行时以读取变量值的方式获取,也可以包括由本地的配置文件获取,或根据用户设置获取,也可以是保存在服务器由通过网络获取,还可以是根据初始值及相应算法策略在本地或服务端计算获得,所述第三时间长度可以优选为3~9秒,譬如3.1秒、3.5秒、4秒、4.5秒、5秒、6秒、7秒、8秒等;
如果所述第一判定步骤的一次执行完成于开始执行所述给出判定提示信息步骤之后的第三时间长度内,并且所述第一判定步骤的本次执行的结果为使用者未入睡,则增加所述第一时间长度;
如果所述第一判定步骤的一次执行完成于开始执行所述给出判定提示信息步骤之后的第三时间长度以后,并且所述第一判定步骤的本次执行的结果为使用者未入睡,则减少所述第一时间长度。
实施例117
下面给出本发明的实施例117,该实施例是在实施例107基础上的优选和/或改进,包括:
获取陀螺仪和/或加速度传感器数据;
获取第一阈值;
将所述传感器数据的变化率与所述第一阈值比较;
判定是否存在敲击、振动和/或摇动,如果判定结果为否,则给出使用者已入睡的判定结果;
获取第二阈值;
将所述传感器数据的变化率与所述第二阈值比较;
判定是否增加或者减少所述第一时间长度。
以手机、PAD等移动设备上的应用场景举例来说,在给出判定提示信息后,获取陀螺仪和/或加速度传感器数据,并将所述传感器数据的变化率与所述第一阈值比较,如果使用者敲击、振动和/或摇动移动设备,此时所述变化率通常会大于所述第一阈值,这样就给出使用者未入睡的判定结果;反之,如果使用者没有敲击、振动和/或摇动移动设备,此时陀螺仪和/或加速度传感器数据的变化率通常小于所述第一阈值,这样就给出使用者已入睡的判定结果;更进一步地,在给出判定提示信息后,将陀螺仪和/或加速度传感器数据的变化率与第二阈值比较,如果使用者是以一个较轻的力度和/或频度敲击、振动和/或摇动移动设备,通常所述变化率会小于第二阈值,这样就减小所述第一时间长度,也就是减小了距离下一次给出判定提示信息的时间间隔。其中,所述第一阈值可以设计为角速度变化率1rad/s2和/或加速度变化率1m/s3,所述第二阈值可以设计为角速度变化率0.5rad/s2和/或加速度变化率0.5m/s3,所述传感器数据的变化率与所述第一阈值/第二阈值比较时,具体可以先将XYZ三轴上的变化率计算2-范数,也可以直接对三轴上的变化率计算平均值或最大值,再将上述计算结果与所述第一阈值/第二阈值比较。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括……”或“包含……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的要素。此外,在本文中,“大于”、“小于”、“超过”等理解为不包括本数;“以上”、“以下”、“以内”等理解为包括本数。当用于表示度量区间时,“X~Y”、“[X,Y]”、“X到Y之间”、“X至Y之间”、“X与Y之间”、“X和Y之间”等表示包括左右端点的区间,“(X,Y)”表示不包括左右端点的区间;“(X,Y]”、“[X,Y)”分别表示不包括左端点但包括右端点的区间、包括左端点但不包括右端点的区间。
本领域内的技术人员应明白,上述各实施例可提供为方法、装置、或计算机程序产品。这些实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。上述各实施例涉及的方法中的全部或部分步骤可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机设备可读取的存储介质中,用于执行上述各实施例方法所述的全部或部分步骤。所述计算机设备,包括但不限于:个人计算机、服务器、通用计算机、专用计算机、网络设备、嵌入式设备、可编程设备、智能移动终端、智能家居设备、穿戴式智能设备、车载智能设备等;所述的存储介质,包括但不限于:RAM、ROM、磁碟、磁带、光盘、闪存、U盘、移动硬盘、存储卡、记忆棒、网络服务器存储、网络云存储等。
上述各实施例是参照根据实施例所述的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到计算机设备的处理器以产生一个机器,使得通过计算机设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机设备以特定方式工作的计算机设备可读存储器中,使得存储在该计算机设备可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机设备上,使得在计算机设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已经对上述各实施例进行了描述,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改,所以以上所述仅为本发明的实施例,并非因此限制本发明的专利保护范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围之内。

Claims (11)

1.一种有声阅读方法,其特征在于,包括以下步骤:
获取文本数据;
播放语音数据:将所述文本数据转换为语音数据播放;
给出判定提示信息;
检测判定触发信号;
第一判定步骤:根据执行所述检测判定触发信号步骤的检测结果,对使用者是否已入睡进行判定;
如果所述第一判定步骤的判定结果为使用者已入睡,则停止执行所述播放语音数据的步骤。
2.根据权利要求1所述一种有声阅读方法,其特征在于,还包括以下步骤:
获取第一时间长度,所述第一时间长度为一固定或可变的时间长度;
获取第二时间长度,所述第二时间长度为一固定或可变的时间长度;
并且:
所述给出判定提示信息的步骤以时间长度为所述第一时间长度的时间间隔重复多次执行;
所述第一判定步骤被执行多次,并且每次执行均开始于开始执行所述给出判定提示信息步骤之后的第二时间长度内。
3.根据权利要求2所述一种有声阅读方法,其特征在于,包括以下步骤:
保存位置记录点,所述位置记录点用于记录所述文本数据已被转换为语音数据并播放的位置;
所述位置记录点落在第一位置与第二位置之间,其中:
所述第一位置的获取方法具体为:当执行所述第一判定步骤获取的判定结果为使用者已入睡时,将该时刻所述文本数据已被转换为语音数据播放的位置记为所述第一位置;
所述第二位置的获取方法具体为:以所述第一位置对应的执行所述第一判定步骤的时刻为基准,将在该时刻之前,最近一次执行所述第一判定步骤时所述文本数据已被转换为语音数据播放的位置记为所述第二位置;
如果所述第一位置对应的所述第一判定步骤的执行为首次执行,则将所述文本数据的起始位置记为所述第二位置。
4.根据权利要求3所述一种有声阅读方法,其特征在于,包括以下步骤:
保存多个位置记录点;
显示所述多个位置记录点;
所述多个位置记录点包括:
第一位置记录点:记录所述第一位置;
第二位置记录点:记录所述第二位置;
第三位置记录点:记录处于所述第一位置与第二位置之间的所述文本数据已被转换为语音数据并播放的位置。
5.根据权利要求2所述一种有声阅读方法,其特征在于,所述第一时间长度不小于人脑EEG中Delta波的最大周期的时间长度。
6.根据权利要求2所述一种有声阅读方法,其特征在于,所述第一时间长度不小于人脑短时记忆在无复述情况下的最大保持时间。
7.根据权利2所述一种有声阅读方法,其特征在于,还包括以下步骤:
判定是否增加或减少所述第一时间长度,并根据判定结果增加所述第一时间长度或减少所述第一时间长度。
8.根据权利要求7所述一种有声阅读方法,其特征在于,包括以下步骤:
设所述第一时间长度当前为Xi秒,令Xi+1=Xi+A*(B-Xi)p(C-Xi)1-p+N(0,D),其中p=1或0,0<A≤1,60≤B≤300,0<C≤30,N(0,D)表示一个随机数,该随机数由均值为0,方差为D的高斯分布产生,其中0<D≤10;然后将Xi+1约束在区间[C,B]内,即如果Xi+1大于B,则将Xi+1置为B,如果Xi+1小于C,则将Xi+1置为C;
执行所述增加所述第一时间长度的步骤包括:将p置为1,计算Xi+1并将所述第一时间长度由Xi秒变化为Xi+1秒;执行所述减少所述第一时间长度的步骤包括:将p置为0,计算Xi+1并将所述第一时间长度由Xi秒变化为Xi+1秒;其中所述第一时间长度初始值取值在区间[C,B]内(单位:秒)。
9.根据权利要求1所述一种有声阅读方法,其特征在于,所述给出判定提示信息的步骤包括控制终端设备或其部件运动或振动、播放提示音、显示图像、播放视频和/或控制一个或多个指示灯变化。
10.根据权利要求9所述一种有声阅读方法,其特征在于,所述给出判定提示信息的步骤包括播放提示音,并且执行所述播放提示音的步骤时,距离用于播放所述提示音的扬声器的直线距离50CM处的声压测量值不超过2.1×10-3Pa,如有多个扬声器,设一共有Nsp2个扬声器,则对于其中任意一个扬声器SP2,在其他扬声器静音时,与所述扬声器SP1的直线距离50CM处的声压测量值不超过2.1×(log2Nsp)-1×10-3Pa。
11.根据权利要求9所述一种有声阅读方法,其特征在于,所述给出判定提示信息的步骤包括播放提示音频,所述提示音频的主频率不小于人脑EEG中Alpha波的频率上限。
CN201610204832.4A 2016-04-05 2016-04-05 一种有声阅读方法 Active CN105824428B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610204832.4A CN105824428B (zh) 2016-04-05 2016-04-05 一种有声阅读方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610204832.4A CN105824428B (zh) 2016-04-05 2016-04-05 一种有声阅读方法

Publications (2)

Publication Number Publication Date
CN105824428A true CN105824428A (zh) 2016-08-03
CN105824428B CN105824428B (zh) 2019-07-02

Family

ID=56525791

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610204832.4A Active CN105824428B (zh) 2016-04-05 2016-04-05 一种有声阅读方法

Country Status (1)

Country Link
CN (1) CN105824428B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08146158A (ja) * 1994-11-17 1996-06-07 Miyoko Kobayashi イヤホン付タイマー
CN101187855A (zh) * 2006-11-16 2008-05-28 王铁兵 进行语音阅读的手机
CN203070318U (zh) * 2012-09-20 2013-07-17 杭州贝迪科技有限公司 一种有声阅读机
CN103778806A (zh) * 2012-10-23 2014-05-07 中国电信股份有限公司 有声阅读的方法、终端和系统
CN205080398U (zh) * 2015-09-28 2016-03-09 郑州职业技术学院 一种基于位置检测的耳机可自动关闭音乐控制系统
CN105433904A (zh) * 2015-11-24 2016-03-30 小米科技有限责任公司 睡眠状态检测方法、装置及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08146158A (ja) * 1994-11-17 1996-06-07 Miyoko Kobayashi イヤホン付タイマー
CN101187855A (zh) * 2006-11-16 2008-05-28 王铁兵 进行语音阅读的手机
CN203070318U (zh) * 2012-09-20 2013-07-17 杭州贝迪科技有限公司 一种有声阅读机
CN103778806A (zh) * 2012-10-23 2014-05-07 中国电信股份有限公司 有声阅读的方法、终端和系统
CN205080398U (zh) * 2015-09-28 2016-03-09 郑州职业技术学院 一种基于位置检测的耳机可自动关闭音乐控制系统
CN105433904A (zh) * 2015-11-24 2016-03-30 小米科技有限责任公司 睡眠状态检测方法、装置及系统

Also Published As

Publication number Publication date
CN105824428B (zh) 2019-07-02

Similar Documents

Publication Publication Date Title
US9508236B2 (en) Haptic warping system that transforms a haptic signal into a collection of vibrotactile haptic effect patterns
US8436241B2 (en) Beat enhancement device, sound output device, electronic apparatus and method of outputting beats
CN103440862B (zh) 一种语音与音乐合成的方法、装置以及设备
KR102084979B1 (ko) 오디오 파일 재 녹음 방법, 장치 및 저장매체
CN1937462A (zh) 内容偏好得分确定方法、内容重放装置及内容重放方法
US10461712B1 (en) Automatic volume leveling
US20210027800A1 (en) Method for processing audio, electronic device and storage medium
CN109218535A (zh) 智能调节音量的方法、装置、存储介质及终端
US9269341B1 (en) Method for processing music to match runners tempo
CN110675848B (zh) 音频处理方法、装置及存储介质
CN110599989B (zh) 音频处理方法、装置及存储介质
CN106921802B (zh) 音频数据的播放方法及装置
CN109243479A (zh) 音频信号处理方法、装置、电子设备及存储介质
CN105852810B (zh) 一种睡眠控制方法
CN112435641B (zh) 音频处理方法、装置、计算机设备及存储介质
CN110660376B (zh) 音频处理方法、装置及存储介质
KR20110065095A (ko) 디바이스를 제어하는 방법 및 그 장치
CN111782865B (zh) 音频信息的处理方法、装置及存储介质
CN105824428A (zh) 一种有声阅读方法
CN105708421B (zh) 一种入睡检测方法
CN111627412A (zh) 音频变速方法、装置、电子设备和计算机可读存储介质
CN105877707B (zh) 一种具有入睡检测功能的人机交互方法
CN111696566A (zh) 语音处理方法、装置和介质
WO2019229936A1 (ja) 情報処理システム
JP2007236826A (ja) 音楽テンポ判別機能を備えたゲーム機

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190606

Address after: 350000 No. 110 Xiyang Middle Road, Wuhang Street, Changle District, Fuzhou City, Fujian Province

Applicant after: Fuzhou Changle District Extremely Micro Information Technology Co., Ltd.

Address before: 350000 Junzhu Road, Luoxing Street, Mawei District, Fuzhou City, Fujian Province

Applicant before: FUZHOU MAWEI DISTRICT SMALL AND MICRO INVENTION INFORMATION TECHNOLOGY CO.,LTD.

GR01 Patent grant
GR01 Patent grant