CN113257246A - 提示方法、装置、设备、系统及存储介质 - Google Patents

提示方法、装置、设备、系统及存储介质 Download PDF

Info

Publication number
CN113257246A
CN113257246A CN202110419299.4A CN202110419299A CN113257246A CN 113257246 A CN113257246 A CN 113257246A CN 202110419299 A CN202110419299 A CN 202110419299A CN 113257246 A CN113257246 A CN 113257246A
Authority
CN
China
Prior art keywords
content
sub
target
head
mounted sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110419299.4A
Other languages
English (en)
Other versions
CN113257246B (zh
Inventor
张燕
李胜民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goertek Inc
Original Assignee
Goertek Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goertek Inc filed Critical Goertek Inc
Priority to CN202110419299.4A priority Critical patent/CN113257246B/zh
Publication of CN113257246A publication Critical patent/CN113257246A/zh
Application granted granted Critical
Publication of CN113257246B publication Critical patent/CN113257246B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本申请公开了一种提示方法、装置、设备、系统及存储介质。其中方法应用于与头戴发声设备配对的电子设备,包括:从头戴发声设备发送的目标语音中获取当前语音段;对比当前语音段与预存内容,在预存内容中确定与当前语音段匹配的目标子内容,预存内容中包括多个子内容;在检测到设定事件发生的情况下,将预存内容中位于目标子内容后且与目标子内容连续的子内容确定为提示内容;向头戴发声设备输出提示内容,以由头戴发声设备播放提示内容。该方法可实现对佩戴者的语音提示,以使得佩戴者可想起接下来要演讲的内容,从而实现顺利演讲。

Description

提示方法、装置、设备、系统及存储介质
技术领域
本申请涉及声学技术领域,更具体地,涉及一种提示方法、一种提示装置、一种电子设备、一种提示系统以及一种计算机可读存储介质。
背景技术
目前,人们常会在一些活动中进行脱稿演讲。
但是,在未完全记住演讲内容时,或因为紧张忘记演讲内容等时,人们将无法顺利进行脱稿演讲,例如演讲时卡壳,或者断断续续。
因此,如何帮助人们顺利脱稿演讲成为亟待解决的技术问题之一。
发明内容
本申请的一个目的是提供一种用于提示的新技术方案。
根据本申请的第一方面,提供了一种提示方法,所述方法应用于与头戴发声设备配对的电子设备,包括:
从所述头戴发声设备发送的目标语音中获取当前语音段;
对比所述当前语音段与预存内容,在所述预存内容中确定与所述当前语音段匹配的目标子内容,所述预存内容中包括多个子内容;
在检测到设定事件发生的情况下,将所述预存内容中位于所述目标子内容后且与所述目标子内容连续的子内容确定为提示内容;
向所述头戴发声设备输出所述提示内容,以由所述头戴发声设备播放所述提示内容。
可选的,所述方法还包括:
在接收到所述头戴发声设备发送目标语音的情况下,停止向所述头戴发声设备输出提示内容,且重复执行所述从所述头戴发声设备发送的目标语音中获取当前语音段的操作。
可选的,所述对比所述当前语音段与预存内容,在所述预存内容中确定与所述当前语音段匹配的目标子内容,包括:
对比所述当前语音段与所述预存内容中的目标未读子内容,所述目标未读子内容为与被标记为已读的子内容相邻的未读子内容;
在所述当前语音段与所述目标子内容匹配的情况下,将所述目标未读子内容确定为目标子内容;
所述方法还包括:
在所述当前语音段与所述目标子内容匹配的情况下,将所述目标未读子内容标由未读记为已读。
可选的,所述预存内容的类型为语音,所述方法还包括:
对于所述预存内容中的每一子内容,对所述子内容执行特征化处理以得到特征化子内容;
对于每一特征化子内容,执行多维度特征值提取以得到第一多维度特征值;
所述对比所述当前语音段与所述预存内容中的目标未读子内容,包括:
对所述当前语音段执行所述特征化处理以得到特征化当前语音段;
对所述特征化后当前语音段执行所述多维度特征值提取以得到第二多维度特征值;
对比所述目标未读子内容对应的第一多维度特征值和所述第二多维度特征值间的特征相似率;
所述方法在所述在所述当前语音段与所述目标子内容匹配的情况下,将所述目标未读子内容确定为目标子内容之前,还包括:
在所述特征相似率大于第一设定值的情况下,确定所述当前语音段与所述目标子内容匹配。
可选的,所述预存内容的类型为文字,所述方法还包括:
将所述当前语音段转换为目标文字;
所述对比所述当前语音段与所述预存内容中的目标未读子内容,包括:
对比所述目标文字与所述预存内容中的目标未读子内容之间的文字相同率;
所述方法在所述在所述当前语音段与所述目标子内容匹配的情况下,将所述目标未读子内容确定为目标子内容之前,还包括:
在所述文字相同率大于第二设定值的情况下,确定所述当前语音段与所述目标子内容匹配。
可选的,所述方法还包括:
接收所述头戴发声设备发送的设定事件发生的通知信息;
根据所述通知信息,确定所述设定事件发生;
其中,所述头戴发声设备在预设时间段内未接收到所述目标语音,和/或在检测到所述头戴发声设备振动预设次数的情况下,由所述头戴发声设备向所述电子设备发送所述通知信息。
根据本申请的第二方面,提供了一种提示装置,包括:
获取模块,用于从所述头戴发声设备发送的目标语音中获取当前语音段;
第一确定模块,用于对比所述当前语音段与预存内容,在所述预存内容中确定与所述当前语音段匹配的目标子内容,所述预存内容中包括多个子内容;
第二确定模块,用于在检测到设定事件发生的情况下,将所述预存内容中位于所述目标子内容后且与所述目标子内容连续的子内容确定为提示内容;
输出模块,用于向所述头戴发声设备输出所述提示内容,以由所述头戴发声设备播放所述提示内容。
根据本申请的第三方面,提供了一种电子设备,所述电子设备包括如第二方面所述的装置;或者,
包括存储器和处理器,所述存储器用于存储计算机指令,所述处理器用于从所述存储器中调用所述计算机指令,以执行如第一方面中任一项所述的方法。
根据本申请的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现根据第一方面中任一项所述的方法。
根据本申请的第五方面,提供了一种提示系统,包括头戴发声设备和与所述头戴发声设备配对的电子设备,其中:
所述头戴发声设备用于向所述电子设备发送目标语音;
所述电子设备用于从所述头戴发声设备发送的目标语音中获取当前语音段;对比所述当前语音段与预存内容,在所述预存内容中确定与所述当前语音段匹配的目标子内容,所述预存内容中包括多个子内容;在检测到设定事件发生的情况下,将所述预存内容中位于所述目标子内容后且与所述目标子内容连续的子内容确定为提示内容;向所述头戴发声设备输出所述提示内容,以由所述头戴发声设备播放所述提示内容;所述头戴发声设备还用于播放所述电子设备发送的提示内容。
在本申请实施例中,通过从头戴发声设备发送的目标语音中获取当前语音段,可以获取到佩戴者当前演讲的一句完整的话。对比当前语音段与预存内容,在预存内容中确定与当前语音段匹配的目标子内容,可定位出当前语音段在预存内容中的位置。在检测到设定事件发生的情况下,则说明佩戴者需要提示。此时,预存内容中位于目标子内容后且与目标子内容连续的子内容记为佩戴者接下来要演讲的内容,因此,将预存内容中位于目标子内容后且与目标子内容连续的子内容确定为提示内容。最后,向头戴发声设备输出提示内容,以由头戴发声设备播放提示内容。这样,可实现对佩戴者的语音提示,以使得佩戴者可想起接下来要演讲的内容,从而实现顺利演讲。
通过以下参照附图对本申请的示例性实施例的详细描述,本申请的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本申请的实施例,并且连同其说明一起用于解释本申请的原理。
图1是根据本申请实施例的一种提示系统的硬件配置的框图;
图2是本申请实施例提供的一种提示方法的流程示意图;
图3是本申请实施例提供的一种提示装置的结构示意图;
图4是本申请实施例提供的一种电子设备的结构示意图;
图5是本申请实施例提供的一种提示系统的结构示意图。
具体实施方式
现在将参照附图来详细描述本申请的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本申请的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本申请及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
<硬件配置>
图1是根据本申请实施例的一种提示系统100的硬件配置的框图。
如图1所示,提示系统100包括头戴发声设备1000和与头戴发声设备1000配对的电子设备2000。
头戴发声设备1000可以为耳机,还可以为带有定向发声扬声器的智能眼镜,例如增强现实(Augmented Reality;AR)眼镜或者虚拟现实(Virtual Reality;VR)眼镜等。其中,耳机可以为真正无线立体声(True Wireless Stereo;TWS)耳机,还可以为与电子设备2000有线连接的有线耳机。
电子设备2000可以为智能手机、平板电脑、PC机等。
电子设备2000可以包括处理器2100、存储器2200、接口装置2300、通信装置2400、显示装置2500、输入装置2600、扬声器2700及麦克风2800,等等。
其中,处理器2100可以是中央处理器CPU、微处理器MCU等。存储器2200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置2300例如包括USB接口、头戴发声设备接口等。通信装置2400例如能够进行有线或无线通信。显示装置2500例如是液晶显示屏、触摸显示屏等。输入装置2600例如可以包括触摸屏、键盘等。用户可以通过扬声器2700和麦克风2800输入/输出语音信息。
尽管在图1中对电子设备2000均示出了多个装置,但是,本申请可以仅涉及其中的部分装置,例如,电子设备2000只涉及存储器2200、处理器2100。
应用于本申请的实施例中,头戴发声设备1000用于向电子设备2000发送目标语音,并播放电子设备2000发送的提示内容。电子设备2000的存储器2200用于存储指令,该指令用于控制处理器2100执行本申请实施例提供的提示方法。
在上述描述中,技术人员可以根据本申请所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
<方法实施例>
图2是本申请实施例提供的一种提示方法的流程示意图,该方法可以由与头戴发声设备配对的电子设备2000实施。
如图2所示,本申请实施例提供的提示方法可包括如下S2100-S2400:
S2100、从头戴发声设备发送的目标语音中获取当前语音段。
在本实施例中,目标语音指的是佩戴头戴发声设备1000的佩戴者的发出的语音。头戴发声设备1000可通过自身的麦克风采集语音,并发送给电子设备2000。电子设备2000根据预先存储的佩戴者的语音特征,从头戴发声设备1000发送的语音中选择出目标语音。
另外,头戴发声设备1000中还可设置骨传感器,这样可利用骨传感器直接采集到目标语音。在该情况下,电子设备2000将从头戴发声设备1000获取到的语音确定为目标语音。
在本实施例中,目标语音中的当前语音段为目标语音中时序上位于最后的一个完整语音段。该当前语音段对应于佩戴者当前演讲的一句完整的话。可以理解的是,佩戴者在演讲时,每一句完整的话之间会有一个小的停顿,该停顿通常为1s左右。因此,电子设备2000在获取到目标语音后,可根据前述的停顿将目标语音分为多个语音段,并将时序上位于最后的一个语音段确定为当前语音段。
S2200、对比当前语音段与预存内容,在预存内容中确定与当前语音段匹配的目标子内容。
其中,预存内容中包括多个子内容。
在本申请实施例中,预存内容为佩戴者需要演讲的完整内容。预存内容的类型可以为文字,也可以为语音。在预存内容的类型为语音的情况下,需要佩戴者预先将演讲的完整内容以语音的方式录入至电子设备2000中。
在预存内容的类型为文字时,预存内容中的一个文字段对应一个子内容。在预存内容的类型为语音时,预存内容中的一个语音段对应一个子内容。
在本申请实施例中,执行上述S2200的目的为定位出当前语音段在预存内容中的位置。具体的,将预存内容中与当前语音段匹配的目标子内容,确定为当前语音段在预存内容中的位置。
在本申请的一个实施例中,上述S2200的具体实现可以为:将当前语音语音段与预存内容中每一个子内容进行语义比对,将语义最相似的子内容确定为与当前语音段匹配的目标子内容。
在本申请的另一个实施例中,上述S2200还可通过如下S2210和S2220来实现:
S2210、对比当前语音段与预存内容中目标未读子内容。
其中,目标未读子内容为被标记为已读的子内容相邻的一个未读子内容。即目标未读子内容为时序上位于被标记为已读的子内容后的第一个未读子内容。
可以理解的是,在执行上述S2210之前,当前语音段通常为佩戴者演讲接下来演讲的一个语音段,因此,在执行上述S2210时,是将当前语音段与预存内容中的目标未读子内容进行对比的。
S2220、在当前语音段与目标子内容匹配的情况下,将目标未读子内容确定为目标子内容。
在本申请实施例中,在当前语音段与目标子内容匹配的情况下,此时可将目标子内容所在的位置,确定为当前语音段在预存内容中的位置。
对应于上述S2220,在当前语音段与目标子内容不匹配的情况下,则说明佩戴者当前的演讲内容超过预存内容的范围,此时电子设备2000不进行任何处理,或者电子设备2000直接执行下述S2300。
在上述S2210和S2220的基础上可知,本申请实施例提供的提示方法还包括如下S2500:
S2500、在当前语音段与目标子内容匹配的情况下,将目标未读子内容标由未读记为已读。
在本申请实施例中,在当前语音段与目标子内容匹配的情况下,则说明佩戴者当前已对目标子内容进行了演讲,因此,需要将目标未读子内容标由未读记为已读。这样,可为后续过程中重复执行上述S2210和S2211时提供基础。
需要说明的是,在初始时刻,预存内容中包括的每一子内容被标记为未读。
S2300、在检测到设定事件发生的情况下,将预存内容中位于目标子内容后且与目标子内容连续的子内容确定为提示内容。
S2400、向头戴发声设备输出提示内容,以由头戴发声设备播放提示内容。
在本申请实施例中,设定事件为需要头戴发声设备1000对佩戴者进行语音提示的事件。在检测到设定事件发生的情况下,则说明佩戴者需要提示。此时,电子设备2000确定预存内容中位于目标子内容后且与目标子内容连续的子内容为佩戴者下一步要演讲的内容,因此将预存内容中位于目标子内容后且与目标子内容连续的全部或部分子内容确定为提示内容。之后,电子设备2000将该提示内容输出至头戴发声设备1000。头戴发声设备1000在接收到该提示内容,对该提示内容进行播放。这样,佩戴者可想起下一步要演讲的内容,从而实现顺利演讲。
在本申请的一个实施例中,头戴发声设备1000可检测设定事件是否发生。在头戴发声设备1000检测到设定事件发生的情况下,向电子设备2000发送通知信息。电子设备2000在接收到通知信息后,确定设定事件的发生。在此基础上,本申请实施例提供的提示方法还包括如下S2610和S2620:
S2610、接收头戴发声设备发送的设定事件发生的通知信息。
S2620、根据通知信息,确定设定事件发生。
其中,头戴发声设备在预设时间段内未接收到目标语音,和/或在检测到头戴发声设备振动预设次数的情况下,由头戴发声设备向电子设备发送通知信息。
在一个示例中,预设时间段可以为5s,即若头戴发声设备1000在5s为未接收到目标语音的情况下,确定佩戴者需要提示,此时确定设定事件发生。
在一个示例中,预设次数为2次,即若头戴发声设备1000检测到被双击,则确定佩戴者需要提示,此时确定设定事件发生。
在本申请的另一个实施例中,电子设备2000可检测设定事件是否发生。例如,佩戴者在需要提示时,佩戴者长按电子设备2000的屏幕设定时长以上。电子设备2000在检测到按压屏幕达到设定时长以上的操作时,确定设定事件发生。
在本申请实施例中,通过从头戴发声设备发送的目标语音中获取当前语音段,可以获取到佩戴者当前演讲的一句完整的话。对比当前语音段与预存内容,在预存内容中确定与当前语音段匹配的目标子内容,可定位出当前语音段在预存内容中的位置。在检测到设定事件发生的情况下,则说明佩戴者需要提示。此时,预存内容中位于目标子内容后且与目标子内容连续的子内容记为佩戴者接下来要演讲的内容,因此,将预存内容中位于目标子内容后且与目标子内容连续的子内容确定为提示内容。最后,向头戴发声设备输出提示内容,以由头戴发声设备播放提示内容。这样,可实现对佩戴者的语音提示,以使得佩戴者可想起接下来要演讲的内容,从而实现顺利演讲。
在一个实施例中,本申请实施例提供的提示方法还包括如下S2700:
S2700、在接收到头戴发声设备发送目标语音的情况下,停止向头戴发声设备输出提示内容,且重复执行从头戴发声设备发送的目标语音中获取当前语音段的操作。
在本申请实施例中,在执行上述S2400之后,电子设备2000再次接收到头戴发声设备发送的目标语音的情况下,则说明佩戴者在头戴发声设备1000的提示下,想起了演讲内容,从而进行顺利演讲。此时,电子设备1000停止向头戴发声设备输出提示内容,这样可避免佩戴者被头戴发声设备1000干扰。进一步的,电子设备2000重复执行上述S2100,以在佩戴者下一次需要提示时,对佩戴者进行及时提示。
在一个实施例中,针对预存内容的类型不同,上述S2210采用不同的实现方法。具体的:
在预存内容的类型为语音的情况下,本申请实施例提供的提示方法还包括如下S2810和S2811:
S2810、对于预存内容中的每一子内容,对子内容执行特征化处理以得到特征化子内容。
在本申请的一个实施例中,可采用梅尔倒谱算法对预存内容中的每一子内容执行特征化处理,以得到对应的特征化子内容。
S2811、对于每一特征化子内容,执行多维度特征值提取以得到第一多维度特征值。
在本申请实施例中,可采用短傅里叶变换,对每一特征化子内容执行多维度特征值(例如时序帧序列、短时过零率序列等)提取,以得到对应的第一多维度特征值。
在上述S2810和S2811的基础上,上述S2210的具体实现为如下S2211-S2213:
S2211、对当前语音段执行特征化处理以得到特征化当前语音段。
S2212、对特征化后当前语音段执行多维度特征值提取以得到第二多维度特征值。
在本申请实施例中,上述S2211的具体实现与上述S2810的具体实现相同,S2212的具体实现与上述S2811的具体实现相同,此处不再赘述。
S2213、对比目标未读子内容对应的第一多维度特征值和第二多维度特征值间的特征相似率。
在本申请实施例中,上述S2213可采用特征相似度算法来实现。
在上述S2211-S2213的基础上,本申请实施例提供的提示方法在上述S2210之前还包括:
在特征相似率大于第一设定值的情况下,确定当前语音段与目标子内容匹配。
在本申请实施例中,第一设定值可以取值为50%,在特征相似率大于第一设定值的情况下,确定当前语音段与目标子内容相似,即认为两者匹配。这是因为,佩戴者在进行演讲时,演讲的内容与目标子内容存在少许的差别。
在预存内容的类型为文字的情况下,本申请实施例提供的提示方法还包括如下S2900:
S2900、将当前语音段转换为文字。
在上述S2900的基础上,上述S2210可通过如下S2214来实现:
S2214、对比目标文字与预存内容中的目标未读子内容之间的文字相同率。
在本申请实施例中,文字相同率的计算方法可以为:计算目标文字和目标未读子内容中相同文字的个数占目标未读子内容中文字个数的比例,将该比例确定为文字相同率。当然,文字相同率还可以采用其他方式。
在上述B的基础上,本申请实施例提供的提示方法在上述S2210之前,还包括如下步骤:
在文字相同率大于第二设定值的情况下,确定当前语音段与目标子内容匹配。
在本申请实施例中,第二设定值可以取值为50%,在文字相同率大于第二设定值的情况下,确定当前语音段与目标子内容相似,即认为两者匹配。这是因为,佩戴者在进行演讲时,演讲的内容与目标子内容存在少许的差别。
<装置实施例>
本申请实施例提供了一种提示装置3000,如图3所示,该提示装置3000包括获取模块3100、第一确定模块3200、第二确定模块3300以及输出模块3400。其中:
获取模块3100用于从所述头戴发声设备发送的目标语音中获取当前语音段。
第一确定模块3200用于对比所述当前语音段与预存内容,在所述预存内容中确定与所述当前语音段匹配的目标子内容,所述预存内容中包括多个子内容。
第二确定模块3300用于在检测到设定事件发生的情况下,将所述预存内容中位于所述目标子内容后且与所述目标子内容连续的子内容确定为提示内容。
输出模块3400用于向所述头戴发声设备输出所述提示内容,以由所述头戴发声设备播放所述提示内容。
在一个实施例中,提示装置3000还包括执行模块,执行模块用于在接收到所述头戴发声设备发送目标语音的情况下,停止向所述头戴发声设备输出提示内容,且重复执行所述从所述头戴发声设备发送的目标语音中获取当前语音段的操作。
在一个实施例中,第一确定模块3200包括对比单元和确定单元。其中:
对比单元用于对比所述当前语音段与所述预存内容中的目标未读子内容,所述目标未读子内容为与被标记为已读的子内容相邻的未读子内容。
确定单元用于在所述当前语音段与所述目标子内容匹配的情况下,将所述目标未读子内容确定为目标子内容。
在本实施例中,提示装置3000还包括标记模块,标记模块用于在所述当前语音段与所述目标子内容匹配的情况下,将所述目标未读子内容标由未读记为已读。
在一个实施例中,提示装置还包括特征化模块和特征提取模块。其中:
特征化模块用于对于所述预存内容中的每一子内容,对所述子内容执行特征化处理以得到特征化子内容。
特征提取模块用于对于每一特征化子内容,执行多维度特征值提取以得到第一多维度特征值。
在本实施例中,对比单元包括特征化子单元、特征提取子单元和第一对比子单元。其中:
特征化子单元用于对所述当前语音段执行所述特征化处理以得到特征化当前语音段。
特征提取子单元对所述特征化后当前语音段执行所述多维度特征值提取以得到第二多维度特征值。
第一对比子单元对比所述目标未读子内容对应的第一多维度特征值和所述第二多维度特征值间的特征相似率。
在本申请实施例中,提示装置3000还包括第三确定模块,第三确定模块用于在所述特征相似率大于第一设定值的情况下,确定所述当前语音段与所述目标子内容匹配。
在一个实施例中,提示装置还包括转换单元,转换单元用于将所述当前语音段转换为目标文字。
在本实施例中,对比单元包括第二对比子单元,第二对比子单元用于对比所述目标文字与所述预存内容中的目标未读子内容之间的文字相同率。
在本实施例中,提示装置还包括第四确定模块,第四确定模块用于在所述文字相同率大于第二设定值的情况下,确定所述当前语音段与所述目标子内容匹配。
在一个实施例中,接收单元3100还用于接收所述头戴发声设备发送的设定事件发生的通知信息。
在本实施例中,提示装置3000还包括第五确定模块,第五确定模块用于根据所述通知信息,确定所述设定事件发生。
其中,所述头戴发声设备在预设时间段内未接收到所述目标语音,和/或在检测到所述头戴发声设备振动预设次数的情况下,由所述头戴发声设备向所述电子设备发送所述通知信息。
<设备实施例>
本申请实施例提供一种电子设备2000,该电子设备2000包括如图3所示的提示装置。
或者,如图4所示,包括包括存储器2200和处理器2100,所述存储器2200用于存储计算机指令,所述处理器2100用于从所述存储器2200中调用所述计算机指令,以执行如上述方法实施例中任一项所述的方法。
<系统实施例>
本申请实施例提供了一种提示系统100,如图5所示,该提示系统100包括头戴发声设备1000和电子设备2000。其中:
所述头戴发声设备1000用于向所述电子设备2000发送目标语音;
所述电子设备2000用于从所述头戴发声设备1000发送的目标语音中获取当前语音段;对比所述当前语音段与预存内容,在所述预存内容中确定与所述当前语音段匹配的目标子内容,所述预存内容中包括多个子内容;在检测到设定事件发生的情况下,将所述预存内容中位于所述目标子内容后且与所述目标子内容连续的子内容确定为提示内容;向所述头戴发声设备1000输出所述提示内容,以由所述头戴发声设备1000播放所述提示内容。
所述头戴发声设备1000还用于播放所述电子设备2000发送的提示内容。
在一个实施例中,电子设备2000还用于在接收到所述头戴发声设备发送目标语音的情况下,停止向所述头戴发声设备输出提示内容,且重复执行所述从所述头戴发声设备发送的目标语音中获取当前语音段的操作。
在一个实施例中,所述对比所述当前语音段与预存内容,在所述预存内容中确定与所述当前语音段匹配的目标子内容,包括:
对比所述当前语音段与所述预存内容中的目标未读子内容,所述目标未读子内容为与被标记为已读的子内容相邻的未读子内容;在所述当前语音段与所述目标子内容匹配的情况下,将所述目标未读子内容确定为目标子内容。
在本实施例中,电子设备2000还用于在所述当前语音段与所述目标子内容匹配的情况下,将所述目标未读子内容标由未读记为已读。
在一个实施例中,预存内容的类型为语音,电子设备2000还用于对于所述预存内容中的每一子内容,对所述子内容执行特征化处理以得到特征化子内容;对于每一特征化子内容,执行多维度特征值提取以得到第一多维度特征值。
所述对比所述当前语音段与所述预存内容中的目标未读子内容,包括:对所述当前语音段执行所述特征化处理以得到特征化当前语音段;对所述特征化后当前语音段执行所述多维度特征值提取以得到第二多维度特征值;对比所述目标未读子内容对应的第一多维度特征值和所述第二多维度特征值间的特征相似率。
电子设备2000在所述在所述当前语音段与所述目标子内容匹配的情况下,将所述目标未读子内容确定为目标子内容之前,还用于在所述特征相似率大于第一设定值的情况下,确定所述当前语音段与所述目标子内容匹配。
在一个实施例中,所述预存内容的类型为文字,电子设备2000还用于将所述当前语音段转换为目标文字。
所述对比所述当前语音段与所述预存内容中的目标未读子内容,包括:对比所述目标文字与所述预存内容中的目标未读子内容之间的文字相同率。
电子设备2000在所述在所述当前语音段与所述目标子内容匹配的情况下,将所述目标未读子内容确定为目标子内容之前,还用于在所述文字相同率大于第二设定值的情况下,确定所述当前语音段与所述目标子内容匹配。
在一个实施例中,电子设备2000还用于接收所述头戴发声设备发送的设定事件发生的通知信息;根据所述通知信息,确定所述设定事件发生;其中,所述头戴发声设备在预设时间段内未接收到所述目标语音,和/或在检测到所述头戴发声设备振动预设次数的情况下,由所述头戴发声设备向所述电子设备发送所述通知信息。
在本实施例中,头戴发声设备1000还用于在预设时间段内未接收到所述目标语音,和/或在检测到所述头戴发声设备振动预设次数的情况下,向所述电子设备2000发送所述通知信息。
<存储介质实施例>
本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现根据上述方法实施例中任一项所述的方法。
本申请可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本申请的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本申请操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本申请的各个方面。
这里参照根据本申请实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本申请的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本申请的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本申请的范围由所附权利要求来限定。

Claims (10)

1.一种提示方法,其特征在于,所述方法应用于与头戴发声设备配对的电子设备,包括:
从所述头戴发声设备发送的目标语音中获取当前语音段;
对比所述当前语音段与预存内容,在所述预存内容中确定与所述当前语音段匹配的目标子内容,所述预存内容中包括多个子内容;
在检测到设定事件发生的情况下,将所述预存内容中位于所述目标子内容后且与所述目标子内容连续的子内容确定为提示内容;
向所述头戴发声设备输出所述提示内容,以由所述头戴发声设备播放所述提示内容。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在接收到所述头戴发声设备发送目标语音的情况下,停止向所述头戴发声设备输出提示内容,且重复执行所述从所述头戴发声设备发送的目标语音中获取当前语音段的操作。
3.根据权利要求1所述的方法,其特征在于,所述对比所述当前语音段与预存内容,在所述预存内容中确定与所述当前语音段匹配的目标子内容,包括:
对比所述当前语音段与所述预存内容中的目标未读子内容,所述目标未读子内容为与被标记为已读的子内容相邻的未读子内容;
在所述当前语音段与所述目标子内容匹配的情况下,将所述目标未读子内容确定为目标子内容;
所述方法还包括:
在所述当前语音段与所述目标子内容匹配的情况下,将所述目标未读子内容标由未读记为已读。
4.根据权利要求3所述的方法,其特征在于,所述预存内容的类型为语音,所述方法还包括:
对于所述预存内容中的每一子内容,对所述子内容执行特征化处理以得到特征化子内容;
对于每一特征化子内容,执行多维度特征值提取以得到第一多维度特征值;
所述对比所述当前语音段与所述预存内容中的目标未读子内容,包括:
对所述当前语音段执行所述特征化处理以得到特征化当前语音段;
对所述特征化后当前语音段执行所述多维度特征值提取以得到第二多维度特征值;
对比所述目标未读子内容对应的第一多维度特征值和所述第二多维度特征值间的特征相似率;
所述方法在所述在所述当前语音段与所述目标子内容匹配的情况下,将所述目标未读子内容确定为目标子内容之前,还包括:
在所述特征相似率大于第一设定值的情况下,确定所述当前语音段与所述目标子内容匹配。
5.根据权利要求3所述的方法,其特征在于,所述预存内容的类型为文字,所述方法还包括:
将所述当前语音段转换为目标文字;
所述对比所述当前语音段与所述预存内容中的目标未读子内容,包括:
对比所述目标文字与所述预存内容中的目标未读子内容之间的文字相同率;
所述方法在所述在所述当前语音段与所述目标子内容匹配的情况下,将所述目标未读子内容确定为目标子内容之前,还包括:
在所述文字相同率大于第二设定值的情况下,确定所述当前语音段与所述目标子内容匹配。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收所述头戴发声设备发送的设定事件发生的通知信息;
根据所述通知信息,确定所述设定事件发生;
其中,所述头戴发声设备在预设时间段内未接收到所述目标语音,和/或在检测到所述头戴发声设备振动预设次数的情况下,由所述头戴发声设备向所述电子设备发送所述通知信息。
7.一种提示装置,其特征在于,包括:
获取模块,用于从所述头戴发声设备发送的目标语音中获取当前语音段;
第一确定模块,用于对比所述当前语音段与预存内容,在所述预存内容中确定与所述当前语音段匹配的目标子内容,所述预存内容中包括多个子内容;
第二确定模块,用于在检测到设定事件发生的情况下,将所述预存内容中位于所述目标子内容后且与所述目标子内容连续的子内容确定为提示内容;
输出模块,用于向所述头戴发声设备输出所述提示内容,以由所述头戴发声设备播放所述提示内容。
8.一种电子设备,其特征在于,所述电子设备包括如权利要求7所述的装置;或者,
包括存储器和处理器,所述存储器用于存储计算机指令,所述处理器用于从所述存储器中调用所述计算机指令,以执行如权利要求1-6中任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的方法。
10.一种提示系统,其特征在于,包括头戴发声设备和与所述头戴发声设备配对的电子设备,其中:
所述头戴发声设备用于向所述电子设备发送目标语音;
所述电子设备用于从所述头戴发声设备发送的目标语音中获取当前语音段;对比所述当前语音段与预存内容,在所述预存内容中确定与所述当前语音段匹配的目标子内容,所述预存内容中包括多个子内容;在检测到设定事件发生的情况下,将所述预存内容中位于所述目标子内容后且与所述目标子内容连续的子内容确定为提示内容;向所述头戴发声设备输出所述提示内容,以由所述头戴发声设备播放所述提示内容;
所述头戴发声设备还用于播放所述电子设备发送的提示内容。
CN202110419299.4A 2021-04-19 2021-04-19 提示方法、装置、设备、系统及存储介质 Active CN113257246B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110419299.4A CN113257246B (zh) 2021-04-19 2021-04-19 提示方法、装置、设备、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110419299.4A CN113257246B (zh) 2021-04-19 2021-04-19 提示方法、装置、设备、系统及存储介质

Publications (2)

Publication Number Publication Date
CN113257246A true CN113257246A (zh) 2021-08-13
CN113257246B CN113257246B (zh) 2023-03-14

Family

ID=77221108

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110419299.4A Active CN113257246B (zh) 2021-04-19 2021-04-19 提示方法、装置、设备、系统及存储介质

Country Status (1)

Country Link
CN (1) CN113257246B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115629894A (zh) * 2022-12-21 2023-01-20 深圳市人马互动科技有限公司 演讲提示方法及相关装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130021373A1 (en) * 2011-07-22 2013-01-24 Vaught Benjamin I Automatic Text Scrolling On A Head-Mounted Display
CN104796584A (zh) * 2015-04-23 2015-07-22 南京信息工程大学 具有语音识别功能的提词装置
CN106910504A (zh) * 2015-12-22 2017-06-30 北京君正集成电路股份有限公司 一种基于语音识别的演讲提示方法及装置
CN108511001A (zh) * 2018-04-09 2018-09-07 上海智臻智能网络科技股份有限公司 语音监控方法及装置、存储介质、终端
CN109089018A (zh) * 2018-10-29 2018-12-25 上海理工大学 一种智能提词装置及其方法
CN110362204A (zh) * 2019-07-11 2019-10-22 Oppo广东移动通信有限公司 信息提示方法、装置、存储介质及增强现实设备
CN111696538A (zh) * 2020-06-05 2020-09-22 北京搜狗科技发展有限公司 语音处理方法、装置和介质
CN112233669A (zh) * 2019-07-15 2021-01-15 珠海金山办公软件有限公司 一种演讲内容提示方法及系统
CN112232127A (zh) * 2020-09-14 2021-01-15 辽宁对外经贸学院 一种智能演讲训练系统及方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130021373A1 (en) * 2011-07-22 2013-01-24 Vaught Benjamin I Automatic Text Scrolling On A Head-Mounted Display
CN104796584A (zh) * 2015-04-23 2015-07-22 南京信息工程大学 具有语音识别功能的提词装置
CN106910504A (zh) * 2015-12-22 2017-06-30 北京君正集成电路股份有限公司 一种基于语音识别的演讲提示方法及装置
CN108511001A (zh) * 2018-04-09 2018-09-07 上海智臻智能网络科技股份有限公司 语音监控方法及装置、存储介质、终端
CN109089018A (zh) * 2018-10-29 2018-12-25 上海理工大学 一种智能提词装置及其方法
CN110362204A (zh) * 2019-07-11 2019-10-22 Oppo广东移动通信有限公司 信息提示方法、装置、存储介质及增强现实设备
CN112233669A (zh) * 2019-07-15 2021-01-15 珠海金山办公软件有限公司 一种演讲内容提示方法及系统
CN111696538A (zh) * 2020-06-05 2020-09-22 北京搜狗科技发展有限公司 语音处理方法、装置和介质
CN112232127A (zh) * 2020-09-14 2021-01-15 辽宁对外经贸学院 一种智能演讲训练系统及方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115629894A (zh) * 2022-12-21 2023-01-20 深圳市人马互动科技有限公司 演讲提示方法及相关装置

Also Published As

Publication number Publication date
CN113257246B (zh) 2023-03-14

Similar Documents

Publication Publication Date Title
US11810554B2 (en) Audio message extraction
US10321204B2 (en) Intelligent closed captioning
US11462213B2 (en) Information processing apparatus, information processing method, and program
US11527233B2 (en) Method, apparatus, device and computer storage medium for generating speech packet
KR102379068B1 (ko) 커뮤니케이션 방법 및 그를 위한 전자 장치
US10741172B2 (en) Conference system, conference system control method, and program
KR102628211B1 (ko) 전자 장치 및 그 제어 방법
WO2018079332A1 (ja) 情報処理装置及び情報処理方法
CN113257246B (zh) 提示方法、装置、设备、系统及存储介质
JP2000207170A (ja) 情報処理装置および情報処理方法
US20200279570A1 (en) Speaker determination apparatus, speaker determination method, and control program for speaker determination apparatus
US20230223021A1 (en) Enhancing signature word detection in voice assistants
US10748535B2 (en) Transcription record comparison
JP2013152277A (ja) 情報提供装置とそのプログラムおよび情報提供システム
CN113160782B (zh) 音频处理的方法、装置、电子设备及可读存储介质
US20210327419A1 (en) Enhancing signature word detection in voice assistants
JP2018081147A (ja) コミュニケーション装置、サーバ、制御方法、および情報処理プログラム
CN110753285A (zh) 降噪耳机的声音信号处理方法、装置、设备及存储介质
US20200160833A1 (en) Information processor, information processing method, and program
CN103258446A (zh) 用于帮助视障用户的同音字的示例性描述
US20210082427A1 (en) Information processing apparatus and information processing method
EP3451188A1 (en) Information processing device, information processing system, and program
CN115379332A (zh) 耳机的控制方法、装置、耳机及介质
EP4139916A1 (en) Enhancing signature word detection in voice assistants
CN113593505A (zh) 一种语音处理方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant