CN111028834A - 语音信息提醒方法、装置、服务器和语音信息提醒设备 - Google Patents
语音信息提醒方法、装置、服务器和语音信息提醒设备 Download PDFInfo
- Publication number
- CN111028834A CN111028834A CN201911043077.6A CN201911043077A CN111028834A CN 111028834 A CN111028834 A CN 111028834A CN 201911043077 A CN201911043077 A CN 201911043077A CN 111028834 A CN111028834 A CN 111028834A
- Authority
- CN
- China
- Prior art keywords
- preset
- data
- target
- voice
- voice data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 239000013598 vector Substances 0.000 claims description 36
- 238000007781 pre-processing Methods 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 18
- 238000001514 detection method Methods 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 7
- 238000004891 communication Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 235000013361 beverage Nutrition 0.000 description 6
- 238000004590 computer program Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 241000395033 Kaempferia Species 0.000 description 2
- 235000013422 Kaempferia rotunda Nutrition 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 241001506304 Kadsura japonica Species 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 241000330755 Tylosema fassoglense Species 0.000 description 1
- 235000018907 Tylosema fassoglense Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书提供一种语音信息提醒方法、装置、服务器和语音信息提醒设备。在一个实施例中,通过先采集目标场景中出现的语音数据,并检测所采集到的语音数据中是否包含有与预设的关键词表匹配的词,来确定该语音数据是否为包含有用户在该目标场景中所关注的目标信息的目标语音数据;在确定该语音数据为目标语音数据的情况下,为用户播放该目标语音数据,以及时地提醒用户相应的目标信息,避免用户遗漏在目标场景中需要关注的目标信息。
Description
技术领域
本说明书属于互联网技术领域,尤其涉及一种语音信息提醒方法、装置、服务器和语音信息提醒设备。
背景技术
在许多等待场景中,用户喜欢戴上耳机通过听音乐、有声书等音频内容来消磨时间。
例如,用户在乘坐地铁前往目的地站时,中间可能需要经过许多站,这时为了不觉得到无聊,用户会戴上耳机听音乐等音频,来消磨这段乘车时间。但这样用户就无法及时、清楚地收听到地铁上的报站广播了,进而可能出现由于没留意报站广播坐过站的情况。
因此,需要一种语音信息提醒方法。
发明内容
本说明书提供了一种语音信息提醒方法、装置、服务器和语音信息提醒设备,以及时地提醒用户目标场景中所出现的用户需要关注的目标信息。
本说明书提供的一种语音信息提醒方法、装置、服务器和语音信息提醒设备是这样实现的:
一种语音信息提醒方法,包括:采集目标场景中的语音数据;检测所述语音数据中是否包含有与预设的关键词表匹配的词;其中,所述预设的关键词表包括目标场景中用户所关注的目标信息中的关键词;在确定所述语音数据中包含有与预设的关键词表匹配的词的情况下,将所述语音数据确定为目标语音数据;播放所述目标语音数据,以提醒用户所述目标信息。
一种语音信息提醒装置,包括:采集模块,用于采集目标场景中的语音数据;检测模块,用于检测所述语音数据中是否包含有与预设的关键词表匹配的词;其中,所述预设的关键词表包括目标场景中用户所关注的目标信息中的关键词;确定模块,用于在确定所述语音数据中包含有与预设的关键词表匹配的词的情况下,将所述语音数据确定为目标语音数据;播放模块,用于播放所述目标语音数据,以提醒用户所述目标信息。
一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现采集目标场景中的语音数据;检测所述语音数据中是否包含有与预设的关键词表匹配的词;其中,所述预设的关键词表包括目标场景中用户所关注的目标信息中的关键词;在确定所述语音数据中包含有与预设的关键词表匹配的词的情况下,将所述语音数据确定为目标语音数据;播放所述目标语音数据,以提醒用户所述目标信息。
一种语音信息提醒设备,包括处理器、声音采集器和播放器,其中,所述声音采集器用于采集目标场景中的语音数据;所述处理器用于检测所述语音数据中是否包含有与预设的关键词表匹配的词;其中,所述预设的关键词表包括目标场景中用户所关注的目标信息中的关键词;在确定所述语音数据中包含有与预设的关键词表匹配的词的情况下,将所述语音数据确定为目标语音数据;所述播放器用于播放所述目标语音数据,以提醒用户所述目标信息。
一种语音信息提醒方法,包括:采集列车中的报站广播数据;检测所述报站广播数据中是否包含有与预设的站名列表匹配的站名;其中,所述预设的站名列表至少包括用户预设的目的地站的站名;在确定所述报站广播数据中包含有与预设的站名列表匹配的站名的情况下,将所述报站广播数据确定为目标广播数据;播放所述目标广播数据,以提醒用户到达目的站。
本说明书提供的一种语音信息提醒方法、装置、服务器和语音信息提醒设备,通过先采集目标场景中出现的语音数据,再检测所采集到的上述语音数据中是否包含有与预设的关键词表匹配的词,以确定该语音数据是否为包含有用户在该目标场景中所关注的目标信息的目标语音数据;在确定该语音数据为目标语音数据的情况下,进一步为用户播放出该目标语音数据,以及时地提醒用户所关注的目标信息,避免用户遗漏掉该目标场景中需要关注的目标信息,提高用户的使用体验。
附图说明
为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是应用本说明书实施例提供的语音信息提醒方法的语音信息提醒设备的结构组成的一个实施例的示意图;
图2是在一个场景示例中,应用本说明书实施例提供的语音信息提醒方法的一种实施例的示意图;
图3是在一个场景示例中,应用本说明书实施例提供的语音信息提醒方法的一种实施例的示意图;
图4是本说明书的一个实施例提供的一种语音信息提醒方法的流程示意图;
图5是本说明书的一个实施例提供的语音信息提醒方法的一个实施例示意图;
图6是本说明书的一个实施例提供的语音信息提醒方法的一个实施例示意图;
图7是本说明书的一个实施例提供的服务器的结构组成示意图;
图8是本说明书的一个实施例提供的语音信息提醒装置的结构组成示意图;
图9是本说明书的一个实施例提供的另一种语音信息提醒方法的流程示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
本说明书实施例提供一种语音信息提醒方法,该方法具体可以应用于包含有处理器、声音采集器和播放器的语音信息提醒设备中。通过该语音信息提醒设备,可以协助用户采集并检测目标场景中出现的语音数据,在确定所采集的语音数据包含有用户在该目标场景中所关注的目标信息时,及时地向用户播放该语音数据,避免用户遗漏掉所关注的目标信息。
具体的,可以参阅图1所示,处理器与声音采集器,以播放器耦合。具体的,上述声音采集器可以用于采集目标场景中的语音数据,并将所采集的语音数据发送至处理器。所述处理器可以用于检测所述语音数据中是否包含有与预设的关键词表匹配的词;其中,所述预设的关键词表包括目标场景中用户所关注的目标信息中的关键词;在确定所述语音数据中包含有与预设的关键词表匹配的词的情况下,将所述语音数据确定为目标语音数据;将所述目标语音数据传输至播放器,并控制所述播放器播放所述目标语音数据,以提醒用户所述关注的目标信息。
在本实施例中,所述处理器具体可以为一种具有数据运算、存储功能以及网络交互功能的电子设备;也可以为运行于该电子设备中,为数据处理、存储和交互提供支持的软件程序。
在本实施例中,所述声音采集器具体可以为一种能够监测采集环境中的语音数据的电子设备。具体的,上述声音采集器可以是麦克风、拾音器等等。
在本实施例中,所述播放器具体可以为一种能够播放所采集的语音数据的电子设备。具体的,上述播放器可以是一种用于播放音频数据的音箱等电子设备,也可以是运行于上述电子设备中用于控制电子设备播放的软件程序。对此,本说明书不作限定。
在一个场景示例中,参阅图2所示,可以应用本说明书实施例提供的语音信息提醒方法可以及时地提醒地铁上正在听音乐的用户到达了目标站点,避免用户坐过站。
用户A准备乘坐地铁去公司上班,从起点站出发,坐到目的地站龙泽站下车,步行前往公司。中间地铁要经过十多个站,用户A上车后,需要等待一个多小时才能到达目的站龙游站下车。
用户A在起点站上车后,想要在从起点站到目的地站这段时间内通过戴耳机听音乐来消磨时间,但是又担心自己由于戴耳机听音乐不能及时地收听到地铁上的报站广播,导致坐过站,没有及时下车。这时,用户A可以使用预先安装有语音信息提醒APP的智能手机作为一种语音信息提醒设备。
具体的,用户A可以先点击手机上的语音信息提醒APP,进而设置界面。在设置界面中用户A可以设置所要提醒的目标信息的关键词。例如,可以在设置界面的预设关键词栏中输入“龙泽站”。
此外,用户A还可以在该设置界面中进一步设置自己所处的具体场景。例如,可以在设置界面的目标场景栏中输入“地铁”,以便后续手机可以更有针对性地对地铁场景中的报站广播进行监测和提醒。
手机APP在接收到用户输入的预设关键词“龙泽站”后,可以先对该预设关键词通过确定出与“龙泽站”语义相同或相近的词,对该预设关键词进行扩展,以便后续能够更加准确、灵敏地发现关于龙泽站的报站数据。
具体的,手机处理器可以先通过预先训练好的word2vec模型(一种用于确定词向量的模型)确定出用户A设置的预设关键词“龙泽站”所对应的词向量。同时,还会根据用户A设置的目标场景,获取与地铁场景匹配的语料库。其中,该匹配的语料库中具体可以包含有大量与地铁相关的预设词,例如,地铁、紫金港站、到站等等。进一步,手机处理器可以通过上述word2vec模型确定出上述与地铁场景匹配的语料库中所包含的各个预设词的词向量。再将上述预设词的词向量分别与预设关键词“龙泽站”的词向量进行比较,根据比较结果,从上述语料库所包含的预设词中筛选出词向量与预设关键词的词向量差异值较小的预设词作为预设关键词的近义词,即与“龙泽站”所表征的语义相近的词,例如“龙泽”、“龙泽站二号出口”等。进而可以根据上述预设关键词,以及预设关键词近似词生成对应的预设的关键词表。
用户A在完成上述设置后就可以安心地戴着耳机听音乐了。而手机处理器则会基于上述APP,不断地自动采集、监测地铁中出现的语音数据,以便及时地发现关于“龙泽站”的报站广播,再通过与手机连接的耳机播放给用户A。
具体实施时,手机处理器可以基于上述APP,调用手机自身的麦克风或者与手机相连的耳机的麦克风等作为声音采集器不断地采集用户A所在的地铁中出现的语音数据,例如,地铁上每个站的报站广播。每次采集语音数据时,可以先将本次所采集的语音数据存储在手机缓存中,再对该语音数据进行进一步分析。
具体的,手机处理器会先对每一次采集的语音数据进行语音识别,将所采集的语音数据转换为对应的文本数据。在将语音数据识别转换为所对应的文本数据的过程中,处理器可以结合预设的关键词表,有针对性地优先将语音数据转换为预设的关键词表中的词,这样可以提高识别转换的效率,以及识别转换的准确度。
具体的,手机处理器可以先获取预设的关键词表中各个关键词的语音信号,再将语音数据中所包含语音信号分别与上述预设的关键词表中关键词的语音信号进行比较,找到语音数据中语音信号与关键词的语音信号相同或相近的词作为第一目标词。再将语音数据中该语音信号所对应的第一目标词转换成文本数据中对应的关键词,从而高效、准确地完成对该语音信号的语音识别转换。例如,一段语音数据中所包含的某个语音信号x如果直接通过语音识别,可能会被识别为“紫荆港”、“紫金港”、“紫晶杠”三种不同的文本数据。但是预设的关键词表中包含有关键词“紫荆港”。处理器在对该段语音数据进行识别转换时,结合预设的关键词表中关键词的语音信号,发现关键词“紫荆港”的语音信号与语音数据中语音信号x较为接近,两者的差异值较小,小于预设的差异阈值。这时,可以优先将该段语音数据中的语音信号x识别为“紫荆港”。
当然,如果在语音数据中没有检测到与预设的关键词表中的关键词的语音信号相同或相近的词,则可以通过语义识别确定出语音数据所对应的文本数据。
在得到了语音数据所对应的文本数据后,进一步手机处理器会根据预设的匹配规则对上述文本数据进行多次的检索匹配,通过确定该文本数据中是否包含有预设的关键词表中的关键词,来判断该文本数据所对应的本次采集语音数据是否是包含有用户A关注的“龙泽站”的报站广播。
在根据预设的匹配规则进行具体检索匹配时,可以先基于词本身的特点进行第一次匹配。将文本数据中的各个词分别与预设的关键词表中的关键词进行逐一比较,以确定文本数据中是否存在与预设的关键词表中的关键词相同或相近的第二目标词。如果存在上述第二目标词,可以判断该文本数据中存在与预设的关键词表匹配的词。
例如,将文本数据中所包含的各个词分别与预设的关键词表中的关键词直接进行比较,确定出文本数据中的词与关键词的差异程度,再检索是否存在与关键词的差异程度较小的,例如小于预设的以阈值的词作为第二目标词。在本场景示例中,如果检索到文本数据中的“龙泽站”与预设的关键词表中的“龙泽站”相同,则可以判断该文本数据存在与预设的关键词表匹配的词。
如果确定文本数据中不存在上述第二目标词,有可能该文本数据确实不存在与预设的关键词表匹配的词,也有可能是在之前的语义识别转换过程中发生了误差,导致得到的文本数据本身不够准确。为了避免出现遗漏,还可以根据预设的匹配规则,基于词的拼音数据进行第二次匹配。
具体的,可以分别确定文本数据中所包含的各个词的拼音数据,以及预设的关键词表中各个关键词的拼音数据。再将文本数据中的各个词的拼音数据,与关键词的拼音数据分别进行比较,以确定文本数据中是否存在拼音数据与关键词相同或相近的第三目标词。如果存在上述第三目标词,也可以判断该文本数据中存在与预设的关键词表匹配的词。
例如,在第一次匹配中,在预设的关键词表中没有找到与文本数据中“龙则”相同或相近的关键词。这时,可以先结合语音数据确定出文本数据中“龙则”所对应的拼音数据“longze”,再基于拼音数据在预设的关键词表中进行匹配比较,发现预设的关键词表中关键词“龙泽”的拼音数据“longze”与文本数据中的龙则的拼音数据相同,因此,可以将龙则确定为符合要求的第三目标词,进而可以判断该文本数据存在与预设的关键词表匹配的词。
如果确定也没有上述第三目标词,有可能该文本数据确实不存在与预设的关键词表匹配的词,也有可能由于口音发音的问题,导致基于拼音数据无法进行准确、有效的匹配。因此,为了避免出现遗漏,还可以根据语音数据的口音特点,结合对应的口音规则,进行第三次匹配。
具体的,手机处理器可以先根据地理位置信息,或者通过识别语音数据中特征词判断所采集的语音数据所对应的口音类型,例如,湖南方言口音。进而可以确定出与该语音数据匹配的湖南方言的口音规则,例如,容易将“l”发音成“n”。进而可以根据上述口音规则对之前结合语音数据所确定的文本数据中词的拼音数据进行修正,再根据修正后的词的拼音数据再次进行比较匹配,以确定文本数据中是否存在第三目标词。
例如,之前结合语音数据确定出文本数据中某个词的拼音数据为“nongze”,再基于上述拼音数据没有从文本数据中确定出第三目标词后。处理器可以根据用户A所在的位置信息“长沙市”确定出与语音数据匹配的口音规则为湖南方言的口音规则。基于该口音规则,处理器会将之前所确定出的文本数据中的词的拼音数据进行修正,检测并将之前确定出的拼音数据中“nongze”中的“n”修正为“l”从而得到了修正后的拼音数据“longze”。再根据修正后的拼音数据“longze”对预设的关键词表中的关键词表的拼音数据再次进行匹配,发现预设的关键词表中的关键词“龙泽”的拼音数据与文本数据中修正后的词的拼音数据相同,从而可以确定出文本数据中存在第三目标词,判断该文本数据存在与预设的关键词表匹配的词。
通过上述方式,如果处理器确定出文本数据中包含有与预设的关键词表匹配的关键词,进一步可以判断与该文本数据对应的语音数据为包含有用户A所关注的关于龙泽站的报站广播的目标语音数据。进而,可以从手机缓存中调取该段目标语音数据,并通过与手机相连的耳机向用户A插播该段目标语音数据。具体可以参阅图3所示。
这时,用户A会发现正在收听的音乐突然暂停了,取而代之的是耳机里播放出上述目标语音数据,即报站广播:“龙泽站到了,到龙泽站的乘客请下车”。这样用户A在一直戴着耳机无法清楚地收听到地铁上的到站广播的情况下,依然不会错过自己所关注的关于龙泽站的到站广播。并且基于该到站广播,用户A可以及时地发现自己已经到目的站龙泽站了,从而可以及时下车,避免由于听音乐没有听到关于龙泽站的到站广播导致坐过站。
相反,通过上述方式,如果处理器确定出文本数据中不包含有与预设的关键词表匹配的关键词,可以判断与该文本数据对应的语音数据为不包含有用户A所关注的关于龙泽站的报站广播的语音数据,即不是目标语音数据。例如,当前地铁上所广播的到站广播为“花园站到了,到花园站的乘客请下车”。这时,参阅图2所示,处理器在确定该段语音数据包含有与预设的关键词表匹配的情况下,确定该段语音数据不包含有用户需要关注的目标信息。可以直接从手机缓存中删除该段语音数据,不会影响到用户A正常听音乐。进一步会对下一段语音数据,例如刚采集的报站广播,按照上述方式进行处理,以确定下一段语音数据所对应的文本数据中是否存在与预设的关键词表中的关键词匹配的词。
在另一个场景示例中,手机处理器在采集到地铁中出现的语音数据后,为了提高后续对语音数据进行分析、判断的准确度,在对所采集的语音数据进行具体语音识别之前,还可以对该语音数据先进行预处理,以便有针对性地减少地铁场景中噪声数据的干扰,提高语音数据的数据质量。
具体的,手机处理器可以根据用户A在设置界面中设置的目标场景,从多个预先针对多种不同应用场景训练的多个预处理模型中筛选出与地铁场景匹配的预处理模型,作为匹配的预处理模型。进而可以调用上述匹配的预处理模型对所采集的语音数据进行具体的预处理。
其中,上述与地铁场景匹配的预处理模型具体可以包括一种预先利用在地铁场景中采集的样本数据对神经网络模型进行学习、训练得到能够识别并过滤地铁场景中噪声数据(例如,地铁中乘客之间的对话、地铁中列车运行过程中的声音,以及地铁中播放的广告等)。
具体实施时,手机处理器可以将每次采集到的语音数据作为模型输入,先输入至上述匹配的预处理模型。并通过运行该模型,对输入的语音数据进行包括诸如识别并过滤噪声数据等预处理,得到数据质量相对更高、精度相对更好的模型输出,作为处理后的语音数据。进而后续可以根据上述处理后的语音数据进行具体处理,以检测确定上述处理后的语音数据中是否包含有与预设的关键词表匹配的词。从而能够有效地降低了嘈杂的地铁场景中噪声的干扰,提高检测准确度。
此外,根据具体场景的需求,为了提高后续针对语音数据检测处理的效率,还可以在对上述处理后语音数据进行检测处理之前,对上述处理后的语音数据进行无效词的检测识别,确定出语音数据中的无效词,并删除无效词,得到去除无效词的语音数据。其中,上述无效词具体可以包括在目标场景中经常出现,但用户一般不会关注的,无意义的词。例如,地铁场景中报站广播中出现的“乘客们”、“旅途愉快”、“请有序下车”等词。
后续再对去除无效词的语音数据进行具体的诸如语音识别转换以及相应的关键词匹配等数据处理,从而能够减少后续的数据处理过程中的数据处理量,提高数据处理效率。
由上述场景示例可见,本说明书提供的语音信息提醒方法,通过检测所采集的语音数据中是否包含有与预设的关键词表匹配的词,确定该语音数据是否为包含有用户在该目标场景中所关注的目标信息的目标语音数据;在确定该语音数据为目标语音数据的情况下,为用户播放该目标语音数据,以及时地提醒用户所关注的目标信息,避免用户遗漏需要关注的目标信息。
参阅图4所示,本说明书实施例提供了一种语音信息提醒方法,其中,该方法具体应用于客户端设备一侧。具体实施时,该方法可以包括以下内容:
S401:采集目标场景中的语音数据。
在一些实施例中,上述目标场景具体可以包括用户在收听诸如音乐、有声书等音频数据,无法及时、清楚地接收到外接环境中的其他语音数据的场景。具体的,上述目标场景可以包括用户在地铁上等待到达目的地站的过程中戴着耳机听音乐无法接收到地铁上的关于目的地站的报站广播的场景。也可以包括用户在某银行排号等待办理业务的过程中戴着耳机音乐无法接收到银行关于自己号码的报号广播的场景。还可以包括用户在某饮料店排队等候所点的饮料过程戴着耳机无法听到饮料店服务员通关于自己的流水单号的饮料已经完成的通知信息等。当然,上述所列举的目标场景只是一种示意性说明。具体实施时,根据具体情况和处理需要,还可以选择其他的应用场景作为目标场景。对此,本说明书不作限定。
在一些实施例中,上述目标场景中的语音数据具体可以包括目标场景中出现的多种不同类型的语音数据,例如,地铁上出现的报站广播、餐厅中服务员的喊号声音等等。当然,上述所列举的语音数据只是一种示意性说明。具体实施时,根据具体的目标场景,还可以包括其他类型和内容的语音数据。对此,本说明书不作限定。
其中,上述语音数据与所在的具体目标场景相关。上述语音数据中可能包含有用户所关注的目标信息,也可能不包含有用户所关注的目标信息。上述目标信息为在目标场景中,对用户有用的、需要及时告知用户的信息。对于不同的目标场景,上述目标信息可以是不同内容的信息。
例如,在地铁场景中,地铁到达用户的目的地站(例如XX站)时所接收到的报站广播可以理解为一种包含有用户比较关注的目标信息的语音数据。该语音数据所包含的“XX站到了”这段信息可以理解为地铁场景中需要及时告知用户的一种目标信息。基于该目标信息用户可以知道自己已经到达目的地站XX站了,需要赶紧下车。而在地铁到达其他站时所接收到的关于其他站的报站广播则可以理解为一种不包含用户所关注的目标信息的语音数据。
在一些实施例中,上述客户端设备具体可以是一种应用上述语音信息提醒方法,集成了相关处理器的,并携带有麦克风的耳机设备。具体实施时,通过该耳机设备的麦克风可以采集目标场景中出现的语音数据。上述客户端设备还可以是一种预先安装有基于语音信息提醒的应用程序的手机。具体实施时,可以通过该手机的内置麦克风采集目标场景中出现的语音数据等。当然,需要说明的是,上述所列举的客户端设备只是一种示意性说明。具体实施时,上述客户端设备还可以是用户使用的智能眼镜、智能手表、平板电脑等等。对于客户端设备的具体类型,本说明书不作限定。
在一些实施例中,具体实施时,用户可以通过客户端设备设置对应的目标场景的相关信息,例如,设置目标场景的类型、标签、名称、特征等等。进而客户端设备可以根据用户设置的上述相关信息,确定所针对目标场景。当然,也可以是客户端设备自动采集用户当前所在位置的预设范围内的信息数据,例如,地址数据、周边环境特征等,进而可以根据所采集的上述信息数据,自动判断用户当前所处的目标场景。
在一些实施例中,再通过语音信息提醒设备采集语音数据的同时,还可以将所采集的语音数据先存储在语音信息提醒设备的缓存中,以便后续调取使用。
S403:检测所述语音数据中是否包含有与预设的关键词表匹配的词;其中,所述预设的关键词表包括目标场景中用户所关注的目标信息中的关键词。
在一些实施例中,上述预设的关键词表至少包括有目标场景中用户所关注的目标信息中的关键词。例如,地铁中用户计划下车的目的地站名,饮料店里用户购买饮料时拿到的流水单号,候车室中用户等待上车的列车号等等。当然,上述所列举的关键词只是一种示意性说明。具体实施时,根据具体的目标场景以及用户具体关注的目标信息,上述关键词还可以包括其他内容的词。对此,本说明书不作限定。
在一些实施例中,用户可以通过客户端设备预先设置相应的词,作为预设关键词,客户端设备可以根据用户设置的预设关键词建立得到对应的预设的关键词表。
例如,在地铁场景中,用户可以将自己准备下车的目的地站“龙泽站”通过手机设置为预设关键词。手机将接收并根据用户设置的预设关键词建立对应的预设的关键词表。
在一些实施例中,可以参阅图5所示,在接收到用户设置的预设关键词后,可以进一步基于所用户设置的预设关键词进行扩展,得到多个与用户设置的预设关键词的语义相近或相同的预设关键词的近义词,进而可以根据预设关键词,以及预设关键词的近义词建立得到覆盖范围更广的预设的关键词表。再基于上述扩展后的预设的关键词表来对语音数据进行检测匹配,可以避免遗漏掉包含有用户关注的目标信息,但不包含与用户设置的预设关键词完全相同的语音数据。
在一些实施例中,具体实施时,可以先根据所接收的用设置的预设关键词,确定出对应的预设关键词的词向量;再获取并确定预设的语料库中的预设词的词向量,其中,所述预设的语料库包括多个预设词;通过根据所述预设关键词的词向量、所述预设词的词向量,从所述预设的语料库中筛选出预设关键词的近义词;进而可以根据所述预设关键词,和所述预设关键词的近义词,建立所述预设的关键词表。
在一些实施例中,具体实施时,可以利用预先训练好的词向量模型,例如word2vec模型,对预设关键词进行处理,得到对应的预设关键词的词向量;利用词向量模型对预设的语料库中的多个预设词分别进行处理,得到对应的多个预设词的词向量。再通过计算并根据所述预设词的词向量与预设关键词的词向量的向量距离来比较对应的预设词与预设关键词的相近程度,得到对应比较结果。进而可以根据比较结果筛选出与预设关键词的语义较为接近,或者与预设关键词的词向量的向量距离较小的预设词作为预设关键词的近义词。进而可以根据预设关键词和预设关键词的近义词,建立得到覆盖范围更广的预设的关键词表。
在一些实施例中,上述预设的语料库可以根据所对应目标场景来确定。例如,可以预先针对多种不同的目标场景,建立多个对应的语料库。具体实施时,可以根据目标场景从多个语料库中筛选出与当前场的目标场景匹配的语料库作为预设的语料来更加精准地确定预设关键词的近义词。当然,也可以不对目标场景作区分,对于不同的目标场景也可以使用统一的一个语料库作为预设的语料库。对此,本说明书不作限定。
在一些实施例中,参阅图6所示,语音信息提醒设备在得到所采集的语音数据后,会先对所采集的语音数据进行语音识别转换,将语音数据转换为表示同一语义,对应的文本数据。再基于文本数据进行检索匹配,通过确定文本数据中是否存在与预设的关键词表匹配的词来确定语音数据中是否存在与预设的关键词表匹配的词。如果文本数据中存在与预设的关键词表匹配的词,则可以判断对应的语音数据中存在与预设的关键词表匹配的词,该语音数据中包含有目标场景中用户所关注的目标信息。如果文本数据中不存在与预设的关键词表匹配的词,则可以判断对应的语音数据中不存在与预设的关键词表匹配的词,该语音数据中不包含目标场景中用户所关注的目标信息。
在一些实施例中,为了能够更加高效、准确地对目标场景中所采集的语音数据进行语音识别转换,得到质量相对较高、较为准确的文本数据。具体实施时,可以结合预设的关键词表对语音数据进行语音识别转换。
具体的,可以先确定出预设的关键词表中的各个关键词的语音信号,在对所采集的语音数据进行语音识别转换的过程中,可以利用预设的关键词表中的关键词的语音信号作为参考,优先将语音数据中语音信号与预设的关键词表中关键词的语音信号差异较小的词识别转换成对应的关键词。
例如,可以根据预设的关键词表中的关键词的语音信号,在语音数据中进行检索,确定语音数据中是否存在与某个关键词的语音信号的差异值小于预设的差异阈值的词,如果存在将该词确定为第一目标词,并优先将语音数据中的该第一目标词识别转换为预设的关键词表中的语音信号与该第一目标词的语音信号的差异值小于预设的差异阈值的关键词。从而结合预设的关键词表,更加快速、准确地识别出语音数据中给的第一目标词。
在一些实施例中,再将语音数据识别转换为对应的文本数据后,可以根据预设的匹配规则,通过多种检索匹配的方式来检索该文本数据,避免遗漏掉文本数据中存在的与预设的关键词表匹配的词,更加准确地确定出文本数据是否存在上述与预设的关键词表匹配的词。其中,上述与预设的关键词表匹配的词具体可以包括文本数据中与预设的关键词表中的某个关键词语义相同或相近的词。
具体实施时,可以根据预设的匹配规则,先基于词本身的特征,对文本数据进行第一次匹配检索。
具体的,可以根据预设的关键词表中的关键词的特征,检索文本数据中是否存在与上述关键词的相同或相近(例如,两者差异程度小于预设的第一阈值)的词,即第二目标词。例如,通过检索文本数据,发现文本数据中的词“龙泽”与预设的关键词表中的关键词“龙泽”相同,则确定文本数据中存在与预设的关键词表匹配的词。
如果通过上述第一次匹配检索,在文本数据中没有找到上述第二目标词,为了避免出现遗漏,可以基于词的拼音数据对文本数据进行第二次匹配的检索。
具体的,可以先确定文本数据中各个词的拼音数据,以及预设的关键词表中各个关键词的拼音数据;再检索所述文本数据中是否存在某个词的拼音数据与预设的关键词表中关键词拼音数据相同或相近(例如,两者的拼音数据的差异程度小于预设的第二阈值)的词,即第三目标词。例如,通过检索文本数据,发现文本数据中的词“龙则”的拼音数据“longze”与预设的关键词表中的关键词“龙泽”的拼音数据“longze”相同,因此也可以将文本数据中的词“龙则”确定为第三目标词。考虑到在语音识别转换时可能将原本的词“龙泽”识别转换成了同音词“龙则”,为了避免遗漏掉用户关注的目标信息,在确定出该文本数据中包含有第三目标词时,也可以判断文本数据存在包含有与预设的关键词表匹配的词,进而也可以将对应的语音数据确定为包含有与预设的关键词表匹配的词的语音数据。
如果通过上述第二次匹配检索,在文本数据中没有找到上述第三目标词,为了避免出现遗漏,还可以结合口音差异,对文本数据中的词的拼音数据进行修正,再基于修正后的拼音数据进行第三次匹配检索。
具体的,可以根据与文本数据所对应语音数据,确定与语音数据匹配的口音规则。例如,可以根据用户当前所处的地理位置等信息确定出所采集的语音数据所对应的口音类型。其中,上述口音类型具体可以包括方言口音。进而可以根据所确定的口音类型,调用对应的口音规则。并根据上述口音规则,对文本数据中各个词的拼音数据进行针对性的修正,例如,将各个词的拼音数据中的“n”修改成“l”。得到修正后的拼音数据。进而,可以基于修正后的拼音数据对文本数据中的词进行检索,以确定文本数据中是否存在修正后的拼音数据与预设的关键词表中关键词的拼音数据相同或相近(例如,两者的拼音数据的差异程度小于预设的第二阈值)的词,即第三目标词。这样可以有效地避免所采集的语音数据由于受口音影响,导致无法准确检索匹配到关键词。
通过上述第三次检索匹配,如果能从文本数据中找出上述第三目标词,可以判断文本数据中存在与预设的关键词表匹配的词,进而可以确定所对应的语音数据存在与预设的关键词表匹配的词。相反,如果不能从文本数据中找到上述第三目标词,可以判断文本数据中确实不存在与预设的关键词表匹配的词,进而可以确定所对应的语音数据确实不存在与预设的关键词表匹配的词。
S405:在确定所述语音数据中包含有与预设的关键词表匹配的词的情况下,将所述语音数据确定为目标语音数据。
在本实施例中,在确定语音数据中包含有与预设的关键词表匹配的词的情况下,可以进一步确定该语音数据为包含有用户在该目标场景中所关注的目标信息的语音数据,记为目标语音数据。
S407:播放所述目标语音数据,以提醒用户所述目标信息。
在本实施例中,可以通过语音信息提醒设备为用户播放上述目标语音数据,以提醒用户相应的目标信息。
具体的,例如,语音信息提醒设备可以暂时中断用户正在收听的音乐或者有声书等音频数据,并从缓存中调取该段目标语音数据,通过用户佩戴的耳机向用户出播放该段目标语音数据,以便用户能够及时地接收到其中的目标信息。当然,具体实施时,语音信息提醒设备还可对目标语音数据进行处理,仅截取目标语音数据中包含有目标信息的一段语音数据播放给用户等。或者,语音信息提醒设备还可以从目标语音数据中截取与预设的关键词表匹配的词的语音数据播放给用户等等。当然,上述所列举的播放方式只是一种示意性说明。具体实施时,根据具体情况和用户习惯,还可以采用其他合适的方式来播放目标语音数据以提醒用户相关的目标信息。对此,本说明书不作限定。
由上可见,本说明书实施例提供的语音信息提醒方法,通过采集目标场景中出现的语音数据,并通过检测所采集的语音数据中是否包含有与预设的关键词表匹配的词,确定该语音数据是否为包含有用户在该目标场景中所关注的目标信息的目标语音数据;在确定该语音数据为目标语音数据的情况下,为用户播放该目标语音数据,以及时地提醒用户所关注的目标信息,使得用户在诸如佩戴耳机听音乐等无法清楚地接收到外界的语音数据的情况下,也不会遗漏需要关注的目标信息,提高了用户的使用体验。
在一些实施例中,所述检测所述语音数据中是否包含有与预设的关键词表匹配的词,具体实施时,可以包括以下内容:根据所述预设的关键词表,对所述语音数据进行语音识别,得到与所述语音数据对应的文本数据;根据预设的匹配规则,检索所述文本数据,以确定所述文本数据中是否存在与所述预设的关键词表匹配的词。
通过上述实施例,可以基于文本数据对语音数据是否包含有与预设的关键词表匹配的词进行较为准确的判断。
在一些实施例中,上述根据所述预设的关键词表,对所述语音数据进行语音识别,得到与所述语音数据对应的文本数据,具体实施时,可以包括以下内容:根据所述预设的关键词表中的关键词的语音信号,检测所述语音数据中是否存在与所述关键词的语音信号的差异值小于预设的差异阈值的第一目标词;在确定所述语音数据中存在与所述关键词的语音信号的差异值小于预设的差异阈值的第一目标词的情况下,将所述语音数据中的第一目标词的语音信号转化为文本数据中所述预设的关键词表中对应的关键词。
通过上述实施例,可以更加快速、准确地将所采集的语音数据识别转换成对应的文本数据。
在一些实施例中,上述根据预设的匹配规则,检索所述文本数据,以确定所述文本数据中是否存在与所述预设的关键词表匹配的词,具体实施时,可以包括以下内容:检索所述文本数据中是否存在与所述预设的关键词表中的关键词的差异程度小于预设的第一阈值的第二目标词;在确定所述文本数据不存在所述第二目标词的情况下,确定所述文本数据中词的拼音数据;检索所述文本数据中是否存在与所述预设的关键词表中的关键词的拼音数据的差异程度小于预设的第二阈值的第三目标词;在确定所述文本数据存在所述第三目标词的情况下,确定所述文本数据中存在与所述预设的关键词表匹配的词。
通过上述实施例,在基于词的特征确定文本数据不存在上述第一目标词的情况下,可以基于词的拼音数据进行第二次检索匹配,确定文本数据中是否存在第二目标词,从而可以避免遗漏掉包含有目标信息的语音数据。
在一些实施例中,在确定所述文本数据不存在所述第三目标词的情况下,所述方法具体实施时,还可以包括以下内容:根据所述语音数据,确定与所述语音数据匹配的口音规则;根据所述口音规则,对所述文本数据中词的拼音数据进行修正,得到修正后的拼音数据;根据所述文本数据中词的修正后的拼音数据,检索所述文本数据中是否存在与所述预设的关键词表中的关键词的拼音数据的差异程度小于预设的第二阈值的第三目标词。
通过上述实施例,在基于词的拼音数据,通过第二次匹配检索确定文本数据不存在上述第二目标词的情况下,又考虑到口音的影响,根据对应的口音规则对文本数据中的拼音数据进行对应的修正后,再基于修正后的拼音数据,进行第三次检索匹配来确定文本数据中是否存在第二目标词,从而可以进一步避免遗漏掉包含有目标信息的语音数据。
在一些实施例中,所述方法具体实施时,还可以包括以下内容:在根据所述文本数据中词的修正后的拼音数据,确定所述文本数据中不存在第三目标词的情况下,删除所述语音数据。
在一些实施例中,在根据所述预设的关键词表,对所述语音数据进行语音识别之前,所述方法具体实施时,还可以包括以下内容:确定的目标场景的场景类型;根据所述目标场景的场景类型,从多个预处理模型中确定出匹配的预处理模型;通过所述匹配的预处理模型,对所述语音数据进行预处理,其中,所述预处理至少包括:过滤目标场景中的噪声数据。
通过上述实施例,在对语音数据进行语音识别转换成对应的文本数据之前,可以先过滤掉在目标场景中采集的语音数据所存在的噪声数据,提高语音数据的数据质量。进而可以使得后续,对处理后的语音数据进行语音识别转换时具有更高的准确度。
在一些实施例中,还可以对语音数据进行无效词的检测识别,并删除语音数据中识别出的无效词,得到去除无效词的语音数据。再对去除无效词的语音数据进行语音识别转换,得到对应的文本数据。从而可以减少语音识别转换过程中的数据处理量,提高处理效率。
在一些实施例中,所述预设的关键词表具体可以按照以下方式获取:接收用户针对目标场景设置的预设关键词,并确定所述预设关键词的词向量;获取并确定预设的语料库中的预设词的词向量,其中,所述预设的语料库包括多个预设词;根据所述预设关键词的词向量、所述预设词的词向量,从所述预设的语料库中筛选出预设关键词的近义词;根据所述预设关键词,和所述预设关键词的近义词,建立所述预设的关键词表。
通过上述实施例,可以基于用户设置的预设关键词进行扩展,得到多个与预设关键词语义相近或相同的预设关键词的近义词,再根据上述预设关键词和预设关键词的近义词来建立到的覆盖范围相对更广的预设的关键词表。
在一些实施例中,所述预设关键词具体可以包括以下中的任意一种或多种:站台名称、流水单号、用户姓名、用户账户名等。当然,上述所列举的预设关键词只是一种示意性说明。具体实施时,根据具体的目标场景,以及用户所关注的目标信息的具体内容,还可以选择其他词作为上述预设关键词。对此,本说明书不作限定。
由上可见,本说明书实施例提供的语音信息提醒方法,通过采集目标场景中出现的语音数据,并通过检测所采集的语音数据中是否包含有与预设的关键词表匹配的词,确定该语音数据是否为包含有用户在该目标场景中所关注的目标信息的目标语音数据;在确定该语音数据为目标语音数据的情况下,为用户播放该目标语音数据,以及时地提醒用户所关注的目标信息,使得用户在诸如佩戴耳机听音乐等无法清楚地接收到外界的语音数据的情况下,也不会遗漏需要关注的目标信息,提高了用户的使用体验。
本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:采集目标场景中的语音数据;检测所述语音数据中是否包含有与预设的关键词表匹配的词;其中,所述预设的关键词表包括目标场景中用户所关注的目标信息中的关键词;在确定所述语音数据中包含有与预设的关键词表匹配的词的情况下,将所述语音数据确定为目标语音数据;播放所述目标语音数据,以提醒用户所述目标信息。
为了能够更加准确地完成上述指令,参阅图7所示,本说明书实施例还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口701、处理器702以及存储器703,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。
其中,所述网络通信端口701,具体可以用于采集目标场景中的语音数据。
所述处理器702,具体可以用于检测所述语音数据中是否包含有与预设的关键词表匹配的词;其中,所述预设的关键词表包括目标场景中用户所关注的目标信息中的关键词;在确定所述语音数据中包含有与预设的关键词表匹配的词的情况下,将所述语音数据确定为目标语音数据;播放所述目标语音数据,以提醒用户所述目标信息。
所述存储器703,具体可以用于存储相应的指令程序。
在本实施例中,所述网络通信端口701可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的80号端口,也可以是负责进行FTP数据通信的21号端口,还可以是负责进行邮件数据通信的25号端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。
在本实施例中,所述处理器702可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。
在本实施例中,所述存储器703可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
本说明书实施例还提供了一种基于上述语音信息提醒方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:采集目标场景中的语音数据;检测所述语音数据中是否包含有与预设的关键词表匹配的词;其中,所述预设的关键词表包括目标场景中用户所关注的目标信息中的关键词;在确定所述语音数据中包含有与预设的关键词表匹配的词的情况下,将所述语音数据确定为目标语音数据;播放所述目标语音数据,以提醒用户所述目标信息。
在本实施例中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施例中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
参阅图8所示,在软件层面上,本说明书实施例还提供了一种语音信息提醒装置,该装置具体可以包括以下的结构模块。
采集模块801,具体可以用于采集目标场景中的语音数据;
检测模块803,具体可以用于检测所述语音数据中是否包含有与预设的关键词表匹配的词;其中,所述预设的关键词表包括目标场景中用户所关注的目标信息中的关键词;
确定模块805,具体可以用于在确定所述语音数据中包含有与预设的关键词表匹配的词的情况下,将所述语音数据确定为目标语音数据;
播放模块807,具体可以用于播放所述目标语音数据,以提醒用户所述目标信息。
在一些实施例中,所述检测模块803具体可以包括以下结构单元:
识别单元,具体可以用于根据所述预设的关键词表,对所述语音数据进行语音识别,得到与所述语音数据对应的文本数据;
第一确定单元,具体可以用于根据预设的匹配规则,检索所述文本数据,以确定所述文本数据中是否存在与所述预设的关键词表匹配的词。
在一些实施例中,所述识别单元具体可以用于根据所述预设的关键词表中的关键词的语音信号,检测所述语音数据中是否存在与所述关键词的语音信号的差异值小于预设的差异阈值的第一目标词;在确定所述语音数据中存在与所述关键词的语音信号的差异值小于预设的差异阈值的第一目标词的情况下,将所述语音数据中的第一目标词的语音信号转化为文本数据中所述预设的关键词表中对应的关键词。
在一些实施例中,所述第一确定单具体可用用于检索所述文本数据中是否存在与所述预设的关键词表中的关键词的差异程度小于预设的第一阈值的第二目标词;在确定所述文本数据不存在所述第二目标词的情况下,确定所述文本数据中词的拼音数据;检索所述文本数据中是否存在与所述预设的关键词表中的关键词的拼音数据的差异程度小于预设的第二阈值的第三目标词;在确定所述文本数据存在所述第三目标词的情况下,确定所述文本数据中存在与所述预设的关键词表匹配的词。
在一些实施例中,在确定所述文本数据不存在所述第三目标词的情况下,所述第一确定单元具体还可以用于根据所述语音数据,确定与所述语音数据匹配的口音规则;根据所述口音规则,对所述文本数据中词的拼音数据进行修正,得到修正后的拼音数据;根据所述文本数据中词的修正后的拼音数据,检索所述文本数据中是否存在与所述预设的关键词表中的关键词的拼音数据的差异程度小于预设的第二阈值的第三目标词。
在一些实施例中,在根据所述文本数据中词的修正后的拼音数据,确定所述文本数据中不存在第三目标词的情况下,所述第一确定单元具体还可以用于删除所述语音数据。
在一些实施例中,所述装置具体还可以包括预处理模块,所述预处理模块具体可以包括以下结构单元:
第二确定单元,具体可以用于确定的目标场景的场景类型;
第三确定单元,具体可以用于根据所述目标场景的场景类型,从多个预处理模型中确定出匹配的预处理模型;
处理单元,具体可以用于通过所述匹配的预处理模型,对所述语音数据进行预处理,其中,所述预处理至少包括:过滤目标场景中的噪声数据。
在一些实施例中,所述装置具体还可以包括建立模块,所述建立模块具体可以包括以下结构单元:
第四确定单元,具体可以用于接收用户针对目标场景设置的预设关键词,并确定所述预设关键词的词向量;
第五确定单元,具体可以用于获取并确定预设的语料库中的预设词的词向量,其中,所述预设的语料库包括多个预设词;
筛选单元,具体可以用于根据所述预设关键词的词向量、所述预设词的词向量,从所述预设的语料库中筛选出预设关键词的近义词;
建立单元,具体可以用于根据所述预设关键词,和所述预设关键词的近义词,建立所述预设的关键词表。
在一些实施例中,所述预设关键词具体可以包括以下至少之一:站台名称、流水单号、用户姓名、用户账户名等。当然,上述所列举的预设关键词只是一种示意性说明。具体实施时,根据具体的目标场景和处理需求,还可以包括其他内容的词作为上述预设关键词。对此,本说明书不作限定。
需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
由上可见,本说明书实施例提供的语音信息提醒装置,通过采集模块采集目标场景中出现的语音数据,并通过检测模块和确定模块检测所采集的语音数据中是否包含有与预设的关键词表匹配的词,确定该语音数据是否为包含有用户在该目标场景中所关注的目标信息的目标语音数据;在确定该语音数据为目标语音数据的情况下,通过播放模块为用户播放该目标语音数据,以及时地提醒用户所关注的目标信息,避免用户遗漏需要关注的目标信息。
参阅图9所示,本说明书实施例还提供了一种针对乘客乘车听音乐或者其他音频内容时的场景的语音信息提醒方法。该方法具体实施时,可以包括以下内容:
S901:采集列车中的报站广播数据;
S903:检测所述报站广播数据中是否包含有与预设的站名列表匹配的站名;其中,所述预设的站名列表至少包括用户预设的目的地站的站名;
S905:在确定所述报站广播数据中包含有与预设的站名列表匹配的站名的情况下,将所述报站广播数据确定为目标广播数据;
S907:播放所述目标广播数据,以提醒用户到达目的站。
在一些实施例中,上述列车具体可以包括地铁、火车、客车、公交等等,当然也可以将上述方法应用于诸如乘坐飞机、轮船等其他交通工具的场景中。
在本实施例中,用户在乘坐列车前往目的站的过程中往往会喜欢戴上等设备通过收听音乐、有声书等音频内容来度过乘车时光,这时往往无法听到或听清列车内到站时的报站广播,导致可能到了目的地站,用户由于没听到目的站到了的报站广播而没有及时下车,坐过了站。通过上述实施例,可以在用户在列车上正常收听音乐、有声书等音频内容时,采集并检测列车内的报站广播数据,通过检测所述报站广播数据中是否包含有与预设的站名列表匹配的站名,确定是否是关于目的站的报站广播数据,即目标报站广播数据。在确定所采集检测的报站刚播数据为关于目的站的报站广播数据后,可以及时地通过耳机等设备向用户播放该条报站广播数据,以提醒用户目的地已经到了,避免用户坐过站。
虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施例的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。
Claims (21)
1.一种语音信息提醒方法,包括:
采集目标场景中的语音数据;
检测所述语音数据中是否包含有与预设的关键词表匹配的词;其中,所述预设的关键词表包括目标场景中用户所关注的目标信息中的关键词;
在确定所述语音数据中包含有与预设的关键词表匹配的词的情况下,将所述语音数据确定为目标语音数据;
播放所述目标语音数据,以提醒用户所述目标信息。
2.根据权利要求1所述的方法,所述检测所述语音数据中是否包含有与预设的关键词表匹配的词,包括:
根据所述预设的关键词表,对所述语音数据进行语音识别,得到与所述语音数据对应的文本数据;
根据预设的匹配规则,检索所述文本数据,以确定所述文本数据中是否存在与所述预设的关键词表匹配的词。
3.根据权利要求2所述的方法,根据所述预设的关键词表,对所述语音数据进行语音识别,得到与所述语音数据对应的文本数据,包括:
根据所述预设的关键词表中的关键词的语音信号,检测所述语音数据中是否存在与所述关键词的语音信号的差异值小于预设的差异阈值的第一目标词;
在确定所述语音数据中存在与所述关键词的语音信号的差异值小于预设的差异阈值的第一目标词的情况下,将所述语音数据中的第一目标词的语音信号转化为文本数据中所述预设的关键词表中对应的关键词。
4.根据权利要求2所述的方法,根据预设的匹配规则,检索所述文本数据,以确定所述文本数据中是否存在与所述预设的关键词表匹配的词,包括:
检索所述文本数据中是否存在与所述预设的关键词表中的关键词的差异程度小于预设的第一阈值的第二目标词;
在确定所述文本数据不存在所述第二目标词的情况下,确定所述文本数据中词的拼音数据;
检索所述文本数据中是否存在与所述预设的关键词表中的关键词的拼音数据的差异程度小于预设的第二阈值的第三目标词;
在确定所述文本数据存在所述第三目标词的情况下,确定所述文本数据中存在与所述预设的关键词表匹配的词。
5.根据权利要求4所述的方法,在确定所述文本数据不存在所述第三目标词的情况下,所述方法还包括:
根据所述语音数据,确定与所述语音数据匹配的口音规则;
根据所述口音规则,对所述文本数据中词的拼音数据进行修正,得到修正后的拼音数据;
根据所述文本数据中词的修正后的拼音数据,检索所述文本数据中是否存在与所述预设的关键词表中的关键词的拼音数据的差异程度小于预设的第二阈值的第三目标词。
6.根据权利要求5所述的方法,所述方法还包括:
在根据所述文本数据中词的修正后的拼音数据,确定所述文本数据中不存在第三目标词的情况下,删除所述语音数据。
7.根据权利要求2所述的方法,在根据所述预设的关键词表,对所述语音数据进行语音识别之前,所述方法还包括:
确定的目标场景的场景类型;
根据所述目标场景的场景类型,从多个预处理模型中确定出匹配的预处理模型;
通过所述匹配的预处理模型,对所述语音数据进行预处理,其中,所述预处理至少包括:过滤目标场景中的噪声数据。
8.根据权利要求1所述的方法,所述预设的关键词表按照以下方式获取:
接收用户针对目标场景设置的预设关键词,并确定所述预设关键词的词向量;
获取并确定预设的语料库中的预设词的词向量,其中,所述预设的语料库包括多个预设词;
根据所述预设关键词的词向量、所述预设词的词向量,从所述预设的语料库中筛选出预设关键词的近义词;
根据所述预设关键词,和所述预设关键词的近义词,建立所述预设的关键词表。
9.根据权利要求1所述的方法,所述预设关键词包括:站台名称、流水单号、用户姓名或用户账户名。
10.一种语音信息提醒装置,包括:
采集模块,用于采集目标场景中的语音数据;
检测模块,用于检测所述语音数据中是否包含有与预设的关键词表匹配的词;其中,所述预设的关键词表包括目标场景中用户所关注的目标信息中的关键词;
确定模块,用于在确定所述语音数据中包含有与预设的关键词表匹配的词的情况下,将所述语音数据确定为目标语音数据;
播放模块,用于播放所述目标语音数据,以提醒用户所述目标信息。
11.根据权利要求10所述的装置,所述检测模块包括:
识别单元,用于根据所述预设的关键词表,对所述语音数据进行语音识别,得到与所述语音数据对应的文本数据;
第一确定单元,用于根据预设的匹配规则,检索所述文本数据,以确定所述文本数据中是否存在与所述预设的关键词表匹配的词。
12.根据权利要求11所述的装置,所述识别单元具体用于根据所述预设的关键词表中的关键词的语音信号,检测所述语音数据中是否存在与所述关键词的语音信号的差异值小于预设的差异阈值的第一目标词;在确定所述语音数据中存在与所述关键词的语音信号的差异值小于预设的差异阈值的第一目标词的情况下,将所述语音数据中的第一目标词的语音信号转化为文本数据中所述预设的关键词表中对应的关键词。
13.根据权利要求11所述的装置,所述第一确定单具体用于检索所述文本数据中是否存在与所述预设的关键词表中的关键词的差异程度小于预设的第一阈值的第二目标词;在确定所述文本数据不存在所述第二目标词的情况下,确定所述文本数据中词的拼音数据;检索所述文本数据中是否存在与所述预设的关键词表中的关键词的拼音数据的差异程度小于预设的第二阈值的第三目标词;在确定所述文本数据存在所述第三目标词的情况下,确定所述文本数据中存在与所述预设的关键词表匹配的词。
14.根据权利要求13所述的装置,在确定所述文本数据不存在所述第三目标词的情况下,所述第一确定单元具体还用于根据所述语音数据,确定与所述语音数据匹配的口音规则;根据所述口音规则,对所述文本数据中词的拼音数据进行修正,得到修正后的拼音数据;根据所述文本数据中词的修正后的拼音数据,检索所述文本数据中是否存在与所述预设的关键词表中的关键词的拼音数据的差异程度小于预设的第二阈值的第三目标词。
15.根据权利要求14所述的装置,在根据所述文本数据中词的修正后的拼音数据,确定所述文本数据中不存在第三目标词的情况下,所述第一确定单元具体还用于删除所述语音数据。
16.根据权利要求11所述的装置,所述装置还包括预处理模块,所述预处理模块包括:
第二确定单元,用于确定的目标场景的场景类型;
第三确定单元,用于根据所述目标场景的场景类型,从多个预处理模型中确定出匹配的预处理模型;
处理单元,用于通过所述匹配的预处理模型,对所述语音数据进行预处理,其中,所述预处理至少包括:过滤目标场景中的噪声数据。
17.根据权利要求10所述的装置,所述装置还包括建立模块,所述建立模块包括:
第四确定单元,用于接收用户针对目标场景设置的预设关键词,并确定所述预设关键词的词向量;
第五确定单元,用于获取并确定预设的语料库中的预设词的词向量,其中,所述预设的语料库包括多个预设词;
筛选单元,用于根据所述预设关键词的词向量、所述预设词的词向量,从所述预设的语料库中筛选出预设关键词的近义词;
建立单元,用于根据所述预设关键词,和所述预设关键词的近义词,建立所述预设的关键词表。
18.根据权利要求10所述的装置,所述预设关键词包括:站台名称、流水单号、用户姓名或用户账户名。
19.一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1至9中任一项所述方法的步骤。
20.一种语音信息提醒设备,包括处理器、声音采集器和播放器,其中,所述声音采集器用于采集目标场景中的语音数据;所述处理器用于检测所述语音数据中是否包含有与预设的关键词表匹配的词;其中,所述预设的关键词表包括目标场景中用户所关注的目标信息中的关键词;在确定所述语音数据中包含有与预设的关键词表匹配的词的情况下,将所述语音数据确定为目标语音数据;所述播放器用于播放所述目标语音数据,以提醒用户所述目标信息。
21.一种语音信息提醒方法,包括:
采集列车中的报站广播数据;
检测所述报站广播数据中是否包含有与预设的站名列表匹配的站名;其中,所述预设的站名列表至少包括用户预设的目的地站的站名;
在确定所述报站广播数据中包含有与预设的站名列表匹配的站名的情况下,将所述报站广播数据确定为目标广播数据;
播放所述目标广播数据,以提醒用户到达目的站。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911043077.6A CN111028834B (zh) | 2019-10-30 | 2019-10-30 | 语音信息提醒方法、装置、服务器和语音信息提醒设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911043077.6A CN111028834B (zh) | 2019-10-30 | 2019-10-30 | 语音信息提醒方法、装置、服务器和语音信息提醒设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111028834A true CN111028834A (zh) | 2020-04-17 |
CN111028834B CN111028834B (zh) | 2023-01-20 |
Family
ID=70204703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911043077.6A Active CN111028834B (zh) | 2019-10-30 | 2019-10-30 | 语音信息提醒方法、装置、服务器和语音信息提醒设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111028834B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111886878A (zh) * | 2020-02-13 | 2020-11-03 | 深圳市汇顶科技股份有限公司 | 一种用于降噪的助听方法、装置、芯片、耳机及存储介质 |
CN113448533A (zh) * | 2021-06-11 | 2021-09-28 | 阿波罗智联(北京)科技有限公司 | 提醒音频的生成方法、装置、电子设备和存储介质 |
CN114418709A (zh) * | 2021-12-24 | 2022-04-29 | 珠海大横琴科技发展有限公司 | 一种会议数据处理的方法和装置 |
CN117409779A (zh) * | 2023-12-14 | 2024-01-16 | 四川蜀天信息技术有限公司 | 一种语音唤醒方法、装置、系统及可读介质 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102254557A (zh) * | 2011-07-04 | 2011-11-23 | 深圳市子栋科技有限公司 | 基于自然语音识别的导航方法和系统 |
CN105117034A (zh) * | 2015-08-31 | 2015-12-02 | 任文 | 一种中文语音输入法及语句定位与纠错方法 |
WO2016014970A1 (en) * | 2014-07-24 | 2016-01-28 | Harman International Industries, Incorporated | Text rule based multi-accent speech recognition with single acoustic model and automatic accent detection |
CN106098063A (zh) * | 2016-07-01 | 2016-11-09 | 海信集团有限公司 | 一种语音控制方法、终端设备和服务器 |
CN106683677A (zh) * | 2015-11-06 | 2017-05-17 | 阿里巴巴集团控股有限公司 | 语音识别方法及装置 |
CN106713633A (zh) * | 2016-12-19 | 2017-05-24 | 中国科学院计算技术研究所 | 一种聋人提示系统、方法及智能手机 |
CN107220381A (zh) * | 2017-06-28 | 2017-09-29 | 南京云问网络技术有限公司 | 一种面向问答系统的输入文本自动纠错方法 |
CN107305768A (zh) * | 2016-04-20 | 2017-10-31 | 上海交通大学 | 语音交互中的易错字校准方法 |
CN107436691A (zh) * | 2016-05-26 | 2017-12-05 | 北京搜狗科技发展有限公司 | 一种输入法进行纠错的方法、客户端、服务器及装置 |
CN108804414A (zh) * | 2018-05-04 | 2018-11-13 | 科沃斯商用机器人有限公司 | 文本修正方法、装置、智能设备及可读存储介质 |
US20180341640A1 (en) * | 2017-05-25 | 2018-11-29 | Baidu Online Network Technology (Beijing) Co., Ltd. | Amendment Source-Positioning Method and Apparatus, Computer Device and Readable Medium |
CN109145276A (zh) * | 2018-08-14 | 2019-01-04 | 杭州智语网络科技有限公司 | 一种基于拼音的语音转文字后的文本校正方法 |
CN109326284A (zh) * | 2018-08-22 | 2019-02-12 | 深圳创维数字技术有限公司 | 语音搜索的方法、装置和存储介质 |
CN109597983A (zh) * | 2017-09-30 | 2019-04-09 | 北京国双科技有限公司 | 一种拼写纠错方法及装置 |
CN110211592A (zh) * | 2019-05-17 | 2019-09-06 | 北京华控创为南京信息技术有限公司 | 智能语音数据处理装置及方法 |
-
2019
- 2019-10-30 CN CN201911043077.6A patent/CN111028834B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102254557A (zh) * | 2011-07-04 | 2011-11-23 | 深圳市子栋科技有限公司 | 基于自然语音识别的导航方法和系统 |
WO2016014970A1 (en) * | 2014-07-24 | 2016-01-28 | Harman International Industries, Incorporated | Text rule based multi-accent speech recognition with single acoustic model and automatic accent detection |
CN105117034A (zh) * | 2015-08-31 | 2015-12-02 | 任文 | 一种中文语音输入法及语句定位与纠错方法 |
CN106683677A (zh) * | 2015-11-06 | 2017-05-17 | 阿里巴巴集团控股有限公司 | 语音识别方法及装置 |
CN107305768A (zh) * | 2016-04-20 | 2017-10-31 | 上海交通大学 | 语音交互中的易错字校准方法 |
CN107436691A (zh) * | 2016-05-26 | 2017-12-05 | 北京搜狗科技发展有限公司 | 一种输入法进行纠错的方法、客户端、服务器及装置 |
CN106098063A (zh) * | 2016-07-01 | 2016-11-09 | 海信集团有限公司 | 一种语音控制方法、终端设备和服务器 |
CN106713633A (zh) * | 2016-12-19 | 2017-05-24 | 中国科学院计算技术研究所 | 一种聋人提示系统、方法及智能手机 |
US20180341640A1 (en) * | 2017-05-25 | 2018-11-29 | Baidu Online Network Technology (Beijing) Co., Ltd. | Amendment Source-Positioning Method and Apparatus, Computer Device and Readable Medium |
CN107220381A (zh) * | 2017-06-28 | 2017-09-29 | 南京云问网络技术有限公司 | 一种面向问答系统的输入文本自动纠错方法 |
CN109597983A (zh) * | 2017-09-30 | 2019-04-09 | 北京国双科技有限公司 | 一种拼写纠错方法及装置 |
CN108804414A (zh) * | 2018-05-04 | 2018-11-13 | 科沃斯商用机器人有限公司 | 文本修正方法、装置、智能设备及可读存储介质 |
CN109145276A (zh) * | 2018-08-14 | 2019-01-04 | 杭州智语网络科技有限公司 | 一种基于拼音的语音转文字后的文本校正方法 |
CN109326284A (zh) * | 2018-08-22 | 2019-02-12 | 深圳创维数字技术有限公司 | 语音搜索的方法、装置和存储介质 |
CN110211592A (zh) * | 2019-05-17 | 2019-09-06 | 北京华控创为南京信息技术有限公司 | 智能语音数据处理装置及方法 |
Non-Patent Citations (2)
Title |
---|
MOUSMITA SARMA: "Dialect Identification from Assamese speech using prosodic features and a neuro fuzzy classifier", 《2016 3RD INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING AND INTEGRATED NETWORKS (SPIN)》 * |
邬龙: "基于短语翻译模型的中文语音识别纠错算法", 《第十四届全国人机语音通讯学术会议》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111886878A (zh) * | 2020-02-13 | 2020-11-03 | 深圳市汇顶科技股份有限公司 | 一种用于降噪的助听方法、装置、芯片、耳机及存储介质 |
WO2021159369A1 (zh) * | 2020-02-13 | 2021-08-19 | 深圳市汇顶科技股份有限公司 | 一种用于降噪的助听方法、装置、芯片、耳机及存储介质 |
US12028683B2 (en) | 2020-02-13 | 2024-07-02 | Shenzhen GOODIX Technology Co., Ltd. | Hearing aid method and apparatus for noise reduction, chip, headphone and storage medium |
CN113448533A (zh) * | 2021-06-11 | 2021-09-28 | 阿波罗智联(北京)科技有限公司 | 提醒音频的生成方法、装置、电子设备和存储介质 |
CN113448533B (zh) * | 2021-06-11 | 2023-10-31 | 阿波罗智联(北京)科技有限公司 | 提醒音频的生成方法、装置、电子设备和存储介质 |
CN114418709A (zh) * | 2021-12-24 | 2022-04-29 | 珠海大横琴科技发展有限公司 | 一种会议数据处理的方法和装置 |
CN117409779A (zh) * | 2023-12-14 | 2024-01-16 | 四川蜀天信息技术有限公司 | 一种语音唤醒方法、装置、系统及可读介质 |
CN117409779B (zh) * | 2023-12-14 | 2024-02-23 | 四川蜀天信息技术有限公司 | 一种语音唤醒方法、装置、系统及可读介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111028834B (zh) | 2023-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111028834B (zh) | 语音信息提醒方法、装置、服务器和语音信息提醒设备 | |
JP6730435B2 (ja) | システム、方法及びプログラム | |
CN104794122B (zh) | 一种位置信息推荐方法、装置和系统 | |
CN102782751B (zh) | 社会网络中的数字媒体语音标签 | |
CN103918247B (zh) | 基于背景环境的智能手机传感器逻辑 | |
US10643620B2 (en) | Speech recognition method and apparatus using device information | |
CN109309751B (zh) | 语音记录方法、电子设备及存储介质 | |
CN106406806A (zh) | 一种用于智能设备的控制方法及装置 | |
US20080235018A1 (en) | Method and System for Determing the Topic of a Conversation and Locating and Presenting Related Content | |
US20130173269A1 (en) | Methods, apparatuses and computer program products for joint use of speech and text-based features for sentiment detection | |
WO2021034382A1 (en) | Presenting electronic communications in narrative form | |
CN104050966A (zh) | 终端设备的语音交互方法和使用该方法的终端设备 | |
CN110972112B (zh) | 地铁运行方向的确定方法、装置、终端及存储介质 | |
KR101795593B1 (ko) | 전화상담원 보호 장치 및 그 방법 | |
WO2012125755A1 (en) | Automated conversation assistance | |
CN110097895B (zh) | 一种纯音乐检测方法、装置及存储介质 | |
CN109754808B (zh) | 语音转换文字的方法、装置、计算机设备及存储介质 | |
CN111767740A (zh) | 音效添加方法和装置、存储介质和电子设备 | |
CN111611358A (zh) | 信息交互方法、装置、电子设备及存储介质 | |
CN111009261B (zh) | 到站提醒方法、装置、终端及存储介质 | |
CN106027801A (zh) | 一种通信消息的处理方法及装置、移动设备 | |
CN105869631B (zh) | 语音预测的方法和装置 | |
CN108305629B (zh) | 一种场景学习内容获取方法、装置、学习设备及存储介质 | |
CN112347768A (zh) | 一种实体识别方法及装置 | |
CN110263135B (zh) | 一种数据交换匹配方法、装置、介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20211217 Address after: Room 602, No. 618, Wai Road, Huangpu District, Shanghai 200010 Applicant after: Ant fortune (Shanghai) Financial Information Service Co.,Ltd. Address before: 310000 801-11 section B, 8th floor, 556 Xixi Road, Xihu District, Hangzhou City, Zhejiang Province Applicant before: Alipay (Hangzhou) Information Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |