CN109992239A - 语音出行方法、装置、终端及存储介质 - Google Patents

语音出行方法、装置、终端及存储介质 Download PDF

Info

Publication number
CN109992239A
CN109992239A CN201910299104.XA CN201910299104A CN109992239A CN 109992239 A CN109992239 A CN 109992239A CN 201910299104 A CN201910299104 A CN 201910299104A CN 109992239 A CN109992239 A CN 109992239A
Authority
CN
China
Prior art keywords
trip
voice
keyword
candidate keywords
requirements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910299104.XA
Other languages
English (en)
Inventor
黄际洲
丁世强
关勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910299104.XA priority Critical patent/CN109992239A/zh
Publication of CN109992239A publication Critical patent/CN109992239A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Navigation (AREA)

Abstract

本发明实施例公开了一种语音出行方法、装置、终端及存储介质。该方法包括:在目标应用程序处于休眠状态过程中,识别用户的出行需求语音;若识别出所述出行需求语音中包括出行关键词和出行参数,则唤醒所述目标应用程序,并根据所述出行参数反馈出行信息。该方案实现了一种出行需求语音的直接满足方案,用户无需进行唤醒交互过程,提高了出行消息的反馈效率,尤其适应于用户处于高速道路等急需快速获取出行信息的场景,通过快速响应用户需求,减少用户等待、交互时间,防止用户未及时获得出行信息而错过更换车道时机,行驶至错误的路径,提高了用户出行的便捷性和安全性。

Description

语音出行方法、装置、终端及存储介质
技术领域
本发明实施例涉及导航技术领域,尤其涉及一种语音出行方法、装置、终端及存储介质。
背景技术
目前,用户在使用终端的地图进行导航时,可以通过语音功能发起导航检索请求,从而终端根据识别语音信号进行导航检索和路线制定,并展示导航结果,而不需要用户手动输入文字进行检索,为用户提供了便利。
但是,现阶段,用户需要先通过说出唤醒词唤醒终端的语音识别功能,收到唤醒应答后,才能说出具体的检索、导航需求,得到检索、导航结果,从而导致导航具有延时性,处理效率低。
发明内容
本发明实施例提供一种语音出行方法、装置、终端及存储介质,以解决应用程序未通过语音唤醒时无法实现导航、检索的问题。
第一方面,本发明实施例提供了一种语音出行方法,该方法包括:
在目标应用程序处于休眠状态过程中,识别用户的出行需求语音;
若识别出所述出行需求语音中包括出行关键词和出行参数,则唤醒所述目标应用程序,并根据所述出行参数反馈出行信息。
第二方面,本发明实施例提供了一种语音出行装置,该装置包括:
识别模块,用于在目标应用程序处于休眠状态过程中,识别用户的出行需求语音;
唤醒反馈模块,用于若识别出所述出行需求语音中包括出行关键词和出行参数,则唤醒所述目标应用程序,并根据所述出行参数反馈出行信息。
第三方面,本发明实施例还提供了一种终端,该终端包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的一种语音出行方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的种语音出行方法。
本发明实施例通过在目标应用程序休眠时,若识别出用户的出行需求语音中包含出行关键词和出行参数则唤醒目标应用程序,并反馈出行信息,即实现了一种出行需求语音的直接满足方案,用户无需进行唤醒交互过程,提高了出行消息的反馈效率,尤其适应于用户处于高速道路等急需快速获取出行信息的场景,通过快速响应用户需求,减少用户等待、交互时间,防止用户未及时获得出行信息而错过更换车道时机,行驶至错误的路径,提高了用户出行的便捷性和安全性。
附图说明
图1是本发明实施例一中的一种语音出行方法的流程图;
图2是本发明实施例二中的一种语音出行方法的流程图;
图3是本发明实施例二中的语义依存关系示意图;
图4是本发明实施例二中的出行字典树示意图;
图5是本发明实施例二中的语音出行展示界面第一示意图;
图6是本发明实施例二中的语音出行展示界面第二示意图;
图7是本发明实施例三中的一种语音出行方法的流程图;
图8是本发明实施例四中的一种语音出行装置结构示意图;
图9是本发明实施例五中的一种终端的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一中的一种语音出行方法的流程图。本实施例提供的语音出行方法可适用于用户通过终端中的应用程序进行出行信息查询或导航的情况,该方法具体可以由语音出行装置来执行,该装置可以由软件和/或硬件的方式实现,该装置可以集成在终端中,所述终端可以为手机、平板电脑、穿戴设备等,也可以为具有语音识别功能的车载终端,参见图1,本发明实施例的方法具体包括:
S110、在目标应用程序处于休眠状态过程中,识别用户的出行需求语音。
其中,目标应用程序是指用户设备配置的诸如地图类应用程序、导航类应用程序之类的能够为用户提供出行信息的应用程序。目标应用程序的状态包括休眠状态和唤醒状态,休眠状态为目标应用程序只执行少量基础操作的免应答状态,基础操作主要是用户的出行需求语音的识别操作,例如语音识别操作,语义理解操作。免应答状态即不应答状态,此时可以获取用户信息,但是不与用户交互。唤醒状态为能够识别用户的语音并且可以根据用户语音进行应答的状态。出行需求语音是目标应用程序检测到的反映用户出行需求的语音。
在本发明实施例中,当目标应用程序处于休眠状态时,不需要通过唤醒词进行唤醒,直接对用户输入的出行需求语音进行识别。然而,在当前的地图类应用中,用户想要使用语音功能发起检索、导航等需求时,需要首先用唤醒词进行唤醒,收到唤醒应答之后,地图客户端才能对用户的检索、导航等需求进行响应,也就是说现有地图类应用在对用户的出行需求语音进行识别之前,用户至少需要一轮对话交互唤醒目标应用程序,处于唤醒状态中的目标应用程序才能对用户的出行需求语音进行识别。由于本实施例提供的方案减少了唤醒交互过程,以便于后续提高出行信息的反馈效率。
S120、若识别出所述出行需求语音中包括出行关键词和出行参数,则唤醒所述目标应用程序,并根据所述出行参数反馈出行信息。
其中,出行关键词包括唤醒类出行关键词(也可以简称为唤醒关键词)和触达类出行关键词。唤醒类出行关键词是“小度小度”,“你好小度”之类的指固定词语;触达类关键词是指表示动作趋向的词语,例如,“要去”、“从…到”、“导航去”等词语,能够体现用户的动作行为。所述出行参数为用户行为的地点(例如“地铁站”、“超市”等)以及用户出行方式(例如驾车、骑行等)。所述出行信息用于为用户的出行提供路线参考,可以为根据用户出行的始发地和目的地等信息制定的出行路线、查询目的地信息等。唤醒目标应用程序之后,目标应用程序处于唤醒状态(即可应答状态),此时可以响应于用户信息,与用户交互。
具体的,目标应用程序对出行需求语音进行识别,若解析得到其中包括的出行关键词和出行参数,则说明用户此时具有出行需求,直接反馈出行信息。其中,出行关键词为唤醒关键词和/或触达类出行关键词。例如出行需求语音是“语音助手北京站”、“语音助手导航去北京站”或者“导航去北京站”。
需要说明的是,若出行需求语音中只包括出行参数,而不包括出行关键词,例如出行需求语音是“北京站”,则目标应用程序保持在休眠状态,从而避免误触发出行反馈。
本发明实施例中用户无需进行唤醒交互过程,直接通过包括出行关键词和出行参数的需求话术提供出行需求,并且得到满足,只需要一轮交互即可得到出行反馈信息,相比于现有技术中至少需要两轮交互才能得到出行信息,提高了出行信息反馈效率,减少了用户交互等待时间。并且,本方案无需依赖唤醒词,对出行需求语音的约束较少,用户只需要通过出行关键词和出行参数即可使用本方案,避免了用户需要记忆唤醒词,还降低了用户学习、使用成本。
本实施例的技术方案,若识别出用户的出行需求语音中包含出行关键词和出行参数则唤醒目标应用程序,并反馈出行信息,即实现了一种出行需求语音的直接满足方案,用户无需进行唤醒交互过程,只需要一轮交互即可反馈出行信息,提高了反馈效率,节省时间;并且,本方案无需依赖唤醒词,用户无需记忆唤醒词,降低了用户学习、使用成本,提高了操作便捷性。
实施例二
图2是本发明实施例二中的一种语音出行方法的流程图。本实施例在上述实施例的基础上进行了优化,未在本实施例中详细描述的细节详见上述实施例。参见图2,本实施例提供的语音出行方法可以包括:
S210、在目标应用程序处于休眠状态过程中,接收用户的出行需求语音。
S220、判断出行需求语音中是否包括唤醒类出行关键词,若包括,则执行S230;若不包括,则执行S240-S260。
其中,唤醒关键词是指用于对目标应用程序进行唤醒,使其从休眠状态转为唤醒状态,可以为预设固定的名字、昵称等。若出行需求语音中包括唤醒关键词,则后续通过S230进一步判断是否执行唤醒应答。若出行需求语音中不包括唤醒关键词,则后续通过S240-S250进一步判断是否需要直接触达出行需求,也就是确定是否直接满足出行需求。
S230、将用户的出行需求语音作为免应答判别模型的输入,若输出结果是当前免应答,则识别所述出行需求语音中是否包括出行参数。
免应答判别模型根据用户的出行需求语音的急促程度,确定当前是否需要响应唤醒关键词进行应答,若不需要,则输出结果是当前免应答;若需要,则输出结果是当前应答。
其中,所述免应答判别模型是基于循环神经网络训练得到的。在本发明实施例中,免应答判别模型的训练过程可以为:收集训练样本,包括正样本(即需要应答的音频),和负样本(即不需要应答的音频),定义模型训练的目标函数为交叉熵损失函数,再通过梯度下降算法对网络中的参数进行更新,经过多次迭代达到要求时,完成训练得到最终的模型参数。
具体的,出行需求语音中包括唤醒关键词和唤醒关键词后面的语音信息,例如若目标应用程序识别到用户语音中包括唤醒音频,则将唤醒音频以及位于唤醒音频之后预设时间长度(例如5s)内音频一起作为出行需求语音,并将出行需求语音作为免应答判别模型的输入,以得到输出结果。示例性的,经过编码过程、多层全连接的神经网络的变换过程、以及Sigmoid函数的处理过程等,最终输出是否需要应答的概率值,若经判断所述概率值超过预设阈值,则说明需要进行唤醒应答播报,若经判断所述概率值未超过预设阈值,则说明不需要进行唤醒应答播报,即属于唤醒词免应答方案。若此时输出结果为当前免应答,则识别出行需求语音中是否包括出行参数,并执行S260。
另外,在免唤醒应答过程中,若识别出所述出行需求语音中包括出行参数,则所述唤醒类出行关键词与所述出行参数之间的时间间隔小于时间间隔阈值。
需要说明的是,若免应答判别模型的输出结果是需要应答,则唤醒目标应用程序,并播放唤醒应答语音。随后识别用户继续输入的语音中是否包括出行参数,并反馈出行信息。
S240、将所述出行需求语音进行语音识别,得到出行需求文本。
具体的,通过对出行需求语音进行识别,得到出行需求文本,便于进一步对出行需求文本进行分析得到触达类出行关键词。例如,对出行需求语音进行编码得到中间向量,再对中间向量进行解码得到出行需求文本。
可选的,识别用户的出行需求语音之前,还包括:对历史出行需求语音进行语音识别,得到历史出行需求文本;将所述历史出行需求文本与关键词提取模板进行匹配,得到候选关键词;根据候选关键词的频次、候选关键词所属历史出行需求文本的地点数量、切词结果、词性序列和语义依存关系中的至少一种,确定所述候选关键词是否为所述触达类出行关键词。
具体的,为了使语音识别更具真实性和可靠性,通过历史出行需求语音获取用户历史检索中使用的触达类出行关键词,以便根据历史出现的触达类出行关键词构建匹配模型。其中,关键词提取模板可以由技术人员进行配置,例如[W:1-5][D:地点]、[W:1-5][D:地点][W:1-5][D:地点][W:0-10]等模板,其中[W:1-5]是通配符,可以匹配1到5个字符的任意文字,[D:地点]可以匹配所有的地点。通过语音识别从历史出行需求语音中获取历史出行需求文本,再将历史出行需求文本与关键词提取模板进行匹配,能够产生一系列候选关键词,例如“我要去”(超市)、“导航去”(地铁站)、“从”(家到公司多久)、“吃”(火锅)等。
进一步地,根据候选关键词的频次、候选关键词所属历史出行需求文本的地点数量、切词结果、词性序列和语义依存关系中的至少一种,最终确定候选关键词是否为触达类出行关键词。其中,频次为候选关键词在历史出行需求文本中出的次数。切词结果为通过对历史出行需求文本进行切词得到的单独词语,例如,对于历史出行需求文本“导航去地铁站”,则进行切词后得到的结果为“导航去”和“地铁站”。所述词性序列为根据出行需求文本中各词语的词性确定的语序,例如历史出行需求文本为“我去超市”,其中“我”的词性为代词(r),“去”的词性为动词(v),“超市”的词性为地名“ns”,则该历史出行文本的词性序列为“r-v-ns”。语义依存关系为不同词性的词语之间根据其语义确定的相互之间的关联关系,例如,如图3所示,对于历史出行需求文本“我要走湖滨大道回家”,其中,“我”、“要”、“回家”都与动词“走”存在依存关系,分别体现了“走”这个动作的执行者和目的地,“湖滨大道”与“回家”存在依存关系,体现了回家的途径。候选关键词所属历史出行需求文本的地点数量为出行需求文本中,候选关键词后面的文本中包括的地点的数量。根据以上信息能够充分考虑到各词语之间的语义关系,从而更加全面准确地确定历史出行需求文本中的触达类出行关键词。
S250、将所述出行需求文本与出行字典树进行匹配,若匹配到触达类出行关键词,则识别所述出行需求语音中是否包括出行参数。
其中,出行字典树是根据触达类出行关键词构建的。具体的,如图4所示,将得到的出行需求文本与出行字典树进行匹配,其中,S为起始节点,M为中间节点,E为目标节点,当出行需求文本中的文字能够与出行字典树中的文字从起始节点匹配到目标节点时,例如,出行需求文本为“导航到超市”,能够与出行字典树中“导航到”的分支相匹配,并从起始节点匹配到目标节点,则说明出行需求文本中的文字命中出行字典树中的触达类出行关键词,后续继续执行S260。需要说明的是,若出行需求文本与出行字典树匹配失败,即出行需求文本中不包括触达类出行关键词,则结束操作。
S260、若识别出所述出行需求语音中包括出行参数,则唤醒所述目标应用程序,并根据所述出行参数反馈出行信息。
若出行需求语音中包括唤醒类出行关键词,免应答输出结果为当前免应答,且识别出所述出行需求语音中包括出行参数,则直接根据出行需求语音中的出行参数反馈出行信息,节省了唤醒应答交互,提高了出行信息的反馈效率。图5是本发明实施例二中的语音出行展示界面第一示意图,如图5所示,在出行需求语音中包括唤醒类出行关键词,例如“语音助手”等,且出行需求语音为免应答语音时,直接根据出行需求语音中包含的出行参数获取出行信息,从而节省了唤醒应答占用的时间,直接及时为用户提供出行信息。
若出行需求文本与出行字典树匹配成功,即匹配到触达类出行关键词,则执行触达类出行关键词直接触达方案,即直接根据语音中的出行参数直接反馈出行信息。图6是本发明实施例二中的语音出行展示界面第二示意图,如图6所示,直接根据触达类出行关键词后面的出行参数确定出行信息,从而及时反馈出行信息。
本发明实施例的技术方案,通过在出行需求语音包含唤醒关键词的情况下,若确定出行需求语音为免应答语音,则不对语音进行应答,直接根据出行需求语音中包括的出行参数确定出行信息;在不包含唤醒关键词的情况下,直接通过对出行需求语音进行语音识别得到出行需求文本,根据出行需求文本是否包括触达类出行关键词确定是否满足直接触达条件。本实施例省去了唤醒和应答的繁琐操作,缩短了出行信息反馈的时间,从而及时快速地为用户提供出行信息,进一步提高了用户出行的安全性,防止用户未及时获得出行信息而错过更换车道时机,行驶至错误的路径。
实施例三
图7是本发明实施例二中的一种语音出行方法的流程图。本实施例在上述实施例的基础上进行了优化,对触达类出行关键词的确定过程作具体介绍。未在本实施例中详细描述的细节详见上述实施例。参见图7,本实施例提供的语音出行方法可以包括:
S310、对历史出行需求语音进行语音识别,得到历史出行需求文本。
S320、将所述历史出行需求文本与关键词提取模板进行匹配,得到候选关键词。
S330、根据候选关键词的频次,判断所述候选关键词属于高频候选关键词还是低频候选关键词。
若所述候选关键词属于高频候选关键词,则执行S340;若所述候选关键词属于低频候选关键词,则执行S350。
S340、根据所述候选关键词的频次和关联的地点数量,确定所述候选关键词是否为触达类出行关键词。
其中,关联的地点数量为历史出行需求文本中的候选关键词后面文本中出现的地点数量。示例性的,若候选关键词出现的频次超过了次数阈值,且关联的地点数量超过了数量阈值,则确定此关键词为触达类出行关键词。例如,历史出行需求文本“导航去地铁站”中“导航去”出现了100次,且与“导航去”关联的地点超过50个,则说明“导航去”为用户常用的出行检索词,确定为触达类出行关键词,进一步执行S360。
S350、根据候选关键词所属历史出行需求文本的切词结果、词性序列和语义依存关系,确定所述候选关键词是否为触达类出行关键词。
根据候选关键词的切词结果、词性序列和语义依存关系,确定所述候选关键词是否为触达类出行关键词,包括:若所述候选关键词属于低频候选关键词,则将所述低频候选关键词作为关键词分类器的输入;通过所述关键词分类器根据所述低频候选关键词所属历史出行需求文本的切词结果、词性序列和语义依存关系,确定所述低频候选关键词是否为触达类出行关键词;其中,所述关键词分类器的正样本是高频触达类出行关键词,负样本是高频非触达类出行关键词。
示例性的,以S340中确定的高频关键词中的触达类出行关键词作为训练样本的正样本,高频关键词中的非触达类出行关键词为负样本,并获取切词结果、词性序列、语义依存关系作为特征输入,构建训练关键词分类器。将低频关键词输入至关键词分类器,进一步确定低频关键词中包含的触达类出行关键词,进一步执行S360。
S360、根据触达类出行关键词构建出行字典树。
具体的,根据确定的触达类出行关键词构建出行字典树,以便于通过将出行需求文本与出行字典树进行匹配,识别出行需求文本中的触达类出行关键词。
S370、在目标应用程序处于休眠状态过程中,若用户的出行需求语音中不包括唤醒类出行关键词,将所述出行需求语音进行语音识别,得到出行需求文本。
S380、将所述出行需求文本与出行字典树进行匹配,若匹配到触达类出行关键词,则识别所述出行需求语音中是否包括出行参数。
可选的,在本发明实施例中,还可以将出行需求语音作为需求分类器的输入,其中所述需求分类器的候选类别数量是触达类出行关键词的数量加1,即分类器中的分类类别比触达类出行关键词的数量多一种。例如,以触达类出行关键词和非触达类出行关键词作为训练样本,训练得到需求分类器模型,将接收到的出行需求语音输入至需求分类器,经过分类得到出行需求语音是否属于触达类出行关键词的结果。
S390、若识别出所述出行需求语音中包括出行关键词和出行参数,则唤醒所述目标应用程序,并根据所述出行参数反馈出行信息。
本发明实施例的技术方案,通过判断出所述候选关键词属于高频候选关键词时,根据所述候选关键词的频次和关联的地点数量,确定所述候选关键词是否为触达类出行关键词,判断出所述候选关键词属于低频候选关键词时,根据候选关键词所属历史出行需求文本的切词结果、词性序列和语义依存关系,确定所述候选关键词是否为触达类出行关键词,从而更加全面准确地确定历史出行需求文本中的触达类出行关键词,以根据触达类出行关键词构建出行字典树,从而使出行需求文本中触达类出行关键词的识别更加及时、准确,从而进一步直接根据触达类出行关键词和出行参数确定出行信息,而免去了唤醒和应答过程。
实施例四
图8为本发明实施例四提供的一种语音出行装置结构示意图。该装置适用于用户通过终端中的应用程序进行出行信息查询或导航的情况,该装置可以由软件和/或硬件实现,并具体可集成在终端中,所述终端可以为手机、平板电脑、穿戴设备等,也可以为具有语音识别功能的车载终端。参见图8,该装置具体包括:
识别模块410,用于在目标应用程序处于休眠状态过程中,识别用户的出行需求语音;
唤醒反馈模块420,用于若识别出所述出行需求语音中包括出行关键词和出行参数,则唤醒所述目标应用程序,并根据所述出行参数反馈出行信息。
可选的,所述识别模块410,包括:
第一判断单元,用于若所述出行需求语音中包括唤醒类出行关键词,则将用户的出行需求语音作为免应答判别模型的输入,若输出结果是当前免应答,则识别所述出行需求语音中是否包括出行参数;
其中,所述免应答判别模型是基于循环神经网络训练得到的。
可选的,所述唤醒类出行关键词与所述出行参数之间的时间间隔小于时间间隔阈值。
可选的,所述识别模块410,还包括:
第二判断单元,用于若所述出行需求语音中不包括唤醒类出行关键词,则将所述出行需求语音进行语音识别,得到出行需求文本;
匹配单元,用于将所述出行需求文本与出行字典树进行匹配,若匹配到触达类出行关键词,则识别所述出行需求语音中是否包括出行参数。
可选的,还包括:
需求文本确定模块,用于对历史出行需求语音进行语音识别,得到历史出行需求文本;
候选关键词确定单元,用于将所述历史出行需求文本与关键词提取模板进行匹配,得到候选关键词;
触达类出行关键词确定单元,用于根据候选关键词的频次、候选关键词所属历史出行需求文本的地点数量、切词结果、词性序列和语义依存关系中的至少一种,确定所述候选关键词是否为所述触达类出行关键词。
可选的,所述触达类出行关键词确定单元,包括:
频次确定子单元,用于根据候选关键词的频次,确定所述候选关键词属于高频候选关键词还是低频候选关键词;
高频关键词确定子单元,用于若所述候选关键词属于高频候选关键词,则根据所述候选关键词的频次和关联的地点数量,确定所述候选关键词是否为触达类出行关键词;
低频关键词确定子单元,用于若所述候选关键词属于低频候选关键词,则根据候选关键词所属历史出行需求文本的切词结果、词性序列和语义依存关系,确定所述候选关键词是否为触达类出行关键词。
可选的,所述低频关键词子单元,具体用于:
若所述候选关键词属于低频候选关键词,则将所述低频候选关键词作为关键词分类器的输入;
通过所述关键词分类器根据所述低频候选关键词所属历史出行需求文本的切词结果、词性序列和语义依存关系,确定所述低频候选关键词是否为触达类出行关键词;
其中,所述关键词分类器的正样本是高频触达类出行关键词,负样本是高频非触达类出行关键词。
本发明实施例的技术方案,由识别模块在目标应用程序处于休眠状态过程中,识别用户的出行需求语音;唤醒反馈模块若识别出所述出行需求语音中包括触达类出行关键词和出行参数,则唤醒所述目标应用程序,并根据所述出行参数反馈出行信息。通过实现了一种出行需求语音的直接满足方案,用户无需进行唤醒交互过程,只需要一轮交互即可反馈出行信息,提高了反馈效率,节省时间;并且,本方案无需依赖唤醒词,用户无需记忆唤醒词,降低了用户学习、使用成本,提高了操作便捷性。
实施例五
图9是本发明实施例五提供的一种终端的结构示意图。图9示出了适于用来实现本发明实施例的示例性终端512的框图。图9显示的终端512仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图9所示,终端512包括:一个或多个处理器516;存储器528,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器516执行,使得所述一个或多个处理器516实现本发明实施例所提供的语音出行方法,包括:
在目标应用程序处于休眠状态过程中,识别用户的出行需求语音;
若识别出所述出行需求语音中包括出行关键词和出行参数,则唤醒所述目标应用程序,并根据所述出行参数反馈出行信息。
以通用终端的形式表现。终端512的组件可以包括但不限于:一个或者多个处理器或者处理器516,系统存储器528,连接不同系统组件(包括系统存储器528和处理器516)的总线518。
总线518表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
终端512典型地包括多种计算机系统可读存储介质。这些存储介质可以是任何能够被终端512访问的可用存储介质,包括易失性和非易失性存储介质,可移动的和不可移动的存储介质。
系统存储器528可以包括易失性存储器形式的计算机系统可读存储介质,例如随机存取存储器(RAM)530和/或高速缓存存储器532。终端512可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统534可以用于读写不可移动的、非易失性磁存储介质(图9未显示,通常称为“硬盘驱动器”)。尽管图9中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光存储介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据存储介质接口与总线518相连。存储器528可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块542的程序/实用工具540,可以存储在例如存储器528中,这样的程序模块562包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块562通常执行本发明所描述的实施例中的功能和/或方法。
终端512也可以与一个或多个外部终端514(例如键盘、指向终端、显示器526等)通信,还可与一个或者多个使得用户能与该终端512交互的终端通信,和/或与使得该终端512能与一个或多个其它计算终端进行通信的任何终端(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口522进行。并且,终端512还可以通过网络适配器520与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器520通过总线518与终端512的其它模块通信。应当明白,尽管图中未示出,可以结合终端512使用其它硬件和/或软件模块,包括但不限于:微代码、终端驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器516通过运行存储在系统存储器528中的多个程序中其他程序的至少一个,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的一种语音出行方法。
实施例六
本发明实施例六还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种语音出行方法:
在目标应用程序处于休眠状态过程中,识别用户的出行需求语音;
若识别出所述出行需求语音中包括出行关键词和出行参数,则唤醒所述目标应用程序,并根据所述出行参数反馈出行信息。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的存储介质的任意组合。计算机可读存储介质可以是计算机可读信号存储介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明实施例中,计算机可读存储介质可以是任何包含或存储程序的有形存储介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号存储介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读存储介质上包含的程序代码可以用任何适当的存储介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或终端上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种语音出行方法,其特征在于,所述方法包括:
在目标应用程序处于休眠状态过程中,识别用户的出行需求语音;
若识别出所述出行需求语音中包括出行关键词和出行参数,则唤醒所述目标应用程序,并根据所述出行参数反馈出行信息。
2.根据权利要求1所述的方法,其特征在于,识别用户的出行需求语音,包括:
若所述出行需求语音中包括唤醒类出行关键词,则将用户的出行需求语音作为免应答判别模型的输入,若输出结果是当前免应答,则识别所述出行需求语音中是否包括出行参数;
其中,所述免应答判别模型是基于循环神经网络训练得到的。
3.根据权利要求2所述的方法,其特征在于,所述唤醒类出行关键词与所述出行参数之间的时间间隔小于时间间隔阈值。
4.根据权利要求1所述的方法,其特征在于,识别用户的出行需求语音,包括:
若所述出行需求语音中不包括唤醒类出行关键词,则将所述出行需求语音进行语音识别,得到出行需求文本;
将所述出行需求文本与出行字典树进行匹配,若匹配到触达类出行关键词,则识别所述出行需求语音中是否包括出行参数;
其中所述出行字典树是根据触达类出行关键词构建的。
5.根据权利要求4所述的方法,其特征在于,识别用户的出行需求语音之前,还包括:
对历史出行需求语音进行语音识别,得到历史出行需求文本;
将所述历史出行需求文本与关键词提取模板进行匹配,得到候选关键词;
根据候选关键词的频次、候选关键词所属历史出行需求文本的地点数量、切词结果、词性序列和语义依存关系中的至少一种,确定所述候选关键词是否为所述触达类出行关键词。
6.根据权利要求5所述的方法,其特征在于,根据候选关键词的频次、候选关键词所属历史出行需求文本的地点数量、切词结果、词性序列和语义依存关系中的至少一种,确定所述候选关键词是否为所述触达类出行关键词,包括:
根据候选关键词的频次,确定所述候选关键词属于高频候选关键词还是低频候选关键词;
若所述候选关键词属于高频候选关键词,则根据所述候选关键词的频次和关联的地点数量,确定所述候选关键词是否为触达类出行关键词;
若所述候选关键词属于低频候选关键词,则根据候选关键词所属历史出行需求文本的切词结果、词性序列和语义依存关系,确定所述候选关键词是否为触达类出行关键词。
7.根据权利要求6所述的方法,其特征在于,若所述候选关键词属于低频候选关键词,则根据候选关键词的切词结果、词性序列和语义依存关系,确定所述候选关键词是否为触达类出行关键词,包括:
若所述候选关键词属于低频候选关键词,则将所述低频候选关键词作为关键词分类器的输入;
通过所述关键词分类器根据所述低频候选关键词所属历史出行需求文本的切词结果、词性序列和语义依存关系,确定所述低频候选关键词是否为触达类出行关键词;
其中,所述关键词分类器的正样本是高频触达类出行关键词,负样本是高频非触达类出行关键词。
8.一种语音出行装置,其特征在于,所述装置包括:
识别模块,用于在目标应用程序处于休眠状态过程中,识别用户的出行需求语音;
唤醒反馈模块,用于若识别出所述出行需求语音中包括出行关键词和出行参数,则唤醒所述目标应用程序,并根据所述出行参数反馈出行信息。
9.一种终端,其特征在于,所述终端包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的一种语音出行方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的一种语音出行方法。
CN201910299104.XA 2019-04-15 2019-04-15 语音出行方法、装置、终端及存储介质 Pending CN109992239A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910299104.XA CN109992239A (zh) 2019-04-15 2019-04-15 语音出行方法、装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910299104.XA CN109992239A (zh) 2019-04-15 2019-04-15 语音出行方法、装置、终端及存储介质

Publications (1)

Publication Number Publication Date
CN109992239A true CN109992239A (zh) 2019-07-09

Family

ID=67133593

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910299104.XA Pending CN109992239A (zh) 2019-04-15 2019-04-15 语音出行方法、装置、终端及存储介质

Country Status (1)

Country Link
CN (1) CN109992239A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110610704A (zh) * 2019-09-09 2019-12-24 上海赛连信息科技有限公司 一种标识展示的方法、介质、装置和计算设备
CN111383639A (zh) * 2020-03-06 2020-07-07 湖南快乐车行露营地投资发展有限公司 水电桩解锁控制方法、装置、计算机设备和存储介质
CN111491123A (zh) * 2020-04-17 2020-08-04 维沃移动通信有限公司 视频背景处理方法、装置及电子设备
CN111538890A (zh) * 2020-04-02 2020-08-14 中国铁道科学研究院集团有限公司 一种基于语音识别的室内引导方法及系统
US20210287674A1 (en) * 2020-03-16 2021-09-16 Knowles Electronics, Llc Voice recognition for imposter rejection in wearable devices
CN114118582A (zh) * 2021-11-29 2022-03-01 中国第一汽车股份有限公司 目的地预测方法、装置、电子终端及存储介质
CN117252260A (zh) * 2023-09-06 2023-12-19 山东心法科技有限公司 一种基于大语言模型的面试技能训练方法、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107610695A (zh) * 2017-08-08 2018-01-19 问众智能信息科技(北京)有限公司 驾驶人语音唤醒指令词权重的动态调整方法
CN108735210A (zh) * 2018-05-08 2018-11-02 宇龙计算机通信科技(深圳)有限公司 一种语音控制方法及终端
JP2018194844A (ja) * 2017-05-19 2018-12-06 ネイバー コーポレーションNAVER Corporation 音声制御装置、音声制御装置の動作方法、コンピュータプログラム及び記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018194844A (ja) * 2017-05-19 2018-12-06 ネイバー コーポレーションNAVER Corporation 音声制御装置、音声制御装置の動作方法、コンピュータプログラム及び記録媒体
CN107610695A (zh) * 2017-08-08 2018-01-19 问众智能信息科技(北京)有限公司 驾驶人语音唤醒指令词权重的动态调整方法
CN108735210A (zh) * 2018-05-08 2018-11-02 宇龙计算机通信科技(深圳)有限公司 一种语音控制方法及终端

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110610704A (zh) * 2019-09-09 2019-12-24 上海赛连信息科技有限公司 一种标识展示的方法、介质、装置和计算设备
CN111383639A (zh) * 2020-03-06 2020-07-07 湖南快乐车行露营地投资发展有限公司 水电桩解锁控制方法、装置、计算机设备和存储介质
US20210287674A1 (en) * 2020-03-16 2021-09-16 Knowles Electronics, Llc Voice recognition for imposter rejection in wearable devices
CN111538890A (zh) * 2020-04-02 2020-08-14 中国铁道科学研究院集团有限公司 一种基于语音识别的室内引导方法及系统
CN111538890B (zh) * 2020-04-02 2023-12-12 中国铁道科学研究院集团有限公司 一种基于语音识别的室内引导方法及系统
CN111491123A (zh) * 2020-04-17 2020-08-04 维沃移动通信有限公司 视频背景处理方法、装置及电子设备
CN114118582A (zh) * 2021-11-29 2022-03-01 中国第一汽车股份有限公司 目的地预测方法、装置、电子终端及存储介质
CN117252260A (zh) * 2023-09-06 2023-12-19 山东心法科技有限公司 一种基于大语言模型的面试技能训练方法、设备及介质
CN117252260B (zh) * 2023-09-06 2024-06-11 山东心法科技有限公司 一种基于大语言模型的面试技能训练方法、设备及介质

Similar Documents

Publication Publication Date Title
CN109992239A (zh) 语音出行方法、装置、终端及存储介质
CN107316643B (zh) 语音交互方法及装置
US8996381B2 (en) Background speech recognition assistant
WO2018149209A1 (zh) 语音识别方法、电子设备以及计算机存储介质
CN107808670A (zh) 语音数据处理方法、装置、设备及存储介质
CN108320738B (zh) 语音数据处理方法及装置、存储介质、电子设备
CN113327609B (zh) 用于语音识别的方法和装置
CN107134279A (zh) 一种语音唤醒方法、装置、终端和存储介质
US11830482B2 (en) Method and apparatus for speech interaction, and computer storage medium
CN108039175B (zh) 语音识别方法、装置及服务器
CN113674742B (zh) 人机交互方法、装置、设备以及存储介质
US11132994B1 (en) Multi-domain dialog state tracking
CN111192590B (zh) 语音唤醒方法、装置、设备及存储介质
US11990122B2 (en) User-system dialog expansion
CN108595406B (zh) 一种用户状态的提醒方法、装置、电子设备及存储介质
CN111161726B (zh) 一种智能语音交互方法、设备、介质及系统
CN109697981B (zh) 一种语音交互方法、装置、设备及存储介质
CN113035180A (zh) 语音输入完整性判断方法、装置、电子设备和存储介质
CN117253478A (zh) 一种语音交互方法和相关装置
WO2021098318A1 (zh) 应答方法、终端及存储介质
CN111833870A (zh) 车载语音系统的唤醒方法、装置、车辆和介质
CN111400463A (zh) 对话响应方法、装置、设备和介质
CN112863496B (zh) 一种语音端点检测方法以及装置
WO2023168713A1 (zh) 交互语音信号处理方法、相关设备及系统
US10929601B1 (en) Question answering for a multi-modal system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190709