CN102374864B - 语音导航设备及语音导航方法 - Google Patents

语音导航设备及语音导航方法 Download PDF

Info

Publication number
CN102374864B
CN102374864B CN201010253223.0A CN201010253223A CN102374864B CN 102374864 B CN102374864 B CN 102374864B CN 201010253223 A CN201010253223 A CN 201010253223A CN 102374864 B CN102374864 B CN 102374864B
Authority
CN
China
Prior art keywords
speech data
weights
waveform
word
key word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010253223.0A
Other languages
English (en)
Other versions
CN102374864A (zh
Inventor
龚贻华
丁国治
吕启明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ambit Microsystems Shanghai Ltd
Original Assignee
Ambit Microsystems Shanghai Ltd
Hon Hai Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ambit Microsystems Shanghai Ltd, Hon Hai Precision Industry Co Ltd filed Critical Ambit Microsystems Shanghai Ltd
Priority to CN201010253223.0A priority Critical patent/CN102374864B/zh
Priority to US12/905,090 priority patent/US8412455B2/en
Publication of CN102374864A publication Critical patent/CN102374864A/zh
Application granted granted Critical
Publication of CN102374864B publication Critical patent/CN102374864B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3608Destination input or retrieval using speech input, e.g. using speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates

Landscapes

  • Engineering & Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Navigation (AREA)

Abstract

本发明提供一种语音导航设备,包括语音接收单元,用于接收关于导航目的地的语音数据V;关键字数据库,其中存储有n个预设的关键字;地名数据库,其中存储有地名信息的搜索树;语音识别单元,用于根据上述关键字数据库中存储的关键字对语音数据V进行分段,以生成n段语音数据Vi(i=1~n),并采用多段识别的方法与地名数据库中的地名信息的搜索树进行匹配,以将上述语音数据V转换为该语音导航设备可以识别的输入形式;及电子地图,用于根据上述识别的输入形式,可视化地显示出导航目的地的位置与路线。本发明还提供一种语音导航方法。本发明可以缩短匹配识别的时间。

Description

语音导航设备及语音导航方法
技术领域
本发明涉及一种导航技术,特别是语音导航设备及语音导航方法。
背景技术
当前,由于民用GPS(Global Position System,全球定位系统)技术的开放与发展,GPS技术已经越来越多的应用在民用的定位和导航中。当前大部分的车载导航设备都能够较为准确的指示当前的位置,并根据道路情况显示路线,极大的方便了驾驶者。
但是,这些传统的导航设备却很难解决交互的问题。例如,驾驶者为了设置一个目的导航地不得不找个地方停下来,用手输入和查找目的地位置,这使得目的地导航的便捷性打了折扣。
为了解决上述问题,具有语音识别功能的语音导航设备应运而生。所述语音识别是将人类语音中的词汇内容转换为电子设备的芯片可识别的输入。这样,驾驶者不需要用手输入和查找目的地位置,而只需发出语音指令即可实现导航设备自动向目的地导航的目的。然而,传统的具有语音识别功能的语音导航设备只能识别一些特殊的地名,如世界之窗、欢乐谷等,而不能对常规地名进行语音识别。
此外,传统的语音识别技术在实现将人类的语音转换为电子设备的芯片可识别的输入时所使用的语法规则是将语音指令中的一句话作为一个整体跟模型库中的所有内容匹配一遍。例如,驾驶者发出的语音指令为“A市B区C路D号”,则原始的语法规则是将“A市B区C路D号”作为一个整体,一次性与地名数据库(/模型库)中所有可能的地名组合匹配一遍。于是,当模型库的规模很大时,进行匹配识别的时间就会很长,严重浪费系统资源及时间。
发明内容
鉴于以上内容,有必要提供一种语音导航设备,其将输入的语音数据进行分段,采用多段识别的方法与地名数据库中的内容进行匹配,极大的减少了匹配识别的时间。
此外,还有必要提供一种语音导航方法,其将输入的语音数据进行分段,采用多段识别的方法与地名数据库中的内容进行匹配,极大的减少了匹配识别的时间。
一种语音导航设备,包括语音接收单元,用于接收关于导航目的地的语音数据V。该语音导航设备还包括:关键字数据库,其中存储有n个预设的关键字,其中,n为大于1的自然数;地名数据库,其中存储有地名信息的搜索树;语音识别单元,用于根据上述关键字数据库中存储的关键字对语音数据V进行分段,以生成n段语音数据Vi(i=1~n),并采用多段识别的方法与地名数据库中的地名信息的搜索树进行匹配,以将上述语音数据V转换为该语音导航设备可以识别的输入形式;及电子地图,用于根据上述识别的输入形式,可视化地显示出导航目的地的位置与路线。
一种语音导航方法,包括:(a)语音导航设备接收关于导航目的地的语音数据V;(b)从一个关键字数据库中获取n个预设的关键字,其中,n为大于1的自然数;(c)根据上述关键字对语音数据V进行分段,以生成n段语音数据Vi(i=1~n);(d)利用上述n段语音数据Vi(i=1~n),采用多段识别的方法与地名数据库中的地名信息的搜索树进行匹配,以将上述语音数据V转换为该语音导航设备能够识别的输入形式;及(e)根据上述转换成的输入形式,在语音导航设备的电子地图上可视化地显示出导航目的地的位置与路线。
本发明提供的语音导航设备及语音导航方法将输入的语音数据进行分段,采用多段识别的方法与地名数据库中的内容进行匹配,极大的减少了匹配识别的时间。
附图说明
图1是本发明语音导航设备较佳实施例的硬件架构图。
图2是本发明语音导航设备较佳实施例中一个地名信息的搜索树的示意图。
图3是本发明语音导航设备较佳实施例中语音识别单元的功能模块图。
图4是本发明语音导航设备较佳实施例中利用关键字对语音数据进行分割的示意图。
图5是本发明语音导航方法较佳实施例的流程图。
主要元件符号说明
语音导航设备        1
语音接收单元        10
语音识别单元        11
关键字数据库        12
地名数据库          13
电子地图            14
中央处理器          15
存储单元            16
关键字获取模块      110
分割模块            111
地名信息获取模块    112
匹配及权值计算模块  113
路径选择模块        114
地名整合模块        115
定位模块            116
具体实施方式
参阅图1所示,是本发明语音导航设备较佳实施例的硬件架构图。该语音导航设备1包括语音接收单元10、语音识别单元11、关键字数据库12、地名数据库13、及电子地图14。所述的语音接收单元10可以是麦克风,用于接收外界的语音数据V。该语音数据V是驾驶者发出的导航目的地的语音命令。本实施例中,该语音数据V为“A市B区C路D号”的格式。所述的语音识别单元11包括多个功能模块(详见图3),用于根据上述关键字数据库12中存储的n个关键字对语音数据V进行分段,以生成n段语音数据Vi(i=1~n),之后采用多段识别的方法与地名数据库13中的地名信息的搜索树进行匹配,以将上述语音数据V转换为该语音导航设备1可以识别的输入形式,并在电子地图14中可视化地显示出导航目的地的位置与路线。其中,n为大于1的自然数。
本实施例中,所述关键字数据库12中存储着关键字的波形图。所述关键字可以是用户设定的。本实施例中,所述关键字包括“市”、“区”、“路”、及“号”。
参阅图2,是地名数据库13中存储的地名信息的搜索树的示意图。本实施例中,该搜索树的第一级节点,即根节点为省级单位,如广东省。该搜索树的第二级节点为市级单位,如广东省所包括的广州市、深圳市、珠海市、及东莞市等。该搜索树的第三级节点为区级单位,如深圳市所包括的罗湖区、南山区、及福田区等。该搜索树的的第四级节点为每个区的各条路,如宝安区所包括的油松路、建设路、人民路、及东环二路等。该搜索树的最后一级节点为每个路上的各个号,如东环二路1号、东环二路2号等。
此外,所述语音导航设备1还包括用于执行语音识别单元11中各功能模块的中央处理器(central processing unit)15,以及用于存储语音识别单元11中各功能模块的存储单元16,如硬盘等。
参阅图3所示,是本发明语音导航设备1较佳实施例中语音识别单元11的功能模块图。所述语音识别单元11包括关键字获取模块110、分割模块111、地名信息获取模块112、匹配及权值计算模块113、路径选择模块114、地名整合模块115、及定位模块116。
所述关键字获取模块110用于从上述关键字数据库12中获取关键字的波形图。
所述分割模块111用于将语音数据V中每个字的波形与关键字的波形进行比较,当语音数据V中某个字的波形与其中一个关键字的波形相匹配时,从该字之后对语音数据V进行分割,从而生成n段语音数据Vi(i=1~n)。参阅图4所示,关键字数据库12中存储有关键字“市”、“区”、“路”、及“号”的波形图。该分割模块111从语音数据V中第一个字的波形开始与上述几个关键字的波形进行比较,当语音数据V中某个字的波形与关键字“市”相匹配时,该分割模块111在该字之后对语音数据V进行分割。继续地,所述分割模块111将语音数据V中其余字的波形与余下的几个关键字的波形进行比较,当语音数据V中某个字的波形与关键字“区”的波形相匹配时,所述分割模块111在该字之后进行分割。如此直至语音数据V中每个字的波形都与上述关键字进行了匹配。
所述地名信息获取模块112用于从地名数据库13中获取地名信息的搜索树。
所述匹配及权值计算模块113用于从该搜索树的根节点开始执行遍历操作与上述n段语音数据中的第一段语音数据V1进行匹配,计算该根节点的每个子节点与上述语音数据V1的匹配度的权值,作为每个子节点的权值,并将该每个子节点的权值与一个预设的阈值相比较,并获取权值大于上述阈值的所有子节点。之后,该匹配及权值计算模块113继续从上述权值大于阈值的所有子节点开始执行遍历操作与下一段语音数据Vnext(next=2~n)进行匹配、计算权值、与预设阈值相比较,获取权值大于阈值的所有子节点。如此直至第n段语音数据Vn都已经与上述搜索树进行了匹配。
所述路径选择模块114用于计算所获取的所有子节点组成的每一条路径的权值总和,并选择其中权值总和最大的一条路径。本实施例中,每一条路径的权值总和的计算公式为:
OverallScore = Σ i = 1 n ConfidenceValue i * w i .
其中,OverallScore为路径的权值总和;ConfidenceValue为组成该条路径的每个子节点的权值;Wi为搜索树的每一层级的权值。其中,搜索树中各个层级的权值呈递减状态。每个子节点的权值代表该节点与语音数据Vi(i=1~n)的相似度。权值的计算方法可以是将语音数据Vi(i=1~n)与一个语言模型(Language Mode)作声学匹配得出。例如,参照图2所示,由深圳市宝安区东环二路2号所组成的路径中,假设“深圳市”这个节点的权值为0.9,“宝安区”这个节点的权值为0.7,“东环二路”这个节点的权值为0.8,“2号”这个节点的权值为0.9。在搜索树中,市级单位这一层级,即搜索树的第二级节点的权值可以设定为8;区级单位这一层级,即搜索树的第三级节点的权值可以设定为4;路级单位这一层级,即搜索树的第四级节点的权值可以设定为2;及号级单位这一层级,即搜索树的第五级节点的权值可以设定为1。于是,由深圳市宝安区东环二路2号所组成的路径的权值总和为:OverallScore=0.9*8+0.7*4+0.8*2+0.9*1=12.5。
所述地名整合模块115用于整合上述权值最大的路径所代表的地名信息,如整合成A市B区C路D号的形式。
所述定位模块116用于根据上述地名信息在电子地图中进行定位,以可视化地显示出导航目的地的位置与路线。
参阅图5所示,是本发明语音导航方法较佳实施例的流程图。
步骤S10,语音接收单元10接收外界的语音数据V。该语音数据V是驾驶者发出的导航目的地的语音命令。本实施例中,该语音数据V为“A市B区C路D号”的格式。
步骤S11,关键字获取模块110从关键字数据库12中获取关键字的波形图。
步骤S12,分割模块111将语音数据V中每个字的波形与关键字的波形进行比较,当语音数据V中某个字的波形与其中一个关键字的波形相匹配时,从该字之后对语音数据V进行分割,从而生成n段语音数据Vi(i=1~n)
步骤S13,地名信息获取模块112从地名数据库13中获取地名信息的搜索树。
步骤S14,匹配及权值计算模块113从上述n段语音数据中获取第一段语音数据V1
步骤S15,匹配及权值计算模块113从上述搜索树的根节点开始执行遍历操作与该第一段语音数据V1进行匹配,计算该根节点的每个子节点与语音数据V1的匹配度的权值,作为每个子节点的权值。
步骤S16,匹配及权值计算模块113将该每个子节点的权值与一个预设的阈值相比较,并获取权值大于上述阈值的所有子节点。
步骤S17,匹配及权值计算模块113判断是否还有下一段语音数据Vnext(next=2~n)。若还有下一段语音数据Vnext(next=2~n),则流程进入步骤S18。否则,若不存在下一段语音数据Vnext(next=2~n),则流程转向步骤S21。
在步骤S18中,匹配及权值计算模块113从上述n段语音数据中获取下一段语音数据Vnext(next=2~n)
步骤S19,匹配及权值计算模块113从上述获取的权值大于阈值的每个子节点开始执行遍历操作与下一段语音数据Vnext(next=2~n)进行匹配,计算该每个子节点的所有子节点的权值。
步骤S20,匹配及权值计算模块113将上述所有子节点的权值与一个预设的阈值相比较,并获取权值大于上述阈值的所有子节点。步骤S20之后重复执行步骤S17。
在步骤S21中,路径选择模块114计算所获取的所有子节点组成的每一条路径的权值总和,并选择其中权值总和最大的一条路径。本实施例中,每一条路径的权值总和的计算公式为:
OverallScore = Σ i = 1 n ConfidenceValue i * w i .
其中,OverallScore为路径的权值总和;ConfidenceValue为组成该条路径的每个字节点的权值;Wi为搜索树的每一层级的权值。其中,搜索树中各个层级的权值呈递减状态。每个子节点的权值代表该节点与语音数据Vi(i=1~n)的相似度。权值的计算方法可以是将语音数据Vi(i=1~n)与一个语言模型(Language Mode)作声学匹配得出。
步骤S22,地名整合模块115整合上述权值最大的路径所代表的地名信息,如整合成A市B区C路D号的形式。
步骤S23,定位模块116根据上述地名信息在电子地图中进行定位,以可视化地显示出导航目的地的位置与路线。

Claims (10)

1.一种语音导航设备,包括语音接收单元,用于接收关于导航目的地的语音数据V,其特征在于,所述语音导航设备还包括:
关键字数据库,其中存储有m个预设的关键字,其中,m为大于1的自然数;
地名数据库,其中存储有地名信息的搜索树;
语音识别单元,用于根据所述关键字数据库中存储的所述关键字对所述语音数据V进行分段,以生成n段语音数据Vi,i=1~n,并采用多段识别的方法与所述地名数据库中的所述地名信息的搜索树进行匹配,以将所述语音数据V转换为所述语音导航设备能够识别的输入形式;及
电子地图,用于根据所述转换成的输入形式,可视化地显示出导航目的地的位置与路线。
2.如权利要求1所述的语音导航设备,其特征在于,所述的m个预设的关键字包括“市”、“区”、“路”、及“号”。
3.如权利要求2所述的语音导航设备,其特征在于,所述的关键字以波形图的形式存储在所述关键字数据库中。
4.如权利要求3所述的语音导航设备,其特征在于,所述语音识别单元包括:
关键字获取模块,用于从所述关键字数据库中获取所述关键字的波形图;
分割模块,用于将所述语音数据V中每个字的波形与所述关键字的波形进行比较,当所述语音数据V中某个字的波形与其中一个所述关键字的波形相匹配时,从所述字之后对所述语音数据V进行分割,从而生成n段语音数据Vi,i=1~n;
地名信息获取模块,用于从所述地名数据库中获取所述地名信息的搜索树;
匹配及权值计算模块,用于从所述搜索树的根节点开始执行遍历操作与所述n段语音数据中的第一段语音数据V1进行匹配,计算所述根节点的每个子节点与所述语音数据V1的匹配度的权值,并将所述每个子节点的权值与一个预设的阈值相比较,并获取权值大于所述预设的阈值的所有子节点,并继续从所述权值大于所述预设的阈值的所有子节点开始执行遍历操作与下一段语音数据Vnext,next=2~n进行匹配、计算权值、与所述预设的阈值相比较,获取权值大于所述预设的阈值的所有子节点,直至第n段语音数据Vn都已经与所述搜索树进行了匹配;
路径选择模块,用于计算所获取的所述所有子节点组成的每一条路径的权值总和,并选择其中权值总和最大的一条路径;
地名整合模块,用于整合所述权值最大的路径所代表的地名信息;及
定位模块,用于根据所述地名信息在电子地图中进行定位,可视化地显示出导航目的地的位置与路线。
5.如权利要求4所述的语音导航设备,其特征在于,所述每一条路径的权值总和的计算公式为:
OverallScore = Σ i = 1 n ConfidenceValue i * w i ,
其中,OverallScore为路径的权值总和;ConfidenceValue为组成该条路径的每个子节点的权值;wi为所述搜索树的每一层级的权值;其中,所述搜索树中各个层级的权值呈递减状态。
6.一种语音导航方法,其特征在于,该方法包括:
(a)语音导航设备接收关于导航目的地的语音数据V;
(b)从一个关键字数据库中获取m个预设的关键字,其中,m为大于1的自然数;
(c)根据所述关键字对所述语音数据V进行分段,以生成n段语音数据Vi,i=1~n;
(d)利用所述n段语音数据Vi,i=1~n,采用多段识别的方法与地名数据库中的地名信息的搜索树进行匹配,以将所述语音数据V转换为所述语音导航设备能够识别的输入形式;及
(e)根据所述转换成的输入形式,在所述语音导航设备的电子地图上可视化地显示出导航目的地的位置与路线。
7.如权利要求6所述的语音导航方法,其特征在于,所述m个预设的关键字包括“市”、“区”、“路”及“号”,及所述m个预设的关键字以波形图的形式存储在所述关键字数据库中。
8.如权利要求7所述的语音导航方法,其特征在于,步骤(c)包括:
从所述语音数据V中第一个字的波形开始与所述“市”、“区”、“路”及“号”的波形进行比较,当所述语音数据V中某个字的波形与所述关键字“市”的波形相匹配时,在“市”字之后对语音数据V进行分割;
将所述语音数据V中其余字的波形与所述关键字“区”、“路”及“号”的波形进行比较,当所述语音数据V中某个字的波形与所述关键字“区”的波形相匹配时,在“区”字之后进行分割;
将所述语音数据V中其余字的波形与所述关键字“路”及“号”的波形进行比较,当所述语音数据V中某个字的波形与所述关键字“路”的波形相匹配时,在“路”字之后进行分割;及
将所述语音数据V中其余字的波形与所述关键字“号”的波形进行比较,当所述语音数据V中某个字的波形与所述关键字“号”的波形相匹配时,在“号”字之后进行分割。
9.如权利要求6所述的语音导航方法,其特征在于,步骤(d)包括:
(d1)从所述n段语音数据Vi,i=1~n中获取第一段语音数据V1;
(d2)从所述搜索树的根节点开始执行遍历操作与所述第一段语音数据V1进行匹配,计算所述根节点的每个子节点与所述语音数据V1的匹配度的权值,作为所述每个子节点的权值;
(d3)将所述每个子节点的权值与一个预设的阈值相比较,并获取所述权值大于所述预设的阈值的所有子节点;
(d4)从所述n段语音数据中获取下一段语音数据Vnext,next=2~n;
(d5)从所述获取的权值大于所述预设的阈值的每个子节点开始执行遍历操作与下一段语音数据Vnext,next=2~n进行匹配,计算所述每个子节点的所有子节点的权值;
(d6)将所述所有子节点的权值与所述预设的阈值相比较,并获取权值大于上述阈值的所有子节点;
(d7)重复所述(d4)至所述(d6)直至不存在Vnext,next=2~n;
(d8)计算所获取的所述所有子节点组成的每一条路径的权值总和,并选择其中权值总和最大的一条路径;
(d9)整合所述权值最大的路径所代表的地名信息。
10.如权利要求9所述的语音导航方法,其特征在于,所述每一条路径的权值总和的计算公式为:
OverallScore = Σ i = 1 n ConfidenceValue i * w i ,
其中,OverallScore为路径的权值总和;ConfidenceValue为组成所述路径的每个字节点的权值;wi为所述搜索树的每一层级的权值,其中,所述搜索树中各个层级的权值呈递减状态。
CN201010253223.0A 2010-08-13 2010-08-13 语音导航设备及语音导航方法 Active CN102374864B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201010253223.0A CN102374864B (zh) 2010-08-13 2010-08-13 语音导航设备及语音导航方法
US12/905,090 US8412455B2 (en) 2010-08-13 2010-10-15 Voice-controlled navigation device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010253223.0A CN102374864B (zh) 2010-08-13 2010-08-13 语音导航设备及语音导航方法

Publications (2)

Publication Number Publication Date
CN102374864A CN102374864A (zh) 2012-03-14
CN102374864B true CN102374864B (zh) 2014-12-31

Family

ID=45565450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010253223.0A Active CN102374864B (zh) 2010-08-13 2010-08-13 语音导航设备及语音导航方法

Country Status (2)

Country Link
US (1) US8412455B2 (zh)
CN (1) CN102374864B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5827872A (en) * 1996-08-23 1998-10-27 Webster; John M. Xenomins novel heterocyclic compounds with antimicrobial and antneoplastic properties
US10957002B2 (en) 2010-08-06 2021-03-23 Google Llc Sequence dependent or location based operation processing of protocol based data message transmissions
US10013978B1 (en) * 2016-12-30 2018-07-03 Google Llc Sequence dependent operation processing of packet based data message transmissions
US10614801B2 (en) 2012-06-25 2020-04-07 Google Llc Protocol based computer network exposure interval content item transmission
US9767479B2 (en) 2012-06-25 2017-09-19 Google Inc. System and method for deploying ads based on a content exposure interval
CN103020098A (zh) * 2012-07-11 2013-04-03 腾讯科技(深圳)有限公司 提供具有语音识别功能的导航业务的搜索方法
CN103591947B (zh) * 2012-08-13 2016-12-28 百度在线网络技术(北京)有限公司 移动终端的语音后台导航方法及移动终端
CN103839548B (zh) 2012-11-26 2018-06-01 腾讯科技(北京)有限公司 一种语音交互方法、装置、系统和移动终端
CN104154926A (zh) * 2013-05-14 2014-11-19 腾讯科技(深圳)有限公司 导航方法及装置
US11218434B2 (en) 2013-06-12 2022-01-04 Google Llc Audio data packet status determination
US8775191B1 (en) * 2013-11-13 2014-07-08 Google Inc. Efficient utterance-specific endpointer triggering for always-on hotwording
WO2017015882A1 (en) * 2015-07-29 2017-02-02 Bayerische Motoren Werke Aktiengesellschaft Navigation device and navigation method
CN106568457A (zh) * 2015-10-09 2017-04-19 深圳市盛思达通讯技术有限公司 语音导航控制方法、系统及智能手表
CN106648530B (zh) * 2016-11-21 2020-09-08 海信集团有限公司 语音控制方法及终端
CN108172219B (zh) * 2017-11-14 2021-02-26 珠海格力电器股份有限公司 识别语音的方法和装置
CN109241332B (zh) * 2018-10-19 2021-09-24 广东小天才科技有限公司 一种通过语音确定语义的方法及系统
CN109408717B (zh) * 2018-10-23 2022-03-29 广东小天才科技有限公司 一种内容推荐方法及系统
KR102625456B1 (ko) * 2019-08-14 2024-01-16 엘지전자 주식회사 Ar 모드 및 vr 모드를 제공하는 xr 디바이스 및 그 제어 방법
CN111540349B (zh) * 2020-03-27 2023-10-10 北京捷通华声科技股份有限公司 一种语音的打断方法和装置
CN111768781B (zh) * 2020-06-29 2023-07-04 北京捷通华声科技股份有限公司 语音打断的处理方法和装置
CN113382472A (zh) * 2021-06-09 2021-09-10 合肥市云联鸿达信息技术有限公司 一种儿童手表定位系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1024476A1 (en) * 1998-08-17 2000-08-02 Sony Corporation Speech recognizing device and method, navigation device, portable telephone, and information processor
CN1365487A (zh) * 1999-06-24 2002-08-21 西门子公司 语音识别的方法和装置
CN101097155A (zh) * 2006-06-30 2008-01-02 佛山市顺德区顺达电脑厂有限公司 具有语音规划路径的导航装置及其方法
CN101109641A (zh) * 2006-07-21 2008-01-23 英华达(上海)电子有限公司 用于gps设备的语音控制与交互装置及其方法
JP4264841B2 (ja) * 2006-12-01 2009-05-20 ソニー株式会社 音声認識装置および音声認識方法、並びに、プログラム
US8244534B2 (en) * 2007-08-20 2012-08-14 Microsoft Corporation HMM-based bilingual (Mandarin-English) TTS techniques
CN201266093Y (zh) * 2008-09-27 2009-07-01 东莞美城电子电器有限公司 具有语音识别功能的导航系统

Also Published As

Publication number Publication date
US20120041766A1 (en) 2012-02-16
US8412455B2 (en) 2013-04-02
CN102374864A (zh) 2012-03-14

Similar Documents

Publication Publication Date Title
CN102374864B (zh) 语音导航设备及语音导航方法
EP3153978B1 (en) Address search method and device
US10037758B2 (en) Device and method for understanding user intent
US7542966B2 (en) Method and system for retrieving documents with spoken queries
CN109145281B (zh) 语音识别方法、装置及存储介质
CN107369439B (zh) 一种语音唤醒方法和装置
CN111597308A (zh) 一种基于知识图谱的语音问答系统及其应用方法
CN103810998B (zh) 基于移动终端设备的离线语音识别方法以及实现方法
CN110364171A (zh) 一种语音识别方法、语音识别系统及存储介质
US20080183468A1 (en) Augmentation and calibration of output from non-deterministic text generators by modeling its characteristics in specific environments
CN111552777B (zh) 一种音频识别方法、装置、电子设备及存储介质
CN111292751B (zh) 语义解析方法及装置、语音交互方法及装置、电子设备
CN101162153A (zh) 一种语音控制的车载gps导航系统及其实现方法
CN102201235A (zh) 发音词典的构建方法和系统
JP6033136B2 (ja) 情報処理装置およびナビゲーション装置
JP2007047412A (ja) 認識文法モデル作成装置、認識文法モデル作成方法、および、音声認識装置
CN107112007B (zh) 语音识别装置及语音识别方法
CN113515616B (zh) 一种基于自然语言的任务驱动系统
CN110246496A (zh) 语音识别方法、系统、计算机设备及储存介质
CN114333759A (zh) 模型训练方法、语音合成方法、设备和计算机程序产品
CN112069824B (zh) 基于上下文概率和引证的地域识别方法、装置及介质
JP3645104B2 (ja) 辞書検索装置及び辞書検索プログラムを記録した記録媒体
CN113807102B (zh) 建立语义表示模型的方法、装置、设备和计算机存储介质
TWI404049B (zh) 語音導航設備及語音導航方法
CN105895091A (zh) 一种eswfst构建方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20180224

Address after: Shanghai City, Songjiang Export Processing Zone South Road No. 1925

Patentee after: Ambit Microsystems (Shanghai) Co., Ltd.

Address before: 201613 Shanghai City, Songjiang District Shanghai city south of Songjiang Export Processing Zone Road No. 1925

Co-patentee before: Hon Hai Precision Industry Co., Ltd.

Patentee before: Ambit Microsystems (Shanghai) Co., Ltd.

TR01 Transfer of patent right