CN102246136B

CN102246136B - 导航装置

Info

Publication number: CN102246136B
Application number: CN200980151568.0A
Authority: CN
Inventors: 谷口琢也; 青柳贵久; 森善彦; 表朝子
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2008-12-16
Filing date: 2009-08-11
Publication date: 2015-05-20
Anticipated expiration: 2029-08-11
Also published as: US20110213553A1; WO2010070781A1; DE112009003645T8; US8618958B2; DE112009003645T5; JPWO2010070781A1; CN102246136A; JP5355591B2; DE112009003645B4

Abstract

本发明的目的在于提供一种导航装置，包括：通信模块(11)，该通信模块(11)在与外部通信设备之间发送、接收信号；音调信号识别部(42)，该音调信号识别部(42)对由外部通信设备通过通信模块(11)传送来的按键音调信号进行识别；以及语音识别部(41)，该语音识别部(41)根据由音调信号识别部(42)识别出的信息，对由外部通信设备通过通信模块(11)传送来的语音信号进行语音识别。

Description

导航装置

技术领域

本发明涉及一种将用户引导至目的地的导航装置，特别涉及一种通过识别通话对象的语音来自动地提取出地点等的技术。

背景技术

目前，已知有具有语音识别功能的导航装置。在该导航装置中，在进行语音识别中，为了防止错误地识别想要识别的语音以外的语音，而不能使用免提电话。为了消除上述问题，专利文献1揭示了以下车载用信息装置：即，即使在使用免提电话中，也能进行语音识别。

该车载用信息装置包括：通信部，该通信部可通过通信网来与对方进行通信；语音识别部，该语音识别部对通过麦克风输入的语音进行识别；主处理部，该主处理部基于由语音识别部识别出的语音，来控制对道路信息进行引导的导航功能及通信部的通信动作；以及识别用开关，该识别用开关对通过麦克风输入的语音可否用作为语音识别部的语音识别用进行切换，通信部由可进行数据通信及语音通话的便携式电话构成，通过麦克风输入的语音作为语音通话用及语音识别用而分别传送到便携式电话及语音识别部，在便携式电话的语音通话中，若识别用开关切换至语音识别侧，则主处理部基于语音识别部识别出的语音来执行导航功能，若识别用开关切换至复原侧，则主处理部复原至便携式电话的语音通话。

专利文献

专利文献1：

日本专利特开2002-257574号公报

发明内容

上述专利文献1所揭示的车载用信息装置中，在免提通话中能够识别导航装置的使用者的语音，但是不能识别通话对象的语音。因此，不能直接从通话对象对想要登录到导航装置的地点信息进行语音识别。因而，由于导航装置的使用者需要先记住从通话对象处听到的地点名称等，然后导航装置的使用者再次进行语音识别，因此，耗时耗力。所以，希望开发能够直接识别出从通话对象处听到的地点信息的导航装置。

本发明是为了满足上述要求而完成的，其目的在于，提供一种能识别出通话对象的语音来获取地点信息或个人信息等的导航装置。

本发明的导航装置包括：通信模块，该通信模块在与外部通信设备之间发送、接收信号；音调信号识别部，该音调信号识别部对由外部通信设备通过通信模块传送来的按键音调信号进行识别；语音识别部，该语音识别部根据由上述音调信号识别部识别出的信息，对由外部通信设备通过通信模块传送来的语音信号进行语音识别；以及音量控制部，该音量控制部在从上述外部通信设备通过上述通信模块接收到语音信号的情况下，减小发送至上述外部通信设备的送话语音的音量。

根据本发明的导航装置，在语音识别中，通话对象能够容易地听到语音引导。

附图说明

图1是表示本发明的实施方式1的导航装置的结构的框图。

图2是表示本发明的实施方式1的导航装置所进行的免提通话处理的流程图。

图3是表示在本发明的实施方式1的导航装置所进行的免提通话处理中的对使用者的声音进行的语音识别处理的详细情况的流程图。

图4是表示在本发明的实施方式1的导航装置所进行的免提通话处理中的对通话对象的声音进行的语音识别处理的详细情况的流程图。

图5是表示在本发明的实施方式2的导航装置所进行的免提通话处理中的对通话对象的声音进行的语音识别处理的详细情况的流程图。

图6是表示在本发明的实施方式3的导航装置所进行的免提通话处理中的对通话对象的声音进行的语音识别处理的详细情况的流程图。

具体实施方式

下面，为了更详细地说明本发明，根据附图对用于实施本发明的方式进行说明。

实施方式1.

图1是表示本发明的实施方式1的导航装置的结构的框图。该导航装置包括：导航单元1、麦克风2、GPS(Global Positioning System，全球定位系统)接收机3、触摸屏4、显示器5、及扬声器6。该导航单元1与便携式电话7相连接。

导航单元1构成导航装置的核心，来控制整个导航装置。该导航单元1的详细情况将在后面叙述。麦克风2兼用于送话用和语音识别用。该麦克风2将输入的语音转换为电信号，并作为语音信号传送到导航单元1。

GPS接收机3接收从GPS卫星发送的电波，并对自己的当前位置进行检测。由该GPS接收机3检测到的自己的当前位置作为当前位置信号，传送到导航单元1。触摸屏4载放在显示器5的画面上，对触摸位置进行检测。将所检测出的位置作为触摸屏数据传送到导航单元1。

显示器5例如由液晶显示器构成，基于从导航单元1传送来的视频信号来显示各种图像。扬声器6兼用于受话用和语音引导用。该扬声器6将导航单元1发送来的语音信号转换成语音并输出。

便携式电话7在与导航单元1之间发送并接收包含语音或数据的信号，并在与通话对象的便携式电话8之间进行通信。这些便携式电话7与便携式电话8对应于本发明的外部通信设备。

接下来，说明导航单元1的详细情况。导航单元1包括通信模块11、DSP(Digital Signal Processor：数字信号处理器)12、辅助存储装置13、放大器14、电话识别按键15、语音识别按键16、取消按键17、及CPU(Central Processing Unit：中央处理器)18。

通信模块11由蓝牙模块或电话连接器构成，包括受话部21及送话部22。受话部21接收由便携式电话7传送来的信号，作为受话信号传送到DSP12及CPU18。送话部22接收从DSP12传送来的送话信号，并传送到便携式电话7。

DSP12在送话语音及受话语音中混有用于导航功能等的引导语音。由此，能够对通话对象发送送话语音及引导语音，并能够对该导航装置的使用者(以下，单独称为“使用者”)输出受话语音及引导语音。

该DSP12包括：第一衰减器31、第一混合器32、回声消除器33、第二衰减器34、以及第二混合器35。第一衰减器31与第二衰减器34对应于本发明的音量控制部。

第一衰减器31根据来自CPU18的指示，使得由通信模块11的受话部21传送来的受话信号衰减，并传送到第一混合器32。由于能够利用该第一衰减器31来减小受话语音的音量，因此能够防止在对使用者的声音进行语音识别中的误识别，还能够提高对于使用者的引导语音的清晰度。

第一混合器32将由第一衰减器31传送来的受话信号和由CPU18传送来的引导语音信号进行混合，并传送到回声消除器33及放大器14。回声消除器33从由麦克风2传送来的语音信号中去除由扬声器6输出的、绕回至麦克风2的声音的分量，并传送到第二衰减器34及CPU18。在进行免提通话时等情况下，利用该回声消除器33，能够防止在送话语音中混有从扬声器6输出的引导语音及受话语音。同时，该回声消除器33也能够防止将扬声器6输出的受话语音传送到CPU18，其结果是，在对免提通话中的使用者的声音进行语音识别时，能够防止误识别。

第二衰减器34根据来自CPU18的指示，使得由回声消除器33传送来的信号衰减，并传送到第二混合器35。由于利用该第二衰减器34，能够减小送话语音的音量，因此，在语音识别中，通话对象能够容易地听到引导语音。第二混合器35将由第二衰减器34传送来的受话信号和由CPU18传送来的引导语音信号进行混合，并传送到通信模块11的送话部22。

辅助存储装置13例如由HDD(Hard Disk Drive：硬盘驱动器)构成，存储导航用的地图数据及语音识别用的词典数据。存储在该辅助存储装置13中的地图数据及词典数据能根据需要由CPU18来访问。放大器14将由DSP12 的第一混合器32传送来的受话信号和引导语音信号混合而成的信号进行放大，并作为语音信号传送到扬声器6。

电话识别按键15用于开始对通话对象的声音进行语音识别。通过按下该电话识别按键15而产生的电话识别按键数据被传送到CPU18。语音识别按键16用于开始对使用者的声音进行语音识别。通过按下该语音识别按键16而产生的语音识别按键数据被传送到CPU18。取消按键17用于消除语音识别的结果。通过按下该取消按键17而产生的取消按键数据被传送到CPU18。

CPU18包括：语音识别部41、音调信号识别部42、操作控制部43、语音引导输出部44、导航部45、及图像处理部46。这些各构成要素都由CPU18所执行的程序来实现。此外，这些各构成要素也能由硬件来构成。

语音识别部41使用从辅助存储装置13中读出的词典数据，来对由便携式电话7通过通信模块11的受话部21传送来的受话信号执行语音识别。另外，语音识别部41使用从辅助存储装置13中读出的词典数据，来对从麦克风2通过DSP12的回声消除器33传送来的语音信号执行语音识别。将该语音识别部41的语音识别结果、即通过执行语音识别而获得的字符或命令等，作为语音识别数据传送到操作控制部43。

音调信号识别部42对由便携式电话7通过通信模块11的受话部21传送来的按键音调信号进行解析，利用信号的频率对与便携式电话7相连接的便携式电话8的所按下的按键进行识别。将表示由该音调信号识别部42识别出的按键的音调信号识别数据传送到操作控制部43。

操作控制部43接收由语音识别部41传送来的语音识别数据、由音调信号识别部42传送来的音调信号识别数据、由电话识别按键15传送来的电话识别按键数据、由语音识别按键16传送来的语音识别按键数据、由取消按键17传送来的取消按键数据、由触摸屏4传送来的触摸屏数据及来自导航部45的要求命令，来执行预定的处理。然后，根据处理的结果，控制语音引导输出部44、导航部45、图像处理部46、及DSP12的第一衰减器31及第二衰减器34。

语音引导输出部44对来自操作控制部43的指示进行响应，来生成引导语音信号，传送到DSP12的第一混合器32及第二混合器35。由此，由于将在送话语音中混合有引导语音的送话信号传送到便携式电话7，因此，能够对通话对象输出语音引导，并能够从扬声器6输出在来自便携式电话7的受话信号中混合有引导语音的信号，因此，也能对使用者输出语音引导。

导航部45对来自操作控制部43的指示进行响应，执行用于实现导航功能的处理。例如，导航部45进行目的地及经由地的设定、或地点的登录等。另外，通过向操作控制部43输出要求，从而获得语音识别的结果，执行路径搜索及路径引导等处理，以输出语音引导。另外，在显示地图的情况下，向图像处理部46输出指示，在显示器5上显示地图。而且，在执行导航的情况下，从GPS接收机3获取当前位置信号，来确定本车位置。

图像处理部46对来自导航部45及操作控制部43的指示进行响应，生成用于显示语音识别的结果、地图、及其他导航所必需的信息的图像，作为视频信号传送到显示器5。由此，在显示器5上显示语音识别的结果、地图、及其他导航所必需的信息。

接下来，将上述结构的本发明的实施方式1的导航装置的动作、以用于实现免提通话的免提通话处理为中心并参照图2～图4所示的流程图进行说明。免提通话处理是由来自使用者的拨号或来自通话对象的便携式电话8的来电而开始的。

开始免提通话处理时，首先检查是否按下了语音识别按键16(步骤ST11)。即，CPU18的操作控制部43对是否有从语音识别按键16传送来语音识别按键数据进行检查。在该步骤ST11中，若判断为按下了语音识别按键16，则对使用者的声音进行语音识别(步骤ST12)。后文将详细叙述该步骤ST12的处理。之后，流程前进至步骤ST15。

另一方面，在步骤ST11中，若判断为未按下语音识别按键16，则接着检查是否按下了电话识别按键15(步骤ST13)。即，CPU18的操作控制部43对是否有从电话识别按键15传送来电话识别按键数据进行检查。在该步骤ST13中，若判断为按下了电话识别按键15，则对通话对象的声音进行语音识别(步骤ST14)。后文将详细叙述该步骤ST14的处理。之后，流程前进至步骤ST15。在上述步骤ST13中，即使在判断为未按下电话识别按键15的情况下，流程也前进至步骤ST15。

在步骤ST15中，对通话是否结束进行检查。即，操作控制部43对是否有从触摸屏4传送来表示进行了结束通话操作的触摸屏数据、或对便携式电话7和便携式电话8之间的通信是否被断开进行检查。在该步骤ST15中，若判断为通话未结束，则流程返回至步骤ST11，重复上述处理。另一方面，在步骤ST15中，若判断为通话结束，则免提通话处理结束。

接下来，参照图3所示的流程图，说明在上述步骤ST12中进行的对使用者的声音进行语音识别处理的细节。

在对使用者的声音进行的语音识别处理中，首先，减小通话语音(是指“送话语音”及“受话语音”这两者)的音量(步骤ST21)。即，操作控制部43对第一衰减器31及第二衰减器34发出指示，以减小语音的音量。由此，第一衰减器31使得由通信模块11的受话部21传送来的受话信号衰减，并传送到第一混合器32。另外，第二衰减器34使得由回声消除器33传送来的信号衰减，并传送到第二混合器35。由此，减小对通话对象的送话语音及来自通话对象的受话语音的音量。

接着，向通话对象发送表示使用者在语音识别中的语音引导(步骤ST22)。即，操作控制部43指示语音引导输出部44生成表示使用者在语音识别中的语音引导。语音引导输出部44对该指示进行响应，生成表示使用者在语音识别中的语音引导的引导语音信号，并传送到DSP12的第二混合器35。第二混合器35将由第二衰减器34传送来的信号和由语音引导输出部44传送来的引导语音信号进行混合，并通过通信模块11的送话部22传送到便携式电话7。便携式电话7将由送话部22传送来的引导语音信号发送至通话对象的便携式电话8。由此，在通话对象的便携式电话8中，输出表示使用者正在语音识别中的语音引导，例如“现在正在进行语音识别操作。请稍等片刻。”这样的语音引导。

接着，输出指示语音识别开始的语音引导(步骤ST23)。即，操作控制部43指示语音引导输出部44生成表示开始语音识别的语音引导。语音引导输出部44对该指示进行响应，生成表示指示开始语音识别的语音引导的引导语音信号，并传送到DSP12的第一混合器32。第一混合器32将由第一衰减器31传送来的信号和由语音引导输出部44传送来的引导语音信号进行混合，并传送到放大器14。放大器14将由第一混合器32传送来的受话信号和引导语音信号混合而成的信号进行放大，并作为语音信号传送到扬声器6。由此，从扬声器6输出指示语音识别开始的语音引导，例如“开始语音识别。请在“哔”的一声后开始说话”这样的语音引导。

利用上述步骤ST21～ST23的处理，能够向通话对象播放表示使用者正在语音识别中的语音引导。另外，由于对于使用者及通话对象这双方，都减小对方的声音的音量，因此，能够集中听清语音引导。

接着，对使用者的声音进行语音识别(步骤ST24)。即，语音识别部41使用从辅助存储装置13中读出的词典数据，来对从麦克风2通过回声消除器33传送来的语音信号执行语音识别，将所获得的字符或命令作为语音识别数据传送到操作控制部43。

接下来，以语音来输出语音识别结果(步骤ST25)。即，操作控制部43指示语音引导输出部44生成表示语音识别结果的语音引导。语音引导输出部44对该指示进行响应，生成包含由语音识别数据所示的字符或命令的引导语音信号，并传送到DSP12的第一混合器32。第一混合器32将由第一衰减器31传送来的信号和由语音引导输出部44传送来的引导语音信号进行混合，并传送到放大器14。放大器14将由第一混合器32传送来的信号进行放大，并作为语音信号传送到扬声器6。由此，从扬声器6中以语音来输出语音识别的结果。

接下来，显示语音识别结果(步骤ST26)。即，操作控制部43指示图像处理部46生成表示语音识别数据所示的语音识别结果的字符或命令。图像处理部46对该指示进行响应，生成表示语音识别结果的字符或命令的图像，并作为视频信号传送到显示器5。由此，在显示器5上显示语音识别的结果。

接着，检查是否按下了取消按键17(步骤ST27)。即，操作控制部43对是否有从取消按键17传送来取消按键数据进行检查。在该步骤ST27中，若判断为按下了取消按键17，则识别为语音识别结果有误，输出取消的语音引导(步骤ST28)。即，操作控制部43指示语音引导输出部44生成表示取消的语音引导。语音引导输出部44对来自操作控制部43的指示进行响应，来生成表示取消的引导语音信号，并传送到DSP12的第一混合器32。第一混合器32将由第一衰减器31传送来的信号和由语音引导输出部44传送来的引导语音信号进行混合，并传送到放大器14。放大器14将由第一混合器32传送来的信号进行放大，并作为语音信号传送到扬声器6。由此，从扬声器6中输出表示取消的语音引导之后，流程返回至步骤ST24，再次执行语音识别处理。

在上述步骤ST27中，若判断为未按下取消按键17，则识别为语音识别结果正确，对通话对象发送表示语音识别操作结束的语音引导(步骤ST29)。即，操作控制部43指示语音引导输出部44生成表示语音识别结束的语音引导。语音引导输出部44对该指示进行响应，生成表示语音识别结束的语音引导的引导语音信号，并传送到DSP12的第二混合器35。第二混合器35将由第二衰减器34传送来的信号和由语音引导输出部44传送来的引导语音信号进行混合，并通过通信模块11的送话部22传送到便携式电话7。便携式电话7将由送话部22传送来的引导语音信号发送至通话对象的便携式电话8。由此，在通话对象的便携式电话8中，输出表示使用者结束了语音识别的语音引导，例如“语音识别操作结束。”这样的语音引导。

接着，将通话语音的音量复原(步骤ST30)。即，操作控制部43对第一衰减器31及第二衰减器34发出指示，以恢复原有的语音的音量。由此，第一衰减器31使得由通信模块11的受话部21传送来的受话信号的衰减量复原，并传送到第一混合器32。另外，第二衰减器34使得由回声消除器33传送来的信号的衰减量复原，并传送到第二混合器35。由此，使得对通话对象的送话语音及来自通话对象的受话语音的音量恢复原有的音量。此后，流程返回至免提通话处理。

接下来，参照图4所示的流程图，说明在上述步骤ST14中进行的对通话对象的声音进行语音识别处理的细节。

在对通话对象的声音进行的语音识别处理中，首先，减小通话语音的音量(步骤ST31)。此步骤ST31的处理与上述步骤ST21的处理相同。

接着，向通话对象发送表示可进行语音识别操作的语音引导(步骤ST32)。即，操作控制部43指示语音引导输出部44生成可进行语音识别操作的语音引导。语音引导输出部44对该指示进行响应，生成表示可进行语音识别操作的语音引导的引导语音信号，并传送到DSP12的第二混合器35。第二混合器35将由第二衰减器34传送来的信号和由语音引导输出部44传送来的引导语音信号进行混合，并通过通信模块11的送话部22传送到便携式电话7。便携式电话7将由送话部22传送来的引导语音信号发送至通话对象的便携式电话8。由此，在通话对象的便携式电话8中，输出表示可进行语音识别操作的语音引导，例如“能够对想要登录的地方进行语音输入。”这样的语音引导。

接着，向通话对象发送催促发话的语音引导(步骤ST33)。即，操作控制部43指示语音引导输出部44生成催促发话的语音引导。语音引导输出部44对该指示进行响应，生成表示催促发话的语音引导的引导语音信号，并传送到DSP12的第二混合器35。第二混合器35将由第二衰减器34传送来的信号和由语音引导输出部44传送来的引导语音信号进行混合，并通过通信模块11的送话部22传送到便携式电话7。便携式电话7将由送话部22传送来的引导语音信号发送至通话对象的便携式电话8。由此，在通话对象的便携式电话8中，输出表示可进行语音识别操作的语音引导，例如“在以地址、关键词来进行搜索的情况下请按下1之后再说，在以电话号码来进行搜索的情况下请按下2之后再说，在以邮编来进行搜索的情况下请按下3之后再说”这样的指示选择语句的种类的语音引导。

对该语音引导进行响应，在通话对象的便携式电话8中，为了选择发话内容的种类，按下“1”至“3”中的任一个按键。由此，发送对应于所按下的按键的按键音调信号，通过便携式电话7传送到导航单元1。另外，便携式电话8发送自身的音调拨号信号，通过便携式电话7来传送到导航单元1，从而通知以完成发话的准备。在导航单元1中，由便携式电话7传送来的按键音调信号通过通信模块11的受话部21，来传送到音调信号识别部42。音调信号识别部42对传送来的按键音调信号进行解析，识别出所按下的按键，将其作为音调信号识别数据传送到操作控制部43。

接下来，进行语音识别(步骤ST34)。即，操作控制部43进行设定，以使得在从音调信号识别部42接收到的音调信号识别数据所示的语句的种类的范围内进行语音识别，之后，指示语音识别部41开始语音识别。语音识别部41使用从辅助存储装置13中读出的词典数据，来对紧接着按键音调信号的、从便携式电话7通过通信模块11的受话部21传送来的受话信号执行语音识别，将所获得的字符或命令作为语音识别数据传送到操作控制部43。

接着，向通话对象发送表示识别结果的语音引导(步骤ST35)。即，操作控制部43指示语音引导输出部44生成表示语音识别结果的语音引导。语音引导输出部44对该指示进行响应，生成包含由语音识别数据所示的字符或命令的引导语音信号，并传送到DSP12的第二混合器35。第二混合器35将由第二衰减器34传送来的信号和由语音引导输出部44传送来的引导语音信号进行混合，并通过通信模块11的送话部22传送到便携式电话7。便携式电话7将由送话部22传送来的引导语音信号发送至通话对象的便携式电话8。由此，在通话对象的便携式电话8中，输出表示语音识别结果的语音引导，例如“若○○○正确则请按1，若不正确则请按2。”这样的语音引导。

接下来，检查识别结果是否正确(步骤ST36)。即，在通话对象的便携式电话8中，若按下“1”或“2”的按键，则发送对应于所按下的按键的按键音调信号，通过便携式电话7传送到导航单元1。在导航单元1中，由便携式电话7传送来的按键音调信号通过通信模块11的受话部21，来传送到音调信号识别部42。音调信号识别部42对传送来的按键音调信号进行解析，识别出所按下的按键，将其作为音调信号识别数据传送到操作控制部43。操作控制部43对音调信号识别数据所示的按下的按键是否为“识别结果正确”(上述语音引导的例子中为“1”)进行检查。

在该步骤ST36中，若判断为识别结果不正确，则向通话对象发送用于再次进行语音识别的语音引导(步骤ST37)。即，操作控制部43指示语音引导输出部44生成表示再次进行语音识别的语音引导。语音引导输出部44对该指示进行响应，生成表示再次进行语音识别的引导语音信号，并传送到DSP12的第二混合器35。第二混合器35将由第二衰减器34传送来的信号和由语音引导输出部44传送来的引导语音信号进行混合，并通过通信模块11的送话部22传送到便携式电话7。便携式电话7将由送话部22传送来的引导语音信号发送至通话对象的便携式电话8。由此，在通话对象的便携式电话8中，输出用于再次进行语音识别的语音引导，例如“已取消，请再说一遍。” 这样的语音引导。其后，流程返回至步骤ST33，重复上述的处理。

另一方面，在步骤ST36中，若判断为识别结果正确，则向通话对象发送语音识别结束的语音引导(步骤ST38)。即，操作控制部43指示语音引导输出部44生成语音识别结束的语音引导。语音引导输出部44对该指示进行响应，生成表示语音识别结束的引导语音信号，并传送到DSP12的第二混合器35。第二混合器35将由第二衰减器34传送来的信号和由语音引导输出部44传送来的引导语音信号进行混合，并通过通信模块11的送话部22传送到便携式电话7。便携式电话7将由送话部22传送来的引导语音信号发送至通话对象的便携式电话8。由此，在通话对象的便携式电话8中，输出语音识别结束的语音引导，例如“已登录。”这样的语音引导。

接着，将语音识别出的地点显示于显示器5，并进行朗读。即，操作控制部43指示图像处理部46生成表示语音识别结果的字符串(表示地点的字符串)，并生成上述字符串所示地点周围的地图。图像处理部46对该指示进行响应，生成表示语音识别结果的字符的图像、和上述字符串所示地点周围的地图的图像，并作为视频信号传送到显示器5。由此，在显示器5上显示出表示语音识别出的地点的字符串、和上述地点周围的地图。另外，操作控制部43指示语音引导输出部44生成表示语音识别结果的语音引导。语音引导输出部44对该指示进行响应，生成表示语音识别结束的引导语音信号，并传送到DSP12的第一混合器32。第一混合器32将由第一衰减器31传送来的信号和由语音引导输出部44传送来的引导语音信号进行混合，并传送到放大器14。放大器14将由第一混合器32传送来的信号进行放大，并作为语音信号传送到扬声器6。由此，从扬声器6中输出表示语音识别结果的语音引导

接着，将通话语音的音量复原(步骤ST40)。该步骤ST40的处理与上述步骤ST30的处理相同。此后，流程返回至免提通话处理。

如上述说明的那样，根据本发明的实施方式1的导航装置，不仅能够在通话中对使用者的声音进行语音识别，并能够对通话对象的声音进行语音识别。另外，由于能够向通话对象提示识别结果，能使其对识别结果是否正确进行判断，在识别结果有误的情况下进行语音引导，使通话对象再说一遍，因此，能够获得通话对象想要的语音识别结果。

实施方式2.

本发明的实施方式2的导航装置的结构与上述实施方式1的导航装置的结构相同。

接下来，对实施方式2的导航装置的动作进行说明。本实施方式2的导航装置的免提通话处理及对使用者的声音的语音识别处理与实施方式1的免提通话处理(参照图2)及对使用者的声音的语音识别处理(参照图3)相同。

图5是表示实施方式2的导航装置所进行的、对通话对象的声音进行语音识别处理的流程图。

在对通话对象的声音进行的语音识别处理中，首先，使用者选择所要识别的词汇的种类(步骤ST41)。即，使用者操作触摸屏4来选择所要识别的词汇的种类。这种情况下的触摸屏4对应于本发明的选择部。操作控制部43对该选择操作进行响应，接收由触摸屏4传送来的触摸屏数据，决定作为语音识别对象的词汇的种类。

接着，减小对通话对象的送话语音的音量(步骤ST42)。即，操作控制部43对第二衰减器34发出指示，以减小语音的音量。对该指示进行响应，第二衰减器34使得由回声消除器33传送来的信号衰减，并传送到第二混合器35。由此，减小对通话对象的送话语音的音量。

接着，向通话对象发送催促发话的语音引导和提示音(步骤ST43)。即，操作控制部43指示语音引导输出部44生成催促发话的语音引导及提示音。语音引导输出部44对该指示进行响应，生成表示催促发话的语音引导及提示音的引导语音信号，并传送到DSP12的第二混合器35。第二混合器35将由第二衰减器34传送来的信号和由语音引导输出部44传送来的引导语音信号进行混合，并通过通信模块11的送话部22传送到便携式电话7。便携式电话7将由送话部22传送来的引导语音信号发送至通话对象的便携式电话8。由此，在通话对象的便携式电话8中，输出表示可进行语音识别操作的语音引导，例如“请在“哔”一声后说出地址。”这样的语音引导和“哔”一声提示音。

对该语音引导进行响应，通话对象进行发话后，语音信号会从便携式电话8通过便携式电话7而传送到导航单元1。在导航单元1中，由便携式电话7传送来的语音信号通过通信模块11的受话部21来传送到语音识别部41。

接着，对通话对象的声音进行语音识别(步骤ST44)。即，语音识别部41使用从辅助存储装置13中读出的词典数据，来对从便携式电话7通过通信模块11的受话部21传送来的受话信号执行语音识别，将所获得的字符或命令作为语音识别数据传送到操作控制部43。此时，由于减小了对通话对象的送话语音的音量以插入语音引导，因此，能够使通话对象容易听到语音引导。

接下来，以语音来输出语音识别结果(步骤ST45)。此步骤ST45的处理与上述步骤ST25的处理相同。接下来，显示语音识别结果(步骤ST46)。此步骤ST46的处理与上述步骤ST26的处理相同。

接着，将送话语音的音量复原(步骤ST47)。即，操作控制部43对第二衰减器34发出指示，以恢复语音的音量。由此，第二衰减器34使得由回声消除器33传送到的信号的衰减量复原，并传送到第二混合器35。由此，使得对通话对象的送话语音及来自通话对象的受话语音的音量恢复至原有的音量。

接着，检查是否按下了取消按键17(步骤ST48)。此步骤ST48的处理与上述步骤ST27的处理相同。在上述步骤ST48中，若判断为按下了取消按键17，则识别为语音识别结果不正确，流程返回至步骤ST42，再次重新进行语音识别。

另一方面，在步骤ST48中，若判断为未按下取消按键17，则识别为语音识别结果正确，接着，将语音识别出的地点显示于显示器5，并进行朗读(步骤ST49)。此步骤ST49的处理与上述步骤ST39的处理相同。此后，流程返回至免提通话处理。

如上所述，根据本发明的实施方式2的导航系统，与实施方式1的导航装置相比，由于减少了对通话对象的语音引导的时间，因此能够在语音识别中减少不能与对方通话的时间。

另外，由于在语音识别中，来自通话对象的受话语音的音量未减小，因此，使用者能够听到通话对象的语音(作为语音识别对象的语音)。因此，即使对通话对象的声音的语音识别失败，但由于使用者也能理解通话对象所要识别的词汇，因此，也能通过使用者自身发话来进行语音识别操作，无需麻烦通话对象再次进行语音识别操作。

而且，根据实施方式2的导航装置，由于不需要CPU18所包含的音调信号识别部42，因此能够简化CPU18的结构。

此外，在上式实施方式1及实施方式2的导航装置中，能够采用以下结构：即，在便携式电话8中的用于语音识别的操作开始或结束时，从扬声器6中以语音来输出通话对象正在语音识别操作中的信息。根据该结构，使用者能够容易地判断可否进行通话。

另外，也能采用以下结构：即，在便携式电话8中，在进行用于语音识别的操作的情况下，在显示器5上显示通话对象正在语音识别中的信息。根据该结构，使用者能够容易地判断可否进行通话。

实施方式3.

本发明的实施方式3的导航装置的结构与上述实施方式1的导航装置的结构相同。

接下来，对实施方式3的导航装置的动作进行说明。本实施方式3的导航装置的免提通话处理及对使用者的声音的语音识别处理与实施方式1的免提通话处理(参照图2)及对使用者的声音的语音识别处理(参照图3)相同。

图6是表示实施方式3的导航装置所进行的、对通话对象的声音进行语音识别处理的流程图。

在对通话对象的声音进行的语音识别处理中，首先，使用者选择所要识别的词汇的种类(步骤ST51)。此步骤ST51的处理与上述步骤ST41的处理相同。之后，不向通话对象发送语音引导，也不减小通话语音的音量，就对通话对象的声音进行语音识别(步骤ST52)。此步骤ST52的处理与上述步骤ST44的处理相同。

接下来，显示语音识别结果(步骤ST53)。此步骤ST53的处理与上述步骤ST46的处理相同。接着，检查是否按下了取消按键17(步骤ST54)。此步骤ST54的处理与上述步骤ST48的处理相同。在上述步骤ST54中，若判断为按下了取消按键17，则识别为语音识别结果不正确，流程返回至免提通话处理。在这种情况下，中止语音识别，返回至正常的通话状态。

另一方面，在步骤ST54中，若判断为未按下取消按键17，则识别为语音识别结果正确，接着，将语音识别出的地点显示于显示器5，并进行朗读(步骤ST55)。此步骤ST55的处理与上述步骤ST49的处理相同。此后，流程返回至免提通话处理。

如上述说明的那样，根据本发明的实施方式3的导航装置，由于不对通话对象进行语音引导，因此，能够与通话对象无关，而根据使用者的情况来对通话对象的声音进行语音识别。而且，根据实施方式3的导航装置，由于不需要CPU18所包含的音调信号识别部42，因此能够简化CPU18的结构。

工业上的实用性

本发明的导航装置对来自通话对象的语音进行语音识别，从而能够直接获取通话对象所要表达的地点信息或个人信息等。因此，适用于能将用户引导至目的地的导航装置等，特别适用于通过识别通话对象的语音来自动地提取出地点等的导航装置等。

Claims

1.一种导航装置，其特征在于，包括：

通信模块，该通信模块与外部通信设备发送、接收信号；

音调信号识别部，该音调信号识别部对由所述外部通信设备通过所述通信模块传送来的表示语音内容的种类的按键音调信号进行识别；

语音识别部，该语音识别部利用所述按键音调信号，对由所述外部通信设备通过所述通信模块传送来的语音信号的词汇进行语音识别；

语音引导输出部，该语音引导输出部对所述外部通信设备的用户输出引导信号，该引导信号表示催促发出要进行语音识别的词汇的语音引导；

麦克风，该麦克风输入语音信号；以及

处理部，该处理部使用由所述麦克风输入的语音信号来输出送话语音，将所生成的送话语音和由所述语音引导输出部所输出的引导信号进行混合，将混合后的信号提供给所述通信模块以发送到所述外部通信设备，

所述处理部具有音量控制部，该音量控制部进行控制，以减小与所述引导信号进行混合的所述送话语音的音量，

所述导航装置具有导航部，该导航部获取所述语音识别部的语音识别的结果，基于所获取的结果来进行路径搜索及路径引导中的至少一个，

由所述语音引导输出部输出的与所述送话语音相混合的所述引导信号表示另一种语音引导，该另一种语音引导对所述外部通信设备的用户通知可选择的语音内容的种类，以执行路径搜索及路径引导中的至少一个。

2.如权利要求1所述的导航装置，其特征在于，

所述语音引导输出部输出表示语音识别部的识别结果是否正确的语音信号，以作为与所述送话语音进行混合的引导信号。

3.如权利要求1所述的导航装置，其特征在于，

包括扬声器，该扬声器在外部通信设备开始或结束语音识别的操作时，以语音来输出该情况。

4.如权利要求3所述的导航装置，其特征在于，

在从所述外部通信设备通过所述通信模块接收到语音信号的情况下，且在所述外部通信设备进行所述语音识别的操作的情况下，所述音量控制部减小由所述扬声器输出的所述语音信号的音量。

5.如权利要求1所述的导航装置，其特征在于，

包括显示器，该显示器在外部通信设备进行语音识别的操作时，显示该情况。