JP2004233542A - 音声認識装置 - Google Patents

音声認識装置 Download PDF

Info

Publication number
JP2004233542A
JP2004233542A JP2003020675A JP2003020675A JP2004233542A JP 2004233542 A JP2004233542 A JP 2004233542A JP 2003020675 A JP2003020675 A JP 2003020675A JP 2003020675 A JP2003020675 A JP 2003020675A JP 2004233542 A JP2004233542 A JP 2004233542A
Authority
JP
Japan
Prior art keywords
information
user
vehicle
voice
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003020675A
Other languages
English (en)
Inventor
Yoichi Kitano
陽一 北野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2003020675A priority Critical patent/JP2004233542A/ja
Publication of JP2004233542A publication Critical patent/JP2004233542A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

【課題】車両の利用者の意志を正確に把握することができる音声認識装置を提供する。
【解決手段】音声入力部2から音声が入力されると、音声認識部1は認識可能か否かを判定する。認識できない音声を、既知の単語に対応付ける場合、関連語推定部13は、その時の位置情報検出部6による位置情報、時間情報検出部7による時間情報、自車周辺情報検出部8による自車周辺情報、運転情報検出部9による運転情報、ドライバ情報検出部10によるドライバ情報、ナビゲーション装置11による地点登録情報を取得する。次に、認識対象語彙と同義として扱う語彙を、記憶部5に記憶された入力履歴と対話状態、位置情報、時間情報、自車周辺情報、運転情報、ドライバ情報、地点登録情報等に関連付けて選択し、候補を利用者3に提示する。そして音声認識部1は、利用者3の選択した同義語を認識対象語彙に関連付けて認識語彙辞書4へ記憶する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、車両の利用者が入力した音声を認識する音声認識装置に関する。
【0002】
【従来の技術】
従来、利用者が入力した文章の履歴情報を管理し、その中から、頻出している単語であって、1単語として纏めるべき単語組を決定し、利用者の使用環境にあった単語組だけ登録できる日本語ディクテーションシステムがある。
このシステムでは、入力音声を受取る音声入力部と、該入力音声を認識するための単語を格納する辞書と、利用者の入力履歴を単語組毎に出現頻度情報を格納する単語組履歴情報部と、入力音声を日本語文章として認識する音声認識部と、該音声認識部による認識結果から単語組毎に分解し、上記出現頻度情報に基づいて、上記単語組の出現数が一定値以上の時に単語組を1つの単語として辞書に登録する連鎖単語判定部とを具備し、利用者の使用環境にあった単語組だけを辞書に登録する(例えば、特許文献1参照。)。
【0003】
【特許文献1】
特開2001−195081号公報
【0004】
【発明が解決しようとする課題】
ところで、特許文献1に記載されているような従来のシステムでは、利用者の使用環境にあった単語組だけを辞書に登録することができるものの、例えば、これを車両に搭載した端末に備え、車両の利用者の音声を認識させようとする場合、利用者の対峙する環境が複雑になることにより利用者の発声する音声が多くなり、利用者が入力する認識不可能な音声も数が増えるため、利用者の使用環境を入力単語の履歴のみでは管理することが難しくなるという問題があった。
すなわち、未認識語を車両の走行状況等と関連付けて扱い、入力単語の履歴のみならず、車両の状態や位置等、更に多くの情報に基づいて推定する必要があった。
【0005】
本発明は、上記課題に鑑みてなされたもので、車両の利用者が入力した認識不可能な音声を、既に登録されている認識語彙と関連づけ、利用者の意志を正確に把握することができる音声認識装置を提供することを目的とする。
【0006】
【課題を解決するための手段】
上記課題を解決するために、請求項1の発明に係る音声認識装置は、車両の利用者(例えば実施の形態の利用者3)が入力した認識不可能な音声を、既に登録されている認識語彙と関連づける音声認識装置であって、前記車両の走行状況を検出する車両走行状況検出手段(例えば実施の形態の位置情報検出部6、自車周辺情報検出部8、運転情報検出部9)と、前記利用者の音声を入力するための音声入力手段(例えば実施の形態の音声入力部2)と、予め前記認識語彙が記憶された音声認識辞書(例えば実施の形態の認識語彙辞書4)により、入力された前記音声を認識する音声認識手段(例えば実施の形態の音声認識部1)と、前記音声認識手段により認識できなかった音声を、未認識語として前記車両の走行状況と関連付けて記憶する未認識語記憶手段(例えば実施の形態の記憶部5)と、前記未認識語について、前記車両の走行状況に基づき前記音声認識用辞書から選択した複数の同義語を、前記利用者に対して提示する関連語推定手段(例えば実施の形態の関連語推定部13)と、前記利用者が選択した前記同義語を前記未認識語に関連付ける同義語記憶手段(例えば実施の形態の音声認識部1)とを備えたことを特徴とする。
【0007】
以上の構成を備えた音声認識装置は、車両の利用者が入力した音声が認識できなかった場合、未認識語判定手段がこれを未認識語として判定する。そして、この未認識語は、車両の走行状況と関連付けて記憶される。一方、関連語推定手段は、未認識語について、車両の走行状況に基づき音声認識用辞書から選択した複数の同義語を、利用者に対して提示すると共に、同義語記憶手段が利用者が選択した同義語を未認識語に関連付けて記憶する。これにより、未認識語に対し、車両の走行状況に基づいて判定した最適な同義語を関連付けることができる。
【0008】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態について説明する。
図1は、本発明の一実施の形態の音声認識装置を示すブロック図である。
図1において、音声認識部1は、音声入力部2を介して車両の利用者3が入力した音声を、認識語彙辞書4を利用して認識する処理部である。これに対し、記憶部5は、音声認識部1が認識できなかった音声を、GPS(Global Positioning System )等を用いた位置情報検出部6から取得した車両の位置情報、時間情報検出部7から取得した時間情報、赤外線センサやカメラ等を用いた自車周辺情報検出部8から取得した自車周辺情報、ステアリングやブレーキ等に設けられたセンサ等の運転情報検出部9から取得した運転情報、カメラや生体センサ等のドライバ情報検出部10から取得した利用者3(ドライバ)の表情や心拍数等のドライバ情報、更にはナビゲーション装置11による地点登録情報と共に、入力履歴として記憶する記憶部である。
【0009】
また、同音語発話回数カウンタ12は、音声認識部1が認識できなかった同音語の発話回数を計数するカウンタであって、同音語発話回数カウンタ12による計数結果が所定回数以上に達すると、その語彙を認識対象語彙として登録するために、関連語推定部13は、認識対象語彙と同義として扱う語彙を、入力履歴と対話状態、位置情報、時間情報、自車周辺情報、運転情報、ドライバ情報、更には地点登録情報等に関連付けて選択し、1つ以上の候補として利用者3に提示する。
また、音声認識部1は、利用者3の選択した同義語を認識対象語彙に関連付けて認識語彙辞書4へ記憶する。
そして、音声認識部1は、認識できた発話内容、あるいは新たに同義語を関連付けた発話内容に従って、操作対象14を制御する。
【0010】
図2は、記憶部5に記憶された情報の一例を示す図であって、音声認識部1が認識できなかった音声情報は、入力履歴として、その時にGPS等から取得した車両の位置情報、時間情報、赤外線センサやカメラ等による自車周辺情報、ステアリングやブレーキ等のセンサで捉えた運転情報、カメラや生体センサで捉えた表情や心拍数等のドライバ情報、ナビゲーション装置11によるナビゲーション情報(地点登録情報)と共に記憶される。
【0011】
次に、本実施の形態の音声認識装置の動作について、図面を参照して説明する。図3は、本実施の形態の音声認識装置の動作を示すフローチャートであって、所定回数以上認識不可能な同音語が入力されたことを、同音語発話回数カウンタにおいて計数した後の処理を説明する。
図3において、まず音声認識装置は、音声入力部2を介して音声が入力される(ステップS1)と、音声認識部1において認識可能か否かを判定する(ステップS2)。
ステップS2において、入力された音声が認識不可能である場合(ステップS2のNO)、音声認識部1は、利用者3に、この音声を既知の単語に対応付けるか否かを選択させる(ステップS3)。
【0012】
ステップS3において、この音声を既知の単語に対応付けない場合(ステップS3のNO)、音声認識部1は音声認識装置の動作を終了する。
一方、ステップS3において、この音声を既知の単語に対応付ける場合(ステップS3のYES)、関連語推定部13は、位置情報検出部6による車両の位置情報、時間情報検出部7による時間情報、自車周辺情報検出部8による自車周辺情報、運転情報検出部9による運転情報、ドライバ情報検出部10によるドライバ情報、ナビゲーション装置11による地点登録情報を取得する(ステップS4)。
【0013】
次に、関連語推定部13は、認識対象語彙と同義として扱う語彙を、記憶部5に記憶された入力履歴と対話状態、位置情報、時間情報、自車周辺情報、運転情報、ドライバ情報、更には地点登録情報等に関連付けて選択し、1つ以上の候補として利用者3に提示する(ステップS5)。
次に、音声認識部1は、利用者3に、この同義語を認識対象語彙に関連付けるか否かを選択させる(ステップS6)。
そして、利用者3がこの同義語を認識対象語彙に関連付けることを希望しない場合(ステップS6のNO)、関連語推定部13は、この同義語が最終候補か否かを判定する(ステップS7)。
【0014】
ステップS7において、この同義語が最終候補であった場合(ステップS7のYES)、音声認識部1は音声認識装置の動作を終了する。
また、ステップS7において、この同義語が最終候補でなかった場合(ステップS7のNO)、ステップS5へ戻り、上述の動作を繰り返す。
一方、ステップS6において、利用者3がこの同義語を認識対象語彙に関連付けることを希望する場合(ステップS6のYES)、音声認識部1は、利用者3の選択した同義語を認識対象語彙に関連付けて認識語彙辞書4へ記憶する(ステップS8)。
【0015】
そして、音声認識部1は、新たに同義語を関連付けた発話内容に従って、操作対象14を制御し(ステップS9)、音声認識部1は音声認識装置の動作を終了する。
また、ステップS2において、入力された音声が認識可能である場合(ステップS2のYES)、ステップS9へ進み、音声認識部1は、認識できた発話内容に従って、操作対象14を制御し(ステップS9)、音声認識部1は音声認識装置の動作を終了する。
【0016】
なお、上述の実施の形態で説明した音声認識部1と、認識語彙辞書4と、記憶部5と、同音語発話回数カウンタ12と、関連語推定部13とを、車両と無線通信により接続される情報センタ側に設けることにより、車両側の装置の負荷を軽減するようにしても良い。
【0017】
以上説明したように、本実施の形態の音声認識装置は、車両の利用者3が入力した音声が認識できなかった場合、音声認識部1は、認識できなかった音声を未認識語として車両の走行状況及び利用者の状態情報と関連付けて記憶する。また、未認識語について、所定回数同音語が発話されている場合、車両の走行状況及び利用者3の状態情報に基づき、関連語推定部13が認識語彙辞書4から選択した複数の同義語を、利用者3に対して提示すると共に、利用者3が選択した同義語を、音声認識部1は未認識語に関連付けて記憶する。
【0018】
従って、未認識語に対し、車両の走行状況及び利用者3の状態情報に基づいて判定した最適な同義語を関連付け、車両の利用者3が入力した未認識語について、車両の走行状態や運転状態に応じて最適化された管理を行い、利用者3の意志を高い確率で認識可能な音声認識装置を実現することができるという効果が得られる。
【0019】
【発明の効果】
以上の如く、請求項1に記載の音声認識装置によれば、車両の利用者が入力した音声が認識できなかった場合、認識できなかった音声は、未認識語として車両の走行状況と関連付けて記憶される。また、未認識語について、車両の走行状況に基づき音声認識用辞書から選択した複数の同義語を、利用者に対して提示すると共に、利用者が選択した同義語を未認識語に関連付けて記憶する。これにより、未認識語に対し、車両の走行状況に基づいて判定した最適な同義語を関連付けることができる。
従って、車両の利用者が入力した未認識語について、車両の走行状況に応じて最適化された管理を行い、利用者の意志を高い確率で認識可能な音声認識装置を実現することができるという効果が得られる。
【図面の簡単な説明】
【図1】本発明の一実施の形態の音声認識装置を示すブロック図である。
【図2】同実施の形態の音声認識装置が備えている記憶部の記憶内容を示す図である。
【図3】同実施の形態の音声認識装置の動作を示すフローチャートである。
【符号の説明】
1 音声認識部(音声認識手段、同義語記憶手段)
2 音声入力部(音声入力手段)
3 利用者
4 認識語彙辞書(音声認識辞書)
5 記憶部(未認識語記憶手段)
6 位置情報検出部(車両走行状況検出手段)
7 時間情報検出部
8 自車周辺情報検出部(車両走行状況検出手段)
9 運転情報検出部(車両走行状況検出手段)
10 ドライバ情報検出部
11 ナビゲーション装置
12 同音語発話回数カウンタ
13 関連語推定部(関連語推定手段)
14 操作対象

Claims (1)

  1. 車両の利用者が入力した認識不可能な音声を、既に登録されている認識語彙と関連づける音声認識装置であって、
    前記車両の走行状況を検出する車両走行状況検出手段と、
    前記利用者の音声を入力するための音声入力手段と、
    予め前記認識語彙が記憶された音声認識辞書により、入力された前記音声を認識する音声認識手段と、
    前記音声認識手段により認識できなかった音声を、未認識語として前記車両の走行状況と関連付けて記憶する未認識語記憶手段と、
    前記未認識語について、前記車両の走行状況に基づき前記音声認識用辞書から選択した複数の同義語を、前記利用者に対して提示する関連語推定手段と、
    前記利用者が選択した前記同義語を前記未認識語に関連付ける同義語記憶手段と
    を備えたことを特徴とする音声認識装置。
JP2003020675A 2003-01-29 2003-01-29 音声認識装置 Pending JP2004233542A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003020675A JP2004233542A (ja) 2003-01-29 2003-01-29 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003020675A JP2004233542A (ja) 2003-01-29 2003-01-29 音声認識装置

Publications (1)

Publication Number Publication Date
JP2004233542A true JP2004233542A (ja) 2004-08-19

Family

ID=32950243

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003020675A Pending JP2004233542A (ja) 2003-01-29 2003-01-29 音声認識装置

Country Status (1)

Country Link
JP (1) JP2004233542A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007114226A1 (ja) 2006-03-31 2007-10-11 Pioneer Corporation 音声入力支援装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、ナビゲーション装置
EP3435255A4 (en) * 2016-03-23 2019-09-18 Clarion Co., Ltd. SERVER DEVICE, INFORMATION SYSTEM AND DEVICE MOUNTED IN A VEHICLE
WO2021085661A1 (ko) * 2019-10-29 2021-05-06 엘지전자 주식회사 지능적 음성 인식 방법 및 장치
WO2022259776A1 (ja) 2021-06-07 2022-12-15 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声認識装置、音声認識方法、及び音声認識プログラム
WO2023210340A1 (ja) * 2022-04-26 2023-11-02 ソニーグループ株式会社 学習装置および学習方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007114226A1 (ja) 2006-03-31 2007-10-11 Pioneer Corporation 音声入力支援装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、ナビゲーション装置
EP2003641A2 (en) * 2006-03-31 2008-12-17 Pioneer Corporation Voice input support device, method thereof, program thereof, recording medium containing the program, and navigation device
JPWO2007114226A1 (ja) * 2006-03-31 2009-08-13 パイオニア株式会社 音声入力支援装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、ナビゲーション装置
JP4551961B2 (ja) * 2006-03-31 2010-09-29 パイオニア株式会社 音声入力支援装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、ナビゲーション装置
EP2003641A4 (en) * 2006-03-31 2012-01-04 Pioneer Corp LANGUAGE INPUT DEVICE, APPROPRIATE METHOD, CORRESPONDING PROGRAM, RECORDING MEDIUM CONTAINING THE PROGRAM, AND NAVIGATION DEVICE
EP3435255A4 (en) * 2016-03-23 2019-09-18 Clarion Co., Ltd. SERVER DEVICE, INFORMATION SYSTEM AND DEVICE MOUNTED IN A VEHICLE
US10896676B2 (en) 2016-03-23 2021-01-19 Clarion Co., Ltd. Server system, information system, and in-vehicle apparatus
WO2021085661A1 (ko) * 2019-10-29 2021-05-06 엘지전자 주식회사 지능적 음성 인식 방법 및 장치
WO2022259776A1 (ja) 2021-06-07 2022-12-15 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声認識装置、音声認識方法、及び音声認識プログラム
WO2023210340A1 (ja) * 2022-04-26 2023-11-02 ソニーグループ株式会社 学習装置および学習方法

Similar Documents

Publication Publication Date Title
JP5158174B2 (ja) 音声認識装置
CN105222797B (zh) 利用口授和部分匹配搜索的导航系统的系统和方法
EP2747077A1 (en) Voice recognition system, recognition dictionary logging system, and audio model identifier series generation device
US9881609B2 (en) Gesture-based cues for an automatic speech recognition system
KR20150044874A (ko) 깊이 기반 콘텍스트 식별
JP2000105596A5 (ja)
JP2010217318A (ja) 同乗者検索装置および同乗者検索プログラム
JP7235441B2 (ja) 音声認識装置及び音声認識方法
JP2011179917A (ja) 情報記録装置、情報記録方法、情報記録プログラムおよび記録媒体
JP2010015027A (ja) 車両用飲酒検知装置及び車両用飲酒検知方法
CN109102801A (zh) 语音识别方法和语音识别装置
JP2006208460A (ja) 音声認識型機器制御装置および車両
JP6459330B2 (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
JP2009064186A (ja) 車両用対話システム
JP5668838B2 (ja) エレベータの呼び登録装置
JP2004233542A (ja) 音声認識装置
JP2010078354A (ja) 車載機器の操作装置及び車載機器の操作方法
WO2000010160A1 (fr) Dispositif et procede de reconnaissance vocale, dispositif de navigation, telephone portable et processeur d'informations
US11164578B2 (en) Voice recognition apparatus, voice recognition method, and non-transitory computer-readable storage medium storing program
JP7280074B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2018116206A (ja) 音声認識装置、音声認識方法及び音声認識システム
WO2006025106A1 (ja) 音声認識システム、音声認識方法およびそのプログラム
JP3296783B2 (ja) 車載用ナビゲーション装置および音声認識方法
JP2009251470A (ja) 車載情報システム
JP4281369B2 (ja) 音声認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051202

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080602

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080610

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080804

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080902