JP2005215474A - 音声認識装置、プログラム、記憶媒体及びナビゲーション装置 - Google Patents
音声認識装置、プログラム、記憶媒体及びナビゲーション装置 Download PDFInfo
- Publication number
- JP2005215474A JP2005215474A JP2004023881A JP2004023881A JP2005215474A JP 2005215474 A JP2005215474 A JP 2005215474A JP 2004023881 A JP2004023881 A JP 2004023881A JP 2004023881 A JP2004023881 A JP 2004023881A JP 2005215474 A JP2005215474 A JP 2005215474A
- Authority
- JP
- Japan
- Prior art keywords
- speaker
- voice
- single syllable
- speech recognition
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 claims abstract description 15
- 238000000034 method Methods 0.000 claims description 125
- 238000012790 confirmation Methods 0.000 claims description 56
- 230000007717 exclusion Effects 0.000 claims description 24
- 208000003028 Stuttering Diseases 0.000 claims description 15
- 230000000007 visual effect Effects 0.000 claims description 7
- 230000003252 repetitive effect Effects 0.000 claims description 2
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 8
- 238000004891 communication Methods 0.000 description 8
- 238000013500 data storage Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 230000000306 recurrent effect Effects 0.000 description 4
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 241000153470 Uenoa Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000004397 blinking Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000005674 electromagnetic induction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/09—Arrangements for giving variable traffic instructions
- G08G1/0962—Arrangements for giving variable traffic instructions having an indicator mounted inside the vehicle, e.g. giving voice messages
- G08G1/0968—Systems involving transmission of navigation instructions to the vehicle
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Navigation (AREA)
Abstract
【解決手段】 音声を入力すると(S120)、音声を分析して候補単音節を複数選択し(S125)、第1候補単音節を報知する(S135)。そして、確定SWが操作されたこと、又は更に音声が入力されたことによって処理を分岐し(S140)、確定SWが操作された場合は報知した候補単音節を確定単音節とし(S145)、さらに音声が入力された場合は再び音声を分析して候補単音節を選択する(S125)。この結果、話者は、認識が正しくなされなかった場合にスイッチ等を操作して再入力指示をすることなく、続けて再発話するだけでよい。
【選択図】 図2
Description
しかし、本当は正しい候補単音節が報知されたにもかかわらず、間違えて再発話してしまう場合も考えられる。このように間違えてしまうと、二度と正しい候補単音節が報知されなくなってしまという不都合が生じる。このような不都合が生じることを防止するためには、請求項4に記載のように、所定回数、再発話があった際には、候補単音節の除外を解除するようになっているとよい。つまり、制御手段が、前記除外について、確定処理を実行することなく繰り返し実行した報知処理のうち直前を除く所定回数以前に実行した報知処理によって報知した候補単音節は除外しないようになっているとよい。
ところでこのように単音節の代わりに確認用単語を報知する場合、話者の好みに応じた確認用単語が用いられるようになっているとよい。つまり、請求項19に記載の音声認識装置のように、記憶手段が、前記辞書を確認用単語の種別によって分けて複数記憶し、制御手段は、受付手段が受け付けた話者の操作に基づいて記憶手段が記憶する辞書を選択し、その選択された辞書を用いて報知処理を実行するようになっているとよい。
また、確認用単語は、請求項20に記載のように、予め話者が受付手段を操作することにより登録できるようになっているとよい。このようになっていれば、更に話者の好みが反映された確認用単語を報知することができる。
ところで、請求項23に記載のような、請求項1〜請求項5,請求項12〜請求項16,請求項18〜請求項22の何れかに記載の音声認識装置における音声認識手段及び制御手段の少なくとも一方として機能させるプログラムを、音声認識装置が内蔵するコンピュータに実行させるようになっていてもよい。このようになっていれば、例えば、フレキシブルディスク、光磁気ディスク、CD−ROM、ハードディスク、ROM、RAM等のコンピュータが読みとり可能な記録媒体にプログラムを記録し、そのプログラムを必要に応じてコンピュータにロードして起動することにより音声認識装置における音声認識手段及び制御手段の少なくとも一方として機能させることができる。また、プログラムはネットワーク等を用いて流通させることも可能であるため、音声認識装置の機能向上も容易である。
図1は、音声認識機能を有するナビゲーション装置20の構成を示すブロック図である。ナビゲーション装置20は車両に搭載され、車両の現在位置を検出する位置検出器21と、ユーザーからの各種指示を入力するための操作スイッチ群22と、操作スイッチ群22と同様に各種指示を入力可能であってナビゲーション装置20とは別体となったリモートコントロール端末(以下、リモコンと称す)23aと、リモコン23aからの信号を入力するリモコンセンサ23bと、地図データや各種の情報を記録した地図記憶媒体から地図データ等を入力する地図データ入力器25と、地図や各種情報の表示を行うための表示部26と、各種のガイド音声等を出力するための音声出力部27と、音声を入力して音声情報を出力するマイクロフォン28と、音声認識関連データを入出力する音声認識関連データ入出力器30と、車内LANと通信を行う車内LAN通信部31と、上述した位置検出器21,操作スイッチ群22,リモコンセンサ23b,地図データ入力器25,マイクロフォン28,音声認識関連データ入出力器30,車内LAN通信部31からの入力に応じて各種処理を実行し、表示部26,音声出力部27,音声認識関連データ入出力器30,車内LAN通信部31を制御する制御部29とを備えている。
マイクロフォン28は、利用者が音声を入力(発話)するとその入力した音声に基づく電気信号(音声信号)を制御部29に出力するものである。利用者はこのマイクロフォン28に様々な音声を入力することにより、ナビゲーション装置20を操作することができる。
続くS120では、マイクロフォン28を介して利用者の音声を入力する。
続いて、操作スイッチ群22又はリモコン23aに設けられた確定SW(上述したトークSWと共用するようになっていても良い)が利用者によって押下されたか否か、又は利用者によって更に音声が入力されたかによって否かによって処理を分岐する(S140)。確定SWが利用者によって押下された場合はS145に進み、確定SWが利用者に操作されることなく、利用者によって更に音声が入力された場合はS150に進む。
本願発明者らは次のような実験を行った。その実験は、停止した車室内において20代から60代までの各代の男女各2名(つまり計20名)が、1人ずつ10回繰り返し発話することを3度行う実験である。そしてその実験結果に基づいて、話者による入力回数を横軸とし、その入力回数までに正しい単音節が認識された確率を縦軸に示したグラフが図9に示すものである。このグラフからわかるように、3回目以降は、ほぼ認識率が一定になり(3回目は認識率96%、4回目は認識率98%、5回目は認識率98%)、それ以降はほとんど変化がない。つまり、4回以上発話回数を重ねてもそれ以降に正しい候補単音節が報知されるということはほとんどない。つまり、ほとんどの場合、再発話回数3回時点までに正しい単音節が一度は報知されていることを意味し、再発話回数が3回になった場合には、話者が正しい候補単音節を誤って除外してしまった可能性が高いことを意味する。したがって、再発話回数が3回になった時には、一番はじめに認識されたものを再び認識候補として報知可能にするとよい。
次に、第2実施例について説明する。第2実施例の音声認識機能を有するナビゲーション装置は、上述した第1実施例のナビゲーション装置20と同様の構成を有するため、相違点についてのみ説明する。主な相違点は、制御部29で実行される音声認識処理にある。以下、制御部29で実行される音声認識処理2について図3のフローチャートを用いて説明する。
制御部29は実行を開始すると、まず、操作スイッチ群22又はリモコン23aに設けられたトークSWが利用者によって押下されたか否かによって処理を分岐する(S210)。トークSWが利用者によって押下された場合は次の処理ステップに進み、そうでなければ本ステップにとどまる。
続くS220では、マイクロフォン28を介して利用者の音声を入力する。
そしてS245では、S240で報知した候補単音節を除外バッファに入れる。この際、除外バッファの中に既に候補単音節が3つある場合は、最も過去に除外バッファに入れた候補単音節を消去し、新たにS240で報知した候補単音節を除外バッファに入れる。そして、上述したS220に処理を戻す。
次に、第3実施例について説明する。第3実施例の音声認識機能を有するナビゲーション装置は、上述した第1実施例のナビゲーション装置20と同様の構成を有するため、相違点についてのみ説明する。主な相違点は、制御部29で実行される音声認識処理にある。以下、制御部29で実行される音声認識処理3について図4のフローチャートを用いて説明する。
続くS320では、マイクロフォン28を介して利用者の音声を入力する。
[第4実施例]
次に、第4実施例について説明する。第4実施例の音声認識機能を有するナビゲーション装置は、上述した第1実施例のナビゲーション装置20と同様の構成を有するため、相違点についてのみ説明する。主な相違点は、制御部29で実行される音声認識処理にある。以下、制御部29で実行される音声認識処理4について図5のフローチャートを用いて説明する。
続くS420では、マイクロフォン28を介して利用者の音声を入力する。
S455では、特定できた確認用単語に対応する候補単音節を確定単音節として、既に確定済みの確定単音節群の最後に加える。
(1)上記実施例では、利用者は基本的に音声入力を単音節で行うようになっていたが、単音節に対応づけられた複数音節からなる単音節認識用特定語によって入力するようになっていてもよい。その場合、ナビゲーション装置20は、音声認識関連データ入出力器30を介して入力した音声認識関連データに基づいて、入力された単音節認識用特定語に対応する単音節を特定するようになっていればよい。そして、予め、様々なジャンル等によって分けられた単音節認識用特定語の辞書を音声認識関連データ記憶媒体に記憶させておき、利用者がその辞書を選択できるようになっていれば、利用者の好みによって辞書を選択できるため利用者は単音節認識用特定語を早く記憶して使いこなせるようになる。なお、この単音節認識用特定語は、利用者が登録できるようになっていると、さらに利用者は単音節認識用特定語を早く記憶して使いこなせるようになる。
Claims (27)
- 話者によって入力された音声に基づいて、話者の意図する単音節を決定する音声認識装置であって、
話者の発声した音声を入力する音声入力手段と、
前記入力手段が入力した音声を分析して候補単音節を特定する音声認識手段と、
指定された情報を報知する報知手段と、
話者の操作を受け付ける受付手段と、
前記音声認識手段が特定した候補単音節の中で最も尤度が高い候補単音節を前記報知手段に報知させる報知処理を実行し、話者より決定を意味する操作を前記受付手段が受け付けた場合は直前の前記報知処理の際に報知させた前記候補単音節を話者の意図する単音節として確定する確定処理を実行し、話者から新たな音声が前記音声入力手段に入力されて前記音声認識手段が候補単音節を特定した場合は前記報知処理の実行に戻りその候補単音節の中で最も尤度が高い候補単音節を前記報知手段に報知させる制御手段と、
を備えることを特徴とする音声認識装置。 - 話者によって入力された音声に基づいて、話者の意図する単音節を決定する音声認識装置であって、
話者の発声した音声を入力する音声入力手段と、
前記入力手段が入力した音声を分析して候補単音節を特定すると共に確定を意味する確定語を認識する音声認識手段と、
指定された情報を報知する報知手段と、
前記音声認識手段が特定した候補単音節の中で最も尤度が高い候補単音節を前記報知手段に報知させる報知処理を実行し、話者から新たな音声が前記音声入力手段に入力されて前記音声認識手段が前記確定語を認識した場合は直前の前記報知処理の際に報知させた前記候補単音節を話者の意図する単音節として確定する確定処理を実行し、話者から新たな音声が前記音声入力手段に入力されて前記音声認識手段が候補単音節を特定した場合は前記報知処理の実行に戻りその候補単音節の中で最も尤度が高い候補単音節を前記報知手段に報知させる制御手段と、
を備えることを特徴とする音声認識装置。 - 請求項1又は請求項2に記載の音声認識装置において、
前記制御手段は、前記確定処理を実行することなく前記報知処理を連続して2回以上実行する場合、前記報知処理によって過去に報知した前記候補単音節を報知する候補単音節から除外して最も尤度の高い前記候補単音節を報知することを特徴とする音声認識装置。 - 請求項3に記載の音声認識装置において、
前記制御手段は、前記除外について、前記確定処理を実行することなく繰り返し実行した前記報知処理のうち直前を除く所定回数以前に実行した前記報知処理によって報知した候補単音節は除外しないことを特徴とする音声認識装置。 - 請求項3に記載の音声認識装置において、
前記制御手段は、前記除外について、前記確定処理を実行することなく繰り返し実行した前記報知処理のうち過去3回以前に実行した前記報知処理によって報知した候補単音節は除外しないことを特徴とする音声認識装置。 - 請求項4に記載の音声認識装置において、
更に、話者の操作を受け付ける受付手段を備えていなければ備え、
前記制御手段は、前記受付手段が受け付けた話者の操作に基づいて前記所定回数を変更することを特徴とする音声認識装置。 - 話者によって入力された音声に基づいて、話者の意図する単音節を決定する音声認識装置であって、
話者の発声した音声を入力する音声入力手段と、
話者の操作を受け付ける受付手段と、
単音節毎に対応づけられた複数音節からなる単音節認識用特定語によって構成される辞書を、その単音節認識用特定語の種別によって分けて複数記憶する記憶手段と、
前記受付手段が受け付けた話者の操作に基づいて前記記憶手段が記憶する前記辞書を選択し、その選択した辞書の中から前記音声入力手段が入力した音声に対応する単音節認識用特定語を選択し、その選択した前記単音節認識用特定語に対応する単音節を話者の意図する単音節として決定する音声認識手段と、
を備えることを特徴とする音声認識装置。 - 請求項7に記載の音声認識装置において、
前記記憶手段が記憶する前記辞書の前記単音節認識用特定語は、予め話者が前記受付手段を操作することにより登録できることを特徴とする音声認識装置。 - 話者によって入力された音声に基づいて、話者の意図する単音節を決定する音声認識装置であって、
話者の発声した音声を入力する音声入力手段と、
前記音声入力手段が入力した同一単音節からなる繰り返し音声を単音節毎の音声に分け、その各音声に基づいて話者の意図する単音節を決定する音声認識手段と、
を備えることを特徴とする音声認識装置。 - 話者によって入力された音声に基づいて、話者の意図する単音節を決定する音声認識装置であって、
話者の発声した音声を入力する音声入力手段と、
前記音声入力手段が入力した単音節の音声が濁音、拗音、促音又は半濁音の何れかであった場合は、その濁音、拗音、促音又は半濁音に対応する清音を話者の意図する単音節として決定し、前記音声入力手段が入力した音声が予め定められた濁音を意味する特定語であった場合は、直前に決定した単音節を対応する濁音の単音節に変更し、前記音声入力手段が入力した音声が予め定められた拗音を意味する特定語であった場合は、直前に決定した単音節を対応する拗音の単音節に変更し、前記音声入力手段が入力した音声が予め定められた促音を意味する特定語であった場合は、直前に決定した単音節を対応する促音の単音節に変更し、前記音声入力手段が入力した音声が予め定められた半濁音を意味する特定語であった場合は、直前に決定した単音節を対応する半濁音の単音節に変更する音声認識手段と、
を備えることを特徴とする音声認識装置。 - 話者によって入力された音声に基づいて、話者の意図する単音節を決定する音声認識装置であって、
話者の発声した音声を入力する音声入力手段と、
複数音節からなる単音節認識用特定語の組み合わせに対して単音節が対応づけられた辞書を記憶する記憶手段と、
前記音声入力手段が入力した音声を分析して前記単音節認識用特定語の組み合わせを特定し、特定した組み合わせに対応する単音節を記憶手段が記憶する辞書に基づいて決定する音声認識手段と、
を備えることを特徴とする音声認識装置。 - 話者によって入力された音声に基づいて、話者の意図する単音節を決定する音声認識装置であって、
話者の発声した音声を入力する音声入力手段と、
前記音声入力手段が入力した音声を分析して候補単音節を特定する音声認識手段と、
指定された情報を表示する表示領域を有すると共に、前記表示領域の表面に対する話者の操作を前記表示領域内の位置と共に感知するセンサを有する表示手段と、
前記音声認識手段が複数の候補単音節を特定した場合それらの候補単音節に対応する各オブジェクトを前記表示手段の前記表示領域に表示領域内で最も大きなオブジェクト群として並べて表示させ、話者に操作されて前記センサが感知した位置に表示されている前記オブジェクトに対応する前記候補単音節を、話者の意図する単音節として決定する制御手段と、
を備えることを特徴とする音声認識装置。 - 請求項12に記載の音声認識装置において、
前記制御手段は、前記表示手段に表示させる前記各オブジェクトを、そのオブジェクトに対応する候補単音節の尤度にしたがって高い順に3つだけ選択して前記表示手段に表示させることを特徴とする音声認識装置。 - 請求項12又は請求項13に記載の音声認識装置において、
前記制御手段は、前記表示手段に表示させる前記各オブジェクトを、そのオブジェクトに対応する候補単音節の尤度にしたがって視覚的特徴を変えて前記表示手段に表示させることを特徴とする音声認識装置。 - 請求項12〜請求項14の何れかに記載の音声認識装置において、
前記制御手段は、前記決定の際、前記表示手段の前記表示領域における前記各オブジェクトの占める表示範囲よりも、前記センサが感知した位置によって前記各オブジェクトを特定する特定範囲の方を広く扱うことを特徴とする音声認識装置。 - 話者によって入力された音声に基づいて、話者の意図する単音節を決定する音声認識装置であって、
話者の発声した音声を入力する音声入力手段と、
前記音声入力手段が入力した音声を分析して候補単音節を特定する音声認識手段と、
指定された情報を表示する表示領域を有すると共に、前記表示領域の表面に対する話者の操作を前記表示領域内の位置と共に感知するセンサを有する表示手段と、
前記表示手段の前記表示領域に50音表に対応させて単音節を示すオブジェクトを表示させると共に、前記音声認識手段が複数の前記候補単音節を特定した場合それらの各候補単音節に対応する前記表示領域中の前記オブジェクトの視覚的特徴を他のオブジェクトとは変えて表示させ、その視覚的特徴を変えたオブジェクトに限らず話者に操作されて前記センサが感知した位置に表示させた前記オブジェクトの示す前記候補単音節を、話者の意図する単音節として決定する制御手段と、
を備えることを特徴とする音声認識装置。 - 話者によって入力された音声に基づいて、話者の意図する単音節を決定する車両に搭載された音声認識装置であって、
話者の発声した音声を入力する音声入力手段と、
前記音声入力手段が入力した音声を分析して候補単音節を特定する音声認識手段と、
指定された情報を表示する表示領域を有すると共に、前記表示領域の表面に対する話者の操作を前記表示領域内の位置と共に感知するセンサを有する表示手段と、
前記車両が走行中であるか否かの情報を取得する車両状態取得手段と、
請求項12〜請求項15の何れかに記載の音声認識装置の前記制御手段と、
請求項16に記載の音声認識装置の前記制御手段と、
前記車両状態取得手段が取得する前記情報に基づき、前記車両が走行中であると判断した場合は、請求項12〜請求項15の何れかに記載の音声認識装置の前記制御手段を機能させ、前記車両が停止中であると判断した場合は、請求項16に記載の音声認識装置の前記制御手段を機能させる主制御手段と、
を備えることを特徴とする音声認識装置。 - 話者によって入力された音声に基づいて、話者の意図する単音節を決定する音声認識装置であって、
話者の発声した音声を入力する音声入力手段と、
前記音声入力手段が入力した音声を分析して候補単音節を特定する音声認識手段と、
指定された情報を報知する報知手段と、
話者の操作を受け付ける受付手段と、
単音節毎に対応づけられた複数音節からなる確認用単語によって構成される辞書を記憶する記憶手段と、
前記音声認識手段が特定した候補単音節の中で最も尤度が高い候補単音節を、前記記憶手段が記憶する前記確認用単語によって前記報知手段に報知させる報知処理を実行し、話者より決定を意味する操作を前記受付手段が受け付けた場合は前記報知処理の際に報知させた前記候補単音節を話者の意図する単音節として確定する制御手段と、
を備えることを特徴とする音声認識装置。 - 請求項18に記載の音声認識装置において、
前記記憶手段は、前記辞書を前記確認用単語の種別によって分けて複数記憶し、
前記制御手段は、前記受付手段が受け付けた話者の操作に基づいて前記記憶手段が記憶する前記辞書を選択し、その選択された辞書を用いて前記報知処理を実行することを特徴とする音声認識装置。 - 請求項18又は請求項19に記載の音声認識装置において、
前記記憶手段が記憶する前記辞書の前記確認用単語は、予め話者が前記受付手段を操作することにより登録できることを特徴とする音声認識装置。 - 請求項18〜請求項20の何れかに記載の音声認識装置において、
更に、指定された情報を表示する表示領域を有すると共に、前記表示領域の表面に対する話者の操作を前記表示領域内の位置と共に感知するセンサを有する表示手段を備え、
前記制御手段は、前記音声認識手段が複数の候補単音節を特定した場合それらの候補単音節に対応する前記確認用単語を前記表示手段にオブジェクトとして並べて表示させ、話者に操作されて前記センサが感知した位置に表示されている前記オブジェクトに対応する前記候補単音節を、話者の意図する単音節として決定する制御手段と、
を備えることを特徴とする音声認識装置。 - 請求項21に記載の音声認識装置において、
前記制御手段は、前記音声認識手段が複数の候補単音節を特定した場合それらの候補単音節に対応する前記確認用単語を前記表示手段にオブジェクトとして並べて表示させた後、前記音声認識手段が特定した前記確認用単語に対応する前記候補単音節を、話者の意図する単音節として決定することを特徴とする音声認識装置 - コンピュータを、請求項1〜請求項5,請求項12〜請求項16,請求項18〜請求項22の何れかに記載の音声認識装置における音声認識手段又は制御手段の少なくとも一方として機能させるためのプログラム。
- コンピュータを、請求項6〜請求項11の何れかに記載の音声認識装置における音声認識手段として機能させるためのプログラム。
- コンピュータを、請求項17に記載の音声認識装置における主制御手段として機能させるためのプログラム。
- 請求項23〜請求項25の何れかに記載のプログラムを記憶する記憶媒体。
- 所定のナビゲーション処理を実行するナビゲーション装置であって、
請求項1〜請求項22の何れかに記載の音声認識装置を備え、その音声認識装置によって得られた話者の意図する単音節群を前記ナビゲーション処理に用いることを特徴とするナビゲーション装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004023881A JP4453377B2 (ja) | 2004-01-30 | 2004-01-30 | 音声認識装置、プログラム及びナビゲーション装置 |
KR1020040110491A KR100677711B1 (ko) | 2004-01-30 | 2004-12-22 | 음성 인식 장치, 기억 매체 및 네비게이션 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004023881A JP4453377B2 (ja) | 2004-01-30 | 2004-01-30 | 音声認識装置、プログラム及びナビゲーション装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005215474A true JP2005215474A (ja) | 2005-08-11 |
JP4453377B2 JP4453377B2 (ja) | 2010-04-21 |
Family
ID=34906753
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004023881A Expired - Fee Related JP4453377B2 (ja) | 2004-01-30 | 2004-01-30 | 音声認識装置、プログラム及びナビゲーション装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4453377B2 (ja) |
KR (1) | KR100677711B1 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007019477A1 (en) * | 2005-08-05 | 2007-02-15 | Microsoft Corporation | Redictation of misrecognized words using a list of alternatives |
JP2008234154A (ja) * | 2007-03-19 | 2008-10-02 | Nec Corp | 入力文字候補を音声により変換する機能を備える情報処理装置及びその文字入力プログラム |
US7881940B2 (en) | 2006-08-10 | 2011-02-01 | Denso Corporation | Control system |
JP2013045282A (ja) * | 2011-08-24 | 2013-03-04 | Kyushu Institute Of Technology | コミュニケーション支援システム |
CN109903770A (zh) * | 2017-12-07 | 2019-06-18 | 现代自动车株式会社 | 用于校正用户的话语错误的装置及其方法 |
US20210357588A1 (en) * | 2020-05-15 | 2021-11-18 | Robert Bosch Gmbh | Device and method for determining at least one part of a knowledge graph |
-
2004
- 2004-01-30 JP JP2004023881A patent/JP4453377B2/ja not_active Expired - Fee Related
- 2004-12-22 KR KR1020040110491A patent/KR100677711B1/ko not_active IP Right Cessation
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007019477A1 (en) * | 2005-08-05 | 2007-02-15 | Microsoft Corporation | Redictation of misrecognized words using a list of alternatives |
US7881940B2 (en) | 2006-08-10 | 2011-02-01 | Denso Corporation | Control system |
JP2008234154A (ja) * | 2007-03-19 | 2008-10-02 | Nec Corp | 入力文字候補を音声により変換する機能を備える情報処理装置及びその文字入力プログラム |
JP2013045282A (ja) * | 2011-08-24 | 2013-03-04 | Kyushu Institute Of Technology | コミュニケーション支援システム |
CN109903770A (zh) * | 2017-12-07 | 2019-06-18 | 现代自动车株式会社 | 用于校正用户的话语错误的装置及其方法 |
US20210357588A1 (en) * | 2020-05-15 | 2021-11-18 | Robert Bosch Gmbh | Device and method for determining at least one part of a knowledge graph |
US11947910B2 (en) * | 2020-05-15 | 2024-04-02 | Robert Bosch Gmbh | Device and method for determining at least one part of a knowledge graph |
Also Published As
Publication number | Publication date |
---|---|
KR100677711B1 (ko) | 2007-02-02 |
JP4453377B2 (ja) | 2010-04-21 |
KR20050078195A (ko) | 2005-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7822613B2 (en) | Vehicle-mounted control apparatus and program that causes computer to execute method of providing guidance on the operation of the vehicle-mounted control apparatus | |
JP4736982B2 (ja) | 作動制御装置、プログラム | |
JP5673330B2 (ja) | 音声入力装置 | |
US7835901B2 (en) | Speech recognition apparatus and navigation system | |
JP2008282224A (ja) | 車載情報検索装置 | |
JP2008196998A (ja) | ナビゲーション装置 | |
JP2006195576A (ja) | 車載音声認識装置 | |
JP2010039099A (ja) | 音声認識および車載装置 | |
JP5217838B2 (ja) | 車載機器の操作装置及び車載機器の操作方法 | |
JP4914632B2 (ja) | ナビゲーション装置 | |
JP4453377B2 (ja) | 音声認識装置、プログラム及びナビゲーション装置 | |
JP5218459B2 (ja) | 車両用情報端末及びプログラム | |
JP4770374B2 (ja) | 音声認識装置 | |
JP2000338993A (ja) | 音声認識装置、その装置を用いたナビゲーションシステム | |
JP2003323192A (ja) | 単語辞書登録装置および単語辞書登録方法 | |
JP5455355B2 (ja) | 音声認識装置及びプログラム | |
JP2008164809A (ja) | 音声認識装置 | |
JP4942406B2 (ja) | ナビゲーション装置及びその音声出力方法 | |
JP2011232668A (ja) | 音声認識機能を備えたナビゲーション装置およびその検出結果提示方法 | |
JP3700533B2 (ja) | 音声認識装置及び処理システム | |
JP2007057805A (ja) | 車両用情報処理装置 | |
JP2006039954A (ja) | データベース検索装置、プログラム及びナビゲーション装置 | |
JP2007025076A (ja) | 車載用音声認識装置 | |
JP2002062893A (ja) | 車載ナビゲーション装置 | |
JP2000020086A (ja) | 音声認識装置、その装置を用いたナビゲーションシステム及び自動販売システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060323 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090303 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090317 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090428 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100112 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100125 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130212 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130212 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140212 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |