JP2003015689A - 音声操作装置 - Google Patents

音声操作装置

Info

Publication number
JP2003015689A
JP2003015689A JP2001197398A JP2001197398A JP2003015689A JP 2003015689 A JP2003015689 A JP 2003015689A JP 2001197398 A JP2001197398 A JP 2001197398A JP 2001197398 A JP2001197398 A JP 2001197398A JP 2003015689 A JP2003015689 A JP 2003015689A
Authority
JP
Japan
Prior art keywords
data
voice
character string
stored
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001197398A
Other languages
English (en)
Inventor
Yoshio Nakajima
芳夫 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Electric Industries Ltd
Original Assignee
Sumitomo Electric Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Electric Industries Ltd filed Critical Sumitomo Electric Industries Ltd
Priority to JP2001197398A priority Critical patent/JP2003015689A/ja
Publication of JP2003015689A publication Critical patent/JP2003015689A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 複数の単語からなる一連の文章における個々
の単語毎に登録,認識が可能であり、認識結果に基づい
て一連の文章が示すコマンドを発行することができる音
声操作装置の提供。 【解決手段】 入力される音声信号に基づく音声データ
と比較するための音声データ、及び該音声データに対応
する文字列が関連付けられて記憶される辞書テーブル1
5と、車両に搭載された種々の装置を操作するためのコ
マンド、及び複数の文字列が組み合わされて前記コマン
ドを示す複文字列データが関連付けられて記憶されてい
るコマンドテーブル16とを備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、外部装置として例
えば、車両に搭載されているステレオ装置,空調装置等
を、音声に基づいて操作するための音声操作装置に関す
るものである。
【0002】
【従来の技術】従来、車両の搭乗者が、車両に搭載され
た周辺装置、例えばステレオ装置,空調装置等を操作す
る場合、これらの装置が具備するスイッチ類,操作パネ
ル等を手操作により行うのは煩瑣である。
【0003】この問題を解決すべく、車両の搭乗者が発
した音声に基づいて周辺装置を操作するための装置が、
特開2001−5492により提案されている。該装置
は、入力された音声が、登録語記憶手段に予め登録され
ている登録語又は追加登録された登録語に一致する場合
に、コマンド発行手段に記憶され前記登録語に対応する
コマンドを、周辺装置に対して発行するものである。
【0004】
【発明が解決しようとする課題】ところで、提案されて
いる前記装置による場合、登録語及びコマンドが一対一
に対応している。例えば、冷房を起動させるコマンドに
は「空調,冷房,オン」という一連の登録語が対応し、
冷房を停止させるコマンドには「空調,冷房,オフ」と
いう一連の登録語が対応している。
【0005】従って、一連の登録語における個々の単語
毎に認識し、認識結果に基づいて一連の登録語に対応す
るコマンドを発行する手段を備えていないため、登録語
記憶手段には重複する単語が多数記憶されることにな
り、無駄が多く発生する。
【0006】本発明は、上述したような事情に鑑みてな
されたものであり、本発明に係る音声操作装置は、音声
データ(例えば、音声「空調」をスペクトル分析してコ
ード化したデータ)、及び文字列データ(例えば、文字
列「くうちょう」)が関連付けられて記憶されている辞
書テーブルと、複数の文字列データ(例えば、文字列
「くうちょう」,「れいぼう」,「おん」)により構成
されて周辺装置への指示内容を示す複文字列データ(例
えば、「くうちょう,れいぼう,おん」)及び前記指示
内容に応じて指示するための指示データが関連付けられ
て記憶されている指示テーブルとを備え、車両の搭乗者
等により発せられ、複数の文字列を意味する音声に対応
する文字列データが夫々辞書テーブルに記憶されている
場合であり、夫々の文字列データから構成される複文字
列データが指示テーブルに記憶されている場合に、前記
複文字列データに関連付けて記憶されている指示データ
に基づいて周辺装置へ指示する。
【0007】上述した構成となすことにより、搭乗者等
が発する音声に対応する文字列データの組合せに関連付
けられた指示データに基づき、周辺装置に指示すること
ができ、例えば冷房を起動又は停止させる指示データに
対し、辞書テーブルは「くうちょう」,「れいぼう」,
「おん」,「おふ」を記憶するだけで済み、文字列が重
複して記憶されることがなく、無駄がない音声操作装置
を提供することを目的とする。
【0008】また、辞書テーブルに音声データ及び文字
列データを関連付けて記録する手段と、指示テーブルに
複文字列データ及び指示データを関連付けて記録する手
段とを更に備えている。
【0009】上述した構成となすことにより、予め記憶
されているデータの他に追加して記憶させることがで
き、ユーザである搭乗者等の用途及びユーザに固有の言
い回し等に応じて、周辺装置を適切に操作することがで
きる音声操作装置を提供することを目的とする。
【0010】また、本発明に係る音声操作装置は、音声
データ及び文字列データが関連付けて記憶されている辞
書テーブルと、指示内容を特定する各要素に対応する文
字列データを階層的に分類した各階層毎の文字列階層デ
ータ、及び該文字列階層データが示す特定された指示内
容に応じて指示するための指示要素データを関連付けて
記憶する複数の階層テーブルとを備え、搭乗者等により
発せられ、複数の文字列を意味する音声に対応する文字
列データが夫々辞書テーブルに記憶されている場合であ
り、夫々の文字列データに対応する文字列階層データ
が、前記複数の階層テーブルにて階層的に記憶されてい
る場合に、前記文字列階層データの夫々に関連付けられ
ている指示要素データに基づいて周辺装置へ指示する。
【0011】上述した構成となすことにより、搭乗者等
が発する音声を構成する各要素に対応し、各階層テーブ
ルに記憶されている文字列階層データに関連付けられた
指示要素データに基づき、周辺装置に指示することがで
き、辞書テーブルに文字列が重複して記憶されることが
ない。また、搭乗者が発する音声を構成する第2音声デ
ータに基づき、各階層テーブル毎に文字列階層データの
存在の有無を判別でき、搭乗者等が発した音声に対応す
る文字列階層データに関連付けられた指示要素データが
存在するか否かの判別を高速に行うことができる音声操
作装置を提供することを目的とする。
【0012】また、辞書テーブルに音声データ及び文字
列データを関連付けて記録する手段と、階層テーブルに
文字列階層データ及び指示要素データを関連付けて記録
する手段とを更に備えている。
【0013】上述した構成となすことにより、文字列階
層データが複数の階層テーブルにおいて階層的に記憶さ
れている場合であっても、予め記憶されているデータの
他に追加して記憶させることができ、ユーザである搭乗
者等の用途及びユーザ固有の言い回し等に応じて、周辺
装置を適切に操作することができる音声操作装置を提供
することを目的とする。
【0014】
【課題を解決するための手段】第1発明に係る音声操作
装置は、入力された音声に基づいて外部装置を操作する
ための音声操作装置において、第1音声データ及び文字
列データが関連付けられて記憶されている辞書テーブル
と、複数の文字列データにより構成されて前記外部装置
への指示内容を示す第1複文字列データ、及び前記指示
内容に応じて前記外部装置へ指示するための指示データ
が関連付けられて記憶されている指示テーブルとを備
え、複数の第2音声データにより構成される複音声デー
タを受け付ける手段と、前記第2音声データの夫々に対
応する第1音声データが前記辞書テーブルに記憶されて
いるか否かを判別する手段と、記憶されていると判別し
た場合に、前記第1音声データの夫々に関連付けられて
いる文字列データにより構成される第2複文字列データ
に対応する第1複文字列データが、前記指示テーブルに
記憶されているか否かを判別する手段と、記憶されてい
ると判別した場合に、前記第1複文字列データに関連付
けられて記憶されている指示データに基づいて前記外部
装置へ指示する手段とを備えることを特徴とする。
【0015】第1発明に係る音声操作装置による場合
は、ユーザである搭乗者等が発する音声である複音声デ
ータを受け付け、該複音声データを構成する第2音声デ
ータに対応する第1音声データが辞書テーブルに記憶さ
れている場合であり、前記第1音声データに関連付けら
れている文字列データにより構成される第2複文字列デ
ータに対応する第1複文字列データが指示テーブルに記
憶されている場合に、前記第1複文字列データに関連付
けられている指示データに基づいて外部装置へ指示する
ことにより、例えば冷房を起動又は停止させる指示デー
タに対し、辞書テーブルは「くうちょう」,「れいぼ
う」,「おん」,「おふ」に対応する第1音声データ及
び文字列データを関連付けて記憶するだけで済み、同一
の文字列データが重複して記憶されることがなく、無駄
がない音声操作装置を実現することができる。
【0016】第2発明に係る音声操作装置は、第1発明
に係る音声操作装置において、前記辞書テーブルに第1
音声データ及び文字列データを関連付けて記録する手段
と、前記指示テーブルに第1複文字列データ及び指示デ
ータを関連付けて記録する手段とを更に備えることを特
徴とする。
【0017】第2発明に係る音声操作装置は、辞書テー
ブルに第1音声データ及び文字列データを関連付けて記
憶する手段と、指示テーブルに第1複文字列データ及び
指示データを関連付けて記憶する手段とを更に備えるこ
とにより、予め記憶されているデータ及びコマンドの他
に追加して記憶させることができ、ユーザである搭乗者
等の用途及びユーザに固有の言い回し等に応じて、周辺
装置を適切に操作することができる音声操作装置を実現
することができる。
【0018】第3発明に係る音声操作装置は、入力され
た音声に基づいて外部装置を操作するための音声操作装
置において、第1音声データ及び文字列データが関連付
けられて記憶されている辞書テーブルと、組み合わせる
ことにより前記外部装置への指示内容を示し、該指示内
容を特定する複数の要素の夫々に対応する複数の文字列
データを階層的に分類した各階層毎の文字列階層デー
タ、及び該文字列階層データが示す前記要素に応じて前
記外部装置へ指示するための指示要素データを関連付け
て記憶する複数の階層テーブルとを備え、複数の第2音
声データにより構成される複音声データを受け付ける手
段と、前記第2音声データの夫々に対応する第1音声デ
ータが前記辞書テーブルに記憶されているか否かを判別
する手段と、記憶していると判別した場合に、前記第1
音声データの夫々に関連付けられている文字列データに
対応する文字列階層データが、夫々前記複数の階層テー
ブルにて階層的に記憶されているか否かを判別する手段
と、階層的に記憶されていると判別した場合に、前記文
字列階層データの夫々に関連付けられている指示要素デ
ータに基づいて前記外部装置へ指示する手段とを備える
ことを特徴とする。
【0019】第3発明に係る音声操作装置は、ユーザで
ある搭乗者等が発する音声である複音声データを受け付
け、該複音声データを構成する第2音声データに対応す
る第1音声データが辞書テーブルに記憶されている場合
であり、前記第1音声データの夫々に関連付けられてい
る文字列データに対応する文字列階層データが、複数の
階層テーブルにて階層的に記憶されている場合に、前記
文字列階層データに関連付けられている指示要素データ
に基づいて外部装置へ指示することにより、辞書テーブ
ルに文字列が重複して記憶されることがない。また、搭
乗者が発する音声を構成する第2音声データに基づき、
各階層テーブル毎に文字列階層データの存在の有無を判
別でき、搭乗者等が発した音声に対応する文字列階層デ
ータに関連付けられた指示要素データが存在するか否か
の判別を高速に行うことができる音声操作装置を実現す
ることができる。
【0020】第4発明に係る音声操作装置は、第3発明
に係る音声操作装置において、前記辞書テーブルに第1
音声データ及び文字列データを関連付けて記録する手段
と、前記階層テーブルに文字列階層データ及び指示要素
データを関連付けて記録する手段とを更に備えることを
特徴とする。
【0021】第4発明に係る音声操作装置は、辞書テー
ブルに第1音声データ及び文字列データを関連付けて記
憶する手段と、階層テーブルに文字列階層データ及び指
示要素データを関連付けて記憶する手段と更に備えるこ
とにより、文字列階層データが複数の階層テーブルにお
いて階層的に記憶されている場合であっても、ユーザで
ある搭乗者等の使用範囲,使用目的、及びユーザ固有の
言い回し等に応じて、周辺装置を適切に操作することが
できる音声操作装置を実現することができる。
【0022】
【発明の実施の形態】以下、本発明をその実施の形態を
示す図面に基づいて詳述する。 (実施の形態1)図1は、本発明に係る音声操作装置の
実施の形態を示すブロック図である。図中1は本発明に
係る音声操作装置であり、マイク21及びスピーカ22
に接続されている。音声操作装置1は音声入出力コンバ
ータ11を備え、マイク21から入力されるアナログの
音声信号をA/D変換し、また、ディジタルの音声信号
をD/A変換してスピーカ22へ出力する。
【0023】音声入出力コンバータ11は音声認識手段
12に接続しており、音声入出力コンバータ11にてデ
ィジタル変換された音声信号が、音声認識手段12へ入
力される。音声認識手段12は、入力された音声信号を
スペクトル分析してコード化された音声データに変換
し、該音声データに対応する音声データが、辞書テーブ
ル15に記憶されているか否かを判別することにより音
声認識を行う。
【0024】図2は辞書テーブル15の構成を示す模式
図である。辞書テーブル15は、入力された音声信号に
基づく音声データと比較するための音声データ(…,so
und022,sound023,…)と、該音声データに対応する文
字列データ(…,えあこん,おーでぃお,…)とが、関
連付けられて予め記憶されている。
【0025】音声認識手段12へ入力された音声信号
が、複数の文字列を示している場合は、音声信号が示す
文字列の組合せ順に辞書テーブル15を参照して音声認
識を行い、認識された場合は、前記文字列の組合せ順
に、対応する文字列データをコマンド出力手段13へ出
力する。
【0026】コマンド出力手段13は、入力された文字
列データに基づいてコマンドテーブル16を参照し、該
文字列データにより前記組合せ順に構成された複文字列
データに対応する複文字列データが、コマンドテーブル
16に記憶されているか否かを判別する。
【0027】図3は本実施の形態に係るコマンドテーブ
ル16の構成を示す模式図である。コマンドテーブル1
6は、外部通信装置,エアコン,オーディオ等、車両に
搭載された種々の装置を操作するためのコマンド(…,
command112,command113,…)が記憶されており、複数
の文字列(文字列データ1〜4)が組み合わされており
前記コマンドを示す複文字列データ(「えあこん,れい
ぼう,にじゅうど,おん」等)が、前記コマンドに関連
付けられて記憶されている。
【0028】コマンドテーブル16を参照した結果、対
応する複文字列データが記憶されていると判別された場
合、コマンド出力手段13は、前記複文字列データに対
応付けられて記憶されているコマンドをLANアダプタ
等の通信手段14へ出力する。通信手段14はLAN回
線等により、インターネット等の通信ネットワークに接
続可能でありメールの作成機能及び送受信機能を有する
外部通信装置23,空調装置24,オーディオ25,カ
ーナビゲーション装置26等の種々の装置に接続されて
おり、コマンド出力手段13から出力されたコマンド
を、指定された装置へ送信する。
【0029】また通信手段14には、音声操作装置1の
外部装置の一つである液晶ディスプレイ(LCD)等の
表示手段27が接続されており、外部通信装置23にて
メールを作成する際のモニタ、及びカーナビゲーション
装置26にて用いるモニタを兼ねている。また、該表示
手段27は通信手段14を介し、音声認識手段12での
音声データに係る判別結果に応じて出力されたデータ、
又は、コマンド出力手段13での複文字列データに係る
判別結果に応じて出力されたコマンドに基づいて種々の
表示を行う。
【0030】図4は、表示手段27にて表示される内容
の一例を示す模式図である。ユーザがマイク21へ向か
って「外部通信装置,メール作成」と音声を発した場
合、音声認識手段12にて音声認識が行われた後、コマ
ンド出力手段13から通信手段14を介して出力された
コマンドに基づき、メール作成用に参照する画面を表示
する。
【0031】図5は、表示手段27にて表示される内容
の他の一例を示す模式図である。ユーザがマイク21へ
向かって「エアコン,調整」と音声を発した場合、音声
認識手段12にて音声認識が行われた後、コマンド出力
手段13から通信手段14を介して出力されたコマンド
に基づき、エアコン調整用に参照する画面を表示する。
【0032】表示手段27は上述した他、通信手段14
からの出力に基づいて種々の表示が可能であり、オーデ
ィオ装置25を操作する場合はオーディオ調整用に参照
する画面を表示することが可能である。また、音声認識
手段12にて音声認識ができなかった場合、又は、コマ
ンド出力手段13にて該当するコマンドに関するデータ
が記憶されていないと判別された場合は、実行できない
旨の表示、又は、再度音声入力をすべき旨の表示を行う
こともでき、これらの旨はスピーカ22を介して音声に
より示してもよい。
【0033】また、音声操作装置1は、辞書テーブル1
5及びコマンドテーブル16に、音声データ,文字列デ
ータ,複文字列データ,及びコマンドを、追加記憶させ
て登録するための登録手段17を備えている。該登録手
段17は、音声入出力コンバータ11,辞書テーブル1
5,及びコマンドテーブル16に接続され、更に音声操
作装置1の外部装置の一つであるキーボード等の操作手
段28に接続されている。
【0034】登録手段17は、マイク21を通じて音声
入出力コンバータ11へ入力された音声データを、ユー
ザによる操作手段28の操作に基づき、辞書テーブル1
5へ追加記憶させる。また登録手段17は、ユーザが操
作手段28を用いて入力した文字列に基づき、文字列デ
ータ及び複文字列データを追加記憶させる。更に、登録
手段17は通信手段14を介して表示手段27に接続さ
れており、該表示手段27にてコマンド一覧を表示さ
せ、該コマンド一覧から選択することによりコマンドを
追加記憶させる。
【0035】図6は、コマンドを追加記憶させる場合に
ユーザが参照すべく表示手段27にて表示される画面の
一例を示す模式図である。なお、ここで表示手段27は
タッチパネル式の液晶ディスプレイであり、操作手段2
8の機能を兼ね備えている場合の一例を示している。画
面には、コマンドに対応させる複文字列データを構成す
る各文字列データを入力すべく、ひらがな入力ボタンが
表示され、また、コマンドがプルダウンメニューとして
表示される。
【0036】ユーザは、ひらがな入力ボタンを操作する
か、マイク21に向かって発声することにより、各文字
列データを入力して複文字列データを決定し、更にプル
ダウンメニューにて前記複文字列データに割り当てるコ
マンドを選択し、決定することによってコマンドテーブ
ルに、新たなコマンドを追加記憶させることができる。
【0037】次に、上述した構成をなす音声操作装置1
の動作の一例について図7に示すフローチャートを用い
て説明する。なおここでは、車両で走行しているユーザ
が、交通渋滞により待ち合わせ時間に遅れて目的地へ到
達する予定の場合に、待ち合わせ相手(鈴木氏)へメー
ルで遅れる旨を報せる場合を想定している。
【0038】ユーザがマイク21へ向かって「がいぶつ
うしんそうち,めーるさくせい,すずきあて,ちこくり
ゆうじゅうたい」と、複数の文字列を含む発声をした場
合、マイク21はアナログの音声信号として音声操作装
置1が備える音声入出力コンバータ11へ入力する。音
声入出力コンバータ11は入力された音声信号をディジ
タルの音声信号に変換して音声認識手段12へ出力す
る。
【0039】音声認識手段12はディジタルの音声信号
の入力を受け付け(S1)、受け付けた音声信号をスペ
クトル分析し、コード化した音声データを生成する(S
2)。音声認識手段12は、生成した音声データに基づ
いて辞書テーブル15を参照する(S3)。
【0040】音声認識手段12は、生成した前記音声デ
ータと、辞書テーブル15に記憶されている音声データ
(…,sound022,sound023,…)とを比較し、一致する
か否かを判別する(S4)。ここでは、「がいぶつうし
んそうち」を示す音声信号から生成された音声データは
音声データ「sound065」に一致し、「めーるさくせい」
は音声データ「sound286」に一致し、「すずきあて」は
音声データ「sound080」に一致し、「ちこくりゆうじゅ
うたい」は音声データ「sound144」に一致する。判別し
た結果、一致した場合は、前記音声データに関連付けら
れて記憶されている文字列データ「がいぶつうしんそう
ち」,「めーるさくせい」,「すずきあて」,「ちこく
りゆうじゅうたい」を取得する(S5)。
【0041】取得した複数の文字列データは、音声認識
手段12からコマンド出力手段13へ出力され、コマン
ド出力手段13は、入力された複数の文字列データに基
づいてコマンドテーブル16を参照する(S6)。即
ち、受信した複数の文字列データを用いて複文字列デー
タ「がいぶつうしんそうち,めーるさくせい,すずきあ
て,ちこくりゆうじゅうたい」を生成し、生成した複文
字列データと、コマンドテーブル16に記憶されている
複文字列データとを比較して一致するか否かを判別する
(S7)。ここでは、コマンド「command141」に関連付
けられている複文字列データに一致する(図3参照)。
【0042】判別した結果、一致した場合は、前記複文
字列データに関連付けられて記憶されているコマンド
「command141」を取得し(S8)、取得したコマンド
「command141」を通信手段14へ出力する(S9)。コ
マンドの入力を受け付けた通信手段14は、LAN等の
通信回線を介してメール作成機能を有する外部通信装置
23へ出力する。
【0043】またステップ4にて、音声信号に基づいて
生成した音声データが、辞書テーブル15に記憶されて
いる音声データに一致しないと判別した場合、又は、ス
テップ7にて、コマンド出力手段13にて生成した複文
字列データが、コマンドテーブル16に記憶されている
複文字列データに一致しないと判別した場合は、通信手
段14を介して表示手段27にてその旨を示すエラー表
示を行う(S10)。
【0044】ここで、コマンド「command141」の入力を
受け付けた外部通信装置23は、該コマンド「command1
41」に応じてメール作成用の画面を通信手段14を介し
て表示手段27に表示させる。図8はコマンドの入力を
受け付けた場合に表示手段27が表示する内容の一例を
示す模式図である。表示手段27には、文章雛形,宛
先,作成日時,題目等が自動的に挿入されたメール作成
用画面が表示される。また、音声操作装置1のユーザが
限定的に登録されている場合には、発信者名(「小林」
等)が自動的に挿入される。
【0045】更に、ユーザがマイク21へ向かって「が
いぶつうしんそうち,めーるさくせい」と発声した場合
は、音声操作装置1は前述と同様にステップ1〜8の動
作を行い、その結果取得したコマンドが外部通信装置2
3へ出力される。コマンドの入力を受け付けた外部通信
装置23は、コマンドに応じ、表示手段27にて表示さ
れた内容のメールを外部通信ネットワークへ送信する。
【0046】本実施に係る音声操作装置1によれば、辞
書テーブル15は、文字列毎に音声データ及び文字列デ
ータが関連付けられて記憶されており、コマンドテーブ
ル16は、複文字列データ及びコマンドが関連付けられ
て記憶されており、ユーザの発声に基づいて文字列毎に
音声データを認識し、認識した音声データにより組み合
わされる複音声データに対応するコマンドを出力するた
め、辞書テーブル15において音声データ及び文字列デ
ータを重複して記憶することがない。
【0047】また、登録手段17を備え、マイク21を
通じて入力された音声信号、操作手段28により入力さ
れた文字列データ,複文字列データ,コマンドを、辞書
テーブル15,コマンドテーブル16に記憶させること
ができるため、予め記憶されたデータ及びコマンドの他
に追加して記憶させることができ、ユーザの用途及びユ
ーザに固有の言い回し等に応じて種々の装置を適切に操
作することができる。
【0048】(実施の形態2)図9は、本発明に係る音
声操作装置10の他の実施の形態を示すブロック図であ
る。図中において図1に示すものと同じ符号を付してあ
るものは、実施の形態1において説明したものと同様の
構成,機能を有しており、ここでの説明は省略する。図
中160は、外部通信装置23,空調装置24等の外部
装置に対して指示するコマンドを記憶するコマンドテー
ブルである。
【0049】図10はコマンドテーブル160の構成を
示す模式図である。コマンドテーブル160は、多数の
ファイルが階層構造をなして関連付けられており、最上
位層には、装置名称テーブルファイル161が存在して
いる。該装置名称テーブルファイル161の下位層に
は、本実施の形態における音声操作装置10が備える通
信手段14を介して接続されている外部装置である外部
通信装置23,空調装置24,オーディオ装置25,カ
ーナビゲーション装置26等に関する各テーブルファイ
ルが存在し、更に、各装置に関するテーブルファイルの
下位層にも複数のテーブルファイルが順次存在してい
る。
【0050】図11は装置名称テーブルファイル161
に記憶されている内容を示す模式図である。装置名称テ
ーブルファイル161には、本実施の形態における音声
操作装置10が備える通信手段14を介して接続されて
いる外部装置である外部通信装置23,空調装置24,
オーディオ装置25,カーナビゲーション装置26等の
名称と、該名称の文字列データと、各外部装置に関連付
けられる下位層のファイル名称とが関連付けられて記憶
されている。
【0051】装置名称テーブルファイル161に記憶さ
れている各外部装置のうち、装置名称「外部通信装置」
の下位層にはファイル「 Cucom.txt」が関連付けられて
記憶されている。図12は、ファイル名称が「 Cucom.t
xt」である外部通信装置テーブルファイル162に記憶
されている内容を示す模式図である。外部通信装置テー
ブルファイル162には、外部通信装置23に対して指
示し得る種々のコマンド( command21, command22,
…)と、文字列データ(「めーるさくせい」,「ねっと
けんさく」,…)と、前記各コマンドに関連付けられて
いる下位層のファイル名称とが関連付けられて記憶され
ている。
【0052】外部通信装置テーブルファイル162に記
憶されている各コマンドのうち、コマンド「 command2
1」の下位層にはファイル「arg1.txt」,「arg2.txt」
が関連付けられて記憶されている。図13は、ファイル
名称が「arg1.txt」である第1引数テーブルファイル1
63に記憶されている内容を示す模式図であり、図14
は、ファイル名称が「arg2.txt」である第2引数テーブ
ルファイル164に記憶されている内容を示す模式図で
ある。
【0053】第1引数テーブルファイル163には、メ
ールを作成する際の宛名に関する文字列データ(「すず
きあて」,「きたむらあて」,…)、及び該文字列デー
タに関連付けられている第1引数( 211, 212,…)が
記憶されている。また、第2引数テーブルファイル16
4には、メールを作成する際の文章雛形に関する文字列
データ(「ちこくりゆうじゅうたい」,「かくにんげん
ざいち」,…)、及び該文字列データに関連付けられて
いる第2引数(2111,2112,…)が記憶されている。
【0054】上述した構成をなす音声操作装置10の動
作の一例について図15に示すフローチャートを用いて
説明する。なおここでは、実施の形態1と同様、車両で
走行しているユーザが、交通渋滞により待ち合わせ時間
に遅れて目的地へ到達する予定の場合に、待ち合わせ相
手(鈴木氏)へメールで遅れる旨を報せる場合を想定し
ている。
【0055】ユーザがマイク21へ向かって「がいぶつ
うしんそうち,めーるさくせい,すずきあて,ちこくり
ゆうじゅうたい」と、複数の文字列を含む発声をした場
合、マイク21から音声入出力コンバータ11を介して
ディジタルの音声信号に変換され、音声認識手段12へ
入力される。音声認識手段12は、音声信号の入力を受
け付け(S11)、該音声信号に基づいてコード化した
音声データを生成し(S12)、生成した音声データに
基づいて辞書テーブル15を参照する(S13)。
【0056】音声認識手段12は、実施の形態1にて説
明したのと同様に、生成した音声データと辞書テーブル
15に記憶されている音声データとを比較して一致する
か否かを判別する(S14)。判別した結果、一致した
場合は前記音声データに関連付けられて記憶されている
文字列データ「がいぶつしんそうち」,「めーるさくせ
い」,「すずきあて」,「ちこくりゆうじゅうたい」を
取得する(S15)
【0057】取得した複数の文字列データは、音声認識
手段12からコマンド出力手段13へ出力され、コマン
ド出力手段13は、入力された複数の文字列データに基
づいてコマンドテーブル160を参照する(S16)。
【0058】図16は、コマンドテーブル160を参照
する際の動作について説明するためのフローチャートで
ある。コマンド出力手段13は、装置名称テーブルファ
イル161を参照し(S161)、取得した文字列のう
ち最初の文字列である「がいぶつうしんそうち」に一致
する文字列データが存在するか否かを判別する(S16
2)。
【0059】判別した結果、一致する文字列データが存
在する場合は、文字列データ「がいぶつうしんそうち」
に関連付けられている装置名称「外部通信装置」及びフ
ァイル名称「 Cucom.txt」を取得し、ファイル名称「 C
ucom.txt」に基づいて外部通信装置テーブルファイル1
62を参照する(S163)。外部通信装置テーブルフ
ァイル162において、取得した2番目の文字列「めー
るさくせい」に一致する文字列データが存在するか否か
を判別する(S164)。
【0060】判別した結果、一致する文字列データが存
在する場合は、文字列データ「めーるさくせい」に関連
付けられているコマンド「 command21」及びファイル名
称「arg1.txt」,「arg2.txt」を取得するし、ファイル
名称「arg1.txt」に基づいて第1引数テーブルファイル
163を参照する(S165)。
【0061】第1引数テーブルファイル163におい
て、取得した3番目の文字列「すずきあて」に一致する
文字列データが存在するか否かを判別する(S16
6)。判別の結果、一致する文字列データが存在する場
合は、文字列データ「すずきあて」に関連付けられてい
る第1引数「 211」を取得する。
【0062】ファイル名称「arg2.txt」に基づいて第2
引数テーブルファイル164を参照する(S167)。
第2引数テーブルファイル164において、取得した4
番目の文字列「ちこくりゆうじゅうたい」に一致する文
字列データが存在するか否かを判別する(S168)。
判別の結果、一致する文字列データが存在する場合は、
文字列データ「ちこくりゆうじゅうたい」に関連付けら
れている第2引数「 2111」を取得する。
【0063】以上により、「外部通信装置」に対するコ
マンド「 command21, 211,2111」を取得し(S1
7)、取得した前記コマンドを通信手段14へ出力する
(S18)。コマンドの入力を受け付けた通信手段14
は、LAN等の通信回線を介してメール作成機能を有す
る外部通信装置23へ出力する。以後、前記コマンドに
基づいて外部通信装置23が行うメール作成動作、及び
作成したメールを送信する動作は、実施の形態1におい
て説明したものと同様であるので説明は省略する。
【0064】なお、ステップ14にて、音声信号に基づ
いて生成した音声データが、辞書テーブル15に記憶さ
れている音声データに一致しないと判別した場合は通信
手段14を介して表示手段27にてその旨を示すエラー
表示を行い(S19)、ステップ162,164,16
6及び168において、取得した文字列が記憶されてい
る文字列データに一致しないと判別した場合にも、通信
手段14を介して表示手段27にてエラー表示を行う
(S169)。
【0065】本実施に係る音声操作装置10によれば、
コマンドテーブル160が、装置名称テーブルファイル
161,外部通信装置テーブルファイル162,第1引
数テーブルファイル163及び第2引数テーブルファイ
ル164等から成り、文字列データ毎に階層的に記憶さ
れているため、ユーザが発した音声に対応する文字列デ
ータがコマンドテーブル160に記憶されているか否か
の判別を高速に行うことができる。
【0066】
【発明の効果】第1発明に係る音声操作装置によれば、
例えば冷房を起動又は停止させる指示データに対し、辞
書テーブルは「くうちょう」,「れいぼう」,「お
ん」,「おふ」に対応する第1音声データ及び文字列デ
ータを関連付けて記憶するだけで済み、同一の文字列デ
ータが重複して記憶されることがなく、無駄がない音声
操作装置を実現することができる。
【0067】第2発明に係る音声操作装置によれば、予
め記憶されているデータ及びコマンドの他に追加して記
憶させることができ、ユーザである搭乗者等の用途及び
ユーザに固有の言い回し等に応じて、周辺装置を適切に
操作することができる音声操作装置を実現することがで
きる。
【0068】第3発明に係る音声操作装置によれば、辞
書テーブルに文字列が重複して記憶されることがない。
また、搭乗者が発する音声を構成する第2音声データに
基づき、各階層テーブル毎に文字列階層データの存在の
有無を判別でき、搭乗者の発声に対応する文字列階層デ
ータに関連付けられた指示要素データが存在するか否か
の判別を高速に行うことができる音声操作装置を実現す
ることができる。
【0069】第4発明に係る音声操作装置によれば、ユ
ーザである搭乗者等の使用範囲,使用目的、及びユーザ
固有の言い回し等に応じて、周辺装置を適切に操作する
ことができる音声操作装置を実現することができる。
【図面の簡単な説明】
【図1】本発明に係る音声操作装置の実施の形態を示す
ブロック図である。
【図2】辞書テーブルの構成を示す模式図である。
【図3】実施の形態1に係るコマンドテーブルの構成を
示す模式図である。
【図4】表示手段にて表示される内容の一例を示す模式
図である。
【図5】表示手段にて表示される内容の他の一例を示す
模式図である。
【図6】コマンドを追加記憶させる場合にユーザが参照
すべく表示手段にて表示される画面の一例を示す模式図
である。
【図7】実施の形態1における音声操作装置の動作の一
例を説明するためのフローチャートである。
【図8】コマンドの入力を受け付けた場合に表示手段が
表示する内容の一例を示す模式図である。
【図9】本発明に係る音声操作装置の他の実施の形態を
示すブロック図である。
【図10】実施の形態2に係るコマンドテーブルの構成
を示す模式図である。
【図11】装置名称テーブルファイルに記憶されている
内容を示す模式図である。
【図12】外部通信装置テーブルファイルに記憶されて
いる内容を示す模式図である。
【図13】第1引数テーブルファイルに記憶されている
内容を示す模式図である。
【図14】第2引数テーブルファイルに記憶されている
内容を示す模式図である。
【図15】実施の形態2における音声操作装置の動作の
一例を説明するためのフローチャートである。
【図16】コマンドテーブルを参照する際の動作を説明
するためのフローチャートである。
【符号の説明】
1,10 音声操作装置 11 音声入出力コンバータ 12 音声認識手段 13 コマンド出力手段 14 通信手段 15 辞書テーブル 16,160 コマンドテーブル 17 登録手段 21 マイク 22 スピーカ 27 表示装置 28 操作手段 161 装置名称テーブルファイル 162 外部通信装置テーブルファイル 163 第1引数テーブルファイル 164 第2引数テーブルファイル

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声に基づいて外部装置を操
    作するための音声操作装置において、 第1音声データ及び文字列データが関連付けられて記憶
    されている辞書テーブルと、複数の文字列データにより
    構成されて前記外部装置への指示内容を示す第1複文字
    列データ、及び前記指示内容に応じて前記外部装置へ指
    示するための指示データが関連付けられて記憶されてい
    る指示テーブルとを備え、 複数の第2音声データにより構成される複音声データを
    受け付ける手段と、前記第2音声データの夫々に対応す
    る第1音声データが前記辞書テーブルに記憶されている
    か否かを判別する手段と、記憶されていると判別した場
    合に、前記第1音声データの夫々に関連付けられている
    文字列データにより構成される第2複文字列データに対
    応する第1複文字列データが、前記指示テーブルに記憶
    されているか否かを判別する手段と、記憶されていると
    判別した場合に、前記第1複文字列データに関連付けら
    れて記憶されている指示データに基づいて前記外部装置
    へ指示する手段とを備えることを特徴とする音声操作装
    置。
  2. 【請求項2】 前記辞書テーブルに第1音声データ及び
    文字列データを関連付けて記録する手段と、前記指示テ
    ーブルに第1複文字列データ及び指示データを関連付け
    て記録する手段とを更に備えることを特徴とする請求項
    1に記載の音声操作装置。
  3. 【請求項3】 入力された音声に基づいて外部装置を操
    作するための音声操作装置において、 第1音声データ及び文字列データが関連付けられて記憶
    されている辞書テーブルと、組み合わせることにより前
    記外部装置への指示内容を示し、該指示内容を特定する
    複数の要素の夫々に対応する複数の文字列データを階層
    的に分類した各階層毎の文字列階層データ、及び該文字
    列階層データが示す前記要素に応じて前記外部装置へ指
    示するための指示要素データを関連付けて記憶する複数
    の階層テーブルとを備え、 複数の第2音声データにより構成される複音声データを
    受け付ける手段と、前記第2音声データの夫々に対応す
    る第1音声データが前記辞書テーブルに記憶されている
    か否かを判別する手段と、記憶していると判別した場合
    に、前記第1音声データの夫々に関連付けられている文
    字列データに対応する文字列階層データが、夫々前記複
    数の階層テーブルにて階層的に記憶されているか否かを
    判別する手段と、階層的に記憶されていると判別した場
    合に、前記文字列階層データの夫々に関連付けられてい
    る指示要素データに基づいて前記外部装置へ指示する手
    段とを備えることを特徴とする音声操作装置。
  4. 【請求項4】 前記辞書テーブルに第1音声データ及び
    文字列データを関連付けて記録する手段と、前記階層テ
    ーブルに文字列階層データ及び指示要素データを関連付
    けて記録する手段とを更に備えることを特徴とする請求
    項3に記載の音声操作装置。
JP2001197398A 2001-06-28 2001-06-28 音声操作装置 Pending JP2003015689A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001197398A JP2003015689A (ja) 2001-06-28 2001-06-28 音声操作装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001197398A JP2003015689A (ja) 2001-06-28 2001-06-28 音声操作装置

Publications (1)

Publication Number Publication Date
JP2003015689A true JP2003015689A (ja) 2003-01-17

Family

ID=19035010

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001197398A Pending JP2003015689A (ja) 2001-06-28 2001-06-28 音声操作装置

Country Status (1)

Country Link
JP (1) JP2003015689A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006345337A (ja) * 2005-06-10 2006-12-21 Sony Ericsson Mobilecommunications Japan Inc 携帯端末、被制御装置のリモートコントロール方法及びプログラム
JP2007318382A (ja) * 2006-05-25 2007-12-06 Clarion Co Ltd 車載機器、車載機器の遠隔操作方法および制御プログラム
WO2009019768A1 (ja) * 2007-08-08 2009-02-12 Pioneer Corporation 音声入力型装置、音声入力制御方法及び音声入力制御プログラム
CN110491379A (zh) * 2019-07-22 2019-11-22 青岛海信日立空调系统有限公司 一种家用电器的语音控制方法、语音控制器和空调器
JP2019207150A (ja) * 2018-05-29 2019-12-05 ナブテスコ株式会社 速度検出装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006345337A (ja) * 2005-06-10 2006-12-21 Sony Ericsson Mobilecommunications Japan Inc 携帯端末、被制御装置のリモートコントロール方法及びプログラム
JP2007318382A (ja) * 2006-05-25 2007-12-06 Clarion Co Ltd 車載機器、車載機器の遠隔操作方法および制御プログラム
WO2009019768A1 (ja) * 2007-08-08 2009-02-12 Pioneer Corporation 音声入力型装置、音声入力制御方法及び音声入力制御プログラム
JP5002014B2 (ja) * 2007-08-08 2012-08-15 パイオニア株式会社 音声入力型装置、音声入力制御方法及び音声入力制御プログラム
JP2019207150A (ja) * 2018-05-29 2019-12-05 ナブテスコ株式会社 速度検出装置
CN110491379A (zh) * 2019-07-22 2019-11-22 青岛海信日立空调系统有限公司 一种家用电器的语音控制方法、语音控制器和空调器

Similar Documents

Publication Publication Date Title
ES2228739T3 (es) Procedimiento para sistema de reconocimiento de lenguaje y procedimiento para el funcionamiento de un sistema asi.
US6073102A (en) Speech recognition method
US9679557B2 (en) Computer-implemented method for automatic training of a dialogue system, and dialogue system for generating semantic annotations
JP4859447B2 (ja) ナビゲーション装置
US20170103756A1 (en) Information processing system, and vehicle-mounted device
US20030156689A1 (en) Method and system for acquiring information with voice input
JP3702867B2 (ja) 音声制御装置
JP2001515611A (ja) コマンド辞書を使用する音声認識装置
JP2003202885A (ja) 情報処理装置及び方法
JP2003015689A (ja) 音声操作装置
JP2001117584A (ja) 音声処理装置
JPH08339288A (ja) 情報処理装置及びその制御方法
JP2001268669A (ja) 移動電話端末を利用した機器制御装置、方法、及び記録媒体
JP2020066472A (ja) エレベーター、及び、エレベーター用の緊急通信を支援する通信支援方法
JP4574888B2 (ja) オーダ入力装置およびオーダ入力支援方法
JP4498906B2 (ja) 音声認識装置
JP2001134285A (ja) 音声認識装置
JP2007193792A (ja) 音声案内システム
JP4367005B2 (ja) 音声認識による照明制御装置
JP4498902B2 (ja) 音声認識装置
JP4049456B2 (ja) 音声情報利用システム
JPH10312193A (ja) 音声入力装置
JP2021033839A (ja) Cad制御支援システム
JP2003140682A (ja) 音声認識装置及び音声辞書作成方法
JPH03274593A (ja) 車載用音声認識装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040601