JP2002123283A - 音声認識操作装置 - Google Patents

音声認識操作装置

Info

Publication number
JP2002123283A
JP2002123283A JP2000312076A JP2000312076A JP2002123283A JP 2002123283 A JP2002123283 A JP 2002123283A JP 2000312076 A JP2000312076 A JP 2000312076A JP 2000312076 A JP2000312076 A JP 2000312076A JP 2002123283 A JP2002123283 A JP 2002123283A
Authority
JP
Japan
Prior art keywords
voice recognition
word
words
recognition operation
setting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000312076A
Other languages
English (en)
Inventor
Takeshi Ono
健 大野
Okihiko Nakayama
沖彦 中山
Norimasa Kishi
則政 岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nissan Motor Co Ltd
Original Assignee
Nissan Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nissan Motor Co Ltd filed Critical Nissan Motor Co Ltd
Priority to JP2000312076A priority Critical patent/JP2002123283A/ja
Priority to US09/973,038 priority patent/US20020046033A1/en
Publication of JP2002123283A publication Critical patent/JP2002123283A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

(57)【要約】 【課題】 任意の言葉を用いて音声認識操作を行う。 【解決手段】 音声認識操作に用いる言葉を新たに登録
するモードが設定されているときに、入力手段7から入
力された情報に基づいて音声認識操作に用いる新しい言
葉とその言葉に対応する機器の操作内容とを設定し、そ
の設定内容を記憶手段8に格納する。これにより、使用
者が使い慣れている任意の言葉を音声認識操作に用いる
ことができ、使用者が発声した言葉を早く正確に認識で
き、音声認識操作の応答性と信頼性を向上させることが
できる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、人間が発声した言
葉を認識して各種機器を操作する装置に関する。
【0002】
【従来の技術】人間が発声した言葉を予め記憶装置に記
憶されている言葉(以下、登録語と呼ぶ)と比較し、発
声言葉と一致する登録語に割り当てられた操作を実行す
る音声認識操作装置が知られている(例えば特開平11
−351901号公報参照)。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
音声認識操作装置では、記憶装置に予めどのような言葉
が登録されており、またそれらの言葉に割り当てられた
操作がどのような内容なのかを認識していないと、どの
ような言葉を発声してよいのか分からないので、充分に
使いこなすことができず、使い勝手が悪いという問題が
ある。
【0004】そのような問題を解決するために、一つの
操作に対して複数の言葉を割り当てると、登録語のデー
タ量が多くなり、発声言葉と一致検索を行う時間が長く
なって操作性が悪くなるという問題がある。
【0005】本発明の目的は、任意の言葉を用いて音声
認識操作を行うことにある。
【0006】
【課題を解決するための手段】発明の一実施の形態の構
成を示す図1および図12に対応づけて本発明を説明す
ると、(1) 請求項1の発明は、使用者が発声した言
葉を収録する収録手段1,2と、音声認識操作に用いる
言葉とそれに対応する機器の操作内容とを記憶する記憶
手段8と、記憶手段8に記録されている言葉の中から収
録手段1,2で収録した言葉に最も一致する言葉を検索
する検索手段9と、検索手段9により検索された言葉に
対応する機器の操作内容を出力する出力手段9とを備え
た音声認識操作装置に適用される。そして、音声認識操
作に用いる言葉を新たに登録するモードを設定するモー
ド設定手段7と、各種情報を入力する入力手段1,2,
7と、登録モードが設定されているときに、入力手段
1,2,7から入力された情報に基づいて音声認識操作
に用いる新しい言葉とその言葉に対応する機器の操作内
容とを設定する設定手段9と、設定手段9の設定内容を
記憶手段8に格納する登録手段9とを備える。 (2) 請求項2の音声認識操作装置は、入力手段は収
録手段1,2であり、設定手段9は、登録モードが設定
されているときに収録手段1,2で収録した言葉に機器
の操作内容を設定するようにしたものである。 (3) 請求項3の音声認識操作装置は、入力手段はキ
ーボード7であり、設定手段9は、登録モードが設定さ
れているときに、キーボード7から入力された情報に基
づいて音声認識操作に用いる新しい言葉とその言葉に対
応する機器の操作内容とを設定するようにしたものであ
る。 (4) 請求項4の音声認識操作装置は、検索手段9に
よって、記憶手段8に予め記憶されている言葉よりも登
録モードにおいて記憶手段8に格納された言葉を優先的
に検索するようにしたものである。 (5) 請求項5の音声認識操作装置は、基地局と通信
を行う通信手段10,11を備え、設定手段9によっ
て、通信手段10,11を介して基地局の言語データベ
ース13にアクセスし、言葉と機器の操作内容を設定す
るようにしたものである。 (6) 請求項6の音声認識操作装置は、設定手段9に
よって、登録モードにおいて新しく登録する言葉にアイ
コンを設定するようにしたものである。 (7) 請求項7の音声認識操作装置は、新しく登録さ
れた言葉またはその言葉に対応するアイコンを表示する
表示手段3,4を備える。
【0007】上述した課題を解決するための手段の項で
は、説明を分かりやすくするために一実施の形態の図を
用いたが、これにより本発明が一実施の形態に限定され
るものではない。
【0008】
【発明の効果】(1) 請求項1の発明によれば、音声
認識操作に用いる言葉を新たに登録するモードが設定さ
れているときに、入力手段から入力された情報に基づい
て音声認識操作に用いる新しい言葉とその言葉に対応す
る機器の操作内容とを設定し、その設定内容を記憶手段
に格納するようにしたので、使用者が使い慣れている任
意の言葉を音声認識操作に用いることができ、使用者が
発声した言葉を早く正確に認識でき、音声認識操作の応
答性と信頼性を向上させることができる。 (2) 請求項2の発明によれば、登録モードが設定さ
れているときに、使用者が発声した言葉を収録して機器
の操作内容を設定するようにしたので、音声認識操作に
用いる新しい言葉をハンズフリーで入力することができ
る。 (3) 請求項3の発明によれば、登録モードが設定さ
れているときに、キーボードから入力された情報に基づ
いて音声認識操作に用いる新しい言葉とその言葉に対応
する機器の操作内容とを設定するようにしたので、音声
認識操作に用いる新しい言葉を確実に入力することがで
きる。 (4) 請求項4の発明によれば、記憶手段に予め記憶
されている言葉よりも登録モードにおいて記憶手段に格
納された言葉を優先的に検索するようにした。使用者は
日常使い慣れている言葉を登録するので、音声認識操作
で使用者が発声する言葉と一致する登録言葉を早く正確
に検索することができ、音声認識操作の応答性と信頼性
を向上させることができる。 (5) 請求項5の発明によれば、通信手段を介して基
地局の言語データベースにアクセスし、言葉と機器の操
作内容を設定するようにしたので、使用者側に大容量の
言語データベースがなくても、使用者の日常使い慣れて
いる任意の言葉を音声認識操作に用いることができ、そ
の言葉に対応する機器の操作内容を簡単に早く設定する
ことができる。 (6) 請求項6および7の発明によれば、登録モード
において新しく登録する言葉にアイコンを設定し、新し
く登録された言葉またはその言葉に対応するアイコンを
表示するするようにしたので、音声認識操作を行うとき
に使用者の発声した言葉に対応するアイコンを表示する
ことができ、使用者は自身の発声した言葉が正しく装置
に認識されたかどうかを視覚的にも確認することができ
る。
【0009】
【発明の実施の形態】《発明の第1の実施の形態》イン
ターネットのような通信網を介して基地局サーバーから
一般家庭のパソコンにニュースや天気予報を取り込み、
モニターに表示する第1の実施の形態を説明する。
【0010】図1は第1の実施の形態の構成を示す図で
ある。図の上部には使用者側に設置されるパソコンの構
成を示し、図の下部には基地局サーバーの構成を示す。
マイク1および音声入力回路2は使用者の発声した言葉
を収録する。また、モニター3および映像出力回路4は
画像情報を出力し、スピーカー5および音声出力回路6
は音声情報を出力する。入力装置7は、音声認識を開始
するスイッチ、言葉の登録モードを設定するスイッチな
どの操作機器を備えている。記憶装置8は、音声認識で
使用される言葉とその言葉に設定された機器の操作内容
などのデータを記憶する。
【0011】信号処理装置9はCPU9a、ROM9
b、A/Dコンバーター9c、D/Aコンバーター9d
などを備え、音声認識処理や新しい言葉の登録処理など
を行う。A/Dコンバーター9cはマイク1および音声
入力回路2により収録された音声をデジタル信号に変換
し、D/Aコンバーター9dはデジタル音声信号をアナ
ログ音声信号に変換して音声出力回路6およびスピーカ
ー5から出力する。使用者側の信号処理装置9は、電話
機10,11を介して基地局サーバーの信号処理装置1
2に接続される。
【0012】基地局サーバーの信号処理装置12はCP
U12a、ROM12b、A/Dコンバーター12c、
D/Aコンバーター12dなどを備え、使用者側の信号
処理装置9との対話と各種情報の配信を行う。基地局サ
ーバーの信号処理装置12には、音声認識操作や使用者
との対話に用いる言語情報を記憶した言語データベース
13と、ニュース、天気予報、株価などの一般情報を記
憶する記憶装置14が接続されている。
【0013】図2は、音声認識操作に用いる新しい言葉
とその言葉に対応する機器の操作内容とを登録する処理
を示すフローチャートであり、(a)は使用者側の信号処
理装置9で実行される登録処理を示し、(b)は基地局サ
ーバーの信号処理装置12で実行される登録処理を示
す。
【0014】なお、音声認識操作で用いる基本的な言葉
とその言葉に対応する機器の操作内容は予め使用者側の
記憶装置8に記憶されており、それらを使用者が使い慣
れた言葉に変更して登録したり、あるいはまったく新し
い言葉とその言葉に対応する機器の操作内容を追加する
場合に、この登録処理を行う。もちろん、音声認識操作
に用いる言葉とその言葉に対応する機器の操作内容を初
めからすべて使用者が任意に登録するようにしてもよ
い。
【0015】使用者側の入力装置7のスイッチにより登
録モードが設定されると、使用者側の信号処理装置9は
図2(a)に示す登録処理を開始する。ステップ1におい
て、電話機10を介して基地局サーバーの登録処理専用
チャンネルに接続する。基地局サーバーの信号処理装置
12は、電話機11を介して使用者側からの呼び出しを
受けると図2(b)に示す登録処理を開始する。図2(a)
のステップ2と図2(b)のステップ11において、使用
者と基地局サーバーとの間で対話通信を行う。すなわ
ち、使用者がマイク1に向かって発声した音声は音声入
力回路2、信号処理装置9、電話機10,11を介して
基地局サーバーの信号処理装置12へ送られる。一方、
基地局サーバーの信号処理装置12からのメッセージと
画像情報は電話機11,10を介して使用者側の信号処
理装置9へ送られ、音声出力回路6およびスピーカー5
と、映像出力回路4およびモニター3からそれぞれ出力
される。
【0016】図3は使用者と基地局サーバーとの間の対
話通信の一例を示す。この例では、音声認識操作に用い
る新しい言葉として「ニュース」と、その言葉に対応す
る機器の操作内容として「野球および○社と×社の株価
の情報を基地局から取り込んで表示する」を登録する例
を示す。なお、このような音声対話機能については、文
献「ロバストな対話システム構築に関する一考察」(情
報処理学会、音声言語情報処理研究会、94-SLP-7-22(19
95,7))、あるいは文献「音声対話システムにおける協
調的応答」(ヒューマンインタフェース研究報告、96-S
LP-10-19(1996,3))などに紹介されているので、ここで
は詳細な説明を省略する。
【0017】なお、基地局サーバーの言語データベース
13は音声対話機能に用いる大規模な言語辞書を記憶し
ており、使用者は「ニュース」に代えて「今日の出来
事」など、日常使い慣れている任意の言葉を用いること
ができる。
【0018】使用者と基地局サーバーとの間の対話が終
了すると、基地局サーバーの信号処理装置12は、図2
のステップ12で新しく登録した言葉とその言葉に対応
する機器の操作内容の登録データを電話機11,10を
介して使用者側の信号処理装置9へ送る。使用者側の信
号処理装置9は、ステップ4において基地局サーバーか
ら送られた登録データを受信し、モニター3に表示する
とともに記憶装置8に記憶して登録モードを終了する。
【0019】図4は、音声認識操作で用いるために新し
く登録した言葉とその言葉に対応する機器の操作内容の
記憶形態を示す。この例では上述した「ニュース」とそ
の操作内容の他に、新しい言葉「天気予報」とその操作
内容「神奈川県東部の天気予報を基地局から取り込んで
表示する」、さらに新しい言葉「渋滞」とその操作内容
「東名横浜町田と東名川崎の渋滞情報を基地局から取り
込んで表示する」を示す。また、図5は、音声認識操作
で用いるために新しく登録した言葉「ニュース」、「天
気予報」および「渋滞」をモニター3の画面下隅に表示
した例を示す。
【0020】図6は使用者側の音声認識処理を示すフロ
ーチャートである。使用者側の入力装置7の音声認識処
理開始スイッチが操作されると、信号処理装置9はスピ
ーカー5により音声認識処理の開始を告げ、図6に示す
処理を開始する。ステップ31において、マイク1で収
録した音声信号のパワーがそれまでの平均パワーより所
定値以上大きくなったら使用者が発声したと判断し、マ
イク1による音声収録を開始する。続くステップ32
で、使用者の音声収録を継続するとともに、収録した音
声の連続した部分を一つの言葉として抽出し、記憶装置
8に記憶されている登録語との一致度を演算する。ステ
ップ33で、マイク1で収録した音声信号のパワーが所
定値以下の状態が所定時間以上継続したら使用者の発声
が終了したと判断し、マイク1による音声収録を終了す
る。
【0021】ステップ34において、記憶装置8に登録
されている言葉の中から使用者の発声した言葉と一致度
が最も高い言葉を選択し、使用者の発声した言葉に相当
する認識語とする。記憶装置8に登録されている言葉を
検索する際に、予め記憶装置8に基本的な言葉として登
録されていた言葉よりも、使用者が上述した登録モード
において登録した言葉を優先的に検索する。使用者は日
常使い慣れている言葉を登録するので、音声認識操作で
使用者が発声した言葉と一致する登録言葉を早く正確に
検索することができ、音声認識操作の応答性と信頼性を
向上させることができる。
【0022】次に、認識語を記憶装置8に記憶されてい
る音声合成データを用いて音声メッセージに変換し、さ
らにD/Aコンバーター9dによりアナログ音声信号に
変換してスピーカー5から出力する。これにより、使用
者は、自分が発声した言葉が信号処理装置9により正し
く認識されているかどうかを知ることができる。続くス
テップ35で、記憶装置8の登録語データから認識語に
対応する機器の操作内容を読み出し、その操作内容にし
たがって機器の操作を行う。
【0023】例えば、使用者が発声した言葉が「ニュー
ス」であったとすると、デジタル信号に変換した発声言
葉「ニュース」を記憶装置8の登録語と順次照合し、一
致度を演算する。そして、一致度が最も高い登録語「ニ
ュース」を認識語とし、アナログ音声信号に変換してス
ピーカー5から放送するとともに、記憶装置8から認識
語「ニュース」に対応する機器の操作内容「野球および
○社と×社の株価の情報を基地局から取り込んで表示す
る」を読み出す。そして、読み出した操作内容にしたが
って電話機10を基地局サーバーの情報入手専用チャン
ネルに接続し、基地局サーバーの信号処理装置12を介
して記憶装置14から「野球および○社と×社の株価の
ニュース」を入手し、モニター3に順次表示する。
【0024】このように、入力装置7のスイッチにより
音声認識操作に用いる言葉を新たに登録するモードが設
定されると、マイク1および音声入力回路2で収録した
使用者の発声言葉に機器の操作内容を設定し、その設定
内容を記憶装置8に格納して登録するようにしたので、
使用者が使い慣れている言葉を音声認識操作に用いるこ
とができ、使用者が発声した言葉を早く正確に認識で
き、音声認識操作の応答性と信頼性を向上させることが
できる。
【0025】また、通信網を介して基地局の言語データ
ベースにアクセスし、言葉と機器の操作内容を設定する
ようにしたので、使用者側に大容量の言語データベース
がなくても、使用者の日常使い慣れている任意の言葉を
音声認識操作に用いることができ、その言葉に対応する
機器の操作内容を簡単に早く設定することができる。
【0026】さらに、音声認識操作に用いるために新し
く登録する言葉をモニター3に表示するようにしたの
で、視覚的に登録する言葉を確認することができ、言葉
の誤登録を防止することができる。
【0027】《発明の第1の実施の形態の変形例》音声
認識操作に用いるために新しく登録した言葉をアイコン
表示する変形例を説明する。
【0028】基地局サーバーの言語データベース13
は、音声認識操作で使用される言葉に対応するアイコン
を記憶している。図2に示す使用者と基地局サーバーと
の間の対話通信において、基地局サーバーの信号処理装
置12は、言語データベース13から「ニュース」のア
イコン情報を読み出して図7に示すようなアイコン選択
画面を使用者側に送り、図8に示すように「ニュース」
に対するアイコンの選択を使用者に促す。アイコン画面
は使用者側の信号処理装置9によりモニター3に表示さ
れ、使用者は「ニュース」アイコンの中からいずれかを
選択してその番号を答える。
【0029】基地局サーバーの信号処理装置12は、新
しく登録した言葉「ニュース」とその言葉に対応するア
イコンおよび機器の操作内容を使用者側の信号処理装置
9へ送る。使用者側の信号処理装置9は、基地局サーバ
ーから送られた登録データを受信し、モニター3に表示
するとともに記憶装置8に記憶する。
【0030】図9は音声認識操作で用いるために新しく
登録した言葉、そのアイコンおよび操作内容の記憶形態
を示す。この例では上述した「ニュース」とそのアイコ
ンおよび操作内容の他に、新しい言葉「天気予報」とそ
のアイコンおよび操作内容「神奈川県東部の天気予報を
基地局から取り込んで表示する」、さらに新しい言葉
「渋滞」とそのアイコンおよび操作内容「東名横浜町田
と東名川崎の渋滞情報を基地局から取り込んで表示す
る」を示す。また、図10は、音声認識操作で用いるた
めに新しく登録した言葉「ニュース」、「天気予報」お
よび「渋滞」のアイコンをモニター3の画面下隅に表示
した例を示す。
【0031】実際に音声認識操作を行うときには、使用
者の例えば「ニュース」の発声に対して音声合成により
スピーカー5から”ニュース”と放送するとともに、モ
ニター3に”ニュース・アイコン”を表示する。これに
より、使用者は、自身が発声した言葉が装置に正しく認
識されたかどうかを、耳と目で確認することができる。
【0032】《発明の第1の実施の形態の他の変形例》
上述した第1の実施の形態とその変形例では、基地局サ
ーバー側の言語登録処理を信号処理装置12と言語デー
タベース13により実行する例を示したが、図11に示
すようにオペレーターにより実行するようにしてもよ
い。この場合には、図2に示す対話通信が使用者と基地
局オペレーターとの間で行われ、新しく登録した言葉と
そのアイコンおよび操作内容の登録データはオペレータ
ーによって編集され、使用者側に送られる。
【0033】《発明の第2の実施の形態》上述した第1
の実施の形態とその変形例では、音声認識操作や使用者
との対話に用いる言語情報を記憶した大容量の言語デー
タベース13を使用者側に設置することが難しいため、
基地局サーバー側に設置し、インターネットなどの通信
網を介して使用者と対話し、音声認識操作に用いる言葉
を新しく登録する例を示した。しかし、本願発明を、例
えば音声認識操作により電話の発信を行う装置への適用
を考えると、使用者が作成した電話帳を検索して受信者
の呼び名と電話番号を登録すればよいから、インターネ
ットなどの通信網を介さずに音声認識操作に用いる言葉
とその言葉に対応する機器の操作内容の登録処理を使用
者側だけで行うことができる。
【0034】図12は第2の実施の形態の構成を示す図
である。なお、この第2の実施の形態の構成は図1に示
す使用者側の機器構成と同様であり、相違点を中心に説
明する。入力装置7には電話番号を入力するキーボード
が含まれる。電話帳15は個人的に作成されたものであ
り、氏名や住所などの受信者情報と電話番号が記憶され
ている。
【0035】図13は、音声認識操作により電話の発信
を行うための受信者名と電話番号の登録処理を示すフロ
ーチャートである。入力装置7の登録処理開始スイッチ
が操作されると、信号処理装置9はこの登録処理を開始
する。ステップ41において入力装置7のキーボードか
ら入力された電話番号を入力し、続くステップ42で電
話帳15を検索して入力電話番号に対応する氏名および
住所を読み出す。ステップ43では、読み出した氏名に
基づいて「○○さんに電話」という登録する言葉(登録
語)を決定し、モニター3に登録語「○○さんに電話」
と電話番号を表示するとともに、記憶装置8に登録語と
電話番号の登録データを記憶する。
【0036】このように、入力装置7のスイッチにより
音声認識操作に用いる言葉を新たに登録するモードが設
定されると、入力装置7のキーボードから入力された電
話番号に基づいて音声認識操作に用いる新しい言葉とそ
の言葉に対応する機器の操作内容とを登録するようにし
たので、電話番号入力だけで音声認識操作に用いる言葉
とその言葉に対応する機器の操作内用とを設定すること
ができる。
【0037】なお、登録語が記憶装置8にすでに記憶さ
れている登録語と類似している場合には、登録語に受信
者の住所を付加して例えば「横須賀の○○さんに電話」
というような登録語を決定する。また、氏名と住所など
を組み合わせて複数の登録語を作成し、モニター3に表
示して使用者に選択させてもよい。
【0038】音声認識操作により電話をかけるときに
は、マイク1に向かって「○○さんに電話」という登録
語を発声すると、記憶装置8の登録語を検索して一致度
が最も高い登録語を認識語として選定し、記憶装置8か
らその認識語に対応する電話番号を読み出して電話の自
動発信を行う。
【0039】なお、この第2の実施の形態の音声認識操
作装置を車両に搭載する場合には、マイク1により収録
した音声がそれまでの平均的なレベルよりも所定値以上
増加したら、音声認識操作が開始されたと判断して車載
音響機器の音量を自動的に下げるのが望ましい。
【図面の簡単な説明】
【図1】 第1の実施の形態の構成を示す図である。
【図2】 音声認識操作に用いる言葉の登録処理を示す
フローチャートである。
【図3】 使用者と基地局サーバーとの対話例を示す図
である。
【図4】 登録語とその操作内容の記憶例を示す図であ
る。
【図5】 登録語の表示例を示す図である。
【図6】 音声認識操作の処理を示すフローチャートで
ある。
【図7】 使用者と基地局サーバーとの対話例を示す図
である。
【図8】 ニュースのアイコンを示す図である。
【図9】 登録語とそのアイコンおよび操作内容の記憶
例を示す図である。
【図10】 登録語アイコンの表示例を示す図である。
【図11】 オペレーターにより運用される基地局を示
す図である。
【図12】 第2の実施の形態の構成を示す図である。
【図13】 音声認識操作に用いる言葉の登録処理を示
すフローチャートである。
【符号の説明】
1 マイク 2 音声入力回路 3 モニター 4 映像出力回路 5 スピーカー 6 音声出力回路 7 入力装置 8 記憶装置 9 信号処理装置 9a CPU 9b ROM 9c A/Dコンバーター 9d D/Aコンバーター 10,11 電話 12 信号処理装置 12a CPU 12b ROM 12c A/Dコンバーター 12d A/Dコンバーター 15 電話帳
───────────────────────────────────────────────────── フロントページの続き (72)発明者 岸 則政 神奈川県横浜市神奈川区宝町2番地 日産 自動車株式会社内 Fターム(参考) 5D015 AA04 BB01 GG03 GG06 KK03 LL05 LL12

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】使用者が発声した言葉を収録する収録手段
    と、 音声認識操作に用いる言葉とそれに対応する機器の操作
    内容とを記憶する記憶手段と、 前記記憶手段に記録されている言葉の中から前記収録手
    段で収録した言葉に最も一致する言葉を検索する検索手
    段と、 前記検索手段により検索された言葉に対応する機器の操
    作内容を出力する出力手段とを備えた音声認識操作装置
    において、 音声認識操作に用いる言葉を新たに登録するモードを設
    定するモード設定手段と、 各種情報を入力する入力手段と、 前記登録モードが設定されているときに、前記入力手段
    から入力された情報に基づいて音声認識操作に用いる新
    しい言葉とその言葉に対応する機器の操作内容とを設定
    する設定手段と、 前記設定手段の設定内容を前記記憶手段に格納する登録
    手段とを備えることを特徴とする音声認識操作装置。
  2. 【請求項2】請求項1に記載の音声認識操作装置におい
    て、 前記入力手段は前記収録手段であり、 前記設定手段は、前記登録モードが設定されているとき
    に前記収録手段で収録した言葉に機器の操作内容を設定
    することを特徴とする音声認識操作装置。
  3. 【請求項3】請求項1に記載の音声認識操作装置におい
    て、 前記入力手段はキーボードであり、 前記設定手段は、前記登録モードが設定されているとき
    に、前記キーボードから入力された情報に基づいて音声
    認識操作に用いる新しい言葉とその言葉に対応する機器
    の操作内容とを設定することを特徴とする音声認識操作
    装置。
  4. 【請求項4】請求項1〜3のいずれかの項に記載の音声
    認識操作装置において、 前記検索手段は、前記記憶手段に予め記憶されている言
    葉よりも前記登録モードにおいて前記記憶手段に格納さ
    れた言葉を優先的に検索することを特徴とする音声認識
    操作装置。
  5. 【請求項5】請求項1〜4のいずれかの項に記載の音声
    認識操作装置において、 基地局と通信を行う通信手段を備え、 前記設定手段は、前記通信手段を介して基地局の言語デ
    ータベースにアクセスし、言葉と機器の操作内容を設定
    することを特徴とする音声認識操作装置。
  6. 【請求項6】請求項1〜5のいずれかの項に記載の音声
    認識操作装置において、 前記設定手段は、前記登録モードにおいて新しく登録す
    る言葉にアイコンを設定することを特徴とする音声認識
    操作装置。
  7. 【請求項7】請求項1〜6のいずれかの項に記載の音声
    認識操作装置において、 新しく登録された言葉またはその言葉に対応するアイコ
    ンを表示する表示手段を備えることを特徴とする音声認
    識操作装置。
JP2000312076A 2000-10-12 2000-10-12 音声認識操作装置 Pending JP2002123283A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000312076A JP2002123283A (ja) 2000-10-12 2000-10-12 音声認識操作装置
US09/973,038 US20020046033A1 (en) 2000-10-12 2001-10-10 Voice recognition operation system and method for operating the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000312076A JP2002123283A (ja) 2000-10-12 2000-10-12 音声認識操作装置

Publications (1)

Publication Number Publication Date
JP2002123283A true JP2002123283A (ja) 2002-04-26

Family

ID=18791736

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000312076A Pending JP2002123283A (ja) 2000-10-12 2000-10-12 音声認識操作装置

Country Status (2)

Country Link
US (1) US20020046033A1 (ja)
JP (1) JP2002123283A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7171006B2 (en) 2003-01-07 2007-01-30 Nissan Motor Co., Ltd. Vocal sound input apparatus for automotive vehicle

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040190688A1 (en) * 2003-03-31 2004-09-30 Timmins Timothy A. Communications methods and systems using voiceprints
US8521510B2 (en) * 2006-08-31 2013-08-27 At&T Intellectual Property Ii, L.P. Method and system for providing an automated web transcription service
JP2009044328A (ja) 2007-08-07 2009-02-26 Seiko Epson Corp 会議システム、サーバ、画像表示方法、コンピュータプログラム及び記録媒体
US9026447B2 (en) * 2007-11-16 2015-05-05 Centurylink Intellectual Property Llc Command and control of devices and applications by voice using a communication base system
US8996386B2 (en) * 2011-01-19 2015-03-31 Denso International America, Inc. Method and system for creating a voice recognition database for a mobile device using image processing and optical character recognition
US9992745B2 (en) 2011-11-01 2018-06-05 Qualcomm Incorporated Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate
KR20160036104A (ko) 2011-12-07 2016-04-01 퀄컴 인코포레이티드 디지털화된 오디오 스트림을 분석하는 저전력 집적 회로
TWI557722B (zh) * 2012-11-15 2016-11-11 緯創資通股份有限公司 語音干擾的濾除方法、系統,與電腦可讀記錄媒體
US9280981B2 (en) * 2013-02-27 2016-03-08 Blackberry Limited Method and apparatus for voice control of a mobile device
CN105185379B (zh) * 2015-06-17 2017-08-18 百度在线网络技术(北京)有限公司 声纹认证方法和装置
JP6526608B2 (ja) * 2016-09-06 2019-06-05 株式会社東芝 辞書更新装置およびプログラム
US10586537B2 (en) * 2017-11-30 2020-03-10 International Business Machines Corporation Filtering directive invoking vocal utterances
US20190251961A1 (en) * 2018-02-15 2019-08-15 Lenovo (Singapore) Pte. Ltd. Transcription of audio communication to identify command to device

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5309546A (en) * 1984-10-15 1994-05-03 Baker Bruce R System for method for producing synthetic plural word messages
US4873714A (en) * 1985-11-26 1989-10-10 Kabushiki Kaisha Toshiba Speech recognition system with an accurate recognition function
US5761639A (en) * 1989-03-13 1998-06-02 Kabushiki Kaisha Toshiba Method and apparatus for time series signal recognition with signal variation proof learning
JPH07109560B2 (ja) * 1990-11-30 1995-11-22 富士通テン株式会社 音声認識装置
CA2088080C (en) * 1992-04-02 1997-10-07 Enrico Luigi Bocchieri Automatic speech recognizer
US5890122A (en) * 1993-02-08 1999-03-30 Microsoft Corporation Voice-controlled computer simulateously displaying application menu and list of available commands
JP3397372B2 (ja) * 1993-06-16 2003-04-14 キヤノン株式会社 音声認識方法及び装置
US5537488A (en) * 1993-09-16 1996-07-16 Massachusetts Institute Of Technology Pattern recognition system with statistical classification
JPH0981183A (ja) * 1995-09-14 1997-03-28 Pioneer Electron Corp 音声モデルの作成方法およびこれを用いた音声認識装置
KR20000075828A (ko) * 1997-12-30 2000-12-26 요트.게.아. 롤페즈 명령어 목록을 이용한 음성 인식 디바이스
US6505159B1 (en) * 1998-03-03 2003-01-07 Microsoft Corporation Apparatus and method for providing speech input to a speech recognition system
US6185530B1 (en) * 1998-08-14 2001-02-06 International Business Machines Corporation Apparatus and methods for identifying potential acoustic confusibility among words in a speech recognition system
US6334102B1 (en) * 1999-09-13 2001-12-25 International Business Machines Corp. Method of adding vocabulary to a speech recognition system
US6473735B1 (en) * 1999-10-21 2002-10-29 Sony Corporation System and method for speech verification using a confidence measure
US6230138B1 (en) * 2000-06-28 2001-05-08 Visteon Global Technologies, Inc. Method and apparatus for controlling multiple speech engines in an in-vehicle speech recognition system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7171006B2 (en) 2003-01-07 2007-01-30 Nissan Motor Co., Ltd. Vocal sound input apparatus for automotive vehicle

Also Published As

Publication number Publication date
US20020046033A1 (en) 2002-04-18

Similar Documents

Publication Publication Date Title
JP3997459B2 (ja) 音声入力システムおよび音声ポータルサーバおよび音声入力端末
US10320981B2 (en) Personal voice-based information retrieval system
US7522711B1 (en) Delivery of audio driving directions via a telephone interface
US8185539B1 (en) Web site or directory search using speech recognition of letters
CN100580769C (zh) 用于选择性语音识别的方法和装置
US20080154611A1 (en) Integrated voice search commands for mobile communication devices
US20080154870A1 (en) Collection and use of side information in voice-mediated mobile search
US20080154612A1 (en) Local storage and use of search results for voice-enabled mobile communications devices
JP2002123283A (ja) 音声認識操作装置
US20080154608A1 (en) On a mobile device tracking use of search results delivered to the mobile device
JPH09321894A (ja) 情報処理装置
US20050288927A1 (en) Quality of service call routing system using counselor and speech recognition engine and method thereof
JP2013088477A (ja) 音声認識システム
JP3322262B2 (ja) 無線携帯端末通信システム
JP2002374356A (ja) 自動情報システム
JP2002091473A (ja) 情報処理装置
JP2003223187A (ja) 音声対話システムを動作させる方法
JPH10164249A (ja) 情報処理装置
JP2004301980A (ja) 音声対話装置及び音声対話代行装置並びにそれらのプログラム
JPH11252281A (ja) 電話端末装置
JP7451033B2 (ja) データ処理システム
EP2130359A2 (en) Integrated voice search commands for mobile communications devices
EP1635328B1 (en) Speech recognition method constrained with a grammar received from a remote system.
JP3862069B2 (ja) 音声入力装置
EP0986013A2 (en) Information retrieval system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040903

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041126

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050617

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050622

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20050909