JP2003345391A - 端末、音声認識サーバ、音声認識システムおよびコンピュータプログラム - Google Patents

端末、音声認識サーバ、音声認識システムおよびコンピュータプログラム

Info

Publication number
JP2003345391A
JP2003345391A JP2002149147A JP2002149147A JP2003345391A JP 2003345391 A JP2003345391 A JP 2003345391A JP 2002149147 A JP2002149147 A JP 2002149147A JP 2002149147 A JP2002149147 A JP 2002149147A JP 2003345391 A JP2003345391 A JP 2003345391A
Authority
JP
Japan
Prior art keywords
voice
voice recognition
terminal
vehicle
recognition server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002149147A
Other languages
English (en)
Inventor
Toshiyuki Ito
敏之 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2002149147A priority Critical patent/JP2003345391A/ja
Priority to US10/442,462 priority patent/US7319963B2/en
Publication of JP2003345391A publication Critical patent/JP2003345391A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems

Abstract

(57)【要約】 【課題】 音声認識サーバの音声認識性能が低下するの
を未然に回避する。 【解決手段】 車載端末1は、受信信号の電界強度が閾
値未満になると、音声の入力を禁止したり、入力された
音声を電波環境を表すデータと共に音声認識サーバ4に
送信したり、入力された音声を記憶し、受信信号の電界
強度が閾値以上になってから、一時的に記憶させていた
音声を音声認識サーバ4に送信したりする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、端末が入力された
音声を音声認識サーバに送信し、音声認識サーバが端末
から受信された音声に対して音声認識を行うように構成
されてなる音声認識システムおよび前記端末にて実行さ
れるコンピュータプログラムに関する。
【0002】
【発明が解決しようとする課題】従来より、端末が入力
された音声を音声認識サーバに送信し、音声認識サーバ
が端末から受信された音声に対して音声認識を行うよう
に構成されてなる音声認識システムが供されている。
【0003】一例として、端末が自動車に搭載される車
載端末である場合を説明すると、車載端末は、乗員から
発せられた例えば「「ケ」、「イ」、「ロ」、「ケ」、
「ン」、「サ」、「ク」」という音声を入力すると、入
力された音声を電話網を通じて音声認識サーバに送信
し、音声認識サーバは、車載端末から音声が受信される
と、現在位置から目的地までに至る経路を検索(演算)
し、検索結果を電話網を通じて車載端末に送信する。そ
して、車載端末は、音声認識サーバから検索結果が受信
されると、受信された検索結果を表示する。これによ
り、乗員は、例えば「「ケ」、「イ」、「ロ」、
「ケ」、「ン」、「サ」、「ク」」という音声を発する
ことにより、現在位置から目的地までに至る経路を認識
することが可能となる。
【0004】ところで、この場合、車載端末と音声認識
サーバとが音声を無線通信により送受信する場合には、
電波環境が劣悪になると、車載端末から音声認識サーバ
に送信される音声の品質が低下する(例えば雑音成分が
増大する)場合があり得るので、そうなると、音声認識
サーバが車載端末から受信された音声に対して音声認識
を行う場合に誤認識が発生し易くなり、音声認識性能が
低下するという問題がある。
【0005】また、上記したように端末が自動車に搭載
される車載端末である場合には、例えばエアコンの送風
音が大きかったり、オーディオ機器の出力音が大きかっ
たり、ワイパーが動作していたりするなど、自動車の状
態に応じて周囲の騒音が大きくなると、上記したものと
同様にして、車載端末から音声認識サーバに送信される
音声の品質が低下する場合があり得るので、このような
場合にも、音声認識サーバが車載端末から受信された音
声に対して音声認識を行う場合に誤認識が発生し易くな
り、音声認識性能が低下するという問題がある。
【0006】本発明は、上記した事情に鑑みてなされた
ものであり、その目的は、音声認識サーバが端末から受
信された音声に対して音声認識を行う場合に誤認識が発
生することを未然に回避することができ、それによっ
て、音声認識性能が低下することを未然に回避すること
ができる端末、音声認識サーバ、音声認識システムおよ
びコンピュータプログラムを提供することにある。
【0007】
【課題を解決するための手段】請求項1に記載した端末
によれば、制御手段は、音声認識サーバとの間の無線通
信に係る電波環境や端末を搭載している車両の状態を表
す車両状態が所定条件を満たしていないと、音声入力手
段による音声の入力を禁止する。
【0008】したがって、端末と音声認識サーバとが音
声を無線通信により送受信する場合であれば、電波環境
が良好である旨を所定条件とし、また、端末が車両に搭
載されている場合であれば、周囲の騒音が小さい車両状
態である旨を所定条件とすることにより、音声認識サー
バは、電波環境が劣悪であるときや、周囲の騒音が大き
い車両状態であるときには、端末から音声を受信するこ
とがなく、音声認識そのものを行うことがなく、音声認
識を行う場合に誤認識が発生することを未然に回避する
ことができ、これによって、音声認識性能が低下するこ
とを未然に回避することができる。
【0009】請求項2に記載した端末によれば、制御手
段は、音声認識サーバとの間の無線通信に係る電波環境
や端末を搭載している車両の状態を表す車両状態が所定
条件を満たしていないときに、音声が音声入力手段によ
り入力されると、入力された音声を電波環境を表すデー
タや車両状態を表すデータと共に送信手段から音声認識
サーバに送信させる。
【0010】したがって、端末と音声認識サーバとが音
声を無線通信により送受信する場合であれば、電波環境
が良好である旨を所定条件とし、また、端末が車両に搭
載されている場合であれば、周囲の騒音が小さい車両状
態である旨を所定条件とすることにより、音声認識サー
バは、電波環境が劣悪であるときや、周囲の騒音が大き
い車両状態であるときには、電波環境を表すデータや車
両状態を表すデータが受信されることにより、電波環境
が劣悪である旨や、周囲の騒音が大きい車両状態である
旨を認識することができ、そのような状況に対して、例
えば音声認識レベルを高めて音声認識を行うなどの適切
な対応を行うことにより、音声認識を行う場合に誤認識
が発生することを未然に回避することができ、これによ
って、音声認識性能が低下することを未然に回避するこ
とができる。
【0011】請求項3に記載した端末によれば、制御手
段は、音声認識サーバとの間の無線通信に係る電波環境
や端末を搭載している車両の状態を表す車両状態が所定
条件を満たしていないときに、音声が音声入力手段によ
りされると、入力された音声を記憶手段に記憶させ、電
波環境や車両状態が所定条件を満たすようになってか
ら、記憶手段に記憶されている音声を送信手段から音声
認識サーバに送信させる。
【0012】したがって、端末と音声認識サーバとが音
声を無線通信により送受信する場合であれば、電波環境
が良好である旨を所定条件とし、また、端末が車両に搭
載されている場合であれば、周囲の騒音が小さい車両状
態である旨を所定条件とすることにより、音声認識サー
バは、電波環境が劣悪であるときや、周囲の騒音が大き
い車両状態であるときには、端末から音声を受信するこ
とがなく、電波環境が良好になってからや、周囲の騒音
が小さい車両状態になってから、端末から一時的に記憶
されていた音声を受信し、受信された音声に対して音声
認識を行うことになるので、音声認識を行う場合に誤認
識が発生することを未然に回避することができ、これに
よって、音声認識性能が低下することを未然に回避する
ことができる。
【0013】請求項4に記載した端末によれば、制御手
段は、記憶手段に記憶されている音声を当該音声が記憶
手段に記憶されてからの経過時間を表すデータと共に送
信手段から音声認識サーバに送信させる。したがって、
音声認識サーバは、経過時間を表すデータが受信される
ことにより、例えば経過時間が短い音声、つまり、記憶
された時刻が時系列的に新しい音声に対しては音声認識
を行い、一方、経過時間が長い音声、つまり、記憶され
た時刻が時系列的に古い音声に対しては音声認識を行わ
ないなどの適切な対応を行うことができる。
【0014】請求項5に記載した端末によれば、制御手
段は、音声認識サーバとの間の無線通信に係る電波環境
や端末を搭載している車両の状態を表す車両状態が所定
条件を満たしているか否かの判定結果を区別するように
報知手段を動作させる。したがって、電波環境が劣悪で
あるか否かや周囲の騒音の大小を知らせることができ
る。
【0015】請求項10に記載したコンピュータプログ
ラムによれば、当該コンピュータプログラムを、端末か
ら受信された音声に対して音声認識を行う音声認識サー
バと共に音声認識システムで用いられる端末にインスト
ールして実行させると、音声認識サーバとの間の無線通
信に係る電波環境や端末を搭載している車両の状態を表
す車両状態が所定条件を満たしているか否かを判定させ
る手順と、電波環境や車両状態が所定条件を満たしてい
ない旨が判定されているときに、音声の入力を禁止させ
る手順とを実行するようになるので、上記した請求項1
に記載したものと同様の作用効果を得ることができる。
【0016】請求項11に記載したコンピュータプログ
ラムによれば、当該コンピュータプログラムを、端末か
ら受信された音声に対して音声認識を行う音声認識サー
バと共に音声認識システムで用いられる端末にインスト
ールして実行させると、音声認識サーバとの間の無線通
信に係る電波環境や端末を搭載している車両の状態を表
す車両状態が所定条件を満たしているか否かを判定させ
る手順と、電波環境や車両状態が所定条件を満たしてい
ない旨が判定されているときであって音声が入力された
ときに、入力された音声を電波環境を表すデータや車両
状態を表すデータと共に音声認識サーバに送信させる手
順とを実行するようになるので、上記した請求項2に記
載したものと同様の作用効果を得ることができる。
【0017】請求項12に記載したコンピュータプログ
ラムによれば、当該コンピュータプログラムを、端末か
ら受信された音声に対して音声認識を行う音声認識サー
バと共に音声認識システムで用いられる端末にインスト
ールして実行させると、音声認識サーバとの間の無線通
信に係る電波環境や端末を搭載している車両の状態を表
す車両状態が所定条件を満たしているか否かを判定させ
る手順と、電波環境や車両状態が所定条件を満たしてい
ない旨が判定されているときであって音声が入力された
ときに、入力された音声を記憶させる手順と、電波環境
や車両状態が所定条件を満たしている旨が判定されてか
ら、記憶されている音声を音声認識サーバに送信させる
手順とを実行するようになるので、上記した請求項3に
記載したものと同様の作用効果を得ることができる。
【0018】
【発明の実施の形態】以下、本発明の端末を自動車に搭
載される車載端末に適用した一実施例について、図面を
参照して説明する。まず、図1は、音声認識システムの
全体構成を概略的に示している。車載端末1は、自動車
2(本発明でいう車両)に搭載されており、自動車電話
網や固定電話網などの各種の電話網から構成される電話
網3を通じて音声認識サーバ4に音声を送信する。音声
認識サーバ4は、車載端末1から音声が受信されると、
受信された音声に対して音声認識を行い、音声認識を行
った結果に応じた処理を行う。
【0019】具体的な例を挙げると、自動車2に乗車し
ている乗員が例えば「「ケ」、「イ」、「ロ」、
「ケ」、「ン」、「サ」、「ク」」という音声を発する
と、車載端末1は、乗員から発せられた「「ケ」、
「イ」、「ロ」、「ケ」、「ン」、「サ」、「ク」」と
いう音声を電話網3を通じて音声認識サーバ4に送信
し、音声認識サーバ4は、車載端末1から音声が受信さ
れると、現在位置から目的地までに至る経路を検索(演
算)し、検索結果を電話網3を通じて車載端末1に送信
する。
【0020】そして、車載端末1は、音声認識サーバ4
から検索結果が受信されると、受信された検索結果を表
示する。これにより、乗員は、例えば「「ケ」、
「イ」、「ロ」、「ケ」、「ン」、「サ」、「ク」」と
いう音声を発することにより、現在位置から目的地まで
に至る経路を認識することが可能となる。尚、図1で
は、地図上に現在位置(「自動車」の印にて示す位置)
から目的地(「星」の印にて示す位置)までに至る経路
が示された一例を概略的に示している。
【0021】図2は、上記した車載端末1の電気的な構
成を機能ブロック図として示している。車載端末1は、
制御プログラム(本発明でいうコンピュータプログラ
ム)を実行するCPU(Central Processing Unit)5
(本発明でいう制御手段)、マイクロホン6、スピーカ
7、音響特性制御部8、音声インタフェース部9、デー
タインタフェース部10、多重化部11、通信部12
(本発明でいう送信手段)、記憶部13(本発明でいう
記憶手段)、操作部14、表示部15(本発明でいう報
知手段)および車両インタフェース部16を備えて構成
されている。
【0022】マイクロホン6は、自動車2の車室内にあ
って自動車2に乗車している乗員が発した音声を集音す
るのに適した位置に取付けられるもので、乗員が発した
音声を入力すると、入力された音声を音響特性制御部8
に出力する。スピーカ7は、自動車2の車室内にあって
自動車2に乗車している乗員が音声を聞取るのに適した
位置に取付けられるもので、音響特性制御部8から音声
を入力すると、入力された音声を外部に出力する。
【0023】音響特性制御部8は、マイクロホン6から
音声を入力すると、入力された音声の音響特性を制御し
て音声インタフェース部9に出力すると共に、音声イン
タフェース部9から音声を入力すると、入力された音声
の音響特性を制御してスピーカ7に出力する。音声イン
タフェース部9は、マイクロホン6から音響特性制御部
8を通じて音声を入力すると、入力された音声を送信処
理して多重化部11に出力すると共に、多重化部11か
ら音声を入力すると、入力された音声を受信処理して音
響特性制御部8を通じてスピーカ7に出力する。データ
インタフェース部10は、CPU5からデータを入力す
ると、入力されたデータを送信処理して多重化部11に
出力すると共に、多重化部11からデータを入力する
と、入力されたデータを受信処理してCPU5に出力す
る。
【0024】多重化部11は、音声インタフェース部9
から音声を入力し、データインタフェース部10からデ
ータを入力すると、それら入力された音声とデータとを
多重化し、音声とデータとが多重化された送信信号を通
信部12に出力すると共に、通信部12から音声とデー
タとが多重化された受信信号を入力すると、入力された
受信信号から音声とデータとを抽出し、音声を音声イン
タフェース部9に出力し、データをデータインタフェー
ス部10に出力する。通信部12は、多重化部11から
送信信号を入力すると、入力された送信信号を電波によ
り送信すると共に、受信信号を電波により受信すると、
受信された受信信号を多重化部11に出力する。
【0025】記憶部13は、マイクロホン6が入力した
音声を記憶可能に構成されている。操作部14は、自動
車2に乗車している乗員が操作するもので、幾つかのキ
ー(ボタン)が配列されて構成されている。尚、この場
合、操作部14は、表示部15に表示されるタッチパネ
ル形式のキーから構成されるものであっても良い。表示
部15は、時刻、自動車2に乗車している乗員に警告を
知らせるための表示ガイダンスおよび音声認識サーバ4
から受信された表示情報(例えば地図情報など)などを
表示する。
【0026】車両インタフェース部16は、自動車2に
搭載されている各種の装置の動作状態を表す動作データ
を入力するもので、例えばエアコンが動作しているか否
かを表すエアコン動作データや、オーディオ機器が動作
しているか否かを表すオーディオ機器動作データや、ワ
イパーが動作しているか否かを表すワイパー動作データ
などを入力する。
【0027】図3は、上記した音声認識サーバ4の電気
的な構成を機能ブロック図として示している。音声認識
サーバ4は、制御プログラムを実行するCPU17(本
発明でいう音声認識手段)、通信部18(本発明でいう
受信手段)、多重化部19、音声インタフェース部2
0、データインタフェース部21および音声認識データ
ベース22を備えて構成されている。
【0028】通信部18は、受信信号を電波により受信
すると、受信された受信信号を多重化部19に出力する
と共に、多重化部19から送信信号を入力すると、入力
された送信信号を電波により送信する。多重化部19
は、通信部18から音声とデータとが多重化された受信
信号を入力すると、入力された受信信号から音声とデー
タとを抽出し、音声を音声インタフェース部20に出力
し、データをデータインタフェース部21に出力すると
共に、音声インタフェース部20から音声を入力し、デ
ータインタフェース部21からデータを入力すると、そ
れら入力された音声とデータとを多重化し、音声とデー
タとが多重化された送信信号を通信部18に出力する。
【0029】音声インタフェース部20は、多重化部1
9から音声を入力すると、入力された音声を受信処理し
てCPU17に出力すると共に、CPU17から音声を
入力すると、入力された音声を送信処理して多重化部1
9に出力する。データインタフェース部21は、多重化
部19からデータを入力すると、入力されたデータを受
信処理してCPU17に出力すると共に、CPU17か
らデータを入力すると、入力されたデータを送信処理し
て多重化部19に出力する。音声認識データベース22
は、CPU17が音声インタフェース部20から入力さ
れた音声に対して音声認識を行うときに参照するデータ
をデータベース化して記憶している。
【0030】次に、上記した構成の作用について、図4
ないし図8を参照して説明する。尚、ここでは、車載端
末1が音声認識サーバ4との間の無線通信に係る電波環
境を判定する場合について、 (1)車載端末1のCPU5が実行する処理 (2)音声認識サーバ4のCPU17が実行する処理を
順次説明する。
【0031】(1)車載端末1のCPU5が実行する処
理 最初に、車載端末1のCPU5が実行する処理につい
て、図4ないし図7を参照して説明する。車載端末1を
使用するユーザは、操作部14を操作することにより、
音声入力禁止モード、電波環境データ送信モードおよび
音声記憶モードのいずれかを動作モードとして設定可能
である。以下、車載端末1において、各モードが動作モ
ードとして設定されている場合を順次説明する。
【0032】(1−1)音声入力禁止モードが動作モー
ドとして設定されている場合 まず、音声入力禁止モードが動作モードとして設定され
ている場合について、図4に示すフローチャートを参照
して説明する。
【0033】車載端末1において、CPU5は、通信部
12により車載端末1と音声認識サーバ4との間で無線
通信リンクを確立すると(ステップS1)、車載端末1
と音声認識サーバ4との間の無線通信に係る電波環境が
良好であるか劣悪であるかを判定するための基準となる
閾値を設定する(ステップS2)。この場合、CPU5
は、例えば過去の履歴や使用環境などに基づいて最適と
推定されている推定値を閾値として設定しても良いし、
あらかじめ決定されている固定値を閾値として設定して
も良い。
【0034】次いで、CPU5は、受信信号の電界強度
を算出し(ステップS3)、算出された電界強度と、先
に設定された閾値とを比較する(ステップS4)。
【0035】ここで、CPU5は、受信信号の電界強度
が閾値以上である旨を判定すると(ステップS4にて
「YES」)、車載端末1と音声認識サーバ4との間の
無線通信に係る電波環境が良好であると判定し、乗員が
音声を発することによる音声の入力を待機する。そし
て、CPU5は、乗員が音声を発した旨を検出すると
(ステップS5にて「YES」)、乗員から発せられた
音声を入力し(ステップS6)、入力された音声を通信
部12から電話網3を通じて音声認識サーバ4に送信さ
せる(ステップS7)。
【0036】以上に説明したように、車載端末1は、受
信信号の電界強度が閾値以上であると、車載端末1と音
声認識サーバ4との間の無線通信に係る電波環境が良好
であると判定し、乗員が音声を発すると、乗員から発せ
られた音声を入力し、入力された音声を音声認識サーバ
4に送信することになる。
【0037】これに対して、CPU5は、受信信号の電
界強度が閾値未満である(本発明でいう所定条件を満た
していない)旨を判定すると(ステップS4にて「N
O」)、図7(a)に示すように、例えば「電波環境が
劣悪です。音声の入力を禁止します。」という表示ガイ
ダンスを表示部15に表示させる(ステップS8)。そ
して、CPU5は、音声の入力を禁止する(ステップS
9)。
【0038】以上に説明したように、車載端末1は、音
声入力禁止モードが動作モードとして設定されている場
合は、受信信号の電界強度が閾値未満になると、これ以
降、音声の入力を禁止することにより、乗員が音声を発
しても、乗員から発せられた音声を入力することがなく
なる。
【0039】また、このとき、乗員は、表示ガイダンス
が表示部15に表示されることにより、車載端末1と音
声認識サーバ4との間の無線通信に係る電波環境が劣悪
であり、車載端末1が音声の入力を禁止する旨を認識す
ることができる。
【0040】(1−2)電波環境データ送信モードが動
作モードとして設定されている場合 次に、電波環境データ送信モードが動作モードとして設
定されている場合について、図5に示すフローチャート
を参照して説明する。
【0041】CPU5は、この場合は、受信信号の電界
強度が閾値未満である旨を判定すると(ステップS4に
て「NO」)、図7(b)に示すように、例えば「電波
環境が劣悪です。音声を入力できますが、音声認識サー
バが正確に音声認識できない可能性があります。」とい
う表示ガイダンスを表示部15に表示させる(ステップ
S11)。
【0042】次いで、CPU5は、乗員が音声を発した
旨を検出すると(ステップS12にて「YES」)、乗
員から発せられた音声を入力する(ステップS13)。
そして、CPU5は、受信信号の電界強度を車載端末1
と音声認識サーバ4との間の無線通信に係る電波環境を
表す電波環境データとして取得し(ステップS14)、
入力された音声を電波環境データと共に通信部12から
電話網3を通じて音声認識サーバ4に送信させる(ステ
ップS15)。
【0043】以上に説明したように、車載端末1は、電
波環境データ送信モードが動作モードとして設定されて
いる場合は、受信信号の電界強度が閾値未満になると、
これ以降、乗員が音声を発すると、乗員から発せられた
音声を入力し、電波環境データを取得することにより、
入力された音声を電波環境データと共に音声認識サーバ
4に送信することになる。
【0044】また、このとき、乗員は、表示ガイダンス
が表示部15に表示されることにより、車載端末1と音
声認識サーバ4との間の無線通信に係る電波環境が劣悪
であり、車載端末1が音声を電波環境データと共に音声
認識サーバ4に送信する旨を認識することができる。
【0045】(1−3)音声記憶モードが動作モードと
して設定されている場合 次に、音声記憶モードが動作モードとして設定されてい
る場合について、図6に示すフローチャートを参照して
説明する。
【0046】CPU5は、この場合は、受信信号の電界
強度が閾値未満である旨を判定すると(ステップS4に
て「NO」)、図7(c)に示すように、例えば「電波
環境が劣悪です。音声を入力できますが、電波環境が良
好になってから音声を音声認識サーバに送信します。」
という表示ガイダンスを表示部15に表示させる(ステ
ップS21)。
【0047】次いで、CPU5は、乗員が音声を発した
旨を検出すると(ステップS22にて「YES」)、乗
員から発せられた音声を入力し(ステップS23)、入
力された音声を記憶部13に記憶させる(ステップS2
4)。そして、CPU5は、受信信号の電界強度と閾値
とを再度比較し、電界強度が閾値以上である旨を判定す
ると(ステップS25にて「YES」)、車載端末1と
音声認識サーバ4との間の無線通信に係る電波環境が良
好であると判定し、音声が記憶部13に記憶されてから
の経過時間を表す経過時間データを取得し(ステップS
26)、記憶部13に記憶されている音声を経過時間デ
ータと共に通信部12から音声認識サーバ4に送信させ
る(ステップS27)。
【0048】以上に説明したように、車載端末1は、音
声記憶モードが動作モードとして設定されている場合
は、受信信号の電界強度が閾値未満になると、これ以
降、乗員が音声を発すると、乗員から発せられた音声を
記憶し、受信信号の電界強度が閾値以上になってから、
経過時間データを取得することにより、入力されて記憶
されていた音声を経過時間データと共に音声認識サーバ
4に送信することになる。
【0049】また、このとき、乗員は、表示ガイダンス
が表示部15に表示されることにより、車載端末1と音
声認識サーバ4との間の無線通信に係る電波環境が劣悪
であり、車載端末1が音声を記憶し、電波環境が良好に
なってから、記憶されている音声を経過時間データと共
に音声認識サーバ4に送信する旨を認識することができ
る。
【0050】(2)音声認識サーバ4のCPU17が実
行する処理 次に、音声認識サーバ4のCPU17が実行する処理に
ついて、図8に示すフローチャートを参照して説明す
る。
【0051】音声認識サーバ4において、CPU17
は、通信部18により音声認識サーバ4と車載端末1と
の間で無線通信リンクを確立すると(ステップT1)、
電波環境に対しての音声認識を拒否するか否かを判定す
るための基準となるリジェクト閾値を設定し(ステップ
T2)、経過時間に対しての音声認識を拒否するか否か
を判定するための基準となるリジェクト閾値を設定する
(ステップT3)。この場合、CPU17は、例えば過
去の履歴や使用環境などに基づいて最適と推定されてい
る推定値をリジェクト閾値として設定しても良いし、あ
らかじめ決定されている固定値をリジェクト閾値として
設定しても良い。
【0052】そして、CPU17は、車載端末1から通
信部18により音声が受信されると(ステップT4にて
「YES」)、受信された音声に電波環境データや経過
時間データが添付されているか否かを判定する(ステッ
プT5、T6)。
【0053】ここで、CPU17は、車載端末1から受
信された音声に電波環境データや経過時間データが添付
されていない旨を判定すると(ステップT5にて「N
O」、ステップT6にて「NO」)、音声認識データベ
ース22を参照することにより、受信された音声認識に
対して音声認識を行う(ステップT7)。そして、CP
U17は、音声認識を行った結果を通信部18から電話
網3を通じて車載端末1に送信させる(ステップT
8)。
【0054】以上に説明したように、音声認識サーバ4
は、車載端末1から電波環境データや経過時間データが
添付されていない音声が受信されると、つまり、車載端
末1との間の無線通信に係る電波環境が良好であるとき
に、車載端末1から音声が受信されると、受信された音
声に対して音声認識を行い、音声認識を行った結果を車
載端末1に送信することになる。
【0055】また、CPU17は、車載端末1から受信
された音声に電波環境データが添付されている旨を判定
すると(ステップT5にて「YES」)、添付されてい
る電波環境データを解析し(ステップT9)、電波環境
データにより表される電界強度と、先に設定された電波
環境に対するリジェクト閾値とを比較する(ステップT
10)。
【0056】そして、CPU17は、電波環境データに
より表される電界強度がリジェクト閾値以上である旨を
判定すると(ステップT10にて「YES」)、音声認
識データベース22を参照することにより、この場合
は、受信された音声に対して音声認識レベルを高めて音
声認識を行い(ステップT11)、音声認識を行った結
果を通信部18から電話網3を通じて車載端末1に送信
させる(ステップT12)。
【0057】これに対して、CPU17は、電波環境デ
ータにより表される電界強度がリジェクト閾値未満であ
る旨を判定すると(ステップT10にて「NO」)、車
載端末1から受信された音声に対して音声認識を行うこ
となく、音声認識を拒否した旨を表す拒否通知信号を電
話網3を通じて車載端末1に送信させる(ステップT1
3)。
【0058】以上に説明したように、音声認識サーバ4
は、車載端末1から電波環境データが添付されている音
声が受信されると、つまり、車載端末1との間の無線通
信に係る電波環境が劣悪であるときに、車載端末1から
音声が受信されると、電波環境データにより表される電
界強度がリジェクト閾値以上である旨を条件として、受
信された音声に対して音声認識レベルを高めて音声認識
を行い、音声認識を行った結果を車載端末1に送信する
ことになる。
【0059】さらに、CPU17は、車載端末1から受
信された音声に経過時間データが添付されている旨を判
定すると(ステップT5にて「NO」、ステップT6に
て「YES」)、添付されている経過時間データを解析
し(ステップT14)、経過時間データにより表される
経過時間と、先に設定された経過時間に対するリジェク
ト閾値とを比較する(ステップT15)。
【0060】そして、CPU17は、経過時間データに
より表される経過時間がリジェクト閾値以上である旨を
判定すると(ステップT15にて「YES」)、音声認
識データベース22を参照することにより、受信された
音声認識に対して音声認識を行い(ステップT16)、
音声認識を行った結果を通信部18から電話網3を通じ
て車載端末1に送信させる(ステップT17)。
【0061】これに対して、CPU17は、経過時間デ
ータにより表される経過時間がリジェクト閾値未満であ
る旨を判定すると(ステップT15にて「NO」)、こ
の場合も、車載端末1から受信された音声に対して音声
認識を行うことなく、音声認識を拒否した旨を表す拒否
通知信号を電話網3を通じて車載端末1に送信させる
(ステップT18)。
【0062】以上に説明したように、音声認識サーバ4
は、車載端末1から経過時間データが添付されている音
声が受信されると、つまり、車載端末1との間の無線通
信に係る電波環境が劣悪であるときに入力された音声が
車載端末1から受信されると、経過時間データにより表
される経過時間がリジェクト閾値以上である旨を条件と
して、受信された音声に対して音声認識を行い、音声認
識を行った結果を車載端末1に送信することになる。
【0063】ところで、以上は、車載端末1において、
CPU5が車載端末1と音声認識サーバ4との間の無線
通信に係る電波環境を判定する場合を説明したものであ
るが、CPU5が自動車2に搭載されている各種の装置
の動作状態を表す動作データを車両インタフェース部1
6を通じて入力することにより、自動車2の状態を判定
する場合も、これと同様である。
【0064】すなわち、車載端末1は、例えばエアコン
が動作していたり、オーディオ機器が動作していたり、
ワイパーが動作していたりすることが原因となって、周
囲の騒音が大きい場合には、音声の入力を禁止したり、
音声と共に周囲の騒音の程度を示すデータを音声認識サ
ーバ4に送信したり、周囲の騒音が小さくなってから、
音声を音声認識サーバ4に送信したりする。
【0065】以上に説明したように本実施例によれば、
車載端末1において、音声入力禁止モードが動作モード
として設定されている場合は、受信信号の電界強度が閾
値未満になると、音声の入力を禁止するように構成した
ので、音声認識サーバ4は、車載端末1から音声を受信
することがなく、音声認識そのものを行うことがないの
で、音声認識を行う場合に誤認識が発生することを未然
に回避することができ、これによって、音声認識性能が
低下することを未然に回避することができる。
【0066】また、車載端末1において、電波環境デー
タ送信モードが動作モードとして設定されている場合
は、受信信号の電界強度が閾値未満になると、乗員が音
声を発すると、乗員から発せられた音声を入力し、電波
環境データを取得することにより、入力された音声を電
波環境データと共に音声認識サーバ4に送信するように
構成したので、音声認識サーバ4は、電波環境が劣悪で
ある旨を認識することができ、そのような状況に対し
て、例えば音声認識レベルを高めて音声認識を行うなど
の適切な対応を行うことにより、音声認識を行う場合に
誤認識が発生することを未然に回避することができ、こ
れによって、音声認識性能が低下することを未然に回避
することができる。
【0067】さらに、車載端末1において、音声記憶モ
ードが動作モードとして設定されている場合は、受信信
号の電界強度が閾値未満になると、乗員から発せられた
音声を記憶し、受信信号の電界強度が閾値以上になって
から、経過時間データを取得することにより、入力され
て記憶されていた音声を経過時間データと共に音声認識
サーバ4に送信するように構成したので、音声認識サー
バ4は、電波環境が劣悪であるときには、車載端末1か
ら音声を受信することがなく、電波環境が良好になって
から、車載端末1から一時的に記憶されていた音声を受
信し、受信された音声に対して音声認識を行うことにな
り、音声認識を行う場合に誤認識が発生することを未然
に回避することができ、これによって、音声認識性能が
低下することを未然に回避することができる。
【0068】本発明は、上記した実施例にのみ限定され
るものではなく、以下のように変形または拡張すること
ができる。端末は、自動車に搭載される車載端末に限ら
ず、人が携帯可能な携帯端末であっても良く、また、自
動車に搭載される車載端末であれば、車室内に着脱可能
な構成であっても良いし、車室内に組込まれている(モ
ジュール化されている)構成であっても良い。
【0069】電波環境や車両状態を表す表示ガイダンス
を表示部に表示する構成に限らず、音声出力機能を搭載
することにより、電波環境や車両状態を表す音声ガイダ
ンスをスピーカから出力する構成であっても良い。ま
た、表示ガイダンスを表示する構成と音声ガイダンスを
出力する構成とを併用しても良い。音声認識サーバにお
いて、電波環境に対しての音声認識を拒否するか否かを
判定するための基準となるリジェクト閾値や、経過時間
に対しての音声認識を拒否するか否かを判定するための
基準となるリジェクト閾値を必要に応じて設定する構成
であっても良い。
【0070】車載端末のCPUや音声認識サーバのCP
Uが実行する制御プログラムは、最初(例えば製品化の
段階)から記憶されているものに限らず、例えば特定の
サーバからネットワークを通じてダウンロードされたり
或いはCD−ROM(Compact Disk-Read Only Memor
y)やカードなどの記録媒体から転送されてインストー
ルされるものであっても良い。
【図面の簡単な説明】
【図1】本発明の一実施例の全体構成を概略的に示す図
【図2】車載端末の電気的な構成を示す機能ブロック図
【図3】音声認識サーバの電気的な構成を示す機能ブロ
ック図
【図4】車載端末のCPUが行う処理を示すフローチャ
ート
【図5】図4相当図
【図6】図4相当図
【図7】車載端末における表示の一例を示す図
【図8】音声認識サーバのCPUが行う処理を示すフロ
ーチャート
【符号の説明】
図面中、1は車載端末(端末)、2は自動車(車両)、
3は電話網、4は音声認識サーバ、5はCPU(制御手
段)、12は通信部(送信手段)、13は記憶部(記憶
手段)、15は表示部(報知手段)、17はCPU(音
声認識手段)、18は通信部(受信手段)である。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 3/00 551A

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力する音声入力手段を備え、端
    末から受信された音声に対して音声認識を行う音声認識
    サーバと共に音声認識システムで用いられる端末であっ
    て、 音声認識サーバとの間の無線通信に係る電波環境や端末
    を搭載している車両の状態を表す車両状態が所定条件を
    満たしていないときに、前記音声入力手段による音声の
    入力を禁止する制御手段を備えたことを特徴とする端
    末。
  2. 【請求項2】 音声を入力する音声入力手段を備え、端
    末から受信された音声に対して音声認識を行う音声認識
    サーバと共に音声認識システムで用いられる端末であっ
    て、 前記音声入力手段により入力された音声を音声認識サー
    バに送信する送信手段と、 音声認識サーバとの間の無線通信に係る電波環境や端末
    を搭載している車両の状態を表す車両状態が所定条件を
    満たしていないときに、音声が前記音声入力手段により
    入力されたときには、入力された音声を電波環境を表す
    データや車両状態を表すデータと共に前記送信手段から
    音声認識サーバに送信させる制御手段とを備えたことを
    特徴とする端末。
  3. 【請求項3】 音声を入力する音声入力手段を備え、端
    末から受信された音声に対して音声認識を行う音声認識
    サーバと共に音声認識システムで用いられる端末であっ
    て、 前記音声入力手段により入力された音声を記憶する記憶
    手段と、 前記記憶手段に記憶されている音声を音声認識サーバに
    送信する送信手段と、 音声認識サーバとの間の無線通信に係る電波環境や端末
    を搭載している車両の状態を表す車両状態が所定条件を
    満たしていないときに、音声が前記音声入力手段により
    入力されたときには、入力された音声を前記記憶手段に
    記憶させ、電波環境や車両状態が所定条件を満たすよう
    になってから、前記記憶手段に記憶されている音声を前
    記送信手段から音声認識サーバに送信させる制御手段と
    を備えたことを特徴とする端末。
  4. 【請求項4】 請求項3に記載した端末において、 前記制御手段は、前記記憶手段に記憶されている音声を
    当該音声が前記記憶手段に記憶されてからの経過時間を
    表すデータと共に前記送信手段から音声認識サーバに送
    信させることを特徴とする端末。
  5. 【請求項5】 請求項1ないし4のいずれかに記載した
    端末において、 報知動作を行う報知手段を備え、 前記制御手段は、電波環境や車両状態が所定条件を満た
    しているか否かの判定結果を区別するように前記報知手
    段を動作させることを特徴とする端末。
  6. 【請求項6】 請求項2に記載した端末と共に音声認識
    システムで用いられる音声認識サーバであって、 端末から音声を受信する受信手段と、 端末から音声と共に電波環境を表すデータや車両状態を
    表すデータが前記受信手段により受信されたときに、受
    信された電波環境を表すデータや車両状態を表すデータ
    が所定条件を満たしている旨を条件として、受信された
    音声に対して音声認識を行う音声認識手段とを備えたこ
    とを特徴とする音声認識サーバ。
  7. 【請求項7】 請求項2に記載した端末と、 請求項6に記載した音声認識サーバとを備えてなること
    を特徴とする音声認識システム。
  8. 【請求項8】 請求項4に記載した端末と共に音声認識
    システムで用いられる音声認識サーバであって、 端末から音声を受信する受信手段と、 端末から音声と共に経過時間を表すデータが前記受信手
    段により受信されたときに、受信された経過時間を表す
    データが所定条件を満たしている旨を条件として、受信
    された音声に対して音声認識を行う音声認識手段とを備
    えたことを特徴とする音声認識サーバ。
  9. 【請求項9】 請求項4に記載した端末と、 請求項8に記載した音声認識サーバとを備えてなること
    を特徴とする音声認識システム。
  10. 【請求項10】 端末から受信された音声に対して音声
    認識を行う音声認識サーバと共に音声認識システムで用
    いられる端末に、 音声認識サーバとの間の無線通信に係る電波環境や端末
    を搭載している車両の状態を表す車両状態が所定条件を
    満たしているか否かを判定させる手順と、 電波環境や車両状態が所定条件を満たしていない旨が判
    定されているときに、音声の入力を禁止させる手順とを
    実行させるためのコンピュータプログラム。
  11. 【請求項11】 端末から受信された音声に対して音声
    認識を行う音声認識サーバと共に音声認識システムで用
    いられる端末に、 音声認識サーバとの間の無線通信に係る電波環境や端末
    を搭載している車両の状態を表す車両状態が所定条件を
    満たしているか否かを判定させる手順と、 電波環境や車両状態が所定条件を満たしていない旨が判
    定されているときであって音声が入力されたときに、入
    力された音声を電波環境を表すデータや車両状態を表す
    データと共に音声認識サーバに送信させる手順とを実行
    させるためのコンピュータプログラム。
  12. 【請求項12】 端末から受信された音声に対して音声
    認識を行う音声認識サーバと共に音声認識システムで用
    いられる端末に、 音声認識サーバとの間の無線通信に係る電波環境や端末
    を搭載している車両の状態を表す車両状態が所定条件を
    満たしているか否かを判定させる手順と、 電波環境や車両状態が所定条件を満たしていない旨が判
    定されているときであって音声が入力されたときに、入
    力された音声を記憶させる手順と、 電波環境や車両状態が所定条件を満たしている旨が判定
    されてから、記憶されている音声を音声認識サーバに送
    信させる手順とを実行させるためのコンピュータプログ
    ラム。
JP2002149147A 2002-05-23 2002-05-23 端末、音声認識サーバ、音声認識システムおよびコンピュータプログラム Pending JP2003345391A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002149147A JP2003345391A (ja) 2002-05-23 2002-05-23 端末、音声認識サーバ、音声認識システムおよびコンピュータプログラム
US10/442,462 US7319963B2 (en) 2002-05-23 2003-05-21 Voice recognition system preventing lowering performance

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002149147A JP2003345391A (ja) 2002-05-23 2002-05-23 端末、音声認識サーバ、音声認識システムおよびコンピュータプログラム

Publications (1)

Publication Number Publication Date
JP2003345391A true JP2003345391A (ja) 2003-12-03

Family

ID=29545255

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002149147A Pending JP2003345391A (ja) 2002-05-23 2002-05-23 端末、音声認識サーバ、音声認識システムおよびコンピュータプログラム

Country Status (2)

Country Link
US (1) US7319963B2 (ja)
JP (1) JP2003345391A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009276495A (ja) * 2008-05-14 2009-11-26 Nippon Telegr & Teleph Corp <Ntt> 音声誤認識訂正支援装置とその方法と、プログラムとその記録媒体
JP2018142329A (ja) * 2018-03-27 2018-09-13 株式会社ユピテル システム及びプログラム
JP2021060585A (ja) * 2020-12-01 2021-04-15 株式会社ユピテル システム及びプログラム

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8005668B2 (en) * 2004-09-22 2011-08-23 General Motors Llc Adaptive confidence thresholds in telematics system speech recognition
US9257120B1 (en) 2014-07-18 2016-02-09 Google Inc. Speaker verification using co-location information
US9318107B1 (en) 2014-10-09 2016-04-19 Google Inc. Hotword detection on multiple devices
US9530408B2 (en) 2014-10-31 2016-12-27 At&T Intellectual Property I, L.P. Acoustic environment recognizer for optimal speech processing
JP6621613B2 (ja) 2015-08-10 2019-12-18 クラリオン株式会社 音声操作システム、サーバー装置、車載機器および音声操作方法
US9972320B2 (en) * 2016-08-24 2018-05-15 Google Llc Hotword detection on multiple devices
EP4328905A3 (en) 2016-11-07 2024-04-24 Google Llc Recorded media hotword trigger suppression
US10522137B2 (en) 2017-04-20 2019-12-31 Google Llc Multi-user authentication on a device

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58144211A (ja) * 1982-02-22 1983-08-27 Mitsubishi Electric Corp 音声入力制御装置
JPS6174426A (ja) 1984-09-20 1986-04-16 Hitachi Ltd 音声情報入力装置
JPS62172397A (ja) 1986-01-25 1987-07-29 株式会社日立製作所 音声入出力装置
JPS63265749A (ja) 1988-03-28 1988-11-02 Nippon Denso Co Ltd 車両用音声制御装置
JP3356370B2 (ja) 1996-04-03 2002-12-16 ケイディーディーアイ株式会社 データ伝送装置
JP3529621B2 (ja) * 1997-05-12 2004-05-24 株式会社東芝 ルータ装置、データグラム転送方法及び通信システム
JPH11150760A (ja) 1997-11-14 1999-06-02 Nec Eng Ltd 簡易型携帯電話陸上移動局
JP2000013861A (ja) 1998-06-18 2000-01-14 Nec Corp 携帯電話システム
JP2000075893A (ja) 1998-08-31 2000-03-14 Olympus Optical Co Ltd 音声認識装置
JP3846161B2 (ja) 2000-06-20 2006-11-15 セイコーエプソン株式会社 音声による情報提供システムおよびその誤動作原因報知方法
US6934756B2 (en) * 2000-11-01 2005-08-23 International Business Machines Corporation Conversational networking via transport, coding and control conversational protocols
US6885735B2 (en) * 2001-03-29 2005-04-26 Intellisist, Llc System and method for transmitting voice input from a remote location over a wireless data channel

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009276495A (ja) * 2008-05-14 2009-11-26 Nippon Telegr & Teleph Corp <Ntt> 音声誤認識訂正支援装置とその方法と、プログラムとその記録媒体
JP2018142329A (ja) * 2018-03-27 2018-09-13 株式会社ユピテル システム及びプログラム
JP2021060585A (ja) * 2020-12-01 2021-04-15 株式会社ユピテル システム及びプログラム
JP7199104B2 (ja) 2020-12-01 2023-01-05 株式会社ユピテル システム及びプログラム

Also Published As

Publication number Publication date
US7319963B2 (en) 2008-01-15
US20030220797A1 (en) 2003-11-27

Similar Documents

Publication Publication Date Title
JP3815388B2 (ja) 音声認識システムおよび端末
US8738368B2 (en) Speech processing responsive to a determined active communication zone in a vehicle
US20100204987A1 (en) In-vehicle speech recognition device
US9026184B2 (en) In-vehicle handsfree apparatus
US8005490B2 (en) In-vehicle apparatus with radio transmission restricting function and radio transmission restricting system
JP2003345391A (ja) 端末、音声認識サーバ、音声認識システムおよびコンピュータプログラム
JP2010074472A (ja) 車載機器及び通信の接続先選択方法
US9830925B2 (en) Selective noise suppression during automatic speech recognition
US8706492B2 (en) Voice recognition terminal
CN108574906B (zh) 用于汽车的声音处理方法、系统和汽车
US8391855B2 (en) Mail operation apparatus with short range wireless communications function
US20090209295A1 (en) In-vehicle handsfree apparatus
US8010166B2 (en) Handsfree apparatus for vehicle
JP2007043356A (ja) 音量自動調節装置および音量自動調節方法
JP3897946B2 (ja) 緊急情報送信システム
JP2000163098A (ja) 音声認識装置
JP2018116206A (ja) 音声認識装置、音声認識方法及び音声認識システム
JP2000276187A (ja) 音声認識方法及び音声認識装置
JP5556529B2 (ja) 車載音声認識装置
JP2010263401A (ja) ハンズフリー通話装置、及び該装置の音声補正方法
JP4867624B2 (ja) 音声出力制御装置および車両用ナビゲーション装置
CN111746434A (zh) 智能体装置、智能体装置的控制方法及存储介质
JP2002335342A (ja) 車両用通信装置
JP2007256643A (ja) 音声認識装置及びナビゲーションシステム
JPH1021049A (ja) 音声合成装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060720

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060912