JP2012063582A - 車載音声認識装置 - Google Patents

車載音声認識装置 Download PDF

Info

Publication number
JP2012063582A
JP2012063582A JP2010207766A JP2010207766A JP2012063582A JP 2012063582 A JP2012063582 A JP 2012063582A JP 2010207766 A JP2010207766 A JP 2010207766A JP 2010207766 A JP2010207766 A JP 2010207766A JP 2012063582 A JP2012063582 A JP 2012063582A
Authority
JP
Japan
Prior art keywords
voice
signal input
vehicle
voice command
control signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010207766A
Other languages
English (en)
Other versions
JP5556529B2 (ja
Inventor
Satoshi Tanaka
聡 田中
Takehiro Tsuda
剛宏 津田
Kunio Yokoi
邦雄 横井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2010207766A priority Critical patent/JP5556529B2/ja
Publication of JP2012063582A publication Critical patent/JP2012063582A/ja
Application granted granted Critical
Publication of JP5556529B2 publication Critical patent/JP5556529B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】より利便性の高い機能を実現できるようにする。
【解決手段】音声信号入力手段を介して入力される音声信号から音声コマンドを音声認識し、当該音声コマンドに応じた制御信号を制御対象機器へ送出するようになっており、複数の音声信号入力手段(10、4)より別々に入力される音声信号を、音声信号が入力される音声信号入力手段毎に区別し、当該音声信号の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器(2、3)へ送出する。
【選択図】図1

Description

本発明は、音声認識した音声コマンドに応じた制御信号を制御対象機器へ送出する車載音声認識装置に関するものである。
従来、車載情報端末においては、安全性や利便性向上のために音声認識機能を用いたHMI(Human Machine Interface)が多数採用されている。
このような車載情報端末として、例えば、音声認識機能を用いて乗員の発話する音声から音声コマンドを認識し、認識結果に応じた動作を行うようにしたものがある(例えば、特許文献1参照)。
特開2003−152884号公報
上記特許文献1に記載されたような装置では、音声認識した音声コマンドに対する動作が一律に規定されている。すなわち、音声認識した音声コマンドと、この音声コマンドに対応する動作とが1対1の関係となっている。
しかし、このように音声認識した音声コマンドと、この音声コマンドに対応する動作とが1対1の関係となっている構成では、1つの音声コマンドで1つの動作しか実施することかできないため、利便性の高い機能を実現することはできないといった問題がある。
本発明は上記問題に鑑みたもので、より利便性の高い機能を実現できるようにすることを目的とする。
上記目的を達成するため、請求項1に記載の発明は、音声信号入力手段を介して入力される音声信号から音声コマンドを音声認識し、当該音声コマンドに応じた制御信号を制御対象機器へ送出する車載音声認識装置であって、音声信号入力手段を介して入力される音声信号を予め定められた条件に従って区別し、当該音声信号の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出する制御信号送出手段を備えたことを特徴としている。
このような構成によれば、音声信号入力手段を介して入力される音声信号を予め定められた条件に従って区別し、当該音声信号の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出するので、1つの音声コマンドであっても音声信号の区別に従って異なる制御信号を制御対象機器へ送出することができ、より利便性の高い機能を実現することができる。
また、請求項2に記載の発明は、複数の音声信号入力手段を介して音声信号が別々に入力されるようになっており、制御信号送出手段は、音声信号入力手段を介して入力される音声信号を、音声信号が入力される音声信号入力手段毎に区別することを特徴としている。
このように、音声信号入力手段を介して入力される音声信号を、音声信号が入力される音声信号入力手段毎に区別し、音声信号の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出することができる。
また、請求項3に記載の発明は、音声信号が入力される音声信号入力手段の区別に従って音声コマンドに応じた制御信号を異なるように規定した情報テーブルを記憶する記憶手段を備え、制御信号送出手段は、記憶手段に記憶された情報テーブルを参照して、音声信号が入力される音声信号入力手段の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出することを特徴としている。
このように、音声信号が入力される音声信号入力手段の区別に従って音声コマンドに応じた制御信号を異なるように規定した情報テーブルを参照して、音声信号が入力される音声信号入力手段の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出することができる。
また、請求項4に記載の発明は、音声信号入力手段の1つは車室内マイクであり、音声信号入力手段の1つは、通信インタフェースを介して接続された携帯型通信機器であることを特徴としている。
このように、音声信号入力手段の1つを車室内マイクとし、音声信号入力手段の1つは、通信インタフェースを介して接続された携帯型通信機器とすることができる。
また、請求項5に記載の発明は、車室内の乗員の有無を判定する乗員有無判定手段と、乗員有無判定手段により車室内に乗員がいると判定された場合、携帯型通信端末のマイクを介して入力される音声信号より音声認識した音声コマンドに応じた制御信号の送出を禁止する制御信号送出禁止手段と、を備えたことを特徴としている。
このような構成によれば、車室内に乗員がいると判定された場合、携帯型通信端末のマイクを介して入力される音声信号より音声認識した音声コマンドに応じた制御信号の送出が禁止されるので、車室内にいる搭乗者の意に反して携帯型通信端末の使用者によって制御対象機器の設定等が変更されてしまうといった問題を防止することができる。
また、請求項6に記載の発明は、音声信号入力手段を介して入力される音声信号を解析して音声の特徴を特定する音声特徴特定手段を備え、制御信号送出手段は、音声信号入力手段を介して入力される音声信号を、音声特徴特定手段により特定された音声の特徴に従って区別することを特徴としている。
このように、音声信号入力手段を介して入力される音声信号を解析して音声の特徴を特定する音声特徴特定手段を備え、音声信号入力手段を介して入力される音声信号を、音声特徴特定手段により特定された音声の特徴に従って区別し、音声の特徴の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出することができる。
また、請求項7に記載の発明は、音声特徴特定手段により特定された音声の特徴と制御対象機器の設定内容を関連付けしたデータベースを作成して記憶手段に蓄積記憶させる処理を行うデータベース作成処理手段を備え、制御信号送出手段は、記憶手段に記憶されたデータベースを参照して、音声特徴特定手段により特定された音声の特徴と同一区分の特徴に関連付けられた制御対象機器の設定内容を示す音声コマンドを示す制御信号を制御対象機器へ送出することを特徴としている。
このような構成によれば、音声特徴特定手段により特定された音声の特徴と制御対象機器の設定内容を関連付けしたデータベースが作成され、このデータベースを参照して、音声特徴特定手段により特定された音声の特徴と同一区分の特徴に関連付けられた制御対象機器の設定内容を示す音声コマンドを示す制御信号が制御対象機器へ送出される。すなわち、ユーザが過去に発声した音声コマンドの特徴と、そのときに設定された制御対象機器の設定内容とを関連付けしたデータベースが自動的に作成され、このデータベースを参照して、音声特徴特定手段により特定された音声の特徴と同一区分の特徴に関連付けられた制御対象機器の設定内容を示す音声コマンドを示す制御信号を制御対象機器へ送出することができる。
また、請求項8に記載の発明は、音声コマンドを発声する乗員を特定する乗員特定手段を備え、データベース作成処理手段は、乗員特定手段により特定された乗員毎にデータベースを作成し、制御信号送出手段は、乗員特定手段により特定された乗員に関する情報をデータベースより読み出して、音声信号解析手段により解析された音声の特徴と同じ分類に関連付けられた制御対象機器の設定内容を示す音声コマンドを示す制御信号を制御対象機器へ送出すること特徴としている。
このような構成によれば、音声コマンドを発声する乗員が別の乗員に変わっても、乗員毎にデータベースが作成され、音声コマンドを発声する乗員に関する情報をデータベースより読み出して、解析された音声の特徴と同じ分類に関連付けられた制御対象機器の設定内容を示す音声コマンドを示す制御信号が制御対象機器へ送出されるので、乗員の音声を別の乗員の音声と混同して誤動作を引き起こすようなことを防止することが可能である。
本発明の第1実施形態に係る車載音声認識装置のブロック構成を示す図である。 情報テーブルの構成について説明するための図である。 本発明の第1実施形態に係る制御部の処理を示すフローチャートである。 本発明の第2実施形態に係る車載音声認識装置のブロック構成を示す図である。 データベースの構成についえ説明するための図である。 本発明の第2実施形態に係る制御部の処理を示すフローチャートである。
(第1実施形態)
本発明の第1実施形態に係る車載音声認識装置のブロック構成を図1に示す。本車載音声認識装置1は、マイク10、通信部12、車内通信制御部13、ディスプレイ14、スピーカ15および制御部16を備えている。本車載音声認識装置1は、車内通信制御部13に接続された車内LAN5を介してエアコンECU2、オーディオECU3等と接続されている。
マイク10は、車室内の音声を集音するためのものであり、車室内の音声に応じた音声信号を制御部16へ送出する。
通信部12は、無線通信網を介して外部通信機器と通信するためのものである。本車載音声認識装置1は、通信部12を介して携帯電話4と通信することが可能となっている。
車内通信制御部13は、車内LAN5を介して接続されたエアコンECU2、オーディオECU3等の制御対象機器と通信するためのものである。
制御部16は、この車内通信制御部13を介してエアコンECU2およびオーディオECU3等の制御対象機器を制御することが可能となっている。
ディスプレイ14は、液晶等の表示部を有しており、制御部16より入力される映像信号に応じた映像を表示部に表示させる。
スピーカ15は、車室内に取り付けられており、制御部16より入力される音声信号に応じた音声を出力する。
制御部16は、音声認識処理を行うための音声認識エンジン16aと、ROM、RAM、フラッシュメモリから成る記憶部16bと、CPU(図示せず)を備えたコンピュータとして構成されている。CPUは、記憶部16bに記憶されたプログラムに従って各種処理を実施する。
制御部16は、マイク10あるいは携帯電話4を介して入力される音声信号から音声コマンドを音声認識し、当該音声コマンドに応じた制御信号を各制御対象機器2、3へ送出する。
本車載音声認識装置1の制御部16には、マイク10より音声信号が入力されるとともに、携帯電話4より音声信号が入力されるようになっている。制御部16は、マイク10より入力される音声信号から音声コマンドを音声認識することも、携帯電話4より入力される音声信号から音声コマンドを音声認識することも可能となっている。
本実施形態における制御部16は、マイク10より入力される音声信号と携帯電話4より入力される音声信号を区別し、マイク10より入力される音声信号から音声認識した音声コマンドと携帯電話4より入力される音声信号から音声認識した音声コマンドが同一であっても、マイク10より入力される音声信号から音声認識した音声コマンドに応じて送出する制御信号と、携帯電話4より入力される音声信号から音声認識した音声コマンドに応じて送出する制御信号とを異ならせることが可能となっている。
制御部16の記憶部16bには、音声信号の区別に従って音声コマンドに応じた動作、すなわち音声コマンドに応じて送出する制御信号を異ならせるように規定した情報テーブルが記憶されている。
制御部16は、記憶部16bに記憶された情報テーブルを参照してマイク10より入力される音声信号から音声認識した音声コマンドに応じて送出する制御信号と、携帯電話4より入力される音声信号から音声認識した音声コマンドに応じて送出する制御信号とを異ならせて送出する。
情報テーブルの構成を図2に示す。この図に示すように、情報テーブルには、各音声コマンドに対する動作が入力インタフェース毎に規定されている。
例えば、「エアコンオン」という音声コマンドに対する動作について、入力インタフェースがマイク10の場合には「前回使用時の送風箇所からの送風でエアコンをオン」すると規定され、入力インタフェースが携帯電話4の場合には「全ての送風箇所からの送風でエアコンをオン」すると規定されている。
したがって、車室内でマイク10に向かって「エアコンオン」と発声した場合には、車両の前回使用時の送風箇所からの送風でエアコンがオンするような制御信号がエアコンECU2に送出され、例えば、車両に乗り込む前に車両から離れた場所から携帯電話4を用いて車載音声認識装置1に通信接続して「エアコンオン」と発声した場合には、車両の全ての送風箇所からの送風でエアコンがオンするような制御信号がエアコンECU2に送出される。
また、「インフォメーション」という音声コマンドに対する動作について、入力インタフェースがマイク10の場合には「交通情報、ガソリン価格等の情報を提供」すると規定され、入力インタフェースが携帯電話4の場合には「鍵が掛かっているかどうか、窓の開閉状態等の情報を提供」すると規定されている。
したがって、車室内でマイク10に向かって「インフォメーション」と発声した場合には、交通情報、ガソリン価格等の情報を表示させるような制御信号がオーディオECU3に送出され、例えば、車両から離れた場所から携帯電話4を用いて車載音声認識装置1に通信接続して「インフォメーション」と発声した場合には、「鍵が掛かっているかどうか」、「窓の開閉状態」等の情報が携帯電話4へ通知される。
次に、図3に従って制御部16の処理について説明する。本車載音声認識装置1は、車両のイグニッションスイッチがオン状態になると通常モードで動作するようになり、車両のイグニッションスイッチがオフ状態になると低消費電力モードで動作するようになる。制御部16は、音声認識の開始を指示するためのPTT(Push Talk Switch)の押下操作、あるいは、外部機器からの着呼があると、動作モードと関係なく図3に示す処理を実施する。
まず、入力インタフェースの判定を行う(S100)。本実施形態では、入力インタフェースとしてマイク10が用いられているか携帯電話4が用いられているかを判定する。
ここで、入力インタフェースとしてマイク10が用いられている場合、S100の判定は「マイク」となり、次に、マイクを入力インタフェースとした設定にする(S102)。具体的には、RAMの予め定められた領域に入力インタフェースがマイクであることを示すフラグを設定する。
次に、コマンド発話を促すガイダンスを再生する(S104)。例えば、「音声コマンドを発声して下さい」といったガイダンスをスピーカ15より音声出力させる。
このガイダンスに従ってユーザの発話が行われると、次に、音声認識処理を実施する(S106)。例えば、ユーザが「エアコンオン」と発話すると、「エアコンオン」という音声コマンドが音声認識される。
次に、認識結果に応じた制御信号を送出する(S108)。具体的には、S102にて設定したフラグを参照して、入力インタフェースとしてマイク10が用いられているか携帯電話4が用いられているかを区別するとともに、情報テーブルを参照して、音声信号が入力される入力インタフェースの区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出する。
上記したように、入力インタフェースとしてマイク10が用いられており、S106にて「エアコンオン」という音声コマンドが音声認識された場合、車両の全ての送風箇所からの送風でエアコンがオンするような制御信号がエアコンECU2に送出される。
また、入力インタフェースとしてマイク10が用いられており、S106にて「インフォメーション」という音声コマンドが音声認識された場合、交通情報やガソリン価格等の情報を表示させるような制御信号がオーディオECU3に送出され、本処理を終了する。
また、入力インタフェースとして携帯電話4が用いられている場合、S100の判定は「携帯電話」となり、次に、搭乗者が1人でもいるか否かを判定する(S110)。具体的には、車両の各座席の着座面に乗員の座席への着座を検出する着座センサが設けられており、これらの着座センサより出力される信号に基づいて搭乗者が1人でもいるか否かを判定する。
ここで、搭乗者が1人もいない場合、S110の判定はNOとなり、次に、携帯電話4を入力インタフェースとして設定にする(S112)。具体的には、RAMの予め定められた領域に入力インタフェースが携帯電話4であることを示すフラグを設定し、S104へ進む。
この場合、S104にてコマンド発話を促すガイダンスが再生され、このガイダンスに従って、例えば、ユーザが「エアコンオン」と発話すると、「エアコンオン」という音声コマンドが音声認識され、S108にて、認識結果に応じた制御信号が送出される。
ここで、入力インタフェースとして携帯電話4が用いられており、S106にて「エアコンオン」という音声コマンドが音声認識された場合、車両の全ての送風箇所からの送風でエアコンがオンするような制御信号がエアコンECU2に送出される。
また、入力インタフェースとして携帯電話4が用いられており、S106にて「インフォメーション」という音声コマンドが音声認識された場合、「鍵が掛かっているかどうか」、「窓の開閉状態」等の情報が携帯電話4へ通知される。
また、入力インタフェースとして携帯電話4が用いられており、搭乗者が1人でもいる場合、S110の判定はYESとなり、次に、携帯電話でのアクセスを禁止する(S114)。具体的には、携帯電話4のマイクにより集音された音声に応じた音声コマンドに応じた制御信号の送出を禁止する。これにより、車室内にいる搭乗者の意に反して携帯電話4を所有する他者によって勝手に制御対象機器の設定等が変更されてしまうといったことが防止される。
次に、音声認識終了のガイダンスを再生して(S116)、本処理を終了する。
上記した構成によれば、音声信号入力手段を介して入力される音声信号を予め定められた条件に従って区別し、当該音声信号の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出するので、1つの音声コマンドであっても音声信号の区別に従って異なる制御信号を制御対象機器へ送出することができ、より利便性の高い機能を実現することができる。
具体的には、入力される音声信号を、音声信号が入力される音声信号入力手段毎に区別し、音声信号の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出することができる。
また、音声信号が入力される音声信号入力手段の区別に従って音声コマンドに応じた制御信号を異なるように規定した情報テーブルを参照して、音声信号が入力される音声信号入力手段の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出することができる。
また、音声信号入力手段の1つを車室内マイクとし、音声信号入力手段の1つは、通信インタフェースを介して接続された携帯型通信機器とすることができる。
また、車室内に乗員がいると判定された場合、携帯型通信端末のマイクを介して入力される音声信号より音声認識した音声コマンドに応じた制御信号の送出が禁止されるので、車室内にいる搭乗者の意に反して携帯型通信端末の使用者によって制御対象機器の設定等が変更されてしまうといった問題を防止することができる。
(第2実施形態)
本実施形態に係る車載音声認識装置の構成を図4に示す。本車載音声認識装置1は、マイク10、車内通信制御部13、ディスプレイ14、スピーカ15および制御部16を備えている。本車載音声認識装置1は、通信部12を介して携帯電話4と通信することが可能となっている。なお、上記第1実施形態と同一部分には同一符号を付して説明を省略し、以下、異なる部分を中心に説明する。
本実施形態では、マイク10より出力される音声信号が制御部16へ直接入力されるようになっている。
上記第1実施形態では、入力される音声信号を、マイク10より入力されたものであるか携帯電話4より入力されたものであるかによって区別し、この区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出したが、本実施形態では、入力される音声信号を解析して音声のトーンを区別し、この区別に従って音声コマンドに応じて制御対象機器へ送出する制御信号を異ならせるようになっている。
本実施形態における制御部16は、マイク10を介して入力される音声信号を解析して音声のトーンを区別するとともに、当該区別した音声のトーンと制御対象機器の設定内容を関連付けして蓄積記憶したデータベースを作成して記憶部16bに蓄積記憶させるとともに、このデータベースを参照して、解析した音声のトーンと同じトーンで過去に高い頻度で設定された設定内容を特定し、この特定した操作内容を示す音声コマンドを示す制御信号を制御対象機器へ送出する処理を実施する。この処理については後で詳細に説明する。
図5に、データベースの構成を示す。図に示すように、ユーザ毎に、かつ、音声コマンドを複数のトーンパターンに分類して、音声コマンドと動作履歴を関連付けしたデータベースが作成される。
なお、トーンパターンは、音声のトーンの高さを表している。本実施形態では、音声コマンドの周波数を解析して、音声コマンドのトーンパターンを特定する。なお、「エアコンオン」という音声コマンドについては、A、B、Cの3つのトーンパターンに分類して音声コマンドと動作履歴が関連付けてデータベースに蓄積記憶され、「オーディオオン」という音声コマンドについてはA、Bの2つのトーンパターンに分類して音声コマンドと動作履歴が関連付けてデータベースに蓄積記憶される。なお、トーンパターンA、B、Cの順にトーンが低くなる。
例えば、ユーザXが、「エアコンオン」という音声コマンドに続いてエアコンの設定温度の入力を示す「設定温度変更」、「25℃」という音声コマンドをトーンパターンAに分類されるトーンで発声すると、図5に示すように「エアコンオン」という音声コマンドに対して、ユーザX、トーンパターンA、動作履歴25℃の項目の登録回数が1つ増加するようになっている。
また、ユーザXの体調が悪く、「エアコンオン」という音声コマンドに続いて、「設定温度変更」、「28℃」という音声コマンドをトーンパターンBに分類されるトーンで発声すると、図5に示すように「エアコンオン」という音声コマンドに対して、ユーザX、トーンパターンB、動作履歴28℃の項目の登録回数が1つ増加するようになっている。
また、ユーザがYさんとなっている場合には、ユーザYの音声コマンドと動作履歴を関連付けしたデータベースが蓄積記憶される。
また、「オーディオオン」という音声コマンドについては、ユーザ毎に、かつ、音声コマンドをトーンパターンA、Bに分類して、音声コマンドと動作履歴を関連付けしたデータベースが作成される。
次に、制御部16の処理について説明する。図6に、制御部16のフローチャートを示す。本実施形態に係る制御部16は、音声認識の開始を指示するためのPTT(Push Talk Switch)が押下操作されると、図6に示す処理を実施する。
まず、ユーザ名の発話を促すガイダンスを生成する(S200)。例えば、「ユーザ名を発声して下さい」といったガイダンスをスピーカ15より音声出力させる。
このガイダンスに従ってユーザ名の発話が行われると、次に、音声認識処理を実施する(S202)。例えば、ユーザが「X」と発話すると、「X」というユーザ名が音声認識される。
次に、音声認識したユーザ名に従って使用ユーザを設定する(S204)。S202にて「X」というユーザ名が音声認識された場合、使用ユーザを「X」として登録する。
次に、コマンド発話を促すガイダンスを再生する(S206)。例えば、「音声コマンドを発声して下さい」といったガイダンスをスピーカ15より音声出力させる。
このガイダンスに従ってユーザの発話が行われると、次に、音声認識処理を実施する(S208)。例えば、「エアコンオン」という音声コマンドが発声されると、「エアコンオン」という音声コマンドが音声認識される。
次に、マイク10より入力される音声信号を解析して音声コマンドのトーンを検出する(S210)。ここでは、「エアコンオン」という音声コマンドのトーンパターンを特定する。
次に、トーンパターンに対応した動作履歴内で登録回数が規定値を超えているものがあるか否かを判定する(S212)。具体的には、データベースを参照して、S208にて認識した音声コマンドで、かつ、S210にて特定されたトーンパターンで登録されている設定温度で、規定値を超えて登録されているものがあるか否かを判定する。
ここで、S208にて認識した音声コマンドで、かつ、S210にて特定されたトーンパターンで登録されている設定温度で、規定値を超えて登録されているものがない場合、S212の判定はNOとなり、エアコンの設定温度を標準温度設定にする(S220)。本実施形態では、25℃が標準温度となっている。
次に、設定温度の変更指示があるか否かを判定する(S222)。具体的には、「設定温度変更」という音声コマンドを音声認識した否かに基づいて設定温度の変更指示があるか否かを判定する。
ここで、「設定温度変更」という音声コマンドが発声され、「設定温度変更」という音声コマンドを音声認識した場合、S222の判定はYESとなり、次に、音声認識処理を実施する(S224)。ここで、ユーザXが、「27℃」と発声すると、「27℃」という音声コマンドを音声認識する。
次に、ユーザXが発声した音声コマンドのトーンを検出する(S226)。ここでは、「27℃」という音声コマンドのトーンパターンを特定する。このように、S210とは別に、再度、音声コマンドのトーンパターンを特定することで、音声コマンドのトーンの検出精度を高くしている。
次に、トーンパターンと設定温度を関連付けてデータベースに登録する(S228)。例えば、S224にて「27℃」という音声コマンドが音声認識されており、S226にてトーンパターンがAとして特定されている場合、ユーザXに対して、トーンパターンAと設定温度「27℃」を関連付けてデータベースに登録する。なお、同条件のものが既にデータベースに登録されている場合には、同条件の登録回数に1を加算する。

次に、認識結果に応じた制御信号をエアコンECU2へ送信する(S218)。ここでは、エアコンの設定温度が27℃になるような制御信号をエアコンECU2へ送信する。
また、「設定温度変更」という音声コマンドが一定時間内に発声されない場合、S222の判定はNOとなり、S210にて検出されたトーンパターンを標準温度と関連付けてデータベースに登録する(S230)。例えば、S210にて「エアコンオン」という音声コマンドのトーンパターンがCとして特定されている場合、トーンパターンを標準温度(25℃)と関連付けてデータベースに登録する。
次に、認識結果に応じた制御信号をエアコンECU2へ送信する(S218)。ここでは、設定温度が標準温度(25℃)で、エアコンをオンする制御信号をエアコンECU2へ送信する。
また、S208にて、ユーザXによる「エアコンオン」という音声コマンドが音声認識され、S210にて、「エアコンオン」という音声コマンドのトーンパターンを特定し、データベースにS208にて認識した音声コマンドで、かつ、S210にて特定されたトーンパターンで登録されている設定温度で、規定値を超えて登録されているものがある場合、S212の判定はYESとなり、次に、最多の設定温度に設定する(S213)。すなわち、規定値を超えて登録されているものの中で、最多の設定温度にする。
従って、図5に示したデータベース構成となっている場合、ユーザXが「エアコンオン」という音声コマンドをトーンパターンAに分類されるトーンで発声した場合、登録回数の最も多い25℃を設定温度として設定する。
また、ユーザXが「エアコンオン」という音声コマンドをトーンパターンBに分類されるトーンで発声した場合、トーンパターンBで、規定値以上、かつ、最も登録回数の多い28℃を設定温度として設定する。
次に、設定温度の変更があるか否かを判定する(S214)。ここで、ユーザ操作により設定温度が変更されると、S214の判定はYESとなり、S224へ進む。また、設定温度が変更されない場合、S214の判定はNOとなり、次に、音声コマンドとトーンパターンを関連付けてデータベースを更新する(S215)。例えば、ユーザXに対して、「エアコンオン」という音声コマンドとトーンパターンを関連付けてデータベースに登録する。なお、同条件のものが既にデータベースに登録されている場合には、同条件の登録回数に1を加算する。
次に、認識結果に応じた制御信号をエアコンECU2へ送信する(S218)。ユーザXが「エアコンオン」という音声コマンドをトーンパターンAに分類されるトーンで発声した場合には、設定温度を25℃として、エアコンをオンする制御信号をエアコンECU2へ送信する。また、ユーザXが「エアコンオン」という音声コマンドをトーンパターンBに分類されるトーンで発声した場合には、設定温度を28℃として、エアコンをオンする制御信号をエアコンECU2へ送信する。
上記したように、音声信号入力手段を介して入力される音声信号を解析して音声の特徴を特定する音声特徴特定手段を備え、音声信号入力手段を介して入力される音声信号を、音声特徴特定手段により特定された音声の特徴に従って区別し、音声の特徴の区別に従って音声コマンドに応じた制御信号を異ならせて制御対象機器へ送出することができる。
また、音声特徴特定手段により特定された音声の特徴と制御対象機器の設定内容を関連付けしたデータベースが作成され、このデータベースを参照して、音声特徴特定手段により特定された音声の特徴と同一区分の特徴に関連付けられた制御対象機器の設定内容を示す音声コマンドを示す制御信号が制御対象機器へ送出される。すなわち、ユーザが過去に発声した音声コマンドの特徴と、そのときに設定された制御対象機器の設定内容とを関連付けしたデータベースが自動的に作成され、このデータベースを参照して、音声特徴特定手段により特定された音声の特徴と同一区分の特徴に関連付けられた制御対象機器の設定内容を示す音声コマンドを示す制御信号を制御対象機器へ送出することができる。
また、音声コマンドを発声する乗員が別の乗員に変わっても、上記した構成によれば、乗員毎にデータベースが作成され、音声コマンドを発声する乗員に関する情報をデータベースより読み出して、解析された音声の特徴と同じ分類に関連付けられた制御対象機器の設定内容を示す音声コマンドを示す制御信号が制御対象機器へ送出されるので、乗員の音声を別の乗員の音声と混同して誤動作を引き起こすようなことを防止することが可能である。
なお、本発明は上記実施形態に限定されるものではなく、本発明の趣旨に基づいて種々なる形態で実施することができる。
例えば、上記実施形態では、エアコンECU2、オーディオECU3を制御対象機器として説明したが、これらのECUの限定されるものではなく、例えば、他のECUや携帯電話4を制御対象機器としてもよい。
また、上記第1実施形態では、音声信号入力手段の1つを通信インタフェースを介して接続された携帯電話のマイクとした構成を示したが、携帯電話に限定されるものではなく、例えば、携帯型通信装置とすることもできる。
また、上記第実施形態では、無線通信網を介して携帯電話4と通信する構成を示したが、例えば、ブルートゥース等のインタフェースを介して携帯電話4と通信するようにしてもよい。
上記第2実施形態では、入力される音声信号を、音声のトーンに従って区別したが、音声のトーンに限定されるものではなく、音声の大きさ、音声の大きさとトーンの組合せなど、各種音声の特徴に従って区別するようにしてもよい。
なお、上記実施形態における構成と特許請求の範囲の構成との対応関係について説明すると、マイク10、携帯電話4のマイクが音声信号入力手段に相当し、エアコンECU2、オーディオECU3が制御対象機器に相当し、S100〜S108、S218が制御信号送出手段に相当し、記憶部16bが記憶手段に相当し、S110が乗員有無判定手段に相当し、S114が制御信号送出禁止手段に相当し、S210、S226が音声特徴特定手段に相当し、S222〜S230がデータベース作成処理手段に相当し、S200〜S204が乗員特定手段に相当する。
1 車載音声認識装置
2 エアコンECU
3 オーディオECU
4 携帯電話
10 マイク
12 通信部
13 車内通信制御部
14 ディスプレイ
15 スピーカ
16 制御部
16a 音声認識エンジン
16b 記憶部

Claims (8)

  1. 音声信号入力手段を介して入力される音声信号から音声コマンドを音声認識し、当該音声コマンドに応じた制御信号を制御対象機器へ送出する車載音声認識装置であって、
    前記音声信号入力手段を介して入力される前記音声信号を予め定められた条件に従って区別し、当該音声信号の区別に従って前記音声コマンドに応じた制御信号を異ならせて前記制御対象機器へ送出する制御信号送出手段を備えたことを特徴とする車載音声認識装置。
  2. 複数の前記音声信号入力手段を介して前記音声信号が別々に入力されるようになっており、
    前記制御信号送出手段は、前記音声信号入力手段を介して入力される前記音声信号を、前記音声信号が入力される前記音声信号入力手段毎に区別することを特徴とする請求項1に記載の車載音声認識装置。
  3. 前記音声信号が入力される前記音声信号入力手段の区別に従って前記音声コマンドに応じた制御信号を異なるように規定した情報テーブルを記憶する記憶手段を備え、
    前記制御信号送出手段は、前記記憶手段に記憶された前記情報テーブルを参照して、前記音声信号が入力される前記音声信号入力手段の区別に従って前記音声コマンドに応じた制御信号を異ならせて前記制御対象機器へ送出することを特徴とする請求項1または2に記載の車載音声認識装置。
  4. 前記音声信号入力手段の1つは車室内マイクであり、前記音声信号入力手段の1つは、通信インタフェースを介して接続された携帯型通信機器であることを特徴とする請求項3に記載の車載音声認識装置。
  5. 車室内の乗員の有無を判定する乗員有無判定手段と、
    前記乗員有無判定手段により前記車室内に乗員がいると判定された場合、前記携帯型通信端末のマイクを介して入力される前記音声信号より音声認識した前記音声コマンドに応じた制御信号の送出を禁止する制御信号送出禁止手段と、を備えたことを特徴とする請求項4に記載の車載音声認識装置。
  6. 前記音声信号入力手段を介して入力される前記音声信号を解析して音声の特徴を特定する音声特徴特定手段を備え、
    前記制御信号送出手段は、前記音声信号入力手段を介して入力される前記音声信号を、前記音声特徴特定手段により特定された前記音声の特徴に従って区別することを特徴とする請求項1に記載の車載音声認識装置。
  7. 前記音声特徴特定手段により特定された前記音声の特徴と前記制御対象機器の設定内容を関連付けしたデータベースを作成して記憶手段に蓄積記憶させる処理を行うデータベース作成処理手段を備え、
    前記制御信号送出手段は、前記記憶手段に記憶された前記データベースを参照して、前記音声特徴特定手段により特定された前記音声の特徴と同一区分の特徴に関連付けられた前記制御対象機器の設定内容を示す音声コマンドを示す制御信号を前記制御対象機器へ送出することを特徴とする請求項6に記載の車載音声認識装置。
  8. 前記音声コマンドを発声する乗員を特定する乗員特定手段を備え、
    前記データベース作成処理手段は、前記乗員特定手段により特定された乗員毎に前記データベースを作成し、
    前記制御信号送出手段は、前記乗員特定手段により特定された乗員に関する情報を前記データベースより読み出して、前記音声特徴特定手段により特定された前記音声の特徴と同じ分類に関連付けられた前記制御対象機器の設定内容を示す音声コマンドを示す制御信号を前記制御対象機器へ送出することを特徴とする請求項7に記載の車載音声認識装置。
JP2010207766A 2010-09-16 2010-09-16 車載音声認識装置 Expired - Fee Related JP5556529B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010207766A JP5556529B2 (ja) 2010-09-16 2010-09-16 車載音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010207766A JP5556529B2 (ja) 2010-09-16 2010-09-16 車載音声認識装置

Publications (2)

Publication Number Publication Date
JP2012063582A true JP2012063582A (ja) 2012-03-29
JP5556529B2 JP5556529B2 (ja) 2014-07-23

Family

ID=46059355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010207766A Expired - Fee Related JP5556529B2 (ja) 2010-09-16 2010-09-16 車載音声認識装置

Country Status (1)

Country Link
JP (1) JP5556529B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014130566A (ja) * 2013-08-21 2014-07-10 Pioneer Electronic Corp 携帯端末装置、車載器、情報提示方法及び情報提示プログラム
JP2016089670A (ja) * 2014-10-31 2016-05-23 株式会社カーメイト 自動車用遠隔操作装置、及び自動車用遠隔操作システム
JP2021092612A (ja) * 2019-12-06 2021-06-17 Tvs Regza株式会社 コマンド制御装置、制御方法および制御プログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6435893A (en) * 1987-07-31 1989-02-06 Toshiba Electric Equip Lighting control device
JPH1165587A (ja) * 1997-08-18 1999-03-09 Honda Motor Co Ltd 車両用音声入力装置
JP2002251235A (ja) * 2001-02-23 2002-09-06 Fujitsu Ltd 利用者インタフェースシステム
JP2003223188A (ja) * 2002-01-29 2003-08-08 Toshiba Corp 音声入力システム、音声入力方法及び音声入力プログラム
JP2004354721A (ja) * 2003-05-29 2004-12-16 Shimizu Corp 音声制御装置、音声制御方法および音声制御プログラム
JP2006254148A (ja) * 2005-03-11 2006-09-21 Sony Corp ハンズフリーシステム、携帯電話及び車載装置
JP2009282704A (ja) * 2008-05-21 2009-12-03 Denso Corp 自動車用情報提供システム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6435893A (en) * 1987-07-31 1989-02-06 Toshiba Electric Equip Lighting control device
JPH1165587A (ja) * 1997-08-18 1999-03-09 Honda Motor Co Ltd 車両用音声入力装置
JP2002251235A (ja) * 2001-02-23 2002-09-06 Fujitsu Ltd 利用者インタフェースシステム
JP2003223188A (ja) * 2002-01-29 2003-08-08 Toshiba Corp 音声入力システム、音声入力方法及び音声入力プログラム
JP2004354721A (ja) * 2003-05-29 2004-12-16 Shimizu Corp 音声制御装置、音声制御方法および音声制御プログラム
JP2006254148A (ja) * 2005-03-11 2006-09-21 Sony Corp ハンズフリーシステム、携帯電話及び車載装置
JP2009282704A (ja) * 2008-05-21 2009-12-03 Denso Corp 自動車用情報提供システム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014130566A (ja) * 2013-08-21 2014-07-10 Pioneer Electronic Corp 携帯端末装置、車載器、情報提示方法及び情報提示プログラム
JP2016089670A (ja) * 2014-10-31 2016-05-23 株式会社カーメイト 自動車用遠隔操作装置、及び自動車用遠隔操作システム
JP2021092612A (ja) * 2019-12-06 2021-06-17 Tvs Regza株式会社 コマンド制御装置、制御方法および制御プログラム
JP7229906B2 (ja) 2019-12-06 2023-02-28 Tvs Regza株式会社 コマンド制御装置、制御方法および制御プログラム

Also Published As

Publication number Publication date
JP5556529B2 (ja) 2014-07-23

Similar Documents

Publication Publication Date Title
JP5141463B2 (ja) 車載機器及び通信の接続先選択方法
JP6501217B2 (ja) 情報端末システム
KR101588190B1 (ko) 차량, 그 제어 방법 및 차량에 포함되는 멀티미디어 장치
US7702130B2 (en) User interface apparatus using hand gesture recognition and method thereof
US7031659B2 (en) Communication system, communication device, and communication method
US8190214B2 (en) In-vehicle handsfree apparatus
US20060052141A1 (en) Handsfree system and mobile phone
CN109273006B (zh) 车载系统的语音控制方法、车载系统、车辆及存储介质
CN103530991A (zh) 用于检测遗忘电话的方法和设备
JP2015074315A (ja) 車載中継装置及び車載通信システム
JP5556529B2 (ja) 車載音声認識装置
US8126514B2 (en) In-vehicle apparatus, cellular phone device, and method for controlling communication therebetween
CN110626303A (zh) 基于车载终端的儿童乘车安全保护方法及系统、车载终端
JP4292798B2 (ja) 情報通信端末及び情報提供方法
CN106494326B (zh) 一种车载通信控制方法和设备
CN113259798A (zh) 智能电话
JP2010136073A (ja) ハンズフリー機能付き車載装置
WO2014129111A1 (ja) 近距離無線通信装置
JP2003345391A (ja) 端末、音声認識サーバ、音声認識システムおよびコンピュータプログラム
CN108234756A (zh) 通话控制方法、装置及计算机可读存储介质
JP7069868B2 (ja) 着信通知方法及び着信通知装置
JP2007043356A (ja) 音量自動調節装置および音量自動調節方法
JP5058699B2 (ja) ハンズフリー通話装置
JP4320880B2 (ja) 音声認識装置及び車載ナビゲーションシステム
JP2016211169A (ja) 車両用キーレスエントリーシステム、および車両用キーレスエントリーシステムにおける車載装備の制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130612

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140327

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140520

LAPS Cancellation because of no payment of annual fees