JP2007225902A - 車内音声操作システム - Google Patents

車内音声操作システム Download PDF

Info

Publication number
JP2007225902A
JP2007225902A JP2006046911A JP2006046911A JP2007225902A JP 2007225902 A JP2007225902 A JP 2007225902A JP 2006046911 A JP2006046911 A JP 2006046911A JP 2006046911 A JP2006046911 A JP 2006046911A JP 2007225902 A JP2007225902 A JP 2007225902A
Authority
JP
Japan
Prior art keywords
voice
voice recognition
vehicle
data
operation system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006046911A
Other languages
English (en)
Inventor
Yoshinori Nakano
祥徳 中野
Katsuhiro Yasuda
克弘 安田
Hideji Miyazawa
英児 宮澤
Kuniaki Kajimoto
晋明 鍜治本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP2006046911A priority Critical patent/JP2007225902A/ja
Publication of JP2007225902A publication Critical patent/JP2007225902A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

【課題】認識率を向上させるとともに音声認識結果の適用範囲を拡大させた車内音声操作システムを提供する。
【解決手段】音声認識用マイクロコンピュータ120は、マイク200を介して車両のユーザの音声を入力し、ユーザの音声に基づく音声認識用データをメモリ110内に構築する。また、音声認識用マイクロコンピュータ120は、マイク200からの入力音声とメモリ110内の音声認識用データとを比較することにより音声認識を行う。その音声認識結果は、その内容に応じてナビゲーション用マイクロコンピュータ130や車両動作制御用マイクロコンピュータ210に制御信号として伝えられ、その結果、ナビゲーション用操作系140や車両動作用操作系220が操作される。
【選択図】図1

Description

本発明は、ユーザが発する音声に基づいて車内の各種機構を操作する車内音声操作システムに関する。
車両の運転者は、走行中にオーディオシステムで曲順や題名を検索する場合、一定の時間、前方を見ることができない。特に、最近では、HDD(Hard Disk Drive)に大量の音楽データを保存することができるため、選曲は、ユーザにとって面倒な操作となっている。また、ナビゲーションシステムで目的地設定などをする場合においても、電話番号や住所などを登録するのは、面倒な操作である。
これらの問題を解決する方法として、音声認識という方法があり、車載機器においても利用されている。しかし、車載機器の場合、音声に走行ノイズが干渉するのを避けることができず、認識率が低い。そのため、車載機器においては、音声認識はほとんど利用されていないのが現状である。
なお、本発明に関連する先行技術文献として、下記特許文献1は、放送局ごとに音声データを登録し、入力された音声で放送局を選曲する音声操作技術について開示している。また、下記特許文献2は、ユーザの音声を常時入力し、機器の操作に関連する音声の切り出しを常時行って音声入力操作を実現する技術について開示している。また、下記特許文献3は、使用者が発声した音声と登録された言葉とを比較して操作内容を表示する音声認識技術について開示している。
特開2001−13984号公報 特開2001−51694号公報 特開2002−123283号公報
本発明は、上述した問題点に鑑みてなされたものであり、その目的は、音声認識率を向上させるとともに音声認識結果の適用範囲を拡大させた車内音声操作システムを提供することにある。
上記目的を達成するために、本発明によれば、ユーザが発する音声に基づいて車内の各種機構を操作する車内音声操作システムであって、メモリと、車両のユーザの音声に基づいて前記メモリ内に音声認識用データを構築する音声認識用データ構築手段と、該ユーザによる入力音声と前記メモリ内の音声認識用データとを比較することにより音声認識を行う音声認識手段と、前記音声認識手段による音声認識結果に基づいて車内の各種操作系に制御信号を送出する制御手段と、を具備する車内音声操作システムが提供される。
一般に、一つの車両のユーザは特定の者に限定される。本発明による車内音声操作システムにおいては、その限定されたユーザの音声を予め録音しておき、その録音した音声を基準として音声認識をすることができるため、認識率が向上する。そして、その音声認識結果により車両内の操作系が制御されるため、車両の操作性が向上する。
以下、添付図面を参照して本発明の実施形態について説明する。図1は、本発明による車内音声操作システムが適用されるナビゲーションシステム及びその周辺機構を示すブロック図である。ナビゲーションシステム100は、HDD等からなるメモリ110、音声認識用マイクロコンピュータ120、ナビゲーション用マイクロコンピュータ130及びナビゲーション用操作系140を備える。また、車両内には、マイク200、スピーカ205、車両動作制御用マイクロコンピュータ210、車両動作用操作系220、等が存在する。
音声認識用マイクロコンピュータ120は、マイク200を介して車両のユーザの音声を入力し、ユーザの音声に基づく音声認識用データをメモリ110内に構築する。また、音声認識用マイクロコンピュータ120は、問い合わせのための音声をスピーカ205から出力する。さらに、音声認識用マイクロコンピュータ120は、マイク200からの入力音声とメモリ110内の音声認識用データとを比較することにより音声認識を行う。その音声認識結果は、その内容に応じてナビゲーション用マイクロコンピュータ130又は車両動作制御用マイクロコンピュータ210に制御信号として伝えられる。
ナビゲーション用マイクロコンピュータ130は、受信した音声認識結果に応じてナビゲーション用操作系140を操作して、ナビゲーションシステムにおけるボリュームアップやトラックアップなどの動作を行わせる。また、車両動作制御用マイクロコンピュータ210は、受信した音声認識結果に応じて車両動作用操作系220を操作することにより、ミラーの開閉やドアロックなどの動作を行わせる。
図2は、ナビゲーションシステム100の基本的な動作を説明するためのフローチャートである。まず、音声認識用マイクロコンピュータ120は、マイク200を介してユーザの音声をメモリ110に録音する(ブロック250)。次いで、音声認識用マイクロコンピュータ120は、メモリ110に記憶された音声認識用データに基づいて、マイク200を介して入力される音声を認識する(ブロック260)。
最後に、音声認識結果がナビゲーション用マイクロコンピュータ130又は車両動作制御用マイクロコンピュータ210に伝えられて、車内の各種操作系が操作される。ユーザの声を録音させ、その録音したユーザの声を判断基準にし、音声認識を行うため、音声認識における認識率が向上する。以下、具体例について説明する。
図3は、本発明の第一実施形態(音声認識用データの構築)について説明するためのフローチャートである。この実施形態では、メモリ(HDD)110にCD(コンパクトディスク)の音楽データを録音させる際に、音声認識のためのユーザの音声を録音させるようにする。すなわち、CDからメモリ110への録音(ブロック300)の終了後、ナビゲーションシステム100は、「音声認識用の音声を入力しますか?」(例えば「アーティスト名を入力しますか?」)と尋ねる(ブロック310)。
ナビゲーションシステム100内の音声認識用マイクロコンピュータ120は、ユーザから「はい」との応答を受けた場合には、音声認識用の音声を入力する(ブロック320)。一方、ユーザから「いいえ」との応答を受けた場合には、そのまま次の録音を開始し又は曲を再生する(ブロック330)。そして、誘導により音声データを入力した場合には、音声データ(ブロック340)と音楽データ(ブロック350)とをリンクさせてメモリ110に格納する。
図4は、音声データと音楽データとのリンクの様子を示す図である。図4(A)に示されるように、一つの曲に係る音楽データの前に音声認識用の音声データが付加されてもよいし、あるいは、図4(B)に示されるように、音声データとしての「曲名」や「アーティスト名」と音楽データとがネットワーク状に関連付けられてもよい。
図5は、本発明の第二実施形態(音声認識用データの構築)について説明するためのフローチャートである。この実施形態では、パーソナルコンピュータ500上において、例えばマイクなどによる外部入力(ブロック510)により音声データ(ブロック520)を録音し、それと音楽データ(ブロック530)とをリンクさせる。このデータは、メモリスティックやCDなどの記憶媒体に格納され(ブロック540)、それからナビゲーションシステム100のメモリ(HDD)110に転送される(ブロック550)。
図6は、本発明の第三実施形態(音声認識用データの構築)について説明するためのフローチャートである。この実施形態では、CDからメモリ(HDD)110への音楽データの録音中又は録音後(ブロック600)に、携帯電話610のマイクを利用して、ユーザの音声が録音される。その録音された音声データ(ブロック630)がナビゲーションシステム620へ転送され、音楽データ(ブロック630)とリンクされる。音声データの転送方法としては、以下の方法を採用することができる。
(1)ナビゲーションシステムと携帯電話とをUSB(Universal Serial Bus)で接続できるようにする。そのUSBケーブルを用いて、転送を行う。
(2)ナビゲーションシステムの新機能として、BlueTooth (ノート型パソコンとデジタル携帯電話、小型携帯端末などを無線で結ぶための通信仕様の開発コード名)機能を搭載させる。現在、携帯電話の数機種では、BlueTooth を搭載させている機種があり、そのBlueTooth を用いて、音声データの転送を行う。
(3)ナビゲーションシステムの新機能として、赤外線通信機能を搭載させる。現在、携帯電話の数機種では、赤外線通信を搭載させている機種があり、その赤外線通信機能を用いて、音声データの転送を行う。
(4)現在、携帯電話の数機種では、メモリスティックを搭載させている機種があり、そのメモリスティックを用いて、音声データの転送を行う。
(5)現状では、ナビゲーションシステムとシガーソケットは、データのやり取りなどできないが、データのやり取りなどをできるように、ナビゲーションシステムとシガーソケットをリンクさせ、携帯電話とシガーソケットを接続できるようにし、それを用いて、音声データをナビゲーションシステムに転送させる。また、シガーソケットとナビゲーションシステムとのデータのやり取りは、シガーソケットのHOT部分でCAN(Control Area Network)などのシリアル通信を用いて実現させる。
図7は、本発明の第四実施形態(音声認識用データの構築)について説明するためのフローチャートである。この実施形態では、ナビゲーションシステムでの目的地設定を行う際に、1度目の設定は手動で行われる(ブロック700)。それが終わった後に、ナビゲーションシステムが「音声認識用の音声を入力しますか?」と尋ねる(ブロック710)。
ナビゲーションシステムは、ユーザから「はい」との応答を受けた場合には、音声認識用の音声を入力する(ブロック720)。一方、ユーザから「いいえ」との応答を受けた場合には、処理を終了する(ブロック730)。そして、誘導により音声データを入力した場合には、音声データ(ブロック740)と目的地データ(ブロック750)とをリンクさせてメモリに格納する。2度目以降の目的地設定の際には、音声認識を用いるようにする(ブロック760、770)。
図8は、本発明の第五実施形態(音声認識)について説明するためのフローチャートである。この実施形態では、車内の会話をナビゲーションシステムが常時検知し、予めユーザが設定しておいたキーワードから判断して、ユーザが予め設定した曲をかけるようにする。例えば、ユーザがキーワードとして「静かに」を設定し、そのキーワードに対して、子守り歌を設定していたとする(ブロック800)。
同乗者が寝ている場合に、「静かに」とユーザが発声すると、ナビゲーションシステムはそれを検知し(ブロック810)、設定されている曲である子守り歌へと曲を変更する制御をする(ブロック820)。一方、キーワードが検知されない場合には、そのままの状態が継続する(ブロック830)。この実施形態では、音声認識が車内の会話により行われ、ユーザが意識せずに、音楽の変更が実現される。
図9は、本発明の第六実施形態について説明するためのフローチャートである。現在のナビゲーションシステムの中には、ナビゲーションシステムの操作系(トラックアップやボリュームアップなど)で音声認識をさせているものがあるが、認識率が悪いという欠点がある。本実施形態では、その操作系の音声認識率向上のために、操作系の音声データの初期設定を行う(ブロック900)。
すなわち、操作系の音声データを取得し(ブロック910)、音声データ(ブロック920)と操作系データ(ブロック930)とをリンクさせてメモリに格納する。そして、ユーザの音声(ブロック940)が登録済みの音声データと適合するかどうかを判断し(ブロック950)、適合する場合には該当する操作を行うように制御し(ブロック960)、適合しない場合には処理を終了する(ブロック970)。
また、この実施形態は、車両動作の操作系に対しても適用可能であり、その場合には、ドアの開閉、ドアロック、ミラーの開閉、ミラーの角度調整、ウィンドウの開閉、シートの上下・傾き、ハザード、ウィンカー、ワイパー、ライト、ハンドルの位置調整、デフォッガ、ルームミラーの調整、パッシング、エアコンのブロアモータとサーボモータの切り換え、エンジンの始動、等が音声操作により実現される。また、ナビゲーションシステムと車両動作の操作系との通信については、CANなどを用いることができる。選曲以外にも、ユーザが声を発するだけで、ワイパーなどが動くようになり、ユーザにとって、便利である。
図10は、本発明の第七実施形態について説明するためのフローチャートである。前述の図9の実施形態において、複数人で1台の車が使用される場合には、複数のユーザがいるので、図10に示されるように、複数の初期登録ができるようにすることが好ましい。そうすることで、ユーザ全員に対して、音声認識の認識率向上が可能となる。
図11は、本発明の第八実施形態について説明するためのフローチャートである。この実施形態では、FM多重放送の特定のページを「お気に入り」に登録させ、音声認識により、そのページを表示するようにする。本実施形態では、FM多重放送のお気に入りページの初期設定を行う(ブロック1100)。すなわち、お気に入りページの音声データを取得し(ブロック1110)、音声データ(ブロック1120)とお気に入りページのデータ(ブロック1130)とをリンクさせてメモリに格納する。そして、ユーザの音声(ブロック1140)が登録済みの音声データと適合するかどうかを判断し(ブロック1150)、適合する場合にはお気に入りページの表示を行うように制御し(ブロック1160)、適合しない場合には処理を終了する(ブロック1170)。
図12は、本発明の第九実施形態について説明するためのフローチャートである。車両に設けられる盗難防止用警報装置では、「ピッピッピー」などの音が発せられ、車両所有者独自の音を出すことができない。そのため、複数台の車を停めている駐車場では、自分の警報装置がなっているのか、わからないことがある。そこで、この実施形態では、警報装置の音を自分の声による「おい、ドロボー!!」などとの音とすることで、自分の車が狙われているとわかるようにする。
まず、盗難警報装置のための音声データを取得し(ブロック1200)、音声データ(ブロック1210)としてメモリに格納する。そして、盗難警報装置のセンサ(ブロック1220)が異常を感知した場合には、盗難されようとしているかどうかを判断し(ブロック1230)、該当する場合にはメモリに記憶された警告音を発するように制御し(ブロック1240)、そうでない場合には処理を終了する(ブロック1250)。
図13は、本発明の第十実施形態について説明するためのフローチャートである。この実施形態では、音声認識について、ある一定のメモリを学習機能用に確保しておき、そのメモリの範囲内で学習機能を働かせる。すなわち、音声データの取得(ブロック1300)がなされる度に、対応する音声データ(ブロック1320)がメモリ(ブロック1300)内に操作系データ(ブロック1330)とリンクされつつ登録される。このように、一つの操作に対して音声データを複数とることで、音声認識率の向上が期待される。
本発明による車内音声操作システムが適用されるナビゲーションシステム及びその周辺機構を示すブロック図である。 ナビゲーションシステムの基本的な動作を説明するためのフローチャートである。 本発明の第一実施形態について説明するためのフローチャートである。 音声データと音楽データとのリンクの様子を示す図である。 本発明の第二実施形態について説明するためのフローチャートである。 本発明の第三実施形態について説明するためのフローチャートである。 本発明の第四実施形態について説明するためのフローチャートである。 本発明の第五実施形態について説明するためのフローチャートである。 本発明の第六実施形態について説明するためのフローチャートである。 本発明の第七実施形態について説明するためのフローチャートである。 本発明の第八実施形態について説明するためのフローチャートである。 本発明の第九実施形態について説明するためのフローチャートである。 本発明の第十実施形態について説明するためのフローチャートである。
符号の説明
100 ナビゲーションシステム
110 メモリ
120 音声認識用マイクロコンピュータ
130 ナビゲーション用マイクロコンピュータ
140 ナビゲーション用操作系
200 マイク
205 スピーカ
210 車両動作制御用マイクロコンピュータ
220 車両動作用操作系

Claims (8)

  1. ユーザが発する音声に基づいて車内の各種機構を操作する車内音声操作システムであって、
    メモリと、
    車両のユーザの音声に基づいて前記メモリ内に音声認識用データを構築する音声認識用データ構築手段と、
    該ユーザによる入力音声と前記メモリ内の音声認識用データとを比較することにより音声認識を行う音声認識手段と、
    前記音声認識手段による音声認識結果に基づいて車内の各種操作系に制御信号を送出する制御手段と、
    を具備する車内音声操作システム。
  2. 前記音声認識用データ構築手段は、記録媒体から前記メモリに音楽データが録音される際に、当該音楽データに対応する音声を発するようにユーザを誘導することにより、当該音楽データにリンクする音声認識用データを作成する、請求項1に記載の車内音声操作システム。
  3. 前記音声認識用データ構築手段は、音楽データと、別途他のコンピュータ上で作成された、当該音楽データにリンクする音声データと、を記録する記録媒体を入力することにより、当該音楽データにリンクする音声認識用データを作成する、請求項1に記載の車内音声操作システム。
  4. 前記音声認識用データ構築手段は、記録媒体から前記メモリに音楽データが録音される際に、携帯電話において記録された音声データを、当該携帯電話からの転送を受けて入力することにより、当該音楽データにリンクする音声認識用データを作成する、請求項1に記載の車内音声操作システム。
  5. 前記車内音声操作システムは、ナビゲーションシステムの一部として構成されるものであり、前記音声認識用データ構築手段は、ユーザによって手動で行われる目的地設定の際に、当該目的地に対応する音声を発するようにユーザを誘導することにより、当該目的地にリンクする音声認識用データを作成する、請求項1に記載の車内音声操作システム。
  6. 前記メモリには、キーワードと対応する曲とからなる設定が記憶されており、前記音声認識手段が、車内の会話を常時監視して当該キーワードが発声されたのを認識すると、前記制御手段が、当該キーワードに対応する曲が演奏されるように制御する、請求項1に記載の車内音声操作システム。
  7. 前記音声認識用データ構築手段は、複数のユーザに対応する音声認識用データを前記メモリに構築する、請求項1に記載の車内音声操作システム。
  8. 前記音声認識用データ構築手段は、学習により一つの操作に対応する複数の音声認識用データを前記メモリに作成する、請求項1に記載の車内音声操作システム。
JP2006046911A 2006-02-23 2006-02-23 車内音声操作システム Withdrawn JP2007225902A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006046911A JP2007225902A (ja) 2006-02-23 2006-02-23 車内音声操作システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006046911A JP2007225902A (ja) 2006-02-23 2006-02-23 車内音声操作システム

Publications (1)

Publication Number Publication Date
JP2007225902A true JP2007225902A (ja) 2007-09-06

Family

ID=38547789

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006046911A Withdrawn JP2007225902A (ja) 2006-02-23 2006-02-23 車内音声操作システム

Country Status (1)

Country Link
JP (1) JP2007225902A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160008763A (ko) * 2014-07-15 2016-01-25 현대자동차주식회사 내비게이션 장치 및 그 제어 방법
CN107886946A (zh) * 2017-06-07 2018-04-06 深圳市北斗车载电子有限公司 用于控制车载导航音量的语音控制系统和方法
JP2018063486A (ja) * 2016-10-11 2018-04-19 本田技研工業株式会社 サービス提供装置、サービス提供方法およびサービス提供プログラム
KR20180096369A (ko) * 2017-02-21 2018-08-29 주식회사 오비고 차량 제어를 위한 음성 인식 지원 시스템 및 그 방법
JP2019053785A (ja) * 2019-01-09 2019-04-04 本田技研工業株式会社 サービス提供装置
CN112509580A (zh) * 2020-12-21 2021-03-16 北京百度网讯科技有限公司 语音处理方法、装置、设备、存储介质及计算机程序产品

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160008763A (ko) * 2014-07-15 2016-01-25 현대자동차주식회사 내비게이션 장치 및 그 제어 방법
KR101597528B1 (ko) * 2014-07-15 2016-03-07 현대자동차주식회사 내비게이션 장치 및 그 제어 방법
JP2018063486A (ja) * 2016-10-11 2018-04-19 本田技研工業株式会社 サービス提供装置、サービス提供方法およびサービス提供プログラム
KR20180096369A (ko) * 2017-02-21 2018-08-29 주식회사 오비고 차량 제어를 위한 음성 인식 지원 시스템 및 그 방법
KR102403315B1 (ko) 2017-02-21 2022-06-02 주식회사 오비고 차량 제어를 위한 음성 인식 지원 시스템 및 그 방법
CN107886946A (zh) * 2017-06-07 2018-04-06 深圳市北斗车载电子有限公司 用于控制车载导航音量的语音控制系统和方法
JP2019053785A (ja) * 2019-01-09 2019-04-04 本田技研工業株式会社 サービス提供装置
CN112509580A (zh) * 2020-12-21 2021-03-16 北京百度网讯科技有限公司 语音处理方法、装置、设备、存储介质及计算机程序产品
CN112509580B (zh) * 2020-12-21 2023-12-19 阿波罗智联(北京)科技有限公司 语音处理方法、装置、设备、存储介质及计算机程序产品

Similar Documents

Publication Publication Date Title
US9587958B2 (en) Mobile device gateway systems and methods
US8918244B2 (en) System and method of synchronizing an in-vehicle control system with a remote source
US20050216271A1 (en) Speech dialogue system for controlling an electronic device
US9820308B2 (en) Apparatus and method for controlling outgoing calls in vehicle
CN105329187A (zh) 蓝牙按键触发实现安全操作的智能车载系统及控制方法
JP2007225902A (ja) 車内音声操作システム
CN105812449A (zh) 车辆和移动装置之间的音频同步
CN103873551A (zh) 乘员使用引入装置与车辆系统交互的方法及系统
JP2010505097A (ja) 無線インタフェースを有するポータブルナビゲーション装置
JP2001270400A (ja) ドライバーアシストシステムおよび情報表示部と通信手段と車両アクチュエータの制御のための方法
CN101517362A (zh) 具有无线接口的便携式导航装置
CN104608710A (zh) 用于车辆无线电台隐私模式控制的方法和设备
JP2015074315A (ja) 車載中継装置及び車載通信システム
JP2008105608A (ja) 車両用音声対応制御装置
US11938820B2 (en) Voice control of vehicle systems
CN217063708U (zh) 一种车辆内外语音通话交互系统
JP2009132266A (ja) 車両状態報知システム及び車両状態の報知方法
JP5037041B2 (ja) 車載用音声認識装置及び音声コマンド登録方法
CN101123865A (zh) 汽车多媒体信息系统
JP2003007040A (ja) 車載用音響装置及びこれと通信する携帯用音響装置並びにこれら両装置を備える音響システム
JP2008094218A (ja) 車両の音響システム
US20050232438A1 (en) Event-driven content playback system for vehicles
KR101657657B1 (ko) 통신 장치, 그를 가지는 차량 및 그 방법
KR102536483B1 (ko) 차량 및 그 제어방법
KR102463581B1 (ko) 대화 시스템 및 이를 포함하는 차량

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20090512