JP2007503022A - 車両用無線システムにおける音声認識 - Google Patents

車両用無線システムにおける音声認識 Download PDF

Info

Publication number
JP2007503022A
JP2007503022A JP2006523991A JP2006523991A JP2007503022A JP 2007503022 A JP2007503022 A JP 2007503022A JP 2006523991 A JP2006523991 A JP 2006523991A JP 2006523991 A JP2006523991 A JP 2006523991A JP 2007503022 A JP2007503022 A JP 2007503022A
Authority
JP
Japan
Prior art keywords
phoneme
acoustic signal
string
channel number
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006523991A
Other languages
English (en)
Inventor
オデル,トーマス
ニックス,アクセル
グロスト,ティモシー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motors Liquidation Co
Original Assignee
Motors Liquidation Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motors Liquidation Co filed Critical Motors Liquidation Co
Publication of JP2007503022A publication Critical patent/JP2007503022A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/025Phonemes, fenemes or fenones being the recognition units

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuits Of Receivers In General (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)

Abstract

本発明に従って、車両用無線システム及び該車両用無線システムを動作させる方法が提供される。車両用無線システムは、放送局から無線信号を受信するよう構成された無線受信機と、車両用無線システムのオペレータから可聴音を受け取って該可聴音から音響信号を生成するマイクロホンと、無線受信機から無線信号を、マイクロホンから音響信号を受け取るよう構成された同調モジュールとを備える。同調モジュールは、第1の音素列及び該第1の音素列に関連した第1のチャンネル番号を記憶するよう構成された記憶モジュールと、音響信号における音素を記憶モジュールに記憶された第1の音素列と比較するよう構成された音声認識エンジンと、音声認識エンジンが音素を第1の音素列として識別するとき無線受信機を第1のチャンネル番号に同調させるチューナーとを備える。

Description

本発明は音声認識に関するもので、特に、車両用無線システムにおける音声認識に関する。
発明の背景
オーディオ無線システム、画像無線システム及びオーディオビジュアル無線システムのための、音声をベースとするインターフェースは、益々広がりつつあり、車両(例えば自動車)の制御に関連する活動にユーザの手がふさがれている環境では特に人気がある。こうした音声ベースのユーザ・インターフェースは無線装置の多くのパラメータ、例えば、ボリューム、フェーディング、バランス、チャンネル選択を制御するために現在は使用されている。しかし、一般に、音声ベースのユーザ・インターフェースを持つ無線システムは「ボリューム・アップ」、「無線105.1FM」又は「無線22XM」のような固定のコマンド・セットに限定され、後者の場合には、周波数又はチャンネル番号は所定の数値の範囲内に入ることが必要である。こうした固定のコマンド・セットがAM/FM無線システムにおいて適切な周波数/チャンネル制御を提供するとしても、その利用はXMやデジタルのオーディオ放送(DAB)のようなデジタル無線システムに限られる。
デジタル・オーディオ・サービス又はデジタル・テレビジョン・サービス(例えば、デジタル・ラジオ・システム)は多数の無線チャンネルを提供するので、ユーザが特定のチャンネル番号を記憶することは困難である。更に、こうした多数のラジオ局及びテレビ局は、そのブランド戦略の一部として、周波数又はチャンネル番号よりも局名を宣伝することが頻繁に行われている。したがって、ユーザは周波数やチャンネル番号よりも局名(例えば、CNN、MSNBC、WTBS、ESPN、ABC、NBC、FOX、CBS)の方を良く知っている。
無線システムの表示装置は局名の重要性に順応しており、こうした局識別名称のみを表示装置に生成し、又は、チャンネル番号と組み合わせて局識別名称を生成する。局名を表示することができるのは、チャンネル又は周波数に関連する名称が、一般に、デジタル・オーディオ・サービスから受信されるデータ・ストリームに符号化されているからである。したがって、ラジオ・チャンネルを変更する最も直感的なコマンドは、「ラジオ・チャンネル〈チャンネル名〉」のようなフォーマットを使うことになろう。しかし、固定のコマンド・セットによる音声ベースの無線システムはこのような直感的なコマンドを提供することができない。これは、一般に、チャンネル名が無線システムを最初に組み立てた後に変わるからである。
現在、放送局は、オーディオ信号をデジタルの又はアナログのフォーマットで放送し、場合によってはデータを放送する。これはデータ放送(例えば、サテライト・デジタル・オーディオ・ラジオ・サービス、地上デジタル・オーディオ放送、FM RDS、デジタル・テレビジョン等)として知られている。現在、データ放送の仕組みは追加オーディオ・チャンネル、GPS修正信号、ページング、MUSAC、プログラム関連データ、広告、気象及び交通情報を含む広範なサービスをカバーする種々のメッセージに対して使用されている。また、データ放送の仕組みは局識別をテキスト・メッセージとしてデータ放送してラジオ又はテレビのスクリーンに表示させる。しかし、無線システムにおいて音声をベースとしてユーザがチャンネルや局の選択を制御するためにデータ放送局識別を完全に利用する又はフォーマットする音声認識システム又は同様の技術は利用可能ではない。
以上に鑑み、音声認識を採用する無線システム受信機に対するデータ放送のための、チャンネル又は局情報のような情報を表す音声表記を作ることが望ましい。また、最大数の音声すなわち精度の向上のために音声認識プロセスを最適化するよう、名称やチャンネルが変わったときにデータ放送の音声表記を修正することができ、また、異なるアクセントや言語に対する複数の音声表記を潜在的に可能にする能力を提供することにより、無線システム全体の性能を最適化する機構を採用することが望ましい。したがって、名称及び無線チャンネルのための動的音声認識能力を提供することが望ましい。加えて、こうしたチャンネル名音声認識の精度を最適化することが望ましい。また、本発明の他の望ましい特徴及び特性は、添付の図面と発明の背景とを組み合わせて、以降の発明の詳細な説明及び請求の範囲から明らかになろう。
簡単な概要
本発明にしたがって、車両用無線システムが提供される。車両用無線システムは、放送局から無線信号を受信するよう構成された無線受信機と、車両用無線システムのオペレータから可聴音を受け取って該可聴音から音響信号を生成するマイクロホンと、無線受信機から無線信号を、マイクロホンから音響信号を受け取るよう構成された同調モジュールとを備える。同調モジュールは、第1の音素列及び該第1の音素列に関連した第1のチャンネル番号を記憶するよう構成された記憶モジュールと、音響信号における音素を記憶モジュールに記憶された第1の音素列と比較するよう構成された音声認識エンジンと、音声認識エンジンが音素を第1の音素列として識別するとき無線受信機を第1のチャンネル番号に同調させるチューナーとを備える。
また、本発明にしたがって、車両用無線システムを動作させる方法が提供される。この方法は、放送局から無線信号を受信する段階と、車両用無線システムのオペレータから可聴音を受け取って可聴音から音響信号を生成する段階とを含む。更に、この方法は、第1の音素列及び第1の音素列に関連した第1のチャンネル番号を記憶する段階と、音響信号における音素を第1の音素列と比較する段階と、音響信号における音素と第1の音素列との比較が音素を第1の音素列として識別するときに第1のチャンネル番号に同調する段階とを含む。
以後、本発明を図と関連されて説明する。同じ参照符号は同様の素子を指す。
詳細な説明
以下の発明の詳細な説明は本質的に単なる例示であって、発明自体又は発明の応用や利用を制限するものではない、また、先の背景又は以後の詳細な説明において提示された明示的又は暗示的理論によって限定されるものではない。
図1は、本発明の典型的な実施の形態に係る車両用システム10の単純化されたブロック図である。無線システム10はラジオ受信機16のアンテナ14により信号を受信するよう構成されている。この信号はデジタル放送サービス12から送信されることが好ましく、デジタル放送サービス12はサテライト放送サービス(例えば、XMサテライト・ラジオ、サテライト・ラジオ/テレビジョン・システム)又は地上放送サービス(例えば、デジタル・オーディオ放送サービス(DAB))であり得る。ラジオ受信機16はデジタル・ラジオ受信機との関連で記述されるが、特定の種類のデータ(例えばFM RDS(ラジオ・データ・システム))によって音声認識エンジンを効率的に動作させるために符号器/復号器が設けられているならば、他の非デジタル・システムにも適用可能である。更に、この詳細な説明において記述されるラジオ受信機はオーディオ・システムであるが、本発明はビジュアル・システム(例えばテレビジョン)やオーディオ/ビジュアル一体型システムにも適用可能である。例えば、本発明はテレビジョン・チャンネル又はプログラムの変更(例えば、「チャンネルをCNNに変更」又は「プログラムを60分に変更」)に適用可能である。また、本記述は自動車に言及しているが、任意の数の陸上、水中、空中及び宇宙車両が本発明のラジオ・システムを備えることができ、本発明の方法は任意の数の陸上、水中、空中及び宇宙車両において実施可能である。
デジタル・ラジオ受信機16は放送サービス12から送信された信号を受信する従来からのコンポーネント及びサブシステムを備えている。デジタル・ラジオ受信機16は該信号を検出し復号してデータ、オーディオ、ビジュアル又はオーディオビジュアルのフォーマット等の任意の数のフォーマットを生成する。デジタル・ラジオ受信機16は、そのユーザが感知することができるフォーマットで送信信号を提示できるよう、増幅器、スピーカ又は表示装置を備えることが好ましい。放送局12から送信された信号は局及びチャンネルの識別子と、サービスによって放送される情報の種類に関係する他の情報を含むことが好ましい。例えば、この情報は、ポピュラー音楽、クラシック音楽等を識別することができる。
この詳細な説明で既に述べたように、アンテナ14によって受信された信号はデジタル・ラジオ受信機16に与えられ、そこで復号されてオーディオ及び/又はオーディオビジュアルの情報を生成し、車両用無線システム10のユーザに与えられる。同調モジュール18がデジタル・ラジオ受信機16及びマイクロホン20に結合され、マイクロホン20を介して車両用無線システム10のユーザは同調情報や他の機能コマンド(例えば、ボリューム、フェーディング、バランスその他)を伝達することができる。
同調モジュール18はマイクロホン20から信号を受信する音声認識エンジン22を備える。音声認識エンジン22はデジタル・ラジオ受信機16と一体であっても、別個のユニットであってもよく、音声認識エンジン22は同調コマンド以外の、車両用無線システム10の機能音声コマンドを識別することができる。例えば、音声認識エンジン22は車両用無線システム10のボリューム・コマンド、フェーディング・コマンド、バランス・コマンドその他の機能コマンドを識別することができる。
また、同調モジュール18は音声認識エンジン22と結合された記憶モジュール24を備え、該モジュール24は、少なくとも、デジタル・ラジオ受信機16によって受信されたチャンネルのプログラム情報に関係する情報を記憶する。更に、音声認識エンジン22はデジタル・ラジオ受信機16を特定のチャンネルに同調させるよう動作するチューナー26に結合される。
典型的な実施の形態においては、放送サービス12によって送信されたデジタル・データ・ストリームはチャンネル名又はプログラム・フォーマット(例えば、スポーツ、ニュース、トーク、音楽等)を記述する音素列を含む。車両用無線システム10は、それぞれの音素列に関連するチャンネル番号とともに音素列を記憶モジュール24に蓄積する。音素はテーブルに記憶することができ、無線システム10は該テーブルを音声認識エンジン22に対する入力として使用することができる。ラジオに記憶された音素テーブルは、現在利用可能なチャンネルに基づいて動的に生成される。チャンネル名は変更されるのが稀なので、デジタル・ラジオ・サービス12によって送信された音素列は、チャンネル名の典型的な発音を反映するよう、当業者には公知の言語技術によって「マニュアルで」最適化することができる。
音声認識エンジン22は、ユーザが発したオーディオ・コマンドにおける音素と記憶モジュール24のテーブルに記憶された音素列とを比較するよう構成されている。ユーザのコマンドとテーブルに記憶された音素列との一致が認められたならば、チューナー26はオーディオ・コマンドに対応するチャンネルに無線システム10を同調させる。例えば、ユーザが「ラジオ・チャンネルCNN」を命じたならば、音声認識エンジン22は記憶モジュール24の固定コマンド・テーブル30に記憶された固定コマンド・セットに基づいて言葉「ラジオ・チャンネル」を識別する。また、可変部分「CNN」は利用可能なチャンネルのチャンネル・テーブル28の音素と比較される。音声認識エンジン22はテーブルの音素「CNN」に対応するチャンネル番号にチューナー26を一致させて調整するよう構成されているので、放送サービス12から送信された対応の信号が無線システム10によって受信される。
本発明の典型的な実施の形態にしたがって、放送サービス12は音素ではなく音声スペリングでチャンネル名を送信する。これにより、車両用無線システム10の音声認識エンジン22は音素列を独立に編集することができる。音声スペリングが利用可能なので、読み取り可能なチャンネル名に限定された従来の利用可能性に比して、音声認識精度が改善される。音素の送信と比較して、音声スペリングは普遍的であり、異なる音声認識エンジンで動作し、車両用無線システム10へ送信されるデータ量を減らす。例えば、チャンネル名「90年代」又は「ESPNニュース」は、オンボードの音声認識エンジンには、チャンネル名の典型的な発音を認識するのに適切な音素列を編集するのが困難である。しかし、「ナインティーズ」又は「イーエスピーエヌニュース」という音声スペリングが音声認識エンジンに与えられるならば、改善された音素列が編集されるので、認識率を向上させることができる。
両方の実施の形態に共通なことは、放送サービス12が、表示装置に表示されるべきチャンネル名に加えて、音声認識エンジンで使用するために特に設計されたフォーマットでチャンネル名情報を送信することが好ましいことである。この詳細な説明で後に説明するように、双方向ラジオ伝送を含む応用に対しては、ラジオ受信機16のユーザが放送局12又は他の情報提供者と通信することができるよう、送信機32が設けられる。
図2を参照すると、本発明の典型的な実施の形態に係る図1の車両用無線システム10の動作を示すフローチャート40が与えられる。デジタル・ラジオ受信機16は放送サービスからデータ・ストリームを受信する(42)。ラジオ受信機はデジタル・データ・ストリームから音素/チャンネル・テーブルを作り(44)、データ・ストリームは記憶モジュールの一部に記憶される(46)。マイクロホンでオーディオ・コマンドが受信される(48)。例えば、「ラジオ・チャンネル ザ・ハート」がマイクロホンで受信される。音声認識エンジンは該コマンドを音素へ変換し(50)、該音素を記憶モジュールの当該部分に記憶された固定コマンド・セットと比較し(52)、「ラジオ・チャンネル」をコマンドとして認識する。その後、音声認識エンジンはオーディオ音素に最も近い一致(例えば「ザ・ハート」)を求めてチャンネル・リスト音素を検索する(54)。最も近い一致が検索から決定されると、チューナーはそれに関連するチャンネルへ向けられる(例えば、最も近い一致がチャンネル23であると検索が決定すると、チャンネルは「チャンネル23」に同調される)。この詳細な説明で既に述べたように、放送サービスによって音素データベースが利用可能でない場合、同様の目的に資するよう音素データベースを作成してもよい。更に、異なる方言に適応するために、チャンネル名の異なる発音又は形を設けておき、放送サービス12は同一チャンネル番号に対する2つ以上の音素列又は音声スペリングを送信することができる。
また、音声認識インタフェースは、チャンネル同調以外のタスク又はチャンネル同調に加えてのタスクに対して利用可能である。例えば、曲名又はアーティスト名を音声的に又は音素によって送信し、それによって、ユーザはラジオに対して特定の曲又はアーティストの検索を連続的に又は周期的に行わせ、好みの曲/アーティストが演奏するときには必ず特定のチャンネルに同調させるようにすることができる。
図3は、図1の車両用無線システムの機能を支持する放送システムの動作を示すフローチャート60である。放送システムは局名又はチャンネル名を選択し又は作る(62)。次いで、放送システムは周知の変換システムを用いて、選択された名称を、該名称を表す音素表現又は音素群へ変換する(64)。既に述べたように、放送局は、異なるユーザの発話又は言語の変動を許容するよう、1つの名称に対して2つ以上の表現を選択することができる。例えば、特定の種類のプログラミングを記述するために、メキシコのユーザは米国のユーザとは異なる言語を使用することができる。また、この詳細な説明で既に述べたように、システムをプログラム選択及び受信機の同調に使用する場合、放送システムはプログラミング言語又は曲のタイトルの複数の音素表現を提供するよう構成される。電子商取引の場合には、こうした商取引を実施するために複数の言語が音声的に符号化される。
図3において、送信すべきデータの音声表現又は音素表現を含み、且つ、それに関連するチャンネル又は周波数の情報を含むデータ・パケットが作られる(66)。次いで、データ・パケットは通常の放送データ・ストリームに入れられる(68)。代わりに、データ・パケットを個別に放送してもよい。例えば、データ・パケットを、送信信号の側波帯上で、制御チャンネル上で又はサブバンド信号等として、個別に放送することができる。次いで、選択された放送技術を用いてデータが送信される(70)。
デジタル・ラジオ受信機16は音声データを含む送信信号を受信し(72)、このデータを図1及び図2を参照して既に述べたように処理する。放送システムは、それ自身の受信機を使うことができるので、受信機の音声認識エンジンの性能とラジオの同調機構の機能とによって音声データ又は音素データの内容を評価することができる(74)。性能が許容可能であるならば、放送システムは、局名又は局識別子の変更のようなイベントが変更を指示するまで、現在の音声表現を維持する(78)。音声認識エンジンの性能が許容可能でない場合、更なる改良のために当該情報は変換システム(64)へ戻され、処理が反復される。システムが他の内容(例えば、電子商取引)で使用される場合には、車両用無線システムのデジタル・ラジオ受信機に関連する送信機は他のデータの双方向通信を放送システムとの間で行うのに使用され、この場合、フィードバックは電子商取引の放送局の適宜の受信機へ送られる。
本発明をデジタル・ラジオ/テレビジョン受信機及び送信機に関して記述してきたが、音声認識機能は他の応用を有する。例えば、送信局は電子商取引に従事する商人であり得る。双方向の環境では、音素列の動的に作られたテーブルを使って、ラジオにおいてエムコマース(m-commerce)の機能を促進することができる。所定の「イエス」、「ノー」の回答のみを許す固定のコマンド・セットにユーザの会話を限定するのではなく、エムコマースの応用では、ダウンロードされた音素又は音声スペリングは「スマートな」会話を提供することができる。例えば、バラを購入するという架空の例においては、応用は購入すべきバラの色を要求する。エムコマース・プロバイダは「赤」、「白」、「黄色」に対する音素又は音声スペリングを車両用無線システムにダウンロードさせて、ユーザが質問に自然に回答することができるようにする。回答の選択範囲は、エムコマースの会話の範囲内の回答選択毎に具体的に車両に対して送信される。
ここまで本発明の詳細な説明において典型的な実施の形態を説明してきたが、理解されるように、広範な変形が存在する。理解されるように、典型的な実施の形態は単なる例であり、本発明の範囲、応用可能性又は構成を限定するものではない。むしろ、これまでの詳細な説明は、本発明の典型的な実施の形態を実現するためのロードマップを当業者に提供する。理解されるように、請求項に記載された発明の範囲から逸脱することなく、典型的な実施の形態において説明した要素の機能及び配置について種々の変更を行い得る。
本発明の典型的な実施の形態に係る車両用無線システムを概略的に示すブロック図である。 本発明の典型的な実施の形態に係る図1の車両用無線システムの動作方法を示すフロー図である。 本発明の典型的な実施の形態に係る放送システムの動作方法を示すフロー図である。

Claims (20)

  1. 車両用無線システムであって、
    放送局から無線信号を受信するよう構成された無線受信機と、
    前記車両用無線システムのオペレータから可聴音を受け取って該可聴音から音響信号を生成するよう構成されたマイクロホンと、
    前記無線受信機から前記無線信号を受け取るとともに前記マイクロホンから前記音響信号を受け取るよう構成された同調モジュールであって、
    第1の音素列と該第1の音素列に関連した第1のチャンネル番号とを記憶するよう構成された記憶モジュールと、
    前記音響信号における音素を前記記憶モジュールに記憶された前記第1の音素列と比較するよう構成された音声認識エンジンと、
    前記音声認識エンジンが前記音素を前記第1の音素列として識別したときに前記無線受信機を前記第1のチャンネル番号に同調させるチューナーと、
    を備える同調モジュールと、
    を具備する車両用無線システム。
  2. 前記記憶モジュールが、第2の音素列及び該第2の音素列に関連した第2のチャンネル番号を記憶するよう構成され、
    前記音声認識エンジンが、前記音響信号における前記音素を前記記憶モジュールに記憶された前記第2の音素列と比較するよう構成され、
    前記チューナーが、前記音声認識エンジンが前記音素を前記第2の音素列として認識したときに前記無線受信機を前記第2のチャンネル番号に同調させるよう構成される、
    請求項1に記載の車両用無線システム。
  3. 前記記憶モジュールが、第3の音素列及び該第3の音素列に関連した第3のチャンネル番号を記憶するよう構成され、
    前記音声認識エンジンが、前記音響信号における前記音素を前記記憶モジュールに記憶された前記第3の音素列と比較するよう構成され、
    前記チューナーが、前記音声認識エンジンが前記音素を前記第3の音素列として認識したときに前記無線受信機を前記第3のチャンネル番号に同調させるよう構成される、
    請求項2に記載の車両用無線システム。
  4. 前記記憶モジュールが、第2の音素列及び該第2の音素列に関連した第1のプログラミング・フォーマットを記憶するよう構成され、
    前記音声認識エンジンが、前記音響信号における前記音素を前記記憶モジュールに記憶された前記第2の音素列と比較するよう構成され、
    前記チューナーが、前記音声認識エンジンが前記音素を前記第2の音素列として認識したときに、前記第1のプログラミング・フォーマットに関連した第2のチャンネル番号に前記無線受信機を同調させるよう構成される、
    請求項1に記載の車両用無線システム。
  5. 前記第1のプログラミング・フォーマットがスポーツ・プログラミング・フォーマットである、請求項4に記載の車両用無線システム。
  6. 前記放送サービスによって送信される前記無線信号がデジタル無線信号である、請求項1に記載の車両用無線システム。
  7. 前記放送サービスがサテライト放送サービスである、請求項1に記載の車両用無線システム。
  8. 前記記憶モジュールが、第2の音素列及び該第2の音素列に関連した第1の機能コマンドを記憶するよう構成され、
    前記音声認識エンジンが、該音声認識エンジンが前記音素を前記第2の音素列として認識したときに前記音響信号における前記音素を前記記憶モジュールに記憶された前記第2の音素列と比較し、前記機能コマンドを要求するよう構成される、
    請求項1に記載の車両用無線システム。
  9. 前記機能コマンドがボリューム・コマンドである、請求項8に記載の車両用無線システム。
  10. 前記第1の音素列が前記第1のチャンネル番号の音声スペリングである、請求項1に記載の車両用無線システム。
  11. 車両用無線システムを動作させる方法であって、
    放送局から無線信号を受信する段階と、
    前記車両用無線システムのオペレータから可聴音を受け取る段階と、
    前記可聴音から音響信号を生成する段階と、
    第1の音素列及び該第1の音素列に関連した第1のチャンネル番号を記憶する段階と、
    前記音響信号における音素を前記第1の音素列と比較する段階と、
    前記音響信号における音素と前記第1の音素列との比較が前記音素を前記第1の音素列として識別するとき、前記第1のチャンネル番号に同調する段階と、
    を備える方法。
  12. 前記記憶モジュールを、第2の音素列及び該第2の音素列に関連した第2のチャンネル番号を記憶するよう構成する段階と、
    前記音響信号における前記音素を前記第2の音素列と比較する段階と、
    前記音響信号における前記音素と前記第2の音素列との比較が前記音素を前記第2の音素列として識別するとき、前記無線受信機を前記第2のチャンネル番号に同調させる段階と、
    を更に備える、請求項11に記載の方法。
  13. 前記記憶モジュールを、第3の音素列及び該第3の音素列に関連した第3のチャンネル番号を記憶するよう構成する段階と、
    前記音響信号における前記音素を前記第3の音素列と比較する段階と、
    前記音響信号における前記音素と前記第3の音素列との比較が前記音素を前記第3の音素列として識別するとき、前記無線受信機を前記第3のチャンネル番号に同調させる段階と、
    を更に備える、請求項12に記載の方法。
  14. 第2の音素列及び該第2の音素列に関連した第1のプログラミング・フォーマットを記憶する段階と、
    前記音響信号における前記音素を前記第2の音素列と比較する段階と、
    前記音響信号における前記音素と前記第2の音素列との比較が前記音素を前記第2の音素列として識別するとき、前記無線受信機を前記第1のプログラミング・フォーマットに関連した第2のチャンネル番号に同調させる段階と、
    を更に備える、請求項11に記載の方法。
  15. 前記第1のプログラミング・フォーマットがスポーツ・プログラミング・フォーマットである、請求項14に記載の方法。
  16. 前記無線信号がデジタル無線信号である、請求項11に記載の方法。
  17. 前記放送サービスがサテライト放送サービスである、請求項11に記載の方法。
  18. 第2の音素列及び該第2の音素列に関連した第1の機能コマンドを記憶する段階と、
    前記音響信号における前記音素を前記第2の音素列と比較する段階と、
    前記音響信号における前記音素と前記第2の音素列との比較が前記音素を前記第2の音素列として識別するとき、前記第1の機能コマンドを要求する段階と、
    を更に備える、請求項11に記載の方法。
  19. 前記機能コマンドがボリューム・コマンドである、請求項18に記載の方法。
  20. 前記第1の音素列が前記第1のチャンネル番号の音声スペリングである、請求項11に記載の方法。
JP2006523991A 2003-08-21 2004-08-17 車両用無線システムにおける音声認識 Pending JP2007503022A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/646,559 US20050043067A1 (en) 2003-08-21 2003-08-21 Voice recognition in a vehicle radio system
PCT/US2004/026746 WO2005022510A2 (en) 2003-08-21 2004-08-17 Voice recognition in a vehicle radio system

Publications (1)

Publication Number Publication Date
JP2007503022A true JP2007503022A (ja) 2007-02-15

Family

ID=34194554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006523991A Pending JP2007503022A (ja) 2003-08-21 2004-08-17 車両用無線システムにおける音声認識

Country Status (4)

Country Link
US (1) US20050043067A1 (ja)
JP (1) JP2007503022A (ja)
DE (1) DE112004001539B4 (ja)
WO (1) WO2005022510A2 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050102148A1 (en) * 2003-11-10 2005-05-12 Rogitz John L. System and method for providing programming on vehicle radio or audio/video decice in response to voice commands
WO2005069302A1 (en) * 2004-01-07 2005-07-28 Johnson Controls Technology Company System and method for searching stored audio data based on a search pattern
US20050215194A1 (en) * 2004-03-09 2005-09-29 Boling Brian M Combination service request and satellite radio system
US20050273251A1 (en) * 2004-05-21 2005-12-08 Axel Nix Turn-by-turn navigation system with special routing features
DE602004024172D1 (de) * 2004-05-21 2009-12-31 Harman Becker Automotive Sys Automatische Erzeugung einer Wortaussprache für die Spracherkennung
EP1693829B1 (en) * 2005-02-21 2018-12-05 Harman Becker Automotive Systems GmbH Voice-controlled data system
WO2007008248A2 (en) * 2005-07-11 2007-01-18 Voicedemand, Inc. Voice control of a media player
DE102005059630A1 (de) * 2005-12-14 2007-06-21 Bayerische Motoren Werke Ag Verfahren zur Erzeugung von Sprachmustern für eine sprachgesteuerte Senderwahl
DE102006006551B4 (de) * 2006-02-13 2008-09-11 Siemens Ag Verfahren und System zum Bereitstellen von Sprachdialoganwendungen sowie mobiles Endgerät
US7831431B2 (en) * 2006-10-31 2010-11-09 Honda Motor Co., Ltd. Voice recognition updates via remote broadcast signal
DE102006056286B4 (de) * 2006-11-29 2014-09-11 Audi Ag Verfahren zur Wiedergabe von Textinformationen durch Sprache in einem Fahrzeug
US20090271106A1 (en) * 2008-04-23 2009-10-29 Volkswagen Of America, Inc. Navigation configuration for a motor vehicle, motor vehicle having a navigation system, and method for determining a route
US20090271200A1 (en) 2008-04-23 2009-10-29 Volkswagen Group Of America, Inc. Speech recognition assembly for acoustically controlling a function of a motor vehicle
US8077022B2 (en) * 2008-06-11 2011-12-13 Flextronics Automotive Inc. System and method for activating vehicular electromechanical systems using RF communications and voice commands received from a user positioned locally external to a vehicle
KR20110065095A (ko) * 2009-12-09 2011-06-15 삼성전자주식회사 디바이스를 제어하는 방법 및 그 장치
CN102237087B (zh) * 2010-04-27 2014-01-01 中兴通讯股份有限公司 语音控制方法和语音控制装置
US9847083B2 (en) 2011-11-17 2017-12-19 Universal Electronics Inc. System and method for voice actuated configuration of a controlling device
US9020825B1 (en) * 2012-09-25 2015-04-28 Rawles Llc Voice gestures
US8768712B1 (en) 2013-12-04 2014-07-01 Google Inc. Initiating actions based on partial hotwords
KR102298457B1 (ko) * 2014-11-12 2021-09-07 삼성전자주식회사 영상표시장치, 영상표시장치의 구동방법 및 컴퓨터 판독가능 기록매체
WO2017035845A1 (zh) * 2015-09-06 2017-03-09 何兰 根据语音调取频道编组的方法和遥控系统
US10418026B2 (en) 2016-07-15 2019-09-17 Comcast Cable Communications, Llc Dynamic language and command recognition
US20180314979A1 (en) * 2017-04-28 2018-11-01 GM Global Technology Operations LLC Systems and methods for processing radio data system feeds
US10304454B2 (en) * 2017-09-18 2019-05-28 GM Global Technology Operations LLC Persistent training and pronunciation improvements through radio broadcast
KR20200056712A (ko) 2018-11-15 2020-05-25 삼성전자주식회사 전자 장치 및 그 제어 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04267619A (ja) * 1991-02-21 1992-09-24 Alpine Electron Inc 車載用放送受信装置
JPH10247857A (ja) * 1997-03-04 1998-09-14 Matsushita Electric Ind Co Ltd 無線放送受信装置
JP2000250575A (ja) * 1999-03-01 2000-09-14 Matsushita Electric Ind Co Ltd 双方向性テレビ受像機を自動的に選局するための音声理解装置およびその方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5752232A (en) * 1994-11-14 1998-05-12 Lucent Technologies Inc. Voice activated device and method for providing access to remotely retrieved data
US6389055B1 (en) * 1998-03-30 2002-05-14 Lucent Technologies, Inc. Integrating digital data with perceptible signals
US6321196B1 (en) * 1999-07-02 2001-11-20 International Business Machines Corporation Phonetic spelling for speech recognition
DE19942869A1 (de) * 1999-09-08 2001-03-15 Volkswagen Ag Verfahren und Einrichtung zum Betrieb einer sprachgesteuerten Einrichtung bei Kraftfahrzeugen
DE10003617A1 (de) * 2000-01-28 2001-08-02 Volkswagen Ag Verfahren und Vorrichtung zur Spracheingabe bei Autoradios
US20020032019A1 (en) * 2000-04-24 2002-03-14 Marks Michael B. Method for assembly of unique playlists
US6529804B1 (en) * 2000-11-07 2003-03-04 Motorola, Inc. Method of and apparatus for enabling the selection of content on a multi-media device
US20020067839A1 (en) * 2000-12-04 2002-06-06 Heinrich Timothy K. The wireless voice activated and recogintion car system
EP1221692A1 (en) * 2001-01-09 2002-07-10 Robert Bosch Gmbh Method for upgrading a data stream of multimedia data
US7472075B2 (en) * 2001-03-29 2008-12-30 Intellisist, Inc. System and method to associate broadcast radio content with a transaction via an internet server
US6876970B1 (en) * 2001-06-13 2005-04-05 Bellsouth Intellectual Property Corporation Voice-activated tuning of broadcast channels
FI111494B (fi) * 2001-06-29 2003-07-31 Nokia Corp Langaton käyttöliittymän laajennus
DE10207895B4 (de) * 2002-02-23 2005-11-03 Harman Becker Automotive Systems Gmbh Verfahren zur Spracherkennung und Spracherkennungssystem
US6950638B2 (en) * 2002-04-30 2005-09-27 General Motors Corporation Method and system for scheduling user preference satellite radio station selections in a mobile vehicle
US20040260438A1 (en) * 2003-06-17 2004-12-23 Chernetsky Victor V. Synchronous voice user interface/graphical user interface

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04267619A (ja) * 1991-02-21 1992-09-24 Alpine Electron Inc 車載用放送受信装置
JPH10247857A (ja) * 1997-03-04 1998-09-14 Matsushita Electric Ind Co Ltd 無線放送受信装置
JP2000250575A (ja) * 1999-03-01 2000-09-14 Matsushita Electric Ind Co Ltd 双方向性テレビ受像機を自動的に選局するための音声理解装置およびその方法

Also Published As

Publication number Publication date
WO2005022510A3 (en) 2006-06-15
WO2005022510A2 (en) 2005-03-10
DE112004001539T5 (de) 2006-06-29
US20050043067A1 (en) 2005-02-24
DE112004001539B4 (de) 2009-08-27

Similar Documents

Publication Publication Date Title
JP2007503022A (ja) 車両用無線システムにおける音声認識
US7831431B2 (en) Voice recognition updates via remote broadcast signal
KR100303411B1 (ko) 싱글캐스트 대화형 라디오 시스템
JP5053432B2 (ja) 個人化されたコンテンツを備える車両インフォテインメントシステム
US9263027B2 (en) Broadcast system using text to speech conversion
US6081780A (en) TTS and prosody based authoring system
EP2053595B1 (en) Text pre-processing for text-to-speech generation
EP2163434A2 (en) Vehicle infotainment system with virtual personalization settings
KR960701532A (ko) 부반송파를 이용한 정보전파용 라디오수신장치(radio receiver for information dissemination using subcarrier)
EP1137209A2 (en) Method and receiver for receiving digital broadcast signals
JP2004056226A (ja) ディジタル放送受信装置
US20020087330A1 (en) Method of communicating a set of audio content
CA2616267C (en) Vehicle infotainment system with personalized content
US20090112603A1 (en) Control of a non-active channel in a multi-channel receiver
US20040194137A1 (en) Method, system, and apparatus for aural presentation of program guide
JPH0944189A (ja) テキスト情報の合成音声読み上げ装置及び文字放送受信機
US20050102148A1 (en) System and method for providing programming on vehicle radio or audio/video decice in response to voice commands
JP3315845B2 (ja) 車載音声合成装置
JP3913884B2 (ja) 音声認識による選局装置及び方法並びに音声認識による選局用プログラムを記録した記録媒体
JP2004304808A (ja) デジタル音声受信機
JP4414980B2 (ja) 放送受信装置
JP2004517584A (ja) 放送情報を提供する方法及びシステム
JP2001156595A (ja) 受信装置
CN113961670A (zh) 一种自动语音回复天气信息的智能系统
JP2001184597A (ja) 自動車情報提供方法及びカーナビゲーションシステム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090721

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091211