JP2012128240A

JP2012128240A - 音声認識システム及び辞書生成装置

Info

Publication number: JP2012128240A
Application number: JP2010280388A
Authority: JP
Inventors: Katsushi Asami; 克志浅見; Daigo Tsui; 大悟堆
Original assignee: Denso Corp
Current assignee: Denso Corp
Priority date: 2010-12-16
Filing date: 2010-12-16
Publication date: 2012-07-05

Abstract

【課題】ユーザが発話した時から音声認識が完了するまでに要する時間の短縮を図るとともに、多様な認識語彙の変化に対応可能とする。
【解決手段】携帯プレーヤ５が端末装置３に装着されると、端末装置３は、携帯プレーヤ５に記憶されている楽曲データのＴＯＣデータを携帯プレーヤ５から読み込んで遠隔サーバ７に送信する。一方、ＴＯＣデータを受信した遠隔サーバ７は、このＴＯＣデータに関連する情報を読み込んでＴＯＣデータと関連付けながら辞書データを生成した後、その生成された辞書データを端末装置３に送信する。そして、受信した辞書データの辞書保持メモリ３Ｄに保存する。これにより、ユーザが発話した時から音声認識が完了するまでに要する時間の短縮を図るとともに、多様な認識語彙の変化に対応することが可能となる。
【選択図】図１

Description

本発明は、ユーザから発せられた音声に対応する情報を認識する音声認識システム及び辞書生成装置に関するものである。

例えば、特許文献１に記載の音声認識システムを利用した音楽プレーヤでは、楽曲見出しデータ（楽曲名データ）のみに基づいて音声認識用の辞書データを作成した後、その辞書データとユーザより発せられた楽曲名を意図する音声から得られた音声データとを照合し、その音声に対応する楽曲を決定して再生している。

また、以下のような音声認識システムを利用した音楽プレーヤシステムも提案されている。すなわち、先ず、楽曲見出しデータ（楽曲名データ）を外部に設けられた遠隔サーバコンピュータに送信し、遠隔サーバコンピュータにて音声認識用の辞書データを作成する。

次に、ユーザより発せられた楽曲名を意図する音声から得られた音声データが、ユーザが携帯する音楽プレーヤから遠隔サーバコンピュータに送信され、遠隔サーバコンピュータにて音声認識（辞書データとの照合）されることにより、再生すべき楽曲名が決定（認識）される。そして、遠隔サーバコンピュータにて決定された楽曲名を示す情報が、ユーザが携帯する音楽プレーヤに送信された後、当該楽曲の再生が開始される。

特開２００５−７８７０５号公報

しかし、特許文献１に記載の発明では、楽曲見出しデータのみに基づいて音声認識用の辞書データを作成するので、楽曲見出しデータ以外の情報に基づいて特定の楽曲を決定することができない。このため例えば、ユーザが楽曲名やアーティスト名を正確に記憶していない場合には、ユーザが意図した楽曲を再生することが難しく、多様な認識語彙の変化に対応できないという問題がある。

また、遠隔サーバコンピュータと通信を行うことにより再生すべき楽曲を決定する音楽プレーヤでは、ユーザが楽曲名を意図する音声を発（発話）した時から実際に再生が開始されるまで時間を要するという問題がある。

本発明は、上記点に鑑み、ユーザが発話した時から音声認識が完了するまでに要する時間の短縮を図るとともに、多様な認識語彙の変化に対応可能とすることを目的とする。

本発明は、上記目的を達成するために、請求項１に記載の発明では、ユーザから発せられた音声に対応する情報を認識する音声認識システムであって、ユーザにより操作される端末装置（３）と、端末装置（３）に設けられ、音声が入力される入力手段（３Ｃ）と、端末装置（３）と通信可能な遠隔装置（７）と、遠隔装置（７）に設けられ、既知の情報及びその情報に関連する情報からなる辞書データを生成するとともに、その辞書データを端末装置（３）に送信する辞書生成手段（Ｓ２３〜Ｓ３１）と、端末装置（３）に設けられ、辞書生成手段（Ｓ２３〜Ｓ３１）により生成された辞書データを受信して記憶する認識用辞書データ記憶手段（３Ｄ）と、認識用辞書データ記憶手段（３Ｄ）に記憶されている辞書データを参照して入力手段（３Ｃ）を介して得られた音声データに対応する情報を認識する音声認識手段（３Ｂ）とを備えることを特徴とする。

これにより、請求項１に記載の発明では、音声データに対応する情報の認識を行う音声認識手段（３Ｂ）、及び音声データとの照合を行うための辞書データが端末装置（３）に設けられた構成となるので、遠隔サーバコンピュータと通信を行う発明に比べて、ユーザが発話した時から音声認識が完了するまでに要する時間を短縮することが可能となる。

また、認識用辞書データ記憶手段（３Ｄ）に記憶されている辞書データは、既知の情報及びその情報に関連する情報に基づいて生成された辞書データであるので、多様な認識語彙の変化に対応しながら、音声認識を行うことができる。

したがって、請求項１に記載の発明では、ユーザが発話した時から音声認識が完了するまでに要する時間の短縮を図るとともに、多様な認識語彙の変化に対応することが可能となる。

請求項２に記載の発明では、ユーザから発せられた音声に対応する情報を認識する音声認識システムであって、音声が入力される入力手段（３Ｃ）と、既知の情報に関連する関連情報を、通信回線を介して取得する関連情報取得手段（Ｓ５５）と、既知の情報及び当該情報についての関連情報からなる辞書データを生成する辞書生成手段（Ｓ５７）と、辞書生成手段（Ｓ５７）により生成された辞書データを参照して入力手段（３Ｃ）を介して得られた音声データに対応する情報を認識する音声認識手段（３Ｂ）とを備えることを特徴とする。

これにより、請求項２に記載の発明も請求項１に記載の発明と同様に、ユーザが発話した時から音声認識が完了するまでに要する時間の短縮を図るとともに、多様な認識語彙の変化に対応することが可能となる。

請求項３に記載の発明では、ユーザから発せられた音声に対応する情報を認識する音声認識システムに用いられる辞書生成装置であって、既知の情報に関連する関連情報を、通信回線を介して取得する関連情報取得手段（Ｓ５５）と、既知の情報及び当該情報についての関連情報からなる辞書データを生成する辞書生成手段（Ｓ２３〜Ｓ３１）とを備えることを特徴とする。

これにより、請求項３に記載の発明も請求項１に記載の発明と同様に、ユーザが発話した時から音声認識が完了するまでに要する時間の短縮を図るとともに、多様な認識語彙の変化に対応することが可能となる。

因みに、上記各手段等の括弧内の符号は、後述する実施形態に記載の具体的手段等との対応関係を示す一例であり、本発明は上記各手段等の括弧内の符号に示された具体的手段等に限定されるものではない。

本発明の第１実施形態に係る音声認識システムの概念図である。（ａ）は知識情報データベースのデータ例を示す図であり、（ｂ）は楽曲−認識キーワード対応テーブルの内容を示す図である。本発明の第１実施形態に係る端末装置の作動を示すフローチャートである。本発明の第１実施形態に係る遠隔サーバの作動を示すフローチャートである。本発明の第１実施形態に係る楽曲再生の作動を示すフローチャートである。本発明の第２実施形態に係る音声認識システムの概念図である。本発明の第２実施形態に係る端末装置の作動を示すフローチャートである。本発明の第２実施形態に係る遠隔サーバの作動を示すフローチャートである。

本実施形態は、本発明に係る音声認識システム及び辞書生成装置を、車両用楽曲再生装置に適用したものであり、以下に本発明の実施形態を図面と共に説明する。
（第１実施形態）
１．車両用楽曲再生装置の構成
１．１．構成の概要
本実施形態に係る車両用楽曲再生装置１は、図１に示すように、車両に組み込まれた端末装置３、端末装置３に着脱自在に装着可能な携帯プレーヤ５、及び端末装置３と無線回線及び有線回線を介して通信可能な遠隔サーバ７等から構成されている。

そして、携帯プレーヤ５が端末装置３に装着されると、携帯プレーヤ５と端末装置３との間で相互に通信可能となり、端末装置３の音声認識機能を利用して携帯プレーヤ５を端末装置３を介して操作することができる。

つまり、携帯プレーヤ５には楽曲データが格納（保存）されており、ユーザは携帯プレーヤ５の操作部（図示せず。）を直接操作する、又は端末装置３の音声認識機能を利用して携帯プレーヤ５を間接的に操作することにより、携帯プレーヤ５に格納されている楽曲を再生することができる。

１．２．端末装置
制御装置３Ａは、端末装置３に組み込まれた各機器を統合的に制御する制御手段であり、音声認識装置３Ｂは、発話音声データと登録音声データとを照合することにより、ユーザから発せられた音声に基づいて操作命令や再生すべき楽曲名を認識する音声認識手段である。

なお、ユーザから発せられた音声は、音声入力手段であるマイクロフォン３Ｃ（図１では「マイク」と表記）を介して音声認識装置３Ｂに入力され、音声認識装置３Ｂは、制御装置３Ａと協働して入力された音声を音声認識装置３Ｂにて解析可能な発話音声データに変換する。

辞書保持メモリ３Ｄは、音声認識装置３Ｂが参照可能な音声認識用の辞書（以下、認識辞書という。）を記憶・保持する記憶手段である。なお、認識用辞書は、携帯プレーヤ５を操作するための操作命令に対応する音声データや再生すべき楽曲名を特定するための音声データ等の集合体であり、認識用辞書に登録されている音声データを登録音声データという。

送受信装置３Ｅは、端末装置３と遠隔サーバ７との間で情報通信を行うための通信手段であり、この送受信装置３Ｅは、直接的又は中継局等を介して間接的に遠隔サーバと無線通信を行うことにより、端末装置３と遠隔サーバ７との間で情報通信を行う。

１．３．遠隔サーバ
遠隔サーバ７は、音声認識装置３Ｂが音声認識を行う際に参照する辞書データを生成する辞書生成装置７Ａを有しており、この辞書生成装置７Ａは、既知の情報及びその情報に関連する情報、並びに音声認識用の認識辞書からなる辞書データを生成するとともに、その生成した辞書データを送受信装置７Ｂを介して端末装置３に送信する。

ここで、本実施形態における「既知の情報」とは、端末装置３に装着された携帯プレーヤ５に格納されている楽曲データついての楽曲見出しデータをいい、具体的には、楽曲名及びアーティスト名等の目次情報（Table of contents）データ（以下、ＴＯＣデータという。）である。

つまり、通常、携帯プレーヤ５に楽曲データが保存される際には、楽曲データと合わせてＴＯＣデータが携帯プレーヤ５に自動的に保存されることから、本実施形態では、ＴＯＣデータを辞書データを生成する際の「既知の情報」として利用している。

また、本実施形態における「既知の情報に関連する情報」とは、ＴＯＣデータに関連した情報をいい、具体的には、図２（ａ）に示すように、（ａ）楽曲名の通称名、（ｂ）その楽曲が収められたアルバム名の通称名、（ｃ）アーティスト名の通称名、（ｄ）その楽曲が使用された映画やテレビドラマの題名、（ｅ）その映画等の出演者、（ｆ）その楽曲が使用されたＣＭの製品名やメーカ名（広告主）、（ｇ）その楽曲のエピソードに関連するキーワード等をいう。

なお、通称名とは、正式な名称ではないが、特定の人や物に対する呼び名として世間一般において通用しているもののことである。例えば、楽曲名やアーティスト名の短縮形、イニシャル、ニックネーム等である。

そして、辞書生成装置７Ａは、遠隔サーバ７が有する知識データベース７Ｃ又は通信を介して入手した他の遠隔サーバが有する知識データベースに保存されている知識情報データベースから「既知の情報に関連する情報」を読み込んで、ＴＯＣデータと関連付けながら辞書データを生成する。

因みに、辞書生成装置７Ａでは、例えば図２（ｂ）に示すように、楽曲名、アルバム名、アーティスト名及びこれらの「既知の情報に関連する情報（以下、関連情報という。）」からなるテーブルデータ形式の辞書データを生成する。

２．車両用楽曲再生装置の作動
２．１．作動の概要
携帯プレーヤ５が端末装置３に装着されると、端末装置３は、携帯プレーヤ５に記憶されている楽曲データに係るＴＯＣデータを携帯プレーヤ５から読み込んで後、そのＴＯＣデータを遠隔サーバ７に送信する。

一方、ＴＯＣデータを受信した遠隔サーバ７は、このＴＯＣデータに係る関連情報を読み込んでＴＯＣデータと関連付けながら辞書データを生成した後、その生成された辞書データを端末装置３に送信する。

そして、端末装置３にて受信した辞書データの辞書保持メモリ３Ｄへの保存が完了すると、端末装置３が音声による操作命令等を受ける付けることが可能な状態となるとともに、その旨がユーザへ報知される。

その後、ユーザから楽曲名やこれに係る関連情報が発話されると、端末装置３は、発話内容を認識した後、発話内容に対応した楽曲を再生すべき旨の指令信号を携帯プレーヤ５に送信する。これにより、端末装置３に装着された携帯プレーヤ５に記憶されている楽曲のうち、発話内容に対応する楽曲が再生される。

２．２．端末装置の作動（図３参照）
図３に示すフローチャートに示される制御は、携帯プレーヤ５が端末装置３に装着されたときに端末装置３（制御装置３Ａ）で自動的に起動・実行されるものである。

なお、本実施形態では、端末装置３と携帯プレーヤ５とが通信可能な状態となったときに、端末装置３は携帯プレーヤ５が端末装置３に装着されたと判断する。また、本制御を実行するためのプログラムは、制御装置３Ａに内蔵されたＲＯＭ等の不揮発性記憶手段に記憶されている。

そして、携帯プレーヤ５が端末装置３に装着されると、図３に示すように、先ず、携帯プレーヤ５に記憶されているＴＯＣデータから楽曲見出しデータが端末装置３に読み込まれるとともに（Ｓ１）、その読み込まれた楽曲見出しデータが遠隔サーバ７に送信される（Ｓ３）。

次に、遠隔サーバ７から送信されてきた辞書データ、つまり楽曲−認識キーワード対応テーブル（図２（ｂ）参照）及び認識辞書が受信されると（Ｓ５）、その受信された辞書データが辞書保持メモリ３Ｄに格納された後（Ｓ７）、その格納された辞書データが音声認識装置３Ｂによる参照（照合）対象として音声認識装置３Ｂに登録されて（Ｓ９）、その辞書データが参照可能状態となる。

２．３．遠隔サーバの作動（図４参照）
図４に示すフローチャートに示される制御は遠隔サーバ７にて実行される制御であり、本制御は、遠隔サーバ７の起動とともに起動・実行される。なお、本制御を実行するためのプログラムは、遠隔サーバ７に内蔵されたＲＯＭやＨＤＤ等の不揮発性記憶手段に記憶されている。

そして、本制御が起動されると、先ず、端末装置３から送信されてきた楽曲見出しデータが受信されたか否かが判定され（Ｓ２１）、受信されていないと判定された場合には（Ｓ２１：ＮＯ）、受信待ち状態となり、一方、受信されたと判定された場合には（Ｓ１２：ＹＥＳ）、既知の情報である楽曲見出しデータ及び楽曲毎の関連情報を基づいて辞書データが生成される（Ｓ２３〜Ｓ２９）。

つまり、楽曲毎に知識データベースが検索され、その楽曲についての関連情報が抽出されるとともに（Ｓ２３）、楽曲−認識キーワード対応テーブル（図２（ｂ）参照）が作成された後（Ｓ２７）、その楽曲−認識キーワード対応テーブルから読みデータが抽出され（Ｓ２７）、楽曲−認識キーワード対応テーブルに基づいて木構造状に整理された辞書が作成される（Ｓ２９）。

なお、読みデータとは、発話内容を示す表音文字（平仮名や片仮名等）に対応する音声データ（図２（ｂ）のＩＤ以外の情報）であり、これら読みデータに従って認識キーワードを、例えば五十音順の木構造に整理することにより、音声認識装置３Ｂが高速に音声認識（参照・照合）可能なデータ構造とすることが可能となる。

そして、音声を認識するための認識辞書及び楽曲−認識キーワード対応テーブル等からなる辞書データが端末装置３に送信された後（Ｓ３１）、再び、Ｓ２１が実行される。
２．４．楽曲再生
図５に示すフローチャートに示される制御は、携帯プレーヤ５が端末装置３に装着されている場合であって、トークスイッチ（図示せず。）等の音声認識を利用して特定の楽曲を再生させるスイッチがユーザにより投入されたときに端末装置３（制御装置３Ａ）で起動・実行されるものである。

そして、トークスイッチが投入されてマイクロフォン３Ｃから音声が入力されると（Ｓ４１）、音声認識装置３Ｂにて入力された音声データと登録音声データとが照合されて、ユーザから発せられた音声の内容が認識される（Ｓ４３）。なお、音声認識の詳細は、公知の手法（例えば特開２０１０−３３３４０号公報等に記載された手法）と同様であるので、本明細書では、音声認識手法の詳細説明は省略する。

次に、Ｓ４３にて認識された結果が楽曲−認識キーワード対応テーブルから検索されて（Ｓ４５）、認識結果に対応する楽曲が抽出された後（Ｓ４７）、その抽出された楽曲を再生すべき旨の信号が端末装置３から携帯プレーヤ５に送信される（Ｓ４９）。これより、携帯プレーヤ５は、その音声認識された内容に対応する楽曲を再生する。

３．本実施形態に係る車両用楽曲再生装置の特徴
本実施形態に係る車両用楽曲再生装置１では、音声データに対応する情報の認識を行う音声認識装置３Ｂ、及び音声データとの照合を行うための辞書データが端末装置３に設けられた構成となるので、遠隔サーバコンピュータと通信を行う場合に比べて、ユーザが発話した時から音声認識が完了するまでに要する時間を短縮することが可能となる。

また、辞書保持メモリ３Ｄに記憶されている辞書データは、既知の情報である楽曲見出しデータ及びその情報に関連情報（楽曲−認識キーワード対応テーブル）に基づいて生成された辞書データであるので、発話された内容が楽曲名と異なる場合であっても再生すべき楽曲を特定することができ、多様な認識語彙の変化に対応しながら、音声認識を行うことができる。

つまり、楽曲見出しデータに含まれていない内容をユーザが発話した場合であっても、その発話された情報を音声認識し、かつ、楽曲−認識キーワード対応テーブルを検索することにより楽曲を特定するので、多様な認識語彙の変化に対応しながら、音声認識を行うことができる。

以上のように、本実施形態に係る車両用楽曲再生装置１によれば、ユーザが発話した時から音声認識が完了するまでに要する時間の短縮を図るとともに、多様な認識語彙の変化に対応することが可能となる。

４．発明特定事項と実施形態との対応関係
本実施形態では、マイクロフォン３Ｃが特許請求の範囲に記載された入力手段に相当し、遠隔サーバ７が特許請求の範囲に記載された遠隔装置に相当し、遠隔サーバ７で実行されるＳ２３〜Ｓ３１が特許請求の範囲に記載された辞書生成手段に相当し、辞書保持メモリ３Ｄが特許請求の範囲に記載された認識用辞書データ記憶手段に相当し、音声認識装置３Ｂが特許請求の範囲に記載された音声認識手段に相当する。また、辞書生成装置７Ａが特許請求の範囲に記載された辞書生成装置に相当する。

（第２実施形態）
第１実施形態では、関連情報の取得及び辞書データの生成を遠隔サーバ７にて実行したが、本実施形態は、端末装置３にて辞書データの生成を実行するものである。

すなわち、本実施形態係る遠隔サーバ７は、図６に示すように、辞書データ（特に、認識辞書）を生成する機能を有しておらず、楽曲−認識キーワード対応テーブル作成装置７Ｄにて楽曲−認識キーワード対応テーブルを作成し、その作成した楽曲−認識キーワード対応テーブルを端末装置３に送信する。

また、端末装置３には、認識辞書及び受信した楽曲−認識キーワード対応テーブルに基づいて辞書データを生成する辞書生成装置３Ｆが設けられている。
１．車両用楽曲再生装置の作動
１．１．作動の概略
携帯プレーヤ５が端末装置３に装着されると、端末装置３は、携帯プレーヤ５に記憶されている楽曲データのＴＯＣデータを携帯プレーヤ５から読み込んで遠隔サーバ７に送信する。

一方、ＴＯＣデータを受信した遠隔サーバ７は、このＴＯＣデータに係る関連情報を遠隔サーバ７が有する知識データベース７Ｃ又は通信を介して入手した他の遠隔サーバが有する知識データベースから抽出して楽曲−認識キーワード対応テーブルを作成した後、その作成された楽曲−認識キーワード対応テーブルを端末装置３に送信する。

そして、端末装置３は、認識辞書を作成するとともに、その認識辞書及び受信した楽曲−認識キーワード対応テーブルから辞書データを生成した後、その辞書データを辞書保持メモリ３Ｄへ保存する。これにより、端末装置３が音声による操作命令等を受ける付けることが可能な状態となると、その旨がユーザへ報知される。

その後、ユーザから楽曲名やこれに関する関連情報が発話されると、端末装置３は、発話内容を認識した後、発話内容に対応した楽曲を再生すべき旨の指令信号を携帯プレーヤ５に送信する。これにより、端末装置３に装着された携帯プレーヤ５に記憶されている楽曲のうち、発話内容に対応する楽曲が再生される。

１．２．端末装置の作動（図７参照）
図７に示すフローチャートに示される制御は、携帯プレーヤ５が端末装置３に装着されたときに端末装置３（制御装置３Ａ）で自動的に起動・実行されるものである。

そして、携帯プレーヤ５が端末装置３に装着されると、図７に示すように、先ず、携帯プレーヤ５に記憶されているＴＯＣデータから楽曲見出しデータが端末装置３に読み込まれるとともに（Ｓ５１）、その読み込まれた楽曲見出しデータが遠隔サーバ７に送信される（Ｓ５３）。

次に、遠隔サーバ７から送信されてきた楽曲−認識キーワード対応テーブルが受信されると（Ｓ５５）、その楽曲−認識キーワード対応テーブルから読みデータが抽出され（Ｓ５７）、楽曲−認識キーワード対応テーブル基づいて木構造状に整理された辞書及び認識辞書、つまり辞書データが生成される（Ｓ５９）。

そして、Ｓ５９にて生成された辞書データが辞書保持メモリ３Ｄに格納された後（Ｓ６１）、その格納された辞書データが音声認識装置３Ｂによる参照（照合）対象として音声認識装置３Ｂに登録されて（Ｓ６３）、その辞書データが参照可能状態となる。

１．３．遠隔サーバの作動（図８参照）
図８に示すフローチャートに示される制御は遠隔サーバ７にて実行される制御であり、本制御は、遠隔サーバ７の起動とともに起動・実行される。なお、本制御を実行するためのプログラムは、遠隔サーバ７に内蔵されたＲＯＭやＨＤＤ等の不揮発性記憶手段に記憶されている。

そして、本制御が起動されると、先ず、端末装置３から送信されてきた楽曲見出しデータが受信されたか否かが判定され（Ｓ７１）、受信されていないと判定された場合には（Ｓ７１：ＮＯ）、受信待ち状態となる。

一方、受信されたと判定された場合には（Ｓ７２：ＹＥＳ）、既知の情報である楽曲見出しデータに基づいて、楽曲毎に知識データベースが検索されてその楽曲についての関連情報が抽出される（Ｓ７３）。

次に、抽出された情報（関連情報）に基づいて楽曲−認識キーワード対応テーブルが作成された後（Ｓ７５）、その楽曲−認識キーワード対応テーブルが端末装置３に送信された後（Ｓ７７）、再び、Ｓ７１が実行される。

２．本実施形態に係る車両用楽曲再生装置の特徴
本実施形態に係る車両用楽曲再生装置１においても、音声データに対応する情報の認識を行う音声認識装置３Ｂ、及び音声データとの照合を行うための辞書データが端末装置３に設けられた構成となるので、遠隔サーバコンピュータと通信を行う場合に比べて、ユーザが発話した時から音声認識が完了するまでに要する時間を短縮することが可能となる。

また、辞書保持メモリ３Ｄに記憶されている辞書データは、既知の情報である楽曲見出しデータ及びその情報に関連する情報（楽曲−認識キーワード対応テーブル）に基づいて生成された辞書データであるので、多様な認識語彙の変化に対応しながら、音声認識を行うことができる。

３．発明特定事項と実施形態との対応関係
本実施形態では、マイクロフォン３Ｃが特許請求の範囲に記載された入力手段に相当し、遠隔サーバ７が特許請求の範囲に記載された遠隔装置に相当し、端末装置３で実行されるＳ５７が特許請求の範囲に記載された辞書生成手段に相当し、端末装置３で実行されるＳ５５が特許請求の範囲に記載された関連情報取得手段に相当し、音声認識装置３Ｂが特許請求の範囲に記載された音声認識手段に相当する。また、辞書生成装置３Ｆが特許請求の範囲に記載された辞書生成装置に相当する。

（その他の実施形態）
上述の実施形態では、本発明を車両用楽曲再生装置に適用したが、本発明の適用はこれに限定されるものではない。

なお、車両用楽曲再生装置においては、ＴＯＣデータが既知の情報に相当し、楽曲名の通称名等が既知の情報に関連する情報（関連情報）に相当したが、例えばカーナビゲーションシステムに本発明を適用した場合には、例えば「行き先名」等が「既知の情報」に相当し、その「行き先名に関係した情報」が「既知の情報に関連する情報（関連情報）」に相当する。

また、第２実施形態においては、楽曲−認識キーワード対応テーブルは遠隔サーバ７で作成したが、本発明はこれに限定されるものではなく、楽曲−認識キーワード対応テーブルを端末装置３で作成してもよい。つまり、端末装置３は、楽曲見出しデータについての関連情報を遠隔サーバ７を介して取得し、楽曲−認識キーワード対応テーブルの作成を端末装置３にて行ってもよい。

また、本発明は、特許請求の範囲に記載された発明の趣旨に合致するものであればよく、上述の実施形態に限定されるものではない。

１…車両用楽曲再生装置、３…端末装置、３Ａ…制御装置、３Ｂ…音声認識装置、
３Ｃ…マイクロフォン、３Ｄ…辞書保持メモリ、５…携帯プレーヤ、
７…遠隔サーバ、７Ａ…辞書生成装置、７Ｂ…送受信装置。

Claims

ユーザから発せられた音声に対応する情報を認識する音声認識システムであって、
ユーザにより操作される端末装置と、
前記端末装置に設けられ、音声が入力される入力手段と、
前記端末装置と通信可能な遠隔装置と、
前記遠隔装置に設けられ、既知の情報及びその既知の情報に関連する情報からなる辞書データを生成するとともに、その辞書データを前記端末装置に送信する辞書生成手段と、
前記端末装置に設けられ、前記辞書生成手段により生成された辞書データを受信して記憶する認識用辞書データ記憶手段と、
前記認識用辞書データ記憶手段に記憶されている辞書データを参照して前記入力手段を介して得られた音声データに対応する情報を認識する音声認識手段と
を備えることを特徴とする音声認識システム。
ユーザから発せられた音声に対応する情報を認識する音声認識システムであって、
音声が入力される入力手段と、
既知の情報に関連する関連情報を、通信回線を介して取得する関連情報取得手段と、
既知の情報及び当該情報についての前記関連情報からなる辞書データを生成する辞書生成手段と、
前記辞書生成手段により生成された辞書データを参照して前記入力手段を介して得られた音声データに対応する情報を認識する音声認識手段と
を備えることを特徴とする音声認識システム。
ユーザから発せられた音声に対応する情報を認識する音声認識システムに用いられる辞書生成装置であって、
既知の情報に関連する関連情報を、通信回線を介して取得する関連情報取得手段と、
既知の情報及び当該情報についての前記関連情報からなる辞書データを生成する辞書生成手段と
を備えることを特徴とする辞書生成装置。