JP2005043654A

JP2005043654A - 楽曲情報配信システム

Info

Publication number: JP2005043654A
Application number: JP2003277481A
Authority: JP
Inventors: Masahiko Tateishi; 雅彦立石; Fumihiko Murase; 文彦村瀬
Original assignee: Denso Corp
Current assignee: Denso Corp
Priority date: 2003-07-22
Filing date: 2003-07-22
Publication date: 2005-02-17
Anticipated expiration: 2023-07-22
Also published as: JP4103715B2

Abstract

【課題】ユーザ毎に異なる読みに対応できると共に、読みの更新作業の工数を削減できる音楽情報配信システムを提供すること。
【解決手段】音声によって楽曲データを検索する楽曲検索装置１００と、有線または無線にて通信を行うことによって楽曲検索装置１００に楽曲データを検索するための選曲データを配信するサーバ２００とからなる楽曲情報配信システムである。サーバ２００は、楽曲検索装置１００から取得したＴＯＣ情報に対応する音楽ＣＤ１３の選曲データ作成し、楽曲検索装置１００に送信する。原選曲データデータベース２０１は、ＸＭＬ読みパターンを含む原選曲データを保持している。木構造読みデータ変換部２０３は、読みデータ変換規則管理部２０２の規則に従って、原選曲データ中のＸＭＬ読みパターンを木構造読みパターンに変換することによって選曲データを作成する。
【選択図】図２

Description

本発明は、楽曲情報配信システムに関するものである。本発明における楽曲情報配信システムは、例えば、車両に搭載されたオーディオ装置等に適用されるものである。

従来、多くの楽曲データの中から音声によって所望の楽曲データを検索する装置として特許文献１に記載される楽曲検索装置がある。図２１は、特許文献１の楽曲検索装置の処理動作を示すフロー図である。

ステップＳ１でマイクロフォンの指向性切替スイッチが選曲位置へスライドされると、ステップＳ２でマイクロフォンの音声入力による選曲ができることがモニタに表示され、ステップＳ３で曲名による選曲が設定されると、ステップＳ４でマイクロフォンから入力される音声の音声認識が開始される。そして、ステップＳ５では、最初の音声が入力されたときから、予め設定されている待ち時間Ｔ１が経過すると、入力された音声が認識できたかが判定される。

Ｔ１が経過するとステップＳ６へ進み、ステップＳ６で音声認識できた場合には、ステップＳ７で、その認識された音声データに対応する音声データが、曲名検索テーブルに存在するかが検索され、ステップＳ８でそのデータが存在する場合はステップＳ９へ進む。ステップＳ９では、その検索結果がモニタに表示され、ステップＳ１０へ進む。ステップＳ１０では、所望の曲名を選択する選択ボタンが押されたかを判定し、選択ボタンが押すされるとステップＳ１１へ進む。ステップＳ１１では、その選択された曲名の選曲番号を示す選曲番号データが予約曲データメモリに格納される。
特開平１０−９１１７６号公報

しかしながら、音楽ＣＤに含まれる楽曲データを音声によって検索する場合、その音楽ＣＤ名や楽曲名にはサブタイトルや年代を表す数字などの属性を示す文字列を含むものがある。このような文字列部分の読みはユーザ毎に異なる場合がある。また、歌手名に関しては、その属性として、デビュー後に仇名のような別名を持つ場合も多い。上記従来技術では、このような属性は考慮されておらずユーザ毎の読みに対応できない。また、歌手名を別名でも検索ができるように読みを更新する場合など、その更新は人手がかかるという問題があった。

本発明は上記問題点に鑑みなされたものであり、各種の読みに対応できる音楽情報配信システムを提供することを第１の目的とする。また、読みの更新作業の工数を削減できる音楽情報配信システムを提供することを第２の目的とするものである。

上記目的を達成する為に請求項１に記載の楽曲情報配信システムでは、音声によって楽曲データを検索するクライアントと、有線または無線にて通信を行うことによってクライアントに楽曲データを検索するための選曲データを配信するサーバとからなる楽曲情報配信システムであって、サーバは、楽曲データの歌手名、音楽媒体名、曲名について、その読み仮名の論理構造を示す読みパターンを含む原選曲データを保持する原選曲データ保持手段と、論理構造を示す読みパターンから複数の読み又は省略可能な読みを表現する木構造読みパターンを生成する所定の規則を保持する生成規則保持手段と、木構造読みパターンを含む選曲データをクライアントに配信する木構造読みパターン生成手段とを備え、クライアントは、楽曲データを複数記憶する楽曲データ記憶手段と、楽曲データを検索するための音声を入力する音声入力手段と、音声入力手段に入力された音声をその音声に相当する記号列に変換する音声変換部と、記号列を選曲データの木構造読みパターンと照合することによって楽曲データを検索する検索手段とを備えることを特徴とするものである。

これによれば、楽曲データの歌手名などの読み仮名の論理構造を示す読みパターンからユーザ毎の読みに応じた所定の規則に従って木構造読みパターンを生成することによって、ユーザ毎に異なる読みに対応できる。

また請求項２に記載の楽曲情報配信システムでは、読みパターンは、ＸＭＬを用いて記述されることを特徴とするものである。これによれば、論理構造を示すタグにそれぞれ曖昧性のない意味付けが可能となるため、タグ付け作業が容易となり、作業の正確性を高め、工数を低減することができる。

請求項３に記載の楽曲情報配信システムでは、サーバは、クライアントからクライアントが最後にサーバにアクセスした日時を受信し、その日時以後に歌手名、音楽媒体名、曲名の情報が更新された楽曲の識別子のリストをクライアントに送信し、クライアントは、識別子のリストに合致する楽曲データを記憶していた場合、その楽曲データに対応する選曲データをサーバから取得することを特徴とするものである。

これによれば、クライアントは取得した識別子のリストに合致する楽曲データを有していた場合、その楽曲データに関する選曲データをサーバから取得することで、選曲データを最新のものにできる。

請求項４に記載の楽曲情報配信システムでは、生成規則保持手段は、別名を有する歌手または音楽媒体場合、読みパターンの歌手名または音楽媒体名に相当する部分を、歌手または音楽媒体の正式名及び別名の両方の読みを表現する木構造読みパターンに変換する規則を有することを特徴とするものである。

これによれば、音楽媒体の正式名及び別名の両方の読みを表現する木構造読みパターンに変換する規則を有することによって、楽曲データを検索する際に、正式名及び別名のどちらを音声として入力しても検索することができる。

請求項５に記載の楽曲情報配信システムでは、生成規則保持手段は、サブタイトルを有する音楽媒体または曲の場合、読みパターンのサブタイトルに相当する部分を、サブタイトルの読みを省略可能な読みを表現する木構造読みパターンに変換する規則を有することを特徴とするものである。

これによれば、サブタイトルの読みを省略可能な読みを表現する木構造読みパターンに変換する規則を有することによって、楽曲データを検索する際に、サブタイトルを音声として入力してもしなくても所望の楽曲データを検索することができる。

請求項６に記載の楽曲情報配信システムでは、生成規則保持手段は、「The」で始まる歌手名又は音楽媒体名又は曲名の場合、読みパターンの歌手、音楽媒体または曲の正式名の読みおよび先頭の「ざ」または「じ」に該当する部分を、「ざ」または「じ」、または省略可能な読みを表現する木構造読みパターンに変換する規則を有することを特徴とするものである。

これによれば、「ざ」または「じ」、または省略可能な読みを表現する木構造読みパターンに変換する規則を有することによって、「The」で始まる歌手名などを最初に「ざ」あるいは「じ」と入力しても所望の楽曲データを検索することができる。また、「ざ」「じ」を省略しても所望の楽曲データを検索することができる。

請求項７に記載の楽曲情報配信システムでは、生成規則保持手段は、年代を表す数字を含む音楽媒体名または曲名を含む場合、読みパターンの年代を示す数字に相当する部分を、桁読み、棒読み２種類の読みを表現する木構造読みパターンに変換する規則を有することを特徴とするものである。

これによれば、年代を示す数字に相当する部分を桁読み、棒読み２種類の読みを表現する木構造読みパターンに変換する規則を有することによって、例えば、「１９９６」を「せんきゅーひゃくろくじゅーろく」、「いちきゅーろくろく」のいずれを入力しても所望の楽曲データを検索することができる。

請求項８に記載の楽曲情報配信システムでは、生成規則保持手段は、何枚目の音楽媒体かを示す数字及び、又は文字を含む音楽媒体名の場合、読みパターンの数字及び、又は文字に相当する部分を、音楽媒体の順番を示す読み、または省略可能な読みを表現する木構造読みパターンに変換する規則を有することを特徴とするものである。

これによれば、何枚目の音楽媒体かを示す文字に続く数字に相当する部分を、数字の読みを省略可能な読みを表現する木構造読みパターンに変換する規則を有することによって、音楽媒体の何枚目であるかの指定を省略して入力しても所望の楽曲データを検索することができる。

請求項９に記載の楽曲情報配信システムでは、生成規則保持手段は、年代以外の意味を表す数字を含む歌手名又は音楽媒体名または曲名の場合、読みパターンの数字に相当する部分を、桁読み、棒読み、英語読みの３種類の読みを表現する木構造部分読みパターンに変換することを特徴とするものである。

これによれば、年代以外の数字に相当する部分を、桁読み、棒読み、英語読みの３種類の読みを表現する木構造部分読みパターンに変換することによって、例えば「１９」を「じゅうく」、「いちきゅう」、「ないんてぃーん」のいずれを入力しても所望の楽曲データを検索することができる。

請求項１０に記載の楽曲情報配信システムでは、生成規則保持手段は、正式名が日本語以外の言語で記述される歌手名又は音楽媒体名又は曲名でかつ日本語名を有する場合、正式名及び日本語名の両方の読みを表現する木構造部分読みパターンに変換することを特徴とするものである。

これによれば、正式名及び日本語名の両方の読みを表現する木構造部分読みパターンに変換することによって、正式名あるいはその日本語名のいずれを入力しても所望の楽曲データを検索することができる。

請求項１１に記載の楽曲情報配信システムでは、選曲データは、歌手名又は音楽媒体名又は曲名の正式名及び日本語名を示す表示パターンを含むものであって、クライアントは、検索手段によって検索された楽曲データを再生する再生手段と、再生する楽曲データの正式名が日本語以外の言語で記述される歌手名又は音楽媒体名又は曲名でかつ日本語名を有する場合、歌手名又は音楽媒体名又は曲名の正式名および日本語名を切り替可能な状態で表示する表示手段を備えることを特徴とするものである。

これによれば、日本語以外の言語で記述される正式名と日本語名とが切り替可能な状態で表示できるので、使用者の好みに応じた表示ができる。

請求項１２に記載の楽曲情報配信システムでは、音声によって楽曲データを検索するクライアントと、有線または無線にて通信を行うことによって当該クライアントに当該楽曲データを検索するための選曲データを配信するサーバとからなる楽曲情報配信システムであって、サーバーは、楽曲データの歌手名、音楽媒体名、曲名について、その表示パターンを含む原選曲データを保持する原選曲データ保持手段と、表示パターンに「ベスト」「Best」「グレーテストヒッツ」「Greatest Hits」という単語を含む場合、ベスト盤に相当する読みを含む木構造読みパターンを生成する規則を保持する生成規則保持手段と、木構造読みパターンを含む選曲データをクライアントに配信する木構造読みパターン生成手段とを備え、クライアントは、楽曲データを複数記憶する楽曲データ記憶手段と、楽曲データを検索するための音声を入力する音声入力手段と、音声入力手段に入力された音声をその音声に相当する記号列に変換する音声変換部と、記号列を選曲データの木構造読みパターンと照合することによって楽曲データを検索する検索手段とを備えることを特徴とするものである。

これによれば、ベスト盤の音楽媒体名には「ベスト」「Best」「グレーテストヒッツ」「Greatest Hits」といった単語を有するものが多い。この場合、ベスト盤に相当する読みを選曲データに付与することによって、論理構造を示す読みパターンを形成することなく、ベスト盤に相当する音声を入力することによって所望の楽曲データを検索することができる。

請求項１３に記載の楽曲情報配信システムでの作用・効果に関しては、上述の請求項１１と同様であるため説明を省略する。

以下、本発明の実施の形態における音楽情報配信システムに関して、図面に基づいて説明する。図１は本発明の実施の形態に係わる、音楽情報配信システムの概略構成を示すブロック図である。

図１において、１００は楽曲検索装置、２００はサーバである。楽曲検索装置１００は本発明のクライアントに相当するものである。楽曲検索装置１００とサーバ２００とは無線通信手段により接続されている。楽曲検索装置１００は、音楽ＣＤ１３から取得した楽曲データをサーバ２００から取得した選曲データに従って選択し、楽曲データを再生する装置である。なお、選曲データに関しては、後ほど詳しく説明する。

まず、楽曲検索装置１００に関して説明する。楽曲検索装置１００は、楽曲検索装置１００の全体の動作を制御するＣＰＵ２にバスを介して音楽ＣＤドライブ１、選曲データ取得部３、ＨＤＤ４、Ａ／Ｄコンバータ５、ＲＯＭ６、ＲＡＭ７、表示制御部８、Ｄ／Ａコンバータ９、リモコン受信機１０が接続される。

音楽ＣＤドライブ１は、音楽ＣＤ１３から楽曲データ、ＴＯＣ（Table Of Contents）情報を読み込む。使用者が音楽ＣＤ１３を音楽ＣＤドライブ１に挿入すると、ＣＰＵ２は音楽ＣＤ１３からＴＯＣ情報を読み込み、その情報を選曲データ取得部３に送る。

更に、ＣＰＵ２は音楽ＣＤ１３から楽曲データを読み出してＭＰ３（MPEG１ Layer-3Audio）など好適なフォーマットで楽曲データファイルを生成し、ＨＤＤ４に格納する。なお、楽曲データのフォーマットの手法としては、ＭＰ３に限らずＡＴＲＡＣ（Adaptive Transform AcousticCoding）方式等の様々な手法を採用することができる。なお、ＴＯＣ（Table Of Contents）とは、音楽ＣＤ１３に記録されている楽曲の曲数、演奏時間、休止時間等の演奏時間情報を記録してある目次情報である。

選曲データ取得部３は、音楽ＣＤドライブ１からＴＯＣ情報を受け取ると、図示せぬ無線通信手段によりサーバ２００にＴＯＣ情報を送信する。また、楽曲検索装置１００は、サーバ２００に最後にアクセスしたアクセス日時をＨＤＤ４に記憶しており、選曲データ取得部３は、そのアクセス日時をサーバ２００に送信する。更に、選曲データ取得部３は、サーバ２００から選曲データ、選曲データ識別子リストなどを取得する。この選曲データ識別子リストは、上記アクセス日時から更新を受けた選曲データの識別子リストである。

このように、選曲データ、選曲データ識別子リストを取得した選曲データ取得部３は、これらのデータをＨＤＤ４の識別子テーブル、属性テーブル等に格納する。なお、すでにＨＤＤ４に格納されている選曲データのうち、選曲データ識別子リストに含まれている物があれば選曲データ取得部３はそれらの選曲データをサーバ２００から取得し、ＨＤＤ４に格納されている選曲データを更新する。これにより、選曲データを常に最新の状態に保つことができる。最後に、選曲データ取得部３はＨＤＤ４の更新日時を現在の日時に書き換える。

ＨＤＤ４は、楽曲データファイル、音声認識辞書、識別子テーブル、属性テーブルなどを備える。

楽曲データファイルは、音楽ＣＤ１３から取得した所定フォーマットの数百〜数千の楽曲データを記憶する。音声認識辞書は、音声認識を行う際の単語の読みを記憶している。識別子テーブルは、楽曲データファイルの楽曲データを選択するためのデータである選曲データを記憶している。属性テーブルは、音楽ＣＤ１３を歌唱／演奏している歌手名、音楽ＣＤ１３の名前、楽曲名とそれらの関係を記憶している。

Ａ／Ｄコンバータ５は、マイク１６と接続されており、このマイク１６から入力される音声信号をディジタル変換してＣＰＵ２に入力する。ＲＯＭ６には、システムプログラム、アプリケーションプログラムおよびフォントデータが記憶されている。システムプログラムはこの装置の基本動作や周辺機器とのデータ送受を記憶するプログラムである。

アプリケーションプログラムは、音声認識プログラム、識別子検索プログラム、識別子選択プログラム、シーケンスプログラムなどからなる。

音声認識プログラムは、Ａ／Ｄコンバータ５から取得したデジタル化された音声信号の発音を分析して、発音を表す記号列に変換するプログラムである。以降、発音を表す記号列を読みと称する。なお、ＨＤＤ４に格納されている楽曲データ、及びその楽曲を歌唱／演奏している歌手、及びその楽曲を収録する音楽ＣＤ１３にはそれぞれ一意の識別子がつけられている。

識別子検索プログラムは、読みと識別子を対照させた表を用い、読みから対応する識別子を検索するプログラムである。識別子選択プログラムは、識別子検索プログラムの検索した識別子が複数個存在した場合、その中から一つを選択するプログラムである。

シーケンスプログラムは表示シーケンスプログラム、楽曲再生シーケンスプログラムなどからなる。各シーケンスプログラムは識別子で特定される楽曲の文字情報（歌手名、アルバム名、楽曲名など）をモニタ１４に画面表示するとともに、楽曲データファイルを再生する。

フォントデータは、歌詞や楽曲名などを表示するためのものであり、明朝体や丸ゴジック体などの複数種類のフォントが記憶されている。

ＲＡＭ７は、ＣＰＵ２などが動作する上で必要なデータを一旦格納するワークエリアが設定される。表示制御部８は、モニタ１４と接続されており、ＲＯＭ６に格納されたフォントを使用して演奏中の音楽ＣＤ１３のアルバム名、歌手名、曲名等を表示する。

Ｄ／Ａコンバータ９は、楽曲データをアナログ信号に変換し、そのアナログ信号をアンプ１１に送る。アンプ１１では、Ｄ／Ａコンバータ９から取得した楽曲データのアナログ信号を増幅したのち、スピーカ１５に出力する。そして、スピーカ１５は、アンプ１１から取得したアナログ信号を放音する。

リモコン受信機１０は、選曲操作などを行うための装置である。リモコン受信機１０はリモコン１２から送られてくる選曲操作に対応する赤外線信号を受信して、その赤外線信号に対応する信号をＣＰＵ２に送信する。また、この選曲操作はリモコン１２に加え、マイク１６を使用した入力音声によってもおこなうことができる。例えば、マイク１６に曲名を入力すると、音声認識プログラムなどによって選曲が行われる。

次に、サーバ２００に関して説明する。図２は、サーバ２００の概略構成を示すブロック図である。サーバ２００は、原選曲データデータベース２０１、読みデータ変換規則管理部２０２、木構造読みデータ変換部２０３、選曲データデータベース２０４、選曲データ検索部２０５を備える。

サーバ２００は、楽曲検索装置１００から音楽ＣＤ１３のＴＯＣ情報及びアクセス日時を受信すると、そのＴＯＣ情報から音楽ＣＤ１３を特定する。また、特定した音楽ＣＤ１３に対応する選曲データ及びアクセス日時以降に更新を受けた選曲データ識別子リストを楽曲検索装置１００に送信する。

原選曲データデータベース２０１は、選曲データを得るための歌手情報、音楽ＣＤ情報を記述した２種類のＸＭＬ(Extensible Markup Language)ファイルからなる原選曲データが格納されている。この原選曲データは、歌手名、アルバム名、曲名などの発音を表現する記号（仮名、アルファベット発音記号等）及びＸＭＬタグから構成される文字列であるＸＭＬ読みパターンなどを含む。

読みデータ変換規則管理部２０２は、原選曲データ中のＸＭＬ読みパターンを木構造読みパターンに変換する規則が格納されている。また、原語表示名、または日本語表示名に所定の単語を持つ音楽ＣＤ１３に対し、その所定の単語に相当する読みを木構造読みパターンに付与するという規則が格納されている。

木構造読みデータ変換部２０３は、読みデータ変換規則管理部２０２の規則に従って、原選曲データ中のＸＭＬ読みパターンを木構造読みパターンに変換する。また、原語表示名、または日本語表示名の所定の単語に相当する読みを木構造読みパターンに付与する。すなわち、原選曲データを選曲データに変換する。

選曲データデータベース２０４は、木構造読みデータ変換部にて変換された選曲データが格納されている。また、この選曲データが更新された日時と選曲データの識別子リストを対応させて記憶されている選曲データ識別子リストが格納されている。

選曲データ検索部２０５は、楽曲検索装置１００から取得したＴＯＣ情報に対応する選曲データを選曲データデータベースから検索し、楽曲検索装置１００に送信する。

ここで、選曲データについて説明する。選曲データは、使用者が音楽ＣＤ１３を楽曲検索装置１００に挿入した時点に送信されるもの、及び更新の必要が生じたときにサーバ２００から楽曲検索装置１００に送信されるものがある。

また、この選曲データは２種類のＸＭＬファイルからなる。一つは音楽ＣＤ１３の曲を歌唱／演奏している歌手の歌手情報であり、もう一つは音楽ＣＤ１３の名前や収録曲などの音楽ＣＤ情報を記述した情報である。これら選曲データは原選曲データデータベースに格納されている原選曲データを変換して得られる。

この原選曲データは歌手情報、音楽ＣＤ情報を記述した２種類のＸＭＬファイルからなる。例えば、「ABCD」という日本の歌手の歌手情報の例を図３（ａ）に示す。１行目はヘッダであり、このＸＭＬファイルが使用している漢字コードなどの情報を記述する。２行目は音楽ＣＤ１３の楽曲を歌唱、演奏している歌手の歌手情報を示す<ARTIST></ARTIST>タグである。この歌手情報を示すタグには、歌手に一対一に対応する識別子である属性ＩＤが記述される。この例では「010000」である。

３行目は歌手名の原語表示名を示す<TITLE></TITLE>タグである。原語とは歌手の正式名を記述する言語を意味する。この例の原語は英語であり、表示文字列は「ABCD」である。４行目〜６行目は音楽ＣＤ１３の楽曲を歌唱、演奏している歌手を音声認識で指定する際の木構造読みパターン及びＸＭＬ読みパターンを示す<PRONOUNCE></PRONOUNCE>タグである。木構造読みパターン及びＸＭＬ読みパターンは一般に複数個存在し、それらをタグ<PRONOUNCE></PRONOUNCE>の間に並記する。一つのＸＭＬ読みパターンはタグ<SYL></SYL>により指定する。この例では、読みは「えーびーしーでぃー」ただ一つである。

また外国の歌手の場合、日本語表示名が追加される。例えば、「The EFG」という外国の歌手の歌手情報の例を図４に示す。３行目に原語表示名「The EFG」が示されている。また４行目に日本語表示名を示すタグである<JTITLE></JTITLE>により示されている。この例では「ザ・イーエフジー」である。

次に、例えば、「SINGLES」という日本の歌手の音楽ＣＤ１３の音楽ＣＤ情報の例を図５に示す。１行目はヘッダあり、このＸＭＬファイルが使用している漢字コードなどの情報を記述する。２行目は音楽ＣＤ１３の音楽ＣＤ情報を示すタグである。この音楽ＣＤ情報を示すタグには、音楽ＣＤ１３に一対一に対応する識別子である属性ＩＤが記述される。この例では「010100」である。３行目は音楽ＣＤ１３の楽曲を歌唱、演奏している歌手の歌手情報を示す<ARTIST></ARTIST>タグである。この歌手情報を示すタグには、歌手に一対一に対応する識別子である属性ＩＤが記述される。この例では「010000」である。

４行目は音楽ＣＤ１３のアルバム情報を記述するタグであり、その中には、以下に示す<TITLE></TITLE>タグ及び<PRONOUNCE></PRONOUNCE>タグが含まれる。５行目は音楽ＣＤ１３の名称の原語表示名を示す<TITLE></TITLE>タグである。この例では「SINGLES」である。６行目〜８行目は音楽ＣＤ１３の名称を音声認識で指定する際の木構造読みパターン及びＸＭＬ読みパターンを示す<PRONOUNCE></PRONOUNCE>タグである。

１０行目は音楽ＣＤ１３に収録されている楽曲の情報を列挙する<TRACKS></TRACKS>タグである。この<TRACKS></TRACKS>タグ中の属性である「COUNT」は楽曲数であり、この例では「15」である。また各楽曲の情報は例えば１１行目のように<TRACK></TRACK>タグで記述する。属性「Ｎ」は音楽ＣＤ１３の中で楽曲が何曲目に収録されているかを示す。

１２行目は曲名を示す<TITLE></TITLE>タグでである。この例ではA&Zである。ここで&はＸＭＬで特殊記号を記述するのに使用するものであり、ここでは文字「&」を示す。１３行目〜１５行目は音楽ＣＤ１３の楽曲の曲名を音声認識で指定する際のＸＭＬ読みパターンを示す<PRONOUNCE></PRONOUNCE>タグである。

また外国の歌手の場合、日本語表示名が追加される。その例を図６に示す。５行目に音楽ＣＤ１３の原語表示名「THE EFG 1962-1966」が示されている。また６行目にその日本語表示名が<JTITLE></JTITLE>タグにより示されている。この例では「ザ・イーエフジー１９６２年−１９６６年」である。８行目にはＸＭＬタグを使用したＸＭＬ読みパターン「<SINGER><THE>ざ</THE>いーえふじー</SINGER><YEAR>1962</YEAR><YEAR>1966</YEAR>」が示されている。

また、音楽ＣＤ１３の２曲目の楽曲は２０行目に原語表示名「ＨＩＪＫ」が示されている。また２１行目にその日本語表示名が<JTITLE></JTITLE>タグにより示されている。この例では「あいうえお」である。２２行目から２５行目に２つのＸＭＬ読みパターン「えいちあいじぇいけい」「かきくけこ」が記述されている。これら原選曲データのＸＭＬ読みパターンは木構造読みデータ変換部により木構造読みパターンに変換される。そして、原選曲データから選曲データが得られる。

なお、<TITLE></TITLE>タグ及び<JTITLE></JTITLE>タグにより示される原語表示名や日本語表示名は本発明の表示パターンに相当するものである。

ＸＭＬ読みパターンに記述される歌手、音楽ＣＤ１３、楽曲の名称の読みの特性には以下の（ａ）から（ｆ）の属性を持つものがある。こうした属性を有する名前を声に出して読む場合、使用者は以下の読み方をすることがある。

（ａ）名前が「The」で始まる。この「The」で始まる名前を読む場合、先頭の「ざ」もしくは「じ」を省略して読むことがある。例えば、「The EFG」という歌手の場合、「ざいーえふじー」と読む場合と、「ざ」を省略して単に「いーえふじー」と読む場合がある。

（ｂ）名前に年代を表す数字を含む。年代を読む場合、数字を桁読みする場合と、棒読みする場合とがある。例えば、１９６２年の場合、「せんきゅーひゃくろくじゅーに」と桁読みする場合と、「いちきゅーろくにー」と棒読みする場合とがある。

（ｃ）名前にサブタイトルを有する。名前にサブタイトルがある場合、このサブタイトルを省略することがある。例えば、「Ｈｅｌｌｏ〜かきくけこ」という楽曲の名前の場合、「はろーかきくけこ」と読む場合と、サブタイトルを省略して「はろー」と読む場合がある。

（ｄ）アルバムが複数毎の音楽ＣＤ１３からなるものであって、音楽ＣＤ１３の名前に「Disc2」などの枚数番号を含む。名前に枚数番号を含む場合、「でぃすく」の後に番号を示す数字を付加し、その数字を日本語読みする場合と、英語読みする場合の２通りがある。あるいは、音楽ＣＤ１３の枚数番号を指定しない、すなわち枚数番号を省略して読む場合がある。例えば、「THE EFG 1962-1966 DISC2」という音楽ＣＤ１３の名前の場合、「Disc2」の部分は、「でぃすくに」と日本語読みする場合と、「でぃすくつー」と英語読みする場合とがある。また、「せんきゅーひゃくろくじゅーろく」のように枚数番号を省略して読む場合もある。

（ｅ）歌手が仇名などの別名をもつ。音楽ＣＤ１３及び楽曲の名前に歌手の名前を含む場合、その歌手の名前を仇名に読み替える場合がある。例えば、「さしすせそ」という名前の歌手の仇名が「さっきー」である場合、その歌手の音楽ＣＤ１３の名前が「さしすせそベスト」だと、「さしすせそベスト」と読む場合と、「さっきーベスト」と歌手の名前を仇名に読み替える場合がある。

（ｆ）名前に年代以外の数字を含むもの。名前に数字を含む場合、その数字を日本語読みする場合と、英語読みする場合、棒読みする場合とがある。例えば、名前に「１９」が含まれる場合、「じゅうく」と日本語読みする場合、「ないんてぃーん」と英語読みする場合、「いちきゅー」と棒読みする場合とがある。

従って、本発明では（ａ）から（ｆ）の属性を木構造読みパターンの生成規則であるＸＭＬタグとしてＸＭＬ読みパターンに記述する。そして、このＸＭＬ読みパターンによって使用者の読みの特性を反映した木構造読みパターンを生成する。なお、この木構造読みパターンは、音声認識辞書単語の生成、および読み照合パターンの生成に用いられる。以下、木構造読みパターン生成規則（タグ）を示す。なお、下記、木構造読みパターン生成規則（ａ）’から（ｆ）’は、上記、属性（ａ）から（ｆ）に対応するものである。

（ａ）’は、<THE></THE>タグであり、このタグで囲まれた部分を省略可能にする。

（ｂ）’は、<YEAR></YEAR>タグであり、このタグで囲まれた部分の数字を桁読み、棒読みの並記に置き換える。

（ｃ）’は、タグであり、このタグで囲まれた部分を省略可能にする。

（ｄ）’は、<DISC></DISC>タグであり、読み「でぃすく」を追記した後、このタグで囲まれた部分の数字の日本語読み、英語読みの並記を追記する。また、「でぃすく＜数字読み＞」全体を省略可能にする。

（ｅ）’は、<SINGER></SINGER>タグであり、このタグで囲まれた歌手が仇名などの別名を持つ場合、この歌手の正式名、別名の読みを併記する。

（ｆ）’は、<NUMBER></NUMBER>タグであり、このタグで囲まれた部分の数字の日本語読み、英語読み、棒読みを追記する。

ここで、ＸＭＬ読みパターンから生成された木構造読みパターンの実際の例を示す。図７は木構造読みパターンを示す図であり、（ａ）は図４の６行目の場合であり、（ｂ）は図５の２０行目の場合であり、（ｃ）は図６の８行目の場合であり（ここで歌手The EFGはあだ名を持たないものとする）、（ｄ）は図６の２３，２４行目の場合であり、（ｅ）は図３（ｂ）の５、６行目の場合であり、（ｆ）は図５の２６行目の場合である。

図７（ａ）〜図７（ｆ）に示すような、ＸＭＬ読みパターンから生成された各木構造読みパターンが受理する読みの例を以下に示す。

図７（ａ）の場合、「ざいーえふじー」、「いーえふじー」である。図７（ｂ）の場合、「はろーかきくけこ」「はろー」である。

図７（ｃ）の場合、「ざいーえふじーせんきゅーひゃくろくじゅーにせんきゅーひゃくろくじゅーろくでぃすくに」、「ざいーえふじーいちきゅーろくにーいちきゅーろくろくでぃすくに」「ざいーえふじーせんきゅーひゃくろくじゅーにせんきゅーひゃくろくじゅーろく」「ざいーえふじーいちきゅーろくにーいちきゅーろくろく」（以下略）である。

図７（ｄ）の場合、「えいちあいじぇいけい」「あいうえお」である。図７（ｅ）の場合、「さしすせそ」「さっきー」である。図７（ｆ）の場合、「はろーじゅうく」「はろーないんてぃーん」「はろーいちきゅー」である。

図７（ｄ）の例の場合、原語表示名と日本語表示名にて正式名（日本語以外の言語）と日本語名の読み、この例では、正式名「えいちあいじぇいけい」、日本語名「あいうえお」が分かる。従って、正式名及び日本語名の両方の読みを受理するようにその読みを木構造読みパターンに付与する。

このように、ＸＭＬタグを用いたＸＭＬ読みパターンを使用することによって、タグにはそれぞれ曖昧性のない意味付けがされており、タグ付け作業が容易であり、作業の正確性を高め、工数の低減につながる。

また、歌手、音楽ＣＤ１３、楽曲の名称を使用者が読み上げる際に生じうる複数の読みを簡潔に生成できる。例えば図７（ｃ）の例ではただ一つの読みパターンから（２×２×２×２＋２×２×２）＝２４通りもの読みを自動生成することができる。手作業でこれらすべての読みを生成することは工数がかかり、かつ間違った読みが混入する原因となる。

さらに、タグにより名前に含まれている属性が示されているため、タグの解釈を容易に拡張できる。上例の<DISC>2</DISC>は「でぃすく＜数字読み＞」という読みに変換されたが、その他に「しーでぃー＜数字読み＞」という読みを生成する規則を追加することも容易である。

また、上記の木構造読みパターンは次の２つの記号を用いて文字列として表現でき、この文字列によって選曲データに記述される。省略は記号[]を用い、記号[]で囲まれた読みは省略可能であることを示す。また、並記は記号(||)を用い、例えば、記号(||)に(A|B|C)と並記された読みＡ、Ｂ、Ｃを受理することを示す。並記する読みの数は２個以上の任意の個数を設定できる。

図７（ａ）〜図７（ｆ）の木構造読みパターンを文字列で表現した例を以下に示す。図７（ａ）の場合、「[ざ]いーえふじー」となる。図７（ｂ）の場合、「はろー[かきくけこ]となる。図７（ｃ）の場合、「[ざ]いーえふじー(せんきゅーひゃくろくじゅーに|いちきゅーろくにー)(せんきゅーひゃくろくじゅーろく|いちきゅーろくろく)[でぃすく(に|つー)]」となる。図７（ｄ）の場合、「(えいちあいじぇいけい|あいうえお)」となる。
図７（ｅ）の場合、「（さしすせそ｜さっきー）」となる。図７（ｆ）の場合、「はろー（じゅうく｜ないんてぃーん｜いちきゅー）」となる。

ここで、ＸＭＬ読みパターンから木構造読みパターンを生成する手順を以下に説明する。図８は、ＸＭＬタグ走査サブ手順を示すフロー図である。図９は、読みデータ変換サブ手順を示すフロー図である。図１０は、ＸＭＬ読みパターンから木構造読みパターンを生成する手順を示すフロー図である。

この手順は（１）ＸＭＬタグの走査、（２）読みデータ変換という２つのサブ手順を交互に、あるいは再帰的に呼び出すことによって行われる。まずサブ手順（１）（２）について説明する。図８に示す、ＸＭＬタグ走査サブ手順では、ＸＭＬ部分読みパターンが入力され、この入力に対する木構造部分読みパターンが出力される。

ＳＡ２０１では、変数Ｓ、Ｔ、ｐを以下のように初期化する。Ｓ：ＸＭＬ部分読みパターン、Ｔ：空文字列、ｐ：Ｓの最初の文字位置。変数の初期化の処理がなされるとＳＡ２０２へ進む。ＳＡ２０２では、文字位置ｐから末尾に向かってＳを走査しタグを探す処理がなされ、ＳＡ２０３へ進む。ＳＡ２０３では、タグが見つかったか否かを判定する。タグが見つからなければＳＡ２０９へ進み、文字位置ｐから末尾までの文字列を変数Ｔに追加する。そしてＴの値を戻り値としてリターンする(ＳＡ２１０)。

一方、ＳＡ２０３でタグが見つかった場合、ＳＡ２０４へ進む。ＳＡ２０４では、見つかったタグを<A>とし、文字位置ｐと前記タグ<A>との間の文字列をＴに追加し、ＳＡ２０５へ進む。

ＳＡ２０５では、タグ<A>に対応する</A>を見つけ、ＳＡ２０６へ進む。ＳＡ２０６では、タグ<A></A>に挟まれた文字列<A>○△□</A>を読みデータ変換サブ手順に渡す。

ここで図９に基づいて読みデータ変換サブ手順について説明する。図９に示す、読みデータ変換サブ手順では、ＸＭＬ部分読みパターンが入力され、この入力に対する木構造部分読みパターンが出力される。

ＳＡ３０１では、ＸＭＬ部分読みパターンＳは<A>○△□</A>という形式の文字列である。タグ<A></A>に挟まれた文字列を変数Ｓに代入し、ＳＡ３０２へ進む。ＳＡ３０２では、<A>=<SYL>であるか否かを判定する。<A>=<SYL>なら、ＳＡ３０３へ進む。ＳＡ３０３では、文字列Ｓを入力としてＸＭＬタグ走査サブ手順を呼び出し、その戻り値をＴに代入しＳＡ３０４へ進む。ＳＡ３０４では、その戻り値をそのまま戻り値としてリターンする。一方、ＳＡ３０２の判定において、<A>=<SYL>でない場合、ＳＡ３０５へ進む。

ＳＡ３０５では、<A>=<THE>であるか否かを判定する。<A>=<THE>なら、ＳＡ３０６へ進む。ＳＡ３０６では、文字列Ｓをカッコ[]で挟んで文字列[S]を生成して変数Tに代入し、ＳＡ３０７へ進む。ＳＡ３０７では、そのＴの値を戻り値としてＸＭＬタグ走査サブ手順へ返す。一方、ＳＡ３０５の判定において、<A>=<THE>でない場合、ＳＡ３０８へ進む。

ＳＡ３０８では、<A>=<YEAR>であるか否かを判定する。<A>=<YEAR>なら、文字列は、年代であり、ＳＡ３０９へ進む。ＳＡ３０９では、Ｓを桁読み、棒読みしたときの読みＭ、Ｎを生成し、文字列(M|N)を生成して変数Tに代入し、ＳＡ３１０へ進む。ＳＡ３１０では、そのＴの値を戻り値としてＸＭＬタグ走査サブ手順へ返す。一方、ＳＡ３０８の判定において、<A>=<YEAR>でない場合、ＳＡ３１１へ進む。

ＳＡ３１１では、<A>=であるか否かを判定する。<A>=なら、ＳＡ３１２へ進む。ＳＡ３１２では、文字列Ｓを入力としてＸＭＬタグ走査サブ手順を呼び出し、その戻り値をカッコ[]で挟んだ文字列[S]を生成して変数Sに代入し、ＳＡ３１３へ進む。ＳＡ３１３では、文字列[S]を生成して変数Tに代入し、ＳＡ３１４へ進む。ＳＡ３１４では、そのＴの値を戻り値としてＸＭＬタグ走査サブ手順へ返す。一方、ＳＡ３１１の判定において、<A>=でない場合、ＳＡ３１５へ進む。

ＳＡ３１５では、<A>=<DISC>であるか否かを判定する。<A>=<DISC>なら、文字列Ｓはアルバム中の番目を示す数字であり、ＳＡ３１６へ進む。ＳＡ３１６では、この数字を日本語読み、英語読みしたときの読みM,Nを生成し、文字列でぃすく(M|N)を生成して変数Tに代入し、ＳＡ３１７へ進む。ＳＡ３１７では、そのＴの値を戻り値としてＸＭＬタグ走査サブ手順へ返す。一方、ＳＡ３１５の判定において、<A>=<DISC>でない場合、ＳＡ３１５へ進む。

ＳＡ３１８では、<A>=<SINGER>であるか否かを判定する。<A>=<SINGER>なら、文字列Ｓは歌手の正式名の読みであり、ＳＡ３１９へ進む。ＳＡ３１９では、この歌手が別名の読みＳ’を有するか否かを判定する。ＳＡ３１９において、別名の読みＳ’を有する場合は、ＳＡ３２１へ進み、そうでない場合は、ＳＡ３２０へ進む。ＳＡ３２１では、文字列(S|S')を生成して変数Tに代入し、ＳＡ３２２へ進む。ＳＡ３２０では、文字列[S]を生成して変数Tに代入し、ＳＡ３２２へ進む。ＳＡ３２２では、そのＴの値を戻り値としてＸＭＬタグ走査サブ手順へ返す。一方、ＳＡ３１５の判定において、<A>=<SINGER>でない場合、ＳＡ３２３へ進む。

ＳＡ３２３では、<A>=<NUMBER>であるか否かを判定する。<A>=<NUMBER>なら、文字列Ｓは数字であり、ＳＡ３２４へ進む。ＳＡ３２４では、この数字を桁読み、棒読み、英語読みしたときの読みL、M、Nを生成し、文字列(L|M|N)を生成して変数Tに代入し、ＳＡ３２５へ進む。ＳＡ３２５では、そのＴの値を戻り値としてＸＭＬタグ走査サブ手順へ返す。一方、ＳＡ３２３の判定において、<A>=<SINGER>でない場合、ＳＡ３２６へ進む。

ＳＡ３２６では、<A>を不明なタグとしてエラーメッセージを出力し、処理を終了する。
なお、上記ＳＡ３０２からＳＡ３２５の読みデータ変換はサーバの読みデータ変換規則管理部に規則として登録されている。

このようにして、戻り値を得たＸＭＬタグ走査サブ手順では、ＳＡ２０７にて、その戻り値を文字列Ｔに追加するし、ＳＡ２０８へ進む。ＳＡ２０８では、文字位置ｐを前記タグ</A>の次の文字位置に設定し、ＳＡ２０２へもどる。

このような（１）ＸＭＬタグの走査、（２）読みデータ変換という２つのサブ手順を用いて生成される木構造読みパターンを生成する手順を説明する。図１０において、ＳＡ４０１では、原選曲データのタグ<PRONOUNCE>にて並記されているＸＭＬ読みパターン<SYL>△□○</SYL>それぞれを入力として、ＸＭＬタグ走査サブ手順を適用し、対応する木構造読みパターンを生成すし、ＳＡ４０２へ進む。ＳＡ４０２では、ＳＡ４０１で得た木構造読みパターンを、例えばT1,T2,・・・,TNとすると、それらを並記した木構造読みパターン(T1|T2|・・・|TN)を生成する。この生成された木構造読みパターンを含む選曲データは、選曲データデータベース２０４に格納される。

このようにして、生成された木構造読みパターンの例を図１１に示す。図１１は、図６に示すＸＭＬ読みパターンから得られる木構造読みパターンの例である。図６の８行目、２３−２４行目に記載されたＸＭＬ読みパターンはそれぞれ図１１の８行目、２３行目の木構造読みパターンに変換されている。

また、サーバ２００で管理されている選曲データが更新される場合がある。これは、歌手や音楽ＣＤ１３に別名が追加された場合などである。例えば、「さしすせそ」という歌手に対し、「さっきー」という別名を追加する必要が生じた場合を考える。図１２（ａ）は原選曲データであり、（ｂ）は更新前の選曲データであり、（ｃ）は更新前の木構造読みパターンであり、（ｄ）は更新後の選曲データであり、（ｅ）は更新後の木構造読みパターンである。

この場合、読みデータ変換規則管理部２０２に「ＸＭＬ読みパターン中に、歌手「さしすせそ」の読みが存在したら、別名の「さっきー」を並記する」という規則を追加する。
この規則を追加することによって、図１２（ａ）に示す原選曲データから生成される選曲データは図１２（ｂ）に示すようなものであるのに対して、更新後は、図１２（ｄ）のような選曲データが生成される。また、木構造読みパターンに関しても、更新前の木構造読みパターン図１２（ｃ）に対して、更新後の木構造読みパターン図１２（ｅ）のように示される。このようにして、原選曲データデータベース２０１中の、<SINGER>さしすせそ</SINGER>を含むＸＭＬ読みパターンを再変換して得られる選曲データを選曲データデータベース２０４に保存する。

また、他の例として「さしすせそベスト」というアルバムが存在したとき、ＸＭＬ読みパターンは「<SINGER>さしすせそ</SINGER>べすと」として登録されている。このＸＭＬ読みパターンは別名追加前では「さしすせそべすと」という木構造読みパターンであるが、別名追加後は「(さしすせそ|さっきー)べすと」という木構造読みパターンに変換される。すなわち使用者は、「さしすせそべすと」「さっきーべすと」いずれの発話でも、音楽ＣＤ１３を検索できるようになる。

このように原選曲データ中のＸＭＬ読みパターンに<SINGER>タグを用いて、読みのどの部分が歌手名に相当するかが示されているため、ある歌手に別名の読みを追加するといった木構造読みパターンの更新が容易にできる。このように、ＸＭＬタグを用いて楽曲データ読みパターンの論理構造を示すことで、木構造読みパターンの生成や更新をほぼ自動的に行うことができる。

また、アルバム名から連想されるキーワードを特定し、そのキーワードを音声認識辞書に登録することでアルバムの検索を容易にすることもできる。アルバムには、その歌手のベスト盤に相当するものがある。そしてそのようなアルバムを購入する使用者は多い。したがってベスト盤の検索を容易にする手段を用意することで、更なる利便性を図ることができる。

ベスト盤のアルバム名には「ベスト」「Best」「グレーテストヒッツ」「Greatest Hits」といった単語を有するものが多い。したがって、こうした単語を原語表示名、または日本語表示名に持つ音楽ＣＤ１３に対し、「べすと」という読みのキーワードを対応させて木構造読みパターンに付与するという規則を読みデータ変換規則管理部２０２に持たせても良い。そして使用者が「べすと」という単語を発声したら、キーワード「ベスト」に対応するアルバム名を候補としてディスプレイに表示する。このようにして、使用者はアルバム名を正確に覚えていなくても、ベスト盤に相当するアルバムを容易に検索することが可能となる。

ここでアルバム名が「ベスト」「グレーテストヒッツ」といった単語を含んでいるか否かの判断は機械的に行うことができ、人手を必要としないことも大きな利点である。なお、上記単語がアルバム名に含まれているかどうかの判定は簡単なロジックで判定可能である。したがって上記のような単語を含む曲名に「べすと」という読みのキーワードを割り当てる機構を楽曲検索装置１００に持たせることも可能である。

さらに、上記実施例では「べすと」という読みのキーワードを割り当てたが、他の好適なキーワード「だいひょうきょく」（代表曲）などを割り当てても良い。さらには、1962-1966というように２つの年代を並べたアルバム名を有するアルバムもベスト盤と判断して差し支えない。したがってこうしたアルバム名も同様にベスト盤として検索できるようにすることで利便性を向上させることができる。

なお、上述のベスト盤にキーワードを割り当てる方法は原語表示名、または日本語表示名の情報を元に行うため、ＸＭＬ読みパターンのような論理構造を持つ読みパターンを必要としない。従って、このベスト盤に関する規則は、上記木構造読みパターン生成規則（ａ）’から（ｆ）’と併用しても良いし、ベスト盤に関する規則のみを用いても良い。

ここで、楽曲検索装置１００及び、サーバ２００の処理動作について説明する。

まず、音楽ＣＤ１３を音楽ＣＤドライブ１に挿入したときの楽曲検索装置１００の処理動作について説明する。図１３は音楽ＣＤ１３を音楽ＣＤドライブ１に挿入したときの楽曲検索装置１００の処理を示すフロー図である。この処理は、音楽ＣＤドライブ１に音楽ＣＤ１３が挿入されことによって開始する。

Ｓ１７１では、音楽ＣＤ１３のＴＯＣ情報を読み込む。ＣＰＵ２は、音楽ＣＤドライブ１に、音楽ＣＤ１３が挿入されると、その音楽ＣＤ１３からＴＯＣ情報を読み込み、その情報を選曲データ取得部３に送る。ＴＯＣ情報を読み込みがなされると、ステップＳ１７２へ進む。

Ｓ１７２では、ＴＯＣ情報及びＨＤＤ４に保存されている更新日時がセンターに送信される。選曲データ取得部３は、音楽ＣＤドライブ１からＴＯＣ情報を受け取ると、図示せぬ無線通信手段によりサーバ２００にＴＯＣ情報を送信する。また、選曲データ取得部３は、サーバ２００に最後にアクセスしたアクセス日時をＨＤＤ４に記憶しており、そのアクセス日時をサーバ２００に送信する。センターへの送信がなされるとステップＳ１７３へ進む。

Ｓ１７３では、サーバ２００から選曲データ及び更新された選曲データ識別子リストを受信する。選曲データ取得部３は、サーバ２００から選曲データ、選曲データ識別子リストを取得する。選曲データ及び選曲データ識別子リストを受信すると、ステップＳ１７４へ進む。

Ｓ１７４では、選曲データをＨＤＤ４に保存する。選曲データ取得部３は、サーバ２００から受信した選曲データをＨＤＤ４に保存する。選曲データを保存すると、ステップＳ１７５へ進む。

Ｓ１７５では、選曲データのアルバム名にBEST、ベスト、Greatest Hits、グレーテストヒッツの単語が含まれていたら対応する木構造読みパターンに「べすと」の読みを並記する。「べすと」の読みを並記すると、ステップＳ１７６へ進む。

Ｓ１７６では、更新された選曲データ識別子リストに含まれる識別子に対応する選曲データがＨＤＤ４に保存されているか否かを判定する。ＣＰＵ２は、ＨＤＤ４に保存されている選曲データが、サーバ２００から受信した選曲データ識別子リストに存在するか否かを判定し、含まれているならＳ１７７へ、そうでなければＳ１７８へ進む。

Ｓ１７７では、ＨＤＤ４に保存された選曲データをサーバから受信し最新のものに更新する。Ｓ１７８では、ＨＤＤ４の更新日時を現在の日時に書き換える。

Ｓ１７９では、音楽ＣＤ１３の楽曲データをＭＰ３ファイルに変換し、楽曲データファイルに保存する。

次に、ＴＯＣ情報、更新日時を受信したときのサーバ２００の処理動作に関して説明する。図１４はサーバ２００が楽曲検索装置１００からＴＯＣ情報、更新日時を受信したときの処理動作を示すフロー図である。

Ｓ１８１では、ＴＯＣ情報および更新日時を受信する。楽曲検索装置１００からＴＯＣ情報および更新日時を受信すると、ステップＳ１８２へ進む。

Ｓ１８２では、ＴＯＣ情報に対応する選曲データを楽曲検索装置１００に送信する。選曲データ検索部２０４は、楽曲検索装置１００から取得したＴＯＣ情報に対応する選曲データを選曲データデータベースから検索し、楽曲検索装置１００に送信する。選曲データを送信すると、ステップＳ１８３へ進む。

Ｓ１８３では、更新日時より前に発売された音楽ＣＤの選曲データのうち、更新日時より後に更新された選曲データの識別子をリストにして楽曲検索装置１００に送信する。

次に、楽曲検索する際の楽曲検索装置１００の処理動作について説明する。図１５は、楽曲検索時の楽曲検索装置１００の処理を示すフロー図である。図１５は使用者が楽曲名を発話し、楽曲を検索したときの楽曲検索装置１００の処理を示す。

Ｓ１９１では、音声認識プログラムにより入力音声を読みを表す文字列に変換する。音声認識プログラムは、デジタル化された入力音声を音声認識辞書に登録された単語の読みと照合する。音声認識辞書の中から入力された入力音声に最も近い発音を示す読みを選択し、その読みを識別子検索プログラムに渡しステップＳ１９２へ進む。ここで、音声認識辞書に図７の各木構造読みパターンが受理する読みをすべて登録したものと仮定する。この読みが登録された状態で使用者が「はろー」と発話すると、音声認識プログラムによりその入力音声は「はろー」という読み（文字列）に変換される。

Ｓ１９２では、識別子検索プログラムにより読みに適合する木構造読みパターンを持つ識別子をすべて求める。識別子検索プログラムは、音声認識プログラムから渡された読みを識別子テーブルと照合する。そして、対応する識別子を全て選択すると共に、選択した識別子を識別子検索プログラムへ渡し、ステップＳ１９３へ進む。なお、識別子テーブルには図１６に示すように識別子と、この識別子に対応する木構造読みパターンが記述される。図１６は、識別子テーブルを説明するためのイメージ図である。

また、識別子テーブルは、データの種別（曲コード，曲名等）によって階層化せずに全ての選曲データをその発音順（たとえばアルファベット順や五十音順）に記憶している。すなわち、マイク１６から入力された入力音声は、Ａ／Ｄ変換・音声認識によって発音が割り出され読みに変換されるため、それだけそのデータの種別を判断することができない。従って、全てのデータをテーブル化して一律に検索し、該当するデータとそのデータ種別を同時に割り出すようにしている。

さて、図７に示す木構造読みパターンと対応する識別子が識別子テーブルに登録されているとする。識別子検索プログラムは、音声認識プログラムから、「はろー」という読みが与えられたとき、識別子テーブルに保持されているすべての各木構造読みパターンと読み「はろー」を照合し、読みが適合する木構造読みパターンに対応する識別子をすべて検索結果として返す。この例では「はろー」に対応する識別子010102が検索結果として返される。

Ｓ１９３では、識別子の個数が複数であるか否かを判定する。この識別子の個数が複数であるか否かの判定は、識別子選択プログラムによって行われる。識別子の個数が複数である場合、ステップＳ１９４へ進み、そうでない場合は、ステップＳ１９５へ進む。

識別子選択プログラムは、識別子検索プログラムから渡された識別子を属性テーブルと照合することによって、識別子の個数が複数であるか否かの判定を行う。属性テーブルは、歌手テーブル、音楽ＣＤテーブル、楽曲テーブルの３つのテーブルから構成される。図１７は、属性テーブルを概略構成を示すイメージ図であり、（ａ）は歌手テーブルの例であり、（ｂ）は音楽ＣＤテーブルの例であり、（ｃ）は楽曲テーブルの例である。

歌手テーブルにはＨＤＤ４に保存されている楽曲データの歌手の識別子と、その識別子に対する原語表示名、日本語表示名、歌手が歌唱／演奏する音楽ＣＤ１３の識別子リストから構成される。

音楽ＣＤテーブルにはＨＤＤ４に保存されている音楽ＣＤ１３の識別子と、その識別子に対する原語表示名、日本語表示名、音楽ＣＤ１３に収録されている楽曲の識別子リストから構成される。

楽曲テーブルにはＨＤＤ４に保存されている楽曲の識別子と、その識別子に対する原語表示名、日本語表示名、楽曲ファイル名から構成される。

例えば、歌手「ABCD」の音楽ＣＤ”SINGLES”の第１曲目である「A & Z」の情報がどのように格納されているかを示す。図３（ａ）より、歌手「ABCD」の識別子は010000である。歌手テーブルの010000の欄に原語表示名、日本語表示名、音楽ＣＤ識別リストが記述されている。音楽ＣＤ識別リストに格納されている010100が音楽ＣＤ「SINGLES」に対応する識別子である。

音楽ＣＤテーブルの010100の欄に原語表示名、日本語表示名、楽曲識別リストが記述されている。楽曲識別リストに格納されている最初の識別子010101が第１曲目の楽曲に相当する。楽曲テーブルの010101の欄に原語表示名、日本語表示名、楽曲ファイル名が記述されている。

なお、本実施例では、識別子は６桁の数字であり、上２桁が歌手、中２桁が音楽ＣＤ，下２桁が音楽ＣＤ中の曲順を表す。従って、たとえば010101という識別子が得られたら、これは楽曲の識別子であり、音楽ＣＤの曲順は１番であること。音楽ＣＤの識別子は010100であること。歌手の識別子は010000であることが分かる。

属性テーブルのそれぞれの識別子に対応する情報を読み出すことで、該識別子は歌手「ABCD」の音楽ＣＤ「SINGLES」の第１曲目である「A & Z」という楽曲に対応すること、またそれに対応する楽曲ファイル名も判別できる。

属性テーブルは楽曲検索装置１００出荷時点の最新の楽曲情報が初期値として設定されている。そしてセンター２００から選曲データ取得部１を介して選曲データをダウンロードした時、その内容にしたがって更新される。

ステップＳ１９４では、識別子を１個に絞り込む。識別子選択プログラムは識別子検索プログラムから渡された識別子が複数個あったとき、あるいは識別子が歌手に対応し、かつその歌手の音楽ＣＤが複数枚存在するときに識別子の候補を１個に絞り込む。また、識別子選択プログラムは、選択された項目に対応する識別子をシーケンスプログラムに送信する。

複数個の識別子を１個に絞り込む手順としては、使用者に選択させる、あるいは楽曲選択装置が何らかの優先度にしたがって識別子を選択する等好適な方法を用いることができる。

例えば、「れれれ」という読みを持つ楽曲が３曲登録されているとする。使用者が「れれれ」と発話すると、識別子検索プログラムは３個の識別子、例えば110107、120102、130111を検索結果として返す。すると識別子選択プログラムはこの識別子を元に属性テーブルを参照し、対応する３つの原語表示名「LeLeLe」、「レ・レ・レ」、「れ・れ・れ」を得る。

また、本実施例では識別子は６桁の数字であり、上２桁を歌手の識別子としている。したがって歌手の識別子もそれぞれ110000、120000、130000と求められるので、それらの曲を歌っている歌手名も分かる。仮に上記３つの識別子に対応する歌手名をそれぞれＡ、Ｂ、Ｃとする。そしてこれら原語表示名を図１８（ａ）に示すようにモニタ１４に候補として表示する。そして使用者にどの楽曲を選曲するか選択を促す。使用者は音声認識でたとえば「いちばん」「にばん」「さんばん」といった数字を発声する事で、あるいはリモコン１２を使用することで候補を一つ選択する。なお、図１８（ａ）は同じ読みをもつ楽曲を示すモニタ１４の表示例であり、（ｂ）は２枚組みのアルバムを示すモニタ１４の表示例である。

同様に、例えば、「THE EFG」という歌手の音楽ＣＤ２枚組のアルバム「THE EFG 1962-1966」の「THE EFG 1962-1966 Disc1」、「THE EFG 1962-1966 Disc2」が登録されているとする。前者はアルバムの１枚目の音楽ＣＤ、後者は２枚目の音楽ＣＤに対応する。使用者が「いーえふじーせんきゅーひゃくろくじゅーにせんきゅーひゃくろくじゅーろく」と発話すると、この発話は１枚目及び２枚目の音楽ＣＤの木構造読みに適合する。

従って、識別子検索プログラムは対応する２つの識別子例えば020100、020200を検索結果として返す。すると識別子選択プログラムは識別子020100、020200を元に属性テーブルを参照し、対応する２つの原語表示名「THE EFG 1962-1966 Disc1」、「THE EFG 1962-1966 Disc2」を得る。そしてこれら表示名を図１８（ｂ）に示すようにモニタ１４に候補として表示する。使用者は音声認識でたとえば「いちばん」「にばん」「さんばん」といった数字を発声する事で、あるいはリモコン１２を使用することで候補を一つ選択する。

Ｓ１９５では、識別子が歌手に対応し、かつその歌手の音楽ＣＤ１３が複数枚登録されているか否かを判定する。音楽ＣＤ１３が複数枚登録されている場合はステップＳ１９６へ進み、そうでない場合はステップＳ１９７へ進む。

Ｓ１９６では、音楽ＣＤを１枚選択しステップＳ１９７へ進み、ステップＳ１９７では、選択された識別子に対応する楽曲を再生する。絞り込む手順としては、使用者に選択させる、あるいは楽曲選択装置が何らかの優先度にしたがって識別子を選択する等好適な方法を用いることができる。

識別子が歌手に対応し、かつ歌手の音楽ＣＤが複数枚楽曲検索装置１００に保存されているときについて、例を元に識別子選択プログラムの動作を説明する。使用者が「えーびーしーでぃー」と発話すると、識別子検索プログラムは図１７（ａ）の歌手テーブルの内容に従い、歌手「ABCD」に対応する識別子010000を検索結果として返す。すると識別子選択プログラムには識別子010000を元に図１８（ｂ）の音楽ＣＤテーブルを参照する。

この例の場合、その歌手の音楽ＣＤが２枚登録されており、それらの識別子はそれぞれ010100、010200であると判断する。そして音楽ＣＤテーブルを参照して、両音楽ＣＤの原語表示名「SINGLES」、「green」を得る。そしてこれら表示名をモニタ１４に候補として表示する。使用者は音声認識でたとえば「いちばん」「にばん」といった数字を発声する事で、あるいはリモコン１２を使用することで候補を一つ選択する。以上述べた要領で、識別子選択プログラムは１枚の音楽ＣＤあるいは１曲の楽曲に対応する識別子への絞込みを行う。Ｓ１９７では、選択された識別子に対応する楽曲を再生する。

ここで、モニタ１４への音楽ＣＤ１３の名称などの表示及び音声による検索例に関して説明する。このモニタ１４への表示はシーケンスプログラムによってなされるものである。シーケンスプログラムは識別子選択プログラムから送られた識別子を元に対応する音楽ＣＤあるいは楽曲の文字情報および楽曲ファイル名を属性テーブルから検索し、モニタ１４への表示、および楽曲の再生を行う。

使用者が識別子010100に対応する音楽ＣＤ「SINGLES」を選択したときの表示例を図１９に示す。また、使用者が識別子020200に対応する音楽ＣＤ「THE EFG 1962-1966 Disc2」を選択したときの表示例を図２０に示す。それぞれ第１曲目の楽曲表示名がハイライトされているが、このハイライトは現在演奏中の楽曲であることを示す。

さらに本発明では、外国の歌手の楽曲に対し原語表示名に加え、日本語表示名および日本語表示名に対応する木構造読みパターンを用意したので、使用者の好みに応じてモニタ１４の表示を日本語表示に切り替えたり、日本語表示名に対応した読みにより楽曲検索が可能である。

図２０（ａ）は原語による歌手名、音楽CD名、楽曲名表示の例である。この表示を日本語表示に切り替えた例を図２０（ｂ）に示す。このように外国の歌手のＣＤに対し、使用者の好みに応じて原語表示および日本語表示を切り替えて使用できる。

また、日本語表示に対応した読みによる楽曲検索の例を説明する。図６の原選曲データ中の１９行目以下に、原語表示名「HIJK」という楽曲に対する情報が記述されている。これは日本語表示名「あいうえお」を持つ。それに従い、ＸＭＬ読みパターンには原語表示名、日本語表示名それぞれに対応する「えいちあいじぇいけい」「あいうえお」が登録されている。

図1７（ｄ）に示される、これらの木構造読みパターンに対応する識別子020202をそれぞれ音声認識辞書、および識別子テーブルに登録することで、どちらの読みを使用者が発話してもこの楽曲を検索することが可能となる。従って、図２０（ａ）がモニタ１４に表示されているときでも「あいうえお」と発話しても２曲目の「HIJK」を検索することができる。

以上述べたように本発明では、原語表示名に加え、日本語表示名および日本語表示名に対応する木構造読みパターンを用意したので使用者の好みに応じてモニタ１４の表示を日本語表示に切り替えたり、日本語表示名に対応した読みにより楽曲検索が可能である。

また、モニタ１４の表示に使用する言語にかかわらず、使用者は原語表示名に対応する読み、日本語表示名に対応する読みいずれでも楽曲を検索することができる。

なお、楽曲データは、音楽ＣＤ１３から読み出してＨＤＤ４に格納する場合について説明したが、本発明は、これに限定されるものではなく、ネットワークを介して配信されるものや、ＤＶＤから取得するものであってもよい。

本発明の実施の形態に係わる、音楽情報配信システムの概略構成を示すブロック図である。本発明の実施の形態に係わる、サーバ２００の概略構成を示すブロック図である。本発明の実施の形態に係わる、原選曲データは歌手情報のＸＭＬファイルの説明図であり、（ａ）は日本の歌手の歌手情報の例であり、（ｂ）は別名を有する歌手の例である。本発明の実施の形態に係わる、原選曲データは歌手情報のＸＭＬファイルの説明図であり、外国の歌手の歌手情報の例である。本発明の実施の形態に係わる、原選曲データは音楽ＣＤ情報のＸＭＬファイルの説明図であり、日本の歌手の音楽ＣＤ１３の例である。本発明の実施の形態に係わる、原選曲データは音楽ＣＤ情報のＸＭＬファイルの説明図であり、外国の歌手の場合で日本語表示名が追加される例である。本発明の実施の形態に係わる、木構造読みパターンが受理する読みの例を説明するイメージ図であり、図７（ａ）は名前が「The」で始まる場合の例であり、図７（ｂ）は名前にサブタイトルを有する場合の例であり、図７（ｃ）は名前に年代を表す数字を含む場合の例であり、図７（ｄ）は正式名が日本語以外の名前で日本語名を持つ場合の例であり、図７（ｅ）は音楽ＣＤ１３及び楽曲の名前に歌手の名前を含む場合の例であり、図７（ｆ）名前に年代以外の数字を含むもの場合の例である。本発明の実施の形態に係わる、ＸＭＬタグ走査サブ手順を示すフロー図である。本発明の実施の形態に係わる、読みデータ変換サブ手順を示すフロー図である。本発明の実施の形態に係わる、ＸＭＬ読みパターンから木構造読みパターンを生成する手順を示すフロー図である。本発明の実施の形態に係わる、ＸＭＬ読みパターンから得られる木構造読みパターン例を説明するイメージ図である。本発明の実施の形態に係わる、（ａ）は原選曲データであり、（ｂ）は更新前の選曲データであり、（ｃ）は更新前の木構造読みパターンであり、（ｄ）は更新後の選曲データであり、（ｅ）は更新後の木構造読みパターンを説明する説明図である。本発明の実施の形態に係わる、音楽ＣＤ１３を音楽ＣＤドライブ１に挿入したときの楽曲検索装置１００の処理を示すフロー図である。本発明の実施の形態に係わる、サーバ２００が楽曲検索装置１００からＴＯＣ情報、更新日時を受信したときの処理動作を示すフロー図である。本発明の実施の形態に係わる、楽曲検索時の楽曲検索装置１００の処理を示すフロー図である。本発明の実施の形態に係わる、識別子テーブルを説明するためのイメージ図である。本発明の実施の形態に係わる、属性テーブルを概略構成を示すイメージ図であり、（ａ）は歌手テーブルの例であり、（ｂ）は音楽ＣＤテーブルの例であり、（ｃ）は楽曲テーブルの例である。本発明の実施の形態に係わる、モニタ１４の表示例を示すイメージ図であり、（ａ）は同じ読みを持つ楽曲の場合の例であり、（ｂ）は２枚組みのアルバムの場合の例である。本発明の実施の形態に係わる、所定の音楽ＣＤを選択した場合のモニタ１４の表示例を示すイメージ図である。本発明の実施の形態に係わる、モニタ１４の表示例を示すイメージ図であり、（ａ）は原語による歌手名、音楽CD名、楽曲名表示の例であり、（ｂ）はその表示を日本語表示に切り替えた例である。従来技術に係わる、楽曲検索装置の動作処理を示すフロー図である。

符号の説明

１音楽ＣＤドライブ、２ＣＰＵ、３選曲データ取得部、４ＨＤＤ、５Ａ／Ｄコンバータ、６ＲＯＭ、７ＲＡＭ、８表示制御部、９Ｄ／Ａコンバータ、９’ アンプ、１０リモコン受信機、１１アンプ、１２リモコン、１３音楽ＣＤ、１４モニタ、１５スピーカ、１６マイク、１００楽曲検索装置、２００サーバ、２０１原選曲データデータベース、２０２読みデータ変換規則管理部、２０３木構造読みデータ変換部、２０４選曲データデータベース、２０５選曲データ検索部

Claims

音声によって楽曲データを検索するクライアントと、有線または無線にて通信を行うことによって当該クライアントに当該楽曲データを検索するための選曲データを配信するサーバとからなる楽曲情報配信システムであって、
前記サーバーは、
前記楽曲データの歌手名、音楽媒体名、曲名について、その読み仮名の論理構造を示す読みパターンを含む原選曲データを保持する原選曲データ保持手段と、
前記論理構造を示す読みパターンから複数の読み又は省略可能な読みを表現する木構造読みパターンを生成する所定の規則を保持する生成規則保持手段と、
前記木構造読みパターンを含む選曲データをクライアントに配信する木構造読みパターン生成手段とを備え、
前記クライアントは、
前記楽曲データを複数記憶する楽曲データ記憶手段と、
前記楽曲データを検索するための音声を入力する音声入力手段と、
前記音声入力手段に入力された音声を当該音声に相当する記号列に変換する音声変換部と、
前記記号列を前記選曲データの木構造読みパターンと照合することによって前記楽曲データを検索する検索手段と、
を備えることを特徴とする楽曲情報配信システム。
前記読み仮名の論理構造を示す読みパターンは、ＸＭＬを用いて記述されることを特徴とする請求項１に記載の楽曲情報配信システム。
前記サーバは、前記クライアントから当該クライアントが最後に当該サーバにアクセスした日時を受信し、前記日時以後に歌手名、音楽媒体名、曲名の情報が更新された楽曲の識別子のリストを前記クライアントに送信し、
前記クライアントは、前記識別子のリストに合致する楽曲データを記憶していた場合、当該楽曲データに対応する選曲データをサーバから取得することを特徴とする請求項１又は請求項２に記載の楽曲情報配信システム。
前記生成規則保持手段は、別名を有する歌手または音楽媒体の場合、前記読みパターンの歌手名または音楽媒体名に相当する部分を、前記歌手または音楽媒体の正式名及び別名の両方の読みを表現する木構造読みパターンに変換する規則を有することを特徴とする請求項１乃至請求項３のいずれかに記載の楽曲情報配信システム。
前記生成規則保持手段は、サブタイトルを有する音楽媒体または曲の場合、前記読みパターンのサブタイトルに相当する部分を、当該サブタイトルの読みを省略可能な読みを表現する木構造読みパターンに変換する規則を有することを特徴とする請求項１乃至請求項４のいずれかに記載の楽曲情報配信システム。
前記生成規則保持手段は、「The」で始まる歌手名又は音楽媒体名又は曲名の場合、前記読みパターンの当該歌手、音楽媒体または曲の正式名の読みおよび先頭の「ざ」または「じ」に該当する部分を、前記「ざ」または「じ」、または省略可能な読みを表現する木構造読みパターンに変換する規則を有することを特徴とする請求項１乃至請求項５のいずれかに記載の楽曲情報配信システム。
前記生成規則保持手段は、年代を表す数字を含む音楽媒体名または曲名を含む場合、前記読みパターンの当該年代を示す数字に相当する部分を、桁読み、棒読み２種類の読みを表現する木構造読みパターンに変換する規則を有することを特徴とする請求項１乃至請求項６のいずれかに記載の楽曲情報配信システム。
前記生成規則保持手段は、何枚目の音楽媒体かを示す数字及び、又は文字を含む音楽媒体名の場合、前記読みパターンの当該数字及び、又は文字に相当する部分を、当該音楽媒体の順番を示す読み、または省略可能な読みを表現する木構造読みパターンに変換する規則を有することを特徴とする請求項１乃至請求項７のいずれかに記載の楽曲情報配信システム。
前記生成規則保持手段は、年代以外の意味を表す数字を含む歌手名又は音楽媒体名または曲名の場合、前記読みパターンの当該数字に相当する部分を、桁読み、棒読み、英語読みの３種類の読みを表現する木構造部分読みパターンに変換することを特徴とする請求項１乃至請求項８のいずれかに記載の楽曲情報配信システム。
前記生成規則保持手段は、正式名が日本語以外の言語で記述される歌手名又は音楽媒体名又は曲名でかつ日本語名を有する場合、当該正式名及び日本語名の両方の読みを表現する木構造部分読みパターンに変換することを特徴とする請求項１乃至請求項９のいずれかに記載の楽曲情報配信システム。
前記選曲データは、歌手名又は音楽媒体名又は曲名の正式名及び日本語名を示す表示パターンを含むものであって、
前記クライアントは、
前記検索手段によって検索された楽曲データを再生する再生手段と、
前記再生する楽曲データの正式名が日本語以外の言語で記述される歌手名又は音楽媒体名又は曲名でかつ日本語名を有する場合、当該歌手名又は音楽媒体名又は曲名の正式名および日本語名を切り替可能な状態で表示する表示手段を備えることを特徴とする請求項１乃至請求項１０のいずれかに記載の楽曲情報配信システム。
音声によって楽曲データを検索するクライアントと、有線または無線にて通信を行うことによって当該クライアントに当該楽曲データを検索するための選曲データを配信するサーバとからなる楽曲情報配信システムであって、
前記サーバーは、
前記楽曲データの歌手名、音楽媒体名、曲名について、その表示パターンを含む原選曲データを保持する原選曲データ保持手段と、
前記表示パターンに「ベスト」「Best」「グレーテストヒッツ」「Greatest Hits」という単語を含む場合、ベスト盤に相当する読みを含む木構造読みパターンを生成する規則を保持する生成規則保持手段と、
前記木構造読みパターンを含む選曲データをクライアントに配信する木構造読みパターン生成手段とを備え、
前記クライアントは、
前記楽曲データを複数記憶する楽曲データ記憶手段と、
前記楽曲データを検索するための音声を入力する音声入力手段と、
前記音声入力手段に入力された音声を当該音声に相当する記号列に変換する音声変換部と、
前記記号列を前記選曲データの木構造読みパターンと照合することによって前記楽曲データを検索する検索手段と、
を備えることを特徴とする楽曲情報配信システム。
前記選曲データは、歌手名又は音楽媒体名又は曲名の正式名及び日本語名を示す表示パターンを含むものであって、
前記クライアントは、
前記検索手段によって検索された楽曲データを再生する再生手段と、
前記再生する楽曲データの正式名が日本語以外の言語で記述される歌手名又は音楽媒体名又は曲名でかつ日本語名を有する場合、当該歌手名又は音楽媒体名又は曲名の正式名および日本語名を切り替可能な状態で表示する表示手段を備えることを特徴とする請求項１２に記載の楽曲情報配信システム。