JP2004362419A

JP2004362419A - 情報処理装置および方法

Info

Publication number: JP2004362419A
Application number: JP2003162192A
Authority: JP
Inventors: Natsuki Saito; 夏樹齋藤; Takahiro Kamai; 孝浩釜井; Katsuyoshi Yamagami; 勝義山上; Yumiko Kato; 弓子加藤; Yoshifumi Hirose; 良文廣瀬
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 2003-06-06
Filing date: 2003-06-06
Publication date: 2004-12-24

Abstract

【課題】マルチメディアコンテンツの作成を行うユーザの負担を軽減し、さらに声質や画像、文体のキャラクタが一致したコンテンツの作成を容易にする。
【解決手段】本発明では、ユーザがマルチメディア的コンテンツを含むメールを作成しようとする際、まずユーザの作りたいメールのキャラクタを選択させることによって、そのキャラクタに合った音声合成パラメータ（声質データ）や画像データを選択しやすいようにソートしてユーザに提示し、さらにそのキャラクタに合った文章をユーザが書くように、キャラクタに個別のテキスト入力変換辞書を使用させる。これにより、テキストや画像及び音声の雰囲気が一致したマルチメディアメールを作成できる。
【選択図】図１

Description

【０００１】
【発明の属する技術分野】
本発明は情報処理装置および方法に関し、特に、マルチメディアコンテンツの作成を支援する装置および方法に関する。
【０００２】
【従来の技術】
従来の技術では、携帯情報端末に対してマルチメディア的コンテンツを提供する際、サービス提供者側であらかじめ用意したコンテンツの場所を示すＵＲＬをテキストで書かれたメールに書き込み、ユーザはそのＵＲＬをたどることでコンテンツの参照を行う。用意されたコンテンツのうち、どれの参照を行うか選択する際には、列挙もしくは階層的構造により提示されたコンテンツのリストから、目的のものをユーザが探して確定するという作業を行う必要がある。
【０００３】
【特許文献１】
特開２００３−１３２０４９号公報
【特許文献２】
特開２００２−１３２８２３号公報
【０００４】
【発明が解決しようとする課題】
従来の技術では、画像や音声などのマルチメディア的コンテンツを含むメールを作成しようとすると、常にメールの内容に合った画像や音声が提供できるようにするには非常に多くの画像や音声をあらかじめ用意しておかなければならない。一方、あらかじめ用意されたデータが多くなるにつれ、サービスを利用するユーザにとってそれら画像や音声の選択にかかる労力が大きくなり、メールの作成が困難になる。
【０００５】
【課題を解決するための手段】
本発明による情報処理装置は、第１の記憶部と、選択部とを備える。第１の記憶部は、複数の第１の情報と、複数の第１の情報に対応づけられた複数の第１のパラメータセットとを記憶する。複数の第１のパラメータセットの各々は、対応する第１の情報の雰囲気を特徴づけるものである。選択部は、第２の情報の雰囲気を特徴づける第２のパラメータセットと複数の第１のパラメータセットの各々とを用いて第２の情報と複数の第１の情報の各々との類似度を算出し、得られた類似度に基づいて複数の第１の情報のうち少なくとも１つを選択する。
【０００６】
本発明による情報処理装置は、たとえばマルチメディアコンテンツの作成を支援するために用いられる。第１の情報と第２の情報とを用いたマルチメディアコンテンツを上記情報処理装置を利用してユーザが作成する際、まず、ある第２の情報が何らかの手段により決定される。この第２の情報と複数の第１の情報の各々との類似度に基づいて複数の第１の情報のうち少なくとも１つが選択部によって選択される。これにより、第２の情報にふさわしいであろうと（類似度に基づいて）考えられる第１の情報が少なくとも１つユーザに提供され、第１の情報の選択に関するユーザの負担が軽減される。第１および第２のパラメータセットは、対応する情報の雰囲気を特徴づけるものであるため、選択部によって算出される類似度は第１の情報と第２の情報との雰囲気の一致度合い（雰囲気の統一感）と相関がある。したがって、類似度の最も高い第１の情報を選択部が選択した場合には、第１の情報と第２の情報との雰囲気の一致度合いの高い（全体の雰囲気の統一感の高い）マルチメディアコンテンツを作成できる。
【０００７】
好ましくは上記複数の第１のパラメータセットの各々は、対応する第１の情報の雰囲気を表すための複数の要素に対して設定された複数の数値データを含む。上記第２のパラメータセットは、第２の情報の雰囲気を表すための複数の要素に対して設定された複数の数値データを含む。
【０００８】
好ましくは上記選択部は、第２の情報の内容を解析して第２のパラメータセットを生成する。
【０００９】
好ましくは上記情報処理装置は第２の記憶部をさらに備える。第２の記憶部は、複数の第２の情報と、複数の第２の情報に対応づけられた複数の第２のパラメータセットとを記憶する。複数の第２のパラメータセットの各々は、対応する第２の情報の雰囲気を特徴づけるものである。選択部は、複数の第２の情報のうちのある１つ（以下、「第２の情報Ａ」という。）に対応する第２のパラメータセットと複数の第１のパラメータセットの各々とを用いて第２の情報Ａと複数の第１の情報の各々との類似度を算出する。
【００１０】
好ましくは上記複数の第２のパラメータセットの各々は、対応する第２の情報の雰囲気を表すための複数の要素に対して設定された複数の数値データを含む。
【００１１】
好ましくは上記選択部は、第２の情報Ａをユーザに選択させる。
【００１２】
好ましくは上記選択部は、得られた類似度に基づいて選択した第１の情報のうち１つをユーザに選択させる。
【００１３】
好ましくは、上記第１および第２の情報は、マルチメディアコンテンツを作成するために用いられる情報である。
【００１４】
好ましくは、上記第１および／または第２の情報は、マルチメディアコンテンツの構成要素である。マルチメディアコンテンツの構成要素としては、たとえば、画像データ、音声データ、テキストデータが挙げられる。
【００１５】
好ましくは、上記第１および／または第２の情報は、マルチメディアコンテンツのある構成要素の雰囲気を制御するものである。たとえば、マルチメディアコンテンツの構成要素の１つである音声データの雰囲気（声質・調子など）を制御するデータ（声質データ）や、マルチメディアコンテンツの構成要素の１つであるテキストデータの雰囲気（文体）を制御する入力変換辞書などが挙げられる。
【００１６】
好ましくは、上記第１または第２の情報は、マルチメディアコンテンツ全体に与えるべき雰囲気を示すものである。
【００１７】
好ましくは上記情報処理装置は、与えられたテキストを音声データに変換する音声合成部をさらに備える。複数の第１の情報の各々は、音声合成部によって生成される音声データの声質を特徴づけるデータ（声質データ）である。音声合成部は、選択部によって選択された声質データを用いて上記テキストを音声データに変換する。
【００１８】
好ましくは上記複数の第１の情報の各々は画像データである。
【００１９】
好ましくは上記複数の第１の情報の各々は表現スタイルである。
【００２０】
好ましくは上記複数の第１の情報の各々は、あるキャラクタ性を持たせた文章を入力するのに適した入力変換辞書である。上記情報処理装置は、選択部によって選択された入力変換辞書を用いてユーザにテキストを入力させる。
【００２１】
好ましくは上記第２の情報は表現スタイルである。
【００２２】
好ましくは上記第２の情報は画像データである。
【００２３】
好ましくは上記第２の情報は、あるキャラクタ性を持たせた文章を入力するのに適した入力変換辞書であり、上記音声合成部には、入力変換辞書を用いて入力されたテキストが与えられる。
【００２４】
好ましくは上記第２の情報は、あるキャラクタ性を持たせた文章を入力するのに適した入力変換辞書であり、上記情報処理装置は、入力変換辞書を用いてユーザにテキストを入力させる。
【００２５】
好ましくは上記情報処理装置は、与えられたテキストを音声データに変換する音声合成部をさらに備える。上記第２の情報は、音声合成部によって生成される音声データの声質を特徴づけるデータ（声質データ）である。音声合成部は、上記声質データを用いて上記テキストを音声データに変換する。
【００２６】
好ましくは上記情報処理装置は、選択部によって選択された入力変換辞書を用いて入力されたテキストを音声データに変換する音声合成部をさらに備える。上記第２の情報は、音声合成部によって生成される音声データの声質を特徴づけるデータ（声質データ）である。音声合成部は、上記声質データを用いて上記テキストを音声データに変換する。
【００２７】
本発明による情報処理方法はステップ（ａ）〜（ｃ）を備える。ステップ（ａ）では、複数の第１の情報と複数の第１のパラメータセットとを対応づける。複数の第１のパラメータセットの各々は、対応する第１の情報の雰囲気を特徴づけるものである。ステップ（ｂ）では、第２の情報の雰囲気を特徴づける第２のパラメータセットと複数の第１のパラメータセットの各々とを用いて第２の情報と複数の第１の情報の各々との類似度を算出する。ステップ（ｃ）では、ステップ（ｂ）によって得られた類似度に基づいて複数の第１の情報のうち少なくとも１つを選択する。
【００２８】
本発明では、ユーザがマルチメディア的コンテンツを含むメールを作成しようとする際、まずユーザの作りたいメールのキャラクタを選択させることによって、そのキャラクタに合った音声合成パラメータ（声質データ）や画像データを選択しやすいようにソートしてユーザに提示し、さらにそのキャラクタに合った文章をユーザが書くように、キャラクタに個別のテキスト入力変換辞書を使用させる。これにより、テキストや画像及び音声の雰囲気が一致したマルチメディアメールを作成できる。
【００２９】
本発明による音声合成サーバ装置は、クライアント携帯端末から送信されたテキストを音声合成技術を用いて音声データに変換する装置であって、特定の雰囲気に沿った文章の入力を行い易くなるようなテキスト入力変換辞書を複数持ち、直感的に選び易いキャラクタをユーザに複数提示してその中から１つを選択させることができ、各々のテキスト入力変換辞書とキャラクタの間の類似性を計算する手段を有し、これによってユーザの選択したキャラクタに沿った文章の入力に最適なテキスト入力変換辞書を決定し、ユーザにダウンロードさせることができ、ユーザは、ダウンロードしたテキスト入力変換辞書を用いてテキストの作成を行うことができる。
【００３０】
上記サーバ装置では、ユーザの入力したい文章の雰囲気に合わせて、最適なテキスト入力変換辞書をダウンロードさせることにより、携帯端末でメールなどのテキストを入力するユーザが様々な文体を使い分ける場合でも、常にストレス無くテキスト入力作業が行えるようになる。
【００３１】
好ましくは上記音声合成サーバ装置は、テキストの読み上げの雰囲気を定める声質データを複数持ち、上記テキスト入力変換辞書及びキャラクタと各々の声質データとの間の類似性を計算する手段を有し、音声合成を行う際にはユーザの選択したキャラクタとテキスト入力変換辞書に最適な声質データを用いることによって、入力されたテキストと声質の間の整合性が保たれる。
【００３２】
上記サーバ装置では、ユーザの入力するテキストの文体に一致するような合成音の声質を自動的に選択するか、もしくは文体と声質の間の類似性によって、サーバ装置の保持する声質のリストをソートして表示することを可能とし、ユーザにとって、入力されたテキストとそれを読み上げる合成音の雰囲気を統一することが容易になる。
【００３３】
好ましくは上記音声合成サーバ装置は、画像データを複数持ち、上記テキスト入力変換辞書、キャラクタ及び声質データと各々の画像データとの間の類似性を計算してそれらの最適な組み合わせを求める手段を有し、入力されたテキストと声質及び表示される画像の間の整合性が保たれる。
【００３４】
上記サーバ装置では、ユーザの入力するテキストの文体、合成音の声質、及び画像データの類似性を計算し、これら３つのデータの雰囲気がどの程度一致しているかを求めることによって、マルチメディアコンテンツの雰囲気の統一性を確保することが容易になる。
【００３５】
上記音声合成サーバ装置を用いて作成される、テキストと合成音声と画像のデータからなるマルチメディアコンテンツを、マルチメディアコンテンツの作成を行ったユーザにダウンロードさせることによって、クライアント端末へのメールや電話の着信報知用コンテンツやアラーム表示用コンテンツとして利用させることが好ましい。上記音声合成サーバ装置によって効率的に作成されたマルチメディアコンテンツを、コンテンツ作成者自らがクライアント端末に保持することによって、従来用いられていた着信メロディや着信音声などの音声メディアのみによる報知メッセージよりも個人の趣向が反映し易くオリジナリティと表現性の高い、マルチメディアコンテンツによる報知メッセージの利用が可能になる。
【００３６】
本発明によるマルチメディアメール配信システムは、上記音声合成サーバ装置を用いて作成される、テキストと合成音声と画像のデータからなるマルチメディアコンテンツを、別に用意したメールサーバ、画像配信サーバ及び合成音声配信サーバを用いてマルチメディアメールとして送信を行える。このシステムでは、上記音声合成サーバ装置によって効率的に作成されたマルチメディアコンテンツを、作成された合成音を蓄積し配信する合成音配信サーバ装置と、コンテンツ作成者の選択した画像をコンテンツ閲覧者に配信する画像配信サーバ装置と、テキスト及び前記合成音及び画像を参照するためのインデックスとなるＵＲＬを含むメールを配信するメール配信サーバ装置によって、ネットワークの負荷を分散させつつ、ユーザによって作成されたマルチメディアコンテンツの配信を効率的に行うことができる。
【００３７】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照して詳しく説明する。なお、図面において同一または相当する部分には同じ参照符号を付しその説明は繰り返さない。
【００３８】
（第１の実施形態）
第１の実施形態によるシステムの構成を図１に示す。このシステムでは、送信側ユーザの使用する携帯情報端末（以下「送信端末」）１０８と受信側ユーザの使用する携帯情報端末（以下「受信端末」）１０９との間でメールサーバ１１０を介してメールの送受信が行われる。送信端末１０８は、キャラクタサーバ１１１の保持する各種キャラクタデータを参照してマルチメディアメールを作成し、受信端末１０９はマルチメディアメール配信サーバ１１２を介して、作成されたマルチメディアメールを取得する。
【００３９】
キャラクタサーバ１１１は、キャラクタ選択機１００と、音声パラメータデータベース１０１と、入力変換辞書データベース１０２と、画像データベース１０３と、表現スタイルデータベース１０４と、音声合成エンジン１０５とを備える。
【００４０】
音声パラメータデータベース１０１には、それぞれ異なったキャラクタ（男性、女性、子供など）に対応する声質データが複数格納されており、どの声質データを音声合成エンジン１０５に与えるか、キャラクタ選択機１００により選択することで、音声合成エンジン１０５から出力される合成音の声質や口調などを変えることができる。音声パラメータデータベース１０１に格納されている声質データの各々には、男性１，女性１，子供１などのような声質番号（識別子）が付与されている。また音声パラメータデータベース１０１には、声質データの各々に対応づけてパラメータセットが格納されている。このパラメータセットは、対応する声質データの雰囲気を表すものであり、図２に示すように、明るさ，渋さ，若さ，ノリの各要素（パラメータ）に対して数値データが設定されている。
【００４１】
入力変換辞書データベース１０２には、それぞれ異なったキャラクタに対応する入力変換辞書が複数格納されており、これら入力変換辞書のうちどれか１つを、キャラクタ選択機１００により選択して送信端末１０８に与える。各入力変換辞書は、それぞれ別のキャラクタ性を持たせた文章を入力するのに適したものになっており、ユーザが入力したい文章に合った入力変換辞書を選ぶことで、ユーザの行う文章入力の作業が簡単になる。また入力変換辞書データベース１０２には、入力変換辞書の各々に対応づけてパラメータセットが格納されている。このパラメータセットは、対応する入力変換辞書の雰囲気を表すものであり、上述の声質データの場合と同様、明るさ，渋さ，若さ，ノリの各要素に対して数値データが設定されている。
【００４２】
画像データベース１０３には、キャラクタ選択機１００によって選択可能なキャラクタに対応する画像データが複数格納されており、これを送信端末１０８に提示したり、受信端末１０９に提示するためにマルチメディアメール配信サーバ１１２に送信したりすることができる。また画像データベース１０３には、画像データの各々に対応づけてパラメータセットが格納されている。このパラメータセットは、対応する画像データの雰囲気を表すものであり、上述の声質データの場合と同様、明るさ，渋さ，若さ，ノリの各要素に対して数値データが設定されている。
【００４３】
表現スタイルデータベース１０４には、キャラクタ選択機１００によって選択可能な表現スタイル（オヤジ風、貴族風、ギャル風など）とパラメータセットとが対応づけられて複数格納されている。表現スタイルの各々にはキャラクタ名（オヤジ風，貴族風，ギャル風，子供風，不良風など）が付与されている。表現スタイルは、ユーザが作成しようとしているマルチメディアメール（マルチメディアコンテンツ）にどのような雰囲気を与えるかを示すものである。パラメータセットは、対応する表現スタイル（キャラクタ名）の雰囲気を表すものであり、図３に示すように、明るさ，渋さ，若さ，ノリの各要素に対して数値データが設定されている。
【００４４】
マルチメディアメール配信サーバ１１２は、合成音保持装置１０６と、画像保持装置１０７によって構成され、送信端末１０８から、メールサーバ１１０を介して受信端末１０９に送信されたメールに添付される画像や音声を、受信端末１０９に送信することを目的とする。
【００４５】
以下、図１の機器構成で提供されるサービスの動作手順を説明する。
【００４６】
このサービスは概略、図４に示されるフローに従って動作し、メールの表現スタイル選択（ステップ２１００）、入力変換辞書のダウンロード（ステップ２１０１）、テキストの入力（ステップ２１０２）、合成音声の声質選択（ステップ２１０３）、画像の選択（ステップ２１０４）、完成したマルチメディアメールの送信（ステップ２１０５）というステップをたどる。各ステップでは既に処理済のステップの結果を利用することができ、例えばステップ２１０４では、ユーザがステップ２１００でどの表現スタイルを選択し、ステップ２１０２でどのような文章を入力し、ステップ２１０３でどの声質を選択したかを考慮した上で、適切な画像を選択しやすいようにすることができる。
【００４７】
以下、図４に示されるフローの各ステップを詳細に説明する。
【００４８】
＜ステップ２１００＞
１）送信側のユーザが、マルチメディアメールの作成を開始する。送信端末１０８はキャラクタサーバ１１１と通信し、表現スタイルのリストを要求する。キャラクタ選択機１００は、選択可能な表現スタイル（キャラクタ名）のリストを表現スタイルデータベース１０４から取得して送信端末１０８に送る。送信端末１０８は、キャラクタサーバ１１１からのリストをディスプレイに表示しユーザに選択を促す（図５参照）。送信側のユーザは、表示されたキャラクタのリストから、入力したいメールのスタイルに最も近いものを１つ選択する（図５参照）。なお、ここでは「貴族風」の表現スタイルが選択されたものとする。
【００４９】
＜ステップ２１０１＞
２）選択された表現スタイル（ここでは「貴族風」）に対応した入力変換辞書をダウンロードするかどうかの確認が送信端末１０８のディスプレイに表示される（図６参照）。「いいえ」を選ぶと、１）のキャラクタ選択画面に戻る。「はい」を選ぶと、選択されたキャラクタ（ここでは「貴族風」）を示すデータが、キャラクタサーバ１１１のキャラクタ選択機１００に送信される。
【００５０】
キャラクタサーバ１１１は、送信された表現スタイル（ここでは「貴族風」）に対応した入力変換辞書を入力変換辞書データベース１０２から選択し、その入力変換辞書を送信端末１０８に送信する。具体的には、渡された表現スタイル「貴族風」と入力変換辞書データベース１０２に格納されている入力変換辞書の各々との類似度を計算し、類似度が最も高い入力変換辞書を送信端末１０８に送信する。上述のとおり、ユーザの選ぶキャラクタ（表現スタイル）には明るさ・渋さ・若さ・ノリという４つのパラメータが与えられており、入力変換辞書データベース１０２の保持する入力変換辞書の各々にもそれぞれ同様のパラメータが与えられている。このとき、選択されたキャラクタ（表現スタイル）と各入力変換辞書との類似度は、それぞれを４次元空間上の点として、その間のユークリッド距離を計算することにより求められる。即ち、ここで各キャラクタ（表現スタイル）に割り振られる４つのパラメータをｘ_ｉ（１≦ｉ≦４）、各入力変換辞書に割り振られる同様のパラメータをｙ_ｉ（１≦ｉ≦４）とすると、キャラクタ（表現スタイル）と入力変換辞書との類似度は、
【数１】

で求められ、この値が小さいほど類似度が高いものとする。
【００５１】
＜ステップ２１０２＞
３）入力変換辞書のダウンロードが終了すると、メール入力画面に移行する。メールの文章を入力するには、まず仮名の入力を行う（図７参照）。続いて、仮名漢字変換処理を行うと、２）でダウンロードされた入力変換辞書に基づいて変換処理が行われる（図８参照）。
４）メール入力が完了したら、ユーザはメニューから「完成」を選択する（図９参照）。
【００５２】
＜ステップ２１０３＞
５）送信端末１０８が、キャラクタサーバ１１１のキャラクタ選択機１００に対し、先ほど入力を行った文章の読み上げに適した声質のリストを要求する。このとき、キャラクタサーバ１１１に対し、文章の作成に使用したキャラクタは「貴族風」であるという情報が渡される。
【００５３】
キャラクタサーバ１１１は、渡された情報を元に、音声パラメータデータベース１０１が保持する声質データのリストをソートする。具体的には、渡されたキャラクタ「貴族風」と、音声パラメータデータベース１０１に格納されている声質データの各々との類似度を計算し、音声パラメータデータベース１０１の持つ声質データのリストを類似度によってソートする。その後、類似度の最も低い声質データを類似度が最も高い声質データと類似度が２番目に高い声質データの間に挿入し、送信端末１０８に送信する声質データのリストとする。
【００５４】
図３に示したように、ユーザの選ぶキャラクタには明るさ・渋さ・若さ・ノリという４つのパラメータが与えられており、音声パラメータデータベース１０１の保持する声質データにも図２に示したようにそれぞれ同様のパラメータが与えられている。このとき、選択されたキャラクタと各声質データの類似度は、それぞれを４次元空間上の点として、その間のユークリッド距離を計算することにより求められる。即ち、ここで各キャラクタに割り振られる４つのパラメータをｘ_ｉ（１≦ｉ≦４）、各声質データに割り振られる同様のパラメータをｙ_ｉ（１≦ｉ≦４）とすると、キャラクタと声質データの類似度は上述の［数１］で求められ、この値が小さいほど類似度が高いものとする。
【００５５】
このような方法で、選択されたキャラクタと各声質データの類似度を求めることで、
・リストの先頭にあるキャラクタは、書かれたメールの読み上げに最も適したキャラクタである。
・リストの２番目にあるキャラクタは、書かれたメールの読み上げに最もミスマッチなキャラクタであり、それによって読み上げに面白味を出すことができる。
・リストの３番目以降のキャラクタは、ユーザが別のキャラクタを選択しやすいように、文章スタイルと声質の類似度によってソートされている。
という特徴を持ったリストを作る。
【００５６】
送信端末１０８は、このリストを送信側ユーザに提示して、どれか１つのキャラクタの選択を促す（図１０参照）。
６）送信側ユーザが、リストの先頭にある「男性１」のキャラクタ（声質）を選択する。送信端末１０８は、キャラクタサーバ１１１のキャラクタ選択機１００にキャラクタ選択内容を、音声合成エンジン１０５にメール文章を送信して、キャラクタサーバ１１１からの合成音の送信を要求する。音声合成エンジン１０５は、キャラクタ選択機１００が音声パラメータデータベース１０１から選択した「男性１」の声質データを使用して、送信端末１０８から受け取ったメール文章から合成音を生成し、送信端末１０８に送る。送信端末１０８は、受け取った合成音を再生して送信側ユーザにこのキャラクタでの読み上げの結果として試聴させる（図１１参照）。
【００５７】
＜ステップ２１０４＞
７）送信端末１０８が、キャラクタサーバ１１１のキャラクタ選択機１００に対し、先ほど入力を行った文章に適した画像のリストを要求する。このとき、キャラクタサーバ１１１に対し、合成音の作成に使用したキャラクタは「貴族風」であるという情報が渡される。
【００５８】
キャラクタサーバ１１１は、渡された情報を元に、画像データベース１０３が保持する画像データのリストをソートする。具体的には、渡されたキャラクタ「貴族風」と、画像データベース１０３に格納されている画像データの各々との類似度を上述と同様にして計算し、画像データベース１０３の持つ画像データのリストを類似度によってソートする。その後、類似度の最も低い画像データを類似度が最も高い画像データと類似度が２番目に高い画像データの間に挿入し、送信端末１０８に送信する画像データのリストとする。これによって、
・リストの先頭にあるキャラクタ（画像データ）は、合成音の声質と最も一致するキャラクタ（画像データ）である。
・リストの２番目にあるキャラクタ（画像データ）は、合成音の声質と最もミスマッチなキャラクタ（画像データ）であり、それによって読み上げに面白味を出すことができる。
・リストの３番目以降のキャラクタ（画像データ）は、ユーザが別のキャラクタ（画像データ）を選択しやすいように、合成音の声質と画像の類似度によってソートされている。
という特徴を持ったリストを作る。
【００５９】
送信端末１０８は、このリストを送信側ユーザに提示して、どれか１つのキャラクタ（画像データ）の選択を促す（図１２参照）。
８）送信側ユーザが、リストの先頭にある「男爵１」のキャラクタ（画像データ）を選択する。送信端末１０８は、キャラクタサーバ１１１のキャラクタ選択機１００にキャラクタ選択内容を送信し、対応する画像の送信を要求する。送信端末１０８は、受け取った画像を表示して送信側ユーザの確認を求める（図１３参照）。
【００６０】
＜ステップ２１０５＞
９）送信端末１０８が、送信側ユーザに、受信側ユーザのメールアドレスの入力を求める。メールアドレスの入力が完了したら、送信側ユーザは「送信」を選択する（図１４参照）。
１０）送信端末１０８が、キャラクタサーバ１１１のキャラクタ選択機１００にキャラクタ（画像データ）選択内容を、音声合成エンジン１０５にメール文章を送信し、マルチメディアメールのデータ作成を要求する。
【００６１】
音声合成エンジン１０５は、キャラクタ選択機１００が音声パラメータデータベース１０１から選択した「男性１」に対応する声質データを使用して、送信端末１０８から受け取ったメール文章から合成音を生成し、さらに、後でこの合成音を簡単に参照できるように、一意のラベル文字列を生成して、マルチメディアメール配信サーバ１１２に送信する。マルチメディアメール配信サーバ１１２は、音声合成エンジン１０５の生成した合成音を、一意のラベル文字列から簡単に参照できるような形で、合成音保持装置１０６に格納する。
【００６２】
さらに、マルチメディアメール配信サーバ１１２は、キャラクタサーバ１１１の画像データベース１０３から、選択された画像を受け取って画像保持装置１０７に格納する。このとき、後でこの画像を簡単に参照できるように、一意のラベル文字列を生成して記憶しておく。
１１）キャラクタサーバ１１１が、送信端末１０８に、音声合成エンジン１０５が生成した合成音を参照するためのラベル文字列と、画像データベース１０３から選択された画像を参照するためのラベル文字列を送信する。
【００６３】
送信端末１０８は、キャラクタサーバ１１１から受け取った２つのラベル文字列から、一意に得られるＵＲＬを作成する。例えば、合成音を参照するためのラベル文字列として「ａｂｃ１２３」が、画像を参照するためのラベル文字列として「ｘｙｚ９８７」が与えられており、マルチメディアメール配信サーバ１１２のインターネットアドレスが「ｍｕｌｔｉｍｅｄｉａ−ｍａｉｌ．ｃｏｍ」であれば、「ｈｔｔｐ：／／ｍｕｌｔｉｍｅｄｉａ−ｍａｉｌ．ｃｏｍ／ａｂｃ１２３＋ｘｙｚ９８７」というＵＲＬを作成する。その上で、「メールが来ています。下記をクリック！」という本文と、作成したＵＲＬが書かれた内容のメールを作成し、宛先を受信端末１０９として、メールサーバ１１０に送信する。
１２）メールサーバ１１０は、受信したメールに書かれた宛先に従って、このメールを受信端末１０９に送信し、受信端末１０９はメールの着信があった旨表示を行う（図１５参照）。受信側ユーザがこのメールを読み（図１６参照）、メールに書かれたＵＲＬを選択すると、受信端末１０９はマルチメディアメール配信サーバ１１２にアクセスして、そのＵＲＬに対応するデータの送信を要求する。即ち、ＵＲＬに埋めこまれた、合成音を参照するためのラベル文字列と、画像を参照するためのラベル文字列をマルチメディアメール配信サーバ１１２に送信し、合成音保持装置１０６と画像保持装置１０７から、対応する合成音や画像のデータを受け取る。
【００６４】
受信端末１０９は、マルチメディアメール配信サーバ１１２から受信した画像データを表示しつつ、同じくマルチメディアメール配信サーバ１１２から受信した合成音を再生し、送信側ユーザの作成したマルチメディアメールの内容を受信側ユーザに示す（図１７参照）。
【００６５】
以上の手順に従って、マルチメディアメールの作成及び送受信を行うサービスが実現できる。
【００６６】
なお、上記２）で「いいえ」を選んだ場合、１）に戻る代わりに、送信端末１０８もしくはキャラクタサーバ１１１上に用意された、キャラクタに依存しない汎用の入力変換辞書を使用するようにしてもよい。また、ユーザに確認を求めず、１）で選択されたキャラクタに対応する入力変換辞書を、自動でダウンロードするようにしてもよい。
【００６７】
同様に、上記６）でもユーザによる選択を要求せず、５）で作成されたソート済みリストで最適とされたものを自動で選択するようにしても良い。
【００６８】
同様に、上記８）でもユーザによる選択を要求せず、７）で作成されたソート済みリストで最適とされたものを自動で選択するようにしても良い。
【００６９】
また、上記５）で、類似度の尺度としてユークリッド距離の代わりに別のものを用いても良い。例えば、ユークリッド距離のｌｏｇ値を用いてもよいし、各パラメータに対して重みｗ_ｉを設定して、
【数２】

を類似度の尺度として用いても良い。
【００７０】
また、上記７）では合成音の作成に使用したキャラクタと各画像のキャラクタとの間の類似度を用いてリストのソートを行っているが、同時にテキストの入力に使用した入力変換辞書のキャラクタを用いても良い。即ち、ある画像のキャラクタと、事前に合成音の作成に使用したキャラクタ間の類似度をＤ_ｖ、同じ画像のキャラクタと、事前にテキストの入力に使用した入力変換辞書のキャラクタ間の類似度Ｄ_ｄをとすると、例えばＤ_ｖ＋Ｄ_ｄを、事前の選択内容とこの画像のキャラクタの間の類似度として用いることができる。
【００７１】
（第２の実施形態）
第１の実施形態に記載の発明の機能を、マルチメディアメール配信サーバ１１２を用意することなく実現する構成を図１８に示す。この構成では、上記第１の実施形態に記載の構成と比較して、キャラクタサーバ１１１にかかる負荷が大きくなるが、キャラクタサーバとは別にマルチメディアメール配信サーバ１１２を用意する必要が無く、また受信端末１０９に送信する合成音や画像を合成音保持装置１０６や画像保持装置１０７に保存しておく必要が無いため、送信側ユーザの作成するメールを受信側ユーザに配信する際に、サーバ側で用意する記憶容量が小さくて済むという利点がある。
【００７２】
以下、図１８の機器構成で提供されるサービスの動作手順を説明する。
１）〜９）は、上記第１の実施形態と同様の手順であるため省略する。
１０）送信端末１０８が、キャラクタサーバ１１１のキャラクタ選択機１００において、送信側ユーザが選択した声質データ及び画像データを指定するためのＵＲＬを作成する。例えば、送信側ユーザが選択した声質データ「男性１」を指定するためのラベル文字列として「１２３」が、画像データ「男爵１」を指定するためのラベル文字列として「ｘｙｚ」が与えられており、マルチメディアメール配信サーバ１１２のインターネットアドレスが「ｍｕｌｔｉｍｅｄｉａ−ｍａｉｌ．ｃｏｍ」であれば、「ｈｔｔｐ：／／ｍｕｌｔｉｍｅｄｉａ−ｍａｉｌ．ｃｏｍ／１２３＋ｘｙｚ」というＵＲＬを作成する。さらに、合成音で喋らせるメールの本文を、このＵＲＬの後ろに追加して「ｈｔｔｐ：／／ｍｕｌｔｉｍｅｄｉａ−ｍａｉｌ．ｃｏｍ／１２３＋ｘｙｚ？麿でおじゃる。」とし、マルチメディアメールの本体とする。このとき、ＵＲＬに含めることが不可能な文字は、キャラクタサーバ１１１でデコードできる適当な方法でエンコードして記述する。
【００７３】
以上の操作を行った上で、「メールが来ています。下記をクリック！」という本文と、作成したＵＲＬが書かれた内容のメールを作成し、宛先を受信端末１０９として、メールサーバ１１０に送信する。
１１）メールサーバ１１０は、受信したメールに書かれた宛先に従って、このメールを受信端末１０９に送信し、受信端末１０９はメールの着信があった旨表示を行う（図１５参照）。受信側ユーザがこのメールを読み（図１６参照）、メールに書かれたＵＲＬを選択すると、受信端末１０９はキャラクタサーバ１１１にアクセスして、そのＵＲＬに対応するデータの送信を要求する。
【００７４】
ＵＲＬを受け取ったキャラクタサーバ１１１では、まずＵＲＬデコーダ２００がこのＵＲＬを解釈して、ＵＲＬがエンコードされていればそれをデコードした上で、声質データ及び画像データを指定するためのラベル文字列と、メール本文を表す文字列を切り離す。ＵＲＬデコーダ２００は次に、キャラクタ選択機１００を通して、ラベル文字列「１２３」に対応する声質データ「男性１」とラベル文字列「ｘｙｚ」に対応する画像データ「男爵１」を選択し、さらに音声合成エンジン１０５にメール本文の文字列「麿でおじゃる。」を渡して、マルチメディアメールのデータを作成し、受信端末１０９に送信する。
【００７５】
受信端末１０９は、キャラクタサーバ１１１から受信した画像データを表示しつつ、同じくキャラクタサーバ１１１から受信した合成音を再生し、送信側ユーザの作成したマルチメディアメールの内容を受信側ユーザに示す（図１７参照）。
【００７６】
（第３の実施形態）
上記第２の実施形態に記載の発明の機能を、受信端末１０９とキャラクタサーバ１１１との通信を行うことなく実現する構成を図１９に示す。この構成では、作成されるマルチメディアメールの閲覧に必要な全てのデータをメールサーバ１１０を通して送信するため、上記第２の実施形態に記載の構成と比較して、メールサーバ１１０にかかる負荷が大きくなるが、既に広く使用されている、電子メールへのファイル添付という形でマルチメディアメールを実現することができるため、サービスの実施が容易になるという利点がある。
【００７７】
以下、図１９の機器構成で提供されるサービスの動作手順を説明する。
１）〜９）は、上記第１および第２の実施形態と同様の手順であるため省略する。
１０）送信端末１０８が、作成されたメールの本文に、上記手順６）において取得した合成音と、手順８）において取得した画像を添付した形式のメールを作成する。メールはＲＦＣ２１１２に規定される、ＭＩＭＥ規格のマルチパートメッセージとして作成し、宛先を受信端末１０９として、メールサーバ１１０に送信する。
１１）メールサーバ１１０は、受信したメールに書かれた宛先に従って、このメールを受信端末１０９に送信し、受信端末１０９はメールの着信があった旨表示を行う（図１５参照）。受信側ユーザがこのメールを読むと、受信端末１０９はメールの構成を確認して、添付された画像と合成音のデータをデコードし、マルチメディアメールとして受信側ユーザに示す（図１７参照）。
【００７８】
（第４の実施形態）
第４の実施形態によるシステムの構成を図２０に示し、この構成で提供されるサービスの動作手順を以下に説明する。
１）〜９）は、上記第１〜第３の実施形態と同様の手順であるため省略する。
１０）ユーザに対し、上記手順にて作成されたコンテンツの保存を行うかどうかの問い合わせが行われる（図２１参照）。ユーザが「いいえ」を選択するとコンテンツの作成は中断され、ユーザが「はい」を選択するとコンテンツは送信端末１０８に保存され、アラーム表示やメールの着信表示などに使用することができるようになる。
【００７９】
（第５の実施形態）
上記第１〜第４の実施形態における、動作手順１）〜９）と類似の効果を得ることのできる、別の動作フローを図２２に示す。図４の動作フローとの相違点は、画像のキャラクタの選択と合成音のキャラクタの選択の順番が逆になっていることである。これにより、ステップ２２０３において画像のキャラクタのリストをソートする際、ユーザがどの合成音のキャラクタを選択したかという情報を用いることはできなくなるが、代わりにステップ２２０４において、ユーザがどの画像のキャラクタを選択したかという情報を利用して、合成音のキャラクタのリストをソートすることができる。
【００８０】
（第６の実施形態）
上記第１〜第４の実施形態における、動作手順１）〜９）と類似の効果を得ることのできる、別の動作フローを図２３に示す。図４の動作フローとの相違点は、テキストの入力にあたって、表現のスタイル選択とそれに伴う入力変換辞書のダウンロードを行わない点である。このため、以降のステップで表現スタイルとの類似度をソートに使用することはできない。代わりに、ユーザが入力したテキストを解析してこのテキストの雰囲気を特徴づけるパラメータセット（明るさ、渋さ、若さ、ノリの各パラメータ）を作成し、作成したパラメータセットを用いて類似度を算出することによりソートを行うことができる。パラメータセットの作成は、例えば以下のようにして行うことができる。
・入力されたテキスト内で、テキストの全文字数に対する「！」記号や顔文字記号の出現頻度をパーセンテージで計算し、それを「ノリ」パラメータの値とする。
・テキスト内の各文の末尾が「です・ます」調である頻度をパーセンテージで計算し、それを「渋さ」パラメータの値とする。
・テキストの全文字数に対する片仮名の出現頻度をパーセンテージで計算し、それを「若さ」パラメータの値とする。
・テキストの形態素解析を行って、テキスト内の全形態素数に対する、明るさをイメージさせる単語の出現頻度をパーセンテージで計算し、それを「明るさ」パラメータの値とする。なお、明るさをイメージさせる単語は、あらかじめ送信端末１０８の内部にリストを用意しておき、このリストと順次文字列マッチングを行うことによって、形態素解析された各単語が明るさをイメージさせる単語かどうかの判定を行う。
【００８１】
（第７の実施形態）
上記第１〜第４の実施形態における、動作手順１）〜９）と類似の効果を得ることのできる、別の動作フローを図２４に示す。図４の動作フローとの相違点は、図４におけるステップ２１００〜２１０４の処理が、図２４のフローではユーザの望む順番で行えることである。
【００８２】
図２４の動作フローはステップ２４００から開始し、ステップ２４０１において、メールの表現スタイル選択（ステップ２４０２）及び入力変換辞書のダウンロード（ステップ２４０３）、合成音の声質選択（ステップ２４０４）、画像の選択（ステップ２４０５）、テキストの入力（ステップ２４０６）、完成したマルチメディアメールの送信（ステップ２４０７）のどれを次に行うか、ユーザが選択することができる。ステップ２４０１における選択処理は、例えば図２５に示すようなメニュー画面を通じて行えばよい。なお、ステップ２４０７の処理を行うための、「メール送信」の選択項目は、合成音の声質選択と、画像の選択と、テキストの入力を全て完了しなければ選択できないものとする。
【００８３】
この方式の利点は、ユーザが行う必要のある各種選択・入力操作を、ユーザが望む順番で行うことができることである。ただし、操作の順番によって、ユーザに提示する画像や声質のキャラクタのリストをソートする際に使用できるデータベースが変化する。例えば、ステップ２４０５による画像の選択を行う前にステップ２４０４による声質の選択をユーザが行いたい場合、声質のキャラクタのリストをソートするために、ユーザが既に選択した画像のキャラクタと、声質のキャラクタの間の類似度を用いることはできない。この場合、画像のキャラクタと声質のキャラクタの間の類似度は用いずにソートを行う。なお、ソートを行うために使用できる、既に選択されたキャラクタや入力されたテキストが無い場合は、キャラクタ名を文字コード順にソートしてユーザに提示すればよい。
【００８４】
【発明の効果】
以上のように本発明によれば、ユーザが希望するキャラクタに合った声質や画像の選択を容易にし、さらにユーザの書く文章を、ユーザが希望するキャラクタに合った文体に誘導できる。これにより、携帯電話でマルチメディアコンテンツの作成を行うユーザの負担を軽減し、さらに声質や画像、文体のキャラクタが一致したコンテンツの作成を容易にできる。
【図面の簡単な説明】
【図１】第１の実施形態によるシステムの概略構成を示す図である。
【図２】各声質に対するパラメータ設定表の一例である。
【図３】各キャラクタ名（表現スタイル）に対するパラメータ設定表の一例である。
【図４】図１に示したシステムの動作フロー概略図である。
【図５】表現のスタイル選択画面の一例である。
【図６】変換辞書ダウンロード確認画面の一例である。
【図７】メール本文仮名入力画面の一例である。
【図８】メール本文仮名漢字変換画面の一例である。
【図９】メール本文入力完了確認画面の一例である。
【図１０】合成音声質候補選択画面の一例である。
【図１１】合成音試聴画面の一例である。
【図１２】画像候補選択画面の一例である。
【図１３】画像確認画面の一例である。
【図１４】送信先メールアドレス入力画面の一例である。
【図１５】メール着信報知画面の一例である。
【図１６】着信メール本文表示画面の一例である。
【図１７】マルチメディアメール再生画面の一例である。
【図１８】第２の実施形態によるシステムの概略構成を示す図である。
【図１９】第３の実施形態によるシステムの概略構成を示す図である。
【図２０】第４の実施形態によるシステムの概略構成を示す図である。
【図２１】マルチメディアコンテンツダウンロード確認画面の一例である。
【図２２】第５の実施形態の動作フロー概略図である。
【図２３】第６の実施形態の動作フロー概略図である。
【図２４】第７の実施形態の動作フロー概略図である。
【図２５】設定項目選択メニュー画面の一例である。
【符号の説明】
１００：キャラクタ選択機
１０１：音声パラメータデータベース
１０２：入力変換辞書データベース
１０３：画像データベース
１０４：表現スタイルデータベース
１０５：音声合成エンジン
１０６：合成音保持装置
１０７：画像保持装置
１０８：送信端末
１０９：受信端末
１１０：メールサーバ
１１１：キャラクタサーバ
１１２：マルチメディアメール配信サーバ
２００：ＵＲＬデコーダ

Claims

第１の記憶部と、選択部とを備え、
前記第１の記憶部は、
複数の第１の情報と、
前記複数の第１の情報に対応づけられた複数の第１のパラメータセットとを記憶し、
前記複数の第１のパラメータセットの各々は、
対応する第１の情報の雰囲気を特徴づけるものであり、
前記選択部は、
第２の情報の雰囲気を特徴づける第２のパラメータセットと前記複数の第１のパラメータセットの各々とを用いて前記第２の情報と前記複数の第１の情報の各々との類似度を算出し、得られた類似度に基づいて前記複数の第１の情報のうち少なくとも１つを選択する、
ことを特徴とする情報処理装置。
請求項１において、
前記複数の第１のパラメータセットの各々は、
対応する第１の情報の雰囲気を表すための複数の要素に対して設定された複数の数値データを含み、
前記第２のパラメータセットは、
前記第２の情報の雰囲気を表すための複数の要素に対して設定された複数の数値データを含む、
ことを特徴とする情報処理装置。
請求項１において、
前記選択部は、
前記第２の情報の内容を解析して前記第２のパラメータセットを生成する、
ことを特徴とする情報処理装置。
請求項１において、
第２の記憶部をさらに備え、
前記第２の記憶部は、
複数の第２の情報と、
前記複数の第２の情報に対応づけられた複数の第２のパラメータセットとを記憶し、
前記複数の第２のパラメータセットの各々は、
対応する第２の情報の雰囲気を特徴づけるものであり、
前記選択部は、
前記複数の第２の情報のうちのある１つ（以下、「第２の情報Ａ」という。）に対応する第２のパラメータセットと前記複数の第１のパラメータセットの各々とを用いて前記第２の情報Ａと前記複数の第１の情報の各々との類似度を算出する、
ことを特徴とする情報処理装置。
請求項４において、
前記複数の第２のパラメータセットの各々は、
対応する第２の情報の雰囲気を表すための複数の要素に対して設定された複数の数値データを含む、
ことを特徴とする情報処理装置。
請求項４において、
前記選択部は、
前記第２の情報Ａをユーザに選択させる、
ことを特徴とする情報処理装置。
請求項１において、
前記選択部は、
得られた類似度に基づいて選択した第１の情報のうち１つをユーザに選択させる、
ことを特徴とする情報処理装置。
請求項１〜７のいずれか１つにおいて、
前記第１および第２の情報は、マルチメディアコンテンツを作成するために用いられる情報である、
ことを特徴とする情報処理装置。
請求項８において、
前記第１および／または第２の情報は、前記マルチメディアコンテンツの構成要素である、
ことを特徴とする情報処理装置。
請求項８において、
前記第１および／または第２の情報は、前記マルチメディアコンテンツのある構成要素の雰囲気を制御するものである、
ことを特徴とする情報処理装置。
請求項８において、
前記第１または第２の情報は、前記マルチメディアコンテンツ全体に与えるべき雰囲気を示すものである、
ことを特徴とする情報処理装置。
請求項１において、
与えられたテキストを音声データに変換する音声合成部をさらに備え、
前記複数の第１の情報の各々は、
前記音声合成部によって生成される音声データの声質を特徴づけるデータ（声質データ）であり、
前記音声合成部は、
前記選択部によって選択された声質データを用いて前記テキストを音声データに変換する、
ことを特徴とする情報処理装置。
請求項１において、
前記複数の第１の情報の各々は画像データである、
ことを特徴とする情報処理装置。
請求項１において、
前記複数の第１の情報の各々は表現スタイルである、
ことを特徴とする情報処理装置。
請求項１において、
前記複数の第１の情報の各々は、
あるキャラクタ性を持たせた文章を入力するのに適した入力変換辞書であり、
前記情報処理装置は、
前記選択部によって選択された入力変換辞書を用いてユーザにテキストを入力させる、
ことを特徴とする情報処理装置。
請求項１２、１３、１５のいずれか１つにおいて、
前記第２の情報は表現スタイルである、
ことを特徴とする情報処理装置。
請求項１２、１４、１５のいずれか１つにおいて、
前記第２の情報は画像データである、
ことを特徴とする情報処理装置。
請求項１２において、
前記第２の情報は、
あるキャラクタ性を持たせた文章を入力するのに適した入力変換辞書であり、
前記音声合成部には、
前記入力変換辞書を用いて入力されたテキストが与えられる、
ことを特徴とする情報処理装置。
請求項１３において、
前記第２の情報は、
あるキャラクタ性を持たせた文章を入力するのに適した入力変換辞書であり、
前記情報処理装置は、
前記入力変換辞書を用いてユーザにテキストを入力させる、
ことを特徴とする情報処理装置。
請求項１３または１４において、
与えられたテキストを音声データに変換する音声合成部をさらに備え、
前記第２の情報は、
前記音声合成部によって生成される音声データの声質を特徴づけるデータ（声質データ）であり、
前記音声合成部は、
前記声質データを用いて前記テキストを音声データに変換する、
ことを特徴とする情報処理装置。
請求項１５において、
前記選択部によって選択された入力変換辞書を用いて入力されたテキストを音声データに変換する音声合成部をさらに備え、
前記第２の情報は、
前記音声合成部によって生成される音声データの声質を特徴づけるデータ（声質データ）であり、
前記音声合成部は、
前記声質データを用いて前記テキストを音声データに変換する、
ことを特徴とする情報処理装置。
複数の第１の情報と複数の第１のパラメータセットとを対応づけるステップ（ａ）と、
第２の情報の雰囲気を特徴づける第２のパラメータセットと前記複数の第１のパラメータセットの各々とを用いて前記第２の情報と前記複数の第１の情報の各々との類似度を算出するステップ（ｂ）と、
前記ステップ（ｂ）によって得られた類似度に基づいて前記複数の第１の情報のうち少なくとも１つを選択するステップ（ｃ）とを備え、
前記複数の第１のパラメータセットの各々は、
対応する第１の情報の雰囲気を特徴づけるものである、
ことを特徴とする情報処理方法。
請求項２２において、
前記複数の第１のパラメータセットの各々は、
対応する第１の情報の雰囲気を表すための複数の要素に対して設定された複数の数値データを含み、
前記第２のパラメータセットは、
前記第２の情報の雰囲気を表すための複数の要素に対して設定された複数の数値データを含む、
ことを特徴とする情報処理方法。
請求項２２において、
前記第２の情報の内容を解析して前記第２のパラメータセットを生成するステップ（ｄ）をさらに備える、
ことを特徴とする情報処理方法。
請求項２２において、
複数の第２の情報と複数の第２のパラメータセットとを対応づけるステップ（ｅ）をさらに備え、
前記複数の第２のパラメータセットの各々は、
対応する第２の情報の雰囲気を特徴づけるものであり、
前記ステップ（ｂ）では、
前記複数の第２の情報のうちのある１つ（以下、「第２の情報Ａ」という。）に対応する第２のパラメータセットと前記複数の第１のパラメータセットの各々とを用いて前記第２の情報Ａと前記複数の第１の情報の各々との類似度を算出する、
ことを特徴とする情報処理方法。
請求項２５において、
前記複数の第２のパラメータセットの各々は、
対応する第２の情報の雰囲気を表すための複数の要素に対して設定された複数の数値データを含む、
ことを特徴とする情報処理方法。
請求項２５において、
前記第２の情報Ａをユーザに選択させるステップ（ｆ）をさらに備える、
ことを特徴とする情報処理方法。
請求項２２において、
前記ステップ（ｃ）によって選択された第１の情報のうち１つをユーザに選択させるステップ（ｇ）をさらに備える、
ことを特徴とする情報処理方法。