JP2000250574A - コンテンツ選択システム、コンテンツ選択クライアント、コンテンツ選択サーバ及びコンテンツ選択方法 - Google Patents

コンテンツ選択システム、コンテンツ選択クライアント、コンテンツ選択サーバ及びコンテンツ選択方法

Info

Publication number
JP2000250574A
JP2000250574A JP11056107A JP5610799A JP2000250574A JP 2000250574 A JP2000250574 A JP 2000250574A JP 11056107 A JP11056107 A JP 11056107A JP 5610799 A JP5610799 A JP 5610799A JP 2000250574 A JP2000250574 A JP 2000250574A
Authority
JP
Japan
Prior art keywords
information
server
content selection
voice
creation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP11056107A
Other languages
English (en)
Inventor
Fukuji Sudo
福治 須藤
Makoto Akaha
誠 赤羽
Toshitada Doi
利忠 土井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP11056107A priority Critical patent/JP2000250574A/ja
Priority to US09/674,576 priority patent/US7197455B1/en
Priority to PCT/JP2000/001304 priority patent/WO2000052913A1/ja
Publication of JP2000250574A publication Critical patent/JP2000250574A/ja
Abandoned legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/428Arrangements for placing incoming calls on hold
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Abstract

(57)【要約】 【課題】 クライアントのマイク等に音声情報を入力す
ることにより、サーバからネットワークを介してクライ
アントが受信して出力した複数の項目であるコンテンツ
の中からどのコンテンツを取得したいのかを操作者に選
択させるようにする。 【解決手段】 入力された音声情報をネットワークを介
してサーバシステム3に送信する通信部2dと、サーバ
システム3からネットワークを介してコンテンツ選択用
情報を受信して出力する出力部2bとを備えるクライア
ント2と、各コンテンツに関する1又は2以上の作成情
報を各コンテンツごとに記憶する作成情報記憶部9b
と、クライアント2からネットワークを介して受信した
音声情報と作成情報とに基づいてコンテンツ選択用情報
を作成し、この作成されたコンテンツ選択用情報をクラ
イアント2にネットワークを介して送信する情報作成サ
ーバ7とを備えるサーバシステム3とを用いる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、クライアントのマ
イク等に音声情報を入力することにより、サーバからネ
ットワークを介してクライアントが受信して出力した複
数の項目からなるコンテンツのリストの中から、どのコ
ンテンツを取得したいのかを操作者に選択させるコンテ
ンツ選択システム、コンテンツ選択クライアント、コン
テンツ選択サーバ及びコンテンツ選択方法に関するもの
である。
【0002】
【従来の技術】近年、携帯性が重視される例えば携帯電
話等の携帯端末が広く用いられており、携帯性の向上の
ために携帯端末の軽量化及び小型化が望まれている。携
帯端末は、小型化に伴って、キーボード等の入力装置を
小さくする又は無くす必要がある。そこで、携帯端末に
おいては、従来の入力装置に比べて比較的場所をとらな
い音声認識装置が注目を集めている。即ち、携帯端末
は、音声認識装置を用いることにより端末自身を小型化
できるだけでなく、利用者の利便性を更に向上させるこ
とができる。
【0003】また、サーバ側とクライアント側との間で
構築されるコンテンツ選択システムにおいては、音声等
のデータ圧縮技術や放送/通信分野でのディジタル信号
処理技術の発達により、所謂Music On Dem
and(以下、MODという。)等の音声情報を提供す
るサービスが実現されている。
【0004】
【発明が解決しようとする課題】しかしながら、入力さ
れた情報を認識する手段として音声認識装置を携帯端末
に用いた場合、音声認識の誤りをなくすことは非常に困
難である。しかも、従来の音声認識装置における入力さ
れた音声情報を正確に認識できる確率は、あまり高くは
ない。
【0005】また、MODサービスにおいて、提供して
もらいたい音楽等を指定するために入力された音声情報
について音声認識装置が誤認識した場合には、ユーザ
は、また同じ音声情報を音声認識装置に入力しなければ
ならない。しかも、音声認識装置が次にユーザが入力す
る音声情報を正確に音声認識できるとは限らないので、
ユーザは、何度か同じ音声情報を音声認識装置に入力し
なければならなくなることもあり、こういう場合には非
常に不便である。
【0006】さらに、ユーザがいくつかの音声情報を音
声認識装置に入力することにより提供してもらいたい音
楽等を指定した場合に、この入力された音声情報の条件
に当てはまる音楽等が複数存在するときがある。このよ
うなときに、ユーザが提供されることを要求している音
楽等を特定する方法は、非常に難しい。
【0007】そこで、本発明は、このような実情に鑑み
てなされたものであり、クライアントのマイク等に音声
情報を入力することにより、サーバからネットワークを
介してクライアントが受信して出力した複数の項目であ
るコンテンツの中からどのコンテンツを取得したいのか
を操作者に選択させるコンテンツ選択システム、コンテ
ンツ選択クライアント、コンテンツ選択サーバ及びコン
テンツ選択方法を提供することを目的とするものであ
る。
【0008】
【課題を解決するための手段】上述の目的を達成するた
めに、本発明に係るコンテンツ選択システムは、サーバ
がネットワークを介してクライアントにコンテンツを選
択させるためのコンテンツ選択用情報を送信するコンテ
ンツ選択システムにおいて、上記クライアントは、入力
された音声情報を上記ネットワークを介して上記サーバ
に送信する入力情報送信手段と、上記サーバから上記ネ
ットワークを介して上記コンテンツ選択用情報を受信し
て出力する出力手段とを備え、上記サーバは、各コンテ
ンツに関する1又は2以上の作成情報を各コンテンツご
とに記憶する作成情報記憶手段と、上記クライアントか
ら上記ネットワークを介して受信した音声情報と上記作
成情報とに基づいて上記コンテンツ選択用情報を作成す
るコンテンツ選択用情報作成手段と、このコンテンツ選
択用情報作成手段により作成された上記コンテンツ選択
用情報を上記クライアントにネットワークを介して送信
するコンテンツ選択用情報送信手段とを備えることを特
徴とする。
【0009】このコンテンツ選択システムでは、クライ
アントは、入力された音声情報をネットワークを介して
サーバに送信し、サーバは、クライアントからネットワ
ークを介して受信した音声情報と作成情報とに基づいて
コンテンツ選択用情報を作成して、この作成されたコン
テンツ選択用情報をクライアントにネットワークを介し
て送信する。
【0010】また、本発明に係るコンテンツ選択クライ
アントは、サーバからネットワークを介して送信された
コンテンツを選択させるためのコンテンツ選択用情報を
出力するコンテンツ選択クライアントにおいて、入力さ
れた音声情報を上記ネットワークを介して上記サーバに
送信する入力情報送信手段と、上記サーバから上記ネッ
トワークを介して上記コンテンツ選択用情報を受信して
出力する出力手段とを備えることを特徴とする。
【0011】このコンテンツ選択クライアントでは、入
力された音声情報をネットワークを介してサーバに送信
し、また、サーバからネットワークを介してコンテンツ
選択用情報を受信して出力する。
【0012】さらに、本発明に係るコンテンツ選択サー
バは、各コンテンツに関する1又は2以上の作成情報を
各コンテンツごとに記憶する作成情報記憶手段と、クラ
イアントからネットワークを介して受信した音声情報と
上記作成情報とに基づいて上記コンテンツを選択するた
めのコンテンツ選択用情報を作成するコンテンツ選択用
情報作成手段と、このコンテンツ選択用情報作成手段に
より作成された上記コンテンツ選択用情報を上記クライ
アントにネットワークを介して送信するコンテンツ選択
用情報送信手段とを備えることを特徴とする。
【0013】このコンテンツ選択サーバでは、各コンテ
ンツに関する1又は2以上の作成情報を各コンテンツご
とに記憶し、クライアントからネットワークを介して受
信した音声情報と作成情報とに基づいてコンテンツを選
択するためのコンテンツ選択用情報を作成して、この作
成されたコンテンツ選択用情報をクライアントにネット
ワークを介して送信する。
【0014】さらにまた、本発明に係るコンテンツ選択
方法は、サーバは、各コンテンツに関する1又は2以上
の作成情報をこの各コンテンツごとに記憶し、クライア
ントは、入力された音声情報をネットワークを介して上
記サーバに送信し、上記サーバは、上記クライアントか
ら上記ネットワークを介して受信した音声情報と上記作
成情報とに基づいて上記コンテンツを選択するためのコ
ンテンツ選択用情報を作成し、この作成されたコンテン
ツ選択用情報を上記クライアントにネットワークを介し
て送信し、上記クライアントは、上記サーバから上記ネ
ットワークを介して上記コンテンツ選択用情報を受信
し、このコンテンツ選択用情報に基づいて選択すること
を要求するコンテンツ選択要求情報を出力することを特
徴とする。
【0015】このコンテンツ選択方法では、クライアン
トは、入力された音声情報をネットワークを介して上記
サーバに送信し、サーバは、クライアントからネットワ
ークを介して受信した音声情報と作成情報とに基づいて
コンテンツを選択するためのコンテンツ選択用情報を作
成して、この作成されたコンテンツ選択用情報をクライ
アントにネットワークを介して送信する。そして、クラ
イアントは、サーバからネットワークを介してコンテン
ツ選択用情報を受信し、このコンテンツ選択用情報に基
づいて選択することを要求するコンテンツ選択要求情報
を出力する。
【0016】
【発明の実施の形態】以下、本発明を適用した実施の形
態について、図面を参照しながら説明する。本発明を適
用した実施の形態であるコンテンツ選択システムは、例
えば、International Multimed
ia Telecommunications−200
0(以下、IMT−2000という。)を用いたネット
ワークにおいて、所謂Music On Demand
(以下、MODという。)サービスを利用するための情
報提供システムの中で用いられるものである。本発明を
適用した実施の形態であるコンテンツ選択システムを図
1に示す。なお、IMT−2000とは、Intern
ational Telecommunication
Union(ITU)が、21世紀のディジタル携帯
電話等に採用する通信方式をいう。
【0017】この図1に示すように、コンテンツ選択シ
ステム1は、例えば通信機能を備えるPersonal
Digital Assistant(以下、PDA
という。)であるクライアント2と、各種サーバを備え
るサーバシステム3と、例えばIMT−2000を介し
てクライアント2とサーバシステム3との間の無線回線
の設定や制御を行う無線設備である公衆用基地局(以
下、基地局という。)4とを備える。
【0018】クライアント2は、ユーザが入力した例え
ば音声情報を処理する入力部2aと、コンテンツとこの
コンテンツを選択するためのコンテンツ選択用情報等を
出力する出力部2bと、サーバシステム3から受信した
コンテンツ選択用情報等を記憶するクライアント用記憶
部2cと、サーバシステム3との接続を確立するための
接続処理及びクライアント2が用いる通信方式に従った
通信処理を行う通信部2dと、上記入力部2aと出力部
2bとクライアント用記憶部2cと通信部2dの各処理
部の機能を制御する制御部2eとを有する。
【0019】ここで、コンテンツ選択用情報とは、サー
バシステム3からクライアント2に送信する候補となる
いくつかのコンテンツに関する情報が項目ごとに示され
たリスト等をいう。
【0020】入力部2aは、例えばマイク等の音声入力
装置により構成される。この入力部2aのマイク等は、
例えば、ユーザが聴くことを希望する音楽情報であるコ
ンテンツ(以下、音楽コンテンツという。)等をサーバ
システム3から送信してもらうために、ユーザが入力し
た音声情報を制御部2eに供給する。なお、入力部2a
は、例えばキーボードやジョグダイアル等の音声以外の
入力装置により構成されていてもよい。
【0021】出力部2bは、例えばスピーカ等の音声出
力装置により構成される。この出力部2bのスピーカ等
は、例えば、サーバシステム3から後述する通信部2d
と制御部2eとを介して送信されてきた音楽コンテンツ
等を再生する。
【0022】なお、出力部2bは、例えば、液晶ディス
プレイのような表示デバイスにより構成されていてもよ
い。また、出力部2bは、例えばInstitute
ofElectrical and Electron
ics Engineers 1394(以下、IEE
E1394という。)端子などのディジタル出力端子を
備えることにより、サーバシステム3から受信した音楽
コンテンツ等のコンテンツを外部端子に出力してもよ
い。さらに、出力部2bは、サーバシステム3から基地
局4を介して受信した、例えば、歌詞、楽譜、作詞者、
作曲者、編曲者、収録アルバム、発売日等のコンテンツ
に付随する情報を、音声情報としてスピーカ等から又は
映像情報として液晶ディスプレイ等から出力してもよ
い。または、出力部2bは、サーバシステム3から受信
した音楽コンテンツ等のコンテンツを再生中に、このコ
ンテンツに付随する情報を液晶ディスプレイ等に表示し
てもよい。
【0023】クライアント用記憶部2cは、例えば、メ
モリーカード、Mini Disk(以下、MDとい
う。)、Digital Audio Taperec
order(以下、DATという。)等のクライアント
2から取り外し可能、又はフラッシュメモリやハードデ
ィスク等のクライアント2から取り外し不可能な記憶装
置により構成される。このクライアント用記憶部2c
は、サーバシステム3から通信部2dと制御部2eとを
介して送信されてきた例えば音楽コンテンツや音楽コン
テンツのリスト等のコンテンツ情報を記憶する。また、
クライアント用記憶部2cは、各クライアント2が有す
る個別の例えばIMT−2000用のユーザID等を記
憶し、制御部2eからの制御信号に基づいて制御部2e
と通信部2dとを介してサーバシステム3にこのユーザ
ID等を送信する。
【0024】通信部2dは、例えば、べースバンド部や
Radio Frequency(以下、RFとい
う。)部により構成される。この通信部2dは、制御部
2eから供給された入力音声情報をサーバシステム3に
送信したり、サーバシステム3からコンテンツ選択用情
報等を受信し、この受信したコンテンツ選択用情報等を
制御部2eに供給したりする。
【0025】制御部2eは、例えばCPUにより構成さ
れる。この制御部2eは、例えば、サーバシステム3か
ら基地局4を介してコンテンツ選択用情報等を受信する
ための制御プログラムを備えており、この制御プログラ
ムを実行することにより出力部2b、通信部2d及びク
ライアント用記憶部2cの制御を行う。なお、制御部2
eは、入力部2aと接続されており、この入力部2aか
ら入力される音声情報等に基づいて上記制御プログラム
における各制御を行う。
【0026】サーバシステム3は、例えば、クライアン
ト2から受信した入力音声情報について音声認識を行う
音声認識サーバ5と、この音声認識サーバ5が認識した
入力音声情報に基づいてクライアント2との接続認証処
理等を行う認証サーバ6と、音声認識サーバ5が認識し
た入力音声情報と後述する作成情報とに基づいてコンテ
ンツ選択用情報を作成するコンテンツ選択用情報作成サ
ーバ(以下、情報作成サーバという。)7と、このコン
テンツ選択用情報に基づいてユーザが選択したコンテン
ツをクライアント2に送信する情報提供サーバ8と、ク
ライアント2に送信するコンテンツ等を記憶するデータ
ベース9とを有する。
【0027】音声認識サーバ5は、クライアント2の通
信部2dから基地局4を介して受信した情報が音声情報
である場合に、図示しない音響分析部、音響モデル及び
言語モデル等に基づいて受信した音声情報の音声認識を
行う。そして、音声認識サーバ5は、この音声認識を行
った結果である音声情報(以下、認識音声情報とい
う。)を後述する認証サーバ6や選択サーバ7に供給す
る。なお、音声認識サーバ5は、例えば音声認識を行っ
た結果が正確であるか否かをユーザに確認してもらうた
めに、認識音声情報をクライアント2に送信してもよ
い。
【0028】ここで、音響分析部とは、入力音声情報に
対して音響的な特徴量系列の抽出を行う処理部をいう。
また、音響モデルとは、この音響分析部で抽出された個
々の特徴量との音響的な類似性の評価を行うための評価
式を用いて、音声の部分的或いは全体的な特徴量系列の
パターンとの類似性の評価を行うための情報をいう。さ
らに、言語モデルとは、音響モデルの接続に関する制約
を与えるための情報をいう。
【0029】認証サーバ6は、音声認識サーバ5から供
給された認識音声情報等に基づいて、例えば、Remo
te Authentication Dial In
User Servise(以下、RADIUSとい
う。)を用いたクライアント2への認証処理を行う。ま
た、認証サーバ6は、音声認識サーバ5から供給された
認識音声情報等に基づいて、例えば、Point to
Point Protoco1(以下、PPPとい
う。)等を用いたクライアント2からの接続処理を行
う。
【0030】ここで、RADIUSとは、ダイアルイン
のためのモデムを備えたネットワーク・アクセス・サー
バに接続するというダイアルインのユーザの認証を行う
ダイアルアップ接続ユーザ認証システムをいう。また、
PPPとは、公衆電話回線などでインターネットヘ接続
するためのプロトコルをいう。
【0031】情報作成サーバ7は、音声認識サーバ5か
ら供給された認識音声情報と、後述するデータベース9
の作成情報記憶部9bから取得した作成情報とに基づい
て、コンテンツ選択用情報を作成する。即ち、情報作成
サーバ7は、後述するコンテンツ選択用情報の作成方法
の中からいくつかの作成方法を用いることによりコンテ
ンツ選択用情報を作成する。そして、情報作成サーバ7
は、作成したコンテンツ選択用情報をクライアント2に
送信し、ユーザにサーバシステム3から提供してもらい
たいコンテンツを入力部2aを用いることにより選択し
てもらう。
【0032】情報提供サーバ8は、クライアント2が情
報作成サーバ7から受信したコンテンツ選択用情報に基
づいてユーザが選択した音楽コンテンツ等に関する情報
をクライアント2から受信することにより、クライアン
ト2に送信する音楽コンテンツ等をコンテンツ情報記憶
部9cから取得してクライアント2に送信する。
【0033】データベース9は、例えばユーザIDとパ
スワード等の属性情報を記憶する属性情報記憶部9a
と、各コンテンツに関する1又は2以上の作成情報をこ
の各コンテンツごとに記憶する作成情報記憶部9bと、
クライアント2に送信するコンテンツ等を記憶するコン
テンツ情報記憶部9cとを有する。
【0034】なお、上述したサーバシステム3の各サー
バは、同一のサーバで構成してもよい。
【0035】以上のように構成されたコンテンツ選択シ
ステム1では、サーバシステム3は、クライアント2か
らコンテンツ選択用情報を作成するための入力音声情報
等を受信し、この入力音声情報等について音声認識を行
い、音声認識を行った入力音声情報である認識音声情報
と作成情報とに基づいてコンテンツ選択用情報を作成
し、この作成したコンテンツ選択用情報をクライアント
2に送信する。そして、クライアント2は、ユーザに聴
くことを希望する音楽コンテンツ等を選択させ、この選
択した音楽コンテンツ等に関する情報をサーバシステム
3に送信する。サーバシステム3は、クライアント2か
ら受信した音楽コンテンツ等に関する情報に基づいてコ
ンテンツ情報記憶部9cからユーザが選択した音楽コン
テンツ等をクライアント2に送信する。クライアント2
は、この送信された音楽コンテンツ等を出力部2bのス
ピーカ等を用いて再生する。
【0036】つぎに、コンテンツ選択システム1を用い
た情報提供システムにおいて、サーバシステム3がクラ
イアント2に音楽コンテンツ等を提供するMODサービ
スが開始されてから終了するまでの一連の処理につい
て、具体的な音楽コンテンツ等の選択方法を用いた一例
を、図2に示すフローチャートに従って説明する。
【0037】この図2に示すフローチャートでは、例え
ば、IMT−2000用の端末であるクライアント2
は、IMT−2000のデータ回線を用いた基地局4を
介して、サーバシステム3に例えば電話をかける等して
予め接続要求を出している。その後、クライアント2
は、サーバシステム3との接続が確立する。即ち、この
図2に示すフローチャートでは、クライアント2とサー
バシステム3との接続が確立している状態から説明す
る。
【0038】まず、図2のステップS1において、ユー
ザがMODサービスを利用するためのサービス開始要求
情報を、クライアント2に備えられた入力部2aのマイ
ク等に音声で入力した場合に、制御部2eは、入力部2
aに入力された音声情報であるサービス開始要求情報
(以下、サービス開始要求音声情報という。)を、この
入力部2aから供給される。制御部2eは、入力部2a
から供給されたサービス開始要求音声情報を通信部2d
に供給する。通信部2dは、供給されたサービス開始要
求音声情報を基地局4を介してサーバシステム3の音声
認識サーバ5に送信する。
【0039】音声認識サーバ5は、通信部2dから基地
局4を介して受信したサービス開始要求音声情報につい
て、図示しない音響分析部、音響モデル及び言語モデル
等に基づき音声認識を行う。音声認識サーバ5は、この
音声認識を行った結果であるサービス開始要求音声情報
(以下、認識サービス開始要求音声情報という。)を認
証サーバ6に供給する。
【0040】認証サーバ6は、音声認識サーバ5から認
識サービス開始要求音声情報が供給されると、ユーザが
入力部2aに音声等でユーザIDとパスワードを入力す
ることを要求するユーザ認証要求情報をクライアント2
に送信する。ここで、このユーザIDとパスワードと
は、クライアント2を所有するユーザがMODサービス
を利用する権利を有するか否かを認証するための情報を
いう。
【0041】制御部2eは、認証サーバ6から通信部2
dを介して受信したユーザ認証要求情報を、出力部2b
のスピーカ等に音声として出力させる。
【0042】続いて、ステップS2において、ユーザが
出力部2bのスピーカ等から音声出力されたユーザ認証
要求情報に従って、入力部2aのマイク等にユーザID
とパスワードを音声で入力した場合に、制御部2eは、
入力部2aに入力された音声情報であるユーザIDとパ
スワードを、この入力部2aから供給される。制御部2
eは、入力部2aから供給されたユーザIDとパスワー
ドを通信部2dに供給する。通信部2dは、供給された
ユーザIDとパスワードを基地局4を介してサーバシス
テム3の音声認識サーバ5に送信する。
【0043】音声認識サーバ5は、通信部2dから基地
局4を介して受信したユーザIDとパスワードについて
音声認識を行う。音声認識サーバ5は、この音声認識を
行った結果であるユーザIDとパスワード(以下、認識
ユーザID・パスワードという。)を認証サーバ6に供
給する。
【0044】認証サーバ6は、データベース9の属性情
報記憶部9aからユーザIDとパスワードを取得し、こ
の取得したユーザIDとパスワードに基づいて音声認識
サーバ5から供給された認識ユーザID・パスワードの
認証処理を行う。
【0045】認証サーバ6は、この認証ができない場合
には、サービス開始不許可情報をクライアント2に送信
する。制御部2eは、認証サーバ6から通信部2dを介
して受信したサービス開始不許可情報に基づいて、MO
Dサービスが開始されない旨を、出力部2bのスピーカ
等に音声として出力させる。ユーザがこのMODサービ
スが開始されない旨をスピーカ等から聞いて、改めて入
力部2aのマイク等にユーザIDとパスワードを正確に
音声で入力した場合には、制御部2eは、入力部2aに
再度入力された音声情報であるユーザIDとパスワード
を、この入力部2aから供給される。
【0046】一方、認証サーバ6は、上述の認証ができ
た場合には、認証ができたことを知らせる認証成功情報
を情報作成サーバ7に供給する。情報作成サーバ7は、
この認証成功情報を認証サーバ6から供給された場合に
は、サービス開始許可情報と、ユーザに曲のタイトルを
入力するように要求するタイトル入力要求情報とをクラ
イアント2に送信する。制御部2eは、情報作成サーバ
7から通信部2dを介して受信したサービス開始許可情
報とタイトル入力要求情報とを、出力部2bのスピーカ
等に音声として出力させる。そして、処理は、ステップ
S3へ進む。
【0047】続いて、ステップS3において、ユーザが
サービス開始許可情報とタイトル入力要求情報とをスピ
ーカ等から聞いた後に、制御部2eは、ユーザが入力部
2aのマイク等にサーバシステム3から提供されること
を希望する曲のタイトル(以下、タイトルという。)を
音声で入力した音声情報(以下、タイトル音声情報とい
う。)を、この入力部2aから供給される。制御部2e
は、入力部2aから供給されたタイトル音声情報を通信
部2dに供給する。通信部2dは、供給されたタイトル
音声情報を基地局4を介してサーバシステム3の音声認
識サーバ5に送信する。
【0048】音声認識サーバ5は、通信部2dから基地
局4を介して受信したタイトル音声情報について音声認
識を行う。音声認識サーバ5は、この音声認識を行った
結果であるタイトル音声情報(以下、認識タイトル音声
情報という。)を情報作成サーバ7に供給する。
【0049】続いて、ステップS4において、情報作成
サーバ7は、音声認識サーバ5から供給された認識タイ
トル音声情報と、データベース9の作成情報記憶部9b
から取得した1又は2以上の各タイトルに関する作成情
報(以下、タイトル作成情報という。)とに基づいて、
サーバシステム3から提供されることを希望する曲に関
するコンテンツ選択用情報(以下、曲コンテンツ選択用
情報という。)を作成する。
【0050】具体的には、情報作成サーバ7は、音響的
な特徴量における、認識タイトル音声情報と、作成情報
記憶部9bに記憶されている情報提供システムで提供可
能な曲のタイトルに関する各タイトル作成情報との類似
性を、図示しない作成情報演算処理部を用いて演算す
る。この情報作成サーバ7は、作成情報記憶部9bに記
憶されている全ての各タイトル作成情報に対して、音響
的な特徴量における認識タイトル音声情報との類似性を
演算する。情報作成サーバ7は、この演算値が予め設定
された所定の閾値であるX(以下、閾値Xという。)を
越えたものを、ユーザがサーバシステム3から提供され
ることを希望する曲の候補になると判断する。
【0051】そして、演算値が閾値Xを越えたタイトル
作成情報に対応する曲の数が所定の定数であるN(以
下、定数Nという。)個未満である場合には、処理は、
ステップS8へ進む。
【0052】一方、演算値が閾値Xを越えたタイトル作
成情報に対応する曲の数が定数N個以上の場合には、情
報作成サーバ7は、候補となる曲の数を絞り込むため
に、ユーザに曲のパフォーマの名前を入力するように要
求するパフォーマ名入力要求情報をクライアント2に送
信する。制御部2eは、情報作成サーバ7から通信部2
dを介して受信したパフォーマ名入力要求情報を、出力
部2bのスピーカ等に音声として出力させる。そして、
処理は、ステップS5へ進む。
【0053】続いて、ステップS5において、ユーザが
パフォーマ名入力要求情報をスピーカ等から聞いた後
に、制御部2eは、ユーザが入力部2aのマイク等にサ
ーバシステム3から提供されることを希望する曲のパフ
ォーマの名前(以下、パフォーマ名という。)を音声で
入力した音声情報(以下、パフォーマ名音声情報とい
う。)を、この入力部2aから供給される。制御部2e
は、入力部2aから供給されたパフォーマ名音声情報を
通信部2dに供給する。通信部2dは、供給されたパフ
ォーマ名音声情報を基地局4を介してサーバシステム3
の音声認識サーバ5に送信する。
【0054】音声認識サーバ5は、通信部2dから基地
局4を介して受信したパフォーマ名音声情報について音
声認識を行う。音声認識サーバ5は、この音声認識を行
った結果であるパフォーマ名音声情報(以下、認識パフ
ォーマ名音声情報という。)を情報作成サーバ7に供給
する。
【0055】続いて、ステップS6において、情報作成
サーバ7は、音声認識サーバ5から供給された認識パフ
ォーマ名音声情報と、データベース9の作成情報記憶部
9bから取得した1又は2以上の各パフォーマ名に関す
る作成情報(以下、パフォーマ名作成情報という。)と
に基づいて、曲コンテンツ選択用情報を作成する。但
し、この場合のパフォーマ名作成情報とは、タイトルに
よる絞り込みで演算値が閾値Xを越えたものの中から取
得したパフォーマ名に関する作成情報のみをいう。従っ
て、作成情報記憶部9bは、予め、コンテンツである各
曲に関するタイトル、パフォーマ名、ジャンル等を記憶
している。
【0056】具体的には、情報作成サーバ7は、音響的
な特徴量における、認識パフォーマ名音声情報と、作成
情報記憶部9bに記憶されている情報提供システムで提
供可能な曲のパフォーマ名に関する各パフォーマ名作成
情報との類似性を、図示しない作成情報演算処理部を用
いて演算する。この情報作成サーバ7は、作成情報記憶
部9bに記憶されている全ての各パフォーマ名作成情報
に対して、音響的な特徴量における認識パフォーマ名音
声情報との類似性を演算する。情報作成サーバ7は、こ
の演算値が閾値Xを越えたものを、ユーザがサーバシス
テム3から提供されることを希望する曲の候補になると
判断する。
【0057】そして、演算値が閾値Xを越えたパフォー
マ名作成情報に対応する曲の数が定数N個未満である場
合、即ち、タイトル及びパフォーマ名の両方を用いた場
合における演算値が閾値Xを越えたタイトル作成情報及
びパフォーマ名作成情報に対応する曲の数が定数N個未
満であるときには、処理は、ステップS8へ進む。
【0058】一方、タイトル及びパフォーマ名の両方を
用いた場合における演算値が閾値Xを越えたパフォーマ
名作成情報に対応する曲の数が定数N個以上のときに
は、情報作成サーバ7は、候補となる曲の数を絞り込む
ために、ユーザに曲のジャンルを入力するように要求す
るジャンル入力要求情報をクライアント2に送信する。
制御部2eは、情報作成サーバ7から通信部2dを介し
て受信したジャンル入力要求情報を、出力部2bのスピ
ーカ等に音声として出力させる。そして、処理は、ステ
ップS7へ進む。
【0059】続いて、ステップS7において、ユーザが
ジャンル入力要求情報をスピーカ等から聞いた後に、制
御部2eは、ユーザが入力部2aのマイク等にサーバシ
ステム3から提供されることを希望する曲のジャンル
(以下、ジャンルという。)を音声で入力した音声情報
(以下、ジャンル音声情報という。)を、この入力部2
aから供給される。制御部2eは、入力部2aから供給
されたジャンル音声情報を通信部2dに供給する。通信
部2dは、供給されたジャンル音声情報を基地局4を介
してサーバシステム3の音声認識サーバ5に送信する。
【0060】音声認識サーバ5は、通信部2dから基地
局4を介して受信したジャンル音声情報について音声認
識を行う。音声認識サーバ5は、この音声認識を行った
結果であるジャンル音声情報(以下、認識ジャンル音声
情報という。)を情報作成サーバ7に供給する。
【0061】情報作成サーバ7は、音声認識サーバ5か
ら供給された認識ジャンル音声情報と、データベース9
の作成情報記憶部9bから取得した1又は2以上の各ジ
ャンルに関する作成情報(以下、ジャンル作成情報とい
う。)とに基づいて、曲コンテンツ選択用情報を作成す
る。但し、この場合のジャンル作成情報とは、タイトル
及びパフォーマ名による絞り込みで演算値が閾値Xを越
えたものの中から取得したジャンルに関する作成情報の
みをいう。
【0062】具体的には、情報作成サーバ7は、音響的
な特徴量における、認識ジャンル音声情報と、作成情報
記憶部9bに記憶されている情報提供システムで提供可
能な曲のジャンルに関する各ジャンル作成情報との類似
性を、図示しない作成情報演算処理部を用いて演算す
る。この情報作成サーバ7は、作成情報記憶部9bに記
憶されている全ての各ジャンル作成情報に対して、音響
的な特徴量における認識ジャンル音声情報との類似性を
演算する。情報作成サーバ7は、この演算値が閾値Xを
越えたものを、ユーザがサーバシステム3から提供され
ることを希望する曲の候補になると判断する。
【0063】そして、演算値が閾値Xを越えたジャンル
作成情報に対応する曲の数が定数N個以下である場合、
即ち、タイトル、パフォーマ名及びジャンルを用いた場
合における演算値が閾値Xを越えたタイトル作成情報、
パフォーマ名作成情報及びジャンル作成情報に対応する
曲の数が定数N個未満であるときには、処理は、ステッ
プS8へ進む。
【0064】一方、タイトル、パフォーマ名及びジャン
ルを用いた場合における演算値が閾値Xを越えたタイト
ル作成情報、パフォーマ名作成情報及びジャンル作成情
報に対応する曲の数が定数N個以上のときには、情報作
成サーバ7は、演算値がジャンル音声情報に最も類似し
ていたものから順にN個をクライアント2に送信する。
つまり、この場合も、処理は、ステップS8へ進む。
【0065】続いて、ステップS8において、演算値が
閾値Xを越えた上記作成情報に対応する曲の数が定数N
個以上の場合に、情報作成サーバ7が曲コンテンツ選択
用情報をクライアント2に送信したときには、制御部2
eは、情報作成サーバ7から通信部2dを介して受信し
た演算値がジャンル音声情報に最も類似していたものか
らの順番であるN個の曲コンテンツ選択用情報を、出力
部2bのスピーカ等に音声として出力させる。
【0066】この場合、制御部2eは、例えば、タイト
ルに関する演算値とパフォーマ名に関する演算値とジャ
ンルに関する演算値の平均等を利用して、入力された音
声情報により類似した曲から順番に並べられたN個の曲
のリスト等である曲コンテンツ選択用情報を、出力部2
bのスピーカ等に音声として出力させる。
【0067】一方、演算値が閾値Xを越えた上記作成情
報に対応する曲の数が定数N個未満である場合に、情報
作成サーバ7が曲コンテンツ選択用情報をクライアント
2に送信したときには、制御部2eは、情報作成サーバ
7から通信部2dを介して受信したN個以下の曲コンテ
ンツ選択用情報を、出力部2bのスピーカ等に音声とし
て出力させる。
【0068】この場合、制御部2eは、例えば、タイト
ルに関する演算値とパフォーマ名に関する演算値とジャ
ンルに関する演算値の平均等を利用して、入力された音
声情報により類似した曲から順番に並べられた曲のリス
ト等である曲コンテンツ選択用情報を、出力部2bのス
ピーカ等に音声として出力させる。
【0069】なお、この曲コンテンツ選択用情報とは、
例えば、曲の名前、曲の一部、パフォーマ名、タイアッ
プしているドラマの名前、その曲が放送された番組の名
前、曲の製作者の名前など、ユーザが入力した音声情報
に対する結果となり得るもの全ての情報をいう。また、
制御部2eは、この曲コンテンツ選択用情報を、例え
ば、液晶ディスプレイ等を用いて、テキスト情報、画像
情報等として出力部2bに出力させてもよい。
【0070】続いて、ステップS9において、ユーザが
曲コンテンツ選択用情報をスピーカ等から聞いた後に、
制御部2eは、この曲コンテンツ選択用情報である曲の
リストの中からユーザが選択した曲に関する情報を入力
部2aのマイク等に音声で入力された音声情報を、この
入力部2aから供給される。
【0071】具体的には、制御部2eは、例えば、曲コ
ンテンツ選択用情報である曲のリストの項目に割り振ら
れた番号を入力部2aに音声で入力された音声情報を、
この入力部2aから供給される。
【0072】また、制御部2eは、例えば、曲コンテン
ツ選択用情報である曲の名前を入力部2aに音声で入力
された音声情報を、この入力部2aから供給される。
【0073】さらに、制御部2eは、例えば、出力部2
bが曲コンテンツ選択用情報である曲のリストを順番に
音声で出力している場合で、現在、音声で出力されてい
る曲をユーザが選択したいときに、「この曲」や「O
K」等という言葉が入力部2aに音声で入力された音声
情報を、この入力部2aから供給される。この場合、入
力部2aは、キー入力装置やジョグダイアル等により構
成されていてもよい。
【0074】さらにまた、制御部2eは、例えば、出力
部2bが曲コンテンツ選択用情報である曲の一部分を順
番に再生している場合で、現在、再生している曲をユー
ザが選択したいときに、「この曲」や「OK」等という
言葉が入力部2aに音声で入力された音声情報を、この
入力部2aから供給される。この場合も、入力部2a
は、キー入力装置やジョグダイアル等により構成されて
いてもよい。
【0075】さらにまた、制御部2eは、例えば、予め
クライアント2がサーバシステム3からユーザの趣向に
あった曲のリストをダウンロードしてある場合に、その
曲のリストの中からユーザが選択した曲の名前が入力部
2aに音声で入力された音声情報を、この入力部2aか
ら供給される。このユーザの趣向にあった曲のリスト
は、ユーザが予め設定しておいてもよい。
【0076】以上の様な操作をされることにより、曲コ
ンテンツ選択用情報である曲のリスト等の中から、ユー
ザがサーバシステム3から提供されることを希望する曲
が選択される。
【0077】続いて、ステップS10において、制御部
2eは、入力部2aに入力されたユーザが曲のリストの
中から選択した曲に関する音声情報(以下、選択音声情
報という。)を、この入力部2aから供給される。制御
部2eは、入力部2aから供給された選択音声情報を通
信部2dに供給する。通信部2dは、供給された選択音
声情報を基地局4を介してサーバシステム3の音声認識
サーバ5に送信する。
【0078】音声認識サーバ5は、通信部2dから基地
局4を介して受信した選択音声情報について音声認識を
行う。音声認識サーバ5は、この音声認識を行った結果
である選択音声情報(以下、認識選択音声情報とい
う。)を、クライアント2に送信する。
【0079】制御部2eは、音声認識サーバ5から通信
部2dを介して受信した認識選択音声情報を、出力部2
bのスピーカ等に音声として出力させる。ユーザは、こ
の認識選択音声情報をスピーカ等から聞くことにより、
自分が選択した曲をサーバシステム3が正しく認識した
かどうか確認する。
【0080】続いて、ステップS11において、情報提
供サーバ8は、音声認識サーバ5から供給された認識選
択音声情報に基づき、クライアント2に送信する音楽等
のコンテンツをコンテンツ情報記憶部9cから取得して
クライアント2に送信する。
【0081】制御部2eは、情報提供サーバ8から通信
部2dを介して受信した音楽等のコンテンツを、出力部
2bのスピーカ等に再生させる。
【0082】続いて、ステップS12において、出力部
2bからのコンテンツの再生が終了し、ユーザが引き続
きMODサービスを利用する場合には、処理は、ステッ
プS3へ戻る。
【0083】一方、ユーザがMODサービスの利用を終
了するためのサービス終了要求情報を、入力部2aのマ
イク等に音声で入力した場合には、制御部2eは、入力
部2aに入力された音声情報であるサービス終了要求情
報(以下、サービス終了要求音声情報という。)を、こ
の入力部2aから供給される。制御部2eは、入力部2
aから供給されたサービス終了要求音声情報を通信部2
dに供給する。通信部2dは、供給されたサービス終了
要求音声情報を基地局4を介してサーバシステム3の音
声認識サーバ5に送信する。
【0084】音声認識サーバ5は、通信部2dから基地
局4を介して受信したサービス終了要求音声情報につい
て、図示しない音響分析部、音響モデル及び言語モデル
等に基づき音声認識を行う。音声認識サーバ5は、この
音声認識を行った結果であるサービス終了要求音声情報
(以下、認識サービス終了要求音声情報という。)を情
報作成サーバ7に供給する。
【0085】情報作成サーバ7は、音声認識サーバ5か
ら認識サービス終了要求音声情報が供給されると、サー
ビス終了許可情報をクライアント2に送信する。
【0086】制御部2eは、情報作成サーバ7から通信
部2dを介して受信したサービス終了許可情報を、制御
部2eのスピーカ等に音声として出力させる。
【0087】ユーザは、このサービス終了許可情報をス
ピーカ等から音声として聞くことによって、MODサー
ビスが終了したことを認識する。
【0088】以上のよう処理されることにより、ユーザ
は、サーバシステム3からMODサービスを受けること
ができる。
【0089】なお、上述した図2に示すフローチャート
を用いた一連の処理では、入力部2aは、音声で情報が
入力されるマイク等で構成されているが、例えばキー入
力されるキーボード等で構成されていてもよい。同様
に、出力部2bは、音声出力するスピーカ等で構成され
ているが、例えば、映像出力する液晶ディスプレイ等で
構成されていてもよい。また、出力部2bは、これらの
スピーカや液晶ディスプレイ等を用いて、映像及び音声
を同時に出力してもよい。
【0090】また、図2に示すフローチャートを用いた
一連の処理では、音声認識サーバ5は、認識音声情報を
直接認証サーバ6や情報作成サーバ7に供給している
が、例えば音声認識を行った結果が正確であるか否かを
ユーザに確認してもらうために、認識音声情報をクライ
アント2に送信してもよい。
【0091】そして、出力部2bが音声認識サーバ5か
ら受信してスピーカ等で音声出力した認識音声情報が間
違っていたとユーザが認識した場合に、制御部2eは、
例えば、「取り消し」や「やり直し」等の音声情報をユ
ーザが入力部2aに再度正確に入力し直した音声情報
を、この入力部2aから供給されてもよい。勿論、制御
部2eは、例えばユーザが「クリアキー」を押すことに
より、入力部2aに再度正確に情報等を入力し直した音
声情報を、この入力部2aから供給されてもよい。
【0092】さらに、図2に示すフローチャートを用い
た一連の処理では、ユーザがサービス開始要求情報を入
力部2aに音声で入力することによりサービスが開始さ
れているが、クライアント2がサーバシステム3に例え
ば電話をかける等して接続されたらサービスが開始され
るとしてもよい。
【0093】さらにまた、図2に示すフローチャートを
用いた一連の処理では、コンテンツ選択システム1を用
いた情報提供システムにおいてMODサービスを利用し
ている途中でこのサービスの利用を終了する場合、制御
部2eは、ネットワークとの接続の切断を命令する切断
音声情報をユーザが入力部2aに入力し直した音声情報
を、この入力部2aから供給されることにより、基地局
4を介したサーバシステム3との接続を切断してMOD
サービスを終了させてもよい。勿論、制御部2eは、例
えばユーザが入力部2aの図示しない「END−KE
Y」等を押すことにより、基地局4を介したサーバシス
テム3との接続を切断してMODサービスを終了させて
もよい。
【0094】さらにまた、図2に示すフローチャートの
ステップS2において、制御部2eは、ユーザが入力部
2aに音声で入力したユーザIDとパスワードとを、こ
の入力部2aから供給されてもよい。しかし、例えばI
MT−2000用のクライアント2の制御部2eは、ユ
ーザにより音声で入力部2aに入力されたパスワードの
みを、この入力部2aから供給されてもよい。IMT−
2000用の各クライアント2は、全て他のクライアン
ト2と違うユーザIDを予め保持しているからである。
【0095】つぎに、上述した曲コンテンツ選択用情報
の作成方法以外の作成方法を利用したコンテンツ選択シ
ステム1を用いた情報提供システムにおいて、MODサ
ービスが開始されてから修了するまでの一連の処理につ
いて、図3に示すフローチャートに従って説明する。こ
の処理は、上述した処理と異なり、次にどういう情報が
入力されればコンテンツ選択用情報を速く作成できるの
かをサーバシステム3側が判断し、その判断された情報
をユーザに入力させるものである。
【0096】この図3に示すフローチャートでは、例え
ば、IMT−2000用の端末であるクライアント2
は、IMT−2000のデータ回線を用いた基地局4を
介して、サーバシステム3に例えば電話をかける等して
予め接続要求を出している。その後、クライアント2
は、サーバシステム3との接続が確立する。即ち、この
図3に示すフローチャートでは、クライアント2とサー
バシステム3との接続が確立している状態から説明す
る。
【0097】なお、この図3に示す第2の実施の形態に
おける処理は、図2に示すフローチャートにおけるステ
ップS4からステップS8までの処理を、図3に示すフ
ローチャートにおけるステップS24からステップS3
3までの処理に換えたものである。
【0098】まず、図3のステップS21において、ユ
ーザがサービス開始要求情報を、クライアント2に備え
られた入力部2aのマイク等に音声で入力した場合に、
制御部2eは、入力部2aに入力されたサービス開始要
求音声情報を、この入力部2aから供給される。制御部
2eは、入力部2aから供給されたサービス開始要求音
声情報を通信部2dに供給する。通信部2dは、供給さ
れたサービス開始要求音声情報を基地局4を介してサー
バシステム3の音声認識サーバ5に送信する。
【0099】音声認識サーバ5は、通信部2dから基地
局4を介して受信したサービス開始要求音声情報につい
て、図示しない音響分析部、音響モデル及び言語モデル
等に基づき音声認識を行う。音声認識サーバ5は、この
音声認識を行った結果である認識サービス開始要求音声
情報を認証サーバ6に供給する。
【0100】認証サーバ6は、音声認識サーバ5から認
識サービス開始要求音声情報が供給されると、クライア
ント2を所有するユーザがMODサービスを利用する権
利を有するか否かを認証するためのユーザIDとパスワ
ードを、ユーザが入力部2aに音声等で入力することを
要求するユーザ認証要求情報を、クライアント2に送信
する。
【0101】制御部2eは、認証サーバ6から通信部2
dを介して受信したユーザ認証要求情報を、出力部2b
のスピーカ等に音声として出力させる。
【0102】続いて、ステップS22において、ユーザ
が出力部2bのスピーカ等から音声出力されたユーザ認
証要求情報に従って、入力部2aのマイク等にユーザI
Dとパスワードを音声で入力した場合に、制御部2e
は、入力部2aに入力された音声情報であるユーザID
とパスワードを、この入力部2aから供給される。制御
部2eは、入力部2aから供給されたユーザIDとパス
ワードを通信部2dに供給する。通信部2dは、供給さ
れたユーザIDとパスワードを基地局4を介してサーバ
システム3の音声認識サーバ5に送信する。
【0103】音声認識サーバ5は、通信部2dから基地
局4を介して受信したユーザIDとパスワードについて
音声認識を行う。音声認識サーバ5は、この音声認識を
行った結果である認識ユーザID・パスワードを認証サ
ーバ6に供給する。
【0104】認証サーバ6は、データベース9の属性情
報記憶部9aからユーザIDとパスワードを取得し、こ
の取得したユーザIDとパスワードに基づいて音声認識
サーバ5から供給された認識ユーザID・パスワードの
認証処理を行う。
【0105】認証サーバ6は、この認証ができない場合
には、サービス開始不許可情報をクライアント2に送信
する。制御部2eは、認証サーバ6から通信部2dを介
して受信したサービス開始不許可情報に基づいて、MO
Dサービスが開始されない旨を、出力部2bのスピーカ
等に音声として出力させる。ユーザがこのMODサービ
スが開始されない旨をスピーカ等から聞いて、改めて入
力部2aのマイク等にユーザIDとパスワードを正確に
音声で入力した場合には、制御部2eは、入力部2aに
再度入力された音声情報であるユーザIDとパスワード
を、この入力部2aから供給される。
【0106】一方、認証サーバ6は、上述の認証ができ
た場合には、認証ができたことを知らせる認証成功情報
を情報作成サーバ7に供給する。情報作成サーバ7は、
この認証成功情報を認証サーバ6から供給された場合に
は、サービス開始許可情報と、ユーザに曲のタイトルを
入力するように要求するタイトル入力要求情報とをクラ
イアント2に送信する。制御部2eは、情報作成サーバ
7から通信部2dを介して受信したサービス開始許可情
報とタイトル入力要求情報とを、出力部2bのスピーカ
等に音声として出力させる。そして、処理は、ステップ
S23へ進む。
【0107】続いて、ステップS23において、ユーザ
がサービス開始許可情報とタイトル入力要求情報とをス
ピーカ等から聞いた後に、制御部2eは、ユーザが入力
部2aのマイク等に音声で入力したタイトル音声情報
を、この入力部2aから供給される。制御部2eは、入
力部2aから供給されたタイトル音声情報を通信部2d
に供給する。通信部2dは、供給されたタイトル音声情
報を基地局4を介してサーバシステム3の音声認識サー
バ5に送信する。
【0108】音声認識サーバ5は、通信部2dから基地
局4を介して受信したタイトル音声情報について音声認
識を行う。音声認識サーバ5は、この音声認識を行った
結果である認識タイトル音声情報を情報作成サーバ7に
供給する。
【0109】続いて、ステップS24において、情報作
成サーバ7は、音声認識サーバ5から供給された認識タ
イトル音声情報と、データベース9の作成情報記憶部9
bから取得した1又は2以上の各タイトル作成情報とに
基づいて、曲コンテンツ選択用情報を作成する。
【0110】具体的には、情報作成サーバ7は、音響的
な特徴量における、認識タイトル音声情報と、作成情報
記憶部9bに記憶されている情報提供システムで提供可
能な曲のタイトルに関する各タイトル作成情報との類似
性を、図示しない作成情報演算処理部を用いて演算す
る。この情報作成サーバ7は、作成情報記憶部9bに記
憶されている全ての各タイトル作成情報に対して、音響
的な特徴量における認識タイトル音声情報との類似性を
演算する。情報作成サーバ7は、この演算値が閾値Xを
越えたものを、ユーザがサーバシステム3から提供され
ることを希望する曲の候補になると判断する。
【0111】そして、演算値が閾値Xを越えたタイトル
作成情報に対応する曲の数が定数N個未満である場合に
は、処理は、ステップS33へ進む。
【0112】ステップS25において、演算値が閾値X
を越えたタイトル作成情報に対応する曲の数が定数N個
以上の場合には、情報作成サーバ7は、候補となる曲の
数を速く絞り込むために、作成情報記憶部9bからタイ
トルの入力情報から決定された候補に関するパフォーマ
名及びジャンルの音声としての作成情報を取得して用い
ることにより、このパフォーマ名及びジャンルの各作成
情報の範疇ごとのばらつきを演算する。なお、候補とな
る曲の数の絞り込みは、ユーザからの音声情報の入力に
対して、このばらつきの程度が大きければ大きいほど速
くできる場合がある。
【0113】続いて、ステップS26において、ジャン
ルの音声情報の方がばらつきの程度が大きい場合には、
情報作成サーバ7は、ジャンル入力要求情報をクライア
ント2に送信する。制御部2eは、情報作成サーバ7か
ら通信部2dと制御部2eとを介して受信したジャンル
入力要求情報を、出力部2bのスピーカ等に音声として
出力させる。そして、処理は、ステップS30へ進む。
【0114】一方、パフォーマ名の音声情報の方がばら
つきの程度が大きい場合には、情報作成サーバ7は、パ
フォーマ名入力要求情報をクライアント2に送信する。
制御部2eは、情報作成サーバ7から通信部2dを介し
て受信したパフォーマ名入力要求情報を、出力部2bの
スピーカ等に音声として出力させる。そして、処理は、
ステップS27へ進む。
【0115】続いて、ステップS27において、ユーザ
がパフォーマ名入力要求情報をスピーカ等から聞いた後
に、制御部2eは、入力部2aのマイク等にパフォーマ
名をユーザにより音声で入力された音声情報(以下、パ
フォーマ名音声情報という。)を、この入力部2aから
供給される。制御部2eは、入力部2aから供給された
パフォーマ名音声情報を通信部2dに供給する。通信部
2dは、供給されたパフォーマ名音声情報を基地局4を
介してサーバシステム3の音声認識サーバ5に送信す
る。
【0116】音声認識サーバ5は、通信部2dから基地
局4を介して受信したパフォーマ名音声情報について音
声認識を行う。音声認識サーバ5は、この音声認識を行
った結果である認識パフォーマ名音声情報を情報作成サ
ーバ7に供給する。
【0117】続いて、ステップS28において、情報作
成サーバ7は、音声認識サーバ5から供給された認識パ
フォーマ名音声情報と、データベース9の作成情報記憶
部9bから取得した1又は2以上の各パフォーマ名作成
情報とに基づいて、曲コンテンツ選択用情報を作成す
る。但し、この場合のパフォーマ名作成情報とは、タイ
トルによる絞り込みで演算値が閾値Xを越えたものの中
から取得したパフォーマ名に関する作成情報のみをい
う。従って、作成情報記憶部9bは、予め、コンテンツ
である各曲に関するタイトル、パフォーマ名、ジャンル
等を記憶している。
【0118】具体的には、情報作成サーバ7は、音響的
な特徴量における、認識パフォーマ名音声情報と、作成
情報記憶部9bに記憶されている情報提供システムで提
供可能な曲のパフォーマ名に関する各パフォーマ名作成
情報との類似性を、図示しない作成情報演算処理部を用
いて演算する。この情報作成サーバ7は、作成情報記憶
部9bに記憶されている全ての各パフォーマ名作成情報
に対して、音響的な特徴量における認識パフォーマ名音
声情報との類似性を演算する。情報作成サーバ7は、こ
の演算値が閾値Xを越えたものを、ユーザがサーバシス
テム3から提供されることを希望する曲の候補になると
判断する。
【0119】そして、演算値が閾値Xを越えたパフォー
マ名作成情報に対応する曲の数が定数N個未満である場
合、即ち、タイトル及びパフォーマ名の両方を用いた場
合における演算値が閾値Xを越えたタイトル作成情報及
びパフォーマ名作成情報に対応する曲の数が定数N個以
下であるときには、処理は、ステップS33へ進む。
【0120】一方、タイトル及びパフォーマ名の両方を
用いた場合における演算値が閾値Xを越えたタイトル作
成情報及びパフォーマ名作成情報に対応する曲の数が定
数N個以上のときには、情報作成サーバ7は、候補とな
る曲の数を絞り込むために、ユーザに曲のジャンルを入
力するように要求するジャンル入力要求情報をクライア
ント2に送信する。制御部2eは、情報作成サーバ7か
ら通信部2dを介して受信したジャンル入力要求情報
を、出力部2bのスピーカ等に音声として出力させる。
そして、処理は、ステップS29へ進む。
【0121】続いて、ステップS29において、ユーザ
がジャンル入力要求情報をスピーカ等から聞いた後に、
制御部2eは、入力部2aのマイク等にジャンルをユー
ザにより音声で入力されたジャンル音声情報を、この入
力部2aから供給される。制御部2eは、入力部2aか
ら供給されたジャンル音声情報を通信部2dに供給す
る。通信部2dは、供給されたジャンル音声情報を基地
局4を介してサーバシステム3の音声認識サーバ5に送
信する。
【0122】音声認識サーバ5は、通信部2dから基地
局4を介して受信したジャンル音声情報について音声認
識を行う。音声認識サーバ5は、この音声認識を行った
結果である認識ジャンル音声情報を情報作成サーバ7に
供給する。
【0123】情報作成サーバ7は、音声認識サーバ5か
ら供給された認識ジャンル音声情報と、データベース9
の作成情報記憶部9bから取得した1又は2以上の各ジ
ャンル作成情報とに基づいて、曲コンテンツ選択用情報
を作成する。但し、この場合のジャンル作成情報とは、
タイトル及びパフォーマ名による絞り込みで演算値が閾
値Xを越えたものの中から取得したジャンルに関する作
成情報のみをいう。
【0124】具体的には、情報作成サーバ7は、音響的
な特徴量における、認識ジャンル音声情報と、作成情報
記憶部9bに記憶されている情報提供システムで提供可
能な曲のジャンルに関する各ジャンル作成情報との類似
性を、図示しない作成情報演算処理部を用いて演算す
る。この情報作成サーバ7は、作成情報記憶部9bに記
憶されている全ての各ジャンル作成情報に対して、音響
的な特徴量における認識ジャンル音声情報との類似性を
演算する。情報作成サーバ7は、この演算値が閾値Xを
越えたものを、ユーザがサーバシステム3から提供され
ることを希望する曲の候補になると判断する。
【0125】そして、演算値が閾値Xを越えたジャンル
作成情報に対応する曲の数が定数N個未満である場合、
即ち、タイトル、パフォーマ名及びジャンルを用いた場
合における演算値が閾値Xを越えたタイトル作成情報、
パフォーマ名及びジャンル作成情報に対応する曲の数が
定数N個未満であるときには、処理は、ステップS33
へ進む。
【0126】一方、タイトル、パフォーマ名及びジャン
ルを用いた場合における演算値が閾値Xを越えたタイト
ル作成情報、パフォーマ名及びジャンル作成情報に対応
する曲の数が定数N個以上のときには、情報作成サーバ
7は、演算値がジャンル音声情報に最も類似していたも
のから順にN個をクライアント2に送信する。つまり、
この場合も、処理は、ステップS33へ進む。
【0127】また、ステップS30からステップS32
においても、上述したステップS27からステップS2
9と同様な処理が行われる。但し、これらのステップS
30からステップS32では、ジャンル、パフォーマ名
の順で音声入力される。
【0128】続いて、ステップS33において、演算値
が閾値Xを越えたジャンル作成情報に対応する曲の数が
定数N個未満である場合に、情報作成サーバ7が曲コン
テンツ選択用情報をクライアント2に送信したときに
は、制御部2eは、情報作成サーバ7から通信部2dを
介して受信したN個未満の曲コンテンツ選択用情報を、
出力部2bのスピーカ等に音声として出力させる。
【0129】この場合、制御部2eは、例えば、タイト
ルに関する演算値とパフォーマ名に関する演算値とジャ
ンルに関する演算値の平均等を利用して、入力された音
声情報により類似した曲から順番に並べられた曲のリス
ト等である曲コンテンツ選択用情報を、出力部2bのス
ピーカ等に音声として出力させる。
【0130】なお、この曲コンテンツ選択用情報とは、
例えば、曲の名前、曲の一部、パフォーマ名、タイアッ
プしているドラマの名前、その曲が放送された番組の名
前、曲の製作者の名前など、ユーザが入力した音声情報
に対する結果となり得るもの全ての情報をいう。また、
制御部2eは、この曲コンテンツ選択用情報を、例え
ば、液晶ディスプレイ等を用いて、テキスト情報、画像
情報等として出力部2bに出力させてもよい。
【0131】一方、演算値が閾値Xを越えたジャンル作
成情報に対応する曲の数が定数N個以上の場合に、情報
作成サーバ7が曲コンテンツ選択用情報をクライアント
2に送信したときには、制御部2eは、情報作成サーバ
7から通信部2dを介して受信した演算値がジャンル音
声情報に最も近似していたものからの順番であるN個の
曲コンテンツ選択用情報を、出力部2bのスピーカ等に
音声として出力させる。
【0132】この場合、制御部2eは、例えば、タイト
ルに関する演算値とパフォーマ名に関する演算値とジャ
ンルに関する演算値の平均等を利用して、入力された音
声情報により類似した曲から順番に並べられたN個の曲
のリスト等である曲コンテンツ選択用情報を、出力部2
bのスピーカ等に音声として出力させる。
【0133】続いて、ステップS34において、ユーザ
が曲コンテンツ選択用情報をスピーカ等から聞いた後
に、制御部2eは、この曲コンテンツ選択用情報である
曲のリストの中からユーザが選択した曲に関する情報を
入力部2aのマイク等に音声で入力された音声情報を、
この入力部2aから供給される。
【0134】具体的には、制御部2eは、例えば、曲コ
ンテンツ選択用情報である曲のリストの項目に割り振ら
れた番号を入力部2aに音声で入力された音声情報を、
この入力部2aから供給される。
【0135】また、制御部2eは、例えば、曲コンテン
ツ選択用情報である曲の名前を入力部2aに音声で入力
された音声情報を、この入力部2aから供給される。
【0136】さらに、制御部2eは、例えば、出力部2
bが曲コンテンツ選択用情報である曲のリストを順番に
音声で出力している場合で、現在、音声で出力されてい
る曲をユーザが選択したいときに、「この曲」や「O
K」等という言葉が入力部2aに音声で入力された音声
情報を、この入力部2aから供給される。この場合、入
力部2aは、キー入力装置やジョグダイアル等により構
成されていてもよい。
【0137】さらにまた、制御部2eは、例えば、出力
部2bが曲コンテンツ選択用情報である曲の一部分を順
番に再生している場合で、現在、再生している曲をユー
ザが選択したいときに、「この曲」や「OK」等という
言葉が入力部2aに音声で入力された音声情報を、この
入力部2aから供給される。この場合も、入力部2a
は、キー入力装置やジョグダイアル等により構成されて
いてもよい。
【0138】さらにまた、制御部2eは、例えば、予め
クライアント2がサーバシステム3からユーザの趣向に
あった曲のリストをダウンロードしてある場合に、その
曲のリストの中からユーザが選択した曲の名前が入力部
2aに音声で入力された音声情報を、この入力部2aか
ら供給される。このユーザの趣向にあった曲のリスト
は、ユーザが予め設定しておいてもよい。
【0139】以上の様な操作をされることにより、曲コ
ンテンツ選択用情報である曲のリスト等の中から、ユー
ザがサーバシステム3から提供されることを希望する曲
が選択される。
【0140】続いて、ステップS35において、制御部
2eは、入力部2aに入力された選択音声情報を、この
入力部2aから供給される。制御部2eは、入力部2a
から供給された選択音声情報を通信部2dに供給する。
通信部2dは、供給された選択音声情報を基地局4を介
してサーバシステム3の音声認識サーバ5に送信する。
【0141】音声認識サーバ5は、通信部2dから基地
局4を介して受信した選択音声情報について音声認識を
行う。音声認識サーバ5は、この音声認識を行った結果
である認識選択音声情報をクライアント2に送信する。
【0142】制御部2eは、音声認識サーバ5から通信
部2dを介して受信した認識選択音声情報を、出力部2
bのスピーカ等に音声として出力させる。ユーザは、こ
の認識選択音声情報をスピーカ等から聞くことにより、
自分が選択した曲をサーバシステム3が正しく認識した
かどうか確認する。
【0143】続いて、ステップS36において、情報提
供サーバ8は、音声認識サーバ5から供給された認識選
択音声情報に基づき、クライアント2に送信する音楽等
のコンテンツをコンテンツ情報記憶部9cから取得して
クライアント2に送信する。
【0144】制御部2eは、情報提供サーバ8から通信
部2dを介して受信した音楽等のコンテンツを、出力部
2bのスピーカ等に再生させる。
【0145】続いて、ステップS37において、出力部
2bからのコンテンツの再生が終了し、ユーザが引き続
きMODサービスを利用する場合には、処理は、ステッ
プS23へ戻る。
【0146】一方、ユーザがMODサービスの利用を終
了するためのサービス終了要求情報を、入力部2aのマ
イク等に音声で入力した場合には、制御部2eは、入力
部2aに入力されたサービス終了要求音声情報を、この
入力部2aから供給される。制御部2eは、入力部2a
から供給されたサービス終了要求音声情報を通信部2d
に供給する。通信部2dは、供給されたサービス終了要
求音声情報を基地局4を介してサーバシステム3の音声
認識サーバ5に送信する。
【0147】音声認識サーバ5は、通信部2dから基地
局4を介して受信したサービス終了要求音声情報につい
て、図示しない音響分析部、音響モデル及び言語モデル
等に基づき音声認識を行う。音声認識サーバ5は、この
音声認識を行った結果である認識サービス終了要求音声
情報を情報作成サーバ7に供給する。
【0148】情報作成サーバ7は、音声認識サーバ5か
ら認識サービス終了要求音声情報が供給されると、サー
ビス終了許可情報をクライアント2に送信する。
【0149】制御部2eは、情報作成サーバ7から通信
部2dを介して受信したサービス終了許可情報を、制御
部2eのスピーカ等に音声として出力させる。
【0150】ユーザは、このサービス終了許可情報をス
ピーカ等から音声として聞くことによって、MODサー
ビスが終了したことを認識する。
【0151】以上のよう処理されることにより、次にど
ういう情報が入力されればコンテンツ選択用情報を速く
作成できるのかをサーバシステム3側が判断するため、
上述した第1の実施の形態におけるコンテンツ選択シス
テムよりも、ユーザは、サーバシステム3からMODサ
ービスをより速く、より正確に受けることができる。
【0152】つぎに、上述した候補となる曲のリストを
出力する方法以外の出力方法を利用したコンテンツ選択
システム1を用いた情報提供システムにおいて、MOD
サービスが開始されてから修了するまでの一連の処理に
ついて、図4に示すフローチャートに従って説明する。
この処理は、上述した処理と異なり、どのように曲コン
テンツ選択用情報である曲のリストが出力されればユー
ザが容易に目的とする曲を選択できるのかをサーバシス
テム3側が判断し、その判断に基づいて曲のリスト等を
出力するものである。
【0153】この図4に示すフローチャートでは、例え
ば、IMT−2000用の端末であるクライアント2
は、IMT−2000のデータ回線を用いた基地局4を
介して、サーバシステム3に例えば電話をかける等して
予め接続要求を出している。その後、クライアント2
は、サーバシステム3との接続が確立する。即ち、この
図4に示すフローチャートでは、クライアント2とサー
バシステム3との接続が確立している状態から説明す
る。
【0154】なお、この図4に示す第3の実施の形態に
おける処理は、図2に示すフローチャートにおけるステ
ップS4からステップS8までの処理を、図4に示すフ
ローチャートにおけるステップS44からステップS5
5の処理に換えたものである。
【0155】まず、図4のステップS41において、ユ
ーザがサービス開始要求情報を、クライアント2に備え
られた入力部2aのマイク等に音声で入力した場合に、
制御部2eは、入力部2aに入力されたサービス開始要
求音声情報を、この入力部2aから供給される。制御部
2eは、入力部2aから供給されたサービス開始要求音
声情報を通信部2dに供給する。通信部2dは、供給さ
れたサービス開始要求音声情報を基地局4を介してサー
バシステム3の音声認識サーバ5に送信する。
【0156】音声認識サーバ5は、通信部2dから基地
局4を介して受信したサービス開始要求音声情報につい
て、図示しない音響分析部、音響モデル及び言語モデル
等に基づき音声認識を行う。音声認識サーバ5は、この
音声認識を行った結果である認識サービス開始要求音声
情報を認証サーバ6に供給する。
【0157】認証サーバ6は、音声認識サーバ5から認
識サービス開始要求音声情報が供給されると、クライア
ント2を所有するユーザがMODサービスを利用する権
利を有するか否かを認証するためのユーザIDとパスワ
ードを、ユーザが入力部2aに音声等で入力することを
要求するユーザ認証要求情報を、クライアント2に送信
する。
【0158】制御部2eは、認証サーバ6から通信部2
dを介して受信したユーザ認証要求情報を、出力部2b
のスピーカ等に音声として出力させる。
【0159】続いて、ステップS42において、ユーザ
が出力部2bのスピーカ等から音声出力されたユーザ認
証要求情報に従って、入力部2aのマイク等にユーザI
Dとパスワードを音声で入力した場合に、制御部2e
は、入力部2aに入力された音声情報であるユーザID
とパスワードを、この入力部2aから供給される。制御
部2eは、入力部2aから供給されたユーザIDとパス
ワードを通信部2dに供給する。通信部2dは、供給さ
れたユーザIDとパスワードを基地局4を介してサーバ
システム3の音声認識サーバ5に送信する。
【0160】音声認識サーバ5は、通信部2dから基地
局4を介して受信したユーザIDとパスワードについて
音声認識を行う。音声認識サーバ5は、この音声認識を
行った結果である認識ユーザID・パスワードを認証サ
ーバ6に供給する。
【0161】認証サーバ6は、データベース9の属性情
報記憶部9aからユーザIDとパスワードを取得し、こ
の取得したユーザIDとパスワードに基づいて音声認識
サーバ5から供給された認識ユーザID・パスワードの
認証処理を行う。
【0162】認証サーバ6は、この認証ができない場合
には、サービス開始不許可情報をクライアント2に送信
する。制御部2eは、認証サーバ6から通信部2dを介
して受信したサービス開始不許可情報に基づいて、MO
Dサービスが開始されない旨を、出力部2bのスピーカ
等に音声として出力させる。ユーザがこのMODサービ
スが開始されない旨をスピーカ等から聞いて、改めて入
力部2aのマイク等にユーザIDとパスワードを正確に
音声で入力した場合には、制御部2eは、入力部2aに
再度入力された音声情報であるユーザIDとパスワード
を、この入力部2aから供給される。
【0163】一方、認証サーバ6は、上述の認証ができ
た場合には、認証ができたことを知らせる認証成功情報
を情報作成サーバ7に供給する。情報作成サーバ7は、
この認証成功情報を認証サーバ6から供給された場合に
は、サービス開始許可情報と、ユーザに曲のタイトルを
入力するように要求するタイトル入力要求情報とをクラ
イアント2に送信する。制御部2eは、情報作成サーバ
7から通信部2dを介して受信したサービス開始許可情
報とタイトル入力要求情報とを、出力部2bのスピーカ
等に音声として出力させる。そして、処理は、ステップ
S43へ進む。
【0164】続いて、ステップS43において、ユーザ
がサービス開始許可情報とタイトル入力要求情報とをス
ピーカ等から聞いた後に、制御部2eは、ユーザが入力
部2aのマイク等に音声で入力したタイトル音声情報
を、この入力部2aから供給される。制御部2eは、入
力部2aから供給されたタイトル音声情報を通信部2d
に供給する。通信部2dは、供給されたタイトル音声情
報を基地局4を介してサーバシステム3の音声認識サー
バ5に送信する。
【0165】音声認識サーバ5は、通信部2dから基地
局4を介して受信したタイトル音声情報について音声認
識を行う。音声認識サーバ5は、この音声認識を行った
結果である認識タイトル音声情報を情報作成サーバ7に
供給する。
【0166】続いて、ステップS44において、情報作
成サーバ7は、音響的な特徴量における、認識タイトル
音声情報と1又は2以上の各タイトル作成情報との類似
性を、図示しない作成情報演算処理部を用いて演算す
る。この情報作成サーバ7は、作成情報記憶部9bに記
憶されている全ての各タイトル作成情報に対して、音響
的な特徴量における認識タイトル音声情報との類似性を
演算する。情報作成サーバ7は、この演算値が閾値Xを
越えたものを、ユーザがサーバシステム3から提供され
ることを希望する曲の候補になると判断する。
【0167】そして、演算値が閾値Xを越えたタイトル
作成情報に対応する曲の数が定数N個未満である場合に
は、情報作成サーバ7が候補となる曲のリスト等である
曲コンテンツ選択用情報を作成するため、処理は、ステ
ップS48へ進む。
【0168】一方、演算値が閾値Xを越えたタイトル作
成情報に対応する曲の数が定数N個以上の場合には、情
報作成サーバ7は、候補となる曲の数を絞り込むため
に、ユーザに曲のパフォーマの名前を入力するように要
求するパフォーマ名入力要求情報をクライアント2に送
信する。制御部2eは、情報作成サーバ7から通信部2
dを介して受信したパフォーマ名入力要求情報を、出力
部2bのスピーカ等に音声として出力させる。そして、
処理は、ステップS45へ進む。
【0169】続いて、ステップS45において、ユーザ
がパフォーマ名入力要求情報をスピーカ等から聞いた後
に、制御部2eは、ユーザが入力部2aのマイク等に音
声で入力したパフォーマ名音声情報を、この入力部2a
から供給される。制御部2eは、入力部2aから供給さ
れたパフォーマ名音声情報を通信部2dに供給する。通
信部2dは、供給されたパフォーマ名音声情報を基地局
4を介してサーバシステム3の音声認識サーバ5に送信
する。
【0170】音声認識サーバ5は、通信部2dから基地
局4を介して受信したパフォーマ名音声情報について音
声認識を行う。音声認識サーバ5は、この音声認識を行
った結果である認識パフォーマ名音声情報を情報作成サ
ーバ7に供給する。
【0171】続いて、ステップS46において、情報作
成サーバ7は、音響的な特徴量における、認識パフォー
マ名音声情報と、作成情報記憶部9bに記憶されている
情報提供システムで提供可能な曲のパフォーマ名に関す
る1又は2以上の各パフォーマ名作成情報との類似性
を、図示しない作成情報演算処理部を用いて演算する。
この情報作成サーバ7は、作成情報記憶部9bに記憶さ
れている全ての各パフォーマ名作成情報に対して、音響
的な特徴量における認識パフォーマ名音声情報との類似
性を演算する。情報作成サーバ7は、この演算値が閾値
Xを越えたものを、ユーザがサーバシステム3から提供
されることを希望する曲の候補になると判断する。
【0172】そして、演算値が閾値Xを越えたパフォー
マ名作成情報に対応する曲の数が定数N個未満である場
合、即ち、タイトル及びパフォーマ名の両方を用いた場
合における演算値が閾値Xを越えたタイトル作成情報及
びパフォーマ名作成情報に対応する曲の数が定数N個未
満であるときには、情報作成サーバ7が候補となる曲の
リスト等である曲コンテンツ選択用情報を作成するた
め、処理は、ステップS48へ進む。
【0173】一方、タイトル及びパフォーマ名の両方を
用いた場合における演算値が閾値Xを越えたタイトル作
成情報及びパフォーマ名作成情報に対応する曲の数が定
数N個以上のときには、情報作成サーバ7は、候補とな
る曲の数を絞り込むために、ユーザに曲のジャンルを入
力するように要求するジャンル入力要求情報をクライア
ント2に送信する。制御部2eは、情報作成サーバ7か
ら通信部2dを介して受信したジャンル入力要求情報
を、出力部2bのスピーカ等に音声として出力させる。
そして、処理は、ステップS47へ進む。
【0174】続いて、ステップS47において、ユーザ
がジャンル入力要求情報をスピーカ等から聞いた後に、
制御部2eは、ユーザが入力部2aのマイク等に音声で
入力したジャンル音声情報を、この入力部2aから供給
される。制御部2eは、入力部2aから供給されたジャ
ンル音声情報を通信部2dに供給する。通信部2dは、
供給されたジャンル音声情報を基地局4を介してサーバ
システム3の音声認識サーバ5に送信する。
【0175】音声認識サーバ5は、通信部2dから基地
局4を介して受信したジャンル音声情報について音声認
識を行う。音声認識サーバ5は、この音声認識を行った
結果である認識ジャンル音声情報を情報作成サーバ7に
供給する。
【0176】情報作成サーバ7は、音響的な特徴量にお
ける、認識ジャンル音声情報と、作成情報記憶部9bに
記憶されている情報提供システムで提供可能な曲のジャ
ンルに関する1又は2以上の各ジャンル作成情報との類
似性を、図示しない作成情報演算処理部を用いて演算す
る。この情報作成サーバ7は、作成情報記憶部9bに記
憶されている全ての各ジャンル作成情報に対して、音響
的な特徴量における認識ジャンル音声情報との類似性を
演算する。情報作成サーバ7は、この演算値が閾値Xを
越えたものを、ユーザがサーバシステム3から提供され
ることを希望する曲の候補になると判断する。
【0177】そして、演算値が閾値Xを越えたジャンル
作成情報に対応する曲の数が定数N個未満である場合、
即ち、タイトル、パフォーマ名及びジャンルを用いた場
合における演算値が閾値Xを越えたタイトル作成情報、
パフォーマ名作成情報及びジャンル作成情報に対応する
曲の数が定数N個未満であるときには、情報作成サーバ
7が候補となる曲のリスト等である曲コンテンツ選択用
情報を作成するため、処理は、ステップS48へ進む。
【0178】一方、タイトル、パフォーマ名及びジャン
ルを用いた場合における演算値が閾値Xを越えたタイト
ル作成情報、パフォーマ名作成情報及びジャンル作成情
報に対応する曲の数が定数N個以上のときには、情報作
成サーバ7が候補となる曲のリスト等である曲コンテン
ツ選択用情報を作成するため、処理は、ステップS48
へ進む。但し、この場合の曲のリスト等である曲コンテ
ンツ選択用情報は、演算値がジャンル音声情報に最も類
似していたものから順にN個の項目からなるものであ
る。
【0179】続いて、ステップS48において、演算値
が閾値Xを越えた上記作成情報に対応する曲の数が定数
N個未満である場合には、情報作成サーバ7は、N個未
満の候補となる曲のリスト等である曲コンテンツ選択用
情報を作成する。一方、演算値が閾値Xを越えた上記作
成情報に対応する曲の数が定数N個以上の場合には、情
報作成サーバ7は、演算値がジャンル音声情報に最も類
似していたものから順番に取得したN個の候補となる曲
のリスト等である曲コンテンツ選択用情報を作成する。
【0180】続いて、ステップS49において、情報作
成サーバ7は、作成した曲コンテンツ選択用情報を、テ
キスト表示等として文字で出力した方がユーザが曲を選
択しやすいか否かを図示しない最適出力状態判断部を用
いて判断し、文字で出力するのが最適だと判断しなかっ
たときは、処理は、ステップS51へ進む。
【0181】一方、情報作成サーバ7は、作成した曲コ
ンテンツ選択用情報を、テキスト表示等として文字で出
力した方がユーザが曲を選択しやすいか否かを図示しな
い最適出力状態判断部を用いて判断し、文字で出力する
のが最適だと判断したときは、文字で出力するための曲
コンテンツ選択用情報をクライアント2に送信する。
【0182】続いて、ステップS50において、演算値
が閾値Xを越えた上記作成情報に対応する曲の数が定数
N個未満である場合に、情報作成サーバ7が曲コンテン
ツ選択用情報をクライアント2に送信したときには、制
御部2eは、情報作成サーバ7から通信部2dを介して
受信したN個未満の曲コンテンツ選択用情報を、出力部
2bの液晶ディスプレイ等に文字として表示させる。
【0183】一方、演算値が閾値Xを越えた上記作成情
報に対応する曲の数が定数N個以上の場合に、情報作成
サーバ7が曲コンテンツ選択用情報をクライアント2に
送信したときには、制御部2eは、情報作成サーバ7か
ら通信部2dを介して受信した演算値がジャンル音声情
報に最も類似していたものからの順番であるN個の曲コ
ンテンツ選択用情報を、出力部2bの液晶ディスプレイ
等に文字として出力させる。
【0184】続いて、ステップS51において、情報作
成サーバ7が、作成した曲コンテンツ選択用情報を、静
止画で出力した方がユーザが曲を選択しやすいか否かを
図示しない最適出力状態判断部を用いて判断し、静止画
で出力するのが最適だと判断しなかったときは、処理
は、ステップS53へ進む。
【0185】一方、情報作成サーバ7は、作成した曲コ
ンテンツ選択用情報を、CDのジャケット写真等によっ
て静止画で出力した方がユーザが曲を選択しやすいか否
かを図示しない最適出力状態判断部を用いて判断し、静
止画で出力するのが最適だと判断したときは、静止画で
出力するための曲コンテンツ選択用情報をクライアント
2に送信する。
【0186】続いて、ステップS52において、演算値
が閾値Xを越えた上記作成情報に対応する曲の数が定数
N個未満である場合に、情報作成サーバ7が曲コンテン
ツ選択用情報をクライアント2に送信したときには、制
御部2eは、情報作成サーバ7から通信部2dを介して
受信したN個未満の曲コンテンツ選択用情報を、出力部
2bの液晶ディスプレイ等に静止画として出力させる。
【0187】一方、演算値が閾値Xを越えた上記作成情
報に対応する曲の数が定数N個以上の場合に、情報作成
サーバ7が曲コンテンツ選択用情報をクライアント2に
送信したときには、制御部2eは、情報作成サーバ7か
ら通信部2dを介して受信した演算値がジャンル音声情
報に最も類似していたものからの順番であるN個の曲コ
ンテンツ選択用情報を、出力部2bの液晶ディスプレイ
等に静止画として出力させる。
【0188】続いて、ステップS53において、情報作
成サーバ7は、作成した曲コンテンツ選択用情報を、V
ideo Clip等によって動画で出力した方がユー
ザが曲を選択しやすいか否かを図示しない最適出力状態
判断部を用いて判断し、動画で出力するのが最適だと判
断したときは、動画で出力するための曲コンテンツ選択
用情報をクライアント2に送信する。
【0189】一方、情報作成サーバ7は、作成した曲コ
ンテンツ選択用情報を、動画で出力した方がユーザが曲
を選択しやすいか否かを図示しない最適出力状態判断部
を用いて判断し、動画で出力するのが最適だと判断しな
かったときは、処理は、ステップS53へ進む。
【0190】続いて、ステップS54において、演算値
が閾値Xを越えた上記作成情報に対応する曲の数が定数
N個未満である場合に、情報作成サーバ7が曲コンテン
ツ選択用情報をクライアント2に送信したときには、制
御部2eは、情報作成サーバ7から通信部2dと制御部
2eとを介して受信したN個未満の曲コンテンツ選択用
情報を、出力部2bの液晶ディスプレイ等に動画として
出力させる。
【0191】一方、演算値が閾値Xを越えた上記作成情
報に対応する曲の数が定数N個以上の場合に、情報作成
サーバ7が曲コンテンツ選択用情報をクライアント2に
送信したときには、制御部2eは、情報作成サーバ7か
ら通信部2dを介して受信した演算値がジャンル音声情
報に最も類似していたものからの順番であるN個の曲コ
ンテンツ選択用情報を、出力部2bの液晶ディスプレイ
等に動画として出力させる。
【0192】続いて、ステップS55において、演算値
が閾値Xを越えた上記作成情報に対応する曲の数が定数
N個未満である場合に、情報作成サーバ7が曲コンテン
ツ選択用情報をクライアント2に送信したときには、制
御部2eは、情報作成サーバ7から通信部2dを介して
受信したN個未満の曲コンテンツ選択用情報を、出力部
2bのスピーカ等に曲を音声として出力させる。
【0193】一方、演算値が閾値Xを越えた上記作成情
報に対応する曲の数が定数N個以上の場合に、情報作成
サーバ7が曲コンテンツ選択用情報をクライアント2に
送信したときには、制御部2eは、情報作成サーバ7か
ら通信部2dを介して受信した演算値がジャンル音声情
報に最も類似していたものからの順番であるN個の曲コ
ンテンツ選択用情報を、出力部2bのスピーカ等に曲を
音声として出力させる。
【0194】続いて、ステップS56において、ユーザ
が曲コンテンツ選択用情報をスピーカ等から聞いた後
に、制御部2eは、この曲コンテンツ選択用情報である
曲のリストの中からユーザが選択した曲に関する情報を
入力部2aのマイク等に音声で入力された音声情報を、
この入力部2aから供給される。
【0195】具体的には、制御部2eは、例えば、曲コ
ンテンツ選択用情報である曲のリストの項目に割り振ら
れた番号を入力部2aに音声で入力された音声情報を、
この入力部2aから供給される。
【0196】また、制御部2eは、例えば、曲コンテン
ツ選択用情報である曲の名前を入力部2aに音声で入力
された音声情報を、この入力部2aから供給される。
【0197】さらに、制御部2eは、例えば、出力部2
bが曲コンテンツ選択用情報である曲のリストを順番に
音声で出力している場合で、現在、音声で出力されてい
る曲をユーザが選択したいときに、「この曲」や「O
K」等という言葉が入力部2aに音声で入力された音声
情報を、この入力部2aから供給される。この場合、入
力部2aは、キー入力装置やジョグダイアル等により構
成されていてもよい。
【0198】さらにまた、制御部2eは、例えば、出力
部2bが曲コンテンツ選択用情報である曲の一部分を順
番に再生している場合で、現在、再生している曲をユー
ザが選択したいときに、「この曲」や「OK」等という
言葉が入力部2aに音声で入力された音声情報を、この
入力部2aから供給される。この場合も、入力部2a
は、キー入力装置やジョグダイアル等により構成されて
いてもよい。
【0199】さらにまた、制御部2eは、例えば、予め
クライアント2がサーバシステム3からユーザの趣向に
あった曲のリストをダウンロードしてある場合に、その
曲のリストの中からユーザが選択した曲の名前が入力部
2aに音声で入力された音声情報を、この入力部2aか
ら供給される。このユーザの趣向にあった曲のリスト
は、ユーザが予め設定しておいてもよい。
【0200】以上の様な操作をされることにより、曲コ
ンテンツ選択用情報である曲のリスト等の中から、ユー
ザがサーバシステム3から提供されることを希望する曲
が選択される。
【0201】続いて、ステップS57において、制御部
2eは、入力部2aに入力された選択音声情報を、この
入力部2aから供給される。制御部2eは、入力部2a
から供給された選択音声情報を通信部2dに供給する。
通信部2dは、供給された選択音声情報を基地局4を介
してサーバシステム3の音声認識サーバ5に送信する。
【0202】音声認識サーバ5は、通信部2dから基地
局4を介して受信した選択音声情報について音声認識を
行う。音声認識サーバ5は、この音声認識を行った結果
である認識選択音声情報を、クライアント2に送信す
る。
【0203】制御部2eは、音声認識サーバ5から通信
部2dを介して受信した認識選択音声情報を、出力部2
bのスピーカ等に音声として出力させる。ユーザは、こ
の認識選択音声情報をスピーカ等から聞くことにより、
自分が選択した曲をサーバシステム3が正しく認識した
かどうか確認する。
【0204】続いて、ステップS58において、情報提
供サーバ8は、音声認識サーバ5から供給された認識選
択音声情報に基づき、クライアント2に送信する音楽等
のコンテンツをコンテンツ情報記憶部9cから取得して
クライアント2に送信する。
【0205】制御部2eは、情報提供サーバ8から通信
部2dを介して受信した音楽等のコンテンツを、出力部
2bのスピーカ等に再生させる。
【0206】続いて、ステップS59において、出力部
2bからのコンテンツの再生が終了し、ユーザが引き続
きMODサービスを利用する場合には、処理は、ステッ
プS43へ戻る。
【0207】一方、ユーザがMODサービスの利用を終
了するためのサービス終了要求情報を、入力部2aのマ
イク等に音声で入力した場合には、制御部2eは、入力
部2aに入力された音声情報であるサービス終了要求音
声情報を、この入力部2aから供給される。制御部2e
は、入力部2aから供給されたサービス終了要求音声情
報を通信部2dに供給する。通信部2dは、供給された
サービス終了要求音声情報を基地局4を介してサーバシ
ステム3の音声認識サーバ5に送信する。
【0208】音声認識サーバ5は、通信部2dから基地
局4を介して受信したサービス終了要求音声情報につい
て、図示しない音響分析部、音響モデル及び言語モデル
等に基づき音声認識を行う。音声認識サーバ5は、この
音声認識を行った結果である認識サービス終了要求音声
情報を情報作成サーバ7に供給する。
【0209】情報作成サーバ7は、音声認識サーバ5か
ら認識サービス終了要求音声情報が供給されると、サー
ビス終了許可情報をクライアント2に送信する。
【0210】制御部2eは、情報作成サーバ7から通信
部2dを介して受信したサービス終了許可情報を、制御
部2eのスピーカ等に音声として出力させる。
【0211】ユーザは、このサービス終了許可情報をス
ピーカ等から音声として聞くことによって、MODサー
ビスが終了したことを認識する。
【0212】以上のよう処理されることにより、どのよ
うに曲コンテンツ選択用情報である曲のリストが出力さ
れればユーザが容易に目的とする曲を選択できるのかを
サーバシステム3側が判断するため、上述した第1の実
施の形態におけるコンテンツ選択システムよりも、ユー
ザは、曲コンテンツ選択用情報である曲のリストから目
的とする曲をより簡単に、より速く選択することができ
る。
【0213】以上述べたように、本発明を適用した実施
の形態であるコンテンツ選択システム1では、ユーザ
は、入力部2aのマイク等に音声情報を入力することに
より、出力部2bに出力された曲のリストの中から簡単
に目的とする曲を選択することができる。従って、ユー
ザは、音声認識装置を備えたクライアント2又はサーバ
システム3を用いることにより、簡単な操作でMODサ
ービスを利用することができる。
【0214】なお、上述したコンテンツ選択システム1
は、IMT−2000を用いてネットワークを構築して
いるが、他の通信方式のネットワークを用いてもよい。
また、上述したクライアント2は、図1では便宜上1つ
しか示していないが、実際には複数のクライアント2が
IMT−2000を介してサーバシステム3と接続され
ることになる。さらに、上述した音声認識機能は、音声
認識サーバ5に備えられているが、クライアント2等に
備えられていてもよい。
【0215】
【発明の効果】以上説明したように、本発明に係るコン
テンツ選択システム、コンテンツ選択クライアント、コ
ンテンツ選択サーバ及びコンテンツ選択方法によれば、
操作者は、クライアントの入力情報送信手段に音声情報
を入力することにより、出力手段に出力されたコンテン
ツの中から速く簡単に目的とするコンテンツを選択する
ことができる。
【図面の簡単な説明】
【図1】本発明を適用した実施の形態を示すコンテンツ
選択システムの構成図である。
【図2】本発明を適用した第1の実施の形態における、
MODサービスが開始されてから終了するまでの一連の
処理の流れを示すフローチャートである。
【図3】本発明を適用した第2の実施の形態における、
MODサービスが開始されてから終了するまでの一連の
処理の流れを示すフローチャートである。
【図4】本発明を適用した第3の実施の形態における、
MODサービスが開始されてから終了するまでの一連の
処理の流れを示すフローチャートである。
【符号の説明】
1 コンテンツ選択システム、2 クライアント、3
サーバシステム、4基地局、5 音声認識サーバ、6
認証サーバ、7 選択サーバ、8 情報提供サーバ、9
データベース
───────────────────────────────────────────────────── フロントページの続き (72)発明者 土井 利忠 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5D015 KK01 KK02 LL04

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 サーバがネットワークを介してクライア
    ントにコンテンツを選択させるためのコンテンツ選択用
    情報を送信するコンテンツ選択システムにおいて、 上記クライアントは、入力された音声情報を上記ネット
    ワークを介して上記サーバに送信する入力情報送信手段
    と、上記サーバから上記ネットワークを介して上記コン
    テンツ選択用情報を受信して出力する出力手段とを備
    え、 上記サーバは、各コンテンツに関する1又は2以上の作
    成情報を各コンテンツごとに記憶する作成情報記憶手段
    と、上記クライアントから上記ネットワークを介して受
    信した音声情報と上記作成情報とに基づいて上記コンテ
    ンツ選択用情報を作成するコンテンツ選択用情報作成手
    段と、このコンテンツ選択用情報作成手段により作成さ
    れた上記コンテンツ選択用情報を上記クライアントにネ
    ットワークを介して送信するコンテンツ選択用情報送信
    手段とを備えることを特徴とするコンテンツ選択システ
    ム。
  2. 【請求項2】 上記クライアントは、上記入力情報送信
    手段に入力された上記音声情報について音声認識を行う
    音声認識手段を備え、 上記入力情報送信手段は、この音声認識手段により音声
    認識が行われた音声認識処理済みの音声情報を上記サー
    バに送信し、 上記コンテンツ選択用情報作成手段は、上記クライアン
    トから受信した上記音声認識処理済みの音声情報と上記
    作成情報とに基づいて、上記コンテンツ選択用情報を作
    成することを特徴とする請求項1記載のコンテンツ選択
    システム。
  3. 【請求項3】 上記サーバは、上記クライアントからネ
    ットワークを介して受信した上記音声情報について音声
    認識を行う音声認識手段を備え、 上記コンテンツ選択用情報作成手段は、この音声認識手
    段により音声認識が行われた音声情報と上記作成情報と
    に基づいて、上記コンテンツ選択用情報を作成すること
    を特徴とする請求項1記載のコンテンツ選択システム。
  4. 【請求項4】 上記作成情報記憶手段は、音声情報から
    なる作成情報を記憶し、 上記コンテンツ選択用情報作成手段は、音響的な特徴量
    における上記音声情報と上記作成情報記憶手段に記憶さ
    れた上記各作成情報との類似性を演算し、この類似性の
    値が所定の閾値を越えた作成情報に対応するコンテンツ
    の数が所定の数以上の場合には、上記音声情報とは異な
    る音声情報を取得して類似性の演算を繰り返し、上記類
    似性の値が所定の閾値を越えた上記作成情報に対応する
    上記コンテンツの数が所定の数未満の場合には、上記類
    似性の値が所定の閾値を越えた上記作成情報に対応する
    上記コンテンツについてのコンテンツ選択用情報を作成
    することを特徴とする請求項1記載のコンテンツ選択シ
    ステム。
  5. 【請求項5】 上記コンテンツ選択用情報作成手段は、
    音響的な特徴量における上記音声情報と上記作成情報記
    憶手段に記憶された上記各作成情報との類似性を演算
    し、この類似性の値が所定の閾値を越えた作成情報に対
    応するコンテンツの数が所定の数以上の場合には、上記
    各作成情報の範疇ごとのばらつきを演算し、このばらつ
    きが最も大きい範疇の作成情報に基づいてコンテンツ選
    択用情報を作成し、上記類似性の値が所定の閾値を越え
    た上記作成情報に対応する上記コンテンツの数が所定の
    数未満の場合には、上記類似性の値が所定の閾値を越え
    た上記作成情報に対応する上記コンテンツについてのコ
    ンテンツ選択用情報を作成することを特徴とする請求項
    1記載のコンテンツ選択システム。
  6. 【請求項6】 上記音声認識手段は、上記音声情報につ
    いての音声認識が正確に行われたのか否かを判定する判
    定手段を有し、この判定手段により正確に音声認識が行
    われたと判定された場合には、上記音声認識処理済みの
    音声情報を出力し、上記判定手段により正確に音声認識
    が行われなかったと判定された場合には、再度上記入力
    情報送信手段に入力された音声情報について音声認識を
    行って上記音声認識処理済みの音声情報を出力し、 上記入力情報送信手段は、上記音声認識手段により音声
    認識が行われた音声認識処理済みの音声情報を上記サー
    バに送信し、 上記コンテンツ選択用情報作成手段は、上記クライアン
    トから受信した上記音声認識処理済みの音声情報と上記
    作成情報とに基づいて、上記コンテンツ選択用情報を作
    成することを特徴とする請求項2記載のコンテンツ選択
    システム。
  7. 【請求項7】 上記音声認識手段は、上記音声情報につ
    いての音声認識が正確に行われたのか否かを判定する判
    定手段を有し、この判定手段により正確に音声認識が行
    われたと判定された場合には、上記音声認識処理済みの
    音声情報を出力し、上記判定手段により正確に音声認識
    が行われなかったと判定された場合には、再度上記クラ
    イアントからネットワークを介して受信した音声情報に
    ついて音声認識を行って上記音声認識処理済みの音声情
    報を出力し、 上記コンテンツ選択用情報作成手段は、上記音声認識手
    段により音声認識が行われた音声情報と上記作成情報と
    に基づいて、上記コンテンツ選択用情報を作成すること
    を特徴とする請求項3記載のコンテンツ選択システム。
  8. 【請求項8】 サーバからネットワークを介して送信さ
    れたコンテンツを選択させるためのコンテンツ選択用情
    報を出力するコンテンツ選択クライアントにおいて、 入力された音声情報を上記ネットワークを介して上記サ
    ーバに送信する入力情報送信手段と、 上記サーバから上記ネットワークを介して上記コンテン
    ツ選択用情報を受信して出力する出力手段とを備えるこ
    とを特徴とするコンテンツ選択クライアント。
  9. 【請求項9】 上記入力情報送信手段は、入力された上
    記音声情報について音声認識を行う音声認識手段を備
    え、この音声認識手段により音声認識が行われた音声認
    識処理済みの音声情報を上記サーバに送信することを特
    徴とする請求項8記載のコンテンツ選択クライアント。
  10. 【請求項10】 各コンテンツに関する1又は2以上の
    作成情報を各コンテンツごとに記憶する作成情報記憶手
    段と、 クライアントからネットワークを介して受信した音声情
    報と上記作成情報とに基づいて上記コンテンツを選択す
    るためのコンテンツ選択用情報を作成するコンテンツ選
    択用情報作成手段と、 このコンテンツ選択用情報作成手段により作成された上
    記コンテンツ選択用情報を上記クライアントにネットワ
    ークを介して送信するコンテンツ選択用情報送信手段と
    を備えることを特徴とするコンテンツ選択サーバ。
  11. 【請求項11】 上記クライアントからネットワークを
    介して受信した上記音声情報について音声認識を行う音
    声認識手段を備え、 上記コンテンツ選択用情報作成手段は、この音声認識手
    段により音声認識が行われた音声情報と上記作成情報と
    に基づいて、上記コンテンツ選択用情報を作成すること
    を特徴とする請求項10記載のコンテンツ選択サーバ。
  12. 【請求項12】 サーバは、各コンテンツに関する1又
    は2以上の作成情報をこの各コンテンツごとに記憶し、 クライアントは、入力された音声情報をネットワークを
    介して上記サーバに送信し、 上記サーバは、上記クライアントから上記ネットワーク
    を介して受信した音声情報と上記作成情報とに基づいて
    上記コンテンツを選択するためのコンテンツ選択用情報
    を作成し、この作成されたコンテンツ選択用情報を上記
    クライアントにネットワークを介して送信し、 上記クライアントは、上記サーバから上記ネットワーク
    を介して上記コンテンツ選択用情報を受信し、このコン
    テンツ選択用情報に基づいて選択することを要求するコ
    ンテンツ選択要求情報を出力することを特徴とするコン
    テンツ選択方法。
JP11056107A 1999-03-03 1999-03-03 コンテンツ選択システム、コンテンツ選択クライアント、コンテンツ選択サーバ及びコンテンツ選択方法 Abandoned JP2000250574A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP11056107A JP2000250574A (ja) 1999-03-03 1999-03-03 コンテンツ選択システム、コンテンツ選択クライアント、コンテンツ選択サーバ及びコンテンツ選択方法
US09/674,576 US7197455B1 (en) 1999-03-03 2000-03-03 Content selection system
PCT/JP2000/001304 WO2000052913A1 (fr) 1999-03-03 2000-03-03 Systeme de selection de contenu

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11056107A JP2000250574A (ja) 1999-03-03 1999-03-03 コンテンツ選択システム、コンテンツ選択クライアント、コンテンツ選択サーバ及びコンテンツ選択方法

Publications (1)

Publication Number Publication Date
JP2000250574A true JP2000250574A (ja) 2000-09-14

Family

ID=13017886

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11056107A Abandoned JP2000250574A (ja) 1999-03-03 1999-03-03 コンテンツ選択システム、コンテンツ選択クライアント、コンテンツ選択サーバ及びコンテンツ選択方法

Country Status (3)

Country Link
US (1) US7197455B1 (ja)
JP (1) JP2000250574A (ja)
WO (1) WO2000052913A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004265376A (ja) * 2002-09-30 2004-09-24 Mitsubishi Electric Research Laboratories Inc メモリに格納されたデータベースから録音物を選択する方法及び装置
JP2004333674A (ja) * 2003-05-02 2004-11-25 Sony Corp ネットワークシステム、電子機器端末およびサーバ装置並びにコンテンツの配信再生方法
JP2016218881A (ja) * 2015-05-25 2016-12-22 大日本印刷株式会社 電子図書館システム
US9812120B2 (en) 2008-04-23 2017-11-07 Sony Mobile Communications Inc. Speech synthesis apparatus, speech synthesis method, speech synthesis program, portable information terminal, and speech synthesis system
JP2019133165A (ja) * 2013-01-07 2019-08-08 三星電子株式会社Samsung Electronics Co.,Ltd. 対話型サーバ、ディスプレイ装置及びその制御方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060287863A1 (en) * 2005-06-16 2006-12-21 International Business Machines Corporation Speaker identification and voice verification for voice applications
US9865240B2 (en) * 2006-12-29 2018-01-09 Harman International Industries, Incorporated Command interface for generating personalized audio content
US9569770B1 (en) 2009-01-13 2017-02-14 Amazon Technologies, Inc. Generating constructed phrases
US9298700B1 (en) 2009-07-28 2016-03-29 Amazon Technologies, Inc. Determining similar phrases
US10007712B1 (en) 2009-08-20 2018-06-26 Amazon Technologies, Inc. Enforcing user-specified rules
US8799658B1 (en) * 2010-03-02 2014-08-05 Amazon Technologies, Inc. Sharing media items with pass phrases
CN105023575B (zh) * 2014-04-30 2019-09-17 中兴通讯股份有限公司 语音识别方法、装置和系统

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06133039A (ja) * 1992-10-16 1994-05-13 Oki Electric Ind Co Ltd 気象情報自動案内装置
JPH08314950A (ja) * 1995-05-12 1996-11-29 Fujitsu Ltd テキストの検索方法及び装置
JP2988378B2 (ja) * 1996-06-05 1999-12-13 日本電気株式会社 音声/fax情報提供システムと提供方法
US5732216A (en) * 1996-10-02 1998-03-24 Internet Angles, Inc. Audio message exchange system
US6167117A (en) * 1996-10-07 2000-12-26 Nortel Networks Limited Voice-dialing system using model of calling behavior
US5915001A (en) * 1996-11-14 1999-06-22 Vois Corporation System and method for providing and using universally accessible voice and speech data files
AU6240398A (en) * 1997-01-14 1998-08-03 Benjamin Slotznick System for calculating occasion dates and converting between different calendar systems, and intelligent agent for using same
US5899975A (en) * 1997-04-03 1999-05-04 Sun Microsystems, Inc. Style sheets for speech-based presentation of web pages
US6240405B1 (en) * 1997-04-17 2001-05-29 Casio Computer Co., Ltd. Information processors having an agent function and storage mediums which contain processing programs for use in the information processor
US5999940A (en) * 1997-05-28 1999-12-07 Home Information Services, Inc. Interactive information discovery tool and methodology
US6282512B1 (en) * 1998-02-05 2001-08-28 Texas Instruments Incorporated Enhancement of markup language pages to support spoken queries
US6226618B1 (en) * 1998-08-13 2001-05-01 International Business Machines Corporation Electronic content delivery system
US6385583B1 (en) * 1998-10-02 2002-05-07 Motorola, Inc. Markup language for interactive services and methods thereof
US6185535B1 (en) * 1998-10-16 2001-02-06 Telefonaktiebolaget Lm Ericsson (Publ) Voice control of a user interface to service applications
US6408128B1 (en) * 1998-11-12 2002-06-18 Max Abecassis Replaying with supplementary information a segment of a video
US6707889B1 (en) * 1999-08-24 2004-03-16 Microstrategy Incorporated Multiple voice network access provider system and method
US20020072915A1 (en) * 1999-12-29 2002-06-13 Bower Ian L. Hyperspeech system and method

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004265376A (ja) * 2002-09-30 2004-09-24 Mitsubishi Electric Research Laboratories Inc メモリに格納されたデータベースから録音物を選択する方法及び装置
JP2004333674A (ja) * 2003-05-02 2004-11-25 Sony Corp ネットワークシステム、電子機器端末およびサーバ装置並びにコンテンツの配信再生方法
CN1627672B (zh) * 2003-05-02 2010-10-13 索尼株式会社 网络系统,电子设备终端,服务器装置及分配和再现方法
US8065382B2 (en) 2003-05-02 2011-11-22 Sony Corporation Network system, electronic equipment terminal, server apparatus and method for distributing and reproducing the contents
US9812120B2 (en) 2008-04-23 2017-11-07 Sony Mobile Communications Inc. Speech synthesis apparatus, speech synthesis method, speech synthesis program, portable information terminal, and speech synthesis system
US10720145B2 (en) 2008-04-23 2020-07-21 Sony Corporation Speech synthesis apparatus, speech synthesis method, speech synthesis program, portable information terminal, and speech synthesis system
JP2019133165A (ja) * 2013-01-07 2019-08-08 三星電子株式会社Samsung Electronics Co.,Ltd. 対話型サーバ、ディスプレイ装置及びその制御方法
JP2016218881A (ja) * 2015-05-25 2016-12-22 大日本印刷株式会社 電子図書館システム

Also Published As

Publication number Publication date
WO2000052913A1 (fr) 2000-09-08
US7197455B1 (en) 2007-03-27

Similar Documents

Publication Publication Date Title
US20080026355A1 (en) Song lyrics download for karaoke applications
JP2009112000A6 (ja) 実時間対話型コンテンツを無線交信ネットワーク及びインターネット上に形成及び分配する方法及び装置
US20020033090A1 (en) System and method for assisting in composing music by means of musical template data
CN108074557A (zh) 音调调整方法、装置及存储介质
KR20090108643A (ko) 네트워크 휴대용 장치에서의 특징 추출
JP2000250574A (ja) コンテンツ選択システム、コンテンツ選択クライアント、コンテンツ選択サーバ及びコンテンツ選択方法
WO2006033835A2 (en) Method of identifying media content contemporaneous with broadcast
JP2002108351A (ja) 音楽データ配信装置、音楽データ配信方法および音楽データ配信プログラムを格納したコンピュータ読み取り可能な記録媒体
JP2000268047A (ja) 情報提供システム、クライアント、情報提供サーバ及び情報提供方法
CN100476813C (zh) 一种音乐、铃声搜索和下载方法及系统
JP2007164878A (ja) 楽曲コンテンツ再生装置、楽曲コンテンツ再生方法および楽曲コンテンツ配信再生システム
CN100379198C (zh) 内容再现设备、服务器及内容分发系统
JP2003091291A (ja) カラオケシステム、カラオケ装置およびカラオケシステムのサーバ装置
WO2001097123A1 (en) Method and system for group-composition in internet, and business method therefor
WO2005039212A1 (en) Downloading system of self music file and method thereof
JP2000259183A (ja) 情報提供システム、クライアント、情報提供サーバ及び情報提供方法
JP2005004604A (ja) コンテンツ受信装置およびコンテンツ配信方法
JP2002123272A (ja) 音楽データ配信システム、サーバ装置、情報端末装置、並びに音楽データ配信方法
JP2000216888A (ja) 情報提供システム、情報提供クライアント、情報提供サ―バ及び情報提供方法
JP4574299B2 (ja) 音楽再生装置
JP2002341880A (ja) 音楽データ配信システム
MX2010009048A (es) Metodo, aparato, sistema y equipo de usuario para procesamiento de tonos de espera de llamada con melodia.
JP2002373075A (ja) 音声メッセージ掲示板システム、情報処理端末、サーバ、および音声メッセージ発信方法
JP2000284791A (ja) 情報提供システム、クライアント、情報提供サーバ、情報提供方法及び記録媒体
JP2019159099A (ja) 楽曲再生システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090331

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090529

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20090902