JP6317235B2 - コンテンツサーバ装置、コンテンツサーバ装置の動作方法およびコンピュータプログラム - Google Patents

コンテンツサーバ装置、コンテンツサーバ装置の動作方法およびコンピュータプログラム Download PDF

Info

Publication number
JP6317235B2
JP6317235B2 JP2014226619A JP2014226619A JP6317235B2 JP 6317235 B2 JP6317235 B2 JP 6317235B2 JP 2014226619 A JP2014226619 A JP 2014226619A JP 2014226619 A JP2014226619 A JP 2014226619A JP 6317235 B2 JP6317235 B2 JP 6317235B2
Authority
JP
Japan
Prior art keywords
content
noise
client device
bit rate
quality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014226619A
Other languages
English (en)
Other versions
JP2016090871A (ja
Inventor
えりか 足利
えりか 足利
丈二 中山
丈二 中山
山田 智広
智広 山田
滋 藤村
滋 藤村
麻衣子 井元
麻衣子 井元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014226619A priority Critical patent/JP6317235B2/ja
Publication of JP2016090871A publication Critical patent/JP2016090871A/ja
Application granted granted Critical
Publication of JP6317235B2 publication Critical patent/JP6317235B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Telephonic Communication Services (AREA)

Description

本発明は、コンテンツを再生するクライアント装置の周囲の雑音状況に応じてコンテンツの品質を低下させつつもユーザの主観品質を損なわない程度にコンテンツの品質を担保することができるコンテンツサーバ装置、コンテンツサーバ装置の動作方法およびコンピュータプログラムに関する。
近年では、スマートフォンやタブレットに代表される携帯端末の高性能化と、通信回線の高速化により、インターネットを介したコンテンツ配信サービスにおいて、コンテンツの高品質化が進んでいる。例えば、ハイレゾリューションオーディオと呼ばれる高解像度の楽曲配信である。高品質なコンテンツは大容量であるが、一般的な携帯端末は例えばHDD (Hard Disk Drive) のような大容量の記憶装置を搭載していないため、高品質なコンテンツを携帯端末へ配信する場合、インターネット上のコンテンツサーバから通信回線経由でストリーミング配信し、携帯端末で受信及び再生することが通常である。
従来の技術では、通信回線経由でコンテンツをストリーミング配信する際には、通信帯域や携帯端末が受信する電波強度など、コンテンツを受信する携帯端末の通信品質を考慮することでコンテンツの品質を制御していた。特許文献1では、配信ストリームの再送要求などの配信品質情報をリアルタイムに把握し、ストリーム配信装置のアクセス数の制限や配信経路の変更及び優先する配信先を決定し品質制御を行うことで、品質が劣化してしまうクライアント装置数の削減を可能としている。
特開2003−258885号公報
従来では、通信品質が良好であれば、ユーザの視聴環境に依らずに高品質のコンテンツを配信していた。しかし、ユーザが感じる品質(主観品質)は周囲の環境に影響を受ける。例えば、街中など周囲に騒音が存在する環境下ではハイレゾリューションオーディオのような高解像度な楽曲と、ビットレートを落としたCD音源と同程度の楽曲の主観品質は変わらない場合がある。そのような環境において高解像度な楽曲を配信すると、主観品質は低下するにも関わらずサーバのCPUやネットワーク帯域を余分に消費し、同時接続クライアント数が限られてしまう。
本発明は、上記の課題に鑑みてなされたものであり、その目的とするところは、コンテンツを再生するクライアント装置の周囲の雑音状況に応じてコンテンツの品質を低下させつつもユーザの主観品質を損なわない程度にコンテンツの品質を担保することができるコンテンツサーバ装置、コンテンツサーバ装置の動作方法およびコンテンツサーバ装置としてコンピュータを機能させるためのコンピュータプログラムを提供することにある。
上記課題を解決するために、第1の本発明は、クライアント装置に音声のコンテンツを送信するコンテンツサーバ装置であって、コンテンツごとに当該コンテンツの品質を含む属性情報を記憶するコンテンツ属性情報データベースと、前記クライアント装置の周囲の雑音について設定された雑音状況に、当該雑音が当該雑音状況に対応する場合においてクライアント装置で再生すべきコンテンツの品質対応づけて記憶するコンテンツ品質情報記憶部と、前記クライアント装置の周囲の雑音を含む音声データを当該クライアント装置から受信し、当該音声データから当該雑音の状況である雑音状況を検出し、前記クライアント装置から取得した検索キーに対応するコンテンツを前記コンテンツ属性情報データベースから検索する音声データ処理部と、前記クライアント装置のユーザの所望の品質を示すクライアント情報を、前記クライアント装置から受信するクライアント情報受信手段と、前記クライアント情報により示される品質と前記検出された雑音状況に対応する品質の少なくとも一方が、前記検索されたコンテンツの品質より低い場合、前記検索されたコンテンツを、前記クライアント情報により示される品質と前記検出された雑音状況に対応する品質のうちの低い方の品質に変換して出力する品質変換部と、前記品質変換部により出力されたコンテンツを、前記クライアント装置に送信するコンテンツ送信部とを備えることを特徴とする。
第2の本発明は、クライアント装置に音声のコンテンツを送信するコンテンツサーバ装置であって、コンテンツごとに、当該コンテンツのビットレートを含む属性情報を記憶するコンテンツ属性情報データベースと、前記クライアント装置の周囲の雑音について設定された雑音状況に、当該雑音が当該雑音状況に対応する場合においてクライアント装置で再生すべきコンテンツのビットレートを対応づけて記憶するコンテンツ品質情報記憶部と、前記クライアント装置の周囲の雑音を含む音声データを当該クライアント装置から受信し、当該音声データから当該雑音の状況である雑音状況を検出し、前記クライアント装置から取得した検索キーに対応するコンテンツを前記コンテンツ属性情報データベースから検索する音声データ処理部と、前記検索されたコンテンツのビットレートが、前記検出された雑音状況に対応するビットレートよりも高い場合、前記検索されたコンテンツのビットレートを、前記検出された雑音状況に対応するビットレートに変換して出力し、前記検索されたコンテンツのビットレートが、前記検出された雑音状況に対応するビットレートよりも低い場合、前記検索されたコンテンツのビットレートを変換することなく出力する品質変換部と、前記品質変換部により出力されたコンテンツを、前記クライアント装置に送信するコンテンツ送信部とを備えることを特徴とする。
第3の本発明は、クライアント装置に音声のコンテンツを送信するコンテンツサーバ装置であって、コンテンツごとに、当該コンテンツのビットレートを含む属性情報を記憶するコンテンツ属性情報データベースと、前記クライアント装置の周囲の雑音について設定された雑音状況に、当該雑音が当該雑音状況に対応する場合においてクライアント装置で再生すべきコンテンツのビットレートを対応づけて記憶するコンテンツ品質情報記憶部と、前記クライアント装置の周囲の雑音を含む音声データを当該クライアント装置から受信し、当該音声データから当該雑音の状況であって、前記クライアント装置の周囲の雑音の周波数特性を含む雑音状況を検出し、前記クライアント装置から取得した検索キーに対応するコンテンツを前記コンテンツ属性情報データベースから検索する音声データ処理部と、前記クライアント装置のユーザの所望の品質を示すクライアント情報により示されるビットレートが前記検索されたコンテンツのビットレートよりも高い場合、前記周波数特性が所定レベルより高い値を示す周波数帯について、前記コンテンツの音を増幅し、前記クライアント情報により示されるビットレートが前記検索されたコンテンツのビットレートより低い場合、前記周波数特性が所定のレベルより高い値を示す周波数帯について、前記コンテンツの音を減衰し、前記クライアント情報により示されるビットレートと前記検出された雑音状況に対応するビットレートの少なくとも一方が、前記検索されたコンテンツのビットレートより低い場合、前記検索されたコンテンツ、或いは所定の周波数帯について増幅または減衰されたコンテンツを、前記クライアント情報により示されるビットレートと前記検出された雑音状況に対応するビットレートのうちの低い方のビットレートに変換して出力する品質変換部と、前記品質変換部により出力されたコンテンツを、前記クライアント装置に送信するコンテンツ送信部とを備えることを特徴とする。
第4の本発明は、クライアント装置に音声のコンテンツを送信するコンテンツサーバ装置の動作方法であって、前記コンテンツサーバ装置は、コンテンツごとに、当該コンテンツの品質を含む属性情報を記憶するコンテンツ属性情報データベースと、前記クライアント装置の周囲の雑音について設定された雑音状況に、当該雑音が当該雑音状況に対応する場合においてクライアント装置で再生すべきコンテンツの品質を対応づけて記憶するコンテンツ品質情報記憶部とを備え、前記動作方法は、前記コンテンツサーバ装置が、前記クライアント装置の周囲の雑音を含む音声データを当該クライアント装置から受信し、当該音声データから当該雑音の状況である雑音状況を検出し、前記クライアント装置から取得した検索キーに対応するコンテンツを前記コンテンツ属性情報データベースから検索するステップと、前記コンテンツサーバ装置が、前記クライアント装置のユーザの所望の品質を示すクライアント情報を、前記クライアント装置から受信するステップと、前記コンテンツサーバ装置が、前記クライアント情報により示される品質と前記検出された雑音状況に対応する品質の少なくとも一方が、前記検索されたコンテンツの品質より低い場合、前記検索されたコンテンツを、前記クライアント情報により示される品質と前記検出された雑音状況に対応する品質のうちの低い方の品質に変換して出力するステップと、前記出力するステップにより出力されたコンテンツを、前記クライアント装置に送信するステップを備えることを特徴とする。
第5の本発明は、クライアント装置に音声のコンテンツを送信するコンテンツサーバ装置の動作方法であって、前記コンテンツサーバ装置は、コンテンツごとに、当該コンテンツのビットレートを含む属性情報を記憶するコンテンツ属性情報データベースと、前記クライアント装置の周囲の雑音について設定された雑音状況に、当該雑音が当該雑音状況に対応する場合においてクライアント装置で再生すべきコンテンツのビットレートを対応づけて記憶するコンテンツ品質情報記憶部とを備え、前記動作方法は、前記コンテンツサーバ装置が、前記クライアント装置の周囲の雑音を含む音声データを当該クライアント装置から受信し、当該音声データから当該雑音の状況である雑音状況を検出し、前記クライアント装置から取得した検索キーに対応するコンテンツを前記コンテンツ属性情報データベースから検索するステップと、前記コンテンツサーバ装置が、前記検索されたコンテンツのビットレートが、前記検出された雑音状況に対応するビットレートよりも高い場合、前記検索されたコンテンツのビットレートを、前記検出された雑音状況に対応するビットレートに変換して出力し、前記検索されたコンテンツのビットレートが、前記検出された雑音状況に対応するビットレートよりも低い場合、前記検索されたコンテンツのビットレートを変換することなく出力するステップと、前記出力するステップにより出力されたコンテンツを、前記クライアント装置に送信するステップを備えることを特徴とする。
第6の本発明は、クライアント装置に音声のコンテンツを送信するコンテンツサーバ装置の動作方法であって、前記コンテンツサーバ装置は、コンテンツごとに、当該コンテンツのビットレートを含む属性情報を記憶するコンテンツ属性情報データベースと、前記クライアント装置の周囲の雑音について設定された雑音状況に、当該雑音が当該雑音状況に対応する場合においてクライアント装置で再生すべきコンテンツのビットレートを対応づけて記憶するコンテンツ品質情報記憶部とを備え、前記動作方法は、前記コンテンツサーバ装置が、前記クライアント装置の周囲の雑音を含む音声データを当該クライアント装置から受信し、当該音声データから当該雑音の状況であって、前記クライアント装置の周囲の雑音の周波数特性を含む雑音状況を検出し、前記クライアント装置から取得した検索キーに対応するコンテンツを前記コンテンツ属性情報データベースから検索するステップと、前記コンテンツサーバ装置が、前記クライアント装置のユーザの所望の品質を示すクライアント情報により示されるビットレートが前記検索されたコンテンツのビットレートよりも高い場合、前記周波数特性が所定レベルより高い値を示す周波数帯について、前記コンテンツの音を増幅し、前記クライアント情報により示されるビットレートが前記検索されたコンテンツのビットレートより低い場合、前記周波数特性が所定のレベルより高い値を示す周波数帯について、前記コンテンツの音を減衰し、前記クライアント情報により示されるビットレートと前記検出された雑音状況に対応するビットレートの少なくとも一方が、前記検索されたコンテンツのビットレートより低い場合、前記検索されたコンテンツ、或いは所定の周波数帯について増幅または減衰されたコンテンツを、前記クライアント情報により示されるビットレートと前記検出された雑音状況に対応するビットレートのうちの低い方のビットレートに変換して出力するステップと、前記出力するステップにより出力されたコンテンツを、前記クライアント装置に送信するステップを備えることを特徴とする。
第7の本発明は、第1の本発明ないし第3の発明等のコンテンツサーバ装置としてコンピュータを機能させるためのコンピュータプログラムである。
本発明によれば、コンテンツを再生するクライアント装置の周囲の雑音状況に応じてコンテンツの品質を低下させつつもユーザの主観品質を損なわない程度にコンテンツの品質を担保することができる。
第1の実施の形態に係るコンテンツサーバ装置を含むコンピュータネットワークシステムの構成を示す図である。 コンテンツ属性情報データベース11の構成の一例を示す図である。 コンテンツ品質情報記憶部131の構成の一例を示す図である。 第1の実施の形態における音声入力部21、配信コンテンツ確定部22、音声データ処理部12の処理の流れを示すフローチャートである。 第1の実施の形態におけるコンテンツ処理部13、コンテンツ再生部23の処理の流れを示すフローチャートである。 第2の実施の形態に係るコンテンツサーバ装置を含むコンピュータネットワークシステムの構成を示す図である。 クライアント情報記憶部14の構成の一例を示す図である。 クライアント情報送信部24、クライアント情報受信部15の処理の流れを示すフローチャートである。 第2の実施の形態におけるコンテンツ処理部13、コンテンツ再生部23の処理の流れを示すフローチャートである。
以下、本発明の実施の形態について図面を参照して説明する。
[第1の実施の形態]
図1は、第1の実施の形態に係るコンテンツサーバ装置を含むコンピュータネットワークシステムの構成を示す図である。
コンテンツサーバ装置1は、インターネットなどを介して、例えば複数のクライアント装置2に接続される。コンテンツサーバ装置1は、クライアント装置2に音声のコンテンツを送信するものである。
コンテンツサーバ装置1は、コンテンツの属性情報を記憶するコンテンツ属性情報データベース11、クライアント装置2から受信する音声データを処理する音声データ処理部12、コンテンツを処理するコンテンツ処理部13を備える。
音声データ処理部12は、クライアント装置2の周囲の雑音状況を音声データから検出する雑音状況検出部121、コンテンツを検索するための検索キーを音声データから検出する検索キー検出部122を備える。
コンテンツ処理部13は、雑音状況ごとにコンテンツの品質情報を記憶するコンテンツ品質情報記憶部131、コンテンツの品質を変換する品質変換部132、コンテンツをクライアント装置2に送信するコンテンツ送信部133を備える。
クライアント装置2は、ユーザが発した音声と周囲の音声(雑音)を入力する音声入力部21、送信されるコンテンツを確定させる配信コンテンツ確定部22、送信されたコンテンツを再生するコンテンツ再生部23を備える。
図2は、コンテンツ属性情報データベース11の構成の一例を示す図である。
コンテンツ属性情報データベース11には、複数のコンテンツのそれぞれにつき、コンテンツの識別情報であるコンテンツID、コンテンツの属性情報、コンテンツの品質情報が予め記憶される。
コンテンツの属性情報は、コンテンツのコンテンツ名、再生時間の長さ、アーティスト名、アルバム名、ジャンル名、リリース日などを含む。
コンテンツの品質情報は、コンテンツのビットレートなどを含む。
図3は、コンテンツ品質情報記憶部131の構成の一例を示す図である。
コンテンツ品質情報記憶部131には、クライアント装置2の周囲の雑音について設定された雑音状況ごとに当該雑音が当該雑音状況に対応する場合においてクライアント装置2で再生すべきコンテンツの品質を示す品質情報が当該雑音状況に対応づけて記憶される。 雑音状況は、ここでは、クライアント装置の周囲の雑音の雑音レベルとする。
品質情報は、ここでは、ビットレートで表され、ビットレートは、コンテンツのビット深度(デジタル信号の離散信号1つあたりの情報量)、サンプリングレート(単位時間あたりにサンプルを採る頻度)、コンテンツの圧縮の有無、圧縮の方法などにより決まる。
図4は、第1の実施の形態における音声入力部21、配信コンテンツ確定部22、音声データ処理部12の処理の流れを示すフローチャートである。
S1:クライアント装置2において、ユーザが所望のコンテンツを検索するための検索キー(例えば、アーティスト名とコンテンツ名)を音声で発すると、音声入力部21は、この音声(検索キー)と周囲の音声(雑音)を入力し、これをディジタル化することで、音声データに変換し、コンテンツサーバ装置1に送信する。
S3:コンテンツサーバ装置1の音声データ処理部12は、音声データを受信し、音声データにおける音声(検索キー)の区間を検出し、その区間の音声データを検索キー検出部122に送信し、それ以外の区間、すなわち雑音の区間の音声データを雑音状況検出部121に送信する。音声(検索キー)の区間では、雑音の区間より音声のレベルが高いので、かかるレベル差を利用して音声(検索キー)の区間を検出できる。なお、検出方法は、この方法に限らない。
S5:雑音状況検出部121は、雑音の区間の音声データに基づき当該雑音のレベル(雑音レベル)を検出し、雑音レベルをコンテンツ処理部13に通知し、処理を終える。ここでは、雑音状況検出部121は、例えば、音声データで示されるパワーレベルを雑音レベルとする。
S7:検索キー検出部122は、音声(検索キー)の区間の音声データに基づき検索キーを検出する。検索キー検出部122は、例えば、音声データを予め記憶した音響モデル、単語発音モデル、言語モデルなどと照合し、確からしい単語や文を組み立て、これを検索キーとする。なお、検出方法は、この方法に限らない。例えば、文字データである検索キーをクライアント装置2から受信してもよい。すなわち、コンテンツサーバ装置1は、クライアント装置2から検索キーを取得すればよい。
S9:検索キー検出部122は、コンテンツ属性情報データベース11から、検出された検索キーに対応する属性情報を検索し、例えば、対応の程度の高い上位n件の属性情報とコンテンツIDを含む検索結果リストを作成し、検索結果リストをクライアント装置2に送信する。
S11:クライアント装置2は、検索結果リストをクライアント装置2の画面(図示せず)などに表示し、その中の1つのコンテンツ名などを選択するようにユーザを促す。選択されない場合は(S11:NO)、ステップS1に戻る。
S13:選択された場合は(S11:YES)、配信コンテンツ確定部22が、対応するコンテンツIDをコンテンツサーバ装置1のコンテンツ処理部13に送信し、処理を終える。
図5は、第1の実施の形態におけるコンテンツ処理部13、コンテンツ再生部23の処理の流れを示すフローチャートである。
S21:コンテンツ処理部13の品質変換部132は、コンテンツ属性情報データベース11から、送信されたコンテンツIDに対応する品質情報(ビットレート)を読み出し、コンテンツIDに対応するコンテンツを取得する。以下、このビットレートをビットレートBという。
S23:品質変換部132は、また、コンテンツ品質情報記憶部131から、通知された雑音レベル(雑音状況)に対応する品質情報(ビットレート)を読み出す。以下、このビットレートCという。
S25:品質変換部132は、次に、ビットレートB、Cを比較する。
S27:品質変換部132は、ビットレートCがビットレートB未満なら(S25:C<B)、取得したコンテンツを変換し且つ変換後のビットレートをビットレートCに一致させる。
S29:コンテンツ送信部133は、S27での変換後のコンテンツまたは、ビットレートCがビットレートB以上の場合においては(S25:C≧B)、S21で取得されたコンテンツをクライアント装置2に送信する。
S31:クライアント装置2のコンテンツ再生部23は、送信されたコンテンツを受信およびストリーミング再生し、処理を終える。
したがって、第1の実施の形態に係るコンテンツサーバ装置1によれば、コンテンツごとに当該コンテンツの属性情報を記憶するコンテンツ属性情報データベース11と、クライアント装置2の周囲の雑音について設定された雑音状況ごとに当該雑音が当該雑音状況に対応する場合においてクライアント装置2で再生すべきコンテンツの品質を示す品質情報を当該雑音状況に対応づけて記憶するコンテンツ品質情報記憶部131と、クライアント装置2の周囲の雑音を含む音声データを当該クライアント装置から受信し(S3)、当該音声データから当該雑音の状況である雑音状況を検出し(S5、S7)、クライアント装置から取得した検索キーに対応する属性情報をコンテンツ属性情報データベース11から検索する(S9)音声データ処理部12と、コンテンツ品質情報記憶部131から、当該検出された雑音状況に対応する品質情報を読み出し(S23)、検索された属性情報に対応するコンテンツをクライアント装置2に送信する際の品質を当該品質情報に基づいて決定する(S25、S27)手段とを備えるので、クライアント装置2の周囲の雑音状況に応じてコンテンツの品質を低下させつつもユーザの主観品質を損なわない程度にコンテンツの品質を担保することができる。その結果、コンテンツサーバ装置1の処理能力やネットワーク帯域を節約し、クライアント装置2の数の増加を図ることができる。
また、コンテンツ品質情報記憶部131の雑音状況は、クライアント装置2の周囲の雑音についての雑音レベルであり、検出される雑音状況は、クライアント装置2の周囲の雑音の雑音レベルであり、検出された雑音状況に対応する品質情報を読み出し(S23)、クライアント装置2に送信する際のコンテンツの品質を、読み出した品質情報に基づいて決定する(S25、S27)ので、クライアント装置2の周囲の雑音レベルに応じてコンテンツの品質を低下させつつもユーザの主観品質を損なわない程度にコンテンツの品質を担保することができる。
[第2の実施の形態]
次に、本発明の第2の実施の形態について説明する。第2の実施の形態では、第1の実施の形態に同一または類似の装置および装置構成を用い、同一または類似のものについては第1の実施の形態で使用した符号を使用して重複説明を略し、第1の実施の形態とは異なる事項を中心に説明を行う。
図6は、第2の実施の形態に係るコンテンツサーバ装置を含むコンピュータネットワークシステムの構成を示す図である。
コンテンツサーバ装置1Aは、インターネットなどを介して、例えば複数のクライアント装置2Aに接続される。コンテンツサーバ装置1Aは、クライアント装置2Aに音声のコンテンツを送信するものである。
コンテンツサーバ装置1Aは、コンテンツサーバ装置1と同様に、コンテンツ属性情報データベース11、音声データ処理部12、コンテンツ処理部13を備え、さらに、クライアント装置2Aのユーザによる所望の品質を示すクライアント情報を記憶するクライアント情報記憶部14、クライアント情報をクライアント装置2Aから受信するクライアント情報受信部15を備える。
クライアント装置2Aは、クライアント装置2と同様に、音声入力部21、配信コンテンツ確定部22、コンテンツ再生部23を備え、さらに、クライアント情報をコンテンツサーバ装置1Aに送信するクライアント情報送信部24を備える。
図7は、クライアント情報記憶部14の構成の一例を示す図である。
クライアント情報記憶部14には、各クライアント装置2Aにつき、クライアントID、クライアント装置2Aのユーザによる所望の品質を示す要求品質を含むクライアント情報が記憶される。
図8は、クライアント情報送信部24、クライアント情報受信部15の処理の流れを示すフローチャートである。
クライアント情報送信部24は、例えば、コンテンツ再生部23で再生可能なコンテンツの最大のビットレート以下を条件として、複数のビットレートを選択肢として、画面(図示せず)などに表示し、所望のビットレートを選択するようにユーザを促す。ユーザは、例えば、コンテンツを高音質で再生したい場合は高いビットレートを選択し、一方、インターネットなどが混雑している場合は低いビットレートを選択する。なお、先にユーザがビットレートを入力し、これがコンテンツ再生部23で再生可能なコンテンツの最大のビットレート以下であることを確認してもよい。
S41:クライアント情報送信部24は、選択または入力されたビットレート(要求品質)とクライアントIDを含むクライアント情報をコンテンツサーバ装置1Aに送信する。
S43:コンテンツサーバ装置1Aのクライアント情報受信部15は、クライアント情報を受信し、クライアント情報記憶部14に記憶させ、処理を終える。
音声入力部21、配信コンテンツ確定部22、音声データ処理部12の処理の流れは、以下の点を除いては、図4に示したものと同様である。
すなわち、S5では、雑音状況検出部121は、雑音の区間の音声データに基づき当該雑音の雑音レベルを検出し、さらに、音声データに基づき雑音の周波数特性を検出し、雑音レベルと周波数特性をコンテンツ処理部13に通知し、処理を終える。雑音状況検出部121は、典型的には、音声データをフーリエ変換し、周波数とエネルギーの関係を示すパワースペクトルを求め、これを周波数特性とする。
図9は、第2の実施の形態におけるコンテンツ処理部13、コンテンツ再生部23の処理の流れを示すフローチャートである。
S51:品質変換部132は、クライアント情報記憶部14から、図4のS1で送信された音声データの送信元を示すクライアントIDを含むクライアント情報を検索し、クライアント情報から要求品質(ビットレート)を読み出す。以下、このビットレートをビットレートAという。
S52:品質変換部132は、コンテンツ属性情報データベース11から、送信されたコンテンツIDに対応する品質情報(ビットレート)を読み出し、コンテンツIDに対応するコンテンツを取得する。以下、このビットレートをビットレートBという。
S55:品質変換部132は、ビットレートA、Bを比較する。
S57:品質変換部132は、ビットレートAがビットレートBより高い場合(S55:A>B)は、周波数特性において、所定のレベルより高い値を示す周波数帯を検出し、読み出したコンテンツにおいて、検出された周波数帯の音を増幅する。
S59:品質変換部132は、ビットレートAがビットレートBより低い場合(S55:A<B)は、周波数特性において、前述の所定のレベルより高い値を示す周波数帯を検出し、コンテンツにおいて、検出された周波数帯の音を減衰させる。
S57、S59の処理後、または、ビットレートA、Bが同じなら(S55:A=B)、S61に進む。
S61:品質変換部132は、コンテンツ品質情報記憶部131から、通知された雑音レベル(雑音状況)に対応する品質情報(ビットレート)を読み出す。以下、このビットレートをビットレートCという。
S63、S65:品質変換部132は、ビットレートA、B、Cの中でビットレートBが最低でない場合に、つまり、ビットレートA、Cの少なくとも一方がビットレートBより低い場合に限っては(S63:YES)、S57の増幅またはS59の減衰後のコンテンツ、または、ビットレートA、Bが同じ場合(S55:A=B)における、S51で取得されたコンテンツを変換し且つ変換後のビットレートをビットレートA、Cの低い方に一致させる。
S67:コンテンツ送信部133は、S65での変換後のコンテンツ、または、ビットレートA、B、Cの中でビットレートBが最低である場合(S63:NO)においては、S57の増幅またはS59の減衰後のコンテンツまたは、S51で取得されたコンテンツをクライアント装置2Aに送信する。
S69:クライアント装置2のコンテンツ再生部23は、送信されたコンテンツを受信およびストリーミング再生し、処理を終える。
したがって、第2の実施の形態に係るコンテンツサーバ装置1Aによれば、コンテンツ品質情報記憶部131の雑音状況は、クライアント装置2の周囲の雑音についての雑音レベルであり、検出される雑音状況は、クライアント装置2の周囲の雑音の雑音レベルと周波数特性であり、検出された雑音状況に対応する品質情報を読み出し(S61)、クライアント装置2に送信する際のコンテンツの品質を、読み出した品質情報と当該周波数特性に基づいて決定する(S55、S57、S59、S63、S65)ので、クライアント装置2の周囲の雑音レベルに応じてコンテンツの品質を低下させつつもユーザの主観品質を損なわない程度にコンテンツの品質を担保することができ、周波数特性に基づいて、特定の周波数帯の音を増幅または減衰させることができる。
また、コンテンツサーバ装置1Aは、クライアント装置2のユーザによる所望の品質を示すクライアント情報をクライアント装置2から受信するクライアント情報受信部15を備え、コンテンツ属性情報データベース11は、コンテンツごとに当該コンテンツの品質を示す品質情報(ビットレートB)を記憶するものであり、コンテンツ属性情報データベース11から、検索された属性情報に対応するコンテンツに対応する品質情報(ビットレートB)を読み出し(S52)、クライアント情報により示される品質(ビットレートA)と検出された雑音状況に対応する品質情報により示される品質(ビットレートC)の少なくとも一方が、検索された属性情報に対応するコンテンツに対応する品質情報により示される品質(ビットレートB)より低い場合(S63:YES)は、検索された属性情報に対応するコンテンツを変換し且つ変換後の品質を、クライアント情報により示される品質(ビットレートA)と、検出された雑音状況に対応する品質情報により示される品質(ビットレートC)の低い方に一致させる(S65)ので、ユーザの主観品質を損なわない程度にコンテンツの品質を担保しつつ、さらに品質を低下させることができる。その結果、コンテンツサーバ装置1の処理能力やネットワーク帯域を一層節約し、クライアント装置2の数の一層の増加を図ることができる。
なお、コンテンツサーバ装置1やコンテンツサーバ装置1Aとしてコンピュータを機能させるためのコンピュータプログラムは、半導体メモリ、磁気ディスク、光ディスク、光磁気ディスク、磁気テープなどのコンピュータ読み取り可能な記録媒体に記録でき、また、インターネットなどの通信網を介して伝送させて、広く流通させることができる。
1、1A…コンテンツサーバ装置
2、2A…クライアント装置
11…コンテンツ属性情報データベース
12…音声データ処理部
13…コンテンツ処理部
14…クライアント情報記憶部
15…クライアント情報受信部
21…音声入力部
22…配信コンテンツ確定部
23…コンテンツ再生部
24…クライアント情報送信部
121…雑音状況検出部
122…検索キー検出部
131…コンテンツ品質情報記憶部
132…品質変換部
133…コンテンツ送信部
A、B、C…ビットレート

Claims (7)

  1. クライアント装置に音声のコンテンツを送信するコンテンツサーバ装置であって、
    コンテンツごとに当該コンテンツの品質を含む属性情報を記憶するコンテンツ属性情報データベースと、
    前記クライアント装置の周囲の雑音について設定された雑音状況に、当該雑音が当該雑音状況に対応する場合においてクライアント装置で再生すべきコンテンツの品質対応づけて記憶するコンテンツ品質情報記憶部と、
    前記クライアント装置の周囲の雑音を含む音声データを当該クライアント装置から受信し、当該音声データから当該雑音の状況である雑音状況を検出し、前記クライアント装置から取得した検索キーに対応するコンテンツを前記コンテンツ属性情報データベースから検索する音声データ処理部と、
    前記クライアント装置のユーザの所望の品質を示すクライアント情報を、前記クライアント装置から受信するクライアント情報受信手段と、
    前記クライアント情報により示される品質と前記検出された雑音状況に対応する品質の少なくとも一方が、前記検索されたコンテンツの品質より低い場合、前記検索されたコンテンツを、前記クライアント情報により示される品質と前記検出された雑音状況に対応する品質のうちの低い方の品質に変換して出力する品質変換部と、
    前記品質変換部により出力されたコンテンツを、前記クライアント装置に送信するコンテンツ送信部と
    を備えることを特徴とするコンテンツサーバ装置。
  2. クライアント装置に音声のコンテンツを送信するコンテンツサーバ装置であって、
    コンテンツごとに当該コンテンツのビットレートを含む属性情報を記憶するコンテンツ属性情報データベースと、
    前記クライアント装置の周囲の雑音について設定された雑音状況に、当該雑音が当該雑音状況に対応する場合においてクライアント装置で再生すべきコンテンツのビットレートを対応づけて記憶するコンテンツ品質情報記憶部と、
    前記クライアント装置の周囲の雑音を含む音声データを当該クライアント装置から受信し、当該音声データから当該雑音の状況である雑音状況を検出し、前記クライアント装置から取得した検索キーに対応するコンテンツを前記コンテンツ属性情報データベースから検索する音声データ処理部と、
    前記検索されたコンテンツのビットレートが、前記検出された雑音状況に対応するビットレートよりも高い場合、前記検索されたコンテンツのビットレートを、前記検出された雑音状況に対応するビットレートに変換して出力し、
    前記検索されたコンテンツのビットレートが、前記検出された雑音状況に対応するビットレートよりも低い場合、前記検索されたコンテンツのビットレートを変換することなく出力する品質変換部と、
    前記品質変換部により出力されたコンテンツを、前記クライアント装置に送信するコンテンツ送信部と
    を備えることを特徴とするコンテンツサーバ装置。
  3. クライアント装置に音声のコンテンツを送信するコンテンツサーバ装置であって、
    コンテンツごとに当該コンテンツのビットレートを含む属性情報を記憶するコンテンツ属性情報データベースと、
    前記クライアント装置の周囲の雑音について設定された雑音状況に、当該雑音が当該雑音状況に対応する場合においてクライアント装置で再生すべきコンテンツのビットレートを対応づけて記憶するコンテンツ品質情報記憶部と、
    前記クライアント装置の周囲の雑音を含む音声データを当該クライアント装置から受信し、当該音声データから当該雑音の状況であって、前記クライアント装置の周囲の雑音の周波数特性を含む雑音状況を検出し、前記クライアント装置から取得した検索キーに対応するコンテンツを前記コンテンツ属性情報データベースから検索する音声データ処理部と、
    前記クライアント装置のユーザの所望の品質を示すクライアント情報により示されるビットレートが前記検索されたコンテンツのビットレートよりも高い場合、前記周波数特性が所定レベルより高い値を示す周波数帯について、前記コンテンツの音を増幅し、
    前記クライアント情報により示されるビットレートが前記検索されたコンテンツのビットレートより低い場合、前記周波数特性が所定のレベルより高い値を示す周波数帯について、前記コンテンツの音を減衰し、
    前記クライアント情報により示されるビットレートと前記検出された雑音状況に対応するビットレートの少なくとも一方が、前記検索されたコンテンツのビットレートより低い場合、前記検索されたコンテンツ、或いは所定の周波数帯について増幅または減衰されたコンテンツを、前記クライアント情報により示されるビットレートと前記検出された雑音状況に対応するビットレートのうちの低い方のビットレートに変換して出力する品質変換部と、
    前記品質変換部により出力されたコンテンツを、前記クライアント装置に送信するコンテンツ送信部と
    を備えることを特徴とするコンテンツサーバ装置。
  4. クライアント装置に音声のコンテンツを送信するコンテンツサーバ装置の動作方法であって、
    前記コンテンツサーバ装置は、
    コンテンツごとに当該コンテンツの品質を含む属性情報を記憶するコンテンツ属性情報データベースと
    前記クライアント装置の周囲の雑音について設定された雑音状況に、当該雑音が当該雑音状況に対応する場合においてクライアント装置で再生すべきコンテンツの品質対応づけて記憶するコンテンツ品質情報記憶部とを備え、
    前記動作方法は、
    前記コンテンツサーバ装置が、前記クライアント装置の周囲の雑音を含む音声データを当該クライアント装置から受信し当該音声データから当該雑音の状況である雑音状況を検出し前記クライアント装置から取得した検索キーに対応するコンテンツを前記コンテンツ属性情報データベースから検索するステップと、
    前記コンテンツサーバ装置が、前記クライアント装置のユーザの所望の品質を示すクライアント情報を、前記クライアント装置から受信するステップと、
    前記コンテンツサーバ装置が、前記クライアント情報により示される品質と前記検出された雑音状況に対応する品質の少なくとも一方が、前記検索されたコンテンツの品質より低い場合、前記検索されたコンテンツを、前記クライアント情報により示される品質と前記検出された雑音状況に対応する品質のうちの低い方の品質に変換して出力するステップと、
    前記出力するステップにより出力されたコンテンツを、前記クライアント装置に送信するステップ
    を備えることを特徴とするコンテンツサーバ装置の動作方法。
  5. クライアント装置に音声のコンテンツを送信するコンテンツサーバ装置の動作方法であって、
    前記コンテンツサーバ装置は、
    コンテンツごとに当該コンテンツのビットレートを含む属性情報を記憶するコンテンツ属性情報データベースと
    前記クライアント装置の周囲の雑音について設定された雑音状況に、当該雑音が当該雑音状況に対応する場合においてクライアント装置で再生すべきコンテンツのビットレートを対応づけて記憶するコンテンツ品質情報記憶部とを備え、
    前記動作方法は、
    前記コンテンツサーバ装置が、前記クライアント装置の周囲の雑音を含む音声データを当該クライアント装置から受信し当該音声データから当該雑音の状況である雑音状況を検出し前記クライアント装置から取得した検索キーに対応するコンテンツを前記コンテンツ属性情報データベースから検索するステップと、
    前記コンテンツサーバ装置が、前記検索されたコンテンツのビットレートが、前記検出された雑音状況に対応するビットレートよりも高い場合、前記検索されたコンテンツのビットレートを、前記検出された雑音状況に対応するビットレートに変換して出力し、
    前記検索されたコンテンツのビットレートが、前記検出された雑音状況に対応するビットレートよりも低い場合、前記検索されたコンテンツのビットレートを変換することなく出力するステップと、
    前記出力するステップにより出力されたコンテンツを、前記クライアント装置に送信するステップ
    を備えることを特徴とするコンテンツサーバ装置の動作方法。
  6. クライアント装置に音声のコンテンツを送信するコンテンツサーバ装置の動作方法であって、
    前記コンテンツサーバ装置は、
    コンテンツごとに当該コンテンツのビットレートを含む属性情報を記憶するコンテンツ属性情報データベースと
    前記クライアント装置の周囲の雑音について設定された雑音状況に、当該雑音が当該雑音状況に対応する場合においてクライアント装置で再生すべきコンテンツのビットレートを対応づけて記憶するコンテンツ品質情報記憶部とを備え、
    前記動作方法は、
    前記コンテンツサーバ装置が、前記クライアント装置の周囲の雑音を含む音声データを当該クライアント装置から受信し当該音声データから当該雑音の状況であって、前記クライアント装置の周囲の雑音の周波数特性を含む雑音状況を検出し前記クライアント装置から取得した検索キーに対応するコンテンツを前記コンテンツ属性情報データベースから検索するステップと、
    前記コンテンツサーバ装置が、前記クライアント装置のユーザの所望の品質を示すクライアント情報により示されるビットレートが前記検索されたコンテンツのビットレートよりも高い場合、前記周波数特性が所定レベルより高い値を示す周波数帯について、前記コンテンツの音を増幅し、
    前記クライアント情報により示されるビットレートが前記検索されたコンテンツのビットレートより低い場合、前記周波数特性が所定のレベルより高い値を示す周波数帯について、前記コンテンツの音を減衰し、
    前記クライアント情報により示されるビットレートと前記検出された雑音状況に対応するビットレートの少なくとも一方が、前記検索されたコンテンツのビットレートより低い場合、前記検索されたコンテンツ、或いは所定の周波数帯について増幅または減衰されたコンテンツを、前記クライアント情報により示されるビットレートと前記検出された雑音状況に対応するビットレートのうちの低い方のビットレートに変換して出力するステップと、
    前記出力するステップにより出力されたコンテンツを、前記クライアント装置に送信するステップ
    を備えることを特徴とするコンテンツサーバ装置の動作方法。
  7. 請求項1ないしのいずれかに記載のコンテンツサーバ装置としてコンピュータを機能させるためのコンピュータプログラム。
JP2014226619A 2014-11-07 2014-11-07 コンテンツサーバ装置、コンテンツサーバ装置の動作方法およびコンピュータプログラム Active JP6317235B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014226619A JP6317235B2 (ja) 2014-11-07 2014-11-07 コンテンツサーバ装置、コンテンツサーバ装置の動作方法およびコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014226619A JP6317235B2 (ja) 2014-11-07 2014-11-07 コンテンツサーバ装置、コンテンツサーバ装置の動作方法およびコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2016090871A JP2016090871A (ja) 2016-05-23
JP6317235B2 true JP6317235B2 (ja) 2018-04-25

Family

ID=56018816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014226619A Active JP6317235B2 (ja) 2014-11-07 2014-11-07 コンテンツサーバ装置、コンテンツサーバ装置の動作方法およびコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP6317235B2 (ja)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3750705B2 (ja) * 1997-06-09 2006-03-01 松下電器産業株式会社 音声符号化伝送方法及び音声符号化伝送装置
JP2001242874A (ja) * 2000-02-29 2001-09-07 Sony Corp 音楽配信システム、音楽配信システム端末、及び音楽配信システムサーバ
JP2002197015A (ja) * 2000-12-27 2002-07-12 Toshiba Corp データ配信システム及びデータ配信方法
JP2002341880A (ja) * 2001-05-21 2002-11-29 Matsushita Electric Ind Co Ltd 音楽データ配信システム
JP2003218781A (ja) * 2002-01-24 2003-07-31 Toshiba Corp 通信端末およびネットワーク制御装置
CN1277180C (zh) * 2002-04-26 2006-09-27 韩国电子通信研究院 用于适应音频信号的装置和方法
JP3894062B2 (ja) * 2002-07-11 2007-03-14 ヤマハ株式会社 楽曲データ配信装置、楽曲データ受信装置及びプログラム
JP4464707B2 (ja) * 2004-02-24 2010-05-19 パナソニック株式会社 通信装置

Also Published As

Publication number Publication date
JP2016090871A (ja) 2016-05-23

Similar Documents

Publication Publication Date Title
US9412368B2 (en) Display apparatus, interactive system, and response information providing method
JP5305675B2 (ja) 聴覚アーカイブを自動的に発生し聴覚アーカイブを提供するための方法、システム、およびコンピュータ・プログラム
WO2020098115A1 (zh) 字幕添加方法、装置、电子设备及计算机可读存储介质
JP4371127B2 (ja) 再生装置、再生方法、プログラム
US20100228549A1 (en) Systems and methods for determining the language to use for speech generated by a text to speech engine
KR102545837B1 (ko) 디스플레이 장치, 디스플레이 장치의 배경음악 제공방법 및 배경음악 제공 시스템
JP2010078979A (ja) 音声録音装置、録音音声検索方法及びプログラム
JP2014132464A (ja) 対話型インターフェース装置及びその制御方法
US20090074204A1 (en) Information processing apparatus, information processing method, and program
KR101100191B1 (ko) 멀티미디어 재생장치와 이를 이용한 멀티미디어 자료검색방법
US11048749B2 (en) Secure searchable media object
US20080058972A1 (en) Data selection system, data selection apparatus, data selection method, and data selection program
US20230109783A1 (en) Computing device and corresponding method for generating data representing text
US20100104267A1 (en) System and method for playing media file
KR20160059131A (ko) 가변적인 크기의 세그먼트를 전송하는 컨텐츠 처리 장치와 그 방법 및 그 방법을 실행하기 위한 컴퓨터 프로그램
JP6317235B2 (ja) コンテンツサーバ装置、コンテンツサーバ装置の動作方法およびコンピュータプログラム
JP2005512134A (ja) リアルタイム時間伸縮用パラメータ付きデジタルオーディオ
US11551722B2 (en) Method and apparatus for interactive reassignment of character names in a video device
JP4191221B2 (ja) 記録再生装置、同時記録再生制御方法、および同時記録再生制御プログラム
KR101336256B1 (ko) 음성 기반 멀티미디어 컨텐츠 태깅 방법 및 장치
JP5105109B2 (ja) 検索装置及び検索システム
KR102384263B1 (ko) 음성 인덱싱을 이용한 비디오 가공 방법 및 장치
JP2013195977A (ja) 情報処理装置及び情報処理方法
KR102118195B1 (ko) 서버 및 그의 제어 방법
US10339219B2 (en) Computing device and corresponding method for generating data representing text

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171031

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180327

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180329

R150 Certificate of patent or registration of utility model

Ref document number: 6317235

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150