JP2008225027A - 音源加工装置、方法、及びプログラム - Google Patents

音源加工装置、方法、及びプログラム Download PDF

Info

Publication number
JP2008225027A
JP2008225027A JP2007062911A JP2007062911A JP2008225027A JP 2008225027 A JP2008225027 A JP 2008225027A JP 2007062911 A JP2007062911 A JP 2007062911A JP 2007062911 A JP2007062911 A JP 2007062911A JP 2008225027 A JP2008225027 A JP 2008225027A
Authority
JP
Japan
Prior art keywords
sound source
processed
noise
frame
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007062911A
Other languages
English (en)
Other versions
JP4888652B2 (ja
Inventor
Hisayuki Mori
久幸 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2007062911A priority Critical patent/JP4888652B2/ja
Publication of JP2008225027A publication Critical patent/JP2008225027A/ja
Application granted granted Critical
Publication of JP4888652B2 publication Critical patent/JP4888652B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】 音質劣化が少ない音楽を聞かせるようにした音源加工装置、方法、プログラム、及び情報記録媒体を提供することにある。
【解決手段】 携帯端末のコーデック(CODEC: COder-DECoder)特性に応じて音質劣化が少なくなる様に音源に加工を加え、加工した複数の音源ファイルを予め作成して蓄積しておき、再生要求時にはさらに個々の楽曲により最適なパラメータを用いて音質改善加工をする。すなわちコーデック種別に応じた最適な音源ファイルを選択する。
【選択図】 図1

Description

本発明は、本発明は、携帯端末を介して聞かせる音楽を音源ファイルとして蓄積しておき、該音源ファイルを再生して、携帯端末に供給し、音楽を、携帯端末を介して聞かせる音源加工装置、方法、プログラム、及び情報記録媒体に関する。
以下の特許文献1には、電話交換機に、リングバックトーン或いはビジートーンを音声として記憶させておき、発信側電話機に対して、記憶されている前記音声で応答する電話交換システムが開示されている。
以下の特許文献2には、リングバックトーン或いはビジートーンを検出したとき、検出結果を音声にて出力する電話機が開示されている。
以下の特許文献3には、交換機に、予め加入者が発呼者に対して送出する画像/音声メッセージを登録し、加入者に対する着呼時に、呼出前又は呼出中に、画像/音声メッセージを発呼者に送出することが開示されている。
以下の特許文献4には、リングバックトーンの代りに、商業情報を音声/文字/画像の形式で送出する技術が開示されている。
しかし、特許文献1乃至4のいずれにも、コーデックを有する携帯端末を介して音楽を聞かせることには、注意が向いていない。
従来の音源加工装置を備えたシステムは、現状の音源加工装置と、ゲートウェイスイッチ(Gateway Switch: GS)と、モバイルスイッチングセンター(Mobile Switching Center: MSC)と、基地局と、携帯端末としての携帯電話とを有する。
携帯電話は、具体的には、GSM (Global System for Mobile Communication)Terminalであり、RPE-LTP (Regular Pulse Excited-Long Term Prediction)と名づけられた音声コーデックを有している。ゲートウェイスイッチとモバイルスイッチングセンターとは交換網を構成する。
現状の音源加工装置は、128kbit/secのWAV(WAVEとも呼ばれるWindows(登録商標)標準の音声ファイルの形式)形式の音源ファイルを蓄積している音源ファイル蓄積装置と、音源再生装置(発信メロディー装置)とを有する。
音源ファイルは、音源再生装置によって、64kbit/secのμ Law PCM(Pulse Code Modulation)信号またはA Law PCM信号として送出される。ゲートウェイスイッチ及びモバイルスイッチングセンターは64kbit/secで音源ファイルをそのまま伝送するので、ゲートウェイスイッチ及びモバイルスイッチングセンターでは音源ファイルの音質の劣化は無い。
前記基地局において、携帯電話の音声コーデックと同じ音声コーデック(RPE-LTPコーディック)で、無線区間信号に変換される。音楽を聞くだけの場合、前記基地局の音声コーデックは、PCM信号をGSM符号信号に変換し、前記携帯電話の音声コーデックは、GSM符号信号をPCM信号に変換する。前記携帯電話は、PCM信号をアナログ信号に変換し、スピーカから携帯電話の所持者などに音楽を聞かせる。前記携帯電話は、しゃべる時は、聞く時と変換の方向が逆になる。この場合、前記携帯電話は、マイクロホンからの音声をPCM信号に変換し、前記携帯電話の音声コーデックは、PCM信号をGSM符号信号に変換し、前記基地局の音声コーデックは、GSM符号信号をPCM信号に変換する。
前記基地局と前記携帯電話との間の帯域は狭い為、人間の音声に特化した符号化を行っている。そのため、音楽のいくつかのフレームが音声ではなくノイズと見なされ、音楽の代わりにノイズフレームが伝送されるので音質が劣化してしまう。
すなわち、現状の音源再生では、前記基地局と前記携帯電話との間の伝送帯域が狭く音声に特化したコーデックを使用しているため、音楽の音質が保てないという課題がある。
以下、現状の音源再生の課題について、より詳細に説明する。
音楽の再生要求時には、準備してあった音源ファイルを携帯電話網(ゲートウェイスイッチとモバイルスイッチングセンターと基地局とを含む)に音声モード(64Kbit/s PCM)で接続して聞かせていた。携帯電話、特に狭帯域の携帯電話では、無線区間のコーデック特性に起因する音質劣化が発生し、音質の良い音楽を提供できないという問題があった。
前記携帯電話で使用している音声コーデックは、狭帯域でも人間の音声のみを送信させる事を目的に設計されており、人間の音声に特化した符号化方式を採用している。一方、音楽は、白色ノイズのような部分を含むものと考えられる。そのため、音楽は人間の音声ではないため、波形が抑圧され音質が劣化してしまう。
ここで、音質劣化の発生原因は以下のとおりである。コーデック種別によって劣化の原因と状態は異なっているので、GSMでの劣化原因を以下に示す。
GSMでは、VAD(Voice Activity Detection)によって音声でないと判断された場合、該当フレームをSID(Silent Description) フレームで転送する。これは、元来、例えば、「もしもし」という音声の後に存在する無音区間に、SIDフレームによるノイズを流し、周囲の音、例えば車の音が、入るのを防止するためである。音楽がVADによって音声でないと判断された場合、該当フレームをSIDフレームで転送するので、SIDフレームによる、大きな音のノイズが聞こえてしまう。Full rate, Half rate, Enhanced full rate の3種類のコーデックは符号化方式は異なっているが、VADの論理は同じである。
さらに、前記VADの動作が音質劣化の主原因であることに着目して、この動作を変える事によって劣化を防止しようとする試みもなされている。
特開平3−123269号公報 特開平3−191645号公報 特開平9−162978号公報 特表2003−505937号公報
しかし、上記した試みにおいても、全ての音源について同じアルゴリズム、同じパラメータで音質改善加工を実施しているため、音源の種別によって音質改善効果が大きい楽曲と改善効果が小さい楽曲とが存在していた。
そこで、本発明の目的は、使用しているコーデックの音声とノイズの判定論理を解析して、ノイズと判定されない様に元の音源に加工を加え、さらに個々の楽曲により最適なパラメータを用いて音質改善加工をすることにより、音質劣化が少ない音楽を聞かせるようにした音源加工装置、方法、プログラム、及び情報記録媒体を提供することにある。
上記課題を解決するために、本件発明は、以下の特徴を有する課題を解決するための手段を採用している。
本発明の第1の態様に係る音源加工装置は、複数種類のコーデック特性に応じて音質劣化が少なくなるように音楽の元音源に加工を施し、その加工された加工音源ファイルを、携帯端末に供給し、当該携帯端末を介して音楽を聞かせるサービスを行なう。前記音源加工装置は、再生要求を表す起動信号を受けた時に、前記起動信号に含まれる発信者情報により前記携帯端末のコーデック種別を判定し、判定されたコーデック種別に応じて所定のノイズ判定アルゴリズムにより加工音源ファイルを作成し、作成された加工音源ファイルを選択的に再生して、前記携帯端末に供給する音源再生装置と、前記作成された加工音源ファイルを、予め蓄積しておく音源ファイル蓄積装置を備え、前記ノイズ判定アルゴリズムによって、フレームごとに音声度(pvad)係数及びノイズ判定閾値が計算され、前記音声度(pvad)係数が前記ノイズ判定閾値及び所定のパラメータの積より大きいフレームのみノイズのない音声フレームと判定され、
前記所定のパラメータは前記元音源ファイルと音質加工後の符号化ファイルを復号化したファイルとの差分を全フレームで累積した値が最小となるような値に設定される可変パラメータであることを特徴とする。
本発明の第2の態様に係る音源加工方法は、複数種類のコーデック特性に応じて音質劣化が少なくなるように音楽の元音源に加工を施した加工音源ファイルを携帯端末に供給するサービスを行なう。前記音源加工方法は、音楽再生要求を表す起動信号を受けた時に、前記起動信号に含まれる発信者情報により前記携帯端末のコーデック種別を判定するステップと、判定されたコーデック種別に応じて所定のノイズ判定アルゴリズムにより前記加工音源ファイルを作成するステップと、前記ノイズ判定アルゴリズムを用いてフレームごとに音声度(pvad)係数及びノイズ判定閾値を計算し、前記音声度(pvad)係数が前記ノイズ判定閾値及び所定のパラメータの積より大きいフレームのみノイズのない音声フレームと判定するステップと、前記作成された加工音源ファイルを、予め蓄積するステップと、前記作成された加工音源ファイルを選択的に再生して、前記携帯端末に供給するステップを有し、前記所定のパラメータは前記元音源ファイルと音質加工後の符号化ファイルを復号化したファイルとの差分を全フレームで累積した値が最小となるような値に設定される可変パラメータであることを特徴とする。
パラメータxの値を使って音質改善加工を行うことにより、携帯電話から音楽種別によらずに音質劣化の少ない音楽を聞くことが出来る。
以上説明したように、本発明によれば、元の音源に応じた最適なパラメータを使って音源加工を加える事により、楽曲の如何を問わず、さまざまな種類の音楽について音質劣化が少ない音楽を聞かせる機能を提供することができる。
次に、本発明の一実施の形態について図面を参照して詳細に説明する。
以下に述べるように、本発明は、携帯端末で音楽を聞くサービスにおいて、携帯端末のコーデック(CODEC: COder-DECoder)特性に応じて音質劣化が少なくなる様に音源に加工を加え、加工した複数の音源ファイルを予め作成して蓄積しておき、再生要求時にはコーデック種別に応じた最適な音源ファイルを選択して聞かせる事により、最善の音質の音楽を聞かせることが出来ることを特徴としている。
本発明による音源加工装置では、音源再生装置は、起動信号に含まれる発信網種別IAM(Initial Address Message)により携帯端末のコーデック種別を判定し、コーデック種別に応じて加工した最善の音源を選択する。
このようにして、本発明では、コーデック対応に音質劣化が少ない専用の音源ファイルを選択して聞かしているので、携帯端末のコーデックで音質劣化が少ない曲を聞かせることができる。
ここで、本発明の核心部分を説明しておく。本発明では、狭帯域の携帯網を使っても音質劣化が少なくなる様に音源ファイルを加工する。この加工技術が本発明の核心である。
音質劣化の状態は各携帯網が使用しているコーデック種別毎の符号化アルゴリズムに依存している。そのため、コーデック毎に音源ファイルの加工方式を変えなければならない。発信者の携帯網を判断して、その携帯網で使用しているコーデック向けに加工した音源ファイルを選択して接続することにより、音楽の音質劣化を防ぐことが出来る。
主な携帯網とコーデック種別と伝送帯域は下記の表1に示す通りである。
Figure 2008225027
ここで、PHSはPersonal Handyphone System、ADPCMはAdaptive Differential Pulse Code Modulation、PDCはPersonal Digital. Cellular、VSELPはVector Sum Excited Linear Prediction、PSI-CELPはPitch Synchronous Innovation-Code Excited Linear Prediction、RPE-LTPはRegular Pulse Excited-Long Term Prediction、EFRはEnhanced Full Rate、A-CELPはAlgebraic-Code Excited Linear Prediction、CdmaはCode division multiple access、EVRCはEnhanced Variable Rate Codecである。
以下、GSM網(Global System for Mobile communication)の加入者が「発信メロディーサービス」により音楽を聞く場合を例にとって説明する。なお、「発信メロディーサービス」とは、AがBに電話をかけて呼び出し中、Aが、リングバックトーンの代わりにBが指定した音楽を聞くサービス(Ring Back Melodyサービス)である。
GSM網にはFull rate, Half rate, EFR(Enhanced Full Rate)の3種類のコーデックがある。事業者によって使用しているコーデックが異なっているので、それぞれ異なった対応(音源加工方式)を行う事によって対応する。複数個のコーデックを使用している事業者も存在する。
図1に本発明の一実施の形態による音源加工方法を実施する音源加工装置20を備えたシステムを示す。
本実施の形態による音源加工装置20は、128kbit/secのWAV形式の元音源(オリジナル音源)ファイル201と、その元音源ファイル201を加工した加工音源ファイル(GSM向け)202と、元音源ファイルを加工した加工音源ファイル(cdma向け)203とを蓄積している音源ファイル蓄積装置200と、音源再生装置(発信メロディー装置)300とを有する。
各コーデック種別に応じた加工音源ファイル202および203は、本発明で作成した音質改善アルゴリズムによって元音源ファイル(基本音源ファイル)から加工して作成する。作成された加工音源ファイルを、音源データベースとしての音源ファイル蓄積装置200中に蓄積しておく。この加工するのに必要なアルゴリズムとパラメータを音楽の種別に応じて可変することによって音質劣化の少ない音楽を聞かせる機能を提供することが今回の発明の核心部分である。
すなわち、音源再生装置(発信メロディー装置)300は、音楽の再生要求を表す起動信号IAM (Initial Address Message)を受けた時、起動信号の中の発信者情報によって発信者が使用しているコーデック識別を決定し、該当コーデック向けに加工された音源ファイル(加工音源ファイル202および203の内の一つ)を選択して接続する。この際、加工された音源ファイルは、音源再生装置300によって、64kbit/secのμ Law PCM(Pulse Code Modulation)信号またはA Law PCM信号として送出される。
ここで、図1を参照すると、本発明の一実施例としての、発メロサービスにおける音楽を聞く場合が示されている。図1において、音源加工装置(発メロ装置)20は音楽の再生要求があった時、起動信号(IAM)の中の発信者情報によって発信者が使用しているコーデック識別を決定し、該当コーデック向けに加工された音源ファイルを選択して接続する。
各コーデック種別に応じた音源ファイルは、音質改善アルゴリズムによって基本音源から加工して作成する。作成された加工音源を音源データベースの中に蓄積しておく。この加工するアルゴリズムとパラメータを音楽によって可変にする事が今回の発明である。
次に、音源加工装置20の音質改善時の接続の動作を説明する。
図1において、起動信号IAMによって音楽再生要求があった場合、音源加工装置20は、起動信号IAMに含まれる発信者情報から発信端末105のコーデック種別を判断して、該当コーデック向けに加工された音源(加工音源ファイル202および203の内の一つ)の音楽を聞かせる。該当コーデック向けの音源が存在しない時は元音源(元音源ファイル201)の音楽を聞かせる。
その後、音源加工装置20は元音源ファイル201の元音源を元にして再生用の加工された音源ファイル202および203を作成する。この際、携帯電話のコーデック対応に対応が必要であるが、携帯電話105(GSM Terminal)の音声コーデック106向けの加工アルゴリズムの概要は以下の通りである。
ここで、元音源ファイル201の元音源を元にして作成された、再生用の加工音源ファイル(GSM向け)202について説明する。元音源において、20msec単位の音声フレームのうち、ノイズと判定されたフレームとその直後の2フレーム(合計、3フレーム)は、強制的に0に置き換えられる(無音にする。クリッピング。)。
この加工を実現する加工処理手順について図2を参照して説明する。
(1)音楽を表現している基本音源を入力する(図2のステップS101)
(2)音楽の小音量部分(小振幅部分)は音質劣化が激しくなるので、小振幅部分の伸張(Gain Control)を行い、入力された基本音源をコーデックの符号化単位である20msec毎(160標本)のフレームに分ける。コーデック106におけるノイズと音声との識別(VAD:Voice Activity Detection)は、各フレーム毎に音声度(pvad)係数とノイズ閾値(thvad)を計算し、音声度(pvad)係数>ノイズ閾値(thvad) の時、音声フレームと判定している。すなわち、音源ファイル自体を加工する事により音質劣化を防ぐ。
ここで、(音声度<ノイズ閾値)であるフレームは、ノイズフレームと判定される。よって、現在フレームがノイズフレームと認識されない様にするためには、音声度(pvad)がノイズ閾値(thvad)より大きくなければならない。音声度が常にノイズ閾値より大きくなるためには、GSMシミュレータによってノイズ閾値が音声度より大きくなる部分を探してその部分にてノイズ閾値を強制的に最小化させることにより音声度がノイズ閾値より大きくなるように動作を遂行する。この際、ノイズ閾値を最小化させるためにはVADでのノイズ閾値の更新において、該当入力フレームでの入力信号のエネルギーを強制的に0にしなければならないが、これは信号を強制的に0にすることで実現可能である。この処理をClipping処理という。
音源を加工しない場合にノイズと見なされるフレームに対しては、該当フレーム(ノイズフレーム)とその直後の2フレームの合計3フレームを強制的に0に置き換える(無音にする)。3つの連続フレームを0に置き換えることにより、ノイズ判定の閾値を下げることが出来る。3つの連続フレームを0に置き換えた音源ファイルを、GSM用加工音源ファイル202として音源ファイル蓄積装置200に出力する。このようにしてまず任意の選択されたパラメータを用いて音質改善加工を実施する(図2のステップS102)。
本発明は以下に述べるステップS103以降の処理に特徴がある。従来、全ての音源について無線方式毎に定められたパラメータで音源加工を実施していたが、本発明では、音楽によって音源加工のパラメータを適応的に変えることによって上記した課題を解決している。以下、その音源加工方法の具体的な内容について説明する。
すなわち、ノイズとして判定する数が多すぎると、3つの連続するフレームを0に置き換える処理が多くなりすぎ、音楽が途切れてしまう。逆に少なすぎるとノイズフレームが混ざってしまう。このことに着目してこれらの調整を楽曲毎に行うことができれば音質改善効果が生じると考えた。
ここで、元音源ファイルをA、GSMで符号化した符号化ファイルをB、Bを復号した音源ファイルをCとし、音源ファイルCを元音源として入力し(ステップS101)、次に上記したように任意の選択されたパラメータを用いて音質改善加工を実施する(ステップS102)。
音質改善加工した音源ファイルをDとすると、この音源ファイルDをGSMで符号化して符号化ファイルEを得、この符号化ファイルEを復号して音源ファイルFを得る(ステップS103)。
この音源ファイルFをコーデックの符号化単位である20msecごと(160標本)のフレームに区切る(ステップS104)。
AとFとの差分が極小になる様に、AからDへの音質改善加工のパラメータxを、後述するアルゴリズムを用いて選択する(ステップS105〜S108)。
この選択されたパラメータxを用いた以下の判定論理にしたがって音質改善加工を行う(ステップS109)。これにより、携帯電話から音楽種別によらずに音質劣化の少ない音楽を聞くことができる。
以下、パラメータxを用いた判定論理について説明する。従来では全ての音楽について、同じ判定論理(音声度係数p>ノイズ判定閾値q)を用い、p>qの場合に音声(ノイズでない)と判定していた。すなわちコーデックにおけるノイズと音声との識別(VAD: Voice Activity Detection)は、各フレーム毎に音声度係数とノイズ判定閾値を計算し、音声度係数>ノイズ判定閾値 の時、音声フレームと判定していた。尚、この場合、音源を加工しない場合にノイズと見なされるフレームに対しては、該当フレームとその直後の2フレームの合計3フレームを強制的に0に置き換える(無音にする)。3つの連続フレームを0に置き換えることにより、ノイズ判定の閾値を下げることができる。
これに対し、本発明では別の判定論理(p>xq:xはパラメータ)を用いてp>xqの場合に音声と判定しているところに特徴がある。このパラメータxを楽曲ごとに可変し、最適な設定にすることにより、音質改善効果を高める。
次に、前記パラメータxの抽出アルゴリズム(抽出方法)について詳細に説明する。
(1)元音源ファイルAと音質加工後のGSM符号化して復号したファイルFの差が小さくなる様にパラメータxを選択する。元音源をA(t)、パラメータxを使って音質改善加工した音源を符号化し復号したファイルをF(t,x)とする。尚、tは時間を示す。
(2)A(t)とF(t,x)の周波数帯域での分布の差が小さいと、AとFを聞いた感覚の差分が小さい。音質劣化が少ないとは、AとFを聞いた感覚が小さいということである。AとFの周波数帯域での分布の差が小さくなる様にパラメータxを選定する。
(3)以下の数1〜数4に示すように、
Figure 2008225027
Figure 2008225027
Figure 2008225027
Figure 2008225027
A(t)とF(t,x)をフレーム単位で周波数空間に展開する。n番目フレームの周波数空間での分布をそれぞれG(f,n),H(f,n,x)とする。αとβは第nフレームの始めと終わりの時刻、fは周波数を表す。
フレーム毎に、以下の数5
Figure 2008225027
にしたがってA(t)とF(t,x)の周波数空間上でのエネルギーの差分を求め、周波数空間で積分する。ここで、第nフレームのエネルギー差分をS(n,x)とする。
これを楽曲の全フレームで累積する。パラメータxの時の累積値をT(x)とするし、この累積値T(x)を以下の数6で求める。
Figure 2008225027
次に、パラメータxを変化させ、累積値T(x)をそれぞれ計算する。
この累積値T(x)が最小(min{T(x)})になるパラメータxを選定する。
このパラメータxを使って、音質改善のための音源加工を行う。
cdma網の場合、パラメータは異なるが、最適パラメータを求める方法はGSMと同じである。
このようにして、本発明においては、音楽の種別によって最適化されたパラメータを使って音質改善加工がなされているので、楽曲によらず音質劣化の少ない曲を聞くことができる。
次に、実端末を使った音質改善の評価結果について説明する。
各音源の加工前と加工後の音楽を実際の携帯電話網を通してGSM端末から再生した音楽を聞き比べて評価した。ある音楽については、改善後音源ではノイズが混ざることがほとんど無くなり、音質が改善されていることが評価出来た。しかし、別の音楽では改善前と改善後であまり音質に違いがみられなかった。本発明により、従来あまり音質改善効果がみられなった音楽(静かな曲に顕著)についても、音質改善がみられる様になった。
次に本発明の他の実施の形態について説明する。
cdmaについての音質改善加工のアルゴリズムは、
(1)元音源を周波数空間に展開し、
(2)主周波数を抽出し、
(3)その周波数を元に櫛型フィルターで音源を加工するというものである。
音質改善の加工アルゴリズムはGSM向けと異なっているが、パラメータの最適化の方法はGSMと同様である。櫛型フィルターの減衰率xを調整して、元音源と音質改善加工後にcdmaで符号化復号した後の音源ファイルとの間の差分が最小になるようにxを選定する。
また、発明対象としては、上記音源加工方法における各ステップをコンピュータに実行させるプログラムも含み、このプログラムはプログラムそのものであってもよいし、このプログラムがコンピュータで読み取り可能な記録媒体に格納されているものであってもよい。
本発明では、この記録媒体として、マイクロコンピュータで処理が行なわれるために必要なメモリ、例えばROMのようなものそのものがプログラムメディアであってもよいし、また、図示していない外部記憶装置としてプログラム読み取り装置が設けられ、そこに記録媒体を挿入することで読み取り可能なプログラムメディアであってもよい。いずれの場合においても、格納されているプログラムはマイクロコンピュータがアクセスして実行させる構成であってもよいし、あるいはいずれの場合もプログラムを読み出し、読み出されたプログラムは、マイクロコンピュータのプログラム記憶エリアにロードされて、そのプログラムが実行される方式であってもよい。このロード用のプログラムは予め本体装置に格納されているものとする。
ここで、上記プログラムメディアは、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、FD(フレキシブルディスク)やHD(ハードディスク)等の磁気ディスクやCD−ROM/MO/MD/DVD等の光ディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM、EEPROM、フラッシュROM等による半導体メモリを含めた固定的にプログラムを担持する媒体であってもよい。
また、本発明においては、インターネットを含む通信ネットワークと接続可能なシステム構成であることから、通信ネットワークからプログラムをダウンロードするように流動的にプログラムを担持する媒体であってもよい。なお、このように通信ネットワークからプログラムをダウンロードする場合には、そのダウンロード用プログラムは予め装置本体に格納しておくか、あるいは別の記録媒体からインストールされるものであってもよい。
さらに、本発明では、プログラム自体として、マイクロコンピュータで実行される処理そのものであってもよいし、あるいはインターネットを含む通信ネットワークとアクセスすることで取り込める、あるいは取り込めたものであってもよいし、こちらから送り出すものであってもよい。
本発明は、携帯電話で音楽を聞くサービス全般に広く利用出来る。
特に、発信メロディーサービスにおいては、エンドユーザー、音源供給事業者の双方から音質の改善要求が出されている。エンドユーザーからは、「良い音質の音楽を聞きたい」との音質改善要求である。コンテンツ供給事業者からは、「供給した音楽を良い音質で聞かせたい。その結果として、提供コンテンツの売り上げを伸ばしたい。音質が悪ければ提供コンテンツの売り上げを伸ばすことが出来ない。」との要望がある。本発明は、これらの要求や要望に応えることができる。
本発明によれば、ネットワーク機器の制御・監視を行うネットワーク管理システムや、ネットワーク管理システムをコンピュータに実現するためのプログラムといった用途に適用できる。また、コンピュータ上で動作する各種プログラムにネットワーク機器の制御・監視を行うネットワーク管理機能を提供するといった用途にも適用可能である。
本発明の一実施例による音源加工装置を備えたシステムを説明するための図である。 図1のシステムにおいて用いられる、GSM用の音源ファイルの加工アルゴリズムの概要を示したフローチャートである。
符号の説明
20 音源加工装置
102 ゲートウェイスイッチ(GS)
103 モバイルスイッチングセンター(MSC)
104 基地局
105 携帯電話
106 音声コーデック
107 音声コーデック
200 音源ファイル蓄積装置
201 元音源ファイル
202 加工音源ファイル(GSM向け)
203 加工音源ファイル(cdma向け)
300 音源再生装置

Claims (10)

  1. 複数種類のコーデック特性に応じて音質劣化が少なくなるように音楽の元音源に加工を施し、その加工された加工音源ファイルを、携帯端末に供給し、当該携帯端末を介して音楽を聞かせるサービスを行なう音源加工装置において、
    再生要求を表す起動信号を受けた時に、前記起動信号に含まれる発信者情報により前記携帯端末のコーデック種別を判定し、判定されたコーデック種別に応じて所定のノイズ判定アルゴリズムにより加工音源ファイルを作成し、作成された加工音源ファイルを選択的に再生して、前記携帯端末に供給する音源再生装置と、
    前記作成された加工音源ファイルを、予め蓄積しておく音源ファイル蓄積装置を備え、
    前記ノイズ判定アルゴリズムによって、フレームごとに音声度(pvad)係数及びノイズ判定閾値が計算され、前記音声度(pvad)係数が前記ノイズ判定閾値及び所定のパラメータの積より大きいフレームのみノイズのない音声フレームと判定され、
    前記所定のパラメータは前記元音源ファイルと音質加工後の符号化ファイルを復号化したファイルとの差分を全フレームで累積した値が最小となるような値に設定される可変パラメータである
    ことを特徴とする音源加工装置。
  2. 前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する複数フレームを前記可変パラメータの値に応じて無音にする判定の数を調整した上で前記フレームに加工処理を行って作成された加工音源ファイルであることを特徴とする請求項1記載の音源加工装置。
  3. 前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する3フレームを前記可変パラメータの値に応じて無音にする判定の数を調整した上で前記フレームに加工処理を行って作成された加工音源ファイルであることを特徴とする請求項2記載の音源加工装置。
  4. 前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームを少なくとも無音にする加工を加えて作成された加工音源ファイルであることを特徴とする請求項1記載の音源加工装置。
  5. 複数種類のコーデック特性に応じて音質劣化が少なくなるように音楽の元音源に加工を施した加工音源ファイルを、携帯端末に供給するサービスを行なう音源加工方法において、
    音楽再生要求を表す起動信号を受けた時に、前記起動信号に含まれる発信者情報により前記携帯端末のコーデック種別を判定するステップと、
    判定されたコーデック種別に応じて所定のノイズ判定アルゴリズムにより前記加工音源ファイルを作成するステップと、
    前記ノイズ判定アルゴリズムを用いてフレームごとに音声度(pvad)係数及びノイズ判定閾値を計算し、前記音声度(pvad)係数が前記ノイズ判定閾値及び所定のパラメータの積より大きいフレームのみノイズのない音声フレームと判定するステップと、
    前記作成された加工音源ファイルを、予め蓄積するステップと、
    前記作成された加工音源ファイルを選択的に再生して、前記携帯端末に供給するステップを有し、
    前記所定のパラメータは前記元音源ファイルと音質加工後の符号化ファイルを復号化したファイルとの差分を全フレームで累積した値が最小となるような値に設定される可変パラメータである
    ことを特徴とする音源加工方法。
  6. 前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する複数フレームを前記可変パラメータの値に応じて無音にする判定の数を調整した上で前記フレームに加工処理を行って作成された加工音源ファイルであることを特徴とする請求項5記載の音源加工方法。
  7. 前記複数種類の加工音源ファイルのうちのいずれかは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームから始まる、連続する3フレームを前記可変パラメータの値に応じて無音にする判定の数を調整した上で前記フレームに加工処理を行って作成された加工音源ファイルであることを特徴とする請求項6記載の音源加工方法。
  8. 前記加工音源ファイルは、前記元音源における音声フレームのうち、元音源を加工しない場合にノイズとみなされる一つのフレームを少なくとも無音にする加工を加えて作成された加工音源ファイルであることを特徴とする請求項5記載の音源加工方法。
  9. コンピュータに、複数種類のコーデック特性に応じて音質劣化が少なくなるように音楽の元音源に加工を施させるプログラムであって、
    音楽再生要求を表す起動信号を受けた時に、前記起動信号に含まれる発信者情報により前記携帯端末のコーデック種別を判定するステップと、
    判定されたコーデック種別に応じて所定のノイズ判定アルゴリズムにより前記加工音源ファイルを作成するステップと、
    前記ノイズ判定アルゴリズムを用いてフレームごとに音声度(pvad)係数及びノイズ判定閾値を計算し、前記音声度(pvad)係数が前記ノイズ判定閾値及び所定のパラメータの積より大きいフレームのみノイズのない音声フレームと判定するステップと、
    前記作成された加工音源ファイルを、予め蓄積するステップと、
    前記作成された加工音源ファイルを選択的に再生して、前記携帯端末に供給するステップを実行させ、
    前記所定のパラメータは前記元音源ファイルと音質加工後の符号化ファイルを復号化したファイルとの差分を全フレームで累積した値が最小となるような値に設定される可変パラメータである
    ことを特徴とするプログラム。
  10. 請求項9に記載のプログラムを記録したことを特徴とするコンピュータ読取可能な情報記録媒体(コンパクトディスク、フレキシブルディスク、ハードディスク、光磁気ディスク、ディジタルビデオディスク、磁気テープ、または、半導体メモリを含む。)。
JP2007062911A 2007-03-13 2007-03-13 音源加工装置、方法、及びプログラム Expired - Fee Related JP4888652B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007062911A JP4888652B2 (ja) 2007-03-13 2007-03-13 音源加工装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007062911A JP4888652B2 (ja) 2007-03-13 2007-03-13 音源加工装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2008225027A true JP2008225027A (ja) 2008-09-25
JP4888652B2 JP4888652B2 (ja) 2012-02-29

Family

ID=39843729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007062911A Expired - Fee Related JP4888652B2 (ja) 2007-03-13 2007-03-13 音源加工装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP4888652B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013140996A1 (ja) * 2012-03-22 2013-09-26 日本電気株式会社 情報処理システム、情報処理方法、サーバ、携帯端末およびそれらの制御方法と制御プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013140996A1 (ja) * 2012-03-22 2013-09-26 日本電気株式会社 情報処理システム、情報処理方法、サーバ、携帯端末およびそれらの制御方法と制御プログラム
JP2013198066A (ja) * 2012-03-22 2013-09-30 Nec Corp サーバ、サーバの制御方法および制御プログラム、情報処理システム、情報処理方法、携帯端末、携帯端末の制御方法および制御プログラム

Also Published As

Publication number Publication date
JP4888652B2 (ja) 2012-02-29

Similar Documents

Publication Publication Date Title
JP4430107B2 (ja) マルチメディアリングバックトーンサービスのための端末機及び端末機の制御方法
ES2371455T3 (es) Pre-procesamiento de datos digitales de audio para codecs de audio de móvil.
JP2008504728A (ja) 発信側交換機を用いてマルチメディアリングバックトーンサービスを提供する方法及びシステム
US8498667B2 (en) System and method for mixing audio with ringtone data
JP4572123B2 (ja) 音源供給装置及び音源供給方法
JP5277368B2 (ja) 通信網を介して加入者端末機に送信されるオーディオ信号の出力品質改善のためのオーディオ信号の処理方法およびこの方法を採用したオーディオ信号処理装置
FI118703B (fi) Menetelmä ja laite äänenlaadun huononemisen lieventämiseksi viestintäjärjestelmässä
JP4725803B2 (ja) 情報提供システム及び方法並びに情報提供用プログラム
JP4888652B2 (ja) 音源加工装置、方法、及びプログラム
EP2099253B1 (en) Method for voice activity detection controlling and controlling device thereof
EP1159738B1 (en) Speech synthesizer based on variable rate speech coding
KR100740373B1 (ko) 음악 제공 시스템, 멜로디 재생 제어 서버, 음악 제공 방법및 음악 제공용 프로그램
KR100723697B1 (ko) 멀티미디어 링백톤 서비스를 제공하는 방법 및 이동통신시스템과 멀티미디어 링백톤 서비스를 위한 이동통신단말기
JP2000349893A (ja) 音声再生方法および音声再生装置
KR100760905B1 (ko) 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치
KR20060027246A (ko) 무선 통신 네트워크를 이용한 휴대폰용 오디오 스트리밍 서비스 방법 및 이의 구현을 위한 서비스 시스템
KR20070031089A (ko) 착신 대기음 구간에서 cdma 이동통신망의 음성슬롯데이터 구조를 이용해 he aac 비트스트림을 전송하는방법
WO2009050721A2 (en) Method and system for processing audio in a telecommunication network
KR20080021256A (ko) 벨 소리 서비스의 종류에 따른 벨 소리의 압축 방식을선택하는 방법 및 이를 이용한 다양한 벨 소리를 제공하는방법
KR20060006475A (ko) 이동통신단말기의 녹음 음성 벨소리 변환장치 및 방법
JPH09298591A (ja) 音声符号化装置
KR20060118131A (ko) 인트로 링 플러스 서비스 시스템 및 방법
JP2011250052A (ja) 呼接続時に発呼端末に対してリングバックコンテンツを返信する発呼方法及び電話システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100302

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111027

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111116

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111129

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141222

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees