JP2000214885A - 音声信号のデ―タ量圧縮装置および圧縮方法 - Google Patents

音声信号のデ―タ量圧縮装置および圧縮方法

Info

Publication number
JP2000214885A
JP2000214885A JP11013464A JP1346499A JP2000214885A JP 2000214885 A JP2000214885 A JP 2000214885A JP 11013464 A JP11013464 A JP 11013464A JP 1346499 A JP1346499 A JP 1346499A JP 2000214885 A JP2000214885 A JP 2000214885A
Authority
JP
Japan
Prior art keywords
audio signal
compression
data amount
audio
preprocessing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11013464A
Other languages
English (en)
Inventor
Toshihiko Date
俊彦 伊達
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP11013464A priority Critical patent/JP2000214885A/ja
Publication of JP2000214885A publication Critical patent/JP2000214885A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音声信号の音質をできるだけ損なわずに、高
い情報圧縮率を実現可能な音声信号のデータ量圧縮装置
および圧縮方法を提供する。 【解決手段】 分析手段102は、音声信号の物理特性
を分析し、前処理内容決定手段103は、分析手段10
2の分析結果に基づいて、処理項目内容のパラメータを
決定する。前処理手段104は、入力された音声信号
を、前処理内容決定手段の決定したパラメータに基づい
て、物理特性を変更させ、音声圧縮手段105へ出力す
る。音声圧縮手段105は、音声信号の情報量を圧縮さ
せ、これを再生手段106で再生する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号のデータ
量を圧縮する装置及び圧縮方法に関するものである。
【0002】
【従来の技術】従来より、音声信号のデータ量を圧縮す
るための、様々な圧縮アルゴリズムに基づく圧縮方式が
開発されている。そして、イコライジングやダイナミッ
クレンジ等の調整によって、様々な物理特性の変更が施
され、音質の向上や情報圧縮率の向上を実現させてい
る。
【0003】
【発明が解決しようとする課題】しかしながら、これら
圧縮方式による音声信号の情報圧縮率と音質との関係
は、一般にトレードオフの関係にある。したがって、現
状の音声信号の製作プロセスにおいて、情報圧縮率を向
上させると音質が低下するため、音声信号の情報圧縮率
を向上させることを目的とした物理特性の変更はほとん
ど行われていない。そこで本発明は、上記の問題点を解
決するためになされたもので、音声信号の音質をできる
だけ損なわずに、高い情報圧縮率を実現可能な音声信号
のデータ量圧縮装置及び圧縮方法を提供するものであ
る。
【0004】
【課題を解決するための手段】上記の目的を達成するた
めに、請求項1に記載の発明に係る音声信号のデータ量
圧縮装置は、音声信号を入力する入力手段と、入力され
た音声信号の物理特性のうち、少なくとも1つを分析す
る分析手段と、上記物理特性の分析結果に基づき、音声
信号の物理特性を変化させる処理内容を決定する前処理
内容決定手段と、上記決定された処理内容に基づき、音
声信号の物理特性を変化させる前処理手段と、上記物理
特性を変化させた音声信号の情報量を圧縮する音声圧縮
手段と、上記圧縮した音声信号を再生する再生手段とを
備え、上記前処理手段は上記音声圧縮手段の前段に設
け、音声信号の物理特性を変化させてから情報量を圧縮
することを特徴とするものである。
【0005】また、請求項2に記載の発明に係る音声信
号のデータ量圧縮装置は、請求項1に記載の音声信号の
データ量圧縮装置において、上記分析手段は、上記音声
信号の周波数スペクトラムを分析するものであることを
特徴とするものである。
【0006】また、請求項3に記載の発明に係る音声信
号のデータ量圧縮装置は、請求項1または2に記載の音
声信号のデータ量圧縮装置において、上記分析手段は、
上記音声信号のダイナミックレンジを分析するものであ
ることを特徴とするものである。
【0007】また、請求項4に記載の発明に係る音声信
号のデータ量圧縮装置は、請求項1から3のいずれかに
記載の音声信号のデータ量圧縮装置において、上記分析
手段は、あいまいな表現値での評価が可能な、感性表現
と物理特性を定義づけるファジイ関数を内蔵し、上記フ
ァジイ関数を用いて音声信号の物理特性を分析するもの
であることを特徴とするものである。
【0008】また、請求項5に記載の発明に係る音声信
号のデータ量圧縮装置は、請求項1から4のいずれかに
記載の音声信号のデータ量圧縮装置において、上記前処
理手段は、音声信号の物理特性を時間軸上で連続的に変
化させるものであり、上記音声圧縮手段は、音声信号の
情報量を時間軸上で連続的に変化させて圧縮するもので
あることを特徴とするものである。
【0009】また、請求項6に記載の発明に係る音声信
号のデータ量圧縮装置は、請求項1から5のいずれかに
記載の音声信号のデータ量圧縮装置において、音声信号
の物理特性と、情報量圧縮率、及び音質との関係を定義
する音声信号の関数を内蔵したデータベースライブラリ
を備え、上記前処理内容決定手段は、上記分析手段から
の分析結果と上記データベースライブラリからの音声信
号の関数とを参照して、上記音声信号の物理特性を変化
させる処理内容を決定するものであることを特徴とする
ものである。
【0010】また、請求項7に記載の発明に係る音声信
号のデータ量圧縮装置は、請求項1から6のいずれかに
記載の音声信号のデータ量圧縮装置において、上記前処
理内容決定手段は、上記再生手段での圧縮後の音声信号
をモニタした後に、物理特性を変化させる処理内容項目
の情報圧縮率と音質に関するパラメータ値の両方、また
はいずれか一方、を調整または設定する機能を有するも
のであることを特徴とするものである。
【0011】また、請求項8に記載の発明に係る音声信
号のデータ量圧縮装置は、請求項1から7のいずれかに
記載の音声信号のデータ量圧縮装置において、上記再生
手段からのモニタされた音声信号の音質、及び上記音声
圧縮手段における圧縮結果を取得し、上記音声信号の音
質、及び情報圧縮率の関係を上記データベースライブラ
リへ出力して、上記データベースライブラリのデータべ
ースを更新させるデータべースライブラリ更新手段を備
えたことを特徴とするものである。
【0012】また、請求項9に記載の発明に係る音声信
号のデータ量圧縮方法は、音声信号が入力する入力ステ
ップと、入力された音声信号の物理特性について、少な
くとも1 つ以上を分析する分析ステップと、上記分析結
果に基づいて、音声信号の物理特性を変化させる処理内
容を決定する前処理内容決定ステップと、上記決定され
た処理内容に基づいて、音声信号の物理特性を変化させ
る前処理ステップと、上記物理特性を変化させた音声信
号の情報量を圧縮する音声圧縮ステップと、上記情報量
を圧縮させた音声信号を再生する再生ステップとを備
え、上記前処理ステップは、上記音声圧縮ステップの前
に設け、音声信号の物理特性を変化させてから情報量を
圧縮させることを特徴とする音声信号のデータ量圧縮方
法。
【0013】また、請求項10に記載の発明に係る音声
信号のデータ量圧縮方法は、請求項9に記載の音声信号
のデータ量圧縮方法において、上記分析ステップは、上
記音声信号の周波数スペクトラムを分析するものである
ことを特徴とするものである。
【0014】また、請求項11に記載の発明に係る音声
信号のデータ量圧縮方法は、請求項9または10に記載
の音声信号のデータ量圧縮方法において、上記分析ステ
ップは、上記音声信号のダイナミックレンジを分析する
ものであることを特徴とするものである。
【0015】また、請求項12に記載の発明に係る音声
信号のデータ量圧縮方法は、請求項9から11のいずれ
かに記載の音声信号のデータ量圧縮方法において、上記
分析ステップでは、あいまいな表現値での評価が可能
な、感性表現と物理特性を定義づけるファジイ関数を用
いて音声信号を分析するものであることを特徴とするも
のである。
【0016】また、請求項13に記載の発明に係る音声
信号のデータ量圧縮方法は、請求項9から12のいずれ
かに記載の音声信号のデータ量圧縮方法において、上記
前処理ステップでは、音声信号の物理特性を時間軸上で
連続的に変化させるものであり、上記音声圧縮ステップ
は、音声信号の情報量を時間軸上で連続的に変化させて
圧縮させるものであることを特徴とするものである。
【0017】また、請求項14に記載の発明に係る音声
信号のデータ量圧縮方法は、請求項9から13のいずれ
かに記載の音声信号のデータ量圧縮方法において、音声
信号の物理特性と、情報量圧縮率、及び音質との関係を
定義する音声信号の関数を出力するデータベース出力ス
テップを備え、上記前処理内容決定ステップは、上記音
声信号の分析結果と、上記音声信号の関数を参照して、
音声信号の物理特性を変化させる処理内容を決定するも
のであることを特徴とするものである。
【0018】また、請求項15に記載の発明に係る音声
信号のデータ量圧縮方法は、請求項9から14のいずれ
かに記載の音声信号のデータ量圧縮方法において、上記
前処理内容決定ステップは、上記再生ステップでの圧縮
後の音声信号をモニタした後に、物理特性を変化させる
処理内容項目の情報圧縮率と音質に関するパラメータ値
の両方、またはいずれか一方、を調整または設定するも
のであることを特徴とするものである。 また、請求項
16に記載の発明に係る音声信号のデータ量圧縮方法
は、請求項9から15のいずれかに記載の音声信号のデ
ータ量圧縮方法において、上記再生ステップでモニタさ
れた音質、及び上記音声圧縮ステップにおける圧縮結果
を取得して、上記音声信号の関数のデータべースを更新
する更新ステップを備えたことを特徴とするものであ
る。
【0019】
【発明の実施の形態】(実施の形態1)図1は、本実施
の形態1における音声信号のデータ量圧縮装置100の
構成を示す図である。図において、101は、音声信号
を入力する入力手段である。102は、上記入力手段1
01に入力された音声信号の物理特性を分析する分析手
段である。103は、上記分析手段102の分析結果か
ら物理特性を変化させる処理内容を決定する前処理内容
決定手段である。104は、上記前処理内容決定手段1
03が決定した処理内容に基づき音声信号の物理特性を
変化させる前処理手段である。105は、音声信号の情
報量を圧縮する音声圧縮手段である。106は、音声信
号を再生する再生手段である。そして上記前処理手段1
04は、具体的に、周波数スペクトラムを変更できるイ
コライザや、ダイナミックレンジを変更できるコンプレ
ッサまたはリミッタ等の各種エフェクタが、直列または
並列に複数接続されたもので構成される。
【0020】また図2は、5.1chマルチチャンネル入
力信号におけるサラウンド度という感性表現と物理特性
を定義づけるファジイ関数を示している。このファジイ
関数は、分析手段102に内蔵され、入力信号をあいま
いな表現値での評価から物理特性の分析を行うことを可
能とする評価関数として用いられる。図において、横軸
は5.1ch全チャンネルに対するサラウンドチャンネル
のエネルギー比という物理特性であり、縦軸は、聴感的
な印象と対応したサラウンド度を示すグレード値であ
る。
【0021】そして、“かなりサラウンドな素材”や、
“同じくらいサラウンドな素材”というようなあいまい
な感性表現での評価を、このファジイ関数を用いて物理
特性上の数値へ置き換え、入力信号の評価を物理特性で
はなくサラウンド度という感性表現で行う。
【0022】これにより、例えばエネルギー比0.7と
いう物理特性上の評価を、サラウンド度という感性表現
での評価に置き換えることが容易になり、また、エネル
ギー比0.5と0.7という評価を、それぞれサラウン
ド度という感性表現での評価に置き換えることによっ
て、相対的に比較することも容易となる。このようにフ
ァジイ関数を定義することによって、分析手段102で
は、人間の聴感特性にマッチした分析及び評価を行う。
【0023】次に動作について説明する。まず、入力手
段101に音声信号が入力される。この入力信号はモノ
ラル信号であってもサラウンドチャンネルを含む所謂
5.1マルチチャンネル信号であってもよい。次に、分
析手段102では、入力された上記音声信号の、各チャ
ンネル毎の周波数スペクトラムやダイナミックレンジ等
の物理特性のうち、少なくとも1つを分析する。
【0024】または、入力手段101に入力された音声
信号に対して人間が評価を行った、あいまいな感性的表
現での評価を分析手段102に入力すると、分析手段1
02では、内蔵されているファジイ関数を用いて、入力
された感性的表現での評価から、実際の物理特性上の数
値に置き換えて数値化を行う。これにより音声信号の評
価は、物理特性ではなく感性表現で行われる。尚、上記
物理特性の分析は、入力された音声信号の全てに対して
分析を行っても、入力された音声信号の一部に対して分
析を行ってもどちらでもよい。そして、分析手段102
で分析された音声信号の物理特性の分析結果は、前処理
内容決定手段103へ出力される。
【0025】次に、上記前処理内容決定手段103で
は、上記分析手段102からの分析結果に基づいて、音
声圧縮手段105での圧縮率が向上するように圧縮アル
ゴリズムを考慮し、音声信号の物理特性の変更内容を決
定する。そして、決定した変更内容に基づいて処理項目
のパラメータを設定し、前処理手段104へ出力する。
尚、上記処理項目のパラメータには、制限する周波数帯
域のカットオフ周波数やリミッタでのスレッシュホルド
レベルなどがある。
【0026】具体的に、上記前処理内容決定手段103
が設定する処理内容を説明すると、例えば5.1マルチ
チャンネル信号のなかでフロントLRチャンネルの信号
レベルと比較して、信号レベルが低いチャンネルがあれ
ば、そのチャンネルの信号に対して周波数帯域やダイナ
ミックレンジを制限するように前処理手段104に対し
て指示する。前処理手段104では、上記前処理内容決
定手段103が出力した処理内容に基づき、周波数帯域
またはダイナミックレンジを制限する。これにより、制
限した周波数帯域またはダイナミックレンジに相当する
音声信号の情報量は削減され、音声圧縮手段105での
情報圧縮率の向上に結び付くこととなる。
【0027】または、時々の高域成分を除去しても、殆
ど音質的に影響がないチャンネル信号の場合、前処理内
容決定手段103は、高域成分を除去するローパスフィ
ルターを、入力された音声信号の全域に渡って通すよう
に前処理手段104へ指示する。前処理手段104で
は、上記前処理内容決定手段103が出力した処理内容
に基づき、ローパスフィルターを、入力された音声信号
の全域に渡って通す。これにより、除去した高域成分に
相当する情報量は削減され、音声圧縮手段105での情
報圧縮率の向上に結び付くこととなり、また音質的な劣
化も最小限に抑えられることとなる。
【0028】または、音声圧縮手段105が圧縮率を時
間軸上で変化させることができる可変ビットレート方式
である場合、前処理内容決定手段103は、前処理手段
104での処理内容項目のパラメータを時間軸上で変化
させる。つまり、前処理内容決定手段103は、高域成
分がローパスフィルターを通る時だけ、ローパスフィル
タのカットオフ周波数を上げる,又は高域成分のフィル
タリングは行わないなどの指示を、前処理手段104へ
出力し、前処理手段104にローパスフィルタの特性の
変化を時間の経過とともに記憶させる。そして、前処理
手段104は、時間の経過と共にローパスフィルタの特
性を変化させ、高域成分のフィルタリングをしない,ま
たは高域成分がローパスフィルタを通過するときだけロ
ーパスフィルタのカット分数を上げる等の処理を行う。
これにより、フィルタリングにより情報量は削減されて
音声圧縮手段105での情報圧縮率の向上に結び付くと
共に、高域成分の除去は、極力抑えられているので、音
質向上のための重要な情報は残り、さらにより良い音質
が得られることとなる。
【0029】このように、前処理手段104にて、上記
前処理内容決定手段103が決定した処理内容に基づ
き、物理特性が変更された音声信号は、音声圧縮手段1
05へ出力される。そして音声圧縮手段105では、上
記前処理手段104からの音声信号を圧縮させて、再生
手段106へ出力する。再生手段106では、上記音声
圧縮手段105からの音声信号を再生する。尚、再生手
段106による圧縮後の音声信号をモニタした後に、人
が直接上記前処理内容決定手段103での決定内容を変
更し、前処理手段104での処理項目のパラメータを調
整または設定できる機能を備えてもよいものとする。
【0030】このように、実施の形態1による音声信号
のデータ量圧縮装置によれば、音声信号の分析結果に基
づいて、イコライジングやダイナミックレンジ等の調整
による物理特性の変更を行った後に、情報量を圧縮させ
るので、新たなツールを設けずに、音声信号の音質の劣
化をできるだけ抑えて、高い情報圧縮率を実現すること
ができる。
【0031】また、分析手段102は、内蔵したファジ
イ関数を用いて音声信号の物理特性の分析を行うので、
音声信号の評価を物理特性ではなく、感性表現で行うこ
とが可能となり、あいまいな表現値に対しても人間の聴
感特性にあった音声信号の評価、及び分析を行うことが
できる。
【0032】また、上記音声圧縮手段105が、情報圧
縮率を時間軸上で変化させることのできる所謂可変ビッ
トレート方式である場合、前処理手段104での処理内
容項目のパラメータを時間軸上で変化させると、情報圧
縮率が向上すると共に、一定のパラメータで前処理を施
す場合よりも、高音質な音声信号を取得することができ
る。
【0033】(実施の形態2)図3は、本実施の形態2
における音声信号のデータ量圧縮装置200の構成を示
す図である。音声信号のデータ量圧縮装置200は、音
声信号の物理特性と、情報圧縮率と、音質との関係を定
義する、図4に示す関数を内蔵したデータベースライブ
ラリ203を備える。図4(a)は、上記物理特性が周
波数帯域であるときの,また図4(b)は、上記物理特
性がダイナミックレンジであるときの,物理特性と、情
報圧縮率、及び音質との関係を示す関数である。これに
より前処理内容決定手段204は、上記データベースラ
イブラリ203に内蔵の関数と入力信号の分析結果とを
照らし合わせながら、入力信号の音質をできるだけ損な
わずに高い情報圧縮率が実現できるような最適解を取得
し、前処理手段205での処理内容を決定する構成とな
っている。その他の構成は、実施の形態1と同様であ
る。
【0034】次に動作について説明する。まず、入力手
段201に音声信号が入力される。この入力信号はモノ
ラル信号であってもサラウンドチャンネルを含む所謂
5.1マルチチャンネル信号であってもよい。次に分析
手段202では、入力された上記音声信号の、各チャン
ネル毎の周波数スペクトラムやダイナミックレンジ等の
物理特性のうち、少なくとも1つを分析する。
【0035】またはこのとき、入力手段201に入力さ
れた音声信号に対して、人間が行ったあいまいな感性的
表現での評価を、分析手段202に入力すると、分析手
段202では、内蔵されているファジイ関数( 図2)を
用いて、感性的表現を実際の物理特性上の数値と置き換
えて数値化を行う。これにより入力信号の評価は、物理
特性ではなく感性表現で行われる。また、上記物理特性
の分析は、入力された音声信号の全てに対して分析を行
っても、入力された音声信号の一部に対して分析を行っ
てもどちらでもよい。そして分析手段202での分析結
果は、前処理内容決定手段204へ出力される。また、
データベースライブラリ203では、上記分析手段20
2が分析した項目に対応する物理特性、音質、及び情報
圧縮率との関係を示す関数を前処理内容決定手段204
へ出力する。
【0036】上記前処理内容決定手段204では、上記
データベースライブラリ203が出力した関数に、上記
分析手段202が出力した分析結果を当てはめる。そし
て、分析結果を当てはめた上記関数より、音声信号の音
質をできるだけ損なわずに高い情報圧縮率が得られるよ
うな最適解を見つける。具体的には、音質の劣化をどの
程度に抑えるか、または、あとどれくらい情報圧縮率を
向上させるか、音質または情報圧縮率の変化させる値を
決定して再生手段207から出力させる音声信号の特性
を決定する。この情報圧縮率または音質のどちらか1つ
の変化させる値が決定すると、入力信号の物理特性の変
更内容が決定することとなる。
【0037】例えば、図4(a)において、入力された
音声信号の分析結果が関数上でA点とし、Aから音質を
変化させる値αまたは、情報圧縮率を変化させる値βを
決定する。そしてA点より音質α,または情報圧縮率β
を関数上で変化させると、A点はB点へ移動する。この
関数上のB点における音質,周波数帯域及び情報圧縮率
が再生手段207より出力される音声信号の特性であ
る。前処理内容決定手段204は、A点における周波数
帯域とB点における周波数帯域との差γを求め、前処理
手段205へ周波数帯域をγカットするよう指示を出
す。前処理手段205では、前処理内容決定手段204
が決定した処理内容に基づき、周波数帯域のパラメータ
を設定し、周波数帯域を制限して物理特性を変化させ
る。音声圧縮手段206では、上記前処理内容決定手段
204での決定内容に基づいて、上記前処理手段205
からの音声信号を圧縮し、再生手段207へ出力する。
再生手段207では、上記音声圧縮手段206からの音
声信号の再生を行う。
【0038】また、音声圧縮手段206が情報圧縮率を
時間軸上で変化させることができる可変ビットレート方
式である場合、前処理内容決定手段204は、決定内容
に基づき前処理手段205での処理内容項目のパラメー
タを時間軸上で変化させる。つまり、前処理内容決定手
段204は、高域成分がローパスフィルタを通る時だ
け、ローパスフィルタのカット分数を上げる,又は高域
成分のフィルタリングは行わないなどの指示を、前処理
手段205へ出し、前処理手段205にローパスフィル
タの特性の変化を時間の経過とともに記憶させる。そし
て前処理手段205は、時間の経過と共に、ローパスフ
ィルタの特性を変化させ、高域成分のフィルタリングを
しない,または高域成分がローパスフィルタを通過する
ときだけローパスフィルタのカット分数を上げる等の処
理を行う。音声圧縮手段206では、情報圧縮率を時間
軸上で変化させて、上記前処理手段205からの音声信
号を圧縮し、再生手段207へ出力する。再生手段20
7は、上記音声圧縮手段206からの音声信号を再生す
る。これにより、フィルタリングにより情報量は削減さ
れて音声圧縮手段206での情報圧縮率の向上に結び付
くと共に、高域成分の除去は、極力抑えられているの
で、音質向上のための重要な情報は残り、一定のパラメ
ータで前処理を施す場合よりも、さらにより良い音質が
得られることとなる。
【0039】尚、再生手段207による圧縮後の音声信
号をモニタした後に、人が直接上記前処理内容決定手段
204での決定内容を変更し、前処理手段204での処
理項目のパラメータを調整または設定できる機能を備え
てもよいものとする。また、上記処理項目のパラメータ
には、制限する周波数帯域のカットオフ周波数の他に、
リミッタでのスレッシュホルドレベルなどがある。
【0040】このように、実施の形態2による音声信号
のデータ量圧縮装置は、音声信号の物理特性と、情報圧
縮率と、音質との関係を示す関数で構成されるデータベ
ースライブラリ203を備えたので、前処理内容決定手
段204は、分析手段202からの分析結果と上記デー
タベースライブラリ203からの上記関数とを参照し
て、音質ができるだけ劣化せずに情報圧縮率が向上する
ような物理特性の変更内容を決定することができる。ま
た物理特性の変更は、情報量を圧縮させる前に、上記変
更内容に基づき、イコライジングやダイナミックレンジ
等の調整によって行うので、新たにツールを設けずに音
質の劣化を最小限に抑えて高い情報圧縮率を実現するこ
とができる。
【0041】また、分析手段202は、内蔵したファジ
イ関数を用いて音声信号の物理特性の分析を行うので、
音声信号の評価を物理特性ではなく、感性表現で行うこ
とが可能となり、あいまいな表現値に対しても人間の聴
感特性にあった音声信号の評価及び分析を行うことがで
きる。また、上記音声圧縮手段206が、情報圧縮率を
時間軸上で変化させることのできる所謂可変ビットレー
ト方式である場合、前処理手段205での処理内容項目
のパラメータを時間軸上で変化させると、情報圧縮率が
向上すると共に、一定のパラメータで前処理を施す場合
よりも、高音質な音声信号を取得することができる。
【0042】(実施の形態3)図5は、本実施の形態3
における音声信号のデータ量圧縮装置300の構成を示
す図である。音声信号のデータ量圧縮装置300は、デ
ータベースライブラリ更新手段308を備え、データベ
ースライブラリ303には学習機能をもたせる。そして
上記データベースライブラリ更新手段308は、再生手
段307からのモニタした音声信号の音質と、音声圧縮
手段306からの情報圧縮率とをフィードバックして、
音質と情報圧縮率との関係をデータべースライブラリ3
03へ出力する。データベースライブラリ303では、
新しい音質と情報圧縮率のデータをもとに、音声信号の
関数のデータベースを新しく構築する。
【0043】このようにデータベースライブラリ303
が人間の主観や経験、ノウハウなどを含む一種のエキス
パートシステムであることを利用して、実施の形態3で
はデータベースライブラリ303に学習機能をもたせ、
再生手段307からの音声信号の音質をモニタリングし
て、音声圧縮手段での情報圧縮率との関係をデータベー
スライブラリ更新手段308からフィードバックするこ
とによって、よりユーザの主観に適合したデータベース
を構築するよう構成されている。その他の構成は、実施
の形態2と同様である。
【0044】次に動作について説明する。まず、入力手
段301に音声信号が入力される。この入力信号はモノ
ラル信号であってもサラウンドチャンネルを含む所謂
5.1マルチチャンネル信号であってもよい。次に分析
手段302では、入力された音声信号の、各チャンネル
毎の周波数スペクトラムやダイナミックレンジ等の物理
特性のうち、少なくても1つを分析する。
【0045】またこのとき、入力手段301に入力され
た音声信号に対して、人間が行ったあいまいな感性表現
での評価を分析手段302に入力すると、分析手段30
2では、内蔵されているファジイ関数( 図2)を用い
て、感性的表現を物理特性上の数値に置き換えて、数値
化を行う。これにより入力信号の評価は、物理特性では
なく感性表現で行われる。尚、上記物理特性の分析は、
入力された音声信号の全てに対して分析を行っても、入
力された音声信号の一部に対して分析を行ってもどちら
でもよい。
【0046】そして、分析手段302で分析された音声
信号の物理特性の分析結果は、前処理内容決定手段30
4へ出力される。また、データベースライブラリ303
では、上記分析手段302が分析した項目に対応する物
理特性、情報圧縮率、及び音質との関係を示す関数( 図
4)を前処理内容決定手段304へ出力する。上記前処
理内容決定手段304では、上記データベースライブラ
リ303が出力した音声信号の関数に、上記分析手段3
02出力した分析結果を当てはめる。そして、当てはめ
た関数より、入力信号の音質をできるだけ損なわずに高
い圧縮率を実現できるような最適解を見つける。具体的
には、音質の劣化をどの程度に抑えるか、または、どれ
くらい圧縮率を向上させるか等、音質または情報圧縮率
を変化させる値を決定する。この音質または情報圧縮率
のどちらか1つを変化させる値が決定すると、入力信号
の物理特性の変更内容が決定することとなる。そして前
処理内容決定手段304は、決定された物理特性の変更
内容に基づいて処理内容項目のパラメータを設定し、前
処理手段305へ出力する。尚、上記処理項目のパラメ
ータには、制限する周波数帯域のカットオフ周波数やリ
ミッタでのスレッシュホルドレベルなどがある。
【0047】上記前処理手段305では、上記前処理内
容決定手段304が出力した、上記処理項目内容のパラ
メータに基づいて、物理特性を変更させて音声圧縮手段
306へ出力する。そして音声圧縮手段306は、上記
前処理内容決定手段304が決定した処理内容に基づ
き、音声信号を圧縮させて、再生手段307へ出力する
と共に、データベースライブラリ更新手段308へ圧縮
結果を出力する。再生手段307では、上記音声圧縮手
段306からの出力である音声信号を再生すると共に、
モニタリングした音声信号の音質をデータベースライブ
ラリ更新手段308へ出力する。
【0048】上記データベースライブラリ更新手段30
8では、上記再生手段307からのモニタリングした音
声信号の音質、及び音声圧縮手段306における圧縮結
果との関係をデータベースライブラリ303へ出力す
る。データベースライブラリ303では、データベース
ライブラリ更新手段308より新しく取得した音声信号
の音質、及び情報圧縮率に基づいてデータベースの再構
築を行う。
【0049】また、音声圧縮手段306が圧縮率を時間
軸上で変化させることができる可変ビットレート方式で
ある場合、前処理内容決定手段304は、決定内容に基
づき前処理手段305での処理内容項目のパラメータを
時間軸上で変化させる。つまり、前処理内容決定手段3
04は、高域成分がローパスフィルタを通る時だけ、ロ
ーパスフィルタのカット分数を上げる,又は高域成分の
フィルタリングは行わないなどの指示を、前処理手段3
05へ出し、前処理手段305にローパスフィルタの特
性の変化を時間の経過とともに記憶させる。そして前処
理手段305は、時間の経過と共に、ローパスフィルタ
の特性を変化させ、高域成分のフィルタリングをしな
い,または高域成分がローパスフィルタを通過するとき
だけローパスフィルタのカット分数を上げる等の処理を
行う。次に音声圧縮手段306は、情報圧縮率を時間軸
上で変化させて、前処理手段305からの音声信号を圧
縮する。これにより、フィルタリングにより情報量は削
減されて音声圧縮手段306での圧縮率の向上に結び付
くと共に、高域成分の除去は、極力抑えられているの
で、音質向上のための重要な情報は残り、一定のパラメ
ータで前処理を施すよりも、さらにより良い音質が得ら
れることとなる。
【0050】尚、再生手段307による圧縮後の音声信
号をモニタした後に、人が直接上記前処理内容決定手段
304での決定内容を変更し、前処理手段305での処
理項目のパラメータを調整または設定できる機能を備え
てもよいものとする。
【0051】このように、本実施の形態3における音声
信号のデータ量圧縮装置300によれば、再生手段30
7からモニタリングした音声信号の音質と、音声圧縮手
段306での情報圧縮率との関係を、データベースライ
ブラリ303へ出力するデータベースライブラリ更新手
段308を備えたので、データベースライブラリ303
は、再生手段307からモニタリングした音声信号の音
質、及び音声圧縮手段306における圧縮結果を、デー
タベースライブラリ更新手段308よりフィードバック
する度に、データを新しく更新することができ、よりユ
ーザーの主観に適合したデータベースへと構築させてい
くことができる。
【0052】また、音声圧縮手段306での圧縮方式
が、圧縮率を事前に規定できないアルゴリズムである場
合も、前処理手段305での前処理内容と圧縮結果との
関係を、データベースライブラリ更新手段308からフ
ィードバックすることによって、情報圧縮率の予測精度
が高いデータベースを構築することができる。
【0053】そして前処理内容決定手段304は、分析
手段302における分析結果と、上記データベースライ
ブラリ303における,よりユーザーの主観に適合した
データベースとを参照して、音質の劣化を最小限に留め
て高い圧縮率が得られるような最適解を取得し、前処理
手段305での処理内容項目のパラメータを決定するの
で、入力した音声信号の音質の劣化を最小限に抑えなが
らユーザーの好みの音質に近づけるとともに、高い情報
圧縮率を実現させることができる。
【0054】また、分析手段302は、内蔵したファジ
イ関数を用いて音声信号の物理特性の分析を行うので、
音声信号の評価を物理特性ではなく、感性表現で行うこ
とが可能となり、あいまいな表現値に対しても人間の聴
感特性にあった音声信号の評価及び分析を行うことがで
きる。
【0055】また、上記音声圧縮手段306が、情報圧
縮率を時間軸上で変化させることのできる所謂可変ビッ
トレート方式である場合、前処理手段305での処理内
容項目のパラメータを時間軸上で変化させると、情報圧
縮率が向上すると共に、一定のパラメータで前処理を施
す場合よりも、高音質な音声信号を取得することができ
る。
【0056】
【発明の効果】請求項1に記載の発明に係る音声信号の
データ量圧縮装置は、音声信号を入力する入力手段と、
入力された音声信号の物理特性のうち、少なくとも1つ
を分析する分析手段と、上記物理特性の分析結果に基づ
き、音声信号の物理特性を変化させる処理内容を決定す
る前処理内容決定手段と、上記決定された処理内容に基
づき、音声信号の物理特性を変化させる前処理手段と、
上記物理特性を変化させた音声信号の情報量を圧縮する
音声圧縮手段と、上記圧縮した音声信号を再生する再生
手段とを備え、上記前処理手段は上記音声圧縮手段の前
段に設け、音声信号の物理特性を変化させてから情報量
を圧縮することを特徴とするものとしたので、音声信号
の情報量を圧縮させる前に物理特性を変更させることに
よって、入力された音声信号の音質をできるだけ損なわ
ずに高い情報圧縮率を実現することができるという効果
を有する。
【0057】また、請求項2に記載の発明に係る音声信
号のデータ量圧縮装置は、請求項1に記載の音声信号の
データ量圧縮装置において、上記分析手段は、上記音声
信号の周波数スペクトラムを分析するものであることを
特徴とするものとしたので、新たなツールを設けずに周
波数帯域を制限するだけで、音声信号の音質をできるだ
け損なわずに高い情報圧縮率を実現することができると
いう効果を有する。
【0058】また、請求項3に記載の発明に係る音声信
号のデータ量圧縮装置は、請求項1または2に記載の音
声信号のデータ量圧縮装置において、上記分析手段は、
上記音声信号のダイナミックレンジを分析するものであ
ることを特徴とするものとしたので、新たなツールを設
けずにダイナミックレンジを制限するだけで、音声信号
の音質をできるだけ損なわずに高い情報圧縮率を実現す
ることができるという効果を有する。
【0059】また、請求項4に記載の発明に係る音声信
号のデータ量圧縮装置は、請求項1から3のいずれかに
記載の音声信号のデータ量圧縮装置において、上記分析
手段は、あいまいな表現値での評価が可能な、感性表現
と物理特性を定義づけるファジイ関数を内蔵し、上記フ
ァジイ関数を用いて音声信号の物理特性を分析するもの
であることを特徴とするものとしたので、入力された音
声信号の評価を物理特性ではなく、感性表現で行うこと
が可能となり、あいまいな表現値に対しても人間の聴感
特性にあった音声信号の評価及び分析を行うことができ
るという効果を有する。
【0060】また、請求項5に記載の発明に係る音声信
号のデータ量圧縮装置は、請求項1から4のいずれかに
記載の音声信号のデータ量圧縮装置において、上記前処
理手段は、音声信号の物理特性を時間軸上で連続的に変
化させるものであり、上記音声圧縮手段は、音声信号の
情報量を時間軸上で連続的に変化させて圧縮するもので
あることを特徴とするものとしたので、一定のパラメー
タで前処理を施す場合よりも、音声信号の音質を一定に
保ちながら、より高い情報圧縮率を実現させることがで
きるという効果を有する。
【0061】また、請求項6に記載の発明に係る音声信
号のデータ量圧縮装置は、請求項1から5のいずれかに
記載の音声信号のデータ量圧縮装置において、音声信号
の物理特性と、情報量圧縮率、及び音質との関係を定義
する関数を内蔵したデータベースライブラリを備え、上
記前処理内容決定手段は、上記分析手段からの分析結果
と上記データベースライブラリからの音声信号の関数と
を参照して、上記入力信号の物理特性を変化させる処理
内容を決定するものであることを特徴とするものとした
ので、前処理内容決定手段は、音声信号の音質をできる
だけ損なわずに高い圧縮率が得られるような最適解を、
データベースライブラリに内蔵された関数を参照して見
つけることができ、音声信号毎に前処理手段での処理内
容のパラメータを決定することができるという効果を有
する。
【0062】また、請求項7に記載の発明に係る音声信
号のデータ量圧縮装置は、請求項1から6のいずれかに
記載の音声信号のデータ量圧縮装置において、上記前処
理内容決定手段は、上記再生手段での圧縮後の音声信号
をモニタした後に、物理特性を変化させる処理内容項目
の情報圧縮率と音質に関するパラメータ値の両方、また
はいずれか一方、を調整または設定する機能を有するも
のであることを特徴とするものとしたので、実際に圧縮
後の音声信号をモニタしてから、再度ユーザーの好みに
合うように情報圧縮率または音質のパラメータを調整す
ることができるという効果を有する。
【0063】また、請求項8に記載の発明に係る音声信
号のデータ量圧縮装置は、請求項1から7のいずれかに
記載の音声信号のデータ量圧縮装置において、上記再生
手段からのモニタされた音声信号の音質、及び上記音声
圧縮手段における圧縮結果を取得し、上記音声信号の音
質と情報圧縮率の関係を上記データベースライブラリへ
出力して、上記データベースライブラリのデータべース
を更新させるデータべースライブラリ更新手段を備えた
ことを特徴とするものとしたので、データベースライブ
ラリは、モニタリングした音声信号の音質と、情報圧縮
率との関係をデータベースライブラリ更新手段からフィ
ードバックする度に、データを新しく更新することがで
き、よりユーザーの主観に適合したデータベースへと構
築させていくことができるという効果を有する。
【0064】また、請求項9に記載の発明に係る音声信
号のデータ量圧縮方法は、音声信号が入力する入力ステ
ップと、入力された音声信号の物理特性について、少な
くとも1 つ以上を分析する分析ステップと、上記分析結
果に基づいて、音声信号の物理特性を変化させる処理内
容を決定する前処理内容決定ステップと、上記決定され
た処理内容に基づいて、音声信号の物理特性を変化させ
る前処理ステップと、上記物理特性を変化させた音声信
号の情報量を圧縮する音声圧縮ステップと、上記情報量
を圧縮させた音声信号を再生する再生ステップとを備
え、上記前処理ステップは、上記音声圧縮ステップの前
に設け、音声信号の物理特性を変化させてから情報量を
圧縮させることを特徴とするものとしたので、音声信号
の情報量を圧縮させる前に物理特性を変更させることに
よって、入力された音声信号の音質をできるだけ損なわ
ずに、高い情報圧縮率を実現することができるという効
果を有する。
【0065】また、請求項10に記載の発明に係る音声
信号のデータ量圧縮方法は、請求項9に記載の音声信号
のデータ量圧縮方法において、上記分析ステップは、上
記音声信号の周波数スペクトラムを分析するものである
ことを特徴とするものとしたので、周波数帯域を制限す
るだけで、音声信号の音質をできるだけ損なわずに高い
情報圧縮率を実現することができるという効果を有す
る。
【0066】また、請求項11に記載の発明に係る音声
信号のデータ量圧縮方法は、請求項9または10に記載
の音声信号のデータ量圧縮方法において、上記分析ステ
ップは、上記音声信号のダイナミックレンジを分析する
ものであることを特徴とするものとしたので、ダイナミ
ックレンジを制限するだけで、音声信号の音質をできる
だけ損なわずに高い情報圧縮率を実現することができる
という効果を有する。
【0067】また、請求項12に記載の発明に係る音声
信号のデータ量圧縮方法は、請求項9から11のいずれ
かに記載の音声信号のデータ量圧縮方法において、上記
分析ステップでは、あいまいな表現値での評価が可能
な、感性表現と物理特性を定義づけるファジイ関数を用
いて音声信号を分析するものであることを特徴とするも
のとしたので、入力された音声信号の評価を物理特性で
はなく、感性表現で行うことが可能となり、あいまいな
表現値に対しても人間の聴感特性にあった音声信号の評
価及び分析を行うことができるという効果を有する。
【0068】また、請求項13に記載の発明に係る音声
信号のデータ量圧縮方法は、請求項9から12のいずれ
かに記載の音声信号のデータ量圧縮方法において、上記
前処理ステップでは、音声信号の物理特性を時間軸上で
連続的に変化させるものであり、上記音声圧縮ステップ
は、音声信号の情報量を時間軸上で連続的に変化させて
圧縮させるものであることを特徴とするものとしたの
で、一定のパラメータで前処理を施す場合よりも、音声
信号の音質を一定に保ちながら、より高い情報圧縮率を
実現させることができるという効果を有する。
【0069】また、請求項14に記載の発明に係る音声
信号のデータ量圧縮方法は、請求項9から13のいずれ
かに記載の音声信号のデータ量圧縮方法において、音声
信号の物理特性と、情報量圧縮率、及び音質との関係を
定義する音声信号の関数を出力するデータベース出力ス
テップを備え、上記前処理内容決定ステップは、上記音
声信号の分析結果と、上記音声信号の関数を参照して、
音声信号の物理特性を変化させる処理内容を決定するも
のであることを特徴とするものとしたので、音声信号の
音質をできるだけ損なわずに高い圧縮率が得られるよう
な処理内容のパラメータを音声信号毎に決定することが
できるという効果を有する。
【0070】また、請求項15に記載の発明に係る音声
信号のデータ量圧縮方法は、請求項9から14のいずれ
かに記載の音声信号のデータ量圧縮方法において、上記
前処理内容決定ステップは、上記再生ステップでの圧縮
後の音声信号をモニタした後に、物理特性を変化させる
処理内容項目の情報圧縮率と音質に関するパラメータ値
の両方、またはいずれか一方、を調整または設定するも
のであることを特徴とするものものとしたので、実際に
圧縮後の音声信号をモニタしてから、再度ユーザーの好
みに合うように情報圧縮率または音質のパラメータを調
整することができるという効果を有する。
【0071】また、請求項16に記載の発明に係る音声
信号のデータ量圧縮方法は、請求項9から15のいずれ
かに記載の音声信号のデータ量圧縮方法において、上記
再生ステップでモニタされた音質、及び上記音声圧縮ス
テップにおける圧縮結果を取得して、上記音声信号の関
数のデータべースを更新する更新ステップを備えたこと
を特徴とするものとしたので、よりユーザーの主観に適
合したデータベースへと構築させていくことができると
いう効果を有する。
【図面の簡単な説明】
【図1】 実施の形態1における音声信号のデータ量圧
縮装置の構成を示すブロック図である。
【図2】 実施の形態1から3における分析手段に内蔵
され、サラウンド度という感性表現と物理特性を定義づ
けるファジイ関数である。
【図3】 実施の形態2における音声信号のデータ量圧
縮装置の構成を示すブロック図である。
【図4】 図4(a)は、周波数帯域、情報圧縮率、及
び音声との関係を示す関数であり、図4(b)は、ダイ
ナミックレンジ、情報圧縮率、及び音質との関係を示す
関数であり、これらの関数でデータベースライブラリは
構成される。
【図5】 実施の形態3における音声信号のデータ量圧
縮装置の構成を示すブロック図である。
【符号の説明】
101 入力手段 102 分析手段 103 前処理内容決定手段 104 前処理手段 105 音声圧縮手段 106 再生手段 201 入力手段 202 分析手段 203 データベースライブラリ 204 前処理内容決定手段 205 前処理手段 206 音声圧縮手段 207 再生手段 301 入力手段 302 分析手段 303 データベースライブラリ 304 前処理内容決定手段 305 前処理手段 306 音声圧縮手段 307 再生手段 308 データベースライブラリ更新手段

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 音声信号を入力する入力手段と、 入力された音声信号の物理特性のうち、少なくとも1つ
    を分析する分析手段と、 上記物理特性の分析結果に基づき、音声信号の物理特性
    を変化させる処理内容を決定する前処理内容決定手段
    と、 上記決定された処理内容に基づき、音声信号の物理特性
    を変化させる前処理手段と、 上記物理特性を変化させた音声信号の情報量を圧縮する
    音声圧縮手段と、 上記圧縮した音声信号を再生する再生手段とを備え、 上記前処理手段は上記音声圧縮手段の前段に設け、音声
    信号の物理特性を変化させてから情報量を圧縮すること
    を特徴とする音声信号のデータ量圧縮装置。
  2. 【請求項2】 請求項1に記載の音声信号のデータ量圧
    縮装置において、 上記分析手段は、上記音声信号の周波数スペクトラムを
    分析するものであることを特徴とする音声信号のデータ
    量圧縮装置。
  3. 【請求項3】 請求項1または2に記載の音声信号のデ
    ータ量圧縮装置において、 上記分析手段は、上記音声信号のダイナミックレンジを
    分析するものであることを特徴とする音声信号のデータ
    量圧縮装置。
  4. 【請求項4】 請求項1から3のいずれかに記載の音声
    信号のデータ量圧縮装置において、 上記分析手段は、あいまいな表現値での評価が可能な、
    感性表現と物理特性を定義づけるファジイ関数を内蔵
    し、上記ファジイ関数を用いて音声信号の物理特性を分
    析するものであることを特徴とする音声信号のデータ量
    圧縮装置。
  5. 【請求項5】 請求項1から4のいずれかに記載の音声
    信号のデータ量圧縮装置において、 上記前処理手段は、音声信号の物理特性を時間軸上で連
    続的に変化させるものであり、 上記音声圧縮手段は、音声信号の情報量を時間軸上で連
    続的に変化させて圧縮するものであることを特徴とする
    音声信号のデータ量圧縮装置。
  6. 【請求項6】 請求項1から5のいずれかに記載の音声
    信号のデータ量圧縮装置において、 音声信号の物理特性と、情報量圧縮率、及び音質との関
    係を定義する音声信号の関数を内蔵したデータベースラ
    イブラリを備え、 上記前処理内容決定手段は、 上記分析手段からの分析結果と上記データベースライブ
    ラリからの音声信号の関数とを参照して、上記音声信号
    の物理特性を変化させる処理内容を決定するものである
    ことを特徴とする音声信号のデータ量圧縮装置。
  7. 【請求項7】 請求項1から6のいずれかに記載の音声
    信号のデータ量圧縮装置において、 上記前処理内容決定手段は、 上記再生手段での圧縮後の音声信号をモニタした後に、
    物理特性を変化させる処理内容項目の情報圧縮率と音質
    に関するパラメータ値の両方、またはいずれか一方、を
    調整または設定する機能を有するものであることを特徴
    とする音声信号のデータ量圧縮装置。
  8. 【請求項8】 請求項1から7のいずれかに記載の音声
    信号のデータ量圧縮装置において、 上記再生手段からのモニタされた音声信号の音質、及び
    上記音声圧縮手段における圧縮結果を取得し、上記音声
    信号の音質と情報圧縮率の関係を上記データベースライ
    ブラリへ出力して、上記データベースライブラリのデー
    タべースを更新させるデータべースライブラリ更新手段
    を備えたことを特徴とする音声信号のデータ量圧縮装
    置。
  9. 【請求項9】 音声信号のデータ量圧縮方法において、 音声信号が入力する入力ステップと、 入力された音声信号の物理特性について、少なくとも1
    つ以上を分析する分析ステップと、 上記分析結果に基づいて、音声信号の物理特性を変化さ
    せる処理内容を決定する前処理内容決定ステップと、 上記決定された処理内容に基づいて、音声信号の物理特
    性を変化させる前処理ステップと、 上記物理特性を変化させた音声信号の情報量を圧縮する
    音声圧縮ステップと、 上記情報量を圧縮させた音声信号を再生する再生ステッ
    プとを備え、 上記前処理ステップは、上記音声圧縮ステップの前に設
    け、音声信号の物理特性を変化させてから情報量を圧縮
    させることを特徴とする音声信号のデータ量圧縮方法。
  10. 【請求項10】 請求項9に記載の音声信号のデータ量
    圧縮方法において、 上記分析ステップは、上記音声信号の周波数スペクトラ
    ムを分析するものであることを特徴とする音声信号のデ
    ータ量圧縮方法。
  11. 【請求項11】 請求項9または10に記載の音声信号
    のデータ量圧縮方法において、 上記分析ステップは、上記音声信号のダイナミックレン
    ジを分析するものであることを特徴とする音声信号のデ
    ータ量圧縮方法。
  12. 【請求項12】 請求項9から11のいずれかに記載の
    音声信号のデータ量圧縮方法において、 上記分析ステップでは、あいまいな表現値での評価が可
    能な、感性表現と物理特性を定義づけるファジイ関数を
    用いて音声信号を分析するものであることを特徴とする
    音声信号のデータ量圧縮方法。
  13. 【請求項13】 請求項9から12のいずれかに記載の
    音声信号のデータ量圧縮方法において、 上記前処理ステップは、音声信号の物理特性を時間軸上
    で連続的に変化させるものであり、 上記音声圧縮ステップは、音声信号の情報量を時間軸上
    で連続的に変化させて圧縮させるものであることを特徴
    とする音声信号のデータ量圧縮方法。
  14. 【請求項14】 請求項9から13のいずれかに記載の
    音声信号のデータ量圧縮方法において、 音声信号の物理特性と、情報量圧縮率、及び音質との関
    係を定義する音声信号の関数を出力するデータベース出
    力ステップを備え、 上記前処理内容決定ステップは、 上記音声信号の分析結果と、上記音声信号の関数とを参
    照して、音声信号の物理特性を変化させる処理内容を決
    定するものであることを特徴とするデータ量圧縮方法。
  15. 【請求項15】 請求項9から14のいずれかに記載の
    音声信号のデータ量圧縮方法において、 上記前処理内容決定ステップは、 上記再生ステップでの圧縮後の音声信号をモニタした後
    に、物理特性を変化させる処理内容項目の情報圧縮率と
    音質に関するパラメータ値の両方、またはいずれか一
    方、を調整または設定するものであることを特徴とする
    音声信号のデータ量圧縮方法。
  16. 【請求項16】 請求項9から15のいずれかに記載の
    音声信号のデータ量圧縮方法において、 上記再生ステップでモニタされた音質、及び上記音声圧
    縮ステップにおける圧縮結果を取得して、上記音声信号
    の関数のデータべースを更新する更新ステップを備えた
    ことを特徴とする音声信号のデータ量圧縮方法。
JP11013464A 1999-01-21 1999-01-21 音声信号のデ―タ量圧縮装置および圧縮方法 Pending JP2000214885A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11013464A JP2000214885A (ja) 1999-01-21 1999-01-21 音声信号のデ―タ量圧縮装置および圧縮方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11013464A JP2000214885A (ja) 1999-01-21 1999-01-21 音声信号のデ―タ量圧縮装置および圧縮方法

Publications (1)

Publication Number Publication Date
JP2000214885A true JP2000214885A (ja) 2000-08-04

Family

ID=11833877

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11013464A Pending JP2000214885A (ja) 1999-01-21 1999-01-21 音声信号のデ―タ量圧縮装置および圧縮方法

Country Status (1)

Country Link
JP (1) JP2000214885A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013174882A (ja) * 2010-12-03 2013-09-05 Yamaha Corp コンテンツ再生装置およびコンテンツ処理方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013174882A (ja) * 2010-12-03 2013-09-05 Yamaha Corp コンテンツ再生装置およびコンテンツ処理方法

Similar Documents

Publication Publication Date Title
US11468750B2 (en) Authoring an immersive haptic data file using an authoring tool
KR101981437B1 (ko) 인코딩된 오디오 메타데이터 기반 라우드니스 등화 및 drc 동안의 동적 등화
JP4970710B2 (ja) オーディオ信号処理装置、方法及びプログラムを記録したコンピュータ読取可能な記録媒体
US7353169B1 (en) Transient detection and modification in audio signals
CA2525942C (en) Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
US20130094669A1 (en) Audio signal processing apparatus, audio signal processing method and a program
EP3598442B1 (en) Systems and methods for modifying an audio signal using custom psychoacoustic models
CN1115079C (zh) 信号质量确定装置和方法
US7490038B2 (en) Speech recognition optimization tool
US11558699B2 (en) Hearing device component, hearing device, computer-readable medium and method for processing an audio-signal for a hearing device
US9478232B2 (en) Signal processing apparatus, signal processing method and computer program product for separating acoustic signals
CA2483798A1 (en) Hearing aid and processes for adaptively processing signals therein
EP3598441B1 (en) Systems and methods for modifying an audio signal using custom psychoacoustic models
JP2002215195A (ja) 音楽信号処理装置
US6673995B2 (en) Musical signal processing apparatus
CN1552171A (zh) 音频再现设备
JP2000214885A (ja) 音声信号のデ―タ量圧縮装置および圧縮方法
KR101890265B1 (ko) 오디오 신호 처리 장치, 오디오 신호 처리 방법 및 오디오 신호 처리 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체
CN113766307A (zh) 用于音轨分析以支持音频个性化的技术
US20100216554A1 (en) Music genre judging device and game machine having the same
US20230163739A1 (en) Method for increasing perceived loudness of an audio data signal
JP2002372982A (ja) 音響信号分析方法及び装置
TWI602173B (zh) 音訊處理方法與非暫時性電腦可讀媒體
Motta et al. An Audio Compression Method Based on Wavelet Packet Decomposition, Ordering, and Polynomial Approximation of Expressive Coefficients
KR0123274B1 (ko) 사용자 기호 보상형 심리음향 모델