JP3648931B2 - 反復変換音声符号化方法および装置 - Google Patents
反復変換音声符号化方法および装置 Download PDFInfo
- Publication number
- JP3648931B2 JP3648931B2 JP20064097A JP20064097A JP3648931B2 JP 3648931 B2 JP3648931 B2 JP 3648931B2 JP 20064097 A JP20064097 A JP 20064097A JP 20064097 A JP20064097 A JP 20064097A JP 3648931 B2 JP3648931 B2 JP 3648931B2
- Authority
- JP
- Japan
- Prior art keywords
- conversion
- frame
- original
- function system
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【発明の属する技術分野】
本発明は音声データを圧縮するために符号化を行う反復変換音声符号化方法および装置に関する。
【0002】
【従来の技術】
従来の音声圧縮技術としては、マルチメディアの分野などにおける音声符号化方式として広く使われているADPCM(Adaptive Differential Pulse Code Modulatioin) や、携帯電話などで用いられているVSELP(Vector-Sum Excited Linear Prediction )、MPC(Multi Pulse Codec)などがある。
【0003】
【発明が解決しようとする課題】
しかしながら、前記ADPCMは計算量が比較的少ないものの、データ圧縮率が1/2からせいぜい1/4と低いのが欠点である。また、VSELPやMPCなどの分析合成型の音声圧縮方式は人間の通常の会話などの音声に対しては、高い圧縮率が得られるが、音楽や擬音など人間の発する音声以外の音の圧縮は行えないという欠点があった。
【0004】
また、最近では、フラクタル理論を用いた符号化方式の1つとしてIFS(Iterated Function System:反復写像関数系)と呼ばれているものがあり、これを画像圧縮に利用した技術が提案されてきている。この技術は画像圧縮だけでなく音声圧縮に応用することもできると考えられるが、音声と画像とでは性質が異なるので、画像圧縮に用いたIFS符号化方式そのままを音声圧縮技術に適用することはできないため、IFS符号化方式を用いた音声圧縮技術は今のところ実用化には至っていない。
【0005】
そこで、本発明は、IFS符号化方式を音声圧縮に適用できるようにし、高い圧縮率で人間の音声は勿論、それ以外の様々な音を符号化すること可能とすることを目的としている。
【0006】
本発明の反復変換音声符号化方法は、IFS(Iterated Function System:反復写像関数系)を用いて音声データを符号化する符号化方法であって、符号化すべき元音声を複数のフレームに分割して1フレームずつ抽出し、直交関数系を用いた、周波数成分の異なる複数の変換規則から1つ1つの変換規則を選択して、選択された変換規則に基づいて前記抽出されたフレームに対し変換を施し、変換後のフレームを前記元音声と比較して元音声の中から類似部分を探索し、最大の類似度が得られた前記元音声の類似位置情報と使用した変換規則を示す情報とを当該フレームの情報を表すIFS符号として出力することを特徴としている。
【0007】
これにより、人間が聞いて意味のある情報を適切に残した圧縮が行え、人間の発する音声は勿論、それ以外の音楽や擬音など人間にとって意味のある様々な音を、高い圧縮率で効率的に符号化することができる。
【0009】
また、直交関数系を用いることにより、音声の周波数成分を効率よく符号化でき、同じ圧縮率でもより高品質な音声の符号化が可能となり、それを復号化したとき高品質な音声を再生することができる。
【0010】
さらに、その直交関数系として、ラデマッヘル直交関数系を用いることを特徴としている。
【0011】
このように、直交関数系としてディジタル系の直交関数系であるラデマッヘル直交関数系を用いることにより、通常の電子計算機で扱いやすいものとすることができる。
【0012】
さらにまた、前記直交関数系として、重み付けされた直交関数系を用いることを特徴としている。
【0013】
このように、重み付けを行った変換を行うことにより、データ圧縮により失われた情報の中で人間の知覚に関係してくるような周波数成分を補うことができ、復号したときに高品質な音声を再生することができる。
【0014】
また、本発明の反復変換音声符号化方法は、IFS(Iterated Function System:反復写像関数系)を用いて音声データを符号化する符号化方法であって、符号化すべき元音声を複数のフレームに分割して1フレームずつ抽出するとともに、直交関数系を用いた、周波数成分の異なる複数の変換規則から1つ1つの変換規則を選択して、選択された変換規則に基づいて前記元音声に対し縮小変換を施し、前記抽出されたフレームを前記変換後の元音声と比較して元音声の中から類似部分を探索し、最大の類似度が得られた元音声の類似位置情報と使用した変換規則を示す情報とを当該フレームの情報を表すIFS符号として出力するような方法を用いてもよい。これにより、前述した反復変換音声符号化方法と同等の効果が得られる。
【0015】
そして、この発明において、その直交関数として、ラデマッヘル直交関数系を用いることを特徴としている。
【0016】
また、本発明の反復変換音声符号化装置は、IFS(Iterated Function System:反復写像関数系)を用いて音声データを符号化する符号化装置であって、符号化すべき所定の長さの元音声を記憶する元音声記憶手段と、前記記憶された元音声を分割して得られたフレームを1フレームずつ抽出し、抽出したフレームに対してそのフレームの情報をIFS符号として出力するIFS符号生成手段と、直交関数系を用いた、周波数成分の異なる変換規則が登録されている変換写像テーブルと、この変換写像テーブルに登録された変換規則を順次選択して読み出し、読み出された変換規則に基づいて前記IFS符号生成手段が抽出したフレームに対して変換を施し、前記IFS符号生成手段に対し、変換に使用した変換規則を示す情報を送るフレーム変換手段と、このフレーム変換手段により変換されたフレームを前記元音声と比較して元音声の中から類似部分を探索し、類似度情報と元音声の類似位置情報とを前記IFS符号生成手段に送る近似領域探索手段と、を有し、前記IFS符号生成手段は、前記変換に使用した変換規則を示す情報、類似度情報、元音声の類似位置情報を基に、最大の類似度が得られた元音声の類似位置情報と使用した変換規則を示す情報とを得て、この元音声の類似位置情報と使用した変換規則を示す情報とを当該フレームの情報を表すIFS符号として出力することを特徴としている。
【0018】
さらに、前記直交関数系として、ラデマッヘル直交関数系を用いることを特徴としている。
【0019】
さらにまた、前記直交関数系として、重み付けされた直交関数系を用いることを特徴としている。
【0020】
また、本発明の反復変換音声符号化装置は、IFS(Iterated Function System:反復写像関数系)を用いて音声データを符号化する符号化装置であって、符号化すべき所定の長さの元音声を記憶する元音声記憶手段と、前記元音声記憶手段記憶された元音声を分割して得られたフレームを1フレームずつ抽出し、抽出したフレームに対してそのフレームの情報を表すIFS符号を出力するIFS符号生成手段と、直交関数系を用いた、周波数成分の異なる複数の変換規則が登録されている変換写像テーブルと、この変換写像テーブルに登録された変換規則を順次選択して読み出し、読み出された変換規則に基づいて前記元音声記憶手段に記憶された元音声に対して縮小変換を施し、前記IFS符号生成手段に対し、変換に使用した変換規則を示す情報を送るフレーム変換手段と、前記IFS符号生成手段にて抽出されたフレームを前記縮小変換された元音声と比較して縮小変換された元音声の中から類似部分を探索し、類似度情報と縮小変換された元音声の類似位置情報とを前記IFS符号生成手段に送る近似領域探索手段と、を有し、前記IFS符号生成手段は、前記変換に使用した変換規則を示す情報、類似度情報、元音声の類似位置情報を基に、最大の類似度が得られた元音声の類似位置情報と使用した変換規則を示す情報とを得て、この元音声の類似位置情報と使用した変換規則を示す情報とを当該フレームの情報を表すIFS符号として出力するような構成としてもよい。
【0021】
そして、その直交関数系として、ラデマッヘル直交関数系を用いることを特徴としている。
【0022】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照しながら説明する。
【0023】
図1は本発明の実施の形態の構成を説明するブロック図であり、元音声記憶回路1、IFS符号生成回路2、フレーム変換回路3、近似領域探索回路4、変換写像テーブル5、IFS符号記憶回路6などから構成されている。以下、これらそれぞれの構成要素の機能などについて図2のフローチャートおよび図3を参照しながら説明する。
【0024】
前記元音声記憶回路1は、圧縮しようとする音声データをたとえば1秒間ごとの長さで記憶するものであり、ここでは、図3(a)に示されるような元音声データが記憶されたとする。
【0025】
IFS符号生成回路2は、このような音声データから1フレーム分を抽出し(ステップs1)、その抽出した1フレームの音声データを、フレーム変換回路3に渡す。フレーム変換回路3では、変換写像テーブル5に登録されている予め定められた何種類かの変換規則のうち、或る1つの変換規則を読み出してその変換規則に基づいてフレーム変換する(ステップs2)。このとき、読み出された変換規則が1番目の変換規則(変換1という)であるとすれば、IFS符号生成回路2から渡されたフレームの情報に対し「変換1」を行う。なお、この変換写像テーブル5に記憶されている内容の具体例については後述する。また、ここで行う変換方法としては、直交関数系を用い、具体的にはラデマッヘル(Rademacher )直交関数系(参考文献:「ディジタル情報処理の基礎理論」斉藤正男他 東海大学出版会1985年)を用いる。
【0026】
そして、フレーム変換回路3は今現在変換を行った変換規則の番号(変換1)をIFS符号生成回路2に送るとともに、変換したフレーム情報を近似領域探索回路4に送る。
【0027】
近似領域探索回路4は、フレーム変換回路3から渡された変換後のフレーム情報が元音声記憶回路1に記憶されている元音声データのどの部分に似ているかを探索し、最も似ている部分を抽出して、その位置と類似度を得る(ステップs3)。
【0028】
以上のステップs1,s2,s3の処理を図3を参照して説明する。図3において、(a)は前記したように、元音声記憶回路1に記憶された元音声の一例を示すもので、(b)はこの元音声から抽出された1フレームを示している。また、フレーム変換回路3により抽出されたフレーム情報に対して「変換1」を施した例を(c)に示している。そして、この変換されたフレーム情報が元音声データのどの部分に似ているかを探索するが、この場合、(d)に示すように、元音声データ中の領域Z1が最も似ていると判定され、その類似度がS1であるとする。この最も似ていると判定された領域Z1の先頭位置を類似位置情報P1とし、その類似位置情報P1とその類似度情報S1がIFS符号生成回路2に渡される。
【0029】
再び図2のフローチャートに説明が戻って、IFS符号生成回路2は、類似度情報S1が、それまでに近似領域探索回路4から渡された類似度の中で最大かどうかを判断する(ステップs4)。つまり、IFS符号生成回路2に記憶されている類似度より大きいか否かを判断して、近似領域探索回路4から新たに渡された類似度の方が大きければ、その類似度を得た変換番号と類似位置情報を記憶する(ステップs5)。
【0030】
そして次に、変換規則が残っているか否かを判断して(ステップs6)、残っていれば、ステップs2に戻り、次の変換規則に基づいてフレーム変換を行い、ステップs3〜s6を行う。図3では、変換規則として、変換1、変換2、・・・、変換NというようにN種類の変換規則がある場合が示されており、今、変換1に基づいた変換がなされたので、今度は図3(e)に示すように、変換2を用いたフレーム変換が施される。そして、前記同様、フレーム変換回路3はそのとき変換を行った変換規則の番号(変換2)をIFS符号生成回路2に送るとともに、変換したフレーム情報を近似領域探索回路4に送る。
【0031】
近似領域探索回路4は、フレーム変換回路3から渡された変換後のフレーム情報が元音声記憶回路1に記憶されている音声データのどの部分に似ているかを探索し、最も似ている部分を抽出して、その位置と類似度を得る。この場合、図3(f)に示すように、元音声データ中の領域Z2が最も似ていると判定され、その類似度がS2であるとして、その領域Z1の先頭位置(類似位置情報P2)とその類似度情報S2がIFS符号生成回路2に渡される。これにより、IFS符号生成回路2は、類似度S2がIFS符号生成部2に記憶されている類似度より大きいか否かを判断して、新たに渡された類似度S2の方が大きければ、その変換番号(変換2)と類似位置情報P2を記憶する。
【0032】
このような処理を、変換写像テーブル5に記憶されているすべての変換規則について処理が終了するまで行う。このすべての変換規則について処理が終了すると、IFS符号生成回路2には処理対象のフレーム情報に対して最大の類似度が得られた変換番号とその類似位置情報が記録されることになる。たとえば、現在処理を行っているフレームにおいて、変換2を行って得られた類似度S2が、他の変換規則を行って得られたそれぞれの類似度に比べて最も大きかったとすれば、IFS符号生成回路2には、最大の類似度が得られた変換番号として変換2とその類似位置情報としてP2が記録されることになる。そして、この変換番号と類似位置情報が現在処理されているフレームを表すIFS符号としてIFS符号記憶回路6で記憶される。
【0033】
このようにして或る1つのフレームに対する処理が終了すると、次に、元音声記憶回路1に記憶されている音声データに未処理のフレームが存在するか否かを判断し(ステップs7)、未処理のフレームが存在すれば、ステップs1に戻って新たなフレームを抽出して、そのフレームに対して、前記同様の処理を行う。そして、元音声記憶回路1に記憶されている音声データの全てのフレームに対して前記した処理が終了すると、IFS符号記憶回路6に記憶されたそれぞれのフレーム毎のIFS符号がIFS符号列として出力される。
【0034】
このように本発明は、どの直交関数系を用いて変換したかを示す変換番号と類似位置情報との2つの情報を、当該フレームを表すIFS符号として出力するものである。
【0035】
ちなみに、処理対象音声データが8KHz、8ビットの音声データであるとすると、元音声記憶回路1には8000サンプルのデータが記憶され、1つのフレームを32サンプルとすれば、1フレーム分のデータ量は32×8=256ビットとなる。
【0036】
これに対して、本発明においては、1フレームの情報を、変換番号と近似領域情報のみのIFS符号として表すことができる。すなわち、変換規則の種類を、たとえば、30種類程度用意したとしても、どの変換規則を用いたかを表す変換番号は5ビットで表すことができる。また、近似領域情報は、元音声記憶回路1に記憶されている音声データの中の近似領域の先頭位置を特定し(たとえば、Z2の領域においてはその領域の先頭位置P2)、その先頭位置から予め定めた或る長さを設定することで近似領域とすることができるので、IFS符号生成回路2が記憶する近似領域情報としては、近似領域の先頭位置情報のみを記憶すればよい。この先頭位置情報は、13ビットあれば1〜8000のいずれかを先頭位置として表すことができる。
【0037】
したがって、この実施の形態では、1フレーム分の音声データは、5ビット+13ビットの合計18ビットのデータで表すことができ、約1/14のデータ量とすることができ、きわめて高い圧縮率を得ることができる。
【0038】
ところで、前記変換写像テーブル5に登録されるラデマッヘル直交関数系による変換規則は、具体的には、図4に示すようなものが一例として考えられる。この変換規則は元のデータをどのように変換するかを定めたもので、ここでは(1)〜(24)の24種類の変換規則が定められた例を示している。図4において、(1)〜(4)はここでは基本型と呼び、(5)〜(8)をここでは反転型と呼ぶことにする。また、(9)〜(24)は前記基本型と反転型にそれぞれ重みづけを行ったものを示している。ただし、ここで示した例は一例であってこれに限られるものでないことは勿論である。
【0039】
ここで今、図4の(2)で示されたラデマッヘル直交関数系を用いた変換規則について図5を用いて説明する。図5に示された変換規則は、1フレーム分の音声データ(この場合、32サンプル)に対して、前半の16サンプルに対しては16個のデータに対してそれぞれ+1を掛け算し、後半の16サンプルに対しては16個のデータに対してそれぞれ−1を掛け算するということを示している。したがって、この変換規則を用いて或る1フレームを変換すると、そのフレームは前半の16サンプルは符号がそのままで、後半の16サンプルは符号が逆になる。
【0040】
同様に、図4の(3)で示される変換規則は、1フレーム分の音声データ(この場合、32サンプル)に対して、最初から1/4までの8サンプルに対してはそれぞれ+1掛け、次の8サンプルに対してはそれぞれ−1を掛け、さらに次の8サンプルに対してはそれぞれ+1掛け、最後の8サンプルに対してはそれぞれ−1掛けるということを示している。したがって、この図4の(3)の変換規則を用いて或る1フレームを変換すると、そのフレームは8サンプルごとに符号が反転する。
【0041】
さらに、図4の(10)で示される変換規則は、重み付けを行った例であり、1フレーム分の音声データ(この場合、32サンプル)に対して、前半の16サンプルに対しては重みづけ係数を0〜0.4まで直線的に変化させ、後半の16サンプルに対しては重みづけ係数を0.5 〜1まで直線的に変化させることを示している。 このように、本発明の実施の形態では、フレームの変換にラデマッヘル直交関数系を用い、さらに、必要に応じて重み付けを行った変換を行うことにより、データ圧縮により失われた情報の中で人間の知覚に関係してくるような周波数成分を補うことができ、復号したときに高品質な音声とすることができる。
【0042】
以上説明した実施の形態では、元音声を複数のフレームに分割し、各フレーム毎に前記した変換を施し、その変換されたフレームとよく似た部分を元音声の中から探索するようにしたが、たとえば、図6に示すような構成とし、図7のフローチャートに示すような処理により符号化を行うようにしてもよい。以下、図6および図7を参照して説明する。なお、図6において図1と同一部分には同一符号が付されている。
【0043】
この場合の処理の流れは、元音声記憶回路1に記憶された音声データ(前記実施の形態同様、1秒間の音声データとする)を、まず、フレーム変換回路3が変換写像テーブル5から変換規則の1つを読み出し、その変換規則を用いて縮小変換する(ステップs11)。この縮小変換は、前記実施の形態で説明したラデマッヘル直交変換による変換規則の或る1つの変換規則を用いて行われる。
【0044】
一方、IFS符号生成回路2は前記元音声データから1つのフレームを抽出し(ステップs12)、その抽出されたフレームの情報を近似領域探索回路4に渡す。そして、近似領域探索回路4はIFS符号生成回路2から渡されたフレーム情報が、前記或る変換規則に基づいて縮小変換された元音声データのどの部分に似ているかを探索し(ステップs13)、最も似ている部分を抽出して、その類似位置情報と類似度をIFS符号生成回路2に送る。
【0045】
IFS符号生成回路2は、類似度がそれまでに近似領域探索回路4から渡された類似度の中で最大かどうかを判断、つまり、IFS符号生成回路2に記憶されている類似度より大きいか否かを判断して(ステップs14)、近似領域探索回路4から新たに渡された類似度の方が大きければ、その変換番号と類似位置情報を記憶する(ステップs15)。
【0046】
そして次に、元音声データの中に抽出すべきフレームが残っているか否かを判断して(ステップs16)、残っていれば、ステップs12に戻り、そのフレームの抽出を行い、抽出されたフレームについてステップs13〜s16を行う。そして、全てのフレームについてステップs13〜s15の処理が終了すると、変換規則が残っているか否かの判断を行い(ステップs17)、変換規則が残っていれば、新たな変換規則に基づいてステップs11から順に前記同様の処理を行う。このような処理を、変換写像テーブル5に登録されているすべての変換規則について行う。このすべての変換規則について処理が終了すると、IFS符号生成回路2には処理対象のフレーム情報に対する最大の類似度が得られた変換番号とその類似位置情報が記録されることになる。そして、この変換番号と類似位置情報が現在処理されているフレームを表すIFS符号としてIFS符号記憶回路6で記憶される。
【0047】
この図6で示された構成においては、元音声をまず縮小変換し、この縮小変換された元音声データに対して、抽出された各フレーム毎にそのフレームが前記縮小変換された元音声データのどの部分に似ているかを探索して、最大の類似度が得られた類似位置情報と変換番号をIFS符号列として出力するものであり、このような方法によっても前記図1の構成のものと同様に、人間の音声は勿論、人間にとって意味のある様々な音を効率よく符号化することができる。
【0048】
なお、以上説明した本発明を実施するためのプログラムはフロッピィディスクなどの記憶媒体に記憶させておくことができ、本発明はその記憶媒体をも含むものである。
【0049】
【発明の効果】
以上説明したように、本発明によれば、人間が聞いて意味のある情報を適切に残した圧縮が行え、人間の発する音声は勿論、それ以外の音楽や擬音など人間にとって意味のある様々な音を、高い圧縮率で効率的に符号化することができる。また、音声データに対し、直交関数系を用いた変換規則による変換を施すことにより、音声の周波数成分を効率よく符号化でき、同じ圧縮率でもより高品質な音声の符号化が可能となり、それを復号化したとき高品質な音声を再生することができる。さらに、前記直交関数系として、重み付けされた直交関数系を用いることにより、データ圧縮により失われた情報の中で人間の知覚に関係してくるような周波数成分を補うことができ、復号したときにより一層高品質な音声とすることができる。
【図面の簡単な説明】
【図1】本発明の実施の形態の構成を説明するブロック図。
【図2】本発明の実施の形態の処理の流れを説明するフローチャート。
【図3】本発明の実施の形態の処理を音声データ例を用いて説明する図。
【図4】本発明の実施の形態における変換写像テーブルに登録された内容の一例を示す図。
【図5】ラデマッヘル直交関数系による変換例を説明する図。
【図6】本発明の実施の形態の変形例の構成を示すブロック図。
【図7】図6で示した構成の処理の流れを説明するフローチャート。
【符号の説明】
1 元音声記憶回路
2 IFS符号生成回路
3 フレーム変換回路
4 近似領域探索回路
5 変換写像テーブル
6 IFS符号記憶回路
Claims (10)
- IFS(Iterated Function System:反復写像関数系)を用いて音声データを符号化する符号化方法であって、
符号化すべき元音声を複数のフレームに分割して1フレームずつ抽出し、直交関数系を用いた、周波数成分の異なる複数の変換規則から1つ1つの変換規則を選択して、選択された変換規則に基づいて前記抽出されたフレームに対し変換を施し、変換後のフレームを前記元音声と比較して元音声の中から類似部分を探索し、最大の類似度が得られた前記元音声の類似位置情報と使用した変換規則を示す情報とを当該フレームの情報を表すIFS符号として出力することを特徴とする反復変換音声符号化方法。 - 前記直交関数系として、ラデマッヘル直交関数系を用いることを特徴とする請求項1記載の反復変換音声符号化方法。
- 前記直交関数系として、重み付けされた直交関数系を用いることを特徴とする請求項1記載の反復変換音声符号化方法。
- IFS(Iterated Function System:反復写像関数系)を用いて音声データを符号化する符号化方法であって、
符号化すべき元音声を複数のフレームに分割して1フレームずつ抽出するとともに、直交関数系を用いた、周波数成分の異なる複数の変換規則から1つ1つの変換規則を選択して、選択された変換規則に基づいて前記元音声に対し縮小変換を施し、前記抽出されたフレームを前記変換後の元音声と比較して元音声の中から類似部分を探索し、最大の類似度が得られた元音声の類似位置情報と使用した変換規則を示す情報とを当該フレームの情報を表すIFS符号として出力することを特徴とする反復変換音声符号化方法。 - 前記直交関数系として、ラデマッヘル直交関数系を用いることを特徴とする請求項4記載の反復変換音声符号化方法。
- IFS(Iterated Function System:反復写像関数系)を用いて音声データを符号化する符号化装置であって、
符号化すべき所定の長さの元音声を記憶する元音声記憶手段と、
前記記憶された元音声を分割して得られたフレームを1フレームずつ抽出し、抽出したフレームに対してそのフレームの情報をIFS符号として出力するIFS符号生成手段と、
直交関数系を用いた、周波数成分の異なる変換規則が登録されている変換写像テーブルと、
この変換写像テーブルに登録された変換規則を順次選択して読み出し、読み出された変換規則に基づいて前記IFS符号生成手段が抽出したフレームに対して変換を施し、前記IFS符号生成手段に対し、変換に使用した変換規則を示す情報を送るフレーム変換手段と、
このフレーム変換手段により変換されたフレームを前記元音声と比較して元音声の中から類似部分を探索し、類似度情報と元音声の類似位置情報とを前記IFS符号生成手段に送る近似領域探索手段と、を有し、
前記IFS符号生成手段は、前記変換に使用した変換規則を示す情報、類似度情報、元音声の類似位置情報を基に、最大の類似度が得られた元音声の類似位置情報と使用した変換規則を示す情報とを得て、この元音声の類似位置情報と使用した変換規則を示す情報とを当該フレームの情報を表すIFS符号として出力することを特徴とする反復変換音声符号化装置。 - 前記直交関数系として、ラデマッヘル直交関数系を用いることを特徴とする請求項6記載の反復変換音声符号化装置。
- 前記直交関数系として、重み付けされた直交関数系を用いることを特徴とする請求項6記載の反復変換音声符号化装置。
- IFS(Iterated Function System:反復写像関数系)を用いて音声データを符号化する符号化装置であって、
符号化すべき所定の長さの元音声を記憶する元音声記憶手段と、
前記元音声記憶手段記憶された元音声を分割して得られたフレームを1フレームずつ抽出し、抽出したフレームに対してそのフレームの情報を表すIFS符号を出力するIFS符号生成手段と、
直交関数系を用いた、周波数成分の異なる複数の変換規則が登録されている変換写像テーブルと、
この変換写像テーブルに登録された変換規則を順次選択して読み出し、読み出された変換規則に基づいて前記元音声記憶手段に記憶された元音声に対して縮小変換を施し、前記IFS符号生成手段に対し、変換に使用した変換規則を示す情報を送るフレーム変換手段と、
前記IFS符号生成手段にて抽出されたフレームを前記縮小変換された元音声と比較して縮小変換された元音声の中から類似部分を探索し、類似度情報と縮小変換された元音声の類似位置情報とを前記IFS符号生成手段に送る近似領域探索手段と、
を有し、
前記IFS符号生成手段は、前記変換に使用した変換規則を示す情報、類似度情報、元音声の類似位置情報を基に、最大の類似度が得られた元音声の類似位置情報と使用した変換規則を示す情報とを得て、この元音声の類似位置情報と使用した変換規則を示す情報とを当該フレームの情報を表すIFS符号として出力することを特徴とする反復変換音声符号化装置。 - 前記直交関数系として、ラデマッヘル直交関数系を用いることを特徴とする請求項9記載の反復変換音声符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20064097A JP3648931B2 (ja) | 1996-07-25 | 1997-07-25 | 反復変換音声符号化方法および装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8-196788 | 1996-07-25 | ||
JP19678896 | 1996-07-25 | ||
JP20064097A JP3648931B2 (ja) | 1996-07-25 | 1997-07-25 | 反復変換音声符号化方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1097297A JPH1097297A (ja) | 1998-04-14 |
JP3648931B2 true JP3648931B2 (ja) | 2005-05-18 |
Family
ID=26509979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20064097A Expired - Fee Related JP3648931B2 (ja) | 1996-07-25 | 1997-07-25 | 反復変換音声符号化方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3648931B2 (ja) |
-
1997
- 1997-07-25 JP JP20064097A patent/JP3648931B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH1097297A (ja) | 1998-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4800645B2 (ja) | 音声符号化装置、及び音声符号化方法 | |
JP2014506686A (ja) | 音声信号からの特徴フィンガープリントの抽出及びマッチング方法 | |
KR20000023379A (ko) | 정보 처리 장치 및 방법, 정보 기록 장치 및 방법, 기록매체 및 제공 매체 | |
US9031852B2 (en) | Data compression apparatus, computer-readable storage medium having stored therein data compression program, data compression system, data compression method, data decompression apparatus, data compression/decompression apparatus, and data structure of compressed data | |
US7747435B2 (en) | Information retrieving method and apparatus | |
JP4978539B2 (ja) | 符号化装置、符号化方法及びプログラム。 | |
JP2003108197A (ja) | オーディオ信号復号化装置およびオーディオ信号符号化装置 | |
JP3344944B2 (ja) | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 | |
JP3648931B2 (ja) | 反復変換音声符号化方法および装置 | |
JP2931059B2 (ja) | 音声合成方式およびこれに用いる装置 | |
JP4578145B2 (ja) | 音声符号化装置、音声復号化装置及びこれらの方法 | |
JP3348759B2 (ja) | 変換符号化方法および変換復号化方法 | |
JPH09230898A (ja) | 音響信号変換符号化方法及び復号化方法 | |
JP3058640B2 (ja) | 符号化方法 | |
JP3236758B2 (ja) | 可変長データのcrc演算装置 | |
JP2712925B2 (ja) | 音声処理装置 | |
JP3319551B2 (ja) | ベクトル量子化装置 | |
JPH0451100A (ja) | 音声情報圧縮装置 | |
JP2001147700A (ja) | 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体 | |
JP2002073097A (ja) | Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法 | |
JP3205161B2 (ja) | 音声符号化装置 | |
JP2780458B2 (ja) | ベクトル量子化法および音声符号化復合化装置 | |
JP3714786B2 (ja) | 音声符号化装置 | |
JP6130128B2 (ja) | 圧縮データのデータ構造、記録媒体、データ圧縮装置、データ圧縮システム、データ圧縮プログラム、およびデータ圧縮方法 | |
JP3210165B2 (ja) | 音声符号化復号化方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040730 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041012 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050125 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050207 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080225 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090225 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090225 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100225 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110225 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110225 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120225 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130225 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130225 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |