JPH08171400A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH08171400A
JPH08171400A JP6314483A JP31448394A JPH08171400A JP H08171400 A JPH08171400 A JP H08171400A JP 6314483 A JP6314483 A JP 6314483A JP 31448394 A JP31448394 A JP 31448394A JP H08171400 A JPH08171400 A JP H08171400A
Authority
JP
Japan
Prior art keywords
encoding
rule
module
voice
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6314483A
Other languages
English (en)
Other versions
JP3183072B2 (ja
Inventor
Toshiyuki Morii
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP31448394A priority Critical patent/JP3183072B2/ja
Priority to US08/559,667 priority patent/US5774846A/en
Priority to DE69532879T priority patent/DE69532879T2/de
Priority to EP03024767A priority patent/EP1391879A3/en
Priority to EP03024766A priority patent/EP1391878A3/en
Priority to EP95118647A priority patent/EP0718820B1/en
Publication of JPH08171400A publication Critical patent/JPH08171400A/ja
Priority to US09/059,568 priority patent/US6067518A/en
Priority to US09/475,249 priority patent/US6205421B1/en
Priority to US09/475,248 priority patent/US6167373A/en
Application granted granted Critical
Publication of JP3183072B2 publication Critical patent/JP3183072B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 本発明は、ディジタル信号としての音響情報
を少ない情報量で符号化し、伝送し、復号化することに
より、効率の良いデータ伝送を可能にすることを目的と
する。 【構成】 上記目的を達成するために本発明は、音声分
析手段と、符号化モジュールが複数格納されていること
を特徴とする符号化部と、音声分析手段によって得られ
たパラメータに基づき符号化モジュールを選択するモジ
ュール選択部と、モジュール選択部で使用するルールが
格納されているルール格納部とを備えており、このルー
ルが予め統計処理により作成されていることを特徴とし
ている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタル信号として
の音響情報を少ない情報量で符号化し、伝送し、復号化
することにより、効率の良いデータ伝送を行なうための
音声符号化装置に関するものである。
【0002】
【従来の技術】携帯電話等のディジタル移動通信の分野
では加入者の増加に対処するために低ビットレートの音
声の圧縮符号化法が求められており、各研究機関におい
て研究開発が進んでいる。日本国内においてはモトロー
ラ社の開発したビットレート11.2kbpsのVSE
LPという符号化法がディジタル携帯電話用の標準符号
化方式として採用された。(同方式を搭載したディジタ
ル携帯電話は1994年秋に国内において発売され
た。)また更に、NTT移動通信網株式会社の開発した
ビットレート5.6kbpsのPSI−CELPという
符号化方式が次期携帯電話の標準化方式として採用さ
れ、現在製品開発の段階にある。これらの方式はいずれ
もCELP(Code Exited Linear
Prediction: M.R.Schroeder ”High Qualit
y Speech at Low Bit Rates” Proc.ICASSP'85 pp.937-
940に記載されている)という方式を改良したものであ
る。これは音声を音源情報と声道情報とに分離し、音源
情報については符号帳に格納された複数の音源サンプル
のインデクスによって符号化し声道情報についてはLP
C(線形予測係数)を符号化するということと、音源情
報符号化の際には声道情報を加味して入力音声と比較を
行なうという方法(A−b−S:Analysisby
Synthesis)を採用していることに特徴があ
る。
【0003】ここで、CELP方式の基本的な部分につ
いて説明する。図7はCELP方式の符号化装置の機能
ブロック図である。まず、LPC分析部22において、入
力された音声データ21に対して自己相関分析とLPC分
析を行なうことによってLPC係数を得、また得られた
LPC係数の符号化を行ないLPC符号を得、また得ら
れたLPC符号を復号化して復号化LPC係数を得る。
次に、加算部25において、適応符号帳23と確率的符号帳
24に格納された音源サンプルを取り出し、それぞれに対
する最適ゲインを求め、その最適ゲインによってパワー
調節したそれぞれの音源を加算して合成音源を得る。更
に、LPC合成部26において、加算部25で得られた合成
音源に対して、LPC分析部22で得られた復号化LPC
係数によってフィルタリングを行ない合成音を得る。更
に、比較部27は、適応符号帳23と確率的符号帳24の全て
の音源サンプルに対して加算部25、LPC合成部26を機
能させることによって得られる多くの合成音と入力音声
との距離計算を行ない、その結果得られる距離の中で最
も小さいときの音源サンプルのインデクスを求める。パ
ラメータ符号化部28では、最適ゲインの符号化を行なう
ことによってゲイン符号を得、LPC符号、音源サンプ
ルのインデクスをまとめて伝送路29へ送る。また、ゲイ
ン符号とインデクスから合成音源を作成し、それを適応
符号帳23に格納すると同時に古い音源サンプルを破棄す
る。また、LPC合成部26においては、線形予測係数や
周波数強調フィルタや長期予測係数(入力音声の長期予
測分析を行なうことによって得られる)を用いた聴感重
み付けを行なう。また、適応符号帳と確率的符号帳によ
る音源探索は、分析区間を更に細かく分けた区間(サブ
フレームと呼ばれる)で行われる。
【0004】前述のVSELPやPSI−CELPは上
記CELPを改良したものである。しかし、従来のこれ
らの方式はどのような入力音声に対しても同一の処理を
行なうために符号化効率は良くなかった。
【0005】実環境において収録された音声情報には局
所的特徴に大きな違いがある。まず、音声の部分と、音
声の無い部分(無音)に分けられる。音声は子音と母音
に分けられる。また子音は無声子音と有声子音に分けら
れる。また、母音はピッチや口の動きが安定した母音定
常部と、それぞれが変化している母音過渡部に分けられ
る。これらはそれぞれ全く異なる特徴を持っている。し
たがって、それぞれに最適の符号化方法が存在する。
【0006】基本方式がCELPの場合の局所的な特徴
による符号化方法の違いを以下に述べる。まず、無音区
間は音声が無い部分で、あるのは実環境ノイズのみであ
り、伝えるべき情報はその時間長だけであり、音源情報
を省略することによって極低ビットレートで符号化でき
る。また、無声子音には破裂性のもの(/p/、/t/
等)と摩擦性のもの(/s/、/h/等)とがある。前
者は、その細かなパワー変化が重要であり短いフレーム
長での符号化が望ましく、適応符号帳の音源インデクス
は不必要な部分である。また、後者は、その放射特性と
時間長が重要であり、前者と同様に適応符号帳の音源イ
ンデクスは不必要な部分である。有声子音は、細かなパ
ワー変化、声道情報、音源情報全てが重要であり、符号
化に最も多い情報量を必要とする部分である。母音定常
部は、類似した形状の波形が連続するために、適応符号
帳を用いれば少ない情報量で符号化できる。母音過渡部
は声道情報や音源情報の変化が母音定常部よりも大き
く、またパワーも大きいので音質の劣化が聞えやすいこ
とから、有声子音同様に、多くの情報を必要とする部分
である。以上のように、局所的に符号化方法を変え、適
応的に情報を配分することによって、効率のよい符号化
が可能になる。
【0007】
【発明が解決しようとする課題】上記で示したように、
音声情報の局所的特徴には大きな違いがある。したがっ
て、これらの特徴を生かして適応的に符号化を行なうこ
とによって符号化効率を上げれば、より少ない平均ビッ
トレートでより良好な合成音を得る事ができる。この考
え方に基づいて、複数の符号化モジュールを用いる符号
化法も検討されている。例としては、日本音響学会春期
研究発表会講演論文集2−Q−23に記載されているも
のや、Qaucom社の開発したQCELP方式が挙げ
られる。同方式は北米でディジタルセルラーホン用の標
準化方式(TIA−IS96)として採用された。
【0008】上記方式のいずれも、符号化モジュールの
選択を簡単なルールに基づいて行っている。そのため
に、適応する符号化モジュールを間違えるという現象が
起こり、耳につく異音が起こるという問題があった。こ
の問題は、複数の符号化モジュール全てで符号化を行な
い符号化歪を比較して最も歪の少ない符号化モジュール
を採用するようにすれば(A−b−Sによれば)解決さ
れる。しかし、それでは計算量が膨大になってしまい、
携帯電話の様な小型の装置に組込むことは難しい。また
一方、異音が起こらないような複雑なルールを人間が考
えるのは大変難しい。
【0009】
【課題を解決するための手段】この問題を解決するため
に本発明は、入力された音声信号(入力音声)を分析し
音声の特徴をパラメータ化する音声分析手段と、音声分
析手段によって得られたパラメータに基づき音声の符号
化を行なう符号化モジュールが複数格納されている符号
化部と、予め多くの入力音声に対して音声分析手段によ
って得られる特徴パラメータとそれぞれの入力音声に対
して符号化部に格納されている全ての符号化モジュール
で符号化を行なって得られる最適な符号化モジュールと
の対応関係を統計処理することよって得られるルールが
格納されている選択ルール格納部と、音声分析手段によ
って得られた音声の特徴パラメータと選択ルール格納部
に格納されているルールとに基づき符号化部に格納され
ている符号化モジュールのうち符号化に用いるモジュー
ルを決定するモジュール選択部とを備える。
【0010】
【作用】本発明は前記の構成によって、予め多くの入力
音声に対して音声分析手段で特徴パラメータを得、符号
化部に格納されている符号化モジュールの全てで符号化
を行なうことによって各符号化モジュールでの符号化歪
が得られ、この符号化歪を比較することによって最も歪
の少ない最適な符号化モジュールのインデクスが得ら
れ、このような特徴パラメータとインデクスとの対応関
係を統計処理することよってルールが簡単に作成でき、
このルールを使用することによってモジュール選択を少
ない計算量で行なうことが出来る。また、統計処理をす
る前の各データを人間がチェックし、より効率がよくな
るように改良すれば、その意志を反映したルールが作成
できる。したがって、各音声の特徴に適応した効率の良
い符号化が可能になる。
【0011】
【実施例】
(実施例1)以下、本発明の一実施例について、従来の
CELPを基本とした音声符号化装置を例に挙げて説明
する。
【0012】本実施例の符号器の機能ブロック図を図1
に示す。各部について以下に説明する。まず、A/D変
換器によってディジタル信号に変換された一定時間長の
入力音声11に対して、自己相関分析部12において分析を
行ない、自己相関係数を得る。また、同時にパワー情報
を得る。LPC分析部13においては、自己相関分析部12
によって得られた自己相関係数を分析し、線形予測係数
を得る。ピッチ予備選択部14においては、入力音声11に
対してLPC分析部13にて得られた線形予測係数を用い
て逆フィルタを掛けて線形予測残差波形を求め、その線
形予測残差波形の長期一次相関を分析し、基本周波数
(ピッチ)の候補を選出する。この情報は適応符号帳の
予備選択や、聴感重み付けフィルタに用いられる。モジ
ュール選択部15においては、自己相関部12において得ら
れる、自己相関係数、現分析区間の入力音声のパワー、
入力音声の前分析区間からのパワー変化量、入力音声の
現分析区間内のパワー変化量、LPC分析部13において
得られる、線形予測係数、スペクトル包絡、前分析区間
からのスペクトル変化量、ピッチ予備選択部14において
得られる、現分析区間の線形予測残差波形や長期予測残
差波形のパワー、線形予測残差波形や長期予測残差波形
の前分析区間からのパワー変化量、線形予測残差波形や
長期予測残差波形の現分析区間内のパワー変化量、線形
予測残差波形の長期予測係数等の特徴から、選択ルール
格納部16に格納されたルールに照合して、符号化部17に
格納された符号化モジュールから符号化に最も適したモ
ジュールのインデクスを選択する。符号化部17において
は、モジュール選択部15で得られたインデクスの符号化
モジュールによって符号化を行なう。符号統合部18にお
いては、符号化部17にて得られた符号を集めて伝送路19
へ送る。
【0013】ここで、選択ルール格納部16に格納された
ルールの作成方法について、選択ルール作成における手
順を示した図2を用いて説明する。
【0014】まず、いろいろな人の発声した音声を収録
しディジタル信号に変換31して、ハードディスク上の音
声格納部32へ格納する。次に図1の構成による本発明の
符号化装置を機能させ33、自己相関分析部12、LPC分
析部13、ピッチ予備選択部14から得られる音声の特徴パ
ラメータと、符号化部17内の全ての符号化モジュールを
機能させたときの符号化歪とをハードディスク上のデー
タ格納部34へ格納する。このデータは各音声の分析区間
の番号と、その特徴パラメータと、各符号化モジュール
の符号化歪により構成されているものである。
【0015】ここで、格納されるデータの一例の一部を
図3に示す。条件は、符号化モジュールが5つで、分析
区間長は20msec、音声は男性の発声した「ば」の
部分である。内容は、左から、分析区間番号、分析区間
のパワー、自己相関係数の1次、自己相関係数の2次、
分析区間を半分ずつ2つの部分区間に分けた時の前後の
部分区間のパワー比(小さい方を大きい方で割ったも
の)、線形予測誤差波形の最も長期相関の高いピッチ候
補の長期予測係数、線形予測誤差波形の長期予測誤差波
形のパルス性を示す値、線形予測誤差波形の長期予測誤
差波形の正規化パワー、線形予測誤差波形の最も長期相
関の高いピッチ候補、5つの符号化モジュールで符号化
した時の符号化歪をS/N比で表した数値、最も誤差の
小さい(S/N比の大きい)符号化モジュールのインデ
クス(最適モジュールのインデクス)である。
【0016】またこの時、エディタ等によりデータ格納
部34に格納されたデータを人間がチェックし、望ましい
数値に改めれば、人間の意志を反映させることができる
(データ改良37)。たとえば、情報ビット数の大きな符
号化モジュールAと、情報ビット数の少ない符号化モジ
ュールBとがあり、局所的S/NがモジュールAの方が
僅かの差で小さい場合、その音質の差よりも情報量が少
ない方が望ましいとして最適インデクスをモジュールB
に書き換えることができ、これを多くの分析区間につい
て行えば、モジュールBの全体に占める割合を増やすこ
とができ、平均ビットレートを下げることができる。
【0017】ルールの作成方法についての説明を続け
る。次に、データ格納部34に格納されたデータを統計処
理部35において統計処理を行いルールを作成して、ルー
ル格納部36に格納する。
【0018】ここで、統計処理部35における処理につい
て説明する。作成するルールの構造は判定の方法によ
る。統計処理に基づくルールの構造には、ニューラルネ
ット、VQ、LVQ、ベイズ判定等が挙げられるが、本
実施例では、例としてニューラルネットで最も単純な3
層のパーセプトロンを用いた場合の説明を行う。入出力
構造を図4に示す。ここで、各ニューロンは、
【0019】
【数1】
【0020】に示すように、複数の入力を重みを付けて
加算し、シグモイドと呼ばれる関数を通して得られる値
を出力する。ニューラルネットに複数の入力を入力する
ことによって判定に必要な情報を出力する。本実施例で
は、特徴パラメータを入力してどの符号化モジュールを
選択すればよいのかを示す値を出力するニューラルネッ
トワークを構築する。
【0021】ニューラルネットを使用する場合の統計処
理とは、多くのデータからこの重みWjiを求めることで
ある(学習と呼ぶ)。本実施例では、誤差逆伝播法によ
る学習を行う。次に手順を述べる。まず、Wjiに乱数で
初期値を与える。次に、入力層のニューロンの入力デー
タとしてデータ格納部に格納された音声の特徴パラメー
タを与え、教師信号としてその時の最適なモジュール番
号の出力層のニューロンのみが発火する状態を教師信号
として与え(例えば、符号化モジュールが5つある場
合、出力層を5つ用意し、最適インデクスの番号のニュ
ーロンのみには「1」、あとの4つのニューロンには
「0」を教師信号として与える)、各Wjiを以下の次式
にしたがって変化させる。
【0022】
【数2】
【0023】以上に示した処理をデータ格納部に格納さ
れているデータ全てについて何度も繰り返し行い、Wji
の値を収束させる。よって、特徴パラメータから符号化
モジュールを選択するルールが作成できる。
【0024】以上の処理によって作成されたルールを図
1の選択ルール格納部16に格納することによって、適切
なモジュール選択が可能になる。
【0025】ここで、ニューラルネットによるモジュー
ル選択性能を評価した実験について以下に示す。
【0026】本実験ではCELP方式に基づく符号化モ
ジュールを5つ使用した。本実験におけるビット割り当
て表を図5に示す。基本条件は、入力音声のサンプリン
グレートが8kHz、分析区間長が20msecであ
る。各モジュールの性質は、モジュール1が母音過渡部
・有声子音用モジュール(8kbps)、モジュール2
が破裂性子音・語頭部分・語尾濁音用モジュール(8k
bps)、モジュール3が母音定常部用モジュール(4
kbps)、モジュール4は無声摩擦音用モジュール
(4kbps)、モジュール5は無音用モジュール(2
kbps)である。また、データ格納部33に格納される
データの内、インデクスについては、人間がエディタに
より、各モジュールの使用割合を考慮しながら改良を加
えた。また、モジュール選択部に入力するパラメータは
以下の20個とした。 P1=分析区間のパワー(現分析区間) P2=分析区間のパワーの比(現分析区間/前分析区
間) P3=分析区間内の前半と後半のパワーの比(現分析区
間) P4=自己相関係数1次(現分析区間) P5=自己相関係数2次(現分析区間) P6=長期予測係数の最大値(現分析区間) P7=長期予測ラグの変化量(現分析区間/前分析区
間) P8=分析区間のパワー(前分析区間) P9=分析区間内の前半と後半のパワーの比(前分析区
間) P10=自己相関係数1次(前分析区間) P11=自己相関係数2次(前分析区間) P12=長期予測係数の最大値(前分析区間) P13=長期予測ラグの変化量(前分析区間/前々分析区
間) P14=S/N比(前分析区間) P15=分析区間のパワー(前々分析区間) P16=分析区間内の前半と後半のパワーの比(前々分析
区間) P17=自己相関係数1次(前々分析区間) P18=自己相関係数2次(前々分析区間) P19=長期予測係数の最大値(前々分析区間) P20=S/N比(前々分析区間) モジュール選択部に用いるニューラルネットは入力層2
0、中間層15、出力層5つのニューロンで構成した。
なお、選択に必要な計算は、積和395回、シグモイド
関数15回、場合分け4回等で、重みWjiの格納に必要
なROM領域は395Wである。また、ルール学習用音
声データとして、男女24人分の短文発声データを用い
た。加速係数を0.01〜0.002、平滑化係数を0.5〜0.2に
変化させて収束を早める工夫を行った。識別データが学
習データと同等の場合の識別結果を図6に示す(ただ
し、この実験における正解は、データ格納部に格納され
たデータの最適インデクスである)。
【0027】また、上記学習データ以外の音声データ
(男女8人の短文音声)を用いて、実際に音声符号化・
復号化実験を行なった。合成音を男女19人に合成音を
試聴させ、5段階の主観評価させることによりMOS
(Mean Opinion Score)を求めた。
この値を、原音声(符号化する前の音声)と、前記従来
の技術で説明した標準化方式であるQCELPとについ
て求め比較した。その結果、原音声で3.61、QCE
LPで3.08に対して、本実施例は3.38という高
いMOS値が得られ、従来法よりも良好な音質の合成音
が得られることが検証できた。
【0028】
【発明の効果】以上のように本発明は、予め多くの入力
音声に対して音声分析手段で特徴パラメータを得、符号
化部に格納されている符号化モジュールの全てで符号化
を行なうことによって各符号化モジュールでの符号化歪
が得られ、符号化歪を比較することによって最適な符号
化モジュールのインデクスが得られ、このような特徴パ
ラメータとインデクスとの対応を統計処理することによ
って複雑なルールが簡単に得られ、このルールを使用す
ることによってモジュール選択を少ない計算量で行なう
ことが出来る。このように、全ての符号器に共通の前処
理において得られる様々な情報に基づき、各符号化モジ
ュールで符号化した結果を予測して符号化モジュールを
選択するルールをヒューリスティックで作成することが
出来る。また、統計処理をする前の各データを人間がチ
ェックし、より効率がよくなるように改良すれば、その
意志を反映したルールが作成できる。
【0029】したがって、各音声の特徴に適応した効率
の良い符号化が可能になる。
【図面の簡単な説明】
【図1】本発明の一実施例の符号器の機能ブロック図
【図2】同実施例におけるルールを作成する方法に関す
るブロック図
【図3】同実施例におけるデータ格納部34に格納される
データの一部の例を示した図
【図4】同実施例で用いるニューラルネットの入出力構
造を示した図
【図5】同実施例における各符号化モジュールのビット
割り当てを示した図
【図6】同実施例におけるニューラルネットによるモジ
ュール選択実験の識別状況を示した図
【図7】従来の方式による符号化装置の基本機能のブロ
ック図
【符号の説明】
11 入力音声 12 自己相関分析部 13 LPC分析部 14 ピッチ予備選択部 15 モジュール選択部 16 選択ルール格納部 17 符号化部 18 符号統合部 19 伝送路 21 入力音声 22 LPC分析部 23 適応符号帳 24 確率的符号帳 25 加算部 26 LPC合成部 27 比較部 28 パラメータ符号化部 29 伝送路 31 音声収録 32 音声格納部 33 符号化部 34 データ格納部 35 統計処理部 36 ルール格納部 37 データ改良

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声信号(入力音声)を分析
    し特徴パラメータを得る音声分析手段と、前記特徴パラ
    メータに基づき音声の符号化を行なう符号化モジュール
    が複数格納され、そのいずれかの符号化モジュールで符
    号化を行なう符号化部と、予め多くの入力音声に対して
    前記音声分析手段で得られる特徴パラメータとそれぞれ
    の入力音声に対して前記符号化部に格納されている全て
    の符号化モジュールで符号化を行なって得られる最適な
    符号化モジュールとの対応を統計処理することよって得
    られるルールが格納されている選択ルール格納部と、前
    記音声分析手段で得られた音声の特徴パラメータと選択
    ルール格納部に格納されているルールとに基づき前記符
    号化部で採用する符号化モジュールを決定するモジュー
    ル選択部とを備えることを特徴とする音声符号化装置。
JP31448394A 1994-12-19 1994-12-19 音声符号化装置 Expired - Lifetime JP3183072B2 (ja)

Priority Applications (9)

Application Number Priority Date Filing Date Title
JP31448394A JP3183072B2 (ja) 1994-12-19 1994-12-19 音声符号化装置
US08/559,667 US5774846A (en) 1994-12-19 1995-11-20 Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
EP03024767A EP1391879A3 (en) 1994-12-19 1995-11-27 Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
EP03024766A EP1391878A3 (en) 1994-12-19 1995-11-27 Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
DE69532879T DE69532879T2 (de) 1994-12-19 1995-11-27 Vorrichtung zur Sprachkodierung, zur linear-prädiktiven Analyse und zur Geräuschverminderung
EP95118647A EP0718820B1 (en) 1994-12-19 1995-11-27 Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
US09/059,568 US6067518A (en) 1994-12-19 1998-04-14 Linear prediction speech coding apparatus
US09/475,249 US6205421B1 (en) 1994-12-19 1999-12-30 Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
US09/475,248 US6167373A (en) 1994-12-19 1999-12-30 Linear prediction coefficient analyzing apparatus for the auto-correlation function of a digital speech signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31448394A JP3183072B2 (ja) 1994-12-19 1994-12-19 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH08171400A true JPH08171400A (ja) 1996-07-02
JP3183072B2 JP3183072B2 (ja) 2001-07-03

Family

ID=18053857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31448394A Expired - Lifetime JP3183072B2 (ja) 1994-12-19 1994-12-19 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3183072B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7092878B1 (en) 1999-08-03 2006-08-15 Canon Kabushiki Kaisha Speech synthesis using multi-mode coding with a speech segment dictionary
US7289951B1 (en) 1999-07-05 2007-10-30 Nokia Corporation Method for improving the coding efficiency of an audio signal
JP2021526240A (ja) * 2018-05-30 2021-09-30 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. 音声類似度評価器、音声符号化器、方法およびコンピュータプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7289951B1 (en) 1999-07-05 2007-10-30 Nokia Corporation Method for improving the coding efficiency of an audio signal
US7457743B2 (en) 1999-07-05 2008-11-25 Nokia Corporation Method for improving the coding efficiency of an audio signal
US7092878B1 (en) 1999-08-03 2006-08-15 Canon Kabushiki Kaisha Speech synthesis using multi-mode coding with a speech segment dictionary
JP2021526240A (ja) * 2018-05-30 2021-09-30 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. 音声類似度評価器、音声符号化器、方法およびコンピュータプログラム
US12051431B2 (en) 2018-05-30 2024-07-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio similarity evaluator, audio encoder, methods and computer program

Also Published As

Publication number Publication date
JP3183072B2 (ja) 2001-07-03

Similar Documents

Publication Publication Date Title
US6205421B1 (en) Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
KR100962681B1 (ko) 오디오신호들의 분류
KR100923896B1 (ko) 분산형 음성 인식 시스템에서 음성 활성을 송신하는 방법및 장치
KR100566713B1 (ko) 음향 파라미터 부호화, 복호화 방법, 장치 및 프로그램, 음성 부호화, 복호화 방법, 장치 및 프로그램
KR20080083718A (ko) 부호화 모델 선택
KR20010014352A (ko) 음성 통신 시스템에서 음성 강화를 위한 방법 및 장치
JP3353852B2 (ja) 音声の符号化方法
EP1298647B1 (en) A communication device and a method for transmitting and receiving of natural speech, comprising a speech recognition module coupled to an encoder
JP3183072B2 (ja) 音声符号化装置
Atal et al. Speech research directions
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
Ding et al. A Hybrid Structure Speech coding scheme based on MELPe and LPCNet
Ozaydin et al. A 1200 bps speech coder with LSF matrix quantization
KR100984094B1 (ko) 가우시안 혼합 모델을 이용한 3세대 파트너십 프로젝트2의 선택 모드 보코더를 위한 실시간 유무성음 분류 방법
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP3250398B2 (ja) 線形予測係数分析装置
Anselam et al. QUALITY EVALUATION OF LPC BASED LOW BIT RATE SPEECH CODERS
Yuan The weighted sum of the line spectrum pair for noisy speech
KR100309873B1 (ko) 코드여기선형예측부호화기에서무성음검출에의한부호화방법
Beritelli et al. A pattern recognition approach to robust voiced/unvoiced speech classification using fuzzy logic
Lee et al. Design of a speech coder utilizing speech recognition parameters for server-based wireless speech recognition
JP3284874B2 (ja) 音声符号化装置
JPH0284700A (ja) 音声符号化復号化装置
Lukasiak Techniques for low-rate scalable compression of speech signals
Gersho Concepts and paradigms in speech coding

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080427

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090427

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100427

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110427

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120427

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120427

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130427

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130427

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140427

Year of fee payment: 13

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term