JPH08251030A - 高速および低速再生能力を与えるためのシステム、記憶および検索システム、ならびに高速および低速再生能力を与えるための方法 - Google Patents

高速および低速再生能力を与えるためのシステム、記憶および検索システム、ならびに高速および低速再生能力を与えるための方法

Info

Publication number
JPH08251030A
JPH08251030A JP7320765A JP32076595A JPH08251030A JP H08251030 A JPH08251030 A JP H08251030A JP 7320765 A JP7320765 A JP 7320765A JP 32076595 A JP32076595 A JP 32076595A JP H08251030 A JPH08251030 A JP H08251030A
Authority
JP
Japan
Prior art keywords
templates
template
excitation signal
ratio
lpc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7320765A
Other languages
English (en)
Inventor
Eyal Shlomot
アイアル・シュロモット
Albert Achuan Hsueh
アルバート・アクーアン・シュー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Boeing North American Inc
Original Assignee
Rockwell International Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rockwell International Corp filed Critical Rockwell International Corp
Publication of JPH08251030A publication Critical patent/JPH08251030A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

(57)【要約】 【課題】 残っている信号内の多重周期類似性を利用
し、励起周期的構造を変えるために適用され得る多重周
期テンプレートマッチングを含み、それによって音声再
生の速度を低減または増大させる可変速度の再生システ
ムを提供する。 【解決手段】 この発明の実施例は、音声のピッチ周期
を変えることなく記憶およびフォワードアプリケーショ
ンのための正確な高速または低速音声再生を可能にす
る。相関される多重周期類似性手段が圧縮器/伸長器
(106)内の励起信号に対して決定される。多重周期
類似性は、有理の比によってオーバーラップおよび加算
拡張または圧縮を可能にする。音声のオンセットおよび
オフセット部分でのエネルギ変動はエネルギベースの適
応型重みウィンドウによって重み付され得る。

Description

【発明の詳細な説明】
【0001】
【発明の分野】この発明は、音声符号化に、音声変更を
組合せたシステムに関する。より特定的には、この発明
は音声信号の周期的構造の操作に関する。
【0002】
【関連技術の説明】さまざまな電子製品、特にボイスメ
ール、音声注釈、応答マシン、または何らかのデジタル
記録/再生装置などの電話製品にデジタル記憶および検
索システムを設けることに興味が高まっている。より特
定的には、たとえば、音声圧縮によって電子装置がデジ
タル入出メッセージを記憶しかつ再生することが可能に
なる。記録された音声再生を制御しかつ変更するために
は、低速および高速再生などの向上した機能が望まし
い。
【0003】信号モデリングおよびパラメータ評価は、
データ圧縮、伸長、および符号化においてますます重要
な役割を果たす。基本的な音声をモデリングするために
は、音声信号はデジタルで処理されるべき別個の波形と
してサンプルされなければならない。線形予測符号化
(LPC)と呼ばれる信号符号化技術の1つでは、いず
れかの特定の時間インデックスでの信号値の評価が先行
値の線形関数として与えられる。後続の信号はこのよう
に先行値に従って線形的に予測可能になる。評価は、L
PC合成フィルタと呼ばれるフィルタまたは線形予測フ
ィルタによって行なわれる。
【0004】たとえば、LPC技術は、符号励起線形予
測(CELP)音声符号器を含む音声符号化に用いられ
得る。これらの従来の音声符号器は一般的に少なくとも
2つの励起符号表を利用する。符号表の出力は入力をL
PC合成フィルタに与える。そして、LPC合成フィル
タの出力はさらなるポストフィルタによって処理され、
復号化音声を生成し、またはポストフィルタを迂回し
て、直接出力され得る。
【0005】そのような符号器は近年にかなり進歩し、
特に音声品質および複雑性の低減の領域において改良が
行なわれた。さまざまなCELP符号器が一般的に工業
規格として受入れられている。たとえば、CELP規格
は連邦規格1016、電話通信(Federal Standard 101
6, Telecommunications )、4800ビット/秒コード
励起線形予測(CELP)による無線音声のアナログ−
デジタル変換(Analogto Digital Conversion of Radio
Voice by 4,800 Bit/Second Code Excited Linear Pre
diction(CELP))、技術および規格の国家通信システ
ム局(NationalCommunications System Office of Tech
nology & Standards )1991年2月14日、1−
2、国家通信システム技術情報公報(National Communi
cations SystemTechnical Information Bulletin)92
−1、連邦規格1016CELPの実施における補助へ
の詳細(Details to Assist in Implementation of Fed
eralStandard 1016 CELP )、1992年1月、8、お
よび高速音声コーデック両立性規格PN−2972、E
IA/TIA仮規格(Full-Rate Speech Codec Compati
bility Standard PN-2972, ELA/TIA Interim Standard
s)、1990年、3−4において述べられている。
【0006】典型的な記憶および検索動作では、さまざ
まな時間ドメインおよび周波数ドメイン評価および変更
技術を用いて高速および低速再生などの音声変更が達成
され、いくつかの音声パラメータ、たとえばピッチ周波
数または遅れが評価され、音声信号がそれに応じて変更
される。しかしながら、音声変更装置または機構を復号
器の外側ではなく復号器中に組込むことによって、より
大きく変更された音声品質を得ることができることがわ
かっている。さらに、ピッチ評価の代わりにテンプレー
トマッチングを利用することによって、より簡単でかつ
よりしっかりした音声変更が達成される。さらに、エネ
ルギベースの適応型ウィンドウイングは、より滑らかに
変更された音声を与える。
【0007】
【発明の概要】この発明は、LPC励起周期的構造を変
えるべく多重周期テンプレートマッチングを組入れる可
変速度再生システムに関し、それによって音声の自然な
品質を維持しながらも音声再生の速度を増減させる。こ
の発明の実施例は、記憶およびフォワードアプリケーシ
ョンのための正確な高速または低速音声再生を可能にす
る。
【0008】多重周期類似基準が復号化LPC励起信号
に対して決定される。多重周期類似度、すなわち、正規
化された相関が決定される。時間ドメインLPC励起信
号の伸長または圧縮は、有理のファクタ、たとえば、
1:2、2:3、3:4、4:3、3:2、および2:
1に従って行なわれ得る。伸長および圧縮はLPC励起
信号に基づいて行なわれるので、その結果周期性はホル
マント構造によって曖昧にされない。このようにして、
高速再生はNテンプレートをMテンプレートに(N>
M)組合せることによって達成され、低速再生はNテン
プレートをMテンプレート(N<M)に伸長することに
よって得られる。
【0009】より特定的には、LPC励起信号の少なく
とも2つのテンプレートが、最大に正規化された相関に
従って決定される。伸長または圧縮の所望の割合に依存
して、テンプレートはLPC励起信号内の1つまたはそ
れ以上のセグメントによって規定される。これらのセグ
メントのエネルギの割合に基づいて、2つの相補的ウィ
ンドウが構成される。テンプレートはその後ウィンドウ
によって乗算され、オーバーラップされ、加算される。
結果として得られる励起信号は変更された励起信号を表
し、それはLPC合成フィルタに入力され、後に変更さ
れた音声として出力される。
【0010】
【発明の詳しい説明】以下の説明は、本発明の現在考え
られる最良の実施態様である。添付図面において、同じ
参照番号は図中の同じ部品を示す。この説明は、この発
明の一般的原理を示すために行なわれ、限定的な意味で
とらえるべきではない。この発明の範囲は前掲の特許請
求の範囲を参照することによって最良に決定される。
【0011】この発明の実施例に従えば、以下で詳細に
議論されるように、最大限に相関するLPC励起テンプ
レートのための適応型ウィンドウオーバーラップおよび
加算技術が利用される。好ましいテンプレートマッチン
グ機構の結果、音声信号などのデジタル式記憶信号の高
速および低速再生の品質が高くなる。
【0012】図1および2に示されているように、復号
化励起信号102は順次記憶されたメッセージの始めか
らその終りまで多重周期圧縮器/伸長器106によって
処理される。圧縮器/伸長器において、励起信号102
内で2つのテンプレートxMLおよびyMLが識別される
(図2のステップ200)。テンプレートはMセグメン
トから形成される。それに従って、高速または低速再生
が励起信号302を有理のN:M比、たとえば2:1、
3:2、2:3で圧縮または伸長することによって達成
され、Mは結果として得られるセグメントの数を表わ
す。
【0013】図3(a)、3(b)および3(c)を参
照して、Tstratは、励起信号302(図1で10
2として示されている)の先行して処理された部分と残
りの処理されていない部分との間の境界を示す。このた
め、TstratはxMLテンプレートの始まりを印して
いる。各段階において、最小値Lminから最大値Lm
axの間の各々の起こり得る整数値Lに対して励起信号
302の適切に並べられたテンプレートxMLおよびyML
が相関される(図2中のステップ202)。正規化され
た相関が以下の式(21)のように与えられる。
【0014】
【数13】
【0015】
【数14】
【0016】上式(22)は、Lのすべてのとり得る
値、たとえばLmin=20ないしMmax=150を
当てはめ、CMLを計算することによって見出され得る。
最大値CMLは、L* として示されるLの特定の値に対し
て決定され得る(図2中のステップ202)。このよう
にして、L* は、励起信号の周期的構造を表わし、ほと
んどの場合ピッチ周期と一致する。しかしながら、正規
化された相関はLPC/CELP符号化において使用さ
れる決まったフレーム構造に制限されることはなく、L
* はピッチ周期に必ずしも限定されないことが認められ
るであろう。
【0017】図2を参照して、ML* の大きさの2つの
相補的適応型ウィンドウ、つまりx ML* に対してWML*
x 、およびyML* に対してWML* y が決定される(ステ
ップ204)。以下に詳細に示されるように、相補的ウ
ィンドウに関して、2つのウィンドウの和はどのポイン
トでも1に等しい。適応がxML* およびyML* の各L *
セグメントのエネルギ比に従って行なわれる。テンプレ
ートxML* およびyML * は、長さML* の相補的適応型
ウィンドウによって乗算され、オーバーラップされ、加
算され、変更された(高速および低速)励起信号を生成
する(ステップ206)。そして、指標Tstart
は、yML* の右に移動し(ステップ208)、変更され
るべきまだ処理されていない励起信号の次の部分を指
す。そして励起信号はLPC合成フィルタ104(図
1)によってフィルタリングされ、復号化出力音声10
8を生成する。
【0018】1.一般的な適応型ウィンドウ公式 このセクションでは、適応型ウィンドウの一般的な公式
が与えられる。N対Mの任意の圧縮/伸長比に対して、
2つの相補的ウィンドウWML* x およびWML* y は、W
ML* x (i)+WML* y (i)=1であるように構成さ
れる。ここで0≦i<ML* である。変更される音声の
エネルギ遷移の品質を改良するために、ウィンドウは、
各L* セグメントのxML* とyML* との間のエネルギの
比率に従って適用される。
【0019】より特定的には、エネルギEy [k](k
=0,…、M−1)は以下の式(23)に従って計算さ
れる。エネルギー公式において、i=0は、対応のx
ML* およびyML* セグメントの始まりを表すことが注目
されるべきである。
【0020】
【数15】
【0021】
【数16】
【0022】2.高速再生−励起信号圧縮 図3(a)を参照して、たとえば2:1の比のデータ圧
縮は、テンプレートx L およびyL を長さLの1つのテ
ンプレートに組合せることによって達成され、この例で
理解され得るようにM=1である。テンプレートxL
12はTstartを始点とするLサンプルによって規
定され、yL 314は次のセグメントのLサンプルによ
って規定される。LminないしLmaxの範囲の各L
に対して、正規化された相関CL が式(21)に従って
計算される。ここでM=1であり、L* は正規化された
相関を最大にするLの値として選択される。適応型ウィ
ンドウは上述の式に従ってM=1で計算される。
【0023】それに応じて、図4に一般的に示されてい
るように、xL*はWL* x によって乗算され(402)、
L*はWL* y によって乗算される(404)。結果とし
て得られる信号はオーバーラップされ(406)、加算
され(408)、圧縮された励起信号を生成する(41
0)。図3(a)において示されているように、L*
ンプルの2つのオーバーラップされていないセグメント
の各々がL* サンプルの1セグメントに組合せられるの
で、2:1の圧縮が達成される。TstartはyL*
終点(図3(a)中のポイント304)にシフトされ
る。そして次のテンプレートマッチングおよび組合せル
ープを行なうことができる。
【0024】図3(b)を参照して、3:2の比のデー
タ圧縮がテンプレートx2L320およびy2L322を長
さ2Lの1テンプレートに組合せることによって達成さ
れる。テンプレートx2L320はTstartを始点と
する2Lサンプルのセグメントによって規定され、y2L
はTstartのLサンプル後に開始する2Lサンプル
によって(すなわち図中のTstartの右側に)規定
される。LminないしLmaxの範囲の各Lに対し
て、正規化された相関C2Lが計算される。正規化された
相関C2Lは式(21)によってM=2を用いて計算され
る。ここでも、L * は正規化された相関を最大にするL
の値として選択される。そして適応型ウィンドウはM=
2に対して計算される。
【0025】図4に示されているように、ここでも、x
2L* はW2L* x によって乗算され(402)、y2L*
2L* y によって乗算される(404)。結果として得
られる信号はオーバーラップされ(406)、加算され
(408)、3:2の圧縮された励起信号を生成する
(410)。言い換えれば、第1のセグメントx2L32
0の後端は次のセグメントy2L322の前端によってオ
ーバーラップされ、各々は2L* サンプルの長さを有
し、その結果オーバーラップされる和はLサンプルの長
さである。このようにして、Tstartは次のテンプ
レートマッチングおよび組合せループのためにy2L*
終点に移動され得る。
【0026】3.低速再生−励起信号拡張 図3(c)を参照して、2:3の比のデータ拡張がテン
プレートx3L330およびy3L332を長さ3Lの1テ
ンプレートに組合せることによって達成される。テンプ
レートx3L330はTstartを始点とする3Lサン
プルによって規定され、y3LはTstartより、時間
的に先行する励起信号を表わすLサンプル前の、ポイン
ト334を始点とする3Lサンプルによって(すなわち
Tstartの左側に)規定される。LminないしL
maxの範囲にある各Lに対して、正規化された相関C
3Lが計算される。正規化された相関は式(21)に従っ
てM=3で決定され、ここでL* は正規化された相関を
最大にするLの値であるように選択される。そして適応
型ウィンドウがM=3に対して計算される。
【0027】適応型ウィンドウイングに関して、図4を
参照して、x3L* はW3L* x によって乗算され(40
2)、y3L* はW3L* y によって乗算される(40
4)。そして結果として得られる信号はオーバーラップ
され(406)、加算され(408)、拡張された励起
信号を生成する(410)。図3(c)において理解さ
れ得るように、2:3の拡張は逆にオーバーラップする
ことによって達成される。すなわち、xMLテンプレート
の前端がyMLテンプレートの後端でオーバーラップさ
れ、各々3L* サンプルである2つのセグメントは2L
* サンプルだけオーバーラップされ、3L* サンプルの
1セグメントに組合せられる。Tstartはy 3L*
右端に移動し、次のテンプレートマッチングおよび組合
せループの準備をする。このようにして、励起信号は、
MLセグメントの特定の配置を選択し、始点Tstar
tをシフトすることによって拡張される。
【0028】この詳しい説明は、この発明の例を表わす
ためにだけなされており、いかなるようにもこの発明の
範囲を限定することを考慮されるべきではない。さまざ
まな修正、付加、または代替がこの発明の範囲から離れ
ることなくなされ得ることが理解されるであろう。した
がって、この発明は特定の示される実施例によって限定
されるのではなく、前掲の特許請求の範囲およびその均
等物の範囲によってのみ限定される。
【図面の簡単な説明】
【図1】この発明の音声変更および再生システムの実施
例を組入れる復号器のブロック図である。
【図2】図1および2において示された音声変更機構の
実施例のフロー図である。
【図3】図1の実施例に従った音声圧縮および拡張を示
す図である。
【図4】この発明のウィンドウオーバーラップおよび加
算機構の実施例の図である。
【符号の説明】
102 励起信号 104 LPC合成フィルタ 106 多重周期圧縮器/伸長器 108 出力音声
───────────────────────────────────────────────────── フロントページの続き (72)発明者 アルバート・アクーアン・シュー アメリカ合衆国、92677 カリフォルニア 州、ラグーナ・ニグエル、ドーエニー、2

Claims (22)

    【特許請求の範囲】
  1. 【請求項1】 波形によって表わされる線形予測符号化
    (LPC)励起信号上で動作可能な、高速および低速再
    生能力を与えるためのシステムであって、 LPC励起信号を受取りかつ変更するための信号圧縮器
    /伸長器を備え、圧縮および伸長は、有理のN対M比に
    従って行なわれ、前記信号圧縮器/伸長器は、 LPC励起信号内の少なくとも1組のテンプレートを区
    別するための手段を含み、各テンプレートは、LPC励
    起信号の波形の一部を表わす時間の少なくとも1つのセ
    グメントを規定し、さらに、 同様の波形を有する1組のテンプレートを選択するため
    の手段と、 1組のテンプレートを、変更された励起信号を規定す
    る、Mセグメントを有する単一のテンプレートに、組合
    せることによって、高速再生および低速再生のためにL
    PC励起信号を圧縮しかつ伸長するための手段とを含
    み、さらに前記システムは、 変更された励起信号をフィルタリングするためのフィル
    タと、 フィルタリングされた信号を出力するための出力手段と
    を備える、システム。
  2. 【請求項2】 テンプレートの各組の相関を計算するた
    めの手段をさらに含む、請求項1に記載のシステム。
  3. 【請求項3】 相関は正規化され、さらに、テンプレー
    トの各組は2つのテンプレートを含み、各テンプレート
    において規定された少なくとも1つのセグメントは、可
    変長Lを有し、少なくとも1つのセグメントを規定する
    2つのテンプレートは、xMLおよびyMLとして表わさ
    れ、テンプレートの各組の正規化された相関CMLは以下
    の式(1) 【数1】 のように決定される、請求項2に記載のシステム。
  4. 【請求項4】 テンプレートの組間の正規化された相関
    が最大化される値L * を以下の式(2) 【数2】 に従って決定するための手段をさらに備え、その結果テ
    ンプレートxML* およびyML* は、正規化された相関が
    最大化されるテンプレートの長さL* に従って選択され
    る、請求項3に記載のシステム。
  5. 【請求項5】 以下の式(3)および(4) 【数3】 に従って各テンプレートML* およびyML* における各対
    応のセグメントk=0、…、M−1のエネルギ値を決定
    するための手段をさらに備える、請求項4に記載のシス
    テム。
  6. 【請求項6】 対応のセグメントのエネルギの比を計算
    するための手段をさらに備え、対応のセグメントのエネ
    ルギの比は以下の式(5) 【数4】 によって決定される、請求項5に記載のシステム。
  7. 【請求項7】 以下の式(6) 【数5】 によって表わされるようにk=0、…、M−1に対して
    比の重み係数を決定するための手段をさらに備える、請
    求項6に記載のシステム。
  8. 【請求項8】 所望の圧縮/伸長比を表わすN対M比、
    およびL* の値に従って予備的ウィンドウ振幅を決定す
    るための手段をさらに備え、予備的ウィンドウ振幅は以
    下のような式(7) 【数6】 として与えられる、請求項7に記載のシステム。
  9. 【請求項9】 所望の圧縮/伸長比、L* 、重み係数、
    および予備的ウィンドウ振幅に従って相補的ウィンドウ
    を構成するための手段をさらに備え、相補的ウィンドウ
    は選択されたテンプレートxML* およびyML* に対応
    し、さらに、高速再生については、相補的ウィンドウが
    以下の式(8)および(9)に従って構成され、さらに
    低速再生については、相補的ウィンドウが以下の式(1
    0)および(11) 【数7】 に従って構成される、請求項8に記載のシステム。
  10. 【請求項10】 選択されたテンプレートxML* および
    ML* に相補的ウィンドウを乗算し、ウィンドウイング
    されたテンプレートを与えるための手段と、 ウィンドウイングされたテンプレートをオーバーラップ
    するための手段と、 オーバーラップされウィンドウイングされたテンプレー
    トを加算するための手段とをさらに備え、加算されたテ
    ンプレートは、変更されたLPC励起信号を表わす、請
    求項9に記載のシステム。
  11. 【請求項11】 線形予測符号化(LPC)励起信号上
    で動作可能な、高速および低速再生能力を与えるための
    記憶および検索システムであって、 LPC励起信号を受取りかつ変更するための信号圧縮器
    /伸長器を備え、圧縮および伸長は有理のN対M比に従
    って行なわれ、前記信号圧縮器/伸長器は、 LPC励起信号内の少なくとも1つの組のテンプレート
    を選択するための手段を含み、1組の各テンプレートは
    その組内の他のテンプレートのMセグメントに対応する
    時間のMセグメントを規定し、各セグメントは可変長L
    を有し、さらに、 テンプレートの各組の正規化された相関を計算し、Lが
    変化すると、テンプレートの組の正規化された相関がそ
    れに応じて変化するための手段と、 テンプレートの組の間で正規化された相関が最大になる
    値L* を決定し、テンプレートxML* およびyML* の動
    作上の組が見出されるための手段と、 各テンプレートの各セグメントのエネルギを決定するた
    めの手段と、 対応のセグメントのエネルギの比を計算するための手段
    と、 N対M比、L* の値、およびエネルギの比に従って相補
    的ウィンドウを構成するための手段と、 テンプレートの動作上の組に相補的ウィンドウを乗算
    し、ウィンドウイングされたテンプレートを与えるため
    の手段と、 ウィンドウイングされたテンプレートをオーパーラップ
    するための手段と、 オーバーラップされウィンドウイングされたテンプレー
    トを加算するための手段とを含み、加算されたテンプレ
    ートは、変更されたLPC励起信号を表し、さらに、前
    記記憶および検索システムは、 変更されたLPC励起信号を受取り、変更されたLPC
    励起信号をフィルタリングし、変更された音声信号を生
    成するためのLPC合成フィルタと、 変更された音声信号を出力するための手段とを備える、
    記憶および検索システム。
  12. 【請求項12】 1つのテンプレートの1つまたはそれ
    以上の対応のセグメントは、対応のテンプレートの組内
    の他のテンプレートのセグメントをオーバーラップし得
    る、請求項11に記載の記憶および検索システム。
  13. 【請求項13】 テンプレートの動作上の組は、2つの
    テンプレートxML*およびyML* を含む、請求項11に
    記載の記憶および検索システム。
  14. 【請求項14】 各テンプレートxML* およびyML*
    各セグメントk=0、…、M−1のエネルギは以下の式
    (12)および(13) 【数8】 に従って計算される、請求項13に記載の記憶および検
    索システム。
  15. 【請求項15】 対応のセグメントのエネルギ比は、以
    下の式(14) 【数9】 によって決定される、請求項14に記載の記憶および検
    索システム。
  16. 【請求項16】 以下の式(15) 【数10】 によって表されるようにk=0、…、M−1に対してエ
    ネルギ比の重み係数を決定するための手段をさらに含
    む、請求項15に記載の記憶および検索システム。
  17. 【請求項17】 N対M比およびL* の値に従って予備
    的ウィンドウ振幅を決定するための手段をさらに備え、
    予備的ウィンドウ振幅は以下の式(16) 【数11】 のように与えられる、請求項16に記載の記憶および検
    索システム。
  18. 【請求項18】 相補的ウィンドウは、N対M比、
    * 、重み係数、計算されたエネルギ、および予備的ウ
    ィンドウ振幅に従って構成され、高速再生については、
    相補的ウィンドウは以下の式(17)および(18)に
    従って構成され、低速再生については、相補的ウィンド
    ウは以下の式(19)および(20) 【数12】 に従って構成される、請求項17に記載のシステム。
  19. 【請求項19】 線形予測符号化(LPC)励起信号上
    で動作可能な、高速および低速再生能力を与えるための
    方法であって、 LPC励起信号を受取るステップと、 LPC励起信号を変更するステップとを備え、圧縮およ
    び伸長は有理のN対M比に従って行なわれ、前記変更す
    るステップは、 LPC励起信号内のテンプレートの少なくとも1組を選
    択するステップを含み、1組の各テンプレートは、その
    組内の他のテンプレートのMセグメントに対応する時間
    のMセグメントを規定し、各セグメントは可変長Lを有
    し、さらに、 テンプレートの各組を相関させ、Lが変化するとテンプ
    レートの組の相関もそれに応じて変化するステップと、 テンプレートの組の間の相関が最大になる値L* を決定
    し、テンプレートx ML* およびyML* の動作上の組が選
    択されるステップと、 各テンプレート内の各セグメントのエネルギを決定する
    ステップと、 対応のセグメントのエネルギの比を計算するステップ
    と、 N対M比、エネルギの比、およびL* に従って相補的ウ
    ィンドウを構成するステップと、 テンプレートの動作上の組に相補的ウィンドウを乗算
    し、ウィンドウイングされたテンプレートを与えるステ
    ップと、 ウィンドウイングされたテンプレートをオーバーラップ
    するステップと、 オーバーラップされウィンドウイングされたテンプレー
    トを加算するステップとを含み、加算されたテンプレー
    トは変更されたLPC励起信号を表わし、高速および低
    速再生能力を与えるための方法はさらに、 変更されたLPC励起信号をフィルタリングし、変更さ
    れた音声信号を生成するステップと、 変更された励起信号を出力するためのステップとを備え
    る、高速および低速再生能力を与えるための方法。
  20. 【請求項20】 エネルギ比の重み係数を決定するステ
    ップをさらに備える、請求項19に記載の方法。
  21. 【請求項21】 N対M比およびL* の値に従って予備
    的ウィンドウ振幅を決定するステップをさらに含む、請
    求項20に記載の方法。
  22. 【請求項22】 相補的ウィンドウは、N対M比、
    * 、重み係数、および予備的ウィンドウ振幅に従って
    構成される、請求項21に記載の方法。
JP7320765A 1995-01-11 1995-12-08 高速および低速再生能力を与えるためのシステム、記憶および検索システム、ならびに高速および低速再生能力を与えるための方法 Withdrawn JPH08251030A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/371258 1995-01-11
US08/371,258 US5694521A (en) 1995-01-11 1995-01-11 Variable speed playback system

Publications (1)

Publication Number Publication Date
JPH08251030A true JPH08251030A (ja) 1996-09-27

Family

ID=23463194

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7320765A Withdrawn JPH08251030A (ja) 1995-01-11 1995-12-08 高速および低速再生能力を与えるためのシステム、記憶および検索システム、ならびに高速および低速再生能力を与えるための方法

Country Status (4)

Country Link
US (1) US5694521A (ja)
EP (1) EP0726560B1 (ja)
JP (1) JPH08251030A (ja)
DE (1) DE69521405T2 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717823A (en) * 1994-04-14 1998-02-10 Lucent Technologies Inc. Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders
DE19710545C1 (de) * 1997-03-14 1997-12-04 Grundig Ag Effizientes Verfahren zur Geschwindigkeitsmodifikation von Sprachsignalen
US6374225B1 (en) 1998-10-09 2002-04-16 Enounce, Incorporated Method and apparatus to prepare listener-interest-filtered works
US6266643B1 (en) * 1999-03-03 2001-07-24 Kenneth Canfield Speeding up audio without changing pitch by comparing dominant frequencies
US7302396B1 (en) 1999-04-27 2007-11-27 Realnetworks, Inc. System and method for cross-fading between audio streams
US6625656B2 (en) * 1999-05-04 2003-09-23 Enounce, Incorporated Method and apparatus for continuous playback or distribution of information including audio-visual streamed multimedia
SE9903223L (sv) * 1999-09-09 2001-05-08 Ericsson Telefon Ab L M Förfarande och anordning i telekommunikationssystem
AU4200600A (en) 1999-09-16 2001-04-17 Enounce, Incorporated Method and apparatus to determine and use audience affinity and aptitude
US6377931B1 (en) 1999-09-28 2002-04-23 Mindspeed Technologies Speech manipulation for continuous speech playback over a packet network
US6718309B1 (en) * 2000-07-26 2004-04-06 Ssi Corporation Continuously variable time scale modification of digital audio signals
US7299182B2 (en) * 2002-05-09 2007-11-20 Thomson Licensing Text-to-speech (TTS) for hand-held devices
US7426470B2 (en) * 2002-10-03 2008-09-16 Ntt Docomo, Inc. Energy-based nonuniform time-scale modification of audio signals
US7426221B1 (en) 2003-02-04 2008-09-16 Cisco Technology, Inc. Pitch invariant synchronization of audio playout rates
US6999922B2 (en) * 2003-06-27 2006-02-14 Motorola, Inc. Synchronization and overlap method and system for single buffer speech compression and expansion
US8340972B2 (en) * 2003-06-27 2012-12-25 Motorola Mobility Llc Psychoacoustic method and system to impose a preferred talking rate through auditory feedback rate adjustment
US8032360B2 (en) * 2004-05-13 2011-10-04 Broadcom Corporation System and method for high-quality variable speed playback of audio-visual media
US7710982B2 (en) * 2004-05-26 2010-05-04 Nippon Telegraph And Telephone Corporation Sound packet reproducing method, sound packet reproducing apparatus, sound packet reproducing program, and recording medium
JP4096915B2 (ja) * 2004-06-01 2008-06-04 株式会社日立製作所 デジタル情報再生装置及び方法
US20060075347A1 (en) * 2004-10-05 2006-04-06 Rehm Peter H Computerized notetaking system and method
US7676362B2 (en) * 2004-12-31 2010-03-09 Motorola, Inc. Method and apparatus for enhancing loudness of a speech signal
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
JP4940888B2 (ja) * 2006-10-23 2012-05-30 ソニー株式会社 オーディオ信号伸張圧縮装置及び方法
WO2009025142A1 (ja) * 2007-08-22 2009-02-26 Nec Corporation 話者速度変換システムおよびその方法ならびに速度変換装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4022974A (en) * 1976-06-03 1977-05-10 Bell Telephone Laboratories, Incorporated Adaptive linear prediction speech synthesizer
US4631746A (en) * 1983-02-14 1986-12-23 Wang Laboratories, Inc. Compression and expansion of digitized voice signals
US4935963A (en) * 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
US4852168A (en) * 1986-11-18 1989-07-25 Sprague Richard P Compression of stored waveforms for artificial speech
JP2884163B2 (ja) * 1987-02-20 1999-04-19 富士通株式会社 符号化伝送装置
IL84902A (en) * 1987-12-21 1991-12-15 D S P Group Israel Ltd Digital autocorrelation system for detecting speech in noisy audio signal
US4991213A (en) * 1988-05-26 1991-02-05 Pacific Communication Sciences, Inc. Speech specific adaptive transform coder
FR2636163B1 (fr) * 1988-09-02 1991-07-05 Hamon Christian Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde
DE69024919T2 (de) * 1989-10-06 1996-10-17 Matsushita Electric Ind Co Ltd Einrichtung und Methode zur Veränderung von Sprechgeschwindigkeit
US5175769A (en) * 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals
DE69228211T2 (de) * 1991-08-09 1999-07-08 Koninkl Philips Electronics Nv Verfahren und Apparat zur Handhabung von Höhe und Dauer eines physikalischen Audiosignals
FR2692070B1 (fr) * 1992-06-05 1996-10-25 Thomson Csf Procede et dispositif de synthese vocale a vitesse variable.
US5386493A (en) * 1992-09-25 1995-01-31 Apple Computer, Inc. Apparatus and method for playing back audio at faster or slower rates without pitch distortion
US5717823A (en) * 1994-04-14 1998-02-10 Lucent Technologies Inc. Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders

Also Published As

Publication number Publication date
DE69521405T2 (de) 2002-05-02
EP0726560A3 (en) 1998-01-07
DE69521405D1 (de) 2001-07-26
EP0726560A2 (en) 1996-08-14
EP0726560B1 (en) 2001-06-20
US5694521A (en) 1997-12-02

Similar Documents

Publication Publication Date Title
JPH08251030A (ja) 高速および低速再生能力を与えるためのシステム、記憶および検索システム、ならびに高速および低速再生能力を与えるための方法
EP1086451B1 (en) Method for performing frame erasure concealment
US7117156B1 (en) Method and apparatus for performing packet loss or frame erasure concealment
US7047190B1 (en) Method and apparatus for performing packet loss or frame erasure concealment
KR100882771B1 (ko) 부호화 음향 신호를 지각적으로 개선 강화시키는 방법 및장치
US20070055498A1 (en) Method and apparatus for performing packet loss or frame erasure concealment
KR20090119936A (ko) 잔여분 변경에 의한 보코더 내부의 프레임들을 시간 와핑하는 시스템 및 방법
KR20030009515A (ko) 결정된 신호 타입들로 한정된 기술들을 사용하는 신호들의시간 스케일 변경
US7869993B2 (en) Method and a device for source coding
JPH07129195A (ja) 音声復号化装置
US6973425B1 (en) Method and apparatus for performing packet loss or Frame Erasure Concealment
JP3063668B2 (ja) 音声符号化装置及び復号装置
US6961697B1 (en) Method and apparatus for performing packet loss or frame erasure concealment
US5668924A (en) Digital sound recording and reproduction device using a coding technique to compress data for reduction of memory requirements
KR20170003596A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
US5799271A (en) Method for reducing pitch search time for vocoder
JP2001147700A (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
KR100304137B1 (ko) 음성압축/신장방법및시스템
JP3285472B2 (ja) 音声復号化装置および音声復号化方法
JPH10124097A (ja) 音声記録再生装置
JPS62100027A (ja) 音声符号化方式

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030304