JP4785328B2 - オーディオ速度変換を可能にするシステムおよび方法 - Google Patents

オーディオ速度変換を可能にするシステムおよび方法 Download PDF

Info

Publication number
JP4785328B2
JP4785328B2 JP2002518091A JP2002518091A JP4785328B2 JP 4785328 B2 JP4785328 B2 JP 4785328B2 JP 2002518091 A JP2002518091 A JP 2002518091A JP 2002518091 A JP2002518091 A JP 2002518091A JP 4785328 B2 JP4785328 B2 JP 4785328B2
Authority
JP
Japan
Prior art keywords
signal
audio signal
rate
speed
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002518091A
Other languages
English (en)
Other versions
JP2004506241A5 (ja
JP2004506241A (ja
Inventor
メゲイド,マグデイ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2004506241A publication Critical patent/JP2004506241A/ja
Publication of JP2004506241A5 publication Critical patent/JP2004506241A5/ja
Application granted granted Critical
Publication of JP4785328B2 publication Critical patent/JP4785328B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • G10L21/043Time compression or expansion by changing speed
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Television Receiver Circuits (AREA)
  • Television Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

【0001】
(背景)
発明の分野
本発明は、一般に、オーディオ速度変換(audio speed conversion)に関し、より詳細には、音声速度変換などのオーディオ速度変換を可能にする方法およびシステムに関する。
【0002】
背景情報
カラー・テレビジョン(CTV)システム、ビデオ・テープ・レコーダ(VTR)、ディジタル・ビデオ/多用途ディスク(DVD)システム、コンパクト・ディスク(CD)プレーヤ、補聴器、留守番電話などのビデオ/オーディオ再生システムでは、速度変換システムを使用して、複数の(再生)速度の動作(例えば高速、低速など)を可能にすることができる。従来のオーディオ速度変換器は一般に、オーディオ信号中の無音区間(silence interval)と有音区間(sound interval)を区別する。無音区間を削除して有音区間を圧縮すると、オーディオ速度が上がる。逆に、無音区間および有音区間を伸張すると、オーディオ速度が下がる。
【0003】
或る種の応用例では、出力オーディオ信号を一定の速度レートで生成される出力ビデオ信号と同期させなければならないことがある。このような場合、出力オーディオ信号の速度を制御する必要があるが、これは、入力オーディオ信号中の冗長度が分らないため困難であることが多い。従来のオーディオ速度変換器は、入力オーディオ信号を固定長のフレームに分割し、各フレームを所定の持続時間に圧縮することにより、この問題に対処している。例えば、オーディオ出力速度が通常速度の2倍(即ち、2×)に設定された場合、変換器は、各フレームを元の持続時間の半分に圧縮する。各フレームは、異なるオーディオ内容を表すので、フレームによっては、適切な信号圧縮に十分な無音区間および冗長区間を有さない場合もある。このような場合、変換器は、所望のオーディオ速度に達するように1つまたは複数のフレームの一部を削除する。その結果、出力オーディオ信号は、ほぼ一定に維持され、各フレームの最後で調整することができる。図1に、このタイプの従来の速度制御をグラフ(graph:図表)で示す。
【0004】
図1で、グラフ60は、時間の経過に伴うビデオ速度(即ち、破線で示す)とオーディオ速度(即ち、実線で示す)との例示的な関係を示す。図1に示すように、1つまたは複数のオーディオ・フレームの一部を削除することにより、ビデオ速度とオーディオ速度の同期が達成される。従って、実際の同期は各フレームの最後に行われるだけであり、フレーム期間の残りの間は同期が行われるとは限らない。この従来タイプの速度制御では、出力オーディオ信号の一部が聞き手にとって理解不能なことがあるので、しばしば不満足な結果をもたらす。従って、これらのタイプの従来のオーディオ速度変換器は、ビデオ・テープ・レコーダ(VTR)における早送り操作など、限られた用途でしか使用できない。
【0005】
従来技術における以上の問題に鑑みて、改良されたオーディオ速度変換器が必要であることが理解される。具体的には、関連情報を失うことなくオーディオ速度変化に対応するオーディオ速度変換器を提供することが望ましい。さらに、このようなオーディオ速度変換器は、ビデオ・システムで使用して出力オーディオ信号と出力ビデオ信号とのよりよい同期を実現するのに適したものであることが一層望ましい。本発明は、これらの問題および他の問題に対処することを意図したものである。
【0006】
(概要)
本発明の一態様によれば、オーディオ信号を処理するためのシステムは、オーディオ信号を第1の速度レートで受け取って、受け取ったオーディオ信号を複数の制御信号に従って処理するための第1の処理手段を具える。各制御信号は、異なる基準パラメータのレベルを表す。第1の処理手段は、処理に従って、受け取ったオーディオ信号の出力を第2の速度レートで生成する。比較器手段が、第2の速度レートを必要速度レートと比較し、比較に従って比較信号を生成する。第2の処理手段が、比較信号に従って制御信号を生成する。
【0007】
本発明の別の態様によれば、オーディオ信号を処理する方法は、オーディオ信号を第1の速度レートで受け取ることを含む。それぞれが異なる基準パラメータのレベルを表す複数の制御信号に従って、受け取ったオーディオ信号を処理する。処理に従って、受け取ったオーディオ信号を第2の速度レートで出力する。第2の速度レートを必要速度レートと比較し、比較に従って比較信号を生成する。この比較信号に従って制御信号を生成する。
【0008】
本明細書に述べる例示は、本発明の好ましい実施形態を示すものであり、このような例示は、本発明の特許請求の範囲を任意の形態において限定して解釈すべきではない。
【0009】
(好ましい実施形態の説明)
本出願は、関連情報を失うことなくオーディオ速度変化を実現するオーディオ信号処理のためのシステムおよび方法であって、ビデオ・システムで使用して出力オーディオ信号と出力ビデオ信号とのよりよい同期を実現するのに適したシステムおよび方法を開示する。例示的な一実施形態によれば、本システムは、オーディオ信号を第1の速度レートで受け取って、受け取ったオーディオ信号を複数の制御信号に従って処理するための第1の処理手段を具える。各制御信号は、異なる基準パラメータのレベルを表す。第1の処理手段は、処理に従って、受け取ったオーディオ信号の出力を第2の速度レートで生成する。例示的な一実施形態によれば、第1の処理手段は、受け取ったオーディオ信号を圧縮することと伸張することの一方によって、受け取ったオーディオ信号を処理する。比較器手段が、第2の速度レートを必要速度レートと比較し、比較に従って比較信号を生成する。第2の処理手段が、比較信号に従って制御信号を生成する。例示的な一実施形態によれば、制御信号によって表される基準パラメータのうちの1つは、平均電力(average power)である。本システムはまた、必要速度レートをユーザが入力できるようにする入力手段、および/または、ビデオ信号を前記第2の速度レートと同期させることによってビデオ信号を処理する手段を具えてもよい。本明細書には、以上のシステムによって実施される方法も開示される。
【0010】
次に図面、より具体的には図2を参照すると、本発明の原理によって構成されるオーディオ速度変換器10が示されている。図2で、オーディオ速度変換器10は、パラメータ依存プロセッサ11(parameter‐dependent processor)など第1の処理手段を具える。パラメータ依存プロセッサ11は、音声信号などの入力オーディオ信号を第1の速度レート(SIN)で受け取る。パラメータ依存プロセッサ11は、受け取ったオーディオ信号を複数の制御信号に従って圧縮または伸張することにより、受け取ったオーディオ信号を処理し、それにより第2の速度レート(SOUT)の出力オーディオ信号を生成する。好ましい実施形態によれば、各制御信号は、それぞれ異なる基準パラメータ(PREF1、PREF2、PREF3、...PREFN)のレベルを表す。
【0011】
速度レート比較器12などの比較手段が、パラメータ依存プロセッサ11から出力オーディオ信号を受け取り、その速度を検出する。ユーザ・インタフェース13などの入力手段が、指定のまたは必要な速度レート(m)をユーザが入力できるようにすることにより、速度制御などの様々な機能を可能にする。速度レート比較器12は、検出した出力オーディオ信号の速度(SOUT)を必要速度レート(m)と比較し、その結果に基づいて比較信号を生成する。
【0012】
パラメータ・プロセッサ14など第2の処理手段が、速度レート比較器12から比較信号を受け取る。パラメータ・プロセッサ14は、受け取った比較信号に従って制御信号を生成する。各制御信号は、異なる基準パラメータのレベル(PREF1、PREF2、PREF3、...PREFN)を表す。各制御信号は、パラメータ依存プロセッサ11の信号圧縮および伸張の動作を制御するためにパラメータ依存プロセッサ11に同時に入力される。本明細書でさらに説明するが、入力オーディオ信号の内容に基づいてオーディオ速度を適応制御するためには、閉ループ設計のオーディオ速度変換器10が有用である。オーディオ速度変換器10はまた、図3に示すように、オーディオ再生機能とビデオ再生機能の両方を有するシステムに組み込むこともできる。
【0013】
図3を参照すると、本発明の原理によって構成されるオーディオ速度変換器10を具える例示的なシステム100が示されている。図3で、システム100は、図2に示したオーディオ速度変換器10およびビデオ速度変換器20を具えるオーディオ/ビデオ・システムである。図3のシステム100内では、出力ビデオ信号が出力オーディオ信号と同じ速度を呈することが望ましい。従って、ビデオ速度変換器20は、最適なビデオ同期のために、出力オーディオ信号の瞬間速度に関する情報を用いて出力ビデオ信号の速度を制御する。一実施形態によれば、この情報は、図3に示すようにパラメータ依存プロセッサ11の出力を介してビデオ速度変換器20にディジタル・データとして生成される。このようにして、オーディオ速度変換器10は「マスタ(master)」として動作し、ビデオ速度変換器20は「スレーブ(slave)」として動作する。
【0014】
次に、図2〜図6を参照しながら、本発明の原理に従って構成されるオーディオ速度変換器10の動作に関する詳細について述べる。
【0015】
先に示したように、図2および図3では、オーディオ速度変換器10のパラメータ依存プロセッサ11が、入力オーディオ信号を第1の速度レート(SIN)で受け取る。パラメータ依存プロセッサ11は、受け取ったオーディオ信号を複数の制御信号に従って圧縮または伸張することにより、受け取ったオーディオ信号を処理する。各制御信号は、異なる基準パラメータ(PREF1、PREF2、PREF3、...PREFN)のレベルを表す。パラメータ依存プロセッサ11により実施される処理は、第2の速度レート(SOUT)の出力オーディオ信号を生成する。具体的には、受け取ったオーディオ信号を圧縮することは、出力オーディオ信号の速度を上げるように機能する。逆に、受け取ったオーディオ信号を伸張することは、出力オーディオ信号の速度を下げるように機能する。
【0016】
速度レート比較器12が、出力オーディオ信号を受け取り、その速度を検出する。即ち、速度レート比較器12は、第2の速度レート(SOUT)を検出する。速度レート比較器12はまた、ユーザ・インタフェース13から、必要速度レート(m)を表す入力信号も受け取る。ユーザ・インタフェース13は、キーパッドやリモート・コントロール(リモコン)など、指定のまたは必要な速度レート(m)をユーザが入力できるようにする任意のタイプの入力手段とすることができる。速度レート比較器12は、検出した出力オーディオ信号の速度(SOUT)を必要速度レート(m)と比較し、その結果に基づいて比較信号を生成する。例示的な一実施形態によれば、速度レート比較器12は、必要速度レート(m)にまだ達していないことを示すためには、比較信号を2進ロー(low:低)信号として生成する。逆に、必要速度レート(m)を超えたことを示すためには、比較信号を2進ハイ(high:高)信号として生成する。
【0017】
パラメータ・プロセッサ14が、速度レート比較器12から比較信号を受け取り、受け取った比較信号に従って制御信号を生成する。各制御信号は、異なる基準パラメータ(PREF1、PREF2、PREF3、...PREFN)のレベルを表す。各制御信号は、パラメータ依存プロセッサ11の信号圧縮および伸張の動作を制御するためにパラメータ依存プロセッサ11に同時に入力される。例示的な一実施形態によれば、各基準パラメータ(PREF1、PREF2、PREF3、...PREFN)は、オーディオ信号の異なる独立したパラメータを表す。例えば、第1の基準パラメータPREF1は、受け取ったオーディオ信号の平均電力を表すものとすることができる。第2の基準パラメータPREF2は、例えば、受け取ったオーディオ信号の連続する2つのピッチ期間(pitch period)の類似度を表すものとすることができる。第3の基準パラメータPREF3は、例えば、受け取ったオーディオ信号の連続する2つのピッチ期間に含まれるサイクル数の差を表すものとすることができる。当然、本発明の原理により他のパラメータを使用することもできる。
【0018】
平均電力(average power)は、有効な入力信号とノイズ信号とを区別するのに特に有用なパラメータである。有効な入力信号とノイズ信号とを区別するためのしきい値は、基準パラメータPREFのレベルによって一般に定義することができる。次に、図4を参照しながら、例示的な基準パラメータPREFに関する詳細について述べる。
【0019】
図4を参照すると、例示的な入力オーディオ信号のパラメータ・レベルを示すグラフ30が示されている。例として、図4に示すパラメータ・レベルは、例示的な入力オーディオ信号の平均電力レベルに対応する。図4で、平均パラメータ・レベルPAVERAGEは、時間の経過に伴って、基準パラメータPREFのレベルの上下に変動する。平均パラメータ・レベルPAVERAGEおよび基準パラメータPREFは、ディジタル値で表すことができる。平均パラメータ・レベルPAVERAGEが基準パラメータPREFよりも高い場合は、対応する信号は有効なオーディオ信号と見なされる。そうでない場合は、信号はノイズ信号と見なされ、従って削除されることがある。
【0020】
図4に示すように、特定の基準パラメータPREFのレベルが過度に高く設定された場合(即ち、点線)、ノイズ信号と見做される入力オーディオ信号部分が増加することになり、最終的には削除されることになる。あるいは、基準パラメータPREFのレベルが過度に低く設定された場合(即ち、破線)、効果的なノイズ検出がより困難になる。実際、所定の基準パラメータPREFのレベルは任意だが、最終的に出力オーディオ信号の品質に影響を及ぼすので、設計上の選択に従って注意深く選択すべきである。所定の基準パラメータPREFの適当なレベルは、狭い許容範囲内で、出力オーディオ信号の品質を劣化させることなく存在し得ることが理解される。所定の基準パラメータPREFに対するこの許容範囲の例を、図4の陰影(斜線)付きの領域で表す。
【0021】
図5を参照すると、出力オーディオ品質(即ち、聞き手における分かり易さ)と基準パラメータPREFのレベルとの例示的な関係を示すグラフ40が示されている。図5に示すように、基準パラメータPREFについての許容範囲を超えると、有効なオーディオ信号が失われるので、出力オーディオ信号の品質が劇的に悪化する恐れがある。各基準パラメータPREFのレベルはまた圧縮レートにも影響を及ぼし、最終的にはオーディオ出力速度に影響を及ぼすことに注目することは重要である。例えば、所定の時間区分の間、高いしきい値の基準パラメータPREFを使用するオーディオ速度変換器は、より低いしきい値の基準パラメータPREFを使用するオーディオ速度変換器よりも多くのノイズを削除する。先に示したように、本発明は、異なる独立した複数の基準パラメータ(PREF1、PREF2、PREF3、...PREFN)を使用して、オーディオ(即ち、音)の冗長度を検出するために使用する。
【0022】
再び図2および図3を参照するが、パラメータ・プロセッサ14は、速度レート比較器12によって生成される比較信号に応答して、制御信号を生成する。各制御信号は、異なる複数の基準パラメータ(PREF1、PREF2、PREF3、...PREFN)のうちの1つのレベルを表す。例示的な一実施形態によれば、パラメータ・プロセッサ14は、それぞれは別個のディジタル値で表される異なる「N」個の基準パラメータ(PREF1、PREF2、PREF3、...PREFN)を利用する。基準パラメータの数「N」は、設計上の選択の問題として選択可能である。実際、異なる基準パラメータ(PREF1、PREF 、PREF3、...PREFN)それぞれについての分解能は同じである必要はない。例えば、第1の基準パラメータPREF1のレベルは8ビットのディジタル値で表すことができ、第2の基準パラメータPREF2のレベルは14ビットのディジタル値で表すことができる。
【0023】
パラメータ・プロセッサ14は、速度レート比較器12によって生成された比較信号に従って個々の基準パラメータ(PREF1、PREF2、PREF3、...PREFN)それぞれのレベルを変動させるために、制御信号を生成する。即ち、パラメータ・プロセッサ14は、比較信号に従って各基準パラメータ(PREF1、PREF2、PREF3、...PREFN)のレベルを変動させて、必要速度レート(m)に達するようにする。例えば、必要速度レート(m)に達するように、パラメータ・プロセッサ14は、第1の基準パラメータPREF1が(PREF1+/−ΔPREF1)になり、第2の基準パラメータPREF2が(PREF2+/−ΔPREF2)になり、第3の基準パラメータPREF3が(PREF3+/−ΔPREF3)になり、第Nの基準パラメータPREFNが(PREFN+/−ΔPREFN)になるように、制御信号を生成することができる。オーディオ速度の上昇は必ずしも基準パラメータの増加を必要とするわけではなく、その逆もまた言えるので、前記の例では「+/−」が必要である。また、図2および図3では、パラメータ・プロセッサ14が各基準パラメータ(PREF1、PREF2、PREF3、...PREFN)毎に別々の出力線を有するものとして示してあるが、実際には、制御信号をシリアル送信することによって、このような出力線の数を削減することも可能であることに留意されたい。
【0024】
例として、図2および図3で、オーディオ速度変換器10がどんな速度調整もなしに通常動作を行っている(即ち、m=1)と仮定する。この状態で、ユーザがユーザ・インタフェース13を介して2に等しい必要速度レート(m)(即ち、通常速度の2倍)を入力した場合、オーディオ速度変換器10は、出力オーディオ信号の速度(SOUT)を必要速度レート(m)に上げるように動作する。
【0025】
所望の速度変化を実現するために、速度レート比較器12が、ユーザ・インタフェース13からユーザ入力を受け取り、出力オーディオ信号の速度(SOUT)が2に等しい必要速度レート(m)にまだ達していないことを最初に検出する。従って、速度レート比較器12は、必要速度レート(m)にまだ達していないことを示すために、比較信号を2進ロー信号として生成する。パラメータ・プロセッサ14は、2進ロー状態の比較信号を受け取り、これに応答して、必要速度レート(m)にまだ達していないことを示すための制御信号を生成する。即ち、パラメータ・プロセッサ14は、必要速度レート(m)に合う基準パラメータ(PREF1、PREF2、PREF3、...PREFN)のレベルを変動させるための制御信号を生成する。制御信号は、パラメータ依存プロセッサ11が信号圧縮レートを上げることにより出力オーディオ信号の速度(SOUT)を上げるようにする。
【0026】
速度レート比較器12は、速くなった出力オーディオ信号の速度(SOUT)を検出し、検出した出力オーディオ信号の速度(SOUT)が必要速度レート(m)よりも低い間は、比較信号を2進ロー信号として生成し続ける。同様にして、パラメータ・プロセッサ14も、必要速度レート(m)に合う基準パラメータ(PREF1、PREF2、PREF3、...PREFN)のレベルを変動させるための制御信号を生成し続ける。これにより、パラメータ依存プロセッサ11は、信号圧縮レートを上げることによって出力オーディオ信号の速度(SOUT)をさらに上げる。必要速度レート(m)を超えたことを速度レート比較器12が検出し、2進ハイ状態の比較信号を生成するまで、このプロセスが継続する。
【0027】
必要速度レート(m)を超えると、パラメータ・プロセッサ14は再び、必要速度レート(m)に合う基準パラメータ(PREF1、PREF2、PREF3、...PREFN)のレベルを変動させるための制御信号を生成する。このように、パラメータ依存プロセッサ11は、信号圧縮レートを下げることによって出力オーディオ信号の速度(SOUT)を下げる。基準パラメータ(PREF1、PREF2、PREF3、...PREFN)のレベルを反復的に変動させるこのループ・ベースのプロセスが継続して、出力オーディオ信号の速度(SOUT)が必要速度レート(m)にロックされる。必要速度レート(m)が1未満である場合は、オーディオ速度変換器10は、同様だが逆の方式で動作する。
【0028】
前述のようにして、パラメータ依存プロセッサ11、速度レート比較器12、およびパラメータ・プロセッサ14は、閉ループ・システムとして動作して、入力オーディオ信号の内容に基づいてオーディオ速度を適応制御する。さらに、この速度制御方法は、図3に示したように、オーディオ再生機能とビデオ再生機能の両方を有するシステムに組み込むこともできる。図6に、本発明の原理によって構成された閉ループ速度制御システムの利点を見ることができる。
【0029】
図6を参照すると、開ループ・システムと閉ループ・システムとの例示的な比較を示すグラフ50が示されている。図6に示すように、開ループ・システム(即ち、実線)は、時間と共に速度変動する出力オーディオ信号を生成する。このタイプの速度変動は、聞き手をいらいらさせる傾向がある。逆に、本発明の原理によって構成されたものなどの閉ループ・システム(即ち、破線)は、有利なことに、比較的一定の速度レートの出力オーディオ信号を生成する。本発明の原理によって構成されたシステムは、向上した機能をオーディオ・ビデオ製品にもたらす。例えば、本発明によれば、ユーザは、オーディオ・セグメントとビデオ・セグメントがうまく同期するようにしながら、オーディオおよびビデオの速度を上げて映画をその元の持続時間の70%で見ることにより、時間を節約することができる。さらに、ユーザは、留守番電話メッセージをその元の持続時間の60%で再生することにより時間を節約することができる。さらに、オーディオ信号を記録する前に圧縮することにより、効率的な記憶がより実現可能になるので、製造コストが削減される。
【0030】
好ましい設計を有するものとして本発明を述べたが、本発明は、本開示の趣旨および範囲の内でさらに変更することができる。従って、本出願は、本発明の一般原理を用いる本発明の任意の変形例、用法、適合もカバーするものである。さらに本出願は、本発明が関する技術分野における周知のまたは慣例の実施に含まれ、且つ特許請求の範囲内に含まれる、本開示からの逸脱もカバーするものとする。
【図面の簡単な説明】
【図1】 従来の速度制御方法による、ビデオ速度とオーディオ速度との例示的な関係を示すグラフである。
【図2】 本発明の原理によって構成されたオーディオ速度変換器のブロック図である。
【図3】 本発明の原理によって構成されたオーディオ速度変換器を具える例示的なシステムのブロック図である。
【図4】 例示的な入力オーディオ信号の基準パラメータ・レベルを示すグラフである。
【図5】 出力オーディオ品質と基準パラメータPREFとの例示的な関係を示すグラフである。
【図6】 開ループ・システムと閉ループ・システムとの例示的な比較を示すグラフである。

Claims (15)

  1. オーディオ信号を処理するシステムであって、
    前記オーディオ信号を第1の速度レートで受信し、前記受信したオーディオ信号を、それぞれが異なる基準パラメータレベルを表す複数の制御信号に従って処理し、前記処理に従って、前記受信したオーディオ信号の出力を第2の速度レート生成する第1の処理手段と、
    前記第2の速度レート必要速度レート比較し、前記比較に従って比較信号を生成する比較器手段
    前記比較信号に従って前記制御信号を生成する第2の処理手段と、
    を具える、前記システム。
  2. 前記制御信号で表される前記基準パラメータ1つが平均電力である、請求項1に記載のシステム。
  3. 前記必要速度レート、ユーザが入力できるようにする入力手段(13)をさらに具える、請求項1に記載のシステム。
  4. ビデオ信号を前記第2の速度レート同期させることによって前記ビデオ信号を処理する手段さらに具える、請求項1に記載のシステム。
  5. 前記第1の処理手段、前記受信したオーディオ信号を圧縮することと伸張することの一方によって、前記受信したオーディオ信号を処理する、請求項1に記載のシステム。
  6. オーディオ信号を処理するシステムであって、
    前記オーディオ信号を第1の速度レートで受信し、前記受信したオーディオ信号を、それぞれが異なる基準パラメータレベルを表す複数の制御信号に従って処理し、前記処理に従って、前記受信したオーディオ信号の出力を第2の速度レート生成する第1のプロセッサ
    前記第2の速度レート必要速度レート比較し、前記比較に従って比較信号を生成する速度レート比較器
    前記比較信号に従って前記制御信号を生成する第2のプロセッサ
    を具える、前記システム。
  7. 前記制御信号で表される前記基準パラメータ1つが平均電力である、請求項6に記載のシステム。
  8. 前記必要速度レートを、ユーザが入力できるようにするユーザ・インタフェースさらに具える、請求項6に記載のシステム。
  9. ビデオ信号を前記第2の速度レート同期させることによって前記ビデオ信号を処理するためのビデオ信号プロセッサさらに具える、請求項6に記載のシステム。
  10. 前記第1のプロセッサ、前記受信したオーディオ信号を圧縮することと伸張することの一方によって、前記受信したオーディオ信号を処理する、請求項6に記載のシステム。
  11. オーディオ信号を処理する方法であって、
    前記オーディオ信号を第1の速度レートで受信するステップと、
    前記受信したオーディオ信号を、それぞれが異なる基準パラメータレベルを表す複数の制御信号に従って処理するステップと、
    前記処理に従って、前記受信したオーディオ信号の出力を第2の速度レート生成するステップと、
    前記第2の速度レート必要速度レート比較し、前記比較に従って比較信号を生成するステップと、
    前記比較信号に従って前記制御信号を生成するステップと
    を含む、前記方法。
  12. 前記制御信号で表される前記基準パラメータ1つが平均電力である、請求項11に記載の方法。
  13. ユーザによって入力されたレートを前記必要速度レートとするステップをさらに含む、請求項11に記載の方法。
  14. ビデオ信号を前記第2の速度レート同期させることによって前記ビデオ信号を処理するステップをさらに含む、請求項11に記載の方法。
  15. 前記受信したオーディオ信号を処理する前記ステップが、前記受信したオーディオ信号を圧縮することと伸張することの一方によって行われる、請求項11に記載の方法。
JP2002518091A 2000-08-10 2001-07-19 オーディオ速度変換を可能にするシステムおよび方法 Expired - Fee Related JP4785328B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US22445400P 2000-08-10 2000-08-10
US60/224,454 2000-08-10
PCT/IB2001/001302 WO2002013540A2 (en) 2000-08-10 2001-07-19 System and method for enabling audio speed conversion

Publications (3)

Publication Number Publication Date
JP2004506241A JP2004506241A (ja) 2004-02-26
JP2004506241A5 JP2004506241A5 (ja) 2008-09-04
JP4785328B2 true JP4785328B2 (ja) 2011-10-05

Family

ID=22840761

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002518091A Expired - Fee Related JP4785328B2 (ja) 2000-08-10 2001-07-19 オーディオ速度変換を可能にするシステムおよび方法

Country Status (9)

Country Link
US (1) US20040090555A1 (ja)
EP (1) EP1308050B1 (ja)
JP (1) JP4785328B2 (ja)
KR (1) KR100768457B1 (ja)
CN (1) CN1185628C (ja)
AU (1) AU2002229158A1 (ja)
DE (1) DE60107438T2 (ja)
MX (1) MXPA03001200A (ja)
WO (1) WO2002013540A2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7030930B2 (en) * 2001-03-06 2006-04-18 Ati Technologies, Inc. System for digitized audio stream synchronization and method thereof
US20060209210A1 (en) * 2005-03-18 2006-09-21 Ati Technologies Inc. Automatic audio and video synchronization
DE602006010246D1 (de) * 2006-01-26 2009-12-17 Infra Com Ltd Jitterarme taktrückgewinnung aus einem über ein drahtloses medium übertragenen digitalen basisband-datensignal
KR101224165B1 (ko) * 2008-01-02 2013-01-18 삼성전자주식회사 데이터 처리 모듈 제어 방법 및 장치
US10178281B2 (en) * 2014-07-28 2019-01-08 Starkey Laboratories, Inc. System and method for synchronizing audio and video signals for a listening system
US10671251B2 (en) 2017-12-22 2020-06-02 Arbordale Publishing, LLC Interactive eReader interface generation based on synchronization of textual and audial descriptors
US11443646B2 (en) 2017-12-22 2022-09-13 Fathom Technologies, LLC E-Reader interface system with audio and highlighting synchronization for digital books
CN112562719B (zh) * 2020-11-30 2024-03-19 清华珠三角研究院 合成语音与原始视频匹配方法、系统、装置及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0854895A (ja) * 1994-08-11 1996-02-27 Matsushita Electric Ind Co Ltd 再生装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3786195A (en) * 1971-08-13 1974-01-15 Dc Dt Liquidating Partnership Variable delay line signal processor for sound reproduction
FR2485839B1 (fr) * 1980-06-27 1985-09-06 Cit Alcatel Procede de detection de parole dans un signal de circuit telephonique et detecteur de parole le mettant en oeuvre
US4631746A (en) * 1983-02-14 1986-12-23 Wang Laboratories, Inc. Compression and expansion of digitized voice signals
US4803730A (en) * 1986-10-31 1989-02-07 American Telephone And Telegraph Company, At&T Bell Laboratories Fast significant sample detection for a pitch detector
US5717818A (en) * 1992-08-18 1998-02-10 Hitachi, Ltd. Audio signal storing apparatus having a function for converting speech speed
US5583652A (en) * 1994-04-28 1996-12-10 International Business Machines Corporation Synchronized, variable-speed playback of digitally recorded audio and video
US5920842A (en) * 1994-10-12 1999-07-06 Pixel Instruments Signal synchronization
US5647834A (en) * 1995-06-30 1997-07-15 Ron; Samuel Speech-based biofeedback method and system
JPH09198089A (ja) * 1996-01-19 1997-07-31 Matsushita Electric Ind Co Ltd 再生速度変換装置
US5749064A (en) * 1996-03-01 1998-05-05 Texas Instruments Incorporated Method and system for time scale modification utilizing feature vectors about zero crossing points
US5969716A (en) * 1996-08-06 1999-10-19 Interval Research Corporation Time-based media processing system
JP2955247B2 (ja) * 1997-03-14 1999-10-04 日本放送協会 話速変換方法およびその装置
US6236970B1 (en) * 1997-04-30 2001-05-22 Nippon Hoso Kyokai Adaptive speech rate conversion without extension of input data duration, using speech interval detection
US6009386A (en) * 1997-11-28 1999-12-28 Nortel Networks Corporation Speech playback speed change using wavelet coding, preferably sub-band coding
JP4098420B2 (ja) * 1998-11-04 2008-06-11 富士通株式会社 音響データ・動画データの同期再構築方法及び装置
US7010491B1 (en) * 1999-12-09 2006-03-07 Roland Corporation Method and system for waveform compression and expansion with time axis

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0854895A (ja) * 1994-08-11 1996-02-27 Matsushita Electric Ind Co Ltd 再生装置

Also Published As

Publication number Publication date
MXPA03001200A (es) 2003-06-30
US20040090555A1 (en) 2004-05-13
DE60107438T2 (de) 2005-05-25
CN1446350A (zh) 2003-10-01
KR100768457B1 (ko) 2007-10-19
EP1308050B1 (en) 2004-11-24
KR20030018071A (ko) 2003-03-04
EP1308050A2 (en) 2003-05-07
DE60107438D1 (de) 2004-12-30
JP2004506241A (ja) 2004-02-26
WO2002013540A3 (en) 2002-04-11
CN1185628C (zh) 2005-01-19
WO2002013540A2 (en) 2002-02-14
AU2002229158A1 (en) 2002-02-18

Similar Documents

Publication Publication Date Title
KR101145941B1 (ko) 음성 신호 처리 장치, 음성 신호 처리 방법
US20080262856A1 (en) Method and system for enabling audio speed conversion
JP4785328B2 (ja) オーディオ速度変換を可能にするシステムおよび方法
US7233200B2 (en) AGC circuit, AGC circuit gain control method, and program for the AGC circuit gain control method
JPH11202900A (ja) 音声データ圧縮方法及びそれを適用した音声データ圧縮システム
US7103265B2 (en) Automatic level control for changing audio mode of digital video recording apparatus
JP4311541B2 (ja) オーディオ信号圧縮装置
JP2000099097A (ja) 信号再生装置及び方法、音声信号再生装置、並びに、音声信号の速度変換方法
JP2002258900A (ja) 音声再生装置及び音声再生方法
US5600755A (en) Voice codec apparatus
JPH08147874A (ja) 話速変換装置
JP3003502B2 (ja) 利得調整装置
JP3607586B2 (ja) 音声遅延制御装置
KR100264328B1 (ko) 디지털 오디오의 페이드 아우트/인 조정장치 및 방법
JP2851772B2 (ja) 記録・再生装置
JP2010033669A (ja) 信号処理装置
JPH07123192A (ja) ファクシミリ装置
Baba et al. Development of a voice speed control system LSI
JPH05303400A (ja) 音声再生装置と音声再生方法
JP2001117589A (ja) 音声信号圧縮方法
JP2000207843A (ja) 再生装置及び再生方法
JP2002111498A (ja) デジタルアッテネータ回路
JP2002152877A (ja) オーディオ装置
JP2007042184A (ja) 圧縮音楽情報再生装置
JPH11232784A (ja) 再生装置および再生方法

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060725

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060810

A072 Dismissal of procedure [no reply to invitation to correct request for examination]

Free format text: JAPANESE INTERMEDIATE CODE: A073

Effective date: 20060926

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061115

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20080318

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080415

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080718

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080718

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090206

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090206

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110705

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110712

R150 Certificate of patent or registration of utility model

Ref document number: 4785328

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140722

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees