JPH0896514A - オーディオ信号処理装置 - Google Patents

オーディオ信号処理装置

Info

Publication number
JPH0896514A
JPH0896514A JP7178687A JP17868795A JPH0896514A JP H0896514 A JPH0896514 A JP H0896514A JP 7178687 A JP7178687 A JP 7178687A JP 17868795 A JP17868795 A JP 17868795A JP H0896514 A JPH0896514 A JP H0896514A
Authority
JP
Japan
Prior art keywords
pitch
audio
address
output
sent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7178687A
Other languages
English (en)
Inventor
Satoshi Takagi
聡 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP7178687A priority Critical patent/JPH0896514A/ja
Priority to US08/507,671 priority patent/US5717829A/en
Publication of JPH0896514A publication Critical patent/JPH0896514A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • G10L21/01Correction of time axis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H3/00Instruments in which the tones are generated by electromechanical means
    • G10H3/12Instruments in which the tones are generated by electromechanical means using mechanical resonant generators, e.g. strings or percussive instruments, the tones of which are picked up by electromechanical transducers, the electrical signals being further manipulated or amplified and subsequently converted to sound by a loudspeaker or equivalent instrument
    • G10H3/125Extracting or recognising the pitch or fundamental frequency of the picked up signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H7/00Instruments in which the tones are synthesised from a data store, e.g. computer organs
    • G10H7/02Instruments in which the tones are synthesised from a data store, e.g. computer organs in which amplitudes at successive sample points of a tone waveform are stored in one or more memories
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/066Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/541Details of musical waveform synthesis, i.e. audio waveshape processing from individual wavetable samples, independently of their origin or of the sound they represent
    • G10H2250/631Waveform resampling, i.e. sample rate conversion or sample depth conversion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

(57)【要約】 【課題】 再生速度を速くしたり遅くしたりしてオーデ
ィオ信号を再生する場合に、雑音が生じないオーディオ
信号処理装置を提供する。 【解決手段】メモリ2に記憶されたオーディオデータ
は、読み出し時にピッチ抽出部4にも送られてオーディ
オピッチが算出される。このオーディオピッチ及びパワ
ー情報はアドレス位相管理部6に送られてオーディオピ
ッチがリファインされ、メモリアドレスコントロール部
5に送られる。このメモリアドレスコントロール部5で
は送られたオーディオピッチに基づいてメモリアドレス
が算出され、このメモリアドレスによってメモリ2内の
オーディオデータが読み出される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、オーディオ信号を
再生する際の信号処理を行うオーディオ信号処理装置に
関する。
【0002】
【従来の技術】ディジタルビデオテープレコーダ(DV
TR)、ディジタルオーディオテープレコーダ及びカラ
オケ装置等において、記録媒体に記録されたオーディオ
信号を再生する際に再生音の高さ、いわゆるピッチを変
化させることなくオーディオ信号の再生速度を速くした
り遅くしたりする制御を行うことがある。この制御は、
一般的にプログラムプレイ機能と呼ばれ、オーディオ信
号の継続時間長の制御を行っている。具体的には、再生
速度が遅い場合には一定のオーディオ信号区間を繰り返
して再生を行い、再生速度が速い場合には一定のオーデ
ィオ信号区間を抜き取って再生を行うことで、記録時の
ピッチに戻している。この繰り返すオーディオ信号区間
又は抜き取るオーディオ信号区間の長さを決定する方法
としていくつかの方法が挙げられる。例えば、安価なカ
ラオケ装置等においては、固定のオーディオ信号区間長
を用いている。また、高品質な音声を必要とするオーデ
ィオ信号の継続時間長の制御を行う場合には、オーディ
オ信号の分析区間毎のオーディオ信号のピッチ、すなわ
ち音の高さに基づいて決定される区間長を用いたオーデ
ィオピッチコレクションを行うことが多い。
【0003】このオーディオピッチコレクションを行う
オーディオ信号処理装置の概略的な構成を図8に示す。
【0004】このオーディオ信号処理装置の信号入力端
子61から入力されるオーディオデータは、先ずメモリ
62に書き込まれる。この後、このメモリ62に記憶さ
れたオーディオデータが読み出されてオーディオつなぎ
処理部63に送られる際に、ピッチ抽出部64にも送ら
れる。このピッチ抽出部64では、逐次送られるオーデ
ィオデータのオーディオピッチ周期を算出する。この算
出されたオーディオピッチ周期はメモリアドレスコント
ロール部65に送られる。このメモリアドレスコントロ
ール部65では、送られるオーディオピッチ周期を元に
してメモリアドレスを算出する。この算出されたメモリ
アドレスはメモリ62に送られる。メモリ62に送られ
たメモリアドレスに従ってメモリ62に記憶されている
オーディオデータが読み出される。この読み出されたオ
ーディオデータはオーディオつなぎ処理部63に送られ
る。このオーディオつなぎ処理部63では、送られたオ
ーディオデータが不連続にならないようにつなぎ処理を
行う。このオーディオつなぎ処理部63には、多くの場
合、クロスフェードが用いられる。このつなぎ処理が施
されたオーディオデータは、信号出力端子66から出力
される。
【0005】
【発明が解決しようとする課題】ところで、図8のピッ
チ抽出部64において算出されたオーディオピッチ周期
は、オーディオ信号の継続時間長を変化させる割合に同
期した信号にはならない。従って、ピッチ抽出部64に
おいて算出されたオーディオピッチ周期単位でデータの
繰り返し又は抜き取りを行っているだけでは、メモリ6
2内の書込アドレスが読出アドレスを追い越してしまっ
たり、その逆に、読出アドレスが書込アドレスを追い越
してしまったりする状態が生じる。例えば、オーディオ
信号の継続時間長の変化率が+10%であるとき、すな
わち再生速度が10%速いときには、再生信号のピッチ
を記録時のピッチに戻すために、再生信号の時間軸を上
記変化率に基づいて伸張するとともに再生中の信号の一
部を抜き取る必要があり、1分析区間長当たりのオーデ
ィオサンプル数が1024であるならば、102.4サ
ンプルのデータの抜き取りが必要とされる。しかし、オ
ーディオピッチ周期として80サンプルが算出される場
合には、書込アドレスが読出アドレスに追いつく方向に
進むので、メモリ62内の空き領域が小さくなり、この
状態が続けば書込アドレスが読出アドレスを追い越すこ
とになる。これによって、書込アドレスと読出アドレス
との衝突が生じ、オーディオ信号の雑音が発生する。
【0006】そこで、本発明は上述の実情に鑑み、再生
速度を速くしたり遅くしたりしてオーディオ信号を再生
する場合に、雑音が生じないオーディオ信号処理装置を
提供するものである。
【0007】
【課題を解決するための手段】本発明に係るオーディオ
信号処理装置は、入力オーディオ信号を記憶する記憶手
段と、上記記憶手段からのオーディオ信号を読み出して
オーディオピッチ及びパワー情報を算出するピッチ抽出
手段と、上記ピッチ抽出手段からのオーディオピッチ及
びパワー情報を用いて、一定のピッチ分析区間における
自己相関ピークを与えるピークピッチをオーディオピッ
チとして出力するアドレス位相管理手段と、上記アドレ
ス位相管理手段からのオーディオピッチを用いて上記記
憶手段内のメモリアドレスを算出するメモリアドレス制
御手段とから成ることにより上述した課題を解決する。
【0008】また、上記ピッチ抽出手段からのパワー情
報として分析区間パワー及び自己相関ピークが出力され
ることを特徴とする。
【0009】さらに、上記アドレス位相管理手段は、上
記ピッチ抽出手段からのオーディオピッチの有効性の有
無を上記メモリアドレス制御手段からのアドレス位相情
報に基づいて検出し、この検出結果に基づいたオーディ
オピッチを出力するピッチ検出手段と、上記ピッチ検出
手段からのオーディオピッチを用いてさらに適切なオー
ディオピッチを選択するピッチ選択手段とから成ること
を特徴とする。
【0010】ここで、上記アドレス位相管理手段には、
ゼロピッチ及び固定ピッチが入力されることを特徴とす
る。
【0011】また、本発明においては、オーディオデー
タは記憶手段に一時記憶された後に、この記憶手段から
読み出されて出力される際に、ピッチ抽出手段にも送ら
れ、このピッチ抽出手段では上記送られたオーディオデ
ータのオーディオピッチを算出し、さらに、アドレス位
相管理手段では上記算出されたオーディオピッチを用い
てメモリアドレス制御手段からのアドレス位相に基づい
た適切なオーディオピッチを算出することにより、上記
記憶手段から連続的にオーディオデータを出力する。
【0012】
【発明の実施の形態】以下、本発明の好ましい実施例に
ついて、図面を参照しながら説明する。図1には、本発
明に係るオーディオ信号処理装置の概略的な構成を示
す。
【0013】信号入力端子1から入力されるオーディオ
データは、先ず、メモリ2に書き込まれる。この後、こ
のメモリ2に記憶されたオーディオデータが読み出され
てオーディオつなぎ処理部3に送られる際に、ピッチ抽
出部4にも送られる。
【0014】上記ピッチ抽出部4では、逐次送られるオ
ーディオデータのオーディオピッチを算出する。ここ
で、このピッチ抽出部4は例えば自己相関法に基づいて
動作するとすると、このピッチ抽出部4では、あるピッ
チ分析区間における自己相関関数を計算し、この自己相
関関数の最大ピークを与える相関ラグをオーディオピッ
チとして出力するものである。
【0015】また、上記アドレス位相管理部6は、後述
するように上記ピッチ抽出部4からのオーディオピッチ
及びパワー情報が送られ、このオーディオピッチ及びパ
ワー情報と、上記メモリ2内の読出アドレス及び書込ア
ドレスとの相対位置の差分データとに基づいてオーディ
オピッチをリファインし、このオーディオピッチをメモ
リアドレスコントロール部5に送る。このメモリアドレ
スコントロール部5では、後述するように、リファイン
されたオーディオピッチを元にしてメモリアドレスを算
出する。この算出されたメモリアドレスは、メモリ2に
送られる。メモリ2に記憶されているオーディオデータ
が、メモリ2に送られたメモリアドレスに従って読み出
される。この読み出されたオーディオデータは、オーデ
ィオつなぎ処理部3に送られる。このオーディオつなぎ
処理部3では、メモリ2からのオーディオデータが不連
続にならないようにつなぎ処理を行う。つなぎ処理が施
されたオーディオデータは、信号出力端子7から出力さ
れる。
【0016】ところで、上記ピッチ抽出部4におけるオ
ーディオピッチの分析は、所定の分析区間、例えば10
24サンプル毎に行われる。このピッチ抽出部4はこの
分析区間内でオーディオデータの自己相関関数を求め、
その分析区間内のパワー(以下単に分析区間パワーとい
う)、自己相関の最大ピーク値(以下単に自己相関ピー
クという)及び最大ピーク値を与える相関ラグすなわち
ピークピッチを出力する。
【0017】ここで、図2のAは、上記所定の分析区間
例えば1024サンプル毎にてサンプリングされたサン
プル数nと各サンプル毎の振幅X(n)との関係を示す
曲線の一例として曲線101を示す。
【0018】また、図2のBは、以下の(1)式に従っ
て、曲線101をサンプル軸側に僅かの所定量ずつずら
して得られる曲線と曲線101とを掛け合わせて得られ
る自己相関関数において、相関ラグまたはずらし量kと
各ずらし量毎の強度R(k)との関係を表す自己相関曲
線の一例として曲線102を示す。
【0019】
【数1】
【0020】図2のBにおいて、上記分析区間パワーは
曲線102におけるk=0での強度R(0)の値であり
Pで表される。上記自己相関ピークは、k軸方向に周期
的に現れるピークの内、例えばエリア103内に示され
る強度R(k)が最大値Rmax(kmax)をとるピークで
表される。また、上記ピークピッチは、k=0からk=
max までの区間104で表される。
【0021】ところが、このピッチ抽出部4で算出され
たオーディオピッチは、継続時間長の変化の比に同期し
たものにはならない。そのため、自己相関法により求め
られたオーディオピッチ単位でデータの抜き取り及び繰
り返しを行っているだけでは上記メモリ2内の書込アド
レスが読出アドレスを追い越してしまったり、その逆の
状態が生じる。
【0022】例えば、継続時間長でのオーディオピッチ
周期の変化率が+10%である場合、読み出す際に1分
析区間(1024サンプル)あたり102.4サンプル
のデータを抜き取ることで上記変化率によるずれが補償
される。ここで、例えばオーディオピッチ周期として8
0サンプルが算出された場合、上記書込アドレスが上記
読出アドレスに追いつく方向に進み、その結果メモリ内
のアドレス余裕すなわち容量的余裕が小さくなる。この
まま放置しておくと、上記書込アドレスが上記読出アド
レスを追い越す虞がある。
【0023】また、上記メモリ2は先頭番地を最終番地
に接続してループ構造を有するものであり、これを模式
的に表したものを図3に示す。
【0024】ここで、図3に示すようなメモリ2におい
て、上記書込アドレスで示される書込ポインタwが、上
記読出アドレスで示される読出ポインタrを追い越した
り、または、上記読出ポインタrが上記書込ポインタを
追い越したりする。なお、ここでは、上記書込ポインタ
w及び読出ポインタrは、所定の速度で時計回りに移動
する。
【0025】従って、このような状態が生じないよう
に、アドレス位相管理部6によって、後述するように、
読出アドレス及び書込アドレスの位相を管理する。この
アドレス位相管理部6におけるアドレス位相管理は、実
際にはメモリ2内の読出アドレス及び書込アドレスの位
相情報を元に、上記ピッチ抽出部4から出力されるオー
ディオピッチのリファインを行うことによって実現され
る。
【0026】具体的には、メモリアドレスコントロール
部5から出力される読出アドレス及び書込アドレスに基
づいて、メモリ2内部でのオーディオデータの書き込み
及び読み出しが制御されるのであるが、さらに、メモリ
アドレスコントロール部5は、上記アドレス位相管理部
6から送られるリファインされたオーディオピッチに基
づいて上記読出アドレス及び書込アドレスが制御され
る。
【0027】また、メモリ2における上記読出ポインタ
rと上記書込ポインタwとによる制御は、上記オーディ
オピッチに基づいた制御に応じて所定時間だけ遅延され
た後にオーディオデータの抜き取り及び繰り返しに反映
されることによって、読出アドレスと書込アドレスとの
衝突が生じないようにする。すなわち、オーディオデー
タの抜き出し及び繰り返しの頻度を制御している。
【0028】次に、上記アドレス位相管理部6の具体的
な構成を図4に示す。
【0029】このアドレス位相管理部には、上記ピッチ
抽出部4から送られる上記分析区間パワーP、ピークピ
ッチの値(kmax )及び自己相関ピーク値Rmax
(kmax)が、それぞれ信号入力端子12、15、16
から入力される。また、メモリアドレスコントロール部
5から送られるメモリ2の読出アドレスと書込アドレス
との差分情報としてのアドレス位相(w−r)が信号入
力端子11から入力される。上記アドレス位相(w−
r)、分析区間パワーP、ピークピッチ(kmax )及び
自己相関ピーク値Rmax(kmax)はピッチ検出回路17
に送られる。なお、上記アドレス位相(w−r)は、上
記書込ポインタwと上記読出ポインタrとの位置の差分
データであり、2乃至3ビット程度のデジタルにエンコ
ードしたデータである。
【0030】ここで、図5に上記アドレス位相(w−
r)を模式的に表した図を示す。
【0031】図5のAは、上記アドレス位相(w−r)
を帯形状のブロックで模式的に表したものであり、(w
−r)を示すブロックは位相値A1 、A2 、A3 で境界
が引かれ、4つのブロック、第1ブロックa1 、第2ブ
ロックa2 、第3ブロックa 3 及び第4ブロックTに分
けられている。また、第4ブロックTは、メモリの容量
に応じて変化する部分である。
【0032】このピッチ検出回路17では、上記ピッチ
抽出部4から送られるオーディオピッチの有効性を判別
する。
【0033】具体的には、ピークピッチ(kmax )に対
応する自己相関ピーク値Rmax(km ax)と分析区間パワ
ーPとを比較し、自己相関ピーク値Rmax(kmax)のほ
うが大きければピッチ性が高く、有効なオーディオピッ
チであると判別する。このとき、アドレス位相(w−
r)の状態によって、例えば図2のBに示すように、自
己相関ピーク値Rmax(kmax)を分析区間パワーPを1
/2、1/4、1/8にしたものすなわちP/2、P/
4、P/8とそれぞれ比較する。
【0034】なお、P/2、P/4、P/8の値に対し
て、後述する上記書込ポインタwと上記読出ポインタr
とが接近した場合の上記読出ポインタrの戻し量がそれ
ぞれ存在する。
【0035】ここで、後述するように、アドレス位相
(w−r)に余裕があるとき、すなわち読出アドレスと
書込アドレスとの衝突までに余裕があるときには、例え
ばRmax(kmax)の強度判定の際に比較ピッチとしてP
/2のパワーを選択する等してピッチ性を厳しく判別す
る。これによって、オーディオピッチとして有効である
と判別された場合には、入力されたピークピッチがその
まま出力される。また、アドレス位相(w−r)がどの
ような状態にあってもピッチ性が低いと判別される場
合、すなわち上記比較ピッチとしてP/8のパワーが選
択されてもピッチ性が低いと判別された場合には、オー
ディオピッチとしてゼロピッチが出力される。これは、
この分析区間では有効なオーディオピッチを検出するこ
とができなかったことを示す。
【0036】上述の判別によって上記ピッチ検出回路1
7から出力されるオーディオピッチは、検出仮ピッチと
してピッチ選択回路18に入力される。
【0037】ここで、上記ピッチ検出回路17の具体的
な構成を図6に示す。
【0038】信号入力端子21から入力される分析区間
パワーPは、1/2回路25に送られて分析区間パワー
Pの1/2のパワー、すわなちP/2パワーに変換され
た後、1/2回路26及び比較器28に送られる。
【0039】この比較器28には、信号入力端子22か
ら入力される自己相関ピーク値Rmax(kmax)が送られ
ており、上記P/2パワーと自己相関ピーク値Rmax
(kmax)とが比較される。比較結果として、例えば自
己相関ピーク値Rmax(kmax)がP/2パワーより大き
いときに位相値A3 が、また、小さいときに“0”が選
択器31に送られる。
【0040】上記1/2回路26は、上記P/2パワー
をさらに1/2にしたパワー、すなわち元の分析区間パ
ワーPの1/4のパワー(以下、P/4パワーという)
に変換する。このP/4パワーは、1/2回路27及び
比較器29に送られる。
【0041】この比較器29には、上記自己相関ピーク
値Rmax(kmax)が入力されており、上記P/4パワー
と自己相関ピーク値Rmax(kmax)とが比較される。比
較結果として、例えば自己相関ピーク値Rmax(kmax
がP/4パワーより大きいときには位相値A2 が、ま
た、小さいときに“0”が選択器31に送られる。
【0042】上記1/2回路27は、上記P/4パワー
をさらに1/2にしたパワー、すなわち元の分析区間パ
ワーPの1/8のパワー(以下、P/8パワーという)
に変換する。このP/8パワーは、比較器30に送られ
る。
【0043】この比較器30には、上記自己相関ピーク
値Rmax(kmax)が入力されており、上記P/8パワー
と自己相関ピーク値Rmax(kmax)とが比較される。比
較結果として、例えば自己相関ピーク値Rmax(kmax
がP/8パワーより大きいときには位相値A1 が、ま
た、小さいときに“0”が選択器31に送られる。
【0044】また、上記選択器31は、信号入力端子2
3からのアドレス位相(w−r)を切換制御信号として
用い、上記位相値A1 、A2 、A3 及びデータ“0”
と、信号入力端子35からの図5で示した上記第4ブロ
ックTを示す信号としての“1”とから1つのデータを
選択し、選択結果として“0”あるいは“1”のデータ
を出力する。出力されたデータは選択器33に送られ、
選択器33の切換制御信号として用いられる。なお、当
該選択器31は、デジタルにエンコードされた上記アド
レス位相(w−r)を一旦デコードするデコーダを有し
ている。
【0045】ここで、選択器31における選択動作につ
いて説明する。
【0046】先ず、位相値A1 、A2 、A3 はメモリ上
では、図5のAに示したような位置関係にあり、選択器
31においては、入力された位相値の中で位相値0から
一番離れた位相値を優先する。すなわち、上記選択動作
では、位相値A1 、A2 、A3 の中の最大位相値、ある
いは信号“1”の何れかが選択される。
【0047】そして、例えば位相値A3 が最大位相値で
ある場合、上記アドレス位相(w−r)が位相値A3
り大きい場合“1”が出力され、小さい場合“0”が出
力される。以下、位相値A2 が最大位相値である場合、
位相値A1 が最大位相値である場合も同様に“1”ある
いは“0”が出力される。また、最大位相値が存在しな
い場合、すなわち分析区間内でピークが検出されなかっ
た場合、“1”の信号が出力される。
【0048】また、上記選択器33には信号入力端子2
4からのピークピッチkmax とゼロピッチ出力器32か
らのゼロピッチとが入力されており、上記選択器31か
ら送られるデータが“1”のデータである場合はゼロピ
ッチが、また、上記選択器31からのデータが“0”の
データである場合はにピークピッチkmax がそれぞれ選
択され、選択結果が検出仮ピッチとして信号出力端子3
4から出力される。
【0049】また、図4に戻り、ピッチ選択回路18に
は、上記信号入力端子11からのアドレス位相(w−
r)及び信号入力端子12からの分析区間パワーPが送
られると共に、信号入力端子13からのゼロピッチ及び
信号入力端子14からの固定ピッチが入力される。この
ピッチ選択回路18では、上記送られるアドレス位相
(w−r)及び分析区間パワーPを用いて上記送られた
検出仮ピッチに対してさらにリファインを行う。具体的
には、上記ピッチ検出回路17から出力された検出仮ピ
ッチ、この検出仮ピッチの2倍及び4倍した仮ピッチ、
固定ピッチ及びゼロピッチの中からオーディオピッチの
選択が行われる。
【0050】ここで、固定ピッチとは外部から与えられ
る値であり、オーディオデータの継続時間長の変化率の
最大に対応する値等が考えられる。例えば、システムと
してオーディオ信号の継続時間長の変化率が+15%〜
−15%であるならば、ピッチ分析区間長が1024サ
ンプルのときには、1024×15%を切り上げた整数
を固定ピッチとして決定すれば良い。
【0051】上記送られる検出仮ピッチの周期が短い場
合には、オーディオピッチを2倍又は4倍する処理を行
う。ここで、検出仮ピッチの周期が短いか否かの判別
は、上記固定ピッチと比較することによって行う。この
ピッチ選択回路18では、上記検出仮ピッチ、この検出
仮ピッチを2倍及び4倍したピッチ、固定ピッチ及びゼ
ロピッチの中から出力ピッチの選択を行う分析区間パワ
ーPが小さいときに、アドレス位相(w−r)の余裕が
あるならばゼロピッチがオーディオピッチとして出力さ
れる。
【0052】また、このときにアドレス位相(w−r)
の余裕が無いならば固定ピッチがオーディオピッチとし
て出力される。さらに、分析区間パワーPが所定の閾値
以上であってアドレス位相(w−r)に余裕があるなら
ば、上記ピッチ検出回路17から送られた検出仮ピッチ
がオーディオピッチとして出力される。このとき、オー
ディオピッチが小さいならば、この検出仮ピッチの値を
2倍又は4倍して、固定ピッチに近いオーディオピッチ
にリファインした後に出力する。尚、分析区間パワーP
が所定の閾値以上であってもアドレス位相(w−r)に
余裕が無いならば、固定ピッチがオーディオピッチとし
て出力される。
【0053】ここで、上記ピッチ選択回路の具体的な構
成を図7に示す。
【0054】先ず、このピッチ選択器の固定ピッチ出力
器41から固定ピッチが、比較器45、46、さらに出
力cとして選択器53に送られる。また、図6に示すピ
ッチ検出回路から出力される検出仮ピッチは信号入力端
子42を介してこのピッチ選択回路に入力され、倍周器
47及び選択器49、さらに出力bとして選択器51に
入力される。
【0055】上記倍周器47は、上記検出仮ピッチの周
期を2倍し、この検出仮ピッチの2倍のオーディオピッ
チ(以下2倍のオーディオピッチという)を上記比較器
45、倍周器48及び選択器49にそれぞれ送る。
【0056】上記比較器45は、固定ピッチ出力器41
からの固定ピッチと、倍周器47からの上記2倍のオー
ディオピッチとを比較し、比較結果として例えば上記2
倍のオーディオピッチが上記固定ピッチよりも小さい場
合は“0”のデータを、また、大きい場合は“1”のデ
ータを選択器49に送る。なお、この比較結果は、選択
器49の切換制御信号として用いられる。
【0057】上記選択器49は、上記比較器45から送
られる比較結果に基づいて、上記検出仮ピッチと上記2
倍のオーディオピッチとから何れか一方を選択する。選
択結果として、“0”のデータが入力されている場合は
上記2倍のオーディオピッチが、また、“1”のデータ
が入力されている場合は上記検出仮ピッチが選択器50
に出力される。
【0058】また、倍周器48は、上記2倍のオーディ
オピッチをさらに2倍し、得られるオーディオピッチ、
すなわち検出仮ピッチの4倍のオーディオピッチ(以
下、4倍のオーディオピッチという)を、比較器46及
び選択器50に送る。
【0059】上記比較器46は、上記固定ピッチと、上
記4倍のオーディオピッチとを比較し、比較結果として
例えば上記4倍のオーディオピッチが上記固定ピッチよ
りも小さい場合は“0”のデータを、また、大きい場合
は“1”のデータを選択器50に送る。なお、この比較
結果は、選択器50の切換制御信号として用いられる。
【0060】また、選択器50は、上記比較器46から
の比較結果に基づいて、上記4倍のオーディオピッチ
と、選択器49からの選択結果として出力されたオーデ
ィオピッチとから何れか一方を選択する。選択結果とし
て、“0”のデータが入力されている場合は上記4倍の
オーディオピッチが、また、“1”のデータが入力され
ている場合は上記選択器49からの出力が選択され、こ
の選択結果を出力aとして選択器51に送る。
【0061】選択器51は、信号入力端子43から入力
されるアドレス位相(w−r)を切換制御信号として用
い、出力aとしての選択器50からの選択結果と、出力
bとしての上記検出仮ピッチとから何れか一方を選択
し、選択した方のオーディオピッチを選択結果として選
択器54に送る。
【0062】ここで、選択器51における選択動作につ
いて説明する。
【0063】選択器51では、アドレス位相(w−r)
を評価する閾値として、図5のCに示すような位相値A
0 (例えば、A0 <A1 )が用いられる。そこで、上記
アドレス位相(w−r)が位相値A0 よりも小さい場合
は出力aが、また、大きい場合は出力bが選択される。
【0064】また、選択器53は、信号入力端子43か
ら入力される上記アドレス位相(w−r)を切換制御信
号として用い、出力cとしての上記固定ピッチ出力器4
1から固定ピッチと、出力dとしてのゼロピッチ出力器
52からゼロピッチとから何れか一方を選択し、選択さ
れた方のオーディオピッチを選択結果として選択器54
に送る。
【0065】ここで、選択器53における選択動作につ
いて説明する。
【0066】選択器53では、アドレス位相(w−r)
を評価する閾値として、図5のBに示すような位相値A
4 (例えば、A4 >A3 )が用いられる。そこで、上記
アドレス位相(w−r)が位相値A4 よりも小さい場合
は出力cが、また、大きい場合は出力dが選択される。
【0067】なお、これら選択器51、53は、上記選
択器31と同様にデジタルにエンコードされた上記アド
レス位相(w−r)をデコードするデコーダを有してい
る。
【0068】上記選択器54は、信号入力端子44から
の分析区間パワーPを切換制御信号として用い、この分
析区間パワーPが所定の閾値よりも大きい場合は、選択
器51からの選択結果を、また、小さい場合は選択器5
3からの選択結果を選択する。この選択結果としてのオ
ーディオピッチは、信号出力端子55から出力され、図
1のメモリアドレスコントロール部5に出力ピッチとし
て出力される。
【0069】上記オーディオ信号処理装置によれば、上
記アドレス位相管理部6からの上記出力ピッチとして出
力aが選択された場合は、分析区間パワーPが所定の閾
値より大きくアドレス位相が小さい場合であり、上記検
出仮ピッチを2倍、4倍して上記固定ピッチに近い周期
にリファインした周期のピッチが出力ピッチとなる。
【0070】また、上記出力ピッチとして、出力bが選
択された場合は、分析区間パワーPが所定の閾値より大
きくアドレス位相に余裕がある場合であり、検出仮ピッ
チがそのまま出力ピッチとなる。
【0071】また、上記出力ピッチとして、出力cが選
択された場合は、分析区間パワーPが所定の閾値より小
さくアドレス位相が小さい場合であり、固定ピッチが出
力となる。
【0072】また、上記出力ピッチとして、出力dが選
択された場合は、分析区間パワーPが所定の閾値より小
さくアドレス位相に余裕がある場合であり、ゼロピッチ
が出力ピッチとなる。
【0073】従って、上記読出ポインタrは、アドレス
位相に余裕があってピークピッチが検出されないときは
戻されず、アドレス位相に余裕があってもピークピッチ
が検出されるとこのピークピッチに基づいて戻される。
【0074】また、読出ポインタrは、アドレス位相に
余裕がなくピークピッチが検出されないときは、固定ピ
ッチに基づいて強制的に戻され、また、アドレス位相に
余裕がなくてもピークピッチが検出されれば、このピー
クピッチを上記固定ピッチに近い周期にリファインして
この結果に基づいて戻される。
【0075】さらに、上記読出ポインタrが上述のよう
に入力されるオーディオデータのピッチや、メモリ2内
部の上記書込ポインタwと上記読出ポインタrとの相対
位置に応じて制御されることで、再生速度を上げたり、
下げたりしてオーディオ信号を再生する際に、メモリ2
の書込及び読出アドレスが互いに衝突しないように制御
することができるため、出力されるオーディオデータ内
に雑音が生じる虞がない。さらに、上記アドレスに応じ
て出力されるオーディオデータに基づいてオーディオつ
なぎ処理部3にて処理され得られるオーディオデータに
聴覚上不自然な部分が生じる虞はなくなる。
【0076】また、上記オーディオ信号処理装置をVT
Rのオーディオデータに対して適用した場合には、この
オーディオデータはビデオデータと一定の位相関係を保
持することができるので、ビデオデータに対してオーデ
ィオデータが極端に進んだり遅れたりすることが生じな
い。
【0077】
【発明の効果】以上説明したように、本発明のオーディ
オ信号処理装置によれば、再生速度を速くしたり遅くし
たりしてオーディオ信号を再生する場合に、記憶手段に
記憶されたオーディオデータの読出アドレスと書込アド
レスとの衝突を回避することができ、オーディオデータ
内に雑音を生じさせることがない。また、このオーディ
オ信号処理装置をVTRのオーディオデータに対して適
用した場合には、このオーディオデータはビデオデータ
と一定の位相関係を保持することができるので、ビデオ
データに対してオーディオデータが極端に進んだり遅れ
たりすることが生じない。
【図面の簡単な説明】
【図1】本発明に係るオーディオ信号処理装置の具体的
な構成を示すブロック図である。
【図2】上記オーディオ信号処理装置におけるピッチ検
出を説明する図である。
【図3】上記オーディオ信号処理装置におけるメモリ内
部の書込アドレスと読出アドレスとの相対位置を説明す
る図である。
【図4】上記オーディオ信号処理装置を構成するアドレ
ス位相管理部の具体的な構成を示す図である。
【図5】上記アドレス位相管理部で管理されるアドレス
位相を説明する図である。
【図6】上記アドレス位相管理部を構成するピッチ検出
回路の具体的な構成を示すブロック図である。
【図7】上記アドレス位相管理部を構成するピッチ選択
回路の具体的な構成を示すブロック図である。
【図8】従来のオーディオ信号処理装置の概略的な構成
を示す図である。
【符号の説明】
2 メモリ 3 オーディオつなぎ処理部 4 ピッチ抽出部 5 メモリアドレスコントロール部 6 アドレス位相管理部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G10L 9/08 301 A

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力オーディオ信号を記憶する記憶手段
    と、 上記記憶手段からのオーディオ信号を読み出してオーデ
    ィオピッチ及びパワー情報を算出するピッチ抽出手段
    と、 上記ピッチ抽出手段からのオーディオピッチ及びパワー
    情報を用いて、一定のピッチ分析区間における自己相関
    ピークを与えるピークピッチをオーディオピッチとして
    出力するアドレス位相管理手段と、 上記アドレス位相管理手段からのオーディオピッチを用
    いて上記記憶手段内のメモリアドレスを算出するメモリ
    アドレス制御手段とから成ることを特徴とするオーディ
    オ信号処理装置。
  2. 【請求項2】 上記ピッチ抽出手段からのパワー情報と
    して分析区間パワー及び自己相関ピークが出力されるこ
    とを特徴とする請求項1記載のオーディオ信号処理装
    置。
  3. 【請求項3】 上記アドレス位相管理手段は、上記ピッ
    チ抽出手段からのオーディオピッチの有効性の有無を上
    記メモリアドレス制御手段からのアドレス位相情報に基
    づいて検出し、 この検出結果に基づいたオーディオピッチを出力するピ
    ッチ検出手段と、 上記ピッチ検出手段からのオーディオピッチを用いてさ
    らに適切なオーディオピッチを選択するピッチ選択手段
    とから成ることを特徴とする請求項1記載のオーディオ
    信号処理装置。
  4. 【請求項4】 上記アドレス位相管理手段には、ゼロピ
    ッチ及び固定ピッチが入力されることを特徴とする請求
    項1記載のオーディオ信号処理装置。
JP7178687A 1994-07-28 1995-07-14 オーディオ信号処理装置 Withdrawn JPH0896514A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP7178687A JPH0896514A (ja) 1994-07-28 1995-07-14 オーディオ信号処理装置
US08/507,671 US5717829A (en) 1994-07-28 1995-07-25 Pitch control of memory addressing for changing speed of audio playback

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP6-177050 1994-07-28
JP17705094 1994-07-28
JP7178687A JPH0896514A (ja) 1994-07-28 1995-07-14 オーディオ信号処理装置

Publications (1)

Publication Number Publication Date
JPH0896514A true JPH0896514A (ja) 1996-04-12

Family

ID=26497727

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7178687A Withdrawn JPH0896514A (ja) 1994-07-28 1995-07-14 オーディオ信号処理装置

Country Status (2)

Country Link
US (1) US5717829A (ja)
JP (1) JPH0896514A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999014751A1 (fr) * 1997-09-12 1999-03-25 Nippon Hoso Kyokai Procede de traitement de sons, processeur de sons, et dispositif d'enregistrement/de reproduction
KR100677473B1 (ko) * 2005-07-07 2007-02-02 엘지전자 주식회사 멀티미디어 단말기의 정지 잡음 방지 장치 및 방법

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998011534A1 (de) * 1996-09-10 1998-03-19 Siemens Aktiengesellschaft Verfahren zur anpassung eines hidden-markov-lautmodelles in einem spracherkennungssystem
JP2000082260A (ja) * 1998-09-04 2000-03-21 Sony Corp オーディオ信号再生装置及び方法
US6553455B1 (en) 2000-09-26 2003-04-22 International Business Machines Corporation Method and apparatus for providing passed pointer detection in audio/video streams on disk media
US7809879B1 (en) 2000-09-26 2010-10-05 International Business Machines Corporation Method and apparatus for providing stream linking in audio/video disk media
JP3871657B2 (ja) * 2003-05-27 2007-01-24 株式会社東芝 話速変換装置、方法、及びそのプログラム
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8744844B2 (en) * 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8934641B2 (en) * 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8150065B2 (en) * 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
TWI312500B (en) * 2006-12-08 2009-07-21 Micro Star Int Co Ltd Method of varying speech speed
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
JP4952469B2 (ja) * 2007-09-19 2012-06-13 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
WO2010091554A1 (zh) * 2009-02-13 2010-08-19 华为技术有限公司 一种基音周期检测方法和装置
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
WO2016033364A1 (en) 2014-08-28 2016-03-03 Audience, Inc. Multi-sourced noise suppression
US9685170B2 (en) * 2015-10-21 2017-06-20 International Business Machines Corporation Pitch marking in speech processing

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4464784A (en) * 1981-04-30 1984-08-07 Eventide Clockworks, Inc. Pitch changer with glitch minimizer
JPS58140798A (ja) * 1982-02-15 1983-08-20 株式会社日立製作所 音声ピツチ抽出方法
US4700391A (en) * 1983-06-03 1987-10-13 The Variable Speech Control Company ("Vsc") Method and apparatus for pitch controlled voice signal processing
NL8400552A (nl) * 1984-02-22 1985-09-16 Philips Nv Systeem voor het analyseren van menselijke spraak.
IL84902A (en) * 1987-12-21 1991-12-15 D S P Group Israel Ltd Digital autocorrelation system for detecting speech in noisy audio signal
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999014751A1 (fr) * 1997-09-12 1999-03-25 Nippon Hoso Kyokai Procede de traitement de sons, processeur de sons, et dispositif d'enregistrement/de reproduction
US6360198B1 (en) 1997-09-12 2002-03-19 Nippon Hoso Kyokai Audio processing method, audio processing apparatus, and recording reproduction apparatus capable of outputting voice having regular pitch regardless of reproduction speed
KR100677473B1 (ko) * 2005-07-07 2007-02-02 엘지전자 주식회사 멀티미디어 단말기의 정지 잡음 방지 장치 및 방법

Also Published As

Publication number Publication date
US5717829A (en) 1998-02-10

Similar Documents

Publication Publication Date Title
JPH0896514A (ja) オーディオ信号処理装置
US6347185B1 (en) Apparatus and method for recording audio/video signal and detected feature information thereof
US4734795A (en) Apparatus for reproducing audio signal
US20080262856A1 (en) Method and system for enabling audio speed conversion
MXPA04008424A (es) Reproduccion de audio con modo de truco.
KR940008690B1 (ko) 정보기록 시스템 및 장치
JP3402748B2 (ja) 音声信号のピッチ周期抽出装置
US6654317B2 (en) Method and apparatus for reproducing information
JP3024447B2 (ja) 音声圧縮装置
GB2454470A (en) Controlling an audio signal by analysing samples between zero crossings of the signal
JP2002258900A (ja) 音声再生装置及び音声再生方法
JP2008518248A (ja) Midiファイルを再生する装置及び方法
EP1732078A1 (en) Digital dubbing device
JPH08292790A (ja) ビデオテープレコーダ
JPH08292796A (ja) 再生装置
RU2310288C2 (ru) Способ, устройство и носитель записи для записи последовательности сигналов видеоинформации
KR100296210B1 (ko) 음성신호재생장치
JPH05303400A (ja) 音声再生装置と音声再生方法
JP2674070B2 (ja) デイジタルオーデイオ編集装置
JPS58223196A (ja) 時間軸変換装置
JPS5921053B2 (ja) 音声出力装置
JP2005223794A (ja) 映像音響コンテンツの記録装置及び方法
JPH05189769A (ja) ディスク再生装置
JPH07120158B2 (ja) 音声信号再生装置
JPH05284463A (ja) ディジタルvtrの音声データ再生装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20021001