JP2006084754A - 音声録音再生装置 - Google Patents

音声録音再生装置 Download PDF

Info

Publication number
JP2006084754A
JP2006084754A JP2004269227A JP2004269227A JP2006084754A JP 2006084754 A JP2006084754 A JP 2006084754A JP 2004269227 A JP2004269227 A JP 2004269227A JP 2004269227 A JP2004269227 A JP 2004269227A JP 2006084754 A JP2006084754 A JP 2006084754A
Authority
JP
Japan
Prior art keywords
block
data
sample
unit
reproduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004269227A
Other languages
English (en)
Inventor
Koji Suzuki
浩二 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Oki Micro Design Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Oki Micro Design Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd, Oki Micro Design Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2004269227A priority Critical patent/JP2006084754A/ja
Priority to US11/226,214 priority patent/US20060077844A1/en
Publication of JP2006084754A publication Critical patent/JP2006084754A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

【課題】 音声信号の音程を変えずに再生スピードを少ない演算回数で変更すること。
【解決手段】 ブロック構成部1は、音声信号を受け入れて、所定長のブロックに分解し、ADPCM変換部3は、ブロック毎にADPCM変換し、ブロック特性抽出部4は、ブロック毎に最小レベルサンプルのサンプル番号と、ADPCM中間データからなるブロック特性データを取得し、記憶部6は、ADPCM変換部3が変換したADPCMデータと、ブロック特性抽出部4が取得したブロック特性データとを格納し、データ読み出し部7は、記憶部6が格納するADPCMデータ再生処理させ、再生データ生成部10は、ブロック繰り返し再生要求を受け入れると、データ読み出し部7を監視し、読み出しサンプル番号が最小レベルサンプルの番号に達するとADPCMデータの読み出し位置を前のブロックの最小レベルサンプルの位置まで戻す。
【選択図】 図1

Description

本発明は、音声録音再生装置、特に、音程を変えずに再生速度(ピッチ)を変化させることが可能な音声録音再生装置、及び、その音声録音再生方法に関するものである。
音声録音再生装置では、音程を変えずに再生スピードを変化させるために、音声信号の短時間自己相関性を利用し、短時間に繰り返す、エンベロープ波形が類似する信号(以後単位相関信号と記す)を挿入して再生スピードを遅くしたり、あるいは又、削除することによって再生スピードを速くしている。しかし、この単位相関信号の抽出には、膨大な演算回数を要するため、従来の技術では、演算回数を減らすことに注力されていた(例えば特許文献1参照)。
演算回数を減らすための手法として、通常、単位相関信号の抽出には、平均振幅差関数法(ADMF法)が、用いられている。このADMF法では、音声信号を所定の長さに切ってセグメントを求める。そのセグメントの長さをサンプリング周期のN倍とし、セグメントに含まれているサンプル番号を1からNとする。D(m)なる関数を次式のように設定し、単位相関信号のくり返し周期(ピッチ周期)を求める。
上式に於いて、mを変化させ、D(m)の最小値を検出する。このときのmの値がピッチ周期となる。このピッチ周期の窓でセグメントの中から単位相関信号を抽出することになる。
かかるADMF法を用いても、ピッチ周期を1回抽出するために要する演算回数は、一例としてmの開始値を100、mの最終値(=N)を500とすると、引き算、足し算、わり算、最小値検出とを合わせて約40万回にも及ぶ。これでは、高速のCPU(中央演算処理装置)を用いない限り、リアルタイムでの再生処理は困難に成ってくる。
そこで、ADMF法を用いることなく、音声信号のゼロクロス点を検出し、ゼロクロス点の短時間自己相関性を利用して、単位相関信号を抽出する技術も公開されている(例えば特許文献2参照)。しかし、この技術を用いても単位相関信号の抽出には、複雑なアルゴリズムと、多大な演算回数を必要としていた。即ち、音声信号を所定の長さに切ったセグメントの中から、ピッチ周期を求める限り、ADMF法を用いれば演算回数が膨大になり、ゼロクロス点検出法を用いれは、ADMF法に比較して、演算回数の削減は有る程度可能になるが、アルゴリズムが複雑になってしまう。
特開平6−230800号公報 特開平5−19792号公報
解決しようとする問題点は、音声信号を所定の長さに切ったセグメントの中から、ピッチ周期を求める限り、ADMF法を用いれは演算回数が膨大になり、ゼロクロス点検出法を用いれは、ADMF法に比較して、演算回数の有る程度の削減は可能になるが、アルゴリズムが複雑になってしまい、低速な(廉価な)CPUを用いて、音程を変えずに再生スピードを変化させることが困難になる点である。従って、本発明では、ピッチ周期を求めることなく、録音再生可能な音声録音再生装置の実現を目的とする。
本発明では、録音側に於いて、ブロック構成部が、受け入れた音声信号のセグメントを予め定められている長さ(サンプリング周期の倍数で設定する)のブロックに分解する。このブロック長は、そのブロックの中に最低1個の単位相関信号が含まれる長さに設定される。この設定は、音声の低域には周波数限界があることから容易に求められる。次に、A/D(アナログ/ディジタル)変換部が、ブロックの受け入れ順にサンプルレベルをA/D変換する。続いてADPCM(適応型パルスコード変調)変換部がディジタル変換する。データ格納管理部がADPCMデータを受け入れてアドレスを管理し、所定の記憶部に格納する。更に、ブロック特性抽出部は、ブロック毎に、そのブロック内でサンプルレベルが最小値を示す最小レベルサンプルを抽出し、そのサンプル番号と、その位置でのADPCM中間データとを取得し、データ格納管理部を介して、ブロック特性として上記ADPCM値と対応させて上記記憶部に格納する。
再生側では、音声信号の繰り返し命令が無い限り、データ読み出し部は、上記記憶部から、上記録音時に格納されたアドレス順にADPCMデータを読み出してADPCM逆変換部へ送る。ADPCM逆変換部は、ADPCMデータを逆変換してD/A変換部へ送る。D/A変換部は、D/A変換して再生音声を出力する。ブロックの先頭で、音声信号の繰り返し命令があると、再生データ生成部は、データ読み出し部を介してそのブロックに於ける最小レベルサンプルのサンプル番号を読み出して保持する。データ読み出し部によるADPCMデータの読み出しが、そのサンプル番号に達すると、再生データ生成部は、データ読み出し部が読み出すサンプルのアドレスを1つ前のブロックの最小レベルサンプルが格納されているアドレスまで戻らせる。再度データ読み出し部は、そのアドレスから順番にADPCMデータを読み出してADPCM逆変換部へ送る。ADPCM逆変換部は、ADPCMデータを逆変換してD/A変換部へ送る。D/A変換部は、D/A変換して再生音声を出力する。即ち、本発明では、ピッチ周期を求めることなく音声の録音再生を行うことを最も主要な特徴とする。
本発明では、ブロック繰り返し再生要求を受け入れると、データ読み出し部によるADPCMデータの読み出しを監視し、読み出しサンプルのサンプル番号が現在読み出し中のブロックに於ける最小レベルサンプルのサンプル番号に達すると、データ読み出し部によるADPCMデータの読み出しアドレスを現在読み出し中のブロックの一つ前のブロックに於ける最小レベルサンプルのアドレスまで戻す再生データ生成部を備えることによって、ピッチ周期を求める必要がなくなるので、アルゴリズムが簡単になり、その結果演算回数も激減し、低速な(廉価な)CPUを用いても、音程を変えずに再生スピードを変化させることが可能になるという効果を得る。
本発明では、ブロック構成部、ADPCM変換部、ブロック特性抽出部、データ格納管理部、データ読み出し部、再生データ生成部、ADPCM逆変換部、の全てを、装置内部に備える制御部(CPU)が所定のプログラムを実行することによって生成する制御手段によって実現した。
実施例1の音声録音再生装置は、再生スピードを遅くすることを目的とする。
図1は、実施例1による音声録音再生装置の機能ブロック図である。
図に示すように、本発明による音声録音再生装置は、ブロック構成部1と、A/D変換部2と、ADPCM変換部3と、ブロック特性抽出部4と、データ格納管理部5と、記憶部6と、データ読み出し部7と、ADPCM逆変換部8と、D/A変換部9と、再生データ生成部10と、制御部11とを備える。
ブロック構成部1は、音声信号のセグメントを予め定められている長さ(サンプリング周期の倍数で設定する)のブロックに分解してA/D変換部へ出力する部分である。このブロック長は、そのブロックの中に最低1個の単位相関信号が含まれる長さに設定される。通常は、音声の最低限界100Hz前後を基準にして設定される。尚、必要に応じて、ブロック長変更部12を用いてブロック長を変更しても良い。
A/D変換部2は、ブロック構成部1からブロックを受け入れて、ブロックの先頭から後尾までサンプル番号順にサンプルレベルをA/D(アナログ/ディジタル)変換し、ブロック特性抽出部4及びADPCM変換部3へ送出するA/Dコンバータである。
ADPCM変換部3は、A/D変換部2の出力を受け入れて、ADPCM(適応パルスコード変調)変換し、ADPCMデータをデータ格納管理部5へ送出する部分である。
ブロック特性抽出部4は、A/D変換部2の出力を受け入れて、ブロック毎に最小レベルサンプルのサンプル番号と、その位置でのADPCM中間データとを取得し、ブロック特性としてデータ格納管理部5へ送出する部分である。ここでADPCM中間データとは、直前のサンプルのPCMデータとADPCMデータである。ここでADPCMデータとは、隣接するサンプル間に於けるPCMデータの差分のみを表すデータである。
データ格納管理部5は、ADPCM変換部3から受け入れたADPCMデータと、ブロック特性抽出部4から受け入れたブロック特性とを対応付けてブロック毎に、且つ、サンプル番号順に記憶部6へ格納し、そのアドレスを管理する部分である。
記憶部6は、ADPCMデータとブロック特性とを格納するRAM(メモリ)であり、その内部にはブロック特性格納領域6−1と、音声データ格納領域6−2とが設けられている。このRAMは、専用に設けられる必要はなく、制御部が所定のプログラムを実行する際に用いるRAMの一部の領域を用いることとしても良い。
データ読み出し部7は、ブロックの追加要求が無い限り、記憶部6から、データ格納管理部5のアドレス管理に基づいて、上記録音時に格納されたアドレス順にADPCMデータを読み出してADPCM逆変換部8へ送る部分である。更に、ブロックの追加要求があると、再生データ生成部10の指示に基づいて、記憶部6から読み出すサンプルのアドレスを1つ前のブロックの最小レベルサンプルのアドレスまで戻り、順次ADPCMデータを読み出してADPCM逆変換部8へ送る部分でもある。
ADPCM逆変換部8は、データ読み出し部7からADPCMデータを受け入れて、逆変換してD/A変換部9へ送出する部分である。
D/A変換部9は、ADPCM逆変換部8の出力を受け入れて、再生音声を出力するD/Aコンバータである。
再生データ生成部10は、データ読み出し部7を介して記憶部6からブロック特性を取得し、そのブロックに於ける最小レベルサンプルのサンプル番号を読み出して保持する部分である。更に、ブロックの追加要求があるとデータ読み出し部7によるADPCMデータの読み出しサンプルのサンプル番号を監視し、サンプル番号が、最小レベルサンプルのサンプル番号に達すると、データ読み出し部7に対して、読み出すサンプルのアドレスを1つ前のブロックの最小レベルサンプルが格納されているアドレスまで戻らせる部分でもある。尚、ブロックの追加要求は、オペレータの設定に基づいて、制御部から再生データ生成部10へ送出される。
制御部11は、装置全体を制御するCPUであり、図示しないROM(メモリ)に予め格納されているプログラムを実行することによって、ブロック構成部1、ADPCM変換部3、ブロック特性抽出部4、データ格納管理部5、データ読み出し部7、ADPCM逆変換部8、及び、再生データ生成部10を生成する部分である。
次に実施例1の動作について説明する。
最初に録音側の動作について説明し、続いて再生側の動作について説明する。
図2は、実施例1の動作フローチャート(録音側)である。
図3は、実施例1の動作原理説明図である。
この図は、図2の説明に於いて引用される図である。(a)は、元の音声波形(録音側)であり、(b)は、再生ピッチを遅くした音声波形(再生側)であり、(c)は、(a)、(b)に共通の時刻を表している。
図2のステップS1−1からステップS1−9までステップ順に実施例1の音声録音再生装置の録音側の動作について説明する。
「動作説明の前提条件」
サンプリング周波数32KHzで、1ブロックのサンプル数を256(NO−0からNO−255)とする。
ブロック構成部1(図1)によって、1ブロックのサンプル数256に設定された音声信号が、A/D変換部2(図1)に入力され、録音側の動作がスタートする。
ステップS1−1
制御部11(図1)は、CPUの内部に有するサンプル数カウンタを初期化する。
ステップS1−2
A/D変換部2(図1)は、受け入れた音声信号のサンプルレベルをA/D変換する。
ステップS1−3
ブロック特性抽出部4(図1)は、受け入れたサンプルのレベルと、自己が保持するその時刻までに於ける最小レベルサンプルのレベルとを比較し、受け入れたサンプルのレベルが、最小レベルサンプルのレベルよりも低い場合にはステップS1−4へ進み、等しいか又は高い場合にはステップS1−5へ進む。但し、受け入れたサンプルが、最初のサンプルである場合にはステップS1−4へ進む。
ステップS1−4
ブロック特性抽出部4(図1)は、そのサンプルNOと、そのレベル、及びADPCM中間データで、自己が保持するその時刻までに於ける最小レベルサンプルのサンプルNOと、そのレベル、及びADPCM中間データとを更新する。
ステップS1−5
ADPCM変換部3(図1)は、受け入れたサンプルのレベルをADPCMデータに変換する。
ステップS1−6
データ格納管理部5(図1)は、ADPCM変換部3(図1)からADPCMデータを受け入れて記憶部6(図1)の所定のアドレスに格納する。
ステップS1−7
そのブロック内の全てのサンプルの処理が終了していない場合には、ステップS1−8へ進み、終了している場合にはステップS1−9へ進む。
ステップS1−8
制御部11(図1)は、CPUの内部に有するサンプル数カウンタをインクリメントしてステップS1−2へ戻る。後に続くサンプルの処理が実行されることになる。
ステップS1−9
データ格納管理部5(図1)は、ブロック特性抽出部4(図1)から、その時刻に保持する最小レベルサンプルのサンプルNOと、そのレベル、及びADPCM中間データとを受け入れて、ブロック特性とし、ADPCMデータと対応させて記憶部6(図1)に格納した後ステップS1−1へ戻って後に続くブロックの処理を実行する。
以上説明したフローによって、一例として図3(a)に示すように、ブロックB1ではサンプルNO−222、ブロックB2ではサンプルNO−237、ブロックB3ではサンプルNO−118、ブロックB4ではサンプルNO−132が最小レベルサンプルとして検出される。ここでは、以下の点に留意する必要がある。即ち、1ブロックの中に複数個の単位相関信号が含まれていても、最小レベルサンプルは、1個のみ検出される。
続いて再生側の動作について説明する。
図4は、実施例1の動作フローチャート(再生側)である。
「動作説明の前提条件」
図3(a)に示す録音側に入力された音声信号において、時刻t1から時刻t4に至る間の波形(B2α)を再生側で追加するものと仮定し、この実例に沿って説明する。
図4のステップS2−1からステップS2−13までステップ順に実施例1の音声録音再生装置の再生側の動作について説明する。
一例として図3(a)に示す音声信号のブロック特性とADPCM特性とが記憶部6(図1)に格納された後再生がスタートされる。
ステップS2−1
制御部11(図1)は、CPUの内部に有するサンプル数カウンタを初期化する。
ステップS2−2
ADPCM逆変換部8(図1)は、データ読み出し部7(図1)が記憶部6(図1)から読み出したADPCMデータをPCMデータに変換する。このPCMデータは、D/A変換部9(図1)を通って再生音声信号となって出力される。ここでは、ブロックB1(図3(b))が再生されることになる。
ステップS2−3
制御部11(図1)は、CPUの内部に有するサンプル数カウンタをインクリメントする。
ステップS2−4
1ブロック終了するまでステップS2−2〜ステップS2−4を繰り返し、1ブロック(ここではブロックB1(図3(b)))の処理が終了するとステップS2−5へ進む。
ステップS2−5
制御部11(図1)は、CPUの内部に有するサンプル数カウンタを初期化する。図3(b)に示すように、時刻t2でブロックB1の処理が終了するのでカウンタ値は255から0になる。
ステップS2−6
後に続くブロックが始めて再生されるブロックであり、且つ、追加要求(繰り返し命令)が出ている場合にはステップS2−7へ進み、初めての再生でない場合、又は追加要求(繰り返し命令)が出ていない場合にはステップS2−2へ戻ってステップS2−1からステップS2−6を繰り返す。ここでは、ブロックB2(図3(b))は、ブロックB1(図3(b))に続いて初めての再生であり、且つ、前提条件より追加要求(繰り返し命令)が出ているのでステップS2−7へ進む。
ステップS2−7
再生データ生成部10(図1)は、データ読み出し部7(図1)を介して記憶部6(図1)からブロック特性を取得し、そのブロックに於ける最小レベルサンプルのサンプル番号を読み出して保持し、データ読み出し部7(図1)によるADPCMデータ読み出しサンプルのサンプル番号監視を開始する。
ステップS2−8
ADPCM逆変換部8(図1)は、データ読み出し部7(図1)が記憶部6(図1)から読み出したADPCMデータをPCMデータに変換する。このPCMデータは、D/A変換部9(図1)を通って再生音声信号となって出力される。ここでは、ブロックB2(図3(b))の途中までが再生されることになる。
ステップS2−9
再生データ生成部10(図1)が、データ読み出し部7(図1)によるADPCMデータの読み出しサンプルのサンプル番号と最小レベルサンプルのサンプル番号との一致を検出するまでは、ステップS2−10へ進み、一致するとステップS2−11へ進む。
ステップS2−10
制御部11(図1)は、CPUの内部に有するサンプル数カウンタをインクリメントした後、ステップS2−8、ステップS2−9、ステップS2−10を繰り返す。ここでは、ブロックB2のサンプルNO−237までステップS2−8、ステップS2−9、ステップS2−10を繰り返すことになる。
ステップS2−11
再生データ生成部10(図1)は、一つ前のブロックのブロック特性情報を取得する。ここでは、データ読み出し部7(図1)を介して記憶部6(図1)から図3(a)に於けるブロックB1の最小レベルサンプルのサンプルNO−222と、このサンプルのADPCM中間データとを読み出すことになる。
ステップS2−12
再生データ生成部10(図1)は、CPUの内部に有するサンプル数カウンタのカウント値をステップS2−11で読み出した、一つ前のブロックに於ける最小レベルサンプルのサンプル番号に変更する。ここでは、図3(b)に示すように時刻t3で、現在のカウント値237をブロックB1に於ける最小レベルサンプルのカウント値222に変更する。
ステップS2−13
データ読み出し部7(図1)は、ブロックB1に於ける最小レベルサンプルのサンプルNO−222が格納されている、記憶部6(図1)のアドレスからADPCMデータを読み出してステップS2−2へ戻る。以下、上記と同様のフローを辿り、所定の再生が終了するとフローを終了する。ここでは、引き続き以下のように動作する。
カウント値222の状態(時刻t3)からステップS2−2へ戻って、図3(a)のブロックB1のサンプルNO−222が格納されている記憶部6(図1)のアドレスから順番にADPCMデータを読み出す。ステップS2−2、ステップS2−3、ステップS2−4、ステップS2−2を繰り返す。時刻t4に於いて、再生側の1ブロック(ここではブロックB2(図3(b)))が終了すると、B2α(図3(a))の繰り返し再生を継続しながら、ステップS2−5へ抜ける。
このときのカウント値240は0に初期化される(ステップS2−5)以下、初期化されたカウント値に基づいて元の音声波形(図3(a))が順次読み出される。その結果、元の音声波形(図3(a))の(B2α)の部分が、再生ピッチを遅くした音声波形(b)に追加されることになる。
以上説明したように、本実施例では、ブロック追加再生要求を受け入れると、再生データ生成部10(図1)が、データ読み出し部7(図1)によるADPCMデータの読み出しを監視し、読み出しサンプル番号が現在読み出し中のブロックに於ける最小レベルサンプルのサンプル番号に達するとデータ読み出し部7(図1)によるADPCMデータの読み出しアドレスを現在読み出し中のブロックの一つ前のブロックに於ける最小レベルサンプルが格納されているアドレスまで戻すのみで、ピッチ周期を求める必要がなくなるので、アルゴリズムが簡単になり、その結果演算回数も激減し、低速な(廉価な)CPUを用いても、音程を変えずに再生スピードを遅くすることが可能になるという効果を得る。
以上の説明では、ブロック特性として最小レベルサンプルを求めることとして説明したが、本発明はこの例に限定されるものではない。即ち、ブロック毎に、そのブロック内でサンプルレベルが最大値を示す最大レベルサンプルを抽出し、上記説明における最小レベルサンプルに置き換えることにしても全く同様の効果が得られる。
又、上記説明では、ブロック追加再生要求を受け入れると、再生データ生成部10(図1)が、データ読み出し部7(図1)によるADPCMデータの読み出しを監視し、読み出しサンプル番号が現在読み出し中のブロックに於ける最小レベルサンプルのサンプル番号に達するとデータ読み出し部7(図1)によるADPCMデータの読み出しアドレスを現在読み出し中のブロックの一つ前のブロックに於ける最小レベルサンプルが格納されているアドレスまで戻すこととして説明したが、本発明は、この例に限定されるものではない。即ち、データ読み出し部7(図1)によるADPCMデータの読み出しアドレスを現在読み出し中のブロックの複数個前のブロックに於ける最小レベルサンプルが格納されているアドレスまで戻すこととしても良い。
更に、上記説明では、ブロック追加再生要求を1回受け入れた場合の動作のみについて説明したが、本発明は、この例に限定されるものではない。即ち、ブロック追加再生要求を複数回繰り返して受け入れた場合には、上記動作を複数回実行することによって、所望回数、再生速度を遅らせることも可能である。
実施例2の音声録音再生装置は、再生スピードを速くすることを目的とする。
図5は、実施例2による音声録音再生装置の機能ブロック図である。
図に示すように、本発明による音声録音再生装置は、ブロック構成部1と、A/D変換部2と、ADPCM変換部3と、ブロック特性抽出部4と、データ格納管理部5と、記憶部6と、データ読み出し部7と、ADPCM逆変換部8と、D/A変換部9と、再生データ生成部20と、制御部21とを備える。
実施例1との相違部分のみについて説明する。実施例1と同様の部分には実施例1と同一の符合を付して説明を省略する。
再生データ生成部20は、データ読み出し部7を介して記憶部6からブロック特性を取得し、そのブロックに於ける最小レベルサンプルのサンプル番号を読み出して保持する部分である。更に、ブロックの削除要求があるとデータ読み出し部7によるADPCMデータの読み出しサンプルのサンプル番号を監視し、サンプル番号が、最小レベルサンプルのサンプル番号に達すると、データ読み出し部7に対して、読み出すサンプルのアドレスを1つ後のブロックの最小レベルサンプルが格納されているアドレスまで進ませる部分でもある。尚、ブロックの削除要求は、オペレータの設定に基づいて制御部から再生データ生成部20へ送出される。
制御部21は、装置全体を制御するCPUであり、図示しないROM(メモリ)に予め格納されているプログラムを実行することによって、ブロック構成部1、ADPCM変換部3、ブロック特性抽出部4、データ格納管理部5、データ読み出し部7、ADPCM逆変換部8、及び、再生データ生成部20を生成する部分である。
次に実施例2の動作について説明する。
録音側の動作は、実施例1と全く同様なので説明を省略し、再生側の動作のみについて説明する。
図6は、実施例2の動作フローチャート(録音側)である。
図7は、実施例2の動作原理説明図である。
この図は、図6の説明に於いて引用される図である。(a)は、元の音声波形(録音側)であり、(b)は、再生ピッチを速くした音声波形(再生側)であり、(c)は、(a)、(b)に共通の時刻を表している。
「動作説明の前提条件」
図7(a)に示す録音側に入力された音声信号において、時刻t5から時刻t7に至る間の波形(B3α)が再生側で削除されるものと仮定し、この実例に沿って説明する。
図6のステップS3−1からステップS3−13までステップ順に実施例2の音声録音再生装置の再生側の動作について説明する。
一例として図7(a)に示す音声信号のブロック特性とADPCM特性とが記憶部6(図5)に格納された後再生がスタートする。
ステップS3−1
制御部21(図5)は、CPUの内部に有するサンプル数カウンタを初期化する。
ステップS3−2
ADPCM逆変換部8(図5)は、データ読み出し部7(図5)が記憶部6(図5)から読み出したADPCMデータをPCMデータに変換する。このPCMデータは、D/A変換部9(図5)を通って再生音声信号となって出力される。ここでは、ブロックB1(図3(b))が再生されることになる。
ステップS3−3
制御部21(図5)は、CPUの内部に有するサンプル数カウンタをインクリメントする。
ステップS3−4
1ブロック終了するまでステップS3−2〜ステップS3−4を繰り返し、1ブロック(ここではブロックB1(図7(a)))の処理が終了するとステップS3−5へ進む。
ステップS3−5
制御部21(図5)は、CPUの内部に有するサンプル数カウンタを初期化する。図7(b)に示すように、時刻t2でブロックB1の処理が終了するのでカウンタ値は255から0になる。
ステップS3−6
後に続くブロックが始めて再生されるブロックであり、且つ、ブロック削除要求(削除命令)が出ている場合にはステップS3−7へ進み、初めての再生でない場合、又はブロック削除要求(削除命令)が出ていない場合にはステップS3−2へ戻ってステップS3−1からステップS3−6を繰り返す。ここでは、ブロックB2(図7(b))は、ブロックB1(図7(b))に続いて初めての再生であるが、前提条件より削除命令が出ていないのでステップS3−2へ戻って、ステップS3−2からステップS3−4を繰り返しブロックB2の処理を終了すると、前提条件よりブロックB3は、始めて再生されるブロックであり、且つ、ブロック削除要求(削除命令)が出ているのでステップS3−7へ進む。
ステップS3−7
再生データ生成部20(図5)は、データ読み出し部7(図5)を介して記憶部6(図5)からブロック特性を取得し、そのブロックに於ける最小レベルサンプルのサンプル番号を読み出して保持し、データ読み出し部7(図5)によるADPCMデータ読み出しサンプルのサンプル番号監視を開始する。
ステップS3−8
ADPCM逆変換部8(図5)は、データ読み出し部7(図5)が記憶部6(図5)から読み出したADPCMデータをPCMデータに変換する。このPCMデータは、D/A変換部9(図5)を通って再生音声信号となって出力される。ここでは、ブロックB3(図7(b))の途中までが再生されることになる。
ステップS3−9
再生データ生成部20(図5)が、データ読み出し部7(図5)によるADPCMデータの読み出しサンプルのサンプル番号と最小レベルサンプルのサンプル番号との一致を検出するまでは、ステップS3−10へ進み、一致するとステップS3−11へ進む。
ステップS3−10
制御部21(図5)は、CPUの内部に有するサンプル数カウンタをインクリメントした後、ステップS3−8、ステップS3−9、ステップS3−10を繰り返す。ここでは、ブロックB3のサンプルNO−117までステップS3−8、ステップS3−9、ステップS3−10を繰り返すことになる。
ステップS3−11
再生データ生成部20(図5)は、一つ後のブロックのブロック特性情報を取得する。ここでは、データ読み出し部7(図5)を介して記憶部6(図5)から図7(a)に於けるブロックB4の最小レベルサンプルのサンプルNO−117と、このサンプルのADPCM中間データとを読み出すことになる。
ステップS3−12
再生データ生成部20(図5)は、CPUの内部に有するサンプル数カウンタのカウント値を、ステップS3−11で読み出した一つ後のブロックに於ける最小レベルサンプルのサンプル番号に変更する。ここでは、図7(b)に示すように時刻t5で、現在のカウント値117をブロックB4に於ける最小レベルサンプルのカウント値132に変更する。
ステップS3−13
データ読み出し部7(図5)は、ブロックB4に於ける最小レベルサンプルのサンプルNO−132が格納されている、記憶部6(図5)のアドレスからADPCMデータを読み出してステップS3−2へ戻る。以下、上記と同様のフローを辿り、所定の再生が終了するとフローを終了する。ここでは、引き続き以下のように動作する。
カウント値132の状態(時刻t5)からステップS3−2へ戻って、図7(a)のブロックB4のサンプルNO−132が格納されている記憶部6(図5)のアドレスから順番にADPCMデータを読み出す。ステップS3−2、ステップS3−3、ステップS3−4、を繰り返す。時刻t6に於いて、再生側の1ブロックが終了すると、ブロックB4(図7(a))の再生を継続しながら、ステップS3−5へ抜ける。
このときのカウント値246は0に初期化される(ステップS3−5)以下、初期化されたカウント値に基づいて元の音声波形(図3(a))が順次読み出される。その結果、元の音声波形(図7(a))の(B3α)の部分が、削除されることになる。
以上説明したように、本実施例では、ブロック削除再生要求を受け入れると、再生データ生成部20(図5)が、データ読み出し部7(図5)によるADPCMデータの読み出しを監視し、読み出しサンプル番号が現在読み出し中のブロックに於ける最小レベルサンプルのサンプル番号に達するとデータ読み出し部7(図5)によるADPCMデータの読み出しアドレスを現在読み出し中のブロックの一つ後のブロックに於ける最小レベルサンプルが格納されているアドレスまで進ませるのみで、ピッチ周期を求める必要がなくなるので、アルゴリズムが簡単になり、その結果演算回数も激減し、低速な(廉価な)CPUを用いても、音程を変えずに再生スピードを速くすることが可能になるという効果を得る。
以上の説明では、ブロック特性として最小レベルサンプルを求めることとして説明したが、本発明はこの例に限定されるものではない。即ち、ブロック毎に、そのブロック内でサンプルレベルが最大値を示す最大レベルサンプルを抽出し、上記説明における最小レベルサンプルに置き換えることにしても全く同様の効果が得られる。
又、上記説明では、ブロック削除再生要求を受け入れると、再生データ生成部20(図5)が、データ読み出し部7(図5)によるADPCMデータの読み出しを監視し、読み出しサンプル番号が現在読み出し中のブロックに於ける最小レベルサンプルのサンプル番号に達するとデータ読み出し部7(図5)によるADPCMデータの読み出しアドレスを現在読み出し中のブロックの一つ後のブロックに於ける最小レベルサンプルが格納されているアドレスまで進ませることとして説明したが、本発明は、この例に限定されるものではない。即ち、データ読み出し部7(図5)によるADPCMデータの読み出しアドレスを現在読み出し中のブロックの複数個後のブロックに於ける最小レベルサンプルが格納されているアドレスまで進ませることとしても良い。
又、上記説明では、ブロック削除再生要求を1回受け入れた場合の動作のみについて説明したが、本発明は、この例に限定されるものではない。即ち、ブロック削除再生要求を複数回繰り返して受け入れた場合には、上記動作を複数回実行することによって、所望回数、再生速度を速くすることも可能である。
更に、上記再生データ生成部20(図5)に実施例1に於ける再生データ生成部10(図1)の機能を併有させることも可能であり、かかる場合には、再生ピッチを遅くしたり、速くしたり、自由自在に再生速度を変更することが可能になる。
以上の説明では、本発明をADPCMデータに適用する場合に限定して説明したが、本発明は、この例に限定されるものではない。即ち、PCMデータについても適用することが出来る。
実施例1による音声録音再生装置の機能ブロック図である。 実施例1の動作フローチャート(録音側)である。 実施例1の動作原理説明図である。 実施例1の動作フローチャート(再生側)である。 実施例2による音声録音再生装置の機能ブロック図である。 実施例2の動作フローチャート(録音側)である。 実施例2の動作原理説明図である。
符号の説明
1 ブロック構成部
2 A/D変換部
3 ADPCM変換部
4 ブロック特性抽出部
5 データ格納管理部
6 記憶部
6−1 ブロック特性格納領域
6−2 音声データ格納領域
7 データ読み出し部
8 ADPCM逆変換部
9 D/A変換部
10 再生データ生成部
11 制御部
12 ブロック長変更部

Claims (9)

  1. 音声信号を受け入れて、所定長のブロックに分解するブロック構成部と、
    前記ブロック毎に、該ブロックの先頭から後尾まで、サンプル番号順にサンプルレベルをディジタル変換するディジタル変換部と、
    前記ブロック毎に該ブロック内で最小のレベルを示す最小レベルサンプルのサンプル番号と、該最小レベルサンプルの中間データとからなるブロック特性データを取得するブロック特性抽出部と、
    前記ディジタル変換部が変換したディジタルデータと、前記ブロック特性抽出部が取得した前記ブロック特性データとを格納する記憶部と、
    前記記憶部が格納するディジタルデータを順次読み出して再生処理させるデータ読み出し部と、
    ブロック追加再生要求を受け入れると、前記データ読み出し部によるディジタルデータの読み出しを監視し、読み出しサンプル番号が、読み出し中のブロックに於ける最小レベルサンプルに達すると、前記データ読み出し部によるディジタルデータの読み出し位置を前記読み出し中のブロックの前のブロックに於ける最小レベルサンプルの位置まで戻す再生遅延データ生成部とを備えることを特徴とする音声録音再生装置。
  2. 請求項1に記載の音声録音再生装置に於いて、
    前記再生遅延データ生成部に換えて、ブロック削除再生要求を受け入れると、前記データ読み出し部によるディジタルデータの読み出しを監視し、読み出しサンプル番号が、読み出し中のブロックに於ける最小レベルサンプルに達すると前記データ読み出し部によるディジタルデータの読み出し位置を前記読み出し中のブロックの後ろのブロックに於ける最小レベルサンプルの位置まで進ませる再生加速データ生成部を備えることを特徴とする請求項1に記載の音声録音再生装置。
  3. 音声信号を受け入れて、所定長のブロックに分解するブロック構成部と、
    前記ブロック毎に、該ブロックの先頭から後尾まで、サンプル番号順にサンプルレベルをディジタル変換するディジタル変換部と、
    前記ブロック毎に該ブロック内で最大のレベルを示す最大レベルサンプルのサンプル番号と、該最大レベルサンプルの中間データとからなるブロック特性データを取得するブロック特性抽出部と、
    前記ディジタル変換部が変換したディジタルデータと、前記ブロック特性抽出部が取得した前記ブロック特性データとを格納する記憶部と、
    前記記憶部が格納するディジタルデータを順次読み出して再生処理させるデータ読み出し部と、
    ブロック追加再生要求を受け入れると、前記データ読み出し部によるディジタルデータの読み出しを監視し、読み出しサンプル番号が、読み出し中のブロックに於ける最大レベルサンプルに達すると前記データ読み出し部によるディジタルデータの読み出し位置を前記読み出し中のブロックの前のブロックに於ける最大レベルサンプルの位置まで戻す再生遅延データ生成部とを備えることを特徴とする音声録音再生装置。
  4. 請求項3に記載の音声録音再生装置に於いて、
    前記再生遅延データ生成部に換えて、ブロック削除再生要求を受け入れると、前記データ読み出し部によるディジタルデータの読み出しを監視し、読み出しサンプル番号が、読み出し中のブロックに於ける最大レベルサンプルに達すると前記データ読み出し部によるディジタルデータの読み出し位置を前記読み出し中のブロックの後ろのブロックに於ける最大レベルサンプルの位置まで進ませる再生加速データ生成部を備えることを特徴とする音声録音再生装置。
  5. 請求項1から請求項4までの何れか一項に記載の音声録音再生装置に於いて、
    前記ディジタル変換部が変換したディジタルデータと、前記ブロック特性抽出部が取得した前記ブロック特性データとを各ブロック毎に対応付けて前記記憶部に格納するデータ格納管理部を更に備えることを特徴とする音声録音再生装置。
  6. 音声信号を受け入れて、所定長のブロックに分解するステップと、
    前記ブロック毎に、該ブロックの先頭から後尾まで、サンプル番号順にサンプルレベルをディジタル変換するステップと、
    前記ブロック毎に該ブロック内で最小のレベルを示す最小レベルサンプルのサンプル番号と、該最小レベルサンプルの中間データとからなるブロック特性データを取得するステップと、
    変換されたディジタルデータと、前記ブロック特性データとを対応させて、所定のメモリに格納するステップと、
    前記所定のメモリから前記ディジタルデータを順次読み出して再生処理させるステップと、
    ブロック追加再生要求を受け入れると、ディジタルデータの再生処理を監視し、再生処理するサンプルの番号が、読み出し中のブロックに於ける最小レベルサンプルの番号に達すると、ディジタルデータの読み出し位置を前記読み出し中のブロックの前のブロックに於ける最小レベルサンプルの位置まで戻す再生遅延データ再生ステップとを備えることを特徴とする音声録音再生方法。
  7. 請求項6に記載の音声録音再生方法に於いて、
    前記再生遅延データ再生ステップに換えて、ブロック削除再生要求を受け入れると、ディジタルデータの再生処理を監視し、再生処理するサンプルの番号が、読み出し中のブロックに於ける最小レベルサンプルの番号に達すると、ディジタルデータの読み出し位置を前記読み出し中のブロックの後のブロックに於ける最小レベルサンプルの位置まで進ませる再生加速データ再生ステップを備えることを特徴とする音声録音再生方法。
  8. 音声信号を受け入れて、所定長のブロックに分解するステップと、
    前記ブロック毎に、該ブロックの先頭から後尾まで、サンプル番号順にサンプルレベルをディジタル変換するステップと、
    前記ブロック毎に該ブロック内で最大のサンプルレベルを示す最大レベルサンプルのサンプル番号と、該最大レベルサンプルの中間データとからなるブロック特性データを取得するステップと、
    変換されたディジタルデータと、前記ブロック特性データとを対応させて、所定のメモリに格納するステップと、
    前記所定のメモリから前記ディジタルデータを順次読み出して再生処理させるステップと、
    ブロックの追加再生要求を受け入れると、ディジタルデータの再生処理を監視し、再生処理するサンプルの番号が、読み出し中のブロックに於ける最大レベルサンプルの番号に達すると、ディジタルデータの読み出し位置を前記読み出し中のブロックの前のブロックに於ける最大レベルサンプルの位置まで戻す再生遅延データ再生ステップとを備えることを特徴とする音声録音再生方法。
  9. 請求項8に記載の音声録音再生方法に於いて、
    前記再生遅延データ再生ステップに換えて、ブロック削除再生要求を受け入れると、ディジタルデータの再生処理を監視し、再生処理するサンプルの番号が、読み出し中のブロックに於ける最大レベルサンプルの番号に達すると、ディジタルデータの読み出し位置を前記読み出し中のブロックの後のブロックに於ける最大レベルサンプルの位置まで進ませる再生加速データ再生ステップを備えることを特徴とする音声録音再生方法。
JP2004269227A 2004-09-16 2004-09-16 音声録音再生装置 Pending JP2006084754A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004269227A JP2006084754A (ja) 2004-09-16 2004-09-16 音声録音再生装置
US11/226,214 US20060077844A1 (en) 2004-09-16 2005-09-15 Voice recording and playing equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004269227A JP2006084754A (ja) 2004-09-16 2004-09-16 音声録音再生装置

Publications (1)

Publication Number Publication Date
JP2006084754A true JP2006084754A (ja) 2006-03-30

Family

ID=36145159

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004269227A Pending JP2006084754A (ja) 2004-09-16 2004-09-16 音声録音再生装置

Country Status (2)

Country Link
US (1) US20060077844A1 (ja)
JP (1) JP2006084754A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008197254A (ja) * 2007-02-09 2008-08-28 Yamaha Corp 音声の圧縮符号化および復号化のための方法および装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8332528B2 (en) * 2008-11-18 2012-12-11 Agere Systems Llc Personal broadcast and content delivery engine

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60216393A (ja) * 1984-04-12 1985-10-29 ソニー株式会社 情報処理装置
JPS61121539A (ja) * 1984-11-16 1986-06-09 Nec Corp 音声信号再生回路
JPH04219797A (ja) * 1990-12-20 1992-08-10 Sanyo Electric Co Ltd 時間軸圧縮伸長方法
JP2004279906A (ja) * 2003-03-18 2004-10-07 Nec Micro Systems Ltd データ再生方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5355430A (en) * 1991-08-12 1994-10-11 Mechatronics Holding Ag Method for encoding and decoding a human speech signal by using a set of parameters
US5920842A (en) * 1994-10-12 1999-07-06 Pixel Instruments Signal synchronization
EP0944036A4 (en) * 1997-04-30 2000-02-23 Japan Broadcasting Corp METHOD AND DEVICE FOR DETECTING LANGUAGE AREAS, AND METHOD AND DEVICE FOR LANGUAGE SPEED CONVERSION
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
CN1240051C (zh) * 2001-04-09 2006-02-01 皇家菲利浦电子有限公司 语音增强设备
JP2002330075A (ja) * 2001-05-07 2002-11-15 Matsushita Electric Ind Co Ltd サブバンドadpcm符号化方法、復号方法、サブバンドadpcm符号化装置、復号装置およびワイヤレスマイクロホン送信システム、受信システム
EP1386312B1 (en) * 2001-05-10 2008-02-20 Dolby Laboratories Licensing Corporation Improving transient performance of low bit rate audio coding systems by reducing pre-noise
JP2005151007A (ja) * 2003-11-13 2005-06-09 Matsushita Electric Ind Co Ltd 無線伝送方法とそれに用いる送信装置および受信装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60216393A (ja) * 1984-04-12 1985-10-29 ソニー株式会社 情報処理装置
JPS61121539A (ja) * 1984-11-16 1986-06-09 Nec Corp 音声信号再生回路
JPH04219797A (ja) * 1990-12-20 1992-08-10 Sanyo Electric Co Ltd 時間軸圧縮伸長方法
JP2004279906A (ja) * 2003-03-18 2004-10-07 Nec Micro Systems Ltd データ再生方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008197254A (ja) * 2007-02-09 2008-08-28 Yamaha Corp 音声の圧縮符号化および復号化のための方法および装置

Also Published As

Publication number Publication date
US20060077844A1 (en) 2006-04-13

Similar Documents

Publication Publication Date Title
JPH0659900U (ja) 電子歌伴奏器の点数評価表示装置
KR950009596A (ko) 노래반주용 비디오 기록재생장치 및 방법
CN108242238B (zh) 一种音频文件生成方法及装置、终端设备
KR950009665A (ko) 화속 변환 장치
RU2005125916A (ru) Устройство и способ для произнесения фонем и клавиатура для этого устройства
JP3402748B2 (ja) 音声信号のピッチ周期抽出装置
JP2006084754A (ja) 音声録音再生装置
JP5223843B2 (ja) 情報処理装置およびプログラム
US5886277A (en) Electronic musical instrument
JPS59113500A (ja) 相関関数計算装置
JPH11175096A (ja) 音声信号処理装置
JP5146434B2 (ja) 録音再生装置
JP2008518248A (ja) Midiファイルを再生する装置及び方法
JPS6029800A (ja) 音声分析方式
JP3201327B2 (ja) 録音再生装置
JPS60119672A (ja) 楽器音符号の読出装置
KR100410863B1 (ko) 캡션카셋트플레이어에서문장단위로반복재생방법
JP2594782B2 (ja) 電子楽器
JP3321578B2 (ja) 音声合成案内装置
JPH08292796A (ja) 再生装置
JP2532230Y2 (ja) 電子楽器の波形記憶装置
JP2626473B2 (ja) 電子楽器の入力制御装置
JPH04301700A (ja) デジタル音声信号再生装置
KR950007857B1 (ko) 전자악기의 역음발생장치
JPH052999B2 (ja)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070209

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20081126

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091027

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100511