JPS58114306A - 音声記録再生方式 - Google Patents

音声記録再生方式

Info

Publication number
JPS58114306A
JPS58114306A JP56213020A JP21302081A JPS58114306A JP S58114306 A JPS58114306 A JP S58114306A JP 56213020 A JP56213020 A JP 56213020A JP 21302081 A JP21302081 A JP 21302081A JP S58114306 A JPS58114306 A JP S58114306A
Authority
JP
Japan
Prior art keywords
waveform
signal
repetition
section
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56213020A
Other languages
English (en)
Inventor
Eiji Kira
吉良 英司
Kazuo Kitagawa
北川 和雄
Kenjiro Endo
遠藤 謙二郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Tokyo Shibaura Electric Co Ltd filed Critical Toshiba Corp
Priority to JP56213020A priority Critical patent/JPS58114306A/ja
Publication of JPS58114306A publication Critical patent/JPS58114306A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の技術分野 この発明は、再生音声のピッチ周波数を変えることなく
再生時間のみを伸縮可能とした曾声記録鼻生方式1;蘭
する・ 発明の技術的背景とその問題点 音声の記録、J!)生において再生時間を伸縮する最も
簡単な方法は、記録媒体としてのS気テープ等の走行速
度’jff&えることである・例えば再生時のテープ走
行速1fV記録時の2倍とすれば再生時間は1/2とな
り、テープ走行速度を1/2とすれば再生時間は2倍と
なる・しかじ。
この場合再生される音声はピッチ周波数もれぞれ2倍、
1/2となるため、非常感二聞き6二くいものとなって
しまう・ そこで、ピップ周波数はkえず(二貴生時間のみを伸縮
させる方法として、一定時間麺に一定時間幅の曾声伯号
技形t’切り出してこれらをくり返し再生したり、数ブ
ロック毎感=切り捨てて再生時間を伸線するものが考え
られている・しかしながら、この方法は再生波形の結合
部で不連続が生じ−て歪が発生し紡くなるはかりでなく
子音部に対しても同様の処理を行なっているため一自然
性、明瞭度が低下する欠点がある。
発明の目的 この発明の目的は、自然性や明瞭度の低下を伴うことな
く、ピップ周波数を一定C;保ったまま画先−間を伸縮
することができる音声記録再生方式を提供することであ
る・ 発明の概養 この発明は、音声信号をその波形のくり返しを利用して
圧縮して記録し、再生時に記録時の圧縮率と巣なる伸長
率で伸長することによって。
再生時間を伸縮することを骨子としている・さら醒−具
体的には、音声信号の有音区間のうち波形のくり返しが
検出された区間は、所定のくり返し回数N毎にそのN回
のくり返しの中での1つの単位波形を抽出して記録する
と共6二。
その本位波形の′各々なNとは異なる回数楓すっくり返
して再生し、くり返しが検出されない区間は音声信号の
波形をそのまま記録し再生するものである・これによっ
て再生時間はM/N  の比で伸縮することになる・ 発明の効果 この発明≦;よれば、音声信号のくり返し区間における
単位波形の時間長は記録時と再生時とで変らないので、
ピッチ周波数も変化しない・まだ、くり返しが検出され
た区間の単位波形を記録してくり返し再生を行なうため
、Jl)生妓形の結合部で不連続が生ずることがなく、
しかも明瞭度、自然性を大きく左右する子音部はそのま
ま記録再生されるので、再生音声の劣化は非常に少ない
この発明C二係る音声記録再生方式の有効性は。
音声信号の性質を考慮すれは明らかである・今。
日本語を例(二とると、単母首のみの童、(子音+母音
)の會、および子並のみの酋の3MfllAの音によっ
て構成されている・これらのうち母音のみの音は”アイ
ウエオ1の5つ、子音のみの會は“ン“のみで、f!i
Lりはすべて(千會+母音)の旨である・ 母音と子音とでは性質が大きく輿なり、tず母音はその
波形がt順の始めから終りまでほばくり返し波形である
ということである・つまり基本周波aFJ!i、分の周
期でほぼ同−波形力tくり過され1例えば250Hgで
発声された母音の會は4msの周期を持っている・厳密
には基本周波数も時間的に少しずつ変化し、また音節の
始めと終りの部分は振幅が小さくなる性質がある・しか
し例えば20flll程度の短時間でみればこれらはほ
ぼ一定とみなせる・従って、この発明の4回毎5:その
4回のくり返しの中での音声信号の単位波形の1つな代
表波形として扱っても。
再生音声の自然性はあまり損なわれない・第11にいく
つかの代表的な(子音+母音)の童の振幅包絡線を示す
・図かられかるように子音の継続時間は檀々異なる・し
かじ、音声の発声速度が皺っだ場合のその継続時間の変
化は母音のそれほど大きくなく、童の種類のみに応じた
一定のil!続峙間を持つと考えることができ、またく
り返しが検出されない子音の時間的割合は欽々たるもの
であるから、その区間圧縮が行なわれなくとも、全体と
しての圧縮効率は十分である。従って、tP伯号を記録
するメモリ等の移置を小さくすることができる。
発明の実施例 M2INはこの発明の一実施例V説明するための音声記
録再生装瀘の構成を示すものである・図において、入力
端子1に与えられる音声信号2はエンコーダjに導かれ
て符号化される。この符号化方式は、PCM 、DPC
M%どのようなものでもよい・音声信号2は有金区間か
無音区間かを判別する有−7無音判別回路−に一人力さ
れる・この判別回路4は例えはレベルセンψと、このセ
ン夛出力を虐当なスレツレヨルドレベルでレベル利足し
て1例えば有音区間のとき一万、エンコーダ1の出力は
くり返し検出−5と(−号処理装置1i16に供給され
る・くり返し検出器6は音声信号Sの葭形のくり返しく
ピッチ情輸)の有無を検出するもので、くり返しt検出
する毎にくり返し検出パルス「を発生する・このくり返
し検出!1!5は例えば公知の自己相関器その他の構成
I:よって冥f@すれるが、その検出性能は例えばLP
−C方式4=おける程高い必−要はなく、くり返しが検
出できなければそこでの圧s本が少々低下するのみであ
って、再生音声の品實−には影響を与えない・ くり返し検出器5からのくり返し検出パルス百は、有曾
無曾判別信号Vと共6:、偵号処理装龜6へ圧縮のため
の制御信号として与えられる・偵号処m装置i−はこの
例ではマイクロコンピューター−より構成され、演算、
制御を行なうマイクロプロセッサ1と、エンコーダ1よ
りの符号化された音声信号データを一定のアルゴリズム
で編集するためのプログラムを格納した10M8と、プ
ログラム実行時に必要となるデータの一時格納用のRA
M#と、各部へのクロック信号Lxt−発生するクロッ
ク発生@111等を含んでいる・ 信号処理装WL1は有量/S音判別信号Vとくり返し検
出信号百6;応じて、エンコーダ1よりの音声信号デー
タ(波形情栂)VRAMよりなるバッファメモリttに
一時格納しては圧縮のための編集を行なってメモ911
g”ニー書込むという操作を逐次少しずつ行なう・ メモ912に蓄積されたデータは適宜続出され、デコー
ダ11によって第4図に示した各データに従い再生時間
が伸縮した音声個号14として再生される。
次(:、この実施例の動作を説明する・信号魁理装g7
Hでの処理内容は、@3図、第45!ll中に示すA、
B、C,Dの4区間によって場合分けされる・第3図は
有音/無音判別信号yと、くり返し検出パルス「の例を
示し、第4図はA。
B、C,Dの各区間においてメモ9Jjg:蓄穂される
データ内容を示している・ Yが高レベルとなる無音区間であるA区関曝:おいては
マイクロプロセッサ1はVが低レベルとなる有音区間の
始点までの間クロック信号CK(エンコーダ1のサンプ
ルクロック)をカクソートシ、そのカウント値を無音区
間の時間長デーJPNとして、無音区関鋤別コードPと
共(:メモリ12へ書込む・ 一方、有童区間であるB、C,D区間のうちB区間は、
有量区間始点より最初C(り返しが検出された時点まで
の主署−子1゛部に相当する区間で、この区間ではマイ
クロプロセッサrは有音区間始点から音声信号データを
そのデータ長をカウントしながらバッファメモ911へ
先願番地より順次格納していき、B区間の終りの時点で
バッファメモ9t1へ格納された音声信号データ(波形
情報)QDと、カウントによって得られた時間長データ
QNをくり返し非検出コードQと共に主メモ91Mへ書
込む・即ち、このB区間では圧縮は行なわれない・ 次1:、C区間はくり返しがほぼ一定周期で検出されて
いる区間で、主−二母音部に相当する区間である・この
C区間では、マイクロプロセッサ1はくり返し検出パル
ス81にカウントし、かつ「の発生時点での音声信号デ
ータの位置を配録しながら、バッファメモリ11へ音声
信号データを格納する・この場合、lii]のC区間の
編集処理は既(−終っているため、バッファメモj 1
7は先順番地よりフルに使用できる・マイクロプロセッ
サ1はくり返し検出パルスiをN個、この例では4個カ
ウントすると、例えば3個目から4個目までの間の音声
信号データをその4回のくり返しの中での単位波形のデ
ータMIDとして、これとその時間長データRNv<:
り返し検出コードR(これはデータが圧縮されているこ
とを表わす)と共1:メモ91zへ畳込む・以下。
くり返しがほぼ一定周期で検出されている間は。
C区間として同様の処理がくり返し行なわれる・こうし
て、C区間−二おいては音声信号データが1iNcユの
例では1/4 ) 4:圧縮されてメモリ124:蓄積
される・ 最後CD区間は、くり返しがNヰ4回検出畜れる前に無
音区間感ニなってしまったときである・このD区間での
処理としては1例えば初期のうちはC区間と同様にバッ
ファメモリ11に音声信号データを格納しつつ、無音区
閲感=なった時点でバッファメモ91tに格納されてい
た音声信号データと、その時間長データをくり返し非検
出コードをB区間と同様にメモ9izへ書込む・従って
、このD区間では圧縮は行なわれない・ なお、D区間での処理の他の形式として、その肋のむ区
間が時間的に長彎て母音情報が十分メモリ77≦:蓄積
されている場合は、とのD区間を次の無音区間の一部と
みなして処理してもよい・このようにすると、自然性に
多少の劣化はきたしても明瞭性は十分確保されるので、
圧縮率をより下げる上では有効である・ 14として再生される・この場合、デコーダ11はメモ
9tzよりくり返しが検出された第4因の6C区間のデ
ータが与えられると、このC区間における単位波形のデ
ータRDの各々なM(MNN)回ずつくり返して復号再
生する・これによって、デコーダ11から時間軸、つま
り再生時間がM/N に伸縮された音声信号14が得ら
れる・即ち、この例ではN=4であるから、例tばM=
5とすれば再生時間は5/4に伸長され。
またM−3とすれば再生時間は3/4に短縮されること
C:なる・ ロセツ夛等を通して制御信号C8を与えて1Mの値を可
変とすることもできる・このようにすれば、使用者の希
望に応じて再生時間の伸長。
短縮の選択、および伸縮率の選択を任意に行なうことが
可能となる。
一方、メモ9txから有音区間の5ちくり返しの検出さ
れなかった第4凶のB区間あるいはD区間のデータが与
えられると、デコーダ11はこのB、D区間における音
声信号波形のデータQDをそのまま復号両生する・ また、メモリJ2かう第4図Aの無音区関ムのデータが
与えられた場合、その時間長データPNで与えられた時
間だけ無音処理してもよいが、この時間なN7Mに合せ
て伸縮して無音処理すればさらに自然性を増すことがで
きる・このよう&:、この発明では有音区間4一ついて
はくり返しが検出された区間のみで再生時間の伸縮を行
ない、子音部を主とするくり返しの検出されない区間は
そのまま配録再生を行なう、ため、明瞭度、自然性を損
なうことが少ない・まだ、再生時間の伸縮はくり返し再
生部分のくり返し回数−の選択4=よって達成され、音
声信号のくり返し区間の単位波形そのものの時間軸は伸
縮されないため、ピッチ周波数が変ることがなく、聞き
易い再生音声が得られる・ このように、この発明では音声信号の有音区間のうちの
時間的−二人部分を占める母を部等のくり返しが良好6
:検出される部分は1/Nに圧縮し、くり返しが検出さ
れない子音部は音声信号の波形情報をそのまま出力する
ため、再生音声の明瞭度等の劣化の少ない効率的な圧縮
が可能となる・これによって音声信号データを記憶する
メモリの容量を効率よく使用でき、コスト面で極めて有
利となる。
この発明において、記録時C:おけるNの値はくり返し
の単位波形がほぼ一定とみなせる最小の値(この値は声
の質等によって異なるが、大体#前後である)以下であ
ることが望ましく。
この範囲にNを選べば再生時の音声信号波形の結合部の
連続性はより向上し、歪のない再生音声が得られる・従
って、Nの値は小さい程よいが、メモリ容置はそれだけ
増えるので、それも考慮してNの値を劇ぶ必要があろう
・ なお、第2図の実施例ではくり返しの検出と。
有金区間と無音区間の判別をハードウェアC;よって実
現したが、マイクロプロセツサrを含む信号処理装置に
ソフトウエア6二よってその機能を持たせてもよい・そ
の場合、tR紀実施例の如く実時間処理が可能かどうが
か間軸となるが、例えば無量区間は主シ;その時間長の
カウントのみが必要で西って、処理時間としては十分が
り余りある区間であり、しかも音声信号の中で無量区間
が占める時間的割合は大きいことを考慮すれば1問題な
い・即ち1例えば連続する有量区間と無音区間を1ブロ
ツクと考えると、処理速度の遍いマイクロプロセッサを
用いてくり返しの検出と有量/無奮区間の判別をソフト
ウェアで実行し、かつ圧縮処理を行なう場合、有量区間
では実時間処理が不可能でも、その不可能この発明は1
日本語のみならず外13i語の音声信号1;対しても有
効であることはいうまでもない・
【図面の簡単な説明】
第1−は子音◆母音の包絡線波形を示す因、1B!脂は
この発明の一実施例の構成図、1113図はその動作を
説明するためのタイムチャート。 lI411は同実施例において編集されメモリに蓄積さ
れるデータの構成を示す因である・1・・・音声信号入
力端子、1・・・エンコーダ、4・・・有音/無童判別
回路、j・・・くり返し検出器。 −・・・信号処理装置、r・・・マイクロプロセッサ。 −i lx =バッフアメそり、IM・・・メモリ、J
J・・・ζ潰−ダ。 出願人代理人 弁理士 鈴 江 武 彦3m5 1図

Claims (1)

  1. 【特許請求の範囲】 0) 音声信号の有音区間のうち波形のくり返しが検出
    された区間は所定のくり返し回数N毎にそのN回のくり
    返しの中での1らの単位波形を抽出して記録すると共に
    、その単位波形の各々なNとは興なる回数Mずつくり返
    して再生し、くり返しが検出されない区間は音声信号の
    波形なそ−のまま記録し再生することを特徴とする音声
    記録再生方式。 a)再生時の単位波形の各々の再生くり返し回数Ml可
    変としたことを特徴とする特許請求の範囲第1項記載の
    音声記録両生方式・
JP56213020A 1981-12-26 1981-12-26 音声記録再生方式 Pending JPS58114306A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56213020A JPS58114306A (ja) 1981-12-26 1981-12-26 音声記録再生方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56213020A JPS58114306A (ja) 1981-12-26 1981-12-26 音声記録再生方式

Publications (1)

Publication Number Publication Date
JPS58114306A true JPS58114306A (ja) 1983-07-07

Family

ID=16632169

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56213020A Pending JPS58114306A (ja) 1981-12-26 1981-12-26 音声記録再生方式

Country Status (1)

Country Link
JP (1) JPS58114306A (ja)

Similar Documents

Publication Publication Date Title
JPH10187188A (ja) 音声再生方法と音声再生装置
JPS5982608A (ja) 音声の再生速度制御方式
JPS58114306A (ja) 音声記録再生方式
JP2000081897A (ja) 音声情報の記録方法、音声情報記録媒体、並びに音声情報の再生方法及び再生装置
JPH03205656A (ja) 早聞き装置
JP2001154684A (ja) 話速変換装置
JPS5821798A (ja) 音声再生装置
JP2582762B2 (ja) 無音圧縮音声録音装置
JPH0368399B2 (ja)
JP2838159B2 (ja) 音声信号処理装置
JPS58113999A (ja) 音声記録再生装置
JPS60214399A (ja) 情報処理装置
JP2962777B2 (ja) 音声信号の時間軸伸長圧縮装置
JPH05303400A (ja) 音声再生装置と音声再生方法
JPS6295595A (ja) 音声応答方式
JP2002313015A (ja) 音声再生方法と音声再生装置
JPS6014422B2 (ja) 再生信号圧縮装置
JPH07101360B2 (ja) 音声録音再生装置
JPS5821799A (ja) 音声再生装置
JPH0493900A (ja) 音声録音再生装置
JPH0452480B2 (ja)
JPH0145919B2 (ja)
JPH08255423A (ja) 音声録音装置
JPS59216195A (ja) 音声処理方式
JPS5842096A (ja) 音声信号の雑音抑圧方式