JPS58113999A - 音声記録再生装置 - Google Patents

音声記録再生装置

Info

Publication number
JPS58113999A
JPS58113999A JP56214935A JP21493581A JPS58113999A JP S58113999 A JPS58113999 A JP S58113999A JP 56214935 A JP56214935 A JP 56214935A JP 21493581 A JP21493581 A JP 21493581A JP S58113999 A JPS58113999 A JP S58113999A
Authority
JP
Japan
Prior art keywords
audio signal
memory
converter
repetition
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56214935A
Other languages
English (en)
Inventor
吉良 英司
北川 和雄
遠藤 謙二郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP56214935A priority Critical patent/JPS58113999A/ja
Publication of JPS58113999A publication Critical patent/JPS58113999A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)
  • Telephone Function (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の技術分野 この発明は、音声信号を波形のくり返しを利用して情報
圧縮して記録し再生する装置に関する0 発明の技術的背景とその問題点 近年、コンピュータシステムの小型端末、さらには家電
8郷において、マン・マシンインターフェースとして音
声を発声させるという要求が高まっており、その次めに
音声信号を低ビツトレートで記録し再生する技術が要求
されている。
このような要求に対し、音声信号の情報を圧縮する技術
は大別して2つの方式が知られているo llp 1は
線型予測方式(I、PC)に代表されるような、予め用
意した単語や文章に対して分析を行ない、音声合成に必
要なホルマント情報と、音源情報としての有声/無声音
判別情報および有声音におけるくり返しくピッチ)情報
とt抽出し、これらを合成フィルタの係数および音源入
力として音声を合成する方式であり、第2は音声信号の
波形のくり返しパターンを半ば手動でとらえて音声を合
成する方式(特開昭56−4194等)である。
しかしながら、第1の方式は有声音でピッチ情報を持つ
くり返し波形に対してはピッチ情報の抽出を正確に行な
うことが大前提となる方式であるため、クツテ情報の抽
出に失敗すると原音声を再生するときに雑音を生じたり
、音声の明瞭度を損ねるといった難点がある。また、現
在ではこの方式による分析のために大型コンピュータt
たは相当大規模な専用LSIを必要とし、さらにA質の
音声を再生しようとすると分析結果の補正も必要となる
等から、コスト面で不利である。
一方、第2の方式はピッチ情報の抽出を正確に行なうこ
とに加え、手動操作によりくり返しの単位波形の切り出
しを行なう必要がある^め、実時間での圧縮が困難であ
った。
発明の目的 この発明の目的は、音声信号の波形のくり返しくピッチ
情報)を検出できなかつ次ときでも再生音声の劣化が少
なく、シかも比較的簡単なハードウェアあるいは汎用小
型コンピュータによって圧縮処理を行なうことができ、
さらに実時間処理が可能な音声記録再生装置を提供する
ことである。
発明の概要 この発明に係る音声記録再生装置1よ音声信号をディジ
タル符号化するエンコーダと、このエンコーダから得ら
れる音声信号データを蓄積するためのメモリと、このメ
モリに対し前記音声信号の有音区間のうち波形のくり返
しが検出され九区間は所定のくり返し回数N毎にそのN
回のくり返し回数の中での1ろの単位波形に対応する音
声信号データとその時間長データを蓄積し、くり返しが
検出されない区間はその区間内の音声信号データをその
まま蓄積する手段と、前記メモリから読出される音声信
号データを復号してアナログ音声信号を再生するデコー
ダとを有し、さらに前記メモリから読出される前記時間
長データに基いて前記デコーダへの復号用クロック信号
の周波数を前記デコーダで再生されるアナログ音声信号
のピッチ周波数が連続的に変化するように制御する制抑
手段とを具備することを特徴としている。
発明の効果 この発明によれば、音声信号の波形のくり返しが検出さ
れなかったときは圧縮を行なわないため、くり返しが検
出できないことによる再生音声の自然性や明瞭度の低下
といった劣化が少ない。また、LPC方式に比べて音声
信号から抽出すべき情報が少なくて済み、ま几圧縮の^
めの処理も簡単な九め、ノ・−ドウエアも簡単となり、
マイクロコンピュータの使用も可能となる○さらに、マ
イクロコンピュータのような比較的処理速度の遅いもの
を用いても、実時間での圧縮が可能である0 この発明における音声信号圧縮方式の有効性は、音声信
号の性質を考慮すれば明らかである。
今、日本語を例にとると、かん九んに言えば単母音のみ
の音、(子音→−母音)の音、および子音のみの音の3
種類の音によって構成されてい心。これらのうち母音の
みの音は1アイウエオ”の5つ、子音のみの音は”ン”
のみで、残りはすべて(子音十母音)の音である○ 母音と子音とでは性質が大きく異なり、まず母音はその
波形が音節の始めから終りまでほぼくり返し波形である
ということである。つまり基本周波数成分の周期でほぼ
同一波形がくり返され、例えば250Hzで発声された
母音の音は4 ms  の周期を持っている。厳密には
基本周波数も時間的に少しずつ変化し、また音節の始め
と終りの部分は振幅が小さくなる性質がある。
しかし例えば20m5 程度の短時間でみればこれらは
ほぼ一定とみなせる。従って、この発明のように母音等
の如くくり返しが連続して検出されたときは、所定のく
り返し回数N毎、例えば4回毎にその4回のくり返しの
中での音声信号の単位波形の1つを代表波形として扱っ
ても、再生音声の自然性はあまり損なわれない。
子音については、無声音であるか有声音であみか、を九
閉鎖音か摩擦音か鼻音か等によって、くり返しの有無に
関してもそれぞれ個有の性質がみられる。しかし、この
発明ではくり返しの検出だけを行なえばよく、例えばL
PC方式で必らず必要な有声音/無声音の判別は必要な
い0即ち、子音部に関してはくり返しが検出されたとき
のみ母音部と同様に圧縮全行ない、検出されないときは
波形のすべてを出力することになる。
WJ1図にいくつかの代表的な(子音+母音)の音の振
幅包結線を示す0図かられかるように子音の継続時間は
種々異なる。しかし、音声の発声速度が変つ九場合のそ
の継続時間の変化は母音のそれほど大きくなく、音の種
類のみに応じた一定の継続時間を持つと考えることがで
き、ま次くり返しが検出されない子音の時間的割合は微
々九るものであるから、その区間圧縮が行なわれなくと
も、全体としての圧縮効率は十分である。
ところで、上述したような圧縮方式を用いて、符号化さ
れた音声信号データをメモリに蓄積し次場合、このメモ
リの内容を読出しデコーダで復号してアナログ音声信号
再生する際、単純に一定のクロック信号を用いて復号を
行なうと、くり返し区間における単位波形と次の単位波
形との間で再生音声信号のピッチ周波数が階段的に変化
するという事がおこりうる几め、明瞭度や自然性を損な
うことが考えられる。しかしながら、この発明ではくり
返しの単位波形の時間長データを利用して復号用クロッ
ク信号の周波数を制御することによって、ピッチ周波数
を連続的変化させるため、この問題が解決し、明瞭度、
自然性のより一層の向上を図ることが可能である。
発明の実施例 第2図はこの発明の一実施例娶説明するための音声記録
再生装置の構成を示すものである0図において、入力端
子1に与えられる音声信号2はエンコーダ3に導かれて
符号化される。この符号化方式はPCM、DPCM、D
M等どのようなものでもよい。音声信号2は有音区間か
無音区間か七判別する有音/無音判別信号4にも入力さ
れる○この判別回路4は例えばレベルセンナと、このセ
ンナ出力を適当なスレッシ舊ルドレベルでレベル判定し
て、例えば有音区間の一方、エンコーダ3の出力はくり
返し検出器5と信号処理装置5に供給される0くり返し
検出器5は音声信号2の波形のくり返しくピッチ情報)
の有無を検出するもので、くり返しを検出する毎にくり
返し検出パルスSt−発生するOこのくり返し検出器5
は例えば公知の自己相関器その他の構成によって実現さ
れるが、その検出性能は例えばLPC方式における程高
い必要はなく、くり返しが検出できなけtばそこでの圧
縮率が少々低下するのみであって、再生音声の品質には
影響を与えない。
くり返し検出器5からのくり返し検出パルスiは、有音
/無音判別信号Yと共に、信号処理装置16へ圧縮の次
めの制御信号として与えらtる。信号処理装置Cはこの
例ではマイクロコンピュータにより構成され、演算、制
御を行なうマイクロプロセラf7と、エンコーダ3より
の符号化された音声信号データを一定のアルゴリズムで
編集するためのプログラムを格納し九ROMgと、プロ
グラム実行時に必要となるデータの一時格納用のRAM
!9と、各部へのクロック信号CKvl−発生するクロ
ック発生器10等を含んでいる。
信号処理装置1は有音/無音判別信号Tとくり返し検出
信号Sに応じてエンコーダ3よりの音声信号データ(波
形情報)をRAMよりなるバッファメモリ1ノに一時格
納しては圧縮のための編集を行なってメモリ12に書込
むという操作を遂次束しずつ行なう。
メモリ12に蓄積されたデータは適宜読出され、デコー
ダ13により復号されてアナログ音声信号14が再生さ
れる0デコーダ13に与えられる復号用クロック信号の
制御手段については後述する。
′?!に、′TK1この実施例の動作を説明する。信号
処理装置6での処理内容は、第3図、第4図中に示すA
、B、C,Dの4区間によって場合分けされる。第3図
は有音/無音判別信号Yと、〈1り返し検出パルス百の
例を示し、第4図はA。
B、C,Dの各区間においてメモリ12に蓄積されるデ
ータ内容を示している。
Fが高レベルとなる無音区間であるA区間においてはマ
イクロプロセッサ8はTが低レベルとなる有音区間の始
点までの間クロック信号CK(エンコーダ3のサンプル
クロック)t″カウント、そのカウント値を無音区間の
時間長データPNとして、無音区間識別コードPと共に
メモリ12へ書込む。
一方、有音区間であるB、C,D区間のうちB区間は、
有音区間始点より最初にくり返しが検出された時点まで
の主に子音部に相当する区間で、この区間ではマイクロ
プロセッサrは有音区間始点から音声信号データをその
データ長をカウントしながらバッファメモリ1ノへ先頭
番地より順次格納していき、B区間の終りの時点でバッ
ファメモリ11へ格納された音声信号データ(波形情報
)QDと、カウントによって得られた時間長データQN
をくり返し非検出コードQと共に主メモリ12へ書込む
。即ち、このB区間では圧縮は行なわれない。
次に、C区間はくり返しがほぼ一定周期で検出されてい
る区間で、主に母音部に相当する区間である0このC区
間では、マイクロプロセラf7はくり返し検出パルスs
lカウントし、かつSの発生時点での音声信号データの
位置を記録しながら、バッファメモリ11へ音声信号デ
ータを格納する。この場合、前のC区間の編集処理は既
に終っているため、バッファメモリ1ノは先頭番地より
フルに使用できる。マイクロプロセッサ7はくり返し検
出パルス5)5−N個この例では4個カウントすると、
例えば3個目から4個目までの間の音声信号データをそ
の4回のくり返しの中での単位波形の情報RDとして、
これとその時間長データRNj(り返し検出コードR(
これはデータが圧縮されていることを表わす)と共にメ
モリ12へ書込む0以下、くり返しがほぼ一定周期で検
出されている間は、C区間として同様の処理がくり返し
行なわれる。
こうして、C区間においては音声信号データが1/N(
この例ではl/4)に圧縮されてメモリ12に蓄積され
る。
最後にD区間は、くり返しがN=4回検量検出る前に無
音区間になってしまったときである。
このD区間での処理としては、例えば初期のうちはC区
間と同様にバッファメモリ1ノに音声信号データを格納
しつつ、無音区間になり九時点でバッファメモリ11に
格納されてい友音声信号データと、その時間長データを
くり返し非検出コードliB区間と同様にメモリ12へ
書込む。従って、このD区間では圧縮は行なわれない0 なお、D区間での処理の他の形式として、その前のC区
間が時間的に長くて母音情報が十分メモリI2に蓄積さ
れている場合は、このp区問を次の無音区間の一部とみ
なして処理しても工い。このようにすると、自然性に多
少の劣化はきたしても明瞭性は十分確保されるので、圧
縮率をより下げる上では有効である。
こうしてメモリ12に蓄積され九データは、適宜読出さ
れ、デコーダ13に入力される。デコーダ13ではメモ
リ12よりくり返しが検出された1g4図のC区間のデ
ータが与えられると、このC区間における単位波形のデ
ータRDの各々iN回ずつくり返して復号し、ま九くり
返しの検出されない第4図のBあるいはp区間のデータ
に対しては音声信号波形のデータQDをそのまま1回ず
つ復号し、さらに無音区間Aのデータに対しては時間長
データPNで与えられる時間だけ無音処理紮行なう。こ
れらの処理は復号用クロック信号CK’に従って行なわ
れる。
1g5図の51.52は復号用クロック信号CK’の周
波数を一定とした場合の、原音声信号2および再生音声
信号14のピッチ周波数jp の時間的変化を示したも
のである。なお、との図でtはくり返しが検出され次区
間における単位波形の時間長、Tは各単位波形がN回ず
つ復号される一時間長、fPoはピッチ基本周波数を示
している。この図かられかるように、原音声信号のピッ
チ周波数変化は5ノのように連続的であるが、再生音声
信号のピッチ周波数は時間T内では一定であるが、全体
としては時間T毎に階段的に変化する。音声の統計的な
性質により、ピッチ周波数およびピッチの高周波成分の
変化速度は10ns  〜20 ms  程度で、また
に時ピッチ周波継の変化fIjRは平均とツテ周波数の
20%程度であるが、これらはあくまで平均的なデータ
であって、ピッチ周波数が時間的に大きく変化する発声
をし次場合には、再生音声信号の時間T毎のピッチ周波
数の階段的な変化幅も大きくなり、自然性の劣化は無視
できない〇そこで、第2図、Q実施例では次のようにし
て再生音声信号14のピッチ周波数の変化を清らかにし
ている。即ち、メモリ12から読出されるデータのうち
、第4図のくり返しが検出され1yC区間における単位
波形の時間長データRNがラッチ回路15を通してD/
A  コンバータ16に入力され、アナログ電圧に変換
される。
1g6図(a)は第5図と同様な原音声信号2および再
生音声信号のピッチ周波数fp  の変化61゜62を
示したものである。但し、第6区(a)の62は復号用
クロック信号CK’li一定とした場合である。この第
6図(&)に対応させてA/Dコンバータ16の出力電
圧の変化を示すと第6図(b)のようになる。このD 
/ A  コンバータ16の出力電圧はピッチ周期に対
応している。このD/A  コンバータ16の出力は平
均ピッチ周期の1/2程度の時定数を持つ9分回路17
によってlp、6図(c)のように微分され、これが復
号用クロック信号CK’ i発生する電圧制御発振器(
vco)18に制御電圧として与えられる。
ここで、微分回路11の出力のw、6図(c)に示す各
電圧値+vI + vO+ −■+ * −vl  に
は次の意味を持たせる。llS7図はVCo、18の入
出力特性を示しており、入力voに対する復号用クロッ
ク信号CK’の周波数f。がエンコーダ3で用いた符号
化用クロック信号CKと同一で、他の入力+vI m 
−”l + −vl  に対するCK’の周。
波数f、、f2 、f、は第6因の再生ピッチ周波数変
化62における各単位波形のピッチ周波数の、1つ前の
単位波形のピッチ周波数に対する変化率にl:1で対応
している。この次めには、第6図の区間T、、T、にお
けるピッチ周波数をj P+ # J” ptとすると
、j pt /f P+ = fo /fsの関係が成
立するように、D/A  コンバータ16からvcoi
tHc至る系での定数を設定すればよい。
このようにすると、例えば区間T、の単位波形kf。の
復号用クロック信号で復号り生し次ときのピッチ周波数
と、区間T2の単位波形【f、の復号用クロック信号で
復号再生したときのピッチ周波数とは同一となる。この
結果、萬6図(d)に示すように再生音声信号14のピ
ッチ周波数の変化は62の階段的な変化から63の如き
滑らかな連続的な変化となる。
第8図はこの発明の他の実施例を示すもので、第2図に
おける微分回路170代りに積分回路19と減算回路2
0’lf用いて同様の効果を得るようにしている。第9
図(ル) (b) (c)は第8図のD/Aコンバータ
16、積分回路19、減算回路20の各出力波形を示し
ている。
このように、この発明では音声信号の有音区間のうちの
時間的に大部分を占める母音部等のくり返しが良好に検
出される部分は1/Nに圧縮し、くり返しが検出されな
い子音部は音声信号の波形情報をそのまま出力するため
、再生音声の明瞭度等の劣化の少ない効率的な圧縮が可
能となる。これによって、音声信号データを記憶するメ
モリの容量を効率よく使用でき、コスト面で極めて有利
となる。
そしてさらに、この発明によれば再生音声のピッチ周波
数を連続的に変化させることができる几め、くり返しが
検出されなかった区間は音声信号データをそのまま記録
、再生するようにし九ことと相まって、明瞭度、自然性
にすぐれた高品質の再生音声が得られる。また、再生音
声のピッチ周波数を連続的に変化させる手段があること
は、Nの値を大きくしてより圧縮率を上げることをもあ
まり自然性を劣化させないまま可能とするものである。
なお、第2図の実施例ではくり返しの検出と、有音区間
と無音区間の判別をハードウェアによって実現したが、
マイクロプロセッサ1を含む信号処理装置にソフトウェ
アによってその機能を持たせてもよい0その場合、前記
実施例の如く実時間処理が可能かどうかが問題となるが
、例えば無音区間は主にその時間長のカウントのみが必
要であって、処理時間としては十分かつ余りある区間で
あり、しかもを声信号の中で無音区間が占める時間的割
合は大きいことを考慮すれば、問題ない。即ち、例えば
連続する有音区間と無音区間5iブロツクと考えると、
処理速度の遅いマイクロプロセッサを用いてくり返しの
検出と有音/無音区間の判別をソフトウェアで実行し、
かつ圧縮処理を行なう場合、有音区間では実時間処理が
不可能でも、その不可能な分を無音区間で補なうことに
よって、1ブロツク内では実時間処理が可能となる。
この発明は、日本語のみならず外国語の音声伝号に対し
ても有効であることはいうまでもないC
【図面の簡単な説明】
第1図は子音十母音の音声の包路線波形を示す図、第2
図はこの発明の一実施例の構成図、第3図はその動作を
説明するためのタイムチャート、第4図は同実施例にお
いて編集されメモリに蓄積されるデータの構成を示す、
第5図および館6図は同実施例の動作を説明するための
タイムチャート、第7図は同じ(VCOの入出力特性図
、第8図はこの発明の他の実施例の要部構成図、第9図
は第8図の各部の波形図であるO 1・・・音声信号入力端子、3・・・エンコーダ、4・
・・有音/′無音判別回路、5・・・くり返し検出器、
6・・・信号処理装置、7・・・マイクロプロセッサ、
11・・・パjソファメモリ、12・・・メモリ、13
・・・デコーダ、15・・・ラッチ回路、16・・・D
/A コンバータ1,17・・・微分回路、18・・・
電圧制御発振器、19・・・積分回路、20・・・減算
回路。 出願人代理人 弁理士  鈴 江 武 彦(ka) (ta) (pa) 0m5 1図 (da)

Claims (3)

    【特許請求の範囲】
  1. (1)音声信号をディジタル符号化するエンコーダと、
    このエンコーダから得られる音声信号データを蓄積する
    几めのメモリと、こρメモリに対し前記音声信号の有音
    区間のうち波形のくり返しが検出された区間は所定のく
    り返し回数N毎にそのN回のくり返し回数の中での1つ
    の単位波形に対応する音声信号データとその時間長デー
    タを蓄積し、くり返しが検出されない区間はその区間内
    の音声信号データをそのまま蓄積する手段と、前記メモ
    リから読出される音声信号データを復号してアナログ音
    声信号を再生するデコーダと、前記メモリから読出され
    る前記時間長データに基いて前記デコーダへの機号用ク
    ロック信号の周波数を前記デコーダで再生されるアナロ
    グ音声信号のピッチ周波数が連続的に変化するように制
    御する制御手段とを具備することを特徴とする音声記録
    再生装置。
  2. (2)制御手段は、メモリから読出される前記時間長デ
    ータをアナログ電圧に変換するD/Aコンバータと、こ
    のD/A  コンバータの出力を微分して、デコーダへ
    の復号用クロック信号を発生する電圧制御発振器の制御
    電圧を得る微分回路とから構成されることを特徴とする
    特許請求の範囲第1項記載の音声記録再生装置。
  3. (3)  制御手段は、メモリから読出される前記時間
    長データ音アナログ電圧に変換するD/Aコンバータと
    、このD/A  コンバータの出力とこれを積分する積
    分回路の出力との差會求めて、デコーダへの復号用クロ
    ック信号を発生する電圧制御発振器の制御電圧を得る手
    段とから構成されることを特徴とする特許請求の範囲l
    s1項記載の音声記録再生装置。
JP56214935A 1981-12-26 1981-12-26 音声記録再生装置 Pending JPS58113999A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56214935A JPS58113999A (ja) 1981-12-26 1981-12-26 音声記録再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56214935A JPS58113999A (ja) 1981-12-26 1981-12-26 音声記録再生装置

Publications (1)

Publication Number Publication Date
JPS58113999A true JPS58113999A (ja) 1983-07-07

Family

ID=16664005

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56214935A Pending JPS58113999A (ja) 1981-12-26 1981-12-26 音声記録再生装置

Country Status (1)

Country Link
JP (1) JPS58113999A (ja)

Similar Documents

Publication Publication Date Title
Kubin et al. Performance of noise excitation for unvoiced speech
JP2000511651A (ja) 記録されたオーディオ信号の非均一的時間スケール変更
EP0380572A1 (en) SPEECH SYNTHESIS FROM SEGMENTS OF DIGITAL COARTICULATED VOICE SIGNALS.
JPH01500463A (ja) スピーチ信号データの圧縮方法及びその装置
US5448679A (en) Method and system for speech data compression and regeneration
EP1426926B1 (en) Apparatus and method for changing the playback rate of recorded speech
JPS58113999A (ja) 音声記録再生装置
US6101463A (en) Method for compressing a speech signal by using similarity of the F1 /F0 ratios in pitch intervals within a frame
JP3513030B2 (ja) データ再生装置
JPS58113992A (ja) 音声信号圧縮方式
JPH03205656A (ja) 早聞き装置
El Haddad et al. Towards a speech synthesis system with controllable amusement levels
JP2582762B2 (ja) 無音圧縮音声録音装置
JPS5837697A (ja) 音声記憶再生装置
JPH0854895A (ja) 再生装置
JPS58113993A (ja) 音声信号圧縮方式
JPS62102294A (ja) 音声符号化方式
JPS6253093B2 (ja)
KR920002861B1 (ko) Lpc 음성합성장치 및 그 방법
JPS5817497A (ja) 音声ピッチ検出装置
JPS58114306A (ja) 音声記録再生方式
JPS58215696A (ja) 実時間音声符号化装置
JPS5965897A (ja) 残差信号符号化方法
JPH0493900A (ja) 音声録音再生装置
JPH0242500A (ja) ディジタル録音再生装置