JPS6252600A - 信号の変換を生ずる方法及び装置 - Google Patents

信号の変換を生ずる方法及び装置

Info

Publication number
JPS6252600A
JPS6252600A JP20192286A JP20192286A JPS6252600A JP S6252600 A JPS6252600 A JP S6252600A JP 20192286 A JP20192286 A JP 20192286A JP 20192286 A JP20192286 A JP 20192286A JP S6252600 A JPS6252600 A JP S6252600A
Authority
JP
Japan
Prior art keywords
signal
transformation
histogram
producing
reference position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP20192286A
Other languages
English (en)
Inventor
ブライアン、リー、スカツト
ラバト、グレイ、グツドマン
ジアン、マーク、ニユウエル
ロイド、アリン、スミス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SUKATSUTO INSTR CORP
Original Assignee
SUKATSUTO INSTR CORP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SUKATSUTO INSTR CORP filed Critical SUKATSUTO INSTR CORP
Publication of JPS6252600A publication Critical patent/JPS6252600A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Analogue/Digital Conversion (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、信号処理法、ことにもとの信号の情報内容の
実質的な部分を保持する信号変換を生ずる方法及び装置
に関する。
聴覚は時間基準であるが視覚は主として空間基準である
。スピーチ(言葉〕を感知する際に1(100分の数秒
程度の短い時間的事象は、たとえばrポール(pole
 ) J及びrボール(bowl)J又は「トウダウン
(tow down ) J及び「トウドダウン(to
wθa down ) Jの間のような単純な音声的又
は単語基準の区別を行うのに臨界的である。
時間的分解能は犠牲にしないで正確に耳がこのような微
細なスペクトル分解能をどのようにして現わすかは神秘
のままである。耳がどのように働くかについて一層多く
のこと゛が理解されれば、このような知識はスピーチ認
識コード化装謹の性能を向上させるのにスぎ−チ技術に
適用することができる。
音響スピーチ信号からの満足の得られる時間情報は若干
の種類のスピーチ処理たとえば音声基準認識システムに
おけスピーチ区分化を行うのに重要である。又スピーチ
信号の満足の得られるスペクトル分解能は、スぎ−チの
圧縮及び合成のような他の種類のスピーチ処理に重要で
ある。現状のディジタル信号プロセッサはこのような種
種のスピーチ処理適用を支援することはできない。その
理由は、これ等のプロセッサがすべて周波数対時間分解
能の旧式のトレードオフを受け、すなわち良好な周波数
分解能を示すプロセッサが低い時間分解能を持ち又その
逆であるからである。良好な空間的及び時間的分解能を
持つディジタル信号プロセッサはスピーチ工業に著しい
利点を持つ。その理由はこのプロセッサにより単一の処
理システムを耳自体の性能特性に近似させることができ
るからである。
スピーチ処理に使う理想的なディジタル信号プロセッサ
は、関連する全部のスピーチ機能を誘導できるスピーチ
信号の独得の表示又は「変換」を生ずる。当業界にはよ
く知られているようにこれ等の特長は音声ぎツチ、振幅
包絡線、スペクトル及び発声の程度である。スピーチシ
ステムでは、実施するスピーチ処理適用の種類と実現す
るプロセッサの能力とに従って、前記の特長を要約する
のにスピーチ信号の全く異なる表示を使うのが普通であ
る。
従ってもとの信号の情報内容の実質的な部分を保持する
スピーチ信号情報を生ずることにより、この変換自体か
ら圧縮及び合成のような変化したスピーチ処理適用に必
要なスピーチ機能の抽出を容易にする方法及び装置が必
要になる。
本発明によればスピーチ処理適用に必要なもとの信号の
情報内容の実質的な部分を保持する信号変換を生ずる方
法及び装置が得られる。この説明で使う場合にこのよう
な適用は、スぎ−チ圧縮、スピーチ合成及びスぎ一チ区
分化を含む。好適とする実施例では変換は、もとの信号
の全部又は一部を成る順序のデータサンプルに変換し、
この順序の第1のサブ部分に沿い基準位置を選定し、こ
の基準位置に対し相関関数に従ってヒストグラム全生成
することによって、生ずる。次いでj−序の第2のサブ
部分に沿う基準位置を選定し、この゛基準位置に対し付
加的なヒストグラムを生成する。
このようにして生成した′iji数のヒストグラムは変
換を含む。本発明によれば次いでこの変換は信号処理適
用で信号自体として使う。
1実施例では変換は、それぞれ所定数の位置rdmaX
Jff”持ち次の形の一般級の差分関数から誘導される
複数の重み付きヒストグラムから成る。
d−1,2,−・・dヤ、に対し この式でX(、)は標本化信号であり、noは基準位置
であり、 dはサンプル間の時間遅れであり、 Scntは各サンプルの平均間隔でありawQ、1であ
る。
本発明は又前記の式により重み付きヒストグラムを誘導
する適当な装置である。好適とする実施例では順序の第
1のサブ部分を表わすデータサンプルは第1及び第2の
区間を持つ差分相関器を経て遂次に加える。第1区間の
出力は第2区間の入力に一時記憶区域を経て接続される
。次いで新らたなデータサンプルを第1相関器区間に加
え、残りのサンプルは1つの位置だけシフトする。デー
タサンプルはこれにより第1相関器区間から差分計算の
第1の反復のために一時記憶区域に取出す。
第2相関器区間内のデータサンプルの大きさは次いで第
1相関器区間内の位置的に対応するデータサンプルの大
きさで差分する。これ等の差の絶対個は次いで計算して
偶数値を生ずる。これ等の偶数1直は次いで基準位置に
対するヒストグラムに加える。次いで一時記憶域内のデ
ータサンプル(第1反復に対する)は第2の相関器区間
に加える。
この区間内の残りのサンプルは1つの位置だけシフトす
る。r差分」、「絶対1直」及び「合計」のステップは
次いで繰返してヒストグラムの奇数値、  を生ずる。
この操作(すなわち偶数値及び奇数値への合計)はヒス
トグラムの1サイクルを表わし式(1)に従ってScn
t図繰返しデータサンプル順序の第1のサブ部分に沿う
基準位置に対しヒストグラムの形・成を終える。次いで
この処理は順序の他の各サブ部分に沿う基準位置に対し
て繰返す。各基準位置は付加的なヒストグラムを形成す
るのに1ピッチ周期(又はその倍数)だけ離して位置さ
せるのがよい。
式(1)についてa−Qのときは関数ヒストグラム(d
、a)は公知の平均大きさ差分関数(AMDF’ )に
なる。a−iのときは関数ヒストグラム(d、a)は、
ヒストグラム(a、1)k計算するのに使うサンプルの
中心点がdの全部の値に対し同じである点でAMDFと
は異なるいわゆる滑動平均大きさ差分関数(SAMDF
)を生ずる。この中心点は基準位希すなわち弐(1)の
n。がよい。
本発明の重要な特長によれば複数の重み付きヒストグラ
ムはもとの信号の変換を含む。本発明者は実験の結果、
前記したような変換が位相情報だけを除いてもとの信号
の情報内容の実質的な部分を保持することが分った。次
いで変換は本発明によれば、種種のスピーチ又はその他
の信号処理適用により使う。たとえばもとの信号の圧縮
変形(バージョン)を形成するのに信号の1ぎツチ周期
おきに生ずる各ヒストグラムの所定の部分を次いで記憶
する。これとは反対にスピーチ合成を行うには圧縮変換
を再構成する。しかしどちらの場合もこの方法は、従来
の場合のように時間及び周波数領域の間の信号の費用の
かかる複雑な変換全必要としない。
本発明によればソフトウェアルーチンの制御のもとにヒ
ストグラム全生成する専用マイクロプロセッサも設けで
ある。又全システム制御を行い信号の圧縮及び合成のよ
うな特殊な処理適用を制御する汎用マイクロプロセッサ
も設けである。これ等のマイクロプロセッサは、システ
ムへの又これからのリアルタイム通信を容易にするよう
に全二重ディジタルトランシーバ構成で同時に作用する
以下本発明による方法及び装置の実施例を添付図面につ
いて詳細に説明する。
添付各図面を通じて同様な参照数字は同様な部品を表わ
す。第1A図は本発明によるヒストグラムを生成する相
関器を示す。後述のように複数のこのようなヒストグラ
ムは、情報内容の実質的な部分を保持する信号のいわゆ
る「変換」を形成する。単に説明のために限定するわけ
ではないがこの技術を源波形として人間のスピーチに重
点をおいて以下に述べる。しかし本発明による方法及び
装置が全種類のアナログ及びディジタル源信号にこのよ
うな信号がどのようにして誘導されるかに関係なく十分
に応用できるのは明らかである。
好適とする実施例ではヒストグラム:は複数の相関関数
の1つに従って生ずる。これ等の関数の1つのサブセッ
トは、dmaX位置を持つ次の形の重み付きヒストグラ
ムを生成するいわゆるr差分」関数である。
d” 1.2、”’ dmaXに対し この式でX(、)はサンプル信号であり、nOは基準位
置であり、 dは各サンプル間の時間遅れであり、 5cnt =各すンプルの平均間隔であり、a(10l
lである。
本発明の重要な特長によれば信号全処理して複数の相関
1関数の1つたとえば式(1)のr差分」関数に従って
重み付きヒストグラムを生成するときは、得られる変換
〔複数のこのようなヒストグラムから成る〕は位相情報
だけを除いてもとの信号の情報内容の実質的な部分を保
持する。本発明によれば変換はもとの信号自体として使
われ処理に先だって又はこれに次いで或はこれ等の両方
で時間及び周波数領域の間で信号の費用のかかる複雑な
変換又はこれから抽出される機能の変換を避ける。
以下の説明は式(1)で定義した差分関数を実施する装
置に係わるが本説明は信号変換を含むヒストグラムを次
の形を持つ互いに異なる種類の公知の「自己」又は「相
互」相関関数によって生ずるようにしである。
式(2)でUがVに同じであればヒストグラムta>は
公知の自己相関関数になる。UがVに同じでなければ式
(2)は相互相関関数全表わす。
第1A図には、a−1のときに式(1)の差分関数に従
ってヒストグラムを生ずるのに本発明に使う相関器20
の線図を示す。相関器20は上部人口26及び上部出口
28を持つ第1の区間24t−備えている。相関器20
は又下部人口32及び下部出口34を持つ第2の区間3
0全備えている。矢印36に示すようにWJ1相関器区
間24の上部出口28は第2相関器区間30の下部人口
32に連結しである。又iIA図に示すように第1の相
関器区間24は、後述の理由でデータサンプルを一時記
憶するために出口28に隣接して一時記憶区域25全備
えている。
説明のためだけにスピーチ波形10は相関器20内でア
ナログ形に示しである。しかし本発明の実際の方法及び
装置ではスピーチ波形10は先ずディジタルデータサン
プルの順序に変換する。
第1A図に示すようにスピーチ波形10のサブ部分は遂
次に第1の相関器区間24を通り一次記憶区域25を経
て次いで第2の相関器区間30内に進む。新らたな各デ
ータサンプルが第1区間24の上部入口26に入ると、
この相関器区間24内の残りのデータサンプルはそれぞ
れ出口28に向かい1つの位置だけシフトする。次いで
データサンプルを一時記憶区域25に取出し後述の所定
の周期だけ区域25に保持する。本発明の特長によれば
第2の相関器区間30内のデータ試料は次いで、第1の
相関器区間24内や位置的に対応するデータサンプルで
差分する。この説明で使う場合に「位置的に対応する」
という用語は、任意の瞬間に相関器の各端部から同じ距
離に位置する各相関器区間内のデータ試料のことである
。従って第1区間24の上部入口26に隣接して位置す
るデータ試料38は第2区間30の下部出口34に隣接
して位置するデータ試料39に「位置的に対応する。」 。  第1B図に示すように第1及び第2の相関器区間
24.30内のスピーチ波形の相関は、複数の所定の「
パケット」すなわちd−1,2・・・からdmax ’
での位置を持つヒストグラム40を生ずる。位置d工、
d23、d5・・・はヒストグラムの計数値を表わし又
d2、dいd6・・・はその偶数値を表わす。第1B図
には詳しくは図示してないが、ヒストグラム40の長さ
は通常各相関語区間の長さの2倍である。又データサン
プル順序の各サブ部分の長さはdmaXより大きい。
式(1)に関してa−0であれば関数は公知の平均大き
さ差分関数(AMDF)になる。この関数は、a−1で
あればいわゆる滑動平均大きさ差分関数(SAMDF 
)になる。この関数は、ヒストグラム(d。
1)を計算するのに使うサンプルの中心点がdの全部の
値に対し同じである点でAMDFとは異なる。
この共通の基準によってSAMDFは本発明の好適とす
る実施例に使われ第2図について次に述べる。
SAMDFは、ヒストグラムのdmaX位置を0に初期
設定することによりステップ41で開始する(相関器は
順序の第1のサブ部分の一部を満たすものとする)。ス
テップ41では新らたなデータサンプルを第1の相関器
区間24に入れ区間24内の残りのサンプルは1位蓋だ
けシフトする。従ってステップ42は計算の男1の、操
返しのために一時記憶区域25にデータサンプルを入れ
る。ステップ43では、各相関器区間内の対応するサン
プル間の大きさの差を計算する。とぐに相関器区間24
内の上部入口26に隣接する第1サンプルの大きさは、
相関器区間30内の下部出口34に隣接する最後のサン
プルの大きさから差分する。
この差分ステップは又各相量器区間内の各位置における
サンプルの残りに対しても実施する。ステップ44では
相関器内の各位置に対しステップ43で計算した差の絶
対値を次いで定め、ステップ45でこの合計に加えてヒ
ストグラム40の偶数位置d2、d4、d6t”生ずる
。次いで間合せ46を実施しヒストグラム形成の全サイ
クルを実行したかどうかを定める。実行してなければル
ーチンは枝分かれしてステップ47にもどる。ステップ
47では一時記憶区域23内のデータサンプル(第1の
繰返し巾に受けた)は第2の相関器区間30にシフトさ
れ、区域25丙の残りのサンプルは1位蓋だげシフトす
る。次いでステップ43〜45が繰返されヒストグラム
40の奇数値d工、d3、d5が増分する。間合せ46
の結果が肯定であれば、試験48が行われElcutサ
ンプルが一時記憶区域25に加えられたかどうかを調べ
る。加えられてなければ、ルーチンは枝分かれしてステ
ップ42にもどる。方法は前記したように繰返す。
間合せ48の結果が肯定であれば、ヒストグラムは正規
化され(たとえば各ヒストグラム値1scntにより割
ることにより)、各相関器区間を経て初めに加えたデー
タサンプル順序の第1のサブ部分に対し終了したヒスト
グラムを生ずる。次いでステップ49でこの処理を信号
の付加的サブ部分(各相関器区間を経て加えた)に対し
て繰返し信号変換を含む付加的ヒストグラムを生成する
好適とする実施例では試料順序に沿う基準位置は信号の
ぎツチ周期又はその倍数により隔離する。
又第2図のSAMDF処理を実施するときは、Scnt
/2サイクル後に一時記憶区域25に入れたデータサン
プルは、順序のサブ部分に沿う基準位置を現わす。
又式(1)ではこの式を第2図に示した方法ステップ以
外で実施する他の方法がある。たとえばデータサンプル
を相関器内にシフトして前記したような種種の合計を生
ずるのでなくて、この式は、ヒストグラムをその第1の
位IJ工に初期設定しくすなわちa−1にセットする)
、式(1)に示したnの範囲にわたって加算することに
より計算する。
次いでヒストグラムはその第2の位置d2に初期設定し
く a = 2 ) 、ヒストグラムの計算を終了する
まで処理を繰返す。
第3図には本発明によジ信号変換金生ずるのに必要な能
力を生じ又スぎ一チ処理適用でこの変換を使うのに必要
な能力を生ずるようにしたスピーチシステム50のブロ
ック図を示しである。前記したように単に説明だけのた
めにシステム50はスぎ−チ展開システムに関連して述
べる。しかしシステム50は全種類の信号処理用途にイ
ンタフェースとして使われ、スピーチ関連用途だけに限
定するものではない。
スピーチシステム50は、複数の入出力(Ilo )デ
バイスを結合した汎用のマイクロプロセッサ52を備え
ている。スピーチシステム50は、それぞれ汎用非同期
式受信機/送信fJ (UART) 58.60全経て
汎用マイクロプロセッサ52に接続した1対の直列ディ
ジタル通信リンク54.56e備えている。このような
デバイスは、よく知られ直列ビット通信リンク54.5
6に対し並列語基準マイクロプロセッサ52’にインタ
フェースとする作用をする。スピーチシステム50は又
汎用マイクロプロセッサ52へのアナログ入力径路62
を備えている。径路62は帯域フィルタ64及びアナロ
グ/ディジタル(A/D)変換器66を含む。又汎用マ
イクロプロセッサ52からアナログ出力径路68を設け
である。径路68は低域フィルタ70及びディジタル/
アナログ(D/A )変換器72を備えている。アナロ
グスぎ−チ波形はアナログ入力径路62に加えられ、径
路62でこの波形はフィルタ64により帯域限定されA
/D変換器66によりディジタル化される。スピーチ波
形のディジタル化変形は次いでディジタル直列通信リン
ク54.56の一方によりスピーチ展開システム50に
類似の遠隔システムに送信される。
又第6図に明らかなように汎用マイクロプロセッサ52
は、応用プログラム及びデータを記憶する協働するラン
ダム・アクセス・メモリ(RAM)51と又マイクロプ
ロセッサ52を制御するオペレーティング・プログラム
を記憶する読取り専用メモリ(ROM) 53とを備え
ている。
とくに本発明によればスピーチシステム50は、ソフト
ウェアルーチンの制御のもとて第2図のSAMDF処理
全実施する専用マイクロプロセッサ74′f!:備えて
いる。専用マイクロプロセッサ74は、このルーチン全
記憶する協働する制御記憶装置76と、汎用マイクロプ
ロセッサ52に通信する協働するRAM 78とを備え
ている。汎用マイクロプロセッサ52は、アナログ入力
径路62からRAM 78にディジタルデータサンプル
全速る。次いでこれ等のサンプルは、制御記憶装置76
内で記憶したルーチンの制御のも−とに専用マイクロプ
ロセッサ74で処理される。スぎ一チ波形のこのように
して得られる変換は次いでRAM 78に記憶する。R
AM 78の内容は次いで、専用マイクロプロセッサ7
4による波形の付加的部分の連続処理は中断しないで、
汎用マイクロプロセッサ52により読取る。
従って専用マイクロプロセッサ74は汎用マイクロプロ
セッサ52と同時に動作してマイクロプロセッサ74が
SAMDF計算を実施すると共に マイクロプロセッサ
52が他のシステム制御機能を生ずることができる。
スぎ一チシステム50は、このシステムへの又これから
のリアルタイム通信を容易にする全二重ディジタルトラ
ンシーバ動作を生ずる。システム50を初期設定すると
きは、制御プログラムは、汎用マイクロプロ七ツセ52
に協働するRAM 51内にダウンロードされる。これ
等のプログラムはマイクロプロセッサ52を制御し、専
用マイクロプロセッサ74に協働する制御記憶装置76
内にSAMDFルーチンをダウンロードする。次いでス
ピーチ波形はアナログ入力径路62で受けられ前記した
ように処理される。
本発明の重要な特長によれば前記したように信号変換が
生ずると、次いでこの変換は、圧縮、合成及び区分化の
ようなスピーチ処理適用により信号自体として使われる
第4図には本発明の信号圧縮ルーチンの流れ図を示しで
ある。このルーチンは信号変換で動作しもとのスピーチ
信号の圧縮変形を生ずる。当業界にはよく知られている
ようにスぎ−チ圧縮の目的は、アナログスぎ−チをでき
るだけ少いディジタルビットで表わすことである。直線
予測符号化(LPO)のような従来の方法は、スピーチ
信号からの音声パラメータの有効な抽出と正確な有声音
/無声音の決定とに基づいている。LPC及びその他の
従来のフォルマント符号化法は若干の用途では有効なス
ピーチ信号圧縮音生ずるが、このような方法は騒音環境
において又スピーチ信号を低いデータ割合で標本化する
ときは失敗する。
従来のこれ等の又その他の問題を改善するために本発明
の圧縮法では信号に固有の若干の情報冗長度を利用する
。これ等の冗長度は又SAMDF処理によジ生ずる信号
変換にも存在する。
スピーチ信号内の情報冗長度の第1の源は、スピーチ波
形が任意の2つの連続したピッチ周期中で互いにほぼ同
様であるから存在することが分っている。従ってスぎ−
チ波形の1つおきのピッチ周期を記憶することは、2対
1の率でスピーチを圧縮する手段を示す。スぎ−チ波形
内の情報冗長度の簗2の源は、スピーチが通常随意の基
準レベルの付近の双極のほぼ対称の波形であるという概
念に基づいている。この波形を整流しこれから零を消去
すると、もとの波形はさらに1/2にすなわち全部で4
対1の率で圧縮することができる。音声波形内の情報冗
長度の第6の源は喉頭によ!ll有声音信号を生ずる方
法で固有のものである。声門源は2つの位相すなわち閉
位相及び閉位相を持ち音声径路の共鳴はスピーチ波形に
最もよく表われるが、声門は閉じる。従って声門がピッ
チ周期の大体50%は閉じるので、スピーチ波形の半分
だけがピッチ周期自体の間に情報を運ぶ。従ってピッチ
周期の半分だけの記憶はスピーチ波形をさらに1/2に
全部で8対1の圧縮比に圧縮する手段を表わす。
又第1B図に示すようにSAMDF処理は入力スピーチ
波形の正負の位相に相関し、波形から半サイクルに対応
するミニマス(minimas ) f持つヒストグラ
ム40が得られる。従ってSAMDF相関処理の使用は
スぎ−チ波形に固有の正から負へのサイクル冗長度を利
用する。さらに又第1B図に示すようにSAMDF処理
により高度に対称形のヒストグラム40′ft生じ、こ
のヒストグラムに表わされたぎツチ周期の半分だけの記
憶が必要である。すなわちピッチ周期の半分の記憶は声
門源の身体的特性から生ずる波形中の冗長度を利用する
。さらに本発明の好適とする実施例ではヒストグラム4
0は、データサンプル順序に沿い1つおきのピッチ周期
ごとに基準位置を選定することにより相関器20によっ
て生じ、ヒストグラムが2つのピッチ周期にわたり「平
均された」相関を表わす。すなわち本発明のこの特長は
、8対1の全圧縮比で生ずる入カスぎ一チ波形に固有の
ピッチ周期対ピッチ周期冗長度を利用する。
第4図の圧縮ルーチンは命令ステップ80で開始する。
命令ステップ80では、データサンプルはRAM 78
に入れられRAM 78でこれ等のサンプルは専用マイ
クロプロセッサT4により処理される。第3図について
前記したようにデータサンプルは、A/D変換器66に
よりアナログ音波の変換から得られる。次いでステップ
80では協働する制御記憶装置76に記憶されたソフト
ウェアルーチンの制御のもとに第3図の専用マイクロプ
ロセッサ74によ!l SAMDI+’相関が実施され
る。
新らたな各データサンプル@ RAM 78に入れた後
検査ステップ84を実施し完成したヒストグラム(第2
図について述べたような)がさらに処理する状態にある
かないかを定める。ヒストグラムがこの状態にない場合
には制御はステップ80にもどり、第2図のステップ4
2により前記したように他のデータサンプル2 RAM
 78に入れる。ヒストグラムがこの状態にありすなわ
ちステップ84における試験が肯定であればヒストグラ
ムはステップ88でRAM 78からRAM 51に移
りこのヒストグラム全汎用マイクロプロセッサ52によ
り処理できるようにする。
又第4図に示すように信号圧縮ルーチンはステップ90
に続き波形のピッチを追跡するときであるかどうかを定
める。間合せステップ90の結果が否定でありすなわち
ぎツチを追跡する時間間隔が経過していなければ、ルー
チンはステップ92に枝分れする。ステップ92ではピ
ッチ周期の半分は、なるべくは2ビツトの適応差分パル
スコード変調(ADPCM) ’i使うことによりヒス
トグラムから符号化する。
圧縮波形の符号化は若干のオーバヘラドラ受ける。たと
えばピッチ周期の周波数又は長さは符号化波形を記憶し
なげればならない。このオーバヘッドを最少にするには
、有声のスピーチのピッチが急速には変化しないから、
システムは、各ピッチ周期と同様に頻繁な程度から複数
のピッチ周期と同様にまれな程度まで変る若干の時間間
隔においてだけ入力スピーチ信号のぎツチを追跡するの
がよい。
又第4図で間合せステップ90の結果が肯定であれば、
ルーチンはステップ94に続きピッチ周期を定める。ス
テップ96ではルーチンは、ステップ94で定まるピッ
チ周期を専用マイクロプロセッサ74にもどすことによ
って続く。ステップ98ではピッチはステップ1(10
に続くルーチンで符号化されピッチ周期の最大振幅又は
利得率を計算する。ステップ102では次いでなるべく
は10g(底敷2)表示を使い利得率を符号化し、ルー
チンはステップ92で前記したように継続する。
ステップ92に次いで間合せステップ104を実施し、
圧縮が終ったかどうかを定める。終っていなげればルー
チンはふたたびステップ80にもどる。ステップ80で
はスピーチ信号の付加的部分がディジタル化され、圧縮
ルーチンは前記したように継続する。圧縮が終っていれ
ばルーチンはステップ106に終る。
第4図の流れ図に詳述したようにヒストグラムで行われ
る第1の解析はピッチ抽出である。ピッチは、ヒストグ
ラムのミニマスを調べ、高調波関係を解析し、第1のピ
ッチのトラフを選定することにより定める。次いでこの
値を使い次ぎのヒストグラムを加算する時間量全制御す
る。処理の効果は高度に対称のヒストグラムを生じてヒ
ストグラム内のピッチ周期の半分だけを記憶すればよい
この場合スぎ−チ波形の2対1の率の圧縮ができる。さ
らに本方法によればヒストグラムは1つおきのぎツチ周
期ごとに出力されさらに2対1の率の圧縮すなわち4対
1の全圧縮比音生ずる。又前記したように符号化ステッ
プ92は2ビットADPCMスキーム変調スキームを使
いヒストグラムを符号化する。これはもとの8ビツトデ
イジタル化波形に゛さらに1/4の圧縮を行うことを表
わす。
すなわちこの方法の全圧縮比は16対1である。
第5図には本発明の信号合成ルーチンの流れ図を示しで
ある。前記したようにこのルーチンは、専用マイクロプ
ロセッサにより生ずるSAMDF信号変換時に、とくに
第4図で前記した圧縮ルーチンにより圧縮したような変
換時に動作する。合成は命令ステップ110で開始する
。ステップ110ではルーチンは、圧縮スピーチ信号を
表わすデータを受けることにより初期設定される。ルー
チンは、ざツチ周期を読取るかどうかを定める間合せス
テップ112で継続する。間合せステップ112の結果
が肯定であればルーチンはステップ114で継続し第6
図のディジタル直列通信リンクの1つで受けるピットス
トリームデータからぎツチ周期を読取る。次いで利得率
全ステップ116でピットストリームデータから読取る
。ステップ116に次いで又は間合せステップ112の
結果が否定であれば方法はステップ118で継続する。
ステップ118では圧縮セグメントに対するピッチ周期
の半分はピットストリームデータから伸長される。ステ
ップ120では、ステップ122における利得率と同様
にセグメントのピッチを補間する。
ルーチンはステップ124で継続しピッチ周期全合成す
る。ステップ124に次いでルーチンは間合せステップ
126に入りスピーチ波形合成が終つ、たかどうかを定
める。終ってなげればこの方法はステップ110にもど
り、データを得て次のセグメントヲ合成する。合成が完
了すると、ルーチンはステップ128で終了する。
従って合成は4つのステップで生ずる。記憶した符号化
ピッチ及び利得率は先ず読取って復号する。第2のステ
ップではADPCMからパルス符号変調(POM)フォ
ーマットにヒストグラムを単に伸長させる。これは第5
図のステップ118で行われる。次いで再構成した波形
をステップ124で反射しピッチ周期を生成する。第4
の最終ステップはピッチ周期全繰返し、次いでこの処理
を圧縮したスぎ−チ波形の引続く各部分に対して反復す
る。
従って本発表によりスピーチ処理たとえば圧縮及び合成
に対しM用な信号波形の変換を生ずる方法及び装置が得
られる。この変換は、もとの信号の情報内容を保持し、
従って信号を表示するのに直接使われる。信号自体とし
ての信号変換の使用により、信号処理応用に先だって又
その後で時間及び周波数領域の間で信号(又はその機能
)を変換するのに、費用のかかる複雑な計算アルゴリズ
ムを避けることができる。本発明の好適とする実施例で
は専用マイクロプロセッサ全役けて、スピーチ波形の連
続セグメントに対し滑動平均大きさ差分関数(SAMD
F)’を計算することにより変換?生ずるソフトルーチ
ンを実行する。
前記したように本発明による方法及び装置tt圧圧縮台
合成ようなスピーチ処理適用について詳細に説明したが
、前記した方法が全部の種類の信号処理適用に十分適合
するのは明らかである。従って本発明の範囲はスピーチ
圧縮/合成を行うのに信号変換を使うことだけに限定す
るものではない。
以上本発明をその実施例について詳細に説明したが本発
明はなおその精神を逸脱しないで種々の変化変型を行う
ことができるのはもちろんである。
【図面の簡単な説明】
第1A図は本発明によりヒストグラムを生成するのに使
う第1区間及び第2区間を持つ本発明装置用の相関器の
平面図、第1B図は第1A図の相関器により生成したヒ
ストグラムを一部を切欠いて示す線図である。第2図は
本発明により滑動平均大きさ差分関数(SAMDF )
を計算するのに使うステップの流れ図、第6図は圧縮及
び合成のようなスピーチ処理応用全行う本発明によるス
ピーチシステムの1実施例のブロック図である。第4図
はもとの信号波形を圧縮するににSAMDF処理により
生ずる信号変換を使う信号圧縮ルーチンの流れ図、第5
図は第4図の信号圧縮ルーチンにより圧縮した信号全合
成する信号合成ルーチンの流れ図である。 40・・・ヒストグラム、50・・・スピーチシステム
、52・・・汎用マイクロプロセッサ、58.60・・
・UART、66.72・・・変換器、74・・・専用
マイクロプロセッサ、76・・・制御記憶装置。 FIG、 3 □□→ 6.4

Claims (18)

    【特許請求の範囲】
  1. (1)信号の変換を生じこの変換を信号処理に使う方法
    において、(a)信号の一部分を或る順序のデータサン
    プルに変換し、(b)前記順序の第1のサブ部分に沿い
    基準位置を選定し、(c)或る相関関数に従つて前記基
    準位置に対するヒストグラムを生じ、(d)前記順序の
    第2のサブ部分に沿い基準位置を選定し、(e)前記順
    序の第2サブ部分に沿う基準位置に対しステップ(c)
    を繰返して、全部のヒストグラムが信号の情報内容の実
    質的部分を保持する変換を含むようにし、(f)信号処
    理適用に信号自体として前記変換を処理することから成
    る方法。
  2. (2)相関関数として平均大きさ差分関数(AMDF)
    を使う特許請求の範囲第(1)項記載の信号の変換を生
    ずる方法。
  3. (3)相関関数として滑動平均大きさ差分関数(SAM
    DF)を使う特許請求の範囲第(1)項記載の信号の変
    換を生ずる方法。
  4. (4)相関関数として自己相関関数を使う特許請求の範
    囲第(1)項記載の信号の変換を生ずる方法。
  5. (5)信号の変換を生じこの変換を信号処理に使う方法
    において、(a)信号の一部分を或る順序のデイジタル
    データサンプルに変換し、(b)前記順序の第1のサブ
    部分に沿い基準位置を選定し、(c)次の式▲数式、化
    学式、表等があります▼(1) d=1、2…d_m_a_xに対し (この式中でx(.)は標本化信号であり、n_0は基
    準位置であり、 dは各サンプル間の時間遅れであり、 Scnt=各サンプルの平均間隔であり a=0.1である) に従つて基準位置に対しd_m_a_x位置を持つヒス
    トグラムを生じ、(d)前記順序の第2のサブ部分に沿
    い基準位置を選定し、(e)前記順序の第2のサブ部分
    に沿う基準位置に対しステップ(c)を繰返して、全部
    のヒストグラムが信号の情報内容の実質的な部分を保持
    する変換を含むようにし、(f)信号処理適用に信号自
    体として前記変換を処理することから成る方法。
  6. (6)ヒストグラムを生ずるステップで、各基準位置に
    対しScntサイクルにわたり動作する特許請求の範囲
    第(5)項記載の信号の変換を生ずる方法。
  7. (7)各基準位置に対しヒストグラムを生ずるステップ
    で、(g)第1及び第2の区間と一時記憶区域とを持ち
    前記第1区間の出力により前記一時記憶区域を経て前記
    第2区間への入力を形成した相関器を経てデイジタルデ
    ータサンプルを加え、(h)新らたなデータサンプルを
    前記第1相関器区間に移しこの区間内の残りのデータサ
    ンプルを1つの位置だけシフトして、前記第1相関器区
    間から前記一時記憶区域にデータサンプルを除くように
    する特許請求の範囲第(6)項記載の信号の変換を生ず
    る方法。
  8. (8)ヒストグラムのサイクルに、(i)第2相関器区
    間内の各データサンプルの大きさを前記第1相関器区間
    内の位置的に対応するデータサンプルの大きさで差分し
    、(j)ステップ(i)で計算した各差の絶対値を定め
    てヒストグラムの偶数値を生じ、(k)一時記憶区域内
    のデータサンプルを第2相関器区間内に移しこの区間内
    の残りのデータサンプルを1つの位置だけシフトし、(
    l)ステップ(i)〜(j)を繰返してヒストグラムの
    奇数値を生ずる各ステップを行う特許請求の範囲第(7
    )項記載の信号の変換を生ずる方法。
  9. (9)信号処理適用に、信号を圧縮するステップを含め
    る特許請求の範囲第(5)項記載の信号の変換を生ずる
    方法。
  10. (10)圧縮のステップに、ステップ(c)で生じた各
    ヒストグラムの所定の部分をスピーチ信号の圧縮変形と
    して記憶するステップを含める特許請求の範囲第(9)
    項記載の信号の変換を生ずる方法。
  11. (11)圧縮のステップで、順序に沿う基準位置を信号
    の1つおきのピッチ周期ごとに選定する特許請求の範囲
    第(10)項記載の信号の変換を生ずる方法。
  12. (12)信号処理適用に、スピーチ信号の圧縮変形から
    変換を合成するステップを含める特許請求の範囲第(1
    0)項記載の信号の変換を生ずる方法。
  13. (13)信号の変換を生じこの変換を信号処理に使う装
    置において、信号を或る順序のデータサンプルに変換す
    る変換手段と、前記順序の第1のサブ部分に沿い基準位
    置を選定する選定手段と、相関関数に従つて前記基準位
    置に対しヒストグラムを生成する生成手段と、この生成
    手段に応答して前記順序の第2のサブ部分に沿い基準位
    置を選定し前記第2サブ部分に対し付加的なヒストグラ
    ムを生成して、前記ヒストグラムが信号の情報内容の実
    質的な部分を保持する前記変換を含むようにした手段と
    、信号処理適用で前記変換を前記信号自体として処理す
    る処理手段とを包含する装置。
  14. (14)処理手段に、変換の圧縮変形を生じ信号の圧縮
    変形を表わすようにした手段を設けた特許請求の範囲第
    (13)項記載の信号の変換を生ずる装置。
  15. (15)処理手段にさらに、圧縮された変形を生ずる手
    段により圧縮した信号を合成し信号変換を再合成するよ
    うにした合成手段を設けた特許請求の範囲第(14)項
    記載の信号の変換を生ずる装置。
  16. (16)生成する手段を複数の相関関数の1つを実現す
    るように協働する記憶装置を持つ専用マイクロプロセッ
    サにより構成した特許請求の範囲第(13)項記載の信
    号の変換を生ずる装置。
  17. (17)生成する手段に応答する手段を、協働する記憶
    装置を持つ汎用マイクロプロセッサにより構成した特許
    請求の範囲第(16)項記載の信号の変換を生ずる装置
  18. (18)汎用マイクロプロセッサ及び専用マイクロプロ
    セッサが同時に動作し信号変換のリアルタイム生成を行
    うようにした特許請求の範囲第(17)項記載の信号の
    変換を生ずる装置。
JP20192286A 1985-08-29 1986-08-29 信号の変換を生ずる方法及び装置 Pending JPS6252600A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US77053085A 1985-08-29 1985-08-29
US770530 1985-08-29

Publications (1)

Publication Number Publication Date
JPS6252600A true JPS6252600A (ja) 1987-03-07

Family

ID=25088868

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20192286A Pending JPS6252600A (ja) 1985-08-29 1986-08-29 信号の変換を生ずる方法及び装置

Country Status (2)

Country Link
EP (1) EP0212323A3 (ja)
JP (1) JPS6252600A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998042077A1 (fr) * 1997-03-18 1998-09-24 Nippon Columbia Co., Ltd. Detecteur de distorsion, correcteur de distorsion, et procede de correction de distorsion pour signal audio numerique

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5025471A (en) * 1989-08-04 1991-06-18 Scott Instruments Corporation Method and apparatus for extracting information-bearing portions of a signal for recognizing varying instances of similar patterns

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5656000A (en) * 1979-09-27 1981-05-16 Philips Nv Method and device for producing characteristic values

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4004096A (en) * 1975-02-18 1977-01-18 The United States Of America As Represented By The Secretary Of The Army Process for extracting pitch information
US4038503A (en) * 1975-12-29 1977-07-26 Dialog Systems, Inc. Speech recognition apparatus

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5656000A (en) * 1979-09-27 1981-05-16 Philips Nv Method and device for producing characteristic values

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998042077A1 (fr) * 1997-03-18 1998-09-24 Nippon Columbia Co., Ltd. Detecteur de distorsion, correcteur de distorsion, et procede de correction de distorsion pour signal audio numerique

Also Published As

Publication number Publication date
EP0212323A3 (en) 1988-03-16
EP0212323A2 (en) 1987-03-04

Similar Documents

Publication Publication Date Title
US4301329A (en) Speech analysis and synthesis apparatus
US4771465A (en) Digital speech sinusoidal vocoder with transmission of only subset of harmonics
Talkin et al. A robust algorithm for pitch tracking (RAPT)
US4797926A (en) Digital speech vocoder
US6119082A (en) Speech coding system and method including harmonic generator having an adaptive phase off-setter
CA1065490A (en) Emphasis controlled speech synthesizer
KR100298300B1 (ko) 포만트유사도측정에의한피솔라를이용한음성파형부호화방식
JPS623439B2 (ja)
JPH0869299A (ja) 音声符号化方法、音声復号化方法及び音声符号化復号化方法
EP0477960A2 (en) Linear prediction speech coding with high-frequency preemphasis
US4969193A (en) Method and apparatus for generating a signal transformation and the use thereof in signal processing
US4945565A (en) Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses
US4922539A (en) Method of encoding speech signals involving the extraction of speech formant candidates in real time
JP2000515998A (ja) コード励振形線形予測(celp)コーダにおいて励振コードブックを検索する方法およびその装置
US5715363A (en) Method and apparatus for processing speech
JP2006171751A (ja) 音声符号化装置及び方法
JPS6252600A (ja) 信号の変換を生ずる方法及び装置
US5696875A (en) Method and system for compressing a speech signal using nonlinear prediction
JP3398968B2 (ja) 音声分析合成方法
JPH0345839B2 (ja)
JPH0736119B2 (ja) 区分的最適関数近似方法
Kim et al. On a Reduction of Pitch Searching Time by Preprocessing in the CELP Vocoder
KR100404049B1 (ko) 음성언어 분석방법
JPH0632037B2 (ja) 音声合成装置
JPS61252600A (ja) Lsp型パタンマツチングボコ−ダ