JPS5950075B2 - 人工音声信号を発生するための方法と装置 - Google Patents

人工音声信号を発生するための方法と装置

Info

Publication number
JPS5950075B2
JPS5950075B2 JP53072271A JP7227178A JPS5950075B2 JP S5950075 B2 JPS5950075 B2 JP S5950075B2 JP 53072271 A JP53072271 A JP 53072271A JP 7227178 A JP7227178 A JP 7227178A JP S5950075 B2 JPS5950075 B2 JP S5950075B2
Authority
JP
Japan
Prior art keywords
signal
filter
amplitude
waveform
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP53072271A
Other languages
English (en)
Other versions
JPS547805A (en
Inventor
ギウリオ・モデナ
ステフアノ・サンドリ
カルロ・スカグリオラ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHI ETSUSE E ERE CHII SENTORO SUTEYUDEI E LAB TEREKOMINIKACHIOONI SpA
Original Assignee
SHI ETSUSE E ERE CHII SENTORO SUTEYUDEI E LAB TEREKOMINIKACHIOONI SpA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHI ETSUSE E ERE CHII SENTORO SUTEYUDEI E LAB TEREKOMINIKACHIOONI SpA filed Critical SHI ETSUSE E ERE CHII SENTORO SUTEYUDEI E LAB TEREKOMINIKACHIOONI SpA
Publication of JPS547805A publication Critical patent/JPS547805A/ja
Publication of JPS5950075B2 publication Critical patent/JPS5950075B2/ja
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Stereophonic System (AREA)

Description

【発明の詳細な説明】 この発明は、音声信号伝送システムに関し、特に電話伝
送システムに関し、そしてそのようなシステムに使用さ
れる装置の性能の客観的評価すなわち人間の話者または
聴者なしに実行される評価に用いるようになる音声信号
を発生するための装置とに関する。
音声信号伝送に使用される装置の性能を評価するための
通常の方法は、可能な限り、人間の話者または聴音なし
に実行される客観的測定よりなる。
事実、主観的測定すなわち人間の話者または聴音または
その両者を伴つて実行される測定の成果は余りにも多く
音声の形式および話者または聴音またはその両者に依存
し、そして試験のために利用されるテキストにさえも依
存する;極めて多数の話者または聴者およびある長さの
テキストを利用することによつてのみ、十分に信頼でき
る成果が得られるようになる;従つて試験は長く、従つ
て経費がかかるようになる。
一般に、客観的測定を実行するための手順は、試験すべ
き装置へ適当な入力信号を送る工程とシステムの出力端
子において受信信号また再建信号のための信号対雑音比
(S/N比)を、入力信号電力と誤差信号電力(誤差信
号は、入力信号と出力信号間の差として定義されるもの
である)との間の比として評価するよう計算する工程と
を備える。
そしてその比が高ければ高いほど、評価されたシステム
の質は良いものとなる。もつと屡々用いられる入力信号
は、種々の周波数たとえば800翫ないし1000圧の
範囲の正弦波信号またはホワイトガウシアンノイズまた
はラプラシアンノイズであり、何となればこれらの信号
は、容易に処理でき、従つて特にシシユレーシヨン(模
擬)技術により実行される試験に有効であるからである
とにかく、スペクトルおよび振幅特性が、音声信号のそ
れではない上記の種類の信号を用いると、客観的性能評
価と主観的性能評価すなわち真の聴者の受信する真の音
声信号を用いて得られる測定との間に、かなりの差が伴
うようになる。
客観的測定と主観的測定との間の差は、デイジタル伝送
システムにおいて一層大きい:最近の研究によると、デ
イジタル伝送システムにおいては、単に信号対雑音比は
もはや十分に意味のあるパラメータではなく、少なくと
も量子化雑音効果と振幅過負荷(または差動システムの
場合はスロープ)によるひずみ効果とを、同様にこれら
の2つのフアクタ(効果)の相対大きさを考慮しながら
区別しなければならないことが明らかとなつ.た。これ
に反し、容易に証明されかつ実験的に立証されたように
、上記の2つのフアクタの統計的特性のため、ホワイト
ノイズまたは正弦波信号のいずれかにより、上記記載の
2つの雑音成分すなわちガウシアンノイズまたはラプラ
シアンノイズ.を正確に区別できないようになる。他方
では、質試験のため音声合成により得られる人工信号を
用いることは容易でなく、何となれば上記の人工信号は
、真の信号に比べ、すべての点で不都合であり、すなわ
ち人工信号は、その合今成方法だけでなく、話者、テキ
スト、言語にも依存するはずであるからである;さらに
音声合成による信号発生は、極めて複雑でかつデリケー
トな工程である。
質試験のために人工信号を用いる場合に含まれる問題は
、この発明の目的である方法と装置とにより解決され、
そしてその方法と装置とによると、簡単に統計的特性の
平均的人間音声を備えた人工信号をうることができ、従
つて主観的質測定および客観的質測定の間に良好な相関
関係が得られうるようになる。
この発明の特別な目的は、基本的に平均的人間音声の一
時的でかつスペクトル的な特性を模擬する特性の人工信
号を発生するための装置が提供され、そしてその装置に
おいては、音声刺激の特性を模擬する波形が発生され、
つぎにその波形は一度濾過されて位相をひずませること
なく振幅スペクトルが補償され、従つて平坦な振幅スペ
クトルを備えた新しい波形が発生されるようになる;そ
の平坦な振幅スペクトルを備えた平坦スペクトル波形は
音声特性を模擬するためもう一度沢過される。
本発明の装置は音声刺激の波形源とその波形のスペクト
ル平坦化を実行できる第1の線形位相デイジタルフイル
タと音声管の平均的伝達機能を実現できる第2のデイジ
タルフイルタとよりなる。
この発明の目的のシステムを記載する前に若干の理論的
原理について述べなければならない。周知のように、音
声放出は、種々のパラメータにより影響されるようにな
る;そのパラメータには下記がある:音刺激源により発
生される音の形式、音声管(すなわち音声穴と唇間の非
均一音響管)の配置の時間および空間変化、音刺激の非
均一な継続時間、鼻空洞が、多少とも音伝送に関係があ
るという可能性がある。とにかく、音声形式信号を発生
するための装置は、音声コードを模擬する音(刺激)源
および音声管を模擬しかつその共振特性を音源により発
生される音響波へ賦課するフイルタとして作用する伝送
システムにより図式化される。
音源と伝送システム間の相互作用は無視できる(余りに
も大きい普遍性を損なうことなしに行なうことができる
)と仮定すると、音源を、それがホワイトスペクトル信
号を発生するよう実現させかつフイルタをそれが内部に
音声波形によるスベクトル寄与を放出および伝送へ集中
させるよう実現させることができる。
上記の要求を満足するこの発明による装置は、第1図に
示される。
この図において、参照符号EGは、周期波形発生器を示
し、実音声刺激を模擬する波形たとえば第2図の波形U
nを発生できるものである。
図示のように、振幅A。および周期Tを有するそのよ
Jうな波形は3つの個別の部分により形成される:すな
わち継続期間T1を有する上昇部分と継続期間T2を有
する降下部分と一定部分との3つである。発生器EGは
、上記の3つの部分を発生し、そしてそれらが相互に完
全に独立したものである1ようにしなければならず、そ
の結果所要に応じて信号Unの形状および継続期間を容
易に変化できる。参照符号F1は、線形位相デイジタル
フイルタを示し、そしてその伝達関数は、基本的に周期
信l号Snの振幅スペクトルの逆値である;このように
して出力端子に、平坦な振幅スペクトルを備える関数が
得られるようになる。
参照符号F2は、第2のデイジタルフイルタであり、音
声管の平均伝達関数を近似できる:そのデイジタルフイ
ルタ;F2の出力端子に、所望の人工信号Snが得られ
るようになる。この伝達関数をきめる方法は、この技術
分野において通常の知識を有するものにとつて周知であ
り、従つてここでは詳細に説明しない;たとえば、伝達
関数を線形予知技術によりき.めることができる。すな
わち、平均の実際の音声を得るために、異なつた話者が
時間で平均化され、線形予知技術によつて元の音声の平
均スペクトルを示す係数が得られ、その係数はデジイタ
ルフイルタの係数である。そのような信号で模擬される
音が音信号(すなわち、音声化音)と非鼻音とである場
合、フイルタF2は、定パラメータ全極フイルタよりな
ることができる。この制限は余りにも高いこの発明の普
遍性をそこなうものではなく、何となればこれらの音が
、音声を構成する音の大きいパーセントを占めているか
らである;他方ではフイルタF2により、信号に固定し
たスベクトル特性を持たせることもできる。この簡略化
はまた、下記の事実により是認される。すなわち多くの
音声処理および音声信号冗長度低減システムは、入力波
形の適合量子化を伴つて動作し、従つて周知のようにそ
のようなシステムはスペクトル変化に対し余り鋭敏でな
くなるという事実により是認される。上記記載のように
、発生すべき信号は、電話システムに挿入された試験装
置に使用しなければならないものであることを考慮する
と、フイルタF2の伝達関数は0Hzから4kHzまで
の周波数帯域幅における音声振幅の平均スペクトルを再
生できるよう選択されることが好ましい。
上記記載の装置は、第3図に示すような周期信号を発生
する。
その周期的構造のため、この信号は、あるこわさのパラ
メータを示す;このこわさが必要でない場合には、信号
へ変化性を導入し、音声特性をよりよく近似させること
ができる。そのような変化性は、スイツチCを介して発
生器EGとフイルタF1との間に挿入された擬似ランダ
ム発生器PS(第1図)により得られ、そしてその擬似
ランダム発生器により信号Unの振幅または周期または
その両方を擬似ランダムに変化させることができる。好
都合なことに、発生器PSは、ある期間の間、前の周期
の信号Snの振幅と周期信号Unの振幅とに基づいて可
変信号Snの振幅を変化させることができる。
たとえば、変化法則は、下記のようである;すなわちA
n=C.An−,+(1−C). AO(1+P.wn
)ここに: Anは、n番目の周期の所望の信号Snの振幅である;
An−,は、 (n−1)番目の周期の信号Snの振幅
である;AOは、周期信号Snの振幅である; Cは、0と1との間よりなる係数で、振幅コーバリアン
スすなわち信号の引続く周期の間の可能な振幅変化を示
すものである;Pは、振幅A。
の値に対する最大相対変化である;Pの値は、下記のよ
うに選択される、すなわち信号Unに対するスペクトル
特性変化が極めて限定され、その結果フイルタF1にお
ける濾過作用を一層有効にできるよう選択される:Wn
は、非相関ランダム変数である (すなわち″ある瞬間
における値は、前の瞬間の値と相関関係にないというこ
とを示す);それは、範囲−1〜+1の間に均一に分布
した値をとる。
周期変化法則は、たとえば下記の形式である:すなわち
ここに; Tnは、波形の所望のn番目の周期である;Tは、Un
の周期である;ΔTは、Tの周りの最大瞬時変化である
;Ynは、Wnと同様な非相関ランダム変数である。
容易に擬似ランダム発生器PSを実現させるため、変数
Ynは、瞬間ごとにWnと一致させる。
この発明により得られる振幅または周期またはその両方
の擬似ランダム変化を備える人工音声信号は、第4図に
示される。そのような装置の動作モードは、単一プロツ
クの動作に関して上記に記載したことから容易に推論で
きる;発生器EGで発生されかつおそらくは発生器PS
で振幅および周期の擬似ランダムな変化を受けるであろ
う周期信号Un(第1図)は、フイルタF1で一度濾過
される。
上記記載のようにフイルタF1の伝達関数は、基本的に
信号Unの振幅の逆数なので、淵過の結果として平坦な
振,幅スペクトルを備える信号が得られる;つぎにその
信号はフイルタF2で濾過され、電話音声の平均スペタ
トル特性をとるようになる。たとえば第3図および第4
図に示す2つの例のように、フイルタF2の出力端子に
得られる信号は、つぎに図示しない試験すべき装置へそ
の入力信号として送られる。上記記載の事柄は、例によ
り説明したけれども、これに限定されるものでなく、明
らかに、この発明の要旨の範囲内で変形することは可能
である。
【図面の簡単な説明】
第1図は、この発明の目的である装置のプロツク図、第
2図は、音声刺激を模擬する信号を示す図、第3図およ
び第4図は、人工音声信号の2つの可能な例であり、そ
してそれらの2つの信号は、第2図の波形から得られる
ものである図を示す。 EG・・・・・・波形発生器、F1・・・・・・第1の
デイジタルフイルタ、F2・・・・・・第2のデイジタ
ルフイルタ、PS・・・・・・擬似ランダム発生器、U
n・・・・・・音声刺激を模擬する波形、Sn・・・・
・・可変信号(出力信号)。

Claims (1)

  1. 【特許請求の範囲】 1 音声伝送システムの一部をなす装置の性能を客観的
    に測定する人工音声信号を発生するための装置において
    :−音声刺激を模擬し、音源信号として利用される、波
    形u_nを発生する波形発生器EGと;−線形位相を備
    え、波形発生器EGの後に接続され、該音源信号u_n
    の振幅スペクトルの逆値である伝達関数を備える、第1
    のデジイタルフイルタF1と;そして−異なつた人間の
    話者によつて発生された複数個の音声信号を平均するこ
    とによつて得た音声信号の振幅スペクトルと位相を示す
    伝達関数を備える第2のディジタルフィルタF2とを設
    けており、該第2のフィルタF2は、該第1のフィルタ
    の出力信号を受取り、人工音声信号を提供することを特
    徴とする人工音声信号を発生する装置。 2 波形発生器EGは、周期波形の発生器であり、そし
    て装置PSが提供されて、それにより上記の周期波形の
    振幅または周期、または、その両方を擬似ランダム変化
    させることを特徴とする特許請求の範囲第1項に記載の
    装置。 3 第2のフィルタF2は、0Hzから4kHzの間の
    周波数帯域幅における音声振幅の平均スペクトルを再生
    するような伝達関数を提供する定パラメータ全極フィル
    タであることを特徴とする特許請求の範囲第1項に記載
    の装置。
JP53072271A 1977-06-20 1978-06-16 人工音声信号を発生するための方法と装置 Expired JPS5950075B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IT0068420-A/77 1977-06-20
IT68420/77A IT1083533B (it) 1977-06-20 1977-06-20 Procedimento e dispositivo per la generazione di un segnale tipo voce per l'effettuazione di misure oggettive delle prestazioni di apparecchiature facenti parte di sistemi di trasmissione di segnali vocali

Publications (2)

Publication Number Publication Date
JPS547805A JPS547805A (en) 1979-01-20
JPS5950075B2 true JPS5950075B2 (ja) 1984-12-06

Family

ID=11309347

Family Applications (1)

Application Number Title Priority Date Filing Date
JP53072271A Expired JPS5950075B2 (ja) 1977-06-20 1978-06-16 人工音声信号を発生するための方法と装置

Country Status (9)

Country Link
US (1) US4187397A (ja)
JP (1) JPS5950075B2 (ja)
CH (1) CH629051A5 (ja)
DE (1) DE2826818C2 (ja)
FR (1) FR2395564A1 (ja)
GB (1) GB2000303B (ja)
IT (1) IT1083533B (ja)
NL (1) NL181152C (ja)
SE (1) SE438386B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL7902238A (nl) * 1978-04-27 1979-10-30 Kawai Musical Instr Mfg Co Inrichting voor het opwekken van een vocaal geluids- signaal in een elektronisch muziekinstrument.
US4374482A (en) * 1980-12-23 1983-02-22 Norlin Industries, Inc. Vocal effect for musical instrument
US4449231A (en) * 1981-09-25 1984-05-15 Northern Telecom Limited Test signal generator for simulated speech
GB2121549B (en) * 1982-06-01 1985-08-29 Standard Telephones Cables Ltd Apparatus for determining the loudness rating of a telephone system
JPS61152800A (ja) * 1984-12-27 1986-07-11 日華化学株式会社 ドライクリ−ニング用洗浄剤
US5832431A (en) * 1990-09-26 1998-11-03 Severson; Frederick E. Non-looped continuous sound by random sequencing of digital sound records
JP3167259B2 (ja) * 1994-05-06 2001-05-21 三菱電機株式会社 音響再生装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB937434A (en) * 1959-02-24 1963-09-18 Nippon Electric Co A vowel synthesizer
US3280266A (en) * 1963-05-15 1966-10-18 Bell Telephone Labor Inc Synthesis of artificial speech
GB1175740A (en) * 1966-05-18 1969-12-23 Tesla Np Method and device for Measuring the Reference Equivalent or Articulation of Telephone Sets
US3549807A (en) * 1967-09-18 1970-12-22 Bell Telephone Labor Inc Voiced fricative synthesizer
FR2045207A5 (ja) * 1969-06-20 1971-02-26 Anvar
DE2028005A1 (de) * 1970-06-08 1971-12-23 Sotscheck J Verfahren zur Bestimmung der Sprachqualität einer Übertragungsstrecke
CA1005913A (en) * 1971-03-01 1977-02-22 Richard T. Gagnon Voice synthesizer
DE2263579A1 (de) * 1972-12-27 1974-07-04 Philips Patentverwaltung Schaltungsanordnung zur elektrischen nachbildung von kehlkopfimpulsen
CH581878A5 (ja) * 1974-07-22 1976-11-15 Gretag Ag

Also Published As

Publication number Publication date
GB2000303A (en) 1979-01-04
NL181152C (nl) 1987-06-16
DE2826818C2 (de) 1983-02-17
FR2395564B1 (ja) 1984-04-27
DE2826818A1 (de) 1979-02-08
IT1083533B (it) 1985-05-21
NL181152B (nl) 1987-01-16
JPS547805A (en) 1979-01-20
FR2395564A1 (fr) 1979-01-19
CH629051A5 (it) 1982-03-31
SE7806822L (sv) 1978-12-21
US4187397A (en) 1980-02-05
GB2000303B (en) 1982-01-27
SE438386B (sv) 1985-04-15
NL7806508A (nl) 1978-12-22

Similar Documents

Publication Publication Date Title
Dudley Remaking speech
AU670950B2 (en) Method and apparatus for objective speech quality measurements of telecommunication equipment
Habets Multi-channel speech dereverberation based on a statistical model of late reverberation
Ioannidou et al. Effect of modulation depth, frequency, and intermittence on wind turbine noise annoyance
CN109565625B (zh) 耳机佩戴状态监测装置及方法
Seetharaman et al. Blind estimation of the speech transmission index for speech quality prediction
Jørgensen et al. Speech intelligibility evaluation for mobile phones
Cecchi et al. A combined psychoacoustic approach for stereo acoustic echo cancellation
JPS5950075B2 (ja) 人工音声信号を発生するための方法と装置
Liski et al. Audibility of group-delay equalization
Antweiler et al. Perfect sequence lms for rapid acquisition of continuous-azimuth head related impulse responses
Steeneken et al. Basics of the STI measuring method
Cabrera et al. BINAURAL MEASUREMENT AND SIMULATION OF THE ROOM ACOUSTICAL RESPONSE FROM A PERSON'S MOUTH TO THEIR EARS.
Gonzalez et al. Near-field evaluation of reproducible speech sources
Edraki et al. Speaker Adaptation For Enhancement Of Bone-Conducted Speech
Klippel Auralization of signal distortion in audio systems—part 1: Generic modeling
Farina et al. AQT-A New Objective Measurement of The Acoustical Quality of Sound Reproduction in Small Compartments
Ellaham et al. Evaluation of the phase-inversion signal separation method when using nonlinear hearing aids
de Santis et al. Perception & thresholds of nonlinear distortion using complex signals
Delebecque et al. BinauRec: A dataset to test the influence of the use of room impulse responses on binaural speech enhancement
ASCARI DSP analysis and psychoacoustic testing on the perception of low frequency transients and quality degradation in small rooms
Jamieson et al. Electroacoustic evaluation of assistive hearing devices
Mohlin Blind estimation of sound coloration in rooms
Pulkki An Introduction to Sound, Hearing and Perception
Gelen Convolution An Approach For Pre-auralization Of A Performance Space