JP2734028B2 - 音声収録装置 - Google Patents

音声収録装置

Info

Publication number
JP2734028B2
JP2734028B2 JP63308137A JP30813788A JP2734028B2 JP 2734028 B2 JP2734028 B2 JP 2734028B2 JP 63308137 A JP63308137 A JP 63308137A JP 30813788 A JP30813788 A JP 30813788A JP 2734028 B2 JP2734028 B2 JP 2734028B2
Authority
JP
Japan
Prior art keywords
voice
standard sound
recording
sound
pitch frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63308137A
Other languages
English (en)
Other versions
JPH02153397A (ja
Inventor
和彦 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP63308137A priority Critical patent/JP2734028B2/ja
Publication of JPH02153397A publication Critical patent/JPH02153397A/ja
Application granted granted Critical
Publication of JP2734028B2 publication Critical patent/JP2734028B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声合成等に用いる音声データを収録するた
めの音声収録装置に関する。
〔従来の技術〕
音声合成方式の一つとして、次のようなものが知られ
ている(日本音響学会発行の音声研究会資料記載の「C
V,VC波形のピッチ周期的補間による任意語合成方式」、
資料番号S82-06(1982−4))。
先ず、ピッチ周波数の異なる単音節等を単位音声とし
て複数種類予め録音しておく。この録音は単位音声を人
が発声することにより行われる。次に、合成する単語や
文書のイントネーションパターンに従って、録音されて
いる単位音声の中から単語等に最も近いピッチ周波数を
有する単位音声を選択し、これらを編集することにより
音声を合成していた。
ここで、予め発声録音されている単位音声のピッチ周
波数を変更せずに最も近いピッチ周波数を有する単位音
声を選択し、これらの単位音声を接続して単語や文章の
イントネーションを合成する方式を採っている理由は、
予め発声録音されている単位音声のピッチ周波数を変更
すると合成音声の音質が著しく劣化するからである。
従って、このような音声合成方式に用いる単位音声と
しては、必要なピッチ周波数で正確に発声されたものを
収録しておかねばならない。
従来、このような音声合成方式で用いられる単位音声
の収録に、予め定められたピッチ周波数を有する標準音
を発声者に聴取させ、その標準音にできるだけ近いと発
声者が感ずるピッチ周波数で発声者に発声させ、それを
録音するという装置が用いられていた(特公昭54-52682
号「音声収録装置」)。
〔発明が解決しようとする課題〕
上述した従来の音声収録装置は、発声者に標準音を聴
取させ、発声者の聴覚でピッチ周波数の遠近を判断させ
る構造であったため、以下の欠点がある。
(イ) 発声者が必要なピッチ周波数を正確に発声する
ことは困難である。
(ロ) 発声者がどの程度標準音に対応して正確に発声
したかを発声者自身がその場で知ることができないた
め、音声収録後、合成時に発声された音声のピッチ周波
数を修正しなくてはならない。この結果、合成音声の品
質劣化は避けることができなかった。また甚だしい場合
には、再度収録を行うといったことが必要であった。
本発明の目的は、上記課題に解決し、音声合成等に用
いる音声データの収録において必要とされる正確なピッ
チ周波数を有する音声を収録することを可能にする音声
収録装置を提供することにある。
〔課題を解決するための手段〕
本発明は、予め定められたピッチ周波数を有する標準
音を発声音に聴取させ、この標準音に近いピッチ周波数
の音声を発声させ、この音声を収録する音声収録装置で
あって、 入力されたピッチ周波数を有する前記標準音を生成す
るための標準音生成手段と、 この標準音生成手段で生成された標準音の特徴量を算
出する標準音特徴量算出手段と、 前記発声音声の特徴量を算出する音声特徴量算出手段
と、 この音声特徴量算出手段により算出された音声の特徴
量と前記標準音特徴量算出手段により算出された標準音
の特徴量との間の距離を算出し、この距離が所定の値よ
りも小さい場合に前記発声音声の収録許可信号を発生す
る収録許可信号発生手段と、 前記収録許可信号に基づいて前記音声を収録する録音
手段とを備えていることを特徴とする。
〔作用〕
本発明では、まず必要とされる正確なピッチ周波数を
有する標準音を標準音生成手段により生成して発声者に
聴取させ、同じ高さと思われる音声を発声者に発声させ
る。発声された音声を音声特徴量算出手段により分析し
て音声の持つ特徴量を算出する。算出する特徴量として
は、ピッチ周波数が考えられる。このとき、前記標準音
についても標準音特徴量算出手段を用いて同様の特徴量
を算出する。次に、収録許可信号発生手段により、前記
音声の特徴量と標準音の特徴量とを比較し、2つの特徴
量の距離を求める。例えば、特徴量としてピッチ周波数
を用いた場合を考えると、音声と標準音の各々の平均ピ
ッチ周波数を算出し、その差を距離とすることができ
る。このようにして得られた距離を予め定めておいた閾
値と比較し、前記距離が前記閾値よりも小さい場合にの
み発声された音声を録音手段を用いて収録する。距離が
閾値よりも大きい場合は、距離が閾値よりも小さい値を
取るまで、発声をやり直す。
以上のように、発声された音声の特徴量と標準音の特
徴量との距離を算出し、2つの特徴量の距離が十分に近
い場合にのみ、発声された音声を収録することにより、
標準音を呈示していただけの従来方法に比べ、より正確
なピッチ周波数を有する音声を確実に収録することが可
能となる。
なお、前記距離を求める際に用いる特徴量としてはピ
ッチ周波数のほか、パワー(音の強さ)など併せて用い
ることも可能であり、これらを総合した距離を算出する
ことは、さらに正確なピッチを有する音声を収録するの
に有効である。
〔実施例〕
本発明の実施例について図面を参照して説明する。
第1図は本発明の一実施例に係る音声収録装置であ
る。
音声収録装置1は、ピッチ周波数入力端子2を有する
標準音生成回路3(標準音生成手段)と、この標準音生
成回路3の出力側に接続された標準音特徴量算出回路4
(標準音特徴量算出手段)と、マイクロホン5に接続さ
れた音声特徴量算出回路6(音声特徴量算出手段)と、
標準音特徴量算出回路4と音声特徴量算出回路の出力側
に接続された収録許可信号発生回路7(収録許可信号発
生手段)と、スイッチ8を介してマイクロホン5に接続
された録音回路9(録音手段)とを備えている。
標準音声生成回路3は、ピッチ周波数入力端子2から
入力したピッチ周波数aに基づいてこのピッチ周波数a
を有する音声の標準音を生成し、生成した標準音bを標
準音特徴量算出回路4及びレシーバ10に出力する機能を
有する。ここで生成される標準音は、正弦波,矩形波又
は三角波等である。この他にも標準音として合成音声を
用いることも可能である。
標準音特徴量算出回路4は、標準音生成回路3からの
標準音bを入力し、この標準音bのピッチ周波数やパワ
ー等の特徴量を算出して、標準音bの特徴量を示す情報
cを収録許可信号発生回路7に出力する機能を有する。
音声特徴量算出回路6は、マイクロホン5から入力し
た音声dのピッチ周波数やパワー等の特徴量を算出して
音声dの特徴量を示す情報eを収録許可信号発生回路7
に出力する機能を有する。
収録許可信号発生回路7は、制御線11を介してスイッ
チ8の開閉制御を行う機能を有する。具体的には、標準
音特徴量算出回路4と音声特徴量算出回路6から入力し
た情報cとeに基づいて、情報cが示す標準音の特徴量
と情報eが示す音声の特徴量との距離、即ち類似の度合
を算出し、その値が所定の閾値より小さいと判断した場
合に制御線11を介して制御信号fをスイッチ8に出力し
てスイッチ8を閉じる機能を有する。
録音回路9は、マイクロホン5から閉状態のスイッチ
8を介して入力した音声dを録音する機能を有する。こ
の録音回路9としてテープレコーダを用いれば、音声d
を磁気テープに録音することができる。また音声dの信
号をアナログ/ディジタル変換を用いてディジタル信号
に変換し、これをメモリや磁気ディスクに蓄える録音回
路9も可能である。
次に、本実施例に係る音声収録装置の動作について説
明する。
ピッチ周波数入力端子2からピッチ周波数aを入力す
ると、標準音生成回路3によってピッチ周波数aを有す
る音声の標準音bが生成される。
この標準音bは、標準音特徴量算出回路4に入力さ
れ、標準音特徴量算出回路4は、標準音bの特徴量を示
す情報cを収録許可信号発生回路7に出力する。また、
標準音bはレシーバ10にも出力されるから、発声者はレ
シーバ10によってピッチ周波数aの標準音bを聴くこと
ができる。
発声者は、レシーバ10から標準音bを聴取し、そのピ
ッチ周波数aと等しいと思われるピッチ周波数で音声d
を発声する。
発声された音声dはマイクロホン5を介して音声特徴
量算出回路6に入力され、音声特徴量算出回路6は音声
dの特徴量を示す情報eを収録許可信号発生回路7に出
力する。
収録許可信号発生回路7に出力した情報cとeは、そ
の特徴量を比較される。収録許可信号発生回路7は、こ
れらの特徴量の距離が前記閾値よりも大きいと判断した
場合にはスイッチ8を開状態にする制御信号fをスイッ
チ8に出力する。従ってこの場合には、音声dは録音回
路9に録音されないため、発声者は再度正確な音声dを
発生する。一方、特徴量の距離が前記閾値よりも小さい
と判断した場合には、スイッチ8を閉状態にする制御信
号fがスイッチ8に出力され、音声dは録音回路9に入
力して正確な音声として録音される。
従って、各種のピッチ周波数の音声を発声者が発声す
ることにより、正確な音声が複数種類にわたって録音回
路9に収録される。
〔発明の効果〕
本発明の音声収録装置は、以上説明したように構成さ
れているため、以下の効果がある。
(イ) 必要なピッチ周波数を持った音声を、従来方式
に比べより確実に収録することができる。
(ロ) 必要なピッチ周波数を持った音声を収録する作
業を、大幅に軽減することができる。
【図面の簡単な説明】
第1図は本発明の一実施例に係る音声収録装置を示すブ
ロック図である。 1……音声収録装置 3……標準音生成回路(標準音生成手段) 4……標準音特徴量算出回路(標準音特徴量算出手段) 6……音声特徴量算出回路(音声特徴量算出手段) 7……収録許可信号発生回路(収録許可信号発生手段) 9……録音回路(録音手段)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】予め定められたピッチ周波数を有する標準
    音を発声者に聴取させ、この標準音に近いピッチ周波数
    の音声を発声させ、この音声を収録する音声収録装置で
    あって、 入力されたピッチ周波数を有する前記標準音を生成する
    ための標準音生成手段と、 この標準音生成手段で生成された標準音の特徴量を算出
    する標準音特徴量算出手段と、 前記発声音声の特徴量を算出する音声特徴量算出手段
    と、 この音声特徴量算出手段により算出された音声の特徴量
    と前記標準音特徴量算出手段により算出された標準音の
    特徴量との間の距離を算出し、この距離が所定の値より
    も小さい場合に前記発声音声の収録許可信号を発生する
    収録許可信号発生手段と、 前記収録許可信号に基づいて前記音声を収録する録音手
    段とを備えていることを特徴とする音声収録装置。
JP63308137A 1988-12-06 1988-12-06 音声収録装置 Expired - Lifetime JP2734028B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63308137A JP2734028B2 (ja) 1988-12-06 1988-12-06 音声収録装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63308137A JP2734028B2 (ja) 1988-12-06 1988-12-06 音声収録装置

Publications (2)

Publication Number Publication Date
JPH02153397A JPH02153397A (ja) 1990-06-13
JP2734028B2 true JP2734028B2 (ja) 1998-03-30

Family

ID=17977336

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63308137A Expired - Lifetime JP2734028B2 (ja) 1988-12-06 1988-12-06 音声収録装置

Country Status (1)

Country Link
JP (1) JP2734028B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2972459B2 (ja) * 1992-10-01 1999-11-08 日本電気株式会社 自動音質評価装置
JP2953238B2 (ja) * 1993-02-09 1999-09-27 日本電気株式会社 音質主観評価予測方式
JP2002132287A (ja) * 2000-10-20 2002-05-09 Canon Inc 音声収録方法および音声収録装置および記憶媒体
JP2007256349A (ja) * 2006-03-20 2007-10-04 Oki Electric Ind Co Ltd 音声データ収録システムおよび音声データ収録方法

Also Published As

Publication number Publication date
JPH02153397A (ja) 1990-06-13

Similar Documents

Publication Publication Date Title
US5828994A (en) Non-uniform time scale modification of recorded audio
EP1973102B1 (en) Sound masking system and masking sound generation method
CA2253749C (en) Method and device for instantly changing the speed of speech
JPS5953560B2 (ja) 音声の合成方法
JP3306784B2 (ja) 骨導マイクロホン出力信号再生装置
JP2734028B2 (ja) 音声収録装置
JPS5982608A (ja) 音声の再生速度制御方式
JP2001184100A (ja) 話速変換装置
JP4778402B2 (ja) 休止時間長算出装置及びそのプログラム、並びに音声合成装置
US20040054524A1 (en) Speech transformation system and apparatus
US20050171777A1 (en) Generation of synthetic speech
JP2001154684A (ja) 話速変換装置
JPH08110796A (ja) 音声強調方法および装置
US6112178A (en) Method for synthesizing voiceless consonants
JPS5912479A (ja) 発音練習装置
JP3241582B2 (ja) 韻律制御装置及び方法
JPH05173587A (ja) 音声合成装置
JPH02153398A (ja) 音声収録装置
Ainsworth The perception of speech signals
JPS63147200A (ja) 音声パラメ−タ修正方式
JPS5950079B2 (ja) 音声合成方法
JPH04213499A (ja) 規則音声合成装置
KR20000059961A (ko) 디지털 음성 속도가변 재생방법 및 그 장치
JPH01187000A (ja) 音声合成装置
JPH07295465A (ja) 語学学習装置