JPS6126099A

JPS6126099A - 音声基本周波数抽出方法

Info

Publication number: JPS6126099A
Application number: JP14837284A
Authority: JP
Inventors: 杉浦　輝樹; 外川　文雄
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1984-07-16
Filing date: 1984-07-16
Publication date: 1986-02-05

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（イ）産業上の利用分野この発明は音声を分析して認識する方法に係り、とくに
音声の基本周波数の抽出方法に関する。

（ロ）従来技術従来より知られている基本周波数の抽出方法は、発声さ
れた文章又は単語の音声波形から音節とは無関係な一定
の時間単位に基本周波数を抽出し、文章や単語全体の基
本周波数の時間的変化の特徴（抑揚など）から話者のく
せや、方言、あるいは国語による特徴などを知る手がか
りにするものである。

しかしながら、基本周波数を抽出する単位時間が一定で
、音節とは全く無関係であるため、音節毎の基本周波数
の変化（たとえば音節毎のアクセントなど）を抽出する
ことができない。

また、周波数に周期性のない部分（例えば無声子音や息
の音）あるいは周期性の不明確な部分（語頭・語尾）な
どにおいて、誤った抽出結果が生じることがあるなどの
問題があった。

（ハ）発明の目的この発明は、このような事情に鑑みてなされたもので、
その主目的の一つは音声の認識において、音節単位に正
確な基本周波数を比較的容易に抽出できる音声基本周波
数抽出方法を提供することにある。

（ニ）発明の構成テープレコーダで音声を再生するとき、テープの速度を
１０％変化させると音声は明確に変化し、話者の声らし
さは全く失われる。　これは、言葉の音韻性の構造は保
たれているにもかかわらず、基本周波数が変化したため
である。　このように基本周波数、すなわちピッチの違
いは男女の声を区別したり、個人の音色の違いを区別す
る手がかりを与えるとともに、抑揚などのピーツチの緩
やかな時間的変化は話者の方言などの特徴などを知る一
つの手がかりとなる。　さらに、詳細に基本周波数を分
析すれば「橋」と「箸」などのアクセントの高さの差な
ども区別することができ、音声を具体的な文字に対応さ
せる場合などに利用することができる。

この発明は、このような基本周波数を特性をさらに活用
しやすくするもので、その機能上においては、（イ）文字や言葉に対応させるため、音節単位の基本周
波数を抽出する。

（ロ）抽出誤差をさけるため、音声波形周期の安定した
母音区間の基本周波数を抽出し、その音節の基本周波数
とする。

などを特徴とする音声基本周波数抽出方法であり、その
構成上においては、（イ）音声波形をデジタル化する。

（ロ）この音声の一定時間長のセグメント毎の特徴量を
算出して記憶する。

（ハ）同時にこれらのセグメント毎の基本周波数を算出
して記憶する。

（ニ）　（ロ）の特徴量から音節区間と母音区間とを検
出する。

（ホ）この音節区間に含まれる母音区間に対応した（ハ
）の基本周波数を呼出して中央値を算出し、前記音節区
間の代表基本周波数とする。

のステップからなる音声基本周波数抽出方法である。

（ホ）実施例以下図面に示す実施例に基づいてこの発明を詳述する。

　なおこれによってこの発明が限定されるものではない
。

第１図は、この発明の方法を実施した基本周波数抽出装
置の構成を示す。　第１図において、マイクロフォン＋
１１から入力された音声はアンプ（２）において増幅さ
れ、Ａ／Ｄ変換部（３）において、一般的な方法によっ
てデジタル化（量子化）される。

デジタル化された音声は、音韻分析部（４）に入力され
、一定時間長（数ミリ秒〜数十ミリ秒）のセグメント（
以下フレートという）ごとに、第１表に示す音韻的特徴
で分類され、記号化されてハソファメモ１月５）へ入力
され、一時的に蓄えられる。

（以下余白、次頁に絖く）第１表なお第１表に示す分類の方法については、例えば音声研
究会資料３８１−７６　（連続音声認識の検討二田中厚
夫、金原真司、白下−美：　Ｓ５７．１．２７発表）な
どを用いて実施することができる。

一方、Ａ／Ｄ変換部（３）の出力は、同時に基本周波数
演算部（６）にも入力され、一般的な方法（例えば波長
をある基準周波数でカウントするなど）で、フレーム毎
に基本周波数が算出され、求められた各フレーム毎の基
本周波数はハソファメモリ（７）へ出力され、一時的に
蓄えられる。　次に、音韻的特徴が記号化されてバッフ
ァメモリに蓄えられていた各フレームは、順次、音節区
間部（８）および母音区間検出部（９）へ出力される。

　音節区間検出部（８）は、記号化された各フレームか
らその記号列の並び順序を判定することにより音節部の
始端および終端を検出し、そのアドレスを基本周波数抽
出部α０）へ送る。　また同時に母音区間検出部（９）
は、記号化された各フレームから記号（Ｖ）のフレーム
を判別することにより、母音部の始端および終端を検出
し、そのアドレスを基本周波数抽出部ＱＯＩへ送る。　
基本周波数抽出部００）は、バッファメモリ（７）から
入力された音節区間とその母音区間のアドレスを参照し
て、音節区間における母音区間に含まれるフレームの基
本周波数を選別し、その中央値を算出して、それをその
音節区間を代表する基本周波数として出力する。

第２図は、第１図の基本周波数抽出部０ωにおける信号
処理のフローチャートを示している。　すなわち基本周
波数抽出部ａψが「スタート」すると、所定の音節区間
における母音区間に対応すフレームが選別されて、まず
フレームの数Ｎが計数される。　次に、その゛母音区間
の各フレームの基本周波数がその大きさの昇順又は降順
にソーティング（整理）され、基本周波数列Ｐ、（ｎ）
（ｎ＝１．２・・・Ｎ）が作成される。　さらに前述の
フレーム数Ｎが奇数か偶数かが判別され、Ｎが奇数のと
きには、基本周波数Ｆ’ｎはＦ　ｎ　＝　Ｐ　Ｃ（ｎ　＋　１）　／　２　）　−−
−一一一−−−−−−（１１によって算出され、Ｎが偶
数のときには、基本周波数ＦｎはＦ　ｎ　＝　（Ｐ　（Ｎ／２　）　＋　Ｐ　Ｃ（ｎ＋２
）／２）　）　／２−−一−−−−−−−＝−−−−’
−（２）によって算出される。　そしてこのＦｎが、そ
の音節を代表する基本周波数として出力される。

第３図は、第１図の装置において／　ｈ　ａ　ｎ　ａ　
ｇ　ａ／（花が）と発声し、その抽出過程の例を示した
図である。　第３図（イ）は、°入力された音声波形の
時間的変化を示すオシログラムである。

（ロ）は、第１図の音韻分析部（４）において、この音
声が一定時間長（１昨り秒）のフレーム毎に第１表の音
韻的特徴で分類され記号化された記号系列を表わしてい
る。　第１図の音節区間検出部（８）では、記号系列の
並び方から各音節の始端および終端が決定されるが、そ
れらが第３図（ロ）に音節区間（ｈａ）　（ｎａ）　（
ｇａ）　として示されている。　また第３図（ハ）は、
前述のフレーム毎に第１図の基本周波数演算部（６）で
演算されパブノアメモ１月７）へ蓄えられる各フレーム
の基本周波数列であり、その内■印の付いた列は、母音
区間検出部（９）で、バッファメモリに蓄えられていた
記号列の記号（Ｖ）からその始端と終端が選別された母
音区間の周波数列を示している。　そして同図（ニ）の
ように、母音区間の周波数列が降順にソーティング（整
理）される。　ここで音節（ｈａ）においては、母音区
間のフレームＮ−７（奇数）であるので、＋１１式から
その中央値として基本周波数　　Ｆｎ＝Ｐ　Ｃ（７＋１
）／２）　−Ｐ　（４）と演算され、第３図（ニ）より
　Ｐ　（４）　−１３５Ｈｚ　　であるから、この値が
音節（ｈａ）を代表する基本周波数として出力される。

　他の音節（ｎａ）　、（ｇａ）についても同様に算出
されるが、第３図（ホ）はそれぞれの算出された基本周
波数を示している。

さら第４図は第１図の装置を用いて、「花が」と「鼻が
」とを成人男性および成人女性に発声させ、その音節毎
の基本周波数を抽出した結果の一例を示したグラフであ
る。同図（八）は男性、（Ｂ）は女性による結果を示し
、（Ａ１）　（Ｂｌ）は「花が」を、（Ａ２）　（Ｂ２
）は「鼻が」を発声した基本周波数の変化を示している
。　この抽出結果は次の項目を明白に示している。

（ｉ）女性の基本周波数は男性のほぼ２倍になっている
。

（ｉｉ）ｒ花が」のｎａと「鼻が」のｎａの基本周波数
には明確な有異差が見られ、両者を区別することは十分
可能である。

上記項目（ｉ）は従来の抽出方法でも検出することがで
きるが、項目（ｉｉ　）はこの発明にしてはじめて可能
となる。

（へ）発明の効果この発明によれば、音声の基本周波数が音節ごとに高精
度に抽出でき、音声の音色や抑揚の微妙な差異や音節ご
とのアクセントの違いなどの検出が比較的容易に可能と
なる。

【図面の簡単な説明】

第１図はこの発明に係る一実施例を示すブロック図、第
２図はこの発明に係る一実施例のフローチャート、第３
図は第１図の過程を示す説明図、第４図は第１図の抽出
結果の一例を示すグラフである。（１）−−−マイクロフォン、　（２１−アンプ、（３
１−Ａ　／　Ｄ変換器、　　（４）−音韻分析部、＋５
１　（７Ｌ−−バッファメモリ、（６）−基本周波数演
算部、（８）−音節区間検出部、　（９１−母音区間検
出部、００１−基本周波数抽出部。出力第４図ｈａ　　　　ｎａ　　　　ｇ。手続補正書昭和５９年８月２１日

Claims

【特許請求の範囲】１、（イ）音声波形をデジタル化する、（ロ）この音声の一定時間長のセグメント毎の特徴量を
算出して記憶する、（ハ）同時にこれらのセグメント毎の基本周波数を算出
して記憶する、（ニ）（ロ）の特徴量から音節区間と母音区間とを検出
する、（ホ）この音節区間に含まれる母音区間に対応した　（
ハ）の基本周波数を呼出して中央値を算出し、前記音節区間の代表基本周波数とする、のステップからなる音声基本周波数抽出方法。