JPS6126099A - 音声基本周波数抽出方法 - Google Patents
音声基本周波数抽出方法Info
- Publication number
- JPS6126099A JPS6126099A JP14837284A JP14837284A JPS6126099A JP S6126099 A JPS6126099 A JP S6126099A JP 14837284 A JP14837284 A JP 14837284A JP 14837284 A JP14837284 A JP 14837284A JP S6126099 A JPS6126099 A JP S6126099A
- Authority
- JP
- Japan
- Prior art keywords
- fundamental frequency
- syllable
- interval
- extraction
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(イ)産業上の利用分野
この発明は音声を分析して認識する方法に係り、とくに
音声の基本周波数の抽出方法に関する。
音声の基本周波数の抽出方法に関する。
(ロ)従来技術
従来より知られている基本周波数の抽出方法は、発声さ
れた文章又は単語の音声波形から音節とは無関係な一定
の時間単位に基本周波数を抽出し、文章や単語全体の基
本周波数の時間的変化の特徴(抑揚など)から話者のく
せや、方言、あるいは国語による特徴などを知る手がか
りにするものである。
れた文章又は単語の音声波形から音節とは無関係な一定
の時間単位に基本周波数を抽出し、文章や単語全体の基
本周波数の時間的変化の特徴(抑揚など)から話者のく
せや、方言、あるいは国語による特徴などを知る手がか
りにするものである。
しかしながら、基本周波数を抽出する単位時間が一定で
、音節とは全く無関係であるため、音節毎の基本周波数
の変化(たとえば音節毎のアクセントなど)を抽出する
ことができない。
、音節とは全く無関係であるため、音節毎の基本周波数
の変化(たとえば音節毎のアクセントなど)を抽出する
ことができない。
また、周波数に周期性のない部分(例えば無声子音や息
の音)あるいは周期性の不明確な部分(語頭・語尾)な
どにおいて、誤った抽出結果が生じることがあるなどの
問題があった。
の音)あるいは周期性の不明確な部分(語頭・語尾)な
どにおいて、誤った抽出結果が生じることがあるなどの
問題があった。
(ハ)発明の目的
この発明は、このような事情に鑑みてなされたもので、
その主目的の一つは音声の認識において、音節単位に正
確な基本周波数を比較的容易に抽出できる音声基本周波
数抽出方法を提供することにある。
その主目的の一つは音声の認識において、音節単位に正
確な基本周波数を比較的容易に抽出できる音声基本周波
数抽出方法を提供することにある。
(ニ)発明の構成
テープレコーダで音声を再生するとき、テープの速度を
10%変化させると音声は明確に変化し、話者の声らし
さは全く失われる。 これは、言葉の音韻性の構造は保
たれているにもかかわらず、基本周波数が変化したため
である。 このように基本周波数、すなわちピッチの違
いは男女の声を区別したり、個人の音色の違いを区別す
る手がかりを与えるとともに、抑揚などのピーツチの緩
やかな時間的変化は話者の方言などの特徴などを知る一
つの手がかりとなる。 さらに、詳細に基本周波数を分
析すれば「橋」と「箸」などのアクセントの高さの差な
ども区別することができ、音声を具体的な文字に対応さ
せる場合などに利用することができる。
10%変化させると音声は明確に変化し、話者の声らし
さは全く失われる。 これは、言葉の音韻性の構造は保
たれているにもかかわらず、基本周波数が変化したため
である。 このように基本周波数、すなわちピッチの違
いは男女の声を区別したり、個人の音色の違いを区別す
る手がかりを与えるとともに、抑揚などのピーツチの緩
やかな時間的変化は話者の方言などの特徴などを知る一
つの手がかりとなる。 さらに、詳細に基本周波数を分
析すれば「橋」と「箸」などのアクセントの高さの差な
ども区別することができ、音声を具体的な文字に対応さ
せる場合などに利用することができる。
この発明は、このような基本周波数を特性をさらに活用
しやすくするもので、その機能上においては、 (イ)文字や言葉に対応させるため、音節単位の基本周
波数を抽出する。
しやすくするもので、その機能上においては、 (イ)文字や言葉に対応させるため、音節単位の基本周
波数を抽出する。
(ロ)抽出誤差をさけるため、音声波形周期の安定した
母音区間の基本周波数を抽出し、その音節の基本周波数
とする。
母音区間の基本周波数を抽出し、その音節の基本周波数
とする。
などを特徴とする音声基本周波数抽出方法であり、その
構成上においては、 (イ)音声波形をデジタル化する。
構成上においては、 (イ)音声波形をデジタル化する。
(ロ)この音声の一定時間長のセグメント毎の特徴量を
算出して記憶する。
算出して記憶する。
(ハ)同時にこれらのセグメント毎の基本周波数を算出
して記憶する。
して記憶する。
(ニ) (ロ)の特徴量から音節区間と母音区間とを検
出する。
出する。
(ホ)この音節区間に含まれる母音区間に対応した(ハ
)の基本周波数を呼出して中央値を算出し、前記音節区
間の代表基本周波数とする。
)の基本周波数を呼出して中央値を算出し、前記音節区
間の代表基本周波数とする。
のステップからなる音声基本周波数抽出方法である。
(ホ)実施例
以下図面に示す実施例に基づいてこの発明を詳述する。
なおこれによってこの発明が限定されるものではない
。
。
第1図は、この発明の方法を実施した基本周波数抽出装
置の構成を示す。 第1図において、マイクロフォン+
11から入力された音声はアンプ(2)において増幅さ
れ、A/D変換部(3)において、一般的な方法によっ
てデジタル化(量子化)される。
置の構成を示す。 第1図において、マイクロフォン+
11から入力された音声はアンプ(2)において増幅さ
れ、A/D変換部(3)において、一般的な方法によっ
てデジタル化(量子化)される。
デジタル化された音声は、音韻分析部(4)に入力され
、一定時間長(数ミリ秒〜数十ミリ秒)のセグメント(
以下フレートという)ごとに、第1表に示す音韻的特徴
で分類され、記号化されてハソファメモ1月5)へ入力
され、一時的に蓄えられる。
、一定時間長(数ミリ秒〜数十ミリ秒)のセグメント(
以下フレートという)ごとに、第1表に示す音韻的特徴
で分類され、記号化されてハソファメモ1月5)へ入力
され、一時的に蓄えられる。
(以下余白、次頁に絖く)
第1表
なお第1表に示す分類の方法については、例えば音声研
究会資料381−76 (連続音声認識の検討二田中厚
夫、金原真司、白下−美: S57.1.27発表)な
どを用いて実施することができる。
究会資料381−76 (連続音声認識の検討二田中厚
夫、金原真司、白下−美: S57.1.27発表)な
どを用いて実施することができる。
一方、A/D変換部(3)の出力は、同時に基本周波数
演算部(6)にも入力され、一般的な方法(例えば波長
をある基準周波数でカウントするなど)で、フレーム毎
に基本周波数が算出され、求められた各フレーム毎の基
本周波数はハソファメモリ(7)へ出力され、一時的に
蓄えられる。 次に、音韻的特徴が記号化されてバッフ
ァメモリに蓄えられていた各フレームは、順次、音節区
間部(8)および母音区間検出部(9)へ出力される。
演算部(6)にも入力され、一般的な方法(例えば波長
をある基準周波数でカウントするなど)で、フレーム毎
に基本周波数が算出され、求められた各フレーム毎の基
本周波数はハソファメモリ(7)へ出力され、一時的に
蓄えられる。 次に、音韻的特徴が記号化されてバッフ
ァメモリに蓄えられていた各フレームは、順次、音節区
間部(8)および母音区間検出部(9)へ出力される。
音節区間検出部(8)は、記号化された各フレームか
らその記号列の並び順序を判定することにより音節部の
始端および終端を検出し、そのアドレスを基本周波数抽
出部α0)へ送る。 また同時に母音区間検出部(9)
は、記号化された各フレームから記号(V)のフレーム
を判別することにより、母音部の始端および終端を検出
し、そのアドレスを基本周波数抽出部QOIへ送る。
基本周波数抽出部00)は、バッファメモリ(7)から
入力された音節区間とその母音区間のアドレスを参照し
て、音節区間における母音区間に含まれるフレームの基
本周波数を選別し、その中央値を算出して、それをその
音節区間を代表する基本周波数として出力する。
らその記号列の並び順序を判定することにより音節部の
始端および終端を検出し、そのアドレスを基本周波数抽
出部α0)へ送る。 また同時に母音区間検出部(9)
は、記号化された各フレームから記号(V)のフレーム
を判別することにより、母音部の始端および終端を検出
し、そのアドレスを基本周波数抽出部QOIへ送る。
基本周波数抽出部00)は、バッファメモリ(7)から
入力された音節区間とその母音区間のアドレスを参照し
て、音節区間における母音区間に含まれるフレームの基
本周波数を選別し、その中央値を算出して、それをその
音節区間を代表する基本周波数として出力する。
第2図は、第1図の基本周波数抽出部0ωにおける信号
処理のフローチャートを示している。 すなわち基本周
波数抽出部aψが「スタート」すると、所定の音節区間
における母音区間に対応すフレームが選別されて、まず
フレームの数Nが計数される。 次に、その゛母音区間
の各フレームの基本周波数がその大きさの昇順又は降順
にソーティング(整理)され、基本周波数列P、(n)
(n=1.2・・・N)が作成される。 さらに前述の
フレーム数Nが奇数か偶数かが判別され、Nが奇数のと
きには、基本周波数F’nは F n = P C(n + 1) / 2 ) −−
−一一一−−−−−−(11によって算出され、Nが偶
数のときには、基本周波数Fnは F n = (P (N/2 ) + P C(n+2
)/2) ) /2−−一−−−−−−−=−−−−’
−(2)によって算出される。 そしてこのFnが、そ
の音節を代表する基本周波数として出力される。
処理のフローチャートを示している。 すなわち基本周
波数抽出部aψが「スタート」すると、所定の音節区間
における母音区間に対応すフレームが選別されて、まず
フレームの数Nが計数される。 次に、その゛母音区間
の各フレームの基本周波数がその大きさの昇順又は降順
にソーティング(整理)され、基本周波数列P、(n)
(n=1.2・・・N)が作成される。 さらに前述の
フレーム数Nが奇数か偶数かが判別され、Nが奇数のと
きには、基本周波数F’nは F n = P C(n + 1) / 2 ) −−
−一一一−−−−−−(11によって算出され、Nが偶
数のときには、基本周波数Fnは F n = (P (N/2 ) + P C(n+2
)/2) ) /2−−一−−−−−−−=−−−−’
−(2)によって算出される。 そしてこのFnが、そ
の音節を代表する基本周波数として出力される。
第3図は、第1図の装置において/ h a n a
g a/(花が)と発声し、その抽出過程の例を示した
図である。 第3図(イ)は、°入力された音声波形の
時間的変化を示すオシログラムである。
g a/(花が)と発声し、その抽出過程の例を示した
図である。 第3図(イ)は、°入力された音声波形の
時間的変化を示すオシログラムである。
(ロ)は、第1図の音韻分析部(4)において、この音
声が一定時間長(1昨り秒)のフレーム毎に第1表の音
韻的特徴で分類され記号化された記号系列を表わしてい
る。 第1図の音節区間検出部(8)では、記号系列の
並び方から各音節の始端および終端が決定されるが、そ
れらが第3図(ロ)に音節区間(ha) (na) (
ga) として示されている。 また第3図(ハ)は、
前述のフレーム毎に第1図の基本周波数演算部(6)で
演算されパブノアメモ1月7)へ蓄えられる各フレーム
の基本周波数列であり、その内■印の付いた列は、母音
区間検出部(9)で、バッファメモリに蓄えられていた
記号列の記号(V)からその始端と終端が選別された母
音区間の周波数列を示している。 そして同図(ニ)の
ように、母音区間の周波数列が降順にソーティング(整
理)される。 ここで音節(ha)においては、母音区
間のフレームN−7(奇数)であるので、+11式から
その中央値として基本周波数 Fn=P C(7+1
)/2) −P (4)と演算され、第3図(ニ)より
P (4) −135Hz であるから、この値が
音節(ha)を代表する基本周波数として出力される。
声が一定時間長(1昨り秒)のフレーム毎に第1表の音
韻的特徴で分類され記号化された記号系列を表わしてい
る。 第1図の音節区間検出部(8)では、記号系列の
並び方から各音節の始端および終端が決定されるが、そ
れらが第3図(ロ)に音節区間(ha) (na) (
ga) として示されている。 また第3図(ハ)は、
前述のフレーム毎に第1図の基本周波数演算部(6)で
演算されパブノアメモ1月7)へ蓄えられる各フレーム
の基本周波数列であり、その内■印の付いた列は、母音
区間検出部(9)で、バッファメモリに蓄えられていた
記号列の記号(V)からその始端と終端が選別された母
音区間の周波数列を示している。 そして同図(ニ)の
ように、母音区間の周波数列が降順にソーティング(整
理)される。 ここで音節(ha)においては、母音区
間のフレームN−7(奇数)であるので、+11式から
その中央値として基本周波数 Fn=P C(7+1
)/2) −P (4)と演算され、第3図(ニ)より
P (4) −135Hz であるから、この値が
音節(ha)を代表する基本周波数として出力される。
他の音節(na) 、(ga)についても同様に算出
されるが、第3図(ホ)はそれぞれの算出された基本周
波数を示している。
されるが、第3図(ホ)はそれぞれの算出された基本周
波数を示している。
さら第4図は第1図の装置を用いて、「花が」と「鼻が
」とを成人男性および成人女性に発声させ、その音節毎
の基本周波数を抽出した結果の一例を示したグラフであ
る。同図(八)は男性、(B)は女性による結果を示し
、(A1) (Bl)は「花が」を、(A2) (B2
)は「鼻が」を発声した基本周波数の変化を示している
。 この抽出結果は次の項目を明白に示している。
」とを成人男性および成人女性に発声させ、その音節毎
の基本周波数を抽出した結果の一例を示したグラフであ
る。同図(八)は男性、(B)は女性による結果を示し
、(A1) (Bl)は「花が」を、(A2) (B2
)は「鼻が」を発声した基本周波数の変化を示している
。 この抽出結果は次の項目を明白に示している。
(i)女性の基本周波数は男性のほぼ2倍になっている
。
。
(ii)r花が」のnaと「鼻が」のnaの基本周波数
には明確な有異差が見られ、両者を区別することは十分
可能である。
には明確な有異差が見られ、両者を区別することは十分
可能である。
上記項目(i)は従来の抽出方法でも検出することがで
きるが、項目(ii )はこの発明にしてはじめて可能
となる。
きるが、項目(ii )はこの発明にしてはじめて可能
となる。
(へ)発明の効果
この発明によれば、音声の基本周波数が音節ごとに高精
度に抽出でき、音声の音色や抑揚の微妙な差異や音節ご
とのアクセントの違いなどの検出が比較的容易に可能と
なる。
度に抽出でき、音声の音色や抑揚の微妙な差異や音節ご
とのアクセントの違いなどの検出が比較的容易に可能と
なる。
第1図はこの発明に係る一実施例を示すブロック図、第
2図はこの発明に係る一実施例のフローチャート、第3
図は第1図の過程を示す説明図、第4図は第1図の抽出
結果の一例を示すグラフである。 (1)−−−マイクロフォン、 (21−アンプ、(3
1−A / D変換器、 (4)−音韻分析部、+5
1 (7L−−バッファメモリ、(6)−基本周波数演
算部、(8)−音節区間検出部、 (91−母音区間検
出部、001−基本周波数抽出部。 出力 第4図 ha na g。 手続補正書 昭和59年8月21日
2図はこの発明に係る一実施例のフローチャート、第3
図は第1図の過程を示す説明図、第4図は第1図の抽出
結果の一例を示すグラフである。 (1)−−−マイクロフォン、 (21−アンプ、(3
1−A / D変換器、 (4)−音韻分析部、+5
1 (7L−−バッファメモリ、(6)−基本周波数演
算部、(8)−音節区間検出部、 (91−母音区間検
出部、001−基本周波数抽出部。 出力 第4図 ha na g。 手続補正書 昭和59年8月21日
Claims (1)
- 【特許請求の範囲】 1、(イ)音声波形をデジタル化する、 (ロ)この音声の一定時間長のセグメント毎の特徴量を
算出して記憶する、 (ハ)同時にこれらのセグメント毎の基本周波数を算出
して記憶する、 (ニ)(ロ)の特徴量から音節区間と母音区間とを検出
する、 (ホ)この音節区間に含まれる母音区間に対応した (
ハ)の基本周波数を呼出して中央 値を算出し、前記音節区間の代表基本周 波数とする、 のステップからなる音声基本周波数抽出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14837284A JPS6126099A (ja) | 1984-07-16 | 1984-07-16 | 音声基本周波数抽出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP14837284A JPS6126099A (ja) | 1984-07-16 | 1984-07-16 | 音声基本周波数抽出方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6126099A true JPS6126099A (ja) | 1986-02-05 |
Family
ID=15451286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP14837284A Pending JPS6126099A (ja) | 1984-07-16 | 1984-07-16 | 音声基本周波数抽出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6126099A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008070564A (ja) * | 2006-09-13 | 2008-03-27 | Fujitsu Ltd | 音声強調装置、音声登録装置、音声強調プログラム、音声登録プログラム、音声強調方法および音声登録方法 |
-
1984
- 1984-07-16 JP JP14837284A patent/JPS6126099A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008070564A (ja) * | 2006-09-13 | 2008-03-27 | Fujitsu Ltd | 音声強調装置、音声登録装置、音声強調プログラム、音声登録プログラム、音声強調方法および音声登録方法 |
US8190432B2 (en) | 2006-09-13 | 2012-05-29 | Fujitsu Limited | Speech enhancement apparatus, speech recording apparatus, speech enhancement program, speech recording program, speech enhancing method, and speech recording method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3162994B2 (ja) | 音声のワードを認識する方法及び音声のワードを識別するシステム | |
JPS5972496A (ja) | 単音識別装置 | |
JPS6247320B2 (ja) | ||
Hasija et al. | Recognition of children Punjabi speech using tonal non-tonal classifier | |
JPS6126099A (ja) | 音声基本周波数抽出方法 | |
JPS5972500A (ja) | 音声認識方式 | |
CN113409762B (zh) | 情感语音合成方法、装置、设备及存储介质 | |
JPH0962286A (ja) | 音声合成装置および音声合成方法 | |
JP3299170B2 (ja) | 音声登録認識装置 | |
JPS63161499A (ja) | 音声認識装置 | |
JPS63217399A (ja) | 音声区間検出装置 | |
JPS6069694A (ja) | 語頭子音のセグメンテ−ション法 | |
JPS60164800A (ja) | 音声認識装置 | |
JPH02124600A (ja) | 音声認識装置 | |
JPS61249099A (ja) | 音声認識装置 | |
JP2578771B2 (ja) | 音声認識装置 | |
JPS6011898A (ja) | 音声認識装置 | |
JPS61180300A (ja) | 音声認識装置 | |
Tun et al. | Myanmar Continuous Speech to Isolated Word Segmentation | |
JP2006343544A (ja) | 音声認識方法 | |
JPS58195895A (ja) | 単語音声認識装置 | |
JPH02205898A (ja) | 音声認識装置 | |
JPH03120434A (ja) | 音声認識装置 | |
JPS6242200A (ja) | 音声認識装置 | |
JPS58199399A (ja) | 音節抽出方式 |