JP2948060B2 - 韻律境界の自動的ラベリング法 - Google Patents

韻律境界の自動的ラベリング法

Info

Publication number
JP2948060B2
JP2948060B2 JP5171504A JP17150493A JP2948060B2 JP 2948060 B2 JP2948060 B2 JP 2948060B2 JP 5171504 A JP5171504 A JP 5171504A JP 17150493 A JP17150493 A JP 17150493A JP 2948060 B2 JP2948060 B2 JP 2948060B2
Authority
JP
Japan
Prior art keywords
phoneme
syllable
prosodic
time extension
duration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5171504A
Other languages
English (en)
Other versions
JPH0728491A (ja
Inventor
ニック・キャンベル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EI TEI AARU JIDO HONYAKU DENWA KENKYUSHO KK
Original Assignee
EI TEI AARU JIDO HONYAKU DENWA KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EI TEI AARU JIDO HONYAKU DENWA KENKYUSHO KK filed Critical EI TEI AARU JIDO HONYAKU DENWA KENKYUSHO KK
Priority to JP5171504A priority Critical patent/JP2948060B2/ja
Publication of JPH0728491A publication Critical patent/JPH0728491A/ja
Application granted granted Critical
Publication of JP2948060B2 publication Critical patent/JP2948060B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は韻律境界の自動的ラベ
リング法に関し、特に、韻律分析のために音韻継続時間
長を用いて韻律境界を検出する韻律境界の自動的ラベリ
ング法に関する。
【0002】
【従来の技術】音声データを分析するためには、韻律ラ
ベルが必要不可欠である。しかし、人間が耳でラベリン
グを行なう場合には、既に知識として持っている文法構
造に当てはめ、実際の韻律境界を聞き落とすなど、正確
さに欠ける危険性を含んでいると同時に、量的にも限界
がある。
【0003】これまでにも、音韻継続時間長を予測した
り、音韻継続時間長を使用して構文の曖昧さを分析する
問題への解決策として提案されている。
【0004】
【発明が解決しようとする課題】ところで、英文の韻律
境界を抽出するには、音韻ラベルと音韻継続時間長とを
用いる必要がある。一般に、音韻継続時間長の伸びに
は、強調あるいはストレスによる影響と、位置的影響と
が考えられる。後者は、通常、韻律境界の直前の時間伸
長として現れるが、音声信号レベルでこれを前者と区別
することはできない。このため、韻律境界を抽出するた
めには、両者を区別する処理が必要となり、音節内の音
韻継続時間長の伸長傾向の差異が有効な指標となる。
【0005】図8は音節レベルでの音韻継続時間長の伸
びの比較を表した図である。図8(a)に示すように、
ストレスの影響による場合は、音節頭(onset)の
時間長が伸び、図8(b)に示す韻律境界の直前の時間
伸長の場合では、音節末(coda)の方が伸びが顕著
である。
【0006】それゆえに、この発明の主たる目的は、こ
の伸長傾向の差異に着目をし、ストレスによる時間長の
伸びが含まれていても、韻律境界の直前の時間長の伸び
を検出して韻律境界を自動的に決定できる韻律境界の自
動的ラベリング法を提供することである。
【0007】
【課題を解決するための手段】請求項1に係る発明は、
音韻継続時間長のデータを伴った音韻ラベルリストを入
力して、音声における韻律境界のラベリングを行なう自
動的ラベリング法であって、各音韻の音韻継続時間長か
ら予め記憶されている音韻ごとの平均継続時間長を減算
して、その結果を予め記憶されている標準偏差で割算す
ることにより正規化する第1のステップと、第1のステ
ップで正規化された音節内での正規化音韻継続時間長の
変化に基づいて時間伸長の傾斜値を求めるための第2の
ステップと、第2のステップで求められた先行音節にお
ける時間伸長の傾斜値と当該音節における時間伸長の傾
斜値とを比較して、ストレスによる時間伸長であるかあ
るいは韻律境界による時間伸長であるかを判別する第3
のステップと、韻律境界による時間伸長であると判別さ
れたことに応じて、音節ラベルリストにおける韻律境界
の位置を示す情報を出力する第4のステップを含む。
【0008】請求項2に係る発明は、請求項1の第3の
ステップは、韻律境界に向かって各音韻の時間伸長が著
しくなることを検出したことに応じて、韻律境界による
時間伸長であると判別する。
【0009】
【作用】この発明に係る韻律境界の自動的ラベリング法
は、各音韻の音韻継続時間長から予め記憶されている音
韻ごとの平均継続時間長を減算して、その結果を予め記
憶されている標準偏差で割算することにより正規化し
て、正規化した音節内での正規化音韻継続時間長の変化
に基づいて時間伸長の傾斜値を求め、求められた先行音
節における時間伸長の傾斜値と当該音節における時間伸
長の傾斜値とを比較して、ストレスによる時間伸長であ
るかあるいは韻律境界による時間伸長であるかを判別し
て、韻律境界による時間伸長であると判別されたことに
応じて、音節ラベルリストにおける韻律境界の位置を示
す情報を出力するようにしたものである。
【0010】
【実施例】図1はこの発明の一実施例の概略ブロック図
である。図1において、入力部1は音韻継続時間長デー
タを伴った音韻ラベルリストを入力するものであり、入
力されたデータは正規化部2に与えられる。正規化部2
は音韻の種類による継続時間長の差の影響を除くため
に、入力された音韻継続時間長を正規化する。メモリ3
には音韻ごとの音韻継続時間データが記憶されており、
正規化部2はこのメモリ3に記憶されている音韻継続時
間データを参照しながら、入力された音韻継続時間長を
正規化する。正規化部2の出力は音韻ラベルと正規化音
韻継続時間長であり、韻律境界検出部4に与えられる。
【0011】韻律境界検出部4は、正規化された音韻の
継続時間長の変化に基づいて、ストレスによる時間伸長
と区別して、韻律境界を検出し、その位置の情報を出力
する。なお、正規化部2および韻律境界検出部4は、た
とえばデジタルコンピュータによって構成される。
【0012】図2は図1に示した正規化部の動作を説明
するためのフローチャートであり、図3は音韻継続時間
長の正規化を説明するための図である。
【0013】次に、図1〜図3を参照して、音韻継続時
間長を正規化する動作について説明する。まず、図1の
入力部1から音韻継続時間長データを伴った音韻ラベル
リストが入力される。音韻を表現するために使用される
ラベルは、たとえば国際発音協会によって推薦されたよ
うな代表例があるが、これに限定されるものではない。
【0014】入力された音韻継続時間長は正規化部2に
よって図2に示すフローチャートに基づいて正規化され
る。この実施例で述べる音韻継続時間長の正規化とは、
各音韻の継続時間の固有の差から生じるみかけ上の偏り
を取除き、本質的な時間長の伸びを求めることである。
すなわち、図3(a),(b)に示すように、/a/と
/i/の2つの母音では音韻継続時間長の分布が異な
る。このような音韻固有の差を取除くために、正規化が
行なわれる。
【0015】各音韻ごとの平均継続時間長は予めメモリ
3に記憶されており、正規化の最初のステップにおい
て、各音韻の音韻継続時間長から音韻ごとの平均継続時
間長を減算する。一方、各音素ごとの標準偏差も予めメ
モリ3に記憶されており、次のステップにおいて、各音
韻ごとの平均継続時間長を減じた音韻継続時間長を標準
偏差の平均値で割算することにより正規化音韻継続時間
長を求める。
【0016】上述のごとくして、各音韻の相対的な時間
伸長が正規化音韻継続時間長として求められ、音節内で
の正規化音韻継続時間長の変化に基づいて、韻律境界が
検出される。しかしながら、従来技術で説明したよう
に、時間長の伸びにはストレスによる場合があり、上述
のごとくして正規化音韻継続時間長を求めても、ストレ
スによる音韻継続時間長の伸長が含まれている場合があ
る。このため、これらのストレスによる時間伸長と韻律
境界による時間伸長とを区別する必要がある。
【0017】一般に、ストレスによる場合には、音節の
比較的前の部分の音韻が長くなる傾向にあり、韻律境界
による時間伸長の場合には、音節の終わりすなわち韻律
境界に近い音韻がより長くなる性質がある。この性質を
利用して、以下に述べる処理に従って、韻律境界による
時間伸長とストレスによる時間伸長の区別が行なわれ
る。
【0018】図4は図1に示した韻律境界検出部による
第1段階の処理を説明するためのフローチャートであ
り、図5は同じく境界検出部の第2段階の処理を説明す
るためのフローチャートである。また、図6は音声波形
とそのスペクトログラムを示す図であり、図7は複数の
話者が同一文章を発声した場合の正規化音韻継続時間長
データを示す図である。
【0019】まず、図4に示すフローチャートに従っ
て、韻律境界検出の第1のステップの処理が行なわれ
る。すなわち、前述の図2に示したフローチャートに基
づいて正規化された音韻継続時間長が入力され、正規化
された音韻継続時間長の差分が合計される。合計した値
がマイナスであれば負の傾斜になり、プラスであれば正
の傾斜になる。次に、その音韻が音節の最後であるか否
かが判別され、最後でなければ上述の動作が繰返され、
音韻の正規化音韻継続時間長の差分が合計される。
【0020】音節の最後であることを判別すると、合計
された正規化音韻継続時間長の差分が、その音節に含ま
れる音韻の数より1少ない数によって割られ、その音節
における時間伸長の傾斜値が決定され、図1の韻律境界
検出部4内のメモリにストアされる。
【0021】次に、図5において、前述の第1のステッ
プで求められた時間伸長の傾斜値がその音節ラベルとと
もに入力され、先行音節における時間伸長の傾斜値と当
該音節における時間伸長の傾斜値とが比較される。この
とき、先行音節における時間伸長の傾斜値が当該音節に
おける時間伸長の傾斜値よりも大きくかつ音節数カウン
タの値が1よりも大きければ、すなわち、現在の音節が
句の最初のものでなければ、韻律境界を示す境界マーカ
が音節ラベルの前に出力される。この際、音節数カウン
タはゼロに戻される。
【0022】しかし、先行音節における時間伸長の傾斜
値が当該音節における時間伸長の傾斜値よりも小さい
か、音節数カウンタが1以下ならば、ストレスによる時
間伸長であると判断され、音節数カウンタを1に増や
し、境界マーカーを伴うことなく、音節ラベルのみを出
力する。
【0023】図6は音声波形21に対するスペクトル2
2を示している。音韻ラベル23は、たとえば単語「w
as」の場合には、/w/,/@/,/z/の通常の発
音における3つの音韻を示している。音韻ラベル23の
下に文節境界24が示されている。音節境界24は、そ
の下に示されている単語境界25と一致する場合と一致
しない場合がある。
【0024】図7は3つの英文を例にとって複数話者の
発声における正規化音韻継続時間長データを示してお
り、音節境界は縦線で、単語境界は・で示してある。な
お、各音韻の正規化継続時間長はゼロを中心として±3
の範囲で上下している。
【0025】図7(b)に示す例における最初の音節で
は、2種類の山なり31,32が見られるが、最初の山
なり31はストレスによるものであり、後の山なり32
は音韻境界による時間伸長である。この発明の実施例で
は、前述の説明から明らかなように、2種類の山なりを
区別して韻律境界を検出することができる。
【0026】
【発明の効果】以上のように、この発明によれば、各音
韻の音韻継続時間長から予め記憶されている音韻ごとの
平均継続時間長を減算して、その結果を予め記憶されて
いる標準偏差で割算することにより正規化して、正規化
した音節内での正規化音韻継続時間長の変化に基づいて
時間伸長の傾斜値を求め、求められた先行音節における
時間伸長の傾斜値と当該音節における時間伸長の傾斜値
とを比較して、ストレスによる時間伸長であるかあるい
は韻律境界による時間伸長であるかを判別して、韻律境
界による時間伸長であると判別されたことに応じて音節
ラベルリストにおける韻律境界の位置を示す情報を出力
するようにしたので、韻律境界を自動的にラベリングす
ることができる。
【図面の簡単な説明】
【図1】この発明の一実施例の概略ブロック図である。
【図2】図1に示した正規化部の動作を説明するための
フローチャートである。
【図3】音韻継続時間長の正規化を説明するための図で
ある。
【図4】図1に示した韻律境界検出部による第1段階の
処理を説明するためのフローチャートである。
【図5】韻律境界検出部の第2段階の処理を説明するた
めのフローチャートである。
【図6】音声波形とそのスペクトログラムを示す図であ
る。
【図7】複数話者が同一文章を発声した場合の正規化音
韻継続時間長データを示す図である。
【図8】音節レベルでの伸びの比較を表した図である。
【符号の説明】
1 入力部 2 正規化部 3 メモリ 4 韻律境界検出部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭60−154300(JP,A) 特開 昭63−236098(JP,A) 特開 昭63−292198(JP,A) 特開 平4−190398(JP,A) 特開 平4−288597(JP,A) (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 - 5/04

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 音韻継続時間長のデータを伴った音韻ラ
    ベルリストを入力して、音声における韻律境界のラベリ
    ングを行なう自動的ラベリング法であって、 各音韻の音韻継続時間長から予め記憶されている音韻ご
    との平均継続時間長を減算して、その結果を予め記憶さ
    れている標準偏差で割算することにより正規化する第1
    のステップと、 前記第1のステップで正規化された音節内での正規化音
    韻継続時間長の変化に基づいて時間伸長の傾斜値を求め
    る第2のステップと、 前記第2のステップで求められた先行音節における時間
    伸長の傾斜値と当該音節における時間伸長の傾斜値とを
    比較して、ストレスによる時間伸長であるかあるいは韻
    律境界による時間伸長であるかを判別する第3のステッ
    プ、および 前記韻律境界による時間伸長であると判別されたことに
    応じて音節ラベルリストにおける韻律境界の位置を示す
    情報を出力する第4のステップを含む、韻律境界の自動
    的ラベリング法。
  2. 【請求項2】 前記第3のステップは、韻律境界に向か
    って各音韻の時間伸長が著しくなることを検出したこと
    に応じて、韻律境界による時間伸長であると判別するこ
    とを特徴とする、請求項1の韻律境界の自動的ラベリン
    グ法。
JP5171504A 1993-07-12 1993-07-12 韻律境界の自動的ラベリング法 Expired - Lifetime JP2948060B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5171504A JP2948060B2 (ja) 1993-07-12 1993-07-12 韻律境界の自動的ラベリング法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5171504A JP2948060B2 (ja) 1993-07-12 1993-07-12 韻律境界の自動的ラベリング法

Publications (2)

Publication Number Publication Date
JPH0728491A JPH0728491A (ja) 1995-01-31
JP2948060B2 true JP2948060B2 (ja) 1999-09-13

Family

ID=15924338

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5171504A Expired - Lifetime JP2948060B2 (ja) 1993-07-12 1993-07-12 韻律境界の自動的ラベリング法

Country Status (1)

Country Link
JP (1) JP2948060B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102436807A (zh) * 2011-09-14 2012-05-02 苏州思必驰信息科技有限公司 自动生成重读音节语音的方法和系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63236098A (ja) * 1987-03-25 1988-09-30 キヤノン株式会社 ラベリングシステム
JPH04190398A (ja) * 1990-11-26 1992-07-08 Meidensha Corp 音声合成方法
JP3061292B2 (ja) * 1991-03-18 2000-07-10 日本電信電話株式会社 アクセント句境界検出装置

Also Published As

Publication number Publication date
JPH0728491A (ja) 1995-01-31

Similar Documents

Publication Publication Date Title
Klabbers et al. On the reduction of concatenation artefacts in diphone synthesis
US20020173955A1 (en) Method of speech recognition by presenting N-best word candidates
Wesenick et al. Estimating the quality of phonetic transcriptions and segmentations of speech signals
M. Kjelgaard, Debra A. Titone, Arthur Wingfield The influence of prosodic structure on the interpretation of temporary syntactic ambiguity by young and elderly listeners
US6963834B2 (en) Method of speech recognition using empirically determined word candidates
US11495245B2 (en) Urgency level estimation apparatus, urgency level estimation method, and program
He et al. Automatic syllable segmentation algorithm of Chinese speech based on MF-DFA
JP2948060B2 (ja) 韻律境界の自動的ラベリング法
Mertens Automatic labelling of pitch levels and pitch movements in speech corpora
Hirschberg et al. Conveying discourse structure through intonation variation
US6438521B1 (en) Speech recognition method and apparatus and computer-readable memory
Murray A study of automatic pitch tracker doubling/halving “errors”
Ohtake et al. Newscast speech summarization via sentence shortening based on prosodic features
JP3110025B2 (ja) 発声変形検出装置
Artimy et al. Automatic detection of acoustic sub-word boundaries for single digit recognition
JP2664136B2 (ja) 音声認識装置
JP3031081B2 (ja) 音声認識装置
JP2768938B2 (ja) パターン比較方法
Stephenson Lexical frequency and neighbourhood density effects on vowel production in words and nonwords
Strik et al. A duration model for phonetic units in isolated Dutch words
Barbosa Cross-linguistic comparison of automatic detection of speech breaks in read and narrated speech in four languages
KR20030079460A (ko) 텍스트/음성 변환 장치 및 방법
RU2101782C1 (ru) Способ распознавания слов в слитной речи и система для его реализации
Hunziker et al. Detecting Strong Prosodic Events
JPH01290000A (ja) 音声認識方式

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990601