JPH0728491A - 韻律境界の自動的ラベリング法 - Google Patents

韻律境界の自動的ラベリング法

Info

Publication number
JPH0728491A
JPH0728491A JP5171504A JP17150493A JPH0728491A JP H0728491 A JPH0728491 A JP H0728491A JP 5171504 A JP5171504 A JP 5171504A JP 17150493 A JP17150493 A JP 17150493A JP H0728491 A JPH0728491 A JP H0728491A
Authority
JP
Japan
Prior art keywords
phoneme
syllable
time
boundary
prosodic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5171504A
Other languages
English (en)
Other versions
JP2948060B2 (ja
Inventor
Kiyanberu Nitsuku
ニック・キャンベル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATR JIDO HONYAKU DENWA KENKYUSHO KK
Original Assignee
ATR JIDO HONYAKU DENWA KENKYUSHO KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATR JIDO HONYAKU DENWA KENKYUSHO KK filed Critical ATR JIDO HONYAKU DENWA KENKYUSHO KK
Priority to JP5171504A priority Critical patent/JP2948060B2/ja
Publication of JPH0728491A publication Critical patent/JPH0728491A/ja
Application granted granted Critical
Publication of JP2948060B2 publication Critical patent/JP2948060B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 韻律境界を自動的に決定できる韻律境界の自
動的ラベリング法を提供する。 【構成】 入力部1から入力された音韻ラベルを伴う音
韻継続時間長を正規化部2により正規化し、音節内での
正規化音韻継続時間長の変化に基づいて時間伸長の傾斜
値を求め、韻律境界検出部4によって先行音節における
時間伸長の傾斜値と当該音節における時間伸長の傾斜値
とを比較し、ストレスによる時間伸長であるかあるいは
韻律境界による時間伸長であるかを判別し、韻律境界に
よる時間伸長であると判別したことに応じて、音節ラベ
ルリストにおける韻律境界の位置を示す情報を出力す
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は韻律境界の自動的ラベ
リング法に関し、特に、韻律分析のために音韻継続時間
長を用いて韻律境界を検出する韻律境界の自動的ラベリ
ング法に関する。
【0002】
【従来の技術】音声データを分析するためには、韻律ラ
ベルが必要不可欠である。しかし、人間が耳でラベリン
グを行なう場合には、既に知識として持っている文法構
造に当てはめ、実際の韻律境界を聞き落とすなど、正確
さに欠ける危険性を含んでいると同時に、量的にも限界
がある。
【0003】これまでにも、音韻継続時間長を予測した
り、音韻継続時間長を使用して構文の曖昧さを分析する
問題への解決策として提案されている。
【0004】
【発明が解決しようとする課題】ところで、英文の韻律
境界を抽出するには、音韻ラベルと音韻継続時間長とを
用いる必要がある。一般に、音韻継続時間長の伸びに
は、強調あるいはストレスによる影響と、位置的影響と
が考えられる。後者は、通常、韻律境界の直前の時間伸
長として現れるが、音声信号レベルでこれを前者と区別
することはできない。このため、韻律境界を抽出するた
めには、両者を区別する処理が必要となり、音節内の音
韻継続時間長の伸長傾向の差異が有効な指標となる。
【0005】図8は音節レベルでの音韻継続時間長の伸
びの比較を表した図である。図8(a)に示すように、
ストレスの影響による場合は、音節頭(onset)の
時間長が伸び、図8(b)に示す韻律境界の直前の時間
伸長の場合では、音節末(coda)の方が伸びが顕著
である。
【0006】それゆえに、この発明の主たる目的は、こ
の伸長傾向の差異に着目をし、ストレスによる時間長の
伸びが含まれていても、韻律境界の直前の時間長の伸び
を検出して韻律境界を自動的に決定できる韻律境界の自
動的ラベリング法を提供することである。
【0007】
【課題を解決するための手段】請求項1に係る発明は、
音節内の各音韻の継続時間長を正規化して得られた正規
化音韻継続時間長の差分値を算出して時間伸長の傾斜値
を求める第1のステップと、求められた先行音節におけ
る時間伸長の傾斜値と当該音節における時間伸長の傾斜
値とを比較し、ストレスによる時間伸長であるかあるい
は韻律境界による時間伸長であるかを判別する第2のス
テップと、韻律境界による時間伸長であると判別された
ことに応じて、音節ラベルリストにおける韻律境界の位
置を示す情報を出力する第3のステップを含む。
【0008】請求項2に係る発明は、請求項1の第2の
ステップが、韻律境界に向かって各音韻の時間伸長が著
しくなることを検出したことに応じて、韻律境界による
時間伸長であると判別する。
【0009】
【作用】この発明に係る韻律境界の自動的ラベリング法
は、音節内の各音韻の継続時間長を正規化し、音節内で
の正規化音韻継続時間長の変化に基づいて時間伸長の傾
斜値を求め、先行音節における時間伸長の傾斜値と当該
音節における時間伸長の傾斜値とを比較し、ストレスに
よる時間伸長であるかあるいは韻律境界による時間伸長
であるかを判別し、韻律境界による時間伸長であれば音
節ラベルリストにおける韻律境界の位置を示す情報を出
力する。
【0010】
【実施例】図1はこの発明の一実施例の概略ブロック図
である。図1において、入力部1は音韻継続時間長デー
タを伴った音韻ラベルリストを入力するものであり、入
力されたデータは正規化部2に与えられる。正規化部2
は音韻の種類による継続時間長の差の影響を除くため
に、入力された音韻継続時間長を正規化する。メモリ3
には音韻ごとの音韻継続時間データが記憶されており、
正規化部2はこのメモリ3に記憶されている音韻継続時
間データを参照しながら、入力された音韻継続時間長を
正規化する。正規化部2の出力は音韻ラベルと正規化音
韻継続時間長であり、韻律境界検出部4に与えられる。
【0011】韻律境界検出部4は、正規化された音韻の
継続時間長の変化に基づいて、ストレスによる時間伸長
と区別して、韻律境界を検出し、その位置の情報を出力
する。なお、正規化部2および韻律境界検出部4は、た
とえばデジタルコンピュータによって構成される。
【0012】図2は図1に示した正規化部の動作を説明
するためのフローチャートであり、図3は音韻継続時間
長の正規化を説明するための図である。
【0013】次に、図1〜図3を参照して、音韻継続時
間長を正規化する動作について説明する。まず、図1の
入力部1から音韻継続時間長データを伴った音韻ラベル
リストが入力される。音韻を表現するために使用される
ラベルは、たとえば国際発音協会によって推薦されたよ
うな代表例があるが、これに限定されるものではない。
【0014】入力された音韻継続時間長は正規化部2に
よって図2に示すフローチャートに基づいて正規化され
る。この実施例で述べる音韻継続時間長の正規化とは、
各音韻の継続時間の固有の差から生じるみかけ上の偏り
を取除き、本質的な時間長の伸びを求めることである。
すなわち、図3(a),(b)に示すように、/a/と
/i/の2つの母音では音韻継続時間長の分布が異な
る。このような音韻固有の差を取除くために、正規化が
行なわれる。
【0015】各音韻ごとの平均継続時間長は予めメモリ
3に記憶されており、正規化の最初のステップにおい
て、各音韻の音韻継続時間長から音韻ごとの平均継続時
間長を減算する。一方、各音素ごとの標準偏差も予めメ
モリ3に記憶されており、次のステップにおいて、各音
韻ごとの平均継続時間長を減じた音韻継続時間長を標準
偏差の平均値で割算することにより正規化音韻継続時間
長を求める。
【0016】上述のごとくして、各音韻の相対的な時間
伸長が正規化音韻継続時間長として求められ、音節内で
の正規化音韻継続時間長の変化に基づいて、韻律境界が
検出される。しかしながら、従来技術で説明したよう
に、時間長の伸びにはストレスによる場合があり、上述
のごとくして正規化音韻継続時間長を求めても、ストレ
スによる音韻継続時間長の伸長が含まれている場合があ
る。このため、これらのストレスによる時間伸長と韻律
境界による時間伸長とを区別する必要がある。
【0017】一般に、ストレスによる場合には、音節の
比較的前の部分の音韻が長くなる傾向にあり、韻律境界
による時間伸長の場合には、音節の終わりすなわち韻律
境界に近い音韻がより長くなる性質がある。この性質を
利用して、以下に述べる処理に従って、韻律境界による
時間伸長とストレスによる時間伸長の区別が行なわれ
る。
【0018】図4は図1に示した韻律境界検出部による
第1段階の処理を説明するためのフローチャートであ
り、図5は同じく境界検出部の第2段階の処理を説明す
るためのフローチャートである。また、図6は音声波形
とそのスペクトログラムを示す図であり、図7は複数の
話者が同一文章を発声した場合の正規化音韻継続時間長
データを示す図である。
【0019】まず、図4に示すフローチャートに従っ
て、韻律境界検出の第1のステップの処理が行なわれ
る。すなわち、前述の図2に示したフローチャートに基
づいて正規化された音韻継続時間長が入力され、正規化
された音韻継続時間長の差分が合計される。合計した値
がマイナスであれば負の傾斜になり、プラスであれば正
の傾斜になる。次に、その音韻が音節の最後であるか否
かが判別され、最後でなければ上述の動作が繰返され、
音韻の正規化音韻継続時間長の差分が合計される。
【0020】音節の最後であることを判別すると、合計
された正規化音韻継続時間長の差分が、その音節に含ま
れる音韻の数より1少ない数によって割られ、その音節
における時間伸長の傾斜値が決定され、図1の韻律境界
検出部4内のメモリにストアされる。
【0021】次に、図5において、前述の第1のステッ
プで求められた時間伸長の傾斜値がその音節ラベルとと
もに入力され、先行音節における時間伸長の傾斜値と当
該音節における時間伸長の傾斜値とが比較される。この
とき、先行音節における時間伸長の傾斜値が当該音節に
おける時間伸長の傾斜値よりも大きくかつ音節数カウン
タの値が1よりも大きければ、すなわち、現在の音節が
句の最初のものでなければ、韻律境界を示す境界マーカ
が音節ラベルの前に出力される。この際、音節数カウン
タはゼロに戻される。
【0022】しかし、先行音節における時間伸長の傾斜
値が当該音節における時間伸長の傾斜値よりも小さい
か、音節数カウンタが1以下ならば、ストレスによる時
間伸長であると判断され、音節数カウンタを1に増や
し、境界マーカーを伴うことなく、音節ラベルのみを出
力する。
【0023】図6は音声波形21に対するスペクトル2
2を示している。音韻ラベル23は、たとえば単語「w
as」の場合には、/w/,/@/,/z/の通常の発
音における3つの音韻を示している。音韻ラベル23の
下に文節境界24が示されている。音節境界24は、そ
の下に示されている単語境界25と一致する場合と一致
しない場合がある。
【0024】図7は3つの英文を例にとって複数話者の
発声における正規化音韻継続時間長データを示してお
り、音節境界は縦線で、単語境界は・で示してある。な
お、各音韻の正規化継続時間長はゼロを中心として±3
の範囲で上下している。
【0025】図7(b)に示す例における最初の音節で
は、2種類の山なり31,32が見られるが、最初の山
なり31はストレスによるものであり、後の山なり32
は音韻境界による時間伸長である。この発明の実施例で
は、前述の説明から明らかなように、2種類の山なりを
区別して韻律境界を検出することができる。
【0026】
【発明の効果】以上のように、この発明によれば、音韻
継続時間長を正規化し、音節内での正規化音韻継続時間
長の変化に基づいて、時間伸長の傾斜値を求め、先行音
節における時間伸長の傾斜値と当該音節における時間伸
長の傾斜値とを比較して、ストレスによる時間伸長であ
るか韻律境界による時間伸長であるかを判別し、韻律境
界による時間伸長であると判別したことに応じて、音節
ラベルリストにおける韻律境界の位置を示す情報を出力
することができ、韻律境界を自動的にラベリングするこ
とができる。
【図面の簡単な説明】
【図1】この発明の一実施例の概略ブロック図である。
【図2】図1に示した正規化部の動作を説明するための
フローチャートである。
【図3】音韻継続時間長の正規化を説明するための図で
ある。
【図4】図1に示した韻律境界検出部による第1段階の
処理を説明するためのフローチャートである。
【図5】韻律境界検出部の第2段階の処理を説明するた
めのフローチャートである。
【図6】音声波形とそのスペクトログラムを示す図であ
る。
【図7】複数話者が同一文章を発声した場合の正規化音
韻継続時間長データを示す図である。
【図8】音節レベルでの伸びの比較を表した図である。
【符号の説明】
1 入力部 2 正規化部 3 メモリ 4 韻律境界検出部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 音韻継続時間長の情報を用いて音声にお
    ける韻律境界のラベリングを行なう自動的ラベリング法
    であって、 前記音声に含まれる各音韻継続時間長を正規化し、音節
    内での正規化音韻継続時間長の変化に基づいて時間伸長
    の傾斜値を求める第1のステップ、 前記により求められた先行音節における時間伸長の傾斜
    値と当該音節における時間伸長の傾斜値とを比較し、ス
    トレスによる時間伸長であるかあるいは韻律境界による
    時間伸長であるかを判別する第2のステップ、および前
    記音韻境界による時間伸長であると判別されたことに応
    じて、音節ラベルリストにおける韻律境界の位置を示す
    情報を出力する第3のステップを含む、韻律境界の自動
    的ラベリング法。
  2. 【請求項2】 前記第2のステップは、韻律境界に向か
    って各音韻の時間伸長が著しくなることを検出したこと
    に応じて、韻律境界による時間伸長であると判別するこ
    とを特徴とする、請求項1の韻律境界の自動的ラベリン
    グ法。
JP5171504A 1993-07-12 1993-07-12 韻律境界の自動的ラベリング法 Expired - Lifetime JP2948060B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5171504A JP2948060B2 (ja) 1993-07-12 1993-07-12 韻律境界の自動的ラベリング法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5171504A JP2948060B2 (ja) 1993-07-12 1993-07-12 韻律境界の自動的ラベリング法

Publications (2)

Publication Number Publication Date
JPH0728491A true JPH0728491A (ja) 1995-01-31
JP2948060B2 JP2948060B2 (ja) 1999-09-13

Family

ID=15924338

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5171504A Expired - Lifetime JP2948060B2 (ja) 1993-07-12 1993-07-12 韻律境界の自動的ラベリング法

Country Status (1)

Country Link
JP (1) JP2948060B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102436807A (zh) * 2011-09-14 2012-05-02 苏州思必驰信息科技有限公司 自动生成重读音节语音的方法和系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63236098A (ja) * 1987-03-25 1988-09-30 キヤノン株式会社 ラベリングシステム
JPH04190398A (ja) * 1990-11-26 1992-07-08 Meidensha Corp 音声合成方法
JPH04288597A (ja) * 1991-03-18 1992-10-13 Nippon Telegr & Teleph Corp <Ntt> アクセント句境界検出装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63236098A (ja) * 1987-03-25 1988-09-30 キヤノン株式会社 ラベリングシステム
JPH04190398A (ja) * 1990-11-26 1992-07-08 Meidensha Corp 音声合成方法
JPH04288597A (ja) * 1991-03-18 1992-10-13 Nippon Telegr & Teleph Corp <Ntt> アクセント句境界検出装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102436807A (zh) * 2011-09-14 2012-05-02 苏州思必驰信息科技有限公司 自动生成重读音节语音的方法和系统

Also Published As

Publication number Publication date
JP2948060B2 (ja) 1999-09-13

Similar Documents

Publication Publication Date Title
Liu Landmark detection for distinctive feature‐based speech recognition
US6839667B2 (en) Method of speech recognition by presenting N-best word candidates
US7962341B2 (en) Method and apparatus for labelling speech
Wesenick et al. Estimating the quality of phonetic transcriptions and segmentations of speech signals
US6553342B1 (en) Tone based speech recognition
Klabbers et al. On the reduction of concatenation artefacts in diphone synthesis
Wilpon et al. An investigation on the use of acoustic sub-word units for automatic speech recognition
US20020184016A1 (en) Method of speech recognition using empirically determined word candidates
US11495245B2 (en) Urgency level estimation apparatus, urgency level estimation method, and program
He et al. Automatic syllable segmentation algorithm of Chinese speech based on MF-DFA
Mertens Automatic labelling of pitch levels and pitch movements in speech corpora
JPS6138479B2 (ja)
JPH0728491A (ja) 韻律境界の自動的ラベリング法
US6438521B1 (en) Speech recognition method and apparatus and computer-readable memory
Baghai-Ravary et al. Detecting gross alignment errors in the Spoken British National Corpus
Jakovljević et al. Automatic Phonetic Segmentation for a Speech Corpus of Hebrew
JP3110025B2 (ja) 発声変形検出装置
Lewis et al. Automatic segmentation of recorded speech into syllables for speech synthesis
Rao et al. A Study of Lexical and Prosodic Cues to Segmentation in a Hindi-English Code-switched Discourse.
Ishi et al. Perceptually-related acoustic-prosodic features of phrase finals in spontaneous speech.
JP2664136B2 (ja) 音声認識装置
KR20030079460A (ko) 텍스트/음성 변환 장치 및 방법
Barbosa Cross-linguistic comparison of automatic detection of speech breaks in read and narrated speech in four languages
RU2101782C1 (ru) Способ распознавания слов в слитной речи и система для его реализации
JPS60198596A (ja) 音声入力装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990601