JPH0293499A - 複合語のアクセント句境界付与方式 - Google Patents

複合語のアクセント句境界付与方式

Info

Publication number
JPH0293499A
JPH0293499A JP63242602A JP24260288A JPH0293499A JP H0293499 A JPH0293499 A JP H0293499A JP 63242602 A JP63242602 A JP 63242602A JP 24260288 A JP24260288 A JP 24260288A JP H0293499 A JPH0293499 A JP H0293499A
Authority
JP
Japan
Prior art keywords
words
word
compound
accent phrase
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63242602A
Other languages
English (en)
Other versions
JP2643363B2 (ja
Inventor
Toru Shimizu
徹 清水
Seiichi Yamamoto
誠一 山本
Norio Higuchi
樋口 宜男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
Kokusai Denshin Denwa KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kokusai Denshin Denwa KK filed Critical Kokusai Denshin Denwa KK
Priority to JP63242602A priority Critical patent/JP2643363B2/ja
Publication of JPH0293499A publication Critical patent/JPH0293499A/ja
Application granted granted Critical
Publication of JP2643363B2 publication Critical patent/JP2643363B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、漢字コード化された日本語データを単語辞書
情報を使用して音声に変換する音声合成に係わり、特に
複数の単語の組合わせからなる複合語のアクセント句境
界を正しく設定する複合語のアクセント句の境界付与方
式に関するものである。
(従来の技術) 単語が複数集合して構成される複合語の全体を一つのフ
レーズで発音しようとすると、語句が単調になるばかり
でな(、同音異義語の多い日本語は意味が曖昧になる。
このため、通常、長い複合語は短い単位に区切って発音
している。すなわち、アクセントの切れ目を適当に挿入
して発音している。この一つのアクセント型を有する単
語または文節をアクセント句と言い、その境界はアクセ
ント句境界と呼ばれている。
従来の複合語の分割方法としては、複合語の単位を2単
語の連接つまり、漢字3文字(漢字1文字+2文字;例
えば新幹線、もしくは漢字2文字+漢字1文字;例えば
研究所)あるいは漢字4文字(漢字2文字+漢字2文字
;例えば外国映画)であると考えて、さらに長い長単位
の複合語においても、2単語を基本単位として分割して
いた。
また、漢字以外の和語や外来語についても同様の考え方
に基づいて、2単語の連鎖(例えばテレビ放送)ごとに
切れ目を挿入していた。
(発明が解決しようとする課題) しかし、従来のアクセント句境界付与方式では、前方よ
り2単語ごとに複合語を分割するため、発声が不自然に
なったり、意味が曖昧になったりすることがあった。例
えば、「合成音声評価装置」という言葉のように2単語
+2単語で意味の切れ目があるものは良いが、「ビル管
理会社設立」のように意味が2単語+2単語の単位で切
れないものは意味が曖昧になっていた。
従って、意味の弁別をアクセントに頼っている日本語で
は、複合語のアクセント句境界を正しく付与しなければ
ならなかったが、従来のアクセント句境界付与方式では
適切なアクセント句境界の付与が困難であった。
本発明は、上述した従来技術の問題点を解決するために
なされたもので、複合語のアクセント句境界を正しく付
与することが可能な複ぞつのアクセント句境界付与方式
を提供することをq的とする。
(課題を解決するための手段) 本発明の特徴は、複合語に用言系単語が含まれている場
合には、用言系単語の品詞を予め定めた種別に応じて複
数の分類に細分類するとともに、細分類された分類情報
と用言系単語に隣接する単語の品詞情報との複数の組合
わせの中から予め定めた基準に基づいて一つを選択し、
選択された組合わせからアクセント句境界を付与するよ
うにしたことにある。
(実施例) 第1図は本発明による複合語のアクセント句境界付与方
式の概略図であり、1はコード化された漢字かな混じり
文字列を後述する単語データ蓄積回路2に記憶されてい
るテーブルに基づき単語単位に分割処理(一般に形態素
解析と呼ばれている)し蓄積するための形態素解析回路
、2は単語の漢字表記、読み及び品詞コードにアクセン
ト情報等の附加情報を付与した単語データをテーブルと
して格納する単語データ蓄積回路、3は形態素解析回路
1から出力された単語が複合語を形成する名詞であるか
または名詞以外の形容訂 しくは助詞等であコツ)を判
定する名詞判定口広 4は名詞の単語のうち用言系以外
の単語(以下、「非用言系単語」と称す)を体言系単語
4a、用言系単語4b及び副言系単語4Cに分類して蓄
積する非用言系単語蓄積回路(以下、単に「非用言系回
路」と称す)、5は名詞単語のうち用言系単語(事物の
動作・作用・存在・性質・状態について叙述する語)を
動詞用法5a、ヲ格用法5b、二格用法5c、主体用法
5d及び名詞用法5eのように予め定めた種別に分類し
て蓄積する用言系単語蓄積回路(以下、単に「用言系回
路」と称す)、6は一つの用言系単語が複数の用法を有
して用言系回路5に蓄積されているときに複合語を形成
する隣接単語との組み合わせのうち最適となる用法を予
め定めた基準に基づいて決定する優先順位決定回路、7
は複数の単語から形成される複合語にアクセント句の境
界を予め定めた基準に基づいて付与するアクセント句境
界付与回路、8は名詞判定回路3及びアクセント句境界
付与回路7の出力である漢字かなコードを音声に変化す
る音声合成回路である。
次に、動作について説明する。
コード化された漢字かな混じり文字列(文字データ)は
、外部入力(例えばR5232インタフエース)または
磁気ディスク等からデータ転送されて形態素解析回路l
に入力する。そして、磁気ディスクやROM等の単語デ
ータ蓄積回路2のコードテーブルと比較されて単語(名
詞、動詞等の品詞分類を与えられた単位)に分割される
。この形態素解析は最長一致法もしくは文節性最長一致
法と呼ばれるアルゴリズムで処理するものである(例え
ば、首藤公昭、吉村賢治r日本語の構造とその解析」、
情報処理 VOL、 27. No、 8. pp、 
947〜954、1986 )。
形態素解析回路1で単語単位に分割された文字列は、単
語の品詞コードごとに異なる単語蓄積回路に蓄積される
。具体的には、名詞的役割を果たす名詞を蓄積する体言
系単語蓄積回路4a、形容動詞的役割を果たす名詞を蓄
積する相貫系単語蓄積回路4b及び副詞的役割を果たす
名詞を蓄積する副官系単語蓄積回路4Cの非用言系単語
と用言系単語蓄積回路5とに分割される。
本発明では、用言系単語蓄積回路5を構文的役割が異な
る用法で5種類に細分類しているので、以下に詳説する
用言系単語としては、す変動側の語幹、動詞の連用形が
ある。このうち、す変動側の語幹は名詞から派生したも
のが多く、動詞の連用形は元の動詞の働きを失って名詞
として定着したものがある。また、役割としては、動詞
の機能を有しているものや名詞の機能を有しているもの
等、い(つかのカテゴリに分類が可能である。また、す
変動側では他動詞と自動詞とで構文的役割がそれぞれ異
なっているため、例えば次のように細分類することがで
きる。
■動詞としての用法(以下、単に「動詞用法」と称す)
■動詞の直前にヲ格の目的、対象、手段等の格を取り名
詞句を構成する用法(以下、単に[ヲ格用法」と 称す
)。但し、自動詞にはこの用法が無い。
◎動詞の直前に二格の目的、対象、手段等の格を取り名
詞句を構成する用法(以下、単に「二格用法」と称す)
■動詞が動作及びその動作結果を表わす主体両者の意味
を取る用法(以下、単に「主体用法」と称す)。
■名詞としての用法(以下、単に「名詞用法」と称す)
一般に、全てのす変動側は、単語単独では動詞(■の用
法)としての用法を有しており、例えば、「重視」、「
設立」等の単語はそれぞれ「重視する」、「設立する」
という機能を有する。しかし、■〜◎の用法は、複合語
の中での機能に依存する。例えば、「音声合成装置」と
いう3連鎖の複合語では、音声を合成する装置というよ
うに、「合成」がす変動側のヲ格用法に該当し、「音声
」という目的格と「装置」という主体を伴って、目的−
動詞−主体の名詞句を構成している。また、主体である
「装置」がない場合でも、「音声合成」は音声を合成す
ることを意味し、目的−動詞−〇(○は空白であること
を示す)のみで同様に名詞句を構成する。また、「合成
」1単語でも合成するという〇−動詞−〇の名詞句を構
成することができる。
一方、「調査」というす変動側が、「研究」というす変
動側を伴った「調査研究」では、調査し研究することと
いうように、0項のヲ格用法に該当し、名詞句中の動詞
が並列になり、「報告」というす変動側を伴った「調査
報告」時には、調査したことについての報告であるとい
うように「調査」は0項のヲ格用法に該当し、0項の名
詞用法に該当している。また、「報告会」では、報告す
る会というように、「報告」はヲ格用法(0項)に該当
し、名詞の「会」は報告の主体になっている。このよう
に、「調査」は動詞用法(0項)とヲ格用法(0項)と
の2つの用法、「報告」は動詞用法(0項)とヲ格用法
(0項)と名詞用法(0項)との3つの用法を持ってい
る。すなわち、一つの単語でも隣接する単語によって、
役割の異なる複数の用法を持っていることになる。従っ
て、本発明では細分類された用言系単語の用法のうち複
合語毎に最適な用法を選択するために優先順位決定回路
6を配置している。
優先順位決定回路6では、用言系回路5からの細分類さ
れた用法種別と、非用言系回路4もしくは用言系回路5
に蓄積されている隣接単語の品詞情報との複数の組み合
わせの中から、予め定めた基準(表1)に従って最適な
一つの組み合わせを選択する。
表1は用言系単語の優先順位を決定する場合の基準例で
あり、4aは体言系単語、4bは体言系単語、4cは体
言系単語、5aは動詞用法系単語、5bはヲ格用法系単
語、5cは二格用法系単語、5dは主体用法系単語、5
eは名詞用法系単語をそれぞれ表わしている。また、4
aは5eと置き換えてもよい。
表1 「調査報告」という複合語の優先順位を例に取り説明す
ると、「調査」は5a及び5bの2種類の用法、「報告
」は5a、5b及び5eの3種類の用法を持っているの
で、その組み合わせが6通り  (5a−5a、   
5a−5b、   5a−5e、   5b−5a、5
b−5b、5b−5e、)存在する。
この中で、最も優先順位が高い組み合わせは、表1から
明らかなように5b−5e(順位1番の5b−4a)で
あり、これが選択される。
優先順位が決定されると、次にアクセント句の境界がア
クセント句境界付与回路7によって決定される。アクセ
ント句の境界を決定するに当っては、各名詞句の構成に
応じて予め定められた位置にアクセント句の境界を付与
するための名詞句構造データの基準に基づいて行われる
が、その基準例を表2に示す。尚、表2において、丸印
は複合(境界なし)を意味し、X印は複合しない(境界
あり)を意味するとともに、〉印は後方に境界を設定す
ることをそれぞれ示している。
(以下余白) 表2 例えば、前述の「調査報告」で優先順位決定回路6が5
b−5eを選択したとき、アクセント句境界付与回路7
は、表2の基準に基づいて「調査」と「報告」との2つ
の単語を複合(境界を設けない)する。すなわち、「調
査報告」を区切り無しに発音するように音声合成回路8
に送られる。
また、「調査研究」で、ヲ格用法の並列の組み合わせで
ある5b−5bを選択したとき、アクセント句境界付与
回路7は「調査」と「研究」との間にアクセント句の境
界が付与されて、音声合成回路8に送られる。このよう
に、漢字4文字(2単語)の複合語においても、構文的
役割によって境界が設定される場合とされない場合が生
じるが、本発明では用言系単語の品詞を細分類して隣接
単語との構文的役割からアクセント句の境界を設定する
ため、正しく境界を付与することができる。
さらに、「ビル管理会社設立」のような長い複合語でも
、rビル」と「管理」との複合語では4a(体言系) 
−5b (ヲ格用法)を優先順位決定回路6で選択する
ため、アクセント句境界付与回路7で複合して「ビル管
理」を名詞句とし、次に「ビル管理」と「会社」とが共
に非用言系単語であるので「ビル管理会社」を一つの名
詞句とする。さらに、名詞句の「ビル管理会社」と用言
系単語である「設立」 (5aの動詞用法しか持たない
)との複合語では、4a−5aを優先順位決定回路6で
選択し、アクセント句境界付与回路7が表2からrビル
管理会社」と「設立」との間に正しくアクセント句の境
界が設けられる。 従 って、従来では「ビル管理」と
「会社設立」というように予め定めた文字単位ごとにア
クセント句の境界が設定されていたため、発音が不自然
になったりしていたが、本発明では隣接単語に応じて構
文的役割を選択することにより、正しくアクセント句の
境界を設定することができる。
(発明の効果) 以上のように、本発明は用言系単語の品詞を細分化し、
隣接単語との組み合わせのうち最適な組み合わせを選択
することにより、長い複合語に対しても正しくアクセン
ト句の境界を設定することが可能となる。
また、用言系単語の品詞を用法の種別に応じて細分類す
ることにより、隣接単語との最適な構文的役割を選択す
ることができる。
さらに、非用言系単語を体言系単語、用言系単語及び副
言系単語とに分類することにより、より正確なアクセン
ト句の境界付与が可能となる。
【図面の簡単な説明】
第1図は本発明による複合語のアクセント句境界付与方
式の概略図である。 1・・・形態素解析回路、 2・・・単語データ蓄積回路、 3・・・名詞判定巳路、 4・・・非用言系単語蓄積回路、 4a・・・体言系単語単語蓄積回路、 4b・・・用言系単語蓄積回路、 4c・・・副官系単語蓄積回路、 5・・用言系単語蓄積回路、 5a・・・動詞用法、 5b・・・ヲ格用法、 5c・・ 二格用法、 5d・・・主体用法、 5e・・・名詞用法、 6・・・優先順位決定回路、 7・・・アクセント句境界付与回路、 8・・・音声合成回路。

Claims (3)

    【特許請求の範囲】
  1. (1)入力されたかな漢字の日本語データを予め蓄積さ
    れている単語データに基づいて単語単位に分割し、該単
    語の品詞情報に応じて複数の前記単語の集合から成る複
    合語のアクセント句の境界を設定する複合語のアクセン
    ト句境界付与方式において、 前記分割された単語の品詞情報に基づいて少なくとも用
    言系単語と該用言系以外の非用言系単語とに分類すると
    共に該用言系単語を予め定めた種別に応じて複数の分類
    に細分類してそれぞれを蓄積した後、 前記複合語に前記用言系単語が含まれているときには前
    記用言系単語に隣接する前記単語の品詞情報と該細分類
    されている分類情報との複数の組合わせのうち一つを予
    め定められた基準に基づいて選択し、 該選択された組合わせから前記複合語のアクセント句の
    境界の付与を行い、 前記複合語が前記非用言系単語から構成されているとき
    には予め定められた基準に基づいて複合語のアクセント
    句の境界を設定することを特徴とする複合語のアクセン
    ト句境界付与方式。
  2. (2)前記用言系単語の品詞が用法の種別に応じて細分
    類されていることを特徴とする請求項1記載の複合語の
    アクセント句境界付与方式。
  3. (3)前記非用言系単語が体言系単語、用言系単語及び
    副言系単語に分類されていることを特徴とする請求項1
    記載の複合語のアクセント句境界付与方式。
JP63242602A 1988-09-29 1988-09-29 複合語のアクセント句境界付与方式 Expired - Lifetime JP2643363B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63242602A JP2643363B2 (ja) 1988-09-29 1988-09-29 複合語のアクセント句境界付与方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63242602A JP2643363B2 (ja) 1988-09-29 1988-09-29 複合語のアクセント句境界付与方式

Publications (2)

Publication Number Publication Date
JPH0293499A true JPH0293499A (ja) 1990-04-04
JP2643363B2 JP2643363B2 (ja) 1997-08-20

Family

ID=17091488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63242602A Expired - Lifetime JP2643363B2 (ja) 1988-09-29 1988-09-29 複合語のアクセント句境界付与方式

Country Status (1)

Country Link
JP (1) JP2643363B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0436799A (ja) * 1990-05-31 1992-02-06 Sharp Corp 音声合成装置
JP2012022447A (ja) * 2010-07-13 2012-02-02 Fujitsu Ltd 音声合成装置、音声合成プログラムおよび音声合成方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0436799A (ja) * 1990-05-31 1992-02-06 Sharp Corp 音声合成装置
JP2012022447A (ja) * 2010-07-13 2012-02-02 Fujitsu Ltd 音声合成装置、音声合成プログラムおよび音声合成方法

Also Published As

Publication number Publication date
JP2643363B2 (ja) 1997-08-20

Similar Documents

Publication Publication Date Title
US7263488B2 (en) Method and apparatus for identifying prosodic word boundaries
Pickering Sentence comprehension
Beard Lexeme-morpheme base morphology: a general theory of inflection and word formation
Watson et al. Intonational phrasing and constituency in language production and comprehension
US6823301B1 (en) Language analysis using a reading point
US8099281B2 (en) System and method for word-sense disambiguation by recursive partitioning
KR100481598B1 (ko) 복합 형태소 분석 장치 및 방법
Clark Priming as a motivating factor in sociophonetic variation and change
Hirschberg et al. Learning prosodic features using a tree representation
Wingfield et al. Multiple memory systems in the processing of speech: Evidence from aging
Ross et al. Factors affecting pitch accent placement
JPH0293499A (ja) 複合語のアクセント句境界付与方式
Fonteyn et al. Category change in the English gerund
Burani et al. Morpheme-based lexical reading: Evidence from pseudoword naming
Becker et al. Creole prototypes as basic varieties and inflectional morphology
Horne et al. Referent tracking in restricted texts using a lemmatized lexicon: implications for generation of intonation.
Kinoshita et al. Effects of concurrent articulation on reading Japanese kanji and kana words
CN112052651A (zh) 诗词生成方法、装置、电子设备及存储介质
Krasnoukhova Attributive modification in South American indigenous languages
Schmerling Rhetorical meaning
Saito et al. High-quality speech synthesis using context-dependent syllabic units
Noske et al. The question of rule ordering: some counter-fallacies
Yakpo On Pichi (Equatorial Guinea): sociolinguistic, typological, and contact-related aspects
Alderete et al. Frequency norms in Tashlhiyt, Part I
Bennett Melodies bristling with change: prosody and understanding conversation