JPH07262191A - 単語分割方法、および音声合成装置 - Google Patents

単語分割方法、および音声合成装置

Info

Publication number
JPH07262191A
JPH07262191A JP6052376A JP5237694A JPH07262191A JP H07262191 A JPH07262191 A JP H07262191A JP 6052376 A JP6052376 A JP 6052376A JP 5237694 A JP5237694 A JP 5237694A JP H07262191 A JPH07262191 A JP H07262191A
Authority
JP
Japan
Prior art keywords
word
words
dictionary
unit
division result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6052376A
Other languages
English (en)
Inventor
Masanori Omote
雅則 表
Tetsuya Kagami
徹也 加賀美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP6052376A priority Critical patent/JPH07262191A/ja
Publication of JPH07262191A publication Critical patent/JPH07262191A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 文や複合語などの単語列を、正しい単語の並
びに分割する。 【構成】 例えば複合名詞「中国的中道路線」に対し、
分割仮説候補「中国的/中道/路線」と「中国/的中/
道路/線」が得られた場合(/は、単語の区切り位置を
示す)、それぞれの隣接単語の単語の組(中国的,中
道)および(中道,路線)、または(中国,的中),
(的中,道路)、および(道路,線)の相乗平均が、図
2に示す辞書に登録された単語間の接続確率を参照して
算出される。そして、その相乗平均の大きい分割仮説候
補である「中国的/中道/路線」が、正しい分割結果と
して選択される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば文や複合語(例
えば、複合名詞など)を、単語に分解して処理する日本
語ワードプロセッサの漢字変換部や音声合成装置の文章
解析部などに用いて好適な単語分割方法、並びに音声合
成装置に関する。
【0002】
【従来の技術】例えば、ワードプロセッサや、音声合成
装置においては、入力されたテキスト(例えば、複数の
単語でなる文章や複合語など)を構文解析(統語解析)
するなどして、漢字変換や合成音の生成処理などを行う
ようになされている。
【0003】一方、例えば日本語は、文字間や単語間な
どの語間に空白を空けずに記述されるため接着語と呼ば
れ、これを構文解析(統語解析)する場合には、それを
構成する語を、適切に分割する必要がある。
【0004】この語への分割は、形態素解析と呼ばれる
が、形態素解析では、形態素(語幹、接頭辞、接尾辞な
どの意味を持つ文字系列の最小単位で、単語よりやや小
さい)が持つ語彙的意味を考慮しながら、語への分割を
行う必要があり、これを考慮しない場合、正確な分割を
行うことは困難である。
【0005】しかしながら、現在の計算機では、このよ
うな意味の制約を、完全に行いながらの処理は負担が大
きく、このため、意味制約を用いずに、あるいは多くの
意味制約を用いずに、より正確に語の分割を行う方法が
検討されている。
【0006】例えば、文を単語(あるいは形態素)に分
割する方法としては、最長一致法や単語数最小法などが
知られている。最長一致法(右方向最長一致法)は、例
えば文を左から右方向に見て、最も長い単語を優先して
分割する方法で、まず文全体が単語候補とされる。そし
て、単語候補と単語辞書とが照合され、その単語候補
が、単語辞書に登録されていなければ、その単語候補の
最右端の1文字を除いたものが新たな単語候補とされ、
再度、単語辞書との照合が行われる。また、単語候補
が、単語辞書に登録されていれば、その単語候補が文か
ら分割され、残った部分が新たな単語候補とされて、再
度、単語辞書との照合が行われる。そして、文から単語
候補を分割した後、残る部分がない場合には、処理を終
了する。
【0007】単語数最小法では、まず単語辞書が参照さ
れ、文が、適当に単語に分割される。そして、その分割
の結果得られた分割パターンの候補(分割結果候補)が
複数ある場合には、そのうちの単語数が最小のものが、
最終的な分割結果とされる。
【0008】以上の最長一致法と単語数最小法は、文だ
けでなく、複数の名詞からなる複合名詞などの複合語に
も適用することができる(上述した説明のうちの「文」
を「複合語」と読み代えれば良い)。
【0009】また、複合名詞などの複合語を単語(ある
いは形態素)に分割する方法としては、次のようなもの
が知られている。即ち、まず、例えば上述した単語数最
小法と同様に、単語辞書が参照され、複合語が、適当に
単語に分割される。そして、その分割の結果得られた分
割パターンの候補(分割結果候補)が複数ある場合に
は、単語間の意味的な係り受け関係が登録されている複
合語辞書が参照され、これにより分割結果候補を構成す
る隣接単語間に意味的な係り受け関係があるか否かが検
出される。さらに、分割結果候補を構成する単語数と、
その係り受け関係の数とが比較され、その差が最も少な
いものが、最終的な分割結果とされる。
【0010】また、この場合、分割結果候補を構成する
単語数と、その係り受け関係の数との差を最小にするも
のが複数存在するときには、単語の使用頻度が登録され
ている頻度辞書が参照され、使用頻度が所定値以下の単
語の数が最も少ないものが、最終的な分割結果とされ
る。
【0011】さらに、この場合、分割結果候補を構成す
る単語のうち、使用頻度が所定値以下のものの数が最も
少ない分割結果候補が複数存在するときには、頻度辞書
が参照され、分割結果候補を構成する単語それぞれの使
用頻度の、例えば乗算結果や加算結果などである分割結
果候補の出現確率を最大にするものが、最終的な分割結
果とされる。
【0012】なお、以上の係り受け関係を利用する分割
方法は、所定の手法により文を、複合語に分割した後に
用いるようにすることにより、文に対しても適用するこ
とが可能である。
【0013】
【発明が解決しようとする課題】ところで、最長一致法
や単語数最小法では、単語間の係り受け関係などの意味
的な情報が用いられずに、文や複合語の分割が行われる
ので、その分割結果は、あまり精度の高いものではなか
った。
【0014】また、単語間の係り受け関係を利用する場
合には、この係り受け関係は、意味的な情報であるがた
めに、すべて人手によって、複合語辞書に記述する(複
合語辞書の作成を行う)必要がある。さらに、この場
合、分割結果の精度を向上させるためには、複合語辞書
に、多くの係り受け関係を記述しなければならず、その
精度を大きく向上させることは困難であった。
【0015】本発明は、このような状況に鑑みてなされ
たものであり、文や複合語を、意味的に正しい単語に、
高い精度で、且つ容易に分割することができるようにす
るものである。
【0016】
【課題を解決するための手段】請求項1に記載の単語分
割方法は、単語列を単語に分割する単語分割方法であっ
て、単語を記憶している単語辞書を参照し、単語列を複
数の単語に分割した分割結果候補を作成し、単語間の接
続確率を記憶している接続確率辞書を参照し、分割結果
候補の中から、それを構成する単語間の接続確率に基づ
いて、単語列の分割結果を選択することを特徴とする。
【0017】請求項2に記載の単語分割方法は、分割結
果候補を構成する単語間の接続確率の相乗平均を算出
し、その相乗平均の最も大きいものを、分割結果候補の
中から、分割結果として選択することを特徴とする。
【0018】請求項3に記載の単語分割方法は、単語列
が、複合名詞であることを特徴とする。
【0019】請求項4に記載の音声合成装置は、請求項
1乃至3のいずれかに記載の単語分割方法により単語列
を単語に分割する単語分割手段(例えば、図1に示す字
種判定部4、辞書検索部5、仮説候補選択部6)と、単
語分割手段により分割された単語に対応する合成音を生
成する合成音生成手段(例えば、図1に示す音声合成規
則部10、音声合成部11、音声出力部12)とを備え
ることを特徴とする。
【0020】
【作用】本発明の単語分割方法においては、単語を記憶
している単語辞書が参照され、例えば複合名詞などの単
語列を複数の単語に分割した分割結果候補が作成され
る。そして、単語間の接続確率を記憶している接続確率
辞書が参照され、例えば分割結果候補を構成する単語間
の接続確率の相乗平均が算出されて、その相乗平均の最
も大きいものが、分割結果候補の中から、分割結果とし
て選択される。従って、例えば複合語などの単語列を、
意味的に正しい単語に、高い精度で、且つ容易に分割す
ることができる。
【0021】また、本発明の音声合成装置においては、
請求項1乃至3のいずれかに記載の単語分割方法により
単語列が単語に分割され、その単語に対応する合成音が
生成される。従って、音韻、韻律の正しい合成音を得る
ことができる。
【0022】
【実施例】図1は、本発明を適用した音声合成装置の一
実施例の構成を示すブロック図である。この音声合成装
置は、入力装置(例えば、キーボードなど)1、演算処
理装置19、メモリ装置20、表示装置(例えば、CR
TやLCDなど)17、および、音声出力装置(例え
ば、スピーカなど)13で構成されている。
【0023】演算処理装置19は、文章解析部18、音
声合成規則部10、音声合成部11、および音声出力部
12で構成されている。文章解析部18は、入力部2、
入力文保持部3、字種判定部4、辞書検索部5、仮説候
補選択部6、不明語読み推測部7、音韻韻律制御記号生
成部8、および文字/制御記号出力部9から構成されて
いる。
【0024】メモリ装置20には、文章や形態素などの
解析、あるいは音韻(読み)の付与に必要な情報が登録
されている辞書14、韻律の付与に必要な情報が登録さ
れている辞書15、および音声素片データなどの音声合
成に必要な情報が登録されている音声単位記憶部16が
記憶されている。辞書14は、自立語辞書、付属語辞
書、活用語尾辞書、漢字辞書(単独漢字辞書)、単語間
接続辞書を含んで構成されている。例えば、漢字辞書に
は、通常の国語辞典などに記載されている漢字が登録さ
れている。辞書15は、アクセント変化規則、ポーズ付
与規則を含んで構成されている。
【0025】以上のように構成される音声合成装置にお
いては、例えばキーボードなどである入力装置1が操作
され、単語列としての、例えば日本語の漢字仮名混じり
文のデータが、入力部2に入力される。入力部2は、文
章解析部18と入力装置1とのインターフェイスで、そ
こに入力された漢字仮名混じり文のデータは、入力文保
持部3に出力され、一次記憶される。入力文保持部3と
しては、例えば演算処理装置19に接続されたランダム
アクセスメモリ(RAM)などで実現された主記憶装置
(図示せず)が用いられる。
【0026】入力文保持部3に記憶されたデータである
単語列は、字種判定部4によって、文字単位で順次読み
出され、そこでその字種が判定される。即ち、字種判定
部4では、例えば、Shift−JISコードなど各種
コードに対応させて、各文字が漢字か、平仮名か、片仮
名か、句読点か、あるいは、その他の記号か文字である
かが判定される。
【0027】そして、辞書検索部5では、上述したよう
にして字種が判定されたものを文頭から、辞書14を構
成する自立語辞書、付属語辞書、活用語尾辞書、単独漢
字辞書が参照され、単語列を複数の単語に分割した分割
仮説候補がたてられる(分割結果の候補が生成され
る)。さらに、辞書検索部5においては、分割仮説候補
を構成する単語に、その読み、品詞などの他、必要に応
じてアクセントなどが付与され、仮説候補選択部6に出
力される。
【0028】仮説候補選択部6においては、辞書14の
中の単語間接続辞書が参照され、辞書検索部5からの分
割仮説候補の中から最も相応しい候補(分割結果)が、
後述するようにして選択される。なお、辞書検索部5か
ら供給された分割仮説候補が1つだけの場合、仮説候補
選択部6は、辞書検索部5からの分割仮説候補をそのま
ま出力する。
【0029】この結果、入力装置1によって、例えば単
語列(文)「私は中執委へ行く。」などが入力された場
合、仮説候補選択部6からは、例えば次のような選択結
果(分割結果)が出力される。
【0030】分割結果:(私=読み:わたし、品詞:名
詞、アクセント型:0) (は=読み:わ、品詞:助詞、アクセント型:−) (中執委=読み:不明語、品詞:不明語、アクセント
型:不明語) (に=読み:に、品詞:助詞、アクセント型:−) (行く=読み:いく、品詞:カ行五段動詞、アクセント
型:0) (。=句点)
【0031】このとき、「中執委」の読み、品詞、アク
セント型が不明語とされているのは、「中執委」が略称
であり、従って辞書検索部5において、その読みなどを
付与することができなかったため、即ち辞書14に登録
されていないためである。
【0032】仮説候補選択部6では、分割仮説候補から
の分割結果の選択を行った結果、その分割結果に不明語
が含まれている場合には、その分割結果が不明語読み推
測部7に出力され、また、不明語が含まれていない場合
には、分割結果が音韻韻律制御記号生成部8に出力され
る。
【0033】不明語読み推測部7では、辞書14が参照
され、仮説候補選択部6からの分割結果に含まれる不明
語の読み(音韻)が推測される。さらに、不明語読み推
測部7は、その品詞およびアクセント型を推測し、音韻
韻律制御記号生成部8に出力する。
【0034】音韻韻律制御記号生成部8では、アクセン
ト変化規則(単語のアクセントは、その単語が単独で発
話される場合と、文や複合語中で発話される場合とで変
化することがあるので、その変化規則に関するもの)お
よびポーズ付与規則が登録されている辞書15が参照さ
れ、仮説候補選択部6からの分割結果、または不明語読
み推測部7からの不明語の推測結果を含む分割結果にお
けるアクセントの位置およびポーズの位置と長さが決定
され、さらにそれが、所定の記号(これは、音韻情報と
韻律情報とを含んだものなので、以下、音韻韻律制御記
号という)に変換される。この音韻韻律制御記号は、文
字/制御記号出力部9に出力される。なお、音韻韻律制
御記号生成部8から文字/制御記号出力部9へは、仮説
候補選択部6からの分割結果、または不明語読み推測部
7からの不明語の推測結果を含む分割結果(以下、単
に、分割結果という)も、音韻韻律制御記号とともに出
力される。
【0035】ここで、音韻韻律制御記号とは、例えば次
のようなものである。なお、この音韻韻律制御記号は、
上述した分割結果に対応するものである。
【0036】音韻韻律制御記号:(WATASHI'-WA)2(TYU:S
YUTUI'NI)1(IKU')
【0037】この音韻韻律制御記号において、ローマ字
は読み、括弧記号は文の切れ目(文節)、数字はポーズ
の位置と時間(長さ)、記号「’」はアクセントの位置
を示している。
【0038】文字/制御記号出力部9では、音韻韻律制
御記号生成部8からの音韻韻律制御記号または分割結果
が、音声合成規則部10または表示装置17に、それぞ
れ出力される。
【0039】表示装置17においては、文字/制御記号
出力部9からの分割結果が表示される。従って、例えば
上述した分割結果が、文字/制御記号出力部9から供給
された場合には、表示装置17において、例えば次のよ
うな画面が表示される。なお、(不明語)は、不明語読
み推測部7における推測結果を意味する。
【0040】(私=読み:わたし、品詞:名詞、アクセ
ント型:0) (は=読み:わ、品詞:助詞、アクセント型:−) (中執委=読み:(不明語)、品詞:(不明語)、アク
セント型:(不明語)) (に=読み:に、品詞:助詞、アクセント型:−) (行く=読み:いく、品詞:カ行五段動詞、アクセント
型:0) (。=句点)
【0041】一方、音声合成規則部10では、音声単位
記憶部16に記憶されている、例えば音声素片データ
が、文字/制御記号出力部9からの音韻韻律制御記号に
対応して読み出され、音声合成部11に供給される。音
声合成部11においては、音声合成規則部10からの音
声素片データが、時系列に合成され、この合成データ
が、音声出力部12に出力される。音声出力部12は、
演算処理装置19と出力装置13とのインターフェイス
で、音声合成部11からの合成データを、音声出力装置
13に出力する。これにより、出力装置13からは、合
成データに対応した合成音が出力される。
【0042】次に、仮説候補選択部6における選択処理
の詳細について説明する。上述したように、仮説候補選
択部6は、辞書14の中の単語間接続辞書を参照し、辞
書検索部5からの分割仮説候補から所定のものを選択す
るが、この単語間接続辞書には、例えば図2に示すよう
な2つの単語間の接続確率が登録されている。図2にお
いて、例えばその1行目は、単語「一番」に、単語「手
前」が続く確率(接続確率)が、0.15であり、その
2行目は、単語「一番手」に、単語「前」が続く確率
(接続確率)が、0.07であることを示している。
【0043】この接続確率は、例えば次のようにして算
出される。即ち、まず最初に、例えば新聞や雑誌などに
記載された多くの文が、単語に分割され、同じ並びの2
つの単語が出現する頻度がカウントされる。そして、そ
の同じ並びの2つの単語の接続確率として、そのカウン
ト値に対応した(例えば、比例した)、例えば0乃至1
の範囲の値が割り当てられる。
【0044】なお、この場合の単語の分割は、例えば計
算機(この計算機の処理能力はそれほど高いものでなく
て良い)に、適当に分割仮説候補を求めさせ、その中か
ら、正しいものを選択することにより行う。従って、接
続確率は、一部を人手に頼るだけで求めることができる
ので、単語間接続辞書は、すべてを人手に頼って求める
係り受け関係などを記述する辞書を作成する場合に比較
して、容易に作成することができる。また、接続確率
は、統計的な値なので、これを用いて、後述するように
単語列(文や、複合名詞などの複合語)の分割を行うこ
とにより、その精度を向上させることができる。
【0045】仮説候補選択部6は、以上のような単語間
接続辞書を参照し、次のような処理を行う。即ち、まず
分割仮説候補を構成する単語から、隣接する2単語の組
が作成され、その組にされた2単語間の接続確率が、単
語間接続辞書を検索(参照)することにより求められ
る。そして、すべての組の接続確率が求められた後、例
えばそれらの相乗平均がとられ、辞書検索部6からの分
割仮説候補のうち、相乗平均の値が最も大きいものが選
択され、正しい分割結果として出力される。
【0046】具体的には、入力装置1によって、例えば
複合語(複合名詞)「一番手前」が入力され、これによ
り辞書検索部4から、分割仮説候補「一番/手前」と
「一番手/前」が出力された場合(但し、/は、単語の
区切り(分割位置)を意味する)、分割仮説候補「一番
/手前」からは、単語の組(一番,手前)が作成され、
分割候補「一番手/前」からは、単語の組(一番手,
前)が作成される。
【0047】単語の組(一番,手前)または(一番手,
前)それぞれの接続確率は、図2に示すように、0.1
5または0.07であり、従って分割仮説候補「一番/
手前」または「一番手/前」それぞれにおける接続確率
の相乗平均は、0.15(0.15の1乗)または0.
07(0.07の1乗)であるから、この場合、仮説候
補選択部6では、分割仮説候補「一番/手前」および
「一番手/前」のうちの、相乗平均が最も大きい分割仮
説候補「一番/手前」が、分割結果として選択されて出
力されることになる。
【0048】また、入力装置1によって、例えば複合語
(複合名詞)「中国的中道路線」が入力され、これによ
り辞書検索部4から、分割仮説候補「中国的/中道/路
線」と「中国/的中/道路/線」が出力された場合、分
割仮説候補「中国的/中道/路線」からは、単語の組
(中国的,中道)および(中道,路線)が作成され、分
割候補「中国/的中/道路/線」からは、単語の組(中
国,的中),(的中,道路)、および(道路,線)が作
成される。
【0049】単語の組(中国的,中道),(中道,路
線),(中国,的中),(的中,道路)、または(道
路,線)それぞれの接続確率は、図2に示すように、
0.21,0.16,0.05,0.01、または0.
08であり、従って分割仮説候補「中国的/中道/路
線」または「中国/的中/道路/線」それぞれにおける
接続確率の相乗平均は、0.183(約(0.21×
0.16)の1/2乗)または0.034(約(0.0
5×0.01×0.08)の1/3乗)であるから、こ
の場合、仮説候補選択部6では、分割仮説候補「中国的
/中道/路線」および「中国/的中/道路/線」のうち
の、相乗平均が最も大きい分割仮説候補「中国的/中道
/路線」が、分割結果として選択されて出力されること
になる。
【0050】さらに、入力装置1によって、例えば複合
語(複合名詞)「東京子女援護協会」が入力され、これ
により辞書検索部4から、分割仮説候補「東/京子/女
/援護/協会」と「東京/子女/援護/協会」が出力さ
れた場合も、上述した場合と同様にして、図2の単語間
接続辞書が参照され、分割仮説候補「東/京子/女/援
護/協会」または「東京/子女/援護/協会」それぞれ
における接続確率の相乗平均が算出される。そして、そ
の相乗平均が最も大きい分割仮説候補が選択されて出力
される(この場合、図2から、分割仮説候補「東/京子
/女/援護/協会」または「東京/子女/援護/協会」
それぞれの接続確率の相乗平均は、ほぼ0.122また
は0.156となるので、分割仮説候補「東京/子女/
援護/協会」が、分割結果として出力される)。
【0051】なお、以上では、複合名詞を例に説明した
が、その他の複合語や文が入力された場合も同様に処理
される。
【0052】以上のように、接続確率の相乗平均をとる
ようにしたので、その値は、いわば正規化されたものと
なり、分割仮説候補を構成する単語の数に関わらず、適
正な選択を行うことができる。
【0053】その結果、分割仮説候補の中から、正しい
分割結果を、精度良く得ることができ、これにより出力
装置13からは、正確なアクセント、韻律を有する合成
音が出力されるようになる。
【0054】以上、本発明を音声合成装置に適用した場
合について説明したが、本発明は、この他、ワードプロ
セッサの漢字変換処理などに適用可能である。この場
合、高い確率で正しい変換結果を得ることができるよう
になる。また、本発明は、例えば計量国語学における言
語事象を観察する場合などにも適用することができる。
【0055】なお、本実施例においては、キーボードで
ある入力装置1を操作して、単語列を入力するようにし
たが、例えば入力装置1の代わりに、ディスク装置など
を設け、そこから電子化された単語列(文や複合語)を
入力するようにすることができる。
【0056】また、本実施例では、辞書14の単語間接
続辞書に、文における単語間の接続確率を登録しておく
ようにしたが、この場合、単語間接続辞書が大きくなる
ので、例えば単語列のうちの、複合名詞における単語間
の接続確率だけを登録しておき、図1の音声合成装置
を、複合名詞専用のものとして、装置を小型に構成する
ようにすることができる。
【0057】この場合、字種判定部5で、入力文保持部
4からの単語列の中の、漢字の位置を検出し、これを辞
書検索部6に知らせるようにしておく。さらに、辞書検
索部5には、単語列のうち、漢字の連続している部分
を、複合名詞として検出させ、仮説候補選択部6に出力
させるようにしておく。そして、仮説候補選択部6に
は、複合名詞における単語間の接続確率だけが登録され
た単語間辞書を参照させ、複合名詞に対してだけ、上述
した接続確率の相乗平均による選択処理を行わせるよう
にすれば良い。
【0058】また、本実施例では、接続確率の相乗平均
をとり、この相乗平均値に基づいて、分割結果を選択す
るようにしたが、接続確率を、その他の手法により処理
し、その結果得られる値に基づいて、分割結果を選択す
るようにしても良い。
【0059】
【発明の効果】以上のように、本発明の単語分割方法に
よれば、例えば複合語などの単語列を、意味的に正しい
単語に、高い精度で、且つ容易に分割することができ
る。
【0060】また、本発明の音声合成装置によれば、音
韻、韻律の正しい合成音を得ることができる。
【図面の簡単な説明】
【図1】本発明を適用した音声合成装置の一実施例の構
成を示すブロック図である。
【図2】図1の実施例における辞書14の単語間接続辞
書を説明する図である。
【符号の説明】
1 入力装置 2 入力部 3 入力保持部 4 字種判定部 5 辞書検索部 6 仮説候補選択部 7 不明語読み推測部 8 音韻韻律制御記号生成部 9 文字/制御記号出力部 10 音声合成規則部 11 音声合成部 12 音声出力部 13 出力装置 14,15 辞書 16 音声単位記憶部 17 表示装置 18 文章解析部 19 演算処理装置 20 メモリ装置

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 単語列を単語に分割する単語分割方法で
    あって、 単語を記憶している単語辞書を参照し、前記単語列を複
    数の単語に分割した分割結果候補を作成し、 単語間の接続確率を記憶している接続確率辞書を参照
    し、前記分割結果候補の中から、それを構成する単語間
    の前記接続確率に基づいて、前記単語列の分割結果を選
    択することを特徴とする単語分割方法。
  2. 【請求項2】 前記分割結果候補を構成する単語間の接
    続確率の相乗平均を算出し、その相乗平均の最も大きい
    ものを、前記分割結果候補の中から、前記分割結果とし
    て選択することを特徴とする請求項1に記載の単語分割
    方法。
  3. 【請求項3】 前記単語列は、複合名詞であることを特
    徴とする請求項1または2に記載の単語分割方法。
  4. 【請求項4】 請求項1乃至3のいずれかに記載の単語
    分割方法により単語列を単語に分割する単語分割手段
    と、 前記単語分割手段により分割された単語に対応する合成
    音を生成する合成音生成手段とを備えることを特徴とす
    る音声合成装置。
JP6052376A 1994-03-24 1994-03-24 単語分割方法、および音声合成装置 Withdrawn JPH07262191A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6052376A JPH07262191A (ja) 1994-03-24 1994-03-24 単語分割方法、および音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6052376A JPH07262191A (ja) 1994-03-24 1994-03-24 単語分割方法、および音声合成装置

Publications (1)

Publication Number Publication Date
JPH07262191A true JPH07262191A (ja) 1995-10-13

Family

ID=12913095

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6052376A Withdrawn JPH07262191A (ja) 1994-03-24 1994-03-24 単語分割方法、および音声合成装置

Country Status (1)

Country Link
JP (1) JPH07262191A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10320421A (ja) * 1997-03-19 1998-12-04 Ricoh Co Ltd 文書検索方法
JP2003132052A (ja) * 2001-10-19 2003-05-09 Nippon Hoso Kyokai <Nhk> 読みがな付与装置およびプログラム
JP2005293582A (ja) * 2004-03-31 2005-10-20 Oce Technol Bv 複合語を構成する単語を割り出す装置及びコンピュータ化された方法
JP2008158998A (ja) * 2006-12-26 2008-07-10 Yafoo Japan Corp 語句又は文章分析方法、サーバ
JP2011096245A (ja) * 2009-09-30 2011-05-12 Kanagawa Univ 漢字複合語分割方法及び漢字複合語分割装置
JP2011146070A (ja) * 2007-08-31 2011-07-28 Research In Motion Ltd テキスト曖昧回避環境における音声学的なテキスト入力の提示される文字解釈の生成を可能にするハンドヘルド電子デバイスおよび関連方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10320421A (ja) * 1997-03-19 1998-12-04 Ricoh Co Ltd 文書検索方法
JP2003132052A (ja) * 2001-10-19 2003-05-09 Nippon Hoso Kyokai <Nhk> 読みがな付与装置およびプログラム
JP2005293582A (ja) * 2004-03-31 2005-10-20 Oce Technol Bv 複合語を構成する単語を割り出す装置及びコンピュータ化された方法
JP2008158998A (ja) * 2006-12-26 2008-07-10 Yafoo Japan Corp 語句又は文章分析方法、サーバ
JP2011146070A (ja) * 2007-08-31 2011-07-28 Research In Motion Ltd テキスト曖昧回避環境における音声学的なテキスト入力の提示される文字解釈の生成を可能にするハンドヘルド電子デバイスおよび関連方法
US8413049B2 (en) 2007-08-31 2013-04-02 Research In Motion Limited Handheld electronic device and associated method enabling the generation of a proposed character interpretation of a phonetic text input in a text disambiguation environment
JP2011096245A (ja) * 2009-09-30 2011-05-12 Kanagawa Univ 漢字複合語分割方法及び漢字複合語分割装置

Similar Documents

Publication Publication Date Title
US7197457B2 (en) Method for statistical language modeling in speech recognition
US6477495B1 (en) Speech synthesis system and prosodic control method in the speech synthesis system
US20070179779A1 (en) Language information translating device and method
JP2006227425A (ja) 音声再生装置及び発話支援装置
JPH07262191A (ja) 単語分割方法、および音声合成装置
JP2004326367A (ja) テキスト解析装置及びテキスト解析方法、ならびにテキスト音声合成装置
JPH06282290A (ja) 自然言語処理装置およびその方法
KR0146549B1 (ko) 한국어 텍스트/음성 변환 방법
JP3366253B2 (ja) 音声合成装置
Akinwonmi Development of a prosodic read speech syllabic corpus of the Yoruba language
JP2003005776A (ja) 音声合成装置
JP2938466B2 (ja) テキスト音声合成システム
JP2001117583A (ja) 音声認識装置および音声認識方法、並びに記録媒体
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
KR0180650B1 (ko) 음성합성기의 한국어 문장분석방법
JPH08160983A (ja) 音声合成装置
JP3573889B2 (ja) 音声出力装置
JPH02110600A (ja) 音声規則合成装置
Külekci Statistical morphological disambiguation with application to disambiguation of pronunciations in Turkish
KR0136423B1 (ko) 발음 제어 기호의 유효성 판정을 이용한 음운 변동 처리 방법
JPH06176023A (ja) 音声合成システム
JP2000187494A (ja) 音声合成方法および音声合成装置
JPH04162098A (ja) 規則音声合成装置
JP2801601B2 (ja) テキスト音声合成装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20010605