JPH06282290A - 自然言語処理装置およびその方法 - Google Patents

自然言語処理装置およびその方法

Info

Publication number
JPH06282290A
JPH06282290A JP5070451A JP7045193A JPH06282290A JP H06282290 A JPH06282290 A JP H06282290A JP 5070451 A JP5070451 A JP 5070451A JP 7045193 A JP7045193 A JP 7045193A JP H06282290 A JPH06282290 A JP H06282290A
Authority
JP
Japan
Prior art keywords
kanji
phoneme
dictionary
character
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5070451A
Other languages
English (en)
Inventor
Tetsuya Kagami
徹也 加賀美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP5070451A priority Critical patent/JPH06282290A/ja
Publication of JPH06282290A publication Critical patent/JPH06282290A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 国語辞書データに登録されていない略語など
についても、適切な朗読音を出力することができる自然
言語処理装置を提供する。 【構成】 入力装置1に入力された文字テキストについ
て字種判定部5にて字種を判定し、辞書検索部6にて全
ての音韻(読み)や単語の区切りなどの仮説候補を列挙
し、仮説候補選択部7にて最も相応し候補を選択する。
不明語読み推測部22では、単独漢字辞書を参照して、
仮説候補選択部7にて不明語とされた漢字を含む文字に
ついて、各単独漢字ごとに、所定の規則に従い、その音
韻を決定する。そして、スピーカ13は、上記仮説公報
選択部7および不明語読み推測部22にて決定された音
韻に基づいて、文字テキストに応じた朗読音を出力す
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力された日本語漢字
仮名混じり文に応じた朗読音を聞くことができる自然言
語処理装置およびその方法に関し、特に、通常の国語辞
書データなどに記憶されていない漢字の発音などを解析
し、正しい朗読音を聞くことができる自然言語処理装置
およびその方法に関する。
【0002】
【従来の技術】本出願人は既に、漢字を含む文字テキス
トを合成音で自動的に朗読出力することができる自然言
語処理装置を提案している。たとえば、特願平4−36
2169号の自然言語処理装置では、漢字を含む文字テ
キストの各文字の字種判定を行い、たとえば、Shif
t−JISコードなどの各種コードに対応させて、各文
字が漢字か、平仮名か、片仮名か、句読点か、あるい
は、その他の記号か文字であるかを判定する。そして、
このように字種判定されたものを文頭から、自立語辞
書、付属語辞書、活用語辞書、接続語辞書、単独漢字辞
書を含む第1の辞書を検索して、全ての読みや単語の区
切りなどの仮説候補を列挙する。そして、上記解説候補
から、第1の辞書の中の接続辞書などを参照し、最も相
応しい候補を選択する。そして、上記候補選択の結果
は、第2の辞書に記録されているアクセント変化規則、
ポーズ付与規則を検索して、必要な音韻と韻律のパラメ
ータ抽出に必要な制御記号に変換され、該制御記号に応
じた音声が出力装置から出力される。この自然言語処理
装置によれば、漢字を含むテキストを合成音で自動的に
朗読出力することができ、朗読音だけでテキストの内容
を理解することができるなどの効果を奏する。
【0003】
【発明が解決しようとする課題】一方、漢字を含むテキ
スト文には、国語辞書データに登録されていない、慣用
語、略語、造語などが含まれる場合があり、このような
語を含むテキストについても、朗読音の出力ができれば
非常に便利であり、また、その要請がある。
【0004】本発明は、上述した要請に鑑み、上記自然
言語処理装置を改良し、国語辞書データに登録されてい
ない語についても、適切な朗読音を出力するこができる
自然言語処理装置およびその方法を提供することを目的
とする。
【0005】
【課題を解決するための手段】上述した問題を解決し、
上述した目的を達成するために、本発明の自然言語処理
装置およびその方法では、文字テキストに含まれる漢字
について、所定の規則に従い、単独漢字ごとに、その音
韻を決定する。
【0006】本発明の自然言語処理装置は、漢字を含む
文字テキストを入力する入力手段と、単独漢字につい
て、少なくとも、その音韻、および、その音韻を選択す
る優先度を含む単独漢字辞書を記録した記録手段と、該
単独漢字辞書を参照し、前記優先度に基づいて、前記文
字テキストに含まれる漢字の音韻を、単独漢字ごとに決
定する単独漢字音韻決定手段と、前記単独漢字音韻決定
手段が決定した結果を出力する出力手段とを有する。
【0007】また、本発明の自然言語処理装置は、好ま
しくは、文書解析手段をさらに有し、前記記録手段は、
文章解析用の辞書をさらに記録し、前記文書解析手段
は、前記文章解析用の辞書を参照して、前記文字テキス
トを音韻に文章解析し、前記単独漢字音韻決定手段は、
前記単独漢字辞書を参照し、前記優先度に基づいて、前
記文章解析手段において音韻が決定されていない漢字の
音韻を、単独漢字ごとに決定し、前記出力手段は、前記
文章解析手段が解析した結果、および、前記単独漢字音
韻決定手段が決定した結果を出力する。
【0008】また、本発明の自然言語処理装置の前記単
独漢字音韻決定手段は、特定的には、前記単独漢字につ
いて、該単独漢字の前後に隣接して位置する前記文字テ
キスト中の文字が、双方とも、平仮名、句読点、また
は、スペースのいずれかである場合には、前記単独漢字
辞書に含まれる音読みの音韻のなかから前記単独漢字の
音韻を決定し、そうでない場合には、訓読みの音韻のな
かから前記単独漢字の音韻を決定する。
【0009】また、本発明の自然言語処理装置の前記単
独漢字辞書は、特定的には、同一の漢字に対する複数の
音韻のうち、最優先に選択される音韻の優先度として、
最優先を示す優先度を含み、前記単独漢字音韻決定手段
は、該単独漢字辞書を参照し、最優先を示す優先度が登
録されている音韻を、前記単独漢字の音韻として決定す
る。
【0010】また、本発明の自然言語処理装置の前記文
章解析用の辞書は、特定的には、自立語辞書、付属語辞
書、活用辞書、接続辞書および漢字辞書であり、前記文
章解析手段は、前記文字テキストに含まれる文字の字種
判定を行う手段と、該字種判定された文字の音韻を前記
文書解析用の辞書を参照して検索し、該検索された音韻
のなかから、前記字種判定された文字の音韻を決定する
手段とを有する。
【0011】また、本発明の自然言語処理装置の前記単
独漢字辞書および前記解析用の辞書は、好ましくは、単
独漢字および文字の音韻の他にアクセント(韻律)に関
する情報を含み、前記単独漢字音韻決定手段および前記
文章解析手段は、前記単独漢字辞書および前記文章解析
用の辞書を参照し、単独漢字および文字の音韻の他に、
その単独漢字および文字のアクセントを決定する。
【0012】また、本発明の自然言語処理装置の前記出
力手段は、特定的には、前記単独漢字音韻決定手段が決
定した結果、および、前記文章解析手段が解析した結
果、に応じた音声を出力する。
【0013】
【作用】本発明の自然言語処理装置およびその方法で
は、たとえば、キーボードなどの入力手段から、漢字を
含む文字テキストが入力される。そして、文字テキスト
は、文章解析手段によって、文章解析用の辞書が参照さ
れ、音韻が決定される。そして、文字テキストに含まれ
る漢字のうち、単独漢字音韻決定手段によって、前記文
章解析手段において解析されなかった、前記文字テキス
トに含まれる慣用語、略語、造語などの音韻が決定され
る。そして、前記文章解析手段および前記単独漢字音韻
決定手段が決定した音韻に基づいて、たとえば、前記文
字テキストの朗読音が出力される。
【0014】
【実施例】以下、本発明の自然言語処理装置の一実施例
としての電子ブックプレーヤについて説明する。図1は
本実施例の電子ブックプレーヤ内の信号処理部分の構成
を示す構成図である。電子ブックプレーヤは、入力装置
(キーボード)1、演算処理装置20、メモリ装置2
1、表示装置(CRT)17、および、音声出力装置
(スピーカ)13を有する。
【0015】演算処理装置20は、文章解析部19、音
声合成規則部10、および、音声合成部11と音声出力
部12とで構成される音声合成部24を有する。文章解
析部19は、入力部3、入力文保持部4、字種判定部
5、辞書検索部6、仮説候補選択部7、単独漢字音韻決
定手段としての不明語読み推測部22、音韻・韻律制御
信号生成部8、および、文字/制御記号出力部9を有す
る。ただし、文字/制御記号出力部9は本発明の電子ブ
ックプレーヤにおいてオプショナルなものであり、必ず
しも必須の構成要件ではない。
【0016】メモリ装置21には、第1の辞書14、第
2の辞書15、および、音声単位記憶部16が記憶され
ている。第1の辞書14は、自立語辞書、付属語辞書、
活用語尾辞書、接続辞書、漢字辞書を含む。漢字辞書に
は、通常の国語辞典に記載されている漢字が登録されて
いる。第2の辞書15は、アクセント変化規則、ポーズ
付与規則を含む。
【0017】上述した電子ブックプレーヤにおける処理
について述べる。入力装置1は、たとえば、キーボード
であり、利用者の操作に応じた、日本語漢字仮名混じり
文のデータを、入力部3に出力する。
【0018】入力部3に入力された、日本語仮名混じり
文のデータは、後述する信号処理のために、入力文保持
部4に保持される。入力文保持部4としては、たとえ
ば、演算処理装置20に接続されたランダムアクセスメ
モリ(RAM)などで実現された主記憶装置(図示せ
ず)が用いられる。
【0019】字種判定部5は入力文の各文字列データの
字種を判定する。たとえば、Shift−JISコード
など各種コードに対応させて、各文字が漢字か、平仮名
か、片仮名か、句読点か、あるいは、その他の記号か文
字であるかを判定する。
【0020】辞書検索部6はこのようにして字種が判定
されたものを文頭から、自立語辞書、付属語辞書、活用
語尾辞書、接続辞書、単独漢字辞書を含む第1の辞書1
4を検索して、全ての読みや単語の区切りなどの仮説候
補を列挙する。
【0021】仮説候補選択部7は、第1の辞書14の中
の接続辞書など参照して、上記仮説候補のなかから最も
相応しい候補を選択していく。その候補選択の具体例を
述べる。 入力例文:「私は中執委に行く。」 選択結果:(私=読み:わたし、品詞:名詞、アクセン
ト型:0) (は=読み:わ、品詞:助詞、アクセント型:−) (中執委=読み:不明語、品詞:不明語、アクセント
型:不明語) (に=読み:に、品詞:助詞、アクセント型:−) (行く=読み:いく、品詞:カ行五段動詞、アクセント
型:0) (。=句点)
【0022】このとき、「中執委」の読み、品詞、アク
セント型が不明語とされているのは、「中執委」が辞書
検索部6において仮説候補が列挙されていない(つま
り、第1の辞書14に登録されていない)単語であるた
めである。仮説候補選択部7では、このように、上記選
択を行った結果、不明語が含まれている場合には、上記
選択結果を不明語読み推測部22に出力する。一方、仮
説候補選択部7では、上記選択を行った結果、不明語が
含まれていない場合には、上記選択結果を音韻・韻律制
御記号生成部8に出力する。
【0023】不明語読み推測部22では、仮説候補選択
部7からの不明語を含む選択結果を入力し、後述するよ
うに、不明語の読み(音韻)を推測し、品詞およびアク
セント型を、たとえば、暫定的に決定する。そして、読
み、品詞およびんアクセント型が決定された不明語を含
む選択結果が、音韻・韻律制御記号生成部8に出力され
る。不明語読み推測部22における処理については、後
に詳細に説明する。
【0024】音韻・韻律制御信号生成部8では、仮説候
補選択部7および音韻・韻律制御記号生成部8からの上
記選択結果は、第2の辞書15に記録されているアクセ
ント変化規則、ポーズ付与規則を検索して、音声合成規
則部10に必要な音韻と韻律のパラメータ抽出に必要な
制御記号として文字/制御記号出力部9に出力する。
【0025】文字/制御記号出力部9では、上記音韻・
韻律制御信号生成部8で生成した音韻と韻律のパラメー
タ抽出に必要な、たとえば、以下に示す出力制御記号
A,Bを表示装置17に、また、出力制御記号Bを音声
合成規則部10に出力する。 出力制御記号A:(私=読み:わたし、品詞:名詞、ア
クセント型:0) (は=読み:わ、品詞:助詞、アクセント型:−) (中執委=読み:ちゅうしゅつい、品詞:不明語、アク
セント型:0) (に=読み:に、品詞:助詞、アクセント型:−) (行く=読み:いく、品詞:カ行五段動詞、アクセント
型:0) (。=句点) 出力制御信号B: (WATASHI'-WA)2(TYU:SYUTUI'NI)1
(IKU') この出力制御記号Bにおいて、括弧記号は文の切れ目、
数字はポーズ時間、ローマ字は音韻制御、’記号はアク
セント型を示し、これらに基づいて音声合成部24の音
韻と韻律と抽出し、制御する。
【0026】表示装置17は、上記出力制御信号A,B
に応じた画像を表示する。文字/制御記号出力部9から
表示装置17には、出力制御信号A,Bを出力するので
はなく、出力制御信号Aのみを出力し、表示させるよう
にしてもよい。
【0027】音声合成規則部10では、音声単位記憶部
16に記憶されている音声素片データを上記出力制御記
号に従って検索し、音声合成部11において時系列に合
成し、時系列に合成したものを音声出力部12において
合成音声として音声出力装置13から音声として出力す
る。
【0028】音声合成規則部10については、好適に
は、「複素ケプストラム分析法を用いた音声合成法」と
して、本件出願人がすでに提案している方法を用いるこ
とができる。図5はその音声合成規則部10の詳細構成
を示す。音声合成規則部10は音韻制御・音声単位読み
出し部106と韻律制御パラメータ生成処理部114を
有する。音韻制御・音声単位読み出し部106は、音韻
について、音韻規則102と音韻記号列104を用い
て、合成波形データ108を生成する。韻律制御パラメ
ータ生成処理部114は、韻律について、韻律規則11
0と文節アクセント・ポーズ112を用いて、ピッチパ
ターン116を生成する。このようにして、生成された
合成波形データ108とピッチパターン116が音声合
成部11において、波形合成され、音声出力部12を介
して、合成された波形に応じた朗読音などの音声として
出力される。
【0029】不明語読み推測部22における処理につい
て以下、詳細に説明する。図2は、不明語読み推測部2
2における処理のフローチャート図である。図3は、第
1の辞書14に登録されたデータを説明するための図で
ある。図4は、不明語読み推測部22において推測可能
な不明語の例である。第1の辞書14には、図3に示す
ように、単独漢字を示す見出しと、その読み、その読み
の音訓、優先度、および、その他アクセントなどの情報
が登録されている。優先度は、同一の単独漢字について
読み(音韻)が複数がある場合に、優先的に選択する読
みを示す。このとき、複数の音読みの中で優先的に選択
する読み、および、複数の訓読みの内で優先的に選択す
る読み、を優先度Bとして登録する。また、複数の音読
みおよび訓読みに係わらず優先的に選択する読みを、最
優先を示す優先度Aとして登録する。不明語読み推測部
22では、仮説候補選択部7から入力した選択結果に含
まれる不明語の各単独漢字について以下に示す図2の処
理を行い、不明語の読みを決定する。
【0030】たとえば、不明語読み推測部22は、仮説
候補選択部7から、図4(A)に示すように、「中」を
音読みの「ちゅう」と発音する「中執委」、「全中
銀」、「八中」、「システム中研」などの不明語を含む
選択結果を入力すると、たとえば、単独漢字「中」につ
いて以下に示す処理を行う。
【0031】ステップS1:不明語読み推測部22は、
第1の辞書14を検索し、図3に示す、「ちゅう」とい
う音読みと、「なか」という訓読みが記載されているこ
とを検出する。
【0032】ステップS2:不明語読み推測部22は、
ステップS1で検出した、第1の辞書14に記載された
「ちゅう」と「なか」とについての優先度を読込み、最
優先を示す優先度Aが登録されているか否かを判断す
る。このとき、図3に示すように、「ちゅう」と「な
か」とには、最優先の指定は無いため、不明語読み推測
部22はステップS3の処理を実行する。
【0033】ステップS3:不明語読み推測部22は、
仮説候補選択部7からの選択結果のなかで、「中」の前
後に隣接して位置する文字が、双方とも、平仮名、句読
点またはスペースのいずれかであるか否かを判断し、そ
うであると判断した場合にはステップS7の処理を実行
し、そうでないと判断した場合にはステップS4の処理
を実行する。このとき、図4(A)に示すように、いず
れの選択結果についても、「中」の前後の隣接文字は、
片方または双方が漢字または片仮名であるため、不明語
読み推測部22は、ステップS4の処理を実行する。
【0034】ステップS4:不明語読み推測部22は、
第1の辞書14に、「中」の音読みが複数、登録されて
いるか否かを判断し、登録されていると判断するとステ
ップS6の処理を実行し、登録されていないと判断する
とステップS5の処理を実行する。このとき、図3に示
すように、「中」には音読みが1つしか登録されていな
いため、不明語読み推測部22は、ステップS5の処理
を実行する。
【0035】ステップS5:不明語読み推測部22は、
ステップS4で1つしか登録されていないと判断された
「中」の音読みを、「中」の読みとして決定する。そし
て、不明語読み推測部22は、不明語に含まれる全ての
単独漢字について図2に示す処理を行いその読みを決定
し、該決定された読みを用いて、不明語の読みを決定
し、選択結果を更新する。そして、不明語読み推測部2
2は、更新された選択結果を音韻・韻律制御記号生成部
8に出力する。一方、ステップS6では、不明語読み推
測部22は、複数の音読みの内、優先度Bが登録されて
いる音読みを、単独漢字の読みとして決定する。
【0036】また、たとえば、不明語読み推測部22
は、仮説候補選択部7から、図4(B)に示すように、
「じゃんけんね」および「かいね」などが第1の辞書1
4に登録されていないために、「なか」と訓読みする
「中」を不明語として含む選択結果を入力すると、たと
えば、単独漢字「中」について以下に示す処理を行う。
不明語読み推測部22は、上述した例と同様に、ステッ
プS1,S2の処理を実行し、ステップS3において、
「中」の前後に隣接して位置する文字が、双方とも、平
仮名、句読点またはスペースのいずれかであると判断
し、ステップS7の処理を実行する。
【0037】ステップS7:不明語読み推測部22は、
第1の辞書14に、「中」の訓読みが複数、登録されて
いるか否かを判断し、登録されていると判断するとステ
ップS9の処理を実行い、登録されていないと判断する
とステップS8の処理を実行する。このとき、図3に示
すように、「中」には訓読みは1つしか登録されていな
いため、不明語読み推測部22は、ステップS8の処理
を実行する。
【0038】ステップS8:不明語読み推測部22は、
ステップS7で1つしか登録されていないと判断された
「中」の訓読みを、「中」の読みとして決定する。そし
て、不明語読み推測部22は、選択結果を更新し、更新
された選択結果を音韻・韻律制御記号生成部8に出力す
る。一方、ステップS6では、不明語読み推測部22
は、複数の訓読みの内、優先度Bが登録されている訓読
みを、単独漢字の読みとして決定する。
【0039】また、たとえば、不明語読み推測部22
は、仮説候補選択部7から、図4(C)に示すように、
「じ」と音読みする、「好事家」、「シス事」、「第二
事本」を不明語として含む選択結果を入力すると、たと
えば、単独漢字「事」について以下に示す処理を行う。
不明語読み推測部22は、上述した例と同様に、ステッ
プS1,S2,S3の処理を実行し、ステップS4にお
いて、第1の辞書14に、「事」の音読みが複数、登録
されていると判断し、ステップS6の処理を実行する。
【0040】ステップS6:不明語読み推測部22は、
「事」について登録された、複数の音読みのうち、図3
に示すように、音読み「じ」について、優先度Bが登録
されていることを検出し、音読み「じ」と「事」の読み
として決定する。ここで、「事」の音読み「じ」は、音
読み「ず」に比べて頻繁に使用されるため、音読み
「じ」に対して予め優先度Bが登録してある。また、
「羽」の訓読み「はね」は、訓読み「は」に比べて頻繁
に使用されるため、訓読み「はね」に対して予め優先度
Bが登録してある。また、「好事家」などの単語を。予
め第1の辞書14に登録しておき、不明語として取り扱
われないようにしてもよい。
【0041】また、たとえば、不明語読み推測部22
は、仮説候補選択部7から、図4(D)に示す、「ねえ
的」、「買べん的(ばいべんてき)」、「ろまん的」な
どのように、「まと」と訓読みする場合に比べて、「て
き」と音読みする場合が圧倒的に多い、「的」を不明語
として含む選択結果を入力すると、たとえば、単独漢字
「的」について以下に示す処理を行う。不明語読み推測
部22は、上述の例と同様に、ステップS1の処理を実
行する。
【0042】ステップS2:不明語読み推測部22は、
ステップS1で検出した、第1の辞書14に記載された
「てき」と「まと」とについての優先度を読込み、最優
先を示す優先度Aが登録されているか否かを判断する。
このとき、図3に示すように、音読みの「てき」には、
最優先を示す優先度Aが登録されているため、不明語読
み推測部22は、ステップS10の処理を実行する。
【0043】ステップS10:不明語読み推測部22
は、ステップS1で優先度Aが登録されている訓読み
「てき」を不明語「的」の読みとして決定する。このよ
うに、音読みおよび訓読み、圧倒的に使用頻度の高い読
みについて、優先度Aを登録しておくことで、ステップ
S3以下の処理を実行せずに、読みを決定させることも
できる。このとき、「的を射る」のように、「的」を
「まと」と訓読みするものを慣用語として第1の辞書1
4に予め登録しておき、不明語として取り扱われないよ
うにする。
【0044】上述したように、本実施例の電子ブックプ
レーヤによれば、メモリ装置21に記憶された通常の国
語辞典などに登録されていない漢字を含む文字について
も、メモリ装置21に記憶された単独漢字辞書を参照し
て、その読み(音韻)を適切に決定することができ、文
字テキストに慣用語、略語、造語などが含まれる場合に
も、文字テキストの内容に応じた朗読音を出力すること
がで、朗読音だけで文字テキストの内容を理解すること
ができる。また、本実施例の電子ブックプレーヤによれ
ば、メモリ装置21に記憶された通常の国語辞典などに
登録されていない漢字を含む文字についても、その読み
を適切に決定することができるため、メモリ装置21に
は、最小限の漢字を含む文字を登録しておけばよく、メ
モリ装置21に記憶される辞書の規模(容量)を小さく
することができる。
【0045】本発明の自然言語処理装置およびその方法
は、上述した実施例に限定されず、種々の変形態様を採
りうる。たとえば、図3に示す第1の辞書14には、各
読み(音韻)について2種類の優先度A,Bを設ける代
わりに、1種類の優先度を設けてもよい。また、不明語
読み推測部22における処理は、上述した図2の処理に
限定されない。また、入力装置1は、キーボードに限定
されず、漢字を含む文字テキストを記憶したフロッビデ
ィスクなどの記録媒体、また、文字テキストを入力する
電子ペンなどのでもよい。
【0046】
【発明の効果】上述したように、本発明の自然言語処理
装置およびその方法によれば、通常の国語辞典などに登
録されていない漢字についても、その読み(音韻)を適
切に決定することができ、文字テキストに慣用語、略
語、造語などが含まれる場合にも、文字テキストの内容
に応じた、たとえば、朗読音を出力することができ、朗
読音だけで文字テキストの内容を理解することができ
る。そのため、記録手段に記録する文書解析用の辞書の
規模を小さくすることができ、辞書のメインテナンスお
よび拡張などが容易に行える。
【図面の簡単な説明】
【図1】本発明の自然言語処理装置の一実施例の電子ブ
ックプレーヤにおける信号処理構成図である。
【図2】図1に示した電子ブックプレーヤの不明語読み
推測部における処理のフローチャート図である。
【図3】図1に示した電子ブックプレーヤの第1の辞書
14に含まれる単独漢字辞書の登録内容を説明するため
の図である。
【図4】図1に示した電子ビックプレーヤで処理を行う
文字テキストに含まれる不明語を説明するための図であ
る。
【図5】図1に示した電子ブックプレーヤの信号処理構
成における音声合成規則部と音声合成部の詳細構成図で
ある。
【符号の説明】
1・・第1入力装置 3・・入力部 4・・入力文保持部 5・・字種判定部 6・・辞書検索部 7・・仮説候補選択部 8・・音韻・韻律制御信号生成部 9・・文字/制御記号出力部 10・・音声合成規則部 11・・音声合成部 12・・音声出力部 13・・音声出力装置 14・・第1の辞書 15・・第2の辞書 16・・音声単位記憶部 17・・表示装置 19・・文章解析部 20・・演算処理装置 21・・メモリ装置 22・・不明語読み推測部 24・・音声合成部 102・・音韻規則 104・・音韻記号列 106・・音韻制御・音声単位読み出し部 108・・合成波形データ 110・・韻律規則 112・・文節アクセント・ポーズ 114・・韻律制御パラメータ生成処理部 116・・ピッチパターン

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】漢字を含む文字テキストを入力する入力手
    段と、 単独漢字について、少なくとも、その音韻、および、そ
    の音韻を選択する優先度を含む単独漢字辞書を記録した
    記録手段と、 該単独漢字辞書を参照し、前記優先度に基づいて、前記
    文字テキストに含まれる漢字の音韻を、単独漢字ごとに
    決定する単独漢字音韻決定手段と、 前記単独漢字音韻決定手段が決定した結果を出力する出
    力手段とを有する自然言語処理装置。
  2. 【請求項2】文書解析手段をさらに有し、 前記記録手段は、文章解析用の辞書をさらに記録し、 前記文書解析手段は、前記文章解析用の辞書を参照し
    て、前記文字テキストを音韻に文章解析し、 前記単独漢字音韻決定手段は、前記単独漢字辞書を参照
    し、前記優先度に基づいて、前記文章解析手段において
    音韻が決定されていない漢字の音韻を、単独漢字ごとに
    決定し、 前記出力手段は、前記文章解析手段が解析した結果、お
    よび、前記単独漢字音韻決定手段が決定した結果を出力
    することを特徴とする請求項1記載の自然言語処理装
    置。
  3. 【請求項3】前記単独漢字音韻決定手段は、前記単独漢
    字について、該単独漢字の前後に隣接して位置する前記
    文字テキスト中の文字が、双方とも、平仮名、句読点、
    または、スペースのいずれかである場合には、前記単独
    漢字辞書に含まれる音読みの音韻のなかから前記単独漢
    字の音韻を決定し、そうでない場合には、訓読みの音韻
    のなかから前記単独漢字の音韻を決定する請求項1また
    は2記載の自然言語処理装置。
  4. 【請求項4】前記単独漢字辞書は、同一の漢字に対する
    複数の音韻のうち、最優先に選択される音韻の優先度と
    して、最優先を示す優先度を含み、 前記単独漢字音韻決定手段は、該単独漢字辞書を参照
    し、最優先を示す優先度が登録されている音韻を、前記
    単独漢字の音韻として決定する請求項1〜3いずれか記
    載の自然言語処理装置。
  5. 【請求項5】前記文章解析用の辞書は、自立語辞書、付
    属語辞書、活用辞書、接続辞書および漢字辞書であり、 前記文章解析手段は、 前記文字テキストに含まれる文字の字種判定を行う手段
    と、 該字種判定された文字の音韻を前記文書解析用の辞書を
    参照して検索し、該検索された音韻のなかから、前記字
    種判定された文字の音韻を決定する手段とを有する請求
    項1〜4いずれか記載の自然言語処理装置。
  6. 【請求項6】前記単独漢字辞書および前記解析用の辞書
    は、単独漢字および文字の音韻の他にアクセント(韻
    律)に関する情報を含み、 前記単独漢字音韻決定手段および前記文章解析手段は、
    前記単独漢字辞書および前記文章解析用の辞書を参照
    し、単独漢字および文字の音韻の他に、その単独漢字お
    よび文字のアクセントを決定する請求項1〜5いずれか
    記載の自然言語処理装置。
  7. 【請求項7】前記出力手段は、前記単独漢字音韻決定手
    段が決定した結果、および、前記文章解析手段が解析し
    た結果、に応じた音声を出力する請求項1〜請求項6い
    ずれか記載の自然言語処理装置。
  8. 【請求項8】漢字を含む文字テキストを入力し、 該文字テキストに含まれる漢字について、単独漢字の音
    韻を選択する優先度に基づいて、単独漢字ごとに、その
    音韻を決定し、 該決定された音韻に基づいて、前記文字テキストの朗読
    音を出力する自然言語処理方法。
  9. 【請求項9】漢字を含む文字テキストを入力し、 該文字テキストに含まれる文字を字種判定し、自立語辞
    書、付属語辞書、活用語辞書および接続辞書を参照し
    て、前記字種判定された文字の音韻を決定し、 単独漢字辞書を参照して、前記字種判定された文字のう
    ち、音韻が決定されていない漢字の音韻を、単独漢字ご
    とに決定し、 前記字種判定された文字および前記単独漢字についての
    前記決定された音韻に基づいて、前記文字テキストの朗
    読音を出力する自然言語処理方法。
JP5070451A 1993-03-29 1993-03-29 自然言語処理装置およびその方法 Pending JPH06282290A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5070451A JPH06282290A (ja) 1993-03-29 1993-03-29 自然言語処理装置およびその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5070451A JPH06282290A (ja) 1993-03-29 1993-03-29 自然言語処理装置およびその方法

Publications (1)

Publication Number Publication Date
JPH06282290A true JPH06282290A (ja) 1994-10-07

Family

ID=13431889

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5070451A Pending JPH06282290A (ja) 1993-03-29 1993-03-29 自然言語処理装置およびその方法

Country Status (1)

Country Link
JP (1) JPH06282290A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5951991A (en) * 1997-05-22 1999-09-14 The Procter & Gamble Company Cleansing products with improved moisturization
US5972361A (en) * 1996-10-25 1999-10-26 The Procter & Gamble Company Cleansing products
US5980931A (en) * 1996-10-25 1999-11-09 The Procter & Gamble Company Cleansing products having a substantially dry substrate
US6063397A (en) * 1996-10-25 2000-05-16 The Procter & Gamble Company Disposable cleansing products for hair and skin
US6132746A (en) * 1997-05-22 2000-10-17 The Procter & Gamble Company Cleansing products with improved moisturization
US6153208A (en) * 1997-09-12 2000-11-28 The Procter & Gamble Company Cleansing and conditioning article for skin or hair
US6190678B1 (en) 1997-09-05 2001-02-20 The Procter & Gamble Company Cleansing and conditioning products for skin or hair with improved deposition of conditioning ingredients
US6338855B1 (en) 1996-10-25 2002-01-15 The Procter & Gamble Company Cleansing articles for skin and/or hair which also deposit skin care actives

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5972361A (en) * 1996-10-25 1999-10-26 The Procter & Gamble Company Cleansing products
US5980931A (en) * 1996-10-25 1999-11-09 The Procter & Gamble Company Cleansing products having a substantially dry substrate
US6063397A (en) * 1996-10-25 2000-05-16 The Procter & Gamble Company Disposable cleansing products for hair and skin
US6074655A (en) * 1996-10-25 2000-06-13 The Procter & Gamble Company Cleansing products
US6338855B1 (en) 1996-10-25 2002-01-15 The Procter & Gamble Company Cleansing articles for skin and/or hair which also deposit skin care actives
US5951991A (en) * 1997-05-22 1999-09-14 The Procter & Gamble Company Cleansing products with improved moisturization
US6132746A (en) * 1997-05-22 2000-10-17 The Procter & Gamble Company Cleansing products with improved moisturization
US6190678B1 (en) 1997-09-05 2001-02-20 The Procter & Gamble Company Cleansing and conditioning products for skin or hair with improved deposition of conditioning ingredients
US6153208A (en) * 1997-09-12 2000-11-28 The Procter & Gamble Company Cleansing and conditioning article for skin or hair

Similar Documents

Publication Publication Date Title
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
KR900009170B1 (ko) 규칙합성형 음성합성시스템
US6208968B1 (en) Computer method and apparatus for text-to-speech synthesizer dictionary reduction
US20070179779A1 (en) Language information translating device and method
JP5198046B2 (ja) 音声処理装置及びそのプログラム
JP4811557B2 (ja) 音声再生装置及び発話支援装置
JPH06282290A (ja) 自然言語処理装置およびその方法
JP2004326367A (ja) テキスト解析装置及びテキスト解析方法、ならびにテキスト音声合成装置
JP3371761B2 (ja) 氏名読み音声合成装置
Möbius The Bell Labs German text-to-speech system
JPH07262191A (ja) 単語分割方法、および音声合成装置
JP2580565B2 (ja) 音声情報辞書作成装置
JP5125404B2 (ja) 省略語判定装置、コンピュータプログラム、テキスト解析装置及び音声合成装置
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JPH08160983A (ja) 音声合成装置
JP3573889B2 (ja) 音声出力装置
JP2003005776A (ja) 音声合成装置
JP2801601B2 (ja) テキスト音声合成装置
KR0180650B1 (ko) 음성합성기의 한국어 문장분석방법
Kasie et al. Concatenative speech synthesis for Amharic using unit selection method
JP2006098552A (ja) 音声情報生成装置、音声情報生成プログラム及び音声情報生成方法
JP2001166790A (ja) 書き起こしテキスト自動生成装置、音声認識装置および記録媒体
JP2009098292A (ja) 音声記号列生成方法、音声合成方法及び音声合成装置
JPH0375898B2 (ja)