JPH04253098A - 音声合成に用いる数字及び特殊記号の言語処理方法 - Google Patents

音声合成に用いる数字及び特殊記号の言語処理方法

Info

Publication number
JPH04253098A
JPH04253098A JP3009582A JP958291A JPH04253098A JP H04253098 A JPH04253098 A JP H04253098A JP 3009582 A JP3009582 A JP 3009582A JP 958291 A JP958291 A JP 958291A JP H04253098 A JPH04253098 A JP H04253098A
Authority
JP
Japan
Prior art keywords
numbers
special symbols
pattern
unit
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3009582A
Other languages
English (en)
Inventor
Kazuyuki Yasui
安井 和之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP3009582A priority Critical patent/JPH04253098A/ja
Publication of JPH04253098A publication Critical patent/JPH04253098A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は日本語を対象とした自
然言語処理において、数字及び特殊記号を正しく読ませ
る言語処理方法に関する。
【0002】
【従来の技術】規則音声合成は任意の単語,文章等を漢
字かな混じり文のテキストより音声として合成する手段
である。図4は、一般的な音声合成装置の概要を示す説
明図で、この音声合成装置で数字や特殊記号等を読ませ
るには辞書20を参照してその読み方を決定している。 ここで、特殊記号とは単位記号(¥,%等)、記述記号
(:,?等)、かっこ記号、一般記号(#,※等)や学
術記号等である。上述した特殊記号のうち、例えば学術
記号の「−」はマイナスと読んでいるが、記述記号の「
,」は読まない。また、数字はそのまま桁読みし、例え
ば「120」は「ひゃくにじゅう」と読んでいる。
【0003】次に特殊記号のない場合の文章を読む場合
を図4により簡単な説明を行う。図4において、テキス
ト入力部1に入力されたテキストを、日本語処理部2に
より音素記号列に変換する。この音素記号列から、音韻
パターン(時間長パターン,ピッチパターン,エネルギ
パターン)を生成する。この音韻パターンのうち、時間
長パターン生成部3により時間長パターンデータベース
4を参照して音声の継続時間を示す時間長パターンを生
成する。同様に、ピッチパターン生成部5により、ピッ
チパターンデータベース6を参照して音声の高さを示す
ピッチパターンを生成する。また、同様にエネルギパタ
ーン生成部7によりエネルギパターンデータベース8を
参照し、音の強を示すエネルギパターンを生成する。こ
のように得られた各音韻パターンに基づいて、音声合成
部9により、音声データベース10を参照し、音声波形
を合成する。なお、11は合成音声を出力する音声出力
部である。
【0004】
【発明が解決しようとする課題】上述した音声合成装置
を用いて、特殊記号を読む場合、日本語処理部2におい
て辞書20を参照して処理を行う。しかし、1つの特殊
記号が種々な使われ方をすると、その都度特殊記号の読
み方が変化する。このため、辞書20を参照してもその
中のどの読み方をしていいのか判断できない。また、特
殊記号の前後に存在する数字も桁読みしていいいのか棒
読みにしていいのかが判断できない問題点がある。例え
ば、10−20%を読む場合、次のような(a)〜(d
)のような読み方がある。
【0005】(a)じゅうからにじゅうパーセント、(
b)じゅうにじゅうパーセント、(c)じゅうひくにじ
ゅうパーセント、(d)じゅうマイナスにじゅうパーセ
ント、また、小数点を持った数字の場合には例外処理を
していて、小数点より前の数字は桁読みし、それより後
の数字は棒読みにしている。小数点自身も通常は句読点
と同様に読まないが、数字に挟まれると「てん」と読ま
れる。
【0006】上述のように小数点のような例外処理を含
めても、特殊記号の数だけ例外処理が図4に示す音声合
成装置には必要となる。また、前後関係によってはさら
に別の処理も必要となるため、特殊記号が文章中に入っ
ていたときには例外処理が極めて多くなり、その処理の
対応ができなくなってしまう問題があった。
【0007】この発明は上記の事情に鑑みてなされたも
ので、数字及び特殊記号の読み方処理が迅速に対応でき
るようにするとともに正確に読めるようにした音声合成
に用いる数字及び特殊記号の言語処理方法を提供するこ
とを目的とする。
【0008】
【課題を解決するための手段】この発明は上記の目的を
達成するために、任意の単語,文章等の漢字かな混じり
文のテキスト入力を日本語処理部で解析して音韻列に変
換し、この音韻列に基づいて時間長パターン,ピッチパ
ターン及びエネルギパターンを各データベースを参照し
て生成し、生成されたこれらのパターンに基づいて音声
合成部で合成音声を生成する方法において、前記漢字か
な混じり文のテキストから数字及び特殊記号を抽出した
後、抽出した数字及び特殊記号をパターン分類し、その
後パターン分類したものが数字及び特殊記号のどれに該
当するかを解析してそれらの読み方処理をした後に、前
記日本語処理部に与えたことを特徴とするものである。
【0009】また、この発明はパターン分類したものが
数字及び特殊記号のパターンの1つ1つを関数生成部で
関数に変換した後、関数実行部で実行し、これらの読み
方を処理したものである。
【0010】
【作用】テキストから抽出した数字及び特殊記号を種々
の学術記号や単位記号等のパターンに分類する。分類後
、各パターンの組み合わせが可能かどうかの解析を行う
。また、各パターンの1つ1つを関数生成部で関数に変
換した後、関数実行部で実行する。解析あるいは実行後
、読み方処理に入力される。
【0011】
【実施例】以下、この発明の一実施例を図面に基づいて
説明する。図1において、テキスト入力部1のテキスト
は数字及び特殊記号等処理部12に入力される。この処
理部12で処理された特殊記号等の読み方は日本語処理
部2に与えられる。数字及び特殊記号等処理部12はテ
キスト入力部1のテキストから、まず数字及び特殊記号
を抽出部12aで抽出する。抽出部12aで抽出された
記号等は学術記号,単位記号,かっこ記号等のパターン
に分類部12bで分類する。分類部12bで分類された
パターンは組み合わせが可能か、どうかを解析部12c
で解析する。解析部12cでの解析結果で組み合わせが
可能の場合の読み方と、そうでない場合の読み方を読み
方処理部12dで行う。
【0012】上記数字及び特殊記号等処理部12での処
理が終了したなら記号類の読み方は図2に示す日本語処
理部2に入力される。その後の処理は図4で述べたよう
に行われて音声合成が行われる。
【0013】図3はこの発明の他の実施例で、この図3
の実施例は分類部12bで分類されたパターンを各々1
つ1つ関数生成部12eで関数に変換する。変換した関
数には優先順位を付して、優先順位の高いものから処理
して関数を生成する。優先順位の1例を次に示す。
【0014】 上記のようにして生成された関数は関数実行部12fで
実行された後、読み方処理部12dに入力されて読み方
の処理が行われる。次に関数を作成する1例を、10個
−20%の場合について示す。
【0015】単位関数の方がハイフォン(から関数)よ
り優先順位が高いので、−(個(10),%(20))
となる。この関数を記述関数処理に渡す。この記述関数
処理ではハイフォン(から関数)が呼ばれる。2つの要
素が同じ単位ではないので、ハイフォンとして処理する
。次に個関数が呼ばれて10を引き数としているので、
「じゅっこ」と読む。その後、%関数が呼ばれ、「にじ
ゅうパーセント」と読まれる。ハイフォンは読まないの
で、最終的に「じゅっこにじゅうパーセント」と読まれ
る。
【0016】
【発明の効果】以上述べたように、この発明によれば、
数字及び特殊記号を正しく読むことができるようになる
とともに、特殊記号を機能ごとに分け、しかもその組み
合わせ処理ごとに読み方を予め決定しておくため、従来
のように組み合わせごとに1つ1つプログラムを作成す
る手間を省くことができる。また、この発明によれば、
例外処理のかたまりでなく、関数生成部と実行部のシン
プルなプログラムであるから、すべての数字及び特殊記
号の組み合わせに対応できるとともに、数字の単位が省
略されていてもデフォルト単位があるので、可能性の高
い数字及び特殊記号の読み方が可能となる。さらにプロ
グラムがシンプルなため処理が速くなる等の利点がある
【図面の簡単な説明】
【図1】この発明の一実施例を示すブロック図。
【図2】この発明の実施例が適用される音声合成装置の
概略説明図。
【図3】この発明の他の実施例を示すブロック図。
【図4】一般的な音声合成装置の概略説明図。
【符号の説明】
12…数字及び特殊記号等処理部 12a…抽出部 12b…分類部 12c…解析部 12d…読み方処理部 12e…関数生成部 12f…関数実行部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】  任意の単語,文章等の漢字かな混じり
    文のテキスト入力を日本語処理部で解析して音韻列に変
    換し、この音韻列に基づいて時間長パターン,ピッチパ
    ターン及びエネルギパターンを各データベースを参照し
    て生成し、生成されたこれらのパターンに基づいて音声
    合成部で合成音声を生成する方法において、前記漢字か
    な混じり文のテキストから数字及び特殊記号を抽出した
    後、抽出した数字及び特殊記号をパターン分類し、その
    後パターン分類したものが数字及び特殊記号のどれに該
    当するかを解析してそれらの読み方処理をした後に、前
    記日本語処理部に与えたことを特徴とする音声合成に用
    いる数字及び特殊記号の言語処理方法。
  2. 【請求項2】  パターン分類したものが数字及び特殊
    記号のパターンの1つ1つを関数生成部で関数に変換し
    た後、関数実行部で実行し、それらの読み方処理したこ
    とを特徴とする請求項1に記載の音声合成に用いる数字
    及び特殊記号の言語処理方法。
JP3009582A 1991-01-30 1991-01-30 音声合成に用いる数字及び特殊記号の言語処理方法 Pending JPH04253098A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3009582A JPH04253098A (ja) 1991-01-30 1991-01-30 音声合成に用いる数字及び特殊記号の言語処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3009582A JPH04253098A (ja) 1991-01-30 1991-01-30 音声合成に用いる数字及び特殊記号の言語処理方法

Publications (1)

Publication Number Publication Date
JPH04253098A true JPH04253098A (ja) 1992-09-08

Family

ID=11724308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3009582A Pending JPH04253098A (ja) 1991-01-30 1991-01-30 音声合成に用いる数字及び特殊記号の言語処理方法

Country Status (1)

Country Link
JP (1) JPH04253098A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123457A (ja) * 1994-10-21 1996-05-17 Oki Electric Ind Co Ltd テキスト音声変換システムの未定義コード検出装置
JP2000010579A (ja) * 1998-06-19 2000-01-14 Nec Corp 音声合成装置及びコンピュータ可読記録媒体
JPWO2008114453A1 (ja) * 2007-03-20 2010-07-01 富士通株式会社 音声合成装置、音声合成システム、言語処理装置、音声合成方法及びコンピュータプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08123457A (ja) * 1994-10-21 1996-05-17 Oki Electric Ind Co Ltd テキスト音声変換システムの未定義コード検出装置
JP2000010579A (ja) * 1998-06-19 2000-01-14 Nec Corp 音声合成装置及びコンピュータ可読記録媒体
JPWO2008114453A1 (ja) * 2007-03-20 2010-07-01 富士通株式会社 音声合成装置、音声合成システム、言語処理装置、音声合成方法及びコンピュータプログラム

Similar Documents

Publication Publication Date Title
JP4038211B2 (ja) 音声合成装置,音声合成方法および音声合成システム
US6188977B1 (en) Natural language processing apparatus and method for converting word notation grammar description data
JPH04253098A (ja) 音声合成に用いる数字及び特殊記号の言語処理方法
JP6998017B2 (ja) 音声合成用データ生成装置、音声合成用データ生成方法及び音声合成システム
JP2009129258A (ja) 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置
JP3589972B2 (ja) 音声合成装置
JP3029403B2 (ja) 文章データ音声変換システム
JPH0415503B2 (ja)
JP3568972B2 (ja) 音声合成方法および装置
JPS62119591A (ja) 文章読上げ装置
JPH10228471A (ja) 音声合成システム,音声用テキスト生成システム及び記録媒体
JP2801622B2 (ja) テキスト音声合成方法
JPH07160685A (ja) 文章読み上げ装置
JPH08185197A (ja) 日本語解析装置、及び日本語テキスト音声合成装置
JPH0229797A (ja) テキスト音声変換装置
JP2000056788A (ja) 音声合成装置の韻律制御方法
JP2839488B2 (ja) 音声合成装置
JP4319851B2 (ja) 読み上げ装置、読み上げ方法及び読み上げ処理用プログラム
JP3001334B2 (ja) 認識用言語処理装置
JPH04199421A (ja) 文書読上げ装置
JPH05281985A (ja) 音声合成方法および装置
JP2000010579A (ja) 音声合成装置及びコンピュータ可読記録媒体
JP3216725B2 (ja) 文章構造解析装置
JPH06309357A (ja) 音声合成に用いる数字及び特殊記号の言語処理方法
JPH04350699A (ja) テキスト音声合成装置