JPH04238397A - 中国語発声記号生成装置及びその多音字辞典 - Google Patents

中国語発声記号生成装置及びその多音字辞典

Info

Publication number
JPH04238397A
JPH04238397A JP3006172A JP617291A JPH04238397A JP H04238397 A JPH04238397 A JP H04238397A JP 3006172 A JP3006172 A JP 3006172A JP 617291 A JP617291 A JP 617291A JP H04238397 A JPH04238397 A JP H04238397A
Authority
JP
Japan
Prior art keywords
polyphonic
character
word
dictionary
phonetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3006172A
Other languages
English (en)
Inventor
Chiyafua Chiyan
チャン・チャファ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3006172A priority Critical patent/JPH04238397A/ja
Publication of JPH04238397A publication Critical patent/JPH04238397A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は中国語文章の漢字の発声
記号を自動的、且つ即座に生成することができる中国語
発声記号生成装置に関するものである。中国語の音声合
成、デスクトップパッブリシングの分野に応用できる。
【0002】
【従来の技術】中国語には千余りの多音字があり、一つ
の字にはいくつかの読みがあるという特徴を持っている
多音字に対してはどの発声記号が正しいかを判断するこ
とは簡単ではない。従来、中国語文章の漢字の発声記号
を生成する時、字音表に基づいて一つの音しかない文字
は問題なく直接に発声記号を生成することができるが、
多音字の場合はすべての発声記号を表示してユーザによ
り選択しなければならないので、効率を向上することが
できない。
【0003】
【発明が解決しようとする課題】如何に多音字の正しい
発声記号を獲得するか、という課題には下記のような問
題点が上げられる。 (1)直ちにどの文字が多音字であるかを判断すること
。 (2)多音字の正しい発声記号を判断すること。
【0004】中国語は英語のように字と字との間に隔て
る記号(例えばスペース)がないので、文のうちに、多
音字は前、後の字との組合せによって違う単語を構成す
ることができる。例えば「説中国語」という文節は「”
説中”_国語」及び「説_”中国語”」この二種類に分
ければ、「説中」と「中国語」の二単語が得られる。こ
の二単語の多音字「中」の発声記号は違っていく。もう
一つの例「呑没銭財」には「呑没」、「没銭財」という
二つの可能な単語が構成できる。上記のように生じたあ
いまい状態の多音字の発声記号の判断に対しては、人に
よれば意味にふさわしい単語に簡単に切り出して、正し
い発声記号を生成することができるが、機械によれば難
しい。 (3)中国語の単語は非常に多いので、発声記号を生成
する正確性を壊さないように、その上に多音字辞典に記
憶する必要のある単語を最低に控えることも解決しなけ
ればならない。なお、規則性があり制限がなく構成でき
る複合語、例えば「十六種」、「好幾擔」の「種」、「
擔」などの多音字に対しては、語法の規則性を利用して
、多音字辞典から数多くの複合語の記憶を除けることも
本発明は解決したい問題点である。
【0005】本発明は上記のような問題点を解消するた
めに、自動的に、且つ即時に中国語の発声記号を正しく
生成する中国語発声記号生成装置を提供することを目的
とする。
【0006】またもう一つの発明は中国語の多音字の発
声記号に関する問題を解決するために、各多音字のすべ
ての発声記号及び関連単語を記憶する多音字辞典を提供
することを目的とする。。
【0007】
【課題を解決するための手段】本発明は、文字コードの
順序に基づいて各中国語文字の発声記号に対応する記憶
値を格納して記憶値により多音字区及び非多音字区に分
けられる字典と、入力された文章の各文字コードにより
字典から対応する記憶値を読み出し該当記憶値により該
当字が多音字であるかどうかを判断する多音字判断部と
、各多音字のすべての発声記号及び使用頻度に基づきそ
れぞれの発声記号に関連する単語を記憶する多音字辞典
と、上記の字典から読み出された多音字のインデックス
により多音字辞典から関連する単語を検出する単語検出
部と、検出された単語と文の単語とを比較することによ
り該当多音字の発声記号を決める多音字発声記号生成部
とを備えることを特徴とする中国語発声記号生成装置で
ある。
【0008】またもう一つの発明は前記中国語発声記号
生成装置の多音字の発声記号に関する問題に対して、単
語列第一インデックス及び発声記号列インデックスを格
納する多音字列記憶部と、各発声記号及び単語列第二イ
ンデックスを格納する多音字発声記号列記憶部と、各単
語及び字位置情報及び発声記号情報を格納する単語列記
憶部を備え、前記単語列記憶部には高頻度単語区及び低
頻度単語区に分けられて、高頻度単語区は第一インデッ
クスを受け、低頻度単語区は第二インデックスを受け、
前記多音字発声記号列記憶部は前の発声記号列インデッ
クスを受け、単語の照合により中国語多音字の発声記号
を正しく決定できることを特徴とする多音字辞典である
【0009】
【作用】本発明は前記の構成により、文の各字に対して
字典を参照した後に、多音字判断部により該当文字が多
音字であるかどうかを判断する。多音字ではない場合は
、字典に記憶されている記憶値により発声記号を獲得し
て発声記号列に記憶する。多音字である場合は、字典に
記憶されている記憶値をインデックスとする。単語検出
部では、このインデックスにより多音字辞典内の単語を
検出する。そして、検出された単語と入力された文の単
語と比べて、一致であればこの単語に関連する発声記号
を発声記号列に記憶する。相違であれば、予定した音(
ディフォールト音)の発声記号を発声記号列に記憶する
。そして発声記号修正部は語法に基づいて文の発声記号
列を修正して、正しい発声記号の獲得を可能にする。
【0010】またもう一つの発明の多音字辞典は文にお
ける多音字の発声記号を決定するために、まず多音字列
記憶部の単語列第一インデックスにより入力された文と
同じ単語を単語列記憶部の高頻度単語区から検索して、
一致であればこの文の多音字の発声記号を決める。一致
ではない場合は、前記多音字発声記号列記憶部の単語列
第二インデックスにより入力された文と同じ単語を単語
列記憶部の低頻度単語区から検索して、一致であればこ
の文の多音字の発声記号を決める。一致ではない場合は
、多音字発声記号列記憶部に記憶されている該当多音字
の最後の発声記号(ディフォールト音)を多音字の発声
記号にする。
【0011】
【実施例】図1は本発明の一実施例における中国語発声
記号生成装置の構成を示すブロック図である。図1にお
いて、10はキーボードなどから中国語文章を入力する
文章入力部である。11は文章入力部10により入力さ
れた中国語を記憶するバッファである。12はバッファ
11に記憶されている文章に対して区切り符号まで各文
字を一つずつ読み出して、読み出された文字は中国語文
字であればバッフア11の文字列に記憶する文切り出し
部である。字典14には13051個の文字の発声記号
に対応する記憶値を記憶している。多音字ではない字で
は発声記号に対応する値を記憶値として記憶されている
が、多音字である場合は該当文字のインデックスにしき
い値を加えて記憶値として記憶されている。本実施例に
記憶されていた非多音字の発声記号を2バイトで表示す
る。例えば、中国語の子音「sh」と介母音「i」から
合成した「shi」音を56hで、母音「ang」と声
調符号「4」から合成した「ang4」音を60hで表
示すると、「sh_i_ang_4」という音は566
0hを記憶値として字典に記憶されている。この2バイ
トで表示される発声記号の記憶値の範囲は2121hか
ら7866hまでにする。なお、しきい値はこの発声記
号の記憶値の範囲より大きい所定の値にする。本実施例
のしきい値は7900hにする。
【0012】多音字判断部13は入力された文字列の各
文字に対して、該当文字の文字コードにより字典に記憶
されている対応する記憶値を読み出して、そしてこの記
憶値により該当文字は多音字であるかどうかを判断する
。 この記憶値がしきい値より小さければ、多音字ではない
と判断して、この記憶値により対応する発声記号をバッ
ファ11の発声記号列に記憶する。この記憶値がしきい
値より大きければ、多音字であると判断して、この記憶
値からしきい値を減らして得られた値をこの多音字のイ
ンデックスにする。
【0013】多音字辞典16には、1416個の多音字
の3180個の発声記号及び多音字に関連する単語を記
憶している。多音字辞典16は図4のように多音字列記
憶部161(1416個の多音字)、多音字発声記号列
記憶部162(3180個の読み)、単語列記憶部16
3の三つの部分から構成される。図4には多音字「行」
、「興」の記憶方式を表示している。
【0014】単語列記憶部163は高頻度単語区及び低
頻度単語区に分けられる。多音字列記憶部161には高
頻度単語区内の該当多音字に関連する単語を記憶する始
点位置のインデックス(次の多音字のインデックスと同
様であれば、この多音字は高頻度単語区に関連単語がな
いことを表わす)、及び多音字発声記号列記憶部162
内の該当多音字に対応する発声記号を記憶するインデッ
クスを記憶している。
【0015】多音字発声記号列記憶部162には多音字
のすべての読み、及び該当読みに関連する単語を記憶す
る低頻度単語区内の始点位置のインデックスを記憶して
いる。なお、記憶されている読みは使用頻度の低い順序
により記憶されていて、各多音字の最後の読みをディフ
ォールト音とする。
【0016】高頻度単語区には使用頻度が高くて、前、
後の組合せ位置により意味が違っていくような可能な単
語を記憶している。前、後の字との組合せに生じた二種
類単語の違う発声記号の判断のあいまい状態に対して、
単語の記憶方式は(表1)のようである。
【0017】
【表1】
【0018】ここでの字位置は該当単語においての多音
字の位置を記憶して、文との単語比較のために用いられ
る。音位置は多音字発声記号列記憶部162に該当単語
の多音字の発声記号の位置(オフセット)を記憶してい
る。
【0019】低頻度単語区には多音字発声記号列記憶部
162内の各発声記号の順序により該当発声記号に関連
する単語を記憶している。低頻度単語区の単語の記憶方
式は(表2)のようになる。
【0020】
【表2】
【0021】尚、低頻度単語区にはディフォールト音に
関連する単語を記憶していないので、多音字辞書のメモ
リを減らすことができる上に、単語比較の手数も減らす
ことできる。これは本発明の効果の一つである。
【0022】図1には、単語検出部15は多音字判断部
13により得られた多音字のインデックスに基づいて、
多音字辞典16の多音字列記憶部、単語列記憶部、多音
字発声記号列記憶部の検索を経て、多音字辞典16から
関連する単語を検出する。多音字発声記号生成部17は
上記の単語検出部15により検出された単語を文の単語
と比べて、一致であれば、この単語に関連する多音字発
声記号列記憶部の発声記号を発声記号列に記入する。相
違であれば、ディフォールト音を発声記号列に記入する
【0023】図1には、bレジスタ18は多音字判断部
13により生じた多音字のインデックス値を格納するレ
ジスタである。eレジスタ19は多音字辞典16におい
ての多音字列記憶部161内の該当多音字に関連する多
音字発声記号列記憶部162内の記憶開始位置のインデ
ックスを格納するレジスタである。iレジスタ20は多
音字発声記号列記憶部162から読み出された回数を格
納するレジスタである。vレジスタ21、wレジスタ2
2はそれぞれ検出された単語の字位置、音位置の値を格
納する。
【0024】発声記号修正部23は声調を調整する必要
のある字、または複合語などに対して、語法により発声
記号列を修正する。発声記号を修正する必要がある字は
(表3)、(表4)、(表5)に示しているように、三
つの部分に分けられる。 (1) 声調を調整する必要のある字に対しての修正(
a) (表3)のように「一」、「不」という声調を調
整する必要のある二字に対しての修正。
【0025】
【表3】
【0026】(b) 家族呼称の重畳字(二つの同じな
字が複合した単語)に対しての修正。 (表4)に示している家族呼称の重畳字の第二字の発声
記号の声調を軽声にする。
【0027】
【表4】
【0028】(2) 複合語に対しての修正(表5)の
量詞(数量を表わす字)の前に(表5)の定詞(限定詞
)である場合は、量詞の発声記    号を(表5)の
ように修正すること。
【0029】
【表5】
【0030】発声記号列出力部24は中国語文章及び該
当発声記号列を画面上に表示すると共に、発声記号列を
音声合成のシステムへ出力する。
【0031】図2、図3は本発明の中国語発声記号生成
装置における一実施例の動作を説明する流れ図である。 以下にこれらの図に従って、本発明の動作を詳細的に説
明する。
【0032】入力された文章を文切り出し部12により
独立の文ごとに切り出して、文字列に書き込む。次に、
多音字判断部13では、文字列から一字ずつを読み出し
て、該当文字コードにより字典14に記憶されている記
憶値を読み取る。獲得された記憶値がしきい値より小さ
ければ、多音字ではないと判断し、記憶値に対応する該
当発声記号をバッファ11の発声記号列に書き込む。記
憶値がしきい値より大きければ、多音字であると判断し
、該当記憶値からしきい値を引いてからbレジスタ18
に格納する。(表6)は、字典14の中の該当記憶値に
より発声記号(非多音字)、或はインデックスに転換す
る例を示している。
【0033】
【表6】
【0034】多音字であれば、bレジスタ18に格納さ
れているb値により、多音字辞典16の多音字列記憶部
161の第b個の多音字発声記号列記憶部162に該当
するインデックスをeレジスタ19に格納する。そして
、多音字列記憶部161の第b個の高頻度単語区に該当
するインデックスにより逐次に高頻度単語区から関連す
る単語を読み取る。関連単語があれば、該当単語の字位
置及び音位置の値をそれぞれvレジスタ21、wレジス
タ22に格納する。そして検出された単語を文の単語と
比較して、一致であれば、多音字発声記号列記憶部16
2の第(e+w)個の発声記号を読み出して、バッファ
内の発声記号列に書き込む。相違であれば、次の関連単
語を読み出して、関連単語をすべて読み終えるまで上記
の単語検出及び単語比較の動作を繰り返すようにする。 例えば、文字列「明天要排行程」の「行」の発声記号に
は、多音字発声記号列記憶部162に記憶されているす
べての関連する発声記号は(表7)のように4つがある
【0035】
【表7】
【0036】高頻度単語区から文と同じ関連単語「行程
」を検出できる。「行程」の記憶方式を(表8)に示す
【0037】
【表8】
【0038】すると、v=0,w=3 多音字発声記号列記憶部162の第e個の発声記号はh
ang4 であるため、第(e+3)個の発声記号はs
hing2となる。そして、この発声記号を発声記号列
に記憶する。一方、低頻度単語区には文と同じ関連単語
「排行」をも検出できるが、
【0039】
【表9】
【0040】高頻度単語区の関連単語が先に検出され、
文と比較するので、低頻度単語区から関連単語「排行」
を選ぶという間違い判断を行なうことはしない。
【0041】もし、高頻度単語区に同じ関連単語が検出
できない場合は、iレジスタ20の値をゼロに設定する
上で、多音字発声記号列記憶部162の第(e+i)個
の発声記号のインデックスにより、逐次に低頻度単語区
の関連単語を読み取る。関連単語があれば、該当単語の
字位置の値をvレジスタ21に格納した後、検出された
単語を文の単語と比較する。一致していれば、多音字発
声記号列記憶部162の第(e+i)個の発声記号を発
声記号列に記憶する。相違であれば、次の関連単語を検
出して、この発声記号に関連するすべての単語を読み終
えるまで、上記の単語検出及び単語比較の動作を繰り返
すようにする。低頻度単語区に文と同じ関連単語がない
と、iレジスタ20の値を1加えて、多音字発声記号列
記憶部162の第(e+i)個(即ち次の読み)の発声
記号はディフォールトであるかを判断する。ディフォー
ルトではないと判断すると、次の読みの低頻度単語区に
記憶されている関連単語を読み出すと共に、前記に述べ
たように文の単語と比較する。ディフォールトであれば
、直接にディフォールトの発声記号を発声記号列に記憶
する。
【0042】それから、入力された文字列においての次
の字に対して、上記のような多音字判断部13、単語検
出部15、多音字発声記号生成部17により該当発声記
号を判断して、正しい発声記号を獲得するようにする。 全部の文字列に対しての処理を終えるまで、前記の動作
を繰り返すようにする。
【0043】本発明の発声記号列修正部23の動作は図
3に示しているように、「一」、「不」、家族呼称の重
畳字に対しての声調修正、及び定詞と量詞との複合した
複合語に対しての発声記号の修正、というような二種類
の修正がある。再び文字列に対して一字ずつ読み取り、
「一」、「不」であれば、(表3)により修正する。家
族呼称の重畳字であれば第2字の声調を軽声に修正する
。もし、読み出された字は(表5)の量詞である上に、
前の字は(表5)の定詞であれば、(表3)に示してい
る発声記号に修正する。上記のような語法によると「一
」、「不」、家族呼称の重畳字の声調を修正できるにつ
れて音声合成システムによる合成した音声もさらにきれ
いに改善することができる。また、複合語の発声記号の
判断問題を解決すると共に、多音字辞典にの複合語の記
憶をも減らすことができる。  例えば、下記のような
文字列について、多音字判断部13、単語検出部15、
多音字発声記号生成部17により生成した発声記号列を
(表10)に示す。
【0044】
【表10】
【0045】発声記号修正部23の処理によると、「不
」の次の字「上」は四声であるので、「不」の発声記号
を「bu2」にする。「一」の次の字「輛」は四声であ
るので、「一」の発声記号「i4」を「i2」に変える
【0046】最後に、本実施例は中国語文章及び発声記
号列を画面上に表示する上に、RS232Cインターフ
ェースにより発声記号列を音声合成システムへ出力する
【0047】下記に文字列「我的興趣是欣賞音楽」を例
として本発明の動作を説明する。図2、図3の流れ図及
び(表4)の字典の内容に基づいて、多音字判断部13
によると、まず文字列の「我」を読み出す。そして「我
」字コードの字コード順序は472であり、第472個
の記憶値はしきい値より小さいであるので、多音字では
ないと判断すると同時に、記憶値により対応発声記号「
uo3」を発声記号列に書き込む。  次に読み出され
た字「的」の字典14の記憶値はしきい値より大きいの
で、多音字であると判断すると、字典14の記憶値から
しきい値を減らして、得られた260をbレジスタ18
に格納する。そして、bレジスタ18の260値をイン
デックスとして、単語検出部15、多音字発声記号生成
部17の判断により、多音字辞典16に同じ関連単語が
ないので、ディフォールト「de0」を発声記号列に書
き込む。
【0048】そして「興」という第3目の字を読み出し
て、字典14の記憶値はしきい値より大きくて、多音字
であるので、字典14の記憶値からしきい値を減らして
、得られた929をbレジスタ18に格納する。多音字
辞典16の多音字列記憶部161の第929個の多音字
発声記号列記憶部162に対応するインデックスをeレ
ジスタに格納する。 多音字辞典16の高頻度単語区には同じ関連単語が検出
できないと判断すると、多音字発声記号列記憶部162
の第(e+i)個(この時のiはゼロである)の読み「
shieng4」のインデックスにより、図5に示して
いる単語検出の通りに、低頻度単語区から文と同じ関連
単語「興趣」が獲得されると共に、多音字発声記号列記
憶部162の第(e+i)個の読み「shieng4」
を発声記号列に記入する。
【0049】上記の処理により、文字列の「趣」、「是
」、「欣」、「賞」、「音」、「楽」の発声記号は(表
11)に示すように生成される。
【0050】
【表11】
【0051】この例には(表3)、(表4)、(表5)
に示しているような字がないので、修正する必要がない
。そのままに(表11)の発声記号を出力することがで
きる。
【0052】もう一つの「姐姐寫完五十行報告」という
文字列を例として発声記号列の修正を説明する。上記の
多音字判断部13、単語検出部15、多音字発声記号生
成部17によると、(表12)のような発声記号列が生
成される。
【0053】
【表12】
【0054】語法による発声記号修正部23の(表4)
の規則によると、「姐姐」という家族呼称の重畳字の第
2字の「姐」の発声記号を「jie0」に修正する。ま
た、(表5)の規則により、「五十行」は定詞と量詞と
の複合語であるので、量詞「行」を「hang2」にす
る。修正された正しい発声記号列を画面上に表示して、
RS232Cインターフェースにより発声記号列を音声
合成システムへ出力する。
【0055】この実施例により、一般雑誌から28篇の
文章を対象として、発声記号の生成を99.5%以上の
精度で生成することができた。
【0056】本発明は上記の実施例にのみ限らず、要旨
を変更しない範囲で適当変形して実施できる。例えば、
多音字辞典には、高頻度単語区がなくても、単に単語の
使用頻度により記憶する単語ファイルを利用しても、け
っこうである。また、字典に記憶されている、発声記号
に対応する記憶値を必ず2バイトで表示するに限らず、
記憶値の最大値をしきい値より小さいにすれば実施でき
る。上記のような方式はすべて本発明に属するものであ
る。
【0057】
【発明の効果】以上説明したように本発明によれば、中
国語文章に対して、直ちに、自動的に正しい発声記号を
生成することができる。また、単語の使用優先度により
記憶する多音字辞典を使う上で、文の単語との比較手段
を加えて、最初に文を単語ごとに切り出す必要がなくな
り、更に多音字と前、後の字との組合せに生じた二種類
の発声記号のあいまい状態を解決することもできる。そ
の上に、語法により、修正する必要のある字に対して、
自動的に修正することができる。
【図面の簡単な説明】
【図1】本発明の一実施例における中国語発声記号生成
装置の構成を示すブロック図である。
【図2】同実施例の処理過程を示す流れ図である。
【図3】同実施例の処理過程を示す図2の続きの流れ図
である。
【図4】同実施例に用いられる多音字辞典の構成を示す
説明図である。
【図5】同実施例で行なう単語検出の過程を示す説明図
である。
【符号の説明】
10  文章入力部 11  バッファ 12  文切り出し部 13  多音字判断部 14  字典 15  単語検出部 16  多音字辞典 17  多音字発声記号生成部 18  bレジスタ 19  eレジスタ 20  iレジスタ 21  vレジスタ 22  wレジスタ 23  発声記号修正部 24  発声記号列出力部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】文字コードの順序に基づいて各中国語文字
    の発声記号に対応する記憶値を格納して記憶値により多
    音字区及び非多音字区に分けられる字典と、入力された
    文章の各文字コードにより字典から対応する記憶値を読
    み出し該当記憶値により該当字が多音字であるかどうか
    を判断する多音字判断部と、各多音字のすべての発声記
    号及び使用頻度に基づきそれぞれの発声記号に関連する
    単語を記憶する多音字辞典と、上記の字典から読み出さ
    れた多音字のインデックスにより多音字辞典から関連す
    る単語を検出する単語検出部と、検出された単語と文の
    単語とを比較することにより該当多音字の発声記号を決
    める多音字発声記号生成部とを備えることを特徴とする
    中国語発声記号生成装置。
  2. 【請求項2】単語列第一インデックス及び発声記号列イ
    ンデックスを格納する多音字列記憶部と、各発声記号及
    び単語列第二インデックスを格納する多音字発声記号列
    記憶部と、各単語及び字位置情報及び発声記号情報を格
    納する単語列記憶部を備え、前記単語列記憶部には高頻
    度単語区及び低頻度単語区に分けられて、高頻度単語区
    は第一インデックスを受け、低頻度単語区は第二インデ
    ックスを受け、前記多音字発声記号列記憶部は前の発声
    記号列インデックスを受け、単語の照合により中国語多
    音字の発声記号を正しく決定できることを特徴とする多
    音字辞典。
JP3006172A 1991-01-23 1991-01-23 中国語発声記号生成装置及びその多音字辞典 Pending JPH04238397A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3006172A JPH04238397A (ja) 1991-01-23 1991-01-23 中国語発声記号生成装置及びその多音字辞典

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3006172A JPH04238397A (ja) 1991-01-23 1991-01-23 中国語発声記号生成装置及びその多音字辞典

Publications (1)

Publication Number Publication Date
JPH04238397A true JPH04238397A (ja) 1992-08-26

Family

ID=11631132

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3006172A Pending JPH04238397A (ja) 1991-01-23 1991-01-23 中国語発声記号生成装置及びその多音字辞典

Country Status (1)

Country Link
JP (1) JPH04238397A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002530703A (ja) * 1998-11-13 2002-09-17 ルノー・アンド・オスピー・スピーチ・プロダクツ・ナームローゼ・ベンノートシャープ 音声波形の連結を用いる音声合成
CN1102779C (zh) * 1995-03-24 2003-03-05 松下电器产业株式会社 中文简繁体字文件转换装置
CN105225657A (zh) * 2015-10-22 2016-01-06 百度在线网络技术(北京)有限公司 多音字标注模板生成方法和装置
CN110264994A (zh) * 2019-07-02 2019-09-20 珠海格力电器股份有限公司 一种语音合成方法、电子设备及智能家居系统
CN111798834A (zh) * 2020-07-03 2020-10-20 北京字节跳动网络技术有限公司 多音字的识别方法、装置、可读介质和电子设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1102779C (zh) * 1995-03-24 2003-03-05 松下电器产业株式会社 中文简繁体字文件转换装置
JP2002530703A (ja) * 1998-11-13 2002-09-17 ルノー・アンド・オスピー・スピーチ・プロダクツ・ナームローゼ・ベンノートシャープ 音声波形の連結を用いる音声合成
CN105225657A (zh) * 2015-10-22 2016-01-06 百度在线网络技术(北京)有限公司 多音字标注模板生成方法和装置
CN110264994A (zh) * 2019-07-02 2019-09-20 珠海格力电器股份有限公司 一种语音合成方法、电子设备及智能家居系统
CN111798834A (zh) * 2020-07-03 2020-10-20 北京字节跳动网络技术有限公司 多音字的识别方法、装置、可读介质和电子设备

Similar Documents

Publication Publication Date Title
KR100769033B1 (ko) 스피치 합성 방법
US20110106792A1 (en) System and method for word matching and indexing
JP5535238B2 (ja) 情報処理装置
JP2002149643A (ja) 日本語の表意文字の読み方を予測する方法
Zerrouki et al. Adapting espeak to Arabic language: Converting Arabic text to speech language using espeak
JPH04238397A (ja) 中国語発声記号生成装置及びその多音字辞典
JP2004326367A (ja) テキスト解析装置及びテキスト解析方法、ならびにテキスト音声合成装置
JP6879521B1 (ja) 多言語音声認識およびテーマ−意義素解析方法および装置
JP6998017B2 (ja) 音声合成用データ生成装置、音声合成用データ生成方法及び音声合成システム
Thangthai et al. Automatic syllable-pattern induction in statistical Thai text-to-phone transcription.
van Leeuwen A development tool for linguistic rules
JP6631186B2 (ja) 音声作成装置、方法、及びプログラム、音声データベース作成装置
JPH11338498A (ja) 音声合成装置
JP3284976B2 (ja) 音声合成装置及びコンピュータ可読記録媒体
JPS5848131A (ja) 文字処理装置
JPH0969109A (ja) 文書検索方法及び文書検索装置
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JP2938466B2 (ja) テキスト音声合成システム
JP2003005776A (ja) 音声合成装置
JP2006098552A (ja) 音声情報生成装置、音声情報生成プログラム及び音声情報生成方法
Kumar et al. Empirical Study of Speech Synthesis Markup Language and Its Implementation for Punjabi Language.
JPH06176023A (ja) 音声合成システム
THORSEN BJöRN GRANsTRöM"*, PETER MoLBEK HANSEN, AND
Louw A new definition of Xhosa grapheme-to-phoneme rules for automatic transcription
JPH04296898A (ja) 音声認識装置