JPS62262099A - 発音辞書更新装置 - Google Patents
発音辞書更新装置Info
- Publication number
- JPS62262099A JPS62262099A JP61105926A JP10592686A JPS62262099A JP S62262099 A JPS62262099 A JP S62262099A JP 61105926 A JP61105926 A JP 61105926A JP 10592686 A JP10592686 A JP 10592686A JP S62262099 A JPS62262099 A JP S62262099A
- Authority
- JP
- Japan
- Prior art keywords
- accent
- pronunciation dictionary
- unregistered word
- phoneme
- character strings
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 claims description 11
- 238000000034 method Methods 0.000 claims description 9
- 235000016496 Panda oleosa Nutrition 0.000 claims description 7
- 240000000220 Panda oleosa Species 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 5
- 230000000877 morphologic effect Effects 0.000 description 8
- 230000011218 segmentation Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は文字列を音声に変換する規則型音声合成システ
ムあるいは、音声を文字列に変換する音声認識システム
等に用いる発音辞書の更新装置に−するものである。
ムあるいは、音声を文字列に変換する音声認識システム
等に用いる発音辞書の更新装置に−するものである。
(従来の技術)
従来、日本語の文字−音声変換システムあるいは、音声
−文字変換システムに用いる辞書として漢字かな混じり
の文字列で表わされた単語に対する音素記号、アクセン
ト記号を記憶する第3区に示すような発音辞書が知られ
ている。
−文字変換システムに用いる辞書として漢字かな混じり
の文字列で表わされた単語に対する音素記号、アクセン
ト記号を記憶する第3区に示すような発音辞書が知られ
ている。
第3図では、漢字かなまじり文字列である見出し語の各
々に対して、アクセント記号(第3図では米で示してい
るりが付加された音素記号列が格納されている。
々に対して、アクセント記号(第3図では米で示してい
るりが付加された音素記号列が格納されている。
従来の辞書更新技術としては、キーボード大刀によっ゛
C更倉するエディタが一般的に知られてぃる。発音辞書
を更新するためには、まず登録しようとする語のアクセ
ント型を認識し、アクセント核の位置を指定しなければ
ならない。キーホードからの入力は、このようにアクセ
ント核の位置を指定してからアクセント核の位置を示す
記号の混ざった音素記号列を入力するのが一般的である
。
C更倉するエディタが一般的に知られてぃる。発音辞書
を更新するためには、まず登録しようとする語のアクセ
ント型を認識し、アクセント核の位置を指定しなければ
ならない。キーホードからの入力は、このようにアクセ
ント核の位置を指定してからアクセント核の位置を示す
記号の混ざった音素記号列を入力するのが一般的である
。
しかしながら、アクセント型の指定を正確に行なうこと
は、容易ではない。従来の技術では、アクセント型の指
定は、経験に頼るところが多く、アクセント型に詳しい
者であってもアクセント核の位置を明示するのに誤るこ
とがある。まして、アクセント型というものに、なじみ
のない一般ユーザには特に難しい。しかし、実際:二は
アクセント型の詳しい知識を有しない、一般のユーザが
アクセントaの指定をし、辞書に登録することが多い。
は、容易ではない。従来の技術では、アクセント型の指
定は、経験に頼るところが多く、アクセント型に詳しい
者であってもアクセント核の位置を明示するのに誤るこ
とがある。まして、アクセント型というものに、なじみ
のない一般ユーザには特に難しい。しかし、実際:二は
アクセント型の詳しい知識を有しない、一般のユーザが
アクセントaの指定をし、辞書に登録することが多い。
また、辞書に登録するときも、従来の技術では、アクセ
ント核の位置を意識しながら、キーボードを叩かなけれ
ばならず、音素系列のみを入力するのに比べて、非能率
的であり、アクセントデータの論りが生じ易いというよ
うな欠点があった。
ント核の位置を意識しながら、キーボードを叩かなけれ
ばならず、音素系列のみを入力するのに比べて、非能率
的であり、アクセントデータの論りが生じ易いというよ
うな欠点があった。
本発明の目的は、発音辞書に未登録な単語を自動的に抽
出することにより専門的知識かなくても自動的にアクセ
ント型を゛指定し、発音辞書の更新作業を容易にかつ効
率良く、行なうことができる発音辞書更新装置を提供す
ることにある。
出することにより専門的知識かなくても自動的にアクセ
ント型を゛指定し、発音辞書の更新作業を容易にかつ効
率良く、行なうことができる発音辞書更新装置を提供す
ることにある。
本発明による発音辞書更新装置は形態系解析と音声合成
に必要な情報を持った発音辞書を持ち、漢字かな混じり
文字列であるテキストを入力とする形態素解析部と、形
態素解析の結果、検出された発音辞書の未登録語を一時
蓄える未登録語メモリと、未登録語に対しで、音素記号
列と音素記号列に対応する音声を入力として前記音素記
号列にアクセント核を表わす記号を付与するアクセント
型認識部とから構成される。
に必要な情報を持った発音辞書を持ち、漢字かな混じり
文字列であるテキストを入力とする形態素解析部と、形
態素解析の結果、検出された発音辞書の未登録語を一時
蓄える未登録語メモリと、未登録語に対しで、音素記号
列と音素記号列に対応する音声を入力として前記音素記
号列にアクセント核を表わす記号を付与するアクセント
型認識部とから構成される。
(作 用)
本発明では、漢字かな混じりの文字列であるテキストが
入力され、形態素解析が行われる。次(二人力されたテ
キストを形態素に分割し、形態素の文字列カ一致する発
音辞書の児出し語を求める。
入力され、形態素解析が行われる。次(二人力されたテ
キストを形態素に分割し、形態素の文字列カ一致する発
音辞書の児出し語を求める。
既存の発音辞書に登録されていない文字列があると、そ
の文字列は未登録語として自動的に検出することができ
る。形態素解析の手法としては、例えば「自然言語処理
研究会資料38j(1983年7月15日)(−「日本
語形態素解析の基本設計」と題して発表された論文に示
された形態素分割の方法を用いることができる。一方、
アクセント型の検出は、特願昭60−108637号明
細書「音声合成用テキスト作成装置」に示された方法を
用いることができる。ここで、このアクセント型の検出
方法(二ついて簡単に説明する。
の文字列は未登録語として自動的に検出することができ
る。形態素解析の手法としては、例えば「自然言語処理
研究会資料38j(1983年7月15日)(−「日本
語形態素解析の基本設計」と題して発表された論文に示
された形態素分割の方法を用いることができる。一方、
アクセント型の検出は、特願昭60−108637号明
細書「音声合成用テキスト作成装置」に示された方法を
用いることができる。ここで、このアクセント型の検出
方法(二ついて簡単に説明する。
日本語音声のアクセントはピッチアクセントであり、ア
クセント核のある音節の後では、ピッチ周波数が急激に
低くなることが良く知られている。
クセント核のある音節の後では、ピッチ周波数が急激に
低くなることが良く知られている。
よって、ピッチ周波数が急激に下降している時間区間が
、アクセントの核の直後に対応していると考えられる。
、アクセントの核の直後に対応していると考えられる。
これと、セグメンテーションの結果得られる音節の時間
区間の情報とをあわせることにより、アクセントの核が
どの音節にあるかを決定することができる。第2図(a
)は、音節単位へのセグメンテーションの結果を表わし
ている。セグメンテーションは、たとえば、「電子通信
学会論文誌J Vol、J67−Dm6(1984年6
月) 693〜700ページにlYop−down的音
韻認識に基づく単語音声認識」と題して発表された論文
に示された方法によって行なうことができる一縦軸は入
力音声のエネルギーであり、横軸は時間軸である。点線
はセグメンテーションによって求められる音節境界であ
る。第2図(b)は、検出されたピッチ周波数の急激に
下降している区間を表わしている。縦軸は入力音声のピ
ッチ周波数であり、横軸は時間軸である。このピッチ周
波数の時系列は、たとえば、「日本音響学会講演論文集
J(1977年10月)35〜36ページに「ピッチ周
期系列最適選択の一方式」と題して発表された論文に述
べられた方法によって得ることができる。また、第2図
(b)のアクセントフォールの区間は、例えば、ピッチ
周波数の第1次差分値がθp以下で、継続時間がOd以
上であるような区間として検出される。これら第2図(
b)のピッチ周波数の急激(二下降している時間区間の
情報と、第2図(a)の対応する時間区間に位置する音
節の情報によりアクセントの核が青菜テキスト中のどの
音節にあるかが決定される。第2図(C)は、決定され
たアクセント核を表わす記号を含む音素テキストを表わ
す、また、決定されたアクセント核は、この他にも、音
素テキスト中のアクセント核の位置を表わす番号として
も指定可能である。
区間の情報とをあわせることにより、アクセントの核が
どの音節にあるかを決定することができる。第2図(a
)は、音節単位へのセグメンテーションの結果を表わし
ている。セグメンテーションは、たとえば、「電子通信
学会論文誌J Vol、J67−Dm6(1984年6
月) 693〜700ページにlYop−down的音
韻認識に基づく単語音声認識」と題して発表された論文
に示された方法によって行なうことができる一縦軸は入
力音声のエネルギーであり、横軸は時間軸である。点線
はセグメンテーションによって求められる音節境界であ
る。第2図(b)は、検出されたピッチ周波数の急激に
下降している区間を表わしている。縦軸は入力音声のピ
ッチ周波数であり、横軸は時間軸である。このピッチ周
波数の時系列は、たとえば、「日本音響学会講演論文集
J(1977年10月)35〜36ページに「ピッチ周
期系列最適選択の一方式」と題して発表された論文に述
べられた方法によって得ることができる。また、第2図
(b)のアクセントフォールの区間は、例えば、ピッチ
周波数の第1次差分値がθp以下で、継続時間がOd以
上であるような区間として検出される。これら第2図(
b)のピッチ周波数の急激(二下降している時間区間の
情報と、第2図(a)の対応する時間区間に位置する音
節の情報によりアクセントの核が青菜テキスト中のどの
音節にあるかが決定される。第2図(C)は、決定され
たアクセント核を表わす記号を含む音素テキストを表わ
す、また、決定されたアクセント核は、この他にも、音
素テキスト中のアクセント核の位置を表わす番号として
も指定可能である。
本発明では、前記、形態素解析(二より、入力テキスト
の中に、辞書に未登録の語があれば、その文字列を切り
だして、未登録語メモリに蓄えておき、表記漢字かな混
じり文字列は、そのまま辞書へそして発音データは、前
記アクセント形検出により、追加できる。このように、
発音辞書更新のための入力は音声と音素系列のみで良く
、またアクセント核の位置を意識しなくて良いので、素
人でも能率的に未登録語の発音データを追加することが
できるようになり、発音辞書の更新を効率良く行うこと
ができる。
の中に、辞書に未登録の語があれば、その文字列を切り
だして、未登録語メモリに蓄えておき、表記漢字かな混
じり文字列は、そのまま辞書へそして発音データは、前
記アクセント形検出により、追加できる。このように、
発音辞書更新のための入力は音声と音素系列のみで良く
、またアクセント核の位置を意識しなくて良いので、素
人でも能率的に未登録語の発音データを追加することが
できるようになり、発音辞書の更新を効率良く行うこと
ができる。
(実施例)
次に図面を用いて、本発明の詳細な説明する。
第1図は本発明の一実施例を示すブロック図である。入
力された漢字かな混じり文字列のテキスト1を形態素解
析部2が形態素の文字列に分解する。
力された漢字かな混じり文字列のテキスト1を形態素解
析部2が形態素の文字列に分解する。
その結果、形態素文字列が発音辞書3に存在しないもの
があれば、その文字列は発音辞書の未登録語として検出
し、未登録語メモリ4に一時記憶した後、未発i&語り
スト5をディスプレイ、または紙に出力する。文字列が
全て発音辞書3に存在すれば、正常終了として処理を終
わるか、または音声合成等の次の処理に移る。
があれば、その文字列は発音辞書の未登録語として検出
し、未登録語メモリ4に一時記憶した後、未発i&語り
スト5をディスプレイ、または紙に出力する。文字列が
全て発音辞書3に存在すれば、正常終了として処理を終
わるか、または音声合成等の次の処理に移る。
未登録語りスト5があれば、そのリストをもとに、未登
録語を発音する。音声8を入力するとともに、キーボー
ド7より前記音声に対応する音素記号列を入力する。
録語を発音する。音声8を入力するとともに、キーボー
ド7より前記音声に対応する音素記号列を入力する。
キーボード6より入力された音素記号列は、テキストバ
ッファ7に保存される。ピッチ抽出部1゜は、入力され
た音声8よりピッチ周波数の時系列を求め、アクセント
フォール検出部11に出力する。アクセントフォール検
出部11は、入力されたピッチ周波数の時系列中で、ピ
ッチ周波数が急激に下降している時間区間の情報をアク
セント付加部12へ出力する。セグメンテーション部9
はテキストバッファ7より入力された音素テキストを用
いて入力音声3を音節単位に分割し、各音節の時間区間
の情報をアクセント付加部12へ出力する。アクセント
付加部7はピッチ周波数下降時間区間に存在する音節を
求め、アクセント核の位置を決定し、テキストバッファ
より入力される音素記号列にアクセント核をあられす記
号を付加する。このアクセント核を表わす記号を付加さ
れた音素記号列13が処理結果として出力される。
ッファ7に保存される。ピッチ抽出部1゜は、入力され
た音声8よりピッチ周波数の時系列を求め、アクセント
フォール検出部11に出力する。アクセントフォール検
出部11は、入力されたピッチ周波数の時系列中で、ピ
ッチ周波数が急激に下降している時間区間の情報をアク
セント付加部12へ出力する。セグメンテーション部9
はテキストバッファ7より入力された音素テキストを用
いて入力音声3を音節単位に分割し、各音節の時間区間
の情報をアクセント付加部12へ出力する。アクセント
付加部7はピッチ周波数下降時間区間に存在する音節を
求め、アクセント核の位置を決定し、テキストバッファ
より入力される音素記号列にアクセント核をあられす記
号を付加する。このアクセント核を表わす記号を付加さ
れた音素記号列13が処理結果として出力される。
この音素記号列13を発音辞−1II3に登録する。
未登録語の表記の文字列は、信号線14(二よって未登
録語メモリ4より発音辞書3に登録される。
録語メモリ4より発音辞書3に登録される。
また、前記音素記号列13を音声合成回路部15に入力
し、前記、未登録語の表記の文字列に対応する音声が出
力される。
し、前記、未登録語の表記の文字列に対応する音声が出
力される。
(発明の効果)
本発明によれば、形態素!析により発音辞書に未登録な
単語を自動的に抽出するとともに専門的知識がなくても
、自動的に単語のアクセント型を指定することができる
ようになるので、単語に対応する音声と音素系列の入力
のみで、一般ユーザが発音辞書の更新を容易に効率よく
行うことかできる。また、本願の音声辞書更新装置に音
P仕成回路を付加することによって、音声で更新結果を
容易に確認することもできる。
単語を自動的に抽出するとともに専門的知識がなくても
、自動的に単語のアクセント型を指定することができる
ようになるので、単語に対応する音声と音素系列の入力
のみで、一般ユーザが発音辞書の更新を容易に効率よく
行うことかできる。また、本願の音声辞書更新装置に音
P仕成回路を付加することによって、音声で更新結果を
容易に確認することもできる。
図面の簡単な説明
第1図は本発明の一実施例を示ずブロック図、第2図(
aJ 、 (b) 、 (C)は本発明の詳細な説明す
るための図奏、第3図は発音辞書の構成の例を示す図で
ある。
aJ 、 (b) 、 (C)は本発明の詳細な説明す
るための図奏、第3図は発音辞書の構成の例を示す図で
ある。
図において、
2・・・・・・形態素解析部
3・・・・・・・発音辞書
4・・・・・・・未登録語メモリ
6・・・・・・千−ボード
7・・・・・・・テキスト/イソファ
8・・・・・・・音声分析回路
9・・・・・・・セグメンテーション部10・・・・−
・・ピッチ抽出部 11・−・・・アクセントフォール検出部12・・・・
・・・アクセント付加部 を碕→−6れi碕−4 15・−・−音声合成回路部 翫を代台吋、す。
・・ピッチ抽出部 11・−・・・アクセントフォール検出部12・・・・
・・・アクセント付加部 を碕→−6れi碕−4 15・−・−音声合成回路部 翫を代台吋、す。
Claims (1)
- 文字列に対して、音素記号が格納される発音辞書の更新
装置であって、漢字かな混じり文字列であるテキストが
入力され、形態素の文字列に分解し、前記形態素文字列
が、前記発音辞書内に登録済であるか否かを検出する形
態素解析部と、登録済でない形態素文字列を一時記憶す
るとともに表示する未登録語メモリと、前記表示された
未登録語に対応する音素記号列と音声を入力する手段と
前記音声よりアクセント位置を検出する手段と、前記ア
クセント位置検出結果にしたがって前記未登録語に対応
する音素記号列にアクセント核を表わす記号を付与する
アクセント型認識部とを備えており、前記未登録語メモ
リの内容と前記アクセント型認識部の出力とを前記発音
辞書に格納する
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61105926A JP2580568B2 (ja) | 1986-05-08 | 1986-05-08 | 発音辞書更新装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61105926A JP2580568B2 (ja) | 1986-05-08 | 1986-05-08 | 発音辞書更新装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS62262099A true JPS62262099A (ja) | 1987-11-14 |
JP2580568B2 JP2580568B2 (ja) | 1997-02-12 |
Family
ID=14420462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61105926A Expired - Lifetime JP2580568B2 (ja) | 1986-05-08 | 1986-05-08 | 発音辞書更新装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2580568B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS649499A (en) * | 1987-07-01 | 1989-01-12 | Hitachi Ltd | Accent type input system for rule voice synchronization |
WO2010018796A1 (ja) * | 2008-08-11 | 2010-02-18 | 旭化成株式会社 | 例外語辞書作成装置、例外語辞書作成方法及びそのプログラム、並びに、音声認識装置及び音声認識方法 |
CN111583961A (zh) * | 2020-05-07 | 2020-08-25 | 北京一起教育信息咨询有限责任公司 | 一种重音评价方法、装置及电子设备 |
-
1986
- 1986-05-08 JP JP61105926A patent/JP2580568B2/ja not_active Expired - Lifetime
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS649499A (en) * | 1987-07-01 | 1989-01-12 | Hitachi Ltd | Accent type input system for rule voice synchronization |
WO2010018796A1 (ja) * | 2008-08-11 | 2010-02-18 | 旭化成株式会社 | 例外語辞書作成装置、例外語辞書作成方法及びそのプログラム、並びに、音声認識装置及び音声認識方法 |
JPWO2010018796A1 (ja) * | 2008-08-11 | 2012-01-26 | 旭化成株式会社 | 例外語辞書作成装置、例外語辞書作成方法及びそのプログラム、並びに、音声認識装置及び音声認識方法 |
CN111583961A (zh) * | 2020-05-07 | 2020-08-25 | 北京一起教育信息咨询有限责任公司 | 一种重音评价方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
JP2580568B2 (ja) | 1997-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8209169B2 (en) | Synchronization of an input text of a speech with a recording of the speech | |
JP2007206317A (ja) | オーサリング方法、オーサリング装置およびプログラム | |
JPS58132800A (ja) | 音声応答装置 | |
JP5088109B2 (ja) | 形態素解析装置、形態素解析方法、コンピュータプログラム、音声合成装置及び音声照合装置 | |
JPS62262099A (ja) | 発音辞書更新装置 | |
JPH06282290A (ja) | 自然言語処理装置およびその方法 | |
JP3371761B2 (ja) | 氏名読み音声合成装置 | |
JP2580565B2 (ja) | 音声情報辞書作成装置 | |
JPH10269204A (ja) | 中国語文書自動校正方法及びその装置 | |
JP3284976B2 (ja) | 音声合成装置及びコンピュータ可読記録媒体 | |
JPH06119144A (ja) | 文書読み上げ装置 | |
JP3414326B2 (ja) | 音声合成用辞書登録装置及び方法 | |
JPS62212870A (ja) | 文章読み上げ校正装置 | |
JPH08185197A (ja) | 日本語解析装置、及び日本語テキスト音声合成装置 | |
JP2728440B2 (ja) | 音声出力装置 | |
JP2573565B2 (ja) | 単語綴りの発音記号への変換装置 | |
JP2614912B2 (ja) | 文章読み上げ装置 | |
JPS6391736A (ja) | 読み合わせ装置 | |
JPH10149355A (ja) | 音声出力付き仮名漢字変換方式 | |
JPH02137899A (ja) | 規則合成装置の文字表示方法 | |
JP2000330998A (ja) | 発音電子辞書 | |
JPS60205594A (ja) | 認識結果表示方式 | |
JPS6132167A (ja) | カナ漢字変換処理装置 | |
JPH10254861A (ja) | 音声合成装置 | |
JPH05333893A (ja) | 文書読み上げ装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |