JPS62262099A

JPS62262099A - 発音辞書更新装置

Info

Publication number: JPS62262099A
Application number: JP61105926A
Authority: JP
Inventors: 市川　昌子; 伏木田　勝信
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1986-05-08
Filing date: 1986-05-08
Publication date: 1987-11-14
Anticipated expiration: 2012-02-12
Also published as: JP2580568B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は文字列を音声に変換する規則型音声合成システ
ムあるいは、音声を文字列に変換する音声認識システム
等に用いる発音辞書の更新装置に−するものである。

（従来の技術）従来、日本語の文字−音声変換システムあるいは、音声
−文字変換システムに用いる辞書として漢字かな混じり
の文字列で表わされた単語に対する音素記号、アクセン
ト記号を記憶する第３区に示すような発音辞書が知られ
ている。

第３図では、漢字かなまじり文字列である見出し語の各
々に対して、アクセント記号（第３図では米で示してい
るりが付加された音素記号列が格納されている。

従来の辞書更新技術としては、キーボード大刀によっ゛
Ｃ更倉するエディタが一般的に知られてぃる。発音辞書
を更新するためには、まず登録しようとする語のアクセ
ント型を認識し、アクセント核の位置を指定しなければ
ならない。キーホードからの入力は、このようにアクセ
ント核の位置を指定してからアクセント核の位置を示す
記号の混ざった音素記号列を入力するのが一般的である
。

〔発明が解決しようとする問題点〕

しかしながら、アクセント型の指定を正確に行なうこと
は、容易ではない。従来の技術では、アクセント型の指
定は、経験に頼るところが多く、アクセント型に詳しい
者であってもアクセント核の位置を明示するのに誤るこ
とがある。まして、アクセント型というものに、なじみ
のない一般ユーザには特に難しい。しかし、実際：二は
アクセント型の詳しい知識を有しない、一般のユーザが
アクセントａの指定をし、辞書に登録することが多い。

また、辞書に登録するときも、従来の技術では、アクセ
ント核の位置を意識しながら、キーボードを叩かなけれ
ばならず、音素系列のみを入力するのに比べて、非能率
的であり、アクセントデータの論りが生じ易いというよ
うな欠点があった。

本発明の目的は、発音辞書に未登録な単語を自動的に抽
出することにより専門的知識かなくても自動的にアクセ
ント型を゛指定し、発音辞書の更新作業を容易にかつ効
率良く、行なうことができる発音辞書更新装置を提供す
ることにある。

〔発明の構成〕

本発明による発音辞書更新装置は形態系解析と音声合成
に必要な情報を持った発音辞書を持ち、漢字かな混じり
文字列であるテキストを入力とする形態素解析部と、形
態素解析の結果、検出された発音辞書の未登録語を一時
蓄える未登録語メモリと、未登録語に対しで、音素記号
列と音素記号列に対応する音声を入力として前記音素記
号列にアクセント核を表わす記号を付与するアクセント
型認識部とから構成される。

（作　用）本発明では、漢字かな混じりの文字列であるテキストが
入力され、形態素解析が行われる。次（二人力されたテ
キストを形態素に分割し、形態素の文字列カ一致する発
音辞書の児出し語を求める。

既存の発音辞書に登録されていない文字列があると、そ
の文字列は未登録語として自動的に検出することができ
る。形態素解析の手法としては、例えば「自然言語処理
研究会資料３８ｊ（１９８３年７月１５日）（−「日本
語形態素解析の基本設計」と題して発表された論文に示
された形態素分割の方法を用いることができる。一方、
アクセント型の検出は、特願昭６０−１０８６３７号明
細書「音声合成用テキスト作成装置」に示された方法を
用いることができる。ここで、このアクセント型の検出
方法（二ついて簡単に説明する。

日本語音声のアクセントはピッチアクセントであり、ア
クセント核のある音節の後では、ピッチ周波数が急激に
低くなることが良く知られている。

よって、ピッチ周波数が急激に下降している時間区間が
、アクセントの核の直後に対応していると考えられる。

これと、セグメンテーションの結果得られる音節の時間
区間の情報とをあわせることにより、アクセントの核が
どの音節にあるかを決定することができる。第２図（ａ
）は、音節単位へのセグメンテーションの結果を表わし
ている。セグメンテーションは、たとえば、「電子通信
学会論文誌Ｊ　Ｖｏｌ、Ｊ６７−Ｄｍ６（１９８４年６
月）　６９３〜７００ページにｌＹｏｐ−ｄｏｗｎ的音
韻認識に基づく単語音声認識」と題して発表された論文
に示された方法によって行なうことができる一縦軸は入
力音声のエネルギーであり、横軸は時間軸である。点線
はセグメンテーションによって求められる音節境界であ
る。第２図（ｂ）は、検出されたピッチ周波数の急激に
下降している区間を表わしている。縦軸は入力音声のピ
ッチ周波数であり、横軸は時間軸である。このピッチ周
波数の時系列は、たとえば、「日本音響学会講演論文集
Ｊ（１９７７年１０月）３５〜３６ページに「ピッチ周
期系列最適選択の一方式」と題して発表された論文に述
べられた方法によって得ることができる。また、第２図
（ｂ）のアクセントフォールの区間は、例えば、ピッチ
周波数の第１次差分値がθｐ以下で、継続時間がＯｄ以
上であるような区間として検出される。これら第２図（
ｂ）のピッチ周波数の急激（二下降している時間区間の
情報と、第２図（ａ）の対応する時間区間に位置する音
節の情報によりアクセントの核が青菜テキスト中のどの
音節にあるかが決定される。第２図（Ｃ）は、決定され
たアクセント核を表わす記号を含む音素テキストを表わ
す、また、決定されたアクセント核は、この他にも、音
素テキスト中のアクセント核の位置を表わす番号として
も指定可能である。

本発明では、前記、形態素解析（二より、入力テキスト
の中に、辞書に未登録の語があれば、その文字列を切り
だして、未登録語メモリに蓄えておき、表記漢字かな混
じり文字列は、そのまま辞書へそして発音データは、前
記アクセント形検出により、追加できる。このように、
発音辞書更新のための入力は音声と音素系列のみで良く
、またアクセント核の位置を意識しなくて良いので、素
人でも能率的に未登録語の発音データを追加することが
できるようになり、発音辞書の更新を効率良く行うこと
ができる。

（実施例）次に図面を用いて、本発明の詳細な説明する。

第１図は本発明の一実施例を示すブロック図である。入
力された漢字かな混じり文字列のテキスト１を形態素解
析部２が形態素の文字列に分解する。

その結果、形態素文字列が発音辞書３に存在しないもの
があれば、その文字列は発音辞書の未登録語として検出
し、未登録語メモリ４に一時記憶した後、未発ｉ＆語り
スト５をディスプレイ、または紙に出力する。文字列が
全て発音辞書３に存在すれば、正常終了として処理を終
わるか、または音声合成等の次の処理に移る。

未登録語りスト５があれば、そのリストをもとに、未登
録語を発音する。音声８を入力するとともに、キーボー
ド７より前記音声に対応する音素記号列を入力する。

キーボード６より入力された音素記号列は、テキストバ
ッファ７に保存される。ピッチ抽出部１゜は、入力され
た音声８よりピッチ周波数の時系列を求め、アクセント
フォール検出部１１に出力する。アクセントフォール検
出部１１は、入力されたピッチ周波数の時系列中で、ピ
ッチ周波数が急激に下降している時間区間の情報をアク
セント付加部１２へ出力する。セグメンテーション部９
はテキストバッファ７より入力された音素テキストを用
いて入力音声３を音節単位に分割し、各音節の時間区間
の情報をアクセント付加部１２へ出力する。アクセント
付加部７はピッチ周波数下降時間区間に存在する音節を
求め、アクセント核の位置を決定し、テキストバッファ
より入力される音素記号列にアクセント核をあられす記
号を付加する。このアクセント核を表わす記号を付加さ
れた音素記号列１３が処理結果として出力される。

この音素記号列１３を発音辞−１ＩＩ３に登録する。

未登録語の表記の文字列は、信号線１４（二よって未登
録語メモリ４より発音辞書３に登録される。

また、前記音素記号列１３を音声合成回路部１５に入力
し、前記、未登録語の表記の文字列に対応する音声が出
力される。

（発明の効果）本発明によれば、形態素！析により発音辞書に未登録な
単語を自動的に抽出するとともに専門的知識がなくても
、自動的に単語のアクセント型を指定することができる
ようになるので、単語に対応する音声と音素系列の入力
のみで、一般ユーザが発音辞書の更新を容易に効率よく
行うことかできる。また、本願の音声辞書更新装置に音
Ｐ仕成回路を付加することによって、音声で更新結果を
容易に確認することもできる。

図面の簡単な説明第１図は本発明の一実施例を示ずブロック図、第２図（
ａＪ　、　（ｂ）　、　（Ｃ）は本発明の詳細な説明す
るための図奏、第３図は発音辞書の構成の例を示す図で
ある。

図において、２・・・・・・形態素解析部３・・・・・・・発音辞書４・・・・・・・未登録語メモリ６・・・・・・千−ボード７・・・・・・・テキスト／イソファ８・・・・・・・音声分析回路９・・・・・・・セグメンテーション部１０・・・・−
・・ピッチ抽出部１１・−・・・アクセントフォール検出部１２・・・・
・・・アクセント付加部を碕→−６れｉ碕−４１５・−・−音声合成回路部翫を代台吋、す。

Claims

【特許請求の範囲】

文字列に対して、音素記号が格納される発音辞書の更新
装置であって、漢字かな混じり文字列であるテキストが
入力され、形態素の文字列に分解し、前記形態素文字列
が、前記発音辞書内に登録済であるか否かを検出する形
態素解析部と、登録済でない形態素文字列を一時記憶す
るとともに表示する未登録語メモリと、前記表示された
未登録語に対応する音素記号列と音声を入力する手段と
前記音声よりアクセント位置を検出する手段と、前記ア
クセント位置検出結果にしたがって前記未登録語に対応
する音素記号列にアクセント核を表わす記号を付与する
アクセント型認識部とを備えており、前記未登録語メモ
リの内容と前記アクセント型認識部の出力とを前記発音
辞書に格納する