JP4262077B2

JP4262077B2 - 情報処理装置及びその制御方法、プログラム

Info

Publication number: JP4262077B2
Application number: JP2003415426A
Authority: JP
Inventors: 道雄相澤
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2003-12-12
Filing date: 2003-12-12
Publication date: 2009-05-13
Anticipated expiration: 2023-12-12
Also published as: US20050131674A1; JP2005173391A

Description

本発明は、単語の発音を推定するための発音規則を生成する、または処理対象の単語の発音を推定する情報処理装置及びその制御方法、プログラムに関するものである。

単語の表記からその発音を推定する方法として、単語の表記を部分文字列に分解し、部分文字列に対応する発音を結合することで、その単語の発音とする方法が広く使われている。この方法では、部分文字列と対応する発音を予め発音規則として用意しておく。

図９に発音規則の例を示す。

例えば、１行目の発音規則は、部分文字列「ａ」に対応する発音が「ｅｉ」であることを示し、２行目の発音規則は、部分文字列「ａｔ」に対応する発音が「｛ｔ」であることを示している。ここで、発音は、アルファベットと記号を用いて表している。

以下、例として、単語「ｍｏｄｅｒａｔｉｏｎ」の発音を推定する場合について説明する。

まず、単語の表記「ｍｏｄｅｒａｔｉｏｎ」を発音規則（図９）に含まれる部分文字列へ分割する。この場合、例えば、「ｍｏｄ／ｅｒ／ａ／ｔｉｏｎ」と、４つの部分文字列に分割することができる。

次に、各部分文字列に対応する発音を発音規則から取り出し、結合して単語全体の発音と推定する。この例の場合、部分文字列「ｍｏｄ」に対応する発音は「ｍａｄ」、部分文字列「ｅｒ」に対する発音は「＠ｒ」、部分文字列「ａ」に対応する発音は「ｅｉ」、部分文字列「ｔｉｏｎ」に対応する発音は「Ｓ＠ｎ」なので、これらの発音を結合し、単語「ｍｏｄｅｒａｔｉｏｎ」に対する発音は「ｍａｄ＠ｒｅｉＳ＠ｎ」と推定される。

従来、この部分文字列を用いた発音推定装置として、発音規則を作成する方法に関して、特許文献１の「ＣＯＭＰＵＴＥＲＭＥＴＨＯＤＡＮＤＡＰＰＡＲＡＴＵＳＦＯＲＧＲＡＰＨＥＭＥ−ＴＯ−ＰＨＯＮＥＭＥＲＵＬＥ−ＳＥＴ−ＧＥＮＥＲＡＴＩＯＮ」がある。また、上記の方法を用いて作成した発音規則を利用して発音を推定する方法に関して、特許文献２の「ＣＯＭＰＵＥＲＭＥＴＨＯＤＡＮＤＡＰＰＡＲＡＴＵＳＦＯＲＴＲＡＮＳＬＡＴＩＮＧＴＥＸＴＴＯＳＯＵＮＤ」がある。

これらの特許文献１や２で開示される方法では、発音規則を接頭辞に関するもの、接尾辞に関するもの、単語内部に関するものに分けて作成し、利用している。
米国特許番号６，３４７，２９５号公報米国特許番号６，０７６，０６０号公報

しかしながら、特許文献２の方法で単語の発音を推定する場合、接頭辞、接尾辞、単語の内部に関する発音規則を単語中の部分文字列の位置に応じて使い分けなければいけないため処理が複雑になるという課題がある。

また、特許文献１のような部分文字列を用いた発音推定装置においては、一般的に次のような課題がある。

例えば、単語「ｍｏｄｅｒａｔｉｏｎ」を「ｍｏｄ／ｅｒ／ａ／ｔｉｏｎ」と分割した場合、部分文字列「ａ」の発音は「ｅｉ」となるが、別の単語「ａｎａｌｏｇ」を「ａｎ／ａ／ｌｏｇ」と分割した場合、部分文字列「ａ」の発音は「Ｖ」となる。つまり、同じ部分文字列に対し異なる発音が起こりえる。

また、単語「ｍｏｄｅｒａｔｉｏｎ」を「ｍｏｄ／ｅｒ／ａ／ｔｉｏｎ」と分割し発音規則を生成したとしても、発音を推定する時に「ｍｏｄｅ／ｒａ／ｔｉｏｎ」と異なる部分文字列に分割される可能性がある。そのため、生成時と推定時において異なる部分文字列への分割が行なわれると発音を正しく推定できない可能性が高くなる。

本発明は上記の課題を解決するためになされたものであり、処理対象の単語の発音をより適切に推定可能にするための発音規則を生成し、かつその発音規則を使用して発音を推定することで、より適切な発音を推定することができる情報処理装置及びその制御方法、プログラムを提供することを目的とする。

上記の目的を達成するための本発明による情報処理装置は以下の構成を備える。即ち、
表記と発音が関連付けられた複数の単語を含む単語辞書から処理対象の単語を順に取得して、処理対象の単語の表記を、母音字・子音字の並びを用いた、以下の４つの分割規則として、
分割規則（１）語頭および語末の子音字はその直後あるいは直前の母音字と同じ部分文字列に含める
分割規則（２）母音字に挟まれた１つの子音字は後ろの部分文字列に含める
分割規則（３）母音字に挟まれた２つの子音字はその間を部分文字列の区切りとする
分割規則（４）３つ以上の子音字が連続するときは最後の子音字の前を部分文字列の区切りとする、
分割規則を用いて、複数の部分文字列に分割する第１分割手段と、
前記分割手段で分割された複数の部分文字列の内、隣接した部分文字列を連結して新しい部分文字列を生成する連結手段と、
前記分割手段で分割された部分文字列及び前記連結手段によって連結して生成された新しい部分文字列のそれぞれについて、処理対象の単語の発音の中で該部分文字列が対応する部分の発音を決定し、その部分文字列と決定した対応する発音の組を発音規則として発音規則保持部に登録する登録手段と、
発音推定対象の単語の表記を取得する取得手段と、
前記４つの分割規則（１）乃至（４）を用いて、前記発音推定対象の単語の表記を複数の部分文字列に分割する第２分割手段と、
前記第２分割手段によって、表記の先頭から順に、前記発音推定対象の単語の表記を分割した部分文字列の区切り位置に合い、かつ最も部分文字列が長い発音規則を、前記発音規則保持部から選択する選択手段と、
前記選択手段で選択された発音規則の発音を順に結合したものを発音推定対象の単語の発音と推定する推定手段と
を備える。

上記の目的を達成するための本発明による情報処理装置の制御方法は以下の構成を備える。即ち、
表記と発音が関連付けられた複数の単語を含む単語辞書から処理対象の単語を順に取得して、処理対象の単語の表記を、母音字・子音字の並びを用いた、以下の４つの分割規則として、
分割規則（１）語頭および語末の子音字はその直後あるいは直前の母音字と同じ部分文字列に含める
分割規則（２）母音字に挟まれた１つの子音字は後ろの部分文字列に含める
分割規則（３）母音字に挟まれた２つの子音字はその間を部分文字列の区切りとする
分割規則（４）３つ以上の子音字が連続するときは最後の子音字の前を部分文字列の区切りとする、
分割規則を用いて、複数の部分文字列に分割する第１分割工程と、
前記分割工程で分割された複数の部分文字列の内、隣接した部分文字列を連結して新しい部分文字列を生成する連結工程と、
前記分割工程で分割された部分文字列及び前記連結工程によって連結して生成された新しい部分文字列のそれぞれについて、処理対象の単語の発音の中で該部分文字列が対応する部分の発音を決定し、その部分文字列と決定した対応する発音の組を発音規則として発音規則保持部に登録する登録工程と、
発音推定対象の単語の表記を取得する取得工程と、
前記４つの分割規則（１）乃至（４）を用いて、前記発音推定対象の単語の表記を複数の部分文字列に分割する第２分割工程と、
前記第２分割工程によって、表記の先頭から順に、前記発音推定対象の単語の表記を分割した部分文字列の区切り位置に合い、かつ最も部分文字列が長い発音規則を、前記発音規則保持部から選択する選択工程と、
前記選択工程で選択された発音規則の発音を順に結合したものを発音推定対象の単語の発音と推定する推定工程と
を備える。

上記の目的を達成するための本発明によるプログラムは以下の構成を備える。即ち、
処理対象の発音を推定する情報処理装置の制御をコンピュータに実行させるためのプログラムであって、
表記と発音が関連付けられた複数の単語を含む単語辞書から処理対象の単語を順に取得して、処理対象の単語の表記を、母音字・子音字の並びを用いた、以下の４つの分割規則として、
分割規則（１）語頭および語末の子音字はその直後あるいは直前の母音字と同じ部分文字列に含める
分割規則（２）母音字に挟まれた１つの子音字は後ろの部分文字列に含める
分割規則（３）母音字に挟まれた２つの子音字はその間を部分文字列の区切りとする
分割規則（４）３つ以上の子音字が連続するときは最後の子音字の前を部分文字列の区切りとする、
分割規則を用いて、複数の部分文字列に分割する第１分割工程と、
前記分割工程で分割された複数の部分文字列の内、隣接した部分文字列を連結して新しい部分文字列を生成する連結工程と、
前記分割工程で分割された部分文字列及び前記連結工程によって連結して生成された新しい部分文字列のそれぞれについて、処理対象の単語の発音の中で該部分文字列が対応する部分の発音を決定し、その部分文字列と決定した対応する発音の組を発音規則として発音規則保持部に登録する登録工程と、
発音推定対象の単語の表記を取得する取得工程と、
前記４つの分割規則（１）乃至（４）を用いて、前記発音推定対象の単語の表記を複数の部分文字列に分割する第２分割工程と、
前記第２分割工程によって、表記の先頭から順に、前記発音推定対象の単語の表記を分割した部分文字列の区切り位置に合い、かつ最も部分文字列が長い発音規則を、前記発音規則保持部から選択する選択工程と、
前記選択工程で選択された発音規則の発音を順に結合したものを発音推定対象の単語の発音と推定する推定工程と
をコンピュータに実行させることを特徴とする。

本発明によれば、処理対象の単語の発音をより適切に推定可能にするための発音規則を生成し、かつその発音規則を使用して発音を推定することで、より適切な発音を推定することができる情報処理装置及びその制御方法、プログラムを提供できる。

以下、本発明の実施の形態について図面を用いて詳細に説明する。

＜実施形態１＞
図１は本発明の実施形態１に係る発音推定装置の機能構成を示すブロック図である。

１０１は単語辞書であり、発音規則を生成するための単語の表記と発音の情報を持つ複数の単語を記憶管理している。１０２は表記文字列分割部であり、処理対象の単語の表記の文字列を部分文字列に分割する。

１０３は部分文字列連結部であり、表記文字列分割部１０２によって生成された複数の部分文字列の内、隣接した複数の部分文字列を連結して新しい部分文字列を生成する。１０４は発音規則生成部であり、各部分文字列に対して、その対応する発音を決定し、その部分文字列と発音の組を発音規則として発音規則保持部１０５に登録する。

１０５は発音規則保持部であり、発音規則を保持する。１０６は発音規則削除部であり、発音規則の中から不要な発音規則を削除する。

尚、この発音推定装置は、専用ハードウェアによって実現されても良いし、あるいはパーソナルコンピュータ等の汎用コンピュータ（情報処理装置）上で動作するプログラムとして実現されても良い。また、この汎用コンピュータの標準的な構成要素としては、例えば、ＣＰＵ、ＲＡＭ、ＲＯＭ、ハードディスク、外部記憶装置、ネットワークインタフェース、ディスプレイ、キーボード、マウス、マイク、スピーカ等を有している。

次に、実施形態１の発音推定装置が実行する処理について、図２を用いて説明する。

図２は本発明の実施形態１に係る発音推定装置が実行する処理を示すフローチャートである。

尚、図２では、単語の発音を推定するための発音規則を生成する処理について説明する。

ステップＳ２０１で、単語辞書１０１から未処理の単語を１つ取り出す。以下、例として、単語辞書１０１より、表記「ｄｅｄｉｃａｔｅ」、発音「ｄｅｄｉｋｅｉｔ」の単語を取り出した場合について説明する。

ステップＳ２０２で、表記文字列分割部１０２によって、単語の表記「ｄｅｄｉｃａｔｅ」を母音字・子音字の並びで部分文字列に分割する。ここで、「ａｅｉｏｕ」を母音字、その他のアルファベットを子音字とする。分割は、例えば、「ロワイヤル仏和辞典」（旺文社発行）にある以下の規則を用いて行なう。

・語頭および語末の子音字は、その直後あるいは直前の母音字と結びつく。

・母音字に挟まれた１つの子音字は後の部分文字列に属する。

・母音字に挟まれた２つの子音字はその間で切る。

・３つ以上の子音字が連続するときは、最後の子音字の前で切る。

以上の規則を用いると、「ｄｅｄｉｃａｔｅ」は「ｄｅ／ｄｉ／ｃａ／ｔｅ」と４つの部分文字列に分割される。

ステップＳ２０３で、部分文字列連結部１０３によって、隣接した複数の部分文字列を連結して新しい部分文字列を生成する。

例えば、部分文字列「ｄｅ」と右に隣接した「ｄｉ」を連結し、部分文字列「ｄｅｄｉ」を生成する。例えば、連結する部分文字列の数を２とすると、「ｄｅｄｉ」、「ｄｉｃａ」、「ｃａｔｅ」の３つの部分文字列が新たに生成される。ここで、連結する部分文字列の数は２に限らず、３以上の連結する部分文字列を連結してもよい。

ステップＳ２０４で、発音規則生成部１０４によって、部分文字列と対応する発音を発音規則として生成し、それを発音規則保持部１０５に登録する。

ここで、部分文字列に対応する発音は、例えば、以下のようにして、決定することが可能である。

例えば、ＤＰマッチングを用いて、単語の表記「ｄｅｄｉｃａｔｅ」と発音「ｄｅｄｉｋｅｉｔ」の文字同士の対応付けを行なう。この対応付けの結果の一例を、図３に示す。この対応付けの結果では、部分文字列「ｄｅ」に対応する発音が「ｄｅ」、部分文字列「ｄｉ」に対応する発音が「ｄｉ」等のように部分文字列に対応する発音を決定することができる。

また、これによって得られる、発音規則部保持部１０５に登録する発音規則は、図４のようになる。

図４の例の場合、ステップＳ２０２で４つの部分文字列、ステップＳ２０３で３つの部分文字列が生成されるので、「ｄｅｄｉｃａｔｅ」からは計７つの発音規則が発音規則部保持部１０５に登録されることになる。また、発音規則を登録する場合、同じ発音規則がすでに登録されていた場合は、その頻度（登録頻度）に１を足し、未登録の場合は頻度を１に設定する。

ステップＳ２０５で、すべての単語の処理が終了した否かを判定する。すべての単語の処理が終了していない場合（ステップＳ２０５でＮＯ）、ステップＳ２０１に戻り、未処理の単語を単語辞書１０１から取り出す。一方、すべての単語の処理が終了した場合（ステップＳ２０５でＹＥＳ）、ステップＳ２０６へ進む。

ステップＳ２０６で、同じ部分文字列に対して異なる発音を有する発音規則が発音規則保持部１０５に登録されている場合、発音規則削除部１０６によって、最も頻度の高い発音規則を選択し、他の発音規則を削除する。

例えば、部分文字列「ａ」に対して、発音が「Ｖ」となる発音規則と発音が「ｅｉ」となる発音規則が発音規則保持部１０５に登録されており、発音が「Ｖ」となる発音規則の頻度が１４００、発音が「ｅｉ」となる発音規則の頻度が２００であるとする。この場合、発音規則削除部１０６は、と、部分文字列「ａ」に対して発音「Ｖ」となる発音規則を選択し、部分文字列「ａ」に対して発音が「ｅｉ」となる発音規則を発音規則保持部１０５から削除する。

ステップＳ２０７で、発音規則削除部１０６によって、ステップＳ２０６で選択した発音規則の中で、頻度の高いものから、予め指定した数の発音規則を選択し、それ以外の発音規則を削除する。

以上説明したように、実施形態１によれば、同じ部分文字列で異なる発音規則が発音規則保持部に登録されている場合には、各発音規則の頻度に基づいて、不要と思われる発音規則を削除する。

これにより、より単語の発音として適切と思われる発音規則を記憶管理することができる。また、不要と思われる発音規則を削除することがで、発音規則を記憶管理するための記憶資源を有効に使用することができる。

また、部分文字列連結部１０３で新たな部分文字列を生成し、各部分文字列に対する発音規則を生成することで、同じ部分文字列に対し異なる発音が起こりえるという問題を回避することが可能となる。例えば、「ｍｏｄ／ｅｒ／ａ／ｔｉｏｎ」と「ａｎ／ａ／ｌｏｇ」において、双方では部分文字列「ａ」の発音が異なるが、「ａｔｉｏｎ」という部分文字列を生成することで「ｍｏｄｅｒａｔｉｏｎ」の分割を「ｍｏｄ／ｅｒ／ａｔｉｏｎ」と変化させ、部分文字列「ａ」の発音を１つに絞ることが可能となる。

＜実施形態２＞
実施形態１では、単語の発音を推定するための発音規則を生成する処理について説明したが、実施形態２では、この生成された発音規則を用いて、単語の発音を推定する処理について説明する。

図５は本発明の実施形態２に係る発音推定装置の構成を示すブロック図である。

尚、図５において、実施形態１の図１の発音推定装置の構成要素と同一の構成要素については、同一の参照番号を付加し、その詳細については省略する。

６０１は表記入力部であり、発音推定対象の単語の表記を入力する。

６０２は発音規則選択部６０２であり、表記文字列分割部１０２によって、発音推定対象の単語の表記を分割した部分文字列の情報を用いて、発音規則保持部１０５から発音規則を選択する。

６０３は発音出力部であり、発音規則選択部６０２が選択した発音規則を用いて、発音推定対象の単語の発音を推定し、出力する。

次に、実施形態２の発音推定装置が実行する処理について、図６を用いて説明する。

図６は本発明の実施形態２に係る発音推定装置が実行する処理を示すフローチャートである。

尚、図６では、発音推定対象の単語の発音を、その表記から推定する処理について説明する。特に、ここでは、一例として、発音推定対象の単語の表記「ｄｅｄｉｃａｔｅｄ」から、その単語の発音を推定する場合について説明する。また、図７で示す１０個の発音規則（実施形態１の処理によって生成された）を用いることにする。但し、発音規則の頻度は、発音推定時には用いないので図７では、各発音規則の頻度は省略している。

まず、ステップＳ７０１で、表記文字列分割部１０２によって、単語の表記「ｄｅｄｉｃａｔｅｄ」を母音字・子音字の並びで部分文字列に分割する。この処理は、図２のステップＳ２０２と同じである。この場合、上述のように、「ｄｅｄｉｃａｔｅｄ」は、「ｄｅ／ｄｉ／ｃａ／ｔｅｄ」と４つの部分文字列に分割される。

ステップＳ７０２で、発音規則選択部６０２によって、ポインタを表記の先頭に合わせる。ここでは、先頭の「ｄ」の位置にポインタを合わせる。

ステップＳ７０３で、発音規則選択部６０２によって、ポインタが表記の末尾にあるか否かを判定する。ポインタが表記の末尾にない場合（ステップＳ７０３でＮＯ）、ステップＳ７０４に進む。一方、ポインタが表記の末尾にある場合（ステップＳ７０３でＹＥＳ）、ステップＳ７０７に進む。

ステップＳ７０４で、発音規則選択部６０２によって、ポインタの位置から始まる表記にマッチする発音規則を、発音規則保持部１０５から取り出す。

例えば、ポインタが先頭の「ｄ」の位置にある場合、図８（ａ）に示すように、「ｄ」、「ｄｅ」、「ｄｅｄｉ」の３つの発音規則が取り出される。

また、ポインタが５文字目の「ｃ」の位置にある場合、図８（ｂ）に示すように、「ｃ」、「ｃａ」、「ｃａｔ」、「ｃａｔｅ」の４つの発音規則が取り出される。

更に、ポインタが７文字目の「ｔ」の位置にある場合、図８（ｃ）に示すように、「ｔ」、「ｔｅ」、「ｔｅｄ」の３つの発音規則が取り出される。

ステップＳ７０５で、ステップＳ７０４で取り出した発音規則の中から、ステップＳ７０１で分割した部分文字列の区切り位置に合い、かつ最も長い部分文字列となる発音規則を選択する。

例えば、図８（ａ）の場合は、「ｄｅｄｉ」の発音規則を選択する。

また、図８（ｂ）の場合は、「ｃａ」の発音規則を選択する。ここで、「ｃａｔ」、「ｃａｔｅ」の発音規則は「ｃａ」よりも長いが、部分文字列の区切り位置に合わないので選択しない。

更に、図８（ｃ）の場合は、「ｔｅｄ」の発音規則を選択する。

ステップＳ７０６で、選択した発音規則の部分文字列の長さだけポインタを進める。そして、ステップＳ７０３に戻る。

例えば、図８（ａ）の場合、５文字目の「ｃ」の位置にポインタを進める。

一方、ステップＳ７０３で、ポインタが表記の末尾にあると、ステップＳ７０７で、発音出力部６０３によって選択した発音規則の発音を結合し、推定された発音として出力する。

この例の場合、図８（ａ）〜図８（ｃ）で、それぞれ「ｄｅｄｉ」、「ｃａ」、「ｔｅｄ」の発音規則が選択され、発音は、それぞれ「ｄｅｄｉ」、「ｋｅｉ」、「ｔｉｄ」となる。これらを結合した「ｄｅｄｉｋｅｉｔｉｄ」が表記「ｄｅｄｉｃａｔｅｄ」から推定された発音として出力される。

以上説明したように、実施形態２によれば、発音推定対象の単語の先頭から末尾に向かい表記を１回走査するという簡単な処理で、発音規則を推定することが可能である。

また、表記文字列分割部１０２を、発音規則の生成時と発音の推定時で共通に使用する分割手段とすることにより、発音規則の生成時と発音の推定時において異なる分割が行なわれる問題を回避することが可能となる。

＜実施形態３＞
実施形態１の図２のステップＳＳ２０２や実施形態２の図７のステップＳ７０１において、表記文字列分割部１０２は、単語の表記を母音字・子音字の並びで部分文字列に分割していたが、音節（シラブル）を部分文字列としてもよい。

特に、ステップＳ２０２の場合は、音節区切りの情報がついた単語辞書を用いることで可能となる。

また、ステップＳ２０２とステップＳ７０１において、例えば、米国特許番号５，９４９，９６１の「ＷＯＲＤＳＹＬＬＡＢＬＩＦＩＣＡＴＩＯＮＩＮＳＰＥＥＣＨＳＹＮＴＨＥＳＩＳＳＹＳＴＥＭ」で開示されている方法などを用いて、自動的に音節に分割することも可能である。

以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。

尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム（実施形態では図に示すフローチャートに対応したプログラム）を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。

従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。

その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、ＯＳに供給するスクリプトデータ等の形態であっても良い。

プログラムを供給するための記録媒体としては、例えば、フロッピー（登録商標）ディスク、ハードディスク、光ディスク、光磁気ディスク、ＭＯ、ＣＤ−ＲＯＭ、ＣＤ−Ｒ、ＣＤ−ＲＷ、磁気テープ、不揮発性のメモリカード、ＲＯＭ、ＤＶＤ（ＤＶＤ−ＲＯＭ，ＤＶＤ−Ｒ）などがある。

その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるＷＷＷサーバも、本発明に含まれるものである。

また、本発明のプログラムを暗号化してＣＤ−ＲＯＭ等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。

また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているＯＳなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。

さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるＣＰＵなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現される。

本発明の実施形態１に係る発音推定装置の機能構成を示すブロック図である。本発明の実施形態１に係る発音推定装置が実行する処理を示すフローチャートである。本発明の実施形態１に係る表記と発音の文字列の対応付けを説明するための図である。本発明の実施形態１に係る発音規則の一例を示す図である。本発明の実施形態２に係る発音推定装置の構成を示すブロック図である。本発明の実施形態２に係る発音推定装置が実行する処理を示すフローチャートである。本発明の実施形態２に係る発音規則の一例を示す図である。本発明の実施形態２に係る発音規則を選択する手順を説明するための図である。発音規則の一例を示す図である。

符号の説明

１０１単語辞書
１０２表記文字列分割部
１０３部分文字列連結部
１０４発音規則生成部
１０５発音規則保持部
１０６発音規則削除部
６０１表記入力部
６０２発音規則選択部
６０３発音出力部

Claims

表記と発音が関連付けられた複数の単語を含む単語辞書から処理対象の単語を順に取得して、処理対象の単語の表記を、母音字・子音字の並びを用いた、以下の４つの分割規則として、
分割規則（１）語頭および語末の子音字はその直後あるいは直前の母音字と同じ部分文字列に含める
分割規則（２）母音字に挟まれた１つの子音字は後ろの部分文字列に含める
分割規則（３）母音字に挟まれた２つの子音字はその間を部分文字列の区切りとする
分割規則（４）３つ以上の子音字が連続するときは最後の子音字の前を部分文字列の区切りとする、
分割規則を用いて、複数の部分文字列に分割する第１分割手段と、
前記分割手段で分割された複数の部分文字列の内、隣接した部分文字列を連結して新しい部分文字列を生成する連結手段と、
前記分割手段で分割された部分文字列及び前記連結手段によって連結して生成された新しい部分文字列のそれぞれについて、処理対象の単語の発音の中で該部分文字列が対応する部分の発音を決定し、その部分文字列と決定した対応する発音の組を発音規則として発音規則保持部に登録する登録手段と、
発音推定対象の単語の表記を取得する取得手段と、
前記４つの分割規則（１）乃至（４）を用いて、前記発音推定対象の単語の表記を複数の部分文字列に分割する第２分割手段と、
前記第２分割手段によって、表記の先頭から順に、前記発音推定対象の単語の表記を分割した部分文字列の区切り位置に合い、かつ最も部分文字列が長い発音規則を、前記発音規則保持部から選択する選択手段と、
前記選択手段で選択された発音規則の発音を順に結合したものを発音推定対象の単語の発音と推定する推定手段と
を備えることを特徴とする情報処理装置。
表記と発音が関連付けられた複数の単語を含む単語辞書から処理対象の単語を順に取得して、処理対象の単語の表記を、母音字・子音字の並びを用いた、以下の４つの分割規則として、
分割規則（１）語頭および語末の子音字はその直後あるいは直前の母音字と同じ部分文字列に含める
分割規則（２）母音字に挟まれた１つの子音字は後ろの部分文字列に含める
分割規則（３）母音字に挟まれた２つの子音字はその間を部分文字列の区切りとする
分割規則（４）３つ以上の子音字が連続するときは最後の子音字の前を部分文字列の区切りとする、
分割規則を用いて、複数の部分文字列に分割する第１分割工程と、
前記分割工程で分割された複数の部分文字列の内、隣接した部分文字列を連結して新しい部分文字列を生成する連結工程と、
前記分割工程で分割された部分文字列及び前記連結工程によって連結して生成された新しい部分文字列のそれぞれについて、処理対象の単語の発音の中で該部分文字列が対応する部分の発音を決定し、その部分文字列と決定した対応する発音の組を発音規則として発音規則保持部に登録する登録工程と、
発音推定対象の単語の表記を取得する取得工程と、
前記４つの分割規則（１）乃至（４）を用いて、前記発音推定対象の単語の表記を複数の部分文字列に分割する第２分割工程と、
前記第２分割工程によって、表記の先頭から順に、前記発音推定対象の単語の表記を分割した部分文字列の区切り位置に合い、かつ最も部分文字列が長い発音規則を、前記発音規則保持部から選択する選択工程と、
前記選択工程で選択された発音規則の発音を順に結合したものを発音推定対象の単語の発音と推定する推定工程と
を備えることを特徴とする情報処理装置の制御方法。
処理対象の発音を推定する情報処理装置の制御をコンピュータに実行させるためのプログラムであって、
表記と発音が関連付けられた複数の単語を含む単語辞書から処理対象の単語を順に取得して、処理対象の単語の表記を、母音字・子音字の並びを用いた、以下の４つの分割規則として、
分割規則（１）語頭および語末の子音字はその直後あるいは直前の母音字と同じ部分文字列に含める
分割規則（２）母音字に挟まれた１つの子音字は後ろの部分文字列に含める
分割規則（３）母音字に挟まれた２つの子音字はその間を部分文字列の区切りとする
分割規則（４）３つ以上の子音字が連続するときは最後の子音字の前を部分文字列の区切りとする、
分割規則を用いて、複数の部分文字列に分割する第１分割工程と、
前記分割工程で分割された複数の部分文字列の内、隣接した部分文字列を連結して新しい部分文字列を生成する連結工程と、
前記分割工程で分割された部分文字列及び前記連結工程によって連結して生成された新しい部分文字列のそれぞれについて、処理対象の単語の発音の中で該部分文字列が対応する部分の発音を決定し、その部分文字列と決定した対応する発音の組を発音規則として発音規則保持部に登録する登録工程と、
発音推定対象の単語の表記を取得する取得工程と、
前記４つの分割規則（１）乃至（４）を用いて、前記発音推定対象の単語の表記を複数の部分文字列に分割する第２分割工程と、
前記第２分割工程によって、表記の先頭から順に、前記発音推定対象の単語の表記を分割した部分文字列の区切り位置に合い、かつ最も部分文字列が長い発音規則を、前記発音規則保持部から選択する選択工程と、
前記選択工程で選択された発音規則の発音を順に結合したものを発音推定対象の単語の発音と推定する推定工程と
をコンピュータに実行させることを特徴とするプログラム。