JP5335165B2

JP5335165B2 - 発音情報生成装置、車載情報装置およびデータベース生成方法

Info

Publication number: JP5335165B2
Application number: JP2013520299A
Authority: JP
Inventors: 道弘山崎
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2011-06-14
Filing date: 2011-06-14
Publication date: 2013-11-06
Anticipated expiration: 2031-06-14
Also published as: US20140067400A1; CN103635961A; CN103635961B; JPWO2012172596A1; WO2012172596A1

Description

この発明は、単語列または単語の発音情報を生成する発音情報生成装置、この発音情報生成装置を用いて音声合成または音声認識処理を行う車載情報装置、およびこの発音情報生成装置が発音情報を生成するために必要な単語列情報データベースの生成方法に関する。

現在、カーナビゲーション装置では音声入出力インタフェースが一般的となり、都市名および道路名などの地名を音声出力するための音声合成機能、およびユーザが発声した地名を音声認識する機能が必要となっている。カーナビゲーション装置において、音声合成および音声認識を行うためには、地名など対象とする単語の読みを示す発音情報が必要である。そのため、従来の音声合成装置は単語の表記を示す表記情報と、表記に対応した発音情報とを格納したデータベースを有している（例えば、特許文献１，２参照）。

他方、表記に対応した発音情報を生成する書記素音素（Ｇｒａｐｈｅｍｅ−ｔｏ−Ｐｈｏｎｅｍｅ；Ｇ２ＰまたはＧＴＰ）変換などの技術がある。例えば、ニューヨーク州の都市の表記「ＡＬＤＥＲＢＥＮＤ」をＧ２Ｐ変換すると、発音情報として「＊”Ｏｌ｜ｄ＠ｒ ”ｂＥｎｄ」が生成される。

特開平９−３２５７８９号公報特開２００４−３２６３６７号公報

従来の音声合成装置は、表記それぞれに対する発音情報をデータベースに格納する構成のため、データベースのサイズが非常に大きくなっていた。そのため、データベースを格納する大容量のメモリが必要となるという課題があった。

他方、Ｇ２Ｐ変換などの技術により表記に対応した発音情報を生成する場合は、表記情報のみをデータベースに格納し、必要に応じて発音情報を生成すればよいため、データベースのサイズを削減することができる。しかしながら、生成された発音情報が正しいとは限らないという課題があった。例えば、ニューヨーク州の都市の表記「ＡＬＤＥＲＢＲＯＯＫ」の正しい発音情報は「＊”Ｏｌ｜ｄ＠ｒ ”ｂｒＵｋ」であるが、Ｇ２Ｐ変換を利用すると「＊”Ｏｌ｜ｄ＠ｒ ”ｋｒｉｋ」という間違った発音情報が生成される。

この発明は、上記のような課題を解決するためになされたもので、小容量のデータベースを用いて、表記に対応した正しい発音情報を生成することを目的とする。

この発明の発音情報生成装置は、単語列または単語の表記情報から自動生成される発音情報が、当該単語列または単語の表記に対応する正式な発音情報に一致しない場合は表記情報と共に正式な発音情報が登録されており、一致する場合は表記情報が登録され正式な発音情報は登録されていない単語列／単語情報データベースと、入力された単語列または単語に該当する表記情報を単語列／単語情報データベースから取得する単語列情報検索部と、単語列情報検索部の取得した表記情報に対応する正式な発音情報が単語列／単語情報データベースに登録されているか否かを判定する発音情報生成判定部と、発音情報生成判定部の判定結果に応じて、正式な発音情報の登録されていない表記情報から発音情報を生成する発音情報生成部と、発音情報生成判定部の判定結果に応じて、表記情報に正式な発音情報が登録されていない場合は発音情報生成部の生成した発音情報を出力し、正式な発音情報が登録されている場合は単語列／単語情報データベースに登録されている当該正式な発音情報を出力する発音情報出力部とを備えるものである。

また、この発明の車載情報装置は、上述の発音情報生成装置を備え、音声出力する単語列または単語の発音情報を発音情報生成装置により生成し、当該生成した発音情報を合成音声に変換する音声合成部と、音声認識対象となる単語列または単語を入力文字列にして発音情報生成装置により生成した発音情報に基づいて音声認識辞書を生成し、当該音声認識辞書を用いて、入力される音声情報の音声認識を行う音声認識部のうちの少なくとも一方を有するものである。

また、この発明のデータベース生成方法は、単語列または単語の表記情報と、当該単語列または単語の表記に対応する正式な発音情報とが含まれた入力データに基づいて、表記情報から発音情報を生成する発音情報生成ステップと、発音情報生成ステップで生成した発音情報と入力データに含まれた正式な発音情報とを比較する発音情報比較ステップと、発音情報比較ステップの比較結果に応じて、発音情報生成ステップで生成した発音情報が正式な発音情報に一致しない場合は表記情報と共に正式な発音情報をデータベースに登録し、一致する場合は表記情報を登録して正式な発音情報は登録しない単語列情報登録ステップとを備えるものである。

この発明によれば、自動生成される発音情報が正式な発音情報と一致すると予め判明している場合は、発音情報生成処理において表記情報から発音情報を生成するようにしたので、データベースに正式な発音情報を登録しておく必要がなく、データベースのサイズを低減することができる。他方、自動生成される発音情報が正式な発音情報と一致しないと予め判明している場合はデータベースに正式な発音情報を登録しておき、発音情報生成処理において表記情報から発音情報を生成せずにデータベースに登録された発音情報を使用するようにしたので、誤った発音情報の生成を防ぐことができる。よって、小容量のデータベースを用いて、表記に対応した正しい発音情報を生成することができる。

また、この発明によれば、データベースのサイズを低減したので発音情報生成装置の小型化が可能となり、小型化の要求される車載情報装置に用いるのに好適な発音情報生成装置を提供することができる。

この発明の実施の形態１に係る発音情報生成装置の構成を示すブロック図である。実施の形態１に係る発音情報生成装置が有する単語列情報ＤＢの一例を示す図である。実施の形態１に係る発音情報生成装置が有する単語列情報ＤＢの別の例を示す図である。実施の形態１に係る発音情報生成装置の動作を示すフローチャートである。実施の形態１に係るＤＢ生成装置の構成を示すブロック図である。実施の形態１に係るＤＢ生成装置の動作を示すフローチャートである。この発明の実施の形態２に係るＤＢ生成装置の構成を示すフローチャートである。実施の形態２に係るＤＢ生成装置が生成する単語列情報ＤＢの一例を示す図である。実施の形態２に係るＤＢ生成装置の動作を示すフローチャートである。この発明の実施の形態３に係る発音情報生成装置が有する単語列情報ＤＢおよび発音情報リストの一例を示す図である。実施の形態３に係る発音情報生成装置の動作を示すフローチャートである。実施の形態３に係る発音情報生成装置が有する単語列情報ＤＢおよび発音情報リストの別の例を示す図である。この発明の実施の形態４に係るＤＢ生成装置が生成する単語列情報ＤＢおよび発音情報リストの一例を示す図である。この発明の実施の形態５に係るナビゲーション装置の構成を示すブロック図である。

以下、この発明をより詳細に説明するために、この発明を実施するための形態について、添付の図面に従って説明する。
実施の形態１．
図１に示す発音情報生成装置は、文字列を入力に用いて、当該入力文字列に対応する発音情報を生成するものであり、単語列情報データベース（以下、ＤＢ）記憶部１と、単語列情報検索部２と、発音情報生成判定部３と、発音情報生成部４と、発音情報出力部５とから構成されている。

単語列情報ＤＢ記憶部１は、単語列の表記を表す表記情報と、この表記の正式な音声を文字および記号で表した発音情報とをセットにして、単語列情報として登録したＤＢ（以下、単語列情報ＤＢ１ａ）を記憶している記憶装置である。
図２は、単語列情報ＤＢ１ａの一例を示す図である。単語列の表記情報から、Ｇ２Ｐ変換などにより自動生成された発音情報が、発音辞書および地図ＤＢなど、人手により整備されたＤＢから取得した発音情報（以下、正式な発音情報と称する）と一致しない場合、表記情報とセットで正式な発音情報が登録されている。
一方、Ｇ２Ｐ変換などにより自動生成された発音情報が、その単語列の正式な発音情報と一致する場合は、表記情報のみが単語列情報ＤＢ１ａに登録されている。
なお、単語列情報ＤＢ１ａの生成方法については後述する。

例えば、ニューヨーク州の都市の「ＡＬＤＥＲＢＲＯＯＫ」の正式な発音情報は「＊”Ｏｌ｜ｄ＠ｒ ”ｂｒＵｋ」であるが、Ｇ２Ｐ変換などにより自動生成した結果は「＊”Ｏｌ｜ｄ＠ｒ ”ｋｒｉｋ」となる。この場合、表記情報「ＡＬＤＥＲＢＲＯＯＫ」とセットになる発音情報として、正式な発音情報「＊”Ｏｌ｜ｄ＠ｒ ”ｂｒＵｋ」が登録されることになる。
一方、ニューヨーク州の都市の「ＡＬＤＥＲＢＥＮＤ」の正式な発音情報は「＊”Ｏｌ｜ｄ＠ｒ ”ｂＥｎｄ」であり、Ｇ２Ｐ変換などにより自動生成した結果も「＊”Ｏｌ｜ｄ＠ｒ ”ｂＥｎｄ」となる。この場合、自動生成により正式な発音情報を得ることができるので、表記情報「ＡＬＤＥＲＢＥＮＤ」とセットになる発音情報としては何も登録されないことになる。

また例えば、表記情報「ＨＥＲＶＥＹＳＴＲＥＥＴ」は自動生成により正式な発音情報を得ることができるため、単語列情報ＤＢ１ａには発音情報は登録されておらず、一方、表記情報「ＱＵＡＫＥＲＳＴＲＥＥＴ」は自動生成により正式な発音情報を得ることができないため、正式な発音情報「＊”ｋｗｅ｜ｋ＠ｒ ”ｓｔｒｉｔ」が単語列情報ＤＢ１ａに登録されている。
なお、説明の都合上、例示した各単語列がＧ２Ｐ変換などにより正式な発音情報を自動生成できるか否かは適宜仮定しており、実際のＧ２Ｐ変換により自動生成される発音情報とは異なる場合がある。

なお、単語列情報ＤＢ１ａに登録される単語列は上記のような地名に限定されるものではなく、住所名、施設名、人名、企業名など、発音情報の使用目的に応じた単語列であればよい。

単語列情報検索部２は、発音情報の生成対象である入力文字列を検索キーに用いて単語列情報ＤＢ記憶部１の単語列情報ＤＢ１ａを検索し、この検索キーと一致する情報を有する単語列情報を取得する。この入力文字列は、単語列の表記情報（「ＡＬＤＥＲＢＲＯＯＫ」など）とする。

発音情報生成判定部３は、単語列情報検索部２により取得された単語列情報に正式な発音情報が格納されているか否か調べ、後段の発音情報生成部４によって発音情報を自動生成するか否かを判定する。発音情報の自動生成が必要と判定した場合は、対応する単語列情報を発音情報生成判定部３から発音情報生成部４へ出力する。一方、自動生成が不必要と判定した場合は、対応する単語列情報を発音情報生成判定部３から発音情報出力部５へ出力する。

発音情報生成部４は、発音情報生成判定部３によって発音情報の自動生成が必要と判定された場合に、発音情報生成判定部３から単語列情報を受け取り、その単語列の表記情報に対応する発音情報をＧ２Ｐ変換などの所定の方法により自動生成する。

発音情報出力部５は、発音情報生成判定部３によって発音情報の自動生成が必要と判定された場合、発音情報生成部４が自動生成した発音情報を受け取って外部出力する。一方、自動生成が不必要と判定された場合は、単語列情報検索部２および発音情報生成判定部３を介して、単語列情報ＤＢ１ａに登録されていた正式な発音情報を受け取って外部出力する。

なお、単語列情報ＤＢ記憶部１は、図２に示す単語列情報ＤＢ１ａに代えて、図３に示す単語列情報ＤＢ１ｂを記憶していてもよい。図３に示すように、単語列情報ＤＢ１ｂは、単語列情報として表記情報および発音情報に加えて、単語列固有の識別情報（以下、ＩＤ）および発音情報の有無を表わすフラグ（ＴｒｕｅまたはＦａｌｓｅ）がセットになって登録されている。
単語列情報ＤＢ１ｂの場合、単語列情報検索部２に入力する入力文字列は、例えば単語列の表記情報（「ＡＬＤＥＲＢＲＯＯＫ」など）であってもよいし、単語列固有のＩＤ（「１」など）であってもよい。そして、単語列情報検索部２が入力文字列の種類（表記情報かＩＤか）に応じて、単語列情報ＤＢ１ｂの検索する範囲（表記情報かＩＤか）を変更すればよい。

次に、図４に示すフローチャートを用いて、発音情報生成装置の動作を説明する。
先ずステップＳＴ１にて、発音情報の生成対象である入力文字列が単語列情報検索部２に入力され、単語列情報検索部２がこの入力文字列を検索キーに用いて単語列情報ＤＢ１ａを検索し、検索キーと一致する単語列情報を検索する。

続くステップＳＴ２にて、単語列情報検索部２は、検索キーと一致する単語列情報が見つからなければ（ステップＳＴ２“ＮＯ”）、一連の発音情報生成処理を終了する。その際、例えば発音情報出力部５が、その単語列が単語列情報ＤＢ１ａに登録されていない旨の外部出力を行ってもよい。
一方、一致する単語列情報が見つかれば（ステップＳＴ２“ＹＥＳ”）、単語列情報検索部２はその単語列情報を取得し、次のステップＳＴ３へ進む。
例えば、単語列情報ＤＢ記憶部１が図２に示す単語列情報ＤＢ１ａまたは図３に示す単語列情報ＤＢ１ｂのいずれか一方を記憶している構成の場合、入力文字列「ＡＬＤＥＲＢＲＯＯＫ」が入力されると、単語列情報検索部２はこれを表記情報の検索キーに用いて、単語列情報ＤＢ１ａまたは単語列情報ＤＢ１ｂから表記情報「ＡＬＤＥＲＢＲＯＯＫ」、およびセットになった発音情報「＊”Ｏｌ｜ｄ＠ｒ ”ｂｒＵｋ」を含む単語列情報を取得する。
また例えば、単語列情報ＤＢ記憶部１が図３に示す単語列情報ＤＢ１ｂを記憶している構成の場合、入力文字列として「１」が入力されると、単語列情報検索部２はこれをＩＤの検索キーに用いて、図３に示す単語列情報ＤＢ１ｂからＩＤ「１」、およびセットになった表記情報「ＡＬＤＥＲＢＲＯＯＫ」と発音情報「＊”Ｏｌ｜ｄ＠ｒ ”ｂｒＵｋ」とフラグ「Ｔｕｒｅ」とを含む単語列情報を取得する。

続くステップＳＴ３にて、発音情報生成判定部３は、単語列情報検索部２から入力される単語列情報に発音情報が含まれているか否かをチェックし、含まれていれば（ステップＳＴ３“ＹＥＳ”）、発音情報生成部４によって単語列の発音情報を自動生成する必要はないと判定してステップＳＴ６へ進み、含まれていなければ（ステップＳＴ３“ＮＯ”）、発音情報生成部４によって単語列の発音情報を自動生成する必要があると判定してステップＳＴ４へ進む。
なお、単語列情報に、発音情報の有無を示すフラグが含まれている場合は、発音情報生成判定部３がそのフラグをチェックして自動生成の必要性を判定してもよい。

発音情報生成判定部３により単語列の発音情報を自動生成する必要があると判定された場合（ステップＳＴ３“ＮＯ”）、続くステップＳＴ４にて、発音情報生成部４が、単語列情報検索部２により取得された単語列情報に含まれる表示情報からＧ２Ｐ変換などにより、その単語列の発音情報を生成して発音情報出力部５へ出力する。そして、続くステップＳＴ５にて、発音情報出力部５が、発音情報生成部４により自動生成された発音情報を外部出力する。
一方、発音情報生成判定部３により単語列の発音情報を自動生成する必要がないと判定された場合（ステップＳＴ３“ＹＥＳ”）、続くステップＳＴ６にて、発音情報出力部５が、単語列情報検索部２により取得された単語列情報に含まれる発音情報を外部出力する。なお、発音情報を自動生成する必要がないと判定された場合に、発音情報出力部５が単語列情報ＤＢ１ａから発音情報を取得する構成にしてもよい。

次に、単語列情報ＤＢ記憶部１に記憶させる単語列情報ＤＢ１ａの作成方法を説明する。
図５は、単語列情報ＤＢ１ａを作成するＤＢ作成装置の構成を示すブロック図である。図５に示すＤＢ作成装置は、入力データに含まれる単語列情報を登録した単語列情報ＤＢ１ａを生成するものであり、単語列情報取得部６と、発音情報生成部４と、発音情報比較部７と、単語列情報登録部８とから構成されている。なお、前提として、ＤＢ生成装置の備える発音情報生成部４の発音情報生成の方法は、図１に示す発音情報生成装置の備える発音情報生成部４の方法（Ｇ２Ｐ変換など）と同じとする。また、ＤＢ生成装置への入力データは、例えば図１に示す発音情報生成装置をナビゲーション装置に適用する場合には地図ＤＢに含まれる地名などを表わす表記情報と正式な発音情報とがセットになった単語列情報とする。

単語列情報取得部６は、入力データから未処理の単語列情報を取得する。
発音情報生成部４は、単語列情報取得部６により取得された単語列情報に含まれる表記情報から、Ｇ２Ｐ変換などの所定の方法によって発音情報を自動生成する。
発音情報比較部７は、単語列情報取得部６により取得された単語列情報に含まれる正式な発音情報を、発音情報生成部４によって自動生成された発音情報と比較して両者が一致するか否かを判定する。
単語列情報登録部８は、発音情報生成部４によって発音情報が一致すると判定された場合に、単語列情報に含まれる表記情報のみを単語列情報ＤＢ１ａに登録し、発音情報は登録しない。一方、発音情報が不一致と判定された場合は、単語列情報取得部６、発音情報生成部４および発音情報比較部７を介して受け取った、入力データ中の単語列情報に含まれる表記情報と正式な発音情報をセットにして単語列情報ＤＢ１ａに登録する。よって、単語列情報ＤＢ１ａとして、図２に示すような単語列情報が登録されたＤＢが作成されることになる。

次に、図６に示すフローチャートを用いて、ＤＢ生成装置の動作を説明する。
先ずステップＳＴ１１にて、単語列情報ＤＢ１ａに登録対象である入力データが単語列情報取得部６に入力されると、単語列情報取得部６は未処理の単語列情報が存在する場合に（ステップＳＴ１１“ＹＥＳ”）、その単語列情報を取得して発音情報生成部４および発音情報比較部７へ出力する（ステップＳＴ１２）。一方、未処理の単語列情報が存在しない場合（ステップＳＴ１１“ＮＯ”）、ＤＢ生成処理を終了する。

ステップＳＴ１３にて、発音情報生成部４は、単語列情報取得部６により取得された単語列情報に含まれる表記情報からＧ２Ｐ変換などによりその単語列の発音情報を自動生成して、発音情報比較部７へ出力する。そして、続くステップＳＴ１４にて、発音情報比較部７が、発音情報生成部４により自動生成された発音情報と、単語列情報取得部６により取得された同一単語列の単語列情報に含まれる正式な発音情報とを比較し、両者が一致するか否かを判定して判定結果を単語列情報登録部８へ出力する。
なお、単語列が複数の単語から構成される場合、発音情報比較部７は全ての単語の発音情報が一致した場合のみ一致と判定する。例えば、表記情報「ＡＬＤＥＲＢＲＯＯＫ」に対して、入力データから取得した発音情報が「＊”Ｏｌ｜ｄ＠ｒ ”ｂｒＵｋ」、自動生成された発音情報が「＊”Ｏｌ｜ｄ＠ｒ ”ｋｒｉｋ」であった場合、単語「ＡＬＤＥＲ」の発音情報は一致するが、単語「ＢＲＯＯＫ」の発音情報が不一致のため、発音情報比較部７では単語列全体として不一致と判定する。

発音情報比較部７により両者が一致すると判定された場合（ステップＳＴ１４“ＹＥＳ”）、続くステップＳＴ１５にて、単語列情報登録部８が、単語列情報取得部６により取得された単語列情報に含まれる表記情報を単語列情報ＤＢ１ａに登録し、発音情報は登録しない。
一方、発音情報比較部７により両者が不一致と判定された場合（ステップＳＴ１４“ＮＯ”）、続くステップＳＴ１６にて、単語列情報登録部８が、単語列情報取得部６により取得された単語列情報の表記情報と正式な発音情報をセットにして単語列情報ＤＢ１ａに登録する。

ＤＢ生成装置は、登録対象の単語列情報の処理がステップＳＴ１５またはステップＳＴ１６まで終了すると、再びステップＳＴ１１に戻って入力データの次の単語列情報について処理を開始する。

なお、ＤＢ生成装置が作成するＤＢを、図２に示す単語列情報ＤＢ１ａのような構成に代えて、図３に示す単語列情報ＤＢ１ｂのような構成にしてもよい。この場合には、図６のステップＳＴ１６において単語列情報登録部８が単語列情報ＤＢ１ａに単語列情報を登録する際に、この単語列に固有のＩＤおよび発音情報の有無を表わすフラグも登録する。

以上より、実施の形態１によれば、発音情報生成装置は、単語列の表記情報からＧ２Ｐ変換など所定の方法で自動生成される発音情報が、当該単語列の表記に対応する正式な発音情報に一致しない場合は表記情報と共に正式な発音情報が登録されており、一致する場合は表記情報のみ登録されている単語列情報ＤＢ１ａを記憶している単語列情報ＤＢ記憶部１と、入力文字列に該当する表記情報を含む単語列情報を単語列情報ＤＢ１ａから取得する単語列情報検索部２と、単語列情報検索部２の取得した表記情報に対応する正式な発音情報が単語列情報ＤＢ１ａから取得した表記情報に対応する正式な発音情報が単語列情報ＤＢ１ａに登録されているか否かを判定する発音情報生成判定部３と、発音情報生成判定部３の判定結果に応じて、正式な発音情報の登録されていない表記情報からＧ２Ｐ変換など所定の方法で発音情報を生成する発音情報生成部４と、発音情報生成判定部３の判定結果に応じて、表記情報に正式な発音情報が登録されていない場合は発音情報生成部４の生成した発音情報を出力し、正式な発音情報が登録されている場合は単語列情報ＤＢ１ａに登録されていたその正式な発音情報を出力する発音情報出力部５とを備えるように構成した。このため、単語列の表記情報から自動生成される発音情報がこの単語列の正式な発音情報と一致すると予め判明している場合は単語列情報ＤＢ１ａに発音情報を登録しておく必要がなくなるので、その分、単語列情報ＤＢ１ａの容量を小さくすることができる。一方、単語列の表記情報から自動生成される発音情報がこの単語列の正式な発音情報と一致しないと予め判明している場合は単語列情報ＤＢ１ａに正式な発音情報を格納して、発音情報生成処理中は自動生成を行わずに格納されている正式な発音情報を使用するため、誤った発音情報を生成することを防止できる。よって、小容量のデータベースを用いて正しい発音情報を生成することができる。

なお、上記実施の形態１では、ＤＢ生成装置が、単語列情報ＤＢ１ａ，１ｂに単語列単位（「ＡＬＤＥＲＢＲＯＯＫ」など）で表記情報と発音情報を登録する構成としたが、これに限定されるものではなく、単語単位（「ＡＬＤＥＲ」など）で表記情報と発音情報を登録する構成（即ち、単語情報ＤＢ）にしてもよい。そして、発音情報生成装置において単語単位の単語列情報ＤＢ１ａ，１ｂを単語列情報ＤＢ記憶部１に記憶させた場合には、単語列情報検索部２、発音情報生成判定部３、発音情報生成部４および発音情報出力部５が単語単位で処理を行えばよい。
また、図示例では２つの単語から構成される単語列を示したが、３つ以上の単語から構成される単語列であってもよいし、あるいは単語列ではなく単語であってもよい。

なお、発音情報生成装置をコンピュータで構成する場合、単語列情報ＤＢ１ａ、単語列情報検索部２、発音情報生成判定部３、発音情報生成部４、発音情報出力部５の処理内容を記述しているプログラムをコンピュータのメモリに格納し、コンピュータのＣＰＵがメモリに格納されているプログラムを実行するよう構成すればよい。
同じく、ＤＢ作成装置をコンピュータで構成する場合、発音情報生成部４、単語列情報取得部６、発音情報比較部７、単語列情報登録部８の処理内容を記述しているプログラムをコンピュータのメモリに格納し、コンピュータのＣＰＵがメモリに格納されているプログラムを実行するよう構成すればよい。

実施の形態２．
図７は、本実施の形態２に係るＤＢ生成装置の構成を示すブロック図である。このＤＢ生成装置は、新たに、単語列情報ＤＢ中での単語列の出現頻度を算出する出現頻度算出部９を備え、単語列情報登録部８は出現頻度に応じて単語列を登録するか否かを判定し、出現頻度を考慮した単語列情報ＤＢ１ｃを生成する構成である。この他、図７において図５と同一または相当の部分については同一の符号を付し説明を省略する。
また、本実施の形態２に係るＤＢ生成装置が生成した単語列情報ＤＢ１ｃを使用する発音情報生成装置は、図１に示す発音情報生成装置と同様の構成であるため、図１を援用する。

上記実施の形態１では、発音情報生成部４により自動生成された発音情報と正式な発音情報とが一致する場合に単語列情報ＤＢ１ａ，１ｂに正式な発音情報が登録されていなかったが、本実施の形態２では、両者が一致する場合であっても、その単語列の出現頻度が指定した閾値以上である場合には単語列情報ＤＢ１ｃに正式な発音情報を登録しておくこととする。
ここでいう出現頻度とは、単語列情報ＤＢ１ｃにおける出現頻度であるが、ＤＢ作成の際にはＤＢ中の出現頻度は不明のため、等価的に、単語列情報ＤＢを作成する元になるデータ、即ち入力データ（発音辞書、地図ＤＢなど）における出現頻度を使用する。例えば発音情報生成装置の生成する発音情報を利用して音声合成および音声認識処理を行うナビゲーション装置において、地図ＤＢ中に出現頻度の高い単語列の発音情報は、ナビゲーション動作時に頻繁に使用されると考えられる。そこで、使用頻度の高い発音情報は単語列情報ＤＢに登録しておき、使用の都度、発音情報生成装置が自動生成しなくてすむようにして、発音情報生成処理時間の短縮を図る。
また、出現頻度の閾値が小さければ単語列情報ＤＢ１ｃのデータ量が増える一方で発音情報生成処理時間が短くなる傾向にあり、閾値が大きければ単語列情報ＤＢ１ｃのデータ量が減る一方で発音情報生成処理時間が長くなる傾向にある。そのため、閾値は、単語列情報ＤＢ１ｃのデータ量と発音情報生成処理時間との兼ね合いに応じて設定すればよい。

図８は、本実施の形態２のＤＢ生成装置が生成する単語列情報ＤＢ１ｃの一例を示す図である。
図２に示す単語列情報ＤＢ１ａでは、表記情報「ＡＬＤＥＲＢＥＮＤ」および「ＨＥＲＶＥＹＳＴＲＥＥＴ」は正式な発音情報が自動生成可能なため登録されていなかったが、図８に示す単語列情報ＤＢ１ｃでは、このうちの表記情報「ＡＬＤＥＲＢＥＮＤ」の出現頻度が閾値以上のため、正式な発音情報が登録されている。

次に、図９に示すフローチャートを用いて、ＤＢ生成装置の動作を説明する。なお、図９に示すステップＳＴ２１〜ＳＴ２４は、上記実施の形態１の図６で説明したステップＳＴ１１〜ＳＴ１４と同一の処理であるため、説明を省略する。
発音情報生成部４により自動生成された発音情報と、単語列情報取得部６により取得された正式な発音情報とが不一致と判定された場合（ステップＳＴ２４“ＮＯ”）、続くステップＳＴ２５にて、単語列情報登録部８ｃが、単語列情報取得部６により取得された正式な発音情報とその表記情報とをセットにして単語列情報ＤＢ１ｃに登録する。

一方、両者が一致すると判定された場合（ステップＳＴ２４“ＹＥＳ”）、続くステップＳＴ２６にて、出現頻度算出部９がその発音情報の単語列の、入力データにおける出現頻度を算出して単語列情報登録部８ｃへ出力し、単語列情報登録部８ｃが所定の閾値と比較する。出現頻度が閾値以上の場合（ステップＳＴ２６“ＹＥＳ”）、単語列情報登録部８ｃは、単語列情報取得部６により取得された正式な発音情報とその表記情報とをセットにして単語列情報ＤＢ１ｃに登録する（ステップＳＴ２５）。一方、出現頻度が閾値未満の場合（ステップＳＴ２６“ＮＯ”）、単語列情報登録部８ｃは、単語列情報取得部６により取得された表記情報のみを単語列情報ＤＢ１ｃに登録する（ステップＳＴ２７）。

なお、単語列情報ＤＢ１ｃを、単語列に固有のＩＤおよび発音情報の有無を表わすフラグが登録された構成にする場合は、単語列情報登録部８ｃが単語列情報ＤＢ１ｃに単語列情報を登録する際に、この単語列に固有のＩＤおよび発音情報の有無を表わすフラグも登録するようにしてもよい（ステップＳＴ２６，ＳＴ２７）。
また、図９のフローチャートではステップＳＴ２６において出現頻度算出部９が出現頻度を算出するが、算出するタイミングはこれに限定されるものではなく、例えばステップＳＴ２１の処理開始前に入力データの各単語列の出現頻度を算出しておいてもよい。

以上より、実施の形態２によれば、発音情報生成装置の単語列情報ＤＢ記憶部１が記憶している単語列情報ＤＢ１ｃは、単語列の表記情報から自動生成される発音情報が、この単語列の正式な発音情報に一致しない場合は表記情報と共に正式な発音情報が登録されており、一致する場合であって単語列情報ＤＢ１ｃ中でのこの単語列の出現頻度が所定の閾値以上の場合も表記情報と共に正式な発音情報が登録されており、一方、一致する場合であって出現頻度が閾値未満の場合は表記情報のみ登録されているように構成した。このため、出現頻度の閾値を適切に設定することで、データベース容量の削減と、発音情報生成処理時間の短縮を両立させることができる。

なお、上記実施の形態２では、ＤＢ生成装置が、単語列情報ＤＢ１ｃに単語列単位（「ＡＬＤＥＲＢＲＯＯＫ」など）で表記情報と発音情報を登録する構成としたが、これに限定されるものではなく、単語単位（「ＡＬＤＥＲ」など）で表記情報と発音情報を登録する構成にしてもよい。そして、ＤＢ作成装置の出現頻度算出部９が単語単位に出現頻度を算出し、単語列情報取得部６、発音情報生成部４、発音情報比較部７および単語列情報登録部８ｃが単語単位で処理を行えばよい。また、発音情報生成装置において単語単位の単語列情報ＤＢ１ｃを単語列情報ＤＢ記憶部１に記憶させた場合には、単語列情報検索部２、発音情報生成判定部３、発音情報生成部４および発音情報出力部５が単語単位で処理を行えばよい。
また、図示例では２つの単語から構成される単語列を示したが、３つ以上の単語から構成される単語列であってもよいし、あるいは単語列ではなく単語であってもよい。

実施の形態３．
本実施の形態３に係る発音情報生成装置の構成は、図１の発音情報生成装置と図面上では略同一の構成であるため、図１を援用して説明する。

図１０は、本実施の形態３の発音情報生成装置において、単語列情報ＤＢ記憶部１が記憶している単語列情報ＤＢ１ｄおよび発音情報リスト１０ｄの一例を示す図である。単語列情報ＤＢ１ｄは、単語列の表記情報と、その表記情報に対応する発音情報が格納された発音情報リスト１０ｄ内の位置情報とがセットで登録されている。この位置情報は、単語単位で登録されている。また、発音情報リスト１０ｄは、発音辞書、地図ＤＢなど、人手により整備されたＤＢから取得した正式な発音情報が、位置情報とセットで登録されている。そして、単語の表記情報からＧ２Ｐ変換などにより自動生成された発音情報が、正式な発音情報と一致しない場合、その単語の正式な発音情報は発音情報リスト１０ｄに位置情報とセットで登録され、単語列情報ＤＢ１ｄには表記情報と位置情報とがセットで登録されている。
一方、Ｇ２Ｐ変換などにより自動生成された発音情報が、その単語の正式な発音情報と一致する場合は、発音情報の位置情報は登録されていない。
なお、単語列情報ＤＢ１ｄおよび発音情報リスト１０ｄの生成方法については後述する。

例えば、単語列「ＡＬＤＥＲＢＲＯＯＫ」は単語「ＡＬＤＥＲ」と「ＢＲＯＯＫ」から成り、「ＡＬＤＥＲ」から自動生成された発音情報「＊”Ｏｌ｜ｄ＠ｒ」は正式な発音情報と一致するため、位置情報は「（空文字列）」となる。一方、「ＢＲＯＯＫ」から自動生成された発音情報「”ｋｒｉｋ」は正式な発音情報「”ｂｒＵｋ」と異なるため、位置情報は「１」となる。従って、単語列情報ＤＢ１ｄには、表記情報「ＡＬＤＥＲＢＲＯＯＫ」の発音情報の位置情報として「（空文字列）／１」が登録されることになる。
なお、この例では表記情報の単語単位の区切り記号を「（空文字列）」、位置情報の区切り記号を「／」としている。そして、単語列情報ＤＢ１ｄ中の「１」は単語「ＢＲＯＯＫ」の正式な発音情報の位置情報であり、その位置情報が示す発音情報リスト１０ｄの位置に「ＢＲＯＯＫ」の正式な発音情報である「”ｂｒＵｋ」が登録されている。

また例えば、単語列「ＡＬＤＥＲＢＥＮＤ」は、単語「ＡＬＤＥＲ」および「ＢＥＮＤ」共に自動生成により正式な発音情報を得ることができるので、表記情報「ＡＬＤＥＲＢＥＮＤ」とセットになる発音情報の位置情報としてはなにも登録されない（即ち「（空文字列）／（空文字列）」）である。

また例えば、単語列「ＨＥＲＶＥＹＳＴＲＥＥＴ」のうち、「ＨＥＲＶＥＹ」は自動生成により正式な発音情報を得ることができるが、「ＳＴＲＥＥＴ」は得ることができないので、表記情報「ＳＴＲＥＥＴ」の発音情報の位置情報だけが登録されることになる。よって、単語列情報ＤＢ１ｄには位置情報として「（空文字列）／２」が登録される。そして、発音情報リスト１０ｄには、「２」の位置に表記情報「ＳＴＲＥＥＴ」の正式な発音情報「”ｓｔｒｉｔ」が登録されることになる。
他方、単語列「ＱＵＡＫＥＲＳＴＲＥＥＴ」は「ＱＵＡＫＥＲ」および「ＳＴＲＥＥＴ」共に自動生成により正式な発音情報を得ることができないので、それぞれの発音情報の位置情報が登録されることになる。ただし、「ＳＴＲＥＥＴ」の正式な発音情報「”ｓｔｒｉｔ」は既に発音情報リスト１０ｄの「２」の位置に登録されているので、単語列情報ＤＢ１ｄには位置情報として「３／２」が登録される。もう一方の発音情報リスト１０ｄは、「３」の位置に表記情報「ＱＵＡＫＥＲ」の正式な発音情報「＊”ｋｗｅ｜ｋ＠ｒ」が登録されることになる。
よって、「ＳＴＲＥＥＴ」のように同一の表記に対する正式な発音情報が重複して発音情報リスト１０ｄに登録されないので、発音情報リスト１０ｄを記憶しておく単語列情報ＤＢ記憶部１の容量を削減することができる。
なお、説明の都合上、例示した各単語がＧ２Ｐ変換などにより正式な発音情報を自動生成できるか否かは適宜仮定しており、実際のＧ２Ｐ変換により自動生成される発音情報とは異なる場合がある。

なお、上記実施の形態１の図１とは異なり、本実施の形態３に係る発音情報生成装置は、発音情報出力部５が単語列情報ＤＢ記憶部１の発音情報リスト１０ｄを参照可能とする。

次に、図１１に示すフローチャートを用いて、単語列情報ＤＢ１ｄおよび発音情報リスト１０ｄを利用する発音情報生成装置の動作を説明する。なお、図１１に示すステップＳＴ３１，ＳＴ３２は、上記実施の形態１の図４で説明したステップＳＴ１，ＳＴ２と同一の処理であるため、説明を省略する。
検索キーと一致する単語列情報が、単語列情報ＤＢ記憶部１の記憶している単語列情報ＤＢ１ｄに存在しない場合（ステップＳＴ３２“ＮＯ”）、一連の発音情報生成処理を終了する。その際、例えば発音情報出力部５が、その単語列が単語列情報ＤＢ１ｄに登録されていない旨の外部出力を行ってもよい。

一方、検索キーと一致する単語列情報が単語列情報ＤＢ１ｄに存在する場合（ステップＳＴ３２“ＹＥＳ”）、単語列情報検索部２は、単語列情報ＤＢ１ｄから検索キーに一致する表記情報および発音情報の位置情報を含む単語列情報を取得して、発音情報生成判定部３へ出力する。
例えば、単語列情報ＤＢ記憶部１が図１０に示す単語列情報ＤＢ１ｄと発音情報リスト１０ｄを記憶している構成の場合、入力文字列「ＡＬＤＥＲＢＲＯＯＫ」が入力されると、単語列情報検索部２はこれを表記情報の検索キーに用いて、単語列情報ＤＢ１ｄから表記情報「ＡＬＤＥＲＢＲＯＯＫ」、およびセットになった発音情報の位置情報「（空文字列）／１」を含む単語列情報を取得する。

続くステップＳＴ３３〜ＳＴ３８において、単語列情報検索部２が取得した単語列を構成する個々の単語について発音情報を生成し外部出力する。
先ずステップＳＴ３３にて、発音情報生成判定部３は、単語列情報検索部２から入力される単語列情報を構成する全ての単語について発音情報が存在するか否かをチェックし、全ての単語について発音情報が存在する場合または生成し終えた場合（ステップＳＴ３３“ＹＥＳ”）、これ以上の発音情報を生成する必要はないと判断して一連の発音情報生成処理を終了し、そうでなければ（ステップＳＴ３３“ＮＯ”）、単語列の先頭単語から順に、個々の単語について発音情報を生成する必要があるか否かを判定する（ステップＳＴ３４）。具体的には、処理対象とする単語の表記情報に対応する位置情報が、単語列情報に含まれているか否かを調べる。

発音情報生成判定部３は、処理対象の単語の表記情報に対応する位置情報が単語列情報に含まれていない場合、その単語については発音情報の自動生成が必要と判定して（ステップＳＴ３４“ＮＯ”）、その単語の表記情報を発音情報生成部４へ出力する。続くステップＳＴ３５にて、発音情報生成部４が、発音情報生成判定部３から入力される表記情報からＧ２Ｐ変換などにより発音情報を生成して発音情報出力部５へ出力する。そして、続くステップＳＴ３６にて、発音情報出力部５が、発音情報生成部４により自動生成された発音情報を外部出力する。
上記「ＡＬＤＥＲＢＲＯＯＫ」の例の場合、ステップＳＴ３３〜ＳＴ３８の繰り返し処理の１回目では、先頭単語の表記情報「ＡＬＤＥＲ」に対応する発音情報の位置情報は「（空文字列）」であり、発音情報リスト１０ｄに正式な発音情報が登録されていないことを示す。そのため、発音情報生成部４が表記情報「ＡＬＤＥＲ」から正式な発音情報と同一の発音情報「＊”Ｏｌ｜ｄ＠ｒ」を自動生成し、発音情報出力部５が外部出力する。

一方、処理対象の単語の表記情報に対応する位置情報が単語列情報に含まれている場合、発音情報生成判定部３は、その単語については発音情報の自動生成が不要と判定して（ステップＳＴ３４“ＹＥＳ”）、その単語の発音情報の位置情報を発音情報出力部５へ出力する。続くステップＳＴ３７にて、発音情報出力部５は、発音情報生成判定部３から入力される発音情報の位置情報に基づき、単語列情報ＤＢ記憶部１の発音情報リスト１０ｄからその位置に登録された発音情報を取得する。そして、発音情報出力部５は続くステップＳＴ３８にて、発音情報リスト１０ｄから取得した発音情報を外部出力する。
上記「ＡＬＤＥＲＢＲＯＯＫ」の例の場合、ステップＳＴ３３〜ＳＴ３８の繰り返し処理の２回目では、先頭から２番目の単語の表記情報「ＢＲＯＯＫ」に対応する発音情報の位置情報は「１」であり、発音情報リスト１０ｄの位置「１」に正式な発音情報「”ｂｒＵｋ」が登録されていることを示す。そのため、発音情報出力部５は発音情報リスト１０ｄから発音情報「”ｂｒＵｋ」を取得し、外部出力する。

ステップＳＴ３６またはステップＳＴ３８まで処理が終了すると、再びステップＳＴ３３に戻って、単語列情報に含まれる次の単語について処理を開始する。このようにして、発音情報生成装置は、入力文字列に該当する単語列の先頭単語から順に発音情報を外部出力することになる。
なお、発音情報を単語単位で外部出力するのではなく、単語列単位で外部出力してもよい。その場合には、発音情報出力部５が、発音情報生成判定部３から入力される単語の発音情報と発音情報生成部４から入力される単語の発音情報とを入力された順に組み合わせて単語列の発音情報を生成すればよい。

また、図１１のフローチャートでは、単語列情報検索部２が単語列情報ＤＢ１ｄから表記情報と発音情報の位置情報とを取得してその位置情報を発音情報出力部５へ通知し、発音情報出力部５が発音情報リスト１０ｄからその位置情報に対応する発音情報を取得する構成としたが、これに限定されるものではなく、例えば単語列情報検索部２が単語列情報ＤＢ１ｄから表記情報と発音情報の位置情報とを取得すると共にその位置情報に対応する発音情報を発音情報リスト１０ｄから取得し、発音情報生成部４が発音情報生成判定部３を介して単語列情報検索部２から発音情報を受け取る構成にしてもよい。

また、単語列情報ＤＢ記憶部１は、図１０に示す単語列情報ＤＢ１ｄおよび発音情報リスト１０ｄに代えて、図１２に示す単語列情報ＤＢ１ｅおよび発音情報リスト１０ｅを記憶していてもよい。図１２に示すように、発音情報リスト１０ｅには、各単語列に重複して出現する単語（「ＳＴＲＥＥＴ」など）の正式な発音情報のみ登録しておく。そして、単語列情報ＤＢ１ｅでは、各単語列に重複する単語（「ＳＴＲＥＥＴ」など）の表記情報とセットで発音情報の位置情報（「１」など）を登録し、重複しない単語（「ＢＲＯＯＫ」など）の表記情報とセットで正式な発音情報（「”ｂｒＵｋ」など）を直接登録し、重複しない単語であってＧ２Ｐ変換などにより正式な発音情報と同一の発音情報を自動生成できる単語（「ＡＬＤＥＲ」など）の表記情報に対しては発音情報を登録しない（即ち「（空文字列）」となる）。

次に、ＤＢ生成装置の動作を説明する。本実施の形態３に係るＤＢ生成装置の構成は、単語列情報ＤＢ１ａを除いて図５のＤＢ生成装置と図面上では略同一の構成であるため、図５を援用して説明する。本実施の形態３に係るＤＢ生成装置は、単語列情報ＤＢ１ａに代えて、単語列情報ＤＢ１ｄおよび発音情報リスト１０ｄを生成する。
このＤＢ生成装置は、上記実施の形態１の図６に示すフローチャートと略同じ動作である。ただし、上記実施の形態１のＤＢ生成装置は単語列単位で発音情報の生成およびＤＢへの登録を行っていたが、本実施の形態３のＤＢ生成装置は単語単位で発音情報の生成およびＤＢへの登録を行う。また、図６のステップＳＴ１６にて、単語列情報登録部８は、正式な発音情報を自動生成できない単語について、入力データから取得した正式な発音情報を発音情報リスト１０ｄに登録し、その単語の表記情報と発音情報の位置情報とを単語列情報ＤＢ１ｄに登録する。
他方、図１２に示す単語列情報ＤＢ１ｅと発音情報リスト１０ｅを作成する場合は、ステップＳＴ１６にて単語列情報登録部８が発音情報リスト１０ｅに発音情報を登録する際に既に同じ発音情報が登録されているか確認し、登録されていればその位置情報を単語列情報ＤＢ１ｅに登録する。発音情報リスト１０ｅに同じ発音情報が登録されていなければ、発音情報リスト１０ｅにその単語の正式な発音情報を登録し、単語列情報ＤＢ１ｅに表記情報と位置情報とを登録する。

以上より、実施の形態３によれば、発音情報生成装置の単語列情報ＤＢ記憶部１は、表記情報から自動生成される発音情報と正式な発音情報とが一致しない単語について、この正式な発音情報が登録されている発音情報リスト１０ｄを備え、単語列情報ＤＢ１ｄは、正式な発音情報の代わりに、発音情報リスト１０ｄ内におけるその正式な発音情報の登録位置を示す位置情報が表記情報と共に登録されているように構成し、単語列情報検索部２が入力文字列に一致する表記情報を単語列情報ＤＢ１ｄから取得し、発音情報生成判定部３が単語列情報検索部２の取得した表記情報に対応する位置情報が単語列情報ＤＢ１ｄに登録されているか否かを判定し、発音情報生成部４が発音情報生成判定部３の判定結果に応じて、位置情報の登録されていない表記情報からＧ２Ｐ変換など所定の方法で発音情報を生成し、発音情報出力部５が発音情報生成判定部３の判定結果に応じて、表記情報に対応する位置情報が登録されていない場合は発音情報生成部４の生成した発音情報を出力し、登録されている場合は発音情報リスト１０ｄ中のその位置情報の指す位置に登録されている正式な発音情報を出力するように構成した。このため、発音情報リスト１０ｄに同一の発音情報が複数重複して登録されなくなり、単語列情報ＤＢ記憶部１の記憶する情報量を削減できる。

なお、上記実施の形態３では、ＤＢ生成装置が、単語列情報ＤＢ１ｄ，１ｅに単語単位（「ＡＬＤＥＲ」など）で表記情報と発音情報の位置情報とを登録する構成としたが、これに限定されるものではなく、単語列単位（「ＡＬＤＥＲＢＲＯＯＫ」など）で表記情報と発音情報の位置情報とを登録する構成にしてもよい。また、発音情報生成装置において単語列単位の単語列情報ＤＢ１ｄ，１ｅを単語列情報ＤＢ記憶部１に記憶させた場合には、単語列情報検索部２、発音情報生成判定部３、発音情報生成部４および発音情報出力部５が単語列単位で処理を行えばよい。
また、図示例では２つの単語から構成される単語列を示したが、３つ以上の単語から構成される単語列であってもよいし、あるいは単語列ではなく単語であってもよい。

さらに、単語列が「ＡＬＤＥＲＢＲＯＯＫＲＯＡＤ」および「ＡＬＤＥＲＢＲＯＯＫＰＡＲＫ」のように単語列「ＡＬＤＥＲＢＲＯＯＫ」と単語「ＲＯＡＤ（またはＰＡＲＫ）」の組み合わせと見なすことが可能な場合、単語列情報ＤＢ１ｄ，１ｅに単語列と単語を混在させて登録しておくこともできる。
この場合、ＤＢ生成装置への入力データおよび発音情報生成装置への入力文字列に、単語を区切るための区切り記号（例えば「（空文字列）」）と、登録単位の区切りを示す区切り記号（例えば「／」）を定義しておく。そして、各装置において「ＡＬＤＥＲＢＲＯＯＫ／ＲＯＡＤ」等の単語列を区切り記号に従って単語列と単語に分け、それぞれに対して処理を行えばよい。
他方、ＤＢ生成装置への入力データには複数種の区切り記号を予め定義しておくことができても、発音情報生成装置への入力文字列に対して予め複数種の区切り記号を定義することができない場合がある。その場合には、ＤＢ生成装置は上述のように複数種の区切り記号に従って単語列と単語が混在した状態の単語列情報ＤＢ１ｄ，１ｅを生成すればよい。一方、発音情報生成装置は、単語列情報検索部２が単語を区切るための区切り記号（例えば「（空文字列）」）のみに従って、例えば最初に「ＡＬＤＥＲＢＲＯＯＫＲＯＡＤ」を単語列情報ＤＢ１ｄ，１ｅから検索し、登録がない場合は、次に「ＡＬＤＥＲＢＲＯＯＫ」と「ＲＯＡＤ」に分けて検索する。これでも登録がなければ、区切り位置を変えて「ＡＬＤＥＲ」と「ＢＲＯＯＫＲＯＡＤ」に分けて検索する等、１つの単語列に対して複数の区切り位置で区切って検索を行う方法もある。

実施の形態４．
本実施の形態４に係るＤＢ生成装置の構成は、単語列情報ＤＢ１ｃを除いて図７のＤＢ生成装置と図面上では略同一の構成であるため、図７を援用して説明する。本実施の形態４に係るＤＢ生成装置は、単語列情報ＤＢ１ｃに代えて、図１３に示す単語列情報ＤＢ１ｆおよび発音情報リスト１０ｆを生成する。
また、本実施の形態４に係るＤＢ生成装置が生成した単語列情報ＤＢ１ｆおよび発音情報リスト１０ｆを使用する発音情報生成装置は、図１に示す発音情報生成装置と同様の構成であるため、図１を援用する。

上記実施の形態３では、発音情報生成部４により自動生成された発音情報と正式な発音情報とが一致する場合には単語列情報ＤＢ１ｄ，１ｅに正式な発音情報が登録されていなかったが、本実施の形態４では、両者が一致する場合であっても、その単語の出現頻度が指定した閾値以上である場合には単語列情報ＤＢ１ｆに正式な発音情報を登録しておくこととする。

図１３は、本実施の形態４に係るＤＢ生成装置が生成する単語列情報ＤＢ１ｆおよび発音情報リスト１０ｆの一例を示す図である。
表記情報「ＡＬＤＥＲ」は正式な発音情報が自動生成可能であるが、出現頻度算出部９が算出する出現頻度が所定の閾値以上であるため、図１３に示す単語列情報ＤＢ１ｆでは発音情報の位置情報「１」が登録されている。そして、発音情報リスト１０ｆの位置「１」に正式な発音情報「＊”Ｏｌ｜ｄ＠ｒ」が登録されている。
これに対して、上記実施の形態３では、図１０に示す単語列情報ＤＢ１ｄに、表記情報「ＡＬＤＥＲ」の発音情報の位置情報は登録されていない。
その他の単語は、たとえ正式な発音情報が自動生成可能であっても出現頻度が閾値未満であるので、図１０に示す単語列情報ＤＢ１ｄと変わりない。ただし、発音情報リスト１０ｆの位置「１」に「＊”Ｏｌ｜ｄ＠ｒ」が登録されたため、以降、位置が１つずつずれている。

次に、ＤＢ生成装置の動作を説明する。なお、このＤＢ生成装置は、上記実施の形態２の図９に示すフローチャートと略同じ動作である。ただし、上記実施の形態２のＤＢ生成装置は単語列単位で発音情報の生成およびＤＢへの登録を行っていたが、本実施の形態４のＤＢ生成装置は単語単位で発音情報の生成およびＤＢへの登録を行う。また、図９のステップＳＴ２５にて、単語列情報登録部８ｃは、正式な発音情報を自動生成できない単語、または正式な発音情報は自動生成できるが出現頻度が閾値以上の単語について、入力データから取得した正式な発音情報を発音情報リスト１０ｆに登録し、その単語の表記情報と発音情報の位置情報とを単語列情報ＤＢ１ｆに登録する。

以上より、実施の形態４によれば、発音情報生成装置の単語列情報ＤＢ記憶部１は、表記情報から自動生成される発音情報と正式な発音情報とが一致しない単語について、その正式な発音情報が登録されている発音情報リスト１０ｆを備え、単語列情報ＤＢ１ｆは、単語の表記情報から自動生成される発音情報が、その単語の正式な発音情報に一致しない場合は表記情報と共に発音情報リスト１０ｆ内における正式な発音情報の登録位置を示す位置情報が登録されており、一致する場合であって単語列情報ＤＢ１ｆ中でのこの単語の出現頻度が所定の閾値以上の場合も表記情報と共に位置情報が登録されており、一方、一致する場合であって出現頻度が閾値未満の場合は表記情報のみ登録されているように構成した。このため、上記実施の形態３と同様に、発音情報リスト１０ｆに同一の発音情報が複数重複して登録されなくなり、単語列情報ＤＢ記憶部１の記憶する情報量を削減できる。また、上記実施の形態２と同様に、出現頻度の閾値を適切に設定することにより、単語列情報ＤＢ記憶部１の記憶する情報量の削減と、発音情報生成処理時間の短縮を両立させることができる。

なお、上記実施の形態４では、ＤＢ生成装置が、単語列情報ＤＢ１ｆに単語単位（「ＡＬＤＥＲ」など）で表記情報と発音情報の位置情報とを登録する構成としたが、これに限定されるものではなく、単語列単位（「ＡＬＤＥＲＢＲＯＯＫ」など）で表記情報と発音情報を登録する構成にしてもよい。そして、ＤＢ作成装置の出現頻度算出部９が単語単位に出現頻度を算出し、単語列情報取得部６、発音情報生成部４、発音情報比較部７および単語列情報登録部８ｃが単語列単位で処理を行えばよい。また、発音情報生成装置において単語列単位の単語列情報ＤＢ１ｆを単語列情報ＤＢ記憶部１に記憶させた場合には、単語列情報検索部２、発音情報生成判定部３、発音情報生成部４および発音情報出力部５が単語列単位で処理を行えばよい。
また、図示例では２つの単語から構成される単語列を示したが、３つ以上の単語から構成される単語列であってもよいし、あるいは単語列ではなく単語であってもよい。
さらに、「ＡＬＤＥＲＢＲＯＯＫＲＯＡＤ」および「ＡＬＤＥＲＢＲＯＯＫＰＡＲＫ」のように、単語列と単語が混在する単語列情報について、上記実施の形態３で説明したのと同様に単語列と単語を混在させて単語列情報ＤＢ１ｆに登録してもよい。

実施の形態５．
図１４は、本実施の形態５に係るナビゲーション装置の構成を示すブロック図である。このナビゲーション装置は、音声合成および音声認識に用いる発音情報を生成する発音情報生成装置１００と、地名、道路名、施設名などとそれぞれの位置とを含む地図情報を格納した地図ＤＢ１０１と、地図情報を用いて経路探索および経路案内などを行うナビゲーション制御部１０２と、経路案内などを行う音声を合成する音声合成部１０３と、合成音声を出力するスピーカ１０４と、ユーザの発話を集音するマイク１０５と、音声認識辞書１０７を用いて目的地などの音声認識を行う音声認識部１０６と、発音情報生成装置１００の発音情報から音声認識辞書１０７を生成する音声認識辞書生成部１０８とを備える。

発音情報生成装置１００は、上記実施の形態１〜４で説明した発音情報生成装置である。ここでは実施の形態１に係る発音情報生成装置を例に発音情報生成装置１００を説明することとし、図１を援用する。発音情報生成装置１００の単語列情報ＤＢ記憶部１は、地図ＤＢ１０１に格納された地名、施設名などの単語列または単語から生成された単語列情報ＤＢを記憶している。
音声認識辞書生成部１０８は、発音情報生成装置１００が出力する発音情報を用いて音声認識用の音声認識辞書１０７を生成する。発音情報から音声認識辞書を生成する方法は公知の技術を用いればよいため、ここでは説明を省略する。

ナビゲーション装置において、例えば経路探索を行う際、ナビゲーション制御部１０２が、ある地点の周辺の施設（現在地または目的地の周辺の施設など）を検索する際に検索対象となる施設名を地図ＤＢ１０１から取得して発音情報生成装置１００へ出力する。発音情報生成装置１００は、入力された施設名の単語列または単語に対応する発音情報を生成して、音声認識辞書生成部１０８へ出力する。音声認識辞書生成部１０８は、入力された単語列または単語を用いて音声認識辞書１０７を生成する。
あるいは、ナビゲーション制御部１０２がある都市に含まれる道路の名称を検索する際に、検索対象となる道路名（選択されている都市を通る道路名）を地図ＤＢ１０１から取得して発音情報生成装置１００へ出力し、上記施設名と同様にして、道路名の音声認識辞書１０７を生成することもできる。

続いて、ナビゲーション制御部１０２が検索対象となる施設名を画面表示し、ユーザに所望の目的地を表す施設名を発話させてマイク１０５で集音し、音声認識部１０６が音声認識辞書１０７を用いて音声認識し、ナビゲーション制御部１０２へ戻す。
続いて、ユーザが発話した目的地を正しく音声認識したか否かを確認するために、ナビゲーション制御部１０２が、音声認識部１０６から入力された目的地を示す音声認識結果の文字列（またはその文字列に設定された固有のＩＤ）を音声合成部１０３へ出力し、音声合成部１０３が発音情報生成装置１００へ目的地の文字列（またはＩＤ）を出力する。発音情報生成装置１００は、目的地の単語列または単語に対応する発音情報を生成して音声合成部１０３へ出力する。そして、音声合成部１０３がその発音情報に対応する音声情報を合成して、スピーカ１０４から出力する。

また例えば、経路案内を行う際、ナビゲーション制御部１０２は案内に使用する地名、施設名、道路名などの文字列（またはＩＤ）を音声合成部１０３へ出力し、音声合成部１０３が発音情報生成装置１００からその文字列（またはＩＤ）に対応する発音情報を取得して音声情報を合成し、スピーカ１０４から出力する。

なお、発音情報生成装置１００は、図１４に示すナビゲーション装置の他、例えばオーディオ装置に適用することもできる。オーディオ装置であれば、ナビゲーション制御部１０２に代えて、ＣＤなどの再生を行うオーディオ制御部を備える。
そして、例えば、メディアがオーディオ装置に挿入された時点で、書誌データ（例えば曲名、アーティスト名など）を入力文字列として、発音情報生成装置１００と音声認識辞書生成部１０８が協働してアーティスト名の音声認識用、曲名の音声認識用などの音声認識辞書１０７を作成する。
また、例えば、ユーザがある検索を行ったタイミングで、検索結果（例えばアーティスト名を検索キーにして抽出したアルバム名）を入力文字列として、アルバム名の音声認識用の音声認識辞書１０７を作成することもできる。
続いて、音声認識部１０６が、ユーザが発話した曲名、アーティスト名、アルバム名などを音声認識し、オーディオ制御部がその認識結果に従って楽曲を再生したり、音声合成部１０３がその楽曲の書誌データを合成音声にしてユーザへ通知したりする。
さらに、オーディオ一体型のナビゲーション装置であってもよい。また、ハンズフリー通話などを実行する電話用の機能を備えていてもよい。この場合、電話機がヘッドユニットに接続されたタイミングで、電話帳検索用の辞書から電話帳の各エントリの名称（人名、レストラン名などの施設名）を抽出し、発音情報生成装置１００を用いて音声認識辞書を生成する。そして、ユーザ発話を音声認識して発信先を特定し、通話を開始することができる。

以上より、上記実施の形態１〜４いずれかの発音情報生成装置はデータベースサイズの低減により小型化が可能となるので、小型化の要求されるカーナビゲーション装置またはカーオーディオ装置などの車載情報装置に用いるのに好適である。また、オフラインで予め生成した音声認識辞書を用いる場合には記憶装置のサイズが大きくなるが、本実施の形態５では発音情報生成装置１００を利用して音声認識辞書をオンラインで生成するので、音声認識辞書に用いる記憶装置のサイズが小さくて足りる。
なお、ナビゲーション装置は、車両に限らず、人、鉄道、船舶、航空機などを含む移動体用のナビゲーション装置であってもよく、例えば車両への持込または車載に適したナビゲーション装置とする。

また、上記実施の形態１〜５では、英語の単語列を例に説明したが、これに限定されるものではなく、日本語、中国語、ドイツ語など任意の言語に適用可能であることは言うまでもない。また、発音情報の表記方式は図示例に限定されるものではなく、国際発音記号（ＩＰＡ）などを用いてもよい。

その他にも、本願発明はその発明の範囲内において、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。

以上のように、この発明に係る発音情報生成装置は、小容量のデータベースを用いて正しい発音情報を生成するようにしたので、カーナビゲーション装置およびカーオーディオ装置などの車載情報装置に用いるのに適している。

１単語列情報ＤＢ記憶部、１ａ〜１ｆ単語列情報ＤＢ（単語列／単語情報データベース）、２単語列情報検索部、３発音情報生成判定部、４発音情報生成部、５発音情報出力部、６単語列情報取得部、７発音情報比較部、８，８ｃ単語列情報登録部、９出現頻度算出部、１０ｄ〜１０ｆ発音情報リスト、１００発音情報生成装置、１０１地図ＤＢ、１０２ナビゲーション制御部、１０３音声合成部、１０４スピーカ、１０５マイク、１０６音声認識部、１０７音声認識辞書、１０８音声認識辞書生成部。

Claims

単語列または単語の表記情報から自動生成される発音情報が、当該単語列または単語の表記に対応する正式な発音情報に一致しない場合は前記表記情報と共に前記正式な発音情報が登録されており、一致する場合は前記表記情報が登録され前記正式な発音情報は登録されていない単語列／単語情報データベースと、
入力された単語列または単語に該当する表記情報を前記単語列／単語情報データベースから取得する単語列情報検索部と、
前記単語列情報検索部の取得した前記表記情報に対応する正式な発音情報が前記単語列／単語情報データベースに登録されているか否かを判定する発音情報生成判定部と、
前記発音情報生成判定部の判定結果に応じて、正式な発音情報の登録されていない前記表記情報から発音情報を生成する発音情報生成部と、
前記発音情報生成判定部の判定結果に応じて、前記表記情報に対応する正式な発音情報が登録されていない場合は前記発音情報生成部の生成した前記発音情報を出力し、登録されている場合は前記単語列／単語情報データベースに登録されている当該正式な発音情報を出力する発音情報出力部とを備える発音情報生成装置。
単語列／単語情報データベースは、単語列または単語の表記情報から自動生成される発音情報が、当該単語列または単語の正式な発音情報に一致しない場合は前記表記情報と共に前記正式な発音情報が登録されており、一致する場合であって前記単語列／単語情報データベース中での当該単語列または単語の出現頻度が所定の閾値以上の場合も前記表記情報と共に前記正式な発音情報が登録されており、一致する場合であって前記出現頻度が所定の閾値未満の場合は前記表記情報が登録され前記正式な発音情報は登録されていないことを特徴とする請求項１記載の発音情報生成装置。
表記情報から自動生成される発音情報と正式な発音情報とが一致しない単語列または単語について、当該正式な発音情報が登録されている発音情報リストを備え、
単語列／単語情報データベースは、前記正式な発音情報の代わりに、前記発音情報リスト内における前記正式な発音情報の登録位置を示す位置情報が前記表記情報と共に登録されており、
発音情報生成判定部は、単語列情報検索部の取得した表記情報に対応する位置情報が前記単語列／単語情報データベースに登録されているか否かを判定し、
前記発音情報生成部は、前記発音情報生成判定部の判定結果に応じて、位置情報の登録されていない前記表記情報から発音情報を生成し、
発音情報出力部は、前記発音情報生成判定部の判定結果に応じて、前記表記情報に対応する位置情報が登録されていない場合は前記発音情報生成部の生成した前記発音情報を出力し、登録されている場合は前記発音情報リスト中の当該位置情報の指す位置に登録されている正式な発音情報を出力することを特徴とする請求項１記載の発音情報生成装置。
単語列／単語情報データベースは、単語列または単語の表記情報から自動生成される発音情報が、当該単語列または単語の正式な発音情報に一致しない場合は前記表記情報と共に発音情報リスト内における前記正式な発音情報の登録位置を示す位置情報が登録されており、一致する場合であって前記単語列／単語情報データベース中での当該単語列または単語の出現頻度が所定の閾値以上の場合も前記表記情報と共に前記位置情報が登録されており、一致する場合であって前記出現頻度が所定の閾値未満の場合は前記表記情報が登録され前記正式な発音情報は登録されていないことを特徴とする請求項３記載の発音情報生成装置。
請求項１記載の発音情報生成装置と、
音声出力する単語列または単語の発音情報を前記発音情報生成装置により生成し、当該生成した発音情報を合成音声に変換する音声合成部と、
音声認識対象となる単語列または単語を入力文字列にして前記発音情報生成装置により生成した発音情報に基づいて音声認識辞書を生成し、当該音声認識辞書を用いて、入力される音声情報の音声認識を行う音声認識部のうちの少なくとも一方を備えることを特徴とする車載情報装置。
単語列または単語の表記情報と、当該単語列または単語の表記に対応する正式な発音情報とが含まれた入力データに基づいて、前記表記情報から発音情報を生成する発音情報生成ステップと、
前記発音情報生成ステップで生成した発音情報と前記入力データに含まれた前記正式な発音情報とを比較する発音情報比較ステップと、
前記発音情報比較ステップの比較結果に応じて、前記発音情報生成ステップで生成した発音情報が前記正式な発音情報に一致しない場合は前記表記情報と共に前記正式な発音情報をデータベースに登録し、一致する場合は前記表記情報を前記データベースに登録して前記正式な発音情報は登録しない単語列情報登録ステップとを備えるデータベース生成方法。