JP5252209B2 - 読み生成装置 - Google Patents
読み生成装置 Download PDFInfo
- Publication number
- JP5252209B2 JP5252209B2 JP2009020406A JP2009020406A JP5252209B2 JP 5252209 B2 JP5252209 B2 JP 5252209B2 JP 2009020406 A JP2009020406 A JP 2009020406A JP 2009020406 A JP2009020406 A JP 2009020406A JP 5252209 B2 JP5252209 B2 JP 5252209B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- dictionary
- proper noun
- reading
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
[装置の構成]
第1の実施形態は、音声合成エンジンにおける読み生成装置に関する。図1は、第1の実施形態に係る読み生成装置の構成を示す機能ブロック図である。図1に示す読み生成装置10は、テキストを入力し、そのテキストの読みアクセント情報を出力するシステムである。
図3は、本実施形態における読み生成装置の動作例を示すフローチャートである。入力部1にテキストが入力されると、入力テキストはテキストバッファに格納される(S301)。通常、形態素解析では、入力テキストはある程度の長さに分割して処理される。ここでは一例として、1文章ごとに処理をするものとする。S302において、単語検索部2は、テキストバッファから解析対象の1文を読み込む。単語検索部2は、例えば、テキストバッファに格納された入力テキストを先頭から一文字ずつチェックしてゆき、「。」「?」「!」などの文末を示す文字が出現するまでのテキストを1文章であると判断することができる。
第2の実施形態は、上記第1の実施形態における地名単語辞書103、氏名単語辞書104、地名代替辞書201および氏名代替辞書202を作成するための辞書作成装置に関する。図5Aおよび図5Bは、第2の実施形態に係る辞書作成装置の構成を示す機能ブロック図である。図5Aは、地名単語辞書103および地名代替辞書201の辞書作成装置、図5Bは、氏名単語辞書104および氏名代替辞書202の辞書作成装置の構成を示している。
8a、8bを備える。データ入力部7aは、地名データリスト402から、地名単語の表記および読みを表すデータを読み込んで、辞書生成部8aで使用可能な状態にする。データ入力部7bは、氏名データリスト403から、氏名単語の表記および読みを表すデータを読み込んで、辞書生成部8bで使用可能な状態にする。
図6は、辞書作成装置による辞書作成処理の一例を示すフローチャートである。ここでは、一例として、データ入力部7bが、予め用意された、図7Aに例示するような氏名データリスト403を読み込んで、辞書生成部8bが、氏名単語辞書104および氏名代替辞書202にデータを登録する処理について説明する。
さて、例えば、音声自動応答装置では、あらかじめ用意されたフロー(あるいはシナリオとも呼ばれる)に基づいて、情報提供等のサービスを進めていく場合がある。サービスのある場面では、これから読み上げる対象のテキストが、固有名詞であることが予め分かる場合がある。例えば、これから読み上げる対象のテキストが、氏名のみからなる文字列であることや、住所のみからなる文字列であることが分かっている場合がある。具体例として、テレホンバンキングにおいて、電話をかけてきたユーザ(預金者)が自分の口座番号を電話のプッシュボタンを押下して入力した後、音声自動応答システムが合成音声を用いて預金者名を電話で返答して、確認する場面が想定できよう。このとき、音声自動応答システムでは、例えば、「山本光人様ですね。」といったテキストから音声が合成される。音声自動応答システムは、「山本光人」は氏名であることがあらかじめ分かっているので、この部分を氏名であることを明示する情報(固有名詞指定情報)をテキストに付加して音声合成を行うことが可能である。このような固有名詞指定情報として、例えば、読み上げテキストに埋め込むことができるタグが挙げられる。具体例として、氏名の開始位置を示す「<氏名開始>」と、氏名の終了位置を示す「<氏名終了>」というタグを定義しておき、これを読み上げテキストに埋め込んで、例えば、「<氏名開始>山本光人<氏名終了>様ですね。」という読み上げテキストを用意することができる。音声自動応答システムでは、音声合成の形態素解析時にタグを検出して、<氏名開始>と<氏名終了>に挟まれた文字列は、氏名であることを認識した上で処理することができる。その結果、より精度よく氏名を読み上げることが可能となる。なお、固有名詞指定情報はタグに限られない。例えば、その他の所定の記号やデータ構造により、テキスト中の固有名詞の部分を定義することができる。
次に、本実施形態に係る読み生成装置10aの動作例を説明する。ここでは、一例として、氏名単語辞書104には、図9Aに示す内容のデータが記録されており、氏名部分文字列辞書202aには、図9Bに示す内容のデータが記録されている場合の動作例を説明する。図9Aに示す例では、氏名単語辞書104には、表記が「光」の単語および表記が「山本」の単語それぞれについて、読みアクセント、漢字読み対応(各漢字に対応する読み)、品詞(「姓」または「名」)が記録されている。図9Bに示す例では、氏名部分文字列辞書202aには、姓の部分文字列として「ヤマ」「モト」「ミツ」「ヒト」という読みそれぞれについて、品詞および文字が登録されている。なお、氏名単語辞書104や氏名部分文字列辞書202aにはこれ以外にも多数の単語が登録され得る。図9A、図9Bには、本動作例を説明するために必要なデータのみ表示されている。
(1)氏名文字列区間が、品詞「姓」の1個の単語と、品詞「名」の1個の単語で構成される。
(2)氏名文字列区間が、品詞「姓」の1個の単語と、品詞「名」の1個以上の部分文字列で構成される。
(3)氏名文字列区間が、品詞「姓」の1個以上の部分文字列と、品詞「名」の1個の単語で構成される。
(4)氏名文字列区間が、品詞「姓」の1個以上の部分文字列と、品詞「名」の1個以上の部分文字列で構成される。
(5)以上(1)〜(4)の基準で解析できなかった部分について、一文字辞書から検索した未知語を採用する。
次に、本実施形態に係る読み生成装置10aの他の動作例を説明する。ここでは、一例として、地名単語辞書103は、図10Aに示す内容のデータが記録されており、地名部分文字列辞書201aには、図10Bに示す内容のデータが記録されている場合の動作例を説明する。図10Aに示す例では、地名単語辞書103には、表記が「盛岡市」の単語について、読みアクセント「モリオカ’シ」、漢字読み対応(各漢字に対応する読み)「盛=モリ、岡=オカ、市=シ」、品詞(属性)「市名」が記録されている。図10Bに示す例では、地名部分文字列辞書201aには、地名の部分文字列として「モリ」「オカ」「ウチ」「マル」という読みそれぞれについて、文字が登録されている。なお、地名単語辞書103や地名部分文字列辞書201aにはこれ以外にも多数の単語が登録され得る。図10A、図10Bには、本動作例を説明するために必要なデータのみ表示されている。
(1)地名単語辞書から検索された地名単語を採用する。
(2)地名単語辞書から検索されなかった部分について、地名部分文字列を採用する。
(3)地名単語でも地名部分文字列でも解析できなかった文字列に対して、一文字辞書から検索した未知語を採用する。
第4の実施形態は、上記第3の実施形態における地名単語辞書103、氏名単語辞書104、地名部分文字列辞書201aおよび氏名部分文字列辞書202aを作成するための辞書作成装置に関する。図11Aおよび図11Bは、第4の実施形態に係る辞書作成装置の構成を示す機能ブロック図である。図11Aは、地名単語辞書103および地名部分文字列辞書201aの辞書作成装置、図11Bは、氏名単語辞書104および氏名部分文字列辞書202aの辞書作成装置の構成を示している。図11A、図11Bにおいて、図5A、図5Bと同じ機能ブロックには同じ番号を付している。
固有名詞単語のテキスト表記および読みと品詞を対応づけて登録した固有名詞辞書と、
前記固有名詞を除く単語のテキスト表記および読みと品詞を登録した一般単語辞書と、
前記固有名詞単語の一部を代替する読みと代替文字を対応づけた代替情報を格納した代替辞書と、
テキストを入力する入力部と、
前記一般単語辞書および前記固有名詞辞書に登録された単語の中から、前記入力テキストに部分一致する単語を検索して単語候補とする単語検索部と、
前記固有名詞辞書の単語を、前記代替辞書に登録された前記代替情報によって代替したときに、前記入力テキストに部分一致する単語を検索して単語候補とする代替単語検索部と、
予め記録されている、連接する単語の組み合わせの繋がり易さを示す評価データに従って、前記単語検索部および前記代替単語検索部によって検索された前記単語候補の中から前記入力テキスト含まれる単語の組み合わせを特定する単語特定部と、
前記単語特定部によって特定された単語の読みに基づいて、前記入力テキストの前記単語の読みを示す情報を生成する読み生成部とを備える、読み生成装置。
前記代替情報は、固有名詞単語の一部と代替可能なテキスト表記と、当該テキスト表記の読みと品詞を表す情報であって、
前記代替単語検索部は、前記固有名詞辞書に格納された単語の一部のテキスト表記を、前記代替情報が表すテキスト表記の一部で代替した単語であって、前記入力テキストに部分一致する単語を検索して単語候補とする、付記1に記載の読み生成装置。
固有名詞単語のテキスト表記および読みと品詞とを対応づけて登録した固有名詞辞書と、
前記固有名詞を除く単語のテキスト表記および読みと品詞を登録した一般単語辞書と、
固有名詞単語の一部の読みと代替文字とが対応づけて格納された部分文字列辞書と、
固有名詞部分を予め定義する固有名詞指定情報を含むテキストを入力する入力部と、
前記固有名詞指定情報に基づいて、入力テキストのうち、固有名詞区間と、その他の一般文字列区間とを設定する、テキスト区間設定部と、
一般文字列区間と設定された区間に対して、前記一般単語辞書から、前記入力テキストに部分一致する単語を検索して単語候補とする一般単語検索部と、
予め記録されている、連接する単語の組み合わせの繋がり易さを示す評価データを用いて、前記一般単語検索部によって検索された単語候補の中から最適な単語の組み合わせを特定する一般単語特定部と、
固有名詞区間と設定された区間に対して前記固有名詞辞書および前記部分文字列辞書から、前記入力テキストに部分一致する単語を検索して単語候補とする固有名詞単語検索部と、
予め記録されている、連接する単語の組み合わせの繋がり易さを示す評価データを用いて、前記固有名詞単語検索部によって検索された前記単語候補の中から最適な単語の組み合わせを特定する固有名詞単語特定部と、
前記一般単語特定部と前記固有名詞単語特定部によって特定された結果を統合する統合部と、
前記統合部により統合された単語の読みに基づいて、前記入力テキストに相当する読み情報を生成する読み生成部とを備える、読み生成装置。
前記固有名詞単語特定部は、前記固有名詞区間に、前記固有名詞辞書から検索された単語候補のいずれにも一致しない部分がある場合、前記部分文字列辞書から検索された、前記部分に一致する単語候補を、最適な単語の組み合わせに含める、付記3に記載の読み生成装置。
複数の固有名詞単語のテキスト表記および読みを表すデータの集合を入力するデータ入力部と、
前記データ入力部が入力したデータの集合に含まれる前記固有名詞単語のテキスト表記および読みと品詞を対応づけて固有名詞辞書に登録する辞書生成部とをさらに備え、
前記辞書生成部は、前記データ入力部が入力したデータの集合に含まれる固有名詞単語と読みが同じ固有名詞単語が、既に前記固有名詞辞書に登録されている場合、既に登録されている既存の固有名詞単語と異なる部分のテキスト表記と、当該テキスト表記に対応する読みと品詞を、固有名詞単語の一部を構成するテキスト表記および読みと品詞として、代替辞書に登録する、付記1または2に記載の読み生成装置。
前記固有名詞辞書は、氏名用の氏名固有名詞辞書と地名用の地名固有名詞辞書を含み、
前記単語検索部は、前記一般単語辞書および前記氏名固有名詞辞書と前記地名固有名詞辞書に登録された単語の中から、前記入力テキストに部分一致する単語を検索して単語候補とし、
前記代替単語検索部は、前記一般単語辞書または前記氏名固有名詞辞書または前記地名固有名詞辞書から検索された部分一致する単語の一致しない一部を、前記代替辞書に登録された前記代替情報によって代替したときに、前記入力テキストに含まれる単語に一致する単語を検索する、付記1、2および5のいずれか1項に記載の読み生成装置。
複数の固有名詞単語のテキスト表記および読みを表すデータの集合を入力するデータ入力部と、
前記データ入力部が入力したデータの集合に含まれる固有名詞単語のテキスト表記および読みと品詞を対応づけて固有名詞辞書に登録する辞書生成部とをさらに備え、
前記辞書生成部は、さらに、前記データ入力部が入力したデータの集合に含まれる固有名詞単語の一部を構成するテキスト表記と当該テキスト表記に対応する読みを、部分文字列辞書に登録する、付記3または4に記載の読み生成装置。
前記代替辞書または前記部分文字列辞書と、前記固有名詞辞書と、前記一般単語辞書とにおいては、読みを表す情報に加えて、当該読みのアクセント情報も登録され、
前記読み生成部は、前記アクセント情報を用いて、前記入力テキストに相当する読みのアクセントを表す情報も生成する、付記1〜7のいずれか1項に記載の読み生成装置。
固有名詞単語のテキスト表記および読みと品詞を対応づけて登録した固有名詞辞書と、前記固有名詞を除く単語のテキスト表記および読みと品詞を登録した一般単語辞書と、前記固有名詞単語の一部を代替する読みと代替文字を対応づけた代替情報を格納した代替辞書とにアクセス可能なコンピュータに処理を実行させる読み生成プログラムであって、
テキストを入力する入力処理と、
前記一般単語辞書および前記固有名詞辞書に登録された単語の中から、前記入力テキストに部分一致する単語を検索して単語候補とする単語検索処理と、
前記固有名詞辞書の単語を、前記代替辞書に登録された前記代替情報によって代替したときに、前記入力テキストに部分一致する単語を検索して単語候補とする代替単語検索処理と、
予め記録されている、連接する単語の組み合わせの繋がり易さを示す評価データに従って、前記単語検索処理および前記代替単語検索処理によって検索された前記単語候補の中から前記入力テキスト含まれる単語の組み合わせを特定する単語特定処理と、
前記単語特定処理によって特定された単語の読みに基づいて、前記入力テキストの前記単語の読みを示す情報を生成する読み生成処理とをコンピュータに実行させる読み生成プログラム。
固有名詞単語のテキスト表記および読みと品詞とを対応づけて登録した固有名詞辞書と、前記固有名詞を除く単語のテキスト表記および読みと品詞を登録した一般単語辞書と、固有名詞単語の一部の読みと代替文字とが対応づけて格納された部分文字列辞書とにアクセス可能なコンピュータに処理を実行させる読み生成プログラムであって、
固有名詞部分を予め定義する固有名詞指定情報を含むテキストを入力する入力処理と、
前記固有名詞指定情報に基づいて、入力テキストのうち、固有名詞区間と、その他の一般文字列区間とを設定する、テキスト区間設定処理と、
一般文字列区間と設定された区間に対して、前記一般単語辞書から、前記入力テキストに部分一致する単語を検索して単語候補とする一般単語検索処理と、
予め記録されている、連接する単語の組み合わせの繋がり易さを示す評価データを用いて、前記一般単語検索処理によって検索された単語候補の中から最適な単語の組み合わせを特定する一般単語特定処理と、
固有名詞区間と設定された区間に対して前記固有名詞辞書および前記部分文字列辞書から、前記入力テキストに部分一致する単語を検索して単語候補とする固有名詞単語検索処理と、
予め記録されている、連接する単語の組み合わせの繋がり易さを示す評価データを用いて、前記固有名詞単語検索処理によって検索された前記単語候補の中から最適な単語の組み合わせを特定する固有名詞単語特定処理と、
前記一般単語特定処理と前記固有名詞単語特定処理によって特定された結果を統合する統合処理と、
前記統合処理により統合された単語の読みに基づいて、前記入力テキストに相当する読み情報を生成する読み生成処理とをコンピュータに実行させる、読み生成プログラム。
固有名詞単語のテキスト表記および読みと品詞を対応づけて登録した固有名詞辞書と、前記固有名詞を除く単語のテキスト表記および読みと品詞を登録した一般単語辞書と、前記固有名詞単語の一部を代替する読みと代替文字を対応づけた代替情報を格納した代替辞書とにアクセス可能なコンピュータが実行する読み生成方法であって、
テキストを入力する入力工程と、
前記一般単語辞書および前記固有名詞辞書に登録された単語の中から、前記入力テキストに部分一致する単語を検索して単語候補とする単語検索工程と、
前記固有名詞辞書の単語を、前記代替辞書に登録された前記代替情報によって代替したときに、前記入力テキストに部分一致する単語を検索して単語候補とする代替単語検索工程と、
予め記録されている、連接する単語の組み合わせの繋がり易さを示す評価データに従って、前記単語検索工程および前記代替単語検索工程で検索された前記単語候補の中から前記入力テキスト含まれる単語の組み合わせを特定する単語特定工程と、
前記単語特定工程によって特定された単語の読みに基づいて、前記入力テキストの前記単語の読みを示す情報を生成する読み生成工程とを含む読み生成方法。
固有名詞単語のテキスト表記および読みと品詞とを対応づけて登録した固有名詞辞書と、前記固有名詞を除く単語のテキスト表記および読みと品詞を登録した一般単語辞書と、固有名詞単語の一部の読みと代替文字とが対応づけて格納された部分文字列辞書とにアクセス可能なコンピュータが実行する読み生成方法であって、
固有名詞部分を予め定義する固有名詞指定情報を含むテキストを入力する入力工程と、
前記固有名詞指定情報に基づいて、入力テキストのうち、固有名詞区間と、その他の一般文字列区間とを設定する、テキスト区間設定工程と、
一般文字列区間と設定された区間に対して、前記一般単語辞書から、前記入力テキストに部分一致する単語を検索して単語候補とする一般単語検索工程と、
予め記録されている、連接する単語の組み合わせの繋がり易さを示す評価データを用いて、前記一般単語検索工程で検索された単語候補の中から最適な単語の組み合わせを特定する一般単語特定工程と、
固有名詞区間と設定された区間に対して前記固有名詞辞書および前記部分文字列辞書から、前記入力テキストに部分一致する単語を検索して単語候補とする固有名詞単語検索工程と、
予め記録されている、連接する単語の組み合わせの繋がり易さを示す評価データを用いて、前記固有名詞単語検索工程によって検索された前記単語候補の中から最適な単語の組み合わせを特定する固有名詞単語特定工程と、
前記一般単語特定工程と前記固有名詞単語特定工程で特定された結果を統合する統合工程と、
前記統合工程により統合された単語の読みに基づいて、前記入力テキストに相当する読み情報を生成する読み生成工程とを含む、読み生成方法。
2 単語検索部
3 代替単語検索部
4 単語特定部
5 読みアクセント生成部
6 出力部
7a、7b データ入力部
8a、8b 辞書生成部
10、10a 読み生成装置
11 テキスト区間設定部
12 一般単語検索部
13 地名単語検索部
14 氏名単語検索部
15 一般単語特定部
16 地名単語特定部
17 氏名単語特定部
18 統合部
19a、19b 辞書生成部
101 単語辞書
102 一般単語辞書
103 地名単語辞書
104 氏名単語辞書
105 一文字辞書
109 単語接続評価値テーブル
201 地名代替辞書
201 代替辞書
201a 地名部分文字列辞書
202 氏名代替辞書
202a 氏名部分文字列辞書
402 地名データリスト
403 氏名データリスト
Claims (8)
- 固有名詞単語のテキスト表記および読みと品詞を対応づけて登録した固有名詞辞書と、
前記固有名詞を除く単語のテキスト表記および読みと品詞を登録した一般単語辞書と、
前記固有名詞単語の一部を代替する読みと代替文字を対応づけた代替情報を格納した代替辞書と、
テキストを入力する入力部と、
前記一般単語辞書および前記固有名詞辞書に登録された単語の中から、前記入力テキストに部分一致する単語を検索して単語候補とする単語検索部と、
前記固有名詞辞書の単語を、前記代替辞書に登録された前記代替情報によって代替したときに、前記入力テキストに部分一致する単語を検索して単語候補とする代替単語検索部と、
予め記録されている、連接する単語の組み合わせの繋がり易さを示す評価データに従って、前記単語検索部および前記代替単語検索部によって検索された前記単語候補の中から前記入力テキスト含まれる単語の組み合わせを特定する単語特定部と、
前記単語特定部によって特定された単語の読みに基づいて、前記入力テキストの前記単語の読みを示す情報を生成する読み生成部とを備える、読み生成装置。 - 前記代替情報は、固有名詞単語の一部と代替可能なテキスト表記と、当該テキスト表記の読みと品詞を表す情報であって、
前記代替単語検索部は、前記固有名詞辞書に格納された単語の一部のテキスト表記を、前記代替情報が表すテキスト表記の一部で代替した単語であって、前記入力テキストに部分一致する単語を検索して単語候補とする、請求項1に記載の読み生成装置。 - 固有名詞単語のテキスト表記および読みと品詞とを対応づけて登録した固有名詞辞書と、
前記固有名詞を除く単語のテキスト表記および読みと品詞を登録した一般単語辞書と、
固有名詞単語の一部の読みと代替文字とが対応づけて格納された部分文字列辞書と、
固有名詞部分を予め定義する固有名詞指定情報を含むテキストを入力する入力部と、
前記固有名詞指定情報に基づいて、入力テキストのうち、固有名詞区間と、その他の一般文字列区間とを設定する、テキスト区間設定部と、
一般文字列区間と設定された区間に対して、前記一般単語辞書から、前記入力テキストに部分一致する単語を検索して単語候補とする一般単語検索部と、
予め記録されている、連接する単語の組み合わせの繋がり易さを示す評価データを用いて、前記一般単語検索部によって検索された単語候補の中から最適な単語の組み合わせを特定する一般単語特定部と、
固有名詞区間と設定された区間に対して前記固有名詞辞書および前記部分文字列辞書から、前記入力テキストに部分一致する単語を検索して単語候補とする固有名詞単語検索部と、
予め記録されている、連接する単語の組み合わせの繋がり易さを示す評価データを用いて、前記固有名詞単語検索部によって検索された前記単語候補の中から最適な単語の組み合わせを特定する固有名詞単語特定部と、
前記一般単語特定部と前記固有名詞単語特定部によって特定された結果を統合する統合部と、
前記統合部により統合された単語の読みに基づいて、前記入力テキストに相当する読み情報を生成する読み生成部とを備える、読み生成装置。 - 前記固有名詞単語特定部は、前記固有名詞区間に、前記固有名詞辞書から検索された単語候補のいずれにも一致しない部分がある場合、前記部分文字列辞書から検索された、前記部分に一致する単語候補を、最適な単語の組み合わせに含める、請求項3に記載の読み生成装置。
- 複数の固有名詞単語のテキスト表記および読みを表すデータの集合を入力するデータ入力部と、
前記データ入力部が入力したデータの集合に含まれる前記固有名詞単語のテキスト表記および読みと品詞を対応づけて固有名詞辞書に登録する辞書生成部とをさらに備え、
前記辞書生成部は、前記データ入力部が入力したデータの集合に含まれる固有名詞単語と読みが同じ固有名詞単語が、既に前記固有名詞辞書に登録されている場合、既に登録されている既存の固有名詞単語と異なる部分のテキスト表記と、当該テキスト表記に対応する読みと品詞を、固有名詞単語の一部を構成するテキスト表記および読みと品詞として、代替辞書に登録する、請求項1または2に記載の読み生成装置。 - 前記固有名詞辞書は、氏名用の氏名固有名詞辞書と地名用の地名固有名詞辞書を含み、
前記単語検索部は、前記一般単語辞書および前記氏名固有名詞辞書と前記地名固有名詞辞書に登録された単語の中から、前記入力テキストに部分一致する単語を検索して単語候補とし、
前記代替単語検索部は、前記一般単語辞書または前記氏名固有名詞辞書または前記地名固有名詞辞書から検索された部分一致する単語の一致しない一部を、前記代替辞書に登録された前記代替情報によって代替したときに、前記入力テキストに含まれる単語に一致する単語を検索する、請求項1、2および5のいずれか1項に記載の読み生成装置。 - 複数の固有名詞単語のテキスト表記および読みを表すデータの集合を入力するデータ入力部と、
前記データ入力部が入力したデータの集合に含まれる固有名詞単語のテキスト表記および読みと品詞を対応づけて固有名詞辞書に登録する辞書生成部とをさらに備え、
前記辞書生成部は、さらに、前記データ入力部が入力したデータの集合に含まれる固有名詞単語の一部を構成するテキスト表記と当該テキスト表記に対応する読みを、部分文字列辞書に登録する、請求項3または4に記載の読み生成装置。 - 前記代替辞書または前記部分文字列辞書と、前記固有名詞辞書と、前記一般単語辞書とにおいては、読みを表す情報に加えて、当該読みのアクセント情報も登録され、
前記読み生成部は、前記アクセント情報を用いて、前記入力テキストに相当する読みのアクセントを表す情報も生成する、請求項1〜7のいずれか1項に記載の読み生成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009020406A JP5252209B2 (ja) | 2009-01-30 | 2009-01-30 | 読み生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009020406A JP5252209B2 (ja) | 2009-01-30 | 2009-01-30 | 読み生成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010176539A JP2010176539A (ja) | 2010-08-12 |
JP5252209B2 true JP5252209B2 (ja) | 2013-07-31 |
Family
ID=42707424
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009020406A Expired - Fee Related JP5252209B2 (ja) | 2009-01-30 | 2009-01-30 | 読み生成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5252209B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05120283A (ja) * | 1991-10-28 | 1993-05-18 | Sharp Corp | 漢字読み仮名変換装置 |
JP3371761B2 (ja) * | 1997-06-19 | 2003-01-27 | 富士通株式会社 | 氏名読み音声合成装置 |
JP2006155213A (ja) * | 2004-11-29 | 2006-06-15 | Hitachi Information Systems Ltd | 漢字氏名のふりがな取得装置及びその取得方法 |
-
2009
- 2009-01-30 JP JP2009020406A patent/JP5252209B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010176539A (ja) | 2010-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6251958B2 (ja) | 発話解析装置、音声対話制御装置、方法、及びプログラム | |
US20110131038A1 (en) | Exception dictionary creating unit, exception dictionary creating method, and program therefor, as well as speech recognition unit and speech recognition method | |
JP2009037633A (ja) | 規模調整可能なニューラルネットワーク・ベースの、文書テキストからの言語同定 | |
JP4740837B2 (ja) | 音声認識における統計的言語モデリング方法、システム及び記録媒体 | |
JP4570509B2 (ja) | 読み生成装置、読み生成方法及びコンピュータプログラム | |
JP2007087397A (ja) | 形態素解析プログラム、補正プログラム、形態素解析装置、補正装置、形態素解析方法および補正方法 | |
JP3372532B2 (ja) | 感情情報抽出方法および感情情報抽出プログラムの計算機読み取り可能な記録媒体 | |
Scherrer et al. | Natural Language Processing for the Swiss German Dialect Area. | |
JP2009258293A (ja) | 音声認識語彙辞書作成装置 | |
Nguyen et al. | A method for Vietnamese Text Normalization to improve the quality of speech synthesis | |
JP5252209B2 (ja) | 読み生成装置 | |
JP2005339347A (ja) | 日中機械翻訳装置、日中機械翻訳方法および日中機械翻訳プログラム | |
JP4751299B2 (ja) | 読み情報生成装置、読み情報生成方法、読み情報生成プログラムおよび音声合成装置 | |
JP6619932B2 (ja) | 形態素解析装置およびプログラム | |
JP6998017B2 (ja) | 音声合成用データ生成装置、音声合成用データ生成方法及び音声合成システム | |
JP6009396B2 (ja) | 発音付与方法とその装置とプログラム | |
Xydas et al. | Text normalization for the pronunciation of non-standard words in an inflected language | |
JP3029403B2 (ja) | 文章データ音声変換システム | |
KR102278288B1 (ko) | 음소 기반 텍스트 검색 장치 및 방법 | |
JP4206253B2 (ja) | 自動音声応答装置及び自動音声応答方法 | |
JP3414326B2 (ja) | 音声合成用辞書登録装置及び方法 | |
JP2010039864A (ja) | 形態素解析装置、形態素解析方法及びコンピュータプログラム | |
JP2021085996A (ja) | 音声認識システム、音声認識方法 | |
JP2005202198A (ja) | 辞書生成装置及び音声認識装置 | |
JP2006098552A (ja) | 音声情報生成装置、音声情報生成プログラム及び音声情報生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111006 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130314 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130321 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130403 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160426 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |