JP2006221532A - 異表記展開方法、辞書登録方法および言語解析方法ならびにプログラム - Google Patents
異表記展開方法、辞書登録方法および言語解析方法ならびにプログラム Download PDFInfo
- Publication number
- JP2006221532A JP2006221532A JP2005036243A JP2005036243A JP2006221532A JP 2006221532 A JP2006221532 A JP 2006221532A JP 2005036243 A JP2005036243 A JP 2005036243A JP 2005036243 A JP2005036243 A JP 2005036243A JP 2006221532 A JP2006221532 A JP 2006221532A
- Authority
- JP
- Japan
- Prior art keywords
- notation
- variation
- information
- dictionary
- acceptance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】 漢字とその読みを含む言語情報、および表記から表記バリエーションを生成するための基準ルールの情報を記憶部に予め格納するステップと、外部から表記とその読みが入力されると、基準ルールに基づいて表記の表記バリエーションを生成するステップと、生成した表記バリエーションを採用するか否かの判定のための情報となる採否判定用情報を表記バリエーションに付与するステップとを有する。
【選択図】 図1
Description
制御部が漢字とその読みを含む言語情報、および前記表記から前記表記バリエーションを生成するための基準ルールの情報を記憶部に予め格納するステップと、
前記制御部は、外部から前記表記とその読みが入力されると、前記基準ルールに基づいて該表記の表記バリエーションを生成するステップと、
生成した表記バリエーションを採用するか否かの判定のための情報となる採否判定用情報を該表記バリエーションに付与するステップと、
を有するものである。
制御部は、見出しと該見出しの読みと該見出しの辞書登録情報が入力されると、該見出しおよび該見出しの読みとともに該辞書登録情報を前記記憶部の前記辞書に登録するステップと、
入力された見出しを前記表記として上記本発明の異表記展開方法により前記表記バリエーションを生成するステップと、
採用対象の表記バリエーションを元の見出しと該見出しの読みと該見出しの辞書登録情報とともに前記辞書に登録するステップと、
を有するものである。
制御部は、文字列からなる表記、その読みおよび品詞を含む情報が登録された解析用辞書と該表記についての異なる表記である表記バリエーションを見出しとして登録するための追加解析用辞書を予め記憶部に格納するステップと、
前記表記について上記本発明の異表記展開方法により前記表記バリエーションを生成するステップと、
前記表記バリエーションを前記追加解析用辞書に登録するステップと、
前記表現が入力されると、前記解析用辞書および前記追加解析用辞書の少なくともいずれか一方を用いて該表現を単語に分解して各単語に品詞を付与する形態素解析を行うステップと、
前記形態素解析の結果を出力部に出力させるステップと、
を有するものである。
漢字とその読みを含む言語情報、および前記表記から前記表記バリエーションを生成するための基準ルールの情報を記憶部に予め格納するステップと、
外部から前記表記とその読みが入力されると、前記基準ルールに基づいて該表記の表記バリエーションを生成するステップと、
生成した表記バリエーションを採用するか否かの判定のための情報となる採否判定用情報を該表記バリエーションに付与するステップと、
を有する処理を前記コンピュータに実行させるものである。
見出しと該見出しの読みと該見出しの辞書登録情報が入力されると、該見出しおよび該見出しの読みとともに該辞書登録情報を前記記憶部の前記辞書に登録するステップと、
入力された見出しを前記表記として上記本発明のプログラムにより前記表記バリエーションを生成するステップと、
採用対象の表記バリエーションを元の見出しと該見出しの読みと該見出しの辞書登録情報とともに前記辞書に登録するステップと、
を有する処理を前記コンピュータに実行させるものである。
文字列からなる表記、その読みおよび品詞を含む情報が登録された解析用辞書と該表記についての異なる表記である表記バリエーションを見出しとして登録するための追加解析用辞書を予め記憶部に格納するステップと、
前記表記について上記本発明のプログラムにより前記表記バリエーションを生成するステップと、
前記表記バリエーションを前記追加解析用辞書に登録するステップと、
前記表現が入力されると、前記解析用辞書および前記追加解析用辞書の少なくともいずれか一方を用いて該表現を単語に分解して各単語に品詞を付与する形態素解析を行うステップと、
前記形態素解析の結果を出力部に出力させるステップと、
を有する処理を前記コンピュータに実行させるものである。
本発明の実施形態1は、入力される表記に対して表記バリエーションを生成する装置である異表記展開装置に関するものである。実施形態1の異表記展開装置について説明する。
取りあつかう:579、とり扱う:158、とりあつかう:1600、取り扱かう:35、
とり扱かう:0、取扱う:50600、取あつかう:3、取扱かう:4
形態素解析への入力文:孫や子を愛する
形態素解析結果:孫/や子/を/愛する
正解解析 :孫/や/子/を/愛する
助詞:が、を、に、と、で、へ、か、から、まで、の
や、かつ、および、または
は、も、すら、さえ、でも、しか
(☆:名詞)(から:助詞)(まつ:動詞)(☆:名詞)
(実施形態2)
本発明の実施形態2は実施形態1と同様に異表記展開装置に関するものであるが、本実施形態の異表記展開装置は、実施形態1の異表記展開装置の表記読み対応手段を設けていない構成である。
(実施形態3)
本発明の実施形態3は、形態素解析用の辞書などの日本語辞書に単語を登録するための装置である辞書登録装置に関するものである。実施形態3の辞書登録装置の構成について説明する。
れると、実施例1と同様にして表記バリエーションを生成する。以下に、生成された表記バリエーションを示す。
取りあつかう とり扱う とりあつかう 取り扱かう
とり扱かう 取扱う 取あつかう 取扱かう
、表記バリエーションと一緒に各表記バリエーションについて採否の入力を要求する旨を出力部17に表示させる。操作者が入力部11を操作して「取りあつかう」と「とり扱う」について「採用」を入力し、その他の表記バリエーションについては「不採用」を入力すると、登録確認手段55は、表記バリエーション「取りあつかう」および「とり扱う」を辞書登録手段54に送出する。辞書登録手段54は、登録確認手段55から表記バリエーション「取りあつかう」および「とり扱う」を受け取ると、日本語辞書53に「見出し:取りあつかう、読み:とりあつかう、品詞:動詞ワ行五段」と「見出し:とり扱う、読み:とりあつかう、品詞:動詞ワ行五段」とを登録する。本実施例では形態素解析用の辞書への登録の場合なので、必須の辞書登録情報ではない読みは登録してもしなくてもよい。
、操作者が採否判定をより効率よく行えるようにする方法について説明する。その方法とは、出現頻度や、利用可能性をランク付けした情報等の採用度を示す採否判定用情報を表記バリエーションとともに出力させるものである。ここでは、採否判定用情報が出現頻度の場合で説明する。また、出現頻度の値をそのまま表示させるのではなく、出現頻度が予め決められた値よりも高い表記バリエーションに印を付けて表示させるようにしてもよい。この場合、異表記展開部52が実施例1で述べた採否判定用情報の判定方法のうち第2の判定方法を行うことで、出現頻度に対応した採否判定用情報を表記バリエーションに付与する。そして、登録確認手段55は、異表記展開部52から採否判定用情報を伴った表記バリエーションを受け取ると、出現頻度が予め決められた値よりも高い表記バリエーションに印を付けて出力部17に表示させる。以下に、この場合の具体例を説明する。具体例では、出現頻度が100以上であれば高頻度とし、100より小さければ低頻度とする。また、高頻度の表記バリエーションに印「○」を付けるものとする。
して入力されると、異表記展開部52は、表記バリエーションを生成し、表記バリエーション毎に出現頻度の情報を含む採否判定用情報を付与して登録確認手段55に送出する。登録確認手段55は、異表記展開部52から表記バリエーションと採否判定用情報を受け取ると、採否判定用情報を読み出す。そして、表記バリエーションを出力部17に表示させる際、採否判定用情報の出現頻度が100以上の表記バリエーションには○印を付けて表示させる。以下にその表示例を示す。また、図12に登録のための一表示例を示す。
○取りあつかう ○とり扱う ○とりあつかう 取り扱かう
とり扱かう ○取扱う 取あつかう 取扱かう
ることで、操作者が日本語辞書53に登録する単語を選択する作業を短縮できる。異表記展開装置52から出力される、表記バリエーションに付与された採否判定用情報を利用することで、より効率的に辞書登録が行えるようになる。
(実施形態4)
本発明の実施形態4は、言語解析装置に関するものである。実施形態4の言語解析装置の構成について説明する。なお、実施形態1から実施形態3のいずれかと同様な構成には同一の符号を付し、その詳細な説明を省略する。
辞書も用いるものである。入力部11を介して入力表現として「危険物を取り扱かう」が解析手段75に入力されたとする。「取り扱かう」という表記は送り仮名が誤っている。この入力表現について、図15に示した、一般的によく利用される見出しのみが登録された日英翻訳用辞書のみを用いて解析手段75が解析・翻訳を行うと、以下のような英文を作成する。
形態素解析結果:(危険物:名詞)(を:助詞)(取り:動詞)(扱:未知語)(かう:動詞)
翻訳結果 : A dangerous object is taken and扱 is bought.
訳結果を見てわかるように、未知語「扱」が残ったままの英文となり、解析に失敗している。この結果が出力部17に表示され、操作者が入力部11を操作して解析のやり直しを指示する旨を入力する。これにより、図16に示した追加日英翻訳辞書も用いて解析手段75が解析・翻訳を行うと、以下のような英文を作成する。
翻訳結果 :A dangerous object is treated.
てわかるように、正しい英文に翻訳を行っており、より正確に翻訳できる。
英翻訳用辞書中の見出しを使う場合には、その見出しに対して利用可能性を示すコスト(点数、重み)を与えるものである。入力部71を介して入力表現として「私がのいちごを食べる」が解析手段75に入力される。解析手段75は、日英翻訳用辞書のみ用いて解析・翻訳を行うと、以下のような英文を作成する。
形態素解析結果:(私:名詞)(が:助詞)(の:助詞)(いちご:名詞)(を:助詞)(食べた:動詞)
翻訳結果:The strawberry which was I was eaten.
ないが、誤った翻訳を行っている。追加日英翻訳用辞書を使う場合を説明する。ここでは、助詞「が」の後ろに助詞「の」が続く可能性は非常に低いというルールが予め形態素解析用プログラムに書き込まれているものとする。そして、解析手段75は、追加日英翻訳用辞書も用いて解析・翻訳を行うと、以下のような英文を作成する。
形態素解析結果:(私:名詞)(が:助詞)(のいちご:名詞)(を:助詞)(食べた:動詞)
翻訳結果:I ate a wild strawberry.
りの語は使われる頻度が少ないため、一般の語と同じコストで利用可能としてしまうと、かえって解析誤りを引き起こし易い。しかし、上記第一の方法および第二の方法で述べたように、利用可能性の低い表記バリエーションについて一般の語よりもコストを高く設定しておくことで、より正しく解析を行うことができる場合がある。なお、この第一の方法や第二の方法は従来の課題3の解決の具体例となる。
12 言語情報記憶部
13 表記展開知識記憶部
14、24、28 表記展開手段
15 採否判定用情報計算用知識記憶部(採否判定記憶部)
16 採否判定用情報計算手段
17 出力部
18 表記読み対応手段
20、22、26、29 制御部
30、32、34 記憶部
52 異表記展開部
53 日本語辞書
54 辞書登録手段
55 登録確認手段
72 解析用辞書
74 追加解析用辞書
75 解析手段
Claims (44)
- 文字列からなる表記についての異なる表記である表記バリエーションを生成するための、コンピュータによる異表記展開方法であって、
制御部が漢字とその読みを含む言語情報、および前記表記から前記表記バリエーションを生成するための基準ルールの情報を記憶部に予め格納するステップと、
前記制御部は、外部から前記表記とその読みが入力されると、前記基準ルールに基づいて該表記の表記バリエーションを生成するステップと、
生成した表記バリエーションを採用するか否かの判定のための情報となる採否判定用情報を該表記バリエーションに付与するステップと、
を有する異表記展開方法。 - 前記制御部は、前記入力される表記に複数の漢字が含まれていると、該表記に含まれる漢字毎にその読みを対応づけるステップを有する請求項1記載の異表記展開方法。
- 前記基準ルールは、
入力される表記中の第二水準の漢字をひらがな化することにより前記表記バリエーションを生成するルール、および、入力される表記中の訓読みの漢字をひらがな化することにより前記表記バリエーションを生成するルールのうち少なくともいずれかを含む請求項1または2記載の異表記展開方法。 - 前記基準ルールは、
入力される表記中に和語動詞を表す漢字が含まれているときに、その連用語尾に相当するひらがなを挿入して前記表記バリエーションを生成するルール、その連用語尾に相当するひらがなを表記から削除して前記表記バリエーションを生成するルール、および、その漢字に対応する読みの最後のひらがなをその漢字の直後に挿入して前記表記バリエーションを生成するルールのうち少なくともいずれかを含む請求項1から3のいずれか1項記載の異表記展開方法。 - 前記基準ルールは、
表記とともに追加情報として品詞の情報が入力されると、前記表記中に自立語があれば該自立語の表記バリエーションを生成し、機能語があれば該機能語の表記バリエーションを生成しない請求項1から4のいずれか1項記載の異表記展開方法。 - 前記制御部は、採用の禁止された表記バリエーションを示す展開禁止語リストを前記記憶部に予め格納するステップと、
前記表記バリエーションが前記展開禁止語リストにあるか否かの情報を前記採否判定用情報に登録するステップと、
を有する請求項1から5のいずれか1項記載の異表記展開方法。 - 前記制御部は、表記バリエーションについての文書中における出現頻度を示す情報を含む前記言語情報を予め格納するステップと、
前記出現頻度を示す情報を前記表記バリエーションの前記採否判定用情報に登録するステップと、
を有する請求項1から5のいずれか1項記載の異表記展開方法。 - 前記制御部が、表記バリエーションの利用可能性をランク付けした情報を含む前記言語情報を予め格納するステップと、
前記ランク付けした情報を前記表記バリエーションの前記採否判定用情報に登録するステップと、
を有する請求項1から5のいずれか1項記載の異表記展開方法。 - 前記表記バリエーションの先頭または末尾が機能語であるとき、
前記制御部が前記表記バリエーションの先頭または末尾が機能語である旨の情報を前記採否判定用情報に登録するステップを有する請求項1から5のいずれか1項記載の異表記展開方法。 - 前記表記バリエーションがひらがなで、かつ該表記バリエーションの文字数が所定の数よりも小さいとき、
前記制御部が前記表記バリエーションの文字数が所定の数よりも小さい旨の情報を前記採否判定用情報に登録するステップを有する請求項1から5のいずれか1項記載の異表記展開方法。 - 前記制御部は、前記表記バリエーションに対して前記採否判定用情報に基づいて採用度を求める請求項1から10のいずれか1項記載の異表記展開方法。
- 文字列からなる表記についての異なる表記である表記バリエーションを辞書に登録するための、コンピュータによる辞書登録方法であって、
制御部は、見出しと該見出しの読みと該見出しの辞書登録情報が入力されると、該見出しおよび該見出しの読みとともに該辞書登録情報を前記記憶部の前記辞書に登録するステップと、
入力された見出しを前記表記として請求項1から請求項11のいずれか1項記載の異表記展開方法により前記表記バリエーションを生成するステップと、
採用対象の表記バリエーションを元の見出しと該見出しの読みと該見出しの辞書登録情報とともに前記辞書に登録するステップと、
を有する辞書登録方法。 - 前記制御部は、生成した表記バリエーションの全てを採用対象とする請求項12記載の辞書登録方法。
- 前記制御部が前記表記バリエーションとともに前記採否判定用情報を出力部に出力させるステップを有する請求項12記載の辞書登録方法。
- 前記制御部は、前記出力部に出力させる表記バリエーションの数および並び順の少なくともいずれかを含む出力フォーマット情報を予め記憶部に格納するステップと、
前記表記バリエーションを前記出力部に出力させるステップで、前記制御部は、前記採用判定用情報を参照して前記出力フォーマット情報にしたがって該表記バリエーションを前記出力部に出力させる請求項14記載の辞書登録方法。 - 前記制御部は、前記表記バリエーションの文書中における出現頻度の情報を該表記バリエーションに付与された前記採否判定用情報に予め格納するステップと、
前記出現頻度が予め決められた基準値よりも大きい表記バリエーションを出力部に出力させるステップと、
を有する請求項12記載の辞書登録方法。 - 前記表記バリエーションを前記出力部に出力させるステップで、前記制御部は、前記出現頻度が予め決められた基準値よりも大きい表記バリエーションに所定の印を付けて該出力部に出力させる請求項16記載の辞書登録方法。
- 前記表記バリエーションを前記出力部に出力させるステップで、前記制御部は、該表記バリエーションが前記辞書に登録された見出しに一致すれば、該表記バリエーションを前記出力部に出力させない請求項14から17のいずれか1項記載の辞書登録方法。
- 前記制御部は、前記出力部に出力された表記バリエーションに対して採用する旨の指示が入力されると、該表記バリエーションを採用対象とする請求項14から17のいずれか1項記載の辞書登録方法。
- 言語による表現について品詞に解析する方法であって、
制御部は、文字列からなる表記、その読みおよび品詞を含む情報が登録された解析用辞書と該表記についての異なる表記である表記バリエーションを見出しとして登録するための追加解析用辞書を予め記憶部に格納するステップと、
前記表記について請求項1から請求項11のいずれか1項記載の異表記展開方法により前記表記バリエーションを生成するステップと、
前記表記バリエーションを前記追加解析用辞書に登録するステップと、
前記表現が入力されると、前記解析用辞書および前記追加解析用辞書の少なくともいずれか一方を用いて該表現を単語に分解して各単語に品詞を付与する形態素解析を行うステップと、
前記形態素解析の結果を出力部に出力させるステップと、
を有する言語解析方法。 - 前記形態素解析を行うステップで、前記制御部は前記解析用辞書を用いて形態素解析を行い、
前記制御部は、前記形態素解析の結果を前記出力部に出力させた後、解析をやり直す旨の指示が入力されると、前記追加解析用辞書を用いて形態素解析を行う請求項20記載の言語解析方法。 - 前記制御部が前記見出しについて利用可能性を示すコストの情報を前記追加解析用辞書に予め登録するステップを有し、
形態素解析を行うステップで、前記制御部は、分解した単語に一致する見出しを前記追加解析用辞書で検索し、該単語に一致する見出しとともに登録されたコストを参照し、該単語をそのまま採用して品詞を付与するか否かを決定する請求項20または21記載の言語解析方法。 - 文字列からなる表記についての異なる表記である表記バリエーションを生成する処理をコンピュータに実行させるプログラムであって、
漢字とその読みを含む言語情報、および前記表記から前記表記バリエーションを生成するための基準ルールの情報を記憶部に予め格納するステップと、
外部から前記表記とその読みが入力されると、前記基準ルールに基づいて該表記の表記バリエーションを生成するステップと、
生成した表記バリエーションを採用するか否かの判定のための情報となる採否判定用情報を該表記バリエーションに付与するステップと、
を有する処理を前記コンピュータに実行させるためのプログラム。 - 前記入力される表記に複数の漢字が含まれていると、該表記に含まれる漢字毎にその読みを対応づけるステップを有する請求項23記載のプログラム。
- 前記基準ルールは、
入力される表記中の第二水準の漢字をひらがな化することにより前記表記バリエーションを生成するルール、および、入力される表記中の訓読みの漢字をひらがな化することにより前記表記バリエーションを生成するルールのうち少なくともいずれかを含む請求項23または24記載のプログラム。 - 前記基準ルールは、
入力される表記中に和語動詞を表す漢字が含まれているときに、その連用語尾に相当するひらがなを挿入して前記表記バリエーションを生成するルール、その連用語尾に相当するひらがなを表記から削除して前記表記バリエーションを生成するルール、および、その漢字に対応する読みの最後のひらがなをその漢字の直後に挿入して前記表記バリエーションを生成するルールのうち少なくともいずれかを含む請求項23から25のいずれか1項記載のプログラム。 - 前記基準ルールは、
表記とともに追加情報として品詞の情報が入力されると、前記表記中に自立語があれば該自立語の表記バリエーションを生成し、機能語があれば該機能語の表記バリエーションを生成しない請求項23から26のいずれか1項記載のプログラム。 - 採用の禁止された表記バリエーションを示す展開禁止語リストを前記記憶部に予め格納するステップと、
前記表記バリエーションが前記展開禁止語リストにあるか否かの情報を前記採否判定用情報に登録するステップと、
を有する請求項23から27のいずれか1項記載のプログラム。 - 表記バリエーションについての文書中における出現頻度を示す情報を含む前記言語情報を予め格納するステップと、
前記出現頻度を示す情報を前記表記バリエーションの前記採否判定用情報に登録するステップと、
を有する請求項23から27のいずれか1項記載のプログラム。 - 表記バリエーションの利用可能性をランク付けした情報を含む前記言語情報を予め格納するステップと、
前記ランク付けした情報を前記表記バリエーションの前記採否判定用情報に登録するステップと、
を有する請求項23から27のいずれか1項記載のプログラム。 - 前記表記バリエーションの先頭または末尾が機能語であるとき、
前記表記バリエーションの先頭または末尾が機能語である旨の情報を前記採否判定用情報に登録するステップを有する請求項23から27のいずれか1項記載のプログラム。 - 前記表記バリエーションがひらがなで、かつ該表記バリエーションの文字数が所定の数よりも小さいとき、
前記表記バリエーションの文字数が所定の数よりも小さい旨の情報を前記採否判定用情報に登録するステップを有する請求項23から27のいずれか1項記載のプログラム。 - 前記表記バリエーションに対して前記採否判定用情報に基づいて採用度を求める請求項23から32のいずれか1項記載のプログラム。
- 文字列からなる表記についての異なる表記である表記バリエーションを辞書に登録する処理をコンピュータに実行させるためのプログラムであって、
見出しと該見出しの読みと該見出しの辞書登録情報が入力されると、該見出しおよび該見出しの読みとともに該辞書登録情報を前記記憶部の前記辞書に登録するステップと、
入力された見出しを前記表記として請求項23から請求項33のいずれか1項記載のプログラムにより前記表記バリエーションを生成するステップと、
採用対象の表記バリエーションを元の見出しと該見出しの読みと該見出しの辞書登録情報とともに前記辞書に登録するステップと、
を有する処理を前記コンピュータに実行させるためのプログラム。 - 生成した表記バリエーションの全てを採用対象とする請求項34記載のプログラム。
- 前記表記バリエーションとともに前記採否判定用情報を出力部に出力させるステップを有する請求項34記載のプログラム。
- 前記出力部に出力させる表記バリエーションの数および並び順の少なくともいずれかを含む出力フォーマット情報を予め記憶部に格納するステップと、
前記表記バリエーションを前記出力部に出力させるステップで、前記採用判定用情報を参照して前記出力フォーマット情報にしたがって該表記バリエーションを該出力部に出力させる請求項36記載のプログラム。 - 前記表記バリエーションの文書中における出現頻度の情報を該表記バリエーションに付与された前記採否判定用情報に予め格納するステップと、
前記出現頻度が予め決められた基準値よりも大きい表記バリエーションを出力部に出力させるステップと、
を有する請求項34記載のプログラム。 - 前記表記バリエーションを前記出力部に出力させるステップで、前記出現頻度が予め決められた基準値よりも大きい表記バリエーションに所定の印を付けて前記出力部に出力させる請求項38記載のプログラム。
- 前記表記バリエーションを前記出力部に出力させるステップで、該表記バリエーションが前記辞書に登録された見出しに一致すれば、該表記バリエーションを前記出力部に出力させない請求項36から39のいずれか1項記載のプログラム。
- 前記出力部に出力された表記バリエーションに対して採用する旨の指示が入力されると、該表記バリエーションを採用対象とする請求項36から39のいずれか1項記載のプログラム。
- 言語による表現について品詞に解析する処理をコンピュータに実行させるためのプログラムであって、
文字列からなる表記、その読みおよび品詞を含む情報が登録された解析用辞書と該表記についての異なる表記である表記バリエーションを見出しとして登録するための追加解析用辞書を予め記憶部に格納するステップと、
前記表記について請求項23から請求項33のいずれか1項記載のプログラムにより前記表記バリエーションを生成するステップと、
前記表記バリエーションを前記追加解析用辞書に登録するステップと、
前記表現が入力されると、前記解析用辞書および前記追加解析用辞書の少なくともいずれか一方を用いて該表現を単語に分解して各単語に品詞を付与する形態素解析を行うステップと、
前記形態素解析の結果を出力部に出力させるステップと、
を有する処理を前記コンピュータに実行させるためのプログラム。 - 前記形態素解析を行うステップで、前記解析用辞書を用いて形態素解析を行い、
前記形態素解析の結果を出力部に出力させた後、解析をやり直す旨の指示が入力されると、前記追加解析用辞書を用いて形態素解析を行う請求項42記載のプログラム。 - 前記見出しについて利用可能性を示すコストの情報を前記追加解析用辞書に予め登録するステップを有し、
形態素解析を行うステップで、分解した単語に一致する見出しを前記追加解析用辞書で検索し、該単語に一致する見出しとともに登録されたコストを参照し、該単語をそのまま採用して品詞を付与するか否かを決定する請求項42または43記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005036243A JP4760043B2 (ja) | 2005-02-14 | 2005-02-14 | 言語解析方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005036243A JP4760043B2 (ja) | 2005-02-14 | 2005-02-14 | 言語解析方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006221532A true JP2006221532A (ja) | 2006-08-24 |
JP4760043B2 JP4760043B2 (ja) | 2011-08-31 |
Family
ID=36983817
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005036243A Active JP4760043B2 (ja) | 2005-02-14 | 2005-02-14 | 言語解析方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4760043B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008134842A (ja) * | 2006-11-28 | 2008-06-12 | Yahoo Japan Corp | 品詞バリエーション生成装置 |
JP2008299675A (ja) * | 2007-05-31 | 2008-12-11 | Yahoo Japan Corp | かな混在表記抽出装置、方法及びプログラム |
JP2009258293A (ja) * | 2008-04-15 | 2009-11-05 | Mitsubishi Electric Corp | 音声認識語彙辞書作成装置 |
JP2011186976A (ja) * | 2010-03-11 | 2011-09-22 | Dainippon Printing Co Ltd | 表記ゆれ解析装置、表記ゆれ解析方法、プログラムおよび記憶媒体 |
JP2014106607A (ja) * | 2012-11-26 | 2014-06-09 | Nippon Telegr & Teleph Corp <Ntt> | 読み仮名誤り検出装置、方法並びにプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04119469A (ja) * | 1990-09-10 | 1992-04-20 | Nec Corp | 辞書作成支援装置 |
JPH0773197A (ja) * | 1993-09-03 | 1995-03-17 | Fujitsu Ltd | 異表記語辞書作成支援装置 |
JPH0844723A (ja) * | 1994-07-27 | 1996-02-16 | Toshiba Corp | 文書作成装置または文書作成方法 |
-
2005
- 2005-02-14 JP JP2005036243A patent/JP4760043B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04119469A (ja) * | 1990-09-10 | 1992-04-20 | Nec Corp | 辞書作成支援装置 |
JPH0773197A (ja) * | 1993-09-03 | 1995-03-17 | Fujitsu Ltd | 異表記語辞書作成支援装置 |
JPH0844723A (ja) * | 1994-07-27 | 1996-02-16 | Toshiba Corp | 文書作成装置または文書作成方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008134842A (ja) * | 2006-11-28 | 2008-06-12 | Yahoo Japan Corp | 品詞バリエーション生成装置 |
JP2008299675A (ja) * | 2007-05-31 | 2008-12-11 | Yahoo Japan Corp | かな混在表記抽出装置、方法及びプログラム |
JP2009258293A (ja) * | 2008-04-15 | 2009-11-05 | Mitsubishi Electric Corp | 音声認識語彙辞書作成装置 |
JP2011186976A (ja) * | 2010-03-11 | 2011-09-22 | Dainippon Printing Co Ltd | 表記ゆれ解析装置、表記ゆれ解析方法、プログラムおよび記憶媒体 |
JP2014106607A (ja) * | 2012-11-26 | 2014-06-09 | Nippon Telegr & Teleph Corp <Ntt> | 読み仮名誤り検出装置、方法並びにプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4760043B2 (ja) | 2011-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5895446A (en) | Pattern-based translation method and system | |
KR102256240B1 (ko) | 논팩토이드형 질의 응답 시스템 및 방법 | |
US8005662B2 (en) | Translation method, translation output method and storage medium, program, and computer used therewith | |
JP5356197B2 (ja) | 単語意味関係抽出装置 | |
US20180011830A1 (en) | Annotation Assisting Apparatus and Computer Program Therefor | |
US20060247914A1 (en) | System and method for automatic enrichment of documents | |
JP2008539476A (ja) | スペル提示の生成方法およびシステム | |
KR20060043682A (ko) | 개선된 맞춤법 검사를 위한 시스템 및 방법 | |
JPH11110416A (ja) | データベースからドキュメントを検索するための方法および装置 | |
JP2001101185A (ja) | 辞書の自動切り換えが可能な機械翻訳方法および装置並びにそのような機械翻訳方法を実行するためのプログラムを記憶したプログラム記憶媒体 | |
JP4760043B2 (ja) | 言語解析方法およびプログラム | |
Gagné et al. | Pseudo-morphemic structure inhibits, but morphemic structure facilitates, processing of a repeated free morpheme | |
Ganfure et al. | Design and implementation of morphology based spell checker | |
US20210064820A1 (en) | Machine learning lexical discovery | |
JP3638145B2 (ja) | 穴埋め問題作成装置、穴埋め問題作成用のコンピュータプログラム及びそのプログラムを記録した記録媒体 | |
JP2007164635A (ja) | 同義語彙獲得方法及び装置及びプログラム | |
US20210073466A1 (en) | Semantic vector rule discovery | |
US8977538B2 (en) | Constructing and analyzing a word graph | |
JP2005174003A (ja) | 要約生成方法およびプログラム | |
Miłkowski et al. | Using SRX standard for sentence segmentation | |
Colton | Text classification using Python | |
JP4938298B2 (ja) | テキストの要約に含める文の候補を出力する方法およびプログラム | |
Vayadande et al. | Spell Checker Model for String Comparison in Automata | |
JP2007316834A (ja) | 日本語文章修正装置、日本語文章修正方法および日本語文章修正のためのプログラム | |
Alshahrani | An Investigation into the Cross-Linguistic Robustness of Textual Equivalence Techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100721 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100921 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101124 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110221 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20110301 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110523 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140617 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4760043 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |