JP2006155528A - 辞書登録装置、辞書登録方法および辞書登録プログラム - Google Patents
辞書登録装置、辞書登録方法および辞書登録プログラム Download PDFInfo
- Publication number
- JP2006155528A JP2006155528A JP2004349049A JP2004349049A JP2006155528A JP 2006155528 A JP2006155528 A JP 2006155528A JP 2004349049 A JP2004349049 A JP 2004349049A JP 2004349049 A JP2004349049 A JP 2004349049A JP 2006155528 A JP2006155528 A JP 2006155528A
- Authority
- JP
- Japan
- Prior art keywords
- word
- notation
- unknown word
- unknown
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】単語を保持する辞書121を記憶する辞書記憶手段と、入力文書を形態素解析し未知語を抽出する形態素解析部102と、前記未知語の前方と後方の少なくとも一方の単語を結合した拡張未知語を生成する未知語範囲拡張部103と、前記未知語を拡張した部分の表記が一致する単語であって前記辞書に登録されている既登録単語を検索する部分一致検索部104と、前記既登録単語のうち前記未知語に相当する部分の表記の文字属性と前記未知語の表記の文字属性とに基づき、表記の類似性を判定する表記類似性判定部105と、前記表記類似性判定部105が前記既登録単語のうち前記未知語に相当する部分の表記と前記未知語の表記とが類似すると判定した場合に、前記拡張未知語を前記辞書に登録する辞書登録部106とを備えた。
【選択図】 図1
Description
第1の実施の形態にかかる辞書登録装置は、ユーザが指定した文書から形態素解析により未知語を抽出し、抽出した未知語の範囲を拡張し、拡張した未知語のうち未知語を拡張した部分が一致する単語であって、未知語に相当する部分の文字種が未知語の文字種と同一である単語が辞書に存在する場合は、当該拡張した未知語を抽出した未知語と同時に辞書に登録するものである。
第2の実施の形態にかかる辞書登録装置は、拡張未知語と類似する単語との類似度を予め定められた類似度判定規則に従い算出し、算出した値が予め定められた値より大きい場合は、当該拡張未知語を、抽出した未知語と同時に辞書に登録するものである。
101 入出力制御部
102 形態素解析部
103 未知語範囲拡張部
104 部分一致検索部
105 表記類似性判定部
106 辞書登録部
110 ユーザI/F
120 解析ルール
121 辞書
130 RAM
131 単語列バッファ
132 未知語バッファ
601 参照ボタン
602 削除ボタン
603 次へボタン
604 キャンセルボタン
605 ファイル参照画面
701 チェックボックス
702 全て選択ボタン
703 全て解除ボタン
704 修正ボタン
705 戻るボタン
706 次へボタン
707 キャンセルボタン
801 類似度判定規則表
Claims (9)
- 単語を保持する辞書を記憶する辞書記憶手段と、
入力文書を形態素解析し、前記入力文書の中から前記辞書に登録されていない未知語を抽出する形態素解析手段と、
前記形態素解析手段が抽出した前記未知語の前方と後方の少なくとも一方の単語を前記未知語に結合した拡張未知語を生成する未知語範囲拡張手段と、
前記未知語範囲拡張手段が生成した前記拡張未知語のうち、前記未知語を拡張した部分の表記が一致する単語であって前記辞書に登録されている既登録単語を前記辞書から検索する部分一致検索手段と、
前記部分一致検索手段が検索した前記既登録単語のうち前記未知語に相当する部分の表記の文字属性と前記未知語の表記の文字属性とに基づき、前記部分一致検索手段が検索した前記既登録単語のうち前記未知語に相当する部分の表記と前記未知語の表記との類似性を判定する表記類似性判定手段と、
前記表記類似性判定手段が前記既登録単語のうち前記未知語に相当する部分の表記と前記未知語の表記とが類似すると判定した場合に、前記拡張未知語を前記辞書に登録する辞書登録手段と、
を備えたことを特徴とする辞書登録装置。 - 前記表記類似性判定手段は、前記既登録単語のうち前記未知語に相当する部分の表記の文字種と、前記未知語の表記の文字種とが同一である場合に、前記既登録単語のうち前記未知語に相当する部分の表記と前記未知語の表記とが類似すると判定することを特徴とする請求項1に記載の辞書登録装置。
- 比較元文字の文字種と比較先文字の文字種ごとの文字類似度を保持する類似度判定規則表を記憶する類似度判定規則記憶手段をさらに備え、
前記表記類似性判定手段は、前記類似度判定規則表に基づいて算出した前記既登録単語のうち前記未知語に相当する部分の表記の文字種と前記未知語の表記の文字種との類似度の値が予め定められた値より大きい場合に、前記既登録単語のうち前記未知語に相当する部分の表記と前記未知語の表記とが類似すると判定することを特徴とする請求項1に記載の辞書登録装置。 - 入力文書を形態素解析し、単語を保持する辞書を記憶する辞書記憶手段に記憶されている前記辞書に登録されていない未知語を、前記入力文書の中から抽出する形態素解析ステップと、
前記形態素解析ステップが抽出した前記未知語の前方と後方の少なくとも一方の単語を前記未知語に結合した拡張未知語を生成する未知語範囲拡張ステップと、
前記未知語範囲拡張ステップが生成した前記拡張未知語のうち、前記未知語を拡張した部分の表記が一致する単語であって前記辞書に登録されている既登録単語を前記辞書から検索する部分一致検索ステップと、
前記部分一致検索ステップが検索した前記既登録単語のうち前記未知語に相当する部分の表記の文字属性と前記未知語の表記の文字属性とに基づき、前記部分一致検索ステップが検索した前記既登録単語のうち前記未知語に相当する部分の表記と前記未知語の表記との類似性を判定する表記類似性判定ステップと、
前記表記類似性判定ステップが前記既登録単語のうち前記未知語に相当する部分の表記と前記未知語の表記とが類似すると判定した場合に、前記拡張未知語を前記辞書に登録する辞書登録ステップと、
を備えたことを特徴とする辞書登録方法。 - 前記表記類似性判定ステップは、前記既登録単語のうち前記未知語に相当する部分の表記の文字種と、前記未知語の表記の文字種とが同一である場合に、前記既登録単語のうち前記未知語に相当する部分の表記と前記未知語の表記とが類似すると判定することを特徴とする請求項4に記載の辞書登録方法。
- 前記表記類似性判定ステップは、記憶手段に記憶された比較元文字の文字種と比較先文字の文字種ごとの文字類似度を保持する類似度判定規則表に基づいて算出した前記既登録単語のうち前記未知語に相当する部分の表記の文字種と前記未知語の表記の文字種との類似度の値が予め定められた値より大きい場合に、前記既登録単語のうち前記未知語に相当する部分の表記と前記未知語の表記とが類似すると判定することを特徴とする請求項4に記載の辞書登録方法。
- 入力文書を形態素解析し、単語を保持する辞書を記憶する辞書記憶手段に記憶されている前記辞書に登録されていない未知語を、前記入力文書の中から抽出する形態素解析手順と、
前記形態素解析手順が抽出した前記未知語の前方と後方の少なくとも一方の単語を前記未知語に結合した拡張未知語を生成する未知語範囲拡張手順と、
前記未知語範囲拡張手順が生成した前記拡張未知語のうち、前記未知語を拡張した部分の表記が一致する単語であって前記辞書に登録されている既登録単語を前記辞書から検索する部分一致検索手順と、
前記部分一致検索手順が検索した前記既登録単語のうち前記未知語に相当する部分の表記の文字属性と前記未知語の表記の文字属性とに基づき、前記部分一致検索手順が検索した前記既登録単語のうち前記未知語に相当する部分の表記と前記未知語の表記との類似性を判定する表記類似性判定手順と、
前記表記類似性判定手順が前記既登録単語のうち前記未知語に相当する部分の表記と前記未知語の表記とが類似すると判定した場合に、前記拡張未知語を前記辞書に登録する辞書登録手順と、
をコンピュータに実行させる辞書登録プログラム。 - 前記表記類似性判定手順は、前記既登録単語のうち前記未知語に相当する部分の表記の文字種と、前記未知語の表記の文字種とが同一である場合に、前記既登録単語のうち前記未知語に相当する部分の表記と前記未知語の表記とが類似すると判定することを特徴とする請求項7に記載の辞書登録プログラム。
- 前記表記類似性判定手順は、記憶手段に記憶された比較元文字の文字種と比較先文字の文字種ごとの文字類似度を保持する類似度判定規則表に基づいて算出した前記既登録単語のうち前記未知語に相当する部分の表記の文字種と前記未知語の表記の文字種との類似度の値が予め定められた値より大きい場合に、前記既登録単語のうち前記未知語に相当する部分の表記と前記未知語の表記とが類似すると判定することを特徴とする請求項7に記載の辞書登録プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004349049A JP4304146B2 (ja) | 2004-12-01 | 2004-12-01 | 辞書登録装置、辞書登録方法および辞書登録プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004349049A JP4304146B2 (ja) | 2004-12-01 | 2004-12-01 | 辞書登録装置、辞書登録方法および辞書登録プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006155528A true JP2006155528A (ja) | 2006-06-15 |
JP4304146B2 JP4304146B2 (ja) | 2009-07-29 |
Family
ID=36633704
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004349049A Active JP4304146B2 (ja) | 2004-12-01 | 2004-12-01 | 辞書登録装置、辞書登録方法および辞書登録プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4304146B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009122807A (ja) * | 2007-11-13 | 2009-06-04 | Nomura Securities Co Ltd | 連想検索システム |
US10755594B2 (en) | 2015-11-20 | 2020-08-25 | Chrysus Intellectual Properties Limited | Method and system for analyzing a piece of text |
US11157142B2 (en) | 2017-10-27 | 2021-10-26 | FUJIFLIM Business Innovation Corp. | Document processing apparatus and non-transitory computer readable medium |
-
2004
- 2004-12-01 JP JP2004349049A patent/JP4304146B2/ja active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009122807A (ja) * | 2007-11-13 | 2009-06-04 | Nomura Securities Co Ltd | 連想検索システム |
US10755594B2 (en) | 2015-11-20 | 2020-08-25 | Chrysus Intellectual Properties Limited | Method and system for analyzing a piece of text |
US11157142B2 (en) | 2017-10-27 | 2021-10-26 | FUJIFLIM Business Innovation Corp. | Document processing apparatus and non-transitory computer readable medium |
Also Published As
Publication number | Publication date |
---|---|
JP4304146B2 (ja) | 2009-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4058057B2 (ja) | 日中機械翻訳装置、日中機械翻訳方法および日中機械翻訳プログラム | |
JP4058071B2 (ja) | 用例翻訳装置、用例翻訳方法および用例翻訳プログラム | |
JP5235344B2 (ja) | 機械翻訳を行う装置、方法およびプログラム | |
JP2007226729A (ja) | 訳語情報出力処理プログラム,処理方法および処理装置 | |
JP4502615B2 (ja) | 類似文検索装置、類似文検索方法、およびプログラム | |
US7684975B2 (en) | Morphological analyzer, natural language processor, morphological analysis method and program | |
JP2006072744A (ja) | 文書処理装置、その制御方法、プログラム、及び記憶媒体 | |
JP4587165B2 (ja) | 情報処理装置及びその制御方法 | |
JP5342760B2 (ja) | 訳語学習のためのデータを作成する装置、方法、およびプログラム | |
JP2009059159A (ja) | 情報処理装置と情報処理方法とプログラム | |
JP4304146B2 (ja) | 辞書登録装置、辞書登録方法および辞書登録プログラム | |
JP5482236B2 (ja) | プログラムおよび情報処理装置 | |
JP4416644B2 (ja) | 予測機能付き文字処理装置、方法、記録媒体およびプログラム | |
JP5379416B2 (ja) | 言語処理装置および言語処理方法 | |
JP2019008477A (ja) | 判別プログラム、判別装置及び判別方法 | |
JP2006004050A (ja) | 画像処理装置、画像読み取り装置およびプログラム | |
JP4021813B2 (ja) | 複合語登録プログラムおよび登録装置 | |
JP3999771B2 (ja) | 翻訳支援プログラム、翻訳支援装置、翻訳支援方法 | |
JP5742454B2 (ja) | 入力支援プログラム、入力支援装置、及び入力支援方法 | |
JP5344649B2 (ja) | 文字列変換装置、文字列変換方法、プログラムおよび記録媒体 | |
JP2006155529A (ja) | 辞書登録装置、辞書登録方法および辞書登録プログラム | |
JP2008084132A (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JP2003178263A (ja) | 文字認識装置及び記録媒体 | |
JPH11345229A (ja) | 文字処理装置及び文字処理プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2007042144A (ja) | 文書処理装置、文書処理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081224 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090407 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090427 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120501 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4304146 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120501 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120501 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130501 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130501 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140501 Year of fee payment: 5 |