JP4155970B2 - 情報処理装置、同義語データベース生成方法、同義語データベース生成プログラム - Google Patents
情報処理装置、同義語データベース生成方法、同義語データベース生成プログラム Download PDFInfo
- Publication number
- JP4155970B2 JP4155970B2 JP2004358533A JP2004358533A JP4155970B2 JP 4155970 B2 JP4155970 B2 JP 4155970B2 JP 2004358533 A JP2004358533 A JP 2004358533A JP 2004358533 A JP2004358533 A JP 2004358533A JP 4155970 B2 JP4155970 B2 JP 4155970B2
- Authority
- JP
- Japan
- Prior art keywords
- synonym
- character string
- pair
- database
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
11 ネットワーク
12 キーボード
13 通信I/O
14 ディスプレイ
15 プリンター
16 メモリ
17 CPU
18 ハードディスク
51 形態素解析処理部
52 文字列抽出処理部
53 同義語対判定処理部
54 同義語対追加処理部
55 同義語集合生成処理部
56 同義語集合判定処理部
57 同義語集合合成処理部
58 同義語集合追加処理部
59 不要同義語候補削除処理部
71 同義語候補データベース
72 同義語データベース
Claims (4)
- 順序のある文字列対が格納される同義語候補データベースと、
第一記号と第二記号とからなる所定の記号対を含む文に対し形態素解析を施す形態素解析手段と、
形態素解析結果を用いて、前記第一記号の直前の所定の連続する形態素列を第一文字列とし、記号対内の所定の連続する形態素列を第二文字列として、順序のある文字列対を抽出する文字列対抽出手段と、
抽出した文字列対と前記同義語候補データベースに格納された文字列対である同義語候補文字列対が、抽出した前記第一文字列と同義語候補対の前記第二文字列が等しく、かつ抽出した前記第二文字列を同義語候補対の前記第一文字列が等しい場合を真とする条件を満たすか否かを判定する同義語対判定手段と、
同義語対判定手段で前記条件を満たすと判定された場合、前記第一文字列と、前記第二文字列と、前記同義語候補対とに含まれる各文字列から、互いに異なる文字列を要素とする同義語集合を生成するとともに、前記同義語候補文字列対を同義語候補データベースから削除する同義語集合生成手段と、
を有することを特徴とする情報処理装置。 - 前記同義語対判定手段で前記条件を満たさないと判定された場合、
前記文字列対抽出手段で抽出された文字列対を新たな同義語候補として、前記同義語候補データベースに追加する同義語候補追加手段を有することを特徴とする請求項1に記載の情報処理装置。 - 前記文字列対抽出手段にて抽出される各文字列は、名詞、記号、助詞のいずれかの品詞をもつ連続する形態素で構成されることを特徴とする請求項1または2に記載の情報処理装置。
- 前記同義語集合生成手段で生成された同義語集合と前記同義語データベースの同義語集合の積集合が空集合でない場合を真と判定する同義語集合判定手段を有し、
前記同義語集合判定手段が真と判定した場合、前記生成された同義語集合を、前記同義語データベースの同義語集合に追加する同義語集合追加手段を有することを特徴とする請求項1から3のいずれか1項に記載の情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004358533A JP4155970B2 (ja) | 2004-12-10 | 2004-12-10 | 情報処理装置、同義語データベース生成方法、同義語データベース生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004358533A JP4155970B2 (ja) | 2004-12-10 | 2004-12-10 | 情報処理装置、同義語データベース生成方法、同義語データベース生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006164170A JP2006164170A (ja) | 2006-06-22 |
JP4155970B2 true JP4155970B2 (ja) | 2008-09-24 |
Family
ID=36666089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004358533A Expired - Fee Related JP4155970B2 (ja) | 2004-12-10 | 2004-12-10 | 情報処理装置、同義語データベース生成方法、同義語データベース生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4155970B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006190044A (ja) * | 2005-01-05 | 2006-07-20 | Ricoh Co Ltd | 関連文字列生成装置、プログラム、及び記憶媒体 |
JP5145288B2 (ja) * | 2009-05-14 | 2013-02-13 | 株式会社エヌ・ティ・ティ・データ | 類義語辞書構築装置及び方法、コンピュータプログラム |
JP2011103038A (ja) * | 2009-11-10 | 2011-05-26 | Nomura Research Institute Ltd | 用語間の対応関係抽出システム及び対応関係抽出プログラム |
JP2013114633A (ja) * | 2011-11-30 | 2013-06-10 | Toshiba Corp | 自然言語処理装置、自然言語処理方法及び自然言語処理プログラム |
-
2004
- 2004-12-10 JP JP2004358533A patent/JP4155970B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006164170A (ja) | 2006-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1367501B1 (en) | Lexicon with sectionalized data and method of using the same | |
CA2484410C (en) | System for identifying paraphrases using machine translation techniques | |
US20070011132A1 (en) | Named entity translation | |
US20100332217A1 (en) | Method for text improvement via linguistic abstractions | |
JP2007257644A (ja) | 訳語候補文字列予測に基づく訳語取得のためのプログラム、方法および装置 | |
JP2006252382A (ja) | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム | |
JP2005276183A (ja) | グラフベースの順位付けを使用してテキスト内の単語および概念に順位付けする方法およびシステム | |
JP2007122509A (ja) | 語句配列の自然度判定装置、方法及びプログラム | |
Saloot et al. | An architecture for Malay Tweet normalization | |
Krizhanovsky et al. | An approach to automated construction of a general-purpose lexical ontology based on Wiktionary | |
Taghi-Zadeh et al. | A new hybrid stemming method for Persian language | |
JP2007207127A (ja) | 質問応答システム、質問応答処理方法及び質問応答プログラム | |
JP4155970B2 (ja) | 情報処理装置、同義語データベース生成方法、同義語データベース生成プログラム | |
Roy et al. | An unsupervised normalization algorithm for noisy text: a case study for information retrieval and stance detection | |
JP4845523B2 (ja) | 文字処理装置、方法、プログラムおよび記録媒体 | |
JP6106489B2 (ja) | 語義解析装置、及びプログラム | |
JP7122773B2 (ja) | 辞書構築装置、辞書の生産方法、およびプログラム | |
JP2007200252A (ja) | 省略語生成・妥当性評価方法、同義語データベース生成・更新方法、省略語生成・妥当性評価装置、同義語データベース生成・更新装置、プログラム、記録媒体 | |
JP2009086979A (ja) | 組織名抽出装置、方法及びプログラム | |
JP2006139708A (ja) | テキストデータ類似度算出方法、テキストデータ類似度算出装置及びテキストデータ類似度算出プログラム | |
JP4933741B2 (ja) | 情報処理装置、同義語対生成方法、同義語対生成プログラム、同義語対生成プログラムを記録した記録媒体 | |
JP2005202924A (ja) | 対訳判断装置、方法及びプログラム | |
JP4934115B2 (ja) | キーワード抽出装置、方法及びプログラム | |
Melero et al. | Selection of correction candidates for the normalization of Spanish user-generated content | |
Park et al. | Affix modification-based bilingual pivoting method for paraphrase extraction in agglutinative languages |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071211 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080212 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080226 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080327 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20080509 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080610 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080708 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110718 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120718 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120718 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130718 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |