JP2008250388A - 情報検索装置、情報検索方法及び情報検索プログラム - Google Patents
情報検索装置、情報検索方法及び情報検索プログラム Download PDFInfo
- Publication number
- JP2008250388A JP2008250388A JP2007087389A JP2007087389A JP2008250388A JP 2008250388 A JP2008250388 A JP 2008250388A JP 2007087389 A JP2007087389 A JP 2007087389A JP 2007087389 A JP2007087389 A JP 2007087389A JP 2008250388 A JP2008250388 A JP 2008250388A
- Authority
- JP
- Japan
- Prior art keywords
- syntax tree
- sentence
- replacement
- partial
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】入力文の入力を受け付ける入力部と、検索対象文と当該検索対象文における自立語を木構造のノードとした自立語間の係り受け構造を保持する構文木とを対応付けて記憶する検索対象文記憶部と、入力文から構文木を生成する構文解析部と、複数の自立語間の係り受け構造を示す対象パタンと、対象パタンよりノード数が少ない置換パタンと、対象パタンを置換パタンに置換する置換条件と、を対応付けて記憶する置換ルール記憶部と、検索対象文の部分構文木が置換条件に一致するか否か判断する判断部と、一致すると判断した場合に、当該置換条件に対応付けられた対象パタンと一致する検索対象文の部分構文木を、置換パタンで置き換える置換部と、入力文の構文木と、置換後の検索対象文の構文木との類似度を判定する類似度判定部と、判定結果と共に置換前の検索対象文を表示する表示処理部と、を備える。
【選択図】 図1
Description
図1に示すように、情報検索装置100は、検索対象文記憶部101と、置換ルール記憶部102と、置換順序記憶部103と、置換履歴格納部104と、入力部105と、構文解析部106と、文節特定部111と、判断部107と、置換部108と、類似度判定部109と、表示処理部110と、検索要求文一致文節記憶部112とを備える。
101 検索対象文記憶部
102 置換ルール記憶部
103 置換順序記憶部
104 置換履歴格納部
105 入力部
106 構文解析部
107 判断部
108 置換部
109 類似度判定部
110 表示処理部
111 文節特定部
112 検索要求文一致文節記憶部
1601 CPU
1602 ROM
1603 RAM
1604 通信I/F
1605 表示部
1606 外部記憶装置
1607 入力デバイス
1608 バス
Claims (8)
- 入力文の入力を受け付ける入力手段と、
前記入力文による検索の対象となる検索対象文と、当該検索対象文における、文節毎の自立語と、前記自立語を木構造のノードとした自立語間の係り受け構造を保持する構文木と、を対応付けて記憶する文記憶手段と、
前記入力文を構文解析して、当該入力文の自立語間の係り受け構造を保持する構文木を生成する構文木生成手段と、
複数の自立語間の係り受け構造を示す第1の部分構文木パタンと、前記第1の部分構文木の言い換えとなる自立語間の係り受け構造を示す部分構文木パタンであって前記第1の部分構文木より前記ノードの数が少ない第2の部分構文木パタンと、前記第1の部分構文木パタンを前記第2の構文木パタンに置換する置換条件と、を対応付けて記憶する構文木パタン記憶手段と、
前記文記憶手段に記憶されている前記検索対象文に含まれる部分構文木が、前記構文木パタン記憶手段が記憶する前記置換条件に一致するか否か判断する判断手段と、
前記置換条件に一致すると判断した場合に、当該置換条件に対応付けられた前記第1の部分構文木パタンと一致する前記検索対象文に含まれている前記部分構文木を、当該置換条件と対応付けられた前記第2の部分構文木パタンで置き換える置換手段と、
前記構文木生成手段により生成された前記入力文の前記構文木と、前記置換手段により置き換えられた前記検索対象文の構文木との類似度を判定する類似度判定手段と、
判定された前記類似度が所定の条件を満たす場合、前記置換手段により置換される前の前記検索対象文を、検索結果として出力する出力手段と、
を備えることを特徴とする情報検索装置。 - 前記構文木パタン記憶手段は、文の区切りとなる所定のまとまり毎に、前記第1の部分構文木パタンと、前記第2の部分構文木パタンと、前記置換条件と、を対応付けて記憶し、
前記判断手段は、前記所定のまとまり毎に、前記文記憶手段に記憶されている前記検索対象文に含まれる部分構文木が、前記構文木パタン記憶手段が記憶する前記置換条件に一致するか否か判断すること、
を特徴とする請求項1に記載の情報検索装置。 - 前記所定のまとまり毎に前記判断手段により判断を行う順序を記憶する順序記憶手段と、をさらに備え、
前記判断手段は、前記順序記憶手段に記憶された順序で前記所定のまとまり毎に、前記文記憶手段に記憶されている前記検索対象文に含まれる部分構文木が、前記構文木パタン記憶手段が記憶する前記置換条件に一致するか否か判断すること、
を特徴とする請求項2に記載の情報検索装置。 - 前記構文木パタン記憶手段は、前記所定のまとまり毎に、前記置換条件について複雑な係り受け構造を満たした場合に一致すると判断される複雑条件から、単純な係り受け構造を満たした場合に一致すると判断される単純条件まで複数個記憶し、
前記判断手段は、さらに、前記置換条件について前記複雑条件から前記単純条件の順に一致するか否か判断すること、
を特徴とする請求項1乃至3のいずれか一つに記載の情報検索装置。 - 前記出力手段は、さらに、前記置換手段により前記所定のまとまり毎に、前記置換手段により前記構文木を置き換えられた前記検索対象文を出力すること、
を特徴とする請求項1乃至4のいずれか一つに記載の情報検索装置。 - 前記構文木パタン記憶手段は、前記置換条件として、前記第1の部分構文木パタンと構造が一致する前記検索対象文の前記部分構文木に含まれるノードにおいて前記入力文が有する前記自立語を含むノードの位置の条件、及び前記部分構文木のノード間の接続関係の条件のうちいずれか一つ以上設定されていること、
を特徴とする請求項1乃至5のいずれか一つに記載の情報検索装置。 - 入力文の入力を受け付ける入力ステップと、
前記入力文による検索の対象となる検索対象文と、当該検索対象文における、文節毎の自立語と、前記自立語を木構造のノードとした自立語間の係り受け構造を保持する構文木と、を対応付けて記憶部に記憶する文記憶ステップと、
前記入力文を構文解析して、当該入力文の自立語間の係り受け構造を保持する構文木を生成する構文木生成ステップと、
前記記憶手段に記憶されている前記検索対象文に含まれる部分構文木が、前記第1の部分構文木パタンを前記第2の構文木パタンに置換する置換条件に一致するか否か判断する判断ステップと、
前記置換条件に一致すると判断した場合に、複数の自立語間の係り受け構造を示す部分構文木であって前記置換条件と対応付けられている第1の部分構文木パタンと一致する、前記検索対象文に含まれている前記部分構文木を、当該第1の部分構文木パタンと対応付けられていると共に前記第1の部分構文木の言い換えとなる自立語間の係り受け構造を示す部分構文木パタンであって前記第1の部分構文木より前記ノードの数が少ない第2の部分構文木パタンで置き換える置換ステップと、
前記構文木生成ステップにより生成された前記入力文の前記構文木と、前記置換ステップにより置き換えられた前記検索対象文の構文木との類似度を判定する類似度判定ステップと、
判定された前記類似度が所定の基準値以上の場合、前記置換ステップにより置換される前の前記検索対象文を、検索結果として出力する出力ステップと、
を有することを特徴とする情報検索方法。 - 入力文の入力を受け付ける入力ステップと、
前記入力文による検索の対象となる検索対象文と、当該検索対象文における、文節毎の自立語と、前記自立語を木構造のノードとした自立語間の係り受け構造を保持する構文木と、を対応付けて記憶部に記憶する文記憶ステップと、
前記入力文を構文解析して、当該入力文の自立語間の係り受け構造を保持する構文木を生成する構文木生成ステップと、
前記記憶手段に記憶されている前記検索対象文に含まれる部分構文木が、前記第1の部分構文木パタンを前記第2の構文木パタンに置換する置換条件に一致するか否か判断する判断ステップと、
前記置換条件に一致すると判断した場合に、複数の自立語間の係り受け構造を示す部分構文木であって前記置換条件と対応付けられている第1の部分構文木パタンと一致する、前記検索対象文に含まれている前記部分構文木を、当該第1の部分構文木パタンと対応付けられていると共に前記第1の部分構文木の言い換えとなる自立語間の係り受け構造を示す部分構文木パタンであって前記第1の部分構文木より前記ノードの数が少ない第2の部分構文木パタンで置き換える置換ステップと、
前記構文木生成ステップにより生成された前記入力文の前記構文木と、前記置換ステップにより置き換えられた前記検索対象文の構文木との類似度を判定する類似度判定ステップと、
判定された前記類似度が所定の条件を満たす場合、前記置換ステップにより置換される前の前記検索対象文を、検索結果として出力する出力ステップと、
をコンピュータに実行させる情報検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007087389A JP5160120B2 (ja) | 2007-03-29 | 2007-03-29 | 情報検索装置、情報検索方法及び情報検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007087389A JP5160120B2 (ja) | 2007-03-29 | 2007-03-29 | 情報検索装置、情報検索方法及び情報検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008250388A true JP2008250388A (ja) | 2008-10-16 |
JP5160120B2 JP5160120B2 (ja) | 2013-03-13 |
Family
ID=39975307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007087389A Expired - Fee Related JP5160120B2 (ja) | 2007-03-29 | 2007-03-29 | 情報検索装置、情報検索方法及び情報検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5160120B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010256977A (ja) * | 2009-04-21 | 2010-11-11 | Toshiba Corp | 情報検索装置およびプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003108583A (ja) * | 2001-09-27 | 2003-04-11 | Seiko Epson Corp | 言語文を用いた検索装置、検索システム、検索方法、プログラム、および記録媒体 |
JP2003167898A (ja) * | 2001-12-04 | 2003-06-13 | Tokyo Soft Kk | 情報検索システム |
JP2007041767A (ja) * | 2005-08-02 | 2007-02-15 | Nec Corp | テキストマイニング装置、テキストマイニング方法、テキストマイニングプログラム |
-
2007
- 2007-03-29 JP JP2007087389A patent/JP5160120B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003108583A (ja) * | 2001-09-27 | 2003-04-11 | Seiko Epson Corp | 言語文を用いた検索装置、検索システム、検索方法、プログラム、および記録媒体 |
JP2003167898A (ja) * | 2001-12-04 | 2003-06-13 | Tokyo Soft Kk | 情報検索システム |
JP2007041767A (ja) * | 2005-08-02 | 2007-02-15 | Nec Corp | テキストマイニング装置、テキストマイニング方法、テキストマイニングプログラム |
Non-Patent Citations (6)
Title |
---|
CSNG200200707001; 松村敦: '構造化インデクスを用いた情報検索システム' アドバンスト・データベース・シンポジウム'97 Vol.97,No.11, 19971215, pp.151-158, 社団法人情報処理学会 * |
CSNG200800048001; 乾健太郎: '言語表現を言い換える技術' 言語処理学会第8回年次大会チュートリアル資料 , 20020317, pp.1-21, 言語処理学会 * |
CSNJ200910070046; 永松健司: '係り受け構造を持つ表現に対する類似度判定手法の提案' 第55回(平成9年後期)全国大会講演論文集(2) 人工知能と認知科学 , 19970924, pp.2-87〜2-88, 社団法人情報処理学会 * |
JPN6012011973; 松村敦: '構造化インデクスを用いた情報検索システム' アドバンスト・データベース・シンポジウム'97 Vol.97,No.11, 19971215, pp.151-158, 社団法人情報処理学会 * |
JPN6012011975; 永松健司: '係り受け構造を持つ表現に対する類似度判定手法の提案' 第55回(平成9年後期)全国大会講演論文集(2) 人工知能と認知科学 , 19970924, pp.2-87〜2-88, 社団法人情報処理学会 * |
JPN6012011979; 乾健太郎: '言語表現を言い換える技術' 言語処理学会第8回年次大会チュートリアル資料 , 20020317, pp.1-21, 言語処理学会 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010256977A (ja) * | 2009-04-21 | 2010-11-11 | Toshiba Corp | 情報検索装置およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5160120B2 (ja) | 2013-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10169337B2 (en) | Converting data into natural language form | |
JP4645242B2 (ja) | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム | |
US20100287162A1 (en) | method and system for text summarization and summary based query answering | |
JP6828335B2 (ja) | 検索プログラム、検索装置および検索方法 | |
JPWO2007099812A1 (ja) | 質問回答装置、質問回答方法および質問回答用プログラム | |
JP2007323671A (ja) | 中国語テキストにおける単語分割 | |
US9218336B2 (en) | Efficient implementation of morphology for agglutinative languages | |
JP5447368B2 (ja) | 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム | |
JP5160120B2 (ja) | 情報検索装置、情報検索方法及び情報検索プログラム | |
JP4745417B2 (ja) | 情報検索装置およびプログラム | |
KR101835994B1 (ko) | 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치 | |
JP6787755B2 (ja) | 文書検索装置 | |
JP5085584B2 (ja) | 記事特徴語抽出装置、記事特徴語抽出方法及びプログラム | |
JP4476609B2 (ja) | 中国語解析装置、中国語解析方法および中国語解析プログラム | |
JP4646328B2 (ja) | 関係情報抽出装置及びその方法 | |
JP2008026967A (ja) | 文書検索システム及びプログラム | |
JP2009104475A (ja) | 類似文書検索装置、類似文書検索方法およびプログラム | |
JP2001101184A (ja) | 構造化文書生成方法及び装置及び構造化文書生成プログラムを格納した記憶媒体 | |
JP2006243976A (ja) | 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置 | |
JP5038881B2 (ja) | 情報検索装置 | |
JP2005157823A (ja) | 知識ベースシステム、および同システムにおける単語間の意味関係判別方法、ならびにそのコンピュータプログラム | |
JP2005234800A (ja) | 用例機械翻訳装置及び用例翻訳コンピュータプログラム、並びに用例検索装置及び用例検索コンピュータプログラム | |
KR101450795B1 (ko) | 대용어 복원 장치 및 방법 | |
JP4060832B2 (ja) | 自然言語解析装置及び方法、自然言語解析プログラム | |
JP2020191099A (ja) | 文書検索装置、文書検索方法およびコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100323 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20100323 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120501 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121212 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5160120 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151221 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |