JP2006163723A - ドキュメント検索方法 - Google Patents
ドキュメント検索方法 Download PDFInfo
- Publication number
- JP2006163723A JP2006163723A JP2004353083A JP2004353083A JP2006163723A JP 2006163723 A JP2006163723 A JP 2006163723A JP 2004353083 A JP2004353083 A JP 2004353083A JP 2004353083 A JP2004353083 A JP 2004353083A JP 2006163723 A JP2006163723 A JP 2006163723A
- Authority
- JP
- Japan
- Prior art keywords
- document
- keywords
- keyword
- search
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】検索対象ドキュメントを、階層構造を持つ中間形式文に変換し、この文に対して形態素解析行い、キーワードを抽出する。その後、このキーワード情報ファイル及びこれに関係付けられた中間形式分をデータベースに格納する。そして、このデータベースに対してキーワード検索を行い、検索キーワードをすべて含むドキュメントを抽出する。
【選択図】図2
Description
SW(I, j) ⊇ W(n)
DW(k) ⊇ W(n)
a)指定キーワードを全て含む。
b)個々のキーワードを含む文章が全て同一の内容に対する記述である。
xpath=”//psc:keywords/psc:keyword[text()=‘赤’]/..psc:keywords[text()=’クラス’]” (1)
により検索するため、上記例2のみが抽出される。
1)// 任意のノードの配下の
2)psc:keywords/ keywordsノードの配下の
3)psc:keyword/ keywordノードの配下の
4)[text()=’赤’] 文字列が赤であるノードが存在するか評価する。
5)上記評価が真である場合
6)/../ 見つけたkeywordノードの直上のノード(keywords)配下の
7)psc:keyword keywordノードの
8)[text()=’クラス’] 文字列がクラスであるノードが存在するか評価する。
Claims (1)
- 検索対象となる対象ドキュメントを、階層構造をもつ中間形式センテンスに展開するステップと、
展開された各階層のセンテンスについてキーワードを生成するステップと、
生成したキーワードからなるキーワード情報ファイルと関連付けされた前記中間形式センテンスをデータベースに格納するステップと、
該データベースを検索し、前記各中間形式センテンス内に全てのキーワードを含むドキュメントを抽出するステップと、
を有するドキュメント検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004353083A JP2006163723A (ja) | 2004-12-06 | 2004-12-06 | ドキュメント検索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004353083A JP2006163723A (ja) | 2004-12-06 | 2004-12-06 | ドキュメント検索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006163723A true JP2006163723A (ja) | 2006-06-22 |
Family
ID=36665684
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004353083A Pending JP2006163723A (ja) | 2004-12-06 | 2004-12-06 | ドキュメント検索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006163723A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008130027A (ja) * | 2006-11-24 | 2008-06-05 | Kengo Fujiwara | 到着ページ最適化システム及び到着ページ最適化方法 |
JP2008538021A (ja) * | 2005-03-04 | 2008-10-02 | チョンヌン インコーポレイテッド | 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供サーバー、方法及びシステム |
JP2014530435A (ja) * | 2011-09-27 | 2014-11-17 | マイクロソフト コーポレーション | フォールトトレラント外部アプリケーションサーバ |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04281565A (ja) * | 1991-03-08 | 1992-10-07 | Toshiba Corp | 文書検索装置 |
JPH04293161A (ja) * | 1991-03-20 | 1992-10-16 | Hitachi Ltd | 文書検索方法および装置 |
JPH05266087A (ja) * | 1992-03-23 | 1993-10-15 | Sharp Corp | 全文検索装置 |
JPH06215035A (ja) * | 1993-01-18 | 1994-08-05 | Sanyo Electric Co Ltd | テキスト検索装置 |
JPH08272822A (ja) * | 1995-03-29 | 1996-10-18 | Fuji Xerox Co Ltd | 文書登録装置及び文書検索装置 |
JPH08272782A (ja) * | 1995-03-29 | 1996-10-18 | Fuji Xerox Co Ltd | 文書検索装置 |
JPH117445A (ja) * | 1997-06-17 | 1999-01-12 | Fuji Xerox Co Ltd | 統合化文書管理装置 |
JP2004133510A (ja) * | 2002-10-08 | 2004-04-30 | Hironobu Shishido | 技術文献検索システム |
-
2004
- 2004-12-06 JP JP2004353083A patent/JP2006163723A/ja active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04281565A (ja) * | 1991-03-08 | 1992-10-07 | Toshiba Corp | 文書検索装置 |
JPH04293161A (ja) * | 1991-03-20 | 1992-10-16 | Hitachi Ltd | 文書検索方法および装置 |
JPH05266087A (ja) * | 1992-03-23 | 1993-10-15 | Sharp Corp | 全文検索装置 |
JPH06215035A (ja) * | 1993-01-18 | 1994-08-05 | Sanyo Electric Co Ltd | テキスト検索装置 |
JPH08272822A (ja) * | 1995-03-29 | 1996-10-18 | Fuji Xerox Co Ltd | 文書登録装置及び文書検索装置 |
JPH08272782A (ja) * | 1995-03-29 | 1996-10-18 | Fuji Xerox Co Ltd | 文書検索装置 |
JPH117445A (ja) * | 1997-06-17 | 1999-01-12 | Fuji Xerox Co Ltd | 統合化文書管理装置 |
JP2004133510A (ja) * | 2002-10-08 | 2004-04-30 | Hironobu Shishido | 技術文献検索システム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008538021A (ja) * | 2005-03-04 | 2008-10-02 | チョンヌン インコーポレイテッド | 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供サーバー、方法及びシステム |
JP2008130027A (ja) * | 2006-11-24 | 2008-06-05 | Kengo Fujiwara | 到着ページ最適化システム及び到着ページ最適化方法 |
JP2014530435A (ja) * | 2011-09-27 | 2014-11-17 | マイクロソフト コーポレーション | フォールトトレラント外部アプリケーションサーバ |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5744873B2 (ja) | トラステッドクエリのシステムおよび方法 | |
US7958444B2 (en) | Visualizing document annotations in the context of the source document | |
KR101040119B1 (ko) | 콘텐츠 검색 장치 및 방법 | |
JP2012248210A (ja) | 日本語などの複雑言語のコンテンツを検索するシステム及び方法 | |
US20180004838A1 (en) | System and method for language sensitive contextual searching | |
US7024405B2 (en) | Method and apparatus for improved internet searching | |
KR20100066919A (ko) | 웹 기반의 정보 저장 및 검색 방법, 이를 위한 정보 관리 시스템 | |
JP2005242416A (ja) | 自然言語文の検索方法および検索装置 | |
JP2007011973A (ja) | 情報検索装置及び情報検索プログラム | |
JP2006163723A (ja) | ドキュメント検索方法 | |
JP2007128224A (ja) | 文書インデキシング装置、文書インデキシング方法及び文書インデキシングプログラム | |
JP4877930B2 (ja) | 文書処理装置及び文書処理方法 | |
JPH11259524A (ja) | 情報検索システム、情報検索システムにおける情報処理方法および記録媒体 | |
JP4000332B2 (ja) | 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2003288332A (ja) | 構造化文書作成支援方法及び構造化文書作成支援システム | |
Batista-Navarro et al. | Construction of a Biodiversity Knowledge Repository using a Text Mining-based Framework. | |
JPH1145238A (ja) | 文書管理システムおよびそのシステムとしてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP4034503B2 (ja) | 文書検索システムおよび文書検索方法 | |
Shidha et al. | Chem Text Mining-An Outline | |
TWI442249B (zh) | Domain Knowledge Network Construction Method and Its System | |
JP2010152705A (ja) | 体験情報検索システム | |
Demartini et al. | An architecture for finding entities on the web | |
El-Gamil et al. | Deep web integrated systems: current achievements and open issues | |
Hammo et al. | ViStA: a visualization system for exploring Arabic text | |
JP2003263458A (ja) | テキスト分析方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070613 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100112 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100311 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100518 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100810 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20100826 |
|
A912 | Removal of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20100917 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120719 |