JP5200762B2 - 検索方法および検索プログラム - Google Patents
検索方法および検索プログラムInfo
- Publication number
- JP5200762B2 JP5200762B2 JP2008215645A JP2008215645A JP5200762B2 JP 5200762 B2 JP5200762 B2 JP 5200762B2 JP 2008215645 A JP2008215645 A JP 2008215645A JP 2008215645 A JP2008215645 A JP 2008215645A JP 5200762 B2 JP5200762 B2 JP 5200762B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- search condition
- search
- text
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
例えば、上記の実施例1では、検索装置が、検索条件外文字列に包含される検索条件文字列の数に1を加算した数のスタック枠を作成し、検索対象となるテキストを判定していたが、これに限定されるものではなく、スタックの代わりに配列を利用して、検索対象となるテキストを判定することもできる。
ところで、本実施例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部あるいは一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
テキストの検索条件となるキーワードを示す検索条件文字列と、前記検索条件の対象外となるキーワードを示す検索条件外文字列とを取得するステップと、
複数のテキストを記憶した記憶装置からテキストを抽出して、当該テキスト中の文字列と前記検索条件文字列および検索条件外文字列とを順次照合し、前記テキスト中の文字列が前記検索条件文字列にヒットした場合には、該当を記憶部に登録し、前記テキスト中の文字列が前記検索条件外文字列にヒットした場合には、当該検索条件外文字列中に含まれる前記検索条件文字列の数だけ、前記記憶部に登録された該当を非該当に変更するステップと、
前記記憶部に該当が残っている場合に、前記記憶装置から抽出したテキストを検索結果として出力するステップと、
を有することを特徴とする検索方法。
テキストの検索条件となるキーワードを示す検索条件文字列と、前記検索条件の対象外となるキーワードを示す検索条件外文字列とを取得する取得手順と、
複数のテキストを記憶した記憶装置からテキストを抽出して、当該テキスト中の文字列と前記検索条件文字列および検索条件外文字列とを順次照合し、前記テキスト中の文字列が前記検索条件文字列にヒットした場合には、該当を記憶部に登録し、前記テキスト中の文字列が前記検索条件外文字列にヒットした場合には、当該検索条件外文字列中に含まれる前記検索条件文字列の数だけ、前記記憶部に登録された該当を非該当に変更する変更手順と、
前記記憶部に該当が残っている場合に、前記記憶装置から抽出したテキストを検索結果として出力する出力手順と、
を実行させることを特徴とする検索プログラム。
50 クライアント端末
100 検索装置
110 入力部
120 出力部
130 通信制御IF部
140 入出力制御IF部
150 記憶部
150a テキスト管理テーブル
150b オートマトンデータ
150c スタック
150d 受理状態管理テーブル
150e 判定結果テーブル
160 制御部
160a 検索クエリ解析部
160b オートマトン生成部
160c 照合処理部
160d 検索結果出力部
200 コンピュータ
201 入力装置
202 モニタ
203 RAM
203a 各種データ
204 ROM
205 媒体読取装置
206 通信装置
207 CPU
207a 検索プロセス
208 HDD
208a 各種データ
208b 検索プログラム
209 バス
Claims (8)
- 検索装置が、
テキストの検索条件となるキーワードを示す検索条件文字列と、前記検索条件の対象外となるキーワードを示す検索条件外文字列とを取得するステップと、
複数のテキストを記憶した記憶装置からテキストを抽出して、当該テキスト中の文字列と前記検索条件文字列および検索条件外文字列とを順次照合し、前記テキスト中の文字列が前記検索条件文字列にヒットした場合には、該当を記憶部に登録し、前記テキスト中の文字列が前記検索条件外文字列にヒットした場合には、当該検索条件外文字列中に含まれる前記検索条件文字列の数だけ、前記記憶部に登録された該当を非該当に変更するステップと、
前記記憶部に該当が残っている場合に、前記記憶装置から抽出したテキストを検索結果として出力するステップと、
を有することを特徴とする検索方法。 - 前記検索条件文字列と前記検索条件外文字列とを取得した場合に、前記検索条件外文字列に包含される前記検索条件文字列の数に1を加算した数のスタック枠を前記記憶部に作成し、前記記憶装置からテキストを抽出して、当該テキスト中の文字列と前記検索条件文字列および検索条件外文字列とを順次照合し、前記テキスト中の文字列が前記検索条件文字列にヒットした場合には、該当を前記スタック枠にプッシュし、前記テキスト中の文字列が前記検索条件外文字列にヒットした場合には、当該検索条件外文字列中に含まれる前記検索条件文字列の数だけ、前記スタック枠に最後に登録された該当から順に該当を非該当に変更し、前記スタック枠に該当が残っている場合に、前記記憶装置から抽出したテキストを検索結果として出力することを特徴とする請求項1に記載の検索方法。
- 前記スタック枠に含まれる各スタック領域の内、最後にプッシュされるべきスタック領域に該当がプッシュされた場合には、前記記憶装置から抽出したテキストを検索結果として出力することを特徴とする請求項2に記載の検索方法。
- 前記検索条件文字列と前記検索条件外文字列とを取得した場合に、前記検索条件文字列を受理するノードと前記検索条件外文字列を受理するノードとを有するACオートマトンを作成し、前記記憶装置から抽出したテキストの文字列を前記ACオートマトンに入力し、前記検索条件文字列を受理するノードに遷移した場合には、該当を前記スタック枠にプッシュし、前記検索条件外文字列を受理するノードに遷移した場合には、当該検索条件外文字列中に含まれる前記検索条件文字列の数だけ、前記スタック枠に最後に登録された該当から順に該当を非該当に変更し、前記スタック枠に該当が残っている場合に、前記記憶装置から抽出したテキストを検索結果として出力することを特徴とする請求項2または3に記載の検索方法。
- コンピュータに、
テキストの検索条件となるキーワードを示す検索条件文字列と、前記検索条件の対象外となるキーワードを示す検索条件外文字列とを取得する取得手順と、
複数のテキストを記憶した記憶装置からテキストを抽出して、当該テキスト中の文字列と前記検索条件文字列および検索条件外文字列とを順次照合し、前記テキスト中の文字列が前記検索条件文字列にヒットした場合には、該当を記憶部に登録し、前記テキスト中の文字列が前記検索条件外文字列にヒットした場合には、当該検索条件外文字列中に含まれる前記検索条件文字列の数だけ、前記記憶部に登録された該当を非該当に変更する変更手順と、
前記記憶部に該当が残っている場合に、前記記憶装置から抽出したテキストを検索結果として出力する出力手順と、
を実行させることを特徴とする検索プログラム。 - 前記変更手順は、前記検索条件外文字列に包含される前記検索条件文字列の数に1を加算した数のスタック枠を前記記憶部に作成し、前記記憶装置からテキストを抽出して、当該テキスト中の文字列と前記検索条件文字列および検索条件外文字列とを順次照合し、前記テキスト中の文字列が前記検索条件文字列にヒットした場合には、該当を前記スタック枠にプッシュし、前記テキスト中の文字列が前記検索条件外文字列にヒットした場合には、当該検索条件外文字列中に含まれる前記検索条件文字列の数だけ、前記スタック枠に最後に登録された該当から順に該当を非該当に変更し、前記出力手順は、前記スタック枠に該当が残っている場合に、前記記憶装置から抽出したテキストを検索結果として出力することを特徴とする請求項5に記載の検索プログラム。
- 前記出力手順は、前記スタック枠に含まれる各スタック領域の内、最後にプッシュされるべきスタック領域に該当がプッシュされた場合には、前記記憶装置から抽出したテキストを検索結果として出力することを特徴とする請求項6に記載の検索プログラム。
- 前記検索条件文字列と前記検索条件外文字列とを取得した場合に、前記検索条件文字列を受理するノードと前記検索条件外文字列を受理するノードとを有するACオートマトンを作成する作成手段を更にコンピュータに実行させ、前記変更手順は、前記記憶装置から抽出したテキストの文字列を前記ACオートマトンに入力し、前記検索条件文字列を受理するノードに遷移した場合には、該当を前記スタック枠にプッシュし、前記検索条件外文字列を受理するノードに遷移した場合には、当該検索条件外文字列中に含まれる前記検索条件文字列の数だけ、前記スタック枠に最後に登録された該当から順に該当を非該当に変更し、前記出力手順は、前記スタック枠に該当が残っている場合に、前記記憶装置から抽出したテキストを検索結果として出力することを特徴とする請求項6または7に記載の検索プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008215645A JP5200762B2 (ja) | 2008-08-25 | 2008-08-25 | 検索方法および検索プログラム |
US12/479,133 US8195686B2 (en) | 2008-08-25 | 2009-06-05 | Search method and search program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008215645A JP5200762B2 (ja) | 2008-08-25 | 2008-08-25 | 検索方法および検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010049650A JP2010049650A (ja) | 2010-03-04 |
JP5200762B2 true JP5200762B2 (ja) | 2013-06-05 |
Family
ID=41697288
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008215645A Active JP5200762B2 (ja) | 2008-08-25 | 2008-08-25 | 検索方法および検索プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8195686B2 (ja) |
JP (1) | JP5200762B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107547905B (zh) * | 2017-05-10 | 2020-07-24 | 新华三信息安全技术有限公司 | 一种解码方法及装置 |
CN110222143B (zh) * | 2019-05-31 | 2022-11-04 | 北京小米移动软件有限公司 | 字符串匹配方法,装置,存储介质及电子设备 |
CN114861216B (zh) * | 2022-03-18 | 2024-05-17 | 浪潮卓数大数据产业发展有限公司 | 一种基于ac自动机的sql注入检测方法、设备、存储介质 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5471610A (en) * | 1989-06-14 | 1995-11-28 | Hitachi, Ltd. | Method for character string collation with filtering function and apparatus |
US5452451A (en) * | 1989-06-15 | 1995-09-19 | Hitachi, Ltd. | System for plural-string search with a parallel collation of a first partition of each string followed by finite automata matching of second partitions |
JPH04340166A (ja) * | 1990-11-30 | 1992-11-26 | Nec Corp | 単語辞書検索装置 |
JPH05250351A (ja) * | 1992-03-06 | 1993-09-28 | Matsushita Electric Ind Co Ltd | 人名漢字検索装置 |
JP3647518B2 (ja) * | 1994-10-06 | 2005-05-11 | ゼロックス コーポレイション | コード化したワードトークンを使用して文書画像をハイライトで強調する装置 |
JP2929963B2 (ja) * | 1995-03-15 | 1999-08-03 | 松下電器産業株式会社 | 文書検索装置および単語索引作成方法および文書検索方法 |
JP3465815B2 (ja) * | 1998-12-28 | 2003-11-10 | 株式会社Quick | テキストフィルタリングシステム |
US6336117B1 (en) * | 1999-04-30 | 2002-01-01 | International Business Machines Corporation | Content-indexing search system and method providing search results consistent with content filtering and blocking policies implemented in a blocking engine |
JP4155382B2 (ja) * | 2001-01-25 | 2008-09-24 | 富士通株式会社 | パターン検索方法、パターン検索装置、パターン検索プログラムを記録したコンピュータ読み取り可能な記録媒体、パターン検索システムおよびパターン検索プログラム |
JP3498798B2 (ja) | 2003-01-24 | 2004-02-16 | 株式会社Quick | テキストフィルタリング方法 |
JP3881638B2 (ja) * | 2003-07-31 | 2007-02-14 | 株式会社東芝 | 文書検索装置、文書検索方法および文書検索プログラム |
JP4365162B2 (ja) * | 2003-08-20 | 2009-11-18 | 富士通株式会社 | 構造化文書のデータを検索する装置および方法 |
JP2005275767A (ja) * | 2004-03-24 | 2005-10-06 | Seiko Epson Corp | 文書情報検索装置および文書情報検索方法ならびにそのプログラム |
US7359895B2 (en) * | 2004-11-18 | 2008-04-15 | Industrial Technology Research Institute | Spiral string matching method |
JP4251652B2 (ja) * | 2006-06-09 | 2009-04-08 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 検索装置、検索プログラムおよび検索方法 |
US8141035B2 (en) * | 2006-07-05 | 2012-03-20 | International Business Machines Corporation | Method for accessing internal states of objects in object oriented programming |
-
2008
- 2008-08-25 JP JP2008215645A patent/JP5200762B2/ja active Active
-
2009
- 2009-06-05 US US12/479,133 patent/US8195686B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20100049712A1 (en) | 2010-02-25 |
US8195686B2 (en) | 2012-06-05 |
JP2010049650A (ja) | 2010-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106537370B (zh) | 在存在来源和翻译错误的情况下对命名实体鲁棒标记的方法和系统 | |
JP5054210B2 (ja) | 属性抽出装置および方法 | |
JP2007094775A (ja) | 意味解析装置、意味解析方法および意味解析プログラム | |
WO2014117549A1 (en) | Method and device for error correction model training and text error correction | |
US8583415B2 (en) | Phonetic search using normalized string | |
JP2007334534A (ja) | 文字列入力装置、文字列入力方法、および、プログラム | |
JP5194818B2 (ja) | データ分類方法およびデータ処理装置 | |
JP5200762B2 (ja) | 検索方法および検索プログラム | |
US20140358522A1 (en) | Information search apparatus and information search method | |
EP4220474A1 (en) | Information processing program, information processing method, and information processing device | |
JP2009157620A (ja) | 情報検索支援装置 | |
KR20110017760A (ko) | 멀티미디어 콘텐츠 기술자 추출시스템 및 그 방법 | |
CN114595696A (zh) | 实体消歧方法、实体消歧装置、存储介质与电子设备 | |
CN104641367B (zh) | 用于格式化电子字符序列的格式化模块、系统和方法 | |
JP7135730B2 (ja) | 要約生成方法及び要約生成プログラム | |
JP6114090B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム | |
JP4806997B2 (ja) | 文章解析プログラム、および文章解析システム | |
JP2020091607A (ja) | 検索システム、及び検索方法 | |
JP2016153975A (ja) | 情報処理装置、侵害検知装置、情報処理方法、およびプログラム | |
JP2007011892A (ja) | 語彙獲得方法及び装置及びプログラム及びプログラムを格納した記憶媒体 | |
JP6425989B2 (ja) | 文字認識支援プログラム、文字認識支援方法及び文字認識支援装置 | |
JP2018180808A (ja) | 解析プログラム、解析方法および解析装置 | |
JP4765107B2 (ja) | 文字列入力装置、および、プログラム | |
JP2008203997A (ja) | 文書検索装置及びプログラム | |
KR101761175B1 (ko) | 빈발 패턴 마이닝 방법, 빈발 패턴 마이닝 서버 및 이를 수행하는 프로그램을 기록하는 기록매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110513 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130115 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5200762 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160222 Year of fee payment: 3 |