JP2009520283A - 複数セグメント文字列の検索 - Google Patents
複数セグメント文字列の検索 Download PDFInfo
- Publication number
- JP2009520283A JP2009520283A JP2008545958A JP2008545958A JP2009520283A JP 2009520283 A JP2009520283 A JP 2009520283A JP 2008545958 A JP2008545958 A JP 2008545958A JP 2008545958 A JP2008545958 A JP 2008545958A JP 2009520283 A JP2009520283 A JP 2009520283A
- Authority
- JP
- Japan
- Prior art keywords
- string
- segment
- query
- segments
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000012545 processing Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 14
- NQLVQOSNDJXLKG-UHFFFAOYSA-N prosulfocarb Chemical compound CCCN(CCC)C(=O)SCC1=CC=CC=C1 NQLVQOSNDJXLKG-UHFFFAOYSA-N 0.000 description 3
- 241000282836 Camelus dromedarius Species 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (20)
- 複数のクエリセグメントを有するクエリ文字列と一致する、複数のセグメントを有する文字列を選択するコンピューティングシステムにおける方法であって、
前記クエリ文字列を受け取るステップと、
前記クエリ文字列のセグメントを識別するステップと、
前記クエリ文字列中の各クエリセグメントを、前記文字列のセグメントと比較するステップと、
前記クエリセグメントと前記文字列のセグメントとの比較に基づいて、前記クエリ文字列に一致する前記文字列を検索結果として選択するステップと
を備えることを特徴とする方法。 - 前記クエリ文字列を前記文字列と比較し、前記クエリ文字列と一致する前記文字列を検索結果として選択するステップをさらに含むことを特徴とする請求項1に記載の方法。
- 前記クエリ文字列が前記クエリセグメントの最後に特殊文字を含んでいる場合、前記クエリセグメントと正確に一致するセグメントを含んでいる前記文字列のみが検索結果として選択されることを特徴とする請求項1に記載の方法。
- 前記クエリ文字列が前記クエリ文字列の最後に特殊文字を含んでいる場合、前記クエリ文字列中の各クエリセグメントと正確に一致するセグメントを含んでいる文字列のみが検索結果として選択されることを特徴とする請求項1に記載の方法。
- 前記文字列中のセグメントは、大文字表記の変化を使用して分割されることを特徴とする請求項1に記載の方法。
- 前記文字列中のセグメントは、1つまたは複数の区切り文字を使用して分割されることを特徴とする請求項1に記載の方法。
- 前記比較で大文字と小文字を区別すべきかどうかを示すフラグを受け取るステップをさらに含むことを特徴とする請求項1に記載の方法。
- 前記クエリ文字列中のいくつの前記クエリセグメントが各文字列中のセグメントと一致するかによって前記検索結果に順位を付けるステップをさらに含むことを特徴とする請求項1に記載の方法。
- 各文字列中のセグメントが前記クエリ文字列中の前記クエリセグメントと同じ順序で出現する度合いによって前記検索結果に順位を付けるステップをさらに含むことを特徴とする請求項1に記載の方法。
- 複数の前記文字列は、ソフトウェア開発プロジェクトの記号を備えることを特徴とする請求項1に記載の方法。
- 前記記号は、公表されたAPIによって公開された文字列を含むことを特徴とする請求項10に記載の方法。
- 前記クエリセグメントが前記文字列中のセグメントの冒頭と一致する時に一致が発生することを特徴とする請求項1に記載の方法。
- 前記クエリ文字列のセグメントを識別するステップは、前記文字列をセグメントに分割するカスタムコンポーネントを呼び出すことを含むことを特徴とする請求項1に記載の方法。
- 文字列を格納及び取り出すシステムであって、
各文字列が含んでいるセグメントによって複数の前記文字列を索引付ける文字列テーブルコンポーネントと、
前記文字列をセグメントに分割するセグメント抽出コンポーネントと、
クエリセグメントと各文字列のセグメントとの比較に基づいて、前記文字列テーブルから、クエリ文字列と一致する前記文字列を選択するクエリ処理コンポーネントと
を備えることを特徴とするシステム。 - 前記文字列テーブルの前記文字列を変更する文字列テーブル更新コンポーネントをさらに含むことを特徴とする請求項14に記載のシステム。
- 外部のコンポーネントが前記文字列テーブルへの操作を行うことを可能にする文字列テーブルインタフェースコンポーネントをさらに含むことを特徴とする請求項14に記載のシステム。
- 前記文字列テーブル更新コンポーネントはさらに、前記文字列テーブルのデータを要求する操作が行われるまで、前記文字列テーブルへの更新を格納する更新キャッシュコンポーネントを備えることを特徴とする請求項14に記載のシステム。
- 文字列を格納するデータ構造を含むコンピュータ読取可能媒体であって、
前記データ構造は、複数の前記文字列と、セグメントエントリの索引とを含み、
各エントリは、少なくとも1つの前記文字列の中に含まれる一意のセグメントを識別するセグメント文字列と、前記識別されたセグメントを含んでいる前記文字列への参照とを含む
ことを特徴とするコンピュータ読取可能媒体。 - 前記データ構造は、操作が行われている間の前記文字列テーブルの変化を検出するためのバージョン番号を含むことを特徴とする請求項18に記載のコンピュータ読取可能媒体。
- 前記セグメントエントリはB木に格納されることを特徴とする請求項18に記載のコンピュータ読取可能媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/311,891 | 2005-12-19 | ||
US11/311,891 US7756859B2 (en) | 2005-12-19 | 2005-12-19 | Multi-segment string search |
PCT/US2006/062012 WO2007076269A2 (en) | 2005-12-19 | 2006-12-13 | Multi-segment string search |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009520283A true JP2009520283A (ja) | 2009-05-21 |
JP4698738B2 JP4698738B2 (ja) | 2011-06-08 |
Family
ID=38195167
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008545958A Active JP4698738B2 (ja) | 2005-12-19 | 2006-12-13 | 複数セグメント文字列の検索 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7756859B2 (ja) |
EP (1) | EP1964004A4 (ja) |
JP (1) | JP4698738B2 (ja) |
WO (1) | WO2007076269A2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011527058A (ja) * | 2008-07-03 | 2011-10-20 | ニュアンス コミュニケーションズ,インコーポレイテッド | モバイルデバイス上で日本語テキストを処理する方法およびシステム |
JP2016167135A (ja) * | 2015-03-09 | 2016-09-15 | 富士通株式会社 | コンピュータプログラム、検索装置及び検索方法 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7657423B1 (en) | 2003-10-31 | 2010-02-02 | Google Inc. | Automatic completion of fragments of text |
US9148477B2 (en) * | 2009-01-29 | 2015-09-29 | Qualcomm Incorporated | Methods and apparatus for communicating in a wireless system |
EP2264626B1 (de) * | 2009-06-19 | 2021-02-24 | Siemens Aktiengesellschaft | Verfahren und Vorrichtung zum speichereffizienten Suchen mindestens eines Anfragedatenelementes |
CN101957828B (zh) * | 2009-07-20 | 2013-03-06 | 阿里巴巴集团控股有限公司 | 一种对搜索结果进行排序的方法和装置 |
US8538935B2 (en) * | 2009-09-25 | 2013-09-17 | Formrouter Inc. | One-to-one and one-to-many relationships in databases |
US9392005B2 (en) | 2010-05-27 | 2016-07-12 | Samsung Sds Co., Ltd. | System and method for matching pattern |
US9171311B2 (en) * | 2010-08-31 | 2015-10-27 | Microsoft Technology Licensing, Llc | Maintaining targetable user inventory for digital advertising |
US8407245B2 (en) * | 2010-11-24 | 2013-03-26 | Microsoft Corporation | Efficient string pattern matching for large pattern sets |
US9195716B2 (en) * | 2013-02-28 | 2015-11-24 | Facebook, Inc. | Techniques for ranking character searches |
WO2017070771A1 (en) * | 2015-10-26 | 2017-05-04 | Intelliresponse Systems Inc. | System and method for determining common subsequences |
US11429586B2 (en) * | 2016-12-22 | 2022-08-30 | Sap Se | Expression update validation |
US10747819B2 (en) | 2018-04-20 | 2020-08-18 | International Business Machines Corporation | Rapid partial substring matching |
US10169451B1 (en) | 2018-04-20 | 2019-01-01 | International Business Machines Corporation | Rapid character substring searching |
US10782968B2 (en) | 2018-08-23 | 2020-09-22 | International Business Machines Corporation | Rapid substring detection within a data element string |
US10732972B2 (en) | 2018-08-23 | 2020-08-04 | International Business Machines Corporation | Non-overlapping substring detection within a data element string |
US11042371B2 (en) | 2019-09-11 | 2021-06-22 | International Business Machines Corporation | Plausability-driven fault detection in result logic and condition codes for fast exact substring match |
US10996951B2 (en) | 2019-09-11 | 2021-05-04 | International Business Machines Corporation | Plausibility-driven fault detection in string termination logic for fast exact substring match |
CN112597345B (zh) * | 2020-10-30 | 2023-05-12 | 深圳市检验检疫科学研究院 | 一种实验室数据自动采集与匹配方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020169755A1 (en) * | 2001-05-09 | 2002-11-14 | Framroze Bomi Patel | System and method for the storage, searching, and retrieval of chemical names in a relational database |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6126176A (ja) * | 1984-07-17 | 1986-02-05 | Nec Corp | 言語処理用辞書 |
US5469354A (en) * | 1989-06-14 | 1995-11-21 | Hitachi, Ltd. | Document data processing method and apparatus for document retrieval |
AU620994B2 (en) * | 1989-07-12 | 1992-02-27 | Digital Equipment Corporation | Compressed prefix matching database searching |
US5276616A (en) * | 1989-10-16 | 1994-01-04 | Sharp Kabushiki Kaisha | Apparatus for automatically generating index |
US5867812A (en) * | 1992-08-14 | 1999-02-02 | Fujitsu Limited | Registration apparatus for compound-word dictionary |
US5768423A (en) * | 1994-09-02 | 1998-06-16 | Panasonic Technologies Inc. | Trie structure based method and apparatus for indexing and searching handwritten databases with dynamic search sequencing |
US5995921A (en) * | 1996-04-23 | 1999-11-30 | International Business Machines Corporation | Natural language help interface |
US5978797A (en) * | 1997-07-09 | 1999-11-02 | Nec Research Institute, Inc. | Multistage intelligent string comparison method |
US6018735A (en) * | 1997-08-22 | 2000-01-25 | Canon Kabushiki Kaisha | Non-literal textual search using fuzzy finite-state linear non-deterministic automata |
US6108444A (en) * | 1997-09-29 | 2000-08-22 | Xerox Corporation | Method of grouping handwritten word segments in handwritten document images |
US6240409B1 (en) * | 1998-07-31 | 2001-05-29 | The Regents Of The University Of California | Method and apparatus for detecting and summarizing document similarity within large document sets |
DE19960081A1 (de) * | 1999-06-09 | 2000-12-14 | Grateach Gmbh | Suchmaschine |
US7483828B2 (en) * | 2001-03-16 | 2009-01-27 | Meaningful Machines, L.L.C. | Multilingual database creation system and method |
US6785677B1 (en) * | 2001-05-02 | 2004-08-31 | Unisys Corporation | Method for execution of query to search strings of characters that match pattern with a target string utilizing bit vector |
US7610189B2 (en) * | 2001-10-18 | 2009-10-27 | Nuance Communications, Inc. | Method and apparatus for efficient segmentation of compound words using probabilistic breakpoint traversal |
US20050131926A1 (en) * | 2003-12-10 | 2005-06-16 | Siemens Corporate Research Inc. | Method of hybrid searching for extensible markup language (XML) documents |
US20050149499A1 (en) * | 2003-12-30 | 2005-07-07 | Google Inc., A Delaware Corporation | Systems and methods for improving search quality |
US7277029B2 (en) * | 2005-06-23 | 2007-10-02 | Microsoft Corporation | Using language models to expand wildcards |
-
2005
- 2005-12-19 US US11/311,891 patent/US7756859B2/en active Active
-
2006
- 2006-12-13 WO PCT/US2006/062012 patent/WO2007076269A2/en active Application Filing
- 2006-12-13 JP JP2008545958A patent/JP4698738B2/ja active Active
- 2006-12-13 EP EP06840236A patent/EP1964004A4/en not_active Ceased
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020169755A1 (en) * | 2001-05-09 | 2002-11-14 | Framroze Bomi Patel | System and method for the storage, searching, and retrieval of chemical names in a relational database |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011527058A (ja) * | 2008-07-03 | 2011-10-20 | ニュアンス コミュニケーションズ,インコーポレイテッド | モバイルデバイス上で日本語テキストを処理する方法およびシステム |
JP2016167135A (ja) * | 2015-03-09 | 2016-09-15 | 富士通株式会社 | コンピュータプログラム、検索装置及び検索方法 |
Also Published As
Publication number | Publication date |
---|---|
EP1964004A2 (en) | 2008-09-03 |
US20070150469A1 (en) | 2007-06-28 |
US7756859B2 (en) | 2010-07-13 |
WO2007076269A3 (en) | 2008-05-02 |
EP1964004A4 (en) | 2010-10-20 |
WO2007076269A2 (en) | 2007-07-05 |
JP4698738B2 (ja) | 2011-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4698738B2 (ja) | 複数セグメント文字列の検索 | |
US7085761B2 (en) | Program for changing search results rank, recording medium for recording such a program, and content search processing method | |
Cambazoglu et al. | Scalability challenges in web search engines | |
US7827181B2 (en) | Click distance determination | |
US20120310630A1 (en) | Tokenization platform | |
US9020951B2 (en) | Methods for indexing and searching based on language locale | |
CN107153647B (zh) | 进行数据压缩的方法、装置、系统和计算机程序产品 | |
US20070174261A1 (en) | Database retrieval apparatus, retrieval method, storage medium, and progam | |
JP2009211263A (ja) | 情報検索システム、方法及びプログラム | |
US11573961B2 (en) | Delta graph traversing system | |
US10262037B2 (en) | Joining operations in document oriented databases | |
US20120124060A1 (en) | Method and system of identifying adjacency data, method and system of generating a dataset for mapping adjacency data, and an adjacency data set | |
CN116150093B (zh) | 一种对象存储列举对象的实现方法及电子设备 | |
US10963476B2 (en) | Searching and visualizing data for a network search based on relationships within the data | |
US10866993B2 (en) | Managing online help information in a data center | |
JP2675958B2 (ja) | 情報検索用計算機システム及びその記憶装置の動作方法 | |
Olsson | Using Elasticsearch for full-text searches on unstructured data | |
KR100434718B1 (ko) | 문서 색인 시스템 및 그 방법 | |
US8176051B2 (en) | Search via fast case insensitive ASCII tree | |
US20220382753A1 (en) | Narrowing synonym dictionary results using document attributes | |
CN109492218B (zh) | 一种基于确定有穷状态机的同义词快速替换方法 | |
JP2001134598A (ja) | T木インデックス構築方法及びt木インデックス検索方法及びt木インデックス構築装置及びt木インデックス検索装置及びt木インデックス構築プログラムを格納した記憶媒体及びt木インデックス検索プログラムを格納した記憶媒体 | |
JPS63311432A (ja) | 連想語検索システム | |
JP2006172338A (ja) | 情報処理装置および方法、記録媒体、並びにプログラム | |
KR100797848B1 (ko) | 표지 데이터를 이용한 데이터 검색 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100914 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110301 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4698738 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D02 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |