JP6737117B2 - 符号化データ検索プログラム、符号化データ検索方法および符号化データ検索装置 - Google Patents
符号化データ検索プログラム、符号化データ検索方法および符号化データ検索装置 Download PDFInfo
- Publication number
- JP6737117B2 JP6737117B2 JP2016198914A JP2016198914A JP6737117B2 JP 6737117 B2 JP6737117 B2 JP 6737117B2 JP 2016198914 A JP2016198914 A JP 2016198914A JP 2016198914 A JP2016198914 A JP 2016198914A JP 6737117 B2 JP6737117 B2 JP 6737117B2
- Authority
- JP
- Japan
- Prior art keywords
- code
- automaton
- word
- search
- basic form
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Fuzzy Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
符号化文書に対する検索文字列を受け付け、
複数の単語について、前記符号化文書の符号化規則による前記単語の符号化データと前記単語の基本形と前記基本形に関連する関連単語とを対応付けた関連情報を参照し、
前記検索文字列の基本形、および、前記基本形の関連単語に関する複数の符号を取得し、
前記複数の符号を検索対象に設定したオートマトンを利用して、前記符号化文書に対する検索を行う
処理を実行させる符号化データ検索プログラム。
符号化文書に対する検索文字列を受け付け、
複数の単語について、前記符号化文書の符号化規則による前記単語の符号化データと前記単語の基本形と前記基本形に関連する関連単語とを対応付けた関連情報を参照し、
前記検索文字列の基本形、および、前記基本形の関連単語に関する複数の符号を取得し、
前記複数の符号を検索対象に設定したオートマトンを利用して、前記符号化文書に対する検索を行う
処理を実行する符号化データ検索方法。
複数の単語について、前記符号化文書の符号化規則による前記単語の符号化データと前記単語の基本形と前記基本形に関連する関連単語とを対応付けた関連情報を参照し、前記検索文字列の基本形、および、前記基本形の関連単語に関する複数の符号を取得し、前記複数の符号を検索対象としてオートマトンに設定する設定部と、
前記オートマトンを利用して、前記符号化文書に対する検索を行う検索部と
を有する符号化データ検索装置。
105 記憶部
115 辞書情報リード部
116 オートマトン生成部
120 受付部
130 ファイルリード部
150a 設定部
150b 検索処理部
Claims (6)
- コンピュータに
符号化文書に対する検索文字列を受け付け、
複数の単語について、前記符号化文書の符号化規則による前記単語の符号化データと前記単語の基本形と前記基本形に関連する関連単語とを対応付けた関連情報を参照し、
前記検索文字列の基本形、および、前記基本形の関連単語に関する複数の符号を取得し、
検索対象であるか否かを示すフラグと第1符号長の符号とを対応付けた第1オートマトンと、検索対象であるか否かを示すフラグと第2符号長の符号とを対応付けた第2オートマトンと、前記複数の符号とを基にして、前記第1オートマトンのフラグおよび前記第2オートマトンのフラグを設定し、前記第1オートマトンおよび前記第2オートマトンを利用して、前記符号化文書に対する検索を行う
処理を実行させる符号化データ検索プログラム。 - 前記基本形に関連する関連単語は、前記基本形の類義語または前記基本形と同音・同意味の語句であり前記基本形と異なる文字表記の表記揺れ単語であることを特徴とする請求項1に記載の符号化データ検索プログラム。
- 前記類義語を検索対象とするのか、前記表記揺れ単語を検索対象とするのかを指示する指示情報を更に受け付け、前記符号を取得する処理は、前記指示情報を基にして、基本形の類義語または表記揺れ単語に対応する複数の符号を取得することを特徴とする請求項2に記載の符号化データ検索プログラム。
- 前記検索する処理は、前記符号化文書の符号と、前記第1オートマトンおよび前記第2オートマトンとを比較し、前記第1オートマトンまたは前記第2オートマトンにヒットした符号を検索対象の符号として特定することを特徴とする請求項1、2または3に記載の符号化データ検索プログラム。
- コンピュータが実行する符号化データ検索方法であって、
符号化文書に対する検索文字列を受け付け、
複数の単語について、前記符号化文書の符号化規則による前記単語の符号化データと前記単語の基本形と前記基本形に関連する関連単語とを対応付けた関連情報を参照し、
前記検索文字列の基本形、および、前記基本形の関連単語に関する複数の符号を取得し、
検索対象であるか否かを示すフラグと第1符号長の符号とを対応付けた第1オートマトンと、検索対象であるか否かを示すフラグと第2符号長の符号とを対応付けた第2オートマトンと、前記複数の符号とを基にして、前記第1オートマトンのフラグおよび前記第2オートマトンのフラグを設定し、前記第1オートマトンおよび前記第2オートマトンを利用して、前記符号化文書に対する検索を行う
処理を実行する符号化データ検索方法。 - 符号化文書に対する検索文字列を受け付ける受付部と、
複数の単語について、前記符号化文書の符号化規則による前記単語の符号化データと前記単語の基本形と前記基本形に関連する関連単語とを対応付けた関連情報を参照し、前記検索文字列の基本形、および、前記基本形の関連単語に関する複数の符号を取得し、検索対象であるか否かを示すフラグと第1符号長の符号とを対応付けた第1オートマトンと、検索対象であるか否かを示すフラグと第2符号長の符号とを対応付けた第2オートマトンと、前記複数の符号とを基にして、前記第1オートマトンのフラグおよび前記第2オートマトンのフラグを設定する設定部と、
前記第1オートマトンのフラグおよび前記第2オートマトンを利用して、前記符号化文書に対する検索を行う検索部と
を有する符号化データ検索装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016198914A JP6737117B2 (ja) | 2016-10-07 | 2016-10-07 | 符号化データ検索プログラム、符号化データ検索方法および符号化データ検索装置 |
US15/705,917 US10942934B2 (en) | 2016-10-07 | 2017-09-15 | Non-transitory computer-readable recording medium, encoded data searching method, and encoded data searching apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016198914A JP6737117B2 (ja) | 2016-10-07 | 2016-10-07 | 符号化データ検索プログラム、符号化データ検索方法および符号化データ検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018060443A JP2018060443A (ja) | 2018-04-12 |
JP6737117B2 true JP6737117B2 (ja) | 2020-08-05 |
Family
ID=61828405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016198914A Active JP6737117B2 (ja) | 2016-10-07 | 2016-10-07 | 符号化データ検索プログラム、符号化データ検索方法および符号化データ検索装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10942934B2 (ja) |
JP (1) | JP6737117B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105893337B (zh) * | 2015-01-04 | 2020-07-10 | 伊姆西Ip控股有限责任公司 | 用于文本压缩和解压缩的方法和设备 |
EP3825896A4 (en) * | 2018-07-19 | 2021-08-04 | Fujitsu Limited | LEARNING PROCEDURES, TRANSLATION PROCEDURES, LEARNING PROGRAM, TRANSLATION PROGRAM AND INFORMATION PROCESSING DEVICE |
Family Cites Families (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60222960A (ja) | 1984-04-19 | 1985-11-07 | Brother Ind Ltd | 電子辞書 |
JP3134204B2 (ja) | 1991-07-19 | 2001-02-13 | 株式会社日立製作所 | 情報検索用端末装置及び情報検索用端末装置における情報表示・入出力方法 |
US5140644A (en) * | 1990-07-23 | 1992-08-18 | Hitachi, Ltd. | Character string retrieving system and method |
US5590317A (en) * | 1992-05-27 | 1996-12-31 | Hitachi, Ltd. | Document information compression and retrieval system and document information registration and retrieval method |
CA2125337A1 (en) * | 1993-06-30 | 1994-12-31 | Marlin Jay Eller | Method and system for searching compressed data |
US5606690A (en) * | 1993-08-20 | 1997-02-25 | Canon Inc. | Non-literal textual search using fuzzy finite non-deterministic automata |
US5704060A (en) * | 1995-05-22 | 1997-12-30 | Del Monte; Michael G. | Text storage and retrieval system and method |
JPH09198398A (ja) * | 1996-01-16 | 1997-07-31 | Fujitsu Ltd | パターン検索装置 |
JPH11143877A (ja) * | 1997-10-22 | 1999-05-28 | Internatl Business Mach Corp <Ibm> | 圧縮方法、辞書の見出し語インデックス・データを圧縮するための方法、及び機械翻訳システム |
JPH11143893A (ja) | 1997-11-07 | 1999-05-28 | Matsushita Electric Ind Co Ltd | 単語照合装置 |
US5991713A (en) * | 1997-11-26 | 1999-11-23 | International Business Machines Corp. | Efficient method for compressing, storing, searching and transmitting natural language text |
JP3457184B2 (ja) * | 1998-06-25 | 2003-10-14 | シャープ株式会社 | 検索装置及びその制御プログラムを記憶した媒体 |
US6269189B1 (en) * | 1998-12-29 | 2001-07-31 | Xerox Corporation | Finding selected character strings in text and providing information relating to the selected character strings |
AU2029601A (en) * | 1999-12-17 | 2001-06-25 | Si Han Kim | Information coding and retrieval system and method thereof |
AU2001293596A1 (en) * | 2000-09-29 | 2002-04-08 | Gavagai Technology Incorporated | A method and system for adapting synonym resources to specific domains |
JPWO2002035369A1 (ja) * | 2000-10-13 | 2004-03-04 | 株式会社東芝 | データ中継システム、データ中継方法、データ中継プログラム、情報処理方法及び情報処理プログラム |
US6925460B2 (en) * | 2001-03-23 | 2005-08-02 | International Business Machines Corporation | Clustering data including those with asymmetric relationships |
US20020152219A1 (en) * | 2001-04-16 | 2002-10-17 | Singh Monmohan L. | Data interexchange protocol |
JP4047053B2 (ja) * | 2002-04-16 | 2008-02-13 | 富士通株式会社 | 繰り返しを含む順序パターンを用いた検索装置および方法 |
JP4308676B2 (ja) * | 2003-01-24 | 2009-08-05 | 株式会社リコー | 文字列処理装置,文字列処理方法および画像形成装置 |
US20040225497A1 (en) * | 2003-05-05 | 2004-11-11 | Callahan James Patrick | Compressed yet quickly searchable digital textual data format |
JP4365162B2 (ja) * | 2003-08-20 | 2009-11-18 | 富士通株式会社 | 構造化文書のデータを検索する装置および方法 |
JP4347264B2 (ja) * | 2005-05-20 | 2009-10-21 | キヤノン株式会社 | 文書管理システム |
JP5169837B2 (ja) * | 2006-12-28 | 2013-03-27 | 日本電気株式会社 | 文字列照合用有限オートマトン生成システム、その生成方法、及び生成プログラム |
US20080208566A1 (en) * | 2007-02-23 | 2008-08-28 | Microsoft Corporation | Automated word-form transformation and part of speech tag assignment |
US8332209B2 (en) * | 2007-04-24 | 2012-12-11 | Zinovy D. Grinblat | Method and system for text compression and decompression |
US20090216911A1 (en) * | 2008-02-21 | 2009-08-27 | Larry Long | Method and system for intuitive coding to enter text expansions |
JP5155001B2 (ja) * | 2008-04-01 | 2013-02-27 | 株式会社日立製作所 | 文書検索装置 |
JP5782214B2 (ja) * | 2008-05-30 | 2015-09-24 | 富士通株式会社 | 情報検索プログラム、情報検索装置および情報検索方法 |
US8312104B2 (en) * | 2008-07-01 | 2012-11-13 | General Motors Llc | Interactive information dissemination and retrieval system and method for generating action items |
US8725671B2 (en) * | 2009-03-19 | 2014-05-13 | Nec Corporation | Pattern matching appratus |
US9160611B2 (en) * | 2009-04-22 | 2015-10-13 | Webroot Inc. | System and method for performing longest common prefix strings searches |
US9059851B2 (en) * | 2010-02-23 | 2015-06-16 | Salesforce.Com, Inc. | Method and computer program product for order preserving symbol based encryption |
US9111106B2 (en) * | 2011-01-13 | 2015-08-18 | Mitsubishi Electric Corporation | Data processing apparatus and data storage apparatus |
JP5678691B2 (ja) * | 2011-01-28 | 2015-03-04 | 富士通株式会社 | 検索制御装置、検索制御プログラムおよび検索制御方法 |
JP5510563B2 (ja) * | 2011-02-08 | 2014-06-04 | 富士通株式会社 | 検索プログラム、検索装置、および検索方法 |
US10176168B2 (en) * | 2011-11-15 | 2019-01-08 | Microsoft Technology Licensing, Llc | Statistical machine translation based search query spelling correction |
US8793199B2 (en) * | 2012-02-29 | 2014-07-29 | International Business Machines Corporation | Extraction of information from clinical reports |
JP5250709B1 (ja) * | 2012-03-12 | 2013-07-31 | 楽天株式会社 | 情報処理装置、情報処理方法、情報処理装置用プログラム、および、記録媒体 |
JP6252489B2 (ja) * | 2012-12-19 | 2017-12-27 | 富士通株式会社 | 圧縮装置、圧縮方法、圧縮プログラム、伸張装置、伸張方法、伸張プログラム、および圧縮伸張システム |
KR20150119403A (ko) * | 2013-03-22 | 2015-10-23 | 후지쯔 가부시끼가이샤 | 압축 장치, 압축 방법, 사전 생성 장치, 사전 생성 방법, 신장 장치, 신장 방법, 신장 프로그램 및 정보 처리 시스템 |
US20160300020A1 (en) * | 2013-12-03 | 2016-10-13 | 3M Innovative Properties Company | Constraint-based medical coding |
US9483768B2 (en) * | 2014-08-11 | 2016-11-01 | 24/7 Customer, Inc. | Methods and apparatuses for modeling customer interaction experiences |
JP6476647B2 (ja) * | 2014-08-20 | 2019-03-06 | 富士通株式会社 | 圧縮プログラム、圧縮装置、圧縮方法、伸長プログラム、伸長装置および伸長方法 |
JP6543922B2 (ja) * | 2014-12-10 | 2019-07-17 | 富士通株式会社 | インデックス生成プログラム |
CN105893337B (zh) * | 2015-01-04 | 2020-07-10 | 伊姆西Ip控股有限责任公司 | 用于文本压缩和解压缩的方法和设备 |
JP6447161B2 (ja) * | 2015-01-20 | 2019-01-09 | 富士通株式会社 | 意味構造検索プログラム、意味構造検索装置、及び意味構造検索方法 |
JP6467937B2 (ja) * | 2015-01-21 | 2019-02-13 | 富士通株式会社 | 文書処理プログラム、情報処理装置および文書処理方法 |
JP6550765B2 (ja) * | 2015-01-28 | 2019-07-31 | 富士通株式会社 | 文字データ変換プログラム、文字データ変換装置および文字データ変換方法 |
JP6507682B2 (ja) * | 2015-01-30 | 2019-05-08 | 富士通株式会社 | 符号化プログラム、符号化方法および符号化装置 |
US10114955B2 (en) * | 2015-02-11 | 2018-10-30 | Visa International Service Association | Increasing search ability of private, encrypted data |
JP6648431B2 (ja) * | 2015-07-13 | 2020-02-14 | 富士通株式会社 | 照合プログラム、照合方法および照合装置 |
JP6679874B2 (ja) * | 2015-10-09 | 2020-04-15 | 富士通株式会社 | 符号化プログラム、符号化装置、符号化方法、復号化プログラム、復号化装置および復号化方法 |
JP2017126185A (ja) * | 2016-01-13 | 2017-07-20 | 富士通株式会社 | 符号化プログラム、符号化方法、符号化装置、復号化プログラム、復号化方法および復号化装置 |
JP6728926B2 (ja) * | 2016-04-18 | 2020-07-22 | 富士通株式会社 | 符号化処理プログラム、符号化処理装置、符号化処理方法、復号化処理プログラム、復号化処理装置および復号化処理方法 |
JP6737025B2 (ja) * | 2016-07-19 | 2020-08-05 | 富士通株式会社 | 符号化プログラム、検索プログラム、符号化装置、検索装置、符号化方法、及び検索方法 |
JP6680126B2 (ja) * | 2016-07-25 | 2020-04-15 | 富士通株式会社 | 符号化プログラム、符号化装置、符号化方法、及び検索方法 |
-
2016
- 2016-10-07 JP JP2016198914A patent/JP6737117B2/ja active Active
-
2017
- 2017-09-15 US US15/705,917 patent/US10942934B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10942934B2 (en) | 2021-03-09 |
US20180101580A1 (en) | 2018-04-12 |
JP2018060443A (ja) | 2018-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8117026B2 (en) | String matching method and system using phonetic symbols and computer-readable recording medium storing computer program for executing the string matching method | |
US9208450B1 (en) | Method and apparatus for template-based processing of electronic documents | |
CN107305586B (zh) | 索引生成方法、索引生成装置及搜索方法 | |
JP6447161B2 (ja) | 意味構造検索プログラム、意味構造検索装置、及び意味構造検索方法 | |
JP2017194803A (ja) | 符号化プログラム、符号化装置および符号化方法 | |
JP6737117B2 (ja) | 符号化データ検索プログラム、符号化データ検索方法および符号化データ検索装置 | |
JP6648431B2 (ja) | 照合プログラム、照合方法および照合装置 | |
US11055328B2 (en) | Non-transitory computer readable medium, encode device, and encode method | |
JP6805720B2 (ja) | データ検索プログラム、データ検索装置およびデータ検索方法 | |
EP3306823B1 (en) | Encoding program, encoding apparatus and encoding method | |
JP5342760B2 (ja) | 訳語学習のためのデータを作成する装置、方法、およびプログラム | |
JP7003427B2 (ja) | 検索プログラム、情報処理装置および検索方法 | |
KR101694179B1 (ko) | 모음 제거 기반 인덱스 생성 방법 및 장치 | |
Gupta et al. | Fast and effective searches of personal names in an international environment | |
JP2018190030A (ja) | 情報処理サーバ、その制御方法、及びプログラム、並びに、情報処理システム、その制御方法、及びプログラム | |
JP2001243245A (ja) | 類似文検索方法、装置、および類似文検索プログラムを記録した記録媒体 | |
US20210357438A1 (en) | Computer-readable recording medium, index creation device, index creation method, computer-readable recording medium, search device, and search method | |
JP4139805B2 (ja) | 字句をデータに変換する装置、方法及びプログラム | |
JP4061283B2 (ja) | 字句をデータに変換する装置、方法及びプログラム | |
JP2008293070A (ja) | 文書解析システム、および文書解析方法、並びにコンピュータ・プログラム | |
JP2005275880A (ja) | 字句をデータに変換する装置、方法及びプログラム | |
JP2016134754A (ja) | 変換処理プログラム、情報処理装置および変換処理方法 | |
JPH07160730A (ja) | 全文検索装置 | |
JPH0869455A (ja) | 文書検索方法,文書検索装置及び文書記憶装置 | |
JPH1166076A (ja) | データ派生装置及び方法、並びに、データ派生プログラムを格納した記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190709 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200204 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200131 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200323 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200616 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200629 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6737117 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |