JP2017021661A - 照合プログラム、照合方法および照合装置 - Google Patents
照合プログラム、照合方法および照合装置 Download PDFInfo
- Publication number
- JP2017021661A JP2017021661A JP2015139997A JP2015139997A JP2017021661A JP 2017021661 A JP2017021661 A JP 2017021661A JP 2015139997 A JP2015139997 A JP 2015139997A JP 2015139997 A JP2015139997 A JP 2015139997A JP 2017021661 A JP2017021661 A JP 2017021661A
- Authority
- JP
- Japan
- Prior art keywords
- collation
- data
- encoded
- byte
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】照合装置は、照合オートマトン50を有する。照合オートマトン50は、2バイトおよび3バイトの被照合単語コードが混在するテキストデータと、照合対象となる3バイトの照合単語コードとを比較する場合に、2バイトの被照合単語コードを、コード変換テーブル60を基にして、3バイトの被照合単語コードに変換する。照合オートマトン50は、被照合単語コードを3バイトのコードに変換した後に、照合単語コードと被照合単語コードとの比較を行う。
【選択図】図1
Description
受け付けた照合データを第1の符号化規則により第1の符号化フォーマットの符号化照合データに変換する処理と、
前記第1の符号化規則により前記第1の符号化フォーマットに符号化されるか、または、所定の変換規則により第2の符号化フォーマットにより符号化された符号化データを順次走査する処理と、
前記符号化照合データと前記符号化データを比較する処理と、を実行させ、
前記走査する処理の際に、前記第2の符号化フォーマットのデータを検出した場合は、前記所定の変換規則に基づいて前記第2の符号化フォーマットを前記第1の符号化フォーマットに変換後に、前記符号化照合データと比較する処理を実行させる、
ことを特徴とする照合プログラム。
受け付けた照合データを第1の符号化規則により第1の符号化フォーマットの符号化照合データに変換する処理と、
前記第1の符号化規則により前記第1の符号化フォーマットに符号化されるか、または、所定の変換規則により第2の符号化フォーマットにより符号化された符号化データを順次走査する処理と、
前記符号化照合データと前記符号化データを比較する処理と、を実行させ、
前記走査する処理の際に、前記第2の符号化フォーマットのデータを検出した場合は、前記所定の変換規則に基づいて前記第2の符号化フォーマットを前記第1の符号化フォーマットに変換後に、前記符号化照合データと比較する処理を実行させる、
ことを特徴とする照合方法。
受け付けた照合データを第1の符号化規則により第1の符号化フォーマットの符号化照合データに変換し、前記第1の符号化規則により前記第1の符号化フォーマットに符号化されるか、または、所定の変換規則により第2の符号化フォーマットにより符号化された符号化データを順次走査し、前記符号化照合データと前記符号化データを比較、前記走査する際に、前記第2の符号化フォーマットのデータを検出した場合は、前記所定の変換規則に基づいて前記第2の符号化フォーマットを前記第1の符号化フォーマットに変換後に、前記符号化照合データと比較する照合処理部と
を有することを特徴とする照合装置。
110 受付部
120 照合処理部
130 出力部
Claims (6)
- コンピュータに、
受け付けた照合データを第1の符号化規則により第1の符号化フォーマットの符号化照合データに変換する処理と、
前記第1の符号化規則により前記第1の符号化フォーマットに符号化されるか、または、所定の変換規則により第2の符号化フォーマットにより符号化された符号化データを順次走査する処理と、
前記符号化照合データと前記符号化データを比較する処理と、を実行させ、
前記走査する処理の際に、前記第2の符号化フォーマットのデータを検出した場合は、前記所定の変換規則に基づいて前記第2の符号化フォーマットを前記第1の符号化フォーマットに変換後に、前記符号化照合データと比較する処理を実行させる、
ことを特徴とする照合プログラム。 - 前記第1の符号化フォーマットの符号化データは、3バイトのコードであり、前記第2の符号化フォーマットの符号化データは、2バイトまたは1バイトのコードであることを特徴とする請求項1に記載の照合プログラム。
- 前記第1の符号化フォーマットの符号化データおよび前記第2の符号化フォーマットの符号化データは、所定のスペース付きの単語または文字列に対応付けられていることを特徴とする請求項2に記載の照合プログラム。
- 元のデータを前記第2の符号化フォーマットによる2バイトの符号化データに変換し、前記走査する処理の際に、前記2バイトの符号化データを検出した場合は、前記所定の変換規則に基づいて前記第2の符号化データを、前記第1の符号化フォーマットによる3バイトの符号化データに変換し、前記符号化照合データと比較する処理を実行させることを特徴とする請求項1に記載の照合プログラム。
- コンピュータが実行する照合方法であって、
受け付けた照合データを第1の符号化規則により第1の符号化フォーマットの符号化照合データに変換する処理と、
前記第1の符号化規則により前記第1の符号化フォーマットに符号化されるか、または、所定の変換規則により第2の符号化フォーマットにより符号化された符号化データを順次走査する処理と、
前記符号化照合データと前記符号化データを比較する処理と、を実行させ、
前記走査する処理の際に、前記第2の符号化フォーマットのデータを検出した場合は、前記所定の変換規則に基づいて前記第2の符号化フォーマットを前記第1の符号化フォーマットに変換後に、前記符号化照合データと比較する処理を実行させる、
ことを特徴とする照合方法。 - 受け付けた照合データを第1の符号化規則により第1の符号化フォーマットの符号化照合データに変換する受付部と、
受け付けた照合データを第1の符号化規則により第1の符号化フォーマットの符号化照合データに変換し、前記第1の符号化規則により前記第1の符号化フォーマットに符号化されるか、または、所定の変換規則により第2の符号化フォーマットにより符号化された符号化データを順次走査し、前記符号化照合データと前記符号化データを比較、前記走査する際に、前記第2の符号化フォーマットのデータを検出した場合は、前記所定の変換規則に基づいて前記第2の符号化フォーマットを前記第1の符号化フォーマットに変換後に、前記符号化照合データと比較する照合処理部と
を有することを特徴とする照合装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015139997A JP6648431B2 (ja) | 2015-07-13 | 2015-07-13 | 照合プログラム、照合方法および照合装置 |
EP16175430.4A EP3118755A1 (en) | 2015-07-13 | 2016-06-21 | Searching program, searching method, and searching device |
US15/187,995 US10664491B2 (en) | 2015-07-13 | 2016-06-21 | Non-transitory computer-readable recording medium, searching method, and searching device |
CN201610546697.1A CN106354746B (zh) | 2015-07-13 | 2016-07-12 | 搜索方法和搜索设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015139997A JP6648431B2 (ja) | 2015-07-13 | 2015-07-13 | 照合プログラム、照合方法および照合装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017021661A true JP2017021661A (ja) | 2017-01-26 |
JP6648431B2 JP6648431B2 (ja) | 2020-02-14 |
Family
ID=56148261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015139997A Active JP6648431B2 (ja) | 2015-07-13 | 2015-07-13 | 照合プログラム、照合方法および照合装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10664491B2 (ja) |
EP (1) | EP3118755A1 (ja) |
JP (1) | JP6648431B2 (ja) |
CN (1) | CN106354746B (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10395231B2 (en) | 2016-06-27 | 2019-08-27 | Altria Client Services Llc | Methods, systems, apparatuses, and non-transitory computer readable media for validating encoded information |
JP6737117B2 (ja) * | 2016-10-07 | 2020-08-05 | 富士通株式会社 | 符号化データ検索プログラム、符号化データ検索方法および符号化データ検索装置 |
CN109002423A (zh) * | 2017-06-06 | 2018-12-14 | 北大方正集团有限公司 | 文本搜索方法及装置 |
CN113535710B (zh) * | 2020-04-22 | 2023-12-15 | 中山大学 | 一种搜索方法、装置、终端设备及存储介质 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07287716A (ja) | 1994-02-22 | 1995-10-31 | Ricoh Co Ltd | 辞書検索装置 |
JPH1185459A (ja) | 1997-09-01 | 1999-03-30 | Denso Corp | 文字データ符号化方法および記録媒体 |
JPH11143877A (ja) * | 1997-10-22 | 1999-05-28 | Internatl Business Mach Corp <Ibm> | 圧縮方法、辞書の見出し語インデックス・データを圧縮するための方法、及び機械翻訳システム |
US20030206519A1 (en) * | 2002-05-03 | 2003-11-06 | Michael Sanders | System and method for encoding and decoding messages |
CN100504849C (zh) * | 2002-10-24 | 2009-06-24 | 国际商业机器公司 | 数据转换方法及设备 |
WO2004093462A1 (en) | 2003-04-17 | 2004-10-28 | Koninklijke Philips Electronics N.V. | Content analysis of coded video data |
KR20060132697A (ko) * | 2004-02-16 | 2006-12-21 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 트랜스코더 및 트랜스코딩 방법 |
US7779391B2 (en) * | 2006-09-05 | 2010-08-17 | International Business Machines Corporation | Method of employing instructions to convert UTF characters with an enhanced extended translation facility |
CN101211341A (zh) * | 2006-12-29 | 2008-07-02 | 上海芯盛电子科技有限公司 | 图像智能模式识别搜索方法 |
CN102662935A (zh) * | 2012-04-08 | 2012-09-12 | 北京语智云帆科技有限公司 | 一种交互式的机器翻译方法和机器翻译系统 |
JP2014002717A (ja) * | 2012-05-23 | 2014-01-09 | Denso Corp | 情報検索システム、中継サーバ、データ形式変換プログラム、及び、移動端末 |
CN105574037B (zh) * | 2014-10-16 | 2019-01-29 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及装置 |
-
2015
- 2015-07-13 JP JP2015139997A patent/JP6648431B2/ja active Active
-
2016
- 2016-06-21 EP EP16175430.4A patent/EP3118755A1/en not_active Ceased
- 2016-06-21 US US15/187,995 patent/US10664491B2/en active Active
- 2016-07-12 CN CN201610546697.1A patent/CN106354746B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
US10664491B2 (en) | 2020-05-26 |
CN106354746B (zh) | 2020-07-07 |
EP3118755A1 (en) | 2017-01-18 |
CN106354746A (zh) | 2017-01-25 |
JP6648431B2 (ja) | 2020-02-14 |
US20170017707A1 (en) | 2017-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6742692B2 (ja) | 符号化プログラムおよび伸長プログラム | |
US9425821B2 (en) | Converting device and converting method | |
JP6648431B2 (ja) | 照合プログラム、照合方法および照合装置 | |
JP6641857B2 (ja) | 符号化プログラム、符号化方法、符号化装置、復号化プログラム、復号化方法および復号化装置 | |
JP2017194803A (ja) | 符号化プログラム、符号化装置および符号化方法 | |
US9577666B2 (en) | Method and system | |
EP3306823B1 (en) | Encoding program, encoding apparatus and encoding method | |
JP6540308B2 (ja) | 符号化プログラム、符号化方法、符号化装置、復号化プログラム、復号化方法および復号化装置 | |
US11055328B2 (en) | Non-transitory computer readable medium, encode device, and encode method | |
JP6350296B2 (ja) | 処理プログラム、処理装置および処理方法 | |
EP3236368A1 (en) | Encoding processing program, encoding processing device, encoding processing method, decoding processing program, decoding processing device, and decoding processing method | |
US10942934B2 (en) | Non-transitory computer-readable recording medium, encoded data searching method, and encoded data searching apparatus | |
JP7159557B2 (ja) | 動的辞書の生成プログラム、動的辞書の生成方法および復号化装置 | |
JP2018067264A (ja) | データ検索プログラム、データ検索装置およびデータ検索方法 | |
US20150160876A1 (en) | Character data storing method and character data stornig device | |
US20210357438A1 (en) | Computer-readable recording medium, index creation device, index creation method, computer-readable recording medium, search device, and search method | |
JP2016134754A (ja) | 変換処理プログラム、情報処理装置および変換処理方法 | |
JP2020061641A (ja) | 符号化プログラム、符号化方法、符号化装置、復号化プログラム、復号化方法および復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180413 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190409 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190528 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191230 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6648431 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |