JP2008102641A - 検索装置、検索方法及びプログラム - Google Patents
検索装置、検索方法及びプログラム Download PDFInfo
- Publication number
- JP2008102641A JP2008102641A JP2006283227A JP2006283227A JP2008102641A JP 2008102641 A JP2008102641 A JP 2008102641A JP 2006283227 A JP2006283227 A JP 2006283227A JP 2006283227 A JP2006283227 A JP 2006283227A JP 2008102641 A JP2008102641 A JP 2008102641A
- Authority
- JP
- Japan
- Prior art keywords
- search
- data string
- unit
- data
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 34
- 238000012545 processing Methods 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 claims description 20
- 238000012795 verification Methods 0.000 claims 1
- 238000004364 calculation method Methods 0.000 abstract description 10
- 238000012423 maintenance Methods 0.000 abstract description 2
- 230000010365 information processing Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 10
- 230000002776 aggregation Effects 0.000 description 8
- 238000004220 aggregation Methods 0.000 description 8
- 230000004931 aggregating effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 108020004414 DNA Proteins 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】検索対象データ列を保持する検索対象データ列保持手段と、検索データ列を取得する検索データ列取得手段と、検索データ列取得手段において取得された検索データ列に対して、オブジェクトを用いる回数の範囲を、予め定められたルールに応じて設定する設定手段と、検索処理として、設定手段において設定された回数の範囲内で、オブジェクトを用いて、検索データ列取得手段において取得された検索データ列と、検索対象データ列保持手段において保持されている検索対象データ列と、の比較を行う検索手段と、を有することによって課題を解決する。
【選択図】図2
Description
以下、情報処理装置1の一例のハードウェア構成を図1に示す。図1は、情報処理装置1の一例のハードウェア構成図である。
ステップS10において、検索部24は、類似関係テーブル適用カウンタをリセットする(ゼロにする)。
例えば、
ア:0001、イ:0010、ウ:0100、エ:1000、
等4種類の文字を4ビットで、ア又はイ又はウ(=ア|イ|ウ)を論理和"0111"と表現し、検索部24は、検索文字と、検索対象文字とが一致するか否かを、ビット演算を用いて比較する。なお、説明の簡略化のため、文字を4ビットで表しているが、より多い種類の文字を表すのにもっと多いビット数を用いてもよい。また当然ながら、ビット数と種類の数が同じである必要は無い。
つまり、検索文字がア"0001"で、検索対象文字がア"0001"の場合、検索部24は、ビット積演算を行い、
0001&0001=0001≠0
と算出する。また、検索文字がア"0001"で、検索対象文字がイ"0010"の場合、検索部24は、ビット積演算を行い、
0001&0010=0000=0
と算出する。また、検索文字列が、検索対象文字列の中に一致する文字があるか否かを、ビット積演算を用いて比較することもできる。検索文字に類似関係テーブルを適用した検索文字が、ア又はイ又はウ "0111"で、検索対象文字がア "0001"の場合、検索部24は、ビット積演算を行い、
0111&0001=0001≠0
と算出する。このように、比較したい文字が複数あっても、1つの検索文字との比較を1回のビット積演算でまとめて行える為、計算効率が非常によくなっている。
つまり、残りの4番目と5番目の検索文字列を比較する処理(ステップ16、ステップ13)を実行しなくとも、検索対象文字列"アエユルレ"を、検索文字列"アイウエオ"に類似しない文字列として、判定することが可能となる。
図6は、情報処理装置1の一例の機能構成図(その2)である。図6に示されるように、情報処理装置1は、機能構成として、検索文字列取得部21と、設定部22と、ルール保持部23と、検索部24と、検索対象文字列保持部25と、類似関係テーブル保持部26と、検索結果集約部27と、ルール操作部28とを含む。
ルール操作部28は、入力装置11、表示装置12等を用いたユーザ操作に応じて、ルール保持部23に保持されているルールや、ルールに対応する類似関係テーブルの適用可能回数及び閾値等を、変更したり、新たなルールや、ルールに対応する類似関係テーブルの適用可能回数及び閾値等をルール保持部23に設定したりする。
上述した実施形態1では、ルールとして、「1音乃至2音が類似関係テーブルAの関係にある」を例に説明を行った。しかしながら、ルールが例えば、「1音乃至2音が類似関係テーブルA、又は類似関係テーブルB、又は類似関係テーブルCの関係にある」等の場合もある。このような場合、検索部24は、図5のステップS16において、検索文字と、検索対象文字とが類似しているか否かを、類似関係テーブルA、類似関係テーブルB、類似関係テーブルCを適用して比較する。この際、各テーブルに優先順位が付加されている場合は、検索部24は、その優先順位に応じて、類似関係テーブルを用いて比較を行う。
なお、上述した各実施形態を任意に組み合わせて実施してもよい。
11 入力装置
12 表示装置
13 記録媒体ドライブ装置
14 記録媒体
15 ROM
16 RAM
17 CPU
18 インターフェース装置
19 HD
21 検索文字列取得部
22 設定部
23 ルール保持部
24 検索部
25 検索対象文字列保持部
26 類似関係テーブル保持部
27 検索結果集約部
28 ルール操作部
Claims (12)
- 検索対象データ列を保持する検索対象データ列保持手段と、
検索データ列を取得する検索データ列取得手段と、
前記検索データ列取得手段において取得された検索データ列に対して、オブジェクトを用いる回数の範囲を、予め定められたルールに応じて設定する設定手段と、
検索処理として、前記設定手段において設定された回数の範囲内で、前記オブジェクトを用いて、前記検索データ列取得手段において取得された検索データ列と、前記検索対象データ列保持手段において保持されている検索対象データ列と、の比較を行う検索手段と、
を有することを特徴とする検索装置。 - 前記検索手段は、前記設定手段において設定された回数の範囲内で、前記オブジェクトを用いて、前記検索データ列を構成する単位データと、前記検索対象データ列を構成する単位データと、の比較を行うことを特徴とする請求項1に記載の検索装置。
- 前記検索手段は、前記検索データ列を構成する単位データと、前記検索対象データ列を構成する単位データと、の比較を、ビット積演算を用いて行うことを特徴とする請求項2に記載の検索装置。
- 前記検索手段は、前記検索データ列を構成する単位データと、前記検索対象データ列を構成する単位データと、の比較を、単位データ毎に行い、一致しない単位データが存在すると、前記設定手段において設定された回数の範囲内で、前記オブジェクトを用いて、前記一致しない単位データが、前記オブジェクトを適用できる単位データか否かの比較を行うことを特徴とする請求項2又は3に記載の検索装置。
- 前記設定手段は、単位データと、検索結果として出力すべき前記検索データ列に適用できる前記検索対象データに係る、類似単位データと、の関係を保持するテーブルをオブジェクトとして、前記検索データ列取得手段において取得された検索データ列に対して、前記オブジェクトを用いる回数の範囲を、予め定められたルールに応じて設定し、
前記検索手段は、前記検索データ列を構成する単位データと、前記検索対象データ列を構成する単位データと、の比較を、単位データ毎に行い、一致しない単位データが存在すると、前記設定手段において設定された回数の範囲内で、前記オブジェクトを用いて、前記一致しない単位データが、前記オブジェクトを適用できる単位データか否かの比較を行うことを特徴とする請求項2乃至4の何れか1項に記載の検索装置。 - 前記オブジェクトを複数有し、
前記検索手段は、検索処理として、前記設定手段において設定された回数の範囲内で、優先順位に応じて、前記複数の内の一のオブジェクトを用いて、前記検索データ列取得手段において取得された検索データ列と、前記検索対象データ列保持手段において保持されている検索対象データ列と、の比較を行うことを特徴とする請求項1乃至5の何れか1項に記載の検索装置。 - 前記検索手段は、前記オブジェクトを用いて、前記検索データ列を構成する単位データと、前記検索対象データ列を構成する単位データと、の比較を行った回数をカウントし、カウントした回数に応じて、前記検索データ列と、前記検証対象データ列との適用度に係る重み付けを行い、前記重み付けに応じて、前記検索データ列に適用する前記検索対象データ列を出力することを特徴とする請求項1乃至6の何れか1項に記載の検索装置。
- 検索対象データ列を保持する検索対象データ列保持手段と、
検索データ列を取得する検索データ列取得手段と、
検索処理として、前記検索データ列取得手段において取得された検索データ列と、前記検索対象データ列保持手段において保持されている検索対象データ列と、の比較を、ビット積演算を用いて行う検索手段と、
を有することを特徴とする検索装置。 - 前記検索手段は、前記検索データ列を構成する単位データと、前記検索対象データ列を構成する単位データと、の比較を、ビット積演算を用いて行うことを特徴とする請求項8に記載の検索装置。
- 検索装置における検索方法であって、
検索データ列を取得する検索データ列取得段階と、
前記検索データ列取得段階において取得された検索データ列に対して、オブジェクトを用いる回数の範囲を、予め定められたルールに応じて設定する設定段階と、
検索処理として、前記設定段階において設定された回数の範囲内で、前記オブジェクトを用いて、前記検索データ列取得段階において取得された検索データ列と、検索対象データ列を保持する検索対象データ列保持手段において保持されている検索対象データ列と、の比較を行う検索段階と、
を有することを特徴とする検索方法。 - 検索装置における検索方法であって、
検索データ列を取得する検索データ列取得段階と、
検索処理として、前記検索データ列取得段階において取得された検索データ列と、検索対象データ列を保持する検索対象データ列保持手段において保持されている検索対象データ列と、の比較を、ビット積演算を用いて行う検索段階と、
を有することを特徴とする検索方法。 - 請求項10又は11に記載の検索方法をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006283227A JP5190192B2 (ja) | 2006-10-18 | 2006-10-18 | 検索装置、検索方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006283227A JP5190192B2 (ja) | 2006-10-18 | 2006-10-18 | 検索装置、検索方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008102641A true JP2008102641A (ja) | 2008-05-01 |
JP5190192B2 JP5190192B2 (ja) | 2013-04-24 |
Family
ID=39436939
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006283227A Active JP5190192B2 (ja) | 2006-10-18 | 2006-10-18 | 検索装置、検索方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5190192B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110126610A (ko) | 2009-02-09 | 2011-11-23 | 제이엔씨 주식회사 | 액정 조성물 및 액정 표시 소자 |
KR20140014379A (ko) | 2009-05-29 | 2014-02-06 | 제이엔씨 주식회사 | 액정 조성물 및 액정 표시 소자 |
US11256756B2 (en) | 2016-02-22 | 2022-02-22 | Advanced New Technologies Co., Ltd. | Character string distance calculation method and device |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6027938A (ja) * | 1983-07-26 | 1985-02-13 | Fujitsu Ltd | 文字列比較装置 |
JPH07152774A (ja) * | 1993-11-30 | 1995-06-16 | Hitachi Ltd | 文書検索方法および装置 |
JPH0869474A (ja) * | 1994-08-29 | 1996-03-12 | Fujitsu Ltd | 類似文字列検索装置 |
JPH08180064A (ja) * | 1994-12-22 | 1996-07-12 | Canon Inc | 文書検索方法及び文書ファイリング装置 |
JPH11203315A (ja) * | 1998-01-14 | 1999-07-30 | Nec Corp | 記号列検索方法及び記号列検索装置並びに記号列検索プログラムを記録した記録媒体 |
JP2004054538A (ja) * | 2002-07-19 | 2004-02-19 | Nec Corp | 漢字コード変換システムおよび漢字コード変換方法 |
JP2005257954A (ja) * | 2004-03-10 | 2005-09-22 | Nec Corp | 音声検索装置、音声検索方法および音声検索プログラム |
-
2006
- 2006-10-18 JP JP2006283227A patent/JP5190192B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6027938A (ja) * | 1983-07-26 | 1985-02-13 | Fujitsu Ltd | 文字列比較装置 |
JPH07152774A (ja) * | 1993-11-30 | 1995-06-16 | Hitachi Ltd | 文書検索方法および装置 |
JPH0869474A (ja) * | 1994-08-29 | 1996-03-12 | Fujitsu Ltd | 類似文字列検索装置 |
JPH08180064A (ja) * | 1994-12-22 | 1996-07-12 | Canon Inc | 文書検索方法及び文書ファイリング装置 |
JPH11203315A (ja) * | 1998-01-14 | 1999-07-30 | Nec Corp | 記号列検索方法及び記号列検索装置並びに記号列検索プログラムを記録した記録媒体 |
JP2004054538A (ja) * | 2002-07-19 | 2004-02-19 | Nec Corp | 漢字コード変換システムおよび漢字コード変換方法 |
JP2005257954A (ja) * | 2004-03-10 | 2005-09-22 | Nec Corp | 音声検索装置、音声検索方法および音声検索プログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110126610A (ko) | 2009-02-09 | 2011-11-23 | 제이엔씨 주식회사 | 액정 조성물 및 액정 표시 소자 |
KR20140014379A (ko) | 2009-05-29 | 2014-02-06 | 제이엔씨 주식회사 | 액정 조성물 및 액정 표시 소자 |
US11256756B2 (en) | 2016-02-22 | 2022-02-22 | Advanced New Technologies Co., Ltd. | Character string distance calculation method and device |
Also Published As
Publication number | Publication date |
---|---|
JP5190192B2 (ja) | 2013-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6007784B2 (ja) | 文書分類装置及びプログラム | |
US8606779B2 (en) | Search method, similarity calculation method, similarity calculation, same document matching system, and program thereof | |
CN110750704A (zh) | 一种查询自动补全的方法和装置 | |
US10394763B2 (en) | Method and device for generating pileup file from compressed genomic data | |
JP6072922B2 (ja) | 文字列検索装置、文字列検索方法および文字列検索プログラム | |
JP5190192B2 (ja) | 検索装置、検索方法及びプログラム | |
JP4524640B2 (ja) | 情報処理装置および方法、並びにプログラム | |
JP6722565B2 (ja) | 類似文書抽出装置、類似文書抽出方法及び類似文書抽出プログラム | |
JP5439235B2 (ja) | 文書分類方法、文書分類装置、およびプログラム | |
JP2007199966A (ja) | 文書分類装置、文書分類方法および文書分類プログラム | |
JPH113343A (ja) | 情報検索装置 | |
JP2009098811A (ja) | 文書分類装置およびプログラム | |
JP4544047B2 (ja) | Web画像検索結果分類提示方法及び装置及びプログラム及びプログラムを格納した記憶媒体 | |
CN106971117B (zh) | 调查设备和调查方法 | |
JP2008070921A (ja) | 文書検索装置及び文書検索プログラム | |
JP2009211277A (ja) | 文書データ分類装置、文書データ分類方法、そのプログラム及び記録媒体 | |
JP2019148859A (ja) | フローダイアグラムを用いたモデル開発環境におけるデザインパターンの発見を支援する装置および方法 | |
JP2009245315A (ja) | 類似画像検索方法および装置 | |
JP4936455B2 (ja) | 文書分類装置、文書分類方法、プログラムおよび記録媒体 | |
JP5751318B2 (ja) | 文書分類装置、文書分類方法、及びプログラム | |
JP6577922B2 (ja) | 検索装置、方法、及びプログラム | |
JP6753190B2 (ja) | 文書検索装置及びプログラム | |
JP2019125025A (ja) | システム、文書データの管理方法、及びプログラム | |
JP2005242668A (ja) | パターンマッチング装置および方法ならびにプログラム | |
JP2001290826A (ja) | 文書分類装置、文書分類方法及び文書分類プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091009 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120406 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20121009 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121207 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20121218 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130115 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130128 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160201 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5190192 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |