JP2009042962A - 検索システム - Google Patents

検索システム Download PDF

Info

Publication number
JP2009042962A
JP2009042962A JP2007206324A JP2007206324A JP2009042962A JP 2009042962 A JP2009042962 A JP 2009042962A JP 2007206324 A JP2007206324 A JP 2007206324A JP 2007206324 A JP2007206324 A JP 2007206324A JP 2009042962 A JP2009042962 A JP 2009042962A
Authority
JP
Japan
Prior art keywords
feature
search
candidate
searcher
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007206324A
Other languages
English (en)
Inventor
Wakako Suganuma
輪香子 菅沼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nikon Corp
Original Assignee
Nikon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nikon Corp filed Critical Nikon Corp
Priority to JP2007206324A priority Critical patent/JP2009042962A/ja
Publication of JP2009042962A publication Critical patent/JP2009042962A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】誤った特徴量を入力した場合でも検索候補に目的の対象物が含まれる可能性を高める。
【解決手段】演算部16は、データベースに対し、複数の特徴項目に基づいて多変量解析を施すことにより、複数の要素を類似性に応じてグループ化する。検索エンジン12は、入力された特徴データを検索キーとしてデータベース11から該当する候補要素を一次候補として抽出する。演算部16は、上記グループ化情報に基づいて、一次候補が含まれるグループを選択し、選択されたグループ内の要素を最終候補要素として出力する。検索結果表示部14は、上記最終候補を表示する。
【選択図】図1

Description

本発明は、検索対象物の特徴に基づいて対象物の同定を行う検索システムに関する。
検索対象物の特徴を入力することで、その特徴情報を検索キーとしてデータベース検索を行い、その対象物の名前等の情報を報知する検索システムが知られている。通常、特徴を入力すべき項目(特徴項目)は複数あり、検索者がいずれの特徴項目を選択するかで検索結果(絞り込み数)は変わってくる。特許文献1の検索システムでは、効率的に候補を絞り込むために、検索対象物の特徴の確かさの分布の重なりが最も小さい特徴項目を選択することが記載されている。
特開2005−267609号公報(段落0145〜,図21)
しかしながら、効率的に候補を絞り込むための特徴項目が報知されたとしても、その特徴項目に対して誤った特徴量を入力すると、検索によって抽出された候補に目的の対象物が含まれず、再検索を余儀なくされることがある。また、入力される特徴量によっては、対象物とは全く異なる型の候補が抽出されることもある。
本発明は、複数の要素に対して特徴項目に関する特徴データが対応づけられて成るデータベースを用い、特徴データに基づいて前記データベースから候補要素を抽出する検索システムに適用され、データベースに対し、特徴項目に基づいて解析を施すことにより、複数の要素を類似性に応じてグループ化する解析手段と、解析手段によって得られたグループ化情報と、特徴データとに基づいてデータベースから前記候補要素を抽出する抽出手段と、抽出された候補要素を検索者に報知する報知手段とを具備することを特徴とする。
解析が、複数の特徴項目に基づく多変量解析であってもよい。
特徴データを検索キーとしてデータベースから該当する候補要素を一次候補として抽出するとともに、グループ化情報に基づいて、上記一次候補が含まれるグループを選択し、選択されたグループ内の要素を最終候補要素として出力するようにしてもよい。検索者による検索時の特徴項目の入力履歴を記憶し、その記憶情報に基づいて、入力頻度が所定値以上の複数の特徴項目を特定する項目特定手段を備え、全特徴項目のうち上記項目特定手段によって特定された複数の特徴項目のみに基づいて多変量解析を行うようにしてもよい。あるいは、全特徴項目のうち検索者が予め指定した複数の特徴項目のみに基づいて多変量解析を行うようにしてもよい。
類似性の閾値を変更することで、グループ化状況を変更可能としてもよい。
本発明によれば、誤った特徴量を入力した場合でも検索候補に目的の対象物が含まれる可能性を高めることができる。
以下、本発明を花情報検索システムに適用した場合の一実施形態を説明する。
花情報検索システムは、花の画像から抽出した花の特徴、または検索者が入力した特徴を検索キーとして、データベースからその花の名前や生態情報などを検索し、検索結果を検索者に報知するものである。
システムの形態としては、データベースや検索エンジンなどをネットワーク上のサーバに置き、検索者が端末からサーバに特徴情報を送信し、検索結果を端末で受け取って表示装置に表示する方式が考えられる。この場合、検索者が使う端末は、表示装置を有するものであれば種類は問わず、パーソナルコンピュータでもよいし、デジタルカメラ、携帯電話機、PDAなどの携帯機器でもよい。あるいは、データベース、検索エンジン、表示装置を一台の装置に収容してなる検索装置でもよい。
このような検索システムを用いれば、例えば野山や山里を散策中に名前の知らない花を見つけた場合、その花を撮影するか、あるいはその場合で花の特徴を入力することで、手軽に花の名前等を知ることができる。
図1は本実施形態における花情報検索システムの構成図である。上述したネットワークを用いたシステムの場合は、データベース11および検索エンジン12はサーバに設けられ、特徴入力部13、検索結果表示部14、記憶部15および演算部16は検索者の端末に設けられる。
データベース11には、例えば図2に示すように、複数の要素(花の種名)に対し、それぞれの花が有する複数の特徴データが格納されている。特徴項目としては、図に示した「花の色」,「葉の形」,「おしべ」の他に、「花冠」,「花のつき方」,「葉の単複」など数多くの項目が存在する。またデータベース11には、各花の画像も格納されている。
次に、検索について説明する。
検索時、特徴入力部13は表示画面に複数の特徴項目を表示し、検索者に特徴入力を促す。検索者は、表示された特徴項目の少なくとも1つに対し、特徴入力部13から特徴量を入力する。1つの特徴項目だけでは大きく絞り込めないため、通常は複数の特徴項目に対して特徴量を入力する。入力については、特徴項目ごとに幾つかの特徴量の選択肢が用意されており、その中から該当する特徴量を検索者が選択する方式が便利である。入力後に検索開始操作がなされると、検索エンジン12が入力された特徴量を検索キーとしてデータベース検索を行い、候補を抽出する。
検索の結果、抽出された候補が検索結果表示部14に表示される。その際、検索された花の名前や生態情報を、その花の画像とともに表示することが望ましい。通常は複数の候補が抽出され、それらが一覧表示される。検索者は、検索に供した花の実物あるいは撮影画像と、候補として表示された花の画像とを見比べ、一致するか否かを判断し、一致するものが見つかれば検索終了となる。
なお、一致するものが見つかった場合、つまり検索者が目的の花を特定した場合は、それを登録できるようにしてもよい。例えば、一覧表示された候補中から特定した花を選択し、所定の登録操作を行うと、特定した花の種名を名称としたフォルダが作成され、そのフォルダ内にその花の画像(検索に供した画像)が格納されるようにしてもよい。
ところで、特徴入力に際し、検索者は必ずしも正確な情報を入力するとは限らず、例えば、花びらの枚数やおしべの数を間違えて入力したり、葉の形状などを誤認して入力するようなことが往々にしてある。入力された特徴が正確でない場合、検索によって抽出された候補中に目的の花が含まれない可能性が高く、この場合、検索者は無駄な照合作業を行った上に、再検索を余儀なくされる。これを防止するするため、本実施形態では、特徴の類似性を加味して最終的な候補を決定するようにした。
類似性の判断は、多変量解析を用いて行う。ここでは、多変量解析として階層的クラスター分析を用いるものとする。まず、予め複数の特徴データを類似性の観点に基づいて数値化しておく。例えば、特徴項目として「葉の形」を挙げた場合、その特徴量である「中広」と「基広」は似ている(間違えやすい)ので、両者間の距離(ユークリッド距離等)が短くなるように、また「複葉」と「単葉」は容易に区別できるので、両者間の距離が長くなるように数値化する。同様に「葉の縁」については、「鋸歯」と「重鋸歯」は似ているので距離が短くなるようにする。花びらやおしべの数はもともと数値化されているので、そのまま用いる。
クラスター分析に供するデータは、検索者が頻繁に選択する特徴項目と全要素との各組み合わせ対して数値化されたデータである。例えば、専ら「花の色」「葉の形」「おしべ」「葉の付き方」の特徴量を入力して検索を行う検索者であれば、この4項目と全要素との組み合わせデータに対して演算部16がクラスター分析を行い、全要素を類似性に基づいてグループ分けする。この分析結果は、次回からの検索処理に用いるため記憶部15に記憶される。
検索者が頻繁に選択する特徴項目は、検索者の入力履歴に基づいて特定することができる。例えば、一連の検索処理が実行されるたび、検索者が選択した特徴項目(特徴量を入力した特徴項目)が記憶部15に蓄積記憶される。検索回数が所定値に達すると、演算部16は蓄積された記憶情報を分析し、全検索回数のうち所定回数以上(例えば、80%以上)の検索で選択された特徴項目がある場合、それを検索者が頻繁に選択する特徴項目と認定する。この頻繁に選択する特徴項目が複数認定されると、演算部16がそれらの項目に基づくクラスター分析を行い、分析結果を記憶する。なお、頻繁に選択する特徴項目が特定されるまでは、クラスター分析結果を用いない通常の検索処理がなされることになる。
ここで、クラスター分析の分析結果は、例えば図3のような樹状図(デンドログラム)で表すことができる。図3のうち下側の数字は要素を、縦軸はクラスターの高さ(距離)を、横線Lは高さの閾線を表し、閾線Lの位置によってグループ分けが決まる。高さが低いほど類似性が高いので、閾線Lの位置を下げるほどグループ数は増え、各グループに含まれる要素数は少なくなる。
クラスター分析の結果が記憶された後の検索について説明する。
この場合も検索者は、通常どおり幾つかの特徴項目(頻繁に選択する特徴項目である可能性が高い)に対して特徴量を入力し、検索開始を指示する。検索エンジン12は、まず検索者が入力した特徴量の組み合わせでAND検索を行って一次候補を抽出する。抽出された一次候補は演算部16に入力され、演算部16は、上記クラスター分析の結果に基づき、一次候補が含まれるグループを選択する。選択されるグループは、上記樹状図上の閾線Lの位置によって異なる。また、一次候補は、検索者が選択した(特徴量を入力した)特徴項目の組み合わせによって異なるため、それによっても選択されるグループは異なる。AND検索による検索候補数が多い場合は、複数のグループが選択されることもある。
次に演算部16は、選択された全グループ内の全ての要素を抽出し、それらを最終の検索候補として検索結果表示部14に表示する。検索者は、表示された最終候補と目的の花とを順に照合し、一致するものを見つける。
ここで、要素のグループ分けの仕方、つまり樹状図上の閾線Lの位置は、検索者が自由に設定できるようにすることが望ましい。例えば、検索に先だち、候補数が少なくなるように閾線Lを低い位置に設定しておき、検索候補中に目的の花が存在しない場合は、閾線Lの位置を上にシフトして候補を増やすといった使い方が考えられる。あるいは、当初は閾線Lを適当な位置に設定しておき、候補数が多すぎる場合に閾線Lを下げるような使い方も可能である。閾線Lの移動によってグループ分け状況が変わり、新たに設定されたグループ内の全要素が改めて抽出され、最終候補として表示される。グループ分けの変更は、上記一次候補の抽出結果には影響を及ぼさないので、一次候補の抽出(AND検索)を改めてやり直す必要はなく、短時間で結果表示の切換えが行える。
以上のように本実施形態では、クラスター分析の分析結果に基づいて最終候補を抽出することで、検索者が頻繁に選択する特徴項目に関して類似性の高い候補が最終候補として表示される。したがって、いずれかの項目の特徴量が誤っていても、他の特徴項目の特徴量が正確であれば、最終候補に目的の花が含まれる可能性は高い。また、例えばおしべが6本の花に対して5本と入力したような場合、6本と5本では類似性が極めて高いので、他の特徴項目に拘わらず最終候補に目的の花が含まれる可能性は高い。さらに、類似性を加味しているので、目的の花と全く型の異なるものが候補として表示されるといった不都合もない。
クラスター分析の結果は、必要に応じて自動的に更新されるようにすることが望ましい。すなわち、一度クラスター分析の結果が記憶された後も検索者の入力履歴を蓄積記憶し、その記憶内容を分析する。その結果、所定頻度以上の条件を満たす特徴項目が新たに加わったり、逆に条件を満たしていたものが満たさなるといった変更が認められたら、変更後の特徴項目に基づいてクラスター分析を行い、結果を更新記憶する。次回からは、更新された分析結果に基づいて最終候補が抽出される。これによれば、検索者の花に対する着眼点が変わっても適正な候補を表示することが可能となる。
以上では、検索者の入力履歴に基づいてクラスター分析に用いる特徴項目を決めるようにしたが、これを検索者の指示によって決めてもよい。例えば、所定の項目選択画面で、検索者が「花の色」「葉の形」「おしべ」「葉の付き方」を選択すると、これら4項目に基づくクラスター分析がなされ、その結果が記憶されるようにしてもよい。また検索の都度、検索者が特徴量を入力した特徴項目に基づいてクラスター分析が行われるようにしてもよい。
さらに、クラスター分析以外の多変量解析(例えば、主成分分析、多次元尺度構成法など)を用いてもよい。また、例えば項目が色情報に関するものであれば、色座標を尺度とした類似度を設定するなど、項目ごとに類似度を設定できる尺度を設けてもよい。
また、実施形態では検索者が特徴量を入力する例を説明したが、本発明は、画像から特徴を自動抽出する場合においても適用可能である。特に特徴量を画像から自動的に抽出する場合には、画像から対象物を抽出した上でさらに、特徴量を抽出するという複雑な過程を経る場合が多く、許容差の大きい特徴量の入力が必要となるため、本発明を用いることによって検索候補に目的の対象物が含まれる可能性を高めることができる。
さらに、花情報検索システムについて説明したが、他の検索システム(例えば、鳥や、昆虫、魚、人工物などを対象とする検索システム)にも本発明を適用可能である。
本発明の一実施形態における検索システムの概略構成図。 データベースの一例を示す図。 階層的クラスター分析の結果の一例を示す図。
符号の説明
11 データベース
12 検索エンジン
13 特徴入力部
14 検索結果表示部
15 記憶部
16 演算部

Claims (6)

  1. 複数の要素に対して特徴項目に関する特徴データが対応づけられて成るデータベースを用い、特徴データに基づいて前記データベースから候補要素を抽出する検索システムにおいて、
    前記データベースに対し、特徴項目に基づいて解析を施すことにより、前記複数の要素を類似性に応じてグループ化する解析手段と、
    前記解析手段によって得られたグループ化情報と、前記特徴データとに基づいて前記データベースから前記候補要素を抽出する抽出手段と、
    前記抽出された候補要素を検索者に報知する報知手段とを具備することを特徴とする検索システム。
  2. 前記解析が、複数の前記特徴項目に基づく多変量解析であることを特徴とする請求項1に記載の検索システム。
  3. 前記抽出手段は、前記特徴データを検索キーとして前記データベースから該当する候補要素を一次候補として抽出する一次候補抽出手段と、前記グループ化情報に基づいて、前記一次候補が含まれるグループを選択し、選択されたグループ内の要素を最終候補要素として出力する最終候補抽出手段とから成ることを特徴とする請求項2に記載の検索システム。
  4. 検索者による検索時の特徴データの入力履歴を記憶し、その記憶情報に基づいて、入力頻度が所定値以上の複数の特徴項目を特定する項目特定手段を備え、
    前記解析手段は、全特徴項目のうち前記項目特定手段によって特定された複数の特徴項目のみに基づいて前記多変量解析を行うことを特徴とする請求項2または3に記載の検索システム。
  5. 前記解析手段は、全特徴項目のうち検索者が予め指定した複数の特徴項目のみに基づいて前記多変量解析を行うことを特徴とする請求項2または3に記載の検索システム。
  6. 類似性の閾値を変更することで、前記グループ化状況を変更可能としたことを特徴とする請求項1〜5のいずれか1項に記載の検索システム。
JP2007206324A 2007-08-08 2007-08-08 検索システム Pending JP2009042962A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007206324A JP2009042962A (ja) 2007-08-08 2007-08-08 検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007206324A JP2009042962A (ja) 2007-08-08 2007-08-08 検索システム

Publications (1)

Publication Number Publication Date
JP2009042962A true JP2009042962A (ja) 2009-02-26

Family

ID=40443656

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007206324A Pending JP2009042962A (ja) 2007-08-08 2007-08-08 検索システム

Country Status (1)

Country Link
JP (1) JP2009042962A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202994A (zh) * 2016-07-04 2016-12-07 上海交通大学 一种生物物种或组织的全息化鉴定方法及系统
US11100365B2 (en) 2019-07-01 2021-08-24 Keysight Technologies, Inc. Apparatus and method for interactively viewing and clustering data segments from long data recordings

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63282569A (ja) * 1986-11-26 1988-11-18 Rateio Internatl:Kk コンピユ−タによる視覚情報からの動植物名検索方法
JP2002312400A (ja) * 2001-04-17 2002-10-25 Fuji Photo Film Co Ltd リスト表示方法および装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63282569A (ja) * 1986-11-26 1988-11-18 Rateio Internatl:Kk コンピユ−タによる視覚情報からの動植物名検索方法
JP2002312400A (ja) * 2001-04-17 2002-10-25 Fuji Photo Film Co Ltd リスト表示方法および装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106202994A (zh) * 2016-07-04 2016-12-07 上海交通大学 一种生物物种或组织的全息化鉴定方法及系统
US11100365B2 (en) 2019-07-01 2021-08-24 Keysight Technologies, Inc. Apparatus and method for interactively viewing and clustering data segments from long data recordings

Similar Documents

Publication Publication Date Title
US10755086B2 (en) Picture ranking method, and terminal
CN109643304B (zh) 交互式图形表示中显示商标查询检索结果的系统和方法
CN109086394B (zh) 搜索排序方法、装置、计算机设备和存储介质
US9471603B2 (en) Method, apparatus and computer-readable recording medium for managing images in image database
US20180157682A1 (en) Image information processing system
US8762390B2 (en) Query specific fusion for image retrieval
EP2618290A2 (en) Method and apparatus to incorporate automatic face recognition in digital image collections
AU2016201273B2 (en) Recommending form fragments
WO2018188378A1 (zh) 一种给应用标注标签的方法、装置、终端及计算机可读存储介质
JP5670787B2 (ja) 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム
US20220067343A1 (en) Information processing apparatus, information processing method, and storage medium
CN112966758B (zh) 一种农作物病虫草害识别方法、装置、系统及存储介质
KR20150137006A (ko) 주석 디스플레이 보조 장치 및 주석 디스플레이를 보조하는 방법
JP6377917B2 (ja) 画像検索装置及び画像検索プログラム
US9621505B1 (en) Providing images with notifications
JP6453502B1 (ja) 特許調査支援方法
JP6314071B2 (ja) 情報処理装置、情報処理方法及びプログラム
US10606878B2 (en) Technology for visualizing clusters of electronic documents
JP2009042962A (ja) 検索システム
JP6958647B2 (ja) 検索装置、方法、およびプログラム
US9036946B2 (en) Image processing apparatus that retrieves similar images, method of controlling the same, and storage medium
JP6062981B2 (ja) 映像検索装置、方法、及びプログラム
US11386340B2 (en) Method and apparatus for performing block retrieval on block to be processed of urine sediment image
KR102086610B1 (ko) 다중 키워드 도메인 기반 공간-키워드 검색 장치 및 방법, 이를 기록한 기록매체
JP2010009337A (ja) アノテーション装置、アノテーション方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100723

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120607

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120612

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120810

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20120810

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130212