JP2016110389A - 検索装置、方法及びプログラム - Google Patents

検索装置、方法及びプログラム Download PDF

Info

Publication number
JP2016110389A
JP2016110389A JP2014247287A JP2014247287A JP2016110389A JP 2016110389 A JP2016110389 A JP 2016110389A JP 2014247287 A JP2014247287 A JP 2014247287A JP 2014247287 A JP2014247287 A JP 2014247287A JP 2016110389 A JP2016110389 A JP 2016110389A
Authority
JP
Japan
Prior art keywords
symbol
element information
search
content
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014247287A
Other languages
English (en)
Other versions
JP2016110389A5 (ja
Inventor
俊信 中洲
Toshinobu Nakasu
俊信 中洲
雄土 山地
Yuto Yamaji
雄土 山地
智行 柴田
Satoyuki Shibata
智行 柴田
山口 修
Osamu Yamaguchi
修 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2014247287A priority Critical patent/JP2016110389A/ja
Priority to CN201510658506.6A priority patent/CN105678210A/zh
Priority to US14/938,648 priority patent/US20160162440A1/en
Publication of JP2016110389A publication Critical patent/JP2016110389A/ja
Publication of JP2016110389A5 publication Critical patent/JP2016110389A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】検索に用いた情報と検索結果との対応をユーザに把握させ易くすることができる検索装置、方法及びプログラムを提供する。【解決手段】実施形態の検索装置は、受付部と、検索部と、生成部と、表示制御部と、を備える。受付部は、1以上の第1構成要素の種別、位置、大きさ、形状、及び色の少なくともいずれかである第1要素情報を指定して、当該1以上の第1構成要素をシンボル化したシンボルデータの入力を受け付ける。検索部は、シンボルデータに基づいて、コンテンツを検索する。生成部は、コンテンツが有する1以上の第2構成要素の種別、位置、大きさ、形状、及び色の少なくともいずれかである第2要素情報に基づいて、当該1以上の第2構成要素をシンボル化したシンボル画像を生成する。表示制御部は、シンボル画像を表示部に表示する。【選択図】図1

Description

本発明の実施形態は、検索装置、方法及びプログラムに関する。
従来から、ユーザが手書きで入力したクエリを用いて、文書を検索する技術が知られている(例えば、特許文献1参照)。
特開2008−77382号公報
しかしながら、上述したような従来技術では、検索結果には、ユーザが検索に用いた情報以外の情報も含まれているため、ユーザは、検索に用いた情報と検索結果との対応を把握しづらい。
本発明が解決しようとする課題は、検索に用いた情報と検索結果との対応をユーザに把握させ易くすることができる検索装置、方法及びプログラムを提供することである。
実施形態の検索装置は、受付部と、検索部と、生成部と、表示制御部と、を備える。受付部は、1以上の第1構成要素の種別、位置、大きさ、形状、及び色の少なくともいずれかである第1要素情報を指定して、当該1以上の第1構成要素をシンボル化したシンボルデータの入力を受け付ける。検索部は、前記シンボルデータに基づいて、コンテンツを検索する。生成部は、前記コンテンツが有する1以上の第2構成要素の種別、位置、大きさ、形状、及び色の少なくともいずれかである第2要素情報に基づいて、当該1以上の第2構成要素をシンボル化したシンボル画像を生成する。表示制御部は、前記シンボル画像を表示部に表示する。
本実施形態の検索装置の例を示す構成図。 本実施形態の検索対象のコンテンツの例を示す図。 本実施形態の手書きのシンボルデータの例を示す図。 本実施形態の検索結果の例を示す図。 本実施形態の検索対象のコンテンツの例を示す図。 本実施形態の手書きのシンボルデータの例を示す図。 本実施形態の手書きのシンボルデータの例を示す図。 本実施形態の手書きのシンボルデータの例を示す図。 本実施形態の手書きのシンボルデータの例を示す図。 本実施形態の手書きのシンボルデータの例を示す図。 本実施形態の表示画面の例を示す図。 本実施形態の表示画面の例を示す図。 本実施形態の表示画面の例を示す図。 本実施形態の表示画面の例を示す図。 本実施形態の表示画面の例を示す図。 本実施形態の処理例を示すフローチャート。 変形例3の検索対象のコンテンツの例を示す図。 変形例3のシンボルデータの例を示す図。 実施形態及び各変形例の検索装置のハードウェア構成例を示す図。
以下、添付図面を参照しながら、実施形態を詳細に説明する。
図1は、本実施形態の検索装置10の一例を示す構成図である。図1に示すように、検索装置10は、記憶部11と、入力部13と、受付部15と、検索部17と、生成部19と、表示制御部21と、表示部23と、を備える。
検索装置10は、例えば、デジタルペンを使用した入力が可能なタブレット端末、スマートフォン、又はPC(Personal Computer)などにより実現できる。
記憶部11は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、メモリカード、光ディスク、RAM(Random Access Memory)、及びROM(Read Only Memory)などの磁気的、光学的、又は電気的に記憶可能な記憶装置により実現できる。
入力部13は、例えば、デジタルペン及びタッチパネルディスプレイなどの手書き入力可能な入力装置により実現できる。受付部15、検索部17、生成部19、及び表示制御部21は、例えば、CPU(Central Processing Unit)などの処理装置にプログラムを実行させること、即ち、ソフトウェアにより実現してもよいし、IC(Integrated Circuit)などのハードウェアにより実現してもよいし、ソフトウェア及びハードウェアを併用して実現してもよい。表示部23は、例えば、タッチパネルディスプレイなどの表示装置により実現できる。
記憶部11は、コンテンツと当該コンテンツが有する1以上の構成要素の種別、位置、大きさ、形状、及び色の少なくともいずれかである要素情報とを対応付けたレコードを複数記憶する。
本実施形態では、コンテンツは、文書作成ソフトウェア、表計算ソフトウェア、プレゼンテーションソフトウェア、及び文書閲覧ソフトウェア等で作成された文書やWebページなどのデジタル文書や、ユーザが手書きデータを入力することで作成された手書き文書などを想定しているが、これに限定されるものではなく、静止画や動画などであってもよい。
以下では、ユーザが入力部13から指定する1以上の構成要素を1以上の第1構成要素、1以上の第1構成要素の種別、位置、大きさ、形状、及び色の少なくともいずれかである要素情報を第1要素情報と称する。
同様に、コンテンツが有する1以上の構成要素を1以上の第2構成要素、1以上の第2構成要素の種別、位置、大きさ、形状、及び色の少なくともいずれかである要素情報を第2要素情報と称する。なお第2要素情報は、1以上の第2構成要素間の相対位置関係を更に示してもよい。
第2構成要素は、コンテンツ上のユーザが認知可能な領域である。第2構成要素の位置は、例えば、ページ上の座標情報などが挙げられる。第2構成要素間の相対位置関係は、両第2構成要素の位置(座標情報)から特定できる。
第2構成要素の種別は、例えば、文字、図形、表、画像、絵、数式、地図、及びユーザが追記したメモ(アノテーション)などの少なくともいずれかとすることができる。なお、第2構成要素の種別が文字の場合、段落、行、単語、1文字、部首など、種別を更に細分化してもよい。また、第2構成要素の種別が図形や表の場合、直線、三角、四角、及び円など、カテゴリを更に細分化してもよい。
また、第2構成要素の種別が画像の場合、画像内の物体やエッジなど、種別を更に細分化してもよい。画像内の物体を認識するには、例えば、Jim Mutch and David G. Lowe. Multiclass Object Recognition with Sparse, Localized Features. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 11-18, New York, June 2006.に開示された物体認識手法を用いればよい。エッジは、画像内において輝度値や色が鋭敏に変化した線である。なお、例えば、第2構成要素の種別を、赤、青、及び緑など色としてもよい。また、例えば、第2構成要素の種別を、濃い、及び薄いなど密度としてもよい。
コンテンツがデジタル文書の場合、文書情報として、第2構成要素の種別、位置、大きさ、形状、及び色、並びに第2構成要素間の相対位置関係を特定可能な情報を含んでいる。このため、コンテンツがデジタル文書の場合、当該コンテンツを解析することで、第2要素情報を生成できる。
また、コンテンツが手書き文書の場合も、手書きデータを構成するストロークそれぞれが属するクラスや位置を解析することで、第2構成要素の種別、位置、大きさ、形状、及び色、並びに第2構成要素間の相対位置関係を特定できる。クラスは、例えば、文字、図形、表、画像、絵、数式、地図、及びユーザが追記したメモなどの少なくともいずれかである。このため、コンテンツが手書きデータの場合も、当該コンテンツを解析することで、第2要素情報を生成できる。
なお、ストロークが属するクラスは、ストロークの集合を空間的又は時間的まとまりで構造化し、構造化した構造単位で、当該構造に帰属するストロークが属するクラスを決定する手法や、ストローク毎に、当該ストロークの周囲に存在する1以上の周辺ストロークを抽出し、当該ストロークと抽出した1以上の周辺ストロークとの組合せの特徴に関する組合せ特徴量を算出し、算出した組合せ特徴量で当該ストロークが属するクラスを決定する手法などで決定しておけばよい。
組合せ特徴量は、対象ストロークと1以上の周辺ストロークの少なくともいずれかとの関係を示す第1特徴量を含む。また、組合せ特徴量は、対象ストロークの形状に関する特徴量と1以上の周辺ストロークそれぞれの形状に関する特徴量との総和である総和値を用いた第2特徴量を含む。
第1特徴量は、対象ストロークと1以上の周辺ストロークの少なくともいずれかとの形状の類似度、及び対象ストロークと1以上の周辺ストロークの少なくともいずれかとの位置関係を特定する特定値の少なくとも一方である。
形状の類似度は、例えば、対象ストロークと1以上の周辺ストロークの少なくともいずれかとの長さ、曲率総和、主成分方向、外接矩形面積、外接矩形長、外接矩形縦横比、始点・終点距離、方向密度ヒストグラム、及び屈曲点数の少なくともいずれかの類似度である。つまり、形状の類似度は、例えば、対象ストロークのストローク特徴量と1以上の周辺ストロークの少なくともいずれかのストローク特徴量との類似度とすることができる。
特定値は、例えば、対象ストロークと1以上の周辺ストロークの少なくともいずれかとの外接矩形の重なり率、重心距離、重心距離の方向、端点距離、端点距離の方向、及び交差点数の少なくともいずれかである。
第2特徴量は、例えば、組合せの外接矩形長に対する対象ストロークの長さと1以上の周辺ストロークそれぞれの長さとの総和の比、対象ストローク及び1以上の周辺ストロークの方向密度ヒストグラムの総和値、及び組合せの外接矩形面積に対する対象ストロークの外接矩形面積と1以上の周辺ストロークそれぞれの外接矩形面積との総和の比の少なくともいずれかである。
入力部13は、1以上の第1構成要素の種別、位置、大きさ、形状、及び色の少なくともいずれかである第1要素情報を指定して、当該1以上の第1構成要素をシンボル化したシンボルデータを入力する。シンボルデータは、1以上の第1構成要素それぞれの位置が指定されることで、1以上の第1構成要素間の相対位置関係も指定される。
本実施形態では、1以上の第1構成要素は、同一ページ上に存在し、1以上の第1構成要素それぞれの位置は、当該同一ページ上の位置であるものとするが、これに限定されるものではない。
また本実施形態では、入力部13はデジタルペン及びタッチパネルディスプレイであり、ユーザがデジタルペンや指を用いてタッチパネルディスプレイ上で第1要素情報をアイコンなどで指定したり、手書きすることで指定したりすることにより、シンボルデータを入力する。但し、これに限定されず、例えば、入力部13をタッチパッドやマウスなどで実現してもよい。
なお、ストロークは、ユーザが手書した第1要素情報の1画、即ち、デジタルペンや指がタッチパネルディスプレイの入力面に接してから離れるまで(ペンダウンからペンアップまで)の軌跡を示すデータであり、例えば、デジタルペンや指と入力面との接点の時系列の座標値として表すことができる。
受付部15は、入力部13からシンボルデータの入力を受け付ける。
検索部17は、受付部15により受け付けられたシンボルデータに基づいて、コンテンツを検索する。具体的には、検索部17は、受付部15により受け付けられたシンボルデータに基づいて、記憶部11から第1要素情報と類似する第2要素情報を含むレコードを検索する。
例えば、検索部17は、第1要素情報が示す1以上の第1構成要素それぞれの位置、大きさ、形状、及び色をそれぞれ量子化する。また検索部17は、記憶部11からレコードを取得し、当該レコードに含まれる第2要素情報が示す1以上の第2構成要素それぞれの位置、大きさ、形状、及び色をそれぞれ量子化する。
次に検索部17は、1以上の第1構成要素それぞれ毎に、当該第1構成要素の位置、大きさ、形状、及び色の量子化値を、それぞれ、1以上の第2構成要素それぞれの位置、大きさ、形状、及び色の量子化値と比較する。そして検索部17は、一致する量子化値の割合が所定割合以上であり、かつ当該第1構成要素の種別と当該第2構成要素の種別が一致すれば、当該第1構成要素に類似する第2構成要素と判定する。更に検索部17は、1以上の第1構成要素と一致する第2構成要素の割合を類似度とし、類似度が閾値以上であれば、第1要素情報と類似する第2要素情報となる。
また例えば、検索部17は、第1構成要素と第2構成要素との類似を、第1構成要素と第2構成要素との差が予め定義した差分特徴の範囲内に収まるか否かで判定してもよい。この場合、カテゴリの差分特徴は、カテゴリ間の意味的な近接関係を使用でき、位置の差分特徴は、座標間距離を画像サイズで正規化した距離を使用でき、大きさの差分特徴は、アスペクト比を使用でき、形状の差分特徴は、外接形状のエッジ情報の相関性を使用でき、色の差分特徴は、色ヒストグラムを使用できる。
また例えば、検索部17は、第1構成要素と第2構成要素との類似を、識別器を用いて判定してもよい。この場合、識別器は、主観的に一致すると判定された構成要素対と主観的に一致しないと判定された構成要素対とを統計データとして差分特徴を用いた2クラス問題として、SVM(Support Vector Machine)などの一般的な機械学習の手法で学習されたものを用いればよい。
なお、検索部17は、入力部13から検索操作の入力が行われ、受付部15が当該検索操作の入力を受け付けると、コンテンツを検索するようにしてもよいし、シンボルデータの入力が完了すると(例えば、シンボルデータの入力がペンアップされると)、コンテンツを検索するようにしてもよい。検索操作は、例えば、検索ボタンの押下や所定の筆記の入力などが挙げられる。
次に、図2〜図4を参照しながら、本実施形態の検索例について説明する。図2は、本実施形態の検索対象のコンテンツ31の一例を示す図であり、図3は、本実施形態の手書きのシンボルデータの一例を示す図であり、図4は、本実施形態の検索結果の一例を示す図である。
図2に示すように、検索対象のコンテンツ31の右下には、画像(写真)の領域32があるものとする。この場合、入力部13は、図3に示すように、種別が画像であってページの右下に位置する領域33を指定するシンボルデータを入力する(例えば、アプリケーションのメニューから画像指定モードを選んで画像という種別を指定したものとする)。なお、シンボルデータは、ユーザが手書きした筆跡データから右下の閉ループの範囲や種別を認識して設定されたものでもよい。
そして、検索部17は、入力されたシンボルデータをクエリに用いて検索を行い、記憶部11から第1要素情報と類似する第2要素情報を含むレコードを検索することで、ページの右下に画像の領域が位置するコンテンツが検索される。この結果、検索結果は、図4に示すように、コンテンツ31、コンテンツ36、コンテンツ38となり、検索対象のコンテンツ31を検索できる。
次に、図5〜図10を参照しながら、本実施形態のシンボルデータを手書きで入力する場合の具体例について説明する。図5は、本実施形態の検索対象のコンテンツ41の一例を示す図であり、図6〜図10は、本実施形態の手書きのシンボルデータの一例を示す図である。
図5に示すように、検索対象のコンテンツ41の上段左には、文字の領域42があり、検索対象のコンテンツ41の上段右には、画像(写真)の領域43があり、検索対象のコンテンツ41の中段には、図の領域44があり、検索対象のコンテンツ41の下段には、表の領域45があるものとする。
この場合、検索対象のコンテンツ41を検索するための手書きのシンボルデータとして、例えば、図6〜図10に示す手書きのシンボルデータが考えられる。
図6に示す手書きのシンボルデータは、1以上の第1構成要素それぞれの位置に記載された手書き円又は手書き多角形及び当該手書き円又は当該手書き多角形内に記載された手書き文字で、検索対象のコンテンツの1以上の第2構成要素それぞれの位置、相対関係、及び1以上の第2構成要素それぞれの種別を指定する。
具体的には、図6に示す手書きのシンボルデータは、ページ50の左上に文字を含む多角形51を手書きすることで、左上に文字領域があり、ページ50の下段に表を含む多角形52を手書きすることで、下段に表領域があることを指定する。例えば、文字を表す場合は、「Text」、「文字」、「文字列」、又は「文章」、表を表す場合は、「Table」、「表」、又は「マトリックス」など様々なパターンを用意しておいても構わない。
なお、図6に示す例では、1以上の第1構成要素それぞれの位置に手書き文字を記載したが、第1構成要素の種別を示すアイコンやスタンプで代用してもよい。また、色の指定をしてもよく、シンボルデータの各領域を、検索対象の色を表すペンで書いたり、範囲内に「青」「赤」のような色を記述する文字を書いたりしてもよい。
図7に示す手書きのシンボルデータは、図6とは異なる指定をしたものである。ページ60の右上に写真を含む多角形61を手書きすることで、右上に写真領域があり、ページ60の中段に図を含む多角形62を手書きすることで、中段に図領域があることを指定する。
図8に示す手書きのシンボルデータは、1以上の第1構成要素それぞれの位置に記載された手書き円又は手書き多角形及び当該手書き円又は当該手書き多角形内に記載された手書き記号(図形)で、1以上の第1構成要素それぞれの位置、相対関係、及び1以上の第1構成要素それぞれの種別を指定する。
具体的には、図8に示す指定データは、ページ70の左上に文字を概念化した記号である横線(波線または直線)及び範囲71を手書きすることで、左上に文字領域があり、ページ70の下段に表を概念化した記号である格子および範囲72を手書きすることで、下段に表領域があることを指定する。なお、範囲71内の横線の本数は、文字領域の行数に対応させてもよいし、対応させなくてもよい。
図9に示す手書きのシンボルデータは、図8とは異なる指定をしたものである。図9に示す指定データは、ページ80の左上に文字を概念化した記号である横線(波線または直線)及び範囲81を手書きすることで、左上に文字領域があり、ページ80の中段に図を概念化した記号である楕円及び範囲82を手書きすることで、中段に図領域があることを指定する。
図8及び図9に示す例では、文字を概念化した記号を横線、図形を概念化した記号を楕円、表を概念化した記号を格子としているが、概念化した記号を追加学習等により増加させたり、変更させたりしてもよい。
図10に示す手書きのシンボルデータは、1以上の第1構成要素それぞれの位置に記載された手書き円又は手書き多角形で、1以上の第1構成要素それぞれの位置を含む範囲、及び範囲の相対関係を指定し、手書き円又は手書き多角形内に記載された手書き文字及び手書き図形の少なくとも一方で、検索対象文字及び検索対象図形の少なくとも一方を指定する。
この場合、検索部17は、記憶部11に記憶された1以上のコンテンツのうち、第1要素情報と第2要素情報とが類似し、かつ手書き文字及び手書き図形の少なくとも一方が記載された手書き円又は手書き多角形で指定された位置で手書き文字及び手書き図形の少なくとも一方が存在するコンテンツを、検索対象のコンテンツとして検索する。
具体的には、図10に示す手書きのシンボルデータは、ページ90の上段に多角形91を手書きし、その中に「System」と手書きすることで、上段のどこかに「System」というキーワードが存在し、ページ90の右段に多角形92を手書きし、その中に円柱を手書きすることで、右段の領域に円柱が存在することを指定する。
なお、図6〜図10に示す例において、手書きのシンボルデータはインタラクティブに入力できるため、図6〜図10で説明した内容を一度に入力する必要はなく、検索結果を見ながら、段階的に入力すればよい。例えば、図10のように手書きのシンボルデータを作った後、多角形92をタッチ&ドラッグなどで移動したりサイズを変化させたりすることで、それに応じて検索結果一覧の表示も更新するようにしてもよい。
生成部19は、検索部17により検索されたコンテンツが有する1以上の第2構成要素の第2要素情報に基づいて、当該1以上の第2構成要素をシンボル化したシンボル画像を生成する。
シンボル画像は、1以上の第2構成要素それぞれ毎に、種別を当該種別の名称(キーワード)、アイコン、又はイラストなどでシンボル化し、第2要素情報が当該第2構成要素の位置を示す場合、当該シンボルの位置を当該第2構成要素の位置に対応する位置とし、第2要素情報が当該第2構成要素の大きさを示す場合、当該シンボルの大きさを当該第2構成要素の大きさに対応する大きさとし、第2要素情報が当該第2構成要素の形状を示す場合、当該シンボルの周囲を当該第2構成要素の形状に沿って線で囲み、第2要素情報が当該第2構成要素の色を示す場合、当該シンボルの色を当該第2構成要素の色に対応する色とした画像である。
表示制御部21は、生成部19により生成されたシンボル画像を表示部23に表示する。
図11は、本実施形態の表示画面の一例を示す図である。図11に示す例では、検索窓101に、第1構成要素のシンボル102、103で構成されるシンボルデータが入力され、検索ボタン104が押下されることで、検索結果表示領域110には、検索されたコンテンツのシンボル画像111、121などが表示されている。なお、アイコン105でシンボル102、103の色の指定などが行える。シンボル画像111は、第2構成要素のシンボル112、113で構成されている。
図11に示す例では、シンボル画像を構成するシンボルに、シンボルデータを構成するシンボルを変形(例えば、移動、拡縮、色変化、又は除去など)したものを使用しており、シンボルデータを入力したユーザが、シンボルデータとシンボル画像との対応をより把握しやすい表示態様となっている。
この場合、生成部19は、受付部15により受け付けられたシンボルデータと検索部17により検索された第2要素情報に基づいて、シンボル画像を生成すればよい。つまり、生成部19は、第2構成要素をシンボル化する場合、シンボルデータに含まれる当該第2構成要素と類似する第1構成要素のシンボルを変形して当該第2構成要素のシンボルを生成する。
なお、検索結果表示領域110に表示されるシンボル画像の配置は、シンボルデータとシンボル画像の生成元のコンテンツとの類似度の高い順などとすればよく、例えば、最も類似度が高いものを左上に配置し、順に上の行から下の行に続くように配置してよい。
図12は、本実施形態の表示画面の他の例を示す図である。図12に示す例では、検索結果表示領域110には、検索されたコンテンツのシンボル画像131、141などが表示されるとともに、シンボル画像131に当該シンボル画像131のコンテンツ132が関連付けて表示され、シンボル画像141に当該シンボル画像141のコンテンツ142が関連付けて表示されている。
なお、シンボル画像とコンテンツとを常時関連付けて表示するのではなく、入力部13から、シンボル画像を指示(例えば、タッチ操作やカーソルを重ねる操作)又は選択(例えば、カーソルを重ねてクリックする操作)する操作が入力され、受付部15により受け付けられると、表示制御部21は、シンボル画像を含むレコードに含まれるコンテンツを取得し、当該シンボル画像に関連付けて表示してもよい。
また、表示制御部21は、検索結果表示領域110にコンテンツを表示し、入力部13から、コンテンツを指示又は選択する操作が入力され、受付部15により受け付けられると、当該コンテンツのシンボル画像を関連付けて表示してもよい。
また、表示制御部21は、シンボル画像とコンテンツとを関連付けるのではなく、シンボル画像のシンボルに対応するコンテンツの第2構成要素を関連付けて表示してもよい。
図13は、本実施形態の表示画面の他の例を示す図である。図13に示す例では、検索結果表示領域110には、シンボルデータ又は複数の第2要素情報に基づいて生成された代表シンボル画像143、144などが表示されるとともに、代表シンボル画像143、144それぞれに個数情報146、147が対応付けられて表示されている。
例えば、生成部19は、検索部17によりレコードがn個検索された場合、受付部15により受け付けられたシンボルデータ又は当該n個のレコードに含まれるn個の第2要素情報に基づいて、m(2≦m≦n)個の代表シンボル画像を更に生成し、表示制御部21は、m個の代表シンボル画像を表示してもよい。
生成部19は、シンボルデータから代表シンボル画像を生成する場合、シンボルデータのシンボルの種別、位置、大きさ、形状、及び色の少なくともいずれかを変更して、m個の代表シンボル画像を生成すればよい。
また生成部19は、n個の第2要素情報からm個の代表シンボル画像を生成する場合、類似度などを基にn個の第2要素情報をm個のグループに分類し、グループ毎に分類された第2要素情報を平均化して代表シンボル画像を生成し、m個の代表シンボル画像を生成すればよい。
また表示制御部21は、n個の第2要素情報をm個の代表シンボル画像に分類し、m個の代表シンボル画像とともに、m個の代表シンボル画像それぞれに分類された第2要素情報の個数を示す個数情報を表示してもよい。なお、生成部19によりn個の第2要素情報の分類が行われている場合、表示制御部21は、分類を省略すればよい。
また生成部19は、m個の代表シンボル画像それぞれに分類された第2要素情報の個数の最大値と最小値との差が閾値以下となるように、m個の代表シンボル画像を生成してもよい。生成部19は、最大値と最小値との差が閾値を超える場合、m個の代表シンボル画像の生成手法を変更してm個の代表シンボル画像を再生成すればよい。生成手法としては、類似度算出のアルゴリズムの変更や類似度算出の重みの変更などが挙げられる。
なお、検索結果表示領域110に表示される代表シンボル画像の配置は、分類された第2要素情報の個数の多い順などとしてもよく、例えば、最も個数が多いものを左上に配置し、順に上の行から下の行に続くように配置してよい。
図14は、本実施形態の表示画面の他の例を示す図である。図14に示す例では、代表シンボル画像151のシンボル152や代表シンボル画像161のシンボル162に第2要素情報の色が反映されている。
図15は、本実施形態の表示画面の他の例を示す図である。図15に示す例では、生成部19は、1以上の第2構成要素それぞれ毎に、当該第2構成要素の種別を言語化して、シンボル画像を生成しており、第1構成要素のシンボル102、103は、それぞれ、シンボル画像171のシンボル172、173に対応するが、両シンボルは異なるシンボルとなっている。図15に示す例では、シンボルデータを入力したユーザ以外の第3者であってもシンボルデータとシンボル画像との対応を把握しやすい表示態様となっている。
図16は、本実施形態の検索装置10で行われる処理の手順の流れの一例を示すフローチャートである。
まず、受付部15は、入力部13から、1以上の第1構成要素の種別、位置、大きさ、形状、及び色の少なくともいずれかである第1要素情報を指定して、当該1以上の第1構成要素をシンボル化したシンボルデータの入力を受け付ける(ステップS101)。
続いて、検索部17は、受付部15により受け付けられたシンボルデータに基づいて、記憶部11から第1要素情報と類似する第2要素情報と当該第2要素情報に対応付けられたコンテンツを含むレコードを検索する(ステップS103)。
続いて、生成部19は、検索部17により検索されたコンテンツに対応付けられた第2要素情報に基づいて、1以上の第2構成要素をシンボル化したシンボル画像を生成する(ステップS105)。
続いて、表示制御部21は、生成部19により生成されたシンボル画像を表示部23に表示する(ステップS107)。
以上のように本実施形態によれば、1以上の第1構成要素の種別、位置、大きさ、形状、及び色の少なくともいずれかである第1要素情報を指定して、当該1以上の第1構成要素をシンボル化したシンボルデータを入力し、当該シンボルデータに基づいて、コンテンツを検索し、検索されたコンテンツが有する1以上の第2構成要素の種別、位置、大きさ、形状、及び色の少なくともいずれかである第2要素情報に基づいて、当該1以上の第2構成要素をシンボル化したシンボル画像を生成し、表示するので、検索に用いられた1以上の第1構成要素と1以上の第2構成要素との対応をユーザに把握させ易くすることができる。
(変形例1)
上記実施形態では、検索装置10が記憶部11を備える例について説明したが、検索装置10の外部(例えば、クラウド上)に記憶部11を設けるようにしてもよい。また、検索装置10が備える記憶部11以外の構成をクラウド化してもよいし、複数の装置に分散して検索装置10を実現してもよい。
(変形例2)
上記実施形態において、シンボル画像の生成方法(表示方法)を入力部13からのユーザ操作入力で切り替えられるようにしてもよい。例えば、図11に示すような表示態様とするか図15に示すような表示態様とするかを切り替えられるようにしてもよい。
(変形例3)
上記実施形態において、検索対象のコンテンツを電子カルテとしてもよい。
図17は、変形例3の検索対象のコンテンツ200の一例を示す図であり、図18は、変形例3のシンボルデータの一例を示す図である。
図17に示すように、検索対象のコンテンツ200の左上には、シェーマの領域201があり、シェーマ内の中央部には、患部の箇所を示す絵領域及び患部に対するコメントの文字領域202があるものとする。シェーマは、人体図のテンプレートであり、患部の箇所や患部に対するコメントなどが記入される。
この場合、検索対象のコンテンツ200を検索するためのシンボルデータとして、例えば、図18に示すシンボルデータが考えられる。
図18に示すシンボルデータは、第1構成要素の位置に記載された手書き絵(ラフスケッチ)で、検索対象のコンテンツの第2構成要素の位置、及び第2構成要素の種別を指定する。
具体的には、図18に示すシンボルデータは、ページ210の左上にシェーマのラフスケッチ211を手書きすることで、左上にシェーマの領域があることを指定する。
なお変形例3の場合、第2要素情報は、シェーマ情報を更に含む。シェーマ情報は、シェーマの領域の位置及びシェーマのテンプレートの種別などである。
また検索部17は、更にシンボルデータのラフスケッチの形状と一致するシェーマを検索するようにしてもよい。この場合、検索部17は、線画同士のマッチング方法として、各画素値が線画の線からの距離に応じ、近いほど大きな値を持つ画像を生成し、その画像間のユークリッド距離により、線画間の距離を求めるchamfer matchingとよばれる技術を用いればよい。そして検索部17は、求めた距離を用いて、書かれた線画が最も近いシェーマのテンプレートを検索すればよい。
そして生成部19は、検索されたコンテンツのシンボル画像を生成し、表示制御部21は、生成されたシンボル画像を表示すればよい。
(ハードウェア構成)
図19は、上記実施形態及び各変形例の検索装置のハードウェア構成の一例を示す図である。上記実施形態及び各変形例の検索装置10は、CPUなどの制御装置901と、ROMやRAMなどの記憶装置902と、HDDなどの外部記憶装置903と、ディスプレイなどの表示装置904と、キーボードやマウスなどの入力装置905と、通信インタフェースなどの通信装置906と、を備えており、通常のコンピュータを利用したハードウェア構成となっている。
上記実施形態及び各変形例の検索装置10で実行されるプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、CD−R、メモリカード、DVD(Digital Versatile Disk)、フレキシブルディスク(FD)等のコンピュータで読み取り可能な記憶媒体に記憶されて提供される。
また、上記実施形態及び各変形例の検索装置10で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するようにしてもよい。また、上記実施形態及び各変形例の検索装置10で実行されるプログラムを、インターネット等のネットワーク経由で提供または配布するようにしてもよい。また、上記実施形態及び各変形例の検索装置10で実行されるプログラムを、ROM等に予め組み込んで提供するようにしてもよい。
上記実施形態及び各変形例の検索装置10で実行されるプログラムは、上述した各部をコンピュータ上で実現させるためのモジュール構成となっている。実際のハードウェアとしては、CPUがHDDからプログラムをRAM上に読み出して実行することにより、上記各部がコンピュータ上で実現されるようになっている。
なお、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせても良い。
例えば、上記実施形態のフローチャートにおける各ステップを、その性質に反しない限り、実行順序を変更し、複数同時に実施し、あるいは実施毎に異なった順序で実施してもよい。
以上のように、上記実施形態及び各変形例によれば、検索に用いた情報と検索結果との対応をユーザに把握させ易くすることができる。
10 検索装置
11 記憶部
13 入力部
15 受付部
17 検索部
19 生成部
21 表示制御部
23 表示部
901 制御装置
902 記憶装置
903 外部記憶装置
904 表示装置
905 入力装置
906 通信装置

Claims (13)

  1. 1以上の第1構成要素の種別、位置、大きさ、形状、及び色の少なくともいずれかである第1要素情報を指定して、当該1以上の第1構成要素をシンボル化したシンボルデータの入力を受け付ける受付部と、
    前記シンボルデータに基づいて、コンテンツを検索する検索部と、
    前記コンテンツが有する1以上の第2構成要素の種別、位置、大きさ、形状、及び色の少なくともいずれかである第2要素情報に基づいて、当該1以上の第2構成要素をシンボル化したシンボル画像を生成する生成部と、
    前記シンボル画像を表示部に表示する表示制御部と、
    を備える検索装置。
  2. 前記生成部は、前記シンボルデータと前記第2要素情報に基づいて、前記シンボル画像を生成する請求項1に記載の検索装置。
  3. 前記生成部は、前記1以上の第2構成要素それぞれ毎に、当該第2構成要素の種別を言語化して、前記シンボル画像を生成する請求項1に記載の検索装置。
  4. 前記表示制御部は、前記シンボル画像に関連付けて前記コンテンツを前記表示部に更に表示する請求項1に記載の検索装置。
  5. 前記表示制御部は、前記表示部に表示された前記シンボル画像が指示又は選択された場合、前記コンテンツを前記表示部に更に表示する請求項4に記載の検索装置。
  6. 前記表示制御部は、前記シンボル画像を構成するシンボルに関連付けて当該シンボルの生成元の第2構成要素を表示部に表示する請求項1に記載の検索装置。
  7. 前記検索部は、コンテンツと当該コンテンツの第2要素情報とを対応付けたレコードを複数記憶する記憶部から、前記第1要素情報と類似する第2要素情報を含むレコードを検索する請求項1に記載の検索装置。
  8. 前記生成部は、前記レコードがn(n≧2)個検索された場合、前記シンボルデータ又は前記n個のレコードに含まれる前記n個の第2要素情報に基づいて、m(2≦m≦n)個の代表シンボル画像を生成し、
    前記表示制御部は、前記m個の代表シンボル画像を前記表示部に表示する請求項7に記載の検索装置。
  9. 前記表示制御部は、前記n個の第2要素情報を前記m個の代表シンボル画像に分類し、前記m個の代表シンボル画像とともに、前記m個の代表シンボル画像それぞれに分類された前記第2要素情報の個数を示す個数情報を前記表示部に表示する請求項8に記載の検索装置。
  10. 前記生成部は、前記m個の代表シンボル画像それぞれに分類された前記第2要素情報の個数の最大値と最小値との差が閾値以下となるように、前記m個の代表シンボル画像を生成する請求項9に記載の検索装置。
  11. 前記生成部は、前記差が閾値を超える場合、前記m個の代表シンボル画像の生成手法を変更して前記m個の代表シンボル画像を再生成する請求項10に記載の検索装置。
  12. 1以上の第1構成要素の種別、位置、大きさ、形状、及び色の少なくともいずれかである第1要素情報を指定して、当該1以上の第1構成要素をシンボル化したシンボルデータの入力を受け付ける受付ステップと、
    前記シンボルデータに基づいて、コンテンツを検索する検索ステップと、
    前記コンテンツが有する1以上の第2構成要素の種別、位置、大きさ、形状、及び色の少なくともいずれかである第2要素情報に基づいて、当該1以上の第2構成要素をシンボル化したシンボル画像を生成する生成ステップと、
    前記シンボル画像を表示部に表示する表示制御ステップと、
    を含む検索方法。
  13. 1以上の第1構成要素の種別、位置、大きさ、形状、及び色の少なくともいずれかである第1要素情報を指定して、当該1以上の第1構成要素をシンボル化したシンボルデータの入力を受け付ける受付ステップと、
    前記シンボルデータに基づいて、コンテンツを検索する検索ステップと、
    前記コンテンツが有する1以上の第2構成要素の種別、位置、大きさ、形状、及び色の少なくともいずれかである第2要素情報に基づいて、当該1以上の第2構成要素をシンボル化したシンボル画像を生成する生成ステップと、
    前記シンボル画像を表示部に表示する表示制御ステップと、
    をコンピュータに実行させるためのプログラム。
JP2014247287A 2014-12-05 2014-12-05 検索装置、方法及びプログラム Pending JP2016110389A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2014247287A JP2016110389A (ja) 2014-12-05 2014-12-05 検索装置、方法及びプログラム
CN201510658506.6A CN105678210A (zh) 2014-12-05 2015-10-12 检索设备和检索方法
US14/938,648 US20160162440A1 (en) 2014-12-05 2015-11-11 Retrieval apparatus, retrieval method, and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014247287A JP2016110389A (ja) 2014-12-05 2014-12-05 検索装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2016110389A true JP2016110389A (ja) 2016-06-20
JP2016110389A5 JP2016110389A5 (ja) 2017-06-15

Family

ID=56094472

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014247287A Pending JP2016110389A (ja) 2014-12-05 2014-12-05 検索装置、方法及びプログラム

Country Status (3)

Country Link
US (1) US20160162440A1 (ja)
JP (1) JP2016110389A (ja)
CN (1) CN105678210A (ja)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5832474A (en) * 1996-02-26 1998-11-03 Matsushita Electric Industrial Co., Ltd. Document search and retrieval system with partial match searching of user-drawn annotations
JP4098880B2 (ja) * 1997-06-06 2008-06-11 松下電器産業株式会社 情報検索装置
JP2003162687A (ja) * 2001-11-28 2003-06-06 Toshiba Corp 手書き文字入力装置、手書き文字認識プログラム
JP2004334339A (ja) * 2003-04-30 2004-11-25 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
US7583841B2 (en) * 2005-12-21 2009-09-01 Microsoft Corporation Table detection in ink notes
US9086798B2 (en) * 2011-03-07 2015-07-21 Ricoh Company, Ltd. Associating information on a whiteboard with a user
JP2013168132A (ja) * 2012-01-17 2013-08-29 Toshiba Corp 商品検索装置、方法、及びプログラム
JP2013246732A (ja) * 2012-05-28 2013-12-09 Toshiba Corp 手書き文書検索装置、方法及びプログラム

Also Published As

Publication number Publication date
US20160162440A1 (en) 2016-06-09
CN105678210A (zh) 2016-06-15

Similar Documents

Publication Publication Date Title
US10127199B2 (en) Automatic measure of visual similarity between fonts
JP5248696B1 (ja) 電子機器、手書き文書作成方法、及び手書き文書作成プログラム
US9886669B2 (en) Interactive visualization of machine-learning performance
US20130125069A1 (en) System and Method for Interactive Labeling of a Collection of Images
JP5774558B2 (ja) 手書き文書処理装置、方法及びプログラム
CN114365075B (zh) 用于选择图形对象的方法和对应装置
JP5717691B2 (ja) 手書き文字検索装置、方法及びプログラム
EP3058513B1 (en) Multi-color channel detection for note recognition and management
WO2022089170A1 (zh) 字幕区域识别方法、装置、设备及存储介质
Panwar Hand gesture based interface for aiding visually impaired
JP2013246732A (ja) 手書き文書検索装置、方法及びプログラム
US9183276B2 (en) Electronic device and method for searching handwritten document
US9250802B2 (en) Shaping device
JP6441142B2 (ja) 検索装置、方法及びプログラム
JP2018067298A (ja) 手書き内容編集装置および手書き内容編集方法
JP2014203393A (ja) 電子機器、手書き文書処理方法、及び手書き文書処理プログラム
JP5735126B2 (ja) システムおよび筆跡検索方法
US20210073552A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
US20160034569A1 (en) Search device
JP6419560B2 (ja) 検索装置、方法及びプログラム
JP2016110389A (ja) 検索装置、方法及びプログラム
KR20220137645A (ko) 핸드라이팅에서의 구조 분해
US20150142784A1 (en) Retrieval device and method and computer program product
JP6030172B2 (ja) 手書き文字検索装置、方法及びプログラム
JP2020064438A (ja) 学習データ生成装置および学習データ生成方法

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170426