JP6876914B2 - 情報処理装置 - Google Patents
情報処理装置 Download PDFInfo
- Publication number
- JP6876914B2 JP6876914B2 JP2017054143A JP2017054143A JP6876914B2 JP 6876914 B2 JP6876914 B2 JP 6876914B2 JP 2017054143 A JP2017054143 A JP 2017054143A JP 2017054143 A JP2017054143 A JP 2017054143A JP 6876914 B2 JP6876914 B2 JP 6876914B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- priority
- area
- similarity
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/174—Segmentation; Edge detection involving the use of two or more images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
- G06T7/74—Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Geometry (AREA)
- Computer Graphics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
- Processing Or Creating Images (AREA)
Description
そこで、本発明は、照合対象を特徴的な箇所に絞り込んで画像の類似度を判定する際に、特徴的な箇所を一律に照合する場合に比べて、類似度の精度を向上させることを目的とする。
請求項2に係る発明によれば、文字列の編集及び画像の編集のどちらに用いるアプリケーションプログラムであっても、役立ちやすい画像ほど類似度が高いと判定することができる。
請求項3に係る発明によれば、指定された画像の内容と優先度の関連付けがない場合に比べて、類似度の精度を向上させることができる。さらに、指定された画像の内容が説明用資料、帳票又は図面のいずれであっても、類似度の精度を向上させることができる。
図1は実施例に係る画像検索システム1の全体構成を表す。画像検索システム1は、ユーザが指定した画像に類似する画像を検索するシステムである。画像検索システム1は、通信回線2と、ユーザ装置10と、画像検索サーバ装置20とを備える。
図4は画像検索システム1が実現する機能構成を表す。ユーザ装置10は、画像指定操作受付部101と、指定画像送信部102と、検索結果表示部103とを備える。画像検索サーバ装置20は、検索対象画像蓄積部201と、画像取得部202と、特徴箇所検出部203と、属性別領域分類部204と、優先度規則記憶部205と、優先度設定部206と、特徴量算出部207と、画像情報蓄積部208と、類似度判定部209と、検索結果送信部210とを備える。
図8は画像検索処理における各装置の動作手順の一例を表す。この例では、検索対象の画像の特徴量及び特徴箇所情報等が既に蓄積されているものとする。図8の動作手順は、例えば、ユーザがユーザ装置10を操作して類似する画像を検索したい画像を指定する画像指定操作を行うことを契機に開始される。まず、ユーザ装置10(画像指定操作受付部101)は、その画像指定操作を受け付ける(ステップS11)。
上述した実施例は本発明の実施の一例に過ぎず、以下のように変形させてもよい。また、実施例及び各変形例は、必要に応じて組み合わせて実施してもよい。
類似判定に用いられる優先度は、実施例では、画像内の領域の属性に関係付けられていたが、属性以外の情報とも関係付けられていてもよい。本変形例では、優先度規則記憶部205が、画像内の領域の属性とその領域の優先度とを関係付ける他、その領域の画像内の位置とその領域の優先度とをさらに関係付ける優先度規則を記憶する。具体的には、優先度規則記憶部205は、例えば、図7に表す第1優先度テーブルに加え、各領域の位置と優先度とを対応付けた第2優先度テーブルを、優先度規則を表す情報として記憶する。
図10は第2優先度テーブルの別の一例を表す。図10に表す第2優先度テーブルでは、「左上」、「右上、左下」及び「右下」という領域の位置と「−1」、「0」及び「+1」という優先度補正値とが対応付けられている。「−1」は、領域の属性に基づき設定される優先度から「1」減じる補正をすること、すなわち優先度を1つ高くすることを意味し、「+1」は、領域の属性に基づき設定される優先度に「1」加える補正をすること、すなわち優先度を1つ低くすることを意味し、「0」は優先度を補正しないことを意味する。
類似判定に用いられる優先度は上記以外の情報と関係付けられてもよい。本変形例では、優先度規則記憶部205が、画像内の領域の属性とその領域の優先度とを関係付ける他、2つの画像における共通属性の領域の位置のずれの大きさとその領域の優先度とをさらに関係付ける優先度規則を記憶する。具体的には、優先度規則記憶部205は、例えば、図7に表す第1優先度テーブルに加え、共通属性の領域の位置のずれの大きさと優先度とを対応付けた第3優先度テーブルを、優先度規則を表す情報として記憶する。
類似判定に用いられる優先度は上記以外の情報と関係付けられてもよい。本変形例では、優先度規則記憶部205が、画像内の領域の属性とその領域の優先度とを関係付ける他、その領域に含まれる特徴的な箇所の特徴量の大きさとその領域の優先度とをさらに関係付ける優先度規則を記憶する。具体的には、優先度規則記憶部205は、例えば、図7に表す第1優先度テーブルに加え、特徴量の大きさと優先度とを対応付けた第4優先度テーブルを、優先度規則を表す情報として記憶する。
類似する画像を検索したい画像を指定する際に用いられたアプリケーションプログラム(以下「アプリ」という)の種類によって異なる優先度が決定されてもよい。本変形例では、指定画像送信部102が、指定画像と共に、その指定画像の指定に用いられたアプリのアプリIDを送信する。
図13は本変形例の第1優先度テーブルの一例を表す。図13の第1優先度テーブルは、アプリの種類が「ブラウザ」の場合は、「文字領域」、「図形領域」及び「画領域」という画像内の領域の属性と、「2」、「3」及び「1」という優先度とを対応付けている。
類似する画像の検索では、会議での説明用資料(いわゆるプレゼン資料)、文書(報告書、帳票及び図面等)、写真などの様々な内容の画像が指定されるが、指定された画像の内容によって異なる優先度が決定されてもよい。本変形例では、指定画像送信部102が送信した指定画像を示すファイルのファイル名が画像取得部202を介して優先度設定部206に供給される。
図14は本変形例の第1優先度テーブルの一例を表す。図14の第1優先度テーブルは、画像の内容が「説明用資料」の場合は、「文字領域」、「図形領域」及び「画領域」という画像内の領域の属性と、「2」、「3」及び「1」という優先度とを対応付けている。
ユーザが優先したい領域の属性を選択してもよい。本変形例では、画像指定操作受付部101が、画像を指定する操作と共に、優先したい領域の属性を選択する操作を受け付ける。属性の選択操作は、例えば、指定画像のうち優先したい属性の領域を指し示す操作である(属性の一覧を表示して選択させる操作でもよい)。画像指定操作受付部101がこの選択操作を受け付けると、指し示された位置の座標情報及び指定画像が指定画像送信部102を介して画像検索サーバ装置20に送信され、画像取得部202を介して優先度設定部206に供給される。
分類された領域内に特徴的な箇所が複数ある場合に、それらの箇所を複数のグループに区分してもよい。本変形例では、優先度設定部206が、供給された領域範囲情報が示す範囲に含まれる全ての特徴的な箇所の特徴量を比較し、例えば特徴量の大きさが異なる複数のグループ(「大」、「中」、「小」グループなど)に各箇所を区分けする。優先度設定部206は本発明の「区分け部」の一例である。
印刷部である原稿を読み取った(スキャンした)画像が指定画像として用いられる場合がある。その印刷物上の画像が網点スクリーン(小さな点のパターン)で表されている場合、原稿の読み取り精度が高いと、網点スクリーンを構成する点のうち比較的大きなものが特徴的な箇所として検出されることがある。
図16は本変形例の画像検索サーバ装置20aが実現する機能構成を表す。画像検索サーバ装置20aは、図4に表す各部に加えて印刷特有箇所特定部211を備える。画像取得部202は、取得した指定画像及び検索対象の画像を印刷特有箇所特定部211に供給する。
画像のレイアウトが似ていなければ、画像全体としても似ていないと感じやすい。本変形例では、レイアウトが似ていない画像については検索対象から除いて類似度が判定される。
図17は本変形例の画像検索サーバ装置20bが実現する機能構成を表す。画像検索サーバ装置20bは、図4に表す各部に加えてレイアウト判断部212を備える。
図4に表す各機能を実現する装置は、図4に表された装置に限らない。例えばユーザ装置10及び画像検索サーバ装置20が備える各機能を1台の装置が実現してもよいし、それらの各機能を3以上の装置がそれぞれ分担して実現してもよい。また、画像検索サーバ装置20が備える機能をユーザ装置も備えていてもよい。
実施例では、優先度規則記憶部205が予め優先度規則を記憶していたが、これに限らない。例えば、画像検索サーバ装置20とは異なる外部装置が優先度規則を記憶しておき、画像検索サーバ装置20の優先度設定部206が優先度を設定する際に、その外部装置にアクセスして優先度規則を読み出し、自装置のRAM等の記憶手段に一時的に記憶してから用いてもよい。その場合は、優先度規則を記憶するRAM等の記憶手段が本発明の「記憶部」の一例である。
実施例では、優先度が高いほど照合結果に付与する重みを重くして類似度が判定されたが、これに限らない。類似度判定部209は、例えば、優先度が低い箇所の照合結果は除外してもよく、言い換えると、優先度が或る基準よりも高い照合結果だけに絞り込んで類似度を判定してもよい。また、類似度判定部209は、優先度に基づいて照合結果を絞り込み、絞り込んだ照合結果にされに優先度に基づく重み付けをして類似度を判定してもよい。いずれの場合も、類似度が高い画像ほど、ユーザから見てもより似ている画像だと感じやすくなるように優先度が用いられればよい。
実施例では、優先度が「1」、「2」、「3」という数値で表されていたが、これに限らず、例えば「A」、「B」、「C」や「高」、「中」、「低」のように文字で表されてもよい。また、3段階ではなく2段階や4段階以上の優先度が表されてもよい。要するに、特徴的な箇所を照合する際の重み付け又は絞り込み等の指標として用いられれば、どのように優先度が表されてもよい。
本発明は、ユーザ装置及び画像検索サーバ装置という情報処理装置の他、それらの装置を備える情報処理システム(画像検索システム)としても捉えられる。また、本発明は、各装置が実施する処理を実現するための情報処理方法としても捉えられる。その場合、各処理を実現する主体となる情報処理装置は複数に分かれていてもよい。また、各装置を制御するコンピュータを機能させるためのプログラムとしても捉えられる。このプログラムは、それを記憶させた光ディスク等の記録媒体の形態で提供されてもよいし、インターネット等の通信回線を介してコンピュータにダウンロードさせ、それをインストールして利用可能にするなどの形態で提供されてもよい。
Claims (3)
- 画像の特徴的な箇所を検出する検出部と、
画像内の領域を属性が異なる複数の領域に分類する分類部と、
前記領域の属性と当該領域の優先度とを関係付ける規則を記憶する記憶部と、
2つの画像について検出された前記箇所を照合し、当該照合の結果に当該箇所を含む前記領域の属性と前記規則により関係付けられる当該領域の優先度を反映して当該2つの画像の類似度を判定する判定部と、
類似度の判定対象の画像を指定する際に用いられたアプリケーションプログラムの種類を特定する特定部とを備え、
前記規則は、前記アプリケーションプログラムの種類毎に、前記領域の属性と当該領域の優先度とを関係付け、
前記判定部は、照合する前記箇所を含む前記領域の属性及び特定された前記アプリケーションプログラムの種類に前記規則で関係付けられる優先度を反映して前記類似度を判定する情報処理装置。 - 前記領域には、文字が表された第1領域と、写真又は絵が表された第2領域とが含まれ、
前記規則は、文字列の編集に用いるアプリケーションプログラムの場合は前記第2領域より前記第1領域の優先度を高くし、画像の編集に用いるアプリケーションプログラムの場合は前記第1領域より前記第2領域の優先度を高くするよう、前記属性及び前記優先度を関係付ける
請求項1に記載の情報処理装置。 - 画像の特徴的な箇所を検出する検出部と、
画像内の領域を属性が異なる複数の領域に分類する分類部と、
前記領域の属性と当該領域の優先度とを関係付ける規則を記憶する記憶部と、
画像の内容を判定する内容判定部と、
2つの画像について検出された前記箇所を照合し、当該照合の結果に当該箇所を含む前記領域の属性と前記規則により関係付けられる当該領域の優先度を反映して当該2つの画像の類似度を判定する判定部とを備え、
前記領域には、文字が表された第1領域と、写真又は絵が表された第2領域と、図形が表された第3領域が含まれ、
前記画像の内容には、会議での説明用資料と、帳票又は図面とが含まれ、
前記規則は、前記画像の内容毎に、前記内容が前記説明用資料の場合は前記第1領域より前記第2及び前記第3領域の優先度を高くし、前記内容が前記帳票又は図面の場合は前記第1及び前記第2領域より前記第3領域の優先度を高くするよう、前記領域の属性と当該領域の優先度とを関係付けており、
前記判定部は、照合する前記箇所を含む前記領域の属性及び判定された前記画像の内容に前記規則で関係付けられる優先度を反映して前記類似度を判定する情報処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017054143A JP6876914B2 (ja) | 2017-03-21 | 2017-03-21 | 情報処理装置 |
US15/892,894 US10445570B2 (en) | 2017-03-21 | 2018-02-09 | Information processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017054143A JP6876914B2 (ja) | 2017-03-21 | 2017-03-21 | 情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018156517A JP2018156517A (ja) | 2018-10-04 |
JP6876914B2 true JP6876914B2 (ja) | 2021-05-26 |
Family
ID=63582725
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017054143A Active JP6876914B2 (ja) | 2017-03-21 | 2017-03-21 | 情報処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10445570B2 (ja) |
JP (1) | JP6876914B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7187377B2 (ja) * | 2019-04-23 | 2022-12-12 | 株式会社日立製作所 | 物体情報登録装置及び物体情報登録方法 |
CN110060252B (zh) * | 2019-04-28 | 2021-11-05 | 重庆金山医疗技术研究院有限公司 | 一种图片内目标提示处理方法、装置及内窥镜系统 |
JP6966749B2 (ja) * | 2019-05-29 | 2021-11-17 | 株式会社マーケットヴィジョン | 画像処理システム |
US20220155942A1 (en) * | 2020-11-18 | 2022-05-19 | Yokogawa Electric Corporation | Information processing apparatus, information processing method, and program |
US11763586B2 (en) | 2021-08-09 | 2023-09-19 | Kyocera Document Solutions Inc. | Method and system for classifying document images |
CN114637845B (zh) * | 2022-03-11 | 2023-04-14 | 上海弘玑信息技术有限公司 | 模型测试方法、装置、设备和存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4311278B2 (ja) | 2004-06-02 | 2009-08-12 | トヨタ自動車株式会社 | 物体認識方法 |
JP2008181460A (ja) * | 2007-01-26 | 2008-08-07 | Ricoh Co Ltd | 文書画像検索装置および文書画像検索方法 |
JP4951373B2 (ja) * | 2007-03-13 | 2012-06-13 | 株式会社リコー | 画像検索装置、画像検索方法、及びコンピュータプログラム |
JP2011257963A (ja) | 2010-06-08 | 2011-12-22 | Canon Inc | 画像処理装置、その処理方法及びプログラム |
JP2015106384A (ja) | 2013-12-02 | 2015-06-08 | キヤノン株式会社 | 情報処理装置およびその制御方法、並びにプログラム |
JP6150766B2 (ja) * | 2014-07-17 | 2017-06-21 | 富士フイルム株式会社 | 情報処理装置、プログラム、及び自動ページ差し替え方法 |
US9569692B2 (en) * | 2014-10-31 | 2017-02-14 | The Nielsen Company (Us), Llc | Context-based image recognition for consumer market research |
-
2017
- 2017-03-21 JP JP2017054143A patent/JP6876914B2/ja active Active
-
2018
- 2018-02-09 US US15/892,894 patent/US10445570B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20180276460A1 (en) | 2018-09-27 |
US10445570B2 (en) | 2019-10-15 |
JP2018156517A (ja) | 2018-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6876914B2 (ja) | 情報処理装置 | |
US10958796B2 (en) | Image processing apparatus, image processing method, and storage medium | |
US10572725B1 (en) | Form image field extraction | |
US11361487B2 (en) | Apparatus, method and storage medium | |
US11562516B2 (en) | Apparatus, method and storage medium | |
US11450045B2 (en) | Apparatus, method and medium | |
US20090019010A1 (en) | Document Search Device, Imaging Forming Apparatus, and Document Search System | |
JP2007286864A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
US11645795B2 (en) | Apparatus, method and medium | |
US8612429B2 (en) | Apparatus, system, and method for information search | |
US20230112555A1 (en) | Image processing apparatus, control method, and storage medium | |
US11107260B2 (en) | Image processing apparatus, control method, and storage medium | |
JP6080409B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
US20080244384A1 (en) | Image retrieval apparatus, method for retrieving image, and control program for image retrieval apparatus | |
US10917529B2 (en) | Image processing apparatus, control method, and storage medium | |
JP2018042067A (ja) | 画像処理システム、画像処理方法、情報処理装置 | |
JP2022086521A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
US20230206672A1 (en) | Image processing apparatus, control method of image processing apparatus, and storage medium | |
US11356570B2 (en) | Image processing apparatus, image processing method, and storage medium | |
US11979523B2 (en) | Storage medium, image processing method, and image processing apparatus | |
US9767579B2 (en) | Information processing apparatus, information processing method, and non-transitory computer readable medium | |
US11887214B2 (en) | Storage medium storing program for generating album data, image processing method for generating album data, and image processing apparatus for generating album data | |
JP2017072941A (ja) | 文書振り分けシステム、情報処理方法及びプログラム | |
JP7336212B2 (ja) | 画像処理装置、制御方法、及びプログラム | |
JP7336210B2 (ja) | 画像処理装置、制御方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210323 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210405 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6876914 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |