JP2021068064A - クエリ修正システム、検索システム及びプログラム - Google Patents

クエリ修正システム、検索システム及びプログラム Download PDF

Info

Publication number
JP2021068064A
JP2021068064A JP2019191530A JP2019191530A JP2021068064A JP 2021068064 A JP2021068064 A JP 2021068064A JP 2019191530 A JP2019191530 A JP 2019191530A JP 2019191530 A JP2019191530 A JP 2019191530A JP 2021068064 A JP2021068064 A JP 2021068064A
Authority
JP
Japan
Prior art keywords
query
query image
information
condition
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019191530A
Other languages
English (en)
Inventor
大悟 堀江
Daigo Horie
大悟 堀江
真太郎 安達
Shintaro Adachi
真太郎 安達
洋 劉
Hiroshi Ryu
洋 劉
山口 聡之
Satoyuki Yamaguchi
聡之 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2019191530A priority Critical patent/JP2021068064A/ja
Priority to US16/847,129 priority patent/US11455332B2/en
Priority to AU2020203188A priority patent/AU2020203188A1/en
Priority to CN202010412232.3A priority patent/CN112685585A/zh
Publication of JP2021068064A publication Critical patent/JP2021068064A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/535Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/778Active pattern-learning, e.g. online learning of image or video features
    • G06V10/7784Active pattern-learning, e.g. online learning of image or video features based on feedback from supervisors

Abstract

【課題】検索の対象に関連する条件が存在する場合に、条件を満たす画像の検索を容易にする。【解決手段】クエリ修正システムは、ユーザにより入力された第1のクエリ画像に、検索の対象に関連する第1の条件に矛盾する部分が含まれる場合、矛盾する部分を第1の条件に応じて補正し、第2のクエリ画像を生成するプロセッサを有する。【選択図】図6

Description

本発明は、クエリ修正システム、検索システム及びプログラムに関する。
検索の条件として画像(以下「クエリ画像」という)が入力された場合、クエリ画像に関連する画像を検索する技術がある。関連する画像の代表例には、クエリ画像に類似する画像がある。
特開2016−218578号公報
もっとも、クエリ画像は、ユーザのイメージにより近い画像を見つけ出すために入力されるのであり、クエリ画像が検索の対象に関連する条件も満たすとは限らない。このため、条件を満たさないクエリ画像から抽出された特徴だけを用いて検索が実行されると、検索の対象に関連する条件に矛盾する特徴に合致する画像が検索されることが起こり得る。
本発明は、検索の対象に関連する条件が存在する場合に、条件を満たす画像の検索を容易にすることを目的とする。
請求項1に記載の発明は、ユーザにより入力された第1のクエリ画像に、検索の対象に関連する第1の条件に矛盾する部分が含まれる場合、当該部分を当該第1の条件に応じて補正し、第2のクエリ画像を生成するプロセッサを有するクエリ修正システムである。
請求項2に記載の発明は、前記第1の条件は、検索クエリとして用いられる、請求項1に記載のクエリ修正システムである。
請求項3に記載の発明は、前記第1の条件は、前記第1のクエリ画像から抽出される特徴に関連する、請求項2に記載のクエリ修正システムである。
請求項4に記載の発明は、前記プロセッサは、前記部分を補正する場合、前記第1のクエリ画像に現れる前記部分以外の構造上の特徴を維持する、請求項1に記載のクエリ修正システムである。
請求項5に記載の発明は、前記構造上の特徴は、前記第1のクエリ画像に含まれる内容の種類に応じて定められる、請求項4に記載のクエリ修正システムである。
請求項6に記載の発明は、前記構造上の特徴は、ユーザ毎に設定される、請求項4に記載のクエリ修正システムである。
請求項7に記載の発明は、前記プロセッサは、前記第1の条件に矛盾する前記部分が予め定めた第2の条件を満たす場合、当該部分を補正しない、請求項1又は4に記載のクエリ修正システムである。
請求項8に記載の発明は、前記第2の条件は、前記第1の条件に矛盾する前記部分が、前記第1のクエリ画像に現れる構造上の特徴に該当することである、請求項7に記載のクエリ修正システムである。
請求項9に記載の発明は、前記プロセッサは、前記第1の条件に矛盾する部分が見つかった場合、前記第1のクエリ画像を補正する前に、当該矛盾する部分の情報をユーザに通知する、請求項1に記載のクエリ修正システムである。
請求項10に記載の発明は、前記プロセッサは、前記第1のクエリ画像を補正する前に、前記第2のクエリ画像の生成の可否をユーザに問い合わせる、請求項1又は9に記載のクエリ修正システムである。
請求項11に記載の発明は、前記プロセッサは、前記第1の条件と矛盾する部分に補正の対象から除外される部分が含まれる場合、当該補正の対象から除外される部分に関連する当該第1の条件の変更をユーザに問い合わせる、請求項1又は9に記載のクエリ修正システムである。
請求項12に記載の発明は、前記プロセッサは、前記矛盾に対応する前記第1の条件の変更が可能な場合には、当該第1の条件の変更の可否をユーザに問い合わせる、請求項1に記載のクエリ修正システムである。
請求項13に記載の発明は、前記プロセッサは、生成された前記第2のクエリ画像をユーザに提示する、請求項1に記載のクエリ修正システムである。
請求項14に記載の発明は、前記プロセッサは、前記第2のクエリ画像と前記第1のクエリ画像を同じ画面上に並べて配置する、請求項13に記載のクエリ修正システムである。
請求項15に記載の発明は、前記プロセッサは、前記第1のクエリ画像及び前記第2のクエリ画像の両方又は一方に、補正された部位を示す表記を追加する、請求項14に記載のクエリ修正システムである。
請求項16に記載の発明は、前記プロセッサは、検索を実行する前に、生成された前記第2のクエリ画像の検索への使用をユーザに問い合わせる、請求項13に記載のクエリ修正システムである。
請求項17に記載の発明は、前記第1の条件は法令を含む、請求項1に記載のクエリ修正システムである。
請求項18に記載の発明は、前記プロセッサは、前記第1の条件としてのユーザの入力と前記法令とが矛盾する場合、法令を優先する、請求項17に記載のクエリ修正システムである。
請求項19に記載の発明は、ユーザにより入力された第1のクエリ画像に、検索の対象に関連する第1の条件に矛盾する部分が含まれる場合、当該部分を当該第1の条件に応じて補正して第2のクエリ画像を生成し、生成された当該第2のクエリ画像を用いてデータベースを検索するプロセッサを有する検索システムである。
請求項20に記載の発明は、コンピュータに、ユーザが入力する第1のクエリ画像を受け付ける機能と、前記第1のクエリ画像に、検索の対象に関連する第1の条件に矛盾する部分が含まれる場合、当該部分を当該第1の条件に応じて補正して第2のクエリ画像を生成する機能とを実行させるプログラムである。
請求項1記載の発明によれば、検索の対象に関連する条件が存在する場合に、条件を満たす画像の検索を容易にできる。
請求項2記載の発明によれば、検索の対象に関する条件とクエリ画像の矛盾が減ることにより、条件を満たす画像の検索を容易にできる。
請求項3記載の発明によれば、補正の対象となる部分の特定を容易にできる。
請求項4記載の発明によれば、第1のクエリ画像に含まれるユーザの意図を可能な限り維持した第2のクエリ画像を生成できる。
請求項5記載の発明によれば、第1のクエリ画像の構造上の特徴を維持した第2のクエリ画像を生成できる。
請求項6記載の発明によれば、第1のクエリ画像に含まれるユーザの意図を可能な限り維持した第2のクエリ画像を生成できる。
請求項7記載の発明によれば、条件に矛盾する特徴でも、補正の対象から除外される例外を用意できる。
請求項8記載の発明によれば、条件に矛盾する特徴が、第1のクエリ画像の構造上の印象に影響する場合には、補正の対象から除外できる。
請求項9記載の発明によれば、第1のクエリ画像に他の条件と矛盾する部分があることを、予めユーザに知らせることができる。
請求項10記載の発明によれば、ユーザの指示を前提として第1のクエリ画像の補正を可能にできる。
請求項11記載の発明によれば、ユーザの選択による条件の変更を可能にできる。
請求項12記載の発明によれば、ユーザの選択による第1の条件の変更を可能にできる。
請求項13記載の発明によれば、補正された部分の確認を容易にできる。
請求項14記載の発明によれば、補正の内容の確認を容易にできる。
請求項15記載の発明によれば、補正の内容をユーザが容易に確認できる。
請求項16記載の発明によれば、検索を実行する前にユーザに確認できる。
請求項17記載の発明によれば、ユーザの制約を満たす場合でも、法令を満たさない場合にはクエリ画像を補正できる。
請求項18記載の発明によれば、法令との矛盾を原因とする検索のやり直しを未然に低減できる。
請求項19記載の発明によれば、検索の対象に関連する条件が存在する場合に、条件を満たす画像の検索を容易にできる。
請求項20記載の発明によれば、検索の対象に関連する条件が存在する場合に、条件を満たす画像の検索を容易にできる。
実施の形態で使用する画像検索システムの構成例を示す図である。 データベースに記録されるデータセットを生成するコンピュータの機能上の構成を説明する図である。 クエリとして入力される画像に類似する、又は、関連する画像をデータベースから検索する検索サーバの機能上の構成を説明する図である。 ユーザが操作する端末からクエリとして入力される情報を説明する図表である。 特徴抽出部による特徴の抽出例を説明する図である。 前処理部を構成する機能構成の一例を説明する図である。 前処理部が実行する処理の一例を説明するフローチャートである。 特定された矛盾の通知に用いられる画面の一例を示す図である。 前提情報の変更の可否の判定に用いられるテーブルの一例を示す図である。 補正後のクエリ画像を表示する画面の例を示す図である。 補正後のクエリ画像を表示する他の画面の例を示す図である。 補正後のクエリ画像を表示する画面の例を示す図である。 クエリ画像に3階建ての建物が含まれるが前提情報で指定された所在地では2階建てしか許されない場合におけるクエリ画像の補正の例を説明する図である。(A)は補正前のクエリ画像を示し、(B)は補正後のクエリ画像を示す。
以下、図面を参照して、本発明の実施の形態を説明する。
<実施の形態>
以下では、設計事務所やデザイン事務所での使用を想定する画像検索システムについて説明する。
設計事務所等には、過去に扱った案件の記録が蓄積されている。ここでの情報には、デザイン案、設計図等の画像の他、顧客からのクレーム、事故の事例、社内レビューの記録等の文書も含まれる。本実施の形態で説明する画像検索システムは、これらの情報の活用を通じ、設計業務の効率化を支援する。
<システム構成>
図1は、実施の形態で使用する画像検索システム1の構成例を示す図である。
図1に示す画像検索システム1は、入力されたクエリに類似する、又は、関連する画像を検索する検索サーバ10と、検索の対象である画像のデータ(以下「画像データ」という)が蓄積されるデータベース(=Data Base)20と、クエリを入力するユーザが操作する端末30と、これらを通信可能に接続するネットワーク40とで構成されている。なお、ネットワークは、ローカルエリアネットワークでもよいし、インターネットでもよい。画像検索システム1は、検索システムの一例である。
図1に示す検索サーバ10は、プログラムの実行を通じて検索その他の処理を実行するプロセッサ11と、プログラムや各種のデータを記憶する記憶装置12と、外部との通信を実現するネットワークIF(=InterFace)13と、これらを接続するバスその他の信号線14とを有している。
プロセッサ11は、例えばCPUで構成される。記憶装置12は、例えばBIOS(=Basic Input Output System)等が記憶されたROM(=Read Only Memory)と、ワークエリアとして用いられるRAM(=Random Access Memory)と、基本プログラムやアプリケーションプログラム等が記憶されたハードディスク装置とで構成される。もっとも、ROMやRAMがプロセッサ11の一部に含まれることを妨げない。プロセッサ11と記憶装置12は、コンピュータを構成する。
図1に示すデータベース20には、デザイン案、設計図等の画像の他、顧客からのクレーム、事故の事例、社内レビューの記録等の文書が記録されている。これらの情報を総称して「過去の事例」という。
過去の事例を構成する個々の情報には、検索用のタグが紐付けられている。タグは、個々の情報に含まれる特徴量(以下「特徴」という)の集合で与えられる。本実施の形態では、特徴の集合をデータセットともいう。
図1に示す端末30は、いわゆるコンピュータである。端末30は、デスクトップ型のコンピュータでも、ノート型のコンピュータでも、スマートフォンやウェアラブル端末等の携帯型のコンピュータでもよい。図1では、端末30を1台のみ表しているが、台数は任意である。
なお、検索サーバ10は、1台である必要はなく、協働する複数台のコンピュータでもよい。本実施の形態では、検索サーバ10を検索システムの一例ともいう。なお、検索サーバ10は、クエリ修正システムの一例でもある。
<機能構成>
図2は、データベース20に記録されるデータセットを生成するコンピュータ50の機能上の構成を説明する図である。
コンピュータ50のハードウェア上の構成は、図1に示す検索サーバ10と同様である。すなわち、コンピュータ50には、プロセッサと、記憶装置と、データベース20との通信に用いるインタフェースが設けられている。
コンピュータ50は、データベース20から過去の事例を読み出すと、構造的な表現に分類される特徴(以下「構造情報」という)の抽出用に用意された前処理部51で前処理し、前処理済みの結果を構造情報抽出部52に与える。図2の場合、構造情報抽出部52は、個々の特徴を学習した推論モデルを用いた推論により、過去の事例に含まれる1つ又は複数の特徴を推論し、推論された特徴の集合を過去の事例に紐付けるデータセットとしてデータベース20に出力する。
本実施の形態の場合、推論モデルは特徴毎に用意されている。推論モデルは、機械学習等により事前に生成されている。図2においては、推論モデルを用いる推論をAI(=Artificial Intelligence)推論という。
コンピュータ50は、データベース20から過去の事例を読み出すと、感性的な表現に分類される特徴(以下「感性情報」という)の抽出用に用意された前処理部53で前処理し、前処理済みの結果を感性情報抽出部54に与える。本実施の形態の場合、感性情報は、構造的な表現又は定量的な表現を含まない特徴をいう。換言すると、感性情報は、定性的又は主観的な表現を含む特徴をいう。
図2の場合、感性情報抽出部54は、感性情報を学習した推論モデルを用いた推論により、過去の事例に含まれる1つ又は複数の感性情報を推論し、推論された感性情報の集合を過去の事例に紐付けるデータセットとしてデータベース20に出力する。本実施の形態の場合、推論モデルは感性情報毎に用意される。推論モデルは、機械学習等により事前に生成されている。
このように、データベース20に蓄積される過去の事例には、構造情報と感性情報の両方又は一方に属する1又は複数の特徴が紐付けられている。
図3は、クエリとして入力される画像(以下「クエリ画像」という)に類似する、又は、関連する画像をデータベース20から検索する検索サーバ10の機能上の構成を説明する図である。ユーザが入力するクエリ画像は、第1のクエリ画像の一例である。
検索サーバ10は、クエリ画像を対象別に分類する分類部101、クエリ画像に予め定めた処理を加える前処理部102、クエリ画像に含まれる特徴量(以下「特徴」という)を抽出する特徴抽出部103、構造的な表現を含むテキスト(以下「構造情報テキスト」という)の表現上のゆらぎを補正する正規化部104、感性的な表現を含むテキスト(以下「感性情報テキスト」という)の表現上のゆらぎを補正する正規化部105、構造情報テキストや感性情報テキストを構成する文字列を対応付ける特徴を分類する対応特徴分類部106、検索エンジン108に与える特徴を補正する特徴補正部107、補正後の特徴との関連性が高い事例をデータベース20から検索する検索エンジン108として機能する。
これらの機能は、プロセッサ11(図1参照)によるプログラムの実行を通じて実現される。なお、検索サーバ10のうち検索エンジン108を除く構成は、検索条件特定システムの一例である。
本実施の形態における検索サーバ10は、端末30(図1参照)から、前提情報と、画像情報と、構造情報テキストと、感性情報テキストをクエリ(以下「検索クエリ」ともいう)として入力する。
ただし、これら4種類の情報の全てがクエリとして入力される必要はない。また、本実施の形態の場合、構造情報テキストと感性情報テキストは、明確に区別されている必要はない。実際には、テキストの入力に用いる表現上の種類についての制約はない。従って、ユーザは、両者を区別することなく、検索したい過去の事例に求める要望を文字列で入力することが可能である。
図4は、ユーザが操作する端末30からクエリとして入力される情報を説明する図表である。
前提情報は、ユーザが入力するクエリの中でも他のクエリに比して優先の度合いが高い、構造的な又は定量的な情報である。なお、前提情報には、法令等も含まれる。前提情報は、検索の対象に関連する条件の一例である。もっとも、法令等は、ユーザが入力する必要はない。
本実施の形態の場合、建物に関する画像を検索の対象とする。
このため、前提情報は、例えば住所、土地の広さ、敷地の条件、周辺環境、物件の種別、予算、庭の有無、車の有無、車庫の有無、家族の構成、世帯数で与えられる。物件の種別には、例えばビル、マンション、一戸建てがある。
画像情報は、いわゆるクエリ画像である。画像情報は、例えば手書きの絵、写真、チラシ、CG(=Computer Graphics)で与えられる。本実施の形態の場合、画像情報は、他の種類のクエリに比して優先の度合いが低い。
構造情報テキストは、構造的な表現を含むテキストである。構造情報テキストには、例えば二世帯住宅、徒歩10分、3LDK、木の家がある。
感性情報テキストは、感性的な表現を含むテキストである。感性情報テキストには、例えば開放感、家族団らん、和のスペース、木のぬくもりがある。
なお、構造情報テキストと感性情報テキストは、明確に区別することなく入力される場合もある。構造的な表現と感性的な表現が混在するテキストには、例えば「開放感のある明るいリビング」がある。「リビング」は、明確に特定が可能な名詞であるので構造的な表現であり、「開放感」や「明るい」は、感覚的な状態を表す形容詞であるので感性的な表現である。
図3の説明に戻る。
分類部101は、ユーザが入力したクエリ画像を対象別に分類する。本実施の形態の場合、クエリ画像がリビングの画像、キッチンの画像、外観の画像のいずれかに分類される。勿論、分類先の候補は3種類に限らない。他の候補には、例えば子供部屋、寝室、浴室、トイレ、玄関、庭等がある。分類部101は、分類の結果を、個々のクエリ画像の属性として付加する。
前処理部102は、入力されたクエリ画像に対し、予め定めた処理を加える。予め定めた処理には、例えばサイズの調整、コントラストの調整、エッジの強調、ノイズの除去等がある。
この他、図3に示す前処理部102には、他の条件と矛盾する部分をクエリ画像から取り除く機能が前処理の1つとして用意されている。例えば前提情報では車庫が不要と指定されているのにクエリ画像には車庫が含まれる場合、前処理部102は、クエリ画像から車庫の部分を除去する補正を行う。ここでの「矛盾」は、同時には成立しない又は併存しないという意味で使用する。なお、本実施の形態では、矛盾する部分を、整合しない部分ともいう。
もっとも、他の条件と矛盾する部分でも補正の対象から除外されることがある。本実施の形態の場合、クエリ画像のうち特定された他の条件と矛盾する部分の補正の実行や後段への出力はユーザの指示に従う。
特徴抽出部103は、機械学習等により特徴毎に用意された推論モデルとの照合により、クエリ画像に含まれる1つ又は複数の特徴を抽出する。
図5は、特徴抽出部103による特徴の抽出例を説明する図である。図5の場合、クエリ画像として入力されたリビングの写真から、「高い天井」、「高所の窓」、「はしご」、「フローリング」、「木のぬくもり」、「開放的」、「シーリングファン」、「スポットライト」等が特徴として抽出されている。
図3の説明に戻る。
正規化部104は、ユーザがクエリとして入力した構造情報テキストの表現上のゆらぎを補正する。例えば文字種の統一、つづりや表記の揺れが吸収される。
正規化部105は、ユーザがクエリとして入力した感性情報テキストの表現上のゆらぎを補正する。また、正規化部104により、個人毎の表現のばらつきも補正される。
対応特徴分類部106は、構造情報テキストや感性情報テキストを構成する文字列が構造的な特徴に対応するか、感性的な特徴に対応するか、それとも両方に対応するかを分類する。
特徴補正部107は、ユーザの意図する検索結果が得られやすくなるように、検索エンジン108に与える特徴を補正する処理を実行する。本実施の形態における特徴補正部107は、抽出された特徴間の矛盾を除去する。例えば特徴補正部107は、クエリ画像から抽出された特徴のうち前提情報と矛盾する特徴を除去する補正を実行する。また例えば特徴補正部107は、複数のクエリ画像間で矛盾する特徴を除去する補正を実行する。
<前処理部102の機能構成>
ここでは、前述した検索サーバ10の機能構成のうち前処理部102で実行される処理機能の詳細について説明する。
図6は、前処理部102を構成する機能構成の一例を説明する図である。
図6に示す前処理部102には、ユーザが入力したクエリ画像を解析する画像解析部121と、検索の対象に関連する条件である前提情報を解析する前提情報解析部122と、画像解析部121の解析の結果と前提情報解析部122の解析の結果を比較する比較部123と、比較の結果を通じて特定された矛盾を補正する矛盾補正部124が設けられている。
ここでの前処理部102は、クエリ修正システムの一例でもある。
本実施の形態における画像解析部121は、クエリ画像に含まれる建物の構造に関する情報を抽出し、抽出された情報を比較部123に出力する。建物は、検索の対象の一例である。建物の構造に関する情報は、第1のクエリ画像から抽出される特徴の一例である。
本実施の形態の場合、構造に関する情報として、例えば建物の形状に関する情報、敷地の情報、周辺の環境、車庫の有無、庭の有無が抽出される。建物の形状に関する情報には、例えば階数、屋根の形状、窓の割合、天井の高さの比率が含まれる。
本実施の形態の場合、階数とは、平屋、2階建て、3階建て等の情報をいう。ただし、クエリ画像から外観的に抽出される階数であるので、実物の階数と一致するとは限らない。
本実施の形態の場合、屋根の形状とは、切妻屋根、寄棟屋根、片流れ屋根等の情報をいう。勿論、クエリ画像が6面図でもない限り、正確な屋根の形状は分からない。
本実施の形態の場合、窓の割合とは、建物の壁面の面積に占める窓の面積の割合をいう。縮尺等が不明でも、壁面の面積に占める窓の面積の割合は計算が可能である。この他、窓に関する情報には、窓の数を抽出することも可能である。
本実施の形態の場合、天井の高さは、クエリ画像に写り込んでいる又は描かれている他の物体の高さとの比率から想定される高さをいう。なお、予め定めた閾値を超える比率を有する天井を相対的に高い天井ともいい、閾値未満の比率を有する天井を相対的に低い天井ともいう。もっとも、天井の高さの代わりに階高を抽出してもよい。
この他、敷地の情報には、例えば土地の面積、道路と敷地との高低差がある。
また、周辺の環境には、例えば住宅地、商業地、郊外がある。
なお、車庫の有無は、クエリ画像に車庫として使用が想定される構造物や空間の有無をいう。なお、車庫がある場合には、車庫に駐車が可能な車両の台数も抽出される。勿論、台数は推定値である。
また、庭の有無は、車庫として実際に利用されるか否かは問わず、敷地内に庭とみなされる空き空間の有無をいう。
また、クエリ画像の内容によっては、1DK、2LDK、3LDK等の間取りの抽出が可能な場合もある。
本実施の形態における前提情報解析部122は、前提情報に含まれる情報を抽出し、抽出された情報を比較部123に出力する。前提情報は、第1の条件の一例である。
本実施の形態の場合、対象物は建物であるので、例えば予算、土地の広さ、家族の構成、敷地の条件、周辺の環境、車の有無、庭の有無、住所等が抽出される。これらの情報は、ユーザによりテキストで入力されているか、ユーザの選択がテキストに紐付けられているので、項目別に抽出される。なお、ユーザが車を所有する場合には、車の台数も抽出される。
本実施の形態における比較部123は、画像解析部121がクエリ画像から抽出した情報と前提情報解析部122が前提情報から抽出した情報のうち互いに対応する又は関連する情報を比較する。
もっとも、互いに対応する又は関連する情報が存在するとは限らない。従って、比較部123における比較は、互いに対応する又は関連する情報が、画像解析部121と前提情報解析部122の両方に存在する場合である。
なお、互いに対応する情報とは、抽出された情報が表す内容が同じ場合をいう。例えばクエリ画像から抽出される車庫の有無と前提情報から抽出される車庫の有無との関係は、互いに対応する情報の一例である。この他、前提情報から抽出される土地の面積と、クエリ画像から抽出される敷地の面積の想定値との関係も、互いに対応する情報の一例である。
一方、互いに関連する情報とは、表現上の項目や内容は異なっていても、比較が可能な情報を含む関係にある場合をいう。例えば前提情報の車の所有台数と、クエリ画像から抽出される駐車場の許容台数との関係は、互いに関連する情報の一例である。また、前提情報から抽出される土地の有無と所在地の情報と、クエリ画像から抽出される階数の情報と想定高さの情報との関係は、互いに関連する情報の一例である。前提情報から抽出される土地の有無や所在地の情報が分かれば、該当する地域で許容されている法令上の階数の上限が分かるためである。この他、前提情報から抽出される予算と、クエリ画像から抽出される間取り情報も互いに関連する情報の一例である。間取り情報が分かれば、建物の建築に要する費用を見積もることが可能なためである。
本実施の形態における矛盾補正部124は、互いに対応する又は関連する情報が矛盾する場合、クエリ画像から矛盾を取り除く補正を実行する。
互いに対応する又は関連する情報が矛盾する場合には、例えば前提情報では平屋を希望しているのに、クエリ画像は2階建てである場合、前提情報では所有する車の台数が3台であるのに、クエリ画像は1台の車の駐車が可能な場合、前提情報で指定された敷地面積とクエリ画像から推定された敷地の面積の推定値との差が予め定めた閾値以上の場合がある。ここでの閾値は、初期値として与えられてもよいし、ユーザが設定してもよい。本実施の形態の場合、閾値は、前提情報で指定された敷地面積の20%である。
矛盾が取り除かれたクエリ画像、すなわち補正後のクエリ画像は、第2のクエリ画像の一例である。
本実施の形態の場合、補正後のクエリ画像には、ユーザが入力したクエリ画像の構造上の特徴が可能な限り維持されている。
具体的には、矛盾する部位に関連する他の部分があっても、矛盾補正部124は、矛盾の部位に関連する他の部分を補正の対象から除外する。例えば前提情報で指定された地域では3階建てが禁止されているが、クエリ画像が3階建ての建物である場合、クエリ画像の構造上の特徴が残るように補正の内容が決定される。例えばクエリ画像の構造上の特徴として窓の数や面積が抽出されている場合、窓の数や面積を維持する補正がクエリ画像に加えられる。
本実施の形態における矛盾補正部124は、基本的に、クエリ画像から矛盾を取り除く補正を加えるが、特定された矛盾の部位がクエリ画像から抽出された構造上の特徴に該当する場合、当該部位を補正の対象から除外することもある。
例えばクエリ画像が2階建ての場合には、前提情報で平屋建てが指定されていても、クエリ画像を平屋には補正しない。また例えばクエリ画像の建物の屋根の形状が三角形状の場合には、前提情報で陸屋根が指定されていても、クエリ画像を陸屋根には補正しない。
いずれの特徴も、クエリ画像の構造上の特徴であり、この特徴を補正すると、クエリ画像の印象が大きく変化するためである。換言すると、補正により、ユーザの意図する特徴が失われる可能性が高くなるためである。
ところで、矛盾を解消する方法は、クエリ画像の補正に限らない。例えば前提情報を補正することによっても、矛盾の解消が可能である。
そこで、本実施の形態における矛盾補正部124には、矛盾に関連する前提情報が変更可能である場合、前提情報の変更をユーザに問い合わせる機能も用意されている。勿論、変更できない前提情報もある。例えばユーザが土地を所有していない場合には、前提情報として指定された所在地の変更が可能である。同様に、ユーザが土地を所有していない場合には、前提情報として指定された土地の面積の変更が可能である。また、駐車場に停車する車の台数や庭の有無等についても、変更が可能な場合がある。
<前処理部で実行される処理の具体例>
以下では、前処理部102(図3参照)として機能するプロセッサ11(図1参照)が実行する処理動作の一例を、図7を用いて説明する。
図7は、前処理部102が実行する処理の一例を説明するフローチャートである。なお、図7で使用する記号のSはステップを意味する。
まず、前処理部102は、前提情報とクエリ画像を受け付ける(ステップ1)。本実施の形態の場合、前提情報には、ユーザが入力する情報に限らず、法令も含まれる。また、本実施の形態で扱うクエリ画像には、ユーザが入力するクエリ画像の他、先に実行された検索の結果の中からユーザが選択した画像も含まれる。
本実施の形態の場合、クエリ画像は1つであるが、複数のクエリ画像が入力されてもよい。
次に、前処理部102は、受け付けた前提情報から、予算、土地の広さ、家族の構成、敷地の条件、周辺の環境、車の有無、庭の有無、住所等を抽出する(ステップ2)。本実施の形態の場合、前提情報から抽出される情報は、予め定められている。もっとも、抽出する情報は、ユーザが個別に設定してもよいし、初期設定を用いてもよい。また、クエリ画像に含まれる対象に応じて、抽出される情報が定められてもよい。
続いて、前処理部102は、受け付けたクエリ画像から、建物の形状、敷地の情報、周辺の環境、車庫の有無、庭の有無等を抽出する(ステップ3)。ここでの建物の形状には、例えば階数、屋根の形状、窓の割合、天井の高さの比率が含まれる。勿論、これらは一例である。
なお、ステップ2とステップ3の順番は入れ替わってもよいし、並行して実行してもよい。
情報の抽出が終了すると、前処理部102は、前提情報から抽出された情報とクエリ画像から抽出された情報を比較する(ステップ4)。
次に、前処理部102は、比較された情報の間で矛盾があるか否かを判定する(ステップ5)。前述したように、矛盾の判定は、互いに対応する又は関連する情報が前提情報とクエリ画像のそれぞれから抽出されている場合を前提とする。
矛盾する情報が1つも存在しない場合、前処理部102は、ステップ5で否定結果を得る。ステップ5で否定結果が得られた場合、前処理部102は、前処理を終了する。具体的には、ユーザが入力したクエリ画像を特徴抽出部103(図3参照)に出力する。
一方、矛盾する情報が見つかった場合、前処理部102は、ステップ5で肯定結果を得る。ステップ5で肯定結果が得られた場合、前処理部102は、矛盾する情報を特定する(ステップ6)。矛盾する全ての情報の特定が終了すると、前処理部102は、特定された情報をユーザに通知する(ステップ7)。
図8は、特定された矛盾の通知に用いられる画面200の一例を示す図である。画面200は、ユーザが操作する端末30(図1参照)に表示される。
図8に示す画面200は、タイトル欄201と、説明文202と、クエリ画像の表示欄203と、検索の継続を希望する場合に操作されるボタン204と、検索を中止する場合に操作されるボタン205を含んでいる。図8の場合、ボタン204には、「はい」のラベルが付されている。また、ボタン205には、「いいえ」のラベルが付されている。
図8の場合、タイトル欄201は、画面200を通じてユーザに求める内容の要約を示している。ここでは、「矛盾の確認」がユーザに求められる。
説明文202には、矛盾の具体的な内容とユーザに求める操作が記載される。図8の例では、「入力されたクエリ画像には、前提情報(車庫なし)と矛盾する部分(枠で囲んだ部分)が含まれています。検索を続ける場合は、「はい」をクリックしてください。矛盾を解消するクエリ画像の補正案を提案します。」と記載されている。
この説明文202は、クエリ画像の表示欄203に対応付けられている。このため、クエリ画像内で車庫として認識された部分が枠線203Aで囲んで示されている。枠線203Aの表示には、クエリ画像内の他の部位との区別が可能な態様が用いられる。例えば枠線203Aの色調、太さ、輝度等は、クエリ画像側の色調、エッジ成分、輝度等との差が大きくなるように定められる。例えば白壁の建物には、赤色の太い枠線203Aが用いられる。もっとも、枠線203Aの表示は任意である。枠線203Aの表示は、ユーザが表示を希望する場合に限定してもよい。
説明文202では、表示中のクエリ画像から矛盾する部分を解消する補正案を提案して良いかの確認も求められている。
図7の説明に戻る。
ステップ7におけるユーザへの通知の後、前処理部102は、処理を継続するか否かを判定する(ステップ8)。
ここでの判定は、「はい」のボタン204(図8参照)が操作されたか、「いいえ」のボタン205(図8参照)が操作されたかの判定である。ボタン204に対する操作が検知された場合、前処理部102は、ステップ8で肯定結果を得る。一方、ボタン205に対する操作が検知された場合、前処理部102は、ステップ8で否定結果を得る。
ステップ8で否定結果が得られた場合、前処理部102は、現在のクエリ画像を特徴抽出部103(図3参照)に出力することなく、前処理を終了する。この場合、ユーザは、新たにクエリ画像や前提情報を入力する状態に戻る。
一方、ステップ8で肯定結果が得られた場合、前処理部102は、前提情報に基づいてクエリ画像を補正する(ステップ9)。
ここでの補正は、特定された矛盾の解消を目的とする。本実施の形態の場合、補正の対象は、ユーザが入力した又は選択したクエリ画像である。従って、現在のクエリ画像に代えて、前提情報を満たす別の画像が補正の結果として出力されることはない。ユーザが入力した又は選択したクエリ画像を補正の対象とすることで、ユーザの当初の意図が、補正後のクエリ画像にも反映されやすくなる。
補正の内容には、例えば削除、他の画像の追加、他の画像の合成、拡大、縮小、色調の調整又は変更、輝度の調整又は変更、編集がある。
編集には、例えばクエリ画像の再構成、建物の縦横比の変更等も含まれる。例えば予め定めた閾値よりも窓の数が多い場合に、補正後の窓の数も閾値より多い状態を維持する補正も編集に含まれる。また例えば予め定めた閾値よりも天井が高い場合に、補正後の天井は閾値より高い状態に維持する補正も編集に含まれる。
ところで、本実施の形態における前処理部102が実行する矛盾を解消する補正には、幾つかの制約がある。ここでの制約は第2の条件の一例である。
制約の1つは、矛盾が見つかった部分がクエリ画像の構造上の特徴に関連することである。この場合、矛盾を解消する補正は行われない。クエリ画像に含まれる構造上の特徴は、ユーザが意図する特徴である可能性が高いためである。換言すると、構造上の特徴の大幅な変化は、クエリ画像の印象の大幅な変更を伴うためである。
例えば2階建てのクエリ画像の平屋への補正は、構造上の特徴の大幅な変更を伴うため、矛盾する部分であっても補正の実行が禁止される。
一方で、3階建てが建てられない地域に対して3階建てのクエリ画像が入力されている場合、2階建てへの補正は許容される。3階建てから2階建てへの変更は、平屋への変更とは異なり、複数階の建物である点で共通するためである。制約に該当するか否かの基準は、予め具体的に規定されている。
制約の他の1つは、矛盾が発見された部分以外の構造上の特徴は可能な限り維持することである。矛盾する部分を補正するには、補正の影響が他の部分にも及ぶ場合がある。
例えば前提情報で規定される敷地の面積とクエリ画像から特定される建物のサイズ感とが矛盾する場合、クエリ画像内の建物のサイズ感を敷地の面積に応じて補正する必要がある。この場合、補正するのは建物のサイズ感だけに限定し、窓の数や窓の形状、屋根の形状等、補正の対象である建物の構造上の特徴は可能な限り維持する。
クエリ画像に対する補正が完了すると、前処理部102は、補正後のクエリ画像を表示する(ステップ10)。
また、前処理部102は、矛盾を解消する前提情報の変更は可能か否かを判定する(ステップ11)。前提情報の変更が可能である場合、前処理部102は、ステップ11で肯定結果を得る。一方、前提情報の変更が可能でない場合、前処理部102は、ステップ11で否定結果を得る。
ステップ11で肯定結果が得られた場合、前処理部102は、前提情報を変更するか否かを更に判定する(ステップ12)。
前提情報を変更する場合、前処理部102は、ステップ12で肯定結果を得、ステップ1に戻る。すなわち、前提情報の入力を受け付ける画面に戻る。
一方、前提情報を変更しない場合、前処理部102は、ステップ12で否定結果を得る。ステップ12で否定結果が得た場合、前処理部102は、補正後のクエリ画像を検索に使用するか否かを更に判定する(ステップ13)。
なお、ステップ11で否定結果が得られた場合も、前処理部102は、ステップ13の判定を実行する。
補正後のクエリ画像を検索に使用する場合、前処理部102は、ステップ13で肯定結果を得る。ステップ13で肯定結果を得た場合、前処理部102は、前処理を終了する。具体的には、補正後のクエリ画像を特徴抽出部103(図3参照)に出力する。
一方、補正後のクエリ画像を検索に使用しない場合、前処理部102は、ステップ13で否定結果を得る。ステップ13で否定結果を得た場合、前処理部102は、ステップ3に戻る。この場合、ユーザは、新たなクエリ画像を入力する又は選択する。
なお、図7の例では、ステップ10の実行後にステップ11を実行しているが、いずれを先に実行してもよい。
図9は、前提情報の変更の可否の判定に用いられるテーブル250の一例を示す図である。
図9に示すテーブル250は、前提情報の欄251、クエリ画像から抽出した特徴の欄252、矛盾の内容の欄253、前提情報の変更可否の欄254とで構成されている。
図9には、矛盾の事例が5つ示されている。
1つ目の矛盾の事例は、テーブル250の上から1行目の事例である。この事例は、クエリ画像から抽出した駐車場の許容台数が、所有する車の台数を下回る場合である。例えば所有する車の台数が2台であるのに対し、クエリ画像から抽出された駐車場の許容台数が1台の場合である。この例の場合、前提情報の変更を「可」とする。もっとも、車の台数を減らすことは容易ではないとの考えを採用する場合には、前提情報の変更を「不可」とすることも可能である。
2つ目の矛盾の事例は、テーブル250の上から2行目の事例である。この事例は、前提情報では庭を希望しているが、クエリ画像から庭が抽出されていない場合、又は、前提情報では庭を希望していないが、クエリ画像から庭が抽出された場合である。この事例は、いずれの場合もあり得る。そこで、図9の場合、前提情報の変更を「可」としている。
3つ目の矛盾の事例は、テーブル250の上から3行目の事例である。この事例は、クエリ画像から抽出された階数が、所在地がある地域で設定されている階数の上限を上回る場合である。例えばクエリ画像から抽出された階数が3階建てであるが、前提情報で指定された所在地では2階建てが法令上の上限の場合である。
この事例では、前提情報として土地の有無や所在地の情報が入力されている。また、クエリ画像からは、建物の階数の情報又は想定高さの情報が得られている。
クエリ画像内の建物の階数が明確に分からない場合でも、車や人等、高さの目安に用いることが可能な情報が含まれる場合には、高さを推定することが可能である。そして、建物の高さが分かれば、おおよその階数を想定することも可能である。
この事例では、土地を既に所有している場合、前提情報の変更を「不可」とする。一方、まだ土地を所有していない場合、前提情報の変更を「可」とする。
4つ目の矛盾の事例は、テーブル250の上から4行目の事例である。この事例は、クエリ画像から抽出された間取りの情報で家を建てた場合、予算を上回る可能性がある場合である。例えばクエリ画像から抽出された間取りが5LDKであるが、前提情報で指定された予算額が2LDK相当の場合である。この例の場合、前提情報の変更を「可」とする。
5つ目の矛盾の事例は、テーブル250の上から5行目の事例である。この事例は、クエリ画像から算出された敷地の面積の想定値が、所有している土地の面積を上回る場合である。例えばクエリ画像から抽出された敷地の面積の想定値が300平方メートルであるが、前提情報で指定された土地の面積が200平方メートルの場合である。
この事例では、前提情報として土地の有無や土地の面積が入力されている。また、クエリ画像からは、敷地の面積の想定地が抽出されている。
この事例では、土地を既に所有している場合、前提情報の変更を「不可」とする。一方、まだ土地を所有していない場合、前提情報の変更を「可」とする。
なお、図9に示す事例は一例であり、変更の可否についての結論も一例に過ぎない。
<前処理に関連する表示>
以下では、ステップ9〜ステップ13(図7参照)に関連して表示される画面の例を説明する。
<例1>
図10は、補正後のクエリ画像を表示する画面300の例を示す図である。画面300は、補正の前後のクエリ画像を並べて表示する場合に用いられる。画面300は、ユーザが操作する端末30(図1参照)に表示される。
図10に示す画面300は、タイトル欄301と、説明文302と、補正前のクエリ画像の表示欄303と、補正後のクエリ画像の表示欄304と、問い合わせ文305と、補正後のクエリ画像を検索に用いる場合に操作されるボタン306と、補正後のクエリ画像を検索に用いない場合に操作されるボタン307とを含んでいる。図10の場合、ボタン306には、「OK」のラベルが付されている。また、ボタン307には、「NG」のラベルが付されている。
図10の場合、タイトル欄301は、画面300を通じてユーザに求める内容の要約を示している。ここでは、「検索条件の確認」がユーザに求められる。ここでの検索条件には、前提情報とクエリ画像の両方が含まれる。
説明文302には、矛盾が発見された検索条件と、矛盾を解消するためにシステム側が生成したクエリ画像の補正案に関する説明が記載される。図10の例では、「前提情報:車庫なしに基づいて、入力されたクエリ画像を以下のように補正しました。」と記載されている。
図10の場合、補正前のクエリ画像の表示欄303と補正後のクエリ画像の表示欄304とが並んで表示される。補正の前後のクエリ画像が並んで表示されることで、補正された部分の確認が容易になる。もっとも、補正後のクエリ画像だけを表示してもよい。補正後のクエリ画像は、第2のクエリ画像の一例である。
図10の場合、補正後のクエリ画像の表示欄304には、車庫が除去された建物が表示されている。ただし、車庫以外の建物の外観は、構造上の特徴が維持されている。
もっとも、表示欄304に示されている建物は、補正前の建物から枠線303Aで囲まれた車庫を除去した画像ではなく、屋根の下に存在するはずの白い外壁を付け加えた画像である。外壁を付け加えない場合、建物として不自然な外観となるためである。
この補正は、建物のデータベースを機械学習した推論モデルや予めプログラミングされた条件別の処理の実行を通じて実現される。
図10の場合、補正後のクエリ画像の表示欄304の下に、補正後のクエリ画像を検索に用いるか否かをユーザに確認する問い合わせ文305が表示されている。
なお、図10に示す画面300は、前提情報の変更が可能でない場合の例である。例えばユーザが敷地を所有している場合である。このため、ボタン306及び307は、補正後のクエリ画像を検索に使用するか否かの二者択一となっている。
図11は、補正後のクエリ画像を表示する他の画面300Aの例を示す図である。図11には、図10との対応部分に対応する符号を付して示している。
画面300Aが画面300(図9参照)と異なる点は、問い合わせ文305に対する応答の入力に用いられるボタンが、「OK」とのラベルが付されたボタン306と、「前提情報を変更」とのラベルが付されたボタン308である点である。
図11に示す画面300Aの場合、ボタン308の表示により、前提情報の変更が可能であることをユーザに通知している。ボタン308の操作の検知は、ステップ12(図7参照)において肯定結果が得られることを意味する。
なお、図11に示す画面300Aの場合にも、前提情報の変更もクエリ画像の補正も希望しないユーザのために、「NG」とのラベルを付したボタン307(図10参照)を配置してもよい。
<例2>
図12は、補正後のクエリ画像を表示する画面300Bの例を示す図である。図12には、図10との対応部分に対応する符号を付して示している。
図12に示す画面300Bは、クエリ画像の内容が画面300(図10参照)と異なっている。
図12に示すクエリ画像には、敷地に余裕がある郊外の建物が表されている。しかも、建物の横には、2台以上の車の駐車が可能な大型の車庫が設けられている。また、図12に示すクエリ画像では、建物の手前側の敷地が空き地になっている。以上より、図12に示すクエリ画像に含まれる建物は、かなり広い土地に建築されていることが推定される。
一方、図12の場合、前提情報で指定された土地の面積は、クエリ画像から抽出される敷地の面積の推定値よりも格段に狭い。このため、説明文302Bには、矛盾が見つかった事項として「土地の面積」が示されている。
図12の場合、前提情報とクエリ画像との矛盾が土地の面積であるため、ユーザが入力したクエリ画像の表示欄303の全体が枠線303Bで囲まれている。
さらに、図12における補正後のクエリ画像の表示欄304には、境界壁で囲まれた建物が表示されている。なお、補正後の建物のサイズ感は、前提情報で示された土地の面積や土地の形状に合わせて補正されている。具体的には、建物の間口が狭められている。ただし、建物の構造上の特徴であるデザインは維持されている。
図12に示す例は、前提情報の変更が許されないので、「OK」とのラベルを付したボタン306と「NG」とのラベルを付したボタン307とが表示されている。
<例3>
図13は、クエリ画像に3階建ての建物が含まれるが前提情報で指定された所在地では2階建てしか許されない場合におけるクエリ画像の補正の例を説明する図である。(A)は補正前のクエリ画像を示し、(B)は補正後のクエリ画像を示す。
図13の場合、クエリ画像の2階部分に窓が無いこともあり、3階部分を2階部分に移動させた補正が加えられている。
なお、クエリ画像の補正では、3階部分を削除して2階部分に屋根を取り付けることも可能である。しかし、補正前のクエリ画像の構造上の特徴の1つに窓の多さがある。このため、図13の場合には、3階部分の窓を構造上の特徴として維持している。
<他の実施の形態>
以上、本発明の実施の形態について説明したが、本発明の技術的範囲は前述した実施の形態に記載の範囲に限定されない。前述した実施の形態に、種々の変更又は改良を加えたものも、本発明の技術的範囲に含まれることは、特許請求の範囲の記載から明らかである。
前述の実施の形態では、設計事務所やデザイン事務所での使用を想定する画像検索システムを例示したが、クエリ画像とテキスト情報を入力する画像検索システムであれば、使用分野は建築関係に限らない。例えばウェブ検索や文書の検索にも活用が可能である。
前述の実施の形態における画像解析部121の場合、入力されるクエリ画像の内容が同じであれば、抽出される構造上の特徴はユーザの違いによらず同じであるが、検索の実行者であるユーザ毎に抽出される特徴が異なっていてもよい。例えばクエリ画像内で注目される構造上の特徴にユーザ毎の傾向がある場合には、この傾向に応じて画像解析部121で抽出される特徴を変更してもよい。ユーザが注目する傾向が高い構造上の特徴の矛盾は検索の結果への影響が大きいためである。
前述の実施の形態では、建物の外観を表すクエリ画像から構造上の特徴を抽出しているが、同じ建物でも室内を表すクエリ画像の場合には、建物の外観を表すクエリ画像とは異なる構造上の特徴が抽出される設定としてもよい。換言すると、クエリ画像に含まれる内容の種類に応じて抽出される構造上の特徴を設定してもよい。この設定により、クエリ画像に含まれる内容の種類毎に特有の特徴が抽出され、矛盾が発見され易くなる。
前述の実施の形態では、クエリ画像から抽出された構造上の特徴と前提情報との間に矛盾が見つかった場合、矛盾の存在をユーザに通知しているが、矛盾を通知すること無く、クエリ画像を補正してもよい。
前述の実施の形態では、特定された矛盾を前提情報に応じて補正したクエリ画像を検索の実行前にユーザに提示しているが、ユーザに提示すること無く、検索を開始してもよい。
前述の実施の形態では、特定された矛盾に関連する前提情報の変更が可能な場合、ユーザに前提情報を変更する機会を与えているが、このような機会を設けなくてもよい。
前述の実施の形態の場合、前処理部102は、構造情報テキストと感性情報テキストの両方又は一方との矛盾を除去する補正を実行していないが、前処理部102における矛盾の除去の対象に構造情報テキストと感性情報テキストの両方又は一方を含めてもよい。
前述の実施の形態では、前提情報の変更が可能である場合、前提情報の変更を受け付けるボタン308(図11参照)を表示しているが、矛盾の内容によっては別のクエリ画像の入力を促す機能を設けてもよい。
なお、前述した各実施の形態におけるプロセッサは、広義的な意味でのプロセッサを指し、汎用的なプロセッサ(例えばCPU(=Central Processing Unit)等)の他、専用的なプロセッサ(例えばGPU(=Graphical Processing Unit)、ASIC(=Application Specific Integrated Circuit)、FPGA(=Field Programmable Gate Array)、プログラム論理デバイス等)を含む。
また、前述した各実施の形態におけるプロセッサの動作は、1つのプロセッサが単独で実行してもよいが、物理的に離れた位置に存在する複数のプロセッサが協働して実行してもよい。また、プロセッサにおける各動作の実行の順序は、前述した各実施の形態に記載した順序のみに限定されるものでなく、個別に変更してもよい。
1…画像検索システム、10…検索サーバ、11…プロセッサ、12…記憶装置、20…データベース、30…端末、50…コンピュータ、51…前処理部、52…構造情報抽出部、53…前処理部、54…感性情報抽出部、101…分類部、102…前処理部、103…特徴抽出部、104、105…正規化部、106…対応特徴分類部、107…特徴補正部、108…検索エンジン、121…画像解析部、122…前提情報解析部、123…比較部、124…矛盾補正部

Claims (20)

  1. ユーザにより入力された第1のクエリ画像に、検索の対象に関連する第1の条件に矛盾する部分が含まれる場合、当該部分を当該第1の条件に応じて補正し、第2のクエリ画像を生成するプロセッサ
    を有するクエリ修正システム。
  2. 前記第1の条件は、検索クエリとして用いられる、請求項1に記載のクエリ修正システム。
  3. 前記第1の条件は、前記第1のクエリ画像から抽出される特徴に関連する、請求項2に記載のクエリ修正システム。
  4. 前記プロセッサは、前記部分を補正する場合、前記第1のクエリ画像に現れる前記部分以外の構造上の特徴を維持する、請求項1に記載のクエリ修正システム。
  5. 前記構造上の特徴は、前記第1のクエリ画像に含まれる内容の種類に応じて定められる、請求項4に記載のクエリ修正システム。
  6. 前記構造上の特徴は、ユーザ毎に設定される、請求項4に記載のクエリ修正システム。
  7. 前記プロセッサは、前記第1の条件に矛盾する前記部分が予め定めた第2の条件を満たす場合、当該部分を補正しない、請求項1又は4に記載のクエリ修正システム。
  8. 前記第2の条件は、前記第1の条件に矛盾する前記部分が、前記第1のクエリ画像に現れる構造上の特徴に該当することである、請求項7に記載のクエリ修正システム。
  9. 前記プロセッサは、前記第1の条件に矛盾する部分が見つかった場合、前記第1のクエリ画像を補正する前に、当該矛盾する部分の情報をユーザに通知する、請求項1に記載のクエリ修正システム。
  10. 前記プロセッサは、前記第1のクエリ画像を補正する前に、前記第2のクエリ画像の生成の可否をユーザに問い合わせる、請求項1又は9に記載のクエリ修正システム。
  11. 前記プロセッサは、前記第1の条件と矛盾する部分に補正の対象から除外される部分が含まれる場合、当該補正の対象から除外される部分に関連する当該第1の条件の変更をユーザに問い合わせる、請求項1又は9に記載のクエリ修正システム。
  12. 前記プロセッサは、前記矛盾に対応する前記第1の条件の変更が可能な場合には、当該第1の条件の変更の可否をユーザに問い合わせる、請求項1に記載のクエリ修正システム。
  13. 前記プロセッサは、生成された前記第2のクエリ画像をユーザに提示する、請求項1に記載のクエリ修正システム。
  14. 前記プロセッサは、前記第2のクエリ画像と前記第1のクエリ画像を同じ画面上に並べて配置する、請求項13に記載のクエリ修正システム。
  15. 前記プロセッサは、前記第1のクエリ画像及び前記第2のクエリ画像の両方又は一方に、補正された部位を示す表記を追加する、請求項14に記載のクエリ修正システム。
  16. 前記プロセッサは、検索を実行する前に、生成された前記第2のクエリ画像の検索への使用をユーザに問い合わせる、請求項13に記載のクエリ修正システム。
  17. 前記第1の条件は法令を含む、請求項1に記載のクエリ修正システム。
  18. 前記プロセッサは、前記第1の条件としてのユーザの入力と前記法令とが矛盾する場合、法令を優先する、請求項17に記載のクエリ修正システム。
  19. ユーザにより入力された第1のクエリ画像に、検索の対象に関連する第1の条件に矛盾する部分が含まれる場合、当該部分を当該第1の条件に応じて補正して第2のクエリ画像を生成し、生成された当該第2のクエリ画像を用いてデータベースを検索するプロセッサ
    を有する検索システム。
  20. コンピュータに、
    ユーザが入力する第1のクエリ画像を受け付ける機能と、
    前記第1のクエリ画像に、検索の対象に関連する第1の条件に矛盾する部分が含まれる場合、当該部分を当該第1の条件に応じて補正して第2のクエリ画像を生成する機能と
    を実行させるプログラム。
JP2019191530A 2019-10-18 2019-10-18 クエリ修正システム、検索システム及びプログラム Pending JP2021068064A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2019191530A JP2021068064A (ja) 2019-10-18 2019-10-18 クエリ修正システム、検索システム及びプログラム
US16/847,129 US11455332B2 (en) 2019-10-18 2020-04-13 Query change system, search system, and computer readable medium
AU2020203188A AU2020203188A1 (en) 2019-10-18 2020-05-15 Query change system, search system, and program
CN202010412232.3A CN112685585A (zh) 2019-10-18 2020-05-15 查询修改系统、检索系统以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019191530A JP2021068064A (ja) 2019-10-18 2019-10-18 クエリ修正システム、検索システム及びプログラム

Publications (1)

Publication Number Publication Date
JP2021068064A true JP2021068064A (ja) 2021-04-30

Family

ID=75445565

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019191530A Pending JP2021068064A (ja) 2019-10-18 2019-10-18 クエリ修正システム、検索システム及びプログラム

Country Status (4)

Country Link
US (1) US11455332B2 (ja)
JP (1) JP2021068064A (ja)
CN (1) CN112685585A (ja)
AU (1) AU2020203188A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240095275A1 (en) * 2022-09-20 2024-03-21 Adobe Inc. Generative prompt expansion for image generation

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8788434B2 (en) * 2010-10-28 2014-07-22 Google Inc. Search with joint image-audio queries
US9087078B2 (en) * 2012-09-25 2015-07-21 Adobe Systems Incorporated Single user interface for selecting, modifying, and querying images
JP2016218578A (ja) 2015-05-15 2016-12-22 日本電信電話株式会社 画像検索装置、画像検索システム、画像検索方法、及び画像検索プログラム
US11004131B2 (en) * 2016-10-16 2021-05-11 Ebay Inc. Intelligent online personal assistant with multi-turn dialog based on visual search
KR102652362B1 (ko) 2017-01-23 2024-03-29 삼성전자주식회사 전자 장치 및 전자 장치 제어 방법
US10977303B2 (en) * 2018-03-21 2021-04-13 International Business Machines Corporation Image retrieval using interactive natural language dialog
US20190311070A1 (en) * 2018-04-06 2019-10-10 Microsoft Technology Licensing, Llc Method and apparatus for generating visual search queries augmented by speech intent
US11010421B2 (en) * 2019-05-09 2021-05-18 Microsoft Technology Licensing, Llc Techniques for modifying a query image

Also Published As

Publication number Publication date
US11455332B2 (en) 2022-09-27
US20210117466A1 (en) 2021-04-22
CN112685585A (zh) 2021-04-20
AU2020203188A1 (en) 2021-05-06

Similar Documents

Publication Publication Date Title
KR20200017347A (ko) 지식 그래프를 생성하기 위한 방법, 장치, 기기 및 컴퓨터 판독 가능 저장 매체
WO2023185458A1 (zh) 建筑方案生成的方法、装置、计算机设备以及存储介质
WO2020159787A1 (en) Methods and systems for rendering and modifying three-dimensional models for interior design
US10430902B1 (en) Automatic updating of real estate database
US8650143B2 (en) Determination of document credibility
CN109804364A (zh) 知识图谱构建系统及方法
JP2005050344A (ja) ビジョンベースの文書セグメンテーション
US20170032481A1 (en) Method and system for identifying a property for purchase and related products and services using image processing
WO2017090678A1 (ja) 情報処理システム、及び情報処理方法
CN111709061A (zh) 室内物品自动摆放处理方法、装置以及设备、存储介质
US11783385B1 (en) Home valuation using identified exterior and interior features systems and methods
WO2023193577A1 (zh) 建筑设计自动设计计算方法及系统
Booi et al. Staying in the city or moving to the suburbs? Unravelling the moving behaviour of young families in the four big cities in the Netherlands
JP2021068064A (ja) クエリ修正システム、検索システム及びプログラム
JP2020129217A (ja) 保育所割当プログラム及びシステム
WO2023193576A1 (zh) 建筑规范条款智能筛选确定方法
US11481431B2 (en) Search criterion determination system, search system, and computer readable medium
US11403292B2 (en) Query modification assistance system, search system, and computer readable medium
JP2021068065A (ja) クエリ生成システム、検索システム及びプログラム
JP7182822B1 (ja) 情報処理システム、情報処理方法および情報処理プログラム
Koutamanis Computer-mediated briefing for architects
WO2024028862A1 (en) System and method for generating enriched property listings
Lytle The perceptions, practices, and policies that govern food, energy, and water consumption in the US Suburban home:“More than My Fair Share”
JP2023086430A (ja) 情報処理装置、解析方法、及び解析プログラム
Takizawa Extracting real estate values of rental apartment floor plans using graph convolutional networks