JP6278893B2 - 対話型マルチモード画像検索 - Google Patents
対話型マルチモード画像検索 Download PDFInfo
- Publication number
- JP6278893B2 JP6278893B2 JP2014542660A JP2014542660A JP6278893B2 JP 6278893 B2 JP6278893 B2 JP 6278893B2 JP 2014542660 A JP2014542660 A JP 2014542660A JP 2014542660 A JP2014542660 A JP 2014542660A JP 6278893 B2 JP6278893 B2 JP 6278893B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- query
- images
- search
- visual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002452 interceptive effect Effects 0.000 title description 112
- 230000000007 visual effect Effects 0.000 claims description 124
- 238000000034 method Methods 0.000 claims description 72
- 230000008569 process Effects 0.000 claims description 31
- 230000008859 change Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims 1
- 239000002131 composite material Substances 0.000 description 45
- 238000000605 extraction Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 10
- 230000003993 interaction Effects 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 230000001755 vocal effect Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 230000000717 retained effect Effects 0.000 description 4
- 241000234295 Musa Species 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 235000021015 bananas Nutrition 0.000 description 3
- 239000003086 colorant Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012905 input function Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 241000282320 Panthera leo Species 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 241001147416 Ursus maritimus Species 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 230000000881 depressing effect Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5854—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本特許文献の開示の一部分は、著作権の保護を受ける情報を含む場合がある。著作権所有者は、それが特許商標庁の特許ファイルまたは記録に見られる限りにおいては、いずれの人間による特許文献または特許開示のファクシミリ複製に対しても異議を唱えないが、それ以外の場合については、いかなる著作権も全て保有する。以下の表示は、本明細書に適用されるものとする:Copyright(C) 2011、Microsoft Corp。
図1は、本明細書に記載するモバイル用の対話型画像検索のフレームワーク100を示す図である。例示的なフレームワーク100は、クラウド側102が少なくとも1つのサーバ104をホスティングしているものとして示してある。サーバ104は、メモリ106、記憶プログラム108、およびプロセッサ110を含む。クライアント側114の1つまたは複数のモバイル・デバイス112は、破線で示すネットワーク116を介してサーバ104およびその他のクラウド型デバイスに接続することができる。サーバ104としては、例えば、ウェブ・サーバ、アプリケーション・サーバ、およびその他の任意の個数のデータ・サーバなどが挙げられる。ネットワーク116は、例えばインターネットなど、任意のタイプの通信ネットワークを代表するものである。モバイル・デバイス112は、ネットワーク116を介してデータを送受信するように構成された任意のタイプのモバイル・デバイスを代表するものである。例えば、モバイル・デバイス112は、携帯電話、携帯情報端末(PDA)、ネットブック、タブレット型コンピュータ、ハンドヘルド型コンピュータ、およびその他のそのような低いフォーム・ファクタおよび低い計算リソース上限を特徴とするモバイル計算デバイスとして実装することができる。
図2は、200に、モバイル・デバイス112における対話型多モード画像検索に使用されるユーザ・インタフェースの構成要素の例を示す図である。図示の例では、モバイル・デバイス112は、Windows(登録商標) Phone(R)デバイスを表しているが、その他の携帯電話、スマートフォン、タブレット型コンピュータおよびその他の同種のモバイル・デバイスも、同様に利用することができる。モバイル・デバイス112では、ハードウェア式またはソフトウェア式のボタン202を押下して入力処理を起動することにより、音声入力を開始したいことを示す。上述のように、音声入力は、音声認識エンジン120を介するなどして受信され、テキストに変換される。変換されたテキストは、204に示すように、モバイル・デバイス112の画面上に提示することができ、これにより、誤って変換されたテキストのイベント部分の編集が可能になる。いくつかの代替の場合には、最初の音声入力の代わりに、モバイル・デバイス112のハードまたはソフト・キーを介してテキスト入力を受信して、対話型マルチモード画像検索の処理を開始することもできる。
<外1>
404を認識し、各エンティティの候補画像のリストを戻り値として返す。本発明に係る様々な実施態様では、各エンティティの候補画像のリストは、対話型マルチモード画像検索ツールによって後の処理において使用するために記憶される。
<外2>
図5は、本明細書に記載する対話型マルチモード画像検索機能を提供するように構成された例示的なモバイル・デバイス112の構成要素の中から選択された構成要素を示す図である。例示的なモバイル・デバイス112は、ネットワーク・インタフェース502と、マイクロプロセッサを含むことが可能な1つまたは複数のプロセッサ504と、音声プロセッサ506と、1つまたは複数のマイクロフォン508と、メモリ510とを含む。ネットワーク・インタフェース502は、モバイル・デバイス112がネットワーク116を介してデータを送信および/または受信できるようにする。ネットワーク・インタフェース502は、モバイル・デバイス112がウェブ・ベースのデータおよび携帯電話網ベースのデータなど(ただしこれらに限定されない)様々なタイプの通信を送信および/または受信できるようにする、その他の通信インタフェースの任意の組合せを表すこともある。
図6〜図9は、本明細書に記載する対話型マルチモード画像検索ツール520を実装する例示的な方法を示す図である。これらの方法は、ハードウェア、ソフトウェアまたはそれらの組合せとして実施することができる処理動作のシーケンスを表す論理フロー・グラフのブロックの集合として示してある。ソフトウェアとして実施される状況では、これらのブロックは、1つまたは複数のプロセッサによって実行されたときに、本実施形態に記載された処理動作を、それらのプロセッサに実行させる、1つまたは複数のコンピュータ可読媒体上のコンピュータ実行可能命令を表す。
<外3>
<外5>
<外6>
<外7>
<外8>
<外10>
<外11>
<外12>
<外13>
<外14>
<外16>
<外17>
<外18>
<外19>
<外20>
<外22>
<外23>
<外24>
<外25>
<外26>
<外27>
モバイル・デバイスを介して利用することができる機能およびデータ・アクセスがますます増加しているこのようなデバイスは、移動しながらますます多くのデータにユーザがアクセスできるようにする個人用のネットサーフィン用コンシェルジュとして機能することができる。モバイル・デバイスによって利用可能となるマルチモード対話機能をレバレッジすることにより、対話型マルチモード画像検索ツールは、既存のクエリ画像を必要とせずに、視覚的検索処理を効果的に実行することができる。
Claims (10)
- 計算デバイスを介してクエリ入力内容を受信するステップであって、前記クエリ入力内容は、少なくとも第1のエンティティおよび第2のエンティティを含む、ステップと、
前記計算デバイスのGPSモジュールから、前記計算デバイスの現在位置の情報を得るステップと、
前記クエリ入力内容および前記現在位置の前記情報に基づいて、前記現在位置に関連する候補画像群を生成するステップであって、前記候補画像群は、少なくとも、前記第1のエンティティに関連付けられた第1の画像群と、前記第2のエンティティに関連付けられた第2の画像群と、を含む、ステップと、
前記第1の画像群の中から第1の画像を選択する第1の操作を受信するステップと、
前記計算デバイスのユーザ・インタフェースを介して、キャンバス上における前記第1の画像の配置に関する第1の指示を受信するステップと、
前記第2の画像群の中から第2の画像を選択する第2の操作を受信するステップと、
前記ユーザ・インタフェースを介して、前記キャンバス上における前記第2の画像の配置に関する第2の指示を受信するステップと、
前記キャンバスに基づいて、視覚的検索処理を実行するためのクエリ画像を作成するステップであって、前記クエリ画像は第1の画像パッチおよび第2の画像パッチを含み、前記第1の画像パッチは前記第1の画像に対応し、前記第2の画像パッチは前記第2の画像に対応し、前記クエリ画像内における前記第1の画像パッチおよび前記第2の画像パッチの相対的な位置は、前記キャンバス上における前記第1の画像および前記第2の画像の相対的な位置に基づく、ステップと、
前記クエリ画像を用いて前記視覚的検索処理を実行するステップと
を含む、方法。 - 前記クエリ入力内容から前記第1のエンティティおよび前記第2のエンティティを抽出するステップをさらに含む、請求項1に記載の方法。
- 前記クエリ画像内における前記第1の画像パッチおよび前記第2の画像パッチの相対的なサイズは、前記キャンバス上における前記第1の画像および前記第2の画像の相対的なサイズに基づく、請求項1または2に記載の方法。
- 前記キャンバス上における前記第1の画像および前記第2の画像のうちの少なくとも1つのサイズの変更を指示する入力内容を受信するステップをさらに含む、請求項1から3のいずれか一項に記載の方法。
- 前記クエリ入力内容が、音声入力を含む、請求項1から4のいずれか一項に記載の方法。
- 前記計算デバイスが、モバイル・デバイスを含む、請求項1から5のいずれか一項に記載の方法。
- 前記ユーザ・インタフェースが、タッチ・インタフェースを含む、請求項1から6のいずれか一項に記載の方法。
- 前記クエリ画像をメモリに記録するステップをさらに含む、請求項1から7のいずれか一項に記載の方法。
- プロセッサおよびメモリを含むシステムであって、請求項1乃至請求項8の中のいずれか一項に記載の方法を実行するように構成されたシステム。
- 請求項1乃至請求項8の中のいずれか一項に記載の方法をデバイスに実行させるコンピュータ・プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2011/082865 WO2013075316A1 (en) | 2011-11-24 | 2011-11-24 | Interactive multi-modal image search |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014534540A JP2014534540A (ja) | 2014-12-18 |
JP6278893B2 true JP6278893B2 (ja) | 2018-02-14 |
Family
ID=48469015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014542660A Active JP6278893B2 (ja) | 2011-11-24 | 2011-11-24 | 対話型マルチモード画像検索 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9411830B2 (ja) |
EP (1) | EP2783305A4 (ja) |
JP (1) | JP6278893B2 (ja) |
KR (1) | KR20140093957A (ja) |
CN (1) | CN103946838B (ja) |
WO (1) | WO2013075316A1 (ja) |
Families Citing this family (71)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5009577B2 (ja) * | 2005-09-30 | 2012-08-22 | 富士フイルム株式会社 | 画像検索装置および方法並びにプログラム |
US9075825B2 (en) | 2011-09-26 | 2015-07-07 | The University Of Kansas | System and methods of integrating visual features with textual features for image searching |
CN103207879B (zh) * | 2012-01-17 | 2016-03-30 | 阿里巴巴集团控股有限公司 | 图像索引的生成方法及设备 |
US10656808B2 (en) * | 2012-09-18 | 2020-05-19 | Adobe Inc. | Natural language and user interface controls |
US20140156704A1 (en) * | 2012-12-05 | 2014-06-05 | Google Inc. | Predictively presenting search capabilities |
US9483518B2 (en) * | 2012-12-18 | 2016-11-01 | Microsoft Technology Licensing, Llc | Queryless search based on context |
US20140207758A1 (en) * | 2013-01-24 | 2014-07-24 | Huawei Technologies Co., Ltd. | Thread Object-Based Search Method and Apparatus |
US10795528B2 (en) | 2013-03-06 | 2020-10-06 | Nuance Communications, Inc. | Task assistant having multiple visual displays |
US10783139B2 (en) * | 2013-03-06 | 2020-09-22 | Nuance Communications, Inc. | Task assistant |
JP2014186372A (ja) * | 2013-03-21 | 2014-10-02 | Toshiba Corp | 図絵描画支援装置、方法、及びプログラム |
US20140358882A1 (en) * | 2013-05-28 | 2014-12-04 | Broadcom Corporation | Device content used to bias a search infrastructure |
CN104239359B (zh) * | 2013-06-24 | 2017-09-01 | 富士通株式会社 | 基于多模态的图像标注装置以及方法 |
KR101720250B1 (ko) * | 2013-07-30 | 2017-03-27 | 주식회사 케이티 | 이미지를 추천하는 장치 및 방법 |
US20150088923A1 (en) * | 2013-09-23 | 2015-03-26 | Google Inc. | Using sensor inputs from a computing device to determine search query |
KR20150090966A (ko) * | 2014-01-29 | 2015-08-07 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 검색 결과 제공 방법 |
CN104834933B (zh) * | 2014-02-10 | 2019-02-12 | 华为技术有限公司 | 一种图像显著性区域的检测方法和装置 |
KR101864240B1 (ko) * | 2014-05-15 | 2018-06-04 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 객체 검색 방법 및 장치 |
US9916079B2 (en) | 2014-06-05 | 2018-03-13 | Openpeak Llc | Method and system for enabling the sharing of information between applications on a computing device |
US9996623B1 (en) | 2014-06-27 | 2018-06-12 | Pubsonic, Inc. | Computer-implemented method of carrying out a search for information available over a network |
CN105224121B (zh) * | 2014-07-03 | 2017-12-12 | 深圳Tcl新技术有限公司 | 密码输入方法及系统 |
EP3172683A4 (en) * | 2014-07-25 | 2018-01-10 | Samsung Electronics Co., Ltd. | Method for retrieving image and electronic device thereof |
WO2016017987A1 (en) * | 2014-07-31 | 2016-02-04 | Samsung Electronics Co., Ltd. | Method and device for providing image |
US20160063096A1 (en) * | 2014-08-27 | 2016-03-03 | International Business Machines Corporation | Image relevance to search queries based on unstructured data analytics |
TWI571753B (zh) | 2014-11-07 | 2017-02-21 | 財團法人資訊工業策進會 | 用於產生一影像之一互動索引碼圖之電子計算裝置、其方法及其電腦程式產品 |
US10083238B2 (en) * | 2015-09-28 | 2018-09-25 | Oath Inc. | Multi-touch gesture search |
US9959872B2 (en) * | 2015-12-14 | 2018-05-01 | International Business Machines Corporation | Multimodal speech recognition for real-time video audio-based display indicia application |
US11294957B2 (en) * | 2016-02-11 | 2022-04-05 | Carrier Corporation | Video searching using multiple query terms |
KR101859050B1 (ko) * | 2016-06-02 | 2018-05-21 | 네이버 주식회사 | 내용 기반의 지도 이미지 탐색 방법 및 시스템 |
US11580186B2 (en) * | 2016-06-14 | 2023-02-14 | Google Llc | Reducing latency of digital content delivery over a network |
EP3502840B1 (en) * | 2016-08-16 | 2020-11-04 | Sony Corporation | Information processing device, information processing method, and program |
US12020174B2 (en) | 2016-08-16 | 2024-06-25 | Ebay Inc. | Selecting next user prompt types in an intelligent online personal assistant multi-turn dialog |
US10860898B2 (en) | 2016-10-16 | 2020-12-08 | Ebay Inc. | Image analysis and prediction based visual search |
US11004131B2 (en) | 2016-10-16 | 2021-05-11 | Ebay Inc. | Intelligent online personal assistant with multi-turn dialog based on visual search |
US11748978B2 (en) * | 2016-10-16 | 2023-09-05 | Ebay Inc. | Intelligent online personal assistant with offline visual search database |
US10346727B2 (en) * | 2016-10-28 | 2019-07-09 | Adobe Inc. | Utilizing a digital canvas to conduct a spatial-semantic search for digital visual media |
US10970768B2 (en) * | 2016-11-11 | 2021-04-06 | Ebay Inc. | Method, medium, and system for image text localization and comparison |
US10650814B2 (en) | 2016-11-25 | 2020-05-12 | Electronics And Telecommunications Research Institute | Interactive question-answering apparatus and method thereof |
WO2018106663A1 (en) * | 2016-12-06 | 2018-06-14 | Ebay Inc. | Anchored search |
US11205103B2 (en) | 2016-12-09 | 2021-12-21 | The Research Foundation for the State University | Semisupervised autoencoder for sentiment analysis |
US10642887B2 (en) * | 2016-12-27 | 2020-05-05 | Adobe Inc. | Multi-modal image ranking using neural networks |
KR102652362B1 (ko) | 2017-01-23 | 2024-03-29 | 삼성전자주식회사 | 전자 장치 및 전자 장치 제어 방법 |
US10565256B2 (en) | 2017-03-20 | 2020-02-18 | Google Llc | Contextually disambiguating queries |
CN107133257A (zh) * | 2017-03-21 | 2017-09-05 | 华南师范大学 | 一种基于中心连通子图的相似实体识别方法及系统 |
US10408624B2 (en) * | 2017-04-18 | 2019-09-10 | Microsoft Technology Licensing, Llc | Providing familiarizing directional information |
US20180300301A1 (en) * | 2017-04-18 | 2018-10-18 | Microsoft Technology Licensing, Llc | Enhanced inking capabilities for content creation applications |
US10620911B2 (en) * | 2017-10-25 | 2020-04-14 | International Business Machines Corporation | Machine learning to identify a user interface trace |
US10620912B2 (en) * | 2017-10-25 | 2020-04-14 | International Business Machines Corporation | Machine learning to determine and execute a user interface trace |
US10970900B2 (en) * | 2018-03-12 | 2021-04-06 | Samsung Electronics Co., Ltd. | Electronic apparatus and controlling method thereof |
KR20190118108A (ko) * | 2018-03-12 | 2019-10-17 | 삼성전자주식회사 | 전자 장치 및 그의 제어방법 |
CN108632621B (zh) * | 2018-05-09 | 2019-07-02 | 北京大学深圳研究生院 | 一种基于层次划分的点云属性压缩方法 |
KR20200024618A (ko) | 2018-08-28 | 2020-03-09 | 십일번가 주식회사 | 이미지 검색 방법 및 이를 위한 장치 |
KR102634375B1 (ko) | 2018-08-31 | 2024-02-06 | 구글 엘엘씨 | 동적 키보드 인터페이스내의 애니메이션 이미지 포지셔닝 방법 및 시스템 |
CN109348275B (zh) * | 2018-10-30 | 2021-07-30 | 百度在线网络技术(北京)有限公司 | 视频处理方法和装置 |
US11010421B2 (en) * | 2019-05-09 | 2021-05-18 | Microsoft Technology Licensing, Llc | Techniques for modifying a query image |
CN110134808B (zh) * | 2019-05-22 | 2020-06-05 | 北京旷视科技有限公司 | 图片检索方法、装置、电子设备及存储介质 |
TWI735899B (zh) * | 2019-06-28 | 2021-08-11 | 國立臺北商業大學 | 具狀況判斷之通話系統及方法 |
US11048975B2 (en) * | 2019-07-17 | 2021-06-29 | Walmart Apollo, Llc | Systems and methods for identifying items in a digital image |
CN110598739B (zh) * | 2019-08-07 | 2023-06-23 | 广州视源电子科技股份有限公司 | 图文转换方法、设备、智能交互方法、设备及系统、客户端、服务器、机器、介质 |
US20220028299A1 (en) * | 2019-11-27 | 2022-01-27 | Mariano Garcia, III | Educational Puzzle Generation Software |
CN113282779A (zh) | 2020-02-19 | 2021-08-20 | 阿里巴巴集团控股有限公司 | 图像搜索方法、装置、设备 |
US11645323B2 (en) | 2020-02-26 | 2023-05-09 | Samsung Electronics Co.. Ltd. | Coarse-to-fine multimodal gallery search system with attention-based neural network models |
KR102415366B1 (ko) * | 2020-04-02 | 2022-07-01 | 네이버 주식회사 | 서로 다른 모달의 피처를 이용한 복합 랭킹 모델을 통해 연관 이미지를 검색하는 방법 및 시스템 |
CN113190153A (zh) * | 2021-04-26 | 2021-07-30 | 中山市云经纪网络科技有限公司 | 一种房产楼盘竖屏显示交互方法及系统 |
US11573706B2 (en) | 2021-06-07 | 2023-02-07 | Western Digital Technologies, Inc. | Data storage device and method for efficient image searching |
CN113901177B (zh) * | 2021-10-27 | 2023-08-08 | 电子科技大学 | 一种基于多模态属性决策的代码搜索方法 |
CN114998607B (zh) * | 2022-05-11 | 2023-01-31 | 北京医准智能科技有限公司 | 超声图像的特征提取方法、装置、电子设备及存储介质 |
US20240125609A1 (en) * | 2022-10-18 | 2024-04-18 | SparkCognition, Inc. | Image-based navigation |
KR102539376B1 (ko) * | 2022-11-07 | 2023-06-02 | 주식회사 드랩 | 자연어 기반 상품 사진 생성 방법, 서버 및 컴퓨터 프로그램 |
CN115690556B (zh) * | 2022-11-08 | 2023-06-27 | 河北北方学院附属第一医院 | 一种基于多模态影像学特征的图像识别方法及系统 |
KR102594547B1 (ko) * | 2022-11-28 | 2023-10-26 | (주)위세아이텍 | 멀티모달 특성 기반의 이미지 검색 장치 및 방법 |
US11809688B1 (en) | 2023-02-08 | 2023-11-07 | Typeface Inc. | Interactive prompting system for multimodal personalized content generation |
Family Cites Families (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5579471A (en) * | 1992-11-09 | 1996-11-26 | International Business Machines Corporation | Image query system and method |
US5530793A (en) * | 1993-09-24 | 1996-06-25 | Eastman Kodak Company | System for custom imprinting a variety of articles with images obtained from a variety of different sources |
US5790132A (en) * | 1995-12-07 | 1998-08-04 | Object Technology Licensing Corp. | Image rendering system with extensible mechanism for providing visual user feedback when an image graphic is selected |
US5963670A (en) * | 1996-02-12 | 1999-10-05 | Massachusetts Institute Of Technology | Method and apparatus for classifying and identifying images |
US5913205A (en) * | 1996-03-29 | 1999-06-15 | Virage, Inc. | Query optimization for visual information retrieval system |
US5915250A (en) * | 1996-03-29 | 1999-06-22 | Virage, Inc. | Threshold-based comparison |
US6075905A (en) * | 1996-07-17 | 2000-06-13 | Sarnoff Corporation | Method and apparatus for mosaic image construction |
US5901245A (en) * | 1997-01-23 | 1999-05-04 | Eastman Kodak Company | Method and system for detection and characterization of open space in digital images |
WO1999022318A1 (en) * | 1997-10-27 | 1999-05-06 | Massachusetts Institute Of Technology | Image search and retrieval system |
US6915301B2 (en) * | 1998-08-25 | 2005-07-05 | International Business Machines Corporation | Dynamic object properties |
US7302114B2 (en) * | 2000-01-18 | 2007-11-27 | Branders.Com, Inc. | Methods and apparatuses for generating composite images |
US7032179B2 (en) * | 2000-06-12 | 2006-04-18 | Peer Image, Inc. | System for creating on a computer display screen composite images from diverse sources |
KR100451649B1 (ko) * | 2001-03-26 | 2004-10-08 | 엘지전자 주식회사 | 이미지 검색방법과 장치 |
JP2003196306A (ja) * | 2001-12-28 | 2003-07-11 | Canon Inc | 画像検索装置及びその方法、プログラム |
US8213917B2 (en) | 2006-05-05 | 2012-07-03 | Waloomba Tech Ltd., L.L.C. | Reusable multimodal application |
US7383513B2 (en) * | 2002-09-25 | 2008-06-03 | Oracle International Corporation | Graphical condition builder for facilitating database queries |
US7391424B2 (en) * | 2003-08-15 | 2008-06-24 | Werner Gerhard Lonsing | Method and apparatus for producing composite images which contain virtual objects |
US7400761B2 (en) | 2003-09-30 | 2008-07-15 | Microsoft Corporation | Contrast-based image attention analysis framework |
US7003140B2 (en) * | 2003-11-13 | 2006-02-21 | Iq Biometrix | System and method of searching for image data in a storage medium |
US20050187911A1 (en) * | 2004-02-24 | 2005-08-25 | Microsoft Corporation | Visual query |
JP2006050469A (ja) * | 2004-08-09 | 2006-02-16 | Ricoh Co Ltd | コンテンツ生成装置、コンテンツ生成方法、プログラムおよび記録媒体 |
US7853582B2 (en) | 2004-08-31 | 2010-12-14 | Gopalakrishnan Kumar C | Method and system for providing information services related to multimodal inputs |
US7532771B2 (en) * | 2004-11-12 | 2009-05-12 | Microsoft Corporation | Image processing system for digital collage |
US7653261B2 (en) * | 2004-11-12 | 2010-01-26 | Microsoft Corporation | Image tapestry |
US7702681B2 (en) * | 2005-06-29 | 2010-04-20 | Microsoft Corporation | Query-by-image search and retrieval system |
US8073700B2 (en) * | 2005-09-12 | 2011-12-06 | Nuance Communications, Inc. | Retrieval and presentation of network service results for mobile device using a multimodal browser |
US7457825B2 (en) | 2005-09-21 | 2008-11-25 | Microsoft Corporation | Generating search requests from multimodal queries |
US7865492B2 (en) * | 2005-09-28 | 2011-01-04 | Nokia Corporation | Semantic visual search engine |
JP5009577B2 (ja) * | 2005-09-30 | 2012-08-22 | 富士フイルム株式会社 | 画像検索装置および方法並びにプログラム |
US7873946B2 (en) * | 2006-03-23 | 2011-01-18 | Oracle America, Inc. | Scalable vector graphics, tree and tab as drag and drop objects |
US20070260582A1 (en) * | 2006-05-05 | 2007-11-08 | Inetsoft Technology | Method and System for Visual Query Construction and Representation |
US8971667B2 (en) * | 2006-10-23 | 2015-03-03 | Hewlett-Packard Development Company, L.P. | Digital image auto-resizing |
JP2008192055A (ja) * | 2007-02-07 | 2008-08-21 | Fujifilm Corp | コンテンツ検索方法、およびコンテンツ検索装置 |
US7576755B2 (en) * | 2007-02-13 | 2009-08-18 | Microsoft Corporation | Picture collage systems and methods |
US7657507B2 (en) * | 2007-03-02 | 2010-02-02 | Microsoft Corporation | Pseudo-anchor text extraction for vertical search |
US20100309226A1 (en) * | 2007-05-08 | 2010-12-09 | Eidgenossische Technische Hochschule Zurich | Method and system for image-based information retrieval |
US8260809B2 (en) | 2007-06-28 | 2012-09-04 | Microsoft Corporation | Voice-based search processing |
US8068693B2 (en) * | 2007-07-18 | 2011-11-29 | Samsung Electronics Co., Ltd. | Method for constructing a composite image |
JP2009025968A (ja) * | 2007-07-18 | 2009-02-05 | Fujifilm Corp | 関連語辞書作成装置、方法、及びプログラム、並びにコンテンツ検索装置 |
US20090070321A1 (en) | 2007-09-11 | 2009-03-12 | Alexander Apartsin | User search interface |
JP2009105769A (ja) * | 2007-10-24 | 2009-05-14 | Visionere Corp | オーサリングサーバ、オーサリングシステム及びオーサリング方法 |
CN101159064B (zh) | 2007-11-29 | 2010-09-01 | 腾讯科技(深圳)有限公司 | 画像生成系统以及按照图像生成画像的方法 |
US20090287626A1 (en) * | 2008-05-14 | 2009-11-19 | Microsoft Corporation | Multi-modal query generation |
US20090327236A1 (en) * | 2008-06-27 | 2009-12-31 | Microsoft Corporation | Visual query suggestions |
US20110078055A1 (en) * | 2008-09-05 | 2011-03-31 | Claude Faribault | Methods and systems for facilitating selecting and/or purchasing of items |
CN101515275A (zh) * | 2008-12-17 | 2009-08-26 | 无敌科技(西安)有限公司 | 通过图形特征查询信息的方法 |
CN102016909A (zh) * | 2008-12-19 | 2011-04-13 | 松下电器产业株式会社 | 图像检索装置以及图像检索方法 |
US9087059B2 (en) * | 2009-08-07 | 2015-07-21 | Google Inc. | User interface for presenting search results for multiple regions of a visual query |
US8335784B2 (en) * | 2009-08-31 | 2012-12-18 | Microsoft Corporation | Visual search and three-dimensional results |
US20110196864A1 (en) * | 2009-09-03 | 2011-08-11 | Steve Mason | Apparatuses, methods and systems for a visual query builder |
US8392430B2 (en) | 2009-09-23 | 2013-03-05 | Microsoft Corp. | Concept-structured image search |
US8489641B1 (en) * | 2010-07-08 | 2013-07-16 | Google Inc. | Displaying layers of search results on a map |
EP2418588A1 (en) * | 2010-08-10 | 2012-02-15 | Technische Universität München | Visual localization method |
US9098767B2 (en) * | 2011-04-11 | 2015-08-04 | Hewlett-Packard Development Company, L.P. | System and method for determining the informative zone of an image |
US20140222783A1 (en) * | 2011-04-21 | 2014-08-07 | The Trustees Of Columbia University In The City Of New York | Systems and methods for automatically determining an improved view for a visual query in a mobile search |
US20130114900A1 (en) * | 2011-11-07 | 2013-05-09 | Stanford University | Methods and apparatuses for mobile visual search |
US9009149B2 (en) * | 2011-12-06 | 2015-04-14 | The Trustees Of Columbia University In The City Of New York | Systems and methods for mobile search using Bag of Hash Bits and boundary reranking |
-
2011
- 2011-11-24 EP EP11876320.0A patent/EP2783305A4/en not_active Ceased
- 2011-11-24 JP JP2014542660A patent/JP6278893B2/ja active Active
- 2011-11-24 CN CN201180075049.8A patent/CN103946838B/zh active Active
- 2011-11-24 WO PCT/CN2011/082865 patent/WO2013075316A1/en active Application Filing
- 2011-11-24 KR KR1020147013784A patent/KR20140093957A/ko active Search and Examination
- 2011-11-24 US US13/393,791 patent/US9411830B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014534540A (ja) | 2014-12-18 |
KR20140093957A (ko) | 2014-07-29 |
EP2783305A4 (en) | 2015-08-12 |
CN103946838B (zh) | 2017-10-24 |
US9411830B2 (en) | 2016-08-09 |
WO2013075316A1 (en) | 2013-05-30 |
US20140250120A1 (en) | 2014-09-04 |
CN103946838A (zh) | 2014-07-23 |
EP2783305A1 (en) | 2014-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6278893B2 (ja) | 対話型マルチモード画像検索 | |
US20220075806A1 (en) | Natural language image search | |
US11361018B2 (en) | Automatically curated image searching | |
US11461386B2 (en) | Visual recognition using user tap locations | |
CN108701161B (zh) | 为搜索查询提供图像 | |
US8706740B2 (en) | Concept-structured image search | |
JP6361351B2 (ja) | 発話ワードをランク付けする方法、プログラム及び計算処理システム | |
US8243988B1 (en) | Clustering images using an image region graph | |
US11704357B2 (en) | Shape-based graphics search | |
CN111639228B (zh) | 视频检索方法、装置、设备及存储介质 | |
US20140348400A1 (en) | Computer-readable recording medium storing program for character input | |
CN118296173A (zh) | 文本配图方法及装置、电子设备和介质 | |
Bankar et al. | Multimodal Image Search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141027 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20150523 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150930 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151027 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160120 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160628 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171011 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6278893 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |