JP4413633B2 - 情報検索システム、情報検索方法、情報検索装置、情報検索プログラム、画像認識装置、画像認識方法および画像認識プログラム、ならびに、販売システム - Google Patents

情報検索システム、情報検索方法、情報検索装置、情報検索プログラム、画像認識装置、画像認識方法および画像認識プログラム、ならびに、販売システム Download PDF

Info

Publication number
JP4413633B2
JP4413633B2 JP2004020852A JP2004020852A JP4413633B2 JP 4413633 B2 JP4413633 B2 JP 4413633B2 JP 2004020852 A JP2004020852 A JP 2004020852A JP 2004020852 A JP2004020852 A JP 2004020852A JP 4413633 B2 JP4413633 B2 JP 4413633B2
Authority
JP
Japan
Prior art keywords
image data
recognition
database
information
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004020852A
Other languages
English (en)
Other versions
JP2005215922A (ja
Inventor
尚隆 安藤
Original Assignee
株式会社ゼータ・ブリッジ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ゼータ・ブリッジ filed Critical 株式会社ゼータ・ブリッジ
Priority to JP2004020852A priority Critical patent/JP4413633B2/ja
Priority to CNB2005800034647A priority patent/CN100465957C/zh
Priority to US10/597,168 priority patent/US8458038B2/en
Priority to PCT/JP2005/001561 priority patent/WO2005073879A1/ja
Priority to EP05709660A priority patent/EP1710717A4/en
Publication of JP2005215922A publication Critical patent/JP2005215922A/ja
Application granted granted Critical
Publication of JP4413633B2 publication Critical patent/JP4413633B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • G06V10/464Salient features, e.g. scale invariant feature transforms [SIFT] using a plurality of salient features, e.g. bag-of-words [BoW] representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/09Recognition of logos

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Mathematical Physics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

この発明は、ユーザが気になった情報を検索し、検索した情報に基づく商品の購入などを容易に行えるようにする情報検索システム、情報検索方法、情報検索装置、情報検索プログラム、画像認識装置、画像認識方法および画像認識プログラム、ならびに、販売システムに関する。
例えばポスターや雑誌掲載などの紙媒体としての広告や、テレビジョン放送やラジオ放送のコマーシャルといった電波を媒体とする広告により、ユーザが気になる商品を発見した場合を考える。このとき、その広告に当該商品を購入可能な店舗情報が示されていれば、ユーザは、店舗情報に基づき直接的に当該店舗に赴き当該商品を購入することができる。広告に当該商品を購入可能な店舗情報が掲載されていない場合には、ユーザは、当該商品から推測して店舗を探す必要がある。
また、近年では、インターネットなどのネットワーク環境が発達し、所望の物品の詳細な情報や当該物品を購入可能な店舗情報を、ネットワーク上で検索することが容易となっている。ユーザは、例えばパーソナルコンピュータなどを用いてインターネット上の検索サイトにアクセスし、所望の商品を示すと思われるキーワードにより目的の情報を検索する。検索された情報に、当該商品を購入可能な店舗情報が含まれている場合は、ユーザは、その店舗に赴き当該商品を購入することができる。
さらに、このようなインターネットの発達に伴うEC(Electronic Commerce)の出現により、インターネット上の情報検索サイトの検索結果に基づき、ユーザが実際にその店舗に赴かなくても、インターネットを介して当該商品を注文し、決済することが可能になった。ユーザは、自宅にいながらにして、所望の商品を入手することができる。
さらにまた、近年では、インターネット接続機能が付加された携帯電話端末が広く普及してきていると共に、携帯電話端末にカメラ機能が付加されたカメラ機能付き携帯電話端末が急速に普及し、手軽に撮影を行い、撮影された画像データをインターネットに対して送信することが可能となった。これを背景として、カメラで撮影した画像データに基づき所望の商品を購入可能な店舗情報を入手できるようにする方法が特許文献1に提案されている。
この方法では、ユーザは、カメラ機能付きの携帯電話端末を用いて所望の商品を撮影し、撮影された撮像画像をインターネットを介してサーバに送信する。サーバでは、受信した撮像画像を解析して特徴量情報を得て、得られた特徴量情報に基づきデータベースを検索して当該商品の詳細情報や当該製品の取り扱い店舗の所在地情報などを出力し、ユーザのカメラ機能付き携帯電話端末装置に返す。ユーザは、当該商品の名称などを知らなくても、当該商品を購入するために必要な情報を得ることができる。
特開2003−122757
また、テレビジョン放送やラジオ放送などで放送中のコンテンツに対する情報検索については、例えばディジタルBS放送や地上波ディジタルテレビジョン放送の場合、インターネット接続型テレビジョン受信機を用いてテレビジョン放送を受信し、受信されたテレビジョン放送と対応してインターネットを介して送信されたデータを検索する方法が既に実用化されている。
一般のテレビジョン受像機の場合には、パーソナルコンピュータや、インターネット通信機能付きの携帯電話端末を用い、ユーザは、気になった番組やコマーシャルが放送された時刻を示す時刻情報を、インターネットなどのネットワークを介してサーバに送信し、サーバ側では、予め用意されている、放送局別の各時刻における放送内容関連情報(番組名、コマーシャル情報、出演者、楽曲名、アーティスト名など)を格納したデータベースを受信した時刻情報に基づき検索し、検索結果をユーザに返すシステムが既に実用化されている。
上述した、広告に基づき実際に店舗に赴いたり、インターネット上の検索サイトなどから所望の商品の検索を行う方法(第1の方法)では、多くの場合、ユーザは、物品の情報を当該商品の名称などの文字情報として記憶しておく必要があり、その文字情報が分からない場合、目的の商品を購入可能な情報を入手することは、非常に困難であるという問題点があった。
例えば、ユーザが、新しく封切りされる映画のポスターを見て上映する映画館と上映時間を知りたいと思ったとする。従来では、ポスターに書かれている映画のタイトルなどの文字情報を記憶若しくはメモし、この文字情報に基づき情報検索サイトで必要な情報を検索する必要があった。この場合、記憶した情報に基づく場合には、記憶違いや忘却などにより検索できなかったり、不適当な検索結果しか得られなかったりするという問題点があった。また、メモを取る場合は、筆記用具やメモ用紙を用意するなど、メモを取ること自体に手間がかかるという問題点があった。
また例えば、ユーザが、気に入った靴を履いている人物の写真を雑誌の広告から発見したとする。ユーザは、その靴が何処のメーカのどの型名かも分からない場合は、上述の情報検索サイトで検索を行うためのキーワードとして用いるべき文字情報すら得られないという問題点があった。
さらに例えば、ワインを購入する際、そのワインが果たしてどんな味なのか、どのワイナリーで作られどの葡萄が用いられているかなど、必要な情報が揃わず買うべきか否かの決断ができない場合がある。情報を知りたいワインボトルのラベルにある文字情報がフランス語の場合など、上述した従来方法による検索方法では入力欄にキーワードを入力することすら難しいという問題点があった。また、その場で直ぐに情報を得たいという要求に対応することも、従来方法では困難であった。
図30は、この第1の方法により情報を検索して商品を購入する場合の一例の手順を示す。先ず、ユーザは、紙媒体やテレビジョン放送、ラジオ放送など、所謂プッシュメディアと称される媒体から、商品の情報を入手する(ステップS100)。この段階では、ユーザは、当該商品に対して「気になる」程度の関心しか持っていないことが考えられる。次に、ユーザは、価格や仕様などの当該商品の詳細な情報を、情報誌などの紙媒体や、インターネット上の情報検索サイトといった所謂プルメディアと称される媒体を利用して調べる(ステップS101)。
ユーザは、商品に関する詳細な情報を入手すると、情報を確認し、複数の購入可能情報が入手された場合は、それらの価格を比較し(ステップS102)、購入可能な店舗の場所を調べる(ステップS103)。当該店舗が実体の店舗として存在する場合には、地図を用いて店舗の場所を確認する。また、その店舗がECに対応しており、インターネット上のWebサイトとして店舗が存在する場合には、当該店舗のURL(Uniform Resource Locator)が確認される。さらに、ユーザは、自身の予算と、自身が購入したいと思っている商品のリスト(ウィッシュリスト)における当該商品の優先順位とから、当該商品を実際に購入するか否かを決定し(ステップS104)、購入するとした場合、実際の購入に移る(ステップS105)。
第1の方法に基づく商品購入においては、このステップS100〜ステップS105の各手順毎に検索や判断を要し、ユーザの負担が大きいと共に、これらの手順が非連続的なそれぞれ個別のプロセスとなっており、ユーザがある商品を「気になる」状態となってから購入するまでに、多大な手間がかかるという問題点があった。またそのため、気になった商品を購入するまでにユーザが疲弊してしまい、購入する意欲を失ってしまうおそれもあった。これは、商品を販売する側からみれば、ビジネスチャンスを失うことを意味する。
また、カメラ機能付き携帯電話端末を用いて所望の商品を撮影して撮像画像をサーバに送信して商品情報を得る、特許文献1に記載の方法(第2の方法)では、例えば、所望の商品をユーザの知人が所有していて写真を撮影させてもらえる、ショーウィンドウに所望の商品が撮影可能な状態に陳列してある、などのように、所望の商品が実際に撮影可能な状態になければいけないという問題点があった。紙媒体による広告やテレビジョン放送のコマーシャルなどの画像を用いることも当然、考えられるが、この場合でも、当該商品が単独またはそれに近い状態で表示されている必要があり、制限が多いという問題点があった。
さらに、ネットワーク接続型のテレビジョン受像機を用いて情報を得る方法(第3の方法)では、専用のテレビジョン受像機が必要となるという問題点があった。また、関連情報は、データチャンネルを用いて放送されるため、録画されたテレビジョン放送を再生する際には、録画および再生を行う機器がデータチャンネルの記録に対応している必要があるという問題点があった。さらに、放送局側で予め用意した情報しか検索できないことや、関連情報が放送時にデータチャンネルで送信されるために、放送を録画後は、記録された関連情報が更新されないため、録画された内容を再生するときには、記録された関連情報が古くなっていて有益ではない場合があるといった問題点があった。
さらにまた、一般のテレビジョン受像機で受信された放送を視聴中に、パーソナルコンピュータや携帯電話端末を用いて時刻情報を送信して情報を得る方法(第4の方法)では、パーソナルコンピュータや携帯電話端末でサーバにアクセスしている間に、目的の映像が終了してしまう場合があるという問題点があった。また、ユーザが自分の視聴する放送局の情報を、別途、予めサーバに登録しておく必要があり、手間がかかるという問題点があった。さらに、録画された放送を再生した映像から関連情報を得ようとする場合には、当該映像の放送局および放送時刻情報を予め当該映像と共に記録しておく必要があり、そのための特殊な録画機器が必要とするという問題点があった。
一方、インターネットを介しての商品関連情報の検索および購入のシステムを利用することで、例えば以下のようなサービスが実施されている。
(1)関連情報提供者が有料検索者に対して情報を提供するサービス。
(2)検索者(ユーザ)が要求する関連情報に対する関係の有無にかかわらず、特定の企業の要請に基づき当該企業が指定して情報を露出してその広告効果の対価を得るビジネス。
(3)検索に必要なシステムや関連データベースを、これらを必要とする企業に対して利用許諾し、その対価を得るビジネス。
(4)検索者が検索結果を得た後に、その検索結果に基づき購買を希望する場合、通信販売業者に対してその検索者を紹介し、紹介手数料を得るビジネス。
(5)検索者自身が売り主となって、他の検索者に物品を販売するビジネス。
しかしながら、従来では、既に述べたような様々な問題点が存在するため、これらのサービスやビジネスが円滑に実行できず、その結果、多数の企業やユーザがビジネスチャンスを逃すことになっていたという問題点があった。
したがって、この発明の目的は、ユーザがある商品を気になってからその商品を購入するまでの手順を連続化し、ユーザがストレス無く商品購入を行えるようにする情報検索システム、情報検索方法、情報検索装置、情報検索プログラム、画像認識装置、画像認識方法および画像認識プログラム、ならびに、販売システムを提供することにある。
上述した課題を解決するために、請求項1に記載の発明は、画像データおよび動画像データに基づき情報検索を行う情報検索システムにおいて、
画像データおよび動画像データを取得する画像データ取得手段と、
画像データ取得手段で取得された画像データおよび動画像データを通信ネットワークに向けて送信する送信手段と
を備える端末装置と、
検索される可能性がある認識用画像データが登録される第1のデータベースと、
第1のデータベースに登録された認識用画像データに対応するメタデータが登録される第2のデータベースと、
テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、情報を検索される可能性がある認識用画像データとして第1のデータベースに登録するとともに、第1のデータベースに登録された認識用画像データに対応するメタデータを収集してメタデータを第2のデータベースに登録する登録部と、
端末装置から送信された画像データおよび動画像データをネットワークを介して受信する受信手段と、
受信手段で受信された画像データおよび動画像データをフレーム毎に分解した画像データの特徴の抽出を行う特徴抽出部と、
第1のデータベースに登録された認識用画像データの特徴の抽出を行い、画像データおよび動画像データをフレーム毎に分解した画像データの特徴と認識用画像データの特徴とを比較する特徴比較部と、
特徴比較部の比較結果に基づき、画像データおよび動画像データをフレーム毎に分解した画像データのそれぞれが含む画像要素と一致度が高い認識用画像データを第1のデータベースから検索する検索手段と、
検索手段による検索結果に基づき第2のデータベースからメタデータを抽出するメタデータ抽出手段と
を備えるサーバ装置と
を有し、
サーバ装置は、メタデータ抽出手段で抽出されたメタデータを通信ネットワークを介して端末装置で閲覧可能なようにしたことを特徴とする情報検索システムである。
また、第2の発明は、端末装置が取得した画像データおよび動画像データに基づき、検索装置において情報検索を行う情報検索方法において、
端末装置が、画像データおよび動画像データを取得する画像データ取得のステップと、
端末装置が、画像データ取得のステップにより取得された画像データおよび動画像データを端末装置から通信ネットワークに向けて送信する送信のステップと、
検索装置が、送信のステップにより送信された画像データおよび動画像データをネットワークを介して受信する受信のステップと、
検索装置が、テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、情報を検索される可能性がある認識用画像データとして第1のデータベースに登録するとともに、第1のデータベースに登録された認識用画像データに対応するメタデータを収集してメタデータを第2のデータベースに登録する登録のステップと、
検索装置が、受信のステップにより受信された画像データおよび動画像データをフレーム毎に分解した画像データの特徴の抽出を行い、第1のデータベースに登録された認識用画像データの特徴の抽出を行い、画像データおよび動画像データをフレーム毎に分解した画像データそれぞれの特徴と認識用画像データの特徴とを比較した比較結果に基づき、検索される可能性がある認識用画像データが登録される第1のデータベースから、画像データが含む画像要素と一致度が高い認識用画像データを検索する検索のステップと、
検索装置が、検索のステップによる検索結果に基づき、第1のデータベースに登録された認識用画像データに対応するメタデータが登録される第2のデータベースからメタデータを抽出するメタデータ抽出のステップと
を有し、
検索装置によってメタデータ抽出のステップで抽出されたメタデータを通信ネットワークを介して端末装置で閲覧可能なようにしたことを特徴とする情報検索方法である。
また、第3の発明は、画像データに基づき情報検索を行う情報検索装置において、
検索される可能性がある認識用画像データが登録される第1のデータベースと、
第1のデータベースに登録された認識用画像データに対応するメタデータが登録される第2のデータベースと、
テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、情報を検索される可能性がある認識用画像データとして第1のデータベースに登録するとともに、第1のデータベースに登録された認識用画像データに対応するメタデータを収集してメタデータを第2のデータベースに登録する登録部と、
端末装置から送信された画像データおよび動画像データを通信ネットワークを介して受信する受信手段と、
受信手段で受信された画像データおよび動画像データをフレーム毎に分解した画像データそれぞれの特徴の抽出を行う特徴抽出部と、
第1のデータベースに登録された認識用画像データの特徴の抽出を行い、画像データおよび動画像データをフレーム毎に分解した画像データの特徴と認識用画像データの特徴とを比較する特徴比較部と、
特徴比較部の比較結果に基づき、画像データおよび動画像データをフレーム毎に分解した画像データのそれぞれが含む画像要素と一致度が高い認識用画像データを第1のデータベースから検索する検索手段と、
検索手段による検索結果に基づき第2のデータベースからメタデータを抽出するメタデータ抽出手段と
を有し、
メタデータ抽出手段で抽出されたメタデータを通信ネットワークを介して端末装置で閲覧可能なようにしたことを特徴とする情報検索装置である。
また、第4の発明は、画像データに基づき検索装置において情報検索を行う情報検索方法において、
検索装置が、テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、情報を検索される可能性がある認識用画像データとして第1のデータベースに登録するとともに、第1のデータベースに登録された認識用画像データに対応するメタデータを収集してメタデータを第2のデータベースに登録する登録のステップと、
検索装置が、端末装置から送信された画像データおよび動画像データを通信ネットワークを介して受信する受信のステップと、
検索装置が、受信のステップにより受信された画像データおよび動画像データをフレーム毎に分解した画像データの特徴の抽出を行い、第1のデータベースに登録された認識用画像データの特徴の抽出を行い、画像データおよび動画像データをフレーム毎に分解した画像データの特徴と認識用画像データの特徴とを比較した比較結果に基づき、検索される可能性がある認識用画像データが登録される第1のデータベースから、画像データおよび動画像データをフレーム毎に分解した画像データが含む画像要素と一致度が高い認識用画像データを検索する検索のステップと、
検索装置が、検索のステップによる検索結果に基づき、第1のデータベースに登録された認識用画像データのメタデータが登録される第2のデータベースからメタデータを抽出するメタデータ抽出のステップと
を有し、
検索装置が、メタデータ抽出のステップにより抽出されたメタデータを通信ネットワークを介して端末装置で閲覧可能なようにしたことを特徴とする情報検索方法である。
また、第5の発明は、画像データに基づき情報検索を行う情報検索方法をコンピュータ装置に実行させる情報検索プログラムにおいて、
情報検索方法は、
検索装置が、テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、情報を検索される可能性がある認識用画像データとして第1のデータベースに登録するとともに、第1のデータベースに登録された認識用画像データに対応するメタデータを収集してメタデータを第2のデータベースに登録する登録のステップと、
検索装置が、端末装置から送信された画像データおよび動画像データを通信ネットワークを介して受信する受信のステップと、
検索装置が、受信のステップにより受信された画像データおよび動画像データをフレーム毎に分解した画像データの特徴の抽出を行い、第1のデータベースに登録された認識用画像データの特徴の抽出を行い、画像データおよび動画像データをフレーム毎に分解した画像データの特徴と認識用画像データの特徴とを比較した比較結果に基づき、検索される可能性がある認識用画像データが登録される第1のデータベースから、画像データおよび動画像データをフレーム毎に分解した画像データが含む画像要素と一致度が高い認識用画像データを検索する検索のステップと、
検索装置が、検索のステップによる検索結果に基づき、第1のデータベースに登録された認識用画像データのメタデータが登録される第2のデータベースからメタデータを抽出するメタデータ抽出のステップと
を有し、
検索装置が、メタデータ抽出のステップにより抽出されたメタデータを通信ネットワークを介して端末装置で閲覧可能なようにしたことを特徴とする情報検索プログラムである。
また、第6の発明は、画像データから特定の形状を認識する画像認識装置において、
検索される可能性がある認識用画像データが登録される第1のデータベースと、
第1のデータベースに登録された認識用画像データのメタデータが登録される第2のデータベースと、
テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、情報を検索される可能性がある認識用画像データとして第1のデータベースに登録するとともに、第1のデータベースに登録された認識用画像データに対応するメタデータを収集してメタデータを第2のデータベースに登録する登録部と、
入力された画像データおよび入力された動画像データをフレーム毎に分解した画像データの特徴の抽出を行う特徴抽出部と、
第1のデータベースに登録された認識用画像データの特徴の抽出を行い、画像データおよび動画像データをフレーム毎に分解した画像データの特徴と認識用画像データの特徴とを比較する特徴比較部と、
特徴比較部の比較結果に基づき、画像データおよび動画像データをフレーム毎に分解した画像データが含む画像要素と一致度が高い認識用画像データを第1のデータベースから検索する検索手段と、
検索手段による検索結果に基づき第2のデータベースからメタデータを抽出するメタデータ抽出手段と
を有することを特徴とする画像認識装置である。
また、第7の発明は、画像データから特定の形状を認識する画像認識方法において、
検索装置が、テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、情報を検索される可能性がある認識用画像データとして第1のデータベースに登録するとともに、第1のデータベースに登録された認識用画像データに対応するメタデータを収集してメタデータを第2のデータベースに登録する登録のステップと、
検索装置が、入力された画像データおよび動画像データをフレーム毎に分解した画像データの特徴の抽出を行い、第1のデータベースに登録された認識用画像データの特徴の抽出を行い、画像データおよび動画像データをフレーム毎に分解した画像データの特徴と認識用画像データの特徴とを比較した比較結果に基づき、検索される可能性がある認識用画像データが登録される第1のデータベースから、画像データおよび動画像データをフレーム毎に分解した画像データが含む画像要素と一致度が高い認識用画像データを検索する検索のステップと、
検索装置が、検索のステップによる検索結果に基づき、第1のデータベースに登録された認識用画像データのメタデータが登録される第2のデータベースからメタデータを抽出するメタデータ抽出のステップと
を有することを特徴とする画像認識方法である。
また、第8の発明は、画像データから特定の形状を認識する画像認識方法をコンピュータ装置に実行させる画像認識プログラムにおいて、
画像認識方法は、
検索装置が、テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、情報を検索される可能性がある認識用画像データとして第1のデータベースに登録するとともに、第1のデータベースに登録された認識用画像データに対応するメタデータを収集してメタデータを第2のデータベースに登録する登録のステップと、
検索装置が、入力された画像データおよび動画像データをフレーム毎に分解した画像データの特徴の抽出を行い、第1のデータベースに登録された認識用画像データの特徴の抽出を行い、画像データおよび動画像データをフレーム毎に分解した画像データの特徴と認識用画像データの特徴とを比較した比較結果に基づき、検索される可能性がある認識用画像データが登録される第1のデータベースから、画像データが含む画像要素と一致度が高い認識用画像データを検索する検索のステップと、
検索装置が、検索のステップによる検索結果に基づき、第1のデータベースに登録された認識用画像データのメタデータが登録される第2のデータベースからメタデータを抽出するメタデータ抽出のステップと
を有することを特徴とする画像認識プログラムである。
上述したように、第1ないし第5の発明は、テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、情報を検索される可能性がある認識用画像データとして第1のデータベースに登録するとともに、第1のデータベースに登録された認識用画像データに対応するメタデータを収集してメタデータを第2のデータベースに登録し、端末装置で取得され通信ネットワークを介して送信された画像データに対し、画像データの特徴の抽出を行い、上記第1のデータベースに登録された上記認識用画像データの特徴の抽出を行い、上記画像データの特徴と上記認識用画像データの特徴とを比較した比較結果に基づき、検索される可能性がある認識用画像データが登録される第1のデータベースから、画像データが含む画像要素と一致度が高い認識用画像データを検索し、検索結果に基づき、第1のデータベースに登録された認識用画像データに対応するメタデータが登録される第2のデータベースからメタデータを抽出し、抽出されたメタデータを通信ネットワークを介して端末装置で閲覧可能なようにしているため、端末装置から画像データを送信するだけで、送信された画像データに対応するメタデータを端末装置上で閲覧することができ、ユーザは、対象物に対する知識が無くても、必要な情報をその場で迅速に得ることができる。
また、第6ないし第8の発明は、テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、情報を検索される可能性がある認識用画像データとして第1のデータベースに登録するとともに、第1のデータベースに登録された認識用画像データに対応するメタデータを収集してメタデータを第2のデータベースに登録し、入力された画像データの特徴の抽出を行い、上記第1のデータベースに登録された上記認識用画像データの特徴の抽出を行い、上記画像データの特徴と上記認識用画像データの特徴とを比較した比較結果に基づき、検索される可能性がある認識用画像データが登録される第1のデータベースから、画像データが含む画像要素と一致度が高い認識用画像データを検索し、検索結果に基づき、第1のデータベースに登録された認識用画像データのメタデータが登録される第2のデータベースからメタデータを抽出するようにしているため、画像データを入力すると、入力された画像データに対応するメタデータを得ることができ、画像データの対象に対する知識が無くてもその画像データに関連する情報を得ることができる。
この発明では、サーバは、画像認識機能を有すると共に、予め画像データおよび画像データに対応する関連情報をデータベースに登録している。そして、ユーザから送られてきた画像データに対して画像認識処理を行ってデータベースに登録された画像データと比較し、一致度が高いとされた画像データに対応する関連情報をユーザに送信するようにしている。
そのため、ユーザは、撮影した画像データをサーバに送信するだけで、撮影した内容に応じた様々なサービスを受けることができる効果がある。また、サーバは、画像認識処理結果に基づき関連情報を抽出してサービスの内容を判断するので、ユーザは、撮影の対象に関する知識を持っていなくても適切なサービスを受けることができる効果がある。それにより、サービスの提供側においても、サービスに関する知識を持たないユーザを新たな顧客として得ることができる効果がある。
また、サーバは、ユーザから送信された画像データに対する画像認識処理において、画像データに含まれる複数の画像要素について認識し、それぞれ関連情報を抽出するようにしている。そのため、ユーザは、撮影した画像中の自分が狙った以外の部分についても、サービスを受けることができる効果がある。また、ユーザは、撮影の対象となる画像(ポスターやテレビジョン放送のコマーシャル映像、雑誌の表示など)の本来の目的以外の画像要素に対しても、サービスを受けることができる効果がある。
さらに、この発明の実施の一形態によれば、画像データを撮影してサーバに送信するだけで、撮影対象に関する関連情報を得ることができるので、ユーザは、欲しい情報を入手する際に文字入力の手間が省けるだけでなく、記憶違いや忘却などにより検索不能となることも、防がれる効果がある。
さらにまた、画像データに対する画像認識処理結果に基づき関連情報が得られるため、ユーザは、対象物の製造メーカや型名が分からなくても、対象物を撮影して画像データをサーバに送信するだけで、欲しい情報を入手できる効果がある。対象物がラベルなどの場合に、そのラベルに記載されている文字がユーザの読めない外国語などであっても、問題なく情報の検索を行うことができるという効果がある。
また、テレビジョン放送による画像データにこの発明を適用した場合、テレビジョン受像機に映出された映像を撮影しサーバに送信するだけで必要な情報が得られるため、サービスを受けるに当たって、ネットワーク接続型のテレビジョン受像機のような専用のテレビジョン受像機を用意する必要が無い効果がある。画像そのものから関連情報が得られるため、録画された画像に対してサービスを受けようとする場合でも、通常の録画装置を用いることでき、例えばテレビジョン放送と共にデータチャンネルを録画するような特殊な録画装置が必要ないという効果がある。
さらに、ネットワーク接続型のテレビジョン受像機を利用したサービスでは、ユーザは、テレビジョン放送局が予め用意したサービスしか受けることができない。一方、この発明が適用されたサービスでは、映像から抽出された関連情報に基づき情報が提供されるため、様々な情報検索が可能であるという効果がある。
さらにまた、ネットワーク接続型のテレビジョン受像機を利用したサービスでは、データは、放送時にデータチャンネルによって送信されるため、放送時から時間が経過しても関連情報の更新が行われず、例えば放送を録画して後に録画した放送を再生したときなど、その放送に関連して放送時に送信された情報が既に古くなって有益ではなくなっている場合がある。一方、この発明が適用されたサービスでは、関連情報が常に更新されるため、過去の映像からでも、最新情報の検索が可能であるという効果がある。
また、この発明が適用されたサービスでは、テレビジョン放送を視聴中に気になる情報を発見した場合でも、その画面を撮影してサーバに送信するだけで必要な情報が得られるので、例えばパーソナルコンピュータを用いてインターネットの情報検索サイトなどで情報を検索する場合のように、放送局情報を一々入力する必要が無いと共に、アクセス中にその放送が終了してしまい情報を逃してしまうことが無いという効果がある。さらに、録画されたテレビジョン放送からも、同様にして再生画面を撮影してサーバに送信するだけで必要な情報が得られるので、放送時刻や放送局情報をテレビジョン放送と共に記録するような特殊な録画装置を用いる必要が無いという効果がある。
また、以上のような効果により、ユーザは、欲しい情報を高い確率で入することができるようになると共に、情報の入手から商品の購入までをストレス無く誘導され、それに伴い、情報提供側も、ビジネスチャンスを逃すことがなくなるという効果がある。
以下、この発明の実施の一形態について説明する。先ず、この発明の説明に先んじて、この発明の出願人により既に実施されているサービスについて、概略的に説明する。
このサービスでは、テレビジョン放送やラジオ放送などで放送される楽曲やコマーシャルの関連情報を、放送される時刻情報と対応付けてサーバ側で予め登録しておく。ユーザが街角や自宅などで視聴中のテレビジョン放送やラジオ放送で気になる楽曲やコマーシャルなどが放送されたら、例えばインターネット通信機能付きの携帯電話端末を用いてサーバに対して時刻情報を送信する。サーバでは、受信した時刻情報に基づき当該時刻に放送されていた楽曲やコマーシャルの関連情報を検索し、検索結果をユーザに返す。これにより、ユーザは、気になった楽曲やコマーシャルなどの関連情報を容易に入手することができる。それと共に、サーバ側では、ユーザに提供した楽曲やコマーシャル情報に関連するビジネスを展開することができる。
この発明では、既に実施されている上述のサービスを画像データに対して発展的に適応し、ユーザに対して連続的な購入プロセスを提供することを目的とする。すなわち、背景技術で述べた第1の方法では、ユーザが情報を入手してから購入までのステップS100〜ステップS105までの各手順が図30の如く非連続的であった。この発明では、図1に模式的に示されるように、情報入手(ステップS1)、情報検索(ステップS2)、情報確認および価格比較(ステップS3)、購入可能店舗またはサイト検索(ステップS4)、予算確認(ステップS5)、購入またはダウンロード(ステップS6)までの各手順を、連続的なプロセスとすることを目的とする。
図2は、この発明の実施の一形態によるシステムの一例の構成を示す。ユーザは、気になった情報を発見すると、例えばカメラ機能付き携帯電話端末1を用いてその情報を撮影する。一例として、ユーザの気になる商品の写真がある雑誌「ABCD誌」の表紙に掲載されているのをユーザが発見したものとする。ユーザは、カメラ機能付き携帯電話端末1を用いてこの雑誌ABCD誌の表紙を撮影し、得られた画像データ7をインターネット2を介してサーバ3に送信する。
サーバ3は、例えば一般的なコンピュータ装置と同様の構成により実現可能な装置であり、画像データの解析機能を有する。サーバ3は、画像データベース4および関連情報データベース5を有する。画像データベース4は、各種商品の画像、人物の画像、ロゴマーク画像、文字情報を示す画像など、様々な画像データが登録される。以下、画像データベース4に既に登録されている画像を、登録済み画像と呼ぶ。関連情報データベース5は、画像データベース4に登録される画像に関連する情報が当該画像のメタデータとして登録される。
なお、サーバ3は、単独のコンピュータ装置で構成されるのに限らず、ネットワークで接続された複数のコンピュータで構成することもできる。また、サーバ3の機能は、サーバ3に搭載されるプログラムにより実行される。プログラムは、CD−ROM(Compact Disc-Read Only Memory)などの記録媒体や、ネットワークを介して供給される。
サーバ3は、画像データ7を受信すると、受信された画像データ7に対して画像認識処理を行う。この画像認識処理において、画像データ7に含まれている画像要素と一致または極めて類似する画像が画像データベース4に登録されているか否かを調べる。登録されていれば、サーバ3は、画像データベース4の当該登録済み画像に対応する関連情報を、関連情報データベース5から検索する。サーバ3は、検索の結果得られた関連情報に基づく情報を、インターネット2を介してカメラ機能付き携帯電話端末1に対して送信する。
なお、画像要素は、一つの画像を構成する意味のある画像のそれぞれをいう。例えば、画像が帽子を被った人物と、ロゴマーク画像とから成り立っていれば、帽子の画像、人物の画像およびロゴマーク画像のそれぞれが当該画像の画像要素である。
関連情報データベース5に登録される関連情報には、インターネット2上に存在する関連サイト6のURL(Uniform Resource Locator)を含ませることができる。ユーザは、サーバ3から送信された関連情報に含まれるURLを用いて、関連サイト6にアクセスすることができる。関連サイト6がECに対応し、インターネット2を介しての商品の購入が可能にされていれば、ユーザは、サーバ3から送信された関連情報に含まれるURLに基づき関連サイト6にアクセスし、関連サイト6上で商品の購入を行うことが可能となる。
次に、この発明の実施の一形態によるシステム構成をより詳細に説明する。図3は、ユーザ側およびサーバ側システムの構成の例を示す。ユーザ側において、カメラ機能付き携帯電話端末1は、カメラ部10、表示部11およびインターフェイス(I/F)部12を有する。カメラ部10は、例えばCCD(Charge Coupled Device)を撮像素子として用い、撮像素子で撮像された撮像信号を所定に画像データに変換して出力する。画像データは、例えばLCD(Liquid Crystal Display)を表示素子として用いた表示部11に供給され表示される。
それと共に、カメラ部10から出力された画像データをグレイスケール化した画像データがインターフェイス部12に供給される。画像データのグレイスケール化は、例えば画像データの輝度成分だけを取り出すことで可能である。
インターフェイス部12は、カメラ機能付き携帯電話端末1とインターネット2との間の通信を、所定のプロトコルを用いて制御する。インターフェイス部12に供給された画像データは、画像データ7として、インターネット2を介してサーバ3に対して送信される。このとき、ユーザを特定するためのID情報などを画像データと共に送信するとよい。
なお、図中に点線のブロックで示されるように、特徴抽出処理部13を設け、カメラ部10から出力された画像データから所定に特徴抽出を行い、抽出された特徴データのみをインターフェイス部12に供給するようにしてもよい。この場合には、特徴データのみがインターネット2に対して送信されることになる。
ユーザ側の画像データ取得および送信手段は、カメラ機能付き携帯電話端末1に限られず、情報提供側から提供される画像を取得可能な手段であれば、他の手段を用いることができる。
例えば、ディジタルカメラ1Bで撮影された画像データをパーソナルコンピュータ(PC)15に転送し、パーソナルコンピュータ15でインターネット2と通信を行うことにより、画像データ7としてサーバ3に送信することが考えられる。この場合でも、ディジタルカメラ1Bで撮影された画像データに対して、特徴抽出部16で予め特徴抽出を行い、抽出された特徴データのみを画像データ7として送信することができる。特徴抽出部16は、パーソナルコンピュータ15上のソフトウェアで構成するとよい。
また例えば、ディジタルテレビジョン受像機1Cで受信されたディジタルテレビジョン放送による画像データを、画像データ7としてサーバ3に送信するようにできる。アンテナ20で受信されたディジタルテレビジョン放送信号は、受信部21で所定の信号処理をされてディジタルビデオ信号とされ、表示部22で表示される。それと共に、ディジタルビデオ信号は、例えば図示されない操作部に対するユーザの操作に応じてある期間のフレームあるいはある1フレームが抽出される。抽出されたフレームは、画像データ7として、インターフェイス部23によりインターネット2を介してサーバ3に送信される。
なお、このディジタルテレビジョン受像機1Cにおいても、上述のカメラ機能付き携帯電話端末1と同様に、図中に点線のブロックで示されるように、特徴抽出処理部24を設け、受信部21から出力された画像データの特徴を予め抽出して、特徴データのみを画像データ7として送信するようにしてもよい。
さらに例えば、ディジタルテレビジョン受像機25で受信されビデオレコーダ26で録画されたディジタルビデオ信号も、同様にして、画像データ7としてサーバ3に送信することができる。ビデオレコーダ26により、ディジタルビデオ信号のある期間のフレームあるいはある1フレームが再生される。ビデオレコーダ26から再生されたフレームを、例えばパーソナルコンピュータ27に転送し、パーソナルコンピュータ27でインターネット2と通信を行うことにより、当該フレームを画像データ7としてサーバ3に送信することが考えられる。
この場合でも、ビデオレコーダ26から出力されたフレームに対して特徴抽出部28で予め特徴抽出を行い、抽出された特徴データのみを、画像データ7として送信することができる。特徴抽出部28は、パーソナルコンピュータ27上のソフトウェアで構成するとよい。
ユーザ側の画像データ取得および送信手段は、上述の例以外にも、例えば画像認識機能付きの家庭用ロボットを用いることもできる。
なお、上述した何れの例においても、サーバ3には、グレイスケール化された画像データが画像データ7として送信される。ユーザ側で特徴抽出がなされる場合には、グレイスケール化された画像データに対して特徴抽出を行う。
また、上述では、テレビジョン放送をディジタルテレビジョン放送としてディジタルテレビジョン受像機1Cで受信するように説明したが、勿論、テレビジョン放送をアナログテレビジョン放送とし、アナログテレビジョン受像機で受信されたアナログテレビジョン放送信号をディジタル変換して用いてもよい。
サーバ側システムについて説明する。サーバ側システムは、サーバ3、画像データベース4、関連情報データベース5およびデータ登録部を有する。サーバ3とインターネット2との間の通信は、インターフェイス部40および41により所定のプロトコルを用いて所定に制御される。ユーザ側からインターネット2を介して送信された画像データがインターフェイス部40により受信され、サーバ3に供給される。
データ登録部では、CM(コマーシャル)自動抽出システム51が各チャンネルのテレビジョン放送から抽出したコマーシャルや、インターネット2上に公開されている一般のWebサイト52に掲載されている情報などを収集し、データ登録ツール50を用いて、画像データベース4に画像を登録する。登録の際に、画像に対してユニークな画像IDが付与される。データ登録ツール50は、画像データベース4や関連情報データベース5に対して効率的にデータ登録を行うように構成されたソフトウェアである。
画像データベース4は、ユーザに検索される可能性がある画像が予め登録される。画像データベース4には、例えばロゴマーク画像、物品や建造物の一部または全体の画像、人物の画像などが登録される。文字情報も画像データベース4に登録され、文字列の解析も可能なようにされる。
また、データ登録部では、画像データベース4に登録された登録済み画像に関連する関連情報をCM自動抽出システム51や一般Webサイト52から収集する。収集された関連情報は、データ登録ツール50を用いて、当該画像と画像IDにより対応付けられて関連情報データベース5に登録される。
サーバ3は、画像特徴抽出部30、画像特徴比較部31、関連情報検索部32および関連情報出力部33を有する。ユーザ側で特徴抽出されていない画像データ7は、インターフェイス部40で受信されると、画像特徴抽出部30に供給される。なお、ユーザ側で予め特徴抽出された画像データ7は、インターフェイス部40で受信されると、後述する画像特徴比較部31に供給される。また、上述した、ユーザ側の特徴抽出部13、16、24および28は、このサーバ側の画像特徴抽出部30で行われるのと同様の特徴抽出処理を行うものとする。
画像特徴抽出部30は、供給された画像データ7に対して特徴抽出を行い、その結果得られた特徴データを出力する。画像特徴抽出部30で行われる特徴抽出処理としては、様々な方法が考えられる。一例として、画像データに対してエッジ検出処理を施し、エッジがより顕著な部分を特徴点として抽出し、抽出された特徴点の位置関係を特徴データとして用いることが考えられる。
特徴データは、画像特徴比較部31に供給される。画像特徴比較部31は、画像データベース4の登録済み画像に対して特徴抽出を行い、抽出の結果得られた特徴データと、画像特徴抽出部30から供給された特徴データとを比較する。比較結果に基づき、画像データベース4の登録済み画像から、画像特徴抽出部30から供給された特徴データの全体または一部と一致度の高い画像を検索する。このとき、一致度の高い登録済み画像が複数、検索された場合は、これら複数の登録済み画像の画像IDを出力する。
画像特徴比較部31から出力された画像IDは、関連情報検索部32に供給される。関連情報検索部32では、供給された画像IDに基づき関連情報データベース5を検索する。検索結果の、当該画像IDが示す画像に対応する関連情報は、関連情報出力部33に供給される。
関連情報出力部33では、関連情報検索部32から供給された関連情報を、ユーザが閲覧可能なデータに変換する。変換されたメタデータは、インターフェイス部41に供給され、インターネット2を介してユーザに対して返される。例えば、カメラ機能付き携帯電話端末1から発せられた画像データ7に対する関連情報であれば、当該関連情報は、インターネット2を介してカメラ機能付き携帯電話端末1に送信される。
なお、上述では、関連情報出力部33が関連情報をユーザに対して送信するように説明したが、これはこの例に限定されない。一例として、関連情報出力部33は、関連情報検索部32から供給された関連情報を表示するようなWebサイトを作成し、インターネット2上でユーザに対して提示するようにできる。サーバ3は、作成された当該WebサイトのURLをユーザ(カメラ機能付き携帯電話端末1)に対して通知し、当該Webサイトをユーザに対して提示する。この通知を受けたユーザは、通知内に記述されるURLにアクセスすることで、最初に送信した画像データ7に対応する関連情報を閲覧することができる。
また、上述では、画像特徴抽出部30は、グレイスケール化された画像データに対して特徴抽出処理を行うように説明しているが、これはこの例に限られない。例えば、画像特徴抽出部30は、色情報を含む画像データに対して特徴抽出処理を行うようにできる。この場合、ユーザ側から、グレイスケール化を行わない画像データをサーバ3に対して送信する。さらに、特徴抽出部13、16、24、28などによりユーザ側で予め特徴抽出処理を行う場合にも、色情報を含む画像データに対して特徴抽出処理を行うようにできる。これに限らず、ユーザ側では予め特徴抽出処理を行う場合には、グレイスケール化したデータに対して特徴抽出処理を行い、サーバ3側で特徴抽出処理を行う場合には、色情報を含む画像データに対して特徴抽出処理を行うようにもできる。
次に、画像データベース4および関連情報データベース5に対するデータ登録について説明する。先ず、テレビジョン放送のコマーシャルに基づき画像データおよび関連情報を収集する方法を、図4を用いて説明する。CM自動抽出システム51は、テレビジョン放送の各チャンネルにそれぞれ対応した複数のチューナ511、511、・・・と、CM検出器512とを有する。チューナ511、511、・・・で受信されたテレビジョン放送は、CM検出器512に供給される。CM検出器512は、供給されたテレビジョン放送から自動的にコマーシャルを検出して抽出する。テレビジョン放送中のコマーシャルは、例えばコマーシャル以外の放送番組とコマーシャルとの音声データの差異やシーンチェンジ、番組表などから検出することができる。
CM自動検出システム51では、検出されたコマーシャルに基づき、その日に放送された新規コマーシャルのリストを作成する。新規コマーシャルのリストは、CM自動検出システム51でその日に検出された新規コマーシャルの画像データ(ビデオデータ)と共に、データセンタ60に供給される。なお、CM自動検出システム51は、コマーシャルの他にも、放送局の番組宣伝番組やイベント告知番組なども抽出し、データセンタ60に供給する。
データセンタ60では、CM自動検出システム51から供給された新規コマーシャルリストおよび新規コマーシャルのビデオデータに基づき、それぞれのコマーシャルについて、関連情報を調査する。例えば、コマーシャルのそれぞれについて、広告主、代理店、制作会社、コマーシャル中に用いられた楽曲の版権を持つ音楽プロダクション、関連するWebサイトや関連情報が掲載された一般のWebサイトなどを調査する。調査結果は、コマーシャルの関連情報として、コマーシャルのビデオデータと共に、コマーシャル(CM)情報データベース61に登録される。
図4の例では、CM情報データベース61は、放送に関連する情報(メタデータ)として、初回放送時刻、放送局、コマーシャル長およびバージョン情報が登録される。広告主に関する情報として、企業名、企業カテゴリ、企業のWebサイトのURLが登録される。商品に関する情報として、商品名、商品カテゴリおよび商品情報(または、商品情報が掲載される関連WebサイトのURL)が登録される。出演者に関する情報として、出演者名およびその出演者によるセリフが登録される。映像等演出に関する情報として、キャッチコピー、場面、映像の特徴などが登録される。また、楽曲に関する情報として、楽曲名、演奏者や作詞者、作曲者、当該楽曲がCDに収録されて発売されている場合には、そのCDのCD番号が登録される。
CM情報データベース61には、さらに、一致検索用ファイルが登録される。データセンタ60から供給されたビデオデータについて、映像(画像)および音声のそれぞれに対して特徴抽出が行われ、特徴データファイルが得られる。これら映像(画像)や音声の特徴データファイルが、コマーシャルに関連付けられて、一致検索用ファイルとして登録される。
このCM情報データベース61に登録された各情報が関連情報データベース5に登録される。また、コマーシャルを収録したビデオデータが画像データベース4に登録される。上述した画像データに関する特徴データファイルを、画像データベース4に登録すると、画像データの検索が容易になり好ましい。
テレビジョン放送以外のメディアから画像データおよび関連情報を収集する方法を、図5を用いて説明する。ここでは、情報源としてインターネット上のWebサイトを想定する。例えば、各種広報文が掲載されたWebサイト、各種ニュースサイト、各種情報サイト、新聞社によるWebサイト、出版社によるWebサイト(特に、その出版社で出版している雑誌に関連するWebサイト)、関連Webサイト、一般Webサイトなどが情報源として考えられる。これに限らず、各種雑誌や新聞といった、紙メディアを情報源としてもよい。
データセンタ60では、これらのWebサイトを例えば毎日監視し、その日に新規に発表された新商品や話題商品、イベントなどを発見したら、発見された情報のリストを作成する。このリストに基づき、情報の発表主、商品の販売店などに詳細情報を問い合わせたり、さらに関連Webサイトや関連する情報が掲載される一般Webサイトを調査する。問い合わせ結果や調査結果に基づき、商品(コンテンツ)情報データベース62に情報が登録される。
図5の例では、商品(コンテンツ)情報データベース62は、販売元に関連する情報(メタデータ)として、販売元企業、当該企業のカテゴリ、当該企業のロゴマーク画像が登録される。販売期間や地区に関する情報として、販売開始日、販売地域が登録される。販売店に関する情報として、販売店名、当該販売店のカテゴリ、当該販売店のWebサイトのURLが登録される。商品(コンテンツ)に関する情報として、商品名、当該商品のカテゴリ、商品番号、JANコード、当該商品に関連する商品の情報、当該商品に関連するWebサイトのURLが登録される。価格に関する情報として、販売価格が登録される。
また、商品(コンテンツ)情報データベース62は、企業のロゴマーク画像や商品が表示される画像データ、商品に関連する画像データが登録される。
この商品(コンテンツ)情報データベース62に登録された各情報が関連情報データベース5に登録される。また、この商品(コンテンツ)情報データベース62に登録された各画像データは、画像データベース4に登録される。各画像の特徴抽出を行った結果得られた特徴データファイルを画像データベース4に登録すると、画像データの検索が容易になり好ましい。
なお、上述したCM情報データベース61および商品(コンテンツ)情報データベース62の構成は、一例であって、登録される項目は上述の例に限られない。さらに、上述では、CM情報データベース61、商品(コンテンツ)情報データベース62、画像データベース4および関連情報データベース5をそれぞれ独立したデータベースのように説明したが、データベースの構成はこの例に限定されるものではない。例えば、これら4つのデータベースを1つのデータベースに統合させて構成することも可能である。
次に、ユーザから送られた画像データを認識し、メタデータを抽出する処理について、図6を用いて概略的に説明する。図6において、画像認識アプリケーション71およびメタデータ抽出アプリケーション73は、サーバ3上で実行可能なアプリケーションプログラムである。
サーバ3に対して、ユーザから画像データ70、70、・・・が送られる。サーバ3では、画像認識アプリケーション71により、ユーザから送られてきた画像データ70、70、・・・に対して特徴抽出処理を施し、特徴データを抽出する。画像認識アプリケーション71は、画像データマスタ72(画像データベース4に対応する)に対し、特徴データが画像データ70から抽出された特徴データと一致または極めて類似した登録済み画像を検索し、検索結果として画像IDを出力する。文字情報は、テキストデータとして出力してもよい。1つの画像データ70に、例えば人物と商品というように、複数の画像要素が含まれている場合、それら複数の画像要素のそれぞれに対して一致または極めて類似する画像の画像IDが出力される。画像IDは、画像認識アプリケーション71からメタデータ抽出アプリケーション73に渡される。
メタデータ抽出アプリケーション73は、受け取った画像IDに対応するメタデータをメタデータマスタ74から検索し、一致画像のメタデータ75を出力する。複数の画像IDを受け取った場合には、それら複数の画像IDのそれぞれに対応するメタデータを検索し、各一致画像のメタデータ75、75、・・・を出力する。なお、メタデータマスタ74は、関連情報データベース5に対応し、メタデータは、関連情報に対応する。
図7を用いて、画像認識処理およびメタデータ抽出処理について、より詳細に説明する。なお、ユーザから複数フレームからなる動画像データ70’が送られてきた場合には、フレーム毎の画像データ70、70、・・・として処理される。このとき、必要であれば、動画像データ70’から所定にフレームを間引いてフレーム毎の画像データ70、70、・・・を得るようにしてもよい。
ここで、画像データ70に含まれる画像要素は、一般的な物体の形状、人物(人相)および文字の、それぞれ性質の異なる3種類に分類することができる。画像認識アプリケーション71は、これら性質の異なる3種類の画像要素に対する認識処理をそれぞれ行うために、パターン認識エンジン71A、人物認識エンジン71Bおよび文字認識エンジン71Cを有する。また、画像データマスタ72も、3種類のデータにそれぞれ対応し、一般画像マスタ72A、人物画像マスタ72Bおよび文字列マスタ72Cを有する。画像データ70、70、・・・は、パターン認識エンジン71A、人物認識エンジン71Bおよび文字認識エンジン71Cにそれぞれ入力される。
パターン認識エンジン71Aは、一般的な物体の形状に対する画像認識処理を行う。パターン認識エンジン71Aは、一般画像マスタ72Aに登録済みの画像の特徴点のパターンと、ユーザから送られてきた画像データ70の特徴点のパターンとを比較し、一致あるいは類似度が高い、すなわち一致度が所定以上高い登録済み画像を抽出する。例えば、登録済み画像とユーザからの画像データ70の特徴点同士などで比較して、一致度のスコアを算出し、スコアが所定値以上の登録済み画像を一致度の高い登録済み画像として抽出する。1つの画像データ70から一致度が所定値以上の登録済み画像が複数、得られた場合には、得られた複数の登録済み画像をそれぞれ抽出する。
このようにして抽出された登録済み画像の画像ID76、76、・・・がパターン認識エンジン71Aから出力される。これら画像ID76、76、・・・に基づき、画像データ70に含まれる一般的な物体の候補の名称を得ることができる。
また、ユーザから送られてきた画像データ70は、被写体が常に適正な角度で撮影されているとは限らない。そのため、パターン認識エンジン71Aによるパターン比較の際に、複数の特徴点について位置関係の演算を行うことにより、ユーザの撮影時の角度が登録済み画像の角度からある程度、例えば45°程度までの差があっても、一致検索することが可能となっている。
さらに、上述したように、ユーザから送られてきた画像データ7は、ユーザ側においてグレイスケール化されているため、撮影時のカメラ装置による色の違いや、照明光の色の影響を受けず、より正確に認識を行うことができる。
さらにまた、ユーザから送られてきた画像データ70と登録済み画像とを比較して一致度のスコアを算出し、スコアに基づき特徴点の一致度を判断しているため、画像データ7の一部が登録済み画像と異なっていたり、異なっていても、一致度が高い画像として抽出することができる。例えば、ユーザが建造物の一部を撮影した際に画像データ70に、対応する登録済み画像には無かった看板などが写っていても、一致度が高い画像として抽出可能である。また、ユーザから送られてきた画像データ70と、登録済み画像とで、実物に対する撮像画像の範囲が異なっていても、一致度が高い画像として抽出できる。
人物認識エンジン71Bは、画像データ70に対して人物認識処理を行い、顔らしきイメージが認識されたら、人相の認識を行う。この、画像データ70から顔らしきイメージを認識する技術は、既に幾つかが実用化されている。人相の認識では、顔として認識された部分に複数の特徴点を設け、これら複数の特徴点の位置関係に基づき、人物画像マスタ72Bに登録済みの人相画像に対するスコアを算出し、スコアが所定値以上の登録済み画像を一致度が高い人相画像として抽出する。1つの画像データ70から一致度が所定値以上の人相画像が複数、得られた場合は、得られた複数の登録済み画像をそれぞれ抽出する。
このようにして抽出された登録済み画像の画像ID77、77、・・・が人物認識エンジン71Bから出力される。これら画像ID77、77、・・・に基づき、画像データ70にに含まれる人物の候補の名前を得ることができる。
このような人相画像の抽出技術としては、例えば、既に実用化されている、ガボールウェーブレット変換およびグラフマッチングを併用した顔認証技術や、摂動空間法および適用的領域混合マッチング法を併用した顔認証技術などを用いることができる。
上述と同様に、ユーザから送られてきた画像データ70は、ユーザ側においてグレイスケール化されているため、撮影時のカメラ装置による色の違いや、照明光の色の影響を受けず、より正確に認識を行うことができる。
また、ユーザから送られてきた画像データ70と登録済み画像とを比較して一致度のスコアを算出し、スコアに基づき一致度を判断しているため、画像データ70の一部が登録済み画像と異なっていたり、異なっていても、一致度が高い画像として抽出することができる。例えば、画像データ70に写っている人物が帽子やメガネなどを装着しており、同一人物についての登録済み画像と異なっていても、一致度が高いとして抽出することが可能である。
文字認識エンジン71Cは、画像データ70に対して文字認識処理を行い、文字情報を抽出する。文字情報の抽出は、一般的に行われているOCR(Optical Charactar Reader)の技術を用いることができる。文字列マスタ72Cは、例えば単語辞書を構成し、検出された文字に基づき単語を検出することができる。認識結果に基づき文字列マスタ72Cが参照され、所定値以上の一致度の文字列があるか否かが検索される。一致する文字列があれば、その文字列データ78が出力される。1つの画像データ70から一致度が所定値以上の文字列が複数、得られた場合には、得られた複数の文字列データ78、78、・・・が候補としてそれぞれ出力される。
パターン認識エンジン71Aから出力された画像ID76、76、・・・、人物認識エンジン71Bから出力された画像ID77、77、・・・および文字認識エンジン71Cから出力された候補の文字列78、78、・・・は、それぞれ1つの画像に対して複数の候補が得られている可能性があり、曖昧な結果であるといえる。メタデータ抽出エンジン73Aは、これらエンジン71A、71Bおよび71Cにより認識された複数の曖昧な結果に基づきメタデータマスタ74を検索し、対応するメタデータ75、75、・・・を抽出する。そして、それらメタデータ75、75、・・・同士で共通部分があるものを、実際に画像データ70に含まれている画像に対応していると判断する。
なお、ユーザから動画像データ70’が送られ、それをフレーム毎の画像データ70、70、・・・に分解したときは、フレーム毎の画像データ70、70、・・・に共通して多く含まれる認識結果を実際に動画像データ70’に含まれている画像に対応していると判断することができる。例えば、フレーム毎の画像データ70、70、・・・の所定値以上の割合に対して共通して含まれる認識結果を、実際に動画像データ70’に含まれている画像に対応していると判断する。
図8は、各エンジン71A、71Bおよび71Cにより、画像データ70から得られる情報の例を概略的に示す。図8Aは、画像データ70が画像要素としてロゴマーク画像とテキスト画像とを含む例である。パターン認識エンジン71Aによりロゴマーク画像が認識される。物としての形状は、不明とされる。画像データ70は、顔らしき画像を含まないので、人物認識エンジン71Bは、認識結果を出力しない。文字認識エンジン71Cにより、ロゴマーク画像の下部に配置された文字列が認識される。
図8Bは、画像データ70が画像要素として物(靴)の画像を含み、物に対してロゴマーク画像が付随している例である。パターン認識エンジン71Aにより、物の形状が靴であることが認識され、さらに、靴であると認識された物の表面に付随するロゴマーク画像が認識される。画像データ70は、文字を含まないので、文字認識エンジン71Cにより認識結果として「無し」が得られる。図8Cは、画像データ70が画像要素として建造物の一部を含み、建造物の付属物にロゴマーク画像が記されている例である。パターン認識エンジン71Aにより、画像データ70の画像要素が建造物であることが認識され、さらに、建造物に対してロゴマーク画像が記されていることが認識される。認識された建造物の画像要素から建造物自体を特定することも可能である。図8Bおよび図8Cの何れにおいても、画像データ70は、顔らしき画像を含まないので、人物認識エンジン71Bによる認識はなされない。なお、図8Bおよび図8Cの例において、パターン認識エンジン71Aによる認識の順序は逆でもよい。
図8Dは、画像データ70が画像要素として人物の画像を含む例である。人物認識エンジン71Bは、画像データ70に含まれる顔らしき画像を認識し、さらに、人相を認識する。画像データ70は、文字を含まないので、文字認識エンジン71Cによる意味のある認識結果は出力されない。画像データ70は、人物および人物の装着物以外の画像要素を含まないので、パターン認識エンジン71Aによる意味のある認識結果は出力されない。なお、この図8Dの例において、人物の装着物に対してパターン認識エンジン71Aによる認識結果を出力することも可能である。
図8Eは、画像データ70が画像要素として物の画像と文字列とを含む例である。物の表面には、ロゴマーク画像が記されている。文字列は、手書きまたは手書き風の書体が用いられている。パターン認識エンジン71Aにより、画像データ70の画像要素に含まれている物が○○社製ゲーム機器であることが認識されると共に、認識された物の表面に記されるロゴマーク画像が認識される。文字認識エンジン71Cにより、画像データ70に含まれる文字列が認識される。このように、文字列が手書きまたは手書き風の不均一な表示で、文字列中の文字認識に欠損が生じても、文字列マスタ72Cが有する単語辞書により、正しい文字列を推測することが可能である。画像データ70は、顔らしき画像を含まないので、人物認識エンジン71Bによる認識はなされない。
図9は、上述した図7の画像認識処理およびメタデータ抽出処理を、より具体的な例を用いて示す。ユーザから送られてきた画像データ70は、1つの画像データ70に対して、複数の人物画像、ロゴマーク画像および製品そのものの画像が画像要素として含むものとする。この画像データ70を、パターン認識エンジン71A、人物認識エンジン71Bおよび文字認識エンジン71Cにそれぞれ供給する。
パターン認識エンジン71Aは、画像データ70の特徴データに基づき一般画像マスタ72Aを検索する。一般画像マスタ72Aには、図9に模式的に示されるように、様々な製品の画像や、各種のロゴマーク画像、建造物の一部または全体の画像(図示しない)などが登録済み画像として登録されている。パターン認識エンジン71Aは、画像データ70の特徴データと一般画像マスタ72Aの登録済み画像の特徴データとを比較し、画像データ70の一部または全体に一致または極めて類似する登録済み画像を検索する。図9の例では、ロゴマーク画像「ABC」およびZZZ社製DVDレコーダの画像が、画像データ70中に含まれるとして、一般画像マスタ72Aから検索されている。検索された画像の画像ID76、76、・・・がメタデータ抽出エンジン73に供給される。
なお、図9では、便宜上、画像データID76、76、・・・として、対応する物(ZZZ社製DVDレコーダ)やロゴマーク(「ABC」)の名称が記されている。
人物認識エンジン71Bは、画像データ70の特徴データに基づき人物認識を行い、顔らしき画像について人物マスタ72Bを検索して人相認識を行う。人物マスタ72Bには、図9に模式的に示されるように、様々な人物の人相画像が登録されている。人物認識エンジン71Bは、人物認識により顔らしいとされた画像と人物マスタ72Bの登録済みの人相画像とを比較し、顔らしいとされた画像に対して一致または極めて類似する登録済み人相画像を検索する。図9の例では、画像データ70に2人の人物画像が含まれるとして、人物マスタ72Bから検索されている。検索された画像の画像ID77、77、・・・がメタデータ抽出エンジン73に供給される。
なお、図9では、便宜上、画像データID77、77、・・・として、対応する人物の名前(「XX正和」、「YY美紀」)として記されている。
文字認識エンジン71Cは、画像データ70に対して文字認識処理を施し、画像データ70に含まれる文字を検出する。図9の例では、画像データ70に含まれる文字列として「DVD」および「レコーダ」がそれぞれ検索されている。検索されたこれらの文字列78、78、・・・がメタデータ抽出エンジン73に供給される。
メタデータ抽出エンジン73は、パターン認識エンジン71Aおよび人物認識エンジン71Bからそれぞれ供給された画像ID76、76、・・・および画像ID77、77、・・・、ならびに、文字認識エンジン71Cから供給された文字列に基づき、画像データ70の内容を特定する。
図9の例では、メタデータ抽出エンジン73は、パターン認識エンジン71Aの認識結果に基づく2個の画像ID76、76、人物認識エンジン71Bの認識結果に基づく2個の画像ID77、77および文字認識エンジン71Cの認識結果に基づく2個の文字列78、78の6個のデータをキーワードとして、メタデータマスタ74を検索する。
メタデータ抽出エンジン73は、これら6個のキーワード全てに共通する(または全てを含む)メタデータがメタデータマスタ74に登録されていたら、当該メタデータをユーザから送られてきた画像データ70に対応するメタデータとして出力する。図9の例では、ロゴマーク画像「ABC」、ZZZ社製DVDレコーダの画像、人物「XX正和」および「YY美紀」、ならびに、文字列「DVD」および「レコーダ」を全て含んだメタデータが画像データ70に対応するメタデータとされる。
また、ロゴマーク画像「ABC」、ZZZ社製DVDレコーダの画像、人物「XX正和」および「YY美紀」、ならびに、文字列「DVD」および「レコーダ」それぞれのメタデータ75、75、・・・を、個別に出力することもできる。
図9の例では、画像データ70に対応するメタデータは、当該画像データ70に画像要素として含まれるZZZ社製DVDレコーダについては、型番、価格、紹介文、情報が公開されるWebサイトのURLおよびこの製品が販売されるWebサイトのURLが含まれる。この画像データ70がテレビジョン放送のコマーシャルに基づく画像の場合、出演者名や用いられた楽曲名、その楽曲の演奏者情報などがさらに含まれる。画像要素それぞれのメタデータ75、75、・・・は、例えば商品画像に対応するメタデータに対して、商品の型番、価格、紹介文、情報が公開されるWebサイトや商品が販売されるWebサイトのURLが含まれる。また、人物に対応するメタデータに対して、その人物の名前やプロフィールが含まれる。
この発明の実施の一形態では、さらに、メタデータ抽出エンジン73は、入力される6個のキーワードのうち数個、例えば1個あるいは2乃至3個が認識できなくても、画像データ70に含まれる、各エンジン71A、71Bおよび71Cでは認識できなかった画像要素を推定して出力することができる。
例えば、画像データ70において、各エンジン71A、71Bおよび71Cにより検索した結果得られた上述の6個のキーワードのうち、ロゴマーク画像「ABC」、人物「XX正和」および人物「YY美紀」が高い一致度で認識され、他の3個は、一致度が低く、認識できなかったものとする。この場合、メタデータ抽出エンジン73は、認識できた3個のキーワードを用いてメタデータマスタ74をAND検索する。この検索により、当該画像データ70に対応するメタデータとして、ZZZ社製DVDレコーダの宣伝のための画像に対応するメタデータが、高い確率で得られることが期待される。メタデータ抽出エンジン73は、こうして得られた画像データ70全体のメタデータの、認識できた画像要素に対応する情報以外の部分を参照することで、各エンジン71A、71Bおよび71Cで認識できなかった画像要素のメタデータを得ることができる。
次に、上述したこの発明の実施の一形態により提供可能なサービスについて説明する。この発明では、上述したように、サーバ3は、予め画像データおよび当該画像データのメタデータをデータベースに登録し、ユーザから送信された画像データに対して画像認識処理を行いデータベースを参照してメタデータを抽出する。この発明では、このメタデータを用いて、ユーザに対して様々なサービスを提供することができる。
図10を参照しながら、より具体的な例を用いて説明する。ユーザは、例えば雑誌や新聞に掲載されている、気になる写真や記事をカメラ機能付き携帯電話端末1やディジタルカメラ装置2などで撮影して画像データ7Aとしてサーバ3に送信する。サーバ3は、受信した画像データ7Aに対して画像認識処理を行い画像データ7Aに画像要素として含まれる文字情報、ロゴマーク画像、物品の画像などをそれぞれ認識し、それぞれの画像要素に対応するメタデータを抽出する。これにより、サーバ3は、撮影された記事に対する速報の入手、撮影された雑誌などに掲載された商品情報の入手や当該商品の購入のサービスを、ユーザに対して提供することが可能である。撮影された雑誌や新聞に他の情報、例えば観光地情報やチケット販売に関する情報が掲載されていれば、それらの情報を提供することも可能である。
同様にして、ユーザにより撮影されサーバに送信された画像データ7Bがレストランなどの建造物の一部であれば、サーバ3は、画像データ7Bに画像要素として含まれる建造物の形状やロゴマーク画像などを認識して例えばレストラン名を特定し、レストラン名と共にそのレストランに関する他の情報、例えばメニュー情報、営業時間、店内映像、予約情報(電話番号)などを提供する。
また、ユーザにより撮影されサーバ3に送信された画像データ7Cが画像要素としてワインなど飲料物や食料品などのラベルを含む場合は、サーバ3は、画像データ7Cのラベル画像上のロゴマーク画像や文字情報などを認識して例えばワイン名を特定し、そのワインの味に関する情報、販売店や価格情報などを提供する。当該ワインの購入サービスをユーザに提供することも可能である。
さらに、ユーザにより撮影されサーバ3に送信された画像データ7Dが画像要素として人物を含む場合は、サーバ3は、画像データ7Dに含まれる人相を認識して当該人物の名前を特定する。当該人物が例えばスポーツ選手である場合には、サーバ3は、当該選手自身の情報の他に、所属するチーム情報、当該チームによるゲームの速報などをユーザに提供することができる。当該選手や当該選手の所属チームなどの関連商品がある場合には、関連商品の購入サービスをユーザに提供することも可能である。
さらにまた、ユーザにより撮影されサーバ3に送信された画像データ7Eが画像要素としてCD(Compact Disc)の発売や上映映画の広告画像を含んでいる場合には、サーバ3は、画像データ7Eに含まれる広告画像に基づき、発売されるCDのタイトル、アーチスト名や、映画のタイトルを特定する。例えば画像データ7Eが上映映画の広告画像であれば、サーバは、タイトル名と共に、その映画のストーリー、出演者情報、監督情報、上映情報などをユーザに提供することができる。当該映画のチケット購入サービスや、当該映画がDVD(Digital Versatile Disc)などに収録され発売された際の購入サービスをユーザに提供することも可能である。
さらに、ユーザにより撮影されサーバ3に送信された画像データ7Fが画像要素としてポスターやテレビジョン放送のコマーシャルなどによる商品広告の画像を含んでいる場合には、サーバ3は、画像データ7Fに含まれる商品画像を認識して商品名を特定し、商品情報や商品の購入サービスをユーザに提供する。当該広告画像が広告対象の商品の他に、例えば人物画像を画像要素として含んでいる場合には、サーバは、当該人物を認識して当該人物に関する情報をユーザに提供することができる。また、当該広告画像がテレビジョン放送のコマーシャルによるものである場合には、当該コマーシャルで用いられている楽曲情報をユーザに提供することもできる。
図11〜図24を用いて、図10で示したそれぞれの例におけるユーザ側のインターフェイスの例について、説明する。なお、以下では、ユーザは、カメラ機能付き携帯電話端末1で撮影した画像データ10をインターネット2を介してサーバ3に送り、サーバ3は、送られた画像データ10に応じたサービスを、画像データ10を送信したカメラ機能付き携帯電話端末1に対して提供するものとする。また、図11〜図24において、符号A〜Iは、それぞれ対応する符号に移行することを示す。
例えば、既に述べたように、サーバ3は、ユーザから送信された画像データ7に応じたサービスを提供するようなWebサイトを作成し、当該Webサイトに対してインターネット2を介してアクセス可能な状態とする。サーバ3は、当該WebサイトのURLを、画像データ7を送信したカメラ機能付き携帯電話端末1に対して例えば電子メール機能などを利用して送信する。
一方、カメラ機能付き携帯電話端末1は、インターネット2を介しての電子メール送受信機能と、インターネット2上のWebサイトへのアクセス機能を有する。カメラ機能付き携帯電話端末1は、Webサイトを閲覧するためのブラウザソフトウェアを有し、WebサイトのURLを指定することで、当該Webサイトにアクセスすることができる。その際、カメラ機能付き携帯電話端末1に所定に配置されたキーを用いて項目の選択やデータの入力、データの送信などを行うことができるようにされている。ユーザは、カメラ機能付き携帯電話端末1により受信されたURLに対してアクセスすることで、サーバ3によるサービスを受けることができる。なお、ユーザ側のインターフェイスとしては、カメラ機能付き携帯電話端末1に限らず、インターネット2に通信可能なパーソナルコンピュータを用いることも可能である。この場合、画像データ7をパーソナルコンピュータからサーバ3に送信してもよいし、画像データ7をカメラ機能付き携帯電話端末1で送信し、サービスをパーソナルコンピュータで受けるようにもできる。
図11〜図13は、上述した画像データ7Aの例に対応し、雑誌や新聞に掲載の気になる写真や記事を撮影してサーバ3に送信し、サービスを受ける例である。図11において、ユーザは、気になった写真や記事が掲載された雑誌の表紙をカメラ機能付き携帯電話端末1で撮影し、撮影された画像データ7Aを電子メールに添付してサーバ3に送信する。なお、画像データ7Aは、その雑誌を実際に撮影したものでなくてもよく、例えばその雑誌が写っている写真を撮影したものや、テレビジョン放送の映像による画像データなどでもよい。画面101は、このときのカメラ機能付き携帯電話端末1の表示部の表示例である。以下、画面表示例は、カメラ機能付き携帯電話端末1の表示部に対する表示例である。画像データ7Aの送信の際には、サブジェクトには何も記述する必要はない。送信ボタンを押す操作を行うことで、画像データ7Aがサーバ3に送信される。
サーバ3は、画像データ7Aを受信し、画像データ7Aに対して画像認識処理を行って画像データ7Aに含まれる画像要素を特定し、特定された画像要素に対応するメタデータの抽出を行う。そして、抽出されたメタデータに基づくサービスを提供するWebサイトを作成し、当該WebサイトのURLが記述された電子メールを、カメラ機能付き携帯電話端末1に対して返信する。この返信の電子メールは、画面102のように、サービス提供のためのWebサイトのURL102Aが記述されている。このURL102Aを所定に指定すると、当該Webサイトにアクセスされ、画面103の表示となる。
画面103は、画像データ7Aによる雑誌の画像7A’と、ボタン103Aおよび103Bが表示される。この雑誌100を撮影した例では、サーバ3により、雑誌名「ABCD」を示すロゴマーク画像と、雑誌100の表紙に写真が掲載される携帯電話端末とが認識され、雑誌「ABCD」に関するサービスと、携帯電話端末に関するサービスとが提供される。
なお、画面に表示されたボタンは、カメラ機能付き携帯電話端末1に対する所定の操作により選択することができ、さらに所定の操作で選択を決定することで、選択したボタンに応じた選択情報がサーバ3に送信されるようになっている。以下では、所定の操作により画面に表示されたボタンを選択して決定する操作を、適宜、「ボタンを押す」などと表現する。サーバ3は、受信された選択情報に応じたデータをカメラ機能付き携帯電話端末1に送信する。カメラ機能付き携帯電話端末1では、受信されたデータに基づく画面の表示がなされる。
ユーザが雑誌「ABCD」に関するサービスを受けたいとしてボタン103Aを選択すると、その旨がサーバ3に送信され、表示が図12に示す画面104に切り替わる。画面104は、雑誌「ABCD」のメタデータに基づき、雑誌「ABCD」に関して概略的に説明が表示されると共に、ボタン104A、104B、104Cおよび104Dが表示される。ボタン104Aを選択すると、画面105が表示され、雑誌「ABCD」に関してより詳細な情報を知ることができる。
画面104において、ボタン104Bを押すと、表示が画面106に切り替わり、雑誌「ABCD」の通信販売での購入申し込みを設定することができる。画面106において必要な情報を入力してボタン106Aを押すと、表示が入力した情報を確認するための画面107に切り替わり、さらにボタン107Aを押すことで、通信販売の決済が実行される。なお、画面104において、ボタン104Cを押すと、表示が類似情報を探す画面に切り替わる。
一方、図11の画面103において、ボタン103Bを押すと、雑誌100を撮影した画像データ7Aから認識された携帯電話端末に関するサービスを提供する画面108(図13参照)に表示が切り替わる。画面108は、メタデータに基づき雑誌に掲載されていた携帯電話端末の情報が概略的に表示されると共に、ボタン108A、108Bおよび108Cが表示される。ボタン108Aを押すと、この携帯電話端末に関するより詳細な情報を閲覧できる画面(図示しない)が表示される。
ボタン108Bを押すと、表示が類似情報を探す画面109に切り替わる。例えば、サーバ3において「携帯電話端末」をキーワードとしてメタデータが検索され、類似情報の候補が抽出される。この類似情報の候補が画面109に表示される。表示された候補を選択してボタン109Aを押すことで、選択された候補に関する画面(図示しない)に表示が切り替わる。この候補に関する画面は、例えば、画面108と同一の構成で異なる機種の携帯電話端末が表示され、所定のボタンを押すことで、詳細情報を見る画面や類似情報を探す画面に切り替わる。
上述において、例えば画面104以降で表示される情報や通信販売画面などは、サーバ3が用意してもよいし、当該商品の発売元などで、インターネット2上のWebサイトとして用意してもよい。一例として、画面103のボタン103Aを雑誌「ABCD」の出版社が用意する雑誌「ABCD」に関するWebサイトにリンクさせておき、ボタン103Aが押されたら、その雑誌「ABCD」に関するWebサイトがアクセスされるようにする。
なお、画面104のボタン104D、画面106のボタン106B、画面107のボタン107B、画面108のボタン108Cおよび画面109のボタン109Bは、それぞれ一つ前の画面に戻るためのボタンである。
図14および図15は、上述した画像データ7Bの例に対応し、建造物の全体または一部を撮影してサーバ3に送信し、サービスを受ける例である。図14において、ユーザは、気になったレストラン「×××」の入り口付近をカメラ機能付き携帯電話端末1で撮影し、撮影された画像データ7Bを画面101により電子メールに添付してサーバ3に送信する。なお、画像データ7Bは、レストラン「×××」を実際に撮影したものでなくてもよく、例えば雑誌の写真を撮影したものや、テレビジョン放送の映像による画像データなどでもよい。
サーバ3では、受信された画像データ7Bに対して画像認識処理およびメタデータ抽出処理を行い、画像データ7Bに含まれる画像要素を特定し、画像要素に対応するメタデータを検索する。そして、抽出されたメタデータに基づくサービスを提供するWebサイトを作成し、当該WebサイトのURLが記述された電子メールを、カメラ機能付き携帯電話端末1に対して返信する。返信の電子メールの画面102に表示されたURL102Aを所定に指定すると、当該Webサイトにアクセスされ、画面111の表示となる。
画面111は、画像データ7Bに基づくレストラン「×××」の画像7B’と、ボタン111Aとが表示される。ボタン111Aを押すと、表示が図15の画面112に切り替わり、レストラン「×××」の概略的な説明と、ボタン112A、112B、112Cおよび112Dとが表示される。ボタン112Aを押すと、表示が画面113に切り替わり、レストラン「×××」の詳細情報が表示される。
また、ボタン112Bを押すと、表示が画面114に切り替わり、レストラン「×××」の場所を示す地図が表示される。画面114においてボタン114Aを押すと、このカメラ機能付き携帯電話端末1の電話機能を用いてレストラン「×××」が呼び出され、ユーザとレストラン「×××」との間で、例えば予約などの相談を行うことができる。なお、上述の画面112において電話番号部分を所定に指定することでも、カメラ機能付き携帯電話端末1の電話機能を用いてレストラン「×××」を呼び出すことができる。
画面112においてボタン112Cを押すと、表示が類似情報を探す画面に切り替わる。例えば、サーバ3においてレストラン「×××」のメタデータに基づき抽出される、このレストラン「×××」が属するカテゴリ(例えば「日本料理店」)に基づきメタデータを検索し、類似のカテゴリに属する他のレストランの一覧を画面に表示させる。
上述において、例えば画面112以降で表示される情報は、サーバ3が用意してもよいし、レストラン「×××」側がインターネット2上のWebサイトとして用意し、画面111のボタン111Aによりリンクするようにしてもよい。
なお、画面112のボタン112Dおよび画面114のボタン114Bは、それぞれ一つ前の画面に戻るためのボタンである。
図16および図17は、上述した画像データ7Cの例に対応し、ワインボトルなどに貼付されているラベルを撮影してサーバ3に送信し、サービスを受ける例である。図16において、ユーザは、気になったワインのボトルに貼付されたラベルをカメラ機能付き携帯電話端末1で撮影し、撮影された画像データ7Cを画面101により電子メールに添付してサーバ3に送信する。なお、画像データ7Cは、ラベルを実際に撮影したものでなくてもよく、例えば雑誌の写真を撮影したものや、テレビジョン放送の映像による画像データなどでもよい。
サーバ3では、受信された画像データ7Cに対して画像認識処理およびメタデータ抽出処理を行い、画像データ7Cに含まれる画像要素を特定し、画像要素に対応するメタデータを検索する。そして、検索されたメタデータに基づくサービスを提供するWebサイトを作成し、当該WebサイトのURLが記述された電子メールを、カメラ機能付き携帯電話端末1に対して返信する。返信の電子メールの画面102に表示されたURL102Aを所定に指定すると、当該Webサイトにアクセスされ、画面120の表示となる。
画面120は、画像データ7Cによるラベルの画像7C’と、ボタン120Aが表示される。ボタン120Aを押すと、表示が図17の画面121に切り替わり、当該ワインの概略的な説明と、ボタン121A、121B、121Cおよび121Dとが表示される。ボタン121Aを押すと、表示が画面122に切り替わり、当該ワインの詳細情報が表示される。
画面121において、ボタン121Bを押すと、表示が画面123に切り替わり、当該ワインの通信販売での購入申し込みを設定することができる。画面123において必要な情報を入力してボタン123Aを押すと、表示が入力した情報を確認するための画面124に切り替わり、さらにボタン124Aを押すことで、通信販売の決済が実行される。
画面121においてボタン121Cを押すと、表示が類似情報を示す画面に切り替わる。例えば、サーバ3において当該ワインのメタデータに基づき、所定の項目で他のワインのメタデータを検索し、当該ワインと類似するワインの一覧を画面に表示させる。
上述において、例えば画面121以降で表示される情報は、サーバ3が用意してもよいし、このワインの販売元、輸入元などがインターネット2上のWebサイトとして用意し、画面120のボタン120Aによりリンクするようにしてもよい。
なお、画面121のボタン121D、画面123のボタン123Bおよび画面124のボタン124Bは、それぞれ一つ前の画面に戻るためのボタンである。
図18および図19は、上述した画像データ7Dの例に対応し、人物(プロスポーツ選手とする)を撮影してサーバ3に送信し、サービスを受ける例である。図18において、ユーザは、気になったスポーツ選手をカメラ機能付き携帯電話端末1で撮影し、撮影された画像データ7Dを画面101により電子メールに添付してサーバ3に送信する。なお、画像データ7Dは、人物を実際に撮影したものでなくてもよく、例えば、テレビジョン放送の映像による画像データや、雑誌の写真を撮影したものなどでもよい。
サーバ3では、受信された画像データ7Dに対して画像認識処理、人相認識およびメタデータ抽出処理を行い、画像データ7Dに含まれる画像要素が示す人物を特定し、当該人物に対応するメタデータを検索する。そして、検索されたメタデータに基づくサービスを提供するWebサイトを作成し、当該WebサイトのURLが記述された電子メールを、カメラ機能付き携帯電話端末1に対して返信する。返信の電子メールの画面102に表示されたURL102Aを所定に指定すると、当該Webサイトにアクセスされ、画面130の表示となる。
画面130は、画像データ7Dによる画像7D’と、ボタン130Aおよび130Bとが表示される。このスポーツ選手を撮影した例では、サーバ3により、スポーツ選手の画像と、スポーツ選手が着ているユニフォームのロゴマーク画像とが認識され、当該スポーツ選手に関するサービスと、当該スポーツ選手が着ているユニフォームに関するサービスとが提供される。
ユーザがスポーツ選手に関するサービスを受けたいとしてボタン130Aを押すと、表示が画面131(図19)に切り替わり、当該スポーツ選手に関して概略的に説明が表示されると共に、ボタン131A、131B、131Cおよび131Dが表示される。ボタン131Aを押すと、表示が画面132に切り替わり、当該スポーツ選手に関してより詳細な情報が表示される。
ボタン131Cを押すと、表示が類似情報を探す画面133に切り替わる。例えば、サーバ3において、当該スポーツ選手の名前をキーワードとしてメタデータが検索され、類似情報の候補が画面133に表示される。対象がスポーツ選手のこの例では、当該スポーツ選手が所属するチームの試合に関する情報や、チームの他の選手に関する情報が類似情報として表示される。所望の類似情報を選択してボタン133Aを押すと、選択した情報が表示される画面に切り替わる。
また、当該スポーツ選手を撮影した画像データを用いた壁紙画像データ(表示部の背景として用いるための画像データ)や、当該スポーツ選手の音声による着信音声データを類似情報としてもよい。この場合には、ボタン133Aを押すと、表示が、壁紙画像データや着信音声データをインターネット2を介してダウンロードするような画面(図示しない)に切り替わる。
画面131において、ボタン131Bを押すと、通信販売での購入申し込みを設定するための画面134に表示が切り替わる。これに限らず、上述の画面130において、ユニフォームに関するサービスを受けたいとしてボタン130Bを押しても、表示がこの画面134に切り替わる。
上述したように、この図18および図19の例では、画像データ7Dからスポーツ選手の人物の画像と共に、スポーツ選手が着ているユニフォームのロゴマーク画像が認識されている。そこで、この画面134では、認識されたロゴマーク画像に関連するスポーツウェアの通信販売による購入申し込みが可能となっている。この例では、注文可能なユニフォームを示す画像134Aおよび134Bがそれぞれボタンを兼ねており、所望のスポーツウェアが表示される画像をボタン表示の如く押すことで、選択されたスポーツウェアの購入申し込み画面135に表示が切り替わる。
画面135において必要な情報を入力してボタン135Aを押すと、入力した情報を確認するための画面(図示しない)に表示が切り替わり、その画面において例えば決済ボタンを押すことで、通信販売の決済が実行される。
上述において、例えば画面131以降で表示される情報は、サーバ3が用意してもよいし、当該スポーツ選手の契約元やロゴマーク画像で認識されるスポーツウェアの販売元などがインターネット2上のWebサイトとして用意し、画面130のボタン130Aやボタン130Bによりリンクするようにしてもよい。
なお、画面131のボタン131D、画面133のボタン133Bおよび画面135のボタン135Bは、それぞれ一つ前の画面に戻るためのボタンである。
図20および図21は、上述した画像データ7Eの例に対応し、CDの発売や上映映画の広告画像を撮影してサーバ3に送信し、サービスを受ける例である。ここでは、画像データ7Eは、上映映画の広告ポスターを撮影したデータであるとする。図20において、ユーザは、気になった上映映画を広告しているポスターをカメラ機能付き携帯電話端末1で撮影し、撮影された画像データ7Eを画面101により電子メールに添付してサーバ3に送信する。なお、画像データ7Eは、テレビジョン放送のコマーシャルなどによる画像データでもよい。
サーバ3では、受信された画像データ7Eに対して画像認識処理およびメタデータ抽出処理を行い、画像データ7Eに含まれる画像要素を特定し、画像要素に対応するメタデータを検索する。そして、検索されたメタデータに基づくサービスを提供するWebサイトを作成し、当該WebサイトのURLが記述された電子メールを、カメラ機能付き携帯電話端末1に対して返信する。返信の電子メールの画面102に表示されたURL102Aを所定に指定すると、当該Webサイトにアクセスされ、画面140の表示となる。
画面140は、画像データ7Eによるポスター画像7E’と、ボタン140Aとが表示される。ボタン140Aを押すと、表示が画面141(図21)に切り替わり、ポスターにより広告される上映映画の概略的な説明と、ボタン141A、141B、141Cおよび141Dとが表示される。ボタン141Aを押すと、表示が142に切り替わり、当該映画の詳細情報が表示される。ここでは、当該映画の上映館や上映時間など、上映に関する情報が詳細情報として表示されている。
ボタン142Aを押すことで、表示が画面144に切り替わり、当該映画のチケットの通信販売での購入申し込みを設定することができる。なお、画面141においてボタン141Bを押すことでも、表示が画面144に切り替わり通信販売によるチケット購入申し込みの設定ができるようになる。画面144において必要な情報を入力してボタン144Aを押すと、入力した情報を確認するための画面145に表示が切り替わり、さらにボタン145Aを押すことで、通信販売の決済が実行される。
画面141において、ボタン141Cを押すと、表示が類似情報を示す画面143に切り替わる。当該映画のメタデータに基づき、当該映画が収録されたDVDの購入情報や、ストーリー、キャストなど当該映画の関連情報、映画の映像を利用した壁紙データのダウンロード、当該映画に関するニュースなどが類似情報として表示される。所望の類似情報を選択してボタン143Aを押すと、選択した情報が表示される画面に切り替わる。例えば、DVDの購入情報を選択した場合は、ボタン143Aを押すと、DVDの通信販売による購入申し込みを設定する画面(図示しない)に表示が切り替わる。また、壁紙データを選択した場合は、ボタン143Aを押すと、壁紙画像データをインターネット2を介してダウンロードするような画面(図示しない)に切り替わる。
上述において、例えば画面141以降で表示される情報は、サーバ3が用意してもよいし、この映画の配給元などがインターネット2上のWebサイトとして用意し、画面140のボタン140Aによりリンクするようにしてもよい。
なお、画面141のボタン141D、画面142のボタン142B、画面143のボタン143B、画面144のボタン144Bおよび画面145のボタン145Bは、それぞれ一つ前の画面に戻るためのボタンである。
図22〜図24は、上述した画像データ7Fの例に対応し、ポスターなど商品広告の画像を撮影してサーバ3に送信し、サービスを受ける例である。図22において、ユーザは、気になった商品を宣伝しているポスターをカメラ機能付き携帯電話端末1で撮影し、撮影された画像データ7Fを画面101により電子メールに添付してサーバ3に送信する。なお、画像データ7Fは、テレビジョン放送のコマーシャル映像による画像データなどでもよい。
サーバ3では、受信された画像データ7Fに対して画像認識処理およびメタデータ抽出処理を行い、画像データ7Fに含まれる画像要素を特定し、画像要素に対応するメタデータを検索する。そして、検索されたメタデータに基づくサービスを提供するWebサイトを作成し、当該WebサイトのURLが記述された電子メールを、カメラ機能付き携帯電話端末1に対して返信する。返信の電子メールの画面102に表示されたURL102Aを所定に指定すると、当該Webサイトにアクセスされ、画面150の表示となる。
画面150は、画像データ7Fによる画像7F’と、ボタン150Aおよびボタン150Bとが表示される。商品広告のポスターを撮影したこの例では、サーバ3により、広告されている商品の画像および当該商品のロゴマーク画像と、広告に起用されているモデルの画像とが認識され、当該商品に関するサービスと、当該モデルに関するサービスとが提供される。
画面150において、ボタン150Aを押すと、表示が画面151(図23)に切り替わり、ポスターにより広告される商品の概略的な説明と、ボタン151A、151B、151Cおよび151Dとが表示される。ボタン151Aを押すと、表示が画面152に切り替わり、当該商品の詳細情報が表示される。
画面152において、ボタン152Aを押すことで、表示が画面154に切り替わり、当該商品の通信販売での購入申し込みを設定することができる。なお、画面151においてボタン151Bを押すことでも、表示が画面154に切り替わり、通信販売による商品購入申し込みの設定ができるようになる。画面154において必要な情報を入力してボタン154Aを押すと、入力した情報を確認する確認画面(図示しない)に表示が切り替わり、入力情報の確認および設定された購入申し込みに対する決済の実行を行うことができる。
画面151においてボタン151Cを押すと、表示が類似情報を示す画面153に切り替わる。当該商品のメタデータに基づき、当該商品のシリーズの他の商品や、当該商品を宣伝するコマーシャルに関する情報、当該商品に関連するニュースなどが類似情報として表示される。所望の類似情報を選択してボタン153Aを押すと、選択した情報が表示される画面に切り替わる。
画面150において、ボタン150Bを押すと、表示が画面155(図24)に切り替わり、当該ポスターに起用されているモデルに関する情報が概略的に表示される。ボタン155Aを押すことで、当該モデルに関する詳細情報を表示する画面(図示しない)に切り替わる。ボタン155Bを押すことで、当該モデルに関する商品の通信販売による購入を申し込む画面(図示しない)に表示が切り替わる。ボタン155Cを押すことで、当該モデルに対する類似情報を表示する画面(図示しない)に切り替わる。すなわち、このモデルの詳細情報の表示画面155以降は、上述したスポーツ選手の詳細情報の表示画面131以降と、同様の構成を持つことができる。
上述において、例えば画面151以降で表示される情報は、サーバ3が用意してもよいし、商品の宣伝元やモデルの所属プロダクションなどがインターネット2上のWebサイトとして用意し、画面150のボタン150Aおよび150Bによりリンクするようにしてもよい。
なお、画面151のボタン151D、画面152のボタン152B、画面153のボタン153B、画面154のボタン154Bおよび画面155のボタン145Dは、それぞれ一つ前の画面に戻るためのボタンである。
このように、この発明の実施の一形態によるシステムによれば、ユーザは、撮影した画像データ7をサーバ3に送信するだけで、撮影した内容に応じた様々なサービスを受けることができる。サーバ3は、画像認識処理結果に基づきメタデータを抽出してサービスの内容を判断する。そのため、ユーザは、撮影の対象に関する知識を持っていなくても適切なサービスを受けることができる。
また、サーバ3は、ユーザから送信された画像データ7に対する画像認識処理において、画像データ7に含まれる複数の画像要素について認識し、それぞれメタデータを抽出するようにしている。そのため、ユーザは、撮影した画像中の自分が狙った以外の部分についても、サービスを受けることができる。また、撮影の対象となる画像(ポスターやテレビジョン放送のコマーシャル映像、雑誌の表示など)の本来の目的以外の画像要素に対しても、サービスを受けることができる。
以上のことから、この発明の実施の一形態によるシステムを用いることで、次のようなことが実現可能である。
(1)例えば、ユーザが、新しく封切りされる映画のポスターを見て、その映画の上映館と上映時間とを知りたいと思ったとする。ユーザは、手元のカメラ機能付き携帯電話端末1を用いて当該ポスターを撮影し、撮影された画像データ7をサーバ3に送信するだけで、欲しい情報がその場で入手可能となる。ユーザは、欲しい情報を入手する際に、文字入力の手間が省けるだけでなく、記憶違いや忘却などにより検索不能となることも、防がれる。
(2)例えば、雑誌の広告に掲載されている写真の人物が履いている靴を、ユーザが気に入ったとする。ユーザは、その靴の製造メーカや型名が分からなくても、その写真をカメラ機能付き携帯電話端末1で撮影してサーバ3に送信するだけで、欲しい情報を入手できる。
(3)例えば、ユーザが店舗でワインを購入する際に、購入しようとするワインが果たしてどんな味なのか、どのワイナリーで作られ、どの葡萄が原料として使われているかなど、必要な情報が分からず買うべきか否かの決断ができない場合がある。このような場合でも、ユーザは、手元のカメラ機能付き携帯電話端末1を用いてそのワインのラベル部分を撮影してサーバ3に送信するだけで、必要な情報を入手することができる。また、撮影された画像を送信するだけなので、ラベルの文字が例えばフランス語やイタリア語で記述されておりユーザが読めない場合でも、問題なく情報の検索を行うことができると共に、その場ですぐに情報を入手することができる。
テレビジョン放送の内容に対してこの発明の実施の一形態を適用した場合について考える。既に実用化されているネットワーク接続型のテレビジョン受像機では、テレビジョン放送に応じた情報をネットワークを介して入手することができる。この発明の実施の一形態は、このようなネットワーク接続型のテレビジョン受像機に対して、次のような優位性がある。
(1)ネットワーク接続型のテレビジョン受像機を利用したサービスでは、専用のテレビジョン受像機が必要となる。一方、この発明の実施の一形態によるサービスでは、テレビジョン受像機に映出された映像をカメラ機能付き携帯電話端末1で撮影しサーバ3に送信するだけでよいので、サービスを受けるに当たって、専用のテレビジョン受像機を用意する必要が無い。
(2)ネットワーク接続型のテレビジョン受像機を利用したサービスでは、ユーザは、テレビジョン放送局が予め用意したサービスしか受けることができない。一方、この発明の実施の一形態によるサービスでは、映像から抽出されたメタデータに基づき情報が提供されるため、様々な情報検索が可能である。
(3)ネットワーク接続型のテレビジョン受像機を利用したサービスでは、データは、放送時にデータチャンネルによって送信されるため、放送時から時間が経過しても関連情報の更新が行われない。そのため、例えば放送を録画して後に録画した放送を再生したときなど、その放送に関連して放送時に送信された情報が既に古くなって有益ではなくなっている場合がある。一方、この発明の実施の一形態によるサービスでは、関連情報が常に更新されるため、過去の映像からでも、最新情報の検索が可能である。
(4)ネットワーク接続型のテレビジョン受像機を利用したサービスでは、録画された放送を再生中に、その放送に関するサービスを受けようとする場合、その放送に対応するデータチャンネルも記録可能な、特殊な録画機器を必要とする。一方、この発明の実施の一形態によるサービスでは、映像に基づき情報が検索されるため、録画装置は通常のものでよい。
テレビジョン放送局の多くは、インターネット2上にWebサイトを持っている。また、インターネット2上には、テレビジョン放送による番組やコマーシャルに関するWebサイトが多数、存在する。ユーザは、ネットワーク接続機能の無い一般のテレビジョン受像機でテレビジョン放送を視聴中に、気になる情報を発見したら、パーソナルコンピュータやインターネット接続機能を有する携帯電話端末などを用いてインターネット2に接続し、その情報を検索することができる。この発明の実施の一形態は、このようなテレビジョン放送に基づく情報検索に対して、次のような優位性がある。
(1)ユーザがテレビジョン放送を視聴中に気になる情報を発見し、パーソナルコンピュータなどで特定のシステム(インターネット上の情報検索サイトなど)にアクセスしている間に、目的の映像が終わってしまう場合がある。一方、この発明の実施の一形態によるサービスでは、気になる映像が映出されたら、その場でカメラ機能付き携帯電話端末1などでその画面を撮影してサーバ3に送信するだけで、情報が得られる。画面を撮影してからパーソナルコンピュータなどで特定のシステムにアクセスしてもよく、アクセス中に目的の映像が終了してしまっても、後から、撮影された画像データ7をサーバ3に送信することで、その特定のシステムにアクセスすることが可能である。
(2)パーソナルコンピュータなどで特定のシステムにアクセスして情報を検索する場合、ユーザは、テレビジョン放送に基づく情報を検索する際に、別途、放送局情報を入力する必要がある。一方、この発明の実施の一形態によるサービスでは、テレビジョン放送の映像を撮影してサーバ3に送信するだけで情報が得られるため、放送局を意識する必要が無い。
(3)パーソナルコンピュータなどで特定のシステムにアクセスして情報を検索する場合、録画されたテレビジョン放送により情報を検索しようとした場合、そのテレビジョン放送の放送局情報や放送された時刻情報をテレビジョン放送の映像と共に録画しなければならず、特殊な録画装置が必要でとされる。一方、この発明の実施の一形態によるサービスでは、録画装置から再生されたテレビジョン放送の映像を撮影してサーバ3に送信するだけで情報が得られるため、通常の録画装置を用いることができる。
このように、この発明の実施の一形態によるサービスでは、既存の情報検索方法に対して優位性が高いため、様々なビジネスを展開することができる。次に、この発明の実施の一形態によるサービスを利用したビジネスモデルについて説明する。
図25は、この発明の実施の一形態によるサービス(以下、画像マーカサービスと呼ぶ)と、ユーザおよび各企業との関係を概念的に示す。画像マーカサービス200は、例えば図3を用いて説明したサーバ側システムに対応し、ロゴマーク画像マスタ214、一般画像マスタ215および人物画像マスタなどの各画像マスタ(例えば図3の画像データベース4に対応)と、コンテンツメタデータ211、商品メタデータ212およびその他のメタデータ213などの、画像マスタに登録された各画像と対応付けられた各メタデータ(例えば図3の関連情報データベース5に対応)と、画像認識エンジン210とからなる画像マーカサービスエンジンを有する。
画像認識エンジン210は、例えば図3を用いて説明した画像特徴抽出部30、画像特徴比較部31および関連情報検索部32に対応し、入力された画像データに対して画像認識処理を行い、各画像マスタに登録されている画像のうち、一致度の高い画像を検索する。そして、一致度が高いとされた画像に対応するメタデータを入力された画像データの関連情報として抽出する。
各画像マスタおよび各メタデータは、上述したCM自動抽出システム51によるテレビジョン放送からのコマーシャルの自動抽出や、一般Webサイト52を検索することで集められ、登録ツールを用いてデータ登録センタ50により登録される。
ユーザ201は、気になる商品や広告などを撮影し、インターネットを介して画像マーカサービス200に送信する。画像マーカサービス200は、画像マーカサービスエンジンを用いて、ユーザ201から送信された画像データの関連情報を検索する。検索された関連情報は、ユーザ201に送信される。
ユーザ201は、画像マーカサービス200から送信された関連情報により基づき、撮影した商品などをインターネットを介して購入することができる。このとき、購入の手続などは、他の企業202が行うことが可能である。
企業202は、例えば、商品の閲覧および購入が可能なWebサイトを用いてインターネット上で電子商取引を行う、EC企業である。以下、企業202をEC企業202と呼ぶ。一例として、画像マーカサービス200は、画像マーカサービスエンジンをEC企業202に貸し出す。換言すれば、画像マーカサービス200は、この画像マーカサービスエンジンの部分をEC企業202に貸し出すASP(Application Service Provider)となる。
従来、ユーザ201は、EC企業202のWebサイトにアクセスして多数の商品の中から購入したい商品を検索および選択し、その後、購入していた。EC企業202が画像マーカサービスエンジンを用いることで、ユーザ201は、EC企業202のWebサイトにアクセスして商品を選択するという行為無しに、直接的に商品を指定して、EC企業202からその商品を購入することになる。画像マーカサービスエンジンを介してEC企業202から商品を購入するユーザ201は、EC企業202の潜在的な顧客であって、将来的にEC企業202のWebサイトなどに誘導できる期待がある。
一方、画像マーカサービスエンジンを介して購入可能な商品の製造メーカなどの一般企業203は、積極的に画像マーカサービスエンジンに対して商品情報やURLなどの情報を登録することで、結果的に売り上げを伸ばすことが可能となる。画像マーカサービス200は、一般企業203が画像マーカサービスエンジンに対して情報の登録を行うことが可能なように、データセンタ50で用いられる登録ツールを一般企業203に対して貸し出しまたは販売する。
図26〜図29を用いて、画像マーカサービス200によるビジネスモデルについて説明する。以下において、ユーザ201は例えばカメラ機能付き携帯電話端末1であると共にカメラ機能付き携帯電話端末1を使用するユーザであり、画像マーカサービス200は例えばサーバ3であり、販売業者等204は、図25のEC企業202や一般企業203に相当する。ユーザ201および画像マーカサービス200は、互いにインターネット2を介して通信可能とされる。例えばインターネット2に接続されるサーバ装置とし、販売業者等204と、ユーザ201および画像マーカサービス200とをインターネット2を介して互いに通信可能としてもよい。
図26は、ユーザに対して課金を行う会員制の有料サービスの例である。この図26の例を、画像マーカサービス200によるビジネスモデルの第1段階とする。画像マーカサービス200は、ユーザ201に対して課金することで、情報提供サービスをユーザ201に対して提供する。すなわち、ユーザ201は、画像マーカサービス200と会員契約し、画像マーカサービス200に対してサービス利用料金を支払い、有料で情報提供サービスを受ける。この情報提供サービスにより提供された情報に基づきユーザ201が購入したい商品があった場合、画像マーカサービス200から販売業者等204に対して、商品購入を希望した顧客(ユーザ201)を紹介する。販売業者等204は、紹介されたユーザ201に対して商品情報を提供し、ユーザが購入のために代金を支払うと、商品や情報をユーザに対して配送する。
図27は、画像マーカサービス200が販売業者等204による商品の販売や課金の代行を行う例である。この図27の例を、画像マーカサービス200によるビジネスモデルの第2段階とする。画像マーカサービス200は、ユーザ201に対して商品情報などを提供する情報提供サービスを行う。ユーザは、提供された情報に基づき商品を購入する。このとき、ユーザ201は、商品代金を画像マーカサービス200に対して支払う。画像マーカサービス200は、商品代金から手数料を差し引いた金額を販売業者等204に渡す。この手数料が画像マーカサービス200の収益となる。販売業者等204は、手数料を差し引かれた商品代金を受け取ると、ユーザ201に対して商品を発送する。
図28は、画像マーカサービス200が画像マーカサービスエンジンの機能を販売業者等204に提供する機能ASPとなる例である。この図28の例を、画像マーカサービス200によるビジネスモデルの第3段階とする。画像マーカサービス200は、画像マーカサービスエンジンの機能を販売業者等204に提供する。販売業者等204は、画像マーカサービス200に対して、画像マーカサービスエンジンの機能利用料を支払う。これで、販売業者等204は、ユーザから送信された画像データに対する画像認識機能や、メタデータ抽出機能を利用することができる。メタデータそのものは、販売業者等204側で収集する必要がある。
ユーザ201は、気に入った商品などを撮影した画像データを販売業者等204に対して送信する。販売業者等204は、画像マーカサービスエンジンの機能を用いて、送信された画像データの関連情報をユーザ201に対し送信する。この関連情報に基づき、ユーザ201が商品の購入のために販売業者等204に代金を支払うと、販売業者等204からユーザ201に対して商品が発送される。
図29は、画像マーカサービス200が販売業者等204に対して、画像マーカサービスエンジンのライセンスを供与する例である。この図29の例を、画像マーカサービス200によるビジネスモデルの第4段階とする。画像マーカサービス200は、販売業者等204に対して画像マーカサービスエンジンの技術に対する使用許諾を行うと共に、メタデータを提供する。販売業者等204は、画像マーカサービス200に対して、技術利用とメタデータの利用に対する利用料金を支払う。これで、販売業者等204は、ユーザから送信された画像データに対する画像認識機能やメタデータ抽出機能を、使用許諾の範囲内で自由に利用することができる。また、メタデータそのものも、使用許諾の範囲内で自由に利用することができ、販売業者等204側でメタデータを収集する必要が無い。
ユーザ201は、気に入った商品などを撮影した画像データを販売業者等204に対して送信する。販売業者等204は、画像マーカサービスエンジンの機能を用いて、送信された画像データの関連情報をユーザ201に対し送信する。この関連情報に基づき、ユーザ201が商品の購入のために販売業者等204に代金を支払うと、販売業者等204からユーザ201に対して商品が発送される。
上述の4つのビジネスモデルにおいて、第1段階、第2段階と段階が進むにつれ、画像マーカサービス200の収益が大きくなることが期待されると共に、販売業者等204側でも、画像マーカサービスエンジン機能をより自由に利用できるようになる。また、段階が進むにつれ、情報や金銭の流れが単純化され、画像マーカサービス200、ユーザ201および販売業者等204の関係がより整理されたものになる。このことは、画像マーカサービス200、ユーザ201および販売業者等204の間でのビジネスがより効率的に行われることを意味する。
この発明による購入プロセスを模式的に示す略線図である。 この発明の実施の一形態によるシステムの一例の構成を示す略線図である。 ユーザ側およびサーバ側システムの構成の例を示すブロック図である。 テレビジョン放送のコマーシャルに基づき画像データおよび関連情報を収集する方法を説明するための図である。 テレビジョン放送以外のメディアから画像データおよび関連情報を収集する方法を説明するための図である。 ユーザから送られた画像データを認識し、メタデータを抽出する処理を説明するための略線図である。 画像認識処理およびメタデータ抽出処理についてより詳細に説明するための略線図である。 画像データから得られる情報の例を概略的に示す略線図である。 画像認識処理およびメタデータ抽出処理をより具体的な例を用いて示す略線図である。 この発明の実施の一形態による、メタデータを用いて提供される様々なサービスの例を説明するための図である。 雑誌や新聞に掲載の気になる写真や記事の画像データに基づきサービスを受ける例を説明するための略線図である。 雑誌や新聞に掲載の気になる写真や記事の画像データに基づきサービスを受ける例を説明するための略線図である。 雑誌や新聞に掲載の気になる写真や記事の画像データに基づきサービスを受ける例を説明するための略線図である。 建造物の全体または一部の画像データに基づきサービスを受ける例を説明するための略線図である。 建造物の全体または一部の画像データに基づきサービスを受ける例を説明するための略線図である。 ワインボトルなどのラベルの画像データに基づきサービスを受ける例を説明するための略線図である。 ワインボトルなどのラベルの画像データに基づきサービスを受ける例を説明するための略線図である。 人物の画像データに基づきサービスを受ける例を説明するための略線図である。 人物の画像データに基づきサービスを受ける例を説明するための略線図である。 広告画像の画像データに基づきサービスを受ける例を説明するための略線図である。 広告画像の画像データに基づきサービスを受ける例を説明するための略線図である。 広告画像の画像データに基づきサービスを受ける例を説明するための略線図である。 広告画像の画像データに基づきサービスを受ける例を説明するための略線図である。 広告画像の画像データに基づきサービスを受ける例を説明するための略線図である。 この発明の実施の一形態によるサービスと、ユーザおよび各企業との関係を概念的に示す略線図である。 ユーザに対して課金を行う会員制の有料サービスの例を示す略線図である。 画像マーカサービスが販売業者等による商品の販売や課金の代行を行う例を示す略線図である。 画像マーカサービが画像マーカサービスエンジンの機能を販売業者等に提供する機能ASPとなる例を示す略線図である。 画像マーカサービスが販売業者等に対して、画像マーカサービスエンジンのライセンスを供与する例を示す略線図である。 従来の第1の方法により情報を検索して商品を購入する場合の一例の手順を示す略線図である。
符号の説明
1 カメラ機能付き携帯電話端末
2 インターネット
3 サーバ
4 画像データベース
5 関連情報データベース
6 関連サイト
7,70 画像データ
30 画像特徴抽出部
31 画像特徴比較部
32 関連情報検索部
33 関連情報出力部
50 データ登録ツール
51 CM自動検出システム
71 画像認識アプリケーション
72 画像データマスタ
73 メタデータ抽出アプリケーション
74 メタデータマスタ
200 画像マーカサービス
201 ユーザ
204 販売業者等

Claims (23)

  1. 画像データおよび動画像データに基づき情報検索を行う情報検索システムにおいて、
    画像データおよび動画像データを取得する画像データ取得手段と、
    上記画像データ取得手段で取得された上記画像データおよび上記動画像データを通信ネットワークに向けて送信する送信手段と
    を備える端末装置と、
    検索される可能性がある認識用画像データが登録される第1のデータベースと、
    上記第1のデータベースに登録された上記認識用画像データに対応するメタデータが登録される第2のデータベースと、
    テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、該情報を上記検索される可能性がある認識用画像データとして上記第1のデータベースに登録するとともに、上記第1のデータベースに登録された上記認識用画像データに対応するメタデータを収集して該メタデータを上記第2のデータベースに登録する登録部と、
    上記端末装置から送信された上記画像データおよび上記動画像データを上記ネットワークを介して受信する受信手段と、
    上記受信手段で受信された上記画像データおよび上記動画像データをフレーム毎に分解した画像データの特徴の抽出を行う特徴抽出部と、
    上記第1のデータベースに登録された上記認識用画像データの特徴の抽出を行い、上記画像データおよび上記動画像データをフレーム毎に分解した画像データの特徴と上記認識用画像データの特徴とを比較する特徴比較部と、
    上記特徴比較部の比較結果に基づき、該画像データおよび上記動画像データをフレーム毎に分解した画像データのそれぞれが含む画像要素と一致度が高い上記認識用画像データを上記第1のデータベースから検索する検索手段と、
    上記検索手段による検索結果に基づき上記第2のデータベースから上記メタデータを抽出するメタデータ抽出手段と
    を備えるサーバ装置と
    を有し、
    上記サーバ装置は、上記メタデータ抽出手段で抽出された上記メタデータを上記通信ネットワークを介して上記端末装置で閲覧可能なようにしたことを特徴とする情報検索システム。
  2. 請求項1に記載の情報検索システムにおいて、
    上記検索手段は、上記端末装置から送信された上記画像データの特徴データに基づき上記認識用画像データとの一致度のスコアを算出し、該スコアが所定値以上の上記認識用画像データを上記一致度の高い画像データとして検索し、
    上記動画像データをフレーム毎に分解した画像データそれぞれの所定以上の割合に対して共通に含まれる上記認識用画像データを上記一致度の高い画像データとして検索する
    ことを特徴とする情報検索システム。
  3. 請求項2に記載の情報検索システムにおいて、
    上記特徴データは、上記サーバ装置側で求めることを特徴とする情報検索システム。
  4. 請求項2に記載の情報検索システムにおいて、
    上記端末装置は、上記画像データ取得手段で取得した画像データおよび上記動画像データをフレーム毎に分解した画像データそれぞれの上記特徴データを予め求めて上記画像データとして上記送信手段で送信するようにしたことを特徴とする情報検索システム。
  5. 請求項1に記載の情報検索システムにおいて、
    上記検索手段は、上記画像データ取得手段で取得された上記画像データおよび上記動画像データをフレーム毎に分解した画像データのそれぞれをグレイスケール化したデータ、もしくは、上記画像データ取得手段で取得された上記画像データおよび上記動画像データをフレーム毎に分解した画像データそれぞれの色情報を含むデータに基づき上記検索を行うことを特徴とする情報検索システム。
  6. 請求項1に記載の情報検索システムにおいて、
    上記検索手段は、上記受信手段で受信された上記画像データおよび上記動画像データをフレーム毎に分解した画像データのそれぞれに含まれる複数の画像要素に対する検索結果をそれぞれ出力し、
    上記画像要素のうち一部の画像要素に対する検索結果に基づき上記第2のデータベースから上記メタデータを抽出し、抽出された該メタデータに基づき上記複数の画像要素のうち他の画像要素を上記第1のデータベースから検索するようにしたことを特徴とする情報検索システム。
  7. 請求項6に記載の情報検索システムにおいて、
    上記検索手段は、人物を認識する第1の認識手段と、文字を認識する第2の認識手段と、上記人物および上記文字以外の形状を認識する第3の認識手段とを有し、
    上記画像データおよび上記動画像データをフレーム毎に分解した画像データのそれぞれに対して上記第1、第2および第3の認識手段でそれぞれ認識処理を行い、上記画像データおよび上記動画像データをフレーム毎に分解した画像データのそれぞれに画像要素として含まれる上記人物、上記文字、ならびに、上記人物および文字以外の形状を上記認識用画像データからそれぞれ検索することを特徴とする情報検索システム。
  8. 請求項1に記載の情報検索システムにおいて、
    上記サーバ装置は、上記メタデータ抽出手段で抽出された上記メタデータの上記通信ネットワーク上のアドレスを上記端末装置に送信し、該メタデータを上記通信ネットワーク上で上記端末装置に向けて提示するようにしたことを特徴とする情報検索システム。
  9. 請求項1に記載の情報検索システムにおいて、
    上記サーバ装置は、上記メタデータ抽出手段で抽出された上記メタデータを上記通信ネットワークを介して上記端末装置に送信するようにしたことを特徴とする情報検索システム。
  10. 請求項1に記載の情報検索システムにおいて、
    上記メタデータを上記端末装置で上記閲覧する際に、該メタデータに基づき該メタデータに関連する上記通信ネットワーク上のアドレスに、上記端末装置からアクセス可能としたことを特徴とする情報検索システム。
  11. 請求項1に記載の情報検索システムにおいて、
    上記端末装置は、カメラ機能付き携帯電話端末であることを特徴とする情報検索システム。
  12. 端末装置が取得した画像データおよび動画像データに基づき、検索装置において情報検索を行う情報検索方法において、
    上記端末装置が、画像データおよび動画像データを取得する画像データ取得のステップと、
    上記端末装置が、上記画像データ取得のステップにより取得された上記画像データおよび上記動画像データを上記端末装置から通信ネットワークに向けて送信する送信のステップと、
    上記検索装置が、上記送信のステップにより送信された上記画像データおよび上記動画像データを上記ネットワークを介して受信する受信のステップと、
    上記検索装置が、テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、該情報を上記検索される可能性がある認識用画像データとして第1のデータベースに登録するとともに、該第1のデータベースに登録された上記認識用画像データに対応するメタデータを収集して該メタデータを第2のデータベースに登録する登録のステップと、
    上記検索装置が、上記受信のステップにより受信された上記画像データおよび上記動画像データをフレーム毎に分解した画像データの特徴の抽出を行い、上記第1のデータベースに登録された上記認識用画像データの特徴の抽出を行い、上記画像データおよび上記動画像データをフレーム毎に分解した画像データそれぞれの特徴と上記認識用画像データの特徴とを比較した比較結果に基づき、検索される可能性がある認識用画像データが登録される上記第1のデータベースから、該画像データが含む画像要素と一致度が高い上記認識用画像データを検索する検索のステップと、
    上記検索装置が、上記検索のステップによる検索結果に基づき、上記第1のデータベースに登録された上記認識用画像データに対応するメタデータが登録される第2のデータベースから上記メタデータを抽出するメタデータ抽出のステップと
    を有し、
    上記検索装置によって上記メタデータ抽出のステップで抽出された上記メタデータを上記通信ネットワークを介して上記端末装置で閲覧可能なようにしたことを特徴とする情報検索方法。
  13. 画像データに基づき情報検索を行う情報検索装置において、
    検索される可能性がある認識用画像データが登録される第1のデータベースと、
    上記第1のデータベースに登録された上記認識用画像データに対応するメタデータが登録される第2のデータベースと、
    テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、該情報を上記検索される可能性がある認識用画像データとして上記第1のデータベースに登録するとともに、上記第1のデータベースに登録された上記認識用画像データに対応するメタデータを収集して該メタデータを上記第2のデータベースに登録する登録部と、
    端末装置から送信された画像データおよび動画像データを通信ネットワークを介して受信する受信手段と、
    上記受信手段で受信された上記画像データおよび上記動画像データをフレーム毎に分解した画像データそれぞれの特徴の抽出を行う特徴抽出部と、
    上記第1のデータベースに登録された上記認識用画像データの特徴の抽出を行い、上記画像データおよび上記動画像データをフレーム毎に分解した画像データの特徴と上記認識用画像データの特徴とを比較する特徴比較部と、
    上記特徴比較部の比較結果に基づき、該画像データおよび上記動画像データをフレーム毎に分解した画像データのそれぞれが含む画像要素と一致度が高い上記認識用画像データを上記第1のデータベースから検索する検索手段と、
    上記検索手段による検索結果に基づき上記第2のデータベースから上記メタデータを抽出するメタデータ抽出手段と
    を有し、
    上記メタデータ抽出手段で抽出された上記メタデータを上記通信ネットワークを介して上記端末装置で閲覧可能なようにしたことを特徴とする情報検索装置。
  14. 画像データに基づき検索装置において情報検索を行う情報検索方法において、
    上記検索装置が、テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、該情報を上記検索される可能性がある認識用画像データとして第1のデータベースに登録するとともに、該第1のデータベースに登録された上記認識用画像データに対応するメタデータを収集して該メタデータを第2のデータベースに登録する登録のステップと、
    上記検索装置が、端末装置から送信された画像データおよび動画像データを通信ネットワークを介して受信する受信のステップと、
    上記検索装置が、上記受信のステップにより受信された上記画像データおよび上記動画像データをフレーム毎に分解した画像データの特徴の抽出を行い、上記第1のデータベースに登録された上記認識用画像データの特徴の抽出を行い、上記画像データおよび上記動画像データをフレーム毎に分解した画像データの特徴と上記認識用画像データの特徴とを比較した比較結果に基づき、検索される可能性がある認識用画像データが登録される第1のデータベースから、上記画像データおよび上記動画像データをフレーム毎に分解した画像データが含む画像要素と一致度が高い上記認識用画像データを検索する検索のステップと、
    上記検索装置が、上記検索のステップによる検索結果に基づき、上記第1のデータベースに登録された上記認識用画像データのメタデータが登録される第2のデータベースから上記メタデータを抽出するメタデータ抽出のステップと
    を有し、
    上記検索装置が、上記メタデータ抽出のステップにより抽出された上記メタデータを上記通信ネットワークを介して上記端末装置で閲覧可能なようにしたことを特徴とする情報検索方法。
  15. 画像データに基づき情報検索を行う情報検索方法をコンピュータ装置に実行させる情報検索プログラムにおいて、
    上記情報検索方法は、
    上記検索装置が、テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、該情報を上記検索される可能性がある認識用画像データとして第1のデータベースに登録するとともに、該第1のデータベースに登録された上記認識用画像データに対応するメタデータを収集して該メタデータを第2のデータベースに登録する登録のステップと、
    上記検索装置が、端末装置から送信された画像データおよび動画像データを通信ネットワークを介して受信する受信のステップと、
    上記検索装置が、上記受信のステップにより受信された上記画像データおよび上記動画像データをフレーム毎に分解した画像データの特徴の抽出を行い、上記第1のデータベースに登録された上記認識用画像データの特徴の抽出を行い、上記画像データおよび上記動画像データをフレーム毎に分解した画像データの特徴と上記認識用画像データの特徴とを比較した比較結果に基づき、検索される可能性がある認識用画像データが登録される第1のデータベースから、上記画像データおよび上記動画像データをフレーム毎に分解した画像データが含む画像要素と一致度が高い上記認識用画像データを検索する検索のステップと、
    上記検索装置が、上記検索のステップによる検索結果に基づき、上記第1のデータベースに登録された上記認識用画像データのメタデータが登録される第2のデータベースから上記メタデータを抽出するメタデータ抽出のステップと
    を有し、
    上記検索装置が、上記メタデータ抽出のステップにより抽出された上記メタデータを上記通信ネットワークを介して上記端末装置で閲覧可能なようにしたことを特徴とする情報検索プログラム。
  16. 画像データから特定の形状を認識する画像認識装置において、
    検索される可能性がある認識用画像データが登録される第1のデータベースと、
    上記第1のデータベースに登録された上記認識用画像データのメタデータが登録される第2のデータベースと、
    テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、該情報を上記検索される可能性がある認識用画像データとして上記第1のデータベースに登録するとともに、上記第1のデータベースに登録された上記認識用画像データに対応するメタデータを収集して該メタデータを上記第2のデータベースに登録する登録部と、
    入力された画像データおよび入力された動画像データをフレーム毎に分解した画像データの特徴の抽出を行う特徴抽出部と、
    上記第1のデータベースに登録された上記認識用画像データの特徴の抽出を行い、上記画像データおよび上記動画像データをフレーム毎に分解した画像データの特徴と上記認識用画像データの特徴とを比較する特徴比較部と、
    上記特徴比較部の比較結果に基づき、上記画像データおよび上記動画像データをフレーム毎に分解した画像データが含む画像要素と一致度が高い上記認識用画像データを上記第1のデータベースから検索する検索手段と、
    上記検索手段による検索結果に基づき上記第2のデータベースから上記メタデータを抽出するメタデータ抽出手段と
    を有することを特徴とする画像認識装置。
  17. 請求項16に記載の画像認識装置において、
    上記検索手段は、上記入力された画像データの特徴データに基づき上記認識用画像データとの一致度のスコアを算出し、該スコアが所定値以上の上記認識用画像データを上記一致度の高い画像データとして検索し、
    上記動画像データをフレーム毎に分解した画像データそれぞれの所定以上の割合に対して共通に含まれる上記認識用画像データを上記動画像データに対する検索結果とする
    ことを特徴とする画像認識装置。
  18. 請求項16に記載の画像認識装置において、
    上記検索手段は、上記入力された画像データおよび上記動画像データをフレーム毎に分解した画像データのそれぞれをグレイスケール化したデータ、もしくは、上記入力された上記画像データおよび上記動画像データをフレーム毎に分解した画像データそれぞれの色情報を含むデータに基づき上記検索を行うことを特徴とする画像認識装置。
  19. 請求項16に記載の画像認識装置において、
    上記検索手段は、上記画像データおよび上記動画像データをフレーム毎に分解した画像データのそれぞれに含まれる複数の画像要素に対する検索結果をそれぞれ出力し、
    上記画像要素のうち一部の画像要素に対する検索結果に基づき上記第2のデータベースから上記メタデータを抽出し、抽出された該メタデータに基づき上記複数の画像要素のうち他の画像要素を上記第1のデータベースから検索するようにした
    ことを特徴とする画像認識装置。
  20. 請求項19に記載の画像認識装置において、
    上記検索手段は、人物を認識する第1の認識手段と、文字を認識する第2の認識手段と、上記人物および上記文字以外の形状を認識する第3の認識手段とを有し、
    上記画像データおよび上記動画像データをフレーム毎に分解した画像データのそれぞれに対して上記第1、第2および第3の認識手段でそれぞれ認識処理を行い、上記画像データおよび上記動画像データをフレーム毎に分解した画像データのそれぞれに画像要素として含まれる上記人物、上記文字、ならびに、上記人物および文字以外の形状を上記認識用画像データからそれぞれ検索することを特徴とする画像認識装置。
  21. 請求項19に記載の画像認識装置において、
    上記画像データおよび上記動画像データをフレーム毎に分解した画像データのそれぞれに含まれる上記複数の画像要素のうち一部の画像要素に対する検索結果に基づき上記第2のデータベースから上記メタデータを抽出し、抽出された該メタデータに基づき上記複数の画像要素のうち他の画像要素を上記第1のデータベースから検索するようにしたことを特徴とする画像認識装置。
  22. 画像データから特定の形状を認識する画像認識方法において、
    検索装置が、テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、該情報を上記検索される可能性がある認識用画像データとして第1のデータベースに登録するとともに、該第1のデータベースに登録された上記認識用画像データに対応するメタデータを収集して該メタデータを第2のデータベースに登録する登録のステップと、
    検索装置が、入力された画像データおよび動画像データをフレーム毎に分解した画像データの特徴の抽出を行い、上記第1のデータベースに登録された上記認識用画像データの特徴の抽出を行い、上記画像データおよび上記動画像データをフレーム毎に分解した画像データの特徴と上記認識用画像データの特徴とを比較した比較結果に基づき、検索される可能性がある認識用画像データが登録される第1のデータベースから、上記画像データおよび上記動画像データをフレーム毎に分解した画像データが含む画像要素と一致度が高い上記認識用画像データを検索する検索のステップと、
    上記検索装置が、上記検索のステップによる検索結果に基づき、上記第1のデータベースに登録された上記認識用画像データのメタデータが登録される第2のデータベースから上記メタデータを抽出するメタデータ抽出のステップと
    を有することを特徴とする画像認識方法。
  23. 画像データから特定の形状を認識する画像認識方法をコンピュータ装置に実行させる画像認識プログラムにおいて、
    上記画像認識方法は、
    検索装置が、テレビジョン放送において放送された情報およびウェブサイトに掲載された情報を収集し、該情報を上記検索される可能性がある認識用画像データとして第1のデータベースに登録するとともに、該第1のデータベースに登録された上記認識用画像データに対応するメタデータを収集して該メタデータを第2のデータベースに登録する登録のステップと、
    検索装置が、入力された画像データおよび動画像データをフレーム毎に分解した画像データの特徴の抽出を行い、上記第1のデータベースに登録された上記認識用画像データの特徴の抽出を行い、上記画像データおよび上記動画像データをフレーム毎に分解した画像データの特徴と上記認識用画像データの特徴とを比較した比較結果に基づき、検索される可能性がある認識用画像データが登録される第1のデータベースから、上記画像データが含む画像要素と一致度が高い上記認識用画像データを検索する検索のステップと、
    上記検索装置が、上記検索のステップによる検索結果に基づき、上記第1のデータベースに登録された上記認識用画像データのメタデータが登録される第2のデータベースから上記メタデータを抽出するメタデータ抽出のステップと
    を有することを特徴とする画像認識プログラム。
JP2004020852A 2004-01-29 2004-01-29 情報検索システム、情報検索方法、情報検索装置、情報検索プログラム、画像認識装置、画像認識方法および画像認識プログラム、ならびに、販売システム Expired - Lifetime JP4413633B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2004020852A JP4413633B2 (ja) 2004-01-29 2004-01-29 情報検索システム、情報検索方法、情報検索装置、情報検索プログラム、画像認識装置、画像認識方法および画像認識プログラム、ならびに、販売システム
CNB2005800034647A CN100465957C (zh) 2004-01-29 2005-01-27 信息检索装置以及信息检索方法
US10/597,168 US8458038B2 (en) 2004-01-29 2005-01-27 Information retrieving system, information retrieving method, information retrieving apparatus, information retrieving program, image recognizing apparatus image recognizing method image recognizing program and sales
PCT/JP2005/001561 WO2005073879A1 (ja) 2004-01-29 2005-01-27 情報検索システム、情報検索方法、情報検索装置,情報検索プログラム、画像認識装置、画像認識方法および画像認識プログラム、ならびに、販売システム
EP05709660A EP1710717A4 (en) 2004-01-29 2005-01-27 INFORMATION SEARCHING SYSTEM, INFORMATION SEARCHING METHOD, INFORMATION SEARCHING DEVICE, INFORMATION SEARCHING PROGRAM, IMAGE RECOGNIZING DEVICE, IMAGE RECOVERING METHOD, IMAGE RECOGNIZING PROGRAM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004020852A JP4413633B2 (ja) 2004-01-29 2004-01-29 情報検索システム、情報検索方法、情報検索装置、情報検索プログラム、画像認識装置、画像認識方法および画像認識プログラム、ならびに、販売システム

Publications (2)

Publication Number Publication Date
JP2005215922A JP2005215922A (ja) 2005-08-11
JP4413633B2 true JP4413633B2 (ja) 2010-02-10

Family

ID=34823767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004020852A Expired - Lifetime JP4413633B2 (ja) 2004-01-29 2004-01-29 情報検索システム、情報検索方法、情報検索装置、情報検索プログラム、画像認識装置、画像認識方法および画像認識プログラム、ならびに、販売システム

Country Status (5)

Country Link
US (1) US8458038B2 (ja)
EP (1) EP1710717A4 (ja)
JP (1) JP4413633B2 (ja)
CN (1) CN100465957C (ja)
WO (1) WO2005073879A1 (ja)

Families Citing this family (195)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8224078B2 (en) 2000-11-06 2012-07-17 Nant Holdings Ip, Llc Image capture and identification system and process
US9310892B2 (en) 2000-11-06 2016-04-12 Nant Holdings Ip, Llc Object information derived from object images
US7680324B2 (en) 2000-11-06 2010-03-16 Evryx Technologies, Inc. Use of image-derived information as search criteria for internet and other search engines
US7565008B2 (en) 2000-11-06 2009-07-21 Evryx Technologies, Inc. Data capture and identification system and process
US7899243B2 (en) 2000-11-06 2011-03-01 Evryx Technologies, Inc. Image capture and identification system and process
US20060276174A1 (en) * 2005-04-29 2006-12-07 Eyal Katz Method and an apparatus for provisioning content data
US8732025B2 (en) * 2005-05-09 2014-05-20 Google Inc. System and method for enabling image recognition and searching of remote content on display
JP2007048212A (ja) * 2005-08-12 2007-02-22 Dainippon Printing Co Ltd 情報提供システム及び情報提供装置
US20070149222A1 (en) * 2005-12-27 2007-06-28 Berislav Hodko Methods, application server, and terminal for directive person identification and communication
EP1974544A2 (en) * 2005-12-29 2008-10-01 United Video Properties, Inc. Systems and methods for commerce in media program related merchandise
US20070156521A1 (en) 2005-12-29 2007-07-05 United Video Properties, Inc. Systems and methods for commerce in media program related merchandise
FI20060028L (fi) * 2006-01-13 2007-07-14 Teknillinen Korkeakoulu Tulostettuun kuvaan liittyvä metatieto
US8208764B2 (en) * 2006-01-21 2012-06-26 Elizabeth Guckenberger Photo automatic linking system and method for accessing, linking, and visualizing “key-face” and/or multiple similar facial images along with associated electronic data via a facial image recognition search engine
JP4810420B2 (ja) 2006-02-24 2011-11-09 キヤノン株式会社 画像処理装置及び画像処理方法、サーバ及びその制御方法、プログラム並びに記憶媒体
JP4645498B2 (ja) * 2006-03-27 2011-03-09 ソニー株式会社 情報処理装置および方法、並びにプログラム
US7787697B2 (en) * 2006-06-09 2010-08-31 Sony Ericsson Mobile Communications Ab Identification of an object in media and of related media objects
JP2008234623A (ja) * 2007-02-19 2008-10-02 Seiko Epson Corp カテゴリー識別装置、カテゴリー識別方法、及び、プログラム
EP1959364A3 (en) * 2007-02-19 2009-06-03 Seiko Epson Corporation Category classification apparatus, category classification method, and storage medium storing a program
EP1965344B1 (en) 2007-02-27 2017-06-28 Accenture Global Services Limited Remote object recognition
JP4337892B2 (ja) 2007-03-09 2009-09-30 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
US9075808B2 (en) * 2007-03-29 2015-07-07 Sony Corporation Digital photograph content information service
US7831141B2 (en) 2007-03-29 2010-11-09 Sony Ericsson Mobile Communications Ab Mobile device with integrated photograph management system
US20080263040A1 (en) * 2007-04-02 2008-10-23 Nikhilesh Talreja System and method for making a face call
KR101364044B1 (ko) * 2007-04-13 2014-02-17 삼성전자주식회사 이동통신 단말기 및 그의 호에 따른 영상 표시 방법
US8234261B2 (en) * 2007-07-17 2012-07-31 Ebay Inc. Digital content hub
JP4814849B2 (ja) 2007-08-10 2011-11-16 富士通株式会社 フレームの特定方法
JP5198838B2 (ja) * 2007-12-04 2013-05-15 楽天株式会社 情報提供プログラム、情報提供装置、及び情報提供方法
US8176144B2 (en) * 2007-12-06 2012-05-08 Eastman Kodak Company Pseudo real time indexing of digital media files
US9495386B2 (en) 2008-03-05 2016-11-15 Ebay Inc. Identification of items depicted in images
KR20100121690A (ko) * 2008-03-05 2010-11-18 이베이 인크. 이미지 인식 서비스 방법, 시스템 및 컴퓨터 판독가능한 매체
FR2928803B1 (fr) * 2008-03-14 2012-03-30 Alcatel Lucent Fourniture de services a partir d'objets filmes ou photographies depuis un terminal mobile.
JP5067216B2 (ja) * 2008-03-17 2012-11-07 大日本印刷株式会社 情報提供システム、問合せサーバ装置、情報提供方法、コンピュータプログラム
US20090237546A1 (en) * 2008-03-24 2009-09-24 Sony Ericsson Mobile Communications Ab Mobile Device with Image Recognition Processing Capability
CN101635763A (zh) * 2008-07-23 2010-01-27 深圳富泰宏精密工业有限公司 图片分类系统及方法
JP5578077B2 (ja) 2008-08-08 2014-08-27 株式会社ニコン 検索支援システム、検索支援方法及び検索支援プログラム
US8520979B2 (en) * 2008-08-19 2013-08-27 Digimarc Corporation Methods and systems for content processing
US8873829B1 (en) 2008-09-26 2014-10-28 Amazon Technologies, Inc. Method and system for capturing and utilizing item attributes
KR101164195B1 (ko) * 2008-12-01 2012-07-11 한국전자통신연구원 영상 데이터 획득을 통해 사용자 단말을 판별하는 디지털 컨텐츠 제공 장치 및 사용자 단말 판별 방법
US8825660B2 (en) 2009-03-17 2014-09-02 Ebay Inc. Image-based indexing in a network-based marketplace
JP2010224943A (ja) * 2009-03-24 2010-10-07 Nec Corp 電子投票装置およびプログラム並びに電子投票方法
US9195898B2 (en) * 2009-04-14 2015-11-24 Qualcomm Incorporated Systems and methods for image recognition using mobile devices
JP5347673B2 (ja) * 2009-04-14 2013-11-20 ソニー株式会社 情報処理装置、情報処理方法及びプログラム
KR20110005174A (ko) * 2009-07-09 2011-01-17 엘지전자 주식회사 와인 정보를 설명해주는 이동 단말기 및 그 제어 방법
JP2013501976A (ja) * 2009-08-07 2013-01-17 グーグル インコーポレイテッド 視覚クエリの複数の領域についての検索結果を提示するためのユーザインターフェイス
US9135277B2 (en) 2009-08-07 2015-09-15 Google Inc. Architecture for responding to a visual query
KR101468231B1 (ko) * 2009-09-11 2014-12-04 삼성전자주식회사 라벨 검색 방법 및 장치
KR100976138B1 (ko) * 2009-09-16 2010-08-16 (주)올라웍스 건축물 이미지의 계층적 매칭 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
US8239282B2 (en) * 2009-09-28 2012-08-07 Todd Tuflija Purchaser centered, product driven world wide web searching and e-commerce system
EP2426633A4 (en) * 2009-09-30 2015-01-21 Rakuten Inc SYSTEM FOR RECOMMENDING AN ARTICLE NOT PRESENT IN AN IMAGE
WO2011041903A1 (en) 2009-10-07 2011-04-14 Telewatch Inc. Video analytics with pre-processing at the source end
WO2011041904A1 (en) 2009-10-07 2011-04-14 Telewatch Inc. Video analytics method and system
JP2011095906A (ja) * 2009-10-28 2011-05-12 Sony Corp 情報処理装置、情報処理方法、及びプログラム
CN102063436A (zh) * 2009-11-18 2011-05-18 腾讯科技(深圳)有限公司 一种利用终端获取图像实现商品信息搜索的系统及方法
US9164577B2 (en) 2009-12-22 2015-10-20 Ebay Inc. Augmented reality system, method, and apparatus for displaying an item image in a contextual environment
EP3748567A1 (en) * 2009-12-24 2020-12-09 Nikon Corporation Retrieval support system, retrieval support method, and retrieval support program
US8970500B2 (en) * 2010-02-26 2015-03-03 Blackberry Limited System and method for extracting content from a data item to separately display portions of such data
JP2011203823A (ja) 2010-03-24 2011-10-13 Sony Corp 画像処理装置、画像処理方法及びプログラム
US8554731B2 (en) * 2010-03-31 2013-10-08 Microsoft Corporation Creating and propagating annotated information
US20110246330A1 (en) * 2010-04-01 2011-10-06 Anup Tikku System and method for searching content
ES2369433B1 (es) * 2010-05-07 2012-10-08 Universidad De Valladolid Sistema y metodo de localizacion e identificacion de setas.
US9143739B2 (en) 2010-05-07 2015-09-22 Iwatchlife, Inc. Video analytics with burst-like transmission of video data
US8645554B2 (en) * 2010-05-27 2014-02-04 Nokia Corporation Method and apparatus for identifying network functions based on user data
US8464297B2 (en) * 2010-06-23 2013-06-11 Echostar Broadcasting Corporation Apparatus, systems and methods for identifying a video of interest using a portable electronic device
US9292565B2 (en) 2010-06-30 2016-03-22 International Business Machines Corporation Template-based recognition of food product information
KR20120005324A (ko) * 2010-07-08 2012-01-16 엘지전자 주식회사 이동 단말기의 전자기기 제어 장치 및 그 방법
CA2748059A1 (en) 2010-08-04 2012-02-04 Iwatchlife Inc. Method and system for initiating communication via a communication network
US8780162B2 (en) 2010-08-04 2014-07-15 Iwatchlife Inc. Method and system for locating an individual
US8860771B2 (en) 2010-08-04 2014-10-14 Iwatchlife, Inc. Method and system for making video calls
US9043232B1 (en) * 2010-08-09 2015-05-26 Amazon Technologies, Inc. Associating item images with item catalog data
WO2012020927A1 (ko) * 2010-08-09 2012-02-16 에스케이텔레콤 주식회사 통합 영상 검색 시스템 및 그 서비스 방법
US8532372B2 (en) 2010-08-19 2013-09-10 Thomas Youngman System and method for matching color swatches
EP2498217A4 (en) * 2010-09-14 2014-05-21 Rakuten Inc PURCHASING SUPPORT SERVER, PURCHASING SUPPORT SYSTEM, PURCHASING SUPPORT PROCESS, PURCHASING SUPPORT PROGRAM AND COMPUTER READABLE RECORDING MEDIUM FOR RECORDING THE PROGRAM
US20120083294A1 (en) * 2010-09-30 2012-04-05 Apple Inc. Integrated image detection and contextual commands
US8645359B2 (en) 2010-09-30 2014-02-04 Microsoft Corporation Providing associations between objects and individuals associated with relevant media items
CN101951552A (zh) * 2010-10-12 2011-01-19 北京车灵通科技发展有限公司 一种热点位置上传及共享的方法
US10127606B2 (en) 2010-10-13 2018-11-13 Ebay Inc. Augmented reality system and method for visualizing an item
US8913171B2 (en) * 2010-11-17 2014-12-16 Verizon Patent And Licensing Inc. Methods and systems for dynamically presenting enhanced content during a presentation of a media content instance
US10108836B2 (en) * 2010-11-19 2018-10-23 Leigh M. Rothschild System and method of providing product information using product images
KR20120063886A (ko) * 2010-12-08 2012-06-18 삼성전자주식회사 영상처리장치, 사용자 단말장치 및 그 영상처리방법, 제어방법
CN102591875A (zh) * 2011-01-13 2012-07-18 腾讯科技(深圳)有限公司 一种数据检索的方法和装置
JP5159989B2 (ja) * 2011-01-25 2013-03-13 パナソニック株式会社 コンテンツ通知システムおよび方法ならびにユーザ端末装置
US20120207356A1 (en) * 2011-02-10 2012-08-16 Murphy William A Targeted content acquisition using image analysis
CN102694826B (zh) * 2011-03-22 2018-09-07 百度在线网络技术(北京)有限公司 一种用于获取与现实场景相关的共享对象的设备和方法
US8401343B2 (en) * 2011-03-27 2013-03-19 Edwin Braun System and method for defining an augmented reality character in computer generated virtual reality using coded stickers
US8810598B2 (en) 2011-04-08 2014-08-19 Nant Holdings Ip, Llc Interference based augmented reality hosting platforms
GB2506028B (en) * 2011-04-12 2018-11-28 Nat Univ Singapore In-video product annotation with web information mining
US8634654B2 (en) 2011-04-15 2014-01-21 Yahoo! Inc. Logo or image recognition
US9547938B2 (en) 2011-05-27 2017-01-17 A9.Com, Inc. Augmenting a live view
EP2533141A1 (en) * 2011-06-07 2012-12-12 Amadeus S.A.S. A personal information display system and associated method
US8935259B2 (en) * 2011-06-20 2015-01-13 Google Inc Text suggestions for images
WO2011150894A2 (zh) * 2011-06-28 2011-12-08 华为终端有限公司 控制用户设备的方法和装置
US9179278B2 (en) * 2011-09-01 2015-11-03 Qualcomm Incorporated Systems and methods involving augmented menu using mobile device
US9449342B2 (en) 2011-10-27 2016-09-20 Ebay Inc. System and method for visualization of items in an environment using augmented reality
GB2495978A (en) * 2011-10-28 2013-05-01 Maurizio Pilu Smartphone application
US9251170B2 (en) * 2011-11-17 2016-02-02 Verizon Patent And Licensing Inc. Method and system for item selection based on characteristic matching
US9805385B2 (en) 2011-11-21 2017-10-31 Nant Holdings Ip, Llc Subscription bill service, systems and methods
JP2015501984A (ja) 2011-11-21 2015-01-19 ナント ホールディングス アイピー,エルエルシー 加入請求書サービス、システムおよび方法
US8965971B2 (en) * 2011-12-30 2015-02-24 Verisign, Inc. Image, audio, and metadata inputs for name suggestion
US9063936B2 (en) 2011-12-30 2015-06-23 Verisign, Inc. Image, audio, and metadata inputs for keyword resource navigation links
CN103186649A (zh) * 2011-12-31 2013-07-03 由田信息技术(上海)有限公司 影像分析之云端处理系统
US10650442B2 (en) 2012-01-13 2020-05-12 Amro SHIHADAH Systems and methods for presentation and analysis of media content
US20130185157A1 (en) * 2012-01-13 2013-07-18 Ahmad SHIHADAH Systems and methods for presentation and analysis of media content
JP2013168132A (ja) * 2012-01-17 2013-08-29 Toshiba Corp 商品検索装置、方法、及びプログラム
JP2013164773A (ja) * 2012-02-13 2013-08-22 Nec Casio Mobile Communications Ltd 情報提供システム、通信装置、情報提供方法およびプログラム
JP5946315B2 (ja) * 2012-04-18 2016-07-06 説男 木村 画像検索システム
CN102722528B (zh) * 2012-05-17 2016-03-30 上海冠勇信息科技有限公司 基于移动设备的实时海量图像检索方法
CN103514211A (zh) * 2012-06-27 2014-01-15 腾讯科技(深圳)有限公司 获取信息的方法和装置
JP6056219B2 (ja) 2012-06-29 2017-01-11 株式会社リコー 検索装置および検索方法、ならびに、プログラム
US10846766B2 (en) 2012-06-29 2020-11-24 Ebay Inc. Contextual menus based on image recognition
US20140019303A1 (en) * 2012-07-13 2014-01-16 Wal-Mart Stores, Inc. Comparison of Product Information
CA2822217A1 (en) 2012-08-02 2014-02-02 Iwatchlife Inc. Method and system for anonymous video analytics processing
CN104871179A (zh) * 2012-10-16 2015-08-26 维迪诺蒂有限公司 用于图像捕捉和便于注解的方法和系统
JP6005482B2 (ja) * 2012-11-05 2016-10-12 株式会社東芝 サーバ装置、解析方法及びプログラム
JP2015513378A (ja) * 2012-11-21 2015-05-11 ナント ホールディングス アイピー,エルエルシー 加入請求書サービス、システムおよび方法
JP6048093B2 (ja) * 2012-11-28 2016-12-21 ブラザー工業株式会社 制御装置およびコンピュータプログラム
US20140152847A1 (en) * 2012-12-03 2014-06-05 Google Inc. Product comparisons from in-store image and video captures
US10275825B2 (en) * 2012-12-04 2019-04-30 Paypal, Inc. Augmented reality in-store product detection system
KR102090269B1 (ko) * 2012-12-14 2020-03-17 삼성전자주식회사 정보 검색 방법, 그와 같은 기능을 갖는 디바이스 및 기록 매체
US9848276B2 (en) 2013-03-11 2017-12-19 Rovi Guides, Inc. Systems and methods for auto-configuring a user equipment device with content consumption material
JP2014238742A (ja) * 2013-06-07 2014-12-18 株式会社リコー 情報処理システムおよび情報処理方法
CN104143104A (zh) * 2013-07-10 2014-11-12 腾讯科技(深圳)有限公司 一种图像识别方法、装置、终端设备及服务器
US9195896B2 (en) 2013-07-10 2015-11-24 Tencent Technology (Shenzhen) Company Limited Methods and systems for image recognition
CN103369049B (zh) * 2013-07-22 2016-05-04 王雁林 移动终端和服务器交互方法及其系统
US9910865B2 (en) 2013-08-05 2018-03-06 Nvidia Corporation Method for capturing the moment of the photo capture
JP6224947B2 (ja) * 2013-08-05 2017-11-01 株式会社 ミックウェア 情報システム、情報処理方法、およびプログラム
JP6224946B2 (ja) * 2013-08-05 2017-11-01 株式会社 ミックウェア サーバ装置、情報処理方法、およびプログラム
WO2015025320A1 (en) * 2013-08-19 2015-02-26 Shop Cloud Ltd. System and methods for providing product information to a querying shopper
US20150085146A1 (en) * 2013-09-23 2015-03-26 Nvidia Corporation Method and system for storing contact information in an image using a mobile device
CN103500337B (zh) * 2013-09-30 2018-10-09 上海合合信息科技发展有限公司 用于智能无线通信终端的识别四边形边框的方法及装置
US9582516B2 (en) 2013-10-17 2017-02-28 Nant Holdings Ip, Llc Wide area augmented reality location-based services
KR20150060338A (ko) * 2013-11-26 2015-06-03 삼성전자주식회사 전자장치 및 전자장치의 문자인식 방법
CN104754377A (zh) * 2013-12-27 2015-07-01 阿里巴巴集团控股有限公司 智能电视的数据处理方法、智能电视以及智能电视系统
JP6114706B2 (ja) * 2014-02-28 2017-04-12 富士フイルム株式会社 検索システム及び検索システムの制御方法
US9367858B2 (en) * 2014-04-16 2016-06-14 Symbol Technologies, Llc Method and apparatus for providing a purchase history
US10395292B1 (en) * 2014-04-30 2019-08-27 Wells Fargo Bank, N.A. Augmented reality electronic device using facial recognition functionality and displaying shopping reward at retail locations
US10726473B1 (en) * 2014-04-30 2020-07-28 Wells Fargo Bank, N.A. Augmented reality shopping rewards
US10839409B1 (en) 2014-04-30 2020-11-17 Wells Fargo Bank, N.A. Augmented reality store and services orientation gamification
CN104035971B (zh) * 2014-05-21 2018-03-27 华为技术有限公司 一种获取商品信息的方法和装置
US10049477B1 (en) 2014-06-27 2018-08-14 Google Llc Computer-assisted text and visual styling for images
US11151630B2 (en) 2014-07-07 2021-10-19 Verizon Media Inc. On-line product related recommendations
US10185976B2 (en) 2014-07-23 2019-01-22 Target Brands Inc. Shopping systems, user interfaces and methods
CN104484671B (zh) * 2014-11-06 2017-10-10 吉林大学 应用于移动平台的目标检索系统
US9652838B1 (en) * 2014-12-23 2017-05-16 A9.Com, Inc. Object retrieval
US11120478B2 (en) 2015-01-12 2021-09-14 Ebay Inc. Joint-based item recognition
US20160217157A1 (en) * 2015-01-23 2016-07-28 Ebay Inc. Recognition of items depicted in images
CN104574156B (zh) * 2015-01-26 2018-03-23 网易有道信息技术(北京)有限公司 一种商品扩展信息匹配、获取方法及装置
US10185981B2 (en) * 2015-03-13 2019-01-22 GeoPRI, LLC Systems and methods for providing product information
US10217113B2 (en) 2015-03-13 2019-02-26 GeoPRI, LLC Authentication systems and methods
CN106157073A (zh) * 2015-04-03 2016-11-23 阿里巴巴集团控股有限公司 交互沟通方法及设备
CN106530194B (zh) * 2015-09-09 2020-02-07 阿里巴巴集团控股有限公司 一种疑似侵权产品图片的检测方法及装置
JP6038256B2 (ja) * 2015-10-05 2016-12-07 オリンパス株式会社 画像検索システムおよび画像検索方法
CN105468142A (zh) * 2015-11-16 2016-04-06 上海璟世数字科技有限公司 基于增强现实技术的互动方法、系统和终端
US20170186076A1 (en) * 2015-12-28 2017-06-29 Mastercard International Incorporated Product tracking and management using image recognition
CN105701431A (zh) * 2016-01-12 2016-06-22 东西大学校产学协力团 拍摄qr码时适用图像处理的展览信息提供系统及其方法
CN105723368A (zh) * 2016-01-26 2016-06-29 盛玉伟 一种房产网图片管理方法及系统
US11163899B2 (en) * 2016-02-15 2021-11-02 Ricoh Company, Ltd. Information processing system and information processing method
CN109643527A (zh) * 2016-04-01 2019-04-16 易客斯特解决方案公司 用于零售环境仿真的虚拟现实平台
JP6857983B2 (ja) * 2016-08-25 2021-04-14 Jcc株式会社 メタデータ生成システム
US10181039B1 (en) * 2016-09-27 2019-01-15 Symantec Corporation Systems and methods for providing computing security by classifying organizations
KR101831783B1 (ko) 2016-10-27 2018-02-27 주식회사 처음마음 출력 인쇄물에 포함된 이미지 및 텍스트 인식 장치 및 그 방법
JP2018073205A (ja) * 2016-10-31 2018-05-10 株式会社iine Card Japan 情報処理装置、情報処理システム、情報処理方法及びプログラム
JP6148785B1 (ja) 2016-12-26 2017-06-14 株式会社Cygames 情報処理システム、情報処理装置及びプログラム
US11068967B2 (en) * 2017-04-19 2021-07-20 Mastercard International Incorporated Systems and methods for dynamic generation of customized product listings
KR102368847B1 (ko) 2017-04-28 2022-03-02 삼성전자주식회사 객체에 대응하는 콘텐트를 출력하기 위한 방법 및 그 전자 장치
CN109032810A (zh) * 2017-06-09 2018-12-18 阿里巴巴集团控股有限公司 业务过程的启动方法和装置
CN108256100A (zh) * 2018-01-31 2018-07-06 维沃移动通信有限公司 一种信息搜索方法、移动终端及云服务器
JP7091684B2 (ja) * 2018-02-07 2022-06-28 大日本印刷株式会社 寄付申請端末、端末プログラム、寄付申請支援システム及び処理プログラム
US10453263B2 (en) 2018-02-27 2019-10-22 Verizon Patent And Licensing Inc. Methods and systems for displaying augmented reality content associated with a media content instance
US11367124B2 (en) * 2019-10-25 2022-06-21 7-Eleven, Inc. Detecting and identifying misplaced items using a sensor array
US10943287B1 (en) * 2019-10-25 2021-03-09 7-Eleven, Inc. Topview item tracking using a sensor array
US11030756B2 (en) 2018-10-26 2021-06-08 7-Eleven, Inc. System and method for position tracking using edge computing
WO2020181066A1 (en) * 2019-03-06 2020-09-10 Trax Technology Solutions Pte Ltd. Methods and systems for monitoring products
US11568471B2 (en) * 2019-09-06 2023-01-31 OLX Global B.V. Systems and methods for listing an item
JP2022548880A (ja) * 2019-09-12 2022-11-22 フアン, ガブリエル ラミレス ユーザー体験を向上させるための対話型マルチメディア管理システム及びその方法
US11893759B2 (en) 2019-10-24 2024-02-06 7-Eleven, Inc. Homography error correction using a disparity mapping
US11113541B2 (en) 2019-10-25 2021-09-07 7-Eleven, Inc. Detection of object removal and replacement from a shelf
US11674792B2 (en) 2019-10-25 2023-06-13 7-Eleven, Inc. Sensor array with adjustable camera positions
US11023740B2 (en) 2019-10-25 2021-06-01 7-Eleven, Inc. System and method for providing machine-generated tickets to facilitate tracking
US11557124B2 (en) 2019-10-25 2023-01-17 7-Eleven, Inc. Homography error correction
US11887337B2 (en) 2019-10-25 2024-01-30 7-Eleven, Inc. Reconfigurable sensor array
JP7515581B2 (ja) * 2019-10-25 2024-07-12 セブン-イレブン インコーポレイテッド 画像追跡中のアクション検出
US11023741B1 (en) 2019-10-25 2021-06-01 7-Eleven, Inc. Draw wire encoder based homography
US11403852B2 (en) 2019-10-25 2022-08-02 7-Eleven, Inc. Object detection based on wrist-area region-of-interest
US11003918B1 (en) 2019-10-25 2021-05-11 7-Eleven, Inc. Event trigger based on region-of-interest near hand-shelf interaction
US11587243B2 (en) 2019-10-25 2023-02-21 7-Eleven, Inc. System and method for position tracking using edge computing
US11450011B2 (en) 2019-10-25 2022-09-20 7-Eleven, Inc. Adaptive item counting algorithm for weight sensor using sensitivity analysis of the weight sensor
US11501454B2 (en) 2019-10-25 2022-11-15 7-Eleven, Inc. Mapping wireless weight sensor array for item detection and identification
US11887372B2 (en) 2019-10-25 2024-01-30 7-Eleven, Inc. Image-based self-serve beverage detection and assignment
US11893757B2 (en) 2019-10-25 2024-02-06 7-Eleven, Inc. Self-serve beverage detection and assignment
US11551454B2 (en) 2019-10-25 2023-01-10 7-Eleven, Inc. Homography error correction using marker locations
JP7400445B2 (ja) * 2019-12-24 2023-12-19 ブラザー工業株式会社 印刷情報処理システム、印刷情報処理方法、及びサーバ
JP7490984B2 (ja) * 2020-03-03 2024-05-28 株式会社Jvcケンウッド サーバ、チャットシステム、広告設定方法及び広告設定プログラム
US11557182B2 (en) * 2020-10-13 2023-01-17 Trax Technology Solutions Pte Ltd. Regaining frictionless status of shoppers
AU2021104706A4 (en) * 2020-11-03 2021-09-30 Christopher Mooney A consumer product type source origin meta data identification and data processing system
CN114973505A (zh) * 2022-05-19 2022-08-30 杭州座头鲸科技有限公司 一种基于视觉的智能货架交付系统

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3780623B2 (ja) * 1997-05-16 2006-05-31 株式会社日立製作所 動画像の記述方法
JPH1145277A (ja) * 1997-07-29 1999-02-16 Sony Corp 情報検索装置及び情報検索システム
US6512919B2 (en) * 1998-12-14 2003-01-28 Fujitsu Limited Electronic shopping system utilizing a program downloadable wireless videophone
JP2000331006A (ja) * 1999-05-18 2000-11-30 Nippon Telegr & Teleph Corp <Ntt> 情報検索装置
AU4521201A (en) * 1999-12-10 2001-06-25 Jerry W. Lennon Customer image capture and use thereof in a retailing system
JP3954267B2 (ja) * 2000-03-09 2007-08-08 北川 高嗣 データ収集部
JP2001265801A (ja) * 2000-03-17 2001-09-28 Sony Corp 検索システムおよび検索方法、ならびに、入力装置および入力方法
JP2001357008A (ja) * 2000-06-14 2001-12-26 Mitsubishi Electric Corp コンテンツ検索配信装置およびコンテンツ検索配信方法
US20020048403A1 (en) * 2000-10-24 2002-04-25 Electronic Warfare Associates, Inc Mark recognition system and method for identification of one or more marks on an object
JP2002318744A (ja) * 2001-04-23 2002-10-31 Sony Corp 情報提供システム及び情報提供方法、携帯端末装置、局所サーバ装置、並びに記憶媒体
US6735329B2 (en) * 2001-05-18 2004-05-11 Leonard S. Schultz Methods and apparatus for image recognition and dictation
JP2003015980A (ja) 2001-07-04 2003-01-17 Kyodo Printing Co Ltd ロゴマーク検索システム及び方法
US20030164819A1 (en) * 2002-03-04 2003-09-04 Alex Waibel Portable object identification and translation system
JP2003345815A (ja) * 2002-05-28 2003-12-05 Jiishisu:Kk Url検索サーバ及びurl検索システム並びに画像加工サーバ及び画像加工システム
JP2004128909A (ja) * 2002-10-03 2004-04-22 Hitachi Ltd 携帯端末
US7734729B2 (en) * 2003-12-31 2010-06-08 Amazon Technologies, Inc. System and method for obtaining information relating to an item of commerce using a portable imaging device

Also Published As

Publication number Publication date
US20080279481A1 (en) 2008-11-13
EP1710717A1 (en) 2006-10-11
CN100465957C (zh) 2009-03-04
US8458038B2 (en) 2013-06-04
JP2005215922A (ja) 2005-08-11
WO2005073879A1 (ja) 2005-08-11
EP1710717A4 (en) 2007-03-28
CN1914611A (zh) 2007-02-14

Similar Documents

Publication Publication Date Title
JP4413633B2 (ja) 情報検索システム、情報検索方法、情報検索装置、情報検索プログラム、画像認識装置、画像認識方法および画像認識プログラム、ならびに、販売システム
US9066130B1 (en) Standardizing video content for use in generating an advertising overlay
US7761400B2 (en) Identifying events
US7428504B2 (en) Method and system for organizing and disseminating information on products featured in entertainment productions
JP5580811B2 (ja) ユーザ関心対象を評価する方法
US20110218864A1 (en) System and methods for searching based on a response to a plurality of both stimuli source types, and initiating stimuli types, without the need for a keyboard
US20070078832A1 (en) Method and system for using smart tags and a recommendation engine using smart tags
US20020026353A1 (en) System and method of providing purchase information to consumers relating to advertisements displaying the product
US20050216512A1 (en) Method of accessing a work of art, a product, or other tangible or intangible objects without knowing the title or name thereof using fractional sampling of the work of art or object
JP2001229285A (ja) 販売促進支援装置および方法、記録媒体
JP4020562B2 (ja) 情報管理装置及びリモートコントローラ
US10204371B2 (en) Method and system to conduct electronic commerce through motion pictures or life performance events
WO2014076442A1 (en) A self-service facility for content providers
JPWO2007021038A1 (ja) リスト比較表示方法、システム、装置、プログラム、記録媒体及び2次元コード化された比較表示用リスト
KR100854143B1 (ko) 동영상 사용자 제작 콘텐츠를 통한 광고방법
US20020060694A1 (en) Method and apparatus for sending an information request over a network
US20130247085A1 (en) Method for generating video markup data on the basis of video fingerprint information, and method and system for providing information using same
KR101108584B1 (ko) 멀티미디어 콘텐츠의 내용에 기반하는 광고 제공 시스템 및그 광고 제공 방법
KR100761956B1 (ko) 동영상 광고 관리 방법 및 시스템
JP2003216862A (ja) 情報配信方法および情報配信装置
US20030126154A1 (en) Information processing apparatus, information processing method, information processing program and information processing system
US20100318529A1 (en) Method of accessing a work of art, a product, or other tangible or intangible objects without knowing the title or name thereof using fractional sampling of the work of art or object
CN115834945A (zh) 信息流广告的展示方法、装置、电子设备及存储介质
KR20100092787A (ko) 키워드 광고 콘텐츠를 호출할 수 있는 상업적 태그 집합을 활용한 멀티미디어 콘텐츠 신디케이션 시스템 및 그 방법
Nikolopoulos et al. About Audio-Visual search

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060316

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090427

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090609

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090825

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090826

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091013

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091118

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4413633

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121127

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151127

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term