JP2020035086A - 情報処理システム、情報処理装置およびプログラム - Google Patents

情報処理システム、情報処理装置およびプログラム Download PDF

Info

Publication number
JP2020035086A
JP2020035086A JP2018159540A JP2018159540A JP2020035086A JP 2020035086 A JP2020035086 A JP 2020035086A JP 2018159540 A JP2018159540 A JP 2018159540A JP 2018159540 A JP2018159540 A JP 2018159540A JP 2020035086 A JP2020035086 A JP 2020035086A
Authority
JP
Japan
Prior art keywords
image
images
information processing
posted
specific image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018159540A
Other languages
English (en)
Inventor
ビネシュ サラス
Vignesh Sharath
ビネシュ サラス
スレシュ ムラリ
Murali Suresh
スレシュ ムラリ
晃 関根
Akira Sekine
晃 関根
内橋 真吾
Shingo Uchihashi
真吾 内橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2018159540A priority Critical patent/JP2020035086A/ja
Priority to CN201910173347.9A priority patent/CN110866148A/zh
Priority to US16/546,310 priority patent/US20200074218A1/en
Publication of JP2020035086A publication Critical patent/JP2020035086A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols

Abstract

【課題】複数の対象画像の中から好評となり得る画像を抽出することができる情報処理システム、情報処理装置及びプログラムを提供する。【解決手段】情報処理システムは、サーバ装置20において、複数の対象画像を受け付ける受付手段と、複数の対象画像の内容に関する内容情報を特定する内容特定手段と、インターネットメディアに掲載されている掲載画像の中から内容情報に基づく特定画像を選択する選択手段と、複数の対象画像の中から特定画像と類似する画像を抽出する抽出手段と、を備える。【選択図】図2

Description

本発明は、情報処理システム、情報処理装置およびプログラムに関する。
例えば特許文献1には、連続して撮像された複数の画像データのそれぞれに対して、画像データに含まれる被写体に基づいて評価値を算出し、複数の画像データの中からいずれかの画像データを選択する工程と選択された画像データを記憶手段に記憶する工程を有し、いずれかの画像データを選択する工程において、複数の画像データから、他の画像データよりも評価値が高い画像データを選択するものであって、複数の画像データのうち、先の撮像で得られた画像の評価値よりも、後の撮像で得られた画像の評価値のほうが高くても、それら評価値の差が所定値以下である場合には、先の撮像で得られた画像を選択することが記載されている。
特開2015−43603号公報
例えば動画を構成する画像などの複数の対象画像の中から好評となり得る画像を抽出しようとする場合、ユーザは、複数の対象画像を確認する必要があったり、どのような画像が好評となるかを判断したりする必要があった。
本発明は、複数の対象画像の中から好評となり得る画像を抽出することを目的とする。
請求項1に記載の発明は、ユーザから複数の対象画像を受け付ける受付手段と、前記複数の対象画像の内容に関する内容情報を特定する内容特定手段と、インターネットメディアに掲載されている掲載画像の中から前記内容情報に基づく特定画像を選択する選択手段と、前記複数の対象画像の中から前記特定画像と類似する画像を抽出する抽出手段と、を備える情報処理システムである。
請求項2に記載の発明は、前記複数の対象画像は、動画を構成する複数のフレーム画像であり、前記抽出手段は、前記複数のフレーム画像の中から前記特定画像と類似するフレーム画像を抽出する請求項1に記載の情報処理システムである。
請求項3に記載の発明は、前記内容特定手段は、前記動画の画像解析から前記内容情報を得る請求項2に記載の情報処理システムである。
請求項4に記載の発明は、前記内容特定手段は、前記ユーザから前記動画の前記内容情報を取得する請求項2に記載の情報処理システムである。
請求項5に記載の発明は、前記選択手段は、前記掲載画像の中から、前記内容特定手段が特定した前記内容情報を拡張した拡張情報に対応する特定画像を選択する請求項1乃至4のいずれか1項に記載の情報処理システムである。
請求項6に記載の発明は、前記選択手段は、前記掲載画像の中から、前記掲載画像の閲覧者による当該掲載画像に対する評価に基づいて前記特定画像を選択する請求項1に記載の情報処理システムである。
請求項7に記載の発明は、前記選択手段は、前記掲載画像の中から、予め定められた期間に集計された前記評価に基づいて前記特定画像を選択する請求項6に記載の情報処理システムである。
請求項8に記載の発明は、前記抽出手段は、前記特定画像の特徴点を有する画像を前記複数の対象画像の中から抽出する請求項1に記載の情報処理システムである。
請求項9に記載の発明は、前記抽出手段は、前記特徴点として前記特定画像における人のポーズを用いる請求項8に記載の情報処理システムである。
請求項10に記載の発明は、前記抽出手段は、前記特徴点として前記特定画像における人または物の構図を用いる請求項8に記載の情報処理システムである。
請求項11に記載の発明は、前記抽出手段は、前記特徴点として前記特定画像の色構成を用いる請求項8に記載の情報処理システムである。
請求項12に記載の発明は、前記抽出手段は、複数の前記特定画像の共通点を有する画像を前記複数の対象画像の中から抽出する請求項1に記載の情報処理システムである。
請求項13に記載の発明は、ユーザから複数の対象画像を受け付ける受付手段と、インターネットメディアに掲載されている掲載画像の閲覧者による評価情報に基づいて、前記複数の対象画像の中から少なくとも一の画像を抽出する抽出手段と、前記一の対象画像を前記価情報とともにユーザに提示する提示手段と、を備える情報処理装置である。
請求項14に記載の発明は、情報処理装置として機能するコンピュータに、ユーザから受け付けた複数の対象画像の内容に関する内容情報を特定する機能と、インターネットメディアに掲載されている掲載画像の中から前記内容情報に基づく特定画像を選択する機能と、前記複数の対象画像の中から前記特定画像と類似する画像を抽出する機能と、を実現させるプログラムである。
請求項15に記載の発明は、情報処理装置として機能するコンピュータに、ユーザから複数の対象画像を受け付ける機能と、インターネットメディアに掲載されている掲載画像の閲覧者による評価情報に基づいて、前記複数の対象画像の中から少なくとも一の画像を抽出する機能と、前記一の対象画像を前記価情報とともにユーザに提示する機能と、を実現させるプログラムである。
請求項1、13、14および15の発明によれば、複数の対象画像の中から好評となり得る画像を抽出することが可能になる。
請求項2の発明によれば、内容を確認するために再生する必要がある動画から好評となり得る画像を抽出することができる。
請求項3の発明によれば、動画そのものから特定した内容情報に基づいて画像を抽出することができる。
請求項4の発明によれば、ユーザから取得した内容情報に基づいて画像を抽出することができる。
請求項5の発明によれば、特定した内容情報だけではなく、より広い概念に基づいて特定画像を特定することが可能になる。
請求項6の発明によれば、他の閲覧者の評価が反映された特定画像を特定することができる。
請求項7の発明によれば、予め定められた期間に流行している特定画像を特定することが可能になる。
請求項8の発明によれば、特定画像における特徴点を有する対象画像の抽出を行うことができる。
請求項9の発明によれば、好評なポーズを有する対象画像の抽出を行うことが可能になる。
請求項10の発明によれば、好評な構図を有する対象画像の抽出を行うことが可能になる。
請求項11の発明によれば、好評な色構成を有する対象画像の抽出を行うことが可能になる。
請求項12の発明によれば、複数の特定画像での共通点を有する対象画像の抽出を行うことができる。
本実施形態の画像抽出システムの全体図である。 本実施形態のサーバ装置の機能構成を示す図である。 (A)、(B)および(C)は、本実施形態の特定画像における特徴点の説明図である。 本実施形態の画像抽出システムの動作フロー図である。 複数のフレーム画像から抽出画像を抽出する具体例である。 本実施形態において抽出画像を提示する際の画面構成例である。
以下、添付図面を参照して、本発明を実施するための形態について説明する。
[画像抽出システム1]
図1は、本実施形態の画像抽出システム1の全体図である。
図1に示すように、本実施形態の画像抽出システム1(情報処理システムの一例)は、ユーザが操作する端末装置10と、端末装置10から取得した複数の対象画像から少なくとも一の対象画像を抽出するサーバ装置20と、を備える。そして、画像抽出システム1において、端末装置10およびサーバ装置20は、ネットワークを介して相互に情報通信が可能になっている。
また、ネットワークは、各装置の間のデータ通信に用いられる通信ネットワークであれば特に限定されず、例えばLAN(Local Area Network)、WAN(Wide Area Network)、インターネット等として良い。データ通信に用いられる通信回線は、有線か無線かを問わず、これらを併用しても良い。また、各装置は、ゲートウェイ装置やルータ等の中継装置を用い、複数のネットワークや通信回線を介して接続されても良い。
さらに、図1に示す例では、一つのサーバ装置20が示されているが、サーバ装置20は、単体のサーバマシンに限定されない。サーバ装置20は、ネットワーク上に設けられた複数のサーバマシンに分散させてサーバ装置20の機能を実現しても良い(いわゆるクラウド環境等)。
なお、図示を省略しているが、図1に示すネットワークには、SNS等の各種のウェブサービスを提供する複数のサーバ装置が接続している。
そして、以下の説明では、例えばユーザが撮影した動画における複数の撮影シーンの中からユーザが少なくとも1つの撮影シーンの画像を抽出しようとする際に、他の人から好評を得られるような撮影シーンの画像の抽出をシステムが支援する例について説明する。
〔端末装置10〕
端末装置10は、ネットワークを介して外部と情報通信が可能な装置である。また、端末装置10は、装置本体に搭載される撮像部によって撮影された画像を記憶したり、他の撮影機器等によって撮影された画像を記憶したりする装置である。
例えば、端末装置10には、スマートフォンなどの携帯電話やタブレットPCなどの携帯型の端末機器や、デスクトップPCなどの設置型の端末機器などを用いることができる。また、端末装置10には、ネットワークを介して外部と情報通信が可能であれば、動画を撮影するビデオカメラや静止画を撮影するスチルカメラ(以下、カメラと呼ぶ)を用いることができる。
〔サーバ装置20〕
図2は、本実施形態のサーバ装置20の機能構成を示す図である。
図2に示すように、サーバ装置20は、端末装置10から動画(複数の対象画像の一例)を受け付ける画像受付部21と、動画の内容に関する内容情報を特定する内容情報特定部22と、インターネットメディアに掲載される掲載画像の中から内容情報に基づいて特定画像を検索する検索部23と、動画の中から特定画像と類似する画像を抽出する抽出部24と、を備える。
(画像受付部21)
画像受付部21(受付手段の一例)は、端末装置10を介してユーザから動画を受信する。動画は、予め端末装置10に保存されていたものでも良いし、端末装置10に接続されたリムーバブルメディア等の各種記憶媒体や、端末装置10に接続されたカメラから取得されるものであっても良い。
(内容情報特定部22)
内容情報特定部22(内容特定手段の一例)は、画像受付部21が受け付けた動画の内容に関する内容情報を特定する。そして、本実施形態の内容情報特定部22は、テキスト化された内容情報を検索部23に送る。
内容情報特定部22は、動画を構成する複数のフレーム画像に対して画像解析を行うことで、動画の内容情報を特定する。本実施形態の内容情報特定部22は、多数の解析用画像を記憶している。また、各々の解析用画像には、それぞれ画像の内容を示す情報がテキストによって関連付けられている。例えば、解析用画像としてのバスケットボールをプレイする選手の画像には、「バスケットボール」というテキストが関連付けられている。そして、内容情報特定部22は、動画を構成する複数のフレーム画像と多数の解析用画像とのマッチングを行う。そして、内容情報特定部22は、動画を構成するフレーム画像に合う解析用画像を特定し、特定した解析用画像のテキストを取得する。そして、内容情報特定部22は、取得したテキストを、画像解析の対象となった動画の内容を示す内容情報とする。
なお、フレーム画像と解析用画像とのマッチングは、抽出部24が行う後述の複数の対象画像の中から特定画像を抽出する際の方法を用いても良く、その他、既存のマッチング技術を用いることができる。
なお、動画を画像解析することで動画の内容情報をする場合には、機械学習による画像分類を用いることができる。例えば、画像の内容を示すテキストがそれぞれ紐付けられた複数の解析用画像であるデータ群(学習データセット)を用いて機械学習を行うことで、学習済みモデルを構築する。そして、学習済みモデルは、学習した分類ルールに基づいて、ユーザから受け付けた動画を分類する。この場合、内容情報特定部22は、分類に関連付けられたテキストを、その画像の内容を示す内容情報として特定する。
また、内容情報特定部22は、ユーザから動画の内容情報を直接的に取得しても良い。内容情報特定部22は、画像受付部21に動画が受け付けられる際に、ユーザから動画の内容情報を受け付ける。例えば、海に沈む夕日が撮影された動画の場合、ユーザは「海の夕日」というテキストを画像受付部21に送る。内容情報特定部22は、ユーザによって指定されたテキストを、動画の内容を示す内容情報として特定する。
(検索部23)
検索部23(選択手段の一例)は、内容情報特定部22が特定した内容情報をキーワードとして、インターネットメディアの検索を行う。本実施形態において、インターネットメディアは、インターネット上で利用可能な情報媒体のことである。例えば、インターネットメディアとしては、SNS(Social Networking Service)、電子掲示板、ブログ等を例示することができる。
そして、検索部23は、インターネットメディアに掲載された掲載画像の中から、内容情報をテキスト化したキーワードに対応する掲載画像(以下、特定画像と呼ぶ)の検索を行う。
また、本実施形態の検索部23は、内容情報特定部22が特定した内容情報のみならず、内容情報を拡張した拡張内容情報を用いて、インターネットメディアの検索を行う。拡張内容情報は、内容情報としての概念を拡張したものである。例えば、拡張内容情報は、内容情報を言い換えた言葉、内容情報を他の言語に翻訳した言葉、内容情報から連想される言葉や、内容情報に類似する言葉などのことである。例えば、内容情報が「バスケットボール」である場合、検索部23は、「バスケ」、「Basketball」、「シュート」、「ダンク」などの言葉や、バスケットの有名な選手名などを拡張内容情報として特定する。
なお、検索部23は、内容情報に基づいて拡張内容情報を特定する際、予めサーバ装置20に記憶された辞書などの言語データベースを用いても良いし、インターネット上で利用可能な言語データベースを参照しても良い。
そして、検索部23は、内容情報および拡張内容情報のキーワードに基づいて検索した特定画像に対する評価の情報の収集も行う。例えばSNSなどにおいて、あるユーザが投稿した画像に対して、他のユーザからの評価を受け付ける機能が設けられている場合がある。このように、インターネットメディアに掲載された掲載画像に対して評価が行われている場合、検索部23は、掲載画像とともに、その掲載画像の評価に関する評価情報を特定する。
また、例えば、特定画像を閲覧した閲覧者が肯定的な評価をした際に、評価に関するカウントが1つ増える仕組みである場合、評価は、カウント数の合計によって特定することができる。この場合、評価は、合計のカウント数が多いほど高くなる。
さらに、評価は、特定画像あるいは特定画像が表示されるウェブページ等へのアクセス数として特定しても良い。この場合、評価は、特定画像や特定画像が表示されるウェブページに対するアクセス数が多いほど高くなる。
(抽出部24)
抽出部24(抽出手段の一例、提示手段の一例)は、画像受付部21にて受け付けられている複数の対象画像の中から、特定された特定画像と類似する対象画像の抽出を行う。本実施形態の抽出部24は、複数の対象画像として動画を構成する複数のフレーム画像に対して、特定画像とのマッチングを行い、複数のフレーム画像のうち特定画像との類似度が最も高いフレーム画像を抽出する。そして、抽出部24は、抽出した対象画像(以下、抽出画像と呼ぶ)を、本実施形態では端末装置10の画面にてユーザに提示する。
そして、本実施形態の抽出部24は、検索部23が特定したインターネットメディアにおいて評価が高い特定画像と類似するフレーム画像の抽出を行う。この場合に、抽出部24は、最も評価が高い特定画像や、その次に評価が高い特定画像など、複数の特定画像に基づいて動画から複数のフレーム画像を抽出しても良い。すなわち、抽出部24は、異なる特定画像に基づいて、それぞれ異なるシーンのフレーム画像を動画から抽出する場合がある。
さらに、抽出部24は、全ての期間ではなく、予め定められた期間に検索部23によって集計された評価に基づいて特定された特定画像を用いて、抽出画像の抽出を行っても良い。例えば、検索部23は、検索の時点から数ヶ月以内など、比較的最近に、高評価が得られている特定画像を特定する。そして、抽出部24は、最近に高評価が得られた特定画像に類似する抽出画像を抽出する。
なお、抽出部24は、画像を構成する色の分布に関するヒストグラムに基づいて、対象画像と特定画像との類似度を特定しても良い。この場合、抽出部24は、ヒストグラムの類似度が高いほど、対象画像と特定画像との類似度が高いと判断する。
さらに、抽出部24は、画像における特徴部分に基づいて、対象画像と特定画像との類似度を特定しても良い。つまり、抽出部24は、特定画像の全体ではなく、一の部分に着目する。そして、抽出部24は、特定画像における一の特徴部分に類似する部分を有する対象画像に対して、特定画像との類似度が高いと判断する。
また、抽出部24は、画像における特徴点の距離に基づいて、対象画像と特定画像との類似度を特定しても良い。抽出部24は、対象画像と特定画像とにおいて、それぞれ、共通する特徴点を複数検出する。さらに、抽出部24は、特定画像における特徴点同士の距離を特定する。一方、抽出部24は、対象画像における特徴点同士の距離を特定する。そして、抽出部24は、対応する特徴点同士の距離の類似度が高いほど、対象画像と特定画像との類似度が高いと判断する。
なお、抽出部24は、ヒストグラム、特徴部分および特徴点の距離の観点のうち、複数を組み合わせて、対象画像と特定画像との類似度の特定を行っても良い。
さらに、抽出部24は、複数の対象画像から抽出する抽出画像の数の指定をユーザから受け付ける。なお、抽出部24は、ユーザからの抽出画像の数の指定が無い場合には、予め定められた数(例えば、2枚など)の抽出を行う。
なお、例えばある同様なシーンを撮影した動画においては、類似するフレーム画像が複数存在することが想定される。この場合、抽出部24は、類似する複数のフレーム画像のうち、予め定められた条件に基づいて、一のフレーム画像を選択する。予め定められた条件とは、例えばタイムライン上で最も時間が早いフレーム画像であることや、画像が最も鮮明であるものなど、各種の条件を用いることができる。
図3は、本実施形態の特定画像における特徴点の説明図である。
本実施形態の抽出部24によって、複数の対象画像から特定画像に類似する対象画像の抽出を行う際に着目する特徴点について説明する。本実施形態において、抽出部24は、特徴点として、(1)特定画像における人のポーズ、(2)特定画像における人または物の構図、および(3)特定画像の色構成、を条件に設定している。
(1)特定画像における人のポーズ
図3(A)に示すように、特定画像T1において人が映っている場合には、抽出部24は、その人のポーズ(姿勢)を特定する。そして、抽出部24は、複数の対象画像のうち、特定画像における人のポーズに類似または一致するポーズを取る人が映っている対象画像を抽出画像として抽出する。
例えば、特定画像T1における特徴的な人のポーズとして、陸上競技の有名選手が優勝した際に行う特徴的なポーズe1を例示できる。この場合、抽出部24は、複数の対象画像のうち、有名選手のポーズe1と類似または一致するポーズをする人が映っている対象画像を、例えば、他の画像要素の類似度が低い場合であっても、抽出画像として選択される順位を高くする。
(2)特定画像における人または物の構図
図3(B)に示すように、抽出部24は、特定画像T2における人や物の構図を分析する。そして、抽出部24は、複数の対象画像のうち、人や物の構図が類似または一致する対象画像を抽出する。
構造物と人と、構造物同士、人同士の位置関係によって、同じ被写体を撮った場合であっても、画像から得られる印象が大きく変わる。例えば、特定画像T2における特徴的な人および物の構図として、建物の手前側にて建物よりも小さく人が配置される構図e2を例示できる。この場合、抽出部24は、複数の対象画像のうち、人や物の構図e2が類似または一致する対象画像を、例えば、他の箇所の類似度が低い場合であっても、抽出画像として選択する順位を高くする。
(3)特定画像の色構成
図3(C)に示すように、抽出部24は、特定画像T3における色構成を分析する。そして、抽出部24は、複数の対象画像のうち、色構成が類似または一致する対象画像を抽出する。
例えば、特定画像T3における特徴的な色構成として、夕焼けによる空の色の色構成e3を例示できる。この場合、抽出部24は、複数の対象画像のうち、色構成e3が類似または一致する対象画像を、例えば、他の箇所の類似度が低い場合であっても、抽出画像として選択される順位を高くする。
なお、抽出部24は、上述した(1)特定画像における人のポーズ、(2)特定画像における人または物の構図、および、(3)特定画像の色構成を、複数組み合わせることで、複数の対象画像からの抽出画像の抽出を行っても良い。
また、抽出部24は、特定画像に対する評価にかかわらず、複数の特定画像に基づいて、複数の対象画像から一の対象画像の抽出を行っても良い。具体的には、あるキーワードに基づいて検索部23によって複数の特定画像が検索結果として特定される。そして、抽出部24は、複数の特定画像の画像解析を行い、複数の特定画像で共通する特徴点を分析する。そして、抽出部24は、複数の対象画像のうち、共通する特徴点を有する対象画像を、抽出画像として抽出しても良い。
続いて、本実施形態の画像抽出システム1の動作について説明する。
図4は、本実施形態の画像抽出システムの動作フロー図である。
図4に示すように、画像受付部21は、端末装置10を介してユーザからビデオカメラによって撮影された動画を受け付ける(S101)。
さらに、画像受付部21は、ユーザから動画の内容情報を取得しているか否かを判断する(S102)。ユーザから動画の内容情報を取得している場合(S102にてYES)には、ステップ104に進む。
一方、ユーザから動画の内容情報を取得していない場合(S102にてNO)には、内容情報特定部22は、受け付けた動画の動画解析に基づいて動画の内容情報を特定する(S103)。
そして、検索部23は、内容情報特定部22が特定した内容情報、または、ユーザから受け付けた内容情報に基づいて、拡張内容情報を特定する(S104)。
さらに、検索部23は、内容情報および拡張内容情報のキーワードを用いて、インターネットメディアの検索を行う(S105)。その結果、検索部23は、インターネットメディアの検索結果から特定画像を特定する(S106)。
その後、抽出部24は、動画を構成する複数のフレーム画像の中から、特定画像に類似する対象画像を抽出する(S107)。
また、抽出部24は、ユーザから抽出画像を抽出する枚数の指定があるか否かを判断する(S108)。そして、ユーザから枚数の指定がある場合(S108でYES)には、ユーザが指定する枚数の抽出画像を端末装置10の画面100にて提示する(S109)。一方、ユーザから抽出枚数の指定がない場合(S108でNO)には、予め定められた枚数の抽出画像を端末装置10の画面100にて提示する(S110)。
図5は、複数のフレーム画像から抽出画像を抽出する具体例である。
図6は、本実施形態において抽出画像を提示する際の画面構成例である。
続いて、複数のフレーム画像から抽出画像を抽出する具体例について説明する。
図5に示すように、ユーザから受け付けた動画を構成する複数のフレーム画像がある。図5に示す例では、動画は、ストリートダンスを撮影したものである。さらに、動画を構成する、複数のフレーム画像として、4枚のフレーム画像(F1、F2、F3およびF4)を代表例として示している。なお、図5においては、便宜的に4枚のフレーム画像だけを示しているが、他にもフレーム画像が存在する。
そして、この例では、動画の内容情報および拡張内容情報に基づいて、インターネットメディアの検索が行われる。まず、ストリートダンスの動画の動画解析によって、内容情報は、「ストリートダンス」であると特定される。さらに、「ストリートダンス」の拡張内容情報は、「ヒップホップ」、「フロアムーブメントダンス」および「ハンドスタンド」であると特定される。
さらに、特定された内容情報および拡張内容情報をキーワードとするインターネットメディアの検索によって、図5に示すように、特定画像A、特定画像Bおよび特定画像Cが特定される。なお、インターネットメディアにおいて閲覧者による評価数は、特定画像C、特定画像B、特定画像Aの順に多くなっている。この例では、特定画像Aは、10,000good!という評価のカウント数が得られている。特定画像Bは、7,000good!という評価のカウント数が得られている。さらに、特定画像Cは、5,000good!という評価のカウント数が得られている。
そして、複数のフレーム画像から、特定画像A、特定画像B、または、特定画像Cに類似するフレーム画像の抽出が行われる。なお、この例では、ユーザから2つの画像を抽出することが指定されているとする。
図5に示す例では、特定画像Aに類似する対象画像として、フレーム画像F1が抽出画像として抽出される。同様に、図5に示す例では、特定画像Cに類似する対象画像として、フレーム画像F4が抽出画像として抽出される。
そして、図6に示すように、抽出画像は、端末装置10の画面100に表示される。本実施形態では、端末装置10の画面100には、2つの抽出画像として、フレーム画像F1およびフレーム画像F4が表示される。さらに、2つの抽出画像には、抽出の元となった特定画像に対する評価情報110がそれぞれ表示される。具体的には、評価情報110として、インターネットメディアにおける評価のカウント数が表示される。
また、図6に示す例では、特定画像を検索するための検索キーワード120が表示される。例えば、ユーザは、動画の分析によって特定された内容情報および拡張内容情報のキーワードが、ユーザの想定内容と異なる場合には、改めて、ユーザが内容情報の入力を行い、キーワードを変更するようにしても良い。
さらに、画面100には、抽出された抽出画像の選択(クリック)を行うことで、抽出画像を静止画として端末装置10にダウンロード可能である指示ボタン130も表示される。
以上説明したように、本実施形態の画像抽出システム1では、ユーザの動画から、インターネットメディアにおいて特定された特定画像に基づく抽出画像の抽出が行われる。
なお、上述した例では、複数の対象画像として、動画を構成する複数のフレーム画像を受け付けているが、この例に限定されない。例えば、画像受付部21は、複数の対象画像として、カメラによって撮影された複数の静止画を受け付けても良い。この場合においても、複数の静止画から、インターネットメディアにおいて特定された特定画像に基づく抽出画像の抽出が行われる。
続いて、本実施形態の端末装置10およびサーバ装置20のハードウェア構成について説明する。
本実施形態の端末装置10およびサーバ装置20は、それぞれ、演算手段であるCPU(Central Processing Unit)、主記憶手段であるメモリ、磁気ディスク装置(HDD:Hard Disk Drive)、ネットワークインターフェイス、ディスプレイ装置を含む表示機構、音声機構、および、キーボードやマウス等の入力デバイス等を備える。
そして、磁気ディスク装置には、OSのプログラムやアプリケーション・プログラムが格納されている。そして、これらのプログラムがメモリに読み込まれてCPUに実行されることにより、本実施形態のサーバ装置20の各々における各機能部の機能が実現される。
さらに、本実施形態の画像抽出システム1における一連の動作を端末装置10やサーバ装置20にてそれぞれ実現させるプログラムは、例えば通信手段により提供することはもちろん、各種の記録媒体に格納して提供しても良い。
なお、本実施形態の画像抽出システム1において行われる一連の機能を実現するための構成は、上述した例に限定されない。例えば、上述した実施形態においてサーバ装置20が実現する機能は、全てサーバ装置20によって実現される必要はなく、例えば端末装置10が一部または全部の機能を実現しても良い。
1…画像抽出システム、10…端末装置、20…サーバ装置、21…画像受付部、22…内容情報特定部、23…検索部、24…抽出部、100…画面、110…評価情報、120…検索キーワード、130…指示ボタン

Claims (15)

  1. ユーザから複数の対象画像を受け付ける受付手段と、
    前記複数の対象画像の内容に関する内容情報を特定する内容特定手段と、
    インターネットメディアに掲載されている掲載画像の中から前記内容情報に基づく特定画像を選択する選択手段と、
    前記複数の対象画像の中から前記特定画像と類似する画像を抽出する抽出手段と、
    を備える情報処理システム。
  2. 前記複数の対象画像は、動画を構成する複数のフレーム画像であり、
    前記抽出手段は、前記複数のフレーム画像の中から前記特定画像と類似するフレーム画像を抽出する請求項1に記載の情報処理システム。
  3. 前記内容特定手段は、前記動画の画像解析から前記内容情報を得る請求項2に記載の情報処理システム。
  4. 前記内容特定手段は、前記ユーザから前記動画の前記内容情報を取得する請求項2に記載の情報処理システム。
  5. 前記選択手段は、前記掲載画像の中から、前記内容特定手段が特定した前記内容情報を拡張した拡張情報に対応する特定画像を選択する請求項1乃至4のいずれか1項に記載の情報処理システム。
  6. 前記選択手段は、前記掲載画像の中から、前記掲載画像の閲覧者による当該掲載画像に対する評価に基づいて前記特定画像を選択する請求項1に記載の情報処理システム。
  7. 前記選択手段は、前記掲載画像の中から、予め定められた期間に集計された前記評価に基づいて前記特定画像を選択する請求項6に記載の情報処理システム。
  8. 前記抽出手段は、前記特定画像の特徴点を有する画像を前記複数の対象画像の中から抽出する請求項1に記載の情報処理システム。
  9. 前記抽出手段は、前記特徴点として前記特定画像における人のポーズを用いる請求項8に記載の情報処理システム。
  10. 前記抽出手段は、前記特徴点として前記特定画像における人または物の構図を用いる請求項8に記載の情報処理システム。
  11. 前記抽出手段は、前記特徴点として前記特定画像の色構成を用いる請求項8に記載の情報処理システム。
  12. 前記抽出手段は、複数の前記特定画像の共通点を有する画像を前記複数の対象画像の中から抽出する請求項1に記載の情報処理システム。
  13. ユーザから複数の対象画像を受け付ける受付手段と、
    インターネットメディアに掲載されている掲載画像の閲覧者による評価情報に基づいて、前記複数の対象画像の中から少なくとも一の画像を抽出する抽出手段と、
    前記一の対象画像を前記価情報とともにユーザに提示する提示手段と、
    を備える情報処理装置。
  14. 情報処理装置として機能するコンピュータに、
    ユーザから受け付けた複数の対象画像の内容に関する内容情報を特定する機能と、
    インターネットメディアに掲載されている掲載画像の中から前記内容情報に基づく特定画像を選択する機能と、
    前記複数の対象画像の中から前記特定画像と類似する画像を抽出する機能と、
    を実現させるプログラム。
  15. 情報処理装置として機能するコンピュータに、
    ユーザから複数の対象画像を受け付ける機能と、
    インターネットメディアに掲載されている掲載画像の閲覧者による評価情報に基づいて、前記複数の対象画像の中から少なくとも一の画像を抽出する機能と、
    前記一の対象画像を前記価情報とともにユーザに提示する機能と、
    を実現させるプログラム。
JP2018159540A 2018-08-28 2018-08-28 情報処理システム、情報処理装置およびプログラム Pending JP2020035086A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018159540A JP2020035086A (ja) 2018-08-28 2018-08-28 情報処理システム、情報処理装置およびプログラム
CN201910173347.9A CN110866148A (zh) 2018-08-28 2019-03-07 信息处理系统、信息处理装置及存储介质
US16/546,310 US20200074218A1 (en) 2018-08-28 2019-08-21 Information processing system, information processing apparatus, and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018159540A JP2020035086A (ja) 2018-08-28 2018-08-28 情報処理システム、情報処理装置およびプログラム

Publications (1)

Publication Number Publication Date
JP2020035086A true JP2020035086A (ja) 2020-03-05

Family

ID=69639896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018159540A Pending JP2020035086A (ja) 2018-08-28 2018-08-28 情報処理システム、情報処理装置およびプログラム

Country Status (3)

Country Link
US (1) US20200074218A1 (ja)
JP (1) JP2020035086A (ja)
CN (1) CN110866148A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102539413B1 (ko) * 2023-03-03 2023-06-02 주식회사 웜브로 포토 키오스크 및 이의 동작 방법

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002215770A (ja) * 2001-01-15 2002-08-02 Ricoh Co Ltd コーディネートサービス方法、サービスセンタ及びプログラム
JP2009116871A (ja) * 2007-11-06 2009-05-28 Palo Alto Research Center Inc 鏡上の内容及び動作に関連した情報を用いて鏡の機能を拡張する方法及び装置
JP2012014544A (ja) * 2010-07-02 2012-01-19 Nippon Telegr & Teleph Corp <Ntt> コーディネート推薦装置、コーディネート推薦方法及びそのプログラム
JP2013196553A (ja) * 2012-03-22 2013-09-30 Dainippon Printing Co Ltd 衣服管理及びレコメンド装置
WO2013145530A1 (ja) * 2012-03-28 2013-10-03 日本電気株式会社 解析システム
JP2014016790A (ja) * 2012-07-09 2014-01-30 Canon Inc 情報処理装置、情報処理方法、およびプログラム
JP2015070505A (ja) * 2013-09-30 2015-04-13 キヤノン株式会社 撮影装置、システム、情報処理方法及びプログラム
JP2016213810A (ja) * 2015-05-01 2016-12-15 株式会社リコー 画像表示システム、情報処理装置、プログラム、画像表示方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006185029A (ja) * 2004-12-27 2006-07-13 Excite Japan Co Ltd 情報処理システム及び情報処理方法、並びに情報処理プログラム
WO2006119603A1 (en) * 2005-05-11 2006-11-16 Optosecurity Inc. Method and system for screening luggage items, cargo containers or persons
US20140328570A1 (en) * 2013-01-09 2014-11-06 Sri International Identifying, describing, and sharing salient events in images and videos
US9471676B1 (en) * 2012-10-11 2016-10-18 Google Inc. System and method for suggesting keywords based on image contents
CN103780973B (zh) * 2012-10-17 2017-08-04 三星电子(中国)研发中心 视频标签添加方法及装置
CN103984738B (zh) * 2014-05-22 2017-05-24 中国科学院自动化研究所 一种基于搜索匹配的角色标注方法
JP2017004252A (ja) * 2015-06-10 2017-01-05 株式会社ウイル・コーポレーション 画像情報処理システム
CN105760472A (zh) * 2016-02-06 2016-07-13 中国农业大学 视频检索方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002215770A (ja) * 2001-01-15 2002-08-02 Ricoh Co Ltd コーディネートサービス方法、サービスセンタ及びプログラム
JP2009116871A (ja) * 2007-11-06 2009-05-28 Palo Alto Research Center Inc 鏡上の内容及び動作に関連した情報を用いて鏡の機能を拡張する方法及び装置
JP2012014544A (ja) * 2010-07-02 2012-01-19 Nippon Telegr & Teleph Corp <Ntt> コーディネート推薦装置、コーディネート推薦方法及びそのプログラム
JP2013196553A (ja) * 2012-03-22 2013-09-30 Dainippon Printing Co Ltd 衣服管理及びレコメンド装置
WO2013145530A1 (ja) * 2012-03-28 2013-10-03 日本電気株式会社 解析システム
JP2014016790A (ja) * 2012-07-09 2014-01-30 Canon Inc 情報処理装置、情報処理方法、およびプログラム
JP2015070505A (ja) * 2013-09-30 2015-04-13 キヤノン株式会社 撮影装置、システム、情報処理方法及びプログラム
JP2016213810A (ja) * 2015-05-01 2016-12-15 株式会社リコー 画像表示システム、情報処理装置、プログラム、画像表示方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102539413B1 (ko) * 2023-03-03 2023-06-02 주식회사 웜브로 포토 키오스크 및 이의 동작 방법

Also Published As

Publication number Publication date
US20200074218A1 (en) 2020-03-05
CN110866148A (zh) 2020-03-06

Similar Documents

Publication Publication Date Title
JP5827445B2 (ja) 拡張現実インタラクションを実現する方法およびシステム
US9076069B2 (en) Registering metadata apparatus
CN110602554A (zh) 封面图像确定方法、装置及设备
US20160179846A1 (en) Method, system, and computer readable medium for grouping and providing collected image content
JP2009110460A (ja) 人物画像検索装置
JP6120467B1 (ja) サーバ装置、端末装置、情報処理方法、およびプログラム
CN104504155B (zh) 一种基于图像搜索的数据获取方法及系统
JP6947085B2 (ja) 電子機器及びその制御方法
JP6366626B2 (ja) 生成装置、生成方法、及び生成プログラム
WO2011161851A1 (ja) コンテンツ管理装置、コンテンツ管理方法、コンテンツ管理プログラムおよび集積回路
JP2010086194A (ja) シェア画像閲覧方法および装置
CN110169055B (zh) 一种生成镜头信息的方法和装置
CN104615639B (zh) 一种用于提供图片的呈现信息的方法和设备
JP2016015018A (ja) サービス提供装置、方法、及びプログラム
JP2020095615A (ja) 生成装置、生成方法および生成プログラム
JP6410427B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2020035086A (ja) 情報処理システム、情報処理装置およびプログラム
JP2017228278A (ja) サーバ装置、端末装置、情報処理方法、およびプログラム
JP6204957B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP6465328B1 (ja) 情報処理システム、情報処理装置、情報処理方法及びプログラム
JP2013222406A (ja) 画像検索システム、画像検索装置およびコンピュータプログラム
Ivanov et al. Epitome: A social game for photo album summarization
KR20150096552A (ko) 사진 앨범 또는 사진 액자를 이용한 온라인 사진 서비스 시스템 및 방법
JP2019200642A (ja) 画像集生成プログラム、情報処理装置、及び画像集生成方法
CN110008364B (zh) 图像处理方法、装置和系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220712

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221018

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230329

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230627