JP2021114071A - Apparatus and method for specifying object to be edited, program, and recording medium - Google Patents
Apparatus and method for specifying object to be edited, program, and recording medium Download PDFInfo
- Publication number
- JP2021114071A JP2021114071A JP2020005823A JP2020005823A JP2021114071A JP 2021114071 A JP2021114071 A JP 2021114071A JP 2020005823 A JP2020005823 A JP 2020005823A JP 2020005823 A JP2020005823 A JP 2020005823A JP 2021114071 A JP2021114071 A JP 2021114071A
- Authority
- JP
- Japan
- Prior art keywords
- image
- editing target
- editing
- target
- scoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
- Studio Devices (AREA)
Abstract
Description
本発明は、編集対象特定装置、編集対象特定方法、プログラム及び記録媒体に関する。 The present invention relates to an edit target identification device, an edit target identification method, a program, and a recording medium.
カメラで撮影された動画を元にダイジェスト動画を作成する動画編集装置が各種提案されている(例えば、特許文献1参照)。 Various video editing devices have been proposed that create a digest video based on a video shot by a camera (see, for example, Patent Document 1).
しかしながら、例えば、カメラ等で自動撮影した画像を、目的に応じて容易に編集可能な新たな技術が求められている。 However, for example, there is a demand for a new technique that can easily edit an image automatically taken by a camera or the like according to a purpose.
そこで、本発明は、例えば、カメラ等で自動撮影した画像を、目的に応じて容易に編集可能な編集対象特定装置及び編集対象特定方法を提供することを目的とする。 Therefore, an object of the present invention is to provide, for example, an edit target identification device and an edit target identification method that can easily edit an image automatically taken by a camera or the like according to a purpose.
前記目的を達成するために、本発明の編集対象特定装置は、
画像取得手段と、記憶手段と、編集対象特定手段と、スコアリング手段と、を含み、
前記画像取得手段は、画像を取得し、
前記記憶手段は、前記画像と、前記編集対象の属性情報と、を記憶し、
前記編集対象特定手段は、前記画像と、前記編集対象の属性情報とを照合して、前記画像の中から前記編集対象を含む画像を特定し、
前記スコアリング手段は、前記編集対象を含む画像を複数組み合わせてスコア化し、前記スコアが閾値を超える画像を選択する装置である。
In order to achieve the above object, the editing target specifying device of the present invention is used.
Includes image acquisition means, storage means, edit target identification means, and scoring means.
The image acquisition means acquires an image and
The storage means stores the image and the attribute information to be edited.
The editing target specifying means collates the image with the attribute information of the editing target, identifies an image including the editing target from the images, and identifies the image.
The scoring means is a device that combines a plurality of images including the editing target and scores them, and selects an image whose score exceeds a threshold value.
本発明の編集対象特定方法は、
画像取得工程と、記憶工程と、編集対象特定工程と、スコアリング工程と、を含み、
前記画像取得工程は、画像を取得し、
前記記憶工程は、前記画像と、前記編集対象の属性情報と、を記憶し、
前記編集対象特定工程は、前記画像と、前記編集対象の属性情報とを照合して、前記画像の中から前記編集対象を含む画像を特定し、
前記スコアリング工程は、前記編集対象を含む画像を複数組み合わせてスコア化し、前記スコアが閾値を超える画像を選択する方法である。
The method for specifying an edit target of the present invention is
Includes an image acquisition process, a storage process, an edit target identification process, and a scoring process.
The image acquisition step acquires an image and
The storage step stores the image and the attribute information to be edited.
In the editing target specifying step, the image is collated with the attribute information of the editing target, and an image including the editing target is specified from the images.
The scoring step is a method in which a plurality of images including the editing target are combined and scored, and an image whose score exceeds a threshold value is selected.
本発明によれば、例えば、カメラ等で自動撮影した画像を、目的に応じて容易に編集可能である。 According to the present invention, for example, an image automatically taken by a camera or the like can be easily edited according to a purpose.
本発明の編集対象特定装置において、例えば、前記画像が、動画であり、前記編集対象特定手段が、所定時間毎に区切って、前記編集対象を含む画像を特定するという態様であってもよい。 In the edit target identification device of the present invention, for example, the image may be a moving image, and the edit target identification means may specify an image including the edit target by dividing the image at predetermined time intervals.
本発明の編集対象特定装置は、例えば、さらに、ラベリング手段を含み、前記ラベリング手段は、前記編集対象を含む画像に、前記編集対象の属性情報及び前記画像に関する情報を含むラベルを付し、前記記憶手段は、前記編集対象を含む画像と前記ラベルとを紐づけて記憶するという態様であってもよい。 The editing target specifying device of the present invention further includes, for example, labeling means, and the labeling means attaches a label containing the attribute information of the editing target and information about the image to the image including the editing target, and the above-mentioned. The storage means may be in the form of associating the image including the editing target with the label and storing the image.
本発明の編集対象特定装置において、例えば、前記画像に関する情報が、撮影日時、撮影場所、天候、及び、編集対象の撮影状態からなる群から選択される少なくとも一つであるという態様であってもよい。 In the editing target specifying device of the present invention, for example, even if the information regarding the image is at least one selected from the group consisting of the shooting date and time, the shooting location, the weather, and the shooting state of the editing target. good.
本発明の編集対象特定装置において、例えば、前記編集対象が、人物であり、前記スコアリング手段が、前記編集対象周辺の人物、前記画像の撮影場所、及び、前記画像の撮影時間からなる群から選択される少なくとも一つを用いて前記スコア化を実施するという態様であってもよい。 In the editing target specifying device of the present invention, for example, the editing target is a person, and the scoring means is composed of a group consisting of a person around the editing target, a shooting location of the image, and a shooting time of the image. The scoring may be performed using at least one selected.
本発明の編集対象特定装置において、例えば、前記編集対象が、人物であり、前記編集対象の属性情報が、顔画像、ID(identification、身分証明)、氏名、年齢、及び、性別からなる群から選択される少なくとも一つであるという態様であってもよい。 In the editing target specifying device of the present invention, for example, the editing target is a person, and the attribute information of the editing target consists of a group consisting of a face image, an ID (identification, identification), a name, an age, and a gender. It may be at least one selected.
本発明の編集対象特定方法において、例えば、前記画像が、動画であり、前記編集対象特定工程が、所定時間毎に区切って、前記編集対象を含む画像を特定するという態様であってもよい。 In the method for specifying an editing target of the present invention, for example, the image may be a moving image, and the editing target specifying step may be divided into predetermined time intervals to specify an image including the editing target.
本発明の編集対象特定方法において、例えば、さらに、ラベリング工程を含み、前記ラベリング工程は、前記編集対象を含む画像に、前記編集対象の属性情報及び前記画像に関する情報を含むラベルを付し、前記記憶工程は、前記編集対象を含む画像と前記ラベルとを紐づけて記憶するという態様であってもよい。 In the method for specifying an editing target of the present invention, for example, a labeling step is further included, and the labeling step attaches a label containing the attribute information of the editing target and information about the image to the image including the editing target. The storage step may be an embodiment in which the image including the editing target and the label are associated and stored.
本発明の編集対象特定方法において、例えば、前記画像に関する情報が、撮影日時、撮影場所、天候、及び、編集対象の撮影状態からなる群から選択される少なくとも一つであるという態様であってもよい。 In the method for specifying an editing target of the present invention, for example, even if the information regarding the image is at least one selected from the group consisting of the shooting date and time, the shooting location, the weather, and the shooting state of the editing target. good.
本発明の編集対象特定方法において、例えば、前記編集対象が、人物であり、前記スコアリング工程が、前記編集対象周辺の人物、前記画像の撮影場所、及び、前記画像の撮影時間からなる群から選択される少なくとも一つを用いて前記スコア化を実施するという態様であってもよい。 In the method for specifying an editing target of the present invention, for example, the editing target is a person, and the scoring step consists of a group consisting of a person around the editing target, a shooting location of the image, and a shooting time of the image. The scoring may be performed using at least one selected.
本発明の編集対象特定方法において、例えば、前記編集対象が、人物であり、前記編集対象の属性情報が、顔画像、ID、氏名、年齢、及び、性別からなる群から選択される少なくとも一つであるという態様であってもよい。 In the method for specifying an editing target of the present invention, for example, the editing target is a person, and the attribute information of the editing target is at least one selected from a group consisting of a face image, an ID, a name, an age, and a gender. It may be in the form of.
本発明のプログラムは、本発明の編集対象特定方法をコンピュータ上で実行可能なプログラムである。 The program of the present invention is a program capable of executing the method of specifying the editing target of the present invention on a computer.
本発明の記録媒体は、本発明のプログラムを記録しているコンピュータ読み取り可能な記録媒体である。 The recording medium of the present invention is a computer-readable recording medium on which the program of the present invention is recorded.
次に、本発明の実施形態について、図1から図11を用いて説明する。本発明は、下記の実施形態によって何ら限定及び制限されない。なお、図1から図11において、同一部分には、同一符号を付している。各実施形態における説明は、それぞれ、互いを援用できる。 Next, an embodiment of the present invention will be described with reference to FIGS. 1 to 11. The present invention is not limited or limited by the following embodiments. In addition, in FIGS. 1 to 11, the same parts are designated by the same reference numerals. The descriptions in each embodiment can be incorporated into each other.
[実施形態1]
図1は、本実施形態の編集対象特定装置1の構成の一例を示すブロック図である。図1に示すように、編集対象特定装置1は、画像取得手段11と、記憶手段12と、編集対象特定手段13と、スコアリング手段14と、を含む。本発明の編集対象特定装置は、例えば、サーバーに組み込まれていてもよい。また、本発明の編集対象特定装置は、例えば、本発明のプログラムがインストールされたパーソナルコンピュータ(PC)であってもよい。
[Embodiment 1]
FIG. 1 is a block diagram showing an example of the configuration of the edit
図2に、編集対象特定装置1のハードウエア構成のブロック図を例示する。図2に示すように、編集対象特定装置1は、例えば、CPU(中央処理装置)101、メモリ102、バス103、記憶手段12、入力装置105、表示装置106、通信デバイス107等を有する。編集対象特定装置1の各部は、例えば、それぞれのインターフェース(I/F)により、バス103を介して接続されている。
FIG. 2 illustrates a block diagram of the hardware configuration of the editing
CPU101は、編集対象特定装置1の全体の制御を担う。編集対象検出装置1において、CPU101により、例えば、本発明のプログラムやその他のプログラムが実行され、また、各種情報の読み込みや書き込みが行われる。具体的には、例えば、CPU101が、画像取得手段11、編集対象特定手段13、及び、スコアリング手段14として機能する。なお、本発明において、CPUに代えてGPU等の他の演算装置を用いてもよい。
The
バス103は、例えば、外部機器とも接続できる。前記外部機器は、例えば、外部記憶装置(外部データベース等)、プリンター等が挙げられる。編集対象特定装置1は、例えば、バス103に接続された通信デバイス107により、通信回線網に接続でき、前記通信回線網を介して、前記外部機器と接続することもできる。前記通信回線網は、特に制限されず、公知のネットワークを使用でき、例えば、有線でも無線でもよい。前記通信回線網は、例えば、インターネット回線、WWW(World Wide Web)、電話回線、LAN(Local Area Network)、WiFi(Wireless Fidelity)等が挙げられる。
The
メモリ102は、例えば、メインメモリを含み、前記メインメモリは、主記憶装置ともいう。CPU101が処理を行う際には、例えば、後述する記憶手段12に記憶されている本発明のプログラム等の種々の動作プログラム104を、メモリ102が読み込み、CPU101は、メモリ102からデータを受け取って、プログラム104を実行する。前記メインメモリは、例えば、RAM(ランダムアクセスメモリ)である。メモリ102は、例えば、さらに、ROM(読み出し専用メモリ)を含む。
The
記憶手段12は、例えば、前記メインメモリ(主記憶装置)に対して、いわゆる補助記憶装置ともいう。前述のように、記憶手段12には、本発明のプログラムを含む動作プログラム104が格納されている。また、記憶手段12は、前記画像と、前記編集対象の属性情報と、を記憶している。記憶手段12は、例えば、記憶媒体と、前記記憶媒体に読み書きするドライブとを含む。前記記憶媒体は、特に制限されず、例えば、内蔵型でも外付け型でもよく、HD(ハードディスク)、FD(フロッピー(登録商標)ディスク)、CD−ROM、CD−R、CD−RW、MO、DVD、フラッシュメモリー、メモリーカード等が挙げられ、前記ドライブは、特に制限されない。記憶手段12は、例えば、記憶媒体とドライブとが一体化されたハードディスクドライブ(HDD)であってもよい。
The storage means 12 is also referred to as a so-called auxiliary storage device with respect to the main memory (main storage device), for example. As described above, the storage means 12 stores an
編集対象特定装置1は、例えば、さらに、入力装置105、表示装置106を有する。入力装置105は、例えば、タッチパネル、キーボード、マウス等である。表示装置106は、例えば、LEDディスプレイ、液晶ディスプレイ等が挙げられる。
The editing
編集対象特定装置1において、メモリ102及び記憶手段12は、ユーザーからのアクセス情報及びログ情報、並びに、外部データベース(図示せず)から取得した情報を記憶することも可能である。
In the editing
次に、本実施形態の編集対象特定方法の一例を、図3のフローチャートに基づき説明する。本実施形態の編集対象特定方法は、例えば、図1の編集対象特定装置1を用いて、次のように実施する。なお、本実施形態の編集対象特定方法は、図1の編集対象特定装置1の使用には限定されない。
Next, an example of the method for specifying the editing target of the present embodiment will be described with reference to the flowchart of FIG. The editing target specifying method of the present embodiment is carried out as follows, for example, using the editing
まず、画像取得手段11により、画像を取得する(S11)。画像取得手段11は、例えば、編集対象特定装置1に搭載されたカメラ等の撮像手段で撮影することで、前記画像を取得してもよい。また、前記画像は、例えば、編集対象特定装置1とは別個に設けられたカメラ(例えば、撮影方向を制御可能な固定カメラ、撮影方向を制御不可能な固定カメラ、ドローン等の移動体に搭載された移動カメラ等)等の撮像手段で撮影され、前記通信回線網を介して、編集対象特定装置1の画像取得手段11によって取得されたものであってもよい。前記画像は、例えば、静止画であってもよいし、動画であってもよい。
First, the image is acquired by the image acquisition means 11 (S11). The image acquisition means 11 may acquire the image by, for example, taking a picture with an image pickup means such as a camera mounted on the editing
次に、記憶手段12により、前記画像と、前記編集対象の属性情報と、を記憶する(S12)。前記編集対象は、特に制限されず、例えば、運動会、文化祭、結婚式等のパーティーの参加者(例えば、子供、孫、児童、生徒、学生、新郎、新婦、参列者等)、コンサートの演者、観客等の人物、競馬における競走馬等の動物、カーレースにおけるレースカー等の自動車、お祭りにおける御神輿等が挙げられる。前記編集対象は、一つ(例えば、一人の人物、一匹の動物、一台の自動車等)であってもよいし、複数(例えば、複数人の人物、複数匹の動物、複数台の自動車等)であってもよい。前記編集対象の属性情報としては、例えば、前記編集対象が人物であれば、顔画像、ID、氏名、年齢、性別等が挙げられる。なお、図3には、画像取得工程(S11)の後、記憶工程(S12)において前記編集対象の属性情報を記憶する例を示したが、本発明は、これに限定されない。本発明においては、画像取得工程(S11)の前に、記憶工程(S12)における前記編集対象の属性情報の記憶を実施してもよいし、画像取得工程(S11)及び記憶工程(S12)における前記編集対象の属性情報の記憶を同時に実施してもよい。 Next, the storage means 12 stores the image and the attribute information to be edited (S12). The editing target is not particularly limited, and for example, participants of parties such as athletic meet, school festival, wedding, etc. (for example, children, grandchildren, children, students, students, grooms, brides, attendees, etc.), performers of concerts, etc. , People such as spectators, animals such as race horses in horse racing, automobiles such as race cars in car races, and gods in festivals. The editing target may be one (for example, one person, one animal, one car, etc.) or a plurality (for example, a plurality of people, a plurality of animals, a plurality of automobiles, etc.). Etc.). Examples of the attribute information of the editing target include a face image, ID, name, age, gender, and the like if the editing target is a person. Note that FIG. 3 shows an example in which the attribute information to be edited is stored in the storage step (S12) after the image acquisition step (S11), but the present invention is not limited to this. In the present invention, the attribute information to be edited in the storage step (S12) may be stored before the image acquisition step (S11), or in the image acquisition step (S11) and the storage step (S12). The attribute information to be edited may be stored at the same time.
次に、編集対象特定手段13により、前記画像と、前記編集対象の属性情報とを照合して、前記画像の中から前記編集対象を含む画像を特定する(S13)。
Next, the editing
図7に、編集対象特定手段13が、前記画像の中から前記編集対象を含む画像を特定する態様の一例を示す。図7に示すように、本例では、前記編集対象は、運動会に参加する児童である。本例において、編集対象特定手段13は、記憶手段12が記憶している前記画像と、前記編集対象の属性情報(本例では、複数の児童の顔画像)とを照合し、前記編集対象を含む画像(本例では、徒競走でゴールする児童の画像)を特定する。前記特定には、例えば、公知の顔認証技術等を用い得る。編集対象特定手段13は、図7に例示するように、さらに、複数の顔画像(本例では、#1〜4の四つ)を検出し、それと一致度の高い児童のIDをラベルとして設定してもよい。
FIG. 7 shows an example of a mode in which the editing
前記画像が動画の場合、編集対象特定手段13は、例えば、図8に示すように、所定時間毎に区切って、前記編集対象を含む画像を特定してもよい。前記所定時間は、特に制限されず、例えば、1秒、1分等である。
When the image is a moving image, the editing
次に、スコアリング手段14により、前記編集対象を含む画像を複数組み合わせてスコア化し、前記スコアが閾値を超える画像を選択する(S14)。 Next, the scoring means 14 combines a plurality of images including the editing target into a score, and selects an image whose score exceeds the threshold value (S14).
図9及び図10に、スコアリング手段14が、前記編集対象を含む画像を複数組み合わせてスコア化し、前記スコアが閾値を超える画像を選択する態様の一例を示す。図9に示すように、本例では、徒競走でゴールする児童の画像(画像1)、組体操をする児童の画像(画像2)、綱引きをする児童の画像(画像3)の三つの前記編集対象を含む画像を組み合わせている。図9に例示するように、画像1〜3では、編集対象特定手段13により、複数人の児童(本例では、児童a〜fの六人)の顔画像が抽出され、それと一致度の高い児童のID(ID−a〜f)がラベルとして設定されている。スコアリング手段14は、例えば、次のようにして前記スコア化を実施する。すなわち、まず、スコアリング手段14は、図9に例示するように、画像1〜3に含まれる児童a〜fの組み合わせを表にまとめ、児童aが含まれる画像には、児童c及びfが含まれる確率が高いことを突き止め、画像2において、IDが不明の顔画像がある場合、それが児童c及びfの顔画像である可能性が高いと推定する。
9 and 10 show an example of a mode in which the scoring means 14 combines a plurality of images including the editing target and scores them, and selects an image whose score exceeds the threshold value. As shown in FIG. 9, in this example, three edits are made: an image of a child scoring a goal in a race (image 1), an image of a child doing gymnastics (image 2), and an image of a child doing tug of war (image 3). The images including the target are combined. As illustrated in FIG. 9, in
次に、図10に例示するように、画像1〜3において、縦軸の児童が含まれているならば、横軸の児童が含まれている確率をスコア化し、前記スコアが閾値を超える画像を選択する。このように、スコアの高い画像を選択することで、顔認証のみで編集対象を識別するよりも、目的とする編集対象を含む画像を多く選択することが可能である。
Next, as illustrated in FIG. 10, in the
編集対象特定手段13は、前記顔画像以外にも、例えば、前記画像の撮影場所、前記画像の撮影時間(例えば、プログラム進行等の時間に基づく撮影時間等)等により、編集対象を推定可能である。
In addition to the face image, the editing
本実施形態の編集対象特定装置1は、例えば、特定された前記編集対象を含む画像を画像編集装置に出力してもよい。前記画像編集装置は、特に制限されない。前記画像編集装置によれば、例えば、前記編集対象を含む画像をアルバム、ドキュメント、物語、日記等の各種モードに編集可能である。前記画像が動画の場合は、例えば、発話している人物毎に動画を切替えることも可能である。また、運動会の場合は、競技に出場している人物と応援者を組み合わせた1つの動画にすることも可能である。
The editing
本実施形態によれば、カメラ等で自動撮影した画像から編集対象を特定できるため、例えば、目的に応じて容易に編集可能である。 According to the present embodiment, since the editing target can be specified from the image automatically taken by the camera or the like, for example, the editing can be easily performed according to the purpose.
[実施形態2]
次に、編集対象特定装置1が、さらに、ラベリング手段15を含む実施形態を説明する。図4及び図5に示すように、本実施形態の編集対象特定装置1は、さらに、ラベリング手段15を含む。それ以外の構成は、実施形態1と同様である。
[Embodiment 2]
Next, an embodiment in which the editing
次に、本実施形態の編集対象特定装置における処理の一例を、図4のブロック図、及び、図6のフローチャートに基づき説明する。 Next, an example of the processing in the editing target specifying device of the present embodiment will be described with reference to the block diagram of FIG. 4 and the flowchart of FIG.
まず、実施形態1と同様にして、画像取得手段11による画像の取得(S11)、記憶手段12による前記画像及び前記編集対象の属性情報の記憶(S12a)、編集対象特定手段13による前記編集対象を含む画像の特定(S13)、及び、スコアリング手段14によるスコア化(S14)を実施する。
First, in the same manner as in the first embodiment, the image acquisition means 11 acquires the image (S11), the storage means 12 stores the image and the attribute information of the edit target (S12a), and the edit
次に、ラベリング手段15により、前記編集対象を含む画像に、前記編集対象の属性情報及び前記画像に関する情報を含むラベルを付す(S15)。すなわち、前記ラベルは、前記編集対象を含む画像と対になっている。前記画像に関する情報は、特に制限されず、例えば、撮影日時、撮影場所、天候、及び、編集対象の撮影状態(例えば、ピンぼけの有無、編集対象の全体を含むか一部しか含んでいないか、構図の良し悪し、編集対象が人物であれば、その表情等)等である。前記編集対象を含む画像と、前記ラベルの一例を図11に示す。そして、記憶手段12は、さらに、前記編集対象を含む画像と前記ラベルとを紐づけて記憶する(S12b)。記憶手段12は、例えば、前記画像と前記ラベルとを別個に記憶してもよいし、前記画像のデータ中に拡張情報として前記ラベルを含ませて記憶してもよい。また、前記画像が動画の場合は、前記区切った画像毎に前記ラベルを付してもよい。 Next, the labeling means 15 attaches a label including the attribute information of the editing target and the information related to the image to the image including the editing target (S15). That is, the label is paired with the image including the editing target. The information regarding the image is not particularly limited, and for example, the shooting date and time, the shooting location, the weather, and the shooting state of the editing target (for example, the presence or absence of out-of-focus, whether the editing target is included in whole or only partially included, etc. The composition is good or bad, and if the editing target is a person, the facial expression, etc.). An image including the editing target and an example of the label are shown in FIG. Then, the storage means 12 further stores the image including the editing target and the label in association with each other (S12b). For example, the storage means 12 may store the image and the label separately, or may include the label as extended information in the data of the image and store the label. When the image is a moving image, the label may be attached to each of the separated images.
本実施形態の編集対象特定装置1は、例えば、前記ラベルが付された前記編集対象を含む画像(以下、「ラベル化画像」とも言う。)を画像編集装置に出力してもよい。前記画像編集装置は、例えば、記憶手段と、ラベル化画像抽出手段と、編集手段とを含む。
The editing
前記画像編集装置を用いた画像の編集について、例をあげて説明する。 Editing an image using the image editing device will be described with an example.
まず、前記記憶手段により、ラベル化画像を記憶する。 First, the labeled image is stored by the storage means.
次に、前記ラベル化画像抽出手段により、前記ラベル化画像の中から、所定の条件に当てはまる画像を抽出する。前記画像の抽出における前記所定の条件としては、例えば、前記編集対象が人物であれば、特定人物の存在、所定のストーリー等が挙げられる。前記特定人物は、例えば、一人であってもよいし、複数人のグループであってもよい。前記所定のストーリーとしては、例えば、アルバム風、ドキュメント風、物語風、日記風等の各種モード等が挙げられる。前記各種モードにおけるストーリーは、例えば、AI(Articicial Intelligence、人工知能)等を用いて自動で生成可能である。 Next, the labeled image extracting means extracts an image that meets a predetermined condition from the labeled image. Examples of the predetermined condition in extracting the image include the existence of a specific person, a predetermined story, and the like if the editing target is a person. The specific person may be, for example, one person or a group of a plurality of people. Examples of the predetermined story include various modes such as an album style, a document style, a story style, and a diary style. The stories in the various modes can be automatically generated by using, for example, AI (Artificial Intelligence).
例えば、前記編集対象が、運動会に参加する児童であれば、前記ラベル化画像抽出手段は、徒競走でゴールする児童aを含む画像、組体操をする児童aを含む画像、綱引きをする児童aの画像等を抽出する。前記ラベル化画像抽出手段は、前記児童aを含む画像に代えて、複数人(例えば、児童a、児童b、児童cの三人)を含む画像を抽出してもよい。 For example, if the editing target is a child participating in an athletic meet, the labeled image extraction means includes an image including a child a who finishes in a foot race, an image including a child a who performs gymnastics, and a child a who tug of war. Extract images, etc. The labeled image extraction means may extract an image including a plurality of people (for example, three children a, a child b, and a child c) instead of the image including the child a.
また、前記ラベル化画像抽出手段は、例えば、前記所定のストーリーに応じて、前記特定人物以外の人物(前述の運動会の例では、児童aを応援する家族等)、風景等の運動会等のイベント全体の画像を抽出してもよい。 Further, the labeled image extraction means is, for example, an event such as a person other than the specific person (in the example of the above-mentioned athletic meet, a family supporting the child a), an athletic meet such as a landscape, etc., according to the predetermined story. The entire image may be extracted.
次に、前記編集手段により、所定の条件に基づいて、前記抽出された画像を編集する。前記画像の編集における前記所定の条件としては、例えば、抽出結果の一覧形式とする、時系列に沿って画像を配置し、静止画像中心のブック形式、動画を含むムービー形式とする等が挙げられ、風景の比率を増やす等してもよい。また、前記画像が動画の場合は、例えば、発話している人物毎に動画を切替えることも可能である。 Next, the extracted image is edited by the editing means based on predetermined conditions. Examples of the predetermined condition in editing the image include a list format of extraction results, a book format centered on still images by arranging images in chronological order, and a movie format including moving images. , The ratio of the landscape may be increased. Further, when the image is a moving image, for example, it is possible to switch the moving image for each person who is speaking.
本実施形態によれば、カメラ等で自動撮影した画像から編集対象を特定できるため、例えば、目的に応じて容易に編集可能である。 According to the present embodiment, since the editing target can be specified from the image automatically taken by the camera or the like, for example, the editing can be easily performed according to the purpose.
[実施形態3]
本実施形態のプログラムは、前記各実施形態の方法を、コンピュータ上で実行可能なプログラムである。また、本実施形態のプログラムは、例えば、コンピュータ読み取り可能な記録媒体に記録されてもよい。前記記録媒体としては、特に限定されず、例えば、読み出し専用メモリ(ROM)、ハードディスク(HD)、光ディスク、フロッピー(登録商標)ディスク(FD)等が挙げられる。
[Embodiment 3]
The program of this embodiment is a program that can execute the method of each of the above-described embodiments on a computer. Further, the program of the present embodiment may be recorded on a computer-readable recording medium, for example. The recording medium is not particularly limited, and examples thereof include a read-only memory (ROM), a hard disk (HD), an optical disk, a floppy (registered trademark) disk (FD), and the like.
<付記>
上記の実施形態の一部又は全部は、以下の付記のように記載されうるが、以下には限られない。
(付記1)
画像取得手段と、記憶手段と、編集対象特定手段と、スコアリング手段と、を含み、
前記画像取得手段は、画像を取得し、
前記記憶手段は、前記画像と、前記編集対象の属性情報と、を記憶し、
前記編集対象特定手段は、前記画像と、前記編集対象の属性情報とを照合して、前記画像の中から前記編集対象を含む画像を特定し、
前記スコアリング手段は、前記編集対象を含む画像を複数組み合わせてスコア化し、前記スコアが閾値を超える画像を選択する、
編集対象特定装置。
(付記2)
前記画像が、動画であり、
前記編集対象特定手段が、所定時間毎に区切って、前記編集対象を含む画像を特定する、
付記1記載の編集対象特定装置。
(付記3)
さらに、ラベリング手段を含み、
前記ラベリング手段は、前記編集対象を含む画像に、前記編集対象の属性情報及び前記画像に関する情報を含むラベルを付し、
前記記憶手段は、前記編集対象を含む画像と前記ラベルとを紐づけて記憶する、
付記1又は2記載の編集対象特定装置。
(付記4)
前記画像に関する情報が、撮影日時、撮影場所、天候、及び、編集対象の撮影状態からなる群から選択される少なくとも一つである、
付記1から3のいずれかに記載の編集対象特定装置。
(付記5)
前記編集対象が、人物であり、
前記スコアリング手段が、前記編集対象周辺の人物、前記画像の撮影場所、及び、前記画像の撮影時間からなる群から選択される少なくとも一つを用いて前記スコア化を実施する、
付記1から4のいずれかに記載の編集対象特定装置。
(付記6)
前記編集対象が、人物であり、
前記編集対象の属性情報が、顔画像、ID、氏名、年齢、及び、性別からなる群から選択される少なくとも一つである、
付記1から5のいずれかに記載の編集対象特定装置。
(付記7)
画像取得工程と、記憶工程と、編集対象特定工程と、スコアリング工程と、を含み、
前記画像取得工程は、画像を取得し、
前記記憶工程は、前記画像と、前記編集対象の属性情報と、を記憶し、
前記編集対象特定工程は、前記画像と、前記編集対象の属性情報とを照合して、前記画像の中から前記編集対象を含む画像を特定し、
前記スコアリング工程は、前記編集対象を含む画像を複数組み合わせてスコア化し、前記スコアが閾値を超える画像を選択する、
編集対象特定方法。
(付記8)
前記画像が、動画であり、
前記編集対象特定工程が、所定時間毎に区切って、前記編集対象を含む画像を特定する、
付記7記載の編集対象特定方法。
(付記9)
さらに、ラベリング工程を含み、
前記ラベリング工程は、前記編集対象を含む画像に、前記編集対象の属性情報及び前記画像に関する情報を含むラベルを付し、
前記記憶工程は、前記編集対象を含む画像と前記ラベルとを紐づけて記憶する、
付記7又は8記載の編集対象特定方法。
(付記10)
前記画像に関する情報が、撮影日時、撮影場所、天候、及び、編集対象の撮影状態からなる群から選択される少なくとも一つである、
付記7から9のいずれかに記載の編集対象特定方法。
(付記11)
前記編集対象が、人物であり、
前記スコアリング工程が、前記編集対象周辺の人物、前記画像の撮影場所、及び、前記画像の撮影時間からなる群から選択される少なくとも一つを用いて前記スコア化を実施する、
付記7から10のいずれかに記載の編集対象特定方法。
(付記12)
前記編集対象が、人物であり、
前記編集対象の属性情報が、顔画像、ID、氏名、年齢、及び、性別からなる群から選択される少なくとも一つである、
付記7から11のいずれかに記載の編集対象特定方法。
(付記13)
付記7から12のいずれかに記載の編集対象特定方法をコンピュータ上で実行可能なプログラム。
(付記14)
付記13記載のプログラムを記録しているコンピュータ読み取り可能な記録媒体。
<Additional notes>
Some or all of the above embodiments may be described as, but not limited to, the following appendices.
(Appendix 1)
Includes image acquisition means, storage means, edit target identification means, and scoring means.
The image acquisition means acquires an image and
The storage means stores the image and the attribute information to be edited.
The editing target specifying means collates the image with the attribute information of the editing target, identifies an image including the editing target from the images, and identifies the image.
The scoring means combines a plurality of images including the editing target into a score, and selects an image whose score exceeds a threshold value.
Editing target identification device.
(Appendix 2)
The image is a moving image.
The editing target specifying means identifies an image including the editing target by dividing it at predetermined time intervals.
The edit target identification device described in
(Appendix 3)
In addition, including labeling means,
The labeling means attaches a label containing the attribute information of the editing target and information about the image to the image including the editing target.
The storage means stores the image including the editing target in association with the label.
The editing target specifying device according to
(Appendix 4)
The information about the image is at least one selected from the group consisting of the shooting date and time, the shooting location, the weather, and the shooting state to be edited.
The editing target specifying device according to any one of
(Appendix 5)
The editing target is a person
The scoring means performs the scoring using at least one selected from a group consisting of a person around the editing target, a shooting location of the image, and a shooting time of the image.
The editing target specifying device according to any one of
(Appendix 6)
The editing target is a person
The attribute information to be edited is at least one selected from the group consisting of a face image, an ID, a name, an age, and a gender.
The editing target specifying device according to any one of
(Appendix 7)
Includes an image acquisition process, a storage process, an edit target identification process, and a scoring process.
The image acquisition step acquires an image and
The storage step stores the image and the attribute information to be edited.
In the editing target specifying step, the image is collated with the attribute information of the editing target, and an image including the editing target is specified from the images.
In the scoring step, a plurality of images including the editing target are combined and scored, and an image whose score exceeds the threshold value is selected.
How to specify the edit target.
(Appendix 8)
The image is a moving image.
The editing target specifying step identifies an image including the editing target by dividing it at predetermined time intervals.
The method for identifying the editing target described in Appendix 7.
(Appendix 9)
In addition, it includes a labeling process
In the labeling step, the image including the editing target is labeled with the attribute information of the editing target and the information related to the image.
In the storage step, the image including the editing target and the label are stored in association with each other.
The method for identifying an edit target according to Appendix 7 or 8.
(Appendix 10)
The information about the image is at least one selected from the group consisting of the shooting date and time, the shooting location, the weather, and the shooting state to be edited.
The method for identifying an edit target according to any one of Supplementary notes 7 to 9.
(Appendix 11)
The editing target is a person
The scoring step performs the scoring using at least one selected from the group consisting of a person around the editing target, a shooting location of the image, and a shooting time of the image.
The method for identifying an editing target according to any one of Supplementary Provisions 7 to 10.
(Appendix 12)
The editing target is a person
The attribute information to be edited is at least one selected from the group consisting of a face image, an ID, a name, an age, and a gender.
The method for identifying an edit target according to any one of Supplementary notes 7 to 11.
(Appendix 13)
A program capable of executing the editing target identification method described in any one of Appendix 7 to 12 on a computer.
(Appendix 14)
A computer-readable recording medium on which the program described in
以上、実施形態を参照して本発明を説明したが、本発明は、上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をできる。 Although the present invention has been described above with reference to the embodiments, the present invention is not limited to the above embodiments. Various changes that can be understood by those skilled in the art can be made to the structure and details of the present invention within the scope of the present invention.
本発明によれば、カメラ等で自動撮影した画像から編集対象を特定可能となり、運動会等のイベントにおいて、特に有用である。 According to the present invention, it is possible to specify an editing target from an image automatically taken by a camera or the like, which is particularly useful in an event such as an athletic meet.
1 編集対象特定装置
11 画像取得手段
12 記憶手段
13 編集対象特定手段
14 スコアリング手段
15 ラベリング手段
1 Editing
Claims (9)
前記画像取得手段は、画像を取得し、
前記記憶手段は、前記画像と、前記編集対象の属性情報と、を記憶し、
前記編集対象特定手段は、前記画像と、前記編集対象の属性情報とを照合して、前記画像の中から前記編集対象を含む画像を特定し、
前記スコアリング手段は、前記編集対象を含む画像を複数組み合わせてスコア化し、前記スコアが閾値を超える画像を選択する、
編集対象特定装置。 Includes image acquisition means, storage means, edit target identification means, and scoring means.
The image acquisition means acquires an image and
The storage means stores the image and the attribute information to be edited.
The editing target specifying means collates the image with the attribute information of the editing target, identifies an image including the editing target from the images, and identifies the image.
The scoring means combines a plurality of images including the editing target into a score, and selects an image whose score exceeds a threshold value.
Editing target identification device.
前記編集対象特定手段が、所定時間毎に区切って、前記編集対象を含む画像を特定する、
請求項1記載の編集対象特定装置。 The image is a moving image.
The editing target specifying means identifies an image including the editing target by dividing it at predetermined time intervals.
The editing target specifying device according to claim 1.
前記ラベリング手段は、前記編集対象を含む画像に、前記編集対象の属性情報及び前記画像に関する情報を含むラベルを付し、
前記記憶手段は、前記編集対象を含む画像と前記ラベルとを紐づけて記憶する、
請求項1又は2記載の編集対象特定装置。 In addition, including labeling means,
The labeling means attaches a label containing the attribute information of the editing target and information about the image to the image including the editing target.
The storage means stores the image including the editing target in association with the label.
The editing target specifying device according to claim 1 or 2.
請求項1から3のいずれか一項に記載の編集対象特定装置。 The information about the image is at least one selected from the group consisting of the shooting date and time, the shooting location, the weather, and the shooting state to be edited.
The editing target specifying device according to any one of claims 1 to 3.
前記スコアリング手段が、前記編集対象周辺の人物、前記画像の撮影場所、及び、前記画像の撮影時間からなる群から選択される少なくとも一つを用いて前記スコア化を実施する、
請求項1から4のいずれか一項に記載の編集対象特定装置。 The editing target is a person
The scoring means performs the scoring using at least one selected from a group consisting of a person around the editing target, a shooting location of the image, and a shooting time of the image.
The editing target specifying device according to any one of claims 1 to 4.
前記編集対象の属性情報が、顔画像、ID、氏名、年齢、及び、性別からなる群から選択される少なくとも一つである、
請求項1から5のいずれか一項に記載の編集対象特定装置。 The editing target is a person
The attribute information to be edited is at least one selected from the group consisting of a face image, an ID, a name, an age, and a gender.
The editing target specifying device according to any one of claims 1 to 5.
前記画像取得工程は、画像を取得し、
前記記憶工程は、前記画像と、前記編集対象の属性情報と、を記憶し、
前記編集対象特定工程は、前記画像と、前記編集対象の属性情報とを照合して、前記画像の中から前記編集対象を含む画像を特定し、
前記スコアリング工程は、前記編集対象を含む画像を複数組み合わせてスコア化し、前記スコアが閾値を超える画像を選択する、
編集対象特定方法。 Includes an image acquisition process, a storage process, an edit target identification process, and a scoring process.
The image acquisition step acquires an image and
The storage step stores the image and the attribute information to be edited.
In the editing target specifying step, the image is collated with the attribute information of the editing target, and an image including the editing target is specified from the images.
In the scoring step, a plurality of images including the editing target are combined and scored, and an image whose score exceeds the threshold value is selected.
How to specify the edit target.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020005823A JP2021114071A (en) | 2020-01-17 | 2020-01-17 | Apparatus and method for specifying object to be edited, program, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020005823A JP2021114071A (en) | 2020-01-17 | 2020-01-17 | Apparatus and method for specifying object to be edited, program, and recording medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021114071A true JP2021114071A (en) | 2021-08-05 |
Family
ID=77076995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020005823A Pending JP2021114071A (en) | 2020-01-17 | 2020-01-17 | Apparatus and method for specifying object to be edited, program, and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021114071A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116112745A (en) * | 2023-04-07 | 2023-05-12 | 环球数科集团有限公司 | Artificial intelligence video editing system for AIGC |
-
2020
- 2020-01-17 JP JP2020005823A patent/JP2021114071A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116112745A (en) * | 2023-04-07 | 2023-05-12 | 环球数科集团有限公司 | Artificial intelligence video editing system for AIGC |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11393209B2 (en) | Generating a video segment of an action from a video | |
US9047320B2 (en) | Music recommendation system, information processing device, and information processing method | |
CN105612514B (en) | System and method for image classification by associating contextual cues with images | |
JP5697139B2 (en) | Secondary content providing system and method | |
JP5931829B2 (en) | Composite image creation assist device, composite image creation assist method, composite image creation assist program, and recording medium thereof | |
US8750681B2 (en) | Electronic apparatus, content recommendation method, and program therefor | |
US10275643B2 (en) | Electronic device, electronic device control method, and computer-readable recording medium having stored thereon electronic device control program | |
US20060092487A1 (en) | Video content creating apparatus | |
CN102207950A (en) | Electronic apparatus, image processing method and program | |
WO2021120818A1 (en) | Methods and systems for managing image collection | |
CN101655867A (en) | Information processing apparatus, information processing method | |
US8713008B2 (en) | Apparatus and method for information processing, program, and recording medium | |
JP2012227873A (en) | Comment distribution system, operating method of the same, and program | |
CN109165564B (en) | Electronic photo album, generation method, system, storage medium and computer equipment | |
JP2021114071A (en) | Apparatus and method for specifying object to be edited, program, and recording medium | |
JP2006079460A (en) | System, method and program for displaying electronic album and device, method, and program for classifying image | |
Elshaer et al. | Tourists’ selfies storytelling: Preferences, intentions, and concerns for practise in the tourism and hospitality industry | |
JP2021114072A (en) | Image editing apparatus, image editing method, program, and recording medium | |
JP2007293454A (en) | Material presentation system and material presentation method | |
Dumoulin et al. | Affect recognition in a realistic movie dataset using a hierarchical approach | |
Norambuena et al. | Characterizing social movement narratives in online communities: The 2021 Cuban Protests on Reddit | |
Šimko et al. | Personal image tagging: a game-based approach | |
JPWO2020158536A1 (en) | Information processing system, information processing method and information processing equipment | |
Tufis et al. | Crowdsourcing comics annotations | |
CN113381927B (en) | Social media interaction method, system and storage medium based on travel information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220630 |