JP7429016B2 - 画像処理方法、コンピュータプログラム及び画像処理装置 - Google Patents
画像処理方法、コンピュータプログラム及び画像処理装置 Download PDFInfo
- Publication number
- JP7429016B2 JP7429016B2 JP2022101248A JP2022101248A JP7429016B2 JP 7429016 B2 JP7429016 B2 JP 7429016B2 JP 2022101248 A JP2022101248 A JP 2022101248A JP 2022101248 A JP2022101248 A JP 2022101248A JP 7429016 B2 JP7429016 B2 JP 7429016B2
- Authority
- JP
- Japan
- Prior art keywords
- scene change
- change position
- frames
- candidate
- moving image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 36
- 238000004590 computer program Methods 0.000 title claims description 6
- 230000008859 change Effects 0.000 claims description 278
- 238000000034 method Methods 0.000 claims description 67
- 238000001514 detection method Methods 0.000 claims description 50
- 230000008569 process Effects 0.000 claims description 31
- 238000004378 air conditioning Methods 0.000 claims description 25
- 238000010276 construction Methods 0.000 claims description 22
- 230000008439 repair process Effects 0.000 claims description 22
- 239000000284 extract Substances 0.000 claims description 17
- 230000010365 information processing Effects 0.000 description 32
- 238000003860 storage Methods 0.000 description 27
- 238000010586 diagram Methods 0.000 description 26
- 238000004891 communication Methods 0.000 description 19
- 238000009826 distribution Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000009423 ventilation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/254—Analysis of motion involving subtraction of images
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
図1は、本実施の形態に係る情報処理システムの概要を説明するための模式図である。本実施の形態に係る情報処理システムでは、空調設備101の施行又は修理等の作業を行う作業者102は、自身の頭部に装着したヘッドセット等に備えられたカメラ103にて作業の様子を撮影する。なお本実施の形態においては、作業者102が装着したヘッドセット等のウェアラブルデバイスに搭載されたカメラ103を用いて撮影が行われるものとするが、これに限るものではなく、空調設備101及び作業者102の周辺にカメラ103を設置して作業を撮影してもよい。また、図1に示した空調設備101はエアコン(エアーコンディショナー)の室内機であるが、これに限るものではなく、空調設備101は例えばエアコンの室外機、換気装置、サーキュレータ、空気清浄機、暖房器具又は除湿乾燥機等の種々の空調関連機器であってよい。またカメラ103により、空調関連機器以外の様々な機器の施工又は修理等の作業を撮影してよく、これらの機器について施工又は修理等以外の様々な作業を撮影してよい。
図2は、本実施の形態に係るサーバ装置1の構成を示すブロック図である。本実施の形態に係るサーバ装置1は、処理部11、記憶部(ストレージ)12及び通信部(トランシーバ)13等を備えて構成されている。なお本実施の形態においては、1つのサーバ装置にて処理が行われるものとして説明を行うが、複数のサーバ装置が分散して処理を行ってもよい。
図4は、本実施の形態に係る情報処理システムが行う場面変化位置及びキーフレームの検出処理を説明するための模式図である。本実施の形態に係る情報処理システムが扱う動画像は、図4の上段に示すように、例えば1秒間に数十枚程度のフレーム(静止画像)を連ねたものである。また動画像は、複数の場面に分割され得る。本実施の形態において場面は、例えば映像制作においてシーン又はショット等と呼ばれ得るものであり、動画像に写された人又は物等の動作が一区切りする単位である。また本実施の形態において1つの場面は、図4の下段に示すように、少なくとも1つのキーフレームを含む複数のフレームを連ねたものであり、最初のフレーム及び最後のフレームが場面変化位置として扱われる。
カメラ103から取得した動画像に対して、サーバ装置1は、まず動画像に含まれる場面変化位置の候補を検出する処理を行う。本実施の形態に係るサーバ装置1は、動画像を構成する複数のフレームについて、時系列的に連続する2つのフレームの差異を示す値を算出し、算出した値が所定の閾値を超えるか否かを判定する。サーバ装置1は、フレームの差異を示す値が閾値を超える場合に、連続する2つのフレームの位置を場面変化位置の候補とする。本実施の形態においてサーバ装置1は、フレームの差異を示す値として、HSLヒストグラムのバタチャリヤ距離と、ハッシュ値の距離との2つの値を算出する。
サーバ装置1は、カメラ103が撮影した動画像に含まれる全てのフレームから、キーフレームの候補となる候補フレームを検出する処理を行う。なお候補フレームの検出処理は、上記の場面変化位置の検出処理より先に行われてもよく、後に行われてもよく、同時に行われてもよい。本実施の形態に係るサーバ装置1は、動画像を構成する複数のフレームについて、エッジを抽出する画像処理を行う。
サーバ装置1は、動画像に含まれる全フレームから検出した候補フレームについて、例えば所定時間内に複数の候補フレームが存在する場合、これら複数の候補フレームの中から類似する候補フレームを除去することによって、最終的なキーフレームを決定する処理を行う。なおサーバ装置1は、キーフレームを決定する処理を候補フレームを検出する処理の後に行うが、キーフレームを決定する処理を場面変化位置の候補を検出する処理の前に行ってもよく、後に行ってもよく、並列的に行ってもよい。
動画像から場面変化位置の候補を検出し、且つ、キーフレームを検出した後、サーバ装置1は、場面変化位置の候補の中から、場面変化位置を決定する処理を行う。本実施の形態においてサーバ装置1は、場面変化位置の候補とキーフレームとの時系列的な順序関係に基づいて、場面変化位置の候補から最終的な場面変化位置を決定することにより、動画像に含まれる場面を決定する。本実施の形態において動画像の場面は、図4の下段に示したように、少なくとも1つのキーフレームを含むことを条件としている。
本実施の形態に係る情報処理システムでは、サーバ装置1が上述の処理により決定した動画像の場面変化位置及びキーフレームに関する情報を、この動画像に対応付けて動画像DB12bに記憶している。また動画像DB12bには、例えば動画像の撮影者が付与した動画像のタイトル(表題)又は説明等の文字列、動画像の撮影日時、並びに、動画像の撮影場所等の様々な情報が対応付けて記憶される。また本実施の形態において動画像DB12bには、空調設備101の施工又は修理等の作業を撮影した動画像が記憶され、動画像には施工又は修理等の作業の対象となった空調設備101の名称又は商品番号等の文字情報が対応付けて記憶される。
本実施の形態に係る情報処理システムでは、上述の処理により決定した動画像の場面変化位置及びキーフレームに基づいて、動画像のダイジェスト動画像(要約動画像)を生成する処理をサーバ装置1が行う。サーバ装置1は、動画像から一又は複数の部分動画像を抽出して(切り出して)連結することによって、元の動画像よりも再生時間が短いダイジェスト動画像を生成する。
本実施の形態に係る情報処理システムでは、動画像のタイトル、動画像に含まれる場面のタイトル、又は、動画像に含まれるキーフレームのタイトル等を、機械学習がなされた学習モデル、いわゆるAI(Artificial Intelligence)を用いてサーバ装置1が自動生成することができる。図15は、本実施の形態に係るサーバ装置1が用いる学習モデルを説明するための模式図である。本実施の形態に係るサーバ装置1が用いる学習モデルは、動画像に含まれるキーフレームを入力として受け付け、このキーフレームに写されている空調設備101の施工又は修理の種別を分類結果として出力するよう予め機械学習がなされた学習モデルである。
以上の構成の本実施の形態に係る情報処理システムでは、カメラ103が撮影した動画像からサーバ装置1が場面変化位置の候補を検出し、動画像を構成する複数のフレームの中から場面のキーフレーム(主要フレーム)となり得る候補フレームを検出し、候補フレームの中からキーフレームを決定し、場面変化位置の候補及びキーフレームの時系列的な順序に基づいて、場面変化位置の候補の中から場面変化位置を決定する。これにより本実施の形態に係る情報処理システムは、動画像から場面の変化を精度よく検出することが期待できる。
3 端末装置
11 処理部
11a 場面変化位置候補検出部
11b 候補フレーム検出部
11c キーフレーム決定部(主要フレーム決定部)
11d 場面変化位置決定部
11e DB処理部
12 記憶部
12a サーバプログラム(コンピュータプログラム)
12b 動画像DB
13 通信部
31 処理部
31a 検索処理部
31b 表示処理部
32 記憶部
32a プログラム
33 通信部
34 表示部
35 操作部
101 空調設備(空調関連機器)
102 作業者
103 カメラ
N ネットワーク
Claims (12)
- 画像処理装置が、
動画像から場面変化位置の候補を検出し、
前記動画像を構成するフレームの中から、場面の主要フレームとなり得る候補フレームを検出し、
前記候補フレームの中から主要フレームを決定し、
場面変化位置の候補及び主要フレームの時系列的な順序に基づき、
時系列的に並ぶ2つの場面変化位置の候補の間に主要フレームが存在しない場合、前記2つの場面変化位置を候補からいずれか一方を除外して、場面変化位置を決定し、
時系列的に並び且つ類似する2つの主要フレームの間に場面変化位置の候補が存在する場合、当該場面変化位置を候補から除外して、場面変化位置を決定することで、
場面変化位置の候補の中から場面変化位置を決定する、
画像処理方法。 - 各フレームの統計値を算出し、
2つのフレームの統計値の差異に基づいて、場面変化位置の候補を検出する、
請求項1に記載の画像処理方法。 - 各フレームのハッシュ値を算出し、
2つのフレームのハッシュ値の差異に基づいて、場面変化位置の候補を検出する、
請求項1に記載の画像処理方法。 - 各フレームからエッジを抽出し、
2つのフレームの間のエッジの変化に基づいて、候補フレームを検出する、
請求項1に記載の画像処理方法。 - 候補フレームから特徴点を抽出し、
複数の候補フレームの間での特徴点の比較結果に基づいて、候補フレームを除外することで、候補フレームの中から主要フレームを決定する、
請求項1に記載の画像処理方法。 - 決定した場面変化位置及び主要フレームに関する情報を前記動画像に対応付けて記憶し、
場面変化位置又は主要フレームの選択を受け付け、
選択された場面変化位置又は主要フレームに基づく前記動画像の再生を行う、
請求項1に記載の画像処理方法。 - 決定した場面変化位置及び主要フレームに関する情報と、前記動画像に関する文字情報とを対応付けて記憶する、
請求項6に記載の画像処理方法。 - 空調関連機器の施工又は修理の作業を撮影した動画像を取得し、
取得した動画像について場面変化位置及び主要フレームを決定し、
決定した場面変化位置及び主要フレームに関する情報と、空調関連機器に関する文字情報とを対応付けて記憶する、
請求項7に記載の画像処理方法。 - 決定した場面変化位置及び主要フレームに基づいて前記動画像から部分動画像を抽出し、
抽出した部分動画像を結合して要約動画像を生成する、
請求項1に記載の画像処理方法。 - 決定した主要フレームを、空調関連機器の施工又は修理の作業を撮影した動画像の主要フレームの入力に対して施工又は修理の種別を分類する学習モデルへ入力し、
当該学習モデルが出力する分類結果を取得し、
取得した分類結果に基づいて、前記動画像又は前記動画像に含まれる場面の表題を決定する、
請求項1に記載の画像処理方法。 - コンピュータに、
動画像から場面変化位置の候補を検出し、
前記動画像を構成するフレームの中から、場面の主要フレームとなり得る候補フレームを検出し、
前記候補フレームの中から主要フレームを決定し、
場面変化位置の候補及び主要フレームの時系列的な順序に基づき、
時系列的に並ぶ2つの場面変化位置の候補の間に主要フレームが存在しない場合、前記2つの場面変化位置を候補からいずれか一方を除外して、場面変化位置を決定し、
時系列的に並び且つ類似する2つの主要フレームの間に場面変化位置の候補が存在する場合、当該場面変化位置を候補から除外して、場面変化位置を決定することで、
場面変化位置の候補の中から場面変化位置を決定する
処理を実行させる、コンピュータプログラム。 - 動画像から場面変化位置の候補を検出する場面変化位置候補検出部と、
前記動画像を構成するフレームの中から、場面の主要フレームとなり得る候補フレームを検出する候補フレーム検出部と、
前記候補フレームの中から主要フレームを決定する主要フレーム決定部と、
場面変化位置の候補及び主要フレームの時系列的な順序に基づき、時系列的に並ぶ2つの場面変化位置の候補の間に主要フレームが存在しない場合、前記2つの場面変化位置を候補からいずれか一方を除外して、場面変化位置を決定し、時系列的に並び且つ類似する2つの主要フレームの間に場面変化位置の候補が存在する場合、当該場面変化位置を候補から除外して、場面変化位置を決定することで、場面変化位置の候補の中から場面変化位置を決定する場面変化位置決定部と
を備える、画像処理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022101248A JP7429016B2 (ja) | 2022-06-23 | 2022-06-23 | 画像処理方法、コンピュータプログラム及び画像処理装置 |
PCT/JP2023/022855 WO2023249034A1 (ja) | 2022-06-23 | 2023-06-21 | 画像処理方法、コンピュータプログラム及び画像処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022101248A JP7429016B2 (ja) | 2022-06-23 | 2022-06-23 | 画像処理方法、コンピュータプログラム及び画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2024002193A JP2024002193A (ja) | 2024-01-11 |
JP7429016B2 true JP7429016B2 (ja) | 2024-02-07 |
Family
ID=89379977
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022101248A Active JP7429016B2 (ja) | 2022-06-23 | 2022-06-23 | 画像処理方法、コンピュータプログラム及び画像処理装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7429016B2 (ja) |
WO (1) | WO2023249034A1 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001527304A (ja) | 1997-12-19 | 2001-12-25 | シャープ株式会社 | ディジタル動画の階層的要約及び閲覧方法 |
JP2005151069A (ja) | 2003-11-14 | 2005-06-09 | Funai Electric Co Ltd | 記録再生装置 |
WO2007039995A1 (ja) | 2005-09-30 | 2007-04-12 | Pioneer Corporation | ダイジェスト作成装置およびそのプログラム |
JP2008109290A (ja) | 2006-10-24 | 2008-05-08 | Sony Corp | 内容文字情報取得方法、内容文字情報取得プログラム、内容文字情報取得装置及び映像コンテンツ記録装置 |
US20200349357A1 (en) | 2018-01-17 | 2020-11-05 | Group Ib, Ltd | Method of creating a template of original video content |
JP2021131738A (ja) | 2020-02-20 | 2021-09-09 | 株式会社安藤・間 | 工程判別システム、及び工程判別方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10257436A (ja) * | 1997-03-10 | 1998-09-25 | Atsushi Matsushita | 動画像の自動階層構造化方法及びこれを用いたブラウジング方法 |
-
2022
- 2022-06-23 JP JP2022101248A patent/JP7429016B2/ja active Active
-
2023
- 2023-06-21 WO PCT/JP2023/022855 patent/WO2023249034A1/ja unknown
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001527304A (ja) | 1997-12-19 | 2001-12-25 | シャープ株式会社 | ディジタル動画の階層的要約及び閲覧方法 |
JP2005151069A (ja) | 2003-11-14 | 2005-06-09 | Funai Electric Co Ltd | 記録再生装置 |
WO2007039995A1 (ja) | 2005-09-30 | 2007-04-12 | Pioneer Corporation | ダイジェスト作成装置およびそのプログラム |
JP2008109290A (ja) | 2006-10-24 | 2008-05-08 | Sony Corp | 内容文字情報取得方法、内容文字情報取得プログラム、内容文字情報取得装置及び映像コンテンツ記録装置 |
US20200349357A1 (en) | 2018-01-17 | 2020-11-05 | Group Ib, Ltd | Method of creating a template of original video content |
JP2021131738A (ja) | 2020-02-20 | 2021-09-09 | 株式会社安藤・間 | 工程判別システム、及び工程判別方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2024002193A (ja) | 2024-01-11 |
WO2023249034A1 (ja) | 2023-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yao et al. | Oscar: On-site composition and aesthetics feedback through exemplars for photographers | |
US8995725B2 (en) | On-site composition and aesthetics feedback through exemplars for photographers | |
CN101523412B (zh) | 基于人脸的图像聚类 | |
US20160078904A1 (en) | Content management system, management content generating method, management content play back method, and recording medium | |
CN109063611B (zh) | 一种基于视频语义的人脸识别结果处理方法和装置 | |
US20070074244A1 (en) | Method and apparatus for presenting content of images | |
US8345742B2 (en) | Method of processing moving picture and apparatus thereof | |
JP2006172437A (ja) | データのストリームにおけるセグメント境界の位置の決定方法、データサブセットを近隣のデータサブセットと比較してセグメント境界を決定する方法、コンピュータによって実行可能な命令のプログラム、ならびにデータのストリームにおける境界及び非境界を識別するシステム又は装置 | |
US9721613B2 (en) | Content management system, management content generation method, management content reproduction method, program and recording medium | |
CN111986180B (zh) | 基于多相关帧注意力机制的人脸伪造视频检测方法 | |
TWI764240B (zh) | 智慧型影片編輯方法及系統 | |
CN111209897A (zh) | 视频处理的方法、装置和存储介质 | |
CN105095853A (zh) | 图像处理装置及图像处理方法 | |
CN108921023A (zh) | 一种确定低质量人像数据的方法及装置 | |
Ma et al. | An universal image attractiveness ranking framework | |
KR102037997B1 (ko) | 전자 장치 및 콘텐츠 생성 방법 | |
CN106682669A (zh) | 一种图像处理方法及移动终端 | |
JP2006217046A (ja) | 映像インデックス画像生成装置及び映像のインデックス画像を生成するプログラム | |
JP6410427B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP7429016B2 (ja) | 画像処理方法、コンピュータプログラム及び画像処理装置 | |
Cheng et al. | Re-compose the image by evaluating the crop on more than just a score | |
JP7211495B2 (ja) | 教師データ生成装置 | |
KR102512468B1 (ko) | 동영상 콘텐츠에 대한 시청자 반응 분석 장치 및 방법 | |
CN111626409B (zh) | 一种图像质量检测的数据生成方法 | |
US20230162501A1 (en) | Image analysis system, image analysis method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231002 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240118 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7429016 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |