JP7424345B2 - 装置、方法およびプログラム - Google Patents
装置、方法およびプログラム Download PDFInfo
- Publication number
- JP7424345B2 JP7424345B2 JP2021080964A JP2021080964A JP7424345B2 JP 7424345 B2 JP7424345 B2 JP 7424345B2 JP 2021080964 A JP2021080964 A JP 2021080964A JP 2021080964 A JP2021080964 A JP 2021080964A JP 7424345 B2 JP7424345 B2 JP 7424345B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- evaluation
- compressed image
- compression
- captured image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 80
- 238000011156 evaluation Methods 0.000 claims description 237
- 238000007906 compression Methods 0.000 claims description 234
- 230000006835 compression Effects 0.000 claims description 234
- 238000012545 processing Methods 0.000 claims description 125
- 230000008569 process Effects 0.000 claims description 68
- 238000003384 imaging method Methods 0.000 claims description 67
- 238000012544 monitoring process Methods 0.000 claims description 64
- 238000003860 storage Methods 0.000 claims description 32
- 230000000694 effects Effects 0.000 claims description 24
- 230000004044 response Effects 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 description 41
- 230000005540 biological transmission Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000010865 sewage Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/162—User input
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/167—Position within a video image, e.g. region of interest [ROI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Closed-Circuit Television Systems (AREA)
- Image Analysis (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Description
[先行技術文献]
[特許文献]
[特許文献1] 国際公開第2012-160902号
図1は、本実施形態に係る警備システム1を示す。警備システム1は、1または複数の監視カメラ2と、トランスコーダ3と、監視端末4とを備える。
各監視カメラ2は、カメラの一例であり、撮像領域の撮像を行う。各監視カメラ2は、撮像された画像(撮像画像とも称する)をトランスコーダ3に供給してよい。画像は動画像であってよく、監視カメラ2は、常時、撮像を行って動画像(映像とも称する)データを生成してよい。例えば、各監視カメラ2は30fpsで撮像を行ってよい。撮像画像の各フレームには、タイムスタンプが付加されてよい。なお、画像は静止画像であってもよい。この場合に、監視カメラ2は、定期的なタイミングで撮像を行い、静止画像を生成してよい。監視カメラ2は可視光のカメラであってもよいし、赤外線や紫外線(一例としてX線)のカメラであってもよい。警備システム1に複数の監視カメラ2が具備される場合には、各監視カメラ2は、互いに種類(一例としてメーカや型番)が異なってよい。
トランスコーダ3は、装置の一例であり、監視カメラ2と、監視端末4との間に配置される。トランスコーダ3は、各監視カメラ2からの撮像画像を圧縮して監視端末4に供給してよい。トランスコーダ3は画像取得部30と、圧縮部31と、通信部32と、学習処理部33と、記憶部35と、供給部36とを有する。
画像取得部30は、撮像画像を取得する。画像取得部30は、複数の監視カメラ2から撮像画像を取得してよい。なお、本実施形態では一例として、画像取得部30は各監視カメラ2と直接接続されているが、通信ネットワーク10を介して接続されてもよい。
圧縮部31は、撮像画像を圧縮して圧縮画像を生成する。圧縮部31は、圧縮パラメータ値を変更して逐次、圧縮画像を生成してよい。また、圧縮部31は、後述の供給部36から圧縮パラメータ値が供給される場合には、当該圧縮パラメータ値を適用して圧縮画像を生成してよい。圧縮部31は、動画像としての撮像画像に含まれる各フレーム内で圧縮を行ってもよいし、連続するフレーム内で圧縮を行ってもよい。圧縮パラメータ値は、圧縮率、解像度、階調数、および、フレームレートの少なくとも1つを示す値であってよい。圧縮画像の各フレームには、対応する撮像画像のフレームと同じタイムスタンプが付加されてよい。
通信部32は、通信ネットワーク10を介して監視端末4と通信する。通信部32は、送信部320と、評価取得部321とを有する。
送信部320は、圧縮画像を監視端末4に送信する。送信部320は、圧縮部31から供給される圧縮画像を逐次、監視端末4に供給してよい。
評価取得部321は、ユーザから圧縮画像の見やすさに応じた評価を取得する。ユーザは、監視端末4を操作するオペレータや警備員であってよい。また、ユーザは、色弱者や弱視者であってもよい。評価取得部321は、監視端末4を介して評価を取得してよい。
記憶部35は、種々の情報を記憶する。記憶部35は、1または複数のモデル350と、1または複数の画像ファイル351とを記憶してよい。
学習処理部33は、評価取得部321によって取得された評価と、当該評価の対象となった圧縮画像の生成で適用された圧縮パラメータ値と、当該圧縮画像に対応する撮像画像とを含む学習データを用いてモデル350の学習処理を行う。なお、評価の対象となった圧縮画像の生成で適用された圧縮パラメータ値は、評価取得部321から評価と対応付けて供給された圧縮パラメータ値であってよい。評価の対象となった圧縮画像に対応する撮像画像は、圧縮部31から供給される撮像画像のうち、評価取得部321から評価と対応付けて供給されたカメラIDおよびタイムスタンプに対応する撮像画像であってよい。
供給部36は、学習処理部33により学習処理が行われたモデル350に対し、画像取得部30により新たに取得された撮像画像を供給する。監視カメラ2ごとのモデル350が記憶部35に記憶されている場合には、供給部36は、撮像画像に付加されたカメラIDに対応するモデル350に対し、当該撮像画像を供給してよい。
監視端末4は、監視カメラ2を用いて監視領域の監視を行う。監視端末4は、通信部40と、表示部42と、操作入力部43とを有する。
通信部40は、通信ネットワーク10を介してトランスコーダ3と通信する。通信部40は、トランスコーダから受信した圧縮画像を表示部42に供給してよい。また、通信部40は、操作入力部43から供給される、操作内容をトランスコーダ3に送信してよい。
表示部42は、圧縮画像を表示する。複数の監視カメラ2の圧縮画像が供給される場合には、表示部42は、これらの圧縮画像を併せて表示してよい。
操作入力部43は、ユーザから種々の操作入力を受ける。操作入力部43は、入力された操作内容を通信部40に供給してよい。
[2.1.学習段階]
図2は、本実施形態に係る警備システム1の学習段階での動作を示す。警備システム1は、ステップS11~S39の処理を行うことにより、監視を行いつつモデル350の学習を行う。
図3は、本実施形態に係る警備システム1の運用段階での動作を示す。警備システム1は、ステップS41~S71の処理を行うことにより、学習済みのモデル350を用いて監視を行う。
上記の実施形態においては、圧縮部31は撮像画像の全体に共通の圧縮パラメータ値を適用して圧縮画像を生成することとして説明したが、撮像画像を領域ごとに圧縮して圧縮画像を生成してもよい。例えば、圧縮部31は、撮像画像のフレームの一部の領域のみを圧縮してもよいし、フレームの領域ごとに別々の圧縮パラメータ値を適用して撮像画像を圧縮してもよい。圧縮部31は、圧縮に適用した圧縮パラメータ値と、その圧縮パラメータ値による圧縮領域を示す情報とを圧縮画像に付加して送信部320や記憶部35、学習処理部33に供給してよい。なお、フレーム内の領域は、被写体のエッジから特定される領域でもよいし、色や輝度などの画像情報から特定される領域でもよいし、フレーム内の座標で特定される領域であってもよい。
なお、上記の実施形態においては、トランスコーダ3は記憶部35および供給部36を有することとして説明したが、これらの何れかを有しないこととしてもよい。例えば、トランスコーダ3は記憶部35を有しない場合には、学習処理部33は、外部接続された記憶装置内のモデル350に学習処理を行ってよい。
2 監視カメラ
3 トランスコーダ
4 監視端末
10 通信ネットワーク
30 画像取得部
31 圧縮部
32 通信部
33 学習処理部
35 記憶部
36 供給部
40 通信部
42 表示部
43 操作入力部
320 送信部
321 評価取得部
350 モデル
351 画像ファイル
2200 コンピュータ
2201 DVD-ROM
2210 ホストコントローラ
2212 CPU
2214 RAM
2216 グラフィックコントローラ
2218 ディスプレイデバイス
2220 入/出力コントローラ
2222 通信インタフェース
2224 ハードディスクドライブ
2226 DVD-ROMドライブ
2230 ROM
2240 入/出力チップ
2242 キーボード
Claims (20)
- 撮像画像を取得する画像取得部と、
撮像画像を圧縮して圧縮画像を生成する圧縮部と、
ユーザから圧縮画像の見やすさに応じた評価を取得する評価取得部と、
前記評価と、当該評価の対象となった圧縮画像に対応する撮像画像と、当該圧縮画像の生成で適用された圧縮パラメータ値とを含む学習データを用いて、新たな撮像画像が入力されることに応じて、当該撮像画像の圧縮で適用するべき圧縮パラメータ値を出力するモデルの学習処理を行う学習処理部と、
を備え、
前記学習処理部は、圧縮で適用するべき圧縮パラメータ値が、肯定的な前記評価の対象となった圧縮画像の圧縮パラメータ値と、否定的な前記評価の対象となった圧縮画像の圧縮パラメータ値との間となるよう、前記モデルの学習処理を行う、装置。 - 撮像画像を取得する画像取得部と、
撮像画像を領域ごとに圧縮して圧縮画像を生成する圧縮部と、
圧縮画像内でユーザにより指定された少なくとも一部の領域に対して、ユーザから圧縮画像の当該少なくとも一部の領域の見やすさに応じた評価を取得する評価取得部と、
圧縮画像の少なくとも一部の領域に対する前記評価と、当該評価の対象となった圧縮画像に対応する撮像画像のうち当該評価の対象となった当該少なくとも一部の領域と、当該圧縮画像の当該少なくとも一部の領域の生成で適用された圧縮パラメータ値とを含む学習データを用いて、新たな撮像画像が入力されることに応じて、当該撮像画像の少なくとも一部の領域の圧縮で適用するべき圧縮パラメータ値を出力するモデルの学習処理を行う学習処理部と、
を備える装置。
- 撮像画像を取得する画像取得部と、
撮像画像を圧縮して圧縮画像を生成する圧縮部と、
ユーザから圧縮画像の見やすさに応じた評価を取得する評価取得部と、
前記評価と、当該評価の対象となった圧縮画像に対応する撮像画像と、当該圧縮画像の生成で適用された圧縮パラメータ値とを含む学習データを用いて、新たな撮像画像が入力されることに応じて、当該撮像画像の圧縮で適用するべき圧縮パラメータ値を出力するモデルの学習処理を行う学習処理部と、
前記圧縮画像を監視端末に送信する送信部と、
前記学習処理部により学習処理が行われた前記モデルに対し、前記画像取得部により新たに取得された撮像画像を供給する供給部と、
撮像画像を記憶する記憶部と、
を備え、
前記評価取得部は、前記監視端末を介して前記評価を取得し、
前記圧縮部は、前記供給部によって新たな撮像画像が供給されたことに応じて前記モデルから出力される圧縮パラメータ値を適用して、当該新たな撮像画像から圧縮画像を生成し、
前記送信部は、圧縮画像に対して否定的な前記評価が前記評価取得部により取得されたことに応じて、当該圧縮画像に対応する撮像画像を前記監視端末に送信する、装置。 - 前記記憶部は、撮像画像と圧縮画像とを記憶し、撮像画像を圧縮画像よりも短い期間の経過後に消去する、請求項3に記載の装置。
- 前記圧縮部は、基準撮像条件とは異なる他の撮像条件で撮像された撮像画像に対し、前記基準撮像条件に応じた画像効果を適用して前記圧縮画像を生成し、
前記送信部は、前記圧縮画像と、前記他の撮像条件を示す識別情報とを前記監視端末に送信する、請求項3または4に記載の装置。 - 当該装置は、撮像画像を撮像する監視カメラと、前記監視端末との間に配置されるトランスコーダである、請求項3から5の何れか一項に記載の装置。
- 前記評価取得部は、ユーザから圧縮画像の見やすさに応じた、当該ユーザによる評価を取得する、請求項1から6のいずれか一項に記載の装置。
- 前記評価取得部は、複数の圧縮画像について肯定的な評価と、否定的な評価とを取得し、
前記学習処理部は、新たな撮像画像が前記モデルに入力されることに応じて、否定的ではない評価の圧縮画像を生成するために適用するべき圧縮パラメータ値が当該モデルから出力されるように学習処理を行う、請求項1から7の何れか一項に記載の装置。 - 前記評価取得部は、圧縮画像の見やすさと、圧縮画像のデータ量の小ささとに応じた前記評価を取得する、請求項1から8の何れか一項に記載の装置。
- 前記圧縮部は、圧縮パラメータ値を変更して逐次、圧縮画像を生成する、請求項1から9の何れか一項に記載の装置。
- 前記圧縮部は、同じ撮像画像から互いに異なる複数の圧縮画像を生成し、
前記評価取得部は、前記複数の圧縮画像の間での見やすさの相対評価を、前記評価として取得する、請求項1から10の何れか一項に記載の装置。 - 前記画像取得部は、基準撮像条件で撮像されて、当該基準撮像条件とは異なる他の撮像条件に応じた画像効果が適用された画像を前記撮像画像として取得し、
前記圧縮部は、前記撮像画像に対し、前記基準撮像条件に応じた画像効果を適用して前記圧縮画像を生成し、
前記評価取得部は、前記圧縮画像の見やすさと、当該圧縮画像、および、前記基準撮像条件で撮像された画像の近似度とに応じた前記評価を取得する、請求項1から10の何れか一項に記載の装置。 - 前記画像取得部は、複数のカメラから撮像画像を取得し、
前記評価取得部は、カメラごとに前記評価を取得し、
前記学習処理部は、カメラごとに異なる前記モデルの学習処理を行う、請求項1から12の何れか一項に記載の装置。 - 前記学習処理部は、一のカメラについての学習済みのモデルを、他のカメラについての学習用のモデルとして用いる、請求項13に記載の装置。
- 前記画像取得部は、複数のカメラから撮像画像を取得し、
前記学習処理部は、前記複数のカメラの間で共通の前記モデルの学習処理を行う、請求項1から12の何れか一項に記載の装置。 - 前記評価取得部は、ユーザごとに前記評価を取得し、
前記学習処理部は、ユーザごとに異なる前記モデルの学習処理を行う、請求項1から15の何れか一項に記載の装置。 - 前記学習処理部は、一のユーザについての学習済みのモデルを、他のユーザについての学習用のモデルとして用いる、請求項16に記載の装置。
- 前記学習処理部は、複数のユーザの間で共通の前記モデルの学習処理を行う、請求項1から15の何れか一項に記載の装置。
- 撮像画像を取得する画像取得段階と、
撮像画像を圧縮して圧縮画像を生成する圧縮段階と、
ユーザから圧縮画像の見やすさに応じた評価を取得する評価取得段階と、
前記評価と、当該評価の対象となった圧縮画像に対応する撮像画像と、当該圧縮画像の生成で適用された圧縮パラメータ値とを含む学習データを用いて、新たな撮像画像が入力されることに応じて、当該撮像画像の圧縮で適用するべき圧縮パラメータ値を出力するモデルの学習処理を行う学習処理段階と、
を備え、
前記学習処理段階では、圧縮で適用するべき圧縮パラメータ値が、肯定的な前記評価の対象となった圧縮画像の圧縮パラメータ値と、否定的な前記評価の対象となった圧縮画像の圧縮パラメータ値との間となるよう、前記モデルの学習処理を行う、方法。 - コンピュータを、
撮像画像を取得する画像取得部と、
撮像画像を圧縮して圧縮画像を生成する圧縮部と、
ユーザから圧縮画像の見やすさに応じた評価を取得する評価取得部と、
前記評価と、当該評価の対象となった圧縮画像に対応する撮像画像と、当該圧縮画像の生成で適用された圧縮パラメータ値とを含む学習データを用いて、新たな撮像画像が入力されることに応じて、当該撮像画像の圧縮で適用するべき圧縮パラメータ値を出力するモデルの学習処理を行う学習処理部
として機能させ、
前記学習処理部は、圧縮で適用するべき圧縮パラメータ値が、肯定的な前記評価の対象となった圧縮画像の圧縮パラメータ値と、否定的な前記評価の対象となった圧縮画像の圧縮パラメータ値との間となるよう、前記モデルの学習処理を行う、プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021080964A JP7424345B2 (ja) | 2021-05-12 | 2021-05-12 | 装置、方法およびプログラム |
EP22172278.8A EP4090016A3 (en) | 2021-05-12 | 2022-05-09 | Apparatus, method and program |
US17/740,353 US20220368886A1 (en) | 2021-05-12 | 2022-05-10 | Apparatus, method, and computer readable medium |
CN202210517331.7A CN115345820A (zh) | 2021-05-12 | 2022-05-12 | 装置、方法及计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021080964A JP7424345B2 (ja) | 2021-05-12 | 2021-05-12 | 装置、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022174918A JP2022174918A (ja) | 2022-11-25 |
JP7424345B2 true JP7424345B2 (ja) | 2024-01-30 |
Family
ID=81595662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021080964A Active JP7424345B2 (ja) | 2021-05-12 | 2021-05-12 | 装置、方法およびプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220368886A1 (ja) |
EP (1) | EP4090016A3 (ja) |
JP (1) | JP7424345B2 (ja) |
CN (1) | CN115345820A (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007281634A (ja) | 2006-04-04 | 2007-10-25 | Hitachi Ltd | 画像処理装置及び動画像符号化方法。 |
JP2014116890A (ja) | 2012-12-12 | 2014-06-26 | Mitsubishi Electric Corp | 画像符号化装置 |
WO2017094847A1 (ja) | 2015-12-02 | 2017-06-08 | 日本電信電話株式会社 | 体感品質最適化装置、ネットワーク品質推定装置、モバイル端末、体感品質最適化方法、ネットワーク品質推定方法、及びプログラム |
JP2018026654A (ja) | 2016-08-09 | 2018-02-15 | 三菱電機株式会社 | 画質評価装置及び画像処理装置 |
US20190026555A1 (en) | 2017-07-18 | 2019-01-24 | Facebook, Inc. | Image compression using content categories |
CN109714557A (zh) | 2017-10-25 | 2019-05-03 | 中国移动通信集团公司 | 视频通话的质量评估方法、装置、电子设备和存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2795147B2 (ja) * | 1993-12-24 | 1998-09-10 | 日本電気株式会社 | 画質評価装置 |
US9842261B2 (en) | 2011-05-24 | 2017-12-12 | Nissan Motor Co., Ltd. | Vehicle monitoring device and method of monitoring vehicle |
US9609323B2 (en) * | 2014-06-26 | 2017-03-28 | Allego Inc. | Iterative video optimization for data transfer and viewing |
GB2558644A (en) * | 2017-01-13 | 2018-07-18 | Nokia Technologies Oy | Video encoding |
-
2021
- 2021-05-12 JP JP2021080964A patent/JP7424345B2/ja active Active
-
2022
- 2022-05-09 EP EP22172278.8A patent/EP4090016A3/en active Pending
- 2022-05-10 US US17/740,353 patent/US20220368886A1/en active Pending
- 2022-05-12 CN CN202210517331.7A patent/CN115345820A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007281634A (ja) | 2006-04-04 | 2007-10-25 | Hitachi Ltd | 画像処理装置及び動画像符号化方法。 |
JP2014116890A (ja) | 2012-12-12 | 2014-06-26 | Mitsubishi Electric Corp | 画像符号化装置 |
WO2017094847A1 (ja) | 2015-12-02 | 2017-06-08 | 日本電信電話株式会社 | 体感品質最適化装置、ネットワーク品質推定装置、モバイル端末、体感品質最適化方法、ネットワーク品質推定方法、及びプログラム |
JP2018026654A (ja) | 2016-08-09 | 2018-02-15 | 三菱電機株式会社 | 画質評価装置及び画像処理装置 |
US20190026555A1 (en) | 2017-07-18 | 2019-01-24 | Facebook, Inc. | Image compression using content categories |
CN109714557A (zh) | 2017-10-25 | 2019-05-03 | 中国移动通信集团公司 | 视频通话的质量评估方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
EP4090016A2 (en) | 2022-11-16 |
JP2022174918A (ja) | 2022-11-25 |
EP4090016A3 (en) | 2023-02-01 |
US20220368886A1 (en) | 2022-11-17 |
CN115345820A (zh) | 2022-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Third-eye: A mobilephone-enabled crowdsensing system for air quality monitoring | |
CN103678472B (zh) | 用于经由社交媒体内容检测事件的方法和系统 | |
JP6425856B1 (ja) | ビデオ録画方法、サーバー、システム及び記憶媒体 | |
JP4702877B2 (ja) | 表示装置 | |
CN110853033B (zh) | 基于帧间相似度的视频检测方法和装置 | |
CN112424769A (zh) | 用于地理位置预测的系统和方法 | |
CN113807276B (zh) | 基于优化的YOLOv4模型的吸烟行为识别方法 | |
US20220172476A1 (en) | Video similarity detection method, apparatus, and device | |
Cheng et al. | Smoke detection and trend prediction method based on Deeplabv3+ and generative adversarial network | |
KR20190079047A (ko) | 육안 인식 검사원의 부하경감을 위한 등급별 영상인식 기술을 이용한 cctv 영상내 의심물체 부분검사 지원 시스템 및 방법 | |
JP7205457B2 (ja) | 装置、システム、方法およびプログラム | |
CN103888731A (zh) | 枪机-球机混合视频监控的结构化描述装置及系统 | |
CN114943937A (zh) | 行人重识别方法、装置、存储介质及电子设备 | |
CN112907138B (zh) | 一种从局部到整体感知的电网场景预警分类方法及系统 | |
JP7424345B2 (ja) | 装置、方法およびプログラム | |
JP2007158496A (ja) | 地図連携映像監視方法及びその装置 | |
US9082049B2 (en) | Detecting broken lamps in a public lighting system via analyzation of satellite images | |
KR20210090484A (ko) | 촬영영상을 이용한 계량기 무인 원격 검침 시스템 | |
CN116797864A (zh) | 基于智能镜子的辅助化妆方法、装置、设备及存储介质 | |
CN114390200B (zh) | 相机作弊识别方法、装置、设备及存储介质 | |
JP2022174948A (ja) | 装置、監視システム、方法およびプログラム | |
US10885343B1 (en) | Repairing missing frames in recorded video with machine learning | |
CN114140879A (zh) | 基于多头级联注意网络与时间卷积网络的行为识别方法及装置 | |
JP2020160762A (ja) | 情報処理装置、コンテンツ制御装置、情報処理方法、及びプログラム | |
CN115760886B (zh) | 基于无人机鸟瞰图的地块划分方法、装置及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220719 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230327 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230502 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231013 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20231025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240101 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7424345 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |