JP2018101406A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2018101406A5 JP2018101406A5 JP2017182561A JP2017182561A JP2018101406A5 JP 2018101406 A5 JP2018101406 A5 JP 2018101406A5 JP 2017182561 A JP2017182561 A JP 2017182561A JP 2017182561 A JP2017182561 A JP 2017182561A JP 2018101406 A5 JP2018101406 A5 JP 2018101406A5
- Authority
- JP
- Japan
- Prior art keywords
- digital
- training
- image
- images
- relevance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000001537 neural Effects 0.000 claims 12
- 238000010191 image analysis Methods 0.000 claims 11
- 238000000034 method Methods 0.000 claims 4
- 230000002123 temporal effect Effects 0.000 claims 4
- 238000005259 measurement Methods 0.000 claims 3
- 238000007906 compression Methods 0.000 claims 1
- 238000004590 computer program Methods 0.000 claims 1
- 230000001276 controlling effect Effects 0.000 claims 1
- 230000000875 corresponding Effects 0.000 claims 1
- 238000001914 filtration Methods 0.000 claims 1
- 238000002372 labelling Methods 0.000 claims 1
Claims (10)
- エンコーディングプロセス中に、画像にビットレートバジェットを分配するときにビデオカメラで使用される、複数の入力用デジタル画像を受信し、特定の入力用デジタル画像内のマクロブロックの関連度を決定するためのデータを前記特定の入力用デジタル画像の各々について出力するニューラルネットワークをトレーニングするための方法であって、
第1の複数のデジタルトレーニング画像について、前記マクロブロック内の画像特性に基づく関連度で前記マクロブロックを自動的にラベル付けするように構成された第1の画像解析アルゴリズムを使用することによって、前記複数のデジタルトレーニング画像の各特定のデジタルトレーニング画像内の前記マクロブロックの関連度を決定することと(S402)、
ユーザが特定した状況を表示する第2の複数のデジタルトレーニング画像について、マクロブロックの画像特性に基づく関連度で前記マクロブロックを自動的にラベル付けするように構成された第2の画像解析アルゴリズムを使用することにより、前記第2の複数のデジタルトレーニング画像の各特定のデジタルトレーニング画像内の前記マクロブロックの関連度を決定すること(S404)、
によってトレーニングデータセットを決定することであって、
前記第2の画像解析アルゴリズムは、前記ユーザが特定した状況を表示する画像を解析するように特別に適合されている点で、第1の画像解析アルゴリズムとは異なり、
比較的高い関連度のマクロブロックは、より低い関連度を有するマクロブロックと比較して、エンコーディングプロセス中にそのマクロブロックに前記ビットレートバジェットのより大きい部分が費やされることをビデオカメラに示す、前記トレーニングデータセットを決定すること、
前記第1および第2の複数のデジタルトレーニング画像および前記関連するラベルを前記トレーニングデータセットとして含めること、および
前記ニューラルネットワークのトレーニング(S408)に前記トレーニングデータセットを使用すること、
を含み、
前記第1の複数のデジタルトレーニング画像および前記関連する関連度は、前記ニューラルネットワークを最初にトレーニングするのに使用され、その後、前記第2の複数のデジタルトレーニング画像および前記関連する関連度は、前記ニューラルネットワークの前記トレーニングを前記ユーザが特定した状況に微調整するのに使用される、方法。 - 前記第1の画像解析アルゴリズムが、
前記マクロブロックの空間的統計測定値を計算することと、
前記複数のデジタルトレーニング画像の画像シーケンスに時間的フィルタリングを適用することによって、前記マクロブロックの時間的統計測定値を計算することであって、前記画像シーケンスは前記特定のデジタルトレーニング画像を含む、前記マクロブロックの時間的統計測定値を計算することと、
前記マクロブロックの前記時間的統計測定値および前記空間的統計測定値を重み付けすることによって重み付け統計測定値を計算して、前記重み付け統計測定値に基づいて前記マクロブロックに関連度をラベル付けすることと
を行うことにより、前記マクロブロックに関連度を自動的にラベル付けするように構成される、請求項1に記載の方法。 - 前記第2の複数のデジタルトレーニング画像が、前記第1の複数のデジタルトレーニング画像の一部である少なくとも1つのデジタルトレーニング画像を含む、請求項1または2に記載の方法。
- 前記第2の複数のデジタルトレーニング画像が、前記第1の複数のデジタルトレーニング画像の一部ではない少なくとも1つのデジタルトレーニング画像を含む、請求項1から3のいずれか一項に記載の方法。
- 前記トレーニングデータセットが、前記第1の複数のデジタルトレーニング画像の中の少なくとも1つのデジタルトレーニング画像のマクロブロックに関連度を手動でラベル付けすること(S406)によってさらに決定される、請求項1から4のいずれか一項に記載の方法。
- 前記トレーニングデータセットが、前記第2の複数のデジタルトレーニング画像の中の少なくとも1つのデジタルトレーニング画像のマクロブロックに関連度を手動でラベル付けすることによってさらに決定される、請求項1から5のいずれか一項に記載の方法。
- 処理能力を有するデバイスによって実行されるとき、請求項1から6のいずれか一項に記載の方法を遂行するように適合された命令を伴うコンピュータ可読記憶媒体を備えるコンピュータプログラム製品。
- エンコーディングプロセス中に、画像にビットレートバジェットを分配するときにビデオカメラで使用される、複数の入力用デジタル画像を受信し、特定の入力用デジタル画像内のマクロブロックの関連度を決定するためのデータを前記特定の入力用デジタル画像の各々について出力するニューラルネットワークをトレーニングするように構成されたプロセッサを備えるコンピュータであって、前記ニューラルネットワークの前記トレーニングが、
第1の複数のデジタルトレーニング画像について、前記マクロブロック内の画像特性に基づく関連度で前記マクロブロックを自動的にラベル付けするように構成された第1の画像解析アルゴリズムを使用することによって、前記複数のデジタルトレーニング画像の各特定のデジタルトレーニング画像内の前記マクロブロックの関連度を決定することと、
ユーザが特定した状況を表示する第2の複数のデジタルトレーニング画像について、マクロブロックの画像特性に基づく関連度で前記マクロブロックを自動的にラベル付けするように構成された第2の画像解析アルゴリズムを使用することにより、前記第2の複数のデジタルトレーニング画像の各特定のデジタルトレーニング画像内の前記マクロブロックの関連度を決定すること(S404)、
とによってトレーニングデータセットを決定することであって、
前記第2の画像解析アルゴリズムは、前記ユーザが特定した状況を表示する画像を解析するように特別に適合されている点で、第1の画像解析アルゴリズムとは異なり、
比較的高い関連度のマクロブロックは、より低い関連度を有するマクロブロックと比較して、エンコーディングプロセス中にそのマクロブロックに前記ビットレートバジェットのより大きい部分が費やされることをビデオカメラに示す、前記トレーニングデータセットを決定すること、
前記第1および第2の複数のデジタルトレーニング画像および前記関連するラベルを前記トレーニングデータセットとして含めること、および
前記ニューラルネットワークのトレーニングに前記トレーニングデータセットを使用すること、
を含み、
前記第1の複数のデジタルトレーニング画像および前記関連する関連度は、前記ニューラルネットワークを最初にトレーニングするのに使用され、その後、前記第2の複数のデジタルトレーニング画像および前記関連する関連度は、前記ニューラルネットワークの前記トレーニングを前記ユーザが特定した状況に微調整するのに使用される、コンピュータ。 - ビデオカメラと請求項8に記載のコンピュータとを備えるシステムであって、
前記プロセッサが、結果として得られたトレーニングされたニューラルネットワークを前記カメラに提供する(S410)ようにさらに構成され、
前記カメラが、
前記トレーニングされたニューラルネットワークを受信し、
複数のデジタル画像を取り込み、前記複数のデジタル画像の画像データを前記トレーニングされたニューラルネットワークに供給し、前記複数のデジタル画像の各特定のデジタル画像について、前記特定のデジタル画像のマクロブロックに各々対応する複数の関連度を取得するように構築された、システム。 - 前記カメラが、
前記取得された関連度に従って前記特定のデジタル画像の圧縮度を制御することによって前記特定のデジタル画像をエンコードするようにさらに構築された、請求項9に記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16192142.4 | 2016-10-04 | ||
EP16192142.4A EP3306528B1 (en) | 2016-10-04 | 2016-10-04 | Using image analysis algorithms for providing traning data to neural networks |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018101406A JP2018101406A (ja) | 2018-06-28 |
JP2018101406A5 true JP2018101406A5 (ja) | 2020-08-20 |
JP6842395B2 JP6842395B2 (ja) | 2021-03-17 |
Family
ID=57083180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017182561A Active JP6842395B2 (ja) | 2016-10-04 | 2017-09-22 | ニューラルネットワークにトレーニングデータを提供するための画像解析アルゴリズムの使用 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10496903B2 (ja) |
EP (1) | EP3306528B1 (ja) |
JP (1) | JP6842395B2 (ja) |
KR (1) | KR102203694B1 (ja) |
CN (1) | CN107895359B (ja) |
TW (1) | TWI735669B (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6624125B2 (ja) * | 2017-03-13 | 2019-12-25 | コニカミノルタ株式会社 | 画像検査装置、画像形成システム及び画像圧縮方法 |
EP3762794A1 (en) * | 2018-03-05 | 2021-01-13 | Omron Corporation | Method, device, system and program for setting lighting condition and storage medium |
DE102019208257A1 (de) * | 2018-07-03 | 2020-01-09 | Heidelberger Druckmaschinen Ag | Druckqualitätsanalyse mit neuronalen Netzen |
CN109271847B (zh) | 2018-08-01 | 2023-04-07 | 创新先进技术有限公司 | 无人结算场景中异常检测方法、装置及设备 |
KR102194303B1 (ko) | 2018-10-08 | 2020-12-22 | 단국대학교 산학협력단 | 3d 데이터 프로세싱에 이용되는 ai 트레이닝을 위한 데이터 셋 확장 생성과 전처리를 위한 장치 및 방법 |
EP3667557B1 (en) * | 2018-12-13 | 2021-06-16 | Axis AB | Method and device for tracking an object |
TWI701565B (zh) * | 2018-12-19 | 2020-08-11 | 財團法人工業技術研究院 | 資料標記系統及資料標記方法 |
US11853812B2 (en) * | 2018-12-20 | 2023-12-26 | Here Global B.V. | Single component data processing system and method utilizing a trained neural network |
US10762393B2 (en) * | 2019-01-31 | 2020-09-01 | StradVision, Inc. | Learning method and learning device for learning automatic labeling device capable of auto-labeling image of base vehicle using images of nearby vehicles, and testing method and testing device using the same |
US10540572B1 (en) * | 2019-01-31 | 2020-01-21 | StradVision, Inc. | Method for auto-labeling training images for use in deep learning network to analyze images with high precision, and auto-labeling device using the same |
CA3130875A1 (en) * | 2019-02-22 | 2020-08-27 | Stratuscent Inc. | Systems and methods for learning across multiple chemical sensing units using a mutual latent representation |
KR102339181B1 (ko) * | 2020-03-09 | 2021-12-13 | 에스케이 주식회사 | Machine Learning을 이용한 데이터 연관성 자동 탐색 방법 및 시스템 |
TWI809266B (zh) * | 2020-04-21 | 2023-07-21 | 中華電信股份有限公司 | 電梯事件偵測模型之產生與更新方法 |
EP3905659B1 (en) * | 2020-04-28 | 2022-06-01 | Axis AB | Statistics-based electronics image stabilization |
WO2021230675A1 (ko) * | 2020-05-13 | 2021-11-18 | (주)사맛디 | 딥러닝 기반 대상체 감성 인식 방법 및 장치 |
US11295430B2 (en) | 2020-05-20 | 2022-04-05 | Bank Of America Corporation | Image analysis architecture employing logical operations |
US11379697B2 (en) | 2020-05-20 | 2022-07-05 | Bank Of America Corporation | Field programmable gate array architecture for image analysis |
CN111767985B (zh) * | 2020-06-19 | 2022-07-22 | 深圳市商汤科技有限公司 | 一种神经网络的训练方法、视频识别方法及装置 |
KR102213291B1 (ko) * | 2020-07-30 | 2021-02-04 | 배도연 | 웹사이트 제작 시스템 |
WO2023085457A1 (ko) * | 2021-11-11 | 2023-05-19 | 한국전자기술연구원 | 효율적인 딥러닝 학습을 위한 메모리 구조 및 제어 방법 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6757602B2 (en) * | 1997-02-06 | 2004-06-29 | Automotive Technologies International, Inc. | System for determining the occupancy state of a seat in a vehicle and controlling a component based thereon |
JP3524250B2 (ja) * | 1995-11-27 | 2004-05-10 | キヤノン株式会社 | デジタル画像処理プロセッサ |
US7444030B2 (en) * | 2004-11-12 | 2008-10-28 | Micron Technology, Inc. | Image encoding with dynamic buffer-capacity-level-based compression adjustment |
US9208405B2 (en) * | 2010-08-06 | 2015-12-08 | Sony Corporation | Systems and methods for digital image analysis |
EP2499964B1 (en) * | 2011-03-18 | 2015-04-15 | SensoMotoric Instruments Gesellschaft für innovative Sensorik mbH | Optical measuring device and system |
EP2557789B1 (en) * | 2011-08-09 | 2017-09-27 | Dolby Laboratories Licensing Corporation | Guided image up-sampling in video coding |
US9071798B2 (en) * | 2013-06-17 | 2015-06-30 | Spotify Ab | System and method for switching between media streams for non-adjacent channels while providing a seamless user experience |
US8965112B1 (en) * | 2013-12-09 | 2015-02-24 | Google Inc. | Sequence transcription with deep neural networks |
CN104103033B (zh) * | 2014-08-05 | 2017-06-06 | 广州国米科技有限公司 | 图像实时处理方法 |
EP3021583B1 (en) | 2014-11-14 | 2019-10-23 | Axis AB | Method of identifying relevant areas in digital images, method of encoding digital images, and encoder system |
EP3029937B1 (en) * | 2014-12-03 | 2016-11-16 | Axis AB | Method and encoder for video encoding of a sequence of frames |
CN104679863B (zh) | 2015-02-28 | 2018-05-04 | 武汉烽火众智数字技术有限责任公司 | 一种基于深度学习的以图搜图方法和系统 |
CN105260734A (zh) * | 2015-10-10 | 2016-01-20 | 燕山大学 | 一种具有自建模功能的商品油表面激光标码识别方法 |
CN105430394A (zh) | 2015-11-23 | 2016-03-23 | 小米科技有限责任公司 | 视频数据压缩处理方法、装置和设备 |
CN105551036B (zh) * | 2015-12-10 | 2019-10-08 | 中国科学院深圳先进技术研究院 | 一种深度学习网络的训练方法和装置 |
-
2016
- 2016-10-04 EP EP16192142.4A patent/EP3306528B1/en active Active
-
2017
- 2017-09-22 JP JP2017182561A patent/JP6842395B2/ja active Active
- 2017-09-28 KR KR1020170126009A patent/KR102203694B1/ko active IP Right Grant
- 2017-09-29 CN CN201710905791.6A patent/CN107895359B/zh active Active
- 2017-09-29 TW TW106133689A patent/TWI735669B/zh active
- 2017-10-04 US US15/725,029 patent/US10496903B2/en active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2018101406A5 (ja) | ||
JP7026878B2 (ja) | ディープニューラルネットワークを用いた、視覚的品質を維持した量子化パラメータ予測 | |
US10475172B2 (en) | Techniques for predicting perceptual video quality | |
CN108780499B (zh) | 基于量化参数的视频处理的系统和方法 | |
JP6842395B2 (ja) | ニューラルネットワークにトレーニングデータを提供するための画像解析アルゴリズムの使用 | |
JP6843239B2 (ja) | 符号化ユニットの深さ特定方法及び装置 | |
JP2016111695A5 (ja) | ||
JP5846517B2 (ja) | 画像構図変更の品質評価 | |
JP6879894B2 (ja) | 物体の流動の状態を求めるシステム及び方法、並びに非一時的コンピューター可読記憶媒体 | |
Yang et al. | Subjective quality assessment of screen content images | |
JP2018530963A5 (ja) | ||
JP2015532061A5 (ja) | ||
JP7146122B2 (ja) | 制御入力および限られた観測から動的流動を予測するための方法およびシステム | |
Ghadiyaram et al. | A no-reference video quality predictor for compression and scaling artifacts | |
CN116208770A (zh) | 用于视频编码的增强型实时视觉质量度量生成 | |
WO2018153161A1 (zh) | 一种视频质量评价方法及装置、设备、存储介质 | |
AU2021212054A1 (en) | Techniques for improving the quality of subjective data | |
CN110913221A (zh) | 一种视频码率预测方法及装置 | |
JP2015530807A5 (ja) | ||
CN105872538B (zh) | 时域滤波方法和时域滤波装置 | |
JP2014036260A (ja) | 画質評価装置、画質評価方法及び画質評価プログラム | |
Eswara et al. | A linear regression framework for assessing time-varying subjective quality in HTTP streaming | |
Adhav et al. | A survey on Measurement of Objective Video Quality in Social Cloud using Machine Learning | |
JP2017005344A (ja) | 映像品質差推定装置、映像品質差推定方法、及びプログラム | |
de Oliveira et al. | Extraction of spatio-temporal features based on a hardware approach for a no-reference objective video quality metric |