JP6748022B2 - 分割形状決定装置、学習装置、分割形状決定方法及び分割形状決定プログラム - Google Patents
分割形状決定装置、学習装置、分割形状決定方法及び分割形状決定プログラム Download PDFInfo
- Publication number
- JP6748022B2 JP6748022B2 JP2017079585A JP2017079585A JP6748022B2 JP 6748022 B2 JP6748022 B2 JP 6748022B2 JP 2017079585 A JP2017079585 A JP 2017079585A JP 2017079585 A JP2017079585 A JP 2017079585A JP 6748022 B2 JP6748022 B2 JP 6748022B2
- Authority
- JP
- Japan
- Prior art keywords
- division
- node
- probability
- learning
- shape
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
(第1実施形態)
図1は、画像符号化装置1の構成の例を示す図である。画像符号化装置1は、例えば、パーソナルコンピュータ装置、スマートフォン端末、タブレット端末又はサーバ装置等の情報処理装置である。画像符号化装置1は、動画像を構成する複数の画像(フレーム)を符号化対象画像として符号化する。符号化対象画像は、64画素×64画素のサイズであるCTUの単位のブロックに区切られている。
図2は、四分木データ構造及び出力ラベルの例を示す図である。1個のCTUにおけるCUの分割形状は、1個の四分木データ構造を用いて表される。四分木データ構造の各ノードには、ノードに対応付けられているCUの分割に関する確率(分割確率)が、ノードのラベルとして定められている。1個の四分木データ構造は、1個のCTUの各CUの分割確率を表す。
図3は、分割形状決定装置10の構成の例を示す図である。分割形状決定装置10は、特徴抽出部100を、単一の学習モデルとして備える。分割形状決定装置10は、決定部110を更に備える。
特徴抽出部100は、CUの分割形状の正解ラベルを学習する場合、符号化対象画像の原画又は特徴量をCTUごとに取得する。全結合層105は、出力ラベルyを出力する。出力ラベルyは、四分木データ構造の各ノードの分割確率を表す。出力ラベルyは、式(1)のように表される。出力ラベルyに対応する正解ラベルtは、式(2)のように表される。
=∂E/∂w
=[∂E/∂w1,∂E/∂w2,…,∂E/∂wM]T …(3)
図4は、分割形状決定装置10の動作の例を示すフローチャートである。特徴抽出部100は、符号化対象画像をCTUごとに取得する。特徴抽出部100は、符号化対象画像のCTUから、輝度値等の特徴量を抽出する。全結合層105は、学習パラメータが更新された学習モデルに基づいて、各ノードの分割確率を算出する(ステップS101)。決定部110は、四分木データ構造における階層が浅いノードに対応する対象ブロックを優先して処理を実行する。
第2実施形態では、親ノードの分割確率が曖昧である場合に親ノードの子ノードの分割確率を分割形状決定装置10が評価する点が、第1実施形態と相違する。第2実施形態では、第1実施形態との相違点についてのみ説明する。
図5は、分割形状決定装置10の動作の例を示すフローチャートである。ステップS201からステップS202までは、図4におけるステップS101からステップS102までと同様である。決定部110は、対象ブロックについて、分割確率が曖昧であるか否かを判定する。すなわち、決定部110は、対象ブロックについて、分割確率が0.5に近い値であるか否かを判定する(ステップS203)。分割確率が曖昧でない場合(ステップS203:NO)、決定部110は、ステップS04に処理を進める。ステップS204からステップS206までは、図4におけるステップS103からステップS105までと同様である。
第3実施形態では、正解ラベルにおいて表されるノードの分割確率が3値以上の多値である点が、第1実施形態と相違する。第3実施形態では、第1実施形態との相違点についてのみ説明する。
Claims (6)
- 分割に関する確率である分割確率を保持する複数のノードが階層構造を成しており、前記ノードの集合である学習モデルの学習パラメータを、符号化対象画像を区切るブロックに対応付けられた前記ノードの前記分割確率に応じて更新し、前記学習パラメータが更新された前記学習モデルの出力として得られた前記分割確率を、前記ノードに対応付けて出力する学習部と、
前記ノードに対応付けて出力された前記分割確率に基づいて、前記ノードに対応付けられたブロックを分割するか否かを決定する決定部と
を備え、
前記決定部は、前記ノードの下位のノードである子ノードが保持している前記分割確率に基づいて、前記ノードに対応付けられた分割するか否かを決定する、
分割形状決定装置。 - 前記学習部は、前記ノードが保持している前記分割確率に応じて、前記ノードの下位のノードである子ノードの前記分割確率を参照するか否かを定める、請求項1に記載の分割形状決定装置。
- 前記階層構造は、四分木データ構造であり、
前記学習部は、前記ノードが保持している前記分割確率が0である場合、前記学習パラメータを更新する際に前記子ノードの前記分割確率を参照しないと定める、請求項2に記載の分割形状決定装置。 - 前記分割確率は、3値以上で表現される確率である、請求項1から請求項3のいずれか一項に記載の分割形状決定装置。
- 符号化対象画像を区切るブロックの分割形状を決定する分割形状決定装置が実行する分割形状決定方法であって、
分割に関する確率である分割確率を保持する複数のノードが階層構造を成しており、前記ノードの集合である学習モデルの学習パラメータを、前記ブロックに対応付けられた前記ノードの前記分割確率に応じて更新し、前記学習パラメータが更新された前記学習モデルの出力として得られた前記分割確率を、前記ノードに対応付けて出力するステップと、
前記ノードに対応付けて出力された前記分割確率に基づいて、前記ノードに対応付けられたブロックを分割するか否かを決定するステップと
を有し、
前記決定するステップでは、前記ノードの下位のノードである子ノードが保持している前記分割確率に基づいて、前記ノードに対応付けられた分割するか否かを決定する、
分割形状決定方法。 - コンピュータに、
分割に関する確率である分割確率を保持する複数のノードが階層構造を成しており、前記ノードの集合である学習モデルの学習パラメータを、符号化対象画像を区切るブロックに対応付けられた前記ノードの前記分割確率に応じて更新し、前記学習パラメータが更新された前記学習モデルの出力として得られた前記分割確率を、前記ノードに対応付けて出力する手順と、
前記ノードに対応付けて出力された前記分割確率に基づいて、前記ノードに対応付けられたブロックを分割するか否かを決定する手順と
を実行させ、
前記決定する手順では、前記ノードの下位のノードである子ノードが保持している前記分割確率に基づいて、前記ノードに対応付けられた分割するか否かを決定する、
分割形状決定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017079585A JP6748022B2 (ja) | 2017-04-13 | 2017-04-13 | 分割形状決定装置、学習装置、分割形状決定方法及び分割形状決定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017079585A JP6748022B2 (ja) | 2017-04-13 | 2017-04-13 | 分割形状決定装置、学習装置、分割形状決定方法及び分割形状決定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018182531A JP2018182531A (ja) | 2018-11-15 |
JP6748022B2 true JP6748022B2 (ja) | 2020-08-26 |
Family
ID=64277256
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017079585A Active JP6748022B2 (ja) | 2017-04-13 | 2017-04-13 | 分割形状決定装置、学習装置、分割形状決定方法及び分割形状決定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6748022B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109788296A (zh) * | 2018-12-25 | 2019-05-21 | 中山大学 | 用于hevc的帧间编码单元划分方法、装置和存储介质 |
JP2021175126A (ja) | 2020-04-28 | 2021-11-01 | キヤノン株式会社 | 分割パターン決定装置、分割パターン決定方法、学習装置、学習方法およびプログラム |
JP2022144360A (ja) * | 2021-03-19 | 2022-10-03 | 公益財団法人実験動物中央研究所 | 排泄物性状推定モデル学習装置、排泄物性状推定装置、排泄物性状推定モデル学習方法、排泄物性状推定方法及びプログラム |
-
2017
- 2017-04-13 JP JP2017079585A patent/JP6748022B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018182531A (ja) | 2018-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111868751B (zh) | 在视频代码化的机器学习模型中使用应用于量化参数的非线性函数 | |
US20230075442A1 (en) | Point cloud compression method, encoder, decoder, and storage medium | |
CN113767400B (zh) | 使用率失真成本作为深度学习的损失函数 | |
TW201830972A (zh) | 用於視訊寫碼之低複雜度符號預測 | |
US11791837B2 (en) | Method and apparatus for neural network model compression/decompression | |
WO2014190468A1 (en) | Video encoder for images | |
CN110383695B (zh) | 用于对数字图像或视频流进行编码和解码的方法和装置 | |
JP6748022B2 (ja) | 分割形状決定装置、学習装置、分割形状決定方法及び分割形状決定プログラム | |
US12088804B2 (en) | Method and device for encoding/decoding video signal by using optimized conversion based on multiple graph-based model | |
CN111837140A (zh) | 视频代码化的感受野一致卷积模型 | |
US12010310B2 (en) | Method and apparatus for quantization, adaptive block partitioning and codebook coding for neural network model compression | |
KR20230131878A (ko) | 포인트 클라우드 프로세싱을 위한 장치 및 방법 | |
CN114096987A (zh) | 视频处理方法及装置 | |
CN113795869A (zh) | 用于神经网络模型压缩的量化、自适应块分区和码本编解码的方法和装置 | |
CN114041292B (zh) | 编解码的方法、装置及可读介质 | |
JP7383720B2 (ja) | 画像成分予測方法、エンコーダ、デコーダ及び記憶媒体 | |
JP5307681B2 (ja) | 画像符号化構造の自動生成方法,画像符号化構造の自動生成装置およびそのプログラム | |
EP4391533A1 (en) | Feature map encoding method and apparatus and feature map decoding method and apparatus | |
CN114868389A (zh) | 一种帧内预测方法、编码器、解码器及存储介质 | |
KR20230073303A (ko) | 계층적 팔레트 테이블 생성을 이용하는 팔레트 모드 비디오 인코딩 | |
JP2005124001A (ja) | 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、及び動画像復号プログラム | |
JP2022551184A (ja) | ブロック分割を伴うニューラルネットワークを復号する方法、装置及びプログラム | |
JP2020061596A (ja) | 差異検出装置及び差異検出プログラム | |
CN112188216B (zh) | 视频数据的编码方法、装置、计算机设备及存储介质 | |
Ettaouil et al. | Vector quantization by improved Kohonen algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190628 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200608 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200623 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200717 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200804 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200806 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6748022 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |