CN115943434A - 三维数据编码方法、三维数据解码方法、三维数据编码装置及三维数据解码装置 - Google Patents

三维数据编码方法、三维数据解码方法、三维数据编码装置及三维数据解码装置 Download PDF

Info

Publication number
CN115943434A
CN115943434A CN202180043574.5A CN202180043574A CN115943434A CN 115943434 A CN115943434 A CN 115943434A CN 202180043574 A CN202180043574 A CN 202180043574A CN 115943434 A CN115943434 A CN 115943434A
Authority
CN
China
Prior art keywords
encoding
data
information
unit
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180043574.5A
Other languages
English (en)
Inventor
井口贺敬
杉尾敏康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Publication of CN115943434A publication Critical patent/CN115943434A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/40Tree coding, e.g. quadtree, octree
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

三维数据编码方法对每个数据单元中包含的多个三维点进行编码(S12172),生成包含多个三维点被编码后的编码数据的比特流(S12173);在编码(S12172)中,使用N叉树将编码对象的数据单元中包含的多个三维点的多个位置信息变换为多个占用地图;将对于多个占用地图分别使用表示占用地图与索引的对应关系的表得到的索引进行编码,根据变换后的索引将表更新并存储到存储器中;在下一个数据单元的开头的三维点的编码时,决定是否将所存储的表进行初始化;在决定为不进行初始化的情况下,使用存储在存储器中的表开始下一个数据单元的编码;比特流还包含表示决定的结果的第1识别信息。

Description

三维数据编码方法、三维数据解码方法、三维数据编码装置及三维数据解码装置
技术领域
本公开涉及三维数据编码方法、三维数据解码方法、三维数据编码装置及三维数据解码装置。
背景技术
在用于汽车或机器人自主地进行工作的计算机视觉、地图信息、监控、基础设施检查、或影像分发等较大的领域中,今后将会普及灵活运用了三维数据的装置或服务。三维数据通过测距仪等距离传感器、立体摄影机、或多个单眼相机的组合等各种方法来取得。
作为三维数据的表现方法之一,有被称作点云的表现方法,该方法通过三维空间内的点群来表现三维构造的形状。在点云中保存点群的位置和颜色。虽然预想点云作为三维数据的表现方法将成为主流,但是点群的数据量非常大。因此,在三维数据的积蓄或传输中,与二维的运动图像(作为一例,有以MPEG进行标准化后的MPEG-4AVC或HEVC等)同样,需要通过编码来进行数据量的压缩。
此外,关于点云的压缩,有一部分由进行点云关联的处理的公开的库(PointCloud Library:点云库)等支持。
此外,已知有利用三维的地图数据,检索位于车辆周边的施设并进行显示的技术(例如,参照专利文献1)。
现有技术文献
专利文献
专利文献1:国际公开第2014/020663号
发明内容
发明要解决的课题
希望使三维数据解码装置对比特流适当地进行解码。
本公开的目的是提供能够使三维数据解码装置对比特流适当地进行解码的三维数据编码方法、三维数据解码方法、三维数据编码装置或三维数据解码装置。
用来解决课题的手段
有关本公开的一技术方案的三维数据编码方法,取得分别包含多个三维点的多个数据单元;对上述多个数据单元各自中包含的多个三维点进行编码;生成包含上述多个三维点被编码后的编码数据的比特流;在上述编码中,使用N叉树将编码对象的数据单元中包含的多个三维点的多个位置信息变换为多个占用地图,N为2以上的整数;使用表示占用地图与索引的对应关系的表将上述多个占用地图分别变换为索引,通过对上述索引进行编码而生成上述编码数据;根据变换后的索引,将上述表更新并存储到存储器中;在上述编码对象的数据单元的下一个数据单元的开头的三维点的编码时,决定是否将存储在上述存储器中的上述表进行初始化;在决定为不进行初始化的情况下,使用存储在上述存储器中的上述表开始上述下一个数据单元的编码;上述比特流还包含表示上述决定的结果的第1识别信息。
有关本公开的一技术方案的三维数据解码方法,取得包含编码数据和第1识别信息的比特流,上述编码数据是包含多个三维点的数据单元被编码后的编码数据,上述第1识别信息表示在上述数据单元的编码中是否将在该数据单元之前的数据单元的编码中使用的表进行初始化来使用;使用与上述第1识别信息相应的表对上述编码数据进行解码;上述表表示用N叉树表现了三维点的位置信息的占用地图与索引的对应关系,N为2以上的整数;上述编码数据包含被编码后的上述索引;在上述解码中,通过导出在上述表中与通过对上述编码数据进行解码而得到的上述索引对应的占用地图,计算三维点的位置信息。
发明效果
本公开能够提供能够使三维数据解码装置对比特流适当地进行解码的三维数据编码方法、三维数据解码方法、三维数据编码装置或三维数据解码装置。
附图说明
图1是表示实施方式1的三维数据编解码系统的构成的图。
图2是表示实施方式1的点群数据的构成例的图。
图3是表示实施方式1的记述有点群数据信息的数据文件的构成例的图。
图4是表示实施方式1的点群数据的种类的图。
图5是表示实施方式1的第1编码部的构成的图。
图6是实施方式1的第1编码部的框图。
图7是表示实施方式1的第1解码部的构成的图。
图8是实施方式1的第1解码部的框图。
图9是实施方式1的三维数据编码装置的框图。
图10是表示实施方式1的位置信息的例子的图。
图11是表示实施方式1的位置信息的八叉树表现的例子的图。
图12是实施方式1的三维数据解码装置的框图。
图13是实施方式1的属性信息编码部的框图。
图14是实施方式1的属性信息解码部的框图。
图15是表示实施方式1的属性信息编码部的结构的框图。
图16是实施方式1的属性信息编码部的框图。
图17是表示实施方式1的属性信息解码部的结构的框图。
图18是实施方式1的属性信息解码部的框图。
图19是表示实施方式1的第2编码部的结构的图。
图20是实施方式1的第2编码部的框图。
图21是表示实施方式1的第2解码部的结构的图。
图22是实施方式1的第2解码部的框图。
图23是表示实施方式1的关于PCC编码数据的协议栈的图。
图24是表示实施方式2的编码部及复用部的结构的图。
图25是表示实施方式2的编码数据的结构例的图。
图26是表示实施方式2的编码数据及NAL单元的结构例的图。
图27是表示实施方式2的pcc_nal_unit_type的语义例的图。
图28是表示实施方式2的NAL单元的送出顺序的例子的图。
图29是有关实施方式3的第1编码部的框图。
图30是有关实施方式3的第1解码部的框图。
图31是有关实施方式3的分割部的框图。
图32是表示有关实施方式3的切片及瓦片的分割例的图。
图33是表示有关实施方式3的切片及瓦片的分割样式的例子的图。
图34是表示有关实施方式3的依赖关系的例子的图。
图35是表示有关实施方式3的数据的解码顺序的例子的图。
图36是有关实施方式3的编码处理的流程图。
图37是有关实施方式3的结合部的框图。
图38是表示有关实施方式3的编码数据及NAL单元的构成例的图。
图39是有关实施方式3的编码处理的流程图。
图40是有关实施方式3的解码处理的流程图。
图41是有关实施方式3的编码处理的流程图。
图42是有关实施方式3的解码处理的流程图。
图43是表示实施方式4的在三维数据编码方法中使用的预测树的一例的图。
图44是表示实施方式4的三维数据编码方法的一例的流程图。
图45是表示实施方式4的三维数据解码方法的一例的流程图。
图46是用来说明实施方式4的预测树的生成方法的图。
图47是用来说明实施方式4的预测模式的第1例的图。
图48是表示实施方式4的位置信息的头的句法的一例的图。
图49是表示实施方式4的位置信息的句法的一例的图。
图50是表示实施方式4的位置信息的句法的另一例的图。
图51是有关实施方式4的三维数据编码装置的处理的流程图。
图52是有关实施方式4的三维数据解码装置的处理的流程图。
图53是表示在有关实施方式5的编码时或解码时根据CABAC初始化标志而进行的CABAC编码/解码引擎的再初始化的处理的流程图。
图54是表示有关实施方式5的三维数据编码装置中包括的第1编码部的构成的框图。
图55是表示有关实施方式5的分割部的构成的框图。
图56是表示有关实施方式5的位置信息编码部及属性信息编码部的构成的框图。
图57是表示有关实施方式5的第1解码部的构成的框图。
图58是表示有关实施方式5的位置信息解码部及属性信息解码部的构成的框图。
图59是表示有关实施方式5的关于位置信息的编码或者属性信息的编码中的CABAC的初始化的处理的一例的流程图。
图60是表示在有关实施方式5的作为比特流的点群数据中CABAC初始化的定时的一例的图。
图61是表示有关实施方式5的编码数据的构成及编码数据向NAL单元的保存方法的图。
图62是表示有关实施方式5的位置信息的解码或属性信息的解码中的与CABAC的初始化有关的处理的一例的流程图。
图63是有关实施方式5的点群数据的编码处理的流程图。
图64是表示有关实施方式5的更新附加信息的处理的一例的流程图。
图65是表示有关实施方式5的CABAC初始化的处理的一例的流程图。
图66是有关实施方式5的点群数据的解码处理的流程图。
图67是表示有关实施方式5的将CABAC解码部初始化的处理的一例的流程图。
图68是表示有关实施方式5的瓦片及切片的例子的图。
图69是表示有关实施方式5的CABAC的初始化及上下文初始值的决定方法的一例的流程图。
图70是表示有关实施方式5的将对由LiDAR得到的点群数据进行俯视的地图分割为瓦片的情况下的例子的图。
图71是表示有关实施方式5的CABAC初始化及上下文初始值的决定方法的另一例的流程图。
图72是表示有关实施方式6的分割后的各数据单元中包含的位置信息的数据结构和位置信息的头的句法的一例的图。
图73是表示有关实施方式6的三维数据编码方法的一例的流程图。
图74是表示有关实施方式6的三维数据解码方法的一例的流程图。
图75是用来说明有关实施方式6的编码方式切换的情况下的上下文的初始化的图。
图76是表示有关实施方式6的三维数据编码装置的处理的流程图。
图77是表示有关实施方式6的三维数据解码装置的处理的流程图。
图78是表示有关实施方式7的SPS的句法的一例的图。
图79是表示有关实施方式7的分割位置信息的头(DevidedGeometryHeader)的句法的一例的图。
图80是表示有关实施方式7的分割属性信息的头(DevidedAttributeHeader)的句法的一例的图。
图81是表示有关实施方式7的分割属性信息的头(DevidedAttributeHeader)的句法的另一例的图。
图82是表示有关实施方式7的分割位置信息的头(DevidedGeometryHeader)的句法的另一例的图。
图83是表示在有关实施方式7的三维数据编码装置中决定是否将熵编码初始化的第1决定的一例的流程图。
图84是表示在有关实施方式7的三维数据解码装置中决定熵编码的标志是否符合一致性(是否适合于规格)的处理的一例的流程图。
图85是有关实施方式7的三维数据编码装置的处理的流程图。
图86是有关实施方式7的三维数据解码装置的处理的流程图。
图87是表示有关实施方式8的SPS的句法的一例的图。
图88是表示有关实施方式8的APS的句法的一例的图。
图89是表示有关实施方式8的分割位置信息的头(DevidedGeometryHeader)的句法的一例的图。
图90是表示有关实施方式8的分割属性信息的头(DevidedAttributeHeader)的句法的一例的图。
图91是表示在有关实施方式8的三维数据编码装置中决定是否使在熵编码中使用的上下文继续的处理的一例的流程图。
图92是用来说明有关实施方式8的表的更新的图。
图93是由有关实施方式8的三维数据编码装置进行的占用地图的编码的流程图。
图94是由有关实施方式8的三维数据解码装置进行的占用地图的解码的流程图。
图95是有关实施方式8的三维数据编码装置的切换熵编码方式的处理的流程图。
图96是有关实施方式8的三维数据编码装置的字节单位的熵编码的继续方法的流程图。
图97是有关实施方式8的三维数据解码装置的切换熵解码方式的处理的流程图。
图98是有关实施方式8的三维数据解码装置的字节单位的熵解码的继续方法的流程图。
图99是表示有关实施方式8的三维数据编码装置的处理的流程图。
图100是表示有关实施方式8的三维数据解码装置的处理的流程图。
图101是表示有关实施方式9的按每个组分为切片进行编码的情况下的三维点群的一例的图。
图102是表示有关实施方式9的比特流的各种各样的结构的例子的图。
图103是有关实施方式9的用切片标志表示是否将切片单位的CABAC初始化、用树标志表示是否将切片内的tree单位的CABAC初始化的例子。
图104是用来说明有关实施方式9的将多个预测树以并行处理进行解码的方法的图。
图105是表示有关实施方式9的三维数据编码方法的一例的图。
图106是表示有关实施方式9的三维数据解码方法的一例的图。
图107是表示在有关实施方式9的三维数据解码方法中进行并行解码的情况下的一例的图。
图108是表示有关实施方式9的在位置信息的数据中保存初始化标志的情况下的位置信息的数据单元的句法的一例的图。
图109是表示有关实施方式9的在位置信息的头中保存初始化标志及偏移信息的情况下的头的句法的一例的图。
图110是表示有关实施方式9的在位置信息的头中以随机访问单位保存初始化标志及偏移信息的情况下的头的句法的一例的图。
图111是实施方式10的三维数据制作装置的框图。
图112是实施方式10的三维数据制作方法的流程图。
图113是表示实施方式10的系统的结构的图。
图114是实施方式10的客户端装置的框图。
图115是实施方式10的服务器的框图。
图116是实施方式10的客户端装置的三维数据制作处理的流程图。
图117是实施方式10的客户端装置的传感器信息发送处理的流程图。
图118是实施方式10的服务器的三维数据制作处理的流程图。
图119是实施方式10的服务器的三维地图发送处理的流程图。
图120是表示实施方式10的系统的变形例的构成的图。
图121是表示实施方式10的服务器以及客户端装置的构成的图。
图122是表示实施方式10的服务器以及客户端装置的构成的图。
图123是实施方式10的客户端装置的处理的流程图。
图124是表示实施方式10的传感器信息收集系统的构成的图。
图125是表示实施方式10的系统的例子的图。
图126是表示实施方式10的系统的变形例的图。
图127是表示实施方式10的应用处理的例子的流程图。
图128是表示实施方式10的各种传感器的传感器范围的图。
图129是表示实施方式10的自动驾驶系统的构成例的图。
图130是表示实施方式10的比特流的构成例的图。
图131是实施方式10的点群选择处理的流程图。
图132是表示实施方式10的点群选择处理的画面例的图。
图133是表示实施方式10的点群选择处理的画面例的图。
图134是表示实施方式10的点群选择处理的画面例的图。
具体实施方式
有关本公开的一技术方案的三维数据编码方法,取得分别包含多个三维点的多个数据单元;对上述多个数据单元各自中包含的多个三维点进行编码;生成包含上述多个三维点被编码后的编码数据的比特流;在上述编码中,使用N叉树将编码对象的数据单元中包含的多个三维点的多个位置信息变换为多个占用地图,N为2以上的整数;使用表示占用地图与索引的对应关系的表将上述多个占用地图分别变换为索引,通过对上述索引进行编码而生成上述编码数据;根据变换后的索引,将上述表更新并存储到存储器中;在上述编码对象的数据单元的下一个数据单元的开头的三维点的编码时,决定是否将存储在上述存储器中的上述表进行初始化;在决定为不进行初始化的情况下,使用存储在上述存储器中的上述表开始上述下一个数据单元的编码;上述比特流还包含表示上述决定的结果的第1识别信息。
由此,在将位置信息进行变换而得到的占用地图的编码时,对使用表得到的索引进行编码,生成包含表示是否将在编码中使用的表进行初始化的第1识别信息的比特流,所以能够使三维数据解码装置对比特流适当地进行解码。
此外,也可以是,上述索引表示占用地图的产生次数及占用地图的产生频率中的某一个。
因此,例如通过产生次数及产生频率越大则将索引设定为越小的值,能够使编码效率提高。
此外,也可以是,在上述第1识别信息表示将上述表进行初始化的情况下,表示将之前的数据单元的上下文进行初始化来对上述多个三维点的多个属性信息进行编码;在表示不将上述表进行初始化的情况下,表示继续使用上述之前的数据单元的上下文来对上述多个属性信息进行编码。
此外,也可以是,上述比特流还包含第2识别信息,该第2识别信息表示在上述多个数据单元间是否使用使熵继续的功能;上述第1识别信息在上述第2识别信息表示在上述多个数据单元之间使用使熵继续的功能的情况下被示出。
有关本公开的一技术方案的三维数据解码方法,取得包含编码数据和第1识别信息的比特流,上述编码数据是包含多个三维点的数据单元被编码后的编码数据,上述第1识别信息表示在上述数据单元的编码中是否将在该数据单元之前的数据单元的编码中使用的表进行初始化来使用;使用与上述第1识别信息相应的表对上述编码数据进行解码;上述表表示用N叉树表现了三维点的位置信息的占用地图与索引的对应关系,N为2以上的整数;上述编码数据包含被编码后的上述索引;在上述解码中,通过导出在上述表中与通过对上述编码数据进行解码而得到的上述索引对应的占用地图,计算三维点的位置信息。
因此,三维数据解码装置在判定为符合一致性的情况下,例如能够通过继续解码来对比特流适当地进行解码。此外,三维数据解码装置在判定为不符合一致性的情况下,例如能够通过停止解码或执行特定的回避处理来抑制对比特流不适当地进行解码。
此外,也可以是,上述索引表示占用地图的产生次数及占用地图的产生频率中的某一个。
此外,也可以是,在上述第1识别信息表示将上述表进行初始化的情况下,表示将之前的数据单元的上下文进行初始化来对上述多个三维点的多个属性信息进行解码;在表示不将上述表进行初始化的情况下,表示继续使用上述之前的数据单元的上下文来对上述多个属性信息进行解码。
此外,也可以是,上述比特流还包含第2识别信息,该第2识别信息表示在上述多个数据单元之间是否使用使熵继续的功能;上述第1识别信息在上述第2识别信息表示在上述多个数据单元之间使用使熵继续的功能的情况下被示出。
此外,有关本公开的一技术方案的三维数据编码装置,具备:处理器;以及存储器;上述处理器使用上述存储器进行如下处理:取得分别包含多个三维点的多个数据单元;对上述多个数据单元各自中包含的多个三维点进行编码;生成包含上述多个三维点被编码后的编码数据的比特流;在上述编码中,使用N叉树将编码对象的数据单元中包含的多个三维点的多个位置信息变换为多个占用地图,N为2以上的整数;使用表示占用地图与索引的对应关系的表将上述多个占用地图分别变换为索引,通过对上述索引进行编码而生成上述编码数据;根据变换后的索引,将上述表更新并存储到存储器中;在上述编码对象的数据单元的下一个数据单元的开头的三维点的编码时,决定是否将存储在上述存储器中的上述表进行初始化;在决定为不进行初始化的情况下,使用存储在上述存储器中的上述表开始上述下一个数据单元的编码;上述比特流还包含表示上述决定的结果的第1识别信息。
由此,在将位置信息进行变换而得到的占用地图的编码时,对使用表得到的索引进行编码,生成包含表示是否将在编码中使用的表进行初始化的第1识别信息的比特流,所以能够使三维数据解码装置对比特流适当地进行解码。
此外,有关本公开的一技术方案的三维数据解码装置,具备:处理器;以及存储器;上述处理器使用上述存储器进行如下处理:取得包含编码数据和第1识别信息的比特流,上述编码数据是包含多个三维点的数据单元被编码后的编码数据,上述第1识别信息表示在上述数据单元的编码中是否将在该数据单元之前的数据单元的编码中使用的表进行初始化来使用;使用与上述第1识别信息相应的表对上述编码数据进行解码;上述表表示用N叉树表现了三维点的位置信息的占用地图与索引的对应关系,N为2以上的整数;上述编码数据包含被编码后的上述索引;在上述解码中,通过导出在上述表中与通过对上述编码数据进行解码而得到的上述索引对应的占用地图,计算三维点的位置信息。
因此,三维数据解码装置在判定为符合一致性的情况下,例如能够通过继续解码来对比特流适当地进行解码。此外,三维数据解码装置在判定为不符合一致性的情况下,例如能够通过停止解码或执行特定的回避处理来抑制对比特流不适当地进行解码。
另外,这些包含性或具体的技术方案也可以由系统、集成电路、计算机程序或计算机可读取的CD-ROM等的记录介质实现,也可以由系统、方法、集成电路、计算机程序及记录介质的任意的组合来实现。
以下,参照附图对实施方式具体地进行说明。另外,以下说明的实施方式都表示本公开的一具体例。在以下的实施方式中表示的数值、形状、材料、构成要素、构成要素的配置位置及连接形态、步骤、步骤的顺序等是一例,不是限定本公开的意思。此外,关于以下的实施方式的构成要素中的、在表示最上位概念的独立权利要求中没有记载的构成要素,设为任意的构成要素进行说明。
(实施方式1)
在实际的装置或服务中使用点云的编码数据时,为了抑制网络带宽,希望按照用途对所需要的信息进行收发。然而,至今的三维数据的编码结构中不存在这样的功能,因此也没有与此相对的编码方法。
在本实施方式中说明提供在三维点云的编码数据中按照用途对所需要的信息进行收发的功能的三维数据编码方法以及三维数据编码装置、对该编码数据进行解码的三维数据解码方法以及三维数据解码装置、以及对该编码数据进行复用的三维数据复用方法、以及传输该编码数据的三维数据传输方法。
特别是,当前,作为点群数据的编码方法(编码方式)研究了第1编码方法和第2编码方法,但没有定义将编码数据的构成以及编码数据保存到系统格式的方法,在这种情况下,存在无法进行编码部中的MUX处理(复用)、或者传输或储存这样的课题。
此外,如PCC(Point Cloud Compression:点云压缩)那样,对第1编码方法和第2编码方法这2个编解码器混合存在的格式进行支持的方法至今不存在。
在本实施方式中,对将第1编码方法和第2编码方法这2个编解码器混合存在的PCC编码数据的构成以及将编码数据向系统格式保存的方法进行说明。
首先,说明本实施方式的三维数据(点群数据)编码解码系统的构成。图1是表示本实施方式的三维数据编码解码系统的构成例的图。如图1所示,三维数据编码解码系统包括三维数据编码系统4601、三维数据解码系统4602、传感器终端4603以及外部连接部4604。
三维数据编码系统4601通过对作为三维数据的点群数据进行编码来生成编码数据或复用数据。此外,三维数据编码系统4601可以是由单个装置实现的三维数据编码装置,也可以是由多个装置实现的系统。另外,三维数据编码装置也可以包含于三维数据编码系统4601中包含的多个处理部中的一部分。
三维数据编码系统4601包括点群数据生成系统4611、提示部4612、编码部4613、复用部4614、输入输出部4615、以及控制部4616。点群数据生成系统4611包括传感器信息取得部4617和点群数据生成部4618。
传感器信息取得部4617从传感器终端4603取得传感器信息,并将传感器信息输出到点群数据生成部4618。点群数据生成部4618根据传感器信息生成点群数据,并将点群数据输出到编码部4613。
提示部4612向用户提示传感器信息或点群数据。例如,提示部4612显示基于传感器信息或点群数据的信息或图像。
编码部4613对点群数据进行编码(压缩),将得到的编码数据、在编码过程中得到的控制信息和其他附加信息输出到复用部4614。附加信息例如包含传感器信息。
复用部4614通过复用从编码部4613输入的编码数据、控制信息和附加信息来生成复用数据。复用数据的格式例如是用于积蓄的文件格式、或用于传输的包格式。
输入输出部4615(例如,通信部或接口)将复用数据向外部输出。或者,复用数据被积蓄于内部存储器等积蓄部。控制部4616(或应用执行部)控制各处理部。即,控制部4616进行编码及复用等控制。
此外,也可以将传感器信息向编码部4613或复用部4614输入。另外,输入输出部4615也可以将点群数据或编码数据直接向外部输出。
从三维数据编码系统4601输出的传输信号(复用数据)经由外部连接部4604输入到三维数据解码系统4602。
三维数据解码系统4602通过对编码数据或复用数据进行解码而生成作为三维数据的点群数据。此外,三维数据解码系统4602可以是由单一的装置实现的三维数据解码装置,也可以是由多个装置实现的系统。另外,三维数据解码装置也可以包含三维数据解码系统4602中包含的多个处理部中的一部分。
三维数据解码系统4602包括传感器信息取得部4621、输入输出部4622、逆复用部4623、解码部4624、提示部4625、用户接口4626、以及控制部4627。
传感器信息取得部4621从传感器终端4603取得传感器信息。
输入输出部4622取得传输信号,根据传输信号对复用数据(文件格式或者包)进行解码,并将复用数据输出到逆复用部4623。
逆复用部4623从复用数据中取得编码数据、控制信息以及附加信息,并将编码数据、控制信息以及附加信息输出到解码部4624。
解码部4624通过对编码数据进行解码而重构点群数据。
提示部4625将点群数据提示给用户。例如,提示部4625显示基于点群数据的信息或图像。用户接口4626取得基于用户的操作的指示。控制部4627(或应用执行部)控制各处理部。即,控制部4627进行逆复用、解码以及提示等的控制。
此外,输入输出部4622也可以从外部直接取得点群数据或编码数据。另外,提示部4625也可以取得传感器信息等附加信息,并提示基于附加信息的信息。另外,提示部4625也可以基于由用户接口4626取得的用户的指示来进行提示。
传感器终端4603生成由传感器取得的信息即传感器信息。传感器终端4603是搭载有传感器或相机的终端,例如有汽车等移动体、飞机等飞行物体、移动终端或相机等。
能够由传感器终端4603取得的传感器信息例如是(1)由LiDAR、毫米波雷达或者红外线传感器得到的传感器终端4603与对象物的距离、或者对象物的反射率、(2)从多个单眼相机图像或者立体相机图像得到的相机与对象物的距离或者对象物的反射率等。另外,传感器信息也可以包含传感器的姿势、朝向、回转(角速度)、位置(GPS信息或者高度)、速度或者加速度等。另外,传感器信息也可以包含气温、气压、湿度、或者磁性等。
外部连接部4604通过集成电路(LSI或IC)、外部积蓄部、经由因特网的与云服务器的通信、或者广播等来实现。
接着,对点群数据进行说明。图2是表示点群数据的构成的图。图3是表示记述了点群数据的信息的数据文件的构成例的图。
点群数据包含多个点的数据。各点的数据包含位置信息(三维坐标)以及与该位置信息相对的属性信息。将聚集了多个这样的点的群称为点群。例如,点群表示对象物(对象)的三维形状。
有时也将三维坐标等位置信息(Position)称为几何形状(geometry)。另外,各点的数据也可以包含多个属性类别的属性信息(attribute)。属性类别例如是颜色或反射率等。
既可以将1个属性信息针对1个位置信息建立对应,也可以将具有多个不同的属性类别的属性信息针对1个位置信息建立对应。另外,也可以将多个相同的属性类别的属性信息针对1个位置信息建立对应。
图3所示的数据文件的构成例是位置信息和属性信息1对1对应的情况的例子,表示构成点群数据的N个点的位置信息和属性信息。
位置信息例如是x、y、z这3轴的信息。属性信息例如是RGB的颜色信息。作为代表性的数据文件,有ply文件等。
接着,对点群数据的种类进行说明。图4是表示点群数据的种类的图。如图4所示,点群数据包含静态对象和动态对象。
静态对象是任意时间(某一个时刻)的三维点群数据。动态对象是随时间变化的三维点群数据。以下,将某时刻的三维点群数据称为PCC帧或者帧。
对象可以是如通常的影像数据那样区域被某种程度限制的点群,也可以是像地图信息那样区域未被限制的大规模点群。
另外,存在各种密度的点群数据,也可以存在稀疏的点群数据和密集的点群数据。
以下,对各处理部的详细情况进行说明。传感器信息通过LiDAR或者测距仪等距离传感器、立体相机或者多个单眼相机的组合等各种方法来取得。点群数据生成部4618基于由传感器信息取得部4617得到的传感器信息生成点群数据。点群数据生成部4618生成位置信息作为点群数据,对位置信息附加针对该位置信息的属性信息。
点群数据生成部4618也可以在生成位置信息或者附加属性信息时,对点群数据进行加工。例如,点群数据生成部4618也可以通过删除位置重复的点群来减少数据量。另外,点群数据生成部4618也可以对位置信息进行变换(位置转变、旋转或者标准化等),也可以对属性信息进行渲染。
此外,在图1中,点群数据生成系统4611包含于三维数据编码系统4601,但也可以独立设置于三维数据编码系统4601的外部。
编码部4613基于预先规定的编码方法对点群数据进行编码,由此生成编码数据。编码方法大致存在以下2种。第1种是使用了位置信息的编码方法,以后将该编码方法记载为第1编码方法。第2种是使用了视频编解码器的编码方法,以后将该编码方法记载为第2编码方法。
解码部4624基于预先规定的编码方法对编码数据进行解码,由此对点群数据进行解码。
复用部4614通过使用现有的复用方式对编码数据进行复用,从而生成复用数据。所生成的复用数据被传输或积蓄。复用部4614除了PCC编码数据以外,还复用影像、声音、字幕、应用、文件等其他媒体、或者基准时刻信息。另外,复用部4614还可以对与传感器信息或者点群数据相关联的属性信息进行复用。
作为复用方式或文件格式,有ISOBMFF、作为ISOBMFF基础的传输方式的MPEG-DASH、MMT、MPEG-2TS Systems、RMP等。
逆复用部4623从复用数据中提取PCC编码数据、其他媒体以及时刻信息等。
输入输出部4615使用与广播或通信等传输介质或积蓄介质一致的方法传输复用数据。输入输出部4615可以经由因特网与其他设备进行通信,也可以与云服务器等积蓄部进行通信。
作为通信协议,使用http、ftp、TCP或UDP等。既可以使用PULL型的通信方式,也可以使用PUSH型的通信方式。
可以使用有线传输和无线传输中的任一种。作为有线传输,使用Ethernet(注册商标)、USB、RS-232C、HDMI(注册商标)或同轴电缆等。作为无线传输,使用无线LAN、Wi-Fi(注册商标)、Bluetooth(注册商标)或毫米波等。
此外,作为广播方式,例如使用DVB-T2、DVB-S2、DVB-C2、ATSC3.0或ISDB-S3等。
图5是表示进行第1编码方法的编码的编码部4613的例子即第1编码部4630的构成的图。图6是第1编码部4630的框图。第1编码部4630通过用第1编码方法对点群数据进行编码来生成编码数据(编码流)。该第1编码部4630包括位置信息编码部4631、属性信息编码部4632、附加信息编码部4633以及复用部4634。
第1编码部4630具有意识到三维结构来进行编码的特征。另外,第1编码部4630具有属性信息编码部4632使用从位置信息编码部4631得到的信息进行编码的特征。第1编码方法也被称为GPCC(Geometry based PCC)。
点群数据是PLY文件那样的PCC点群数据、或者根据传感器信息生成的PCC点群数据,包含位置信息(Position)、属性信息(Attribute)以及其他的附加信息(MetaData)。位置信息被输入到位置信息编码部4631,属性信息被输入到属性信息编码部4632,附加信息被输入到附加信息编码部4633。
位置信息编码部4631通过对位置信息进行编码,来生成作为编码数据的编码位置信息(Compressed Geometry)。例如,位置信息编码部4631使用八叉树等N叉树结构对位置信息进行编码。具体而言,在八叉树中,对象空间被分割为8个节点(子空间),生成表示各节点中是否包含点群的8比特的信息(占用率编码)。另外,包含点群的节点进一步被分割为8个节点,生成表示在该8个节点的每一个中是否包含点群的8比特的信息。反复进行该处理,直到成为预先确定的层级或节点所包含的点群的数量的阈值以下为止。
属性信息编码部4632通过使用由位置信息编码部4631生成的构成信息进行编码,来生成作为编码数据的编码属性信息(Compressed Attribute)。例如,属性信息编码部4632基于由位置信息编码部4631生成的八叉树结构,决定在处理对象的对象点(对象节点)的编码中参照的参照点(参照节点)。例如,属性信息编码部4632参照周边节点或相邻节点中的八叉树中的父节点与对象节点的父节点相同的节点。另外,参照关系的决定方法不限于此。
另外,属性信息的编码处理可以包括量化处理、预测处理和算术编码处理中的至少一个。在该情况下,参照是指在属性信息的预测值的计算中使用参照节点,或者在编码的参数的决定中使用参照节点的状态(例如,表示在参照节点中是否包含点群的占有信息)。例如,编码的参数是量化处理中的量化参数、或者算术编码中的上下文等。
附加信息编码部4633通过对附加信息中的可压缩的数据进行编码,来生成作为编码数据的编码附加信息(Compressed MetaData)。
复用部4634通过对编码位置信息、编码属性信息、编码附加信息以及其他附加信息进行复用,来生成作为编码数据的编码流(Compressed Stream)。所生成的编码流被输出到未图示的系统层的处理部。
接着,对作为进行第1编码方法的解码的解码部4624的例子的第1解码部4640进行说明。图7是表示第1解码部4640的构成的图。图8是第1解码部4640的框图。第1解码部4640通过以第1编码方法对以第1编码方法进行了编码的编码数据(编码流)进行解码,来生成点群数据。该第1解码部4640包括逆复用部4641、位置信息解码部4642、属性信息解码部4643以及附加信息解码部4644。
从未图示的系统层的处理部将作为编码数据的编码流(Compressed Stream)输入到第1解码部4640。
逆复用部4641从编码数据中分离编码位置信息(Compressed Geometry)、编码属性信息(Compressed Attribute)、编码附加信息(Compressed MetaData)以及其他附加信息。
位置信息解码部4642通过对编码位置信息进行解码来生成位置信息。例如,位置信息解码部4642根据由八叉树等N叉树结构表示的编码位置信息,复原用三维坐标表示的点群的位置信息。
属性信息解码部4643基于由位置信息解码部4642生成的构成信息,对编码属性信息进行解码。例如,属性信息解码部4643基于由位置信息解码部4642得到的八叉树结构,决定在处理对象的对象点(对象节点)的解码中参照的参照点(参照节点)。例如,属性信息解码部4643参照周边节点或相邻节点中的八叉树中的父节点与对象节点的父节点相同的节点。另外,参照关系的决定方法不限于此。
另外,属性信息的解码处理也可以包括逆量化处理、预测处理以及算术解码处理中的至少一个。在该情况下,参照是指在属性信息的预测值的计算中使用参照节点、或者在解码的参数的决定中使用参照节点的状态(例如,表示在参照节点中是否包含点群的占有信息)。例如,解码的参数是逆量化处理中的量化参数、或者算术解码中的上下文等。
附加信息解码部4644通过对编码附加信息进行解码来生成附加信息。另外,第1解码部4640在解码时使用位置信息以及属性信息的解码处理所需的附加信息,向外部输出应用所需的附加信息。
接着,说明位置信息编码部的构成例。图9是本实施方式的位置信息编码部2700的框图。位置信息编码部2700具备八叉树生成部2701、几何信息计算部2702、编码表选择部2703、以及熵编码部2704。
八叉树生成部2701根据输入的位置信息生成例如八叉树,并且生成八叉树的各节点的占用率编码。几何信息计算部2702取得表示对象节点的相邻节点是否是占有节点的信息。例如,几何信息计算部2702根据对象节点所属的父节点的占用率编码计算相邻节点的占有信息(表示相邻节点是否是占有节点的信息)。此外,几何信息计算部2702可以预先将已编码的节点保存在列表中,并从该列表内搜索相邻节点。此外,几何信息计算部2702可以根据对象节点在父节点内的位置来切换相邻节点。
编码表选择部2703使用由几何信息计算部2702计算的相邻节点的占有信息,选择对象节点的熵编码中使用的编码表。例如,编码表选择部2703可以使用相邻节点的占有信息来生成比特串,并选择从该比特串生成的索引号的编码表。
熵编码部2704通过使用所选择的索引号的编码表对对象节点的占用率编码进行熵编码,生成编码位置信息和元数据。熵编码部2704也可以将表示所选择的编码表的信息附加在编码位置信息中。
以下,说明八叉树表现和位置信息的扫描顺序。位置信息(位置数据)被变换为八叉树结构(八叉树化)后被编码。八叉树结构由节点和叶构成。各节点具有8个节点或叶,各叶具有体素(VXL)信息。图10是表示包含多个体素的位置信息的结构例的图。图11是表示图10所示的位置信息被变换为八叉树结构的例子的图。这里,图11所示的叶中,叶1、2、3分别表示图10所示的体素VXL1、VXL2、VXL3,并表现有包含点群的VXL(以下,有效VXL)。
具体而言,节点1对应于包含图10的位置信息的整个空间。将对应于节点1的整个空间分割为8个节点,将8个节点中包含有效VXL的节点进一步分割为8个节点或叶,与树结构的层级量相应地重复该处理。这里,各节点对应于子空间,作为节点信息具有表示在分割后的哪个位置具有下一个节点或叶的信息(占用率编码)。此外,将最下层的块设定在叶中,保持包含在叶内的点群数等作为叶信息。
接着,说明位置信息解码部的结构例。图12是本实施方式的位置信息解码部2710的框图。位置信息解码部2710具备八叉树生成部2711、几何信息计算部2712、编码表选择部2713以及熵解码部2714。
八叉树生成部2711使用比特流的头信息或者元数据等来生成某空间(节点)的八叉树。例如,八叉树生成部2711使用附加在头信息中的某空间的x轴、y轴、z轴方向的大小来生成大空间(根节点),通过将该空间在x轴、y轴、z轴方向上分别进行2分割而生成8个小空间A(节点A0~A7),从而生成八叉树。另外,节点A0~A7被依次设定为对象节点。
几何信息计算部2712取得表示对象节点的相邻节点是否是占有节点的占有信息。例如,几何信息计算部2712根据对象节点所属的父节点的占用率编码来计算相邻节点的占有信息。此外,几何信息计算部2712可以预先将已解码的节点保存在列表中,并从该列表内搜索相邻节点。此外,几何信息计算部2712可以根据对象节点在父节点内的位置来切换相邻节点。
编码表选择部2713使用由几何信息计算部2712计算出的相邻节点的占有信息,选择在对象节点的熵解码中使用的编码表(解码表)。例如,编码表选择部2713可以使用相邻节点的占有信息生成比特串,并选择从该比特串生成的索引号的编码表。
熵解码部2714通过使用所选择的编码表对对象节点的占用率编码进行熵解码,生成位置信息。另外,熵解码部2714也可以从比特流中解码并取得所选择的编码表的信息,使用由该信息表示的编码表,对对象节点的占用率编码进行熵解码。
以下,说明属性信息编码部及属性信息解码部的结构。图13是表示属性信息编码部A100的结构例的框图。属性信息编码部可以包括执行不同的编码方法的多个编码部。例如,属性信息编码部可以根据使用情况来切换使用以下两种方法。
属性信息编码部A100包括LoD属性信息编码部A101和变换属性信息编码部A102。LoD属性信息编码部A101使用三维点的位置信息将各三维点分类到多个层级,预测属于各层级的三维点的属性信息,对该预测残差进行编码。在此,将分类后的各层级称为LoD(Level of Detail,多细节层次)。
变换属性信息编码部A102使用RAHT(Region Adaptive HierarchicalTransform,区域自适应分层变换)对属性信息进行编码。具体而言,变换属性信息编码部A102根据三维点的位置信息,对各属性信息应用RAHT或Haar变换,生成各层级的高频成分和低频成分,并利用量化和熵编码等对这些值进行编码。
图14是表示属性信息解码部A110的结构例的框图。属性信息解码部可以包括执行不同解码方法的多个解码部。例如,属性信息解码部也可以根据头或元数据中包含的信息来切换下述两种方式进行解码。
属性信息解码部A110包括LoD属性信息解码部A111和变换属性信息解码部A112。LoD属性信息解码部A111使用三维点的位置信息将各三维点分类到多个层级,一边预测属于各层级的三维点的属性信息一边解码属性值。
变换属性信息解码部A112使用RAHT(Region Adaptive HierarchicalTransform)对属性信息进行解码。具体而言,变换属性信息解码部A112根据三维点的位置信息,对各属性值的高频成分及低频成分应用inverse RAHT或inverse Haar变换,对属性值进行解码。
图15是表示作为LoD属性信息编码部A101的一例的属性信息编码部3140的结构的框图。
属性信息编码部3140包括LoD生成部3141、周围搜索部3142、预测部3143、预测残差计算部3144、量化部3145、算术编码部3146、逆量化部3147、解码值生成部3148和存储器3149。
LoD生成部3141使用三维点的位置信息生成LoD。
周围搜索部3142使用由LoD生成部3141进行的LoD的生成结果和表示各三维点间的距离的距离信息,搜索与各三维点相邻的邻近三维点。
预测部3143生成编码对象的对象三维点的属性信息的预测值。
预测残差计算部3144计算(生成)由预测部3143生成的属性信息的预测值的预测残差。
量化部3145对由预测残差计算部3144计算出的属性信息的预测残差进行量化。
算术编码部3146对由量化部3145量化后的预测残差进行算术编码。算术编码部3146将包含算术编码后的预测残差的比特流输出到例如三维数据解码装置。
此外,预测残差也可以在通过算术编码部3146进行算术编码之前,例如通过量化部3145进行二值化。
此外,例如,算术编码部3146可以在算术编码之前对用于算术编码的编码表进行初始化。算术编码部3146可以按每个层对用于算术编码的编码表进行初始化。另外,算术编码部3146也可以将表示对编码表进行了初始化的层的位置的信息包含在比特流中进行输出。
逆量化部3147对由量化部3145量化后的预测残差进行逆量化。
解码值生成部3148通过将由预测部3143生成的属性信息的预测值与由逆量化部3147逆量化后的预测残差相加来生成解码值。
存储器3149是存储由解码值生成部3148解码的各三维点的属性信息的解码值的存储器。例如,在生成尚未编码的三维点的预测值的情况下,预测部3143利用存储在存储器3149中的各三维点的属性信息的解码值来生成预测值。
图16是作为变换属性信息编码部A102的一例的属性信息编码部6600的框图。属性信息编码部6600具备排序部6601、Haar变换部6602、量化部6603、逆量化部6604、逆Haar变换部6605、存储器6606以及算术编码部6607。
排序部6601使用三维点的位置信息生成莫顿编码,按照莫顿编码顺序对多个三维点进行排序。Haar变换部6602通过对属性信息应用Haar变换来生成编码系数。量化部6603对属性信息的编码系数进行量化。
逆量化部6604对量化后的编码系数进行逆量化。逆Haar变换部6605对编码系数应用逆Haar变换。存储器6606存储已解码的多个三维点的属性信息的值。例如,存储器6606中存储的已解码的三维点的属性信息也可以利用于未被编码的三维点的预测等。
算术编码部6607根据量化后的编码系数计算ZeroCnt,对ZeroCnt进行算术编码。另外,算术编码部6607对量化后的非零的编码系数进行算术编码。算术编码部6607可以在算术编码前对编码系数进行二值化。另外,算术编码部6607也可以生成和编码各种头信息。
图17是表示作为LoD属性信息解码部A111的一例的属性信息解码部3150的结构的框图。
属性信息解码部3150包括LoD生成部3151、周围搜索部3152、预测部3153、算术解码部3154、逆量化部3155、解码值生成部3156以及存储器3157。
LoD生成部3151,使用由位置信息解码部(在图17中未图示)解码的三维点的位置信息来生成LoD。
周围搜索部3152使用LoD生成部3151的LoD的生成结果和表示各三维点间的距离的距离信息,搜索与各三维点相邻的邻近三维点。
预测部3153生成解码对象的对象三维点的属性信息的预测值。
算术解码部3154对从图15所示的属性信息编码部3140获得的比特流内的预测残差进行算术解码。此外,算术解码部3154可以对用于算术解码的解码表进行初始化。对图15所示的算术编码部3146进行了编码处理的层,算术解码部3154对用于算术解码的解码表进行初始化。算术解码部3154可以按每个层对用于算术解码的解码表进行初始化。此外,算术解码部3154可以基于包含在比特流中的、表示编码表初始化后的层的位置的信息,对解码表进行初始化。
逆量化部3155对算术解码部3154进行算术解码后的预测残差进行逆量化。
解码值生成部3156将由预测部3153生成的预测值和由逆量化部3155逆量化后的预测残差相加而生成解码值。解码值生成部3156将解码后的属性信息数据向其他装置输出。
存储器3157是存储由解码值生成部3156解码的各三维点的属性信息的解码值的存储器。例如,在生成尚未解码的三维点的预测值的情况下,预测部3153利用存储在存储器3157中的各三维点的属性信息的解码值来生成预测值。
图18是作为变换属性信息解码部A112的一例的属性信息解码部6610的框图。属性信息解码部6610具备算术解码部6611、逆量化部6612、逆Haar变换部6613以及存储器6614。
算术解码部6611对比特流所包含的ZeroCnt和编码系数进行算术解码。另外,算术解码部6611也可以对各种头信息进行解码。
逆量化部6612对算术解码出的编码系数进行逆量化。逆Haar变换部6613对逆量化后的编码系数应用逆Haar变换。存储器6614存储已解码的多个三维点的属性信息的值。例如,存储器6614中存储的已解码的三维点的属性信息也可以利用于未被解码的三维点的预测。
接着,对作为进行第2编码方法的编码的编码部4613的例子的第2编码部4650进行说明。图19是表示第2编码部4650的结构的图。图20是第2编码部4650的框图。
第2编码部4650通过以第2编码方法对点群数据进行编码来生成编码数据(编码流)。该第2编码部4650包括附加信息生成部4651、位置图像生成部4652、属性图像生成部4653、影像编码部4654、附加信息编码部4655以及复用部4656。
第2编码部4650具有如下特征:通过将三维结构投影于二维图像来生成位置图像以及属性图像,并使用现有的影像编码方式对所生成的位置图像以及属性图像进行编码。第2编码方法也被称为VPCC(video based PCC,基于视频的PCC)。
点群数据是PLY文件那样的PCC点群数据、或者根据传感器信息生成的PCC点群数据,包含位置信息(Position)、属性信息(Attribute)以及其他的附加信息(MetaData)。
附加信息生成部4651通过将三维结构投影到二维图像,来生成多个二维图像的映射信息。
位置图像生成部4652基于位置信息和由附加信息生成部4651生成的映射信息,生成位置图像(Geometry Image)。该位置图像例如是表示距离(Depth)作为像素值的距离图像。另外,该距离图像既可以是从1个视点观察多个点群的图像(在1个二维平面上投影了多个点群的图像),也可以是从多个视点观察多个点群的多个图像,也可以是将这些多个图像合并而成的1个图像。
属性图像生成部4653基于属性信息和由附加信息生成部4651生成的映射信息,生成属性图像。该属性图像例如是表示属性信息(例如颜色(RGB))作为像素值的图像。另外,该图像可以是从1个视点观察多个点群的图像(在1个二维平面上投影了多个点群的图像),也可以是从多个视点观察多个点群的多个图像,也可以是将这些多个图像合并而成的1个图像。
影像编码部4654通过使用影像编码方式对位置图像以及属性图像进行编码,从而生成作为编码数据的编码位置图像(Compressed Geometry Image)以及编码属性图像(Compressed Attribute Image)。此外,作为影像编码方式,可以使用公知的任意的编码方式。例如,影像编码方式是AVC或HEVC等。
附加信息编码部4655通过对点群数据中包含的附加信息以及映射信息等进行编码来生成编码附加信息(Compressed MetaData)。
复用部4656通过对编码位置图像、编码属性图像、编码附加信息以及其他附加信息进行复用,来生成作为编码数据的编码流(Compressed Stream)。所生成的编码流被输出到未图示的系统层的处理部。
接着,对作为进行第2编码方法的解码的解码部4624的例子的第2解码部4660进行说明。图21是表示第2解码部4660的结构的图。图22是第2解码部4660的框图。第2解码部4660通过以第2编码方法对以第2编码方法进行了编码的编码数据(编码流)进行解码,来生成点群数据。该第2解码部4660包括逆复用部4661、影像解码部4662、附加信息解码部4663、位置信息生成部4664以及属性信息生成部4665。
从未图示的系统层的处理部将作为编码数据的编码流(Compressed Stream)输入到第2解码部4660。
逆复用部4661从编码数据中分离编码位置图像(Compressed Geometry Image)、编码属性图像(Compressed Attribute Image)、编码附加信息(Compressed MetaData)以及其他附加信息。
影像解码部4662通过使用影像编码方式对编码位置图像以及编码属性图像进行解码,来生成位置图像以及属性图像。此外,作为影像编码方式,可以使用公知的任意的编码方式。例如,影像编码方式是AVC或HEVC等。
附加信息解码部4663通过对编码附加信息进行解码,来生成包含映射信息等的附加信息。
位置信息生成部4664使用位置图像和映射信息生成位置信息。属性信息生成部4665使用属性图像和映射信息生成属性信息。
第2解码部4660在解码时使用解码所需的附加信息,向外部输出应用所需的附加信息。
以下,说明PCC编码方式中的课题。图23是表示与PCC编码数据有关的协议栈的图。图23表示在PCC编码数据中复用、传输或积蓄影像(例如HEVC)或声音等其他媒体的数据的例子。
复用方式及文件格式具有用于复用、传输或积蓄各种编码数据的功能。为了传输或积蓄编码数据,必须将编码数据变换为复用方式的格式。例如,在HEVC中,规定了将编码数据保存在被称为NAL单元的数据结构中,将NAL单元保存到ISOBMFF中的技术。
另一方面,当前,作为点群数据的编码方式,正在研究第1编码方法(Codec1)以及第2编码方法(Codec2),但没有定义编码数据的结构以及将编码数据保存到系统格式的方法,存在无法直接进行编码部中的MUX处理(复用)、传输以及积蓄这样的课题。
另外,以下,如果没有特定的编码方法的记载,则表示第1编码方法和第2编码方法中的任一个。
(实施方式2)
在本实施方式中,对由上述的第1编码部4630或第2编码部4650生成的编码数据(位置信息(Geometry)、属性信息(Attribute)、附加信息(Metadata))的种类及附加信息(元数据)的生成方法、以及复用部中的复用处理进行说明。另外,附加信息(元数据)也有表述为参数集或控制信息的情况。
在本实施方式中,以在图4中说明的动态对象(随时间而变化的三维点群数据)为例进行说明,但在静态对象(任意的时刻的三维点群数据)的情况下也可以使用同样的方法。
图24是表示在有关本实施方式的三维数据编码装置中包含的编码部4801及复用部4802的结构的图。编码部4801例如对应于上述的第1编码部4630或第2编码部4650。复用部4802对应于上述的复用部4634或4656。
编码部4801将多个PCC(Point Cloud Compression)帧的点群数据编码,生成多个位置信息、属性信息及附加信息的编码数据(Multiple Compressed Data)。
复用部4802通过对多个数据种类(位置信息、属性信息及附加信息)的数据进行NAL单元化,将数据变换为考虑了解码装置中的数据访问的数据结构。
图25是表示由编码部4801生成的编码数据的结构例的图。图中的箭头表示与编码数据的解码有关的依赖关系,箭头的根部依赖于箭头的尖部的数据。即,解码装置将箭头的尖部的数据解码,使用该解码的数据将箭头的根部的数据解码。换言之,依赖是指在依赖源的数据的处理(编码或解码等)中参照(使用)依赖目标的数据。
首先,对位置信息的编码数据的生成处理进行说明。编码部4801通过将各帧的位置信息编码,生成各帧的编码位置数据(Compressed Geometry Data)。此外,将编码位置数据用G(i)表示。i表示帧号或帧的时刻等。
此外,编码部4801生成与各帧对应的位置参数集(GPS(i))。位置参数集包含能够在编码位置数据的解码中使用的参数。此外,每个帧的编码位置数据依赖于对应的位置参数集。
此外,将由多个帧构成的编码位置数据定义为位置序列(Geometry Sequence)。编码部4801生成将在对于位置序列内的多个帧的解码处理中共同使用的参数进行保存的位置序列参数集(Geometry Sequence PS:也记作位置SPS)。位置序列依赖于位置SPS。
接着,对属性信息的编码数据的生成处理进行说明。编码部4801通过将各帧的属性信息编码,生成各帧的编码属性数据(Compressed Attribute Data)。此外,将编码属性数据用A(i)表示。此外,在图25中,示出了存在属性X和属性Y的例子,将属性X的编码属性数据用AX(i)表示,将属性Y的编码属性数据用AY(i)表示。
此外,编码部4801生成与各帧对应的属性参数集(APS(i))。此外,将属性X的属性参数集用AXPS(i)表示,将属性Y的属性参数集用AYPS(i)表示。属性参数集包含能够在编码属性信息的解码中使用的参数。编码属性数据依赖于对应的属性参数集。
此外,将由多个帧构成的编码属性数据定义为属性序列(Attribute Sequence)。编码部4801生成将在对于属性序列内的多个帧的解码处理中共同使用的参数进行保存的属性序列参数集(Attribute Sequence PS:也记作属性SPS)。属性序列依赖于属性SPS。
此外,在第1编码方法中,编码属性数据依赖于编码位置数据。
此外,在图25中,示出了存在两种属性信息(属性X和属性Y)的情况下的例子。在有两种属性信息的情况下,例如由两个编码部生成各自的数据及元数据。此外,例如按属性信息的每个种类来定义属性序列,按属性信息的每个种类来生成属性SPS。
另外,在图25中,示出了位置信息是1种、属性信息是两种的例子,但并不限于此,属性信息也可以是1种,也可以是3种以上。在此情况下,也能够用同样的方法生成编码数据。此外,在不具有属性信息的点群数据的情况下,也可以没有属性信息。在此情况下,编码部4801也可以不生成与属性信息关联的参数集。
接着,对附加信息(元数据)的生成处理进行说明。编码部4801生成PCC流整体的参数集即PCC流PS(PCC Stream PS:也记作流PS)。编码部4801在流PS中保存能够在对1个或多个位置序列及1个或多个属性序列的解码处理中共同使用的参数。例如,在流PS中,包含表示点群数据的编解码器的识别信息及表示在编码中使用的算法的信息等。位置序列及属性序列依赖于流PS。
接着,对访问单元及GOF进行说明。在本实施方式中,新导入访问单元(AccessUnit:AU)及GOF(Group of Frame:帧组)的考虑方式。
访问单元是在解码时用来访问数据的基本单位,由1个以上的数据及1个以上的元数据构成。例如,访问单元由相同时刻的位置信息和1个或多个属性信息构成。GOF是随机访问单位,由1个以上的访问单元构成。
编码部4801生成访问单元头(AU Header)作为表示访问单元的开头的识别信息。编码部4801在访问单元头中保存与访问单元有关的参数。例如,访问单元头包含:在访问单元中包含的编码数据的结构或信息。此外,访问单元头包含对在访问单元中包含的数据共同使用的参数,例如与编码数据的解码有关的参数等。
另外,编码部4801也可以代替访问单元头而生成不包含与访问单元有关的参数的访问单元定界符。该访问单元定界符被用作表示访问单元的开头的识别信息。解码装置通过检测访问单元头或访问单元定界符,识别访问单元的开头。
接着,对GOF开头的识别信息的生成进行说明。编码部4801生成GOF头(GOFHeader)作为表示GOF的开头的识别信息。编码部4801在GOF头中保存与GOF有关的参数。例如,GOF头包含:在GOF中包含的编码数据的结构或信息。此外,GOF头包含对在GOF中包含的数据共同使用的参数,例如与编码数据的解码有关的参数等。
另外,编码部4801也可以代替GOF头而生成不包含与GOF有关的参数的GOF定界符。该GOF定界符被用作表示GOF的开头的识别信息。解码装置通过检测GOF头或GOF定界符,识别GOF的开头。
在PCC编码数据中,例如定义为访问单元是PCC帧单位。解码装置基于访问单元开头的识别信息,对PCC帧进行访问。
此外,例如GOF被定义为1个随机访问单位。解码装置基于GOF开头的识别信息,对随机访问单位进行访问。例如,如果PCC帧相互没有依赖关系而能够单独解码,则也可以将PCC帧定义为随机访问单位。
另外,也可以对1个访问单元分配两个以上的PCC帧,也可以对1个GOF分配多个随机访问单位。
此外,编码部4801也可以定义并生成上述以外的参数集或元数据。例如,编码部4801也可以生成保存有可能在解码时不一定使用的参数(可选的参数)的SEI(Supplemental Enhancement Information:补充增强信息)。
接着,说明编码数据的结构及编码数据向NAL单元的保存方法。
例如,按编码数据的每个种类规定数据格式。图26是表示编码数据及NAL单元的例子的图。
例如,如图26所示,编码数据包括头和有效载荷。另外,编码数据也可以包含编码数据、头或表示有效载荷的长度(数据量)的长度信息。此外,编码数据也可以不包含头。
头例如包含用来确定数据的识别信息。该识别信息例如表示数据种类或帧号。
头例如包含表示参照关系的识别信息。该识别信息例如是在数据间有依赖关系的情况下被保存到头中,用来从参照源对参照目标进行参照的信息。例如,在参照目标的头中,包含用来确定该数据的识别信息。在参照源的头中,包含表示参照目标的识别信息。
另外,在能够从其他信息识别或导出参照目标或参照源的情况下,也可以省略用来确定数据的识别信息或表示参照关系的识别信息。
复用部4802将编码数据保存在NAL单元的有效载荷中。在NAL单元头中,包含作为编码数据的识别信息的pcc_nal_unit_type。图27是表示pcc_nal_unit_type的语义例的图。
如图27所示,在pcc_codec_type是编解码器1(Codec1:第1编码方法)的情况下,pcc_nal_unit_type的值0~10被分配给编解码器1中的编码位置数据(Geometry)、编码属性X数据(AttributeX)、编码属性Y数据(AttributeY)、位置PS(Geom.PS)、属性XPS(AttrX.PS)、属性YPS(AttrX.PS)、位置SPS(Geometry Sequence PS)、属性XSPS(AttributeX Sequence PS)、属性YSPS(AttributeY Sequence PS)、AU头(AU Header)、GOF头(GOF Header)。此外,值11以后被分配为编解码器1的备用。
在pcc_codec_type是编解码器2(Codec2:第2编码方法)的情况下,pcc_nal_unit_type的值0~2被分配给编解码器的数据A(DataA)、元数据A(MetaDataA)、元数据B(MetaDataB)。此外,值3以后被分配为编解码器2的备用。
接着,对数据的送出顺序进行说明。以下,对NAL单元的送出顺序的制约进行说明。
复用部4802将NAL单元以GOF或AU单位一起送出。复用部4802将GOF头配置在GOF的开头,将AU头配置在AU的开头。
复用部4802也可以按每个AU来配置序列参数集(SPS),以使得在因丢包等而丢失了数据的情况下解码装置也能够从下个AU起进行解码。
在编码数据中有与解码有关的依赖关系的情况下,解码装置在将参照目标的数据解码后,将参照源的数据解码。在解码装置中,为了使得能够不将数据重新排列而以接收到的顺序进行解码,复用部4802先送出参照目标的数据。
图28是表示NAL单元的送出顺序的例子的图。图28表示位置信息优先、参数优先和数据合并这3个例子。
位置信息优先的送出顺序是将与位置信息有关的信息和与属性信息有关的信息的各信息一起送出的例子。在该送出顺序的情况下,与位置信息有关的信息的送出比与属性信息有关的信息的送出更早完成。
例如,通过使用该送出顺序,不解码属性信息的解码装置通过忽视属性信息的解码,有可能能够设置不进行处理的时间。此外,例如在想要早解码位置信息的解码装置的情况下,通过较早得到位置信息的编码数据,有可能能够更早地解码位置信息。
另外,在图28中,将属性XSPS与属性YSPS合并而记作属性SPS,但也可以单独地配置属性XSPS和属性YSPS。
在参数集优先的送出顺序中,先送出参数集,后送出数据。
如以上这样,只要遵循NAL单元送出顺序的制约,复用部4802将NAL单元以怎样的顺序送出都可以。例如,也可以定义顺序识别信息,复用部4802具有以多个样式的顺序送出NAL单元的功能。例如在流PS中保存NAL单元的顺序识别信息。
三维数据解码装置也可以基于顺序识别信息进行解码。也可以从三维数据解码装置向三维数据编码装置指示期望的送出顺序,三维数据编码装置(复用部4802)按照被指示的送出顺序对送出顺序进行控制。
另外,只要是如数据合并的送出顺序那样遵循送出顺序的制约的范围,复用部4802也可以生成将多个功能归并的编码数据。例如,如图28所示,也可以将GOF头与AU头合并,也可以将AXPS与AYPS合并。在此情况下,在pcc_nal_unit_type中,定义表示是具有多个功能的数据的标识符。
以下,对本实施方式的变形例进行说明。如帧级的PS、序列级的PS、PCC序列级的PS那样,PS有级别,如果将PCC序列级设为上位的级别,将帧级设为下位的级别,则参数的保存方法也可以使用下述的方法。
将默认的PS的值用较上位的PS表示。此外,在下位的PS的值与上位的PS的值不同的情况下,用下位的PS表示PS的值。或者,在上位不记载PS的值,在下位的PS中记载PS的值。或者,用下位的PS和上位的PS的某一方或双方来表示将PS的值用下位的PS表示、还是用上位的PS表示、还是用双方表示的信息。或者,也可以将下位的PS归并到上位的PS。或者,在下位的PS与上位的PS重复的情况下,复用部4802也可以将某一方的送出省略。
另外,编码部4801或复用部4802也可以将数据分割为切片或瓦片等,将分割后的数据送出。在分割后的数据中,包含用来识别所分割的数据的信息,在参数集中包含在分割数据的解码中使用的参数。在此情况下,在pcc_nal_unit_type中,定义表示是与瓦片或切片有关的数据或保存参数的数据的标识符。
(实施方式3)
在HEVC编码中,为了使得能够进行解码装置的并行处理,有切片或瓦片等的数据分割的工具,但在PCC(Point Cloud Compression:点云压缩)编码中还没有。
在PCC中,根据并行处理、压缩效率及压缩算法,可以考虑各种各样的数据分割方法。这里,对切片及瓦片的定义、数据结构及送接收方法进行说明。
图29是表示有关本实施方式的三维数据编码装置中包含的第1编码部4910的构成的框图。第1编码部4910通过用第1编码方法(GPCC(Geometry based PCC))将点群数据编码而生成编码数据(编码流)。该第1编码部4910包括分割部4911、多个位置信息编码部4912、多个属性信息编码部4913、附加信息编码部4914和复用部4915。
分割部4911通过将点群数据分割而生成多个分割数据。具体而言,分割部4911通过将点群数据的空间分割为多个子空间而生成多个分割数据。这里子空间指的是瓦片及切片中的一方、或瓦片及切片的组合。更具体地讲,点群数据包含位置信息、属性信息及附加信息。分割部4911将位置信息分割为多个分割位置信息,将属性信息分割为多个分割属性信息。此外,分割部4911生成关于分割的附加信息。
多个位置信息编码部4912通过将多个分割位置信息编码,生成多个编码位置信息。例如,多个位置信息编码部4912将多个分割位置信息并行处理。
多个属性信息编码部4913通过将多个分割属性信息编码而生成多个编码属性信息。例如,多个属性信息编码部4913将多个分割属性信息并行处理。
附加信息编码部4914通过将点群数据中包含的附加信息和由分割部4911在分割时生成的关于数据分割的附加信息编码,生成编码附加信息。
复用部4915通过将多个编码位置信息、多个编码属性信息及编码附加信息复用,生成编码数据(编码流),将所生成的编码数据送出。此外,编码附加信息在解码时被使用。
另外,在图29中,示出了位置信息编码部4912及属性信息编码部4913的数量分别为两个的例子,但位置信息编码部4912及属性信息编码部4913的数量分别也可以是1个,也可以是3个以上。此外,多个分割数据既可以如CPU内的多核那样在同一芯片内并行处理,也可以由多个芯片的核并行处理,也可以由多个芯片的多个核进行并行处理。
图30是表示第1解码部4920的构成的框图。第1解码部4920通过对通过用第1编码方法(GPCC)将点群数据编码而生成的编码数据(编码流)进行解码,将点群数据复原。该第1解码部4920包括逆复用部4921、多个位置信息解码部4922、多个属性信息解码部4923、附加信息解码部4924和结合部4925。
逆复用部4921通过将编码数据(编码流)逆复用,生成多个编码位置信息、多个编码属性信息及编码附加信息。
多个位置信息解码部4922通过将多个编码位置信息解码而生成多个分割位置信息。例如,多个位置信息解码部4922将多个编码位置信息并行处理。
多个属性信息解码部4923通过将多个编码属性信息解码而生成多个分割属性信息。例如,多个属性信息解码部4923将多个编码属性信息并行处理。
多个附加信息解码部4924通过将编码附加信息解码,生成附加信息。
结合部4925通过使用附加信息将多个分割位置信息结合,生成位置信息。结合部4925通过使用附加信息将多个分割属性信息结合,生成属性信息。
另外,在图30中示出了位置信息解码部4922及属性信息解码部4923的数量分别为两个的例子,但位置信息解码部4922及属性信息解码部4923的数量分别也可以是1个,也可以是3个以上。此外,多个分割数据既可以如CPU内的多核那样在同一芯片内并行处理,也可以由多个芯片的核并行处理,也可以由多个芯片的多个核进行并行处理。
接着,说明分割部4911的构成。图31是分割部4911的框图。分割部4911包括切片分割部4931(Slice Divider)、位置信息瓦片分割部4932(Geometry Tile Divider)和属性信息瓦片分割部4933(Attribute Tile Divider)。
切片分割部4931通过将位置信息(Position(Geometry))分割为切片而生成多个切片位置信息。此外,切片分割部4931通过将属性信息(Attribute)分割为切片而生成多个切片属性信息。此外,切片分割部4931输出有关切片分割的信息及包含在切片分割中生成的信息的切片附加信息(SliceMetaData)。
位置信息瓦片分割部4932通过将多个切片位置信息分割为瓦片而生成多个分割位置信息(多个瓦片位置信息)。此外,位置信息瓦片分割部4932输出与位置信息的瓦片分割有关的信息及包含在位置信息的瓦片分割中生成的信息的位置瓦片附加信息(GeometryTile MetaData)。
属性信息瓦片分割部4933通过将多个切片属性信息分割为瓦片而生成多个分割属性信息(多个瓦片属性信息)。此外,属性信息瓦片分割部4933输出与属性信息的瓦片分割有关的信息及包含在属性信息的瓦片分割中生成的信息的属性瓦片附加信息(Attribute Tile MetaData)。
另外,被分割的切片或瓦片的数量是1个以上。即,也可以不进行切片或瓦片的分割。
此外,这里示出了在切片分割后进行瓦片分割的例子,但也可以在瓦片分割后进行切片分割。此外,除了切片及瓦片以外,也可以再定义新的分割种类,以3个以上的分割种类进行分割。
以下,对点群数据的分割方法进行说明。图32是表示切片及瓦片分割的例子的图。
首先,对切片分割的方法进行说明。分割部4911将三维点群数据以切片单位分割为任意的点群。分割部4911在切片分割中不分割构成点的位置信息和属性信息,而将位置信息和属性信息一齐分割。即,分割部4911以任意点处的位置信息和属性信息属于相同的切片的方式进行切片分割。另外,只要遵循这些,则分割数量及分割方法是怎样的方法都可以。此外,分割的最小单位是点。例如,位置信息和属性信息的分割数量相同。例如,与切片分割后的位置信息对应的三维点和与属性信息对应的三维点包含于相同的切片中。
此外,分割部4911在切片分割时生成作为与分割数量及分割方法有关的附加信息的切片附加信息。切片附加信息在位置信息和属性信息中是相同的。例如,切片附加信息包含表示分割后的包围盒(bounding box)的基准坐标位置、大小或边的长度的信息。此外,切片附加信息包含表示分割数量及分割类型等的信息。
接着,对瓦片分割的方法进行说明。分割部4911将被切片分割后的数据分割为切片位置信息(G切片)和切片属性信息(A切片),将切片位置信息和切片属性信息分别分割为瓦片单位。
另外,在图32中示出了以8叉树结构分割的例子,但分割数量及分割方法是怎样的方法都可以。
此外,分割部4911将位置信息和属性信息既可以用不同的分割方法分割,也可以用相同的分割方法分割。此外,分割部4911将多个切片既可以用不同的分割方法分割为瓦片,也可以用相同的分割方法分割为瓦片。
此外,分割部4911在瓦片分割时生成与分割数量及分割方法有关的瓦片附加信息。瓦片附加信息(位置瓦片附加信息及属性瓦片附加信息)在位置信息和属性信息中独立。例如,瓦片附加信息包含表示分割后的包围盒的基准坐标位置、大小或边的长度的信息。此外,瓦片附加信息包含表示分割数量及分割类型等的信息。
接着,说明将点群数据分割为切片或瓦片的方法的例子。作为切片或瓦片分割的方法,分割部4911既可以使用预先设定的方法,也可以根据点群数据而自适应地切换所使用的方法。
在切片分割时,分割部4911对于位置信息和属性信息一齐将三维空间分割。例如,分割部4911判定对象的形状,根据对象的形状将三维空间分割为切片。例如,分割部4911提取树或建筑物等对象,以对象单位进行分割。例如,分割部4911进行切片分割,以使1个或多个对象的整体包含于1个切片中。或者,分割部4911将一个对象分割为多个切片。
在此情况下,编码装置例如也可以按每个切片改变编码方法。例如,编码装置也可以对特定的对象或对象的特定的一部分使用高品质的压缩方法。在此情况下,编码装置也可以将表示每个切片的编码方法的信息向附加信息(元数据)保存。
此外,分割部4911也可以基于地图信息或位置信息进行切片分割,以使各切片对应于预先设定的坐标空间。
在瓦片分割时,分割部4911将位置信息和属性信息独立地分割。例如,分割部4911根据数据量或处理量将切片分割为瓦片。例如,分割部4911判定切片的数据量(例如切片中包含的三维点的数量)是否比预先设定的阈值多。分割部4911在切片的数据量比阈值多的情况下将切片分割为瓦片。分割部4911在切片的数据量比阈值少时不将切片分割为瓦片。
例如,分割部4911将切片分割为瓦片,以使解码装置中的处理量或处理时间成为一定的范围(预先设定的值以下)。由此,解码装置的每个瓦片的处理量成为一定,解码装置中的分散处理变得容易。
此外,分割部4911在位置信息和属性信息中处理量不同的情况下,例如在位置信息的处理量比属性信息的处理量多的情况下,使位置信息的分割数量比属性信息的分割数量多。
此外,例如根据内容,在解码装置也可以将位置信息较早地解码并显示、将属性信息然后慢慢解码而显示的情况下,分割部4911也可以使位置信息的分割数量比属性信息的分割数量多。由此,解码装置能够使位置信息的并行数量变多,所以能够使位置信息的处理比属性信息的处理高速化。
另外,解码装置并不需要一定将被切片化或瓦片化的数据并行处理,也可以根据解码处理部的数量或能力来判定是否将它们并行处理。
通过用以上那样的方法分割,能够实现与内容或对象对应的自适应的编码。此外,能够实现解码处理中的并行处理。由此,点群编码系统或点群解码系统的柔性提高。
图33是表示切片及瓦片的分割的样式的例子的图。图中的DU是数据单位(DataUnit),表示瓦片或切片的数据。此外,各DU包括切片索引(Slice Index)和瓦片索引(TileIndex)。图中的DU的右上的数值表示切片索引,DU的左下的数值表示瓦片索引。
在样式1中,在切片分割中,在G切片和A切片中分割数量及分割方法相同。在瓦片分割中,对于G切片的分割数量及分割方法与对于A切片的分割数量及分割方法不同。此外,在多个G切片间使用相同的分割数量及分割方法。在多个A切片间使用相同的分割数量及分割方法。
在样式2中,在切片分割中,在G切片和A切片中分割数量及分割方法相同。在瓦片分割中,对于G切片的分割数量及分割方法与对于A切片的分割数量及分割方法不同。此外,在多个G切片间,分割数量及分割方法不同。在多个A切片间,分割数量及分割方法不同。
接着,对分割数据的编码方法进行说明。三维数据编码装置(第1编码部4910)将被分割后的数据分别编码。三维数据编码装置在将属性信息编码时,生成表示基于哪个构成信息(位置信息、附加信息或其他属性信息)进行了编码的依赖关系信息作为附加信息。即,依赖关系信息例如表示参照目标(依赖目标)的构成信息。在此情况下,三维数据编码装置基于与属性信息的分割形状对应的构成信息生成依赖关系信息。另外,三维数据编码装置也可以基于与多个分割形状对应的构成信息生成依赖关系信息。
依赖关系信息也可以由三维数据编码装置生成,所生成的依赖关系信息被送出至三维数据解码装置。或者,也可以由三维数据解码装置生成依赖关系信息,三维数据编码装置不送出依赖关系信息。此外,也可以预先设定三维数据编码装置使用的依赖关系,三维数据编码装置不送出依赖关系信息。
图34是表示各数据的依赖关系的一例的图。图中的箭头的尖部表示依赖目标,箭头的根部表示依赖源。三维数据解码装置以从依赖目标到依赖源的顺序将数据解码。此外,在图中用实线表示的数据是实际被送出的数据,由点线表示的数据是不被送出的数据。
此外,在该图中,G表示位置信息,A表示属性信息。Gs1表示切片号1的位置信息,Gs2表示切片号2的位置信息。Gs1t1表示切片号1且瓦片号1的位置信息,Gs1t2表示切片号1且瓦片号2的位置信息,Gs2t1表示切片号2且瓦片号1的位置信息,Gs2t2表示切片号2且瓦片号2的位置信息。同样,As1表示切片号1的属性信息,As2表示切片号2的属性信息。As1t1表示切片号1且瓦片号1的属性信息,As1t2表示切片号1且瓦片号2的属性信息,As2t1表示切片号2且瓦片号1的属性信息,As2t2表示切片号2且瓦片号2的属性信息。
Mslice表示切片附加信息,MGtile表示位置瓦片附加信息,MAtile表示属性瓦片附加信息。Ds1t1表示属性信息As1t1的依赖关系信息,Ds2t1表示属性信息As2t1的依赖关系信息。
此外,三维数据编码装置也可以将数据以解码顺序重新排列,以使得在三维数据解码装置中不需要将数据重新排列。另外,也可以在三维数据解码装置中将数据重新排列,也可以在三维数据编码装置和三维数据解码装置双方中将数据重新排列。
图35是表示数据的解码顺序的例子的图。在图35的例子中,从左方的数据起依次进行解码。三维数据解码装置在处于依赖关系的数据间,先从依赖目标的数据开始进行解码。例如,三维数据编码装置将数据预先重新排列为该顺序而送出。另外,只要是依赖目标的数据为先的顺序,则怎样的顺序都可以。此外,三维数据编码装置也可以将附加信息及依赖关系信息比数据先送出。
图36是表示由三维数据符号装置进行的处理的流程的流程图。首先,三维数据编码装置如上述那样将多个切片或瓦片的数据编码(S4901)。接着,三维数据编码装置如图35所示,以依赖目标的数据为先的方式将数据重新排列(S4902)。接着,三维数据编码装置将重新排列后的数据复用(NAL单元化)(S4903)。
接着,说明在第1解码部4920中包含的结合部4925的构成。图37是表示结合部4925的构成的框图。结合部4925包括位置信息瓦片结合部4941(Geometry Tile Combiner)、属性信息瓦片结合部4942(Attribute Tile Combiner)和切片结合部(Slice Combiner)。
位置信息瓦片结合部4941通过使用位置瓦片附加信息将多个分割位置信息结合,生成多个切片位置信息。属性信息瓦片结合部4942通过使用属性瓦片附加信息将多个分割属性信息结合,生成多个切片属性信息。
切片结合部4943通过使用切片附加信息将多个切片位置信息结合而生成位置信息。此外,切片结合部4943通过使用切片附加信息将多个切片属性信息结合而生成属性信息。
另外,被分割的切片或瓦片的数量是1个以上。即,也可以不进行切片或瓦片的分割。
此外,这里示出了在切片分割后进行瓦片分割的例子,但也可以在瓦片分割后进行切片分割。此外,除了切片及瓦片以外也可以还定义新的分割种类,以3个以上的分割种类进行分割。
接着,说明被切片分割或瓦片分割的编码数据的构成、以及编码数据向NAL单元的保存方法(复用方法)。图38是说明编码数据的构成及编码数据向NAL单元的保存方法的图。
编码数据(分割位置信息及分割属性信息)被保存到NAL单元的有效载荷中。
编码数据包括头和有效载荷。头是用来确定有效载荷中包含的数据的识别信息。该识别信息例如包括切片分割或瓦片分割的种类(slice_type、tile_type)、用来确定切片或瓦片的索引信息(slice_idx、tile_idx)、数据(切片或瓦片)的位置信息、或数据的地址(address)等。用来确定切片的索引信息也记作切片索引(Slice Index)。用来确定瓦片的索引信息也记作瓦片索引(Tile Index)。此外,分割的种类例如是上述那样的基于对象形状的方法、基于地图信息或位置信息的方法、或者基于数据量或处理量的方法等。
另外,上述信息的全部或一部分也可以被保存在分割位置信息的头及分割属性信息的头的一方中,而不保存在另一方中。例如,在位置信息和属性信息中使用相同的分割方法的情况下,在位置信息和属性信息中,分割的种类(slice_type、tile_type)及索引信息(slice_idx、tile_idx)相同。因此,也可以在位置信息和属性信息的一方的头中包含这些信息。例如,在属性信息依赖于位置信息的情况下,位置信息先被处理。因此,也可以在位置信息的头中包含这些信息,在属性信息的头中不包含这些信息。在此情况下,三维数据解码装置例如判断为依赖源的属性信息属于与依赖目标的位置信息的切片或瓦片相同的切片或瓦片。
此外,有关切片分割或瓦片分割的附加信息(切片附加信息、位置瓦片附加信息或属性瓦片附加信息)及表示依赖关系的依赖关系信息等也可以被保存在既有的参数集(GPS、APS、位置SPS或属性SPS等)中而送出。在分割方法按每个帧变化的情况下,也可以在每个帧的参数集(GPS或APS等)中保存表示分割方法的信息。在序列内分割方法不变化的情况下,也可以在每个序列的参数集(位置SPS或属性SPS)中保存表示分割方法的信息。进而,在位置信息和属性信息中使用相同的分割方法的情况下,也可以在PCC流的参数集(流PS)中保存表示分割方法的信息。
此外,上述的信息既可以被保存在上述的某个参数集中,也可以被保存在多个参数集中。此外,也可以定义瓦片分割或切片分割用的参数集,在该参数集中保存上述信息。此外,这些信息也可以被保存在编码数据的头中。
此外,编码数据的头包含表示依赖关系的识别信息。即,在数据间有依赖关系的情况下,该头包含用来从依赖源参照依赖目标的识别信息。例如,在依赖目标的数据的头中,包含用来确定该数据的识别信息。在依赖源的数据的头中,包含表示依赖目标的识别信息。另外,在能够根据其他信息识别或导出用来确定数据的识别信息、与切片分割或瓦片分割有关的附加信息及表示依赖关系的识别信息的情况下,也可以将这些信息省略。
接着,对有关本实施方式的点群数据的编码处理及解码处理的流程进行说明。图39是有关本实施方式的点群数据的编码处理的流程图。
首先,三维数据编码装置决定使用的分割方法(S4911)。该分割方法包含是否进行切片分割、是否进行瓦片分割。此外,分割方法也可以包含进行切片分割或瓦片分割的情况下的分割数量及分割的种类等。分割的种类指的是上述那样的基于对象形状的方法、基于地图信息或位置信息的方法、或者基于数据量或处理量的方法等。另外,分割方法也可以被预先设定。
在进行切片分割的情况下(在S4912中“是”),三维数据编码装置通过将位置信息和属性信息一齐分割,生成多个切片位置信息及多个切片属性信息(S4913)。此外,三维数据编码装置生成有关切片分割的切片附加信息。另外,三维数据编码装置也可以将位置信息和属性信息独立地分割。
在进行瓦片分割的情况下(在S4914中“是”),三维数据编码装置通过将多个切片位置信息及多个切片属性信息(或位置信息及属性信息)独立地分割,生成多个分割位置信息及多个分割属性信息(S4915)。此外,三维数据编码装置生成与瓦片分割有关的位置瓦片附加信息及属性瓦片附加信息。另外,三维数据编码装置也可以将切片位置信息和切片属性信息一齐分割。
接着,三维数据编码装置通过将多个分割位置信息及多个分割属性信息分别编码,生成多个编码位置信息及多个编码属性信息(S4916)。此外,三维数据编码装置生成依赖关系信息。
接着,三维数据编码装置通过将多个编码位置信息、多个编码属性信息及附加信息进行NAL单元化(复用)而生成编码数据(编码流)(S4917)。此外,三维数据编码装置将所生成的编码数据送出。
图40是有关本实施方式的点群数据的解码处理的流程图。首先,三维数据解码装置通过将编码数据(编码流)中包含的有关分割方法的附加信息(切片附加信息、位置瓦片附加信息及属性瓦片附加信息)解析,判定分割方法(S4921)。该分割方法包含是否进行切片分割、是否进行瓦片分割。此外,分割方法也可以包含进行切片分割或瓦片分割的情况下的分割数量及分割的种类等。
接着,三维数据解码装置通过将编码数据中包含的多个编码位置信息及多个编码属性信息使用编码数据中包含的依赖关系信息进行解码,生成分割位置信息及分割属性信息(S4922)。
在由附加信息表示进行了瓦片分割的情况下(在S4923中“是”),三维数据解码装置基于位置瓦片附加信息及属性瓦片附加信息,将多个分割位置信息和多个分割属性信息用各自的方法结合,从而生成多个切片位置信息及多个切片属性信息(S4924)。另外,三维数据解码装置也可以将多个分割位置信息和多个分割属性信息用相同的方法结合。
在由附加信息表示进行了切片分割的情况下(在S4925中“是”),三维数据解码装置基于切片附加信息,将多个切片位置信息及多个切片属性信息(多个分割位置信息及多个分割属性信息)用相同的方法结合,从而生成位置信息及属性信息(S4926)。另外,三维数据解码装置也可以将多个切片位置信息和多个切片属性信息分别用不同的方法结合。
如以上这样,有关本实施方式的三维数据编码装置进行图42所示的处理。首先,三维数据编码装置分割为多个分割数据(例如瓦片),该多个分割数据包含于将包含多个三维点的对象空间分割而成的多个子空间(例如切片),并且分别包含1个以上的三维点(S4932)。这里,分割数据是包含于子空间中,包含1个以上的三维点的1个以上的数据集合体。此外,分割数据也是空间,也可以包括不包含三维点的空间。此外,既可以在1个子空间中包含多个分割数据,也可以在1个子空间中包含1个分割数据。另外,也可以在对象空间中设定多个子空间,也可以在对象空间中设定1个子空间。
接着,三维数据编码装置通过将多个分割数据分别编码,生成与多个分割数据分别对应的多个编码数据(S4931)。三维数据编码装置生成包含多个编码数据和与多个编码数据分别对应的多个控制信息(例如图38所示的头)的比特流(S4932)。在多个控制信息各自中,保存表示与对应于该控制信息的编码数据对应的子空间的第1识别符(例如slice_idx)、和表示与对应于该控制信息的编码数据对应的分割数据的第2识别符(例如tile_idx)。
由此,将由三维数据编码装置生成的比特流解码的三维数据解码装置能够使用第1识别符及第2识别符将多个分割数据的数据结合而容易地复原对象空间。因此,能够减少三维数据解码装置中的处理量。
例如,三维数据编码装置在上述编码中,将在多个分割数据各自中包含的三维点的位置信息和属性信息编码。多个编码数据分别包含位置信息的编码数据和属性信息的编码数据。多个控制信息分别包含位置信息的编码数据的控制信息和属性信息的编码数据的控制信息。第1识别符及第2识别符保存在位置信息的编码数据的控制信息中。
例如,在比特流中,多个控制信息分别配置在与该控制信息对应的编码数据之前。
此外,三维数据编码装置也可以是,包含多个三维点的对象空间被设定为1个以上的子空间,在上述子空间中包括包含1个以上的三维点的1个以上的分割数据;通过将上述分割数据分别编码,生成与上述多个分割数据分别对应的多个编码数据,生成包含上述多个编码数据和与上述多个编码数据分别对应的多个控制信息的比特流;在上述多个控制信息各自中,保存表示与对应于该控制信息的编码数据对应的子空间的第1识别符、和表示与对应于该控制信息的编码数据对应的分割数据的第2识别符。
例如,三维数据编码装置具备处理器和存储器,处理器使用存储器进行上述的处理。
此外,有关本实施方式的三维数据解码装置进行图42所示的处理。首先,三维数据解码装置从包含多个编码数据和与多个编码数据分别对应的多个控制信息(例如图38所示的头)的比特流,取得保存在上述多个控制信息中的第1识别符(例如slice_idx)和第2识别符(例如tile_idx),上述多个编码数据是多个分割数据(例如瓦片)分别被编码而生成的,上述多个分割数据包含于将包含多个三维点的对象空间分割而成的多个子空间(例如切片)中,并且分别包含1个以上的三维点,上述第1识别符表示与对应于该控制信息的编码数据对应的子空间,上述第2识别符表示与对应于该控制信息的编码数据对应的分割数据(S4941)。接着,三维数据解码装置通过将多个编码数据解码而复原多个分割数据(S4942)。接着,三维数据解码装置通过使用第1识别符及第2识别符将多个分割数据结合,复原对象空间(S4943)。例如,三维数据编码装置通过使用第2识别符将多个分割数据结合而复原多个子空间,通过使用第1识别符将多个子空间结合而复原对象空间(多个三维点)。另外,三维数据解码装置也可以使用第1识别符及第2识别符的至少一方,从比特流取得希望的子空间或分割数据的编码数据,将所取得的编码数据有选择地解码或优先地解码。
由此,三维数据解码装置能够使用第1识别符及第2识别符将多个分割数据的数据结合而容易地复原对象空间。因此,能够减少三维数据解码装置中的处理量。
例如,多个编码数据分别通过将对应的分割数据中包含的三维点的位置信息和属性信息编码而生成,并且包含位置信息的编码数据和属性信息的编码数据。多个控制信息分别包含位置信息的编码数据的控制信息和属性信息的编码数据的控制信息。第1识别符及第2识别符保存在位置信息的编码数据的控制信息中。
例如,在比特流中,控制信息配置在对应的编码数据之前。
例如,三维数据解码装置具备处理器和存储器,处理器使用存储器进行上述的处理。
(实施方式4)
在实施方式4的三维数据编码方法中,对于多个三维点的位置信息,使用基于该位置信息生成的预测树进行编码。
图43是表示实施方式4的在三维数据编码方法中使用的预测树的一例的图。图44是表示实施方式4的三维数据编码方法的一例的流程图。图45是表示实施方式4的三维数据解码方法的一例的流程图。
如图43及图44所示,在三维数据编码方法中,使用多个三维点生成预测树,然后对预测树的各节点所包含的节点信息进行编码。由此,得到包含被编码的节点信息的比特流。各节点信息例如是关于预测树的1个节点的信息。各节点信息例如包含1个节点的位置信息、该1个节点的索引、该1个节点所具有的子节点的数量、为了将该1个节点的位置信息编码而使用的预测模式及预测残差。
此外,如图43及图45所示,在三维数据解码方法中,对比特流中包含的被编码的各节点信息进行解码,然后,一边生成预测树一边对位置信息进行解码。
接着,使用图46对预测树的生成方法进行说明。
图46是用来说明实施方式4的预测树的生成方法的图。
在预测树的生成方法中,如图46的(a)所示,三维数据编码装置首先追加点0作为预测树的初始点。点0的位置信息由包含(x0,y0,z0)的3个要素的坐标表示。点0的位置信息既可以由三轴正交坐标系的坐标表示,也可以由极坐标系的坐标表示。
child_count每当对设定了该child_count的节点追加1个子节点就被+1。预测树的生成完成后的各节点的child_count表示各节点所具有的子节点的数量,被附加到比特流中。pred_mode表示用来预测各节点的位置信息的值的预测模式。预测模式的详细情况在后面叙述。
接着,如图46的(b)所示,三维数据编码装置将点1追加到预测树中。此时,三维数据编码装置也可以从已经被追加到预测树中的点群中搜索点1的最邻近点,作为该最邻近点的子节点而追加点1。点1的位置信息由包含(x1,y1,z1)的3个要素的坐标表示。点1的位置信息既可以由三轴正交坐标系的坐标表示,也可以由极坐标系的坐标表示。在图46的情况下,点0为点1的最邻近点,作为点0的子节点而追加点1。并且,三维数据编码装置使点0的child_count所表示的值增加1。
另外,各节点的位置信息的预测值也可以在对预测树追加了节点时计算。例如,在图46的(b)的情况下,三维数据编码装置也可以将点1作为点0的子节点追加,计算点0的位置信息作为预测值。在此情况下,也可以设定为pred_mode=1。pred_mode是表示预测模式的预测模式信息(预测模式值)。此外,三维数据编码装置也可以在预测值的计算后计算点1的residual_value(预测残差)。这里,residual_value是从各节点的位置信息减去在由pred_mode表示的预测模式中计算出的预测值而得到的差分值。这样,在三维数据编码方法中,通过不是将位置信息本身编码、而是将相对于预测值的差分值编码,能够提高编码效率。
接着,如图46的(c)所示,三维数据编码装置将点2追加到预测树。此时,三维数据编码装置也可以从已经追加到预测树中的点群中搜索点2的最邻近点,作为该最邻近点的子节点而追加点2。点2的位置信息由包含(x2,y2,z2)的3个要素的坐标表示。点2的位置信息既可以由三轴正交坐标系的坐标表示,也可以由极坐标系的坐标表示。在图46的情况下,点1为点2的最邻近点,作为点1的子节点而追加点2。并且,三维数据编码装置使点1的child_count所表示的值增加1。
接着,如图46的(d)所示,三维数据编码装置将点3追加到预测树中。此时,三维数据编码装置也可以从已经追加到预测树中的点群中搜索点3的最邻近点,作为该最邻近点的子节点而追加点3。点3的位置信息由包含(x3,y3,z3)的3个要素的坐标表示。点3的位置信息既可以由三轴正交坐标系的坐标表示,也可以由极坐标系的坐标表示。在图46的情况下,点0为点3的最邻近点,作为点0的子节点而追加点3。并且,三维数据编码装置使点0的child_count所表示的值增加1。
这样,三维数据编码装置将全部的点追加到预测树中,完成预测树的生成。如果预测树的生成完成,则最终具有child_count=0的节点成为预测树的叶节点(leaf)。三维数据编码装置在预测树的生成完成后,对从根(root)节点以深度(depth)优先顺序选择的各节点的child_count、pred_mode及residual_value进行编码。即,三维数据编码装置在以深度优先顺序选择节点的情况下,作为所选择的节点的下一个节点,选择该选择的节点的1个以上的子节点中的还没有被选择的子节点。三维数据编码装置在所选择的节点没有子节点的情况下,选择所选择的节点的父节点的未选择的其他子节点。
另外,编码顺序并不限于深度优先顺序,例如也可以是宽度优先(width first)顺序。三维数据编码装置在以宽度优先顺序选择节点的情况下,作为所选择的节点的下一个节点,选择与该所选择的节点相同深度(层级)的1个以上的节点中的还没有被选择的节点。三维数据编码装置在没有与所选择的节点相同深度的节点的情况下,选择下一个深度的1个以上的节点中的还没有被选择的节点。
另外,点0~3是多个三维点的一例。
另外,在上述的三维数据编码方法中,设为在将各点追加到了预测树中时计算child_count、pred_mode及residual_value,但并不一定限定于此,例如也可以在预测树的生成完成后计算它们。
关于多个三维点向三维数据编码装置的输入顺序,也可以将被输入的三维点以莫顿序(Morton order)的升序或降序重新排列,从其开头的三维点起依次进行处理。由此,三维数据编码装置能够高效地搜索处理对象的三维点的最邻近点,能够提高编码效率。此外,三维数据编码装置也可以不将三维点重新排列而以被输入的顺序进行处理。例如,三维数据编码装置也可以以多个三维点的输入顺序生成没有分支的预测树。具体而言,三维数据编码装置也可以以多个三维点的输入顺序,将被输入的三维点的下一个被输入的三维点作为规定的三维点的子节点追加。
接着,使用图47对预测模式的第1例进行说明。图47是用来说明实施方式4的预测模式的第1例的图。图47是表示预测树的一部分的图。
预测模式也可以如以下所示那样设定8个。例如,如图47所示,以计算点c的预测值的情况为例进行说明。在预测树中,表示了点c的父节点是点p0,点c的祖父节点是点p1,点c的曾祖父节点是点p2。另外,点c、点p0、点p1及点p2是多个三维点的一例。
预测模式值为0的预测模式(以下称作预测模式0)也可以不预测而设定。即,三维数据编码装置也可以在预测模式0下计算被输入的点c的位置信息作为该点c的预测值。
此外,预测模式值为1的预测模式(以下称作预测模式1)也可以设定为与点p0的差分预测。即,三维数据编码装置也可以计算作为点c的父节点的点p0的位置信息,作为该点c的预测值。
此外,预测模式值为2的预测模式(以下称作预测模式2)也可以设定为基于点p0和点p1的线性预测。即,三维数据编码装置也可以计算通过使用作为点c的父节点的点p0的位置信息和作为点c的祖父节点的点p1的位置信息的线性预测得到的预测结果,作为点c的预测值。具体而言,三维数据编码装置使用下述的式T1计算预测模式2下的点c的预测值。
预测值=2×p0-p1   (式T1)
在式T1中,p0表示点p0的位置信息,p1表示点p1的位置信息。
此外,预测模式值为3的预测模式(以下称作预测模式3)也可以设定为使用点p0、点p1及点p2的平行四边形(Parallelogram)预测。即,三维数据编码装置也可以计算通过使用作为点c的父节点的点p0的位置信息、作为点c的祖父节点的点p1的位置信息和作为点c的曾祖父节点的点p2的位置信息的平行四边形预测得到的预测结果,作为点c的预测值。具体而言,三维数据编码装置使用下述的式T2计算预测模式3下的点c的预测值。
预测值=p0+p1-p2   (式T2)
在式T2中,p0表示点p0的位置信息,p1表示点p1的位置信息,p2表示点p2的位置信息。
此外,预测模式值为4的预测模式(以下称作预测模式4)也可以设定为与点p1的差分预测。即,三维数据编码装置也可以计算作为点c的祖父节点的点p1的位置信息,作为该点c的预测值。
此外,预测模式值为5的预测模式(以下称作预测模式5)也可以设定为与点p2的差分预测。即,三维数据编码装置也可以计算作为点c的曾祖父节点的点p2的位置信息,作为该点c的预测值。
此外,预测模式值为6的预测模式(以下称作预测模式6)也可以设定为点p0、点p1及点p2中的某2个以上的位置信息的平均。即,三维数据编码装置也可以计算作为点c的父节点的点p0的位置信息、作为点c的祖父节点的点p1的位置信息和作为点c的曾祖父节点的点p2的位置信息中的2个以上的位置信息的平均值,作为点c的预测值。例如,三维数据编码装置在预测值的计算中使用点p0的位置信息和点p1的位置信息的情况下,使用以下的式T3计算预测模式6下的点c的预测值。
预测值=(p0+p1)/2   (式T3)
在式T3中,p0表示点p0的位置信息,p1表示点p1的位置信息。
此外,预测模式值为7的预测模式(以下称作预测模式7)也可以设定为使用点p0及点p1之间的距离d0和点p2及点p1之间的距离d1的非线性预测。即,三维数据编码装置也可以计算通过使用距离d0和距离d1的非线性预测得到的预测结果,作为点c的预测值。
另外,对各预测模式分配的预测方法并不限于上述例。此外,上述的8个预测模式和上述的8个预测方法也可以不是上述的组合,是怎样的组合都可以。例如,在使用算术编码等的熵编码对预测模式进行编码的情况下,也可以对预测模式0分配使用频度高的预测方法。由此,能够提高编码效率。此外,三维数据编码装置也可以通过一边推进编码处理、一边匹配于预测模式的使用频度而动态地变更预测模式的分配,来提高编码效率。三维数据编码装置例如也可以将编码时的各预测模式的使用频度计数,对于使用频度越高的预测方法,分配由越小的值表示的预测模式。由此,能够提高编码效率。另外,M是表示预测模式的数量的预测模式数,在上述例子的情况下,由于预测模式有预测模式0~7的8个,所以为M=8。
三维数据编码装置也可以使用编码对象的三维点的周围的三维点中的距编码对象的三维点距离近的三维点的位置信息,计算在编码对象的三维点的位置信息的计算中使用的预测值,作为三维点的位置信息(x,y,z)的预测值(px,py,pz)。此外,三维数据编码装置也可以按每个三维点附加预测模式信息(pred_mode),能够根据预测模式而选择计算的预测值。
例如,在总数为M的预测模式中,可以考虑对预测模式0分配最邻近点的三维点p0的位置信息,…,对预测模式M-1分配三维点p2的位置信息,将在预测中使用的预测模式按每个三维点附加到比特流中。
另外,也可以将预测模式数M附加到比特流中。此外,预测模式数M也可以不附加到比特流中,而用标准的档次、级别等来规定值。此外,预测模式数M也可以使用根据在预测中使用的三维点数N计算出的值。例如,预测模式数M也可以通过M=N+1来计算。
图48是表示位置信息的头的句法的一例的图。对于图48的句法中的NumNeighborPoint、NumPredMode,Thfix,QP及unique_point_per_leaf依次进行说明。
NumNeighborPoint表示在三维点的位置信息的预测值的生成中使用的周围的点数的上限值。在周围的点数M小于NumNeighborPoint的情况下(M<NumNeighborPoint),在预测值的计算处理中,也可以使用M个周围的点数计算预测值。
NumPredMode表示在位置信息的预测中使用的预测模式的总数M。另外,预测模式数可取的值的最大值MaxM也可以由标准等来规定值。三维数据编码装置也可以将(MaxM-M)的值(0<M<=MaxM)作为NumPredMode附加到头中,将(MaxM-1)通过截断一元编码进行二值化而编码。此外,预测模式数NumPredMode也可以不附加到比特流中,其值也可以由标准等的档次或级别来规定。此外,预测模式数也可以由NumNeighborPoint+NumPredMode规定。
Thfix是用来判定是否将预测模式固定的阈值。计算在预测中使用的点p1及点p0之间的距离d0、和点p2及点p1之间的距离d1,如果其差分绝对值distdiff=|d0-d1|比阈值Thfix[i]小,则预测模式被固定为α。α是用来计算预测模式使用线性预测的预测值的预测模式,在上述实施方式中是“2”。另外,Thfix也可以不附加到比特流中,其值也可以由标准等的档次或级别来规定。
QP表示在将位置信息进行量化时使用的量化参数。三维数据编码装置也可以根据量化参数计算量化步长,使用计算出的量化步长将位置信息进行量化。
unique_point_per_leaf是表示在比特流内是否包含duplicated point(位置信息相同的点)的信息。unique_point_per_leaf=1,表示在比特流内没有duplicatedpoint。unique_point_per_leaf=0,表示在比特流内存在1个以上duplicated point。
另外,在本实施方式中,是否将预测模式固定的判断是使用距离d0和距离d1的差分绝对值来进行的,但并不一定限定于此,用怎样的方法判断都可以。例如,该判断也可以是,计算点p1及点p0之间的距离d0,在距离d0比阈值大的情况下,判定为点p1不能用于预测,将预测模式值固定为“1”(预测值p0),如果不是那样,则设定预测模式。由此,能够在抑制开销的同时提高编码效率。
上述NumNeighborPoint、NumPredMode、Thfix、unique_point_per_leaf也可以被熵编码而附加到头中。例如各值也可以被二值化而算数编码。此外,为了抑制处理量,各值也可以以固定长度被编码。
图49是表示位置信息的句法的一例的图。对于图49的句法中的NumOfPoint、child_count、pred_mode及residual_value[j]依次进行说明。
NumOfPoint表示比特流中包含的三维点的总数。
child_count表示第i个三维点(node[i])拥有的子节点的数量。
pred_mode表示用来对第i个三维点的位置信息进行编码或解码的预测模式。pred_mode取值0到M-1(M为预测模式的总数)的值。在比特流中没有pred_mode的情况下(不满足作为条件的distdiff>=Thfix[i]&&NumPredMode>1的情况下),也可以将pred_mode推测为固定值α。α是用来计算预测模式使用线性预测的预测值的预测模式,在上述实施方式中是“2”。另外,α并不限于“2”,也可以设定从0到M-1中的任一个值作为推测值。此外,在比特流中没有pred_mode的情况下的推测值也可以另行附加到头等中。此外,关于pred_mode,也可以使用分配了预测值的预测模式数通过截断一元编码进行二值化而进行算术编码。
另外,在NumPredMode=1的情况下,即在预测模式数为1的情况下,三维数据编码装置也可以不将表示预测模式的预测模式值进行编码,而生成不包含预测模式值的比特流。此外,三维数据解码装置也可以在取得了不包含预测模式值的比特流的情况下,在预测值的计算中计算特定的预测模式的预测值。特定的预测模式是预先设定的预测模式。
residual_value[j]表示位置信息的与预测值之间的预测残差的编码数据。也可以是,residual_value[0]表示位置信息的要素x,residual_value[1]表示位置信息的要素y,residual_value[2]表示位置信息的要素z。
图50是表示位置信息的句法的另一例的图。图50的例子是图49的例的变形例。
如图50所示,pred_mode也可以表示位置信息(x,y,z)的3个要素各自的预测模式。即,pred_mode[0]表示要素x的预测模式,pred_mode[1]表示要素y的预测模式,pred_mode[2]表示要素z的预测模式。pred_mode[0]、pred_mode[1]及pred_mode[2]被附加在比特流中。
如以上这样,本实施方式的一技术方案的三维数据编码装置进行图51所示的处理。三维数据编码装置执行将具有层级结构的多个三维点进行编码的三维数据编码方法。三维数据编码装置使用第1三维点的周围的1个以上的第2三维点的第2位置信息,设定用于计算所述第1三维点的第1位置信息的预测值的2个以上的预测模式中的1个预测模式(S9781)。接着,三维数据编码装置计算所设定的所述预测模式的预测值(S9782)。接着,三维数据编码装置计算作为所述第1位置信息与计算出的所述预测值的差分的预测残差(S9783)。接着,三维数据编码装置生成包含所设定的所述预测模式和所述预测残差的第1比特流(S9784)。在所述设定(S9781)中,基于所述第1三维点的所述层级结构的深度,设定所述预测模式。
由此,能够在2个以上的预测模式中,使用基于层级结构的深度设定的1个预测模式的预测值将位置信息进行编码,所以能够提高位置信息的编码效率。
例如,三维数据编码装置在所述设定(S9784)中,设定所述第1三维点的所述层级结构的深度的值以下的预测模式值。所述预测模式值表示所述预测模式。
例如,所述第1比特流还包含表示所述2个以上的预测模式的数量的预测模式数。
例如,三维数据编码装置在所述生成(S9784)中,使用所述预测模式数将表示所设定的所述预测模式的预测模式值进行编码。所述第1比特流包含被编码的所述预测模式值,作为所设定的所述预测模式。
例如,在所述生成(S9784)中,用以所述预测模式数为最大值的截断一元编码将所述预测模式值进行编码。因此,能够减少预测模式值的编码量。
例如,所述第1位置信息及所述第2位置信息分别包含3个要素。三维数据编码装置在所述设定(S9781)中,作为用于计算所述第1位置信息所包含的3个要素的各要素的预测值的所述1个预测模式,对于所述3个要素设定共同的预测模式。因此,能够减少预测模式值的编码量。
例如,所述第1位置信息及所述第2位置信息分别包括3个要素。三维数据编码装置在所述设定中,作为用于计算所述第1位置信息所包含的3个要素的各要素的预测值的所述1个预测模式,对于所述3个要素分别设定独立的预测模式。因此,三维数据解码装置能够将各要素独立地解码。
例如,所述第1位置信息及所述第2位置信息分别包括3个要素。三维数据编码装置在所述设定中,作为用于计算所述第1位置信息所包含的3个要素的各要素的预测值的所述1个预测模式,对于所述3个要素中的2个要素设定共同的预测模式,对于其余的1个要素设定与所述2个要素独立的预测模式。因此,能够减少关于2个要素的预测模式值的编码量。此外,三维数据解码装置能够将其余的1个要素独立地解码。
例如,三维数据编码装置在所述生成中,在所述预测模式数是1的情况下,不将表示所述预测模式的预测模式值编码,而生成不包含所述预测模式值的第2比特流。因此,能够减少比特流的编码量。
例如,三维数据编码装置在所述生成中,在设定有在所述计算中计算的预测值为0的预测模式的情况下,不将表示所述预测残差为正还是为负的正负信息编码,而生成不包含所述正负信息的第3比特流。因此,能够减少比特流的编码量。
例如,三维数据编码装置具备处理器和存储器,处理器使用存储器进行上述的处理。
此外,有关本实施方式的一技术方案的三维数据解码装置进行图52所示的处理。三维数据解码装置执行将具有层级结构的多个三维点解码的三维数据解码方法。三维数据解码装置取得包含被编码的所述多个三维点中的第1三维点的预测模式及被编码的预测残差的第1比特流(S9791)。接着,三维数据解码装置将表示所述被编码的预测模式的预测模式值及所述被编码的预测残差解码(S9792)。接着,三维数据解码装置计算由通过进行解码得到的所述预测模式值表示的预测模式的预测值(S9793)。接着,三维数据解码装置通过将所述预测值与通过进行解码得到的预测残差相加,计算所述第1三维点的第1位置信息(S9794)。所述第1比特流中包含的被编码的所述预测模式是基于所述第1三维点的所述层级结构的深度设定的预测模式。
由此,能够将使用2个以上的预测模式中的基于层级结构的深度设定的1个预测模式的预测值进行了编码的位置信息适当地解码。
例如,所述第1比特流中包含的表示被编码的预测模式的预测模式值是所述第1三维点的所述层级结构的深度的值以下。
例如,所述第1比特流包含表示所述2个以上的预测模式的数量的预测模式数。
例如,三维数据解码装置在所述解码(S9792)中,用以所述预测模式数为最大值的截断一元编码对所述被编码的预测模式值进行解码。
例如,所述第1位置信息及所述第1三维点的周围的1个以上的第2三维点的第2位置信息分别包含3个要素。所述预测模式用于计算所述第1位置信息所包含的3个要素的各要素的预测值,对于所述3个要素共同地设定有所述预测模式。
例如,所述第1位置信息及所述第1三维点的周围的1个以上的第2三维点的第2位置信息分别包含3个要素。所述预测模式用于计算所述第1位置信息所包含的3个要素的各要素的预测值,对于所述3个要素分别独立地设定有所述预测模式。
例如,所述第1位置信息及所述第1三维点的周围的1个以上的第2三维点的第2位置信息分别包含3个要素。所述预测模式用于计算所述第1位置信息包含的3个要素的各要素的预测值,对于所述3个要素中的2个要素共同地设定有所述预测模式,并且对于其余的1个要素,与所述2个要素独立地设定有所述预测模式。
例如,三维数据解码装置在所述取得(S9791)中取得了不包含所述预测模式值的第2比特流的情况下,在所述预测值的计算中,计算特定的预测模式的预测值。
例如,三维数据解码装置在所述取得(S9791)中取得了不包含表示所述预测残差为正还是为负的正负信息的第3比特流的情况下,在所述第1位置信息的计算(S9794)中,将所述预测残差作为0或正数来处理。
例如,三维数据解码装置具备处理器和存储器,处理器使用存储器进行上述处理。
(实施方式5)
为了将点群数据分割为瓦片及切片并将分割数据有效地编码或解码,需要在编码侧及解码侧适当地进行控制。通过在分割数据间没有依赖关系而独立地进行分割数据的编码及解码,能够使用多线程或多核处理器在各个线程/核中并行地处理分割数据,性能提高。
将点群数据分割为瓦片及切片的方法有各种各样的方法,例如有基于路面等的点群数据的对象物的属性或点群数据的绿色等颜色信息等特性进行分割的方法。
CABAC是Context-Based Adaptive Binary Arithmetic Coding(上下文的自适应二进制算术编码)的简称,是通过基于已编码的信息依次更新上下文(估计所输入的2值符号的发生概率的模型)而提高概率的精度、实现高压缩率的算术编码(熵编码)的编码方法。
为了将瓦片或切片那样的分割数据并行处理,需要能够独立地编码或解码各个分割数据。但是,为了在分割数据间独立地进行CABAC,需要在编码及解码中在分割数据的开头将CABAC初始化,但没有该机制。
CABACABAC初始化标志在CABAC编码及解码中用于将CABAC初始化。
图53是表示在编码或解码中根据CABAC初始化标志而进行的CABAC的初始化的处理的流程图。
三维数据编码装置或三维数据解码装置在编码或解码中,判定CABAC初始化标志是否是1(S5201)。
三维数据编码装置或三维数据解码装置在CABAC初始化标志是1的情况下(在S5201中是),将CABAC编码部/解码部初始化为默认状态(S5202),继续编码或解码。
三维数据编码装置或三维数据解码装置在CABAC初始化标志不是1的情况下(在S5201中否),不进行初始化而继续编码或解码。
即,在将CABAC初始化的情况下,设为CABAC_init_flag=1,将CABAC的编码部或CABAC的解码部初始化或再初始化。另外,在进行初始化的情况下,设定在CABAC处理中使用的上下文的初始值(默认状态)。
对编码处理进行说明。图54是表示在有关本实施方式的三维数据编码装置中包含的第1编码部5200的构成的框图。图55是表示有关本实施方式的分割部5201的构成的框图。图56是表示有关本实施方式的位置信息编码部5202及属性信息编码部5203的构成的框图。
第1编码部5200通过将点群数据用第1编码方法(GPCC((Geometry based PCC))编码,生成编码数据(编码流)。该第1编码部5200包括分割部5201、多个位置信息编码部5202、多个属性信息编码部5203、附加信息编码部5204和复用部5205。
分割部5201通过将点群数据分割而生成多个分割数据。具体而言,分割部5201通过将点群数据的空间分割为多个子空间而生成多个分割数据。这里子空间是瓦片及切片中的一方、或瓦片及切片的组合。更具体地讲,点群数据包含位置信息、属性信息及附加信息。分割部5201将位置信息分割为多个分割位置信息,将属性信息分割为多个分割属性信息。此外,分割部5201生成关于分割的附加信息。
分割部5201如图55所示,包括瓦片分割部5211和切片分割部5212。例如,瓦片分割部5211将点群分割为瓦片。瓦片分割部5211也可以将在分割的各瓦片中使用的量化值决定为瓦片附加信息。
切片分割部5212将由瓦片分割部5211得到的瓦片再分割为切片。切片分割部5212也可以将在分割的各切片中使用的量化值决定为切片附加信息。
多个位置信息编码部5202通过将多个分割位置信息编码而生成多个编码位置信息。例如,多个位置信息编码部5202将多个分割位置信息并行处理。
位置信息编码部5202如图56所示,包括CABAC初始化部5221和熵编码部5222。CABAC初始化部5221根据CABAC初始化标志将CABAC初始化或再初始化。熵编码部5222通过CABAC将分割位置信息进行编码。
多个属性信息编码部5203通过将多个分割属性信息编码,生成多个编码属性信息。例如,多个属性信息编码部5203将多个分割属性信息并行处理。
属性信息编码部5203如图56所示,包括CABAC初始化部5231和熵编码部5232。CABAC初始化部5221根据CABAC初始化标志将CABAC初始化或再初始化。熵编码部5232通过CABAC将分割属性信息进行编码。
附加信息编码部5204通过将点群数据中包含的附加信息、和由分割部5201在分割时生成的关于数据分割的附加信息编码,生成编码附加信息。
复用部5205通过将多个编码位置信息、多个编码属性信息及编码附加信息复用而生成编码数据(编码流),并送出所生成的编码数据。此外,编码附加信息在解码时被使用。
另外,在图54中示出了位置信息编码部5202及属性信息编码部5203的数量分别为两个的例子,但位置信息编码部5202及属性信息编码部5203的数量分别可以是1个,也可以是3个以上。此外,多个分割数据既可以如CPU内的多个核那样在同一芯片内被并行处理,也可以由多个芯片的核并行处理,也可以由多个芯片的多个核并行处理。
接着,对解码处理进行说明。图57是表示第1解码部5240的构成的框图。图58是表示位置信息解码部5242及属性信息解码部5243的构成的框图。
第1解码部5240通过对通过将点群数据用第1编码方法(GPCC)编码而生成的编码数据(编码流)进行解码,将点群数据复原。该第1解码部5240包括逆复用部5241、多个位置信息解码部5242、多个属性信息解码部5243、附加信息解码部5244和结合部5245。
逆复用部5241通过将编码数据(编码流)逆复用,生成多个编码位置信息、多个编码属性信息及编码附加信息。
多个位置信息解码部5242通过将多个编码位置信息解码,生成多个量化位置信息。例如,多个位置信息解码部5242将多个编码位置信息并行处理。
位置信息解码部5242如图58所示,包括CABAC初始化部5251和熵解码部5252。CABAC初始化部5251根据CABAC初始化标志,将CABAC初始化或再初始化。熵解码部5252通过CABAC将位置信息进行解码。
多个属性信息解码部5243通过将多个编码属性信息解码,生成多个分割属性信息。例如,多个属性信息解码部5243将多个编码属性信息并行处理。
属性信息解码部5243如图58所示,包括CABAC初始化部5261和熵解码部5262。CABAC初始化部5261根据CABAC初始化标志,将CABAC初始化或再初始化。熵解码部5262通过CABAC将属性信息进行解码。
多个附加信息解码部5244通过将编码附加信息解码,生成附加信息。
结合部5245通过使用附加信息将多个分割位置信息结合,生成位置信息。结合部5245通过使用附加信息将多个分割属性信息结合,生成属性信息。例如,结合部5245首先使用切片附加信息将针对切片的解码后的点群数据结合,由此生成与瓦片对应的点群数据。接着,结合部5245使用瓦片附加信息将与瓦片对应的点群数据结合,由此将原来的点群数据复原。
另外,在图57中示出了位置信息解码部5242及属性信息解码部5243的数量分别为两个的例子,但位置信息解码部5242及属性信息解码部5243的数量分别可以是1个,也可以是3个以上。此外,多个分割数据既可以如CPU内的多个核那样在同一芯片内被并行处理,也可以由多个芯片的核并行处理,也可以由多个芯片的多个核并行处理。
图59是表示位置信息的编码或属性信息的编码中的与CABAC的初始化有关的处理的一例的流程图。
首先,三维数据编码装置按每个切片,基于规定的条件判定在该切片的位置信息的编码中是否进行CABAC初始化(S5201)。
三维数据编码装置在判断为进行CABAC初始化的情况下(在S5202中是),决定在位置信息的编码中使用的上下文初始值(S5203)。上下文初始值被设定为考虑了编码特性的初始值。初始值既可以为预先设定的值,也可以根据切片内的数据的特性而自适应地决定。
接着,三维数据编码装置将位置信息的CABAC初始化标志设定为1,设定上下文初始值(S5204)。在进行CABAC初始化的情况下,在位置信息的编码中,使用上下文初始值执行初始化处理。
另一方面,三维数据编码装置在判断为不进行CABAC初始化的情况下(在S5202中否),将位置信息的CABAC初始化标志设定为0(S5205)。
接着,三维数据编码装置按每个切片,基于规定的条件判定在该切片的属性信息的编码中是否进行CABAC初始化(S5206)。
三维数据编码装置在判断为进行CABAC初始化的情况下(在S5207中是),决定在属性信息的编码中使用的上下文初始值(S5208)。上下文初始值被设定为考虑了编码特性的初始值。初始值既可以为预先设定的值,也可以根据切片内的数据的特性自适应性决定。
接着,三维数据编码装置将属性信息的CABAC初始化标志设定为1,设定上下文初始值(S5209)。在进行CABAC初始化的情况下,在属性信息的编码中,使用上下文初始值执行初始化处理。
另一方面,三维数据编码装置在判断为不进行CABAC初始化的情况下(在S5207中否),将属性信息的CABAC初始化标志设定为0(S5210)。
另外,在图59中的流程图中,有关位置信息的处理和有关属性信息的处理的处理顺序也可以相反,也可以是并行。
另外,在图59中的流程图中,以切片单位的处理为例,但在瓦片单位或其他数据单位下的处理的情况下也能够与切片单位同样地处理。即,图59的流程图的切片可以替换为瓦片或其他数据单位。
此外,关于规定的条件,既可以在位置信息和属性信息中是相同的条件,也可以是不同的条件。
图60是表示在作为比特流的点群数据中CABAC初始化的定时的一例的图。
点群数据包含位置信息和0以上的属性信息。即,点群数据既有不具有属性信息的情况,也有具有多个属性信息的情况。
例如,针对1个三维点,有作为属性信息而具有颜色信息的情况、具有颜色信息和反射信息的情况、具有与1个以上的视点信息分别建立了关联的1个以上的颜色信息的情况等。
在任何构成的情况下,都能够应用在本实施方式中说明的方法。
接着,对CABAC的初始化的判定条件进行说明。
在满足以下的条件的情况下,也可以将位置信息或者属性信息的编码中的CABAC初始化。
例如,也可以在位置信息或属性信息(如果有多个则各个属性信息)的开头数据将CABAC初始化。例如,也可以在构成能够单独解码的PCC帧的数据的开头将CABAC初始化。即,如图60的(a)所示,如果PCC帧能够以帧单位解码,则也可以在PCC帧的开头数据将CABAC初始化。
此外,例如如图60的(b)所示,在PCC帧之间使用帧间预测的情况等不能以帧单独解码的情况下,也可以在随机访问单位(例如GOF)的开头数据将CABAC初始化。
此外,例如如图60的(c)所示,也可以在被分割为1个以上的切片数据的开头、被分割为1个以上的瓦片数据的开头、其他的分割数据的开头将CABAC初始化。
图60的(c)例示了瓦片,但在切片的情况下也是同样的。在瓦片或切片的开头,既可以必须初始化,也可以未必初始化。
图61是表示编码数据的构成及编码数据向NAL单元的保存方法的图。
初始化信息既可以保存在编码数据的头中,也可以保存在元数据中。此外,初始化信息也可以保存在头和元数据双方中。初始化信息例如是caba_init_flag、CABAC初始值或能够确定初始值的表的索引。
在本实施方式中说明为保存在元数据中的部分也可以替换为保存在编码数据的头中,相反也是同样的。
初始化信息在保存到编码数据的头中的情况下,例如也可以保存到编码数据中的最初的NAL单元中。在位置信息中保存位置信息的编码的初始化信息,在属性信息中保存属性信息的编码的初始化信息。
属性信息的编码的cabac_init_flag和位置信息的编码的cabac_init_flag既可以为相同的值,也可以为不同的值。在设为相同的值的情况下,也可以使位置信息和属性信息的cabac_init_flag共同。此外,在设为不同的值的情况下,位置信息和属性信息的cabac_init_flag分别表示不同的值。
初始化信息既可以保存到在位置信息和属性信息中共同的元数据中,也可以保存到位置信息的单独的元数据及属性信息的单独的元数据的至少一方中,也可以保存到共同的元数据和单独的元数据双方中。此外,也可以使用表示是否记载在位置信息的单独的元数据、属性信息的单独的元数据及共同的元数据中的任一个中的标志。
图62是表示与位置信息的解码或属性信息的解码中的CABAC的初始化有关的处理的一例的流程图。
三维数据解码装置将编码数据解析,取得位置信息的CABAC初始化标志、属性信息的CABAC初始化标志和上下文初始值(S5211)。
接着,三维数据解码装置判定位置信息的CABAC初始化标志是否是1(S5212)。
三维数据解码装置在位置信息的CABAC初始化标志是1的情况下(在S5212中是),使用位置信息编码的上下文初始值,将位置信息编码的CABAC解码初始化(S5213)。
另一方面,三维数据解码装置在位置信息的CABAC初始化标志是0的情况下(在S5212中否),在位置信息编码中不将CABAC解码初始化(S5214)。
接着,三维数据解码装置判定属性信息的CABAC初始化标志是否是1(S5215)。
三维数据解码装置在属性信息的CABAC初始化标志是1的情况下(在S5215中是),使用属性信息编码的上下文初始值,将属性信息编码的CABAC解码初始化(S5216)。
另一方面,三维数据解码装置在属性信息的CABAC初始化标志是0的情况下(在S5215中否),在属性信息编码中不将CABAC解码初始化(S5217)。
另外,在图62的流程图中,有关位置信息的处理和有关属性信息的处理的处理顺序也可以相反,也可以是并行。
另外,图62的流程图对于切片分割的情况、瓦片分割的情况的哪一方都能够应用。
接着,对有关本实施方式的点群数据的编码处理及解码处理的流程进行说明。图63是有关本实施方式的点群数据的编码处理的流程图。
首先,三维数据编码装置决定要使用的分割方法(S5221)。该分割方法包括是否进行瓦片分割、是否进行切片分割。此外,分割方法也可以包括进行瓦片分割或切片分割的情况下的分割数量及分割种类等。分割种类指的是上述那样的基于对象形状的方法、基于地图信息或位置信息的手法、或基于数据量或处理量的方法等。另外,分割方法也可以被预先设定。
在进行瓦片分割的情况下(在S5222中是),三维数据编码装置通过将位置信息和属性信息以瓦片单位分割而生成多个瓦片位置信息及多个瓦片属性信息(S5223)。此外,三维数据编码装置生成有关瓦片分割的瓦片附加信息。
在进行切片分割的情况下(在S5224中是),三维数据编码装置通过将多个瓦片位置信息及多个瓦片属性信息(或位置信息及属性信息)分割而生成多个分割位置信息及多个分割属性信息(S5225)。此外,三维数据编码装置生成有关切片分割的位置切片附加信息及属性切片附加信息。
接着,三维数据编码装置通过将多个分割位置信息及多个分割属性信息分别编码,生成多个编码位置信息及多个编码属性信息(S5226)。此外,三维数据编码装置生成依赖关系信息。
接着,三维数据编码装置通过将多个编码位置信息、多个编码属性信息及附加信息进行NAL单元化(复用),生成编码数据(编码流)(S5227)。此外,三维数据编码装置送出所生成的编码数据。
图64是表示在瓦片的分割(S5222)或切片的分割(S5225)中决定CABAC初始化标志的值并更新附加信息的处理的一例的流程图。
在步骤S5222、S5225中,瓦片及/或切片的位置信息及属性信息既可以用各自的方法独立地单独分割,也可以共同一起分割。由此,生成按每个瓦片及/或按每个切片分割的附加信息。
此时,三维数据编码装置决定将CABAC初始化标志设定为1还是0(S5231)。
并且,三维数据编码装置更新附加信息,以使其包含所决定的CABAC初始化标志(S5232)。
图65是表示在编码(S5226)的处理中进行CABAC初始化的处理的一例的流程图。
三维数据编码装置判定CABAC初始化标志是否是1(S5241)。
三维数据编码装置在CABAC初始化标志是1的情况下(在S5241中是),将CABAC编码部再初始化为默认状态(S5242)。
并且,三维数据编码装置继续编码处理,直到满足编码处理的停止条件、例如直到不再有编码对象的数据(S5243)。
图66是有关本实施方式的点群数据的解码处理的流程图。首先,三维数据解码装置通过将编码数据(编码流)中包含的有关分割方法的附加信息(瓦片附加信息、位置切片附加信息及属性切片附加信息)解析,判定分割方法(S5251)。该分割方法包括是否进行瓦片分割、是否进行切片分割。此外,分割方法也可以包括进行瓦片分割或切片分割的情况下的分割数量及分割种类等。
接着,三维数据解码装置通过使用编码数据中包含的依赖关系信息将编码数据中包含的多个编码位置信息及多个编码属性信息解码,生成分割位置信息及分割属性信息(S5252)。
在由附加信息表示进行了切片分割的情况下(在S5253中是),三维数据解码装置通过基于位置切片附加信息及属性切片附加信息将多个分割位置信息与多个分割属性信息结合,生成多个瓦片位置信息及多个瓦片属性信息(S5254)。
在由附加信息表示进行了瓦片分割的情况下(在S5255中是),三维数据解码装置通过基于瓦片附加信息将多个瓦片位置信息及多个瓦片属性信息(多个分割位置信息及多个分割属性信息)结合,生成位置信息及属性信息(S5256)。
图67是表示在按每个切片进行了分割的信息的结合(S5254)或按每个瓦片进行了分割的信息的结合(S5256)中将CABAC解码部初始化的处理的一例的流程图。
切片或瓦片的位置信息及属性信息既可以使用各自的方法结合,也可以使用相同的方法结合。
三维数据解码装置根据编码流的附加信息,将CABAC初始化标志解码(S5261)。
接着,三维数据解码装置判定CABAC初始化标志是否是1(S5262)。
三维数据解码装置在CABAC初始化标志是1的情况下(在S5262中是),将CABAC解码部再初始化为默认状态(S5263)。
另一方面,三维数据解码装置在CABAC初始化标志不是1的情况下(在S5262中否),不将CABAC解码部再初始化而向步骤S5264前进。
并且,三维数据解码装置继续解码处理,直到满足解码处理的停止条件,例如直到不再有解码对象的数据(S5264)。
接着,对CABAC初始化的其他判定条件进行说明。
关于是否将位置信息的编码或属性信息的编码初始化,也可以考虑瓦片或切片等的数据单位的编码效率来判定。在此情况下,也可以在满足规定的条件的瓦片或切片的开头数据将CABAC初始化。
接着,对位置信息的编码中的CABAC初始化的判定条件进行说明。
三维数据编码装置例如也可以按每个切片,判定点群数据的密度,即属于切片的每个单位区域的点的数量,将其他切片的数据密度与该切片的数据密度比较,在数据密度的变化不超过规定的条件的情况下,判断为不将CABAC初始化时编码效率更好,判断为不进行CABAC初始化。另一方面,三维数据编码装置也可以在数据密度的变化不满足规定的条件的情况下,判断为初始化时编码效率更好,判断为进行CABAC初始化。
这里其他切片例如可以是在解码处理顺序上的前1个切片,也可以是在空间上相邻的切片。此外,三维数据编码装置即使不与其他切片的数据密度比较,也可以根据该切片的数据密度是否是规定的数据密度来判定是否进行CABAC初始化。
三维数据编码装置在判定为进行CABAC初始化的情况下,决定在位置信息的编码中使用的上下文初始值。上下文初始值被设定为与数据密度对应的编码特性较好的初始值。三维数据编码装置也可以预先保持与数据密度对应的初始值表,从表中选择最优的初始值。
另外,三维数据编码装置并不限于切片的密度的例子,也可以基于点的数量、点的分布、点的偏倚等来判定是否进行CABAC初始化。或者,三维数据编码装置也可以基于根据点的信息得到的特征量及特征点的数量、或者识别的对象,来判定是否进行CABAC初始化。在此情况下,判定基准也可以作为与根据点的信息得到的特征量或特征点的数量、或基于点的信息识别的对象建立了对应的表而预先保持在存储器中。
三维数据编码装置例如也可以判定地图信息的位置信息中的对象,根据基于位置信息的对象来判定是否进行CABAC初始化,也可以基于将三维数据投影为二维的信息或特征量来判定是否进行CABAC初始化。
接着,对属性信息的编码中的CABAC初始化的判定条件进行说明。
三维数据编码装置例如将前1个切片的颜色的特性与该切片的颜色的特性比较,在颜色的特性的变化满足规定的条件的情况下判断为不进行CABAC初始化时编码效率更好,判断为不进行CABAC初始化。另一方面,三维数据编码装置也可以在颜色的特性的变化不满足规定的条件的情况下判断为进行CABAC初始化时编码效率更好,判断为进行CABAC初始化。颜色的特性例如是亮度、色度、色彩度、它们的直方图、颜色的连续性等。
这里,其他切片例如可以是解码处理顺序上的前1个切片,也可以是在空间上相邻的切片。此外,三维数据编码装置即使不与其他切片的数据密度比较,也可以根据该切片的数据密度是否是规定的数据密度来判定是否进行CABAC初始化。
三维数据编码装置在判定为进行CABAC初始化的情况下,决定在位置信息的编码中使用的上下文初始值。上下文初始值被设定为与数据密度相应的编码特性较好的初始值。三维数据编码装置也可以预先保持与数据密度对应的初始值表,从表中选择最优的初始值。
三维数据编码装置在属性信息是反射率的情况下,也可以根据基于反射率的信息来判定是否进行CABAC初始化。
三维数据编码装置也可以在三维点有多个属性信息的情况下,按每个属性信息独立地决定基于各个属性信息的初始化信息,或者,也可以基于某一方的属性信息来决定多个属性信息的初始化信息,也可以使用多个属性信息来决定该多个属性信息的初始化信息。
说明了基于位置信息决定位置信息的初始化信息、基于属性信息决定属性信息的初始化信息的例子,但也可以基于位置信息来决定位置信息及属性信息的初始化信息,也可以基于属性信息来决定位置信息及属性信息的初始化信息,也可以基于双方信息来决定位置信息及属性信息的初始化信息。
三维数据编码装置例如也可以通过将cabac_init_flag设定为on(开启)或off(关闭)、或从初始值表中使用1个以上的初始值,基于预先对编码效率进行了模拟的结果来决定初始化信息。
三维数据编码装置也可以在基于位置信息或属性信息决定了对切片或瓦片等的数据分割方法的情况下,根据与基于分割方法的决定的信息相同的信息来决定初始化信息。
图68是表示瓦片及切片的例子的图。
例如,具有PCC数据的一部分的1个瓦片中的切片如凡例所示那样被识别。CABAC初始化标志可以用来判定在连续的切片中是否需要上下文的再初始化。例如,在图68中,在一个瓦片中包含按每个对象(移动体、人行道、建筑物、树、其他对象)分割的切片数据的情况下,移动体、人行道、树的切片的CABAC初始化标志被设定为1,建筑物及其他切片的CABAC初始化标志被设定为0。这例如在人行道和建筑物两者都是较密的永久结构、有可能具有同样的编码效率的情况下,通过在人行道与建筑物的切片间不将CABAC再初始化,有可能能够提高编码效率。另一方面,在建筑物和树之间有可能密度及编码效率较大地不同的情况下,通过在建筑物与树的切片间将CABAC初始化,有可能能够提高编码效率。
图69是表示CABAC的初始化及上下文初始值的决定方法的一例的流程图。
首先,三维数据编码装置基于根据位置信息判定的对象,将点群数据分割为切片(S5271)。
接着,三维数据编码装置按每个切片,基于该切片的对象的数据密度,判定是否进行位置信息的编码和属性信息的编码的CABAC初始化(S5272)。即,三维数据编码装置基于位置信息,决定位置信息的编码和属性信息的编码的CABAC初始化信息(CABAC初始化标志)。三维数据编码装置例如利用点群数据密度判定编码效率较好的初始化。另外,CABAC初始化信息也可以由在位置信息和属性信息中共同的cabac_init_flag表示。
接着,三维数据编码装置在判定为进行CABAC初始化的情况下(在S5273中是),决定位置信息的编码的上下文初始值(S5274)。
接着,三维数据编码装置决定属性信息的编码的上下文初始值(S5275)。
接着,三维数据编码装置将位置信息的CABAC初始化标志设定为1,设定位置信息的上下文初始值,并将属性信息的CABAC初始化标志设定为1,设定属性信息的上下文初始值(S5276)。另外,在进行CABAC初始化的情况下,三维数据编码装置在位置信息的编码及属性信息的编码的各自中,使用上下文初始值实施初始化处理。
另一方面,三维数据编码装置在判定为不进行CABAC初始化的情况下(在S5273中否),将位置信息的CABAC初始化标志设定为0,将属性信息的CABAC初始化标志设定为0(S5277)。
图70是表示将对由LiDAR得到的点群数据进行俯视的地图分割为瓦片的情况下的例子的图。图71是表示CABAC初始化及上下文初始值的决定方法的另一例的流程图。
三维数据编码装置在大规模地图数据中,基于位置信息,通过俯视中的二维的分割方法,将点群数据分割为1个以上的瓦片(S5281)。三维数据编码装置例如也可以用如图70所示的正方形的区域进行分割。此外,三维数据编码装置也可以将点群数据分割为各种各样的形状、大小的瓦片。瓦片的分割也可以由预先设定的1个以上的方法进行,也可以自适应地进行。
接着,三维数据编码装置按每个瓦片判定瓦片内的对象,判定在该瓦片的位置信息的编码或属性信息的编码中是否进行CABAC初始化(S5282)。另外,三维数据编码装置在切片分割的情况下,对对象(树、人、移动体、建筑物)进行识别,根据对象进行切片分割及初始值的判定。
三维数据编码装置在判定为进行CABAC初始化的情况下(在S5283中是),决定位置信息的编码的上下文初始值(S5284)。
接着,三维数据编码装置决定属性信息的编码的上下文初始值(S5285)。
在步骤S5284及S5285中,也可以作为初始值而存储具有特定的编码特性的瓦片的初始值,用作具有相同的编码特性的瓦片的初始值。
接着,三维数据编码装置将位置信息的CABAC初始化标志设定为1,设定位置信息的上下文初始值,并将属性信息的CABAC初始化标志设定为1,设定属性信息的上下文初始值(S5286)。另外,在进行CABAC初始化的情况下,三维数据编码装置在位置信息的编码及属性信息的编码的各自中,使用上下文初始值实施初始化处理。
另一方面,三维数据编码装置在判定为不进行CABAC初始化的情况下(在S5283中否),将位置信息的CABAC初始化标志设定为0,将属性信息的CABAC初始化标志设定为0(S5287)。
(实施方式6)
在上述实施方式的CABAC(Context-Based Adaptive Binary ArithmeticCoding:基于上下文的自适应二进制算术编码)中,三维数据编码装置也可以用方式相互不同的多个编码方式中的一方对数据单元中包含的多个三维点进行编码。即,三维数据编码装置按每个数据单元,将对该数据单元中包含的多个三维点进行编码的编码方式决定为多个编码方式中的适合于该数据单元的编码方式。例如在三维点的位置信息的编码中,多个编码方式包括使用八叉树的编码方式即八叉树编码、以及使用预测树的编码方式即预测树编码。
对这样的CABAC编码中的CABAC初始化标志(以下,也称作初始化信息、识别信息)的信号化(Signaling)进行说明。
[信号化]
初始化信息保存在编码数据的头中。初始化信息例如是caba_init_flag、CABAC初始值、能够确定初始值的表的索引等。初始化信息为了在CABAC编码及解码中将CABAC初始化而被使用。换言之,初始化信息(识别信息)是表示是否继续使用在编码中使用的上下文进行编码的信息。
三维数据编码装置既可以将初始化信息保存在元数据中,也可以记载在头及元数据双方中。另外,在本实施方式中,既可以将保存到元数据中替换为保存到编码数据的头中,相反也可以将保存到编码数据的头中替换为保存到元数据中。
另外,三维数据编码装置将初始化信息应用于位置信息的编码及属性信息的编码中的哪一方都可以。三维数据编码装置在将初始化信息保存到编码数据的头中的情况下,也可以在位置信息中保存位置信息的编码的初始化信息,在属性信息中保存属性信息的初始化信息。
[位置信息的头]
CABAC是Context-Based Adaptive Binary Arithmetic Coding的简称,是基于已编码的信息将上下文(推测被输入的二值码元的发生概率的模型)依次更新来提高概率的精度,实现高压缩率的算术编码(熵编码)的编码方法。为了将瓦片或切片那样的、点群数据被分割而得到的多个数据单元(多个分割数据)并行处理,需要能够将各个数据单元独立地编码或解码。但是,为了在数据单元之间使CABAC独立,在编码及解码中需要在数据单元的开头将CABAC初始化。CABAC初始化标志在CABAC编码及解码中为了将CABAC初始化而被使用。
图72是表示分割后的各数据单元中包含的位置信息的数据结构和位置信息的头的句法的一例的图。
三维数据编码装置既可以将初始化信息在位置信息的编码中应用于八叉树编码、预测树编码等编码方式(编码方法)的任一方,也可以应用于双方。八叉树编码是使用与预测树编码不同的树结构的编码方式。
三维数据编码装置在使用八叉树结构的八叉树编码的情况下,保存在八叉树编码中使用的上下文(即,用于八叉树编码的上下文)。此外,三维数据编码装置在使用预测树结构的预测树编码的情况下,保存在预测树编码中使用的上下文(即,用于预测树编码的上下文)。
三维数据编码装置通过向被分割的位置信息的每个数据单元的头保存初始化信息,能够按每个被分割的数据单元切换是否将在编码中使用的上下文初始化。换言之,三维数据编码装置通过向被分割的位置信息的每个数据单元的头保存识别信息,能够按每个被分割的数据单元切换是否将在编码中使用的上下文继续用于编码。
SPS_ID表示该数据单元参照的SPS(参数集)的识别符。GPS_ID表示该数据单元参照的GPS(位置信息参数集)的识别符。tile_id表示该数据单元所属的瓦片的识别符(分割数据的识别符1)。slice_id表示该数据单元所属的切片的识别符(分割数据的识别符2)。
tree_mode表示在该数据单元的位置信息编码中使用的树结构。在树结构为两种的情况下,tree_mode也可以是标志。tree_mode例如也可以在标志为0的情况下表示八叉树(octree),在标志为1的情况下表示预测树(predtree)。另外,tree_mode在由GPS表示的情况下也可以不表示在切片头中。
三维数据编码装置也可以基于tree_mode切换在各自的编码中使用的元数据的结构,进行信号化。
例如,三维数据编码装置在树结构是八叉树(tree_mode==‘octree’)的情况下,将在八叉树编码中使用的参数(octree_information)进行信号化。进而,也可以示出表示在八叉树编码中是否将上下文初始化的标志(cabac_init_flag)、换言之表示是否继续使用上下文的识别信息。
此外,例如三维数据编码装置在树结构是预测树(tree_mode==‘predtree’)的情况下,将在预测树编码中使用的参数(predtree_information)进行信号化。进而,也可以示出表示在预测树编码中是否将上下文初始化的标志(cabac_init_flag)、换言之表示是否继续使用上下文的识别信息。
另外,通过使用以下的方法,有可能能够削减信号化的信息量而提高压缩效率。三维数据编码装置也可以将cabac_init_flag设为多个编码方式中共同的标志,在tree_mode的条件分支之前进行信号化。
此外,三维数据编码装置也可以将上下文的初始化应用于一部分树结构,而不应用于另一部分树结构。在此情况下,三维数据编码装置也可以在不应用上下文的初始化的树结构的情况下生成不包含初始化信息的句法的头,在应用上下文的初始化的树结构的情况下生成包含初始化信息的句法的头。例如,在被分割的全部的数据单元中进行初始化的情况下,三维数据编码装置也可以在SPS或GPS等的更上位的参数集中将初始化信息共同地表示,而不表示每个数据单元的初始化信息。
图73是表示三维数据编码方法的一例的流程图。这里,对数据单元中包含的多个三维点的位置信息的编码进行说明。
三维数据编码装置决定处理对象的数据单元的编码方式,并且决定在处理对象的数据单元的开头的三维点的位置信息的编码中是否使CABAC继续(S11401)。换言之,三维数据编码装置将数据单元的编码方式决定为八叉树编码及预测树编码中的某一个,并且决定是否继续使用在编码中使用的上下文进行编码。
接着,三维数据编码装置在决定了继续使用上下文的情况下(S11402中“是”),将cabac_init_flag设定为false(S11403)。即,三维数据编码装置将识别信息设定为使其表示继续使用在编码中使用的上下文。三维数据编码装置将识别信息设定为,使得识别信息表示步骤S11402的决定结果。
接着,三维数据编码装置在将编码方式决定为了八叉树编码的情况下(S11404中“八叉树”),继续使用在八叉树编码中使用的上下文而以八叉树进行编码(S11405)。在八叉树编码中使用的上下文是在处理对象的数据单元的紧前的数据单元的八叉树编码中使用的上下文。该上下文例如被暂时地保存在三维数据编码装置的存储器中,三维数据编码装置读出存储在存储器中的上下文,用于处理对象的数据单元的编码。
另一方面,三维数据编码装置在将编码方式决定为了预测树编码的情况下(S11404中“预测树”),继续使用在预测树编码中使用的上下文而以预测树进行编码(S11406)。在预测树编码中使用的上下文是在处理对象的数据单元的紧前的数据单元的预测树编码中使用的上下文。该上下文例如被暂时地保存在三维数据编码装置的存储器中,三维数据编码装置读出存储在存储器中的上下文,用于处理对象的数据单元的编码。
如步骤S11405及S11406所示,三维数据编码装置继续使用在多个编码方式中的由步骤S11401决定的编码方式中使用的上下文,执行编码。
另外,三维数据编码装置在继续使用上下文的情况下,根据位置信息的编码方式(八叉树或预测树),变更要继续的上下文的值。例如,用于八叉树编码的上下文是用来对Occupancy码或量化值、叶节点中的重复点等进行熵编码的上下文,用于预测树编码的上下文是用来对节点的数量或预测模式等进行熵编码的上下文。
此外,三维数据编码装置在决定了不继续使用上下文的情况下(S11402中“否”),即在决定了将上下文初始化的情况下,将cabac_init_flag设定为true(S11407)。即,三维数据编码装置将识别信息设定为使其表示不继续使用在编码中使用的上下文。三维数据编码装置将识别信息设定为,使得识别信息表示步骤S11402的决定结果。
接着,三维数据编码装置使用在步骤S11401中决定的用于编码方式的初始化的上下文,对数据单元的开头的三维点的位置信息进行编码(S11408)。
如以上这样,三维数据编码装置在进行八叉树编码的情况下使用用于八叉树编码的上下文进行编码,在进行预测树编码的情况下使用用于预测树编码的上下文进行编码。即,三维数据编码方法根据位置信息的编码方式,变更在编码中继续使用的上下文。
图74是表示三维数据解码方法的一例的流程图。这里,对数据单元中包含的多个三维点的位置信息的解码进行说明。
三维数据解码装置对处理对象的被编码的数据单元(编码数据)的头进行解析,对cabac_init_flag进行解析(S11411)。
三维数据解码装置判定cabac_init_flag是否表示继续使用上下文(S11412)。
三维数据解码装置在cabac_init_flag表示继续使用上下文的情况下(S11412中“是”),即在cabac_init_flag被设定为false的情况下,判定处理对象的编码数据的编码方式(S11413)。
三维数据解码装置在处理对象的编码数据的编码方式是八叉树编码的情况下(S11413中“八叉树”),继续使用在八叉树编码中使用的上下文作为要在八叉树编码中使用的上下文的初始值进行熵解码,重构八叉树而进行解码(S11414)。
三维数据解码装置在处理对象的编码数据的编码方式是预测树编码的情况下(S11413中“预测树”),继续使用在预测树编码中使用的上下文作为要在预测树编码中使用的上下文的初始值进行熵解码,重构预测树而进行解码(S11415)。
这样,三维数据解码装置在cabac_init_flag(识别信息)表示继续使用在编码中使用的上下文的情况下,继续使用在该编码数据的编码方式中使用的上下文,对编码数据进行解码。
此外,三维数据解码装置在cabac_init_flag表示不继续使用上下文的情况下(S11412中“否”),即在cabac_init_flag被设定为true的情况下,将用于被指定的编码方式的上下文初始化,进行熵解码,用与被指定的编码方式对应的解码方式进行解码(S11416)。
另外,在上述实施方式中,对根据位置信息的编码方式(八叉树或预测树)变更要继续的上下文的方法进行了说明,但该方法也同样应用于属性信息的编码方式。在属性信息的编码方式中,例如包括基于LoD的编码方式和基于Transform的编码方式。在此情况下,三维数据编码装置也可以根据属性信息的编码方式变更要继续的上下文。即,三维数据编码装置在进行基于LoD的编码的情况下使用用于基于LoD的编码的上下文进行编码,在进行基于Transform的编码的情况下使用用于基于Transform的编码的上下文进行编码。
另外,在属性信息的编码中将cabac_init_flag信号化的情况下,既可以在基于LoD的编码方式及基于Transform的编码方式各自中独立地信号化,也可以共同地信号化。即,三维数据编码装置既可以将用于各个编码方式的cabac_init_flag保存在头中,也可以将在多个编码方式中共同的cabac_init_flag保存在头中。三维数据编码装置在使用多个编码方式中的1个编码方式的情况下,通过将cabac_init_flag共同化(即设为1个),能够削减信号化的信息量。
此外,属性信息的编码的cabac_init_flag和位置信息的编码的cabac_init_flag既可以设为相同的值,也可以设为不同的值。
在将属性信息的编码的cabac_init_flag和位置信息的编码的cabac_init_flag设为相同的值的情况下,也可以将属性信息的编码的cabac_init_flag和位置信息的编码的cabac_init_flag共同化,保存到SPS等的序列间共同的元数据中。在此情况下,三维数据编码装置在决定为了在编码中继续使用在编码中使用的上下文的情况下,(i)继续使用在多个编码方式中的多个三维点的编码方式中使用的上下文,对多个三维点的位置信息进行编码;(ii)继续使用在属性信息的编码方式中使用的上下文,对多个三维点的属性信息进行编码。相反,三维数据编码装置在决定为了在编码中不继续使用在编码中使用的上下文的情况下,(i)使用用于多个编码方式中的多个三维点的编码方式的初始化的上下文,对多个三维点的位置信息进行编码;(ii)使用用于属性信息的编码方式的初始化的上下文,对多个三维点的属性信息进行编码。
在此情况下,三维数据解码装置在识别信息表示继续使用在编码中使用的上下文的情况下,(i)通过继续使用在多个编码方式中的被编码的多个三维点的位置信息的编码中使用的上下文进行解码,来计算多个三维点的位置信息;(ii)通过继续使用在属性信息的编码方式中使用的上下文进行解码,来计算多个三维点的属性信息。相反,三维数据解码装置在识别信息表示不继续使用在编码中使用的上下文的情况下,(i)通过使用用于在多个编码方式中的被编码的多个三维点的位置信息的编码中使用的编码方式的初始化的上下文进行解码,来计算被编码的多个三维点的位置信息;(ii)通过使用用于属性信息的编码方式的初始化的上下文进行解码,来对多个三维点的属性信息进行解码。
在将属性信息的编码的cabac_init_flag和位置信息的编码的cabac_init_flag设为不同的值的情况下,三维数据编码装置将属性信息的编码的cabac_init_flag和位置信息的编码的cabac_init_flag分别保存到APS、GPS、数据单元头等中。
三维数据编码装置既可以将属性信息的编码的cabac_init_flag和位置信息的编码的cabac_init_flag保存到在位置信息和属性信息中共同的元数据中,也可以保存到单独的元数据的某一方或双方中,也可以保存到共同的元数据和单独的元数据双方中。此外,三维数据编码装置也可以使用表示记载于属性信息的编码的cabac_init_flag和位置信息的编码的cabac_init_flag的哪一个中的标志。
另外,三维数据编码装置在位置信息的编码中,在数据单元间切换编码方式的情况下,也可以决定为不使在编码方式被切换后最初被编码的数据单元的上下文继续而进行初始化。
图75是用来说明编码方式被切换的情况下的上下文的初始化的图。图75是通过八叉树编码(Octree)对切片#1的数据单元进行编码、通过预测树编码(predtree)对切片#2及切片#3的各数据单元进行编码的情况的例子。
三维数据编码装置将在八叉树编码的开头的数据单元(切片#1)的位置信息的编码中使用的初始化标志(cabac_init_flag)设定为ON(true(真))。并且,三维数据编码装置将在预测树编码的开头的数据单元(切片#2)的位置信息的编码中使用的初始化标志(cabac_init_flag)设定为ON(true)。另外,切片#3的初始化标志既可以设定为ON,也可以设定为OFF。
这样,三维数据编码装置在第1数据单元的编码方式和在第1数据单元之后被编码的第2数据单元的编码方式不同的情况下,决定不继续使用在编码中使用的上下文,使用用于多个编码方式中的第2数据单元的编码方式的初始化的上下文对第2数据单元的多个三维点进行编码。在此情况下,与第2数据单元对应的识别信息(第2识别信息)被设定为,表示不继续使用在编码中使用的上下文。
如以上这样,有关本实施方式的一形态的三维数据编码装置进行图76所示的处理。三维数据编码装置取得包含多个第1三维点的第1数据单元(S11421)。接着,三维数据编码装置用方式不同的多个编码方式中的一方对所取得的上述第1数据单元中包含的上述多个第1三维点进行编码(S11422)。接着,三维数据编码装置生成比特流,该比特流包含上述多个第1三维点被编码的第1编码数据和第1识别信息(S11423)。在上述编码(S11422)中,决定是否继续使用在编码中使用的上下文进行编码,使用在上述多个编码方式中的用于该编码的编码方式中使用的上下文中的与上述决定的决定结果相应的上下文,对上述多个第1三维点进行编码。上述第1识别信息包含上述决定的决定结果。
由此,决定是否使在编码中使用的上下文继续,所以能够提高编码效率,此外,由于生成包含第1识别信息的比特流,所以能够使三维数据解码装置适当地进行解码。
例如,在上述编码(S11422)中决定了继续使用在编码中使用的上下文的情况下,在上述编码(S11422)中,继续使用在上述多个编码方式中的上述多个第1三维点的编码方式中使用的上下文,对上述多个第1三维点进行编码,上述第1识别信息表示继续使用在编码中使用的上下文进行编码。
例如,在上述编码(S11422)中决定了不继续使用在编码中使用的上下文的情况下,在上述编码(S11422)中,使用用于上述多个编码方式中的上述多个第1三维点的编码方式的初始化的上下文,对上述多个第1三维点进行编码,上述第1识别信息表示不继续使用在编码中使用的上下文。
例如,上述多个第1三维点分别包含各第1三维点的位置信息及各第1三维点的属性信息。上述多个编码方式是位置信息的编码方式。在上述编码(S11422)中,用其他的编码方式对上述多个第1三维点的属性信息进行编码。在上述编码中决定了继续使用在编码中使用的上下文的情况下,在上述编码(S11422)中,(i)继续使用在上述多个编码方式中的上述多个第1三维点的编码方式中使用的上下文,对上述多个第1三维点的位置信息进行编码,(ii)继续使用在上述其他的编码方式中使用的上下文,对上述多个第1三维点的属性信息进行编码。
例如,在上述编码(S11422)中决定了不继续使用在编码中使用的上下文的情况下,在上述编码(S11422)中,(i)使用用于上述多个编码方式中的上述多个第1三维点的编码方式的初始化的上下文,对上述多个第1三维点的位置信息进行编码,(ii)使用用于上述其他的编码方式的初始化的上下文,对上述多个第1三维点的属性信息进行编码。
例如,三维数据编码装置具备处理器和存储器,处理器使用存储器进行上述的处理。
此外,有关本实施方式的一形态的三维数据解码装置进行图77所示的处理。三维数据解码装置取得比特流,该比特流包含多个第1三维点被编码的第1编码数据和表示是否继续使用在编码中使用的上下文的第1识别信息(S11431)。接着,三维数据解码装置用与方式不同的多个编码方式中的在上述第1编码数据的编码中使用的编码方式对应的解码方式,对上述第1编码数据进行解码(S11432)。在上述解码(S11432)中,使用与上述第1识别信息相应的上下文,对上述第1编码数据进行解码。
由此,通过根据比特流中包含的第1识别信息对第1编码数据进行解码,能够计算适当的多个第1三维点。
例如,在上述解码(S11432)中,在上述第1识别信息表示继续使用在编码中使用的上下文的情况下,继续使用在与上述解码方式对应的编码方式中使用的上下文,对上述第1编码数据进行解码。
例如,在上述解码(S11432)中,在上述第1识别信息表示不继续使用在编码中使用的上下文的情况下,使用用于上述多个编码方式中的在上述第1编码数据的编码中使用的编码方式的初始化的上下文,对上述第1编码数据进行解码。
例如,上述第1编码数据包含被编码的上述多个第1三维点的位置信息和被编码的上述多个第1三维点的属性信息。上述多个编码方式是上述被编码的上述多个第1三维点的位置信息的编码方式。被编码的上述多个第1三维点的属性信息是用其他的编码方式被编码的。在上述解码(S11432)中,在上述第1识别信息表示继续使用在编码中使用的上下文的情况下,(i)通过继续使用在上述多个编码方式中的上述被编码的上述多个第1三维点的位置信息的编码中使用的上下文进行解码,来计算多个第1三维点的位置信息,(ii)通过继续使用在上述其他的编码方式中使用的上下文进行解码,来计算多个第1三维点的属性信息。
例如,在上述解码(S11432)中,在上述第1识别信息表示不继续使用在编码中使用的上下文的情况下,(i)通过使用用于上述多个编码方式中的在上述被编码的上述多个第1三维点的位置信息的编码中使用的编码方式的初始化的上下文进行解码,来计算上述被编码的上述多个第1三维点的位置信息,(ii)通过使用用于上述其他的编码方式的初始化的上下文进行解码,来对上述多个第1三维点的属性信息进行解码。
例如,上述比特流还包含多个第2三维点被编码的第2编码数据、以及表示是否继续使用在编码中使用的上下文的第2识别信息。上述多个第2三维点是在上述多个第1三维点之后被编码的。上述第2识别信息表示不继续使用在编码中使用的上下文。
例如,三维数据解码装置具备处理器和存储器,处理器使用存储器进行上述的处理。
(实施方式7)
在表示在熵编码中是否使上下文继续的情况下,在表示使上下文继续的情况下,优选的是在三维数据解码装置中保证对应的上下文是否被继续。例如,如果上下文没有被保存或者不能使用但表示使上下文继续,则三维数据解码装置不能解码三维点群。因此,在使上下文继续的情况下,为了保证三维数据解码装置中的三维点群的解码,也可以进行以下的制约。
[编码的制约]
作为在编码中使用的上下文变化的情况的例子,除了切换预测树或八叉树等的编码方式的情况以外,还有切换编码中的参数的情况。
在切换编码中的参数的情况下,例如在八叉树编码中,有将八叉树切换为四叉树或二叉树的情况等改变树结构的数量的情况。此外,在切换编码中的参数的情况下,例如有如切换对于8比特的occupancy code的各个比特分配上下文的每个比特的编码和对于occupancy code整体分配上下文的每个字节的编码的情况等那样切换对于occupancycode的上下文的情况。此外,在切换编码中的参数的情况下,在八叉树编码中有切换是参照相同节点还是参照到相邻节点为止的情况。
另外,表示是否切换这些编码参数的标志被表示在SPS(序列参数集),GPS(位置信息参数集)、数据单元头等中。
像这样,三维数据编码装置在要使用的上下文切换的情况下,也可以在由该数据单元使用的熵编码中最初将上下文复位。即,三维数据编码装置不使用所保存的上下文而使用被复位(初始化)的上下文进行编码。
另外,三维数据编码装置在属性信息的编码中也与位置信息的编码同样,在要使用的上下文切换的情况下,也可以在该数据单元的熵编码中将上下文复位。
此外,在编码中,在不将熵编码复位的情况下,也可以进行制约以不切换编码参数。
例如,在编码中,也可以进行规定,以在保存上下文的“之前的数据单元DU_prev”所参照的参数集(例如GPS1)和使用DU_prev的上下文开始熵编码的“现在的数据单元DU_cur”所参照的参数集(GPS2)中将与编码有关的参数设为相同。
或者,在编码中,也可以进行规定,以将GPS1及GPS2的几何学参数集设为相同,使其记载相同的内容。即,也可以进行规定,以将参数集中的识别符GPS_id设为相同。
此外,在APS的情况下也可以同样地规定。例如,在编码中,也可以进行规定,以在保存上下文的“之前的数据单元DU_prev”所参照的参数集(例如APS1)和使用DU_prev的上下文开始熵编码的“现在的数据单元DU_cur”所参照的参数集(APS2)中将与编码有关的参数设为相同。
或者,在编码中,也可以进行规定,以将APS1及APS2的几何学参数集设为相同,使其记载相同的内容。即,也可以进行规定,以将参数集中的APS_id设为相同。
另外,在使上下文继续的情况下,也可以在数据单元头中,在DU_cur的数据单元头保存DU_cur所属的切片的ID和DU_prev所属的切片的ID。
[解码的制约]
此外,也可以如以下这样设置三维数据解码装置的制约。
在DU_cur的熵编码中,在使用由DU_prev保存的上下文的情况下,即在cabac_init_flag=0的情况下,三维数据解码装置也可以判定在将DU_cur解码之前被解码的数据单元的切片ID是否与DU_prev一致,如果一致则进行解码。即,三维数据解码装置确认在三维数据编码装置侧保存了上下文的对象的切片与在三维数据解码装置侧保存了上下文的对象的切片一致。并且,也可以是,如果确认的结果是这些切片不一致,则三维数据解码装置判定为违反一致性(或不符合规格)。另外,比特流的符合规格是指为了使得在解码器中正常地解码比特流而由编码器制作的设定了比特流的必要条件的规格,即也可以说是用来由解码器确认编码器中的编码方法的制约的规格。因而,将用来由解码器正常地解码的编码方法规定为比特流的符合规格,在解码器中通过进行比特流是否符合规格的判定,能够判定是否能够将比特流正确地解码。
此外,在DU_cur所参照的参数集和DU_prev所参照的参数集中通过编码参数的切换而要使用的上下文改变的情况下,三维数据解码装置也可以判定为违反一致性(或不符合规格)。三维数据解码装置在判定为违反一致性(或不符合规格)的情况下,既可以将解码中止,也可以实施特定的回避处理。
或者,三维数据解码装置也可以在DU_cur所参照的参数集和DU_prev所参照的参数集中两者的GPS_id或APS_id不同的情况下判定为违反一致性(或不符合规格)。
图78~图82是表示句法的一例的图。图78是表示SPS的句法的一例的图。图79是表示分割位置信息的头(DevidedGeometryHeader)的句法的一例的图。图80是表示分割属性信息的头(DevidedAttributeHeader)的句法的一例的图。图81是表示分割属性信息的头(DevidedAttributeHeader)的句法的另一例的图。图82是表示分割位置信息的头(DevidedGeometry Header)的句法的另一例的图。
到此为止,表示是否将在编码中使用的上下文初始化的标志被表现为cabac_init_flag,但在这里被表现为entropy_continue_flag。在entropy_contin ue_flag中,标志的定义是相反的。即,初始化标志(entropy_continue_flag)是表示是否不进行初始化而继续进行熵编码的标志,即是表示将在之前的数据单元的编码中使用的上下文进行保存并应用于下一个数据单元的标志。
如图78所示,在SPS中表示了是否具有(利用)使数据单元间的上下文继续的功能的标志(entropy_continue_enable)。标志(entropy_continue_enable)是第3识别信息的一例。
如图79所示,分割位置信息的头(DevidedGeometryHeader)包括:包含该分割位置信息的数据单元所参照的GPS的识别符(gps_id)、瓦片的识别符(tile_id)、以及帧的识别符(frame_id)。
此外,如果在SPS中表示的entropy_continue_enable有效(即,在entropy_continue_enable表示具有使上下文继续的功能的情况下),分割位置信息的头(DevidedGeometryHeader)示出表示在包含该分割位置信息的数据单元的编码中是否继续使用在该数据单元之前的数据单元的编码中使用的上下文的标志(geom_du_entropy_continue_flag)。即,在此情况下,分割位置信息的头(DevidedGeometryHeader)包含标志(geom_du_entropy_continue_flag)。此外,如果geom_du_entropy_continue_flag有效,则分割位置信息的头(DevidedGeometryHeader)示出之前的数据单元所属的切片ID(slice2_id)。即,分割位置信息的头(DevidedGeometryHeader)包含切片ID(slice2_id)。另外,标志(geom_du_entropy_continue_flag)是第1识别信息的一例。
如图80所示,分割属性信息的头(DevidedAttributeHeader)包括:包含该分割属性信息的数据单元所参照的APS(属性信息参数集)的识别符(aps_id)、在记载于SPS中的属性信息的顺序中示出该属性信息的号码(attr_index)、以及该属性信息所对应的位置信息的切片ID(geom_slice_id)。
此外,如果SPS中表示的entropy_continue_enable有效(即,在entropy_continue_enable表示具有使上下文继续的功能的情况下),分割属性信息的头(DevidedAttributeHeader)示出在包含该分割属性信息的数据单元的编码中是否继续使用在该数据单元之前的数据单元的编码中使用的上下文的标志(attr_du_entropy_continue_flag)。即,在此情况下,分割属性信息的头(DevidedAttributeHeader)包含标志(attr_du_entropy_continue_flag)。此外,如果attr_du_entropy_continue_flag有效,则分割属性信息的头(DevidedAttributeHeader)表示之前的数据单元所属的切片ID(slice2_id)。即,分割属性信息的头(DevidedAttributeHeader)包含切片ID(slice2_id)。另外,标志(geom_du_entropy_continue_flag)是第1识别信息的一例。
如上述那样,如果在SPS中表示的entropy_continue_enable有效(即,在entropy_continue_enable表示具有使上下文继续的功能的情况下),分割位置信息的头(DevidedGeometryHeader)包含标志(geom_du_entropy_continue_flag),分割属性信息的头(DevidedAttributeHeader)包含标志(attr_du_entropy_continue_flag)。即,三维数据编码装置也可以决定是否进行使用上下文的编码(第2决定),在决定为进行使用上下文的编码的情况下,决定在处理对象的数据单元的编码中是否继续使用在处理对象的数据单元之前的数据单元的编码中使用的上下文(第1决定)。在此情况下,三维数据编码装置生成包含表示是否进行使用上下文的编码的entropy_continue_enable(第3识别信息)的比特流。此外,在entropy_continue_enable(第3识别信息)表示进行使用上下文的编码的情况下,geom_du_entropy_continue_flag(第1识别信息)或attr_du_entropy_continue_flag(第1识别信息)被表示于数据单元的头中。
此外,由于像这样在分割位置信息的头及分割属性信息的头中包含geom_du_entropy_continue_flag和attr_du_entropy_continue_flag,所以能够在位置信息和属性信息中单独地控制是否使上下文继续。因此,能够进行灵活的控制。
此外,如图81所示,表示是否使在属性信息的编码中使用的上下文继续的标志(attr_du_entropy_continue_flag)也可以在位置信息的熵编码正在继续进行的情况下设定为有效,在有效的情况下在分割属性信息的头(DevidedAttributeHeader)中示出该属性信息的数据单元的熵编码是否有效。
即,三维数据编码装置也可以在决定为继续使用在之前的数据单元的编码中使用的上下文的情况下,(i)继续使用在之前的数据单元的位置信息的编码中使用的上下文,来对处理对象的数据单元的位置信息进行编码;并且,(ii)继续使用在之前的数据单元的属性信息的编码中使用的上下文,来对处理对象的数据单元的属性信息进行编码。在此情况下,三维数据解码装置在第1识别信息表示继续使用在之前的数据单元的编码中使用的上下文的情况下,(i)通过继续使用在之前的数据单元的位置信息的编码中使用的上下文进行解码,来计算数据单元中包含的多个三维点的位置信息;(ii)通过继续使用在之前的数据单元的属性信息的编码中使用的上下文进行解码,来计算数据单元中包含的多个三维点的属性信息。
或者,也可以在entropy_continue_enable为true(真)的情况下,在分割属性信息的头(DevidedAttributeHeader)中设定attr_du_entropy_continue_flag,在geom_du_entropy_continue_flag为false(假)的情况下,不论attr_du_entropy_continue_flag为怎样的值,attr_du_entropy_continue_flag都设定为false。
或者,也可以在geom_du_entropy_continue_flag为false且attr_du_entrpy_continue_flag为true的情况下规定为违反一致性(或不符合规格)。
另外,也可以将位置信息的编码的控制和属性信息的编码的控制统一。即,也可以将geom_du_entropy_continue_flag和attr_du_entropy_continue_flag合并。在此情况下,在分割属性信息的头中也可以不示出attr_du_entropy_continue_flag。在分割属性信息的熵编码中,按照在用geom_slice_id建立了对应的位置信息的数据单元头中示出的du_entropy_continue_flag,判断是否使在之前的数据单元的编码中使用的上下文继续。
另外,在使DU_cur和DU_prev所参照的参数集相同的情况下,也可以在DU_cur中不示出参数集ID(GPS_id、APS_id)。三维数据解码装置参照在DU_cur的头中示出的DU_prev,参照具有在DU_prev头中示出的参数集ID的参数集。
另外,在设定为DU_cur和DU_prev属于相同的瓦片的情况下,也可以不示出tile_id。即,分割位置信息的头也可以不包含tile_id。由此,能够减少判定DU_cur和DU_prev是否相同的处理。此外,能够防止尽管上下文切换了但仍表示熵编码继续进行那样的混乱。
此外,也可以规定为,在du_entropy_continue_flag为false的情况下示出gps_id及tile_id的至少一方,在du_entropy_continue_flag为true的情况下不示出gps_id及tile_id。
另外,geom_entropy_continue_enable_flag是表示是否使熵编码的上下文继续的标志。也可以规定为,为了将geom_entropy_continue_enable_flag设定为true而需要满足以下的条件1或条件2。条件1是容许在切片(数据单元)间有编码的依赖关系。条件2是不容许切片(数据单元)的顺序替换。
另外,切片(数据单元)的顺序例如也可以由数据单元的ID(切片ID)示出。数据单元的ID既可以是用来以帧单位识别该数据单元的ID(号码),也可以是用来以随机访问单位识别的ID(号码)。另外,随机访问单位的开头的数据单元是被赋予了规定的ID(规定的号码)的数据单元。这样,各数据单元被赋予了该数据单元在随机访问单位中的顺序。即,三维数据编码装置在为了满足条件2而决定为继续使用在之前的数据单元的编码中使用的上下文的情况下,也可以不进行多个数据单元的顺序的替换。在此情况下,三维数据编码装置也可以还生成包含表示是否容许随机访问单位的多个数据单元的顺序的替换的第2识别信息的比特流。此外,三维数据解码装置也可以在du_entropy_continue_flag(第1识别信息)表示不继续使用上下文、并且第2识别信息表示不容许顺序的替换的情况下,判定为所取得的比特流符合一致性。此外,三维数据解码装置也可以在du_entropy_continue_flag(第1识别信息)表示不继续使用上下文的情况下、或第2识别信息表示容许顺序的替换的情况下,判定为所取得的比特流不符合一致性。
在此情况下,也可以在满足条件1或条件2的情况下示出geom_entropy_continue_enable_flag是否有效。或者,也可以在geom_entropy_continue_enable_flag为true的情况下在不满足条件1或条件2的情况下设为违反一致性(或不符合规格)。此外,也可以将geom_entropy_continue_enable_flag和表示条件1或条件2的标志合并而替换为某个标志。
此外,也可以在处理对象的数据单元是随机访问单位的开头的数据单元的情况下,将du_entropy_continue_flag在随机访问单位下设为false。即,在此情况下,三维数据编码装置也可以决定为不继续使用在之前的数据单元的编码中使用的上下文。此外,三维数据编码装置也可以在处理对象的数据单元不是随机访问单位的开头的数据单元的情况下,决定继续使用在之前的数据单元的编码中使用的上下文。
此外,三维数据解码装置也可以在du_entropy_continue_flag(第1识别信息)表示不继续使用在之前的数据单元的编码使用的上下文、并且数据单元是随机访问单位的开头的数据单元的情况下,判定为比特流符合一致性。即,三维数据解码装置将在数据单元是随机访问单位的开头的数据单元的情况下第1识别信息表示不继续使用在上述之前的数据单元的编码中使用的上下文,判定为比特流的符合条件(即,满足比特流的符合条件)。此外,三维数据解码装置也可以在du_entropy_continue_flag(第1识别信息)表示继续使用在之前的数据单元的编码中使用的上下文的情况下、或在数据单元不是随机访问单位的开头的数据单元的情况下,判定为比特流不符合一致性。
例如,随机访问单位也可以是1个帧单位。在此情况下,三维数据编码装置也可以决定在1帧的开头的切片(数据单元)的编码中不继续使用在之前的数据单元的编码中使用的上下文。此外,三维数据解码装置也可以在du_entropy_continue_flag(第1识别信息)表示不继续使用在之前的数据单元的编码中使用的上下文、并且数据单元是1帧的开头的数据单元的情况下,判定为比特流符合一致性。
此外,例如随机访问单位也可以是多个帧单位(GOF:Group Of Flame(帧组))。在此情况下,三维数据编码装置也可以决定在GOF的开头的切片(数据单元)的编码中不继续使用在之前的数据单元的编码中使用的上下文。此外,三维数据解码装置也可以在du_entropy_continue_flag(第1识别信息)表示不继续使用在之前的数据单元的编码中使用的上下文、并且数据单元是GOF的开头的数据单元的情况下,判定为比特流符合一致性。
此外,随机访问单位也可以是1个瓦片单位。在此情况下,三维数据编码装置也可以决定在1个瓦片的开头的切片(数据单元)的编码中不继续使用在之前的数据单元的编码中使用的上下文。此外,三维数据解码装置也可以在du_entropy_continue_flag(第1识别信息)表示不继续使用在之前的数据单元的编码中使用的上下文、并且数据单元是1个瓦片的开头的数据单元情况下,判定为比特流符合一致性。
另外,也可以在数据单元所参照的参数集或头中设定表示该数据单元是否是开头的数据单元(随机访问点)的随机访问点标志。在此情况下,du_entropy_continue_flag也可以在随机访问点标志表示数据单元是开头的数据单元的情况下在头中有效(即,包含在头中)。此外,也可以将du_entropy_continue_flag与随机访问点标志合并。
图83是表示在三维数据编码装置中决定是否将熵编码初始化的第1决定的一例的流程图。
三维数据编码装置决定是否继续实施熵编码(S11901)。
接着,三维数据编码装置执行每个切片(数据单元)的处理(S11902)。
接着,三维数据编码装置判定处理对象的切片是否是随机访问点(S11903)。在能够以帧单位进行随机访问的情况下随机访问点是帧开头的切片,在能够以多帧单位(GOF)进行随机访问的情况下随机访问点是GOF开头的切片,在能够以瓦片单位进行随机访问的情况下随机访问点是瓦片开头的切片。
三维数据编码装置在判定为处理对象的切片不是随机访问点的情况下(在S11903中否),判定在处理对象的切片的编码中要使用的上下文是否与在之前的切片的编码中使用的上下文相同(S11904)。另外,三维数据编码装置例如也可以基于表示树结构是八叉树还是预测树的标志、是否使用二叉树、四叉树的的标志、是否使用每个比特的上下文的标志,来判定在编码中要使用的上下文变化的情况(即,上下文不同的情况)。
三维数据编码装置在判定为在处理对象的切片的编码中要使用的上下文与在之前的切片的编码中使用的上下文相同的情况下(在S11904中是),判定是否将上下文初始化(S11905)。
三维数据编码装置在判定为不将上下文初始化的情况下(在S11905中否),决定为将上下文不进行初始化而继续使用(S11906)。
另一方面,三维数据编码装置在判定为处理对象的切片是随机访问点的情况(在S11903中是),在判定为在处理对象的切片的编码中要使用的上下文与在之前的切片的编码中使用的上下文不相同的情况(在S11904中否)、以及判定为将上下文进行初始化的情况(在S11905中是)中的任一种情况下,决定为将上下文进行初始化(即,不继续)(S11907)。
图84是表示在三维数据解码装置中决定熵编码的标志是否符合一致性(是否符合规格)的处理的一例的流程图。
三维数据解码装置将每个切片(数据单元)的头进行解析(S11911)。
接着,三维数据解码装置判定du_entropy_continue_flag(第1识别信息)是否为true(S11912)。
三维数据解码装置在判定为du_entropy_continue_flag(第1识别信息)为true的情况下(在S11912中是),判定处理对象的切片所参照的GPS的识别符(gps_id)是否与之前的切片所参照的GPS的识别符(gps_id)相同(S11913)。
三维数据解码装置在判定为处理对象的切片所参照的GPS的识别符(gps_id)与之前的切片所参照的GPS的识别符(gps_id)不相同的情况下(在S11913中否),判定处理对象的切片是否是随机访问单位的开头(S11914)。三维数据解码装置也可以将帧单位是随机访问的情况、检测到存在表示帧边界的数据单元的情况、或者检测到帧索引的切换的情况检测为帧边界。
三维数据解码装置在判定为处理对象的切片不是随机访问单位的开头的情况下(在S11914中否),决定为违反一致性(不符合规格)(S11915)。
三维数据解码装置在判定为du_entropy_continue_flag(第1识别信息)不为true(即,为false)的情况下(在S11912中否)、在判定为处理对象的切片所参照的GPS的识别符(gps_id)与之前的切片所参照的GPS的识别符(gps_id)相同的情况下(在S11913中是)、在判定为处理对象的切片是随机访问单位的开头的情况下(在S11914中是),决定为符合一致性(符合规格)(S11916)。
如以上这样,有关本实施方式的一技术方案的三维数据编码装置进行图85所示的处理。三维数据编码装置取得包含多个三维点的数据单元(S11921)。接着,三维数据编码装置对于各个上述数据单元,将该数据单元中包含的上述多个三维点进行编码(S11922)。三维数据编码装置生成包含上述数据单元被编码的编码数据的比特流(S11925)。三维数据编码装置在编码(S11922)中,进行第1决定,该第1决定中决定在上述数据单元的编码中是否继续使用在上述数据单元之前的数据单元的编码中使用的上下文(S11923)。并且,三维数据编码装置接着S11923,使用与上述第1决定的决定结果相应的上下文,对上述数据单元进行编码(S11924)。在上述第1决定(S11923)中,三维数据编码装置在上述数据单元是随机访问单位的开头的数据单元的情况下,决定不继续使用在上述之前的数据单元的编码中使用的上下文。
由此,在处理对象的数据单元是随机访问单位的开头的数据单元的情况下,决定不继续使用在之前的数据单元的编码中使用的上下文,所以能够使三维数据解码装置对比特流适当地进行解码。
例如,上述随机访问单位是1个帧单位。
例如,上述随机访问单位是多个帧单位。
例如,上述随机访问单位是1个瓦片单位。
例如,上述数据单元被赋予了该数据单元在上述随机访问单位中的顺序。在上述第1决定(S11923)中,三维数据编码装置在决定了不继续使用在上述之前的数据单元的编码中使用的上下文的情况下,不进行上述随机访问单位的多个数据单元的上述顺序的替换。
例如,在上述编码中,三维数据编码装置还进行第2决定,该第2决定中决定是否进行使用上述上下文的编码。在上述第2决定中决定为进行使用上述上下文的编码的情况下,三维数据编码装置进行上述第1决定(S11923)。
例如,上述多个三维点分别包含各三维点的位置信息及各三维点的属性信息。在上述编码(S11922)中,三维数据编码装置在上述第1决定(S11923)中决定了继续使用在上述之前的数据单元的编码中使用的上下文的情况下,(i)继续使用在上述之前的数据单元的位置信息的编码中使用的上下文,对上述数据单元的位置信息进行编码;并且,(ii)继续使用在上述之前的数据单元的属性信息的编码中使用的上下文,对上述数据单元的属性信息进行编码。
例如,三维数据编码装置具备处理器和存储器,处理器使用存储器进行上述的处理。
此外,有关本实施方式的一技术方案的三维数据解码装置进行图86所示的处理。三维数据解码装置取得包含编码数据和第1识别信息的比特流,上述编码数据是包含多个三维点的数据单元被编码的编码数据,上述第1识别信息表示在上述数据单元的编码中是否继续使用在该数据单元之前的数据单元的编码中使用的上下文(S11931)。三维数据解码装置使用与上述第1识别信息相应的上下文对上述编码数据进行解码(S11932)。在上述解码(S11932)中,三维数据解码装置将在上述数据单元是随机访问单位的开头的数据单元的情况下上述第1识别信息表示不继续使用在上述之前的数据单元的编码中使用的上下文,判定为上述比特流的符合条件(即,满足比特流的符合条件)。
因此,三维数据解码装置在判定为符合一致性的情况下,例如能够通过继续解码来对比特流适当地进行解码。此外,三维数据解码装置在判定为不符合一致性的情况下,例如能够通过停止解码或执行特定的回避处理,来抑制对比特流不适当地进行解码。
例如,上述随机访问单位是1个帧单位。
例如,上述随机访问单位是多个帧单位。
例如,上述随机访问单位是1个瓦片单位。
例如,上述数据单元被赋予了该数据单元在上述随机访问单位中的顺序。上述比特流还包含第2识别信息,该第2识别信息表示是否容许上述随机访问单位的多个数据单元的顺序的替换。在上述解码(S11932)中,三维数据解码装置在上述第1识别信息表示不继续使用上述上下文,并且上述第2识别信息表示不容许上述顺序的替换的情况下,判定为上述比特流符合一致性。
例如,上述比特流还包含第3识别信息,该第3识别信息表示是否进行使用上述上下文的编码。在上述第3识别信息表示进行使用上述上下文的编码的情况下,上述第1识别信息被表示于上述数据单元的头中。
例如,上述编码数据包含被编码的上述多个三维点的位置信息以及被编码的上述多个三维点的属性信息。在上述解码(S11932)中,三维数据解码装置在上述第1识别信息表示继续使用在上述之前的数据单元的编码中使用的上下文的情况下,(i)通过继续使用在上述之前的数据单元的位置信息的编码中使用的上下文进行解码,来计算上述数据单元中包含的多个三维点的位置信息;(ii)通过继续使用在上述之前的数据单元的属性信息的编码中使用的上下文进行解码,来计算上述数据单元中包含的多个三维点的属性信息。
例如,三维数据解码装置具备处理器和存储器,处理器使用存储器进行上述的处理。
(实施方式8)
在本实施方式中,对熵编码的另一例进行说明。图87是表示SPS的句法的一例的图。图88是表示APS的句法的一例的图。图89是表示分割位置信息的头(DevidedGeometryHeader)的句法的一例的图。图90是表示分割属性信息的头(DevidedAttributeHeader)的句法的一例的图。
在熵编码中,也可以按每个属性信息的数据单元设置切换标志(识别信息),该切换标志用于切换是否将在熵编码中使用的上下文的继续功能设为有效。
切换标志也可以设置在属性信息所参照的参数集(SPS或APS)中。具体而言,切换标志(entropy_continue_attr_enable_flag)既可以如图87所示在SPS中示出,也可以如图88所示在APS中示出。entropy_continue_attr_enable_flag是表示是否将在属性信息的编码中使用的上下文的继续功能设为有效的标志。entropy_continue_attr_enable_flag也可以在SPS中示出的entropy_continue_enable_flag为true(真)的情况下被示出。另外,entropy_continue_enable_flag是表示是否将上下文的继续功能设为有效的标志。另外,图88所示的Sps.entropy_continue_enable_flag是指在SPS中被信号化的entropy_continue_enable_flag。
此外,如图89所示,在分割位置信息的头(DevidedGeometryHeader)中,也可以示出按每个数据单元表示是否使上下文继续的标志(geom_du_entropy_continue_flag)。此外,如图90所示,也可以在分割属性信息的头(DevidedAttributeHeader)中不示出与上下文的继续有关的信息。
也可以使用如图87~图90所示的句法,如图91的流程图中所示那样导出每个数据单元(位置信息及属性信息)的继续标志。图91是表示在三维数据编码装置中决定是否使在熵编码中使用的上下文继续的处理的一例的流程图。
首先,三维数据编码装置判定SPS的entropy_continue_enable_flag是否表示true(真)(S12101)。
三维数据编码装置在SPS的entropy_continue_enable_flag表示true的情况下(在S12101中是),判定分割位置信息的头(DevidedGeometryHeader)的geom_du_entropy_continue_flag是否为true(S12102)。
三维数据编码装置在分割位置信息的头(DevidedGeometryHeader)的geom_du_entropy_continue_flag表示true的情况下(在S12102中是),在位置信息的数据单元的编码开始时,决定使用在之前的位置信息的数据单元中被保存(存储或存放)到存储装置(存储器)中的上下文(S12103)。即,在此情况下,三维数据编码装置决定继续使用在之前的位置信息的数据单元的编码中使用的上下文。
接着,三维数据编码装置判定SPS或APS的entropy_continue_attr_enable_flag是否为true(S12104)。
三维数据编码装置在SPS或APS的entropy_continue_attr_enable_flag表示true的情况下(S12104中是),在属性信息的数据单元的编码开始时,决定使用在之前的属性信息的数据单元中被保存在存储装置(存储器)中的上下文(S12105)。即,在此情况下,三维数据编码装置决定继续使用在之前的属性信息的数据单元的编码中使用的上下文。
三维数据编码装置在SPS的entropy_continue_enable_flag表示false(假)的情况下(在S12101中否),或者在分割位置信息的头(DevidedGeometryHeader)的geom_du_entropy_continue_flag表示false的情况下(在S12102中否),在位置信息的数据单元的编码开始时,决定将上下文初始化(S12106)。即,在此情况下,三维数据编码装置决定不继续使用在之前的位置信息的数据单元的编码中使用的上下文而进行初始化。
并且,三维数据编码装置在SPS或APS的entropy_continue_attr_enable_flag表示false的情况下(在S12104中否),或者在步骤S12106之后,在属性信息的数据单元的编码开始时,决定将上下文初始化(S12107)。即,在此情况下,三维数据编码装置决定不继续使用在之前的属性信息的数据单元的编码中使用的上下文而进行初始化。
如果entropy_continue_attr_enable_flag在SPS中被示出,则三维数据编码装置能够以全部的颜色、反射率等的全部的属性组件共同地进行控制。此外,如果entropy_cotinue_attr_enable_flag在APS中被示出,则三维数据编码装置能够以全部的颜色、反射率等的全部的属性组件单独地进行控制。
是否使属性信息的数据单元的上下文继续的判断也可以依赖于是否使位置信息的每个数据单元的上下文继续的判断结果。在此情况下,是否使位置信息的数据单元的上下文继续(ON/OFF)和是否使属性信息的数据单元的上下文继续(ON/OFF)的组合(GometryDU,Attribute DU)可以有(ON,ON)、(ON,OFF)及(OFF,OFF)的任一种组合。
在熵编码中,通过将在之前的数据单元或数据单元的编码中使用的上下文保存在存储装置(存储器)中,并将保存在存储装置(存储器)中的上下文应用于下一个数据单元的编码,能够提高编码绩效。在以比特单位进行熵编码,并使用比特单位的上下文的情况下,有在比特单位的熵编码中应继续的熵上下文。但是,在熵编码是字节单位的情况下,由于没有字节单位的上下文,所以没有在字节单位的熵编码中应继续的熵上下文。因而,在到此为止说明的方法中,不存在使字节单位的熵编码继续的方法。
在本实施方式中,说明在使用N叉树(N是2以上的整数,例如是八叉树)的位置信息的编码中将占用码元(occupancy code)以字节单位编码的情况下的使熵编码继续的方法。此外,说明根据编码方式(比特单位的编码或字节单位的编码)将继续熵编码的方法进行切换的方法。
在字节单位的编码中,三维数据编码装置使用参照表,将占用码元变换为表的索引信息,对变换后的索引信息进行编码。这里,关于占用码元,如在上述实施方式中说明那样,在以八叉树表现了三维点群的情况下,是表示在某个节点处在分割后的哪个位置具有下一个节点或叶节点的8比特的信息。以下,也有将占用码元称为占用地图(occupancymap)的情况。以后将占用码元表现为占用地图。
图92是用来说明表的更新的图。
三维数据编码装置使用图92所示的表12101,将占用地图变换为示出表示占用地图的产生次数的直方图与表示产生次数的顺序的辞典索引的关系的表。在图92中,将占用地图用m表示,将辞典索引用d表示,将直方图用h表示。此外,在图92中表示了占用地图为15、25及35的3种表的例子,但并不限于此,表也可以具有4种以上的占用地图。
三维数据编码装置在每当对1个占用地图进行编码时更新表。三维数据编码装置在对占用地图进行编码的情况下,向对应的占用地图的直方图的值加1。例如,如图92的(a)所示,三维数据编码装置在被输入的占用地图表示25的情况下,向与25的占用地图对应的直方图的值加1。
接着,三维数据编码装置基于更新后的直方图,更新辞典索引。即,三维数据编码装置基于更新后的占用地图的产生次数,赋予(设定)产生次数的顺序作为辞典索引。另外,辞典索引只要表示占用地图的产生次数及占用地图的产生频率中的某一个即可。
例如,如图92的(a)所示,三维数据编码装置如果直方图的值被更新,则以更新后的直方图的值从大到小的顺序赋予索引,所以将与15的占用地图对应的索引设为2,将与25的占用地图对应的索引设为1,将与35的占用地图对应的索引设为3。另外,15的占用地图的直方图和35的占用地图的直方图是相同的值,但在此情况下,也可以将占用地图较小一方的索引设为较小的值。另外,并不限于此,也可以将占用地图较小一方的索引设为较大的值。
在图92的(b)中,被输入25的占用地图,在图92的(c)~(f)各自中,被输入35的占用地图,在图92的(g)中,被输入15的占用地图。三维数据编码装置如果被输入各占用地图,在对与被输入的占用地图对应的直方图的值加1,以计算出的直方图的值从大到小的顺序赋予辞典索引。因此,辞典索引的值更小,意味着占用地图的产生频率(输入频率)更大。
接着,三维数据编码装置对表示所设定的辞典索引的索引信息进行编码。三维数据编码装置在字节单位的编码中,通过将占用地图变换为索引信息,能够削减编码量。
这样,三维数据编码装置使用表导出与占用地图对应的索引信息,对所导出的索引信息进行编码。然后,三维数据编码装置将保存在存储装置(存储器)中的表更新为表示更新后的直方图与所设定的索引的关系的表。
三维数据解码装置从编码比特流,对编码比特流中包含的索引信息进行解码,通过与三维数据编码装置同样的方法,使用保存在存储装置(存储器)中的表导出占用地图。然后,使用与三维数据编码装置同样的方法更新表。
对于表中的直方图及索引信息,也可以进行更新直到切片(数据单元)的占用地图的编码完成,在下一个切片的开头进行初始化。此外,也可以将在切片的最后使用的表进行存储,在下一个切片的编码中继续使用所存储的表。在字节单位的熵编码中,通过将在之前的切片中学习的表在下一个切片的编码中继续使用,能够期待编码的改善。这样,相对于在比特单位的编码中使上下文继续,在字节单位的编码中使表继续这一点上比特单位的编码和字节单位的编码不同。
另外,以字节单位的编码为例进行了说明,但并不限定于此。在编码中不使用上下文而在将值的产生进行计数的直方图(占用地图等)中使用表的情况下、或在其他的学习参数等编码所使用的附加信息中也同样能够应用。此外,该方法不仅应用于位置信息的编码,也能够应用于属性信息的编码。在将附加信息保存在存储装置(存储器)中,并对下一个数据单元应用所保存的附加信息的情况下,也能够期待编码率的提高。
图93是由三维数据编码装置进行的占用地图的编码的流程图。
三维数据编码装置按每个数据单元将三维点变换为N叉树表现,开始每个节点的占用地图的编码(S12111)。三维数据编码装置对于处理对象的数据单元中包含的多个三维点中的各个三维点,将该三维点的位置信息变换为N叉树表现(例如八叉树表现),从而生成占用地图。即,三维数据编码装置使用八叉树将编码对象的数据单元中包含的多个三维点的多个位置信息变换为多个占用地图。
接着,三维数据编码装置使用表生成与占用地图对应的索引信息,对所生成的索引信息进行编码(S12112)。三维数据编码装置将多个占用地图分别使用表示占用地图与索引的对应关系的表变换为索引,通过对索引进行编码而生成编码数据。
接着,三维数据编码装置通过使用占用地图更新直方图及索引,来更新保存在存储装置(存储器)中的表(S12113)。三维数据编码装置根据变换后的索引将表进行更新,并存储到存储器中。
图94是由三维数据解码装置进行的占用地图的解码的流程图。
三维数据解码装置按比特流内的每个数据单元,开始解码处理(S12121)。比特流例如包含编码数据和第1识别信息,编码数据是包含多个三维点的数据单元被编码后的编码数据,第1识别信息表示在数据单元的编码中是否将在该数据单元之前的数据单元的编码中使用的表进行初始化来使用。
接着,三维数据解码装置对比特流中包含的被编码后的索引信息进行解码,使用解码后的索引信息和保存在存储装置(存储器)中的表,导出与索引信息表示的索引对应的占用地图(S12122)。即,三维数据解码装置通过导出在表中与通过对编码数据进行解码而得到的索引对应的占用地图,计算三维点的位置信息。
接着,三维数据解码装置通过使用占用地图更新直方图及索引,来更新保存在存储装置(存储器)中的表(S12123)。
图95是三维数据编码装置的切换熵编码方式的处理的流程图。
三维数据编码装置判定编码方式是比特单位还是字节单位(S12131)。
三维数据编码装置在判定为编码方式是比特单位的情况下(在S12131中“比特单位”),通过比特单位的熵编码的继续方法执行编码(S12132)。
三维数据编码装置将表示编码方式是否是比特单位(否表示是字节单位)的标志(bit-wise_flag)设定为true(S12133)。三维数据编码装置生成包含该标志的比特流,向三维数据解码装置发送。
三维数据编码装置在判定为编码方式是字节单位的情况下(在S12131中“字节单位”),通过字节单位的熵编码的继续方法执行编码(S12134)。
三维数据编码装置将表示编码方式是否是比特单位(否表示是字节单位)的标志(bit-wise_flag)设定为false(S12133)。三维数据编码装置生成包含该标志的比特流,向三维数据解码装置发送。
图96是三维数据编码装置的字节单位的熵编码的继续方法的流程图。
三维数据编码装置判定是否将熵编码初始化(S12141)。三维数据编码装置判定是否将在字节单位的熵编码中使用的表初始化,即是否继续使用该表。
三维数据编码装置在判定为不将熵编码进行初始化的情况下(在S12142中否),即在判定为继续使用表的情况下,继续使用在之前的数据单元的编码时保存在存储装置(存储器)中的表执行编码(S12142)。
接着,三维数据编码装置将cabac_init_flag设定为false(S12143)。即,三维数据编码装置将表示有没有使表继续的标志(识别信息)设定为表示使表继续了的值。
三维数据编码装置在判定为将熵编码进行初始化的情况下(在S12142中是),即在判定为不继续使用表的情况下,将在之前的数据单元的编码时保存在存储装置(存储器)中的表初始化来执行编码(S12144)。
接着,三维数据编码装置将cabac_init_flag设定为true(S12145)。即,三维数据编码装置将表示有没有使表继续的标志(识别信息)设定为表示没有使表继续的值。
三维数据编码装置对应于熵编码将表更新,将更新后的表保存到存储装置(存储器)中(S12146)。
图97是三维数据解码装置的切换熵解码方式的处理的流程图。
三维数据解码装置对与比特流中包含的解码对象的数据单元对应的bit-wise_flag进行解析(S12151)。
接着,三维数据解码装置判定解析的结果,解码对象的数据单元的编码方式是比特单位还是字节单位(S12152)。即,三维数据解码装置判定与解码对象的数据单元对应的bit-wise_flag是否表示true。
三维数据解码装置在解码对象的数据单元的编码方式是比特单位的情况下,即在bit-wise_flag表示true的情况下,通过比特单位的熵编码的继续方法执行解码(S12153)。
三维数据解码装置在解码对象的数据单元的编码方式是字节单位的情况下,即在bit-wise_flag表示false的情况下,通过字节单位的熵编码的继续方法执行解码(S12154)。
图98是三维数据解码装置的字节单位的熵解码的继续方法的流程图。
三维数据解码装置对比特流中包含的cabac_init_flag进行解析(S12161)。
接着,三维数据解码装置判定cabac_init_flag是否表示true(S12162)。
三维数据解码装置在cabac_init_flag表示false的情况下(在S12162中否),继续使用在之前的数据单元的解码中保存在存储装置(存储器)中的表来执行解码(S12163)。
三维数据解码装置在cabac_init_flag表示true的情况下(在S12162中是),将在之前的数据单元的解码中保存在存储装置(存储器)中的表初始化而执行解码(S12164)。
三维数据解码装置对应于熵解码将表更新,将更新后的表保存到存储装置(存储器)中(S12165)。
如以上这样,有关本实施方式的一技术方案的三维数据编码装置进行图99所示的处理。三维数据编码装置取得分别包含多个三维点的多个数据单元(S12171)。接着,三维数据编码装置对上述多个数据单元各自中包含的多个三维点进行编码(S12172)。接着,三维数据编码装置生成包含上述多个三维点被编码后的编码数据的比特流(S12173)。三维数据编码装置在上述编码(S12172)中,使用N叉树将编码对象的数据单元中包含的多个三维点的多个位置信息变换为多个占用地图,使用表示占用地图与索引的对应关系的表将上述多个占用地图分别变换为索引,通过对上述索引进行编码而生成上述编码数据,根据变换后的索引将上述表更新并存储到存储器中;在上述编码对象的数据单元的下一个数据单元的开头的三维点的编码时,决定是否将存储在上述存储器中的上述表进行初始化,在决定为不进行初始化的情况下,使用存储在上述存储器中的上述表开始上述下一个数据单元的编码。上述比特流还包含表示上述决定的结果的第1识别信息。
由此,在将位置信息进行变换而得到的占用地图的编码时,对使用表得到的索引进行编码,生成包含表示是否将在编码中使用的表进行初始化的第1识别信息的比特流,所以能够使三维数据解码装置对比特流适当地进行解码。
例如,上述索引表示占用地图的产生次数及占用地图的产生频率中的某一个。因此,例如通过产生次数及产生频率越大则将索引设定为越小的值,能够使编码效率提高。
例如,在上述第1识别信息表示将上述表进行初始化的情况下,表示将之前的数据单元的上下文进行初始化来对上述多个三维点的多个属性信息进行编码;在表示不将上述表进行初始化的情况下,表示继续使用上述之前的数据单元的上下文来对上述多个属性信息进行编码。
例如,上述比特流还包含第2识别信息,该第2识别信息表示是否使用在上述多个数据单元之间使熵继续的功能。上述第1识别信息在上述第2识别信息表示使用在上述多个数据单元之间使熵继续的功能的情况下被示出。
例如,三维数据编码装置具备处理器和存储器,处理器使用存储器进行上述的处理。
此外,有关本实施方式的一技术方案的三维数据解码装置进行图100所示的处理。三维数据解码装置取得包含编码数据和第1识别信息的比特流,编码数据是包含多个三维点的数据单元被编码后的编码数据,第1识别信息表示在上述数据单元的编码中是否将在该数据单元之前的数据单元的编码中使用的表进行初始化来使用(S12181)。三维数据编码装置使用与上述第1识别信息相应的表对上述编码数据进行解码(S12182)。上述表表示使用N叉树表现了三维点的位置信息的占用地图与索引的对应关系。上述编码数据包含被编码后的上述索引。三维数据解码装置在上述解码(S12182)中,通过导出在上述表中与通过对上述编码数据进行解码而得到的上述索引对应的占用地图,计算三维点的位置信息。
由此,能够使用对编码数据进行解码而得到的索引以及与第1识别信息相应的表来导出占用地图,所以能够使三维数据解码装置对比特流适当地进行解码。
例如,上述索引表示占用地图的产生次数及占用地图的产生频率中的某一个。
例如,在上述第1识别信息表示将上述表进行初始化的情况下,表示将之前的数据单元的上下文进行初始化来对上述多个三维点的多个属性信息进行编码;在表示不将上述表进行初始化的情况下,表示继续使用上述之前的数据单元的上下文来对上述多个属性信息进行编码。
例如,上述比特流还包含第2识别信息,该第2识别信息表示是否使用在上述多个数据单元之间使熵继续的功能。上述第1识别信息在上述第2识别信息表示使用在上述多个数据单元之间使熵继续的功能的情况下被示出。
例如,三维数据解码装置具备处理器和存储器,处理器使用存储器进行上述的处理。
(实施方式9)
在点群数据被分割为多个数据单元(切片)的情况下,在CABAC被初始化的情况下,对于各个数据单元,能够没有依存关系地分别独立地进行编码或解码。另一方面,在当前的数据单元(切片)的数据结构中,不支持将数据并行处理的功能。
所以,在预测树编码中,提供以处于每个数据单元(切片)的数据内的预测树的单位将上下文进行初始化的功能、通过添加向预测树的单位进行访问的信息而能够将数据单元(切片)内的多个数据单位进行并行处理的功能。
图101是表示按每个组分为切片而进行编码的情况下的三维点群的一例的图。图102是表示比特流的各种各样的结构的例子的图。
如图101所示,三维点群也可以被分割为多个数据单元11401~11404、11411~11413。此外,也可以是多个数据单元11401~11404、11411~11413中的多个数据单元11401~11404被分类为组1,多个数据单元11411~11413被分类为组2。
接着,使用图102说明切片与预测树的关系。
三维数据编码装置既可以如比特流1那样用1个预测树对1个切片的数据单元进行编码,也可以如比特流2那样用多个预测树对1个切片的数据单元进行编码。此外,例如在能够基于点群的特性等而对点群进行聚类、分组的情况下,三维数据编码装置也可以如比特流4那样按每个组分为切片进行编码,也可以如比特流3那样不分为切片而进行编码。在不将比特流分为切片进行编码的情况下,三维数据编码装置也可以将点群重排为使得成为按组的顺序,按每个组用预测树进行编码。
图103是用切片标志(slice_cabac_init_flag)表示是否将切片单位的CABAC初始化、用树标志(tree_cabac_init_flag)表示是否将切片内的tree单位的CABAC初始化的例子。另外,图103中的比特流1~4分别与图102所示的比特流1~4相同。
三维数据编码装置在各个处理单位的开头将CABAC初始化的情况下,将slice_cabac_init_flag或tree_cabac_init_flag设定为1,将被设定为1的slice_cabac_init_flag或tree_cabac_init_flag作为元数据进行传送。另外,被设定为1的slice_cabac_init_flag或tree_cabac_init_flag表示在各个处理单位的开头将CABAC初始化。slice_cabac_init_flag是用来以切片单位对CABAC的初始化进行控制的初始化标志。tree_cabac_init_flag是用来以树结构单位对CABAC的初始化进行控制的初始化标志。
三维数据解码装置对元数据进行解析,在slice_cabac_init_flag或tree_cabac_init_flag为1的情况下将CABAC初始化。在图103中,在tree_cabac_init_flag表示1的情况下或slice_cabac_init_flag表示1的情况下,表示CABAC被初始化,在tree_cabac_init_flag表示0的情况下或slice_cabac_init_flag表示0的情况下,表示不将CABAC初始化而上下文连续(即,将上下文继续使用)。
通过设定tree_cabac_init_flag,能够以预测树单位进行CABAC的初始化。通过设定tree_cabac_init_flag,能够进行任意的预测树开头处的复位,例如,tree_cabac_init_flag也可以被设定为,使得在每组的开头处将CABAC初始化。或者,tree_cabac_init_flag也可以被设定为,使得在预测树的编码参数变化的边界将CABAC初始化。另外,在按每个切片表示初始化标志的情况下,也可以不表示切片开头的树结构单位的初始化标志。
由于特定的组的预测表具有相互类似的特性,所以使CABAC继续时编码效率提高的可能性更高。因此,在比特流3中,初始化标志也可以被设定为,使得在各组的开头将CABAC初始化,以在相同的组中CABAC继续。
图104是用来说明以并行处理对多个预测树进行解码的方法的图。
在图104中,表示了在1个切片内在预测树1、2、5、7的开头将CABAC初始化的比特流。在这样的比特流中,三维数据解码装置能够将预测树1的解码处理、预测树2~4的解码处理、预测树5、6的解码处理和预测树7、8的解码处理分别独立地进行处理。三维数据解码装置为了进行并行处理,三维数据解码装置需要直接访问能够独立解码的数据单元的存储器的保存场所。因此,三维数据编码装置将编码数据的开头的偏移信息(表示保存场所的信息)包含在编码数据中。偏移信息例如是从切片开头起的字节信息等。在图104中,由偏移2表示的偏移信息是从切片开头到预测树2的编码数据为止的字节数。偏移信息既可以按每个预测树表示,也可以按每个能够独立处理的1个以上的预测树的单位表示。此外,也可以如偏移D_56那样,用相对于预测树6的紧前的预测树5的开头的差分的字节数表示。
图105是表示三维数据编码方法的一例的图。
三维数据编码装置按每个切片执行预测树编码(S11441)。
接着,三维数据编码装置生成预测树,执行每个预测树的熵编码(S11442)。
接着,三维数据编码装置判定是否在树结构(预测树)的开头使上下文继续(S11443)。
三维数据编码装置在判定为在树结构(预测树)的开头不使上下文继续的情况下(S11443中“否”),将上下文初始化,将tree_cabac_init_flag设定为1(S11444)。
接着,三维数据编码装置存储树结构的开头的偏移信息(表示保存场所的信息)(S11445)。
另一方面,三维数据编码装置在判定为在树结构(预测树)的开头使上下文继续的情况下(S11443中“是”),使上下文继续,将tree_cabac_init_flag设定为0(S11446)。
接着,三维数据编码装置通过规定的方法,将tree_cabac_init_flag及偏移信息中的至少tree_cabac_init_flag进行信号化(S11447)。
图106是表示三维数据解码方法的一例的图。
三维数据解码装置对tree_cabac_init_flag进行解析(S11451)。
接着,三维数据解码装置判定tree_cabac_init_flag是否表示在树结构(预测树)的开头使上下文继续(S11452)。
三维数据解码装置在tree_cabac_init_flag表示在树结构(预测树)的开头不使上下文继续的情况下(S11452中“否”),将上下文初始化,执行熵解码(S11453)。
三维数据解码装置在tree_cabac_init_flag表示在树结构(预测树)的开头使上下文继续的情况下(S11452中“是”),将上下文继续使用,执行熵解码(S11454)。
图107是表示在三维数据解码方法中进行并行解码的情况下的一例的图。
三维数据解码装置判定是否实施并行解码(S11461)。
三维数据解码装置在判定为实施并行解码的情况下(S11461中“是”),基于偏移信息对并行编码单位进行访问,将多个编码单位并行地解码(S11462)。
这样,三维数据编码装置通过将CABAC初始化而将树结构中的依存关系去除,能够独立地进行处理。此外,由于表示了树结构的开头的偏移信息,所以三维数据解码装置能够随机访问以多个预测树进行编码而得到的多个编码数据,所以能够独立地进行解码处理,能够并行地进行解码处理。此外,由于三维数据编码装置及三维数据解码装置基于tree_cabac_init_flag将CABAC初始化,所以能够使编码时和解码时的初始化的定时相同。
图108是表示在位置信息的数据中保存初始化标志的情况下的位置信息的数据单元的句法的一例的图。
在位置信息的数据单元中,预测树编码的编码数据也可以在每个三维点的循环内表示节点信息、例如预测模式(pred_mode)等。在pred_mode=0(直接模式)的情况下,表示该节点是根节点。根节点是预测树的开头的节点(三维点),在处理对象是根节点的情况下,也可以示出表示在该根节点中CABAC是否已被初始化的初始化标志(tree_cabac_init_flag)。另外,也可以不是初始化标志,而是用随机访问标志来表示CABAC是否已被初始化。例如,也可以在随机访问标志为ON的情况下,看作CABAC必定已被初始化。
图109是表示在位置信息的头中保存初始化标志及偏移信息的情况下的头的句法的一例的图。
初始化标志及偏移信息也可以一起表示在位置信息的数据单元头中。在位置信息的数据单元头中,既可以表示位置信息的数据单元中包含的预测树的数量(num_predtree_minus2),也可以表示每个预测树的tree_cabac_init_flag。此外,在tree_cabac_init_flag被设定为1的情况下,在数据单元头中表示偏移信息。偏移信息可以是从数据单元的开头的偏移(差分信息),也可以是从前面的预测树的开头的偏移(差分信息)。另外,也可以作为num_predtree_minus2而设定为在头中不包含开头的预测树的信息,也可以作为num_predtree_minus1而设定为在头中包含开头的预测树的信息。
图110是表示在位置信息的头中以随机访问单位保存初始化标志及偏移信息的情况的头的句法的一例的图。
num_rap表示能够并行解码(随机访问)的单位的数量。偏移信息也可以以能够并行解码的单位分别表示。另外,也可以不示出tree_cabac_init_flag,而在由该偏移信息表示的预测树的开头将CABAC初始化。
此外,也可以在位置信息的数据内按每个预测树表示识别符(tree_id),在该头中表示能够随机访问的预测树的识别符(tree_id)。这样,通过明示预测树的编号,能够判定(识别)预测树的顺序。
偏移信息需要表示在头中,tree_cabac_init_flag表示在数据、头的哪个中都可以。也可以将偏移信息表示在头中,将tree_cabac_init_flag表示在数据中。
另外,在将CABAC初始化的情况下,CABAC的初始值既可以设定为预先决定的值,也可以与cabac_init_flag或offset同样被信号化。
此外,关于属性信息,也能够通过使用与位置信息同样的方法来进行并行处理。也可以使用同样的信号化方法来表示初始化标志或偏移信息。初始化标志也可以包含在属性信息的头或数据中。
另外,能够并行解码的单位也可以在位置信息和属性信息中共同。在此情况下,属性信息的能够并行解码的单位的信息及初始化标志由于与位置信息是共同的,所以表示在位置信息的头中,属性信息中的偏移信息也可以表示在属性信息的头中。
(实施方式10)
接着,对本实施方式的三维数据制作装置810的构成进行说明。图111是表示本实施方式的三维数据制作装置810的构成例的框图。该三维数据制作装置810例如搭载于车辆。三维数据制作装置810与外部的交通监控云、前方车辆或后方车辆进行三维数据的收发,并且制作并积蓄三维数据。
三维数据制作装置810具备:数据接收部811、通信部812、接收控制部813、格式转换部814、多个传感器815、三维数据制作部816、三维数据合成部817、三维数据积蓄部818、通信部819、发送控制部820、格式转换部821、以及数据发送部822。
数据接收部811从交通监控云或前方车辆接收三维数据831。三维数据831例如包含包括本车辆的传感器815不能检测的区域的、点云、可见光影像、进深信息、传感器位置信息、或速度信息等的信息。
通信部812与交通监控云或前方车辆进行通信,将数据发送请求等发送给交通监控云或前方车辆。
接收控制部813经由通信部812,与通信方交换对应格式等信息,确立与通信方的通信。
格式转换部814通过对由数据接收部811接收的三维数据831进行格式转换等来生成三维数据832。并且,格式转换部814在三维数据831被压缩或编码了的情况下,进行解压缩或解码处理。
多个传感器815是LiDAR、可见光相机或红外线相机等的取得车辆的外部的信息的传感器群,生成传感器信息833。例如,在传感器815为LiDAR等激光传感器的情况下,传感器信息833是点云(点群数据)等三维数据。另外,传感器815也可以不是多个。
三维数据制作部816根据传感器信息833生成三维数据834。三维数据834例如包括点云、可见光影像、进深信息、传感器位置信息、或速度信息等的信息。
三维数据合成部817将交通监控云或前方车辆等制作的三维数据832与根据本车辆的传感器信息833而制作的三维数据834进行合成,从而能够构建将本车辆的传感器815不能检测的前方车辆的前方的空间也包括在内的三维数据835。
三维数据积蓄部818积蓄所生成的三维数据835等。
通信部819与交通监控云或后方车辆进行通信,将数据发送请求等发送给交通监控云或后方车辆。
发送控制部820经由通信部819,与通信方交换对应格式等信息,与通信方确立通信。并且,发送控制部820根据由三维数据合成部817生成的三维数据832的三维数据构建信息、以及来自通信方的数据发送请求,来决定作为发送对象的三维数据的空间的发送区域。
具体而言,发送控制部820按照来自交通监控云或后方车辆的数据发送请求,决定发送区域,该发送区域包括后方车辆的传感器不能检测的本车辆的前方的空间。并且,发送控制部820根据三维数据构建信息判断能够发送的空间或已发送空间的更新有无等,从而决定发送区域。例如,发送控制部820将由数据发送请求指定且存在对应的三维数据835的区域决定为发送区域。并且,发送控制部820将通信方所对应的格式、以及发送区域通知给格式转换部821。
格式转换部821通过将三维数据积蓄部818中积蓄的三维数据835中的发送区域的三维数据836转换为接收侧所对应的格式,来生成三维数据837。另外,格式转换部821也可以通过对三维数据837进行压缩或编码,来削减数据量。
数据发送部822将三维数据837发送到交通监控云或后方车辆。该三维数据837例如包含:包括成为后方车辆的死角的区域的、本车辆的前方的点云、可见光影像、进深信息、或传感器位置信息等的信息。
另外,在此以由格式转换部814以及821进行格式转换等为例进行了说明,但是也可以不进行格式转换。
通过此构成,三维数据制作装置810从外部取得通过本车辆的传感器815不能检测的区域的三维数据831,并通过对三维数据831与基于由本车辆的传感器815检测到的传感器信息833的三维数据834进行合成而生成三维数据835。由此,三维数据制作装置810能够生成通过本车辆的传感器815不能检测的范围的三维数据。
并且,三维数据制作装置810能够按照来自交通监控云或后方车辆的数据发送请求,将包括通过后方车辆的传感器不能检测的本车辆的前方的空间的三维数据发送给交通监控云或后方车辆等。
接着,对三维数据制作装置810中的对后方车辆发送三维数据的发送顺序进行说明。图112是表示由三维数据制作装置810向交通监控云或后方车辆发送三维数据的顺序的一个例子的流程图。
首先,三维数据制作装置810生成并更新包括本车辆的前方道路上的空间的空间的三维数据835(S801)。具体而言,三维数据制作装置810通过将交通监控云或前方车辆等制作的三维数据831与基于本车辆的传感器信息833制作的三维数据834进行合成等,构建将通过本车辆的传感器815不能检测的前方车辆的前方的空间也包括在内的三维数据835。
接着,三维数据制作装置810判断已发送的空间中包含的三维数据835是否发生了变化(S802)。
在由于车辆或人从外部进入到已发送的空间等而该空间中包含的三维数据835发生了变化的情况下(S802的“是”),三维数据制作装置810将包含发生了变化的空间的三维数据835的三维数据发送给交通监控云或后方车辆(S803)。
另外,三维数据制作装置810可以匹配于以规定的间隔发送三维数据的发送定时来发送发生了变化的空间的三维数据,但也可以在检测到变化后立即进行发送。即,三维数据制作装置810可以将发生了变化的空间的三维数据比以规定的间隔发送的三维数据优先发送。
并且,三维数据制作装置810也可以将发生了变化的空间的三维数据的全部作为发生了变化的空间的三维数据来发送,也可以仅发送三维数据的差分(例如出现或消失的三维点的信息、或三维点的位移信息等)。
并且,也可以是,三维数据制作装置810在发送发生了变化的空间的三维数据之前,先将紧急刹车警报等与本车辆的危险回避动作有关的元数据发送给后方车辆。由此,后方车辆能够提早确认到前方车辆的紧急刹车等,能够尽快地开始减速等危险回避动作。
在已发送的空间中包含的三维数据835没有发生变化的情况下(S802的“否”)或步骤S803之后,三维数据制作装置810将位于本车辆的前方距离L上的规定的形状的空间中包含的三维数据发送给交通监控云或后方车辆(S804)。
并且,例如步骤S801~S804的处理以规定的时间间隔反复执行。
并且,三维数据制作装置810在当前的发送对象的空间的三维数据835与三维地图之间没有差异的情况下,也可以不发送空间的三维数据837。
在本实施方式中,客户端装置向服务器或其他客户端装置发送由传感器得到的传感器信息。
首先,对本实施方式的系统的构成进行说明。图113是表示本实施方式的三维地图以及传感器信息的收发系统的构成的图。该系统包括服务器901、客户端装置902A以及902B。另外,在不对客户端装置902A以及902B进行特殊区分的情况下,也记作客户端装置902。
客户端装置902例如是被搭载在车辆等移动体的车载设备。服务器901例如是交通监控云等,能够与多个客户端装置902进行通信。
服务器901向客户端装置902发送由点云构成的三维地图。另外,三维地图的构成并非受点云所限,也可以通过网格结构等其他的三维数据来表现。
客户端装置902向服务器901发送由客户端装置902获得的传感器信息。传感器信息例如至少包括LiDAR获得信息、可见光图像、红外图像、深度图像、传感器位置信息以及速度信息之中的一个。
关于在服务器901与客户端装置902之间收发的数据,在想要减少数据的情况下可以被压缩,在想要维持数据的精确度的情况下可以不进行压缩。在对数据进行压缩的情况下,在点云中例如能够采用基于八叉树的三维压缩方式。并且,在可见光图像、红外图像、以及深度图像中可以采用二维的图像压缩方式。二维的图像压缩方式例如是以MPEG标准化的MPEG-4AVC或HEVC等。
并且,服务器901按照来自客户端装置902的三维地图的发送请求,将在服务器901进行管理的三维地图发送到客户端装置902。另外,服务器901也可以不等待来自客户端装置902的三维地图的发送请求,就对三维地图进行发送。例如,服务器901也可以将三维地图广播到预先规定的空间中的一个以上的客户端装置902。并且,服务器901也可以向接受过一次发送请求的客户端装置902,每隔一定的时间发送适于客户端装置902的位置的三维地图。并且,服务器901也可以在每当服务器901所管理的三维地图被更新时,向客户端装置902发送三维地图。
客户端装置902向服务器901发出三维地图的发送请求。例如,在客户端装置902在行驶时想要进行自身位置估计的情况下,客户端装置902将三维地图的发送请求发送到服务器901。
另外,在以下的情况下,客户端装置902也可以向服务器901发出三维地图的发送请求。在客户端装置902所持有的三维地图比较旧的情况下,客户端装置902也可以向服务器901发出三维地图的发送请求。例如,在客户端装置902获得三维地图并经过了一定期间的情况下,客户端装置902也可以向服务器901发出三维地图的发送请求。
也可以是,在客户端装置902将要从客户端装置902所保持的三维地图所示的空间出来的一定时刻之前,客户端装置902向服务器901发出三维地图的发送请求。例如也可以是,在客户端装置902存在于从客户端装置902所保持的三维地图所示的空间的边界预先规定的距离以内的情况下,客户端装置902向服务器901发出三维地图的发送请求。并且,在掌握到客户端装置902的移动路径以及移动速度的情况下,可以根据掌握到的移动路径和移动速度,来预测客户端装置902从客户端装置902所保持的三维地图示出的空间出来的时刻。
在客户端装置902根据传感器信息制作的三维数据与三维地图的位置对照时的误差在一定范围以上时,客户端装置902可以向服务器901发出三维地图的发送请求。
客户端装置902按照从服务器901发送来的传感器信息的发送请求,将传感器信息发送到服务器901。另外,客户端装置902也可以不等待来自服务器901的传感器信息的发送请求,就将传感器信息发送到服务器901。例如,客户端装置902在从服务器901得到过一次传感器信息的发送请求的情况下,可以在一定的期间之中,定期地将传感器信息发送到服务器901。并且也可以是,在客户端装置902根据传感器信息制作的三维数据、与从服务器901得到的三维地图的位置对照时的误差为一定范围以上的情况下,客户端装置902判断在客户端装置902的周边的三维地图有发生变化的可能性,并将这一判断结果和传感器信息一起发送到服务器901。
服务器901向客户端装置902发出传感器信息的发送请求。例如,服务器901从客户端装置902接收GPS等客户端装置902的位置信息。服务器901根据客户端装置902的位置信息,在判断为客户端装置902接近到服务器901所管理的三维地图中信息少的空间的情况下,为了重新生成三维地图,而将传感器信息的发送请求发出到客户端装置902。并且也可以是,服务器901在想要更新三维地图的情况、在想要确认积雪时或灾害时等道路状况的情况、在想要确认堵塞状况或事件事故状况等情况下,也可以发出传感器信息的发送请求。
并且也可以是,客户端装置902按照从服务器901接受的传感器信息的发送请求的接收时的通信状态或频带,来设定发送到服务器901的传感器信息的数据量。对发送到服务器901的传感器信息的数据量进行设定例如是指,对该数据本身进行增减、或者选择适宜的压缩方式。
图114是表示客户端装置902的构成例的框图。客户端装置902从服务器901接收以点云等构成的三维地图,根据基于客户端装置902的传感器信息而制作的三维数据,来估计客户端装置902的自身位置。并且,客户端装置902将获得的传感器信息发送到服务器901。
客户端装置902具备:数据接收部1011、通信部1012、接收控制部1013、格式转换部1014、多个传感器1015、三维数据制作部1016、三维图像处理部1017、三维数据积蓄部1018、格式转换部1019、通信部1020、发送控制部1021、以及数据发送部1022。
数据接收部1011从服务器901接收三维地图721。三维地图721是包括WLD或SWLD等点云的数据。三维地图721也可以包括压缩数据、以及非压缩数据的任一方。
通信部1012与服务器901进行通信,将数据发送请求(例如,三维地图的发送请求)等发送到服务器901。
接收控制部1013经由通信部1012,与通信对方交换对应格式等信息,确立与通信对方的通信。
格式转换部1014通过对数据接收部1011所接收的三维地图721进行格式转换等,来生成三维地图722。并且,格式转换部1014在三维地图721被压缩或编码的情况下,进行解压缩或解码处理。另外,格式转换部1014在三维地图721为非压缩数据的情况下,不进行解压缩或解码处理。
多个传感器1015是LiDAR、可见光相机、红外线相机、或深度传感器等客户端装置902所搭载的用于获得车辆的外部的信息的传感器群,生成传感器信息1033。例如,在传感器1015为LiDAR等激光传感器的情况下,传感器信息1033是点云(点群数据)等三维数据。另外,传感器1015也可以不是多个。
三维数据制作部1016根据传感器信息1033,制作本车辆的周边的三维数据1034。例如,三维数据制作部1016利用由LiDAR获得的信息、以及由可见光相机得到的可见光影像,来制作本车辆的周边的具有颜色信息的点云数据。
三维图像处理部1017利用接收的点云等三维地图722、以及根据传感器信息1033生成的本车辆的周边的三维数据1034,来进行本车辆的自身位置估计处理等。另外,也可以是,三维图像处理部1017对三维地图722与三维数据1034进行合成,来制作本车辆的周边的三维数据1035,利用制作的三维数据1035,来进行自身位置估计处理。
三维数据积蓄部1018对三维地图722、三维数据1034以及三维数据1035等进行积蓄。
格式转换部1019通过将传感器信息1033转换为接收侧所对应的格式,来生成传感器信息1037。另外,格式转换部1019可以通过对传感器信息1037进行压缩或编码来减少数据量。并且,在不需要格式转换的情况下,格式转换部1019可以省略处理。并且,格式转换部1019可以对按照发送范围的指定来发送的数据量进行控制。
通信部1020与服务器901进行通信,从服务器901接收数据发送请求(传感器信息的发送请求)等。
发送控制部1021经由通信部1020,与通信对方交换对应格式等信息,从而确立通信。
数据发送部1022将传感器信息1037发送到服务器901。传感器信息1037例如包括通过LiDAR获得的信息、通过可见光相机获得的亮度图像(可见光图像)、通过红外线相机获得的红外图像、通过深度传感器获得的深度图像、传感器位置信息、以及速度信息等由多个传感器1015获得的信息。
接着,对服务器901的结构进行说明。图115是示出服务器901的构成例的框图。服务器901接收从客户端装置902发送来的传感器信息,根据接收的传感器信息,来制作三维数据。服务器901利用制作的三维数据,对服务器901管理的三维地图进行更新。并且,服务器901按照来自客户端装置902的三维地图的发送请求,将更新的三维地图发送到客户端装置902。
服务器901具备:数据接收部1111、通信部1112、接收控制部1113、格式转换部1114、三维数据制作部1116、三维数据合成部1117、三维数据积蓄部1118、格式转换部1119、通信部1120、发送控制部1121、以及数据发送部1122。
数据接收部1111从客户端装置902接收传感器信息1037。传感器信息1037例如包括通过LiDAR获得的信息、通过可见光相机获得的亮度图像(可见光图像)、通过红外线相机获得的红外图像、通过深度传感器获得的深度图像、传感器位置信息、以及速度信息等。
通信部1112与客户端装置902进行通信,将数据发送请求(例如,传感器信息的发送请求)等发送到客户端装置902。
接收控制部1113经由通信部1112,与通信对方交换对应格式等信息,从而确立通信。
格式转换部1114在接收的传感器信息1037被压缩或编码的情况下,通过进行解压缩或解码处理,来生成传感器信息1132。另外,在传感器信息1037是非压缩数据的情况下,格式转换部1114不进行解压缩或解码处理。
三维数据制作部1116根据传感器信息1132,制作客户端装置902的周边的三维数据1134。例如,三维数据制作部1116利用通过LiDAR获得的信息、以及通过可见光相机得到的可见光影像,来制作客户端装置902的周边具有颜色信息的点云数据。
三维数据合成部1117将基于传感器信息1132而制作的三维数据1134,与服务器901管理的三维地图1135进行合成,据此来更新三维地图1135。
三维数据积蓄部1118对三维地图1135等进行积蓄。
格式转换部1119通过将三维地图1135转换为接收侧对应的格式,来生成三维地图721。另外,格式转换部1119也可以通过对三维地图1135进行压缩或编码,来减少数据量。并且,在不需要格式转换的情况下,格式转换部1119也可以省略处理。并且,格式转换部1119可以对按照发送范围的指定来发送的数据量进行控制。
通信部1120与客户端装置902进行通信,从客户端装置902接收数据发送请求(三维地图的发送请求)等。
发送控制部1121经由通信部1120,与通信对方交换对应格式等信息,从而确立通信。
数据发送部1122将三维地图721发送到客户端装置902。三维地图721是包括WLD或SWLD等点云的数据。在三维地图721中也可以包括压缩数据以及非压缩数据的任一方。
接着,对客户端装置902的工作流程进行说明。图116是示出客户端装置902进行的三维地图获得时的工作的流程图。
首先,客户端装置902向服务器901请求三维地图(点云等)的发送(S1001)。此时,客户端装置902也将通过GPS等得到的客户端装置902的位置信息一起发送,据此,可以向服务器901请求与该位置信息相关的三维地图的发送。
接着,客户端装置902从服务器901接收三维地图(S1002)。若接收的三维地图是压缩数据,客户端装置902对接收的三维地图进行解码,生成非压缩的三维地图(S1003)。
接着,客户端装置902根据从多个传感器1015得到的传感器信息1033,来制作客户端装置902的周边的三维数据1034(S1004)。接着,客户端装置902利用从服务器901接收的三维地图722、以及根据传感器信息1033制作的三维数据1034,来估计客户端装置902的自身位置(S1005)。
图117是示出客户端装置902进行的传感器信息的发送时的工作的流程图。首先,客户端装置902从服务器901接收传感器信息的发送请求(S1011)。接收了发送请求的客户端装置902将传感器信息1037发送到服务器901(S1012)。另外,在传感器信息1033包括通过多个传感器1015得到的多个信息的情况下,客户端装置902针对各信息,以适于各信息的压缩方式来进行压缩,从而生成传感器信息1037。
接着,对服务器901的工作流程进行说明。图118是示出服务器901进行传感器信息的获得时的工作的流程图。首先,服务器901向客户端装置902请求传感器信息的发送(S1021)。接着,服务器901接收按照该请求而从客户端装置902发送的传感器信息1037(S1022)。接着,服务器901利用接收的传感器信息1037,来制作三维数据1134(S1023)。接着,服务器901将制作的三维数据1134反映到三维地图1135(S1024)。
图119是示出服务器901进行的三维地图的发送时的工作的流程图。首先,服务器901从客户端装置902接收三维地图的发送请求(S1031)。接收了三维地图的发送请求的服务器901向客户端装置902发送三维地图1151(S1032)。此时,服务器901可以与客户端装置902的位置信息相对应地提取其附近的三维地图,并发送提取的三维地图。并且可以是,服务器901针对由点云构成的三维地图,例如利用通过八叉树的压缩方式等来进行压缩,并发送压缩后的三维地图。
以下,对本实施方式的变形例进行说明。
服务器901利用从客户端装置902接收的传感器信息1037,来制作客户端装置902的位置附近的三维数据1134。接着,服务器901对制作的三维数据1134、与服务器901所管理的相同区域的三维地图1135进行匹配,算出三维数据1134与三维地图1135的差分。服务器901在差分为预先决定的阈值以上的情况下,判断在客户端装置902的周边发生了某种异常。例如,在因地震等自然灾害而发生了地表下沉等时,可以考虑到在服务器901所管理的三维地图1135、与基于传感器信息1037而制作的三维数据1134之间会产生较大的差。
传感器信息1037也可以包括传感器的种类、传感器的性能、以及传感器的型号之中的至少一个。并且也可以是,传感器信息1037中被附加与传感器的性能相对应的类别ID等。例如,在传感器信息1037是由LiDAR获得的信息的情况下,可以考虑到针对传感器的性能来分配标识符,例如,针对能够以几mm单位的精确度来获得信息的传感器分配类别1、针对能够以几cm单位的精确度来获得信息的传感器分配类别2、针对能够以几m单位的精确度来获得信息的传感器分配类别3。并且,服务器901也可以从客户端装置902的型号来估计传感器的性能信息等。例如,在客户端装置902搭载于车辆的情况下,服务器901可以根据该车辆的车型来判断传感器的标准信息。在这种情况下,服务器901可以事前获得车辆的车型的信息,也可以使该信息包括在传感器信息中。并且也可以是,服务器901利用获得的传感器信息1037,来切换针对利用传感器信息1037而制作的三维数据1134的校正的程度。例如,在传感器性能为高精确度(类别1)的情况下,服务器901不进行针对三维数据1134的校正。在传感器性能为低精确度(类别3)的情况下,服务器901将适于传感器的精确度的校正适用到三维数据1134。例如,服务器901在传感器的精确度越低的情况下就越增强校正的程度(强度)。
服务器901也可以向存在于某个空间的多个客户端装置902同时发出传感器信息的发送请求。服务器901在从多个客户端装置902接收到多个传感器信息的情况下,没有必要将所有的传感器信息都利用到三维数据1134的制作,例如可以按照传感器的性能,来选择将要利用的传感器信息。例如,服务器901在对三维地图1135进行更新的情况下,可以从接收的多个传感器信息中选择高精确度的传感器信息(类别1),利用选择的传感器信息来制作三维数据1134。
服务器901并非受交通监控云等服务器所限,也可以是其他的客户端装置(车载)。图120示出了这种情况下的系统结构。
例如,客户端装置902C向附近存在的客户端装置902A发出传感器信息的发送请求,并从客户端装置902A获得传感器信息。于是,客户端装置902C利用获得的客户端装置902A的传感器信息,来制作三维数据,并更新对客户端装置902C的三维地图进行更新。这样,客户端装置902C能够活用客户端装置902C的性能,来生成能够从客户端装置902A获得的空间的三维地图。例如,在客户端装置902C的性能高的情况下,可以考虑发生这种情况。
并且,在这种情况下,提供了传感器信息的客户端装置902A被给予获得由客户端装置902C生成的高精确度的三维地图的权利。客户端装置902A按照该权利,从客户端装置902C接收高精确度的三维地图。
并且也可以是,客户端装置902C向附近存在的多个客户端装置902(客户端装置902A以及客户端装置902B)发出传感器信息的发送请求。在客户端装置902A或客户端装置902B的传感器为高性能的情况下,客户端装置902C能够利用通过该高性能的传感器得到的传感器信息来制作三维数据。
图121是示出服务器901以及客户端装置902的功能构成的框图。服务器901例如具备:对三维地图进行压缩以及解码的三维地图压缩/解码处理部1201、对传感器信息进行压缩以及解码的传感器信息压缩/解码处理部1202。
客户端装置902具备:三维地图解码处理部1211、以及传感器信息压缩处理部1212。三维地图解码处理部1211接收压缩后的三维地图的编码数据,对编码数据进行解码并获得三维地图。传感器信息压缩处理部1212不对通过获得的传感器信息而制作的三维数据进行压缩,而是对传感器信息本身进行压缩,将压缩后的传感器信息的编码数据发送到服务器901。根据此构成,客户端装置902可以将用于对三维地图(点云等)进行解码处理的处理部(装置或LSI)保持在内部,而不必将用于对三维地图(点云等)的三维数据进行压缩处理的处理部保持在内部。这样,能够抑制客户端装置902的成本以及耗电量等。
如以上所述,本实施方式所涉及的客户端装置902被搭载在移动体,根据通过被搭载在移动体的传感器1015得到的、示出移动体的周边状况的传感器信息1033,来制作移动体的周边的三维数据1034。客户端装置902利用制作的三维数据1034,来估计移动体的自身位置。客户端装置902将获得的传感器信息1033发送到服务器901或者其他的客户端装置902。
据此,客户端装置902将传感器信息1033发送到服务器901等。这样,与发送三维数据的情况相比,将会有能够减少发送数据的数据量的可能性。并且,由于没有必要在客户端装置902执行三维数据的压缩或编码等处理,因此能够减少客户端装置902的处理的量。因此,客户端装置902能够实现传输的数据量的减少或装置的构成的简略化。
并且,客户端装置902进一步向服务器901发送三维地图的发送请求,从服务器901接收三维地图721。客户端装置902在自身位置的估计中,利用三维数据1034和三维地图722,来对自身位置进行估计。
并且,传感器信息1033至少包括通过激光传感器得到的信息、亮度图像(可见光图像)、红外图像、深度图像、传感器的位置信息、以及传感器的速度信息之中的一个。
并且,传感器信息1033包括示出传感器的性能的信息。
并且,客户端装置902对传感器信息1033进行编码或压缩,在传感器信息的发送中,将编码或压缩后的传感器信息1037发送到服务器901或者其他的客户端装置902。据此,客户端装置902能够减少传输的数据量。
例如,客户端装置902具备处理器以及存储器,处理器利用存储器进行上述的处理。
并且,本实施方式所涉及的服务器901能够与搭载在移动体的客户端装置902进行通信,从客户端装置902接收通过被搭载在移动体的传感器1015得到的、示出移动体的周边状况的传感器信息1037。服务器901根据接收的传感器信息1037,来制作移动体的周边的三维数据1134。
据此,服务器901利用从客户端装置902发送来的传感器信息1037,来制作三维数据1134。这样,与客户端装置902发送三维数据的情况相比,将会有能够减少发送数据的数据量的可能性。并且,由于可以不必在客户端装置902进行三维数据的压缩或编码等处理,因此能够减少客户端装置902的处理量。这样,服务器901能够实现传输的数据量的减少、或装置的构成的简略化。
并且,服务器901进一步向客户端装置902发送传感器信息的发送请求。
并且,服务器901进一步利用制作的三维数据1134,来更新三维地图1135,按照来自客户端装置902的三维地图1135的发送请求,将三维地图1135发送到客户端装置902。
并且,传感器信息1037至少包括通过激光传感器得到的信息、亮度图像(可见光图像)、红外图像、深度图像、传感器的位置信息、以及传感器的速度信息之中的一个。
并且,传感器信息1037包括示出传感器的性能的信息。
并且,服务器901进一步按照传感器的性能,对三维数据进行校正。据此,该三维数据制作方法能够提高三维数据的品质。
并且,服务器901在传感器信息的接收中,从多个客户端装置902接收多个传感器信息1037,根据多个传感器信息1037中包括的示出传感器的性能的多个信息,来选择三维数据1134的制作中使用的传感器信息1037。据此,服务器901能够提高三维数据1134的品质。
并且,服务器901对接收的传感器信息1037进行解码或解压缩,根据解码或解压缩后的传感器信息1132,制作三维数据1134。据此,服务器901能够减少传输的数据量。
例如,服务器901具备处理器和存储器,处理器利用存储器进行上述的处理。
以下,对变形例进行说明。图122是表示本实施方式的系统的构成的图。图122所示的系统包括服务器2001、客户端装置2002A和客户端装置2002B。
客户端装置2002A及客户端装置2002B被搭载于车辆等移动体,将传感器信息向服务器2001发送。服务器2001将三维地图(点云)向客户端装置2002A及客户端装置2002B发送。
客户端装置2002A具备传感器信息获得部2011、存储部2012和数据发送可否判定部2013。另外,客户端装置2002B的结构也是同样的。此外,以下在将客户端装置2002A和客户端装置2002B不特别区分的情况下,也记作客户端装置2002。
图123是表示本实施方式所涉及的客户端装置2002的动作的流程图。
传感器信息获得部2011利用搭载于移动体的传感器(传感器群)获得各种传感器信息。即,传感器信息获得部2011获得由搭载于移动体的传感器(传感器群)得到的、表示移动体的周边状况的传感器信息。此外,传感器信息获得部2011将所获得的传感器信息向存储部2012存储。该传感器信息包括LiDAR获得信息、可视光图像、红外图像及深度图像中的至少一个。此外,传感器信息也可以包括传感器位置信息、速度信息、获得时刻信息及获得场所信息中的至少一个。传感器位置信息表示获得了传感器信息的传感器的位置。速度信息表示传感器获得了传感器信息时的移动体的速度。获得时刻信息表示传感器信息被传感器获得的时刻。获得场所信息表示传感器信息被传感器获得时的移动体或传感器的位置。
接着,数据发送可否判定部2013判定移动体(客户端装置2002)是否存在于能够向服务器2001发送传感器信息的环境中(S2002)。例如,数据发送可否判定部2013也可以使用GPS等信息,确定客户端装置2002所处的场所及时刻,判定是否能够发送数据。此外,数据发送可否判定部2013也可以通过是否能够连接到特定的接入点,来判定是否能够发送数据。
客户端装置2002在判定为移动体存在于能够向服务器2001发送传感器信息的环境中的情况下(S2002中“是”),将传感器信息向服务器2001发送(S2003)。即,在客户端装置2002成为能够将传感器信息向服务器2001发送那样的状况的时间点,客户端装置2002将所保持的传感器信息向服务器2001发送。例如,在交叉口等设置能够进行高速通信的毫米波的接入点。客户端装置2002在进入到交叉口内的时间点,利用毫米波通信将客户端装置2002所保持的传感器信息高速地发送给服务器2001。
接着,客户端装置2002将已发送给服务器2001的传感器信息从存储部2012删除(S2004)。另外,客户端装置2002也可以在没有向服务器2001发送的传感器信息满足规定的条件的情况下将该传感器信息删除。例如,客户端装置2002也可以在所保持的传感器信息的获得时刻比从当前时刻起一定时刻前更早的时间点,将该传感器信息从存储部2012删除。即,客户端装置2002也可以在传感器信息被传感器获得的时刻与当前时刻的差超过了预先设定的时间的情况下,将传感器信息从存储部2012删除。此外,客户端装置2002也可以在所保持的传感器信息的获得场所距当前地点的距离比一定距离远的时间点,将该传感器信息从存储部2012删除。即,客户端装置2002也可以在传感器信息被传感器获得时的移动体或传感器的位置与移动体或传感器的当前位置的差超过了预先设定的距离的情况下,将传感器信息从存储部2012删除。由此,能够抑制客户端装置2002的存储部2012的容量。
在由客户端装置2002进行的传感器信息的获得没有结束的情况下(S2005中“否”),客户端装置2002再次进行步骤S2001以后的处理。此外,在由客户端装置2002进行的传感器信息的获得结束的情况下(S2005中“是”),客户端装置2002结束处理。
此外,客户端装置2002也可以匹配于通信状况来选择向服务器2001发送的传感器信息。例如,客户端装置2002在能够高速通信的情况下,将向存储部2012保持的尺寸大的传感器信息(例如LiDAR获得信息等)优先发送。此外,客户端装置2002在难以高速通信的情况下,发送向存储部2012保持的尺寸小且优先级高的传感器信息(例如可视光图像)。由此,客户端装置2002能够将保持在存储部2012中的传感器信息根据网络的状况有效地发送给服务器2001。
此外,客户端装置2002也可以从服务器2001获得表示上述当前时刻的时刻信息及表示当前地点的场所信息。此外,客户端装置2002也可以基于所获得的时刻信息及场所信息,决定传感器信息的获得时刻及获得场所。即,客户端装置2002也可以从服务器2001获得时刻信息,使用所获得的时刻信息,生成获得时刻信息。此外,客户端装置2002也可以从服务器2001获得场所信息,使用所获得的场所信息,生成获得场所信息。
例如关于时刻信息,服务器2001和客户端装置2002利用NTP(Network TimeProtocol:网络时间协议)或PTP(Precision Time Protocol:高精度时间同步协议)等的机制进行时刻同步。由此,客户端装置2002能够获得正确的时刻信息。此外,由于能够在服务器2001与多个客户端装置之间使时刻同步,所以能够使不同客户端装置2002获得的传感器信息内的时刻同步。因此,服务器2001能够处置表示被同步后的时刻的传感器信息。另外,时刻同步的机制也可以是NTP或PTP以外的任何方法。此外,作为上述时刻信息及场所信息,也可以使用GPS的信息。
服务器2001也可以指定时刻或场所来从多个客户端装置2002获得传感器信息。例如在发生了某种事故的情况下,为了寻找处于其附近的客户端,服务器2001指定事故发生时刻和场所,向多个客户端装置2002广播发送传感器信息发送请求。并且,具有相应的时刻和场所的传感器信息的客户端装置2002向服务器2001发送传感器信息。即,客户端装置2002从服务器2001接收包含指定场所及时刻的指定信息的传感器信息发送请求。客户端装置2002在存储部2012中存储有在由指定信息表示的场所及时刻得到的传感器信息、并且判定为移动体存在于能够向服务器2001发送传感器信息的环境中的情况下,将在由指定信息表示的场所及时刻得到的传感器信息向服务器2001发送。由此,服务器2001能够从多个客户端装置2002获得与事故的发生关联的传感器信息,用于事故解析等。
另外,客户端装置2002在接收到来自服务器2001的传感器信息发送请求的情况下,也可以拒绝传感器信息的发送。此外,也可以事前由客户端装置2002设定在多个传感器信息之中能够发送哪个传感器信息。或者,服务器2001也可以每次向客户端装置2002询问能否发送传感器信息。
此外,对于向服务器2001发送了传感器信息的客户端装置2002,也可以赋予得分。该得分例如可以用于汽油购买费、EV(Electric Vehicle,电动汽车)的充电费、高速道路的通行费或租车费用等的支付。此外,服务器2001也可以在获得传感器信息之后,将用来确定传感器信息的发送源的客户端装置2002的信息删除。例如,该信息是客户端装置2002的网络地址等信息。由此,能够使传感器信息匿名化,所以客户端装置2002的用户能够安心地将传感器信息从客户端装置2002向服务器2001发送。此外,服务器2001也可以由多个服务器构成。例如通过由多个服务器共用传感器信息,即使某个服务器故障,其他的服务器也能够与客户端装置2002通信。由此,能够避免因服务器故障造成的服务的停止。
此外,由传感器信息发送请求指定的指定场所表示事故的发生位置等,有时与由传感器信息发送请求指定的指定时刻的客户端装置2002的位置不同。因此,服务器2001例如能够通过作为指定场所而指定周边XXm以内等的范围,来对存在于该范围内的客户端装置2002请求信息获得。关于指定时刻也同样,服务器2001也可以指定从某时刻起前后N秒以内等范围。由此,服务器2001能够从“在时刻:t-N至t+N”存在于“场所:距绝对位置S在XXm以内”的客户端装置2002获得传感器信息。客户端装置2002也可以在发送LiDAR等的三维数据时,发送在时刻t的紧接着之后生成的数据。
此外,服务器2001也可以将表示作为传感器信息获得对象的客户端装置2002的场所的信息、和想得到传感器信息的场所分别分开指定为指定场所。例如,服务器2001指定从存在于距绝对位置S在XXm以内的客户端装置2002获得至少包括距绝对位置S为YYm的范围的传感器信息。客户端装置2002在选择要发送的三维数据时,以至少包含被指定的范围的传感器信息的方式选择1个以上的可随机访问的单位的三维数据。此外,客户端装置2002在发送可视光图像时,也可以发送至少包含时刻t的紧接着之前或紧接着之后的帧的、在时间上连续的多个图像数据。
在客户端装置2002在传感器信息的发送中能够利用5G或WiFi、或5G的多个模式等多个物理网络的情况下,客户端装置2002也可以按照从服务器2001通知的优先顺序来选择要利用的网络。或者,也可以是客户端装置2002自身基于发送数据的尺寸来选择能够确保适当的带宽的网络。或者,客户端装置2002也可以基于在数据发送中花费的费用等来选择要利用的网络。此外,在来自服务器2001的发送请求中,也可以包含客户端装置2002在时刻T之前能够开始发送的情况下进行发送等表示发送期限的信息。服务器2001如果在期限内不能获得足够的传感器信息,则也可以再次发布发送请求。
传感器信息也可以与压缩或非压缩的传感器数据一起包含表示传感器数据的特性的头信息。客户端装置2002也可以将头信息经由与传感器数据不同的物理网络或通信协议发送给服务器2001。例如,客户端装置2002也可以在传感器数据的发送之前将头信息发送给服务器2001。服务器2001基于头信息的解析结果,判断是否获得客户端装置2002的传感器数据。例如,头信息也可以包含表示LiDAR的点群获得密度、仰角、或帧速率,或者可视光图像的分辨率、SN比或帧速率等的信息。由此,服务器2001能够从具有所决定的品质的传感器数据的客户端装置2002获得传感器信息。
如以上这样,客户端装置2002被搭载于移动体,获得由搭载于移动体的传感器得到的、表示移动体的周边状况的传感器信息,并将传感器信息存储到存储部2012中。客户端装置2002判定移动体是否存在于能够向服务器2001发送传感器信息的环境中,在判定为移动体存在于能够向服务器发送传感器信息的环境中的情况下,将传感器信息发送给服务器2001。
此外,客户端装置2002进一步,根据传感器信息制作移动体的周边的三维数据,使用制作出的三维数据估计移动体的自身位置。
此外,客户端装置2002进一步,向服务器2001发送三维地图的发送请求,从服务器2001接收三维地图。客户端装置2002在自身位置的估计中,利用三维数据和三维地图来估计自身位置。
另外,由上述客户端装置2002进行的处理也可以作为客户端装置2002中的信息发送方法实现。
此外,客户端装置2002也可以具备处理器和存储器,处理器使用存储器进行上述的处理。
接着,对本实施方式所涉及的传感器信息收集系统进行说明。图124是表示本实施方式所涉及的传感器信息收集系统的结构的图。如图124所示,本实施方式所涉及的传感器信息收集系统包括终端2021A、终端2021B、通信装置2022A、通信装置2022B、网络2023、数据收集服务器2024、地图服务器2025和客户端装置2026。另外,在将终端2021A及终端2021B不特别区分的情况下,也记作终端2021。在将通信装置2022A及通信装置2022B不特别区分的情况下,也记作通信装置2022。
数据收集服务器2024将由终端2021所具备的传感器得到的传感器数据等数据作为与三维空间中的位置建立了对应的位置关联数据而收集。
传感器数据例如指的是使用终端2021具备的传感器获得了终端2021的周围的状态或终端2021的内部的状态等的数据。终端2021将从处于能够与终端2021直接通信、或者通过相同的通信方式将一个或多个中继装置进行中继而能够通信的位置的一个或多个传感器设备收集到的传感器数据发送给数据收集服务器2024。
位置关联数据中包含的数据例如也可以包含表示终端自身或终端所具备的设备的动作状态、动作日志、服务的利用状况等的信息。此外,位置关联数据中包含的数据也可以包含将终端2021的标识符与终端2021的位置或移动路径等建立了对应的信息等。
位置关联数据中包含的表示位置的信息与例如三维地图数据等三维数据中的表示位置的信息建立了对应。关于表示位置的信息的详细情况在后面叙述。
位置关联数据除了作为表示位置的信息的位置信息以外,也可以还包含所述的时刻信息、和表示位置关联数据中包含的数据的属性或生成该数据的传感器的种类(例如型号等)的信息中的至少一个。位置信息及时刻信息也可以被保存在位置关联数据的头区域或保存位置关联数据的帧的头区域中。此外,位置信息及时刻信息也可以作为与位置关联数据建立了对应的元数据而与位置关联数据分开地发送及/或保存。
地图服务器2025例如连接于网络2023,根据来自终端2021等其他装置的请求而发送三维地图数据等三维数据。此外,如在所述的各实施方式中说明那样,地图服务器2025也可以具备利用从终端2021发送的传感器信息将三维数据更新的功能等。
数据收集服务器2024例如连接于网络2023,从终端2021等其他装置收集位置关联数据,将收集到的位置关联数据保存到内部或其他服务器内的存储装置中。此外,数据收集服务器2024将收集到的位置关联数据或基于位置关联数据而生成的三维地图数据的元数据等,按照来自终端2021的请求而对终端2021发送。
网络2023是例如因特网等的通信网络。终端2021经由通信装置2022连接于网络2023。通信装置2022通过一个通信方式或一边切换多个通信方式一边与终端2021进行通信。通信装置2022例如是(1)LTE(Long Term Evolution,长期演进)等的基站,(2)WiFi或毫米波通信等的接入点(AP),(3)SIGFOX、LoRaWAN或Wi-SUN等的LPWA(Low Power Wide Area低功耗广域)网的网关,或(4)使用DVB-S2等的卫星通信方式进行通信的通信卫星。
另外,基站既可以通过被分类为NB-IoT(Narrow Band-IoT:窄带物联网)或LTE-M等的LPWA的方式进行与终端2021的通信,也可以一边切换这些方式一边进行与终端2021的通信。
这里,举出了终端2021具备与使用两种通信方式的通信装置2022进行通信的功能,使用这些通信方式中的某一个、或一边切换这些多个通信方式及作为直接的通信对方的通信装置2022一边与地图服务器2025或数据收集服务器2024进行通信的情况为例,但传感器信息收集系统及终端2021的结构并不限于此。例如,终端2021也可以不具有多个通信方式下的通信功能,而具备以某一个通信方式进行通信的功能。此外,终端2021也可以对应于3个以上的通信方式。此外,也可以按每个终端2021,对应的通信方式不同。
终端2021例如具备图114所示的客户端装置902的结构。终端2021使用接收到的三维数据进行自身位置等的位置估计。此外,终端2021将从传感器获得的传感器数据与由位置估计的处理得到的位置信息建立对应,生成位置关联数据。
对位置关联数据附加的位置信息例如表示在三维数据中使用的坐标系中的位置。例如,位置信息是用纬度及经度的值表示的坐标值。此时,终端2021也可以与坐标值一起,将作为该坐标值的基准的坐标系及表示在位置估计中使用的三维数据的信息包含在位置信息中。此外,坐标值也可以包含高度的信息。
此外,位置信息也可以与能够在所述的三维数据的编码中使用的数据的单位或空间的单位建立对应。该单位,例如是WLD、GOS、SPC、VLM或VXL等。此时,位置信息例如通过用来确定与位置关联数据对应的SPC等的数据单位的标识符来表现。另外,位置信息除了用来确定SPC等的数据单位的标识符以外,也可以还包含表示对包括该SPC等的数据单位的三维空间进行编码而得到的三维数据的信息、或表示该SPC内的详细的位置的信息等。表示三维数据的信息,例如是该三维数据的文件名。
这样,该系统通过生成与基于使用三维数据进行的位置估计的位置信息建立了对应的位置关联数据,与对传感器信息附加基于使用GPS获得的客户端装置(终端2021)的自身位置的位置信息的情况相比,能够对传感器信息赋予精度更高的位置信息。结果,在其他装置在其他服务中利用位置关联数据的情况下,也能够通过基于相同的三维数据进行位置估计,在真实空间中更正确地确定与位置关联数据对应的位置。
另外,在本实施方式中,举从终端2021发送的数据是位置关联数据的情况为例进行了说明,但从终端2021发送的数据也可以是没有与位置信息建立关联的数据。即,也可以经由在本实施方式中说明的网络2023进行在其他实施方式中说明的三维数据或传感器数据的收发。
接着,对表示三维或二维的真实空间或地图空间中的位置的位置信息不同的例子进行说明。对位置关联数据附加的位置信息也可以是表示相对于三维数据中的特征点的相对位置的信息。这里,作为位置信息的基准的特征点,例如是被编码为SWLD、作为三维数据被通知给终端2021的特征点。
表示相对于特征点的相对位置的信息,例如也可以通过从特征点到位置信息所表示的点的矢量来表示,是表示从特征点到位置信息所表示的点的方向和距离的信息。或者,表示相对于特征点的相对位置的信息也可以是表示从特征点到位置信息表示的点的X轴、Y轴、Z轴各自的变位量的信息。此外,表示相对于特征点的相对位置的信息也可以是表示从3个以上的特征点各自到位置信息所表示的点的距离的信息。另外,相对位置也可以不是以各特征点为基准而表现的位置信息所表示的点的相对位置,而是以位置信息所表示的点为基准而表现的各特征点的相对位置。基于相对于特征点的相对位置的位置信息的一例包括用来确定作为基准的特征点的信息、和表示位置信息所表示的点相对于该特征点的相对位置的信息。此外,在将表示相对于特征点的相对位置的信息与三维数据分开提供的情况下,表示相对于特征点的相对位置的信息也可以包含表示在相对位置的导出中使用的坐标轴、表示三维数据的种类的信息、或/及表示相对位置的信息的值的每单位量的大小(比例尺等)的信息等。
此外,位置信息也可以包含针对多个特征点表示相对于各特征点的相对位置的信息。在将位置信息用相对于多个特征点的相对位置表示的情况下,在真实空间中要确定该位置信息所表示的位置的终端2021也可以根据按每个特征点基于传感器数据估计出的该特征点的位置,计算位置信息所表示的位置的候选点,将对计算出的多个候选点进行平均而求出的点判定为位置信息所表示的点。根据该结构,能够减轻根据传感器数据估计特征点的位置时的误差的影响,所以能够提高真实空间中的位置信息所表示的点的估计精度。此外,在位置信息包含表示相对于多个特征点的相对位置的信息的情况下,即使在存在因终端2021所具备的传感器的种类或性能等的制约而不能检测的特征点的情况下,只要能够检测到多个特征点中的某一个,就能够估计位置信息所表示的点的值。
作为特征点,可以使用能够根据传感器数据来确定的点。能够根据传感器数据来确定的点,例如是满足所述的三维特征量或可视光数据的特征量为阈值以上等特征点检测用的规定的条件的点或区域内的点。
此外,也可以使用设置在真实空间中的标记等作为特征点。在此情况下,标记只要能够根据使用LiDER或相机等的传感器获得的数据进行检测及位置的确定就可以。例如,通过颜色或亮度值(反射率)的变化、或三维形状(凹凸等)来表现标记。此外,也可以使用表示该标记的位置的坐标值或根据该标记的标识符生成的二维码或条码等。
此外,也可以使用发送光信号的光源作为标记。在使用光信号的光源作为标记的情况下,不仅发送坐标值或标识符等的用来获得位置的信息,也可以将其他的数据利用光信号来发送。例如,光信号也可以包含与该标记的位置对应的服务的内容、用来获得内容的url等的地址、或用来接受服务的提供的无线通信装置的标识符、表示用来与该无线通信装置连接的无线通信方式等的信息。通过使用光通信装置(光源)作为标记,表示位置的信息以外的数据的发送变得容易,并且能够动态地切换该数据。
终端2021例如使用在数据间共同使用的标识符、或者表示数据间的特征点的对应关系的信息或表来掌握相互不同的数据间的特征点的对应关系。此外,在没有表示特征点间的对应关系的信息的情况下,终端2021也可以将在将一方的三维数据中的特征点的坐标变换为另一方的三维数据空间上的位置的情况下处于最近的距离的特征点判定为对应的特征点。
在使用以上说明的基于相对位置的位置信息的情况下,即使在使用相互不同的三维数据的终端2021或服务之间,也能够以各三维数据中包含的或与各三维数据建立了对应的共同的特征点为基准,确定或估计位置信息所表示的位置。结果,能够在使用相互不同的三维数据的终端2021或服务间以更高的精度确定或估计相同的位置。
此外,即使在使用利用相互不同的坐标系表现的地图数据或三维数据的情况下,也能够降低伴随于坐标系的变换的误差的影响,所以能够实现基于更高精度的位置信息的服务的协同。
以下,对由数据收集服务器2024提供的功能的例子进行说明。数据收集服务器2024也可以将接收到的位置关联数据传送给其他的数据服务器。在有多个数据服务器的情况下,数据收集服务器2024判定将接收到的位置关联数据传送给哪个数据服务器,并向被判定为传送目的地的数据服务器传送位置关联数据。
数据收集服务器2024例如基于在数据收集服务器2024中事前设定的传送目的地服务器的判定规则来进行传送目的地的判定。传送目的地服务器的判定规则,例如用将对应于各终端2021的标识符与传送目的地的数据服务器建立了对应的传送目的地表等来设定。
终端2021对所发送的位置关联数据附加与该终端2021建立了对应的标识符,并向数据收集服务器2024发送。数据收集服务器2024基于使用传送目的地表等的传送目的地服务器的判定规则,确定与附加在位置关联数据中的标识符对应的传送目的地的数据服务器,将该位置关联数据向被确定的数据服务器发送。此外,传送目的地服务器的判定规则也可以由使用位置关联数据被获得的时间或场所等的判定条件来指定。这里,与上述的发送源的终端2021建立了对应的标识符,例如是各终端2021所固有的标识符、或表示终端2021所属的组的标识符等。
此外,传送目的地表也可以不是将对应于发送源的终端的标识符与传送目的地的数据服务器直接建立对应的。例如,数据收集服务器2024保持管理表和传送目的地表,管理表保存有按照终端2021所固有的标识符而赋予的标签信息,传送目的地表将该标签信息与传送目的地的数据服务器建立了对应。数据收集服务器2024也可以使用管理表和传送目的地表判定基于标签信息的传送目的地的数据服务器。这里,标签信息例如是与该标识符对应的终端2021的种类、型号、所有者、所属的组或其他的对标识符赋予的管理用的控制信息或服务提供用的控制信息。此外,在传送目的地表中,也可以代替与发送源的终端2021建立对应的标识符而使用每个传感器所固有的标识符。此外,传送目的地服务器的判定规则也可以能够从客户端装置2026设定。
数据收集服务器2024也可以将多个数据服务器判定为传送目的地,将接收到的位置关联数据传送给该多个数据服务器。根据该结构,例如在将位置关联数据自动地备份的情况下、或者在为了在不同的服务中共同地利用位置关联数据而需要对用来提供各服务的数据服务器发送位置关联数据的情况下,通过变更对数据收集服务器2024的设定,能够实现所意图的数据的传送。结果,与对单独的终端2021设定位置关联数据的发送目的地的情况相比,能够削减系统的构建及变更所需要的工作量。
数据收集服务器2024也可以根据从数据服务器接收到的传送请求信号,将由传送请求信号指定的数据服务器登记为新的传送目的地,将以后接收到的位置关联数据传送给该数据服务器。
数据收集服务器2024也可以将从终端2021接收到的位置关联数据保存到记录装置中,根据从终端2021或数据服务器接收到的发送请求信号,将由发送请求信号指定的位置关联数据发送给请求源的终端2021或数据服务器。
数据收集服务器2024也可以判断能否对请求源的数据服务器或终端2021提供位置关联数据,在判断为能够提供的情况下向请求源的数据服务器或终端2021传送或发送位置关联数据。
在从客户端装置2026受理了当前的位置关联数据的请求的情况下,即使不是终端2021的位置关联数据的发送定时,也可以由数据收集服务器2024对终端2021进行位置关联数据的发送请求,终端2021根据该发送请求发送位置关联数据。
在上述的说明中,假设终端2021对数据收集服务器2024发送位置信息数据,但数据收集服务器2024例如也可以具备对终端2021进行管理的功能等为了从终端2021收集位置关联数据而需要的功能、或从终端2021收集位置关联数据时使用的功能等。
数据收集服务器2024也可以具备对终端2021发送数据请求信号并收集位置关联数据的功能,数据请求信号是请求位置信息数据的发送的信号。
在数据收集服务器2024中,事前登记有用来与作为数据收集对象的终端2021进行通信的地址或终端2021固有的标识符等的管理信息。数据收集服务器2024基于所登记的管理信息,从终端2021收集位置关联数据。管理信息也可以包含终端2021所具备的传感器的种类、终端2021所具备的传感器的数量、以及终端2021所对应的通信方式等的信息。
数据收集服务器2024也可以从终端2021收集终端2021的工作状态或当前位置等的信息。
管理信息的登记既可以从客户端装置2026进行,也可以通过由终端2021向数据收集服务器2024发送登记请求,来开始用于登记的处理。数据收集服务器2024也可以具备控制与终端2021之间的通信的功能。
将数据收集服务器2024与终端2021连结的通信也可以是MNO(Mobile NetworkOperator:移动网络运营商)或MVNO(Mobile Virtual Network Operator:移动虚拟网络运营商)等服务业者提供的专用线路,或者由VPN(Virtual Private Network:虚拟专用网络)构成的虚拟的专用线路等。根据该结构,能够安全地进行终端2021与数据收集服务器2024之间的通信。
数据收集服务器2024也可以具备对终端2021进行认证的功能、或将与终端2021之间收发的数据进行加密的功能。这里,终端2021的认证处理或数据的加密处理,使用在数据收集服务器2024与终端2021之间事前共用的、终端2021所固有的标识符或包括多个终端2021的终端组所固有的标识符等来进行。该标识符例如是作为保存在SIM(SubscriberIdentity Module:用户识别模块)卡中的固有号码的IMSI(International MobileSubscriber Identity:国际移动用户识别码)等。在认证处理中使用的标识符和在数据的加密处理中使用的标识符既可以相同也可以不同。
数据收集服务器2024与终端2021之间的认证或数据加密的处理,只要数据收集服务器2024和终端2021双方具备实施该处理的功能就能够提供,不依赖于进行中继的通信装置2022使用的通信方式。因此,能够不考虑终端2021使用哪种通信方式而使用共同的认证或加密的处理,所以用户的系统构建的方便性提高。但是,不依赖于进行中继的通信装置2022所使用的通信方式,是指根据通信方式变更并不是必须的。即,也可以以传输效率的提高或安全性的确保的目的,根据中继装置所使用的通信方式来切换数据收集服务器2024与终端2021之间的认证或数据加密的处理。
数据收集服务器2024也可以向客户端装置2026提供对从终端2021收集的位置关联数据的种类及数据收集的调度等的数据收集规则进行管理的UI。由此,用户能够使用客户端装置2026指定收集数据的终端2021、以及数据的收集时间及频率等。此外,数据收集服务器2024也可以指定想要收集数据的地图上的区域等,从包含在该区域中的终端2021收集位置关联数据。
在以终端2021单位对数据收集规则进行管理的情况下,客户端装置2026例如在画面中提示作为管理对象的终端2021或传感器的列表。用户按列表的每个项目来设定数据的收集与否或收集调度等。
在指定想要收集数据的地图上的区域等的情况下,客户端装置2026例如在画面中提示作为管理对象的地域的二维或三维的地图。用户在所显示的地图上选择收集数据的区域。在地图上选择的区域,既可以是以在地图上指定的点为中心的圆形或矩形的区域,也可以是能够通过拖拽动作确定的圆形或矩形的区域。此外,客户端装置2026也可以以城市、城市内的区域、街区或主要的道路等预先设定的单位来选择区域。此外,也可以不是使用地图指定区域,而是输入纬度及经度的数值来设定区域,也可以从基于被输入的文本信息导出的候选区域的列表中选择区域。文本信息例如是地域、城市或地标的名称等。
此外,也可以通过由用户指定一个或多个终端2021,设定该终端2021的周围100米的范围内等的条件,从而一边动态地变更指定区域一边进行数据的收集。
此外,在客户端装置2026具备相机等的传感器的情况下,也可以基于根据传感器数据得到的客户端装置2026在真实空间中的位置来指定地图上的区域。例如,客户端装置2026也可以使用传感器数据估计自身位置,将距与估计出的位置对应的地图上的点为预先设定的距离或用户指定的距离的范围内的区域指定为收集数据的区域。此外,客户端装置2026也可以将传感器的感测区域、即与所获得的传感器数据对应的区域指定为收集数据的区域。或者,客户端装置2026也可以将基于与用户指定的传感器数据对应的位置的区域指定为收集数据的区域。与传感器数据对应的地图上的区域或位置的估计既可以由客户端装置2026进行,也可以由数据收集服务器2024进行。
在地图上的区域中进行指定的情况下,数据收集服务器2024也可以通过收集各终端2021的当前位置信息,来确定被指定的区域内的终端2021,对所确定的终端2021请求位置关联数据的发送。此外,也可以不是数据收集服务器2024确定区域内的终端2021,而是数据收集服务器2024将表示被指定的区域的信息向终端2021发送,终端2021判定自身是否处于被指定的区域内,在判断为处于被指定的区域内的情况下发送位置关联数据。
数据收集服务器2024将用来在客户端装置2026所执行的应用中提供上述UI(UserInterface)的列表或地图等的数据向客户端装置2026发送。数据收集服务器2024不仅发送列表或地图等的数据,也可以将应用的程序发送给客户端装置2026。此外,上述的UI也可以作为通过能够用浏览器显示的HTML等制作的内容来提供。另外,地图数据等一部分数据也可以从地图服务器2025等的数据收集服务器2024以外的服务器提供。
客户端装置2026如果由用户进行设定按钮的按下等通知输入完成的输入,则将被输入的信息作为设定信息向数据收集服务器2024发送。数据收集服务器2024基于从客户端装置2026接收到的设定信息,对各终端2021发送位置关联数据的请求或通知位置关联数据的收集规则的信号,进行位置关联数据的收集。
接着,说明基于附加在三维或二维地图数据中的附加信息对终端2021的动作进行控制的例子。
在本结构中,将表示埋设在道路或停车场中的无线供电的供电天线或供电线圈等供电部的位置的对象信息包含在三维数据中,或与三维数据建立对应,向作为车或无人机等的终端2021提供。
为了进行充电而获得了该对象信息的车辆或无人机通过自动驾驶使车辆自身的位置移动以使车辆具备的充电天线或充电线圈等充电部的位置成为与该对象信息所示的区域对置的位置,并开始充电。另外,在不具备自动驾驶功能的车辆或无人机的情况下,利用显示在画面上的图像或声音等,对驾驶员或操纵者提示应移动的方向或应进行的操作。并且,如果判断为基于估计出的自身位置计算出的充电部的位置进入到由对象信息所示的区域或距该区域为规定的距离的范围内,则将提示的图像或声音切换为使驾驶或操纵中止的内容,并开始充电。
此外,对象信息也可以不是表示供电部的位置的信息,而是表示如果将充电部配置到该区域内则能得到规定的阈值以上的充电效率的区域的信息。关于对象信息的位置,既可以用对象信息所示的区域的中心的点表示,也可以用二维平面内的区域或线、或者三维空间内的区域、线或平面等表示。
根据该结构,由于能够掌握通过LiDER的感测数据或由相机拍摄的影像不能掌握的供电天线的位置,所以能够更高精度地进行车等的终端2021所具备的无线充电用的天线与埋设在道路等中的无线供电天线的对位。结果,能够使无线充电时的充电速度变短,或使充电效率提高。
对象信息也可以是供电天线以外的对象物。例如,三维数据也可以包含毫米波无线通信的AP的位置等作为对象信息。由此,终端2021能够事前掌握AP的位置,所以能够将波束的指向性朝向该对象信息的方向来开始通信。结果,能够实现传输速度的提高、到通信开始为止的时间的缩短、以及延长可通信的期间等的通信品质的提高。
对象信息也可以包含表示与该对象信息对应的对象物的类型的信息。此外,对象信息也可以包含表示在终端2021包含于与该对象信息的三维数据上的位置对应的真实空间上的区域内、或距区域为规定的距离的范围内的情况下终端2021应实施的处理的信息。
对象信息也可以从与提供三维数据的服务器不同的服务器提供。在将对象信息与三维数据分开提供的情况下,也可以将保存有在相同的服务中使用的对象信息的对象组根据对象服务或对象设备的种类而分别作为不同的数据提供。
与对象信息组合使用的三维数据可以是WLD的点群数据,也可以是SWLD的特征点数据。
在三维数据编码装置中,在使用LoD(Level of Detail,多细节层次)对作为编码对象的三维点的对象三维点的属性信息进行了分层级编码的情况下,三维数据解码装置可以用该三维数据解码装置将属性信息解码到所需的LoD的层级,不对不需要的层级的属性信息进行解码。例如,在三维数据编码装置编码的比特流内的属性信息的LoD的总数为N个的情况下,三维数据解码装置也可以对从最上位层的LoD0到LoD(M-1)的M个(M<N)LoD进行解码,不对到剩余的LoD(N-1)为止的LoD进行解码。由此,三维数据解码装置能够抑制处理负荷,并且能够对三维数据解码装置所需的从LoD0至LoD(M-1)的属性信息进行解码。
图125是表示上述的使用情况的图。在图125的例子中,服务器保持通过对三维位置信息和属性信息进行编码而得到的三维地图。服务器(三维数据编码装置)对服务器管理的区域的客户端装置(三维数据解码装置:例如车辆或者无人机等)广播发送三维地图,客户端装置进行使用从服务器接收到的三维地图来确定客户端装置的自身位置的处理、或者对操作客户端装置的用户等显示地图信息的处理。
以下,对该例子中的动作例进行说明。首先,服务器使用八叉树结构等对三维地图的位置信息进行编码。然后,服务器使用以位置信息为基础而构建的N个LoD对三维地图的属性信息进行分层级编码。服务器保存通过分层级编码得到的三维地图的比特流。
接着,服务器根据从服务器管理的区域的客户端装置发送的地图信息的发送请求,将编码后的三维地图的比特流发送到客户端装置。
客户端装置接收从服务器发送的三维地图的比特流,根据客户端装置的用途对三维地图的位置信息和属性信息进行解码。例如,在客户端装置使用位置信息和N个LoD的属性信息进行高精度的自身位置推测的情况下,客户端装置判断为需要到稠密的三维点为止的解码结果作为属性信息,对比特流内的所有信息进行解码。
另外,在客户端装置将三维地图的信息显示给用户等的情况下,客户端装置判断为需要到稀疏的三维点为止的解码结果作为属性信息,对位置信息与从LoD的上位层即LoD0至M个(M<N)为止的LoD的属性信息进行解码。
这样,通过根据客户端装置的用途切换解码的属性信息的LoD,能够削减客户端装置的处理负荷。
在图125所示的例子中,例如,三维点地图包含位置信息和属性信息。位置信息用八叉树进行编码。属性信息用N个LoD进行编码。
客户端装置A进行高精度的自身位置推测。在该情况下,客户端装置A判断为需要全部的位置信息和属性信息,将比特流内的位置信息和由N个LoD构成的属性信息全部解码。
客户端装置B向用户显示三维地图。在该情况下,客户端装置B判断为需要位置信息和M个(M<N)LoD的属性信息,对比特流内的位置信息和由M个LoD构成的属性信息进行解码。
另外,服务器可以向客户端装置广播发送三维地图,也可以组播发送或者单播发送。
以下,对本实施方式的系统的变形例进行说明。在三维数据编码装置中,在使用LoD对作为编码对象的三维点的对象三维点的属性信息进行分层级编码的情况下,三维数据编码装置也可以对该三维数据解码装置所需的LoD的层级为止的属性信息进行编码,不对不需要的层级的属性信息进行编码。例如,在LoD的总数为N个的情况下,三维数据编码装置也可以对从最上位层LoD0到LoD(M-1)的M个(M<N)LoD进行编码,不对到剩余LoD(N-1)为止的LoD进行编码,由此生成比特流。由此,三维数据编码装置能够根据来自三维数据解码装置的需求,提供对三维数据解码装置所需的从LoD0到LoD(M-1)的属性信息进行编码而得到的比特流。
图126是表示上述使用情况的图。在图126所示的例子中,服务器保持通过对三维位置信息和属性信息进行编码而得到的三维地图。服务器(三维数据编码装置)对服务器管理的区域的客户端装置(三维数据解码装置:例如车辆或者无人机等),根据客户端装置的需求单播发送三维地图,客户端装置使用从服务器接收到的三维地图来进行确定客户端装置的自身位置的处理、或者将地图信息显示给操作客户端装置的用户等的处理。
以下,对该例子中的动作例进行说明。首先,服务器使用八叉树结构等对三维地图的位置信息进行编码。然后,服务器使用以位置信息为基础构建的N个LoD对三维地图的属性信息进行分层级编码,由此生成三维地图A的比特流,并将生成的比特流保存在该服务器中。另外,服务器使用以位置信息为基础构建的M个(M<N)LoD对三维地图的属性信息进行分层级编码,由此生成三维地图B的比特流,并将生成的比特流保存在该服务器中。
接着,客户端装置根据客户端装置的用途向服务器请求三维地图的发送。例如,客户端装置在使用位置信息和N个LoD的属性信息进行高精度的自身位置推测的情况下,判断为需要到稠密的三维点为止的解码结果作为属性信息,向服务器请求三维地图A的比特流的发送。另外,客户端装置在将三维地图的信息显示给用户等的情况下,判断为需要到稀疏的三维点为止的解码结果作为属性信息,向服务器请求包含位置信息和从LoD的上位层LoD0到M个(M<N)LoD的属性信息的三维地图B的比特流的发送。然后,服务器根据来自客户端装置的地图信息的发送请求,将编码后的三维地图A或者三维地图B的比特流发送到客户端装置。
客户端装置接收根据客户端装置的用途从服务器发送的三维地图A或三维地图B的比特流,对该比特流进行解码。这样,服务器根据客户端装置的用途切换要发送的比特流。由此,能够削减客户端装置的处理负荷。
在图126所示的例子中,服务器保持三维地图A以及三维地图B。服务器例如用八叉树对三维地图的位置信息进行编码,用N个LoD对三维地图的属性信息进行编码,由此生成三维地图A。即,三维地图A的比特流中包含的NumLoD表示N。
另外,服务器例如用八叉树对三维地图的位置信息进行编码,用M个LoD对三维地图的属性信息进行编码,由此生成三维地图B。即,三维地图B的比特流中包含的NumLoD表示M。
客户端装置A进行高精度的自身位置推测。在该情况下,客户端装置A判断为需要全部的位置信息和属性信息,向服务器发送包含全部的位置信息和由N个LoD构成的属性信息的三维地图A的发送请求。客户端装置A接收三维地图A,对全部的位置信息和由N个LoD构成的属性信息进行解码。
客户端装置B向用户显示三维地图。在该情况下,客户端装置B判断为需要位置信息和M个(M<N)LoD的属性信息,将包含全部的位置信息和由M个LoD构成的属性信息的三维地图B的发送请求发送到服务器。客户端装置B接收三维地图B,对全部的位置信息和由M个LoD构成的属性信息进行解码。
另外,服务器(三维数据编码装置)除了三维地图B以外,也可以事先对将剩余的N-M个LoD的属性信息进行编码而得到的三维地图C进行编码,根据客户端装置B的要求将三维地图C发送到客户端装置B。另外,客户端装置B也可以使用三维地图B和三维地图C的比特流,得到N个LoD的解码结果。
以下,对应用处理的例子进行说明。图127是表示应用处理的例子的流程图。当开始应用操作时,三维数据逆复用装置取得包含点群数据以及多个编码数据的ISOBMFF文件(S7301)。例如,三维数据逆复用装置既可以通过通信取得ISOBMFF文件,也可以从积蓄的数据中读入ISOBMFF文件。
接着,三维数据逆复用装置解析ISOBMFF文件中的整体结构信息,特定应用中使用的数据(S7302)。例如,三维数据逆复用装置取得处理中使用的数据,不取得处理中不使用的数据。
接着,三维数据逆复用装置提取应用中使用的1个以上的数据,解析该数据的结构信息(S7303)。
在数据的类型是编码数据的情况下(步骤S7304中的编码数据),三维数据逆复用装置将ISOBMFF变换成编码流,并且提取时间戳(步骤S7305)。另外,三维数据逆复用装置例如也可以参照表示数据间是否同步的标志来判定数据间是否同步,如果不同步,则进行同步处理。
接着,三维数据逆复用装置按照时间戳及其他指示,按照规定的方法对数据进行解码,对解码后的数据进行处理(S7306)。
另一方面,在数据的类别是编码数据的情况下(S7304中RAW数据),三维数据逆复用装置提取数据和时间戳(S7307)。另外,三维数据逆复用装置例如也可以参照表示数据间是否同步的标志来判定数据间是否同步,如果不同步,则进行同步处理。接着,三维数据逆复用装置按照时间戳及其他指示,对数据进行处理(S7308)。
例如,说明光束LiDAR、泛光式LiDAR、以及由相机取得的传感器信号分别以不同的编码方式进行编码以及复用的情况的例子。图128是表示光束LiDAR、泛光式LiDAR以及相机的传感器范围的例子的图。例如,光束LiDAR检测车辆(传感器)的周围的全部方向,泛光式LiDAR及相机检测车辆的一个方向(例如前方)的范围。
在将LiDAR点群合并处理的应用的情况下,三维数据逆复用装置参照整体结构信息,提取光束LiDAR和泛光式LiDAR的编码数据进行解码。另外,三维数据逆复用装置不提取相机影像。
三维数据逆复用装置按照LiDAR和泛光式LiDAR的时间戳,同时处理同一时间戳的时刻各自的编码数据。
例如,三维数据逆复用装置也可以通过提示装置提示处理后的数据,或者合成光束LiDAR和泛光式LiDAR的点群数据,或者进行渲染等处理。
另外,在数据间进行校准的应用的情况下,三维数据逆复用装置也可以提取传感器位置信息并在应用中使用。
例如,三维数据逆复用装置可以在应用中选择使用光束LiDAR信息还是使用泛光式LiDAR,并根据选择结果来切换处理。
这样,能够根据应用的处理而自适应地改变数据的取得以及编码处理,因此能够削减处理量以及消耗电力。
以下,对自动驾驶中的使用情况进行说明。图129是表示自动驾驶系统的结构例的图。该自动驾驶系统包括云服务器7350和车载装置或移动装置等的边缘7360。云服务器7350具备逆复用部7351、解码部7352A、7352B以及7355、点群数据合成部7353、大规模数据积蓄部7354、比较部7356以及编码部7357。边缘7360具备传感器7361A及7361B、点群数据生成部7362A及7362B、同步部7363、编码部7364A及7364B、复用部7365、更新数据积蓄部7366、逆复用部7367、解码部7368、滤波器7369、自身位置推测部7370、以及驾驶控制部7371。
在该系统中,边缘7360下载云服务器7350中积蓄的大规模点群地图数据即大规模数据。边缘7360通过将大规模数据和在边缘7360得到的传感器信息进行匹配,进行边缘7360(车辆或终端)的自身位置推测处理。另外,边缘7360将取得的传感器信息上载到云服务器7350,将大规模数据更新为最新的地图数据。
另外,在处理系统内的点群数据的各种应用中,处理编码方法不同的点群数据。
云服务器7350对大规模数据进行编码及复用。具体而言,编码部7357使用适于对大规模点群进行编码的第3编码方法进行编码。此外,编码部7357对编码数据进行复用。大规模数据积蓄部7354积蓄由编码部7357进行编码及复用后的数据。
边缘7360进行感测。具体而言,点群数据生成部7362A使用由传感器7361A取得的感测信息,生成第1点群数据(位置信息(几何)以及属性信息)。点群数据生成部7362B使用由传感器7361B取得的感测信息,生成第2点群数据(位置信息以及属性信息)。生成的第1点群数据以及第2点群数据用于自动驾驶的自身位置推测或者车辆控制或者地图更新。在各个处理中,也可以使用第1点群数据以及第2点群数据中的一部分信息。
边缘7360进行自身位置推测。具体而言,边缘7360从云服务器7350下载大规模数据。逆复用部7367通过对文件格式的大规模数据进行逆复用而取得编码数据。解码部7368通过对所取得的编码数据进行解码而取得作为大规模点群地图数据的大规模数据。
自身位置推测部7370通过将取得的大规模数据与由点群数据生成部7362A和7362B生成的第1点群数据以及第2点群数据进行匹配,来推测车辆的地图中的自身位置。另外,驾驶控制部7371将该匹配结果或自身位置推测结果用于驾驶控制。
另外,自身位置推测部7370以及驾驶控制部7371也可以提取大规模数据中的位置信息等特定的信息,并使用提取出的信息进行处理。另外,滤波器7369对第1点群数据以及第2点群数据进行修正或间隔剔除等处理。自身位置推测部7370以及驾驶控制部7371也可以使用进行了该处理后的第1点群数据以及第2点群数据。另外,自身位置推测部7370及驾驶控制部7371也可以使用由传感器7361A及7361B得到的传感器信号。
同步部7363进行多个传感器信号或多个点群数据的数据间的时间同步及位置修正。另外,同步部7363也可以基于通过自身位置推测处理而生成的、大规模数据与传感器数据的位置修正信息,以使传感器信号或者点群数据的位置信息与大规模数据一致的方式进行修正。
另外,同步和位置修正也可以不是边缘7360而是由云服务器7350进行。在该情况下,边缘7360也可以将同步信息以及位置信息复用并发送到云服务器7350。
边缘7360对传感器信号或点群数据进行编码及复用。具体而言,传感器信号或点群数据使用适于对各自的信号进行编码的第1编码方法或第2编码方法进行编码。例如,编码部7364A通过使用第1编码方法对第1点群数据进行编码来生成第1编码数据。编码部7364B使用第2编码方法对第2点群数据进行编码,由此生成第2编码数据。
复用部7365通过对第1编码数据、第2编码数据、以及同步信息等进行复用而生成复用信号。更新数据积蓄部7366积蓄所生成的复用信号。此外,更新数据积蓄部7366将复用信号上载到云服务器7350。
云服务器7350对点群数据进行合成。具体而言,逆复用部7351通过对在云服务器7350上载的复用信号进行逆复用而取得第1编码数据和第2编码数据。解码部7352A通过对第1编码数据进行解码而取得第1点群数据(或传感器信号)。解码部7352B通过对第2编码数据进行解码而取得第2点群数据(或传感器信号)。
点群数据合成部7353通过规定的方法合成第1点群数据以及第2点群数据。在复用信号中对同步信息以及位置修正信息进行复用的情况下,点群数据合成部7353也可以使用这些信息进行合成。
解码部7355对积蓄在大规模数据积蓄部7354中的大规模数据进行逆复用和解码。比较部7356将基于由边缘7360得到的传感器信号而生成的点群数据与云服务器7350所具有的大规模数据进行比较,判断需要更新的点群数据。比较部7356将大规模数据中判断为需要更新的点群数据更新为从边缘7360得到的点群数据。
编码部7357对更新后的大规模数据进行编码及复用,将得到的数据积蓄在大规模数据积蓄部7354中。
如上所述,根据所使用的用途或应用,存在处理信号不同、复用的信号或编码方法不同的情况。即使在这样的情况下,通过使用本实施方式对各种编码方式的数据进行复用,也能够进行灵活的解码以及应用处理。另外,即使在信号的编码方式不同的情况下,也能够通过逆复用、解码、数据变换、编码、复用的处理而变换适合的编码方式,由此构建各种各样的应用、系统,提供灵活的服务。
以下,说明分割数据的解码和应用的例子。首先,说明分割数据的信息。图130是表示比特流的结构例的图。分割数据的整体信息按每个分割数据表示该分割数据的传感器ID(sensor_id)和数据ID(data_id)。另外,数据ID也表示在各编码数据的头中。
此外,与图37同样,图130所示的分割数据的整体信息除了传感器ID之外,还可以包含传感器信息(Sensor)、传感器的版本(Version)、传感器的制造商名(Maker)、传感器的设置信息(Mount Info.)和传感器的位置坐标(World Coordinate)中的至少一个。由此,三维数据解码装置能够从结构信息中取得各种传感器的信息。
分割数据的整体信息可以保存在作为元数据的SPS、GPS或APS中,也可以保存在作为对于编码不是必需的元数据的SEI中。此外,三维数据编码装置在复用时将该SEI保存在ISOBMFF的文件中。三维数据解码装置能够基于该元数据取得希望的分割数据。
在图130中,SPS是编码数据整体的元数据,GPS是位置信息的元数据,APS是每个属性信息的元数据,G是每个分割数据的位置信息的编码数据,A1等是每个分割数据的属性信息的编码数据。
接下来,说明分割数据的应用例。说明从点群数据中选择任意点群并提示所选择的点群的应用的例子。图131是由该应用执行的点群选择处理的流程图。图132~图134是表示点群选择处理的画面例的图。
如图132所示,执行应用的三维数据解码装置例如具有显示用于选择任意点群的输入UI(用户界面)8661的UI部。输入UI8661具有提示所选择的点群的提示部8662和受理用户的操作的操作部(按钮8663和8664)。三维数据解码装置在由UI8661选择了点群后,从积蓄部8665取得期望的数据。
首先,基于针对用户的输入UI8661的操作,选择用户想要显示的点群信息(S8631)。具体而言,通过选择按钮8663,选择基于传感器1的点群。通过选择按钮8664,选择基于传感器2的点群。或者,通过选择按钮8663及按钮8664这两者来选择基于传感器1的点群和基于传感器2的点群这两者。另外,点群的选择方法是一例,并不限于此。
接着,三维数据解码装置对复用信号(比特流)或编码数据中包含的分割数据的整体信息进行解析,从所选择的传感器的传感器ID(sensor_id)中特定构成所选择的点群的分割数据的数据ID(data_id)(S8632)。接着,三维数据解码装置从复用信号中提取包含所特定的希望的数据ID的编码数据,通过对所提取的编码数据进行解码,对基于所选择的传感器的点群进行解码(S8633)。另外,三维数据解码装置不对其他编码数据进行解码。
最后,三维数据解码装置提示(例如显示)解码后的点群(S8634)。图133表示按下传感器1的按钮8663的情况的例子,提示传感器1的点群。图134表示按下传感器1的按钮8663和传感器2的按钮8664这两者的情况的例子,提示传感器1和传感器2的点群。
以上,对有关本公开的实施方式的三维数据编码装置及三维数据解码装置等进行了说明,但本公开并不限定于该实施方式。
此外,有关上述实施方式的三维数据编码装置及三维数据解码装置等中包含的各处理部典型的是作为集成电路即LSI实现。它们既可以单独地形成1个芯片,也可以包含一部分或全部而形成1个芯片。
此外,集成电路化并不限于LSI,也可以由专用电路或通用处理器实现。也可以利用在LSI制造后能够编程的FPGA(Field Programmable Gate Array现场可编程门阵列)、或能够重构LSI内部的电路单元的连接或设定的可重构处理器。
此外,在上述各实施方式中,各构成要素也可以由专用的硬件构成,或通过执行适合于各构成要素的软件程序来实现。各构成要素也可以通过由CPU或处理器等程序执行部读出被记录在硬盘或半导体存储器等记录介质中的软件程序并执行来实现。
此外,本公开也可以作为由三维数据编码装置及三维数据解码装置等执行的三维数据编码方法或三维数据解码方法等实现。
此外,框图中的功能块的分割是一例,也可以将多个功能块作为一个功能块实现,或将一个功能块分割为多个,或将一部分功能转移到其他的功能块。此外,也可以是单一的硬件或软件将具有类似的功能的多个功能块的功能并行或分时地处理。
此外,流程图中的各步骤的执行顺序是为了具体地说明本公开而例示的,也可以是上述以外的顺序。此外,也可以将上述步骤的一部分与其他步骤同时(并行)执行。
以上,基于实施方式对有关一个或多个技术方案的三维数据编码装置及三维数据解码装置等进行了说明,但本公开并不限定于该实施方式。只要不脱离本公开的主旨,对本实施方式施以本领域技术人员想到的各种变形的形态、或将不同实施方式的构成要素组合而构建的形态也可以包含在一个或多个技术方案的范围内。
工业实用性
本公开能够应用于三维数据编码装置及三维数据解码装置。
标号说明
810 三维数据制作装置
811 数据接收部
812、819 通信部
813 接收控制部
814、821 格式转换部
815 传感器
816 三维数据制作部
817 三维数据合成部
818 三维数据积蓄部
820 发送控制部
822 数据发送部
831、832、834、835、836、837 三维数据
833 传感器信息
901 服务器
902、902A、902B、902C 客户端装置
1011、1111 数据接收部
1012、1020、1112、1120 通信部
1013、1113 接收控制部
1014、1019、1114、1119 格式转换部
1015 传感器
1016、1116 三维数据制作部
1017 三维图像处理部
1018、1118 三维数据积蓄部
1021、1121 发送控制部
1022、1122 数据发送部
1031、1032、1135 三维地图
1033、1037、1132 传感器信息
1034、1035、1134 三维数据
1117 三维数据合成部
1201 三维地图压缩/解码处理部
1202 传感器信息压缩/解码处理部
1211 三维地图解码处理部
1212 传感器信息压缩处理部
1501 服务器
1502 客户端
1511 存储部
1512 控制部
1513 编码三维地图
1521 解码器
1522 应用
2001 服务器
2002、2002A、2002B 客户端装置
2011 传感器信息取得部
2012 存储部
2013 数据发送可否判定部
2021、2021A、2021B 终端
2022、2022A、2022B 通信装置
2023 网络
2024 数据收集服务器
2025 地图服务器
2026 客户端装置
2700 位置信息编码部
2701、2711 八叉树生成部
2702、2712 几何信息计算部
2703、2713 编码表选择部
2704 熵编码部
2710 位置信息解码部
2714 熵解码部
3140 属性信息编码部
3141、3151 LoD生成部
3142、3152 周围搜索部
3143、3153 预测部
3144 预测残差计算部
3145 量化部
3146 算术编码部
3147、3155 逆量化部
3148、3156 解码值生成部
3149、3157 存储器
3150 属性信息解码部
3154 算术解码部
4601 三维数据编码系统
4602 三维数据解码系统
4603 传感器终端
4604 外部连接部
4611 点群数据生成系统
4612 提示部
4613 编码部
4614 复用部
4615 输入输出部
4616 控制部
4617 传感器信息取得部
4618 点群数据生成部
4621 传感器信息取得部
4622 输入输出部
4623 逆复用部
4624 解码部
4625 提示部
4626 用户接口
4627 控制部
4630 第1编码部
4631 位置信息编码部
4632 属性信息编码部
4633 附加信息编码部
4634 复用部
4640第1解码部
4641 逆复用部
4642 位置信息解码部
4643 属性信息解码部
4644 附加信息解码部
4650第2编码部
4651 附加信息生成部
4652 位置图像生成部
4653 属性图像生成部
4654 映像编码部
4655 附加信息编码部
4656 复用部
4660第2解码部
4661 逆复用部
4662 映像解码部
4663 附加信息解码部
4664 位置信息生成部
4665 属性信息生成部
4801 编码部
4802 复用部
4910 第1编码部
4911 分割部
4912 位置信息编码部
4913 属性信息编码部
4914 附加信息编码部
4915 复用部
4920 第1解码部
4921 逆复用部
4922 位置信息解码部
4923 属性信息解码部
4924 附加信息解码部
4925 结合部
4931 切片分割部
4932 位置信息瓦片分割部
4933 属性信息瓦片分割部
4941 位置信息瓦片结合部
4942 属性信息瓦片结合部
4943 切片结合部
5200 第1编码部
5201 分割部
5202 位置信息编码部
5203 属性信息编码部
5204 附加信息编码部
5205 复用部
5211 瓦片分割部
5212 切片分割部
5221、5231、5251、5261 CABAC初始化部
5222、5232 熵编码部
5240 第1解码部
5241 逆复用部
5242 位置信息解码部
5243 属性信息解码部
5244 附加信息解码部
5245 结合部
5252、5262 熵解码部
6600 属性信息编码部
6601 排序部
6602Haar变换部
6603 量化部
6604、6612 逆量化部
6605、6613 逆Haar变换部
6606、6614 存储器
6607 算术编码部
6610 属性信息解码部
6611 算术解码部
7350 云服务器
7351 逆复用部
7352A、7352B 解码部
7353 点群数据合成部
7354 大规模数据积蓄部
7355 解码部
7356 比较部
7357 编码部
7360 边缘
7361A、7361B 传感器
7362A、7362B 点群数据生成部
7363 同步部
7364A、7364B 编码部
7365 复用部
7366 更新数据积蓄部
7367 逆复用部
7368 解码部
7369 滤波器
7370 自身位置推测部
7371 运转控制部
8661输入UI
8662 提示部
8663、8664 按钮
8665 积蓄部
10500 位置信息编码部
10501、10521 树结构生成部
10502、10522 几何信息计算部
10503、10523 编码表选择部
10504 熵编码部
10511 控制部
10512、10532 八叉树生成部
10513、10533 预测树生成部
10520 位置信息解码部
10524 熵解码部
10531 解析部
A100 属性信息编码部
A101 LoD属性信息编码部
A102 变换属性信息编码部
A110 属性信息解码部
A111 LoD属性信息解码部
A112 变换属性信息解码部

Claims (10)

1.一种三维数据编码方法,其中,
取得分别包含多个三维点的多个数据单元;
对上述多个数据单元各自中包含的多个三维点进行编码;
生成包含上述多个三维点被编码后的编码数据的比特流;
在上述编码中,
使用N叉树将编码对象的数据单元中包含的多个三维点的多个位置信息变换为多个占用地图,N为2以上的整数;
使用表示占用地图与索引的对应关系的表将上述多个占用地图分别变换为索引,通过对上述索引进行编码而生成上述编码数据;
根据变换后的索引,将上述表更新并存储到存储器中;
在上述编码对象的数据单元的下一个数据单元的开头的三维点的编码时,决定是否将存储在上述存储器中的上述表进行初始化;
在决定为不进行初始化的情况下,使用存储在上述存储器中的上述表开始上述下一个数据单元的编码;
上述比特流还包含表示上述决定的结果的第1识别信息。
2.如权利要求1所述的三维数据编码方法,其中,
上述索引表示占用地图的产生次数及占用地图的产生频率中的某一个。
3.如权利要求1或2所述的三维数据编码方法,其中,
在上述第1识别信息表示将上述表进行初始化的情况下,表示将之前的数据单元的上下文进行初始化来对上述多个三维点的多个属性信息进行编码,在表示不将上述表进行初始化的情况下,表示继续使用上述之前的数据单元的上下文对上述多个属性信息进行编码。
4.如权利要求1~3中任一项所述的三维数据编码方法,其中,
上述比特流还包含第2识别信息,该第2识别信息表示是否使用在上述多个数据单元之间使熵继续的功能;
上述第1识别信息在上述第2识别信息表示使用在上述多个数据单元之间使熵继续的功能的情况下被示出。
5.一种三维数据解码方法,其中,
取得包含编码数据和第1识别信息的比特流,上述编码数据是包含多个三维点的数据单元被编码后的编码数据,上述第1识别信息表示在上述数据单元的编码中是否将在该数据单元之前的数据单元的编码中使用的表进行初始化来使用;
使用与上述第1识别信息相应的表对上述编码数据进行解码;
上述表表示用N叉树表现了三维点的位置信息的占用地图与索引的对应关系,N为2以上的整数;
上述编码数据包含被编码后的上述索引;
在上述解码中,通过导出在上述表中与通过对上述编码数据进行解码而得到的上述索引对应的占用地图,计算三维点的位置信息。
6.如权利要求5所述的三维数据解码方法,其中,
上述索引表示占用地图的产生次数及占用地图的产生频率中的某一个。
7.如权利要求5或6所述的三维数据解码方法,其中,
在上述第1识别信息表示将上述表进行初始化的情况下,表示将之前的数据单元的上下文进行初始化来对上述多个三维点的多个属性信息进行解码,在表示不将上述表进行初始化的情况下,表示继续使用上述之前的数据单元的上下文对上述多个属性信息进行解码。
8.如权利要求5~7中任一项所述的三维数据解码方法,其中,
上述比特流还包含第2识别信息,该第2识别信息表示是否使用在上述多个数据单元之间使熵继续的功能;
上述第1识别信息在上述第2识别信息表示使用在上述多个数据单元之间使熵继续的功能的情况下被示出。
9.一种三维数据编码装置,其中,具备:
处理器;以及
存储器;
上述处理器使用上述存储器进行如下处理:
取得分别包含多个三维点的多个数据单元;
对上述多个数据单元各自中包含的多个三维点进行编码;
生成包含上述多个三维点被编码后的编码数据的比特流;
在上述编码中,
使用N叉树将编码对象的数据单元中包含的多个三维点的多个位置信息变换为多个占用地图,N为2以上的整数;
使用表示占用地图与索引的对应关系的表将上述多个占用地图分别变换为索引,通过对上述索引进行编码而生成上述编码数据;
根据变换后的索引,将上述表更新并存储到存储器中;
在上述编码对象的数据单元的下一个数据单元的开头的三维点的编码时,决定是否将存储在上述存储器中的上述表进行初始化;
在决定为不进行初始化的情况下,使用存储在上述存储器中的上述表开始上述下一个数据单元的编码;
上述比特流还包含表示上述决定的结果的第1识别信息。
10.一种三维数据解码装置,其中,具备:
处理器;以及
存储器;
上述处理器使用上述存储器进行如下处理:
取得包含编码数据和第1识别信息的比特流,上述编码数据是包含多个三维点的数据单元被编码后的编码数据,上述第1识别信息表示在上述数据单元的编码中是否将在该数据单元之前的数据单元的编码中使用的表进行初始化来使用;
使用与上述第1识别信息相应的表对上述编码数据进行解码;
上述表表示用N叉树表现了三维点的位置信息的占用地图与索引的对应关系,N为2以上的整数;
上述编码数据包含被编码后的上述索引;
在上述解码中,通过导出在上述表中与通过对上述编码数据进行解码而得到的上述索引对应的占用地图,计算三维点的位置信息。
CN202180043574.5A 2020-06-25 2021-06-24 三维数据编码方法、三维数据解码方法、三维数据编码装置及三维数据解码装置 Pending CN115943434A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063043937P 2020-06-25 2020-06-25
US63/043,937 2020-06-25
PCT/JP2021/023939 WO2021261555A1 (ja) 2020-06-25 2021-06-24 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置

Publications (1)

Publication Number Publication Date
CN115943434A true CN115943434A (zh) 2023-04-07

Family

ID=79281306

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180043574.5A Pending CN115943434A (zh) 2020-06-25 2021-06-24 三维数据编码方法、三维数据解码方法、三维数据编码装置及三维数据解码装置

Country Status (3)

Country Link
US (1) US20230145001A1 (zh)
CN (1) CN115943434A (zh)
WO (1) WO2021261555A1 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112041889A (zh) * 2018-02-08 2020-12-04 松下电器(美国)知识产权公司 三维数据编码方法、三维数据解码方法、三维数据编码装置、以及三维数据解码装置
WO2019203297A1 (ja) * 2018-04-19 2019-10-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置

Also Published As

Publication number Publication date
US20230145001A1 (en) 2023-05-11
WO2021261555A1 (ja) 2021-12-30

Similar Documents

Publication Publication Date Title
CN113853635A (zh) 三维数据编码方法、三维数据解码方法、三维数据编码装置及三维数据解码装置
WO2021070952A1 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
WO2021141117A1 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
WO2021141090A1 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
US20230005190A1 (en) Three-dimensional data encoding method, three-dimensional data decoding method, three-dimensional data encoding device, and three-dimensional data decoding device
CN114450941A (zh) 三维数据编码方法、三维数据解码方法、三维数据编码装置及三维数据解码装置
CN113940083A (zh) 三维数据编码方法、三维数据解码方法、三维数据编码装置及三维数据解码装置
WO2022075428A1 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
WO2021210549A1 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
US20230033616A1 (en) Three-dimensional data encoding method, three-dimensional data decoding method, three-dimensional data encoding device, and three-dimensional data decoding device
US20230162405A1 (en) Three-dimensional data encoding method, three-dimensional data decoding method, three-dimensional data encoding device, and three-dimensional data decoding device
US20230121882A1 (en) Three-dimensional data encoding method, three-dimensional data decoding method, three-dimensional data encoding device, and three-dimensional data decoding device
US20220303577A1 (en) Three-dimensional data encoding method, three-dimensional data decoding method, three-dimensional data encoding device, and three-dimensional data decoding device
WO2022004682A1 (ja) 三次元データ符号化方法及び三次元データ符号化装置
WO2021193899A1 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
CN116583877A (zh) 三维数据编码方法、三维数据解码方法、三维数据编码装置及三维数据解码装置
CN115702442A (zh) 三维数据编码方法、三维数据解码方法、三维数据编码装置及三维数据解码装置
CN115280365A (zh) 三维数据编码方法、三维数据解码方法、三维数据编码装置、以及三维数据解码装置
CN114303376A (zh) 三维数据编码方法、三维数据解码方法、三维数据编码装置及三维数据解码装置
WO2021261555A1 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
WO2021261458A1 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
WO2022025275A1 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
WO2022025280A1 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
WO2021200921A1 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置
WO2022075326A1 (ja) 三次元データ符号化方法、三次元データ復号方法、三次元データ符号化装置、及び三次元データ復号装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination