CN104410425A - 一种用于随钻测量系统数据压缩的方法 - Google Patents

一种用于随钻测量系统数据压缩的方法 Download PDF

Info

Publication number
CN104410425A
CN104410425A CN201410532348.5A CN201410532348A CN104410425A CN 104410425 A CN104410425 A CN 104410425A CN 201410532348 A CN201410532348 A CN 201410532348A CN 104410425 A CN104410425 A CN 104410425A
Authority
CN
China
Prior art keywords
datagram
huffman
data
coding
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410532348.5A
Other languages
English (en)
Inventor
李忠伟
王瑞和
崔学荣
吴春雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China National Petroleum Corp
China University of Petroleum East China
Original Assignee
China National Petroleum Corp
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China National Petroleum Corp, China University of Petroleum East China filed Critical China National Petroleum Corp
Priority to CN201410532348.5A priority Critical patent/CN104410425A/zh
Publication of CN104410425A publication Critical patent/CN104410425A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供了一种用于随钻测量系统数据压缩的方法,是石油随钻测量系统井下测量的参数上传系统中数据压缩的方法,从而实现高效的数据传输。发明主要通过①系统初始化;②发送数据;③修改该序号的数据报的权值;④判断自上次重构编码后的时间是否大于设定时间周期;⑤计算所有字符的权值的标准差;⑥判断标准差是否大于设定阈值;⑦发送该序号数据报的Huffman权值表;⑧对本地该序号的数据报的字符重新进行Huffman编码等8个步骤来实现,用于石油钻井、测井、录井等随钻测量系统中数据的压缩,实现数据的高效传输。

Description

一种用于随钻测量系统数据压缩的方法
技术领域:
本发明涉及一种数据压缩的方法,尤其是石油随钻测量系统井下测量的参数上传系统中数据的压缩方法,从而实现高效的数据传输。
背景技术:
从井下到地面的信息传输技术是导向钻井与定向钻井领域中研究的热点与难点问题,也是随钻测量系统应用和发展的技术瓶颈。基于钻井液压力的信息传输方式,具有经济、方便、传输可靠性强、传输距离远等优点,是目前发展最成熟、应用最广泛的传输方法。但是,目前的研究主要集中在测量仪器的硬件设备设计与开发方面,注重仪器的硬件实现,而缺乏对其数据压缩传输方面特别是针对其数据特征进行高效的数据压缩传输的研究。
自20世纪30年代J.C.Karcher等研制的随钻电阻率测井系统和50年代Arps J.J.发明的泥浆遥测系统获得成功以来,随钻测量技术开启了加速发展的时代。井下测量参数也从最初基本的方位数据和地层评价数据(电阻率和伽马射线),发展到如今的包括几何参数、定向参数和井下工况参数等共计约20种之多,例如井斜角、方位角、工具面角、井底钻压、钻头扭矩、马达转速、井底温度、自然伽马、地层电阻率、地层倾角、孔隙度、密度、中子测井、电压等。而且,随着钻井技术不断地向自动化、智能化方向发展,越来越多的井下测量仪器将会得以研制与应用,可以测量获得的井下参数也将会越来越多,可以更加有效地指导地面的作业。
然而,在数据的压缩传输方面少有研究,由于钻井液信道传输带宽有限、钻井液压力波信号的产生速率有待提高,因此,引进数据压缩技术成为大幅提高井下信息传输效率的有效途径。
由于随钻测量参数在一定时间以及一定的地层下具有相对的稳定性,而且仅仅使用有限的表示数字的符号(共11个),所以在对其进行压缩时,可以根据数字出现的频率,极大提高数据的压缩比,即压缩后的二进制数据的长度将更短,从而保证了其传输的高效性。
Huffman编码是1952年由Huffman提出的一种无损数据压缩技术,是基于统计模型的数据压缩技术,是无损压缩当中最好的方法之一。它使用二进制来替换每个符号,长度由每个符号出现的频率(权值)决定。Huffman编码充分考虑了被编码符号的统计特性,将出现概率大的符号转换为较短的二进制编码,将出现概率小的符号转换为较长的二进制编码,从而实现对字符的压缩。Huffman压缩和解压缩是通过Huffman树来实现的,工作过程包括以下步骤:
1)Huffman树的构造
Huffman树,即带权路径长度最短的树。其构造步骤如下:
①根据给定的n个权值{w1,w2,……wn},构造n棵只有根结点的二叉树,令其权值为wj
②在森林中选取两棵根结点权值最小的树作为左右子树,构造一棵新的二叉树,置新二叉树根结点的权值为其左右子树根结点权值之和;
③在森林中删除这两棵树,同时将新得到的二叉树加入森林中;
④重复上述②、③两步,直到只含一棵树为止,这棵树即Huffman树。
2)Huffman压缩
首先,要根据Huffman树获得Huffman编码表,方法是从根节点开始遍历树,左孩子的所有路径标注为0,右孩子的所有路径标注为1。最后,再根据生成的Huffman树对数据进行编码,方法是从叶子结点开始向根结点回溯,组合路径上所有的符号(0或1),即可得到该叶子结点对应符号的编码。
3)Huffman解码
解码的过程本质上就是一个遍历二叉树的过程,一直遍历到叶子结点,此时完成第一个字符的解码;接着再重新从树根开始遍历二叉树,一直再遍历到叶子结点,此时完成第二个字符的解码;直到所有的二进制都遍历完毕为止。
本发明采用Huffman技术对数据进行压缩,从而实现随钻测量系统的高效传输,实验证明通过Huffman编码得到的数据压缩比可以满足实际应用需求,具有广泛的应用意义。
发明内容:
本发明所要解决的技术问题是提供一种用于随钻测量系统中数据压缩的方法,实现高效的数据传输。
1、一种用于随钻测量系统数据压缩的方法,其特征在于对随钻测量中从井下向地面传递的参数采用Huffman编码,发送方在井下自动计算在传输周期内各个字符出现的概率,如果符号出现的概率有了较大变化则择期将其发送到地面主控计算机,同时修改自己的Huffman编码,具体实现包括以下8个步骤:
A.系统初始化
在第一次使用系统发送编号为i的数据报Pi时,需要对其参数进行初始化,主要包括:
1)权值和编码初始化
12个字符的权值都设置为1,各字符对应的Huffman编码如下表所示;
字符 0 1 2 3 4 5 6 7 8 9 . -
编码 000 001 010 011 1000 1001 1010 1011 1100 1101 1110 1111
2)设定时间周期
用户可以设定每类数据报的Huffman编码的更新周期,只有自上次重构编码后的时间超过这个更新周期,系统才重新计算是否需要更新Huffman编码;
3)标准差阈值
只有当在新的一个发送周期内所有12个字符的概率标准差超过这个阈值,才更新Huffman编码,否则如果在很长时间内字符的概率变化很少,即使到了更新周期,也不更新;
B.发送数据
完成数据报的封装、压缩、校验和发送;
C.修改该序号的数据报的权值
每发送完一个数据报,系统都重新更新该序号的报文中所涉及到的所有字符的权值,但,不重新计算Huffman编码;
D.判断自上次重构编码后的时间是否大于设定时间周期
只有在经过设定时间周期,才考虑是否更新Huffman编码,否则再转回步骤B,继续发送后续数据;
E.计算所有字符的权值的标准差
标准差的计算公式为:
α = Σ 1 n ( x i - x ‾ ) 2 n , - - - ( 1 )
其中xi为第i个字符当前的权值,为每个字符当前权值的平均值,1≤i≤12;
F.判断标准差是否大于设定阈值
如果计算出的标准差很大,此时就需要重新计算Huffman编码,如果标准差变化不大,即使到了Huffman编码更新周期也不更新,此时再转回步骤B,继续发送后续数据;
G.发送该序号数据报的Huffman权值表
Huffman权值表的数据报,采用下表所示的格式(数据报编号为99),
其中:
1)数据报类型标识:使用“1”,说明发送的是完全数据报,要求地面主控计算机使用支持重传的否定确认协议,确保井下和地面Huffman编码的一致性;
2)数据域定界:表明后边各个域中字符的长度,其中第一位一定为2,因为数据报编号为99,长度为2;第2位为0、1或者2表示编号的长度,因为编号最大为99,所以长度最大为2;后边12个域的长度最大为2,即数据域定界后12位的取值只能是0、1、2;
3)数据报编号:取固定值,99;
4)编号:指定当前发送的权值表是属于哪个数据报的,即数据报的编号;
H.对本地该序号的数据报的字符重新进行Huffman编码
重新按照Huffman编码的规则,构造Huffman树,重新编码,该步骤在井下和地面主控计算机同时进行;如果地面接收站没有正确接收到该数据报,则地面主控计算机会发送一个否认帧,此时井下接收到该否认帧后,需要重新发送Huffman权值表和随后已经发送的使用新的Huffman编码发送的所有数据。
附图说明:
图1Huffman编码表的更新过程。
图2 系统初始化时生成的Huffman树。
图3 实施例中采用的字符的Huffman树。
具体实施方式:
结合附图说明其具体实现方式。
在随钻测量中从井下向地面传递的参数均为数值型数据,所以只用到10个数字、负号(-)、和小数点(.),共12个字符,所以只需要对这12个字符进行Huffman编码即可。随钻测量数据在某个时间段内具有一定的稳定性,即参数的取值变化不大。这样,字符出现的频率也就相对稳定。发送方在井下自动计算在某个周期内,各个字符出现的概率,如果符号出现的概率有了较大变化则择期将其发送到地面主控计算机,同时修改自己的Huffman编码,其更新流程图如图所示,具体实现步骤包括以下8个步骤:
1.系统初始化
在第一次使用系统发送编号为i的数据报Pi时,需要对其参数进行初始化,主要包括:
1)权值和编码初始化
12个字符的权值都设置为1,这样生成的Huffman树的形状如图所示,各字符对应的Huffman编码如下表所示。
字符 0 1 2 3 4 5 6 7 8 9 . -
编码 000 001 010 011 1000 1001 1010 1011 1100 1101 1110 1111
例如,如果需要发送数值“0.34”,则压缩码为“00011100111000”;如果地面主控计算机收到的是“001010”,则解码结果为“12”。
2)设定时间周期
用户可以设定每类数据报的Huffman编码的更新周期,只有自上次重构编码后的时间超过这个更新周期,系统才重新计算是否需要更新Huffman编码。
3)标准差阈值
只有当在新的一个发送周期内所有12个字符的概率标准差超过这个阈值,才更新Huffman编码。否则如果在很长时间内字符的概率变化很少,即使到了更新周期,也不更新。
2.发送数据
在该模块内完成数据报的封装、压缩、校验和发送。
3.修改该序号的数据报的权值
每发送完一个数据报,系统都重新更新该序号的报文中所涉及到的所有字符的权值,注意只是更新权值,并不重新计算Huffman编码。
4.判断自上次重构编码后的时间是否大于设定时间周期
因为在很长一段时间内或者在某个地层上参数的取值都会保持相对稳定,而且考虑到尽量减少Huffman权值表发送的次数,所以并不是每次发送完数据报都更新Huffman编码,只有在经过某个已经设定的时间周期后,才考虑是否更新Huffman编码,否则再转回第2步,继续发送后续数据。
5.计算所有字符的权值的标准差
标准差的计算公式为:
α = Σ 1 n ( x i - x ‾ ) 2 n , - - - ( 1 )
其中xi为第i个字符当前的权值,为每个字符当前权值的平均值,1≤i≤12。
6.判断标准差是否大于设定阈值
如果计算出的标准差很大,说明各个字符的出现概率发生了很大的变化,此时就需要重新计算Huffman编码。如果标准差变化不大,即使到了Huffman编码更新周期,也不更新,此时再转回第2步,继续发送后续数据。
7.发送该序号数据报的Huffman权值表
Huffman权值表的数据报,采用下表所示的格式(假定数据报编号为99)。
其中:
(1)数据报类型标识:使用“1”,说明发送的是完全数据报,要求地面主控计算机使用支持重传的否定确认协议,确保井下和地面Huffman编码的一致性。
(2)数据域定界:表明后边各个域中字符的长度,其中第一位一定为2,因为数据报编号为99,长度为2。第2位为0、1或者2表示编号的长度,因为编号最大为99,所以长度最大为2。后边12个域的长度最大为2,即数据域定界后12位的取值只能是0、1、2。
(3)数据报编号:取固定值,99。
(4)编号:指定当前发送的权值表是属于哪个数据报的,即数据报的编号。
8.对本地该序号的数据报的字符重新进行Huffman编码
重新按照Huffman编码的规则,构造Huffman树,重新编码。该步骤在井下和地面主控计算机同时进行,这样保证下次发送的数据采用的是新的Huffman编码。
注意:如果地面接收站没有正确接收到该数据报,则地面主控计算机会发送一个否认帧,此时井下接收到该否认帧后,需要重新发送Huffman权值表和随后已经发送的使用新的Huffman编码发送的所有数据。
实施例
衡量数据压缩方法好坏的重要指标是压缩比,压缩比=压缩后代码长度/源代码长度×100%,其含义是被压缩后的代码占源代码的比例。为了对算法进行分析,选用某井测深从993.81米到1079.7米的10条井史资料进行分析。假设Huffman权值表如下表所示,根据该表产生的Huffman树如图3所示。根据该Huffman树生成的各个字符的Huffman编码如下表所示。
字符 0 1 2 3 4 5 6 7 8 9 . -
权值 16 17 18 5 4 10 5 5 8 3 5 3
编码 101 110 00 11111 11110 010 0110 0111 1110 10010 1000 10011
根据上表Huffman编码表对仿真的数据进行Huffman压缩的结果如下表所示(被方框框起来的部分是数据报报头)。
从整个数据报考虑:从上表中可以看出如果采用7位的ASCII进行传输,其长度明显比Huffman压缩的长。所有10条数据的平均压缩比为43%。另外,因为第1、6条是完全数据报,其Huffman编码的长度明显比增量数据报长。
仅考虑数据域:如果数据域使用浮点数进行表示,则为了表示倾斜角和方位角,共需要12+12=24位二进制。Huffman编码压缩后平均长度也才是15.5也明显小于用浮点数表示时的长度24。

Claims (1)

1.一种用于随钻测量系统数据压缩的方法,其特征在于对随钻测量中从井下向地面传递的参数采用Huffman编码,发送方在井下自动计算在传输周期内各个字符出现的概率,如果符号概率有了较大变化则择期将其发送到地面主控计算机,同时修改自己的Huffman编码,具体实现包括以下8个步骤:
A.系统初始化
在第一次使用系统发送编号为i的数据报Pi时,需要对其参数进行初始化,主要包括:
1)权值和编码初始化
12个字符的权值都设置为1,各字符对应的Huffman编码如下表所示;
字符 0 1 2 3 4 5 6 7 8 9 . - 编码 000 001 010 011 1000 1001 1010 1011 1100 1101 1110 1111
2)设定时间周期
用户可以设定每类数据报的Huffman编码的更新周期,只有自上次重构编码后的时间超过这个更新周期,系统才重新计算是否需要更新Huffman编码;
3)标准差阈值
只有当在新的一个发送周期内所有12个字符的概率标准差超过这个阈值,才更新Huffman编码,否则如果在很长时间内字符的概率变化很少,即使到了更新周期,也不更新;
B.发送数据
完成数据报的封装、压缩、校验和发送;
C.修改该序号的数据报的权值
每发送完一个数据报,系统都重新更新该序号的报文中所涉及到的所有字符的权值,但,不重新计算Huffman编码;
D.判断自上次重构编码后的时间是否大于设定时间周期
只有在经过设定时间周期,才考虑是否更新Huffman编码,否则再转回步骤B,继续发送后续数据;
E.计算所有字符的权值的标准差
标准差的计算公式为:
α = Σ 1 n ( x i - x ‾ ) 2 n , - - - ( 1 )
其中xi为第i个字符当前的权值,为每个字符当前权值的平均值,1≤i≤12;
F.判断标准差是否大于设定阈值
如果计算出的标准差很大,此时就需要重新计算Huffman编码,如果标准差变化不大,即使到了Huffman编码更新周期,也不更新,此时再转回步骤B,继续发送后续数据;
G.发送该序号数据报的Huffman权值表
Huffman权值表的数据报,采用下表所示的格式(数据报编号为99),
其中:
1)数据报类型标识:使用“1”,说明发送的是完全数据报,要求地面主控计算机使用支持重传的否定确认协议,确保井下和地面Huffman编码的一致性;
2)数据域定界:表明后边各个域中字符的长度,其中第一位一定为2,因为数据报编号为99,长度为2;第2位为0、1或者2表示编号的长度,因为编号最大为99,所以长度最大为2;后边12个域的长度最大为2,即数据域定界后12位的取值只能是0、1、2;
3)数据报编号:取固定值99;
4)编号:指定当前发送的权值表是属于哪个数据报的,即数据报的编号;
H.对本地该序号的数据报的字符重新进行Huffman编码
重新按照Huffman编码的规则,构造Huffman树,重新编码,该步骤在井下和地面主控计算机同时进行;如果地面接收站没有正确接收到该数据报,则地面主控计算机会发送一个否认帧,此时井下接收到该否认帧后,需要重新发送Huffman权值表和随后已经发送的使用新的Huffman编码发送的所有数据。
CN201410532348.5A 2014-10-10 2014-10-10 一种用于随钻测量系统数据压缩的方法 Pending CN104410425A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410532348.5A CN104410425A (zh) 2014-10-10 2014-10-10 一种用于随钻测量系统数据压缩的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410532348.5A CN104410425A (zh) 2014-10-10 2014-10-10 一种用于随钻测量系统数据压缩的方法

Publications (1)

Publication Number Publication Date
CN104410425A true CN104410425A (zh) 2015-03-11

Family

ID=52648026

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410532348.5A Pending CN104410425A (zh) 2014-10-10 2014-10-10 一种用于随钻测量系统数据压缩的方法

Country Status (1)

Country Link
CN (1) CN104410425A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109356570A (zh) * 2018-11-22 2019-02-19 长江大学 钻井导向参数的传输方法及设备
CN109690358A (zh) * 2016-08-01 2019-04-26 通用电气(Ge)贝克休斯有限责任公司 声反射图像的实时图案识别和自动解释
CN113346910A (zh) * 2021-06-04 2021-09-03 上海天旦网络科技发展有限公司 基于标准差的统计数据压缩方法和系统
CN114629504A (zh) * 2021-08-05 2022-06-14 中国石油天然气集团有限公司 基于fpga的井下随钻数据压缩方法和系统
CN114704247A (zh) * 2022-06-07 2022-07-05 西安钰雪石油科技有限公司 油气井液面智能监测方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102231696A (zh) * 2011-05-23 2011-11-02 中国石油大学(华东) 一种用于随钻测量系统数据报报文封装的方法
US20140286538A1 (en) * 2013-03-25 2014-09-25 Schlumberger Technology Corporation LWD Real-Time Borehole Image Transmission

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102231696A (zh) * 2011-05-23 2011-11-02 中国石油大学(华东) 一种用于随钻测量系统数据报报文封装的方法
US20140286538A1 (en) * 2013-03-25 2014-09-25 Schlumberger Technology Corporation LWD Real-Time Borehole Image Transmission

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李忠伟: "井下钻井液压力连续波信号传输机理及技术研究", 《万方学位论文数据库》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109690358A (zh) * 2016-08-01 2019-04-26 通用电气(Ge)贝克休斯有限责任公司 声反射图像的实时图案识别和自动解释
CN109690358B (zh) * 2016-08-01 2022-04-12 通用电气(Ge)贝克休斯有限责任公司 声反射图像的实时图案识别和自动解释
CN109356570A (zh) * 2018-11-22 2019-02-19 长江大学 钻井导向参数的传输方法及设备
CN109356570B (zh) * 2018-11-22 2022-06-17 长江大学 钻井导向参数的传输方法及设备
CN113346910A (zh) * 2021-06-04 2021-09-03 上海天旦网络科技发展有限公司 基于标准差的统计数据压缩方法和系统
CN114629504A (zh) * 2021-08-05 2022-06-14 中国石油天然气集团有限公司 基于fpga的井下随钻数据压缩方法和系统
CN114629504B (zh) * 2021-08-05 2024-04-30 中国石油天然气集团有限公司 基于fpga的井下随钻数据压缩方法和系统
CN114704247A (zh) * 2022-06-07 2022-07-05 西安钰雪石油科技有限公司 油气井液面智能监测方法及装置
CN114704247B (zh) * 2022-06-07 2022-08-16 西安钰雪石油科技有限公司 油气井液面智能监测方法及装置

Similar Documents

Publication Publication Date Title
CN104410425A (zh) 一种用于随钻测量系统数据压缩的方法
CN102231696B (zh) 一种用于随钻测量系统数据报报文封装的方法
CN110222373B (zh) 一种面向岩土工程全生命周期的工程勘察数据处理方法
US20240118451A1 (en) Optimization under uncertainty for integrated models
US6606554B2 (en) Method and apparatus for defining location coordinates
CN104539393A (zh) 一种基于极化码的信源编码方法
Yang et al. Fixed-slope universal lossy data compression
JP6704929B2 (ja) 組み合わせハイパーマップベースのデータ表現および演算のための装置および方法
CN108804804A (zh) 一种基于数字河网的大数量子流域快速编码方法
CN113095593B (zh) 钻井井壁状态确定方法、装置及设备
CN104598649A (zh) 地理位置编码方法
CN102496059A (zh) 矿山竖井工程围岩人工智能分级方法
CN102664639B (zh) 一种分布式lt码的编码方法
CN117034865B (zh) 一种市政工程设计数据优化处理方法
Ghanbarian et al. Habitat suitability mapping of Artemisia aucheri Boiss based on the GLM model in R
CN101294491B (zh) 一种井下信息自适应传输方法和系统
El Assi et al. Resource-efficient floating-point data compression using MAS in WSN
CN104065460A (zh) 基于二叉树的编码方法和编码装置
CN104301070A (zh) 一种用于随钻测量系统数据检错纠错的方法
Ashley et al. Geological prediction and updating in tunneling-a probabilistic approach
MX2014009202A (es) Metodo para llevar a cabo correccion de errores de datos rmn.
Chourushi et al. A critical review of hydrological modeling practices for flood management
CN115797589A (zh) 一种模型的渲染方法、装置、电子设备及存储介质
CN115967750A (zh) 用于随钻数据的压缩和传输方法、压缩装置和存储介质
CN110792435B (zh) 一种泥浆脉冲的快速编码方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150311

WD01 Invention patent application deemed withdrawn after publication