CN111213146B - 伪数据生成装置、其方法和记录介质 - Google Patents
伪数据生成装置、其方法和记录介质 Download PDFInfo
- Publication number
- CN111213146B CN111213146B CN201880066293.XA CN201880066293A CN111213146B CN 111213146 B CN111213146 B CN 111213146B CN 201880066293 A CN201880066293 A CN 201880066293A CN 111213146 B CN111213146 B CN 111213146B
- Authority
- CN
- China
- Prior art keywords
- value
- attribute
- dummy data
- data
- numeric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000007493 shaping process Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 description 25
- 238000003860 storage Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 241000039077 Copula Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种伪数据生成装置,根据编码规则将原始数据中包含的类别属性的值编码为数值属性的值;使用用于数值属性的伪数据生成方法,根据编码后的原始数据生成第一伪数据;在第一伪数据中包含的、与类别属性的值对应的数值属性的值超过该数值属性的值可取的值的范围的情况下,将该数值属性的值转换为包含于该数值属性的值可取的值的范围的值;根据编码规则,将转换后的第一伪数据中包含的与类别属性的值对应的数值属性的值解码为类别属性的值,作为伪数据。
Description
技术领域
本发明涉及伪数据生成装置、其方法和记录介质。
背景技术
在隐私保护领域中,在由于安全等问题而不能处理包含个人信息的原始数据的情况下,有时作为代用而生成伪数据来进行分析等。这里,考虑根据表形式的原始数据生成表形式的伪数据的情形。表形式的数据的例子如图1所示。将表形式的数据视为矩阵,将行向量称为记录,将列向量称为属性。原始数据和伪数据的行数有时不同,但列数相同。将原始数据的行数设为n>0,将伪数据的行数设为n'>0。设在原始数据和伪数据中仅存储字符串。
如图1所示,表形式的数据中有时包含年龄、身高、体重等数值属性、以及职业、最终学历、血型等类别属性。以往,在想要生成的伪数据是仅具有数值属性的表的情况下,存在通过以能够保持原始数据内的属性间的关系性(方差-协方差或相关等)的方式对随机数组进行整形来生成伪数据的方法。此外,作为保持包含数值属性和类别属性的原始数据的全部属性间的关系性的伪数据的生成方法,已知有非专利文献1。在非专利文献1中,列举了存在于原始数据内的所有类别的组,按照该类别的每个组生成保持原始数据的数值属性的性质的伪数据,通过合并来保持原始数据整体的属性间的性质。
现有技术文献
非专利文献
非专利文献1:独立行政法人统计中心(独立行政法人統計センター),“教育用伪微观数据的开发及其利用~以平成16年全国消费实况调查为例~(教育用擬似ミクロデータの開発とその利用~平成16年全国消費実態調査を例として~)”、2012年.
发明内容
发明所要解决的课题
然而,在基于现有技术的包含类别属性的伪数据的生成中,需要生成与原始数据中存在的类别的组的数目相应的、保持属性间的性质的伪数据。因此,类别的组越增加,计算效率越差。
本发明的一个目的在于,提供一种对于包含类别属性的伪数据,也以与仅包含数值属性的伪数据同样的效率,生成保持包含类别属性的原始数据的所有属性间的关系性的伪数据的伪数据生成装置、其方法和程序。
用于解决课题的手段
为了解决上述课题,根据本发明的一个方式,一种伪数据生成装置,包括:编码单元,根据编码规则将原始数据中包含的类别属性的值编码为数值属性的值;数据整形单元,通过使用用于数值属性的伪数据生成方法,根据编码后的原始数据生成第一伪数据;转换单元,在第一伪数据中包含的、与类别属性的值对应的数值属性的值超过该数值属性的值可取的值的范围的情况下,将该数值属性的值转换为包含于该数值属性的值可取的值的范围的值;以及解码单元,用于根据编码规则将转换后的第一伪数据中包含的与类别属性的值对应的数值属性的值解码为类别属性的值,并作为伪数据。
为了解决上述课题,根据本发明的其他方式,一种伪数据生成装置进行的伪数据生成方法,包括:编码步骤,根据编码规则将原始数据中包含的类别属性的值编码为数值属性的值;数据整形步骤,通过使用用于数值属性的伪数据生成方法,根据编码后的原始数据生成第一伪数据;转换步骤,在第一伪数据中包含的、与类别属性的值对应的数值属性的值超过该数值属性的值可取的值的范围的情况下,将该数值属性的值转换为包含于该数值属性的值可取的值的范围的值;解码步骤,用于根据编码规则将转换后的第一伪数据中包含的与类别属性的值对应的数值属性的值解码为类别属性的值,并作为伪数据。
发明效果
根据本发明,起到如下效果:对于包含类别属性的伪数据,也能够以与仅包含数值属性的伪数据同样的效率,生成保持包含类别属性的原始数据的全部属性间的关系性的伪数据。
附图说明
图1是表示在本申请说明书中处理的表形式的数据的例子的图。
图2是第一实施方式的伪数据生成装置的功能框图。
图3是表示第一实施方式的伪数据生成装置的处理流程的例子的图。
图4是表示编码规则的例子的图。
图5是表示编码单元中的编码前的数据和编码后的数据的例子的图。
具体实施方式
以下,对本发明的实施方式进行说明。另外,在以下说明所使用的附图中,对具有相同功能的构成部和进行相同处理的步骤标注相同的符号,并省略重复说明。在以下的说明中,在文本中使用的符号“-”等原本应当直接记载在紧前的字符的正上方,但由于文本标记法的限制,记载在该字符的紧后。在式中,这些符号记载在本来的位置上。此外,以矢量或矩阵的各元素为单位进行的处理,只要没有特别说明,就适用于该矢量或该矩阵的所有元素。
<第一实施方式的要点>
对类别属性进行编码(例如二进制化)并转换为数值属性。例如,对原始数据的类别属性进行编码,转换为仅具有数值属性的表。通过用于任意的数值属性的伪数据生成方法,根据转换后的表生成仅具有数值属性的伪数据。通过将仅具有数值属性的伪数据的类别属性的数值解码为原类别值,生成包含类别属性的伪数据。由此,计算量较大的伪数据生成处理只需1次即可。因此,即使类别的组的数量增加,也能够高效地进行伪数据生成。换言之,由于能够一次性地进行保持属性间的性质的处理,因而计算效率提高。
<第一实施方式>
图2表示第一实施方式的伪数据生成装置的功能框图,图3表示其处理流程。
第一实施方式的伪数据生成装置包括编码单元110、编码规则存储单元120、数据整形单元130、转换单元140和解码单元150。
伪数据生成装置例如是在具有中央运算处理装置(中央处理器(CPU:CentralProcessing Unit))、主存储装置(随机存取内存(RAM:Random Access Memory))等的公知或专用的计算机中读入特殊的程序而构成的特殊的装置。伪数据生成装置例如在中央运算处理装置的控制下执行各个处理。输入到伪数据生成装置的数据和在各处理中得到的数据例如被存储在主存储装置中,主存储装置中存储的数据根据需要被读出到中央运算处理装置中而用于其他处理。伪数据生成装置的各处理单元的至少一部分可以由集成电路等硬件构成。伪数据生成装置所具备的各存储单元例如可以由RAM(Random Access Memory)等主存储装置、由硬盘或光盘或闪存(Flash Memory)那样的半导体存储元件构成的辅助存储装置、或者关系数据库或键-值存储(Key-Value Store)等中间件构成。
第一实施方式的伪数据生成装置将原始数据D和生成的伪数据中包含的记录数量n'作为输入,生成伪数据D'并将其输出。另外,以原始数据的各属性的直方图及二维交叉合计表、和伪数据的各属性的直方图及二维交叉合计表近似的方式生成伪数据D’。另外,近似的精度与包含在伪数据中的记录数量n'的大小相关,n'越大,近似的精度越容易变高。
以下,说明各单元的处理内容。
<编码规则存储单元120>
编码规则存储单元120存储编码规则。图4表示编码规则的例子。例如,编码规则表示码与类别属性的值的对应关系。
<编码单元110>
输入:原始数据D
输出:类别属性的各值被编码(数值矢量化)的表形式的数据(编码后的原始数据)X
编码单元110根据编码规则(例如参照图4)将原始数据D中包含的类别属性的值编码(数值矢量化)为数值属性的值(S110),输出编码后的原始数据X。图5表示编码前的原始数据和编码后的原始数据的例子。
例如,通过公知的1-of-K编码方式将原始数据D内的所有类别属性的值转换为数值矢量,输出转换后的原始数据X。
例如,1-of-K编码方式包括以下4种。这里,为了方便,记载为编码方式A、B、C、D。由于最终获得的伪数据D'的结果根据所使用的方法而不同,因而在本方法中,使用伪数据D'可以近似为原始数据D的方式。
编码方式A:当某属性的可取的值为(S1、S2、S3)时,设S1=(0,0)、S2=(1,0)、S3=(0,1)的方法。在该方法中,能够使用长度p的比特串来表达2p种类别属性的值。
编码方式B:当某属性的可取的值为(S1、S2、S3)时,设S1=(1,0,0)、S2=(0,1,0)、S3=(0,0,1)的方法。在该方法中,能够使用长度p的比特串来表达p种类别属性的值。
编码方式C:当某属性的可取的值为(S1、S2、S3)时,设S1=0、S2=1、S3=2的方法。
编码方式D:当某属性的可取的值为(S1、S2、S3)时,设S1=1、S2=2、S3=3的方法。在编码方式C、D中,能够使用p个数值来表达p种类别属性的值。
例如,在图4中使用编码方式D。
<数据整形单元130>
输入:编码后的原始数据X,伪数据中包含的记录数n'
输出:第一伪数据Y
数据整形单元130使用用于数值属性的伪数据生成方法,根据编码后的原始数据X生成包含期望的记录数量n'的第一伪数据Y(S130),并输出。在用于数值属性的伪数据生成方法中能够利用各种公知的技术。例如,能够利用参考文献1或参考文献2的方法。
(参考文献1)Zhengli Huang,Wenliang Du,and Biao Chen."Deriving privateinformation from randomized data",In Proceedings of the 2005 ACM SIGMODinternational conference on Management of data,pp.37-48.ACM,2005.
(参考文献2)Haoran Li,Li Xiong,and Xiaoqian Jiang"Differentiallyprivate synthesization of multi-dimensional data using copula functions",InAdvances in database technology:proceedings.International Conference onExtending Database Technology,Vol.2014,p.475.NIH Public Access,2014.
<转换单元140>
输入:第一伪数据Y
输出:转换后的第一伪数据Z
在包含在第一伪数据Y中的与类别属性的值对应的数值属性的值超过该数值属性的值可取的值的范围的情况下,转换单元140将该数值属性的值转换为包含在该数值属性的值可取的值的范围中的值(S140),并输出转换后的第一伪数据Z。
第一伪数据Y内的类别属性部分的值可能在数据整形单元130中变为不是原来的码的格式。因此,转换单元140在第一伪数据Y中的类别属性部分的值不是原来的码的格式的情况下,重新格式化为原来的码的格式。以下,表示其例子。
(在编码单元110中,使用编码方式A、B的情况)
将第i个记录中的第j个长度lj的类别属性的值设为Sj (i)=(s1 (i),s2 (i),···,sl_j (i))(其中,下标l_j表示lj),设:
此时,确认各Sj (i)的各要素是否超过s- j,如果有超过的要素,则将超过的要素集合内的最大值设为1,将除此以外的全部要素设为0。如果没有超过的要素,则使所有的要素为0。但是,也可以是使s- j为任意值的方法。
(在编码单元110中,使用编码方式C的情况)
将第i个记录中的第j个长度lj的类别属性的值设为Sj (i)。此时,如果各Sj (i)是比0小的值,则设为Sj (i)←0,如果是比lj-1大的值,则设为Sj (i)←lj-1。另外,如果0≤Sj (i)≤lj-1,则直接使用Sj (i)的整数部分。
(在编码单元110中,使用编码方式D的情况)
将第i个记录中的第j个长度lj的类别属性的值设为Sj (i)。此时,如果各Sj (i)是比1小的值,则设为Sj (i)←1,如果是比lj大的值,则设为Sj (i)←lj。另外,如果1≤Sj (i)≤lj,则直接使用Sj (i)的整数部分。
<解码单元150>
输入:转换后的第一伪数据Z
输出:将转换后的第一伪数据Z内的数值化后的类别属性解码为类别值的表形式的伪数据D'
解码单元150根据编码规则(参照图4)将与转换后的第一伪数据Z中包含的类别属性的值对应的数值属性的值解码为类别属性的值(S150),并作为伪数据D’输出。
例如,由于上述编码方式A、B、C、D是双射(一一对应),因而如果保持其对应关系,则也能够唯一地进行相反的操作(解码)。
<效果>
根据以上的结构,对于包含类别属性的伪数据,也能够以与仅包含数值属性的伪数据同样的效率,生成保持包含类别属性的原始数据的全部属性间的关系性的伪数据。
<其他变形例>
本发明不限于上述实施方式和变形例。例如,上述的各种处理不仅可以按照记载按时序执行,也可以根据执行处理的装置的处理能力或者根据需要并行或者单独地执行。此外,在不脱离本发明的宗旨的范围内能够进行适当的变更。
<程序和记录介质>
此外,也可以通过计算机来实现在上述实施方式以及变形例中说明的各装置中的各种处理功能。在这种情况下,各装置应具有的功能的处理内容由程序记述。而且,通过用计算机执行该程序,在计算机上实现上述各装置的各种处理功能。
能够将描述了该处理内容的程序记录在计算机可读取的记录介质中。作为计算机可读取的记录介质,例如可以是磁记录装置、光盘、光磁记录介质、半导体存储器等任意的记录介质。
此外,该程序的流通例如通过对记录有该程序的DVD、CD-ROM等便携式记录介质进行销售、转让、出借等来进行。进而,也可以将该程序预先存储在服务器计算机的存储装置中,经由网络从服务器计算机向其他计算机传送该程序,从而使该程序流通。
执行这样的程序的计算机例如首先将记录在便携型记录介质中的程序或从服务器计算机传送的程序暂时存储在自己的存储单元中。然后,在执行处理时,该计算机读取存储在自身的存储单元中的程序,执行按照所读取的程序的处理。此外,作为该程序的另一实施方式,也可以设为计算机从便携式记录介质直接读取程序,执行按照该程序的处理。进而,也可以设为在每次从服务器计算机向该计算机传送程序时,逐次执行按照接收到的程序的处理。此外,也可以构成为,不从服务器计算机向该计算机进行程序的传送,而通过仅根据其执行指示和结果获取来实现处理功能的所谓ASP(Application Service Provider)型的服务,来执行上述的处理。另外,设为在程序中,包含作为用于基于电子计算机的处理的信息的、等同于程序的信息(不是对于计算机的直接指令,而是具有规定计算机的处理的性质的数据等)。
此外,设为通过在计算机上执行规定的程序来构成各装置,但也可以设为通过硬件来实现这些处理内容的至少一部分。
Claims (3)
1.一种伪数据生成装置,用于生成保持包含类别属性的原始数据中的所有属性之间的关系的伪数据,包括:
编码单元,根据编码规则将原始数据中包含的类别属性的值编码为仅由数值属性的值构成的编码;
数据整形单元,使用用于数值属性的伪数据生成方法,根据编码后的原始数据生成第一伪数据;
转换单元,在所述第一伪数据中包含的、与所述类别属性的值对应的所述数值属性的值超过该数值属性的值可取的值的范围的情况下,将该数值属性的值转换为包含于该数值属性的值可取的值的范围的值;以及
解码单元,根据所述编码规则,将转换后的第一伪数据中包含的与所述类别属性的值对应的所述数值属性的值解码为类别属性的值作为伪数据。
2.一种由伪数据生成装置进行的伪数据生成方法,所述伪数据生成装置用于生成保持包含类别属性的原始数据中的所有属性之间的关系的伪数据,该伪数据生成方法包括:
编码步骤,根据编码规则将原始数据中包含的类别属性的值编码为仅由数值属性的值构成的编码;
数据整形步骤,使用用于数值属性的伪数据生成方法,根据编码后的原始数据生成第一伪数据;
转换步骤,在所述第一伪数据中包含的、与所述类别属性的值对应的所述数值属性的值超过该数值属性的值可取的值的范围的情况下,将该数值属性的值转换为包含于该数值属性的值可取的值的范围的值;以及
解码步骤,根据所述编码规则,将转换后的第一伪数据中包含的与所述类别属性的值对应的所述数值属性的值解码为类别属性的值作为伪数据。
3.一种计算机可读取的记录介质,存储了程序,该程序用于使计算机作为权利要求1的伪数据生成装置发挥作用。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017199200 | 2017-10-13 | ||
JP2017-199200 | 2017-10-13 | ||
PCT/JP2018/037309 WO2019073912A1 (ja) | 2017-10-13 | 2018-10-05 | 擬似データ生成装置、その方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111213146A CN111213146A (zh) | 2020-05-29 |
CN111213146B true CN111213146B (zh) | 2024-05-03 |
Family
ID=66100802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880066293.XA Active CN111213146B (zh) | 2017-10-13 | 2018-10-05 | 伪数据生成装置、其方法和记录介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20200257824A1 (zh) |
EP (1) | EP3696704B1 (zh) |
JP (1) | JP6904426B2 (zh) |
CN (1) | CN111213146B (zh) |
WO (1) | WO2019073912A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11983201B2 (en) * | 2019-09-27 | 2024-05-14 | International Business Machines Corporation | Creating a metatype tree for metatype introspection |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101505318A (zh) * | 2009-03-18 | 2009-08-12 | 飞拓无限信息技术(北京)有限公司 | 用户属性鉴别方法和装置 |
CN103577195A (zh) * | 2013-11-14 | 2014-02-12 | 中国联合网络通信集团有限公司 | 一种软件需求分析量化方法及系统 |
CN104011720A (zh) * | 2011-12-22 | 2014-08-27 | 株式会社日立制作所 | 行动属性分析方法以及装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7672967B2 (en) * | 2005-02-07 | 2010-03-02 | Microsoft Corporation | Method and system for obfuscating data structures by deterministic natural data substitution |
JP4575416B2 (ja) * | 2007-10-29 | 2010-11-04 | みずほ情報総研株式会社 | テストデータ生成システム、テストデータ生成方法及びテストデータ生成プログラム |
JP5620984B2 (ja) * | 2009-06-10 | 2014-11-05 | アビニシオ テクノロジー エルエルシー | テストデータの生成方法 |
JP2011034264A (ja) * | 2009-07-31 | 2011-02-17 | Hitachi Solutions Ltd | 個人情報マスキングシステム |
US8364124B2 (en) * | 2010-02-18 | 2013-01-29 | Tekelec, Inc. | Methods, systems, and computer readable media for tokenization of multimedia messages |
US9052358B2 (en) * | 2012-01-27 | 2015-06-09 | Portland State University | Copula-based system and method for management of manufacturing test and product specification throughout the product lifecycle for electronic systems or integrated circuits |
JP6532829B2 (ja) * | 2016-01-15 | 2019-06-19 | 日本電信電話株式会社 | 撹乱データ再構築誤差推定装置、撹乱データ再構築誤差推定方法、プログラム |
-
2018
- 2018-10-05 WO PCT/JP2018/037309 patent/WO2019073912A1/ja unknown
- 2018-10-05 US US16/753,037 patent/US20200257824A1/en active Pending
- 2018-10-05 JP JP2019548170A patent/JP6904426B2/ja active Active
- 2018-10-05 EP EP18865739.9A patent/EP3696704B1/en active Active
- 2018-10-05 CN CN201880066293.XA patent/CN111213146B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101505318A (zh) * | 2009-03-18 | 2009-08-12 | 飞拓无限信息技术(北京)有限公司 | 用户属性鉴别方法和装置 |
CN104011720A (zh) * | 2011-12-22 | 2014-08-27 | 株式会社日立制作所 | 行动属性分析方法以及装置 |
CN103577195A (zh) * | 2013-11-14 | 2014-02-12 | 中国联合网络通信集团有限公司 | 一种软件需求分析量化方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
EP3696704A1 (en) | 2020-08-19 |
CN111213146A (zh) | 2020-05-29 |
US20200257824A1 (en) | 2020-08-13 |
WO2019073912A1 (ja) | 2019-04-18 |
JP6904426B2 (ja) | 2021-07-14 |
EP3696704B1 (en) | 2022-07-13 |
JPWO2019073912A1 (ja) | 2020-10-22 |
EP3696704A4 (en) | 2021-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9298722B2 (en) | Optimal sequential (de)compression of digital data | |
US20170024466A1 (en) | System and method for natural language processing using synthetic text | |
CN112020737B (zh) | 秘密聚合总计系统及其方法、秘密计算装置、记录介质 | |
US9244935B2 (en) | Data encoding and processing columnar data | |
Chen | Scalable spectral clustering with cosine similarity | |
CN111213146B (zh) | 伪数据生成装置、其方法和记录介质 | |
CN111898135A (zh) | 数据处理方法、数据处理装置、计算机设备和介质 | |
Pan et al. | Improved CNN‐Based Hashing for Encrypted Image Retrieval | |
JP2006351001A (ja) | コンテンツ特徴量抽出方法及び装置及びコンテンツ同一性判定方法及び装置 | |
CN114328898A (zh) | 文本摘要生成方法及其装置、设备、介质、产品 | |
CN104133883B (zh) | 电话号码归属地数据压缩方法 | |
Tang et al. | OPPR: An outsourcing privacy-preserving JPEG image retrieval scheme with local histograms in cloud environment | |
EP3246900B1 (en) | Matrix and key generation device, matrix and key generation system, matrix coupling device, matrix and key generation method, and program | |
CN109923549A (zh) | 处理倒排索引的可搜索对称加密系统和方法 | |
Kamiński et al. | Compatibility conditions and the convolution of functions and generalized functions | |
CN114065269A (zh) | 无绑定型非同质化代币的生成方法和解析方法和存储介质 | |
JP6780428B2 (ja) | 符号化プログラム、符号化方法、符号化装置、復号化プログラム、復号化方法および復号化装置 | |
Waidyasooriya et al. | Efficient data transfer scheme using word-pair-encoding-based compression for large-scale text-data processing | |
Thepade et al. | Performance gain of content based video retrieval technique using intermediate block truncation coding on different color spaces | |
JP7464499B2 (ja) | コード化装置、コード化方法及びコード化プログラム | |
CN116760545B (zh) | 一种基于量子随机数验证的智慧社区数据加密方法及系统 | |
CN111061731B (zh) | 一种加密数据全文检索方法 | |
US11212528B2 (en) | Bit string block encoder device, block decoder device, information processing device, program, block encoding method and block decoding method | |
Otoo et al. | New approaches to storing and manipulating multi-dimensional sparse arrays | |
Osadchyy et al. | Transformer Timer Coding Technology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |