CN110647505A - 一种基于指纹特征的计算机辅助密点标注方法 - Google Patents

一种基于指纹特征的计算机辅助密点标注方法 Download PDF

Info

Publication number
CN110647505A
CN110647505A CN201910773833.4A CN201910773833A CN110647505A CN 110647505 A CN110647505 A CN 110647505A CN 201910773833 A CN201910773833 A CN 201910773833A CN 110647505 A CN110647505 A CN 110647505A
Authority
CN
China
Prior art keywords
fingerprint
secret
point
feature
dense
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910773833.4A
Other languages
English (en)
Other versions
CN110647505B (zh
Inventor
张祯
吴国华
王秋华
袁理锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN201910773833.4A priority Critical patent/CN110647505B/zh
Publication of CN110647505A publication Critical patent/CN110647505A/zh
Application granted granted Critical
Publication of CN110647505B publication Critical patent/CN110647505B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明公开了一种基于指纹特征的计算机辅助密点标注方法。本发明方法首先利用已进行密点标注的文件中的密点构建密点库,对密点库中的密点计算密点指纹,并存入密点指纹库,然后计算待进行密点标注的文件的指纹特征,计算待标密文件的每个指纹特征和密点指纹库中的每个密点指纹的相似度,最后根据密点指纹的相似度,按照相似度从高到低进行排序,分别进行处理。本发明方法实现定密工作的规范化、精准化、细粒度标密,减轻人工定密的负担,提高了定密工作效率和定密准确度。

Description

一种基于指纹特征的计算机辅助密点标注方法
技术领域
本发明属于保密管理领域,涉及一种基于指纹特征的计算机辅助密点标注方法。
背景技术
对涉密文件进行密级标注是开展好保密管理各项工作的前提和基础。当前文件密级的设定多以人工定密方式为主。然而,通过人工方法进行文件密级的确定,不仅效率低下,而且极容易引起失误。人工定密还存在定密尺度把握困难,定密人的经验无法积累的问题。
另一方面,一个文件是否涉密以及该文件的密级是由文件所包含的具体涉密内容来决定的。文件中具体决定一个事项具备国家秘密本质属性的关键内容称为密点,一般表现为文字、数据、图表等。对涉密文件的密点内容标注密级称为密点标注。而当前对涉密文件进行密级标注的方式是对整个文件标注密级,而没有对文件的具体涉密内容进行密级标注,缺少对文件包含的具体涉密信息内容的有效保护。收到密级文件的用户,只知道整个文件是什么密级,并不知道文件中具体哪个段落、哪句话涉密,涉密的内容的密级分别是什么,也不清楚哪些内容不涉密。这给今后正确管理和使用该文件中的内容造成很大的不便,使得接收者在使用文件时对文件内容进行了不正确的引用,或可能凭个人主观判断,将自认为不涉密的内容按照非涉密文件处理,从而造成极大的失泄密隐患。因此,需要对文件具体涉密信息内容进行密点标注。而随着单位保密业务的开展,涉密电子文件数量不断增加,若仍然通过人工方式进行密点标注,不仅更加增加了定密人的负担,而且效率低下,难以满足保密工作便捷和高效的需求。所以,在人工定密的基础上,利用计算机辅助定密人员完成电子文件的密点标注工作,提高文档的定密效率,减轻定密工作人员的负担,是当前定密工作中的迫切需求。计算机辅助密点标注不仅可以为定密工作提供科学依据,保证保密工作的规范化、科学化和高效化,而且可以减少人为因素的影响,提高定密的准确度,实现涉密信息定密的数字化。
发明内容
本发明的目的是针对当前对涉密电子文件进行人工定密工作中存在的问题,提供一种基于指纹特征的计算机辅助密点标注方法,用于实现对涉密文件的具体涉密内容进行计算机辅助密点标注,实现定密工作的规范化、精准化、细粒度标密,减轻人工定密的负担,提高定密工作效率和定密准确度。
本发明方法包括以下步骤:
步骤(1).利用已进行密点标注的文件中的密点构建密点库;
密点库由已进行密点标注的文件中的密点构建,包括已进行密点标注的所有密点和该密点对应的密点属性;所述的密点为已进行密级标注的所有句子或段落,所述密点属性包括密级、保密期限、定密依据、定密人;
步骤(2).对密点库中的密点计算密点指纹,并存入密点指纹库;
步骤(3).计算待进行密点标注的文件的指纹特征;
步骤(4).计算待标密文件的每个指纹特征和密点指纹库中的每个密点指纹的相似度;
步骤(5).根据密点指纹的相似度,按照相似度从高到低进行排序,分别进行处理:
若相似度为1,则直接显示该密点指纹所对应的已标密点内容及其密级属性;
若相似度大于0小于1,将最为相似的一条或多条密点指纹所对应的已标密点内容返回给定密人;
若相似度为0,将无匹配结果信息发送定密人。
步骤(2)的具体方法是:
步骤(2.1).对密点库中的密点进行预处理:对已进行标注的密点进行分词,去噪声词,形成该密点的包括N个特征词的特征词序列;所述的噪声词包括停用词、标点符号、无用数字;
步骤(2.2).为特征词序列中的每个特征词根据其重要程度赋予不同的权重值;优选地,权重计算方法采用TF-IDF算法;
步骤(2.3).对特征词序列进行切割:首先设置大小为K的滑动窗口,然后对特征词序列进行切割,切割后每部分的长度为K个特征词,得到(N-K+1)个特征词集合,每个特征词集合包含K个特征词;
步骤(2.4).计算每个特征词集合的指纹特征,具体方法是:
(a).首先计算特征词集合中每个特征词的权重,重复的特征词的权重相加,并取权重值最大的前m个特征词;
(b).通过哈希算法计算选取出的前m个特征词中每个特征词的哈希值;
(c).对生成的哈希结果,按照特征词的权重形成m个加权数字串;
(d).将上述m个加权数字串进行累加,形成一个序列串;
(e).将序列串转变成(0,1)串,形成每个特征词集合最终的指纹特征,共得到(N-K+1)个指纹特征;将序列串转变成(0,1)串的方法:如果每一位大于0,则记为1,否则记为0;
步骤(2.5).计算密点的密点指纹:首先设置一个大小为W的滑动窗口,将每个窗口中符合设定规则的特征词集合的指纹特征保留下来,如果窗口中符合设定规则的指纹特征有两个或者多个,则保留最右边的那一个,形成密点的密点指纹;所述设定规则为窗口中最小的指纹特征值,或窗口中最大的指纹特征值。
步骤(3)的具体方法是:
步骤(3.1).对待进行密点标注的文件内容进行预处理:对文件进行分词,去噪声词,形成该文件的包括N′个特征词的特征词序列;
步骤(3.2).为特征词序列中的每个特征词根据其重要程度赋予不同的权重值;优选地,权重计算方法可选择TF-IDF算法;
步骤(3.3).对特征词序列进行切割:首先设置大小为K的滑动窗口,然后对特征词序列进行切割,切割后每部分的长度为K个特征词,得到(N′-K+1)个特征词集合,每个特征词集合包含K个特征词;
步骤(3.4).计算每个特征词集合的指纹特征,具体方法是:
(f).首先计算特征词集合中每个特征词的权重,重复的特征词的权重相加,并取权重值最大的前m个特征词;
(g).通过哈希算法计算选取出的前m个特征词中每个特征词的哈希值;
(h).对生成的哈希结果,按照特征词的权重形成m个加权数字串;
(i).将上述m个加权数字串进行累加,形成一个序列串;
(j).将序列串转变成(0,1)串,形成每个特征词集合最终的指纹特征,共得到(N′-K+1)个指纹特征;将序列串转变成(0,1)串的方法:如果每一位大于0,则记为1,否则记为0。
步骤(4)的具体方法是:用待进行密点标注的文件的每个指纹特征值和密点指纹库中的密点指纹进行匹配,计算相似度
Figure BDA0002174442970000031
n为指纹特征的长度,k为待进行密点标注的文件的指纹特征和密点指纹库中的密点指纹中相同的位数;相似度的值在0~1之间,值越大,则表示两个指纹特征的相似度越大,指纹所对应的文件内容越相似。
步骤(5)中通过相似度算法,若找到相匹配的已标注密点,则自动在待定密文件中高亮标注出指纹特征值所对应的文件所对应的待定密文件内的具体内容,并显示与该内容所对应的已标密点及其密级属性信息,并提供给定密人;所述的密级属性信息包括对应的密级、保密期限和定密依据。其中,对待定密文件中定密依据相同且位置相连的密点内容进行拼接显示。
本发明的有益效果在于:本发明利用技术手段解决了当前对涉密文件进行密点标注的问题,可以更好地帮助定密人员准确高效地完成密点标注工作。本发明将已标密点库和指纹特征相似度计算相结合实现辅助密点标注的功能,最大化地利用之前的密点标注结果,避免重复劳动,节省定密时间并在一定程度上提高定密质量(不同定密人员定密结果的学习借鉴)。本发明利用计算机的海量存储能力,快速计算和检索能力,结合定密专家的工作经验,实现了计算机对定密人员进行定密辅助,有效减少了人工定密所造成的定密结果不一致现象,提高了定密的质量和定密效率,填补了该方面的技术空白。
附图说明
图1为本发明方法的流程图;
图2为本发明方法系统组成示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明,但本发明保护范围不局限于以下所述。
如图1,一种基于指纹特征的计算机辅助密点标注方法,具体步骤如下:
步骤(1).利用已进行密点标注的文件中的密点构建密点库;
密点库由已进行密点标注的文件中的密点构建,包括已进行密点标注的所有密点和该密点对应的密点属性。密点为已进行密级标注的所有句子或段落,密点属性包括密级、保密期限、定密依据、定密人。
步骤(2).对密点库中的密点计算密点指纹,并存入密点指纹库。具体方法是:
步骤(2.1).对密点库中的密点进行预处理:对已进行标注的密点进行分词,去噪声词,形成该密点的包括N个特征词的特征词序列;噪声词包括停用词、标点符号、无用数字;
步骤(2.2).为特征词序列中的每个特征词根据其重要程度赋予不同的权重值;优选地,权重计算方法采用TF-IDF算法;
步骤(2.3).对特征词序列进行切割:首先设置大小为K的滑动窗口,然后对特征词序列进行切割,切割后每部分的长度为K个特征词,得到(N-K+1)个特征词集合,每个特征词集合包含K个特征词;
步骤(2.4).计算每个特征词集合的指纹特征,具体方法是:
(a).首先计算特征词集合中每个特征词的权重,重复的特征词的权重相加,并取权重值最大的前m个特征词,此步骤的作用是进行降维,以减少计算量;
(b).通过哈希算法计算选取出的前m个特征词中每个特征词的哈希值;
(c).对生成的哈希结果,按照特征词的权重形成m个加权数字串;
(d).将上述m个加权数字串进行累加,形成一个序列串;
(e).将序列串转变成(0,1)串,形成每个特征词集合最终的指纹特征,共得到(N-K+1)个指纹特征;将序列串转变成(0,1)串的方法:如果每一位大于0,则记为1,否则记为0;
步骤(2.5).计算密点的密点指纹:首先设置一个大小为W的滑动窗口,将每个窗口中符合设定规则的特征词集合的指纹特征保留下来,如果窗口中符合设定规则的指纹特征有两个或者多个,则保留最右边的那一个,形成密点的密点指纹。设定规则为窗口中最小的指纹特征值,或窗口中最大的指纹特征值。
步骤(3).计算待进行密点标注的文件的指纹特征,具体方法是:
步骤(3.1).对待进行密点标注的文件内容进行预处理:对文件进行分词,去噪声词,形成该文件的包括N′个特征词的特征词序列;
步骤(3.2).为特征词序列中的每个特征词根据其重要程度赋予不同的权重值;优选地,权重计算方法可选择TF-IDF算法;
步骤(3.3).对特征词序列进行切割:首先设置大小为K的滑动窗口,然后对特征词序列进行切割,切割后每部分的长度为K个特征词,得到(N′-K+1)个特征词集合,每个特征词集合包含K个特征词;
步骤(3.4).计算每个特征词集合的指纹特征,具体方法是:
(f).首先计算特征词集合中每个特征词的权重,重复的特征词的权重相加,并取权重值最大的前m个特征词,此步骤的作用是进行降维,以减少计算量;
(g).通过哈希算法计算选取出的前m个特征词中每个特征词的哈希值;
(h).对生成的哈希结果,按照特征词的权重形成m个加权数字串;
(i).将上述m个加权数字串进行累加,形成一个序列串;
(j).将序列串转变成(0,1)串,形成每个特征词集合最终的指纹特征,共得到(N′-K+1)个指纹特征;将序列串转变成(0,1)串的方法:如果每一位大于0,则记为1,否则记为0。
步骤(4).计算待标密文件的每个指纹特征和密点指纹库中的每个密点指纹的相似度,具体方法是:用待进行密点标注的文件的每个指纹特征值和密点指纹库中的密点指纹进行匹配,计算相似度
Figure BDA0002174442970000051
n为指纹特征的长度,k为待进行密点标注的文件的指纹特征和密点指纹库中的密点指纹中相同的位数;相似度的值在0~1之间,值越大,则表示两个指纹特征的相似度越大,指纹所对应的文件内容越相似。
步骤(5).根据密点指纹的相似度,按照相似度从高到低进行排序,分别进行处理:
若相似度为1,则直接显示该密点指纹所对应的已标密点内容及其密级属性;
若相似度大于0小于1,将最为相似的一条或多条密点指纹所对应的已标密点内容返回给定密人作为定密参考;
若相似度为0,将无匹配结果信息发送定密人,由定密人人工对该待标密点句进行判定是否涉密及密级。若判定为该句涉密,则将该句以及其密级属性存储到密点数据库中,供以后使用。
通过相似度算法,若找到相匹配的已标注密点,则自动在待定密文件中高亮标注出指纹特征值所对应的文件所对应的待定密文件内的具体内容,并显示与该内容所对应的已标密点及其密级属性信息,并提供给定密人做定密参考。密级属性信息包括对应的密级、保密期限和定密依据。其中,对待定密文件中定密依据相同且位置相连的密点内容进行拼接显示。
该方法通过计算机辅助密点标注系统完成,该系统用于对电子文件中的具体涉密内容进行计算机辅助密点标注。如图2,该系统具体包括密点指纹生成模块、文件指纹生成模块、相似度计算模块、密点标注模块、密点库和密点指纹库。
(1)密点指纹生成模块:用于对密点库中已标注密点计算密点指纹。
(2)文件指纹生成模块:用于计算待进行密点标注的文件的指纹。
(3)相似度计算模块:用于计算待标密文件的指纹特征和密点指纹库中密点指纹的相似度。
(4)密点标注模块:用于根据计算得到的相似度,按照相似度从高到低进行排序,按照相似度从高到低进行排序,按照相似度的高低,分别进行处理,若找到相匹配的已标注密点句,自动高亮标注出待定密文件内的具体涉密内容,供定密人参考。
(5)密点库:用于存储已进行密点标注的所有密点以及该密点对应的密点属性。
(6)密点指纹库:用于存储密点库中所有密点的密点指纹。

Claims (10)

1.一种基于指纹特征的计算机辅助密点标注方法,其特征在于,该方法具体步骤是:
步骤(1).利用已进行密点标注的文件中的密点构建密点库;
密点库由已进行密点标注的文件中的密点构建,包括已进行密点标注的所有密点和该密点对应的密点属性;所述的密点为已进行密级标注的所有句子或段落,所述密点属性包括密级、保密期限、定密依据、定密人;
步骤(2).对密点库中的密点计算密点指纹,并存入密点指纹库;
步骤(3).计算待进行密点标注的文件的指纹特征;
步骤(4).计算待标密文件的每个指纹特征和密点指纹库中的每个密点指纹的相似度;
步骤(5).根据密点指纹的相似度,按照相似度从高到低进行排序,分别进行处理:
若相似度为1,则直接显示该密点指纹所对应的已标密点内容及其密级属性;
若相似度大于0小于1,将最为相似的一条或多条密点指纹所对应的已标密点内容返回给定密人;
若相似度为0,将无匹配结果信息发送定密人。
2.如权利要求1所述的一种基于指纹特征的计算机辅助密点标注方法,其特征在于,步骤(2)的具体方法是:
步骤(2.1).对密点库中的密点进行预处理:对已进行标注的密点进行分词,去噪声词,形成该密点的包括N个特征词的特征词序列;
步骤(2.2).为特征词序列中的每个特征词根据其重要程度赋予不同的权重值;
步骤(2.3).对特征词序列进行切割:首先设置大小为K的滑动窗口,然后对特征词序列进行切割,切割后每部分的长度为K个特征词,得到(N-K+1)个特征词集合,每个特征词集合包含K个特征词;
步骤(2.4).计算每个特征词集合的指纹特征;
步骤(2.5).计算密点的密点指纹:首先设置一个大小为W的滑动窗口,将每个窗口中符合设定规则的特征词集合的指纹特征保留下来,如果窗口中符合设定规则的指纹特征有两个或者多个,则保留最右边的那一个,形成密点的密点指纹;所述设定规则为窗口中最小的指纹特征值,或窗口中最大的指纹特征值。
3.如权利要求1所述的一种基于指纹特征的计算机辅助密点标注方法,其特征在于,步骤(3)的具体方法是:
步骤(3.1).对待进行密点标注的文件内容进行预处理:对文件进行分词,去噪声词,形成该文件的包括N′个特征词的特征词序列;
步骤(3.2).为特征词序列中的每个特征词根据其重要程度赋予不同的权重值;
步骤(3.3).对特征词序列进行切割:首先设置大小为K的滑动窗口,然后对特征词序列进行切割,切割后每部分的长度为K个特征词,得到(N′-K+1)个特征词集合,每个特征词集合包含K个特征词;
步骤(3.4).计算每个特征词集合的指纹特征。
4.如权利要求1所述的一种基于指纹特征的计算机辅助密点标注方法,其特征在于,步骤(4)的具体方法是:用待进行密点标注的文件的每个指纹特征值和密点指纹库中的密点指纹进行匹配,计算相似度
Figure FDA0002174442960000021
n为指纹特征的长度,k为待进行密点标注的文件的指纹特征和密点指纹库中的密点指纹中相同的位数;相似度的值在0~1之间,值越大,则表示两个指纹特征的相似度越大,指纹所对应的文件内容越相似。
5.如权利要求1所述的一种基于指纹特征的计算机辅助密点标注方法,其特征在于,步骤(5)中通过相似度算法,若找到相匹配的已标注密点,则自动在待定密文件中高亮标注出指纹特征值所对应的文件所对应的待定密文件内的具体内容,并显示与该内容所对应的已标密点及其密级属性信息,并提供给定密人;所述的密级属性信息包括对应的密级、保密期限和定密依据。
6.如权利要求2所述的一种基于指纹特征的计算机辅助密点标注方法,其特征在于,步骤(2.4)的具体方法是:
(a).首先计算特征词集合中每个特征词的权重,重复的特征词的权重相加,并取权重值最大的前m个特征词;
(b).通过哈希算法计算选取出的前m个特征词中每个特征词的哈希值;
(c).对生成的哈希结果,按照特征词的权重形成m个加权数字串;
(d).将上述m个加权数字串进行累加,形成一个序列串;
(e).将序列串转变成(0,1)串,形成每个特征词集合最终的指纹特征,共得到(N-K+1)个指纹特征;将序列串转变成(0,1)串的方法:如果每一位大于0,则记为1,否则记为0。
7.如权利要求3所述的一种基于指纹特征的计算机辅助密点标注方法,其特征在于,步骤(3.4)的具体方法是:
(f).首先计算特征词集合中每个特征词的权重,重复的特征词的权重相加,并取权重值最大的前m个特征词;
(g).通过哈希算法计算选取出的前m个特征词中每个特征词的哈希值;
(h).对生成的哈希结果,按照特征词的权重形成m个加权数字串;
(i).将上述m个加权数字串进行累加,形成一个序列串;
(j).将序列串转变成(0,1)串,形成每个特征词集合最终的指纹特征,共得到(N′-K+1)个指纹特征;将序列串转变成(0,1)串的方法:如果每一位大于0,则记为1,否则记为0。
8.如权利要求2或3所述的一种基于指纹特征的计算机辅助密点标注方法,其特征在于:所述的噪声词包括停用词、标点符号、无用数字。
9.如权利要求2或3所述的一种基于指纹特征的计算机辅助密点标注方法,其特征在于,步骤(2.2)和步骤(3.2)的权重计算方法采用TF-IDF算法。
10.如权利要求5所述的一种基于指纹特征的计算机辅助密点标注方法,其特征在于,步骤(5)对待定密文件中定密依据相同且位置相连的密点内容进行拼接显示。
CN201910773833.4A 2019-08-21 2019-08-21 一种基于指纹特征的计算机辅助密点标注方法 Active CN110647505B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910773833.4A CN110647505B (zh) 2019-08-21 2019-08-21 一种基于指纹特征的计算机辅助密点标注方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910773833.4A CN110647505B (zh) 2019-08-21 2019-08-21 一种基于指纹特征的计算机辅助密点标注方法

Publications (2)

Publication Number Publication Date
CN110647505A true CN110647505A (zh) 2020-01-03
CN110647505B CN110647505B (zh) 2021-06-29

Family

ID=69009787

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910773833.4A Active CN110647505B (zh) 2019-08-21 2019-08-21 一种基于指纹特征的计算机辅助密点标注方法

Country Status (1)

Country Link
CN (1) CN110647505B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111353301A (zh) * 2020-02-24 2020-06-30 成都网安科技发展有限公司 辅助定密方法及装置
CN111538998A (zh) * 2020-03-31 2020-08-14 北京万里红科技股份有限公司 文本定密方法和装置、电子设备及计算机可读存储介质
CN112214262A (zh) * 2020-12-09 2021-01-12 南京中孚信息技术有限公司 基于浏览器插件实现对文档在线内容标注的方法及系统
CN112417501A (zh) * 2020-11-18 2021-02-26 中国电子科技集团公司第三十研究所 基于区块链的外网涉密文件检测方法
CN112417499A (zh) * 2020-11-18 2021-02-26 中国电子科技集团公司第三十研究所 基于区块链的内网密点提取及管理方法
CN113918974A (zh) * 2021-10-14 2022-01-11 南京中孚信息技术有限公司 一种基于文档指纹相似快速匹配方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004362123A (ja) * 2003-06-03 2004-12-24 Read Eng Kk 機密情報保護システム及び機密情報保護方法
CN102819604A (zh) * 2012-08-20 2012-12-12 徐亮 基于内容相关性的文件涉密内容检索、密级判定及标注方法
CN103093154A (zh) * 2013-02-06 2013-05-08 杭州电子科技大学 一种定密信息管理系统及定密信息管理方法
CN105260878A (zh) * 2015-09-23 2016-01-20 成都网安科技发展有限公司 辅助定密方法和装置
CN108984530A (zh) * 2018-07-23 2018-12-11 北京信息科技大学 一种网络敏感内容的检测方法及检测系统
CN110019640A (zh) * 2017-07-25 2019-07-16 杭州盈高科技有限公司 涉密文件检查方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004362123A (ja) * 2003-06-03 2004-12-24 Read Eng Kk 機密情報保護システム及び機密情報保護方法
CN102819604A (zh) * 2012-08-20 2012-12-12 徐亮 基于内容相关性的文件涉密内容检索、密级判定及标注方法
CN103093154A (zh) * 2013-02-06 2013-05-08 杭州电子科技大学 一种定密信息管理系统及定密信息管理方法
CN105260878A (zh) * 2015-09-23 2016-01-20 成都网安科技发展有限公司 辅助定密方法和装置
CN110019640A (zh) * 2017-07-25 2019-07-16 杭州盈高科技有限公司 涉密文件检查方法及装置
CN108984530A (zh) * 2018-07-23 2018-12-11 北京信息科技大学 一种网络敏感内容的检测方法及检测系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
项雪峰: ""基于关键词相关度的计算机辅助定密技术研究"", 《中国优秀硕士学位论文全文数据库 社会科学I辑》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111353301A (zh) * 2020-02-24 2020-06-30 成都网安科技发展有限公司 辅助定密方法及装置
CN111538998A (zh) * 2020-03-31 2020-08-14 北京万里红科技股份有限公司 文本定密方法和装置、电子设备及计算机可读存储介质
CN111538998B (zh) * 2020-03-31 2023-11-24 北京万里红科技有限公司 文本定密方法和装置、电子设备及计算机可读存储介质
CN112417501A (zh) * 2020-11-18 2021-02-26 中国电子科技集团公司第三十研究所 基于区块链的外网涉密文件检测方法
CN112417499A (zh) * 2020-11-18 2021-02-26 中国电子科技集团公司第三十研究所 基于区块链的内网密点提取及管理方法
CN112417499B (zh) * 2020-11-18 2022-04-22 中国电子科技集团公司第三十研究所 基于区块链的内网密点提取及管理方法
CN112214262A (zh) * 2020-12-09 2021-01-12 南京中孚信息技术有限公司 基于浏览器插件实现对文档在线内容标注的方法及系统
CN112214262B (zh) * 2020-12-09 2021-03-02 南京中孚信息技术有限公司 基于浏览器插件实现对文档在线内容标注的方法及系统
CN113918974A (zh) * 2021-10-14 2022-01-11 南京中孚信息技术有限公司 一种基于文档指纹相似快速匹配方法
CN113918974B (zh) * 2021-10-14 2024-04-12 南京中孚信息技术有限公司 一种基于文档指纹相似快速匹配方法

Also Published As

Publication number Publication date
CN110647505B (zh) 2021-06-29

Similar Documents

Publication Publication Date Title
CN110647505B (zh) 一种基于指纹特征的计算机辅助密点标注方法
WO2021135910A1 (zh) 基于机器阅读理解的信息抽取方法、及其相关设备
CN108664574B (zh) 信息的输入方法、终端设备及介质
CN104199965B (zh) 一种语义信息检索方法
CN111611775B (zh) 一种实体识别模型生成方法、实体识别方法及装置、设备
CN112380825B (zh) Pdf文档跨页表格合并方法、装置、电子设备及存储介质
DE102018007165A1 (de) Vorhersage von stilbrüchen innerhalb eines textinhalts
CN111291177A (zh) 一种信息处理方法、装置和计算机存储介质
CN113032552B (zh) 一种基于文本摘要的政策要点抽取方法与提取系统
CN112632278A (zh) 一种基于多标签分类的标注方法、装置、设备及存储介质
CN116701303B (zh) 基于深度学习的电子文件分类方法、系统及可读存储介质
CN112287069A (zh) 基于语音语义的信息检索方法、装置及计算机设备
CN112395391B (zh) 概念图谱构建方法、装置、计算机设备及存储介质
US8117237B2 (en) Optimized method and system for managing proper names to optimize the management and interrogation of databases
CN110674251A (zh) 一种基于语义信息的计算机辅助密点标注方法
CN113946677A (zh) 基于双向循环神经网络和注意力机制的事件识别分类方法
CN115618866A (zh) 一种工程项目投标文件的段落识别与主题提取方法及系统
CN111695054A (zh) 文本处理方法及设备、信息抽取方法及系统、介质
CN112906376B (zh) 一种自适应匹配的用户英语学习文本推送系统和方法
CN113240322B (zh) 气候风险披露质量方法、装置、电子设备及存储介质
CN113887191A (zh) 文章的相似性检测方法及装置
CN114842982B (zh) 一种面向医疗信息系统的知识表达方法、装置及系统
CN115033683B (zh) 摘要生成方法、装置、设备及存储介质
CN113420119B (zh) 基于知识卡片的智能问答方法、装置、设备及存储介质
CN114756617A (zh) 一种工程档案结构化数据提取方法、系统、设备和存介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant