CN113722475A - 基于云存储的文件操作方法、系统和电子设备 - Google Patents

基于云存储的文件操作方法、系统和电子设备 Download PDF

Info

Publication number
CN113722475A
CN113722475A CN202110874080.3A CN202110874080A CN113722475A CN 113722475 A CN113722475 A CN 113722475A CN 202110874080 A CN202110874080 A CN 202110874080A CN 113722475 A CN113722475 A CN 113722475A
Authority
CN
China
Prior art keywords
feature vectors
structure information
feature vector
sequence
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110874080.3A
Other languages
English (en)
Inventor
刘梦强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lichuan Mengqiang Technology Co ltd
Original Assignee
Lichuan Mengqiang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lichuan Mengqiang Technology Co ltd filed Critical Lichuan Mengqiang Technology Co ltd
Priority to CN202110874080.3A priority Critical patent/CN113722475A/zh
Publication of CN113722475A publication Critical patent/CN113722475A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及云存储的领域,其具体地公开了一种基于云存储的文件操作方法、系统和电子设备,其为了能够实现各个计算机节点底层文件系统到云存储的格式统一,采用基于深度学习技术的自然语义理解模型来进行文本信息的分类和标注,以对于各个相对于计算机节点底层文件系统的不同结构信息进行统一。通过这样的方式,可以使得分布式文件系统隐藏内部的实现细节,对用户和应用程序屏蔽各个计算机节点底层文件系统之间的差异,以提供给用户统一的访问接口和方便的资源管理手段。

Description

基于云存储的文件操作方法、系统和电子设备
技术领域
本发明涉及无线云领域,且更为具体地,涉及一种基于云存储的文件操作方法、基于云存储的文件操作系统和电子设备。
背景技术
随着信息化程度的不断提高,全球数据日益膨胀。面对当前PB级的海量数据存储需求,传统的存储系统在容量和性能的扩展上存在瓶颈。云存储以其扩展性强、性价比高、容错性好等优势得到了业界的广泛认同。
目前,云存储一般采用分布式文件系统,其除了具有本地文件系统的所有功能外,还必须管理整个系统中所有计算机上的文件资源,从而把整个分布式文件资源以统一的视图呈现给用户。另外,分布式文件系统还需要隐藏内部的实现细节,对用户和应用程序屏蔽各个计算机节点底层文件系统之间的差异,以提供给用户统一的访问接口和方便的资源管理手段。对于各个计算机节点底层文件系统存储到云的文件来说,除了文件本身的内容以外,还包含文件相对于计算机节点底层文件系统的结构信息,因此需要对于这些相对于计算机节点底层文件系统的不同结构信息进行统一。因此,需要提供一种能够实现各个计算机节点底层文件系统到云存储的格式统一的文件操作方法。
目前,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
随着深度学习技术的发展,自然语言理解(NLP)也在深度学习的基础上得到了很大的发展,从而为文本信息的分类和标注提供了良好的解决方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于云存储的文件操作方法、系统和电子设备,其为了能够实现各个计算机节点底层文件系统到云存储的格式统一,采用基于深度学习技术的自然语义理解模型来进行文本信息的分类和标注,以对于各个相对于计算机节点底层文件系统的不同结构信息进行统一。通过这样的方式,可以使得分布式文件系统隐藏内部的实现细节,对用户和应用程序屏蔽各个计算机节点底层文件系统之间的差异,以提供给用户统一的访问接口和方便的资源管理手段。
根据本申请的一个方面,提供了一种基于云存储的文件操作方法,其包括:
获取待存储到云的文件的文本数据;
识别所述文本数据中的文本内容部分和结构信息部分;
将所述文本数据通过能够进行令牌类型区分的语义理解模型以获得对应于所述文本内容部分的文本内容特征向量序列和对应于所述结构信息部分的结构信息特征向量序列,其中,所述语义理解模型以所述结构信息部分作为令牌,并将所述文本内容部分作为实体;
将所述文本内容特征向量序列和所述结构信息特征向量序列进行基于上下文的编码以获得多个结构信息特征向量;
基于所述云的存储的文本结构,获得与所述文本结构对应的结构信息的标签序列;
将所述标签序列通过所述语义理解模型以获得多个标签特征向量;
获得所述多个结构信息特征向量到所述多个标签特征向量的转移矩阵,其中,所述转移矩阵的每个位置的特征值对应于预定序列的所述结构信息特征向量和对应于预定序列的所述标签特征向量;
将所述转移矩阵通过类Softmax分类函数以获得每个所述结构信息相对于每个标签的分类概率;以及
基于所述每个所述结构信息相对于每个标签的分类概率,对所述文本数据的结构信息部分进行标注和分类。
在上述基于云存储的文件操作方法中,将所述文本内容特征向量序列和所述结构信息特征向量序列进行基于上下文的编码以获得多个结构信息特征向量,包括:将所述文本内容特征向量序列和所述结构信息特征向量序列按照所述文书数据中的顺序进行重新排列后输入第二语义理解模型以获得所述多个结构信息特征向量。
在上述基于云存储的文件操作方法中,所述第二语义模型为双向LSTM网络模型。
在上述基于云存储的文件操作方法中,获得所述多个结构信息特征向量到所述多个标签特征向量的转移矩阵,包括:基于矩阵乘法获得所述多个结构信息特征向量到所述多个标签特征向量的转移矩阵,其中,设定所述转移矩阵为W,所述多个结构信息特征向量为Vi,i=1~m,所述多个标签特征向量为Lj,j=1~n;其中,所述转移矩阵、所述多个标签特征向量和所述多个结构信息特征向量满足关系:L1×m=Wm×n×V1×n,其中转移矩阵W的每个位置的特征值wi,j对应于所述结构信息特征向量Vi和所述标签特征向量Lj
在上述基于云存储的文件操作方法中,将所述转移矩阵通过类Softmax分类函数以获得每个所述结构信息相对于每个标签的分类概率,包括:将所述转移矩阵通过具有如下公式的类Softmax分类函数,以获得所述转移矩阵中每个位置的特征值对应的类Softmax分类函数值作为每个所述结构信息相对于每个标签的分类概率;其中,所述公式为:p=exp(-wi,j)/∑i,j exp(-wi,j)。
在上述基于云存储的文件操作方法中,所述语义理解模型为Bert语义理解模型。
根据本申请的另一方面,提供了一种基于云存储的文件操作系统,其包括:
文本数据获取单元,用于获取待存储到云的文件的文本数据;
文本数据识别单元,用于识别所述文本数据获取单元获得的所述文本数据中的文本内容部分和结构信息部分;
语义理解模型处理单元,用于将所述文本数据获取单元获得的所述文本数据通过能够进行令牌类型区分的语义理解模型以获得对应于所述文本数据识别单元获得的所述文本内容部分的文本内容特征向量序列和对应于所述文本数据识别单元获得的所述结构信息部分的结构信息特征向量序列,其中,所述语义理解模型以所述结构信息部分作为令牌,并将所述文本内容部分作为实体;
编码处理单元,用于将所述语义理解模型处理单元获得的所述文本内容特征向量序列和所述语义理解模型处理单元获得的所述结构信息特征向量序列进行基于上下文的编码以获得多个结构信息特征向量;
标签序列生成单元,用于基于所述云的存储的文本结构,获得与所述文本结构对应的结构信息的标签序列;
标签特征向量生成单元,用于将所述标签序列生成单元获得的所述标签序列通过所述语义理解模型以获得多个标签特征向量;
转移矩阵生成单元,用于获得所述编码处理单元获得的所述多个结构信息特征向量到所述标签特征向量生成单元获得的所述多个标签特征向量的转移矩阵,其中,所述转移矩阵的每个位置的特征值对应于预定序列的所述结构信息特征向量和对应于预定序列的所述标签特征向量;
分类概率值生成单元,用于将所述转移矩阵生成单元获得的所述转移矩阵通过类Softmax分类函数以获得每个所述结构信息相对于每个标签的分类概率;以及
标注分类单元,用于基于所述分类概率生成单元获得的所述每个所述结构信息相对于每个标签的分类概率,对所述文本数据的结构信息部分进行标注和分类。
在上述基于云存储的文件操作系统中,所述编码处理单元,进一步用于:将所述文本内容特征向量序列和所述结构信息特征向量序列按照所述文书数据中的顺序进行重新排列后输入第二语义理解模型以获得所述多个结构信息特征向量。
在上述基于云存储的文件操作系统中,所述第二语义模型为双向LSTM网络模型。
在上述基于云存储的文件操作系统中,所述转移矩阵生成单元,进一步用于:基于矩阵乘法获得所述多个结构信息特征向量到所述多个标签特征向量的转移矩阵,其中,设定所述转移矩阵为W,所述多个结构信息特征向量为Vi,i=1~m,所述多个标签特征向量为Lj,j=1~n;其中,所述转移矩阵、所述多个标签特征向量和所述多个结构信息特征向量满足关系:L1×m=Wm×n×V1×n,其中转移矩阵W的每个位置的特征值wi,j对应于所述结构信息特征向量Vi和所述标签特征向量Lj
在上述基于云存储的文件操作系统中,所述分类概率值生成单元,进一步用于:将所述转移矩阵通过具有如下公式的类Softmax分类函数,以获得所述转移矩阵中每个位置的特征值对应的类Softmax分类函数值作为每个所述结构信息相对于每个标签的分类概率;其中,所述公式为:p=exp(-wi,j)/∑i,j exp(-wi,j)。
在上述基于云存储的文件操作系统中,所述语义理解模型为Bert语义理解模型。
根据本申请的又一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的基于云存储的文件操作方法。
根据本申请的再又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的基于云存储的文件操作方法。
与现有技术相比,本申请提供的基于云存储的文件操作方法、基于云存储的文件操作系统和电子设备,其为了能够实现各个计算机节点底层文件系统到云存储的格式统一,采用基于深度学习技术的自然语义理解模型来进行文本信息的分类和标注,以对于各个相对于计算机节点底层文件系统的不同结构信息进行统一。通过这样的方式,可以使得分布式文件系统隐藏内部的实现细节,对用户和应用程序屏蔽各个计算机节点底层文件系统之间的差异,以提供给用户统一的访问接口和方便的资源管理手段。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的基于云存储的文件操作方法的应用场景图;
图2为根据本申请实施例的基于云存储的文件操作方法的流程图;
图3为根据本申请实施例的基于云存储的文件操作方法的系统架构示意图;
图4为根据本申请实施例的基于云存储的文件操作系统的框图;
图5为根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
场景概述
如前所述,云存储一般采用分布式文件系统,其除了具有本地文件系统的所有功能外,还必须管理整个系统中所有计算机上的文件资源,从而把整个分布式文件资源以统一的视图呈现给用户。另外,分布式文件系统还需要隐藏内部的实现细节,对用户和应用程序屏蔽各个计算机节点底层文件系统之间的差异,以提供给用户统一的访问接口和方便的资源管理手段。对于各个计算机节点底层文件系统存储到云的文件来说,除了文件本身的内容以外,还包含文件相对于计算机节点底层文件系统的结构信息,因此需要对于这些相对于计算机节点底层文件系统的不同结构信息进行统一,而统一的基础首先是对这些结构信息进行准确的分类和标注。因此,需要提供一种能够实现各个计算机节点底层文件系统到云存储的格式统一的文件操作方法。
随着深度学习技术的发展,自然语言理解(NLP)也在深度学习的基础上得到了很大的发展,从而为文本信息的分类和标注提供了良好的解决方案。
因此,在本申请的技术方案中,首先获取待存储到云的文件的文本数据,并确定文本数据中的文本内容部分和结构信息部分。这里,由于文本内容部分的语义有助于理解结构信息部分的语义,因此在将其输入语义理解模型,比如Bert模型时,将结构信息部分作为令牌(token),而将文本内容部分作为实体(entity),从而得到对应于结构信息序列的结构信息特征向量序列,此时,也会得到对应于文本内容序列的文本内容特征向量序列。
接下来,为了对于结构信息特征向量序列进行多分类,首先再基于文本内容作为上下文对结构信息进行再编码,即将结构信息特征向量序列和文本内容特征向量序列按照初始文本数据中的顺序进行重新排列后输入双向LSTM网络,并得到多个编码后的结构信息特征向量,例如记为Vi,i=1~m。
这里,因为结构信息的标签本身是已知的,也就是,针对云存储的文本结构,可以获得其对应的结构信息的标签序列。针对该标签序列,同样通过上述的语义理解模型,例如Bert模型和双向LSTM网络,得到多个编码后的标签特征向量,例如记为Lj,j=1~n。
这样,基于多标签分类的方法,可以得到V到J的转移矩阵W,使得L1×m=Wm×n×V1×n,其中转移矩阵W的每个位置的值wi,j对应于结构信息特征向量Vi和标签特征向量Lj,这样,通过类softmax分类函数p=exp(-wi,j)/∑i,jexp(-wi,j),就可以得到每个结构信息相对于每个标签的分类概率,从而对结构信息进行分类和标注。
基于此,本申请提出了一种基于云存储的文件操作方法,其包括:获取待存储到云的文件的文本数据;识别所述文本数据中的文本内容部分和结构信息部分;将所述文本数据通过能够进行令牌类型区分的语义理解模型以获得对应于所述文本内容部分的文本内容特征向量序列和对应于所述结构信息部分的结构信息特征向量序列,其中,所述语义理解模型以所述结构信息部分作为令牌,并将所述文本内容部分作为实体;将所述文本内容特征向量序列和所述结构信息特征向量序列进行基于上下文的编码以获得多个结构信息特征向量;基于所述云的存储的文本结构,获得与所述文本结构对应的结构信息的标签序列;将所述标签序列通过所述语义理解模型以获得多个标签特征向量;获得所述多个结构信息特征向量到所述多个标签特征向量的转移矩阵,其中,所述转移矩阵的每个位置的特征值对应于预定序列的所述结构信息特征向量和对应于预定序列的所述标签特征向量;将所述转移矩阵通过类Softmax分类函数以获得每个所述结构信息相对于每个标签的分类概率以及,基于所述每个所述结构信息相对于每个标签的分类概率,对所述文本数据的结构信息部分进行标注和分类。
图1图示了根据本申请实施例的基于云存储的文件操作方法的应用场景图。如图1所示,在该应用场景中,首先,获取待存储到云(例如,如图1中所示意的C)的文件的文本数据;然后,将所述获取的待存储到云的文件的文本数据输入至部署有基于云存储的文件操作算法的服务器中(例如,如图1中所示意的云服务器S),其中,所述服务器能够以基于云存储的文件操作算法对所述待存储到云的文件的文本数据进行处理,以生成每个结构信息相对于每个标签的分类概率。进而,基于所述每个结构信息相对于每个标签的分类概率以对结构信息进行分类和标注。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性方法
图2图示了基于云存储的文件操作方法的流程图。如图2所示,根据本申请实施例的基于云存储的文件操作方法,包括:S110,获取待存储到云的文件的文本数据;S120,识别所述文本数据中的文本内容部分和结构信息部分;S130,将所述文本数据通过能够进行令牌类型区分的语义理解模型以获得对应于所述文本内容部分的文本内容特征向量序列和对应于所述结构信息部分的结构信息特征向量序列,其中,所述语义理解模型以所述结构信息部分作为令牌,并将所述文本内容部分作为实体;S140,将所述文本内容特征向量序列和所述结构信息特征向量序列进行基于上下文的编码以获得多个结构信息特征向量;S150,基于所述云的存储的文本结构,获得与所述文本结构对应的结构信息的标签序列;S160,将所述标签序列通过所述语义理解模型以获得多个标签特征向量;S170,获得所述多个结构信息特征向量到所述多个标签特征向量的转移矩阵,其中,所述转移矩阵的每个位置的特征值对应于预定序列的所述结构信息特征向量和对应于预定序列的所述标签特征向量;S180,将所述转移矩阵通过类Softmax分类函数以获得每个所述结构信息相对于每个标签的分类概率;以及,S190,基于所述每个所述结构信息相对于每个标签的分类概率,对所述文本数据的结构信息部分进行标注和分类。
图3图示了根据本申请实施例的基于云存储的文件操作方法的架构示意图。如图3所示,在所述基于云存储的文件操作方法的网络架构中,首先,识别所述获取的待存储到云的文件的文本数据(例如,如图3中所示意的IN)中的文本内容部分(例如,如图3中所示意的TC)和结构信息部分(例如,如图3中所示意的SI);接着,将所述文本数据通过能够进行令牌类型区分的语义理解模型(例如,如图3中所示意的SUM)以获得对应于所述文本内容部分的文本内容特征向量序列(例如,如图3中所示意的FVT)和对应于所述结构信息部分的结构信息特征向量序列(例如,如图3中所示意的FVS);然后,将所述文本内容特征向量序列和所述结构信息特征向量序列进行基于上下文的编码以获得多个结构信息特征向量(例如,如图3中所示意的FV1-FVn);接着,基于所述云的存储的文本结构,获得与所述文本结构对应的结构信息(例如,如图3中所示意的S)的标签序列(例如,如图3中所示意的TS1-TSn);然后,将所述标签序列通过所述语义理解模型以获得多个标签特征向量(例如,如图3中所示意的FVL1-FVLn);接着,获得所述多个结构信息特征向量到所述多个标签特征向量的转移矩阵(例如,如图3中所示意的TM);然后,将所述转移矩阵通过类Softmax分类函数(例如,如图3中所示意的圈S)以获得每个所述结构信息相对于每个标签的分类概率;以及,最后,基于所述每个所述结构信息相对于每个标签的分类概率,对所述文本数据的结构信息部分进行标注和分类。
在步骤S110和步骤S120中,获取待存储到云的文件的文本数据,并识别所述文本数据中的文本内容部分和结构信息部分。也就是,首先,获取待存储到云的文件的文本数据,这里,所述文本数据信息包括但不局限于联系人的信息、通话记录信息、相册信息等。然后,再确定文本数据中的文本内容部分和结构信息部分,在具体实施例中,例如当所述文本数据信息为相册信息时,所述文本内容部分就为相片的内容和数据,所述结构信息部分则为相片相对于计算机节点的底层文件系统,也就是存储格式。
应可以理解,对于各个计算机节点底层文件系统存储到云的文件来说,除了文件本身的内容以外,还包含文件相对于计算机节点底层文件系统的结构信息。因此,在本申请的技术方案中,为了能够实现各个计算机节点底层文件系统到云存储的格式统一,采用基于深度学习技术的自然语义理解模型来对文本信息中的结构信息进行准确的分类和标注,以对于各个相对于计算机节点底层文件系统的不同结构信息进行统一,在此之前,首先需要获取待存储到云的文件的文本数据,并识别所述文本数据中的文本内容部分和结构信息部分。
在步骤S130中,将所述文本数据通过能够进行令牌类型区分的语义理解模型以获得对应于所述文本内容部分的文本内容特征向量序列和对应于所述结构信息部分的结构信息特征向量序列,其中,所述语义理解模型以所述结构信息部分作为令牌,并将所述文本内容部分作为实体。应可以理解,由于文本内容部分的语义有助于理解结构信息部分的语义,因此,在本申请的技术方案中,在将其输入语义理解模型时,例如Bert模型,将结构信息部分作为令牌,而将文本内容部分作为实体,从而得到对应于结构信息序列的结构信息特征向量序列,以及对应于文本内容序列的文本内容特征向量序列。也就是,以语义理解模型对所述文本数据进行处理,以提取出所述文本数据中的文本内容部分和结构信息部分中的语义信息,以获得考虑所述文本内容部分和所述结构信息部分之间关联信息的分别对应于结构信息序列的结构信息特征向量序列和文本内容序列的文本内容特征向量序列。
在步骤S140中,将所述文本内容特征向量序列和所述结构信息特征向量序列进行基于上下文的编码以获得多个结构信息特征向量。如前所述,应可以理解,为了对于结构信息特征向量序列进行多分类,在本申请的技术方案中,将基于所述文本内容作为上下文对结构信息进行再编码,也就是,将所述结构信息特征向量序列和所述文本内容特征向量序列按照初始文本数据中的顺序进行重新排列后输入双向LSTM网络,并得到多个编码后的结构信息特征向量。值得一提的是,这里,所述结构信息特征向量融合了所述文本数据中的文本内容部分的语义信息和文本结构信息部分的语义信息,以利于提高所述文本结构信息相对于每个标签的分类概率的准确度。
具体地,在本申请实施例中,将所述文本内容特征向量序列和所述结构信息特征向量序列进行基于上下文的编码以获得多个结构信息特征向量,包括:将所述文本内容特征向量序列和所述结构信息特征向量序列按照所述文书数据中的顺序进行重新排列后输入第二语义理解模型以获得所述多个结构信息特征向量,例如记为Vi,i=1~m。这里,所述第二语义模型为双向LSTM网络模型。应可以理解,因为文本数据是有一定顺序的,因此,在对文本数据进行特征提取时,也需要将这种顺序映射到高维空间,以达到语义的连贯性,从而获得多个结构信息特征向量。
在步骤S150中,基于所述云的存储的文本结构,获得与所述文本结构对应的结构信息的标签序列。应可以理解,因为结构信息的标签本身是已知的,也就是,所述文本结构对应的所述结构信息的标签与所述云存储中文本结构的所述结构信息的标签一致,因此,在本申请的技术方案中,可以针对云存储的文本结构,从而获得其对应的结构信息的标签序列。
在步骤S160中,将所述标签序列通过所述语义理解模型以获得多个标签特征向量。也就是,在具体实施例中,针对该标签序列,同样通过上述的语义理解模型,例如Bert模型和双向LSTM网络,得到多个编码后的标签特征向量,例如记为Lj,j=1~n。应可以理解,为了基于所述多个标签特征向量和所述多个结构信息特征向量构造转移矩阵,以融合所述标签特征向量和结构信息特征向量之间的关联性特征,从而提高所述结构信息分类和标注的准确性,就需要将所述标签序列同样通过所述语义理解模型处理以获得多个标签特征向量。
在步骤S170中,获得所述多个结构信息特征向量到所述多个标签特征向量的转移矩阵。具体地,在本申请实施例中,获得所述多个结构信息特征向量到所述多个标签特征向量的转移矩阵的过程,包括:基于矩阵乘法获得所述多个结构信息特征向量到所述多个标签特征向量的转移矩阵,其中,设定所述转移矩阵为W,所述多个结构信息特征向量为Vi,i=1~m,所述多个标签特征向量为Lj,j=1~n;其中,所述转移矩阵、所述多个标签特征向量和所述多个结构信息特征向量满足关系:L1×m=Wm×n×V1×n,其中转移矩阵W的每个位置的特征值wi,j对应于所述结构信息特征向量Vi和所述标签特征向量Lj。应可以理解,这里,所述转移矩阵表示融合了所述结构信息特征向量和所述标签特征向量的关联性特征,其中,所述转移矩阵的每个位置的特征值对应于预定序列的所述结构信息特征向量和对应于预定序列的所述标签特征向量。
在步骤S180和步骤S190中,将所述转移矩阵通过类Softmax分类函数以获得每个所述结构信息相对于每个标签的分类概率,并基于所述每个所述结构信息相对于每个标签的分类概率,对所述文本数据的结构信息部分进行标注和分类。也就是,首先,将所述转移矩阵输入类Softmax分类函数以获得所述转移矩阵归属于每个标签的分类概率值;然后,再通过所述转移矩阵归属于每个标签的分类概率值来对所述文本数据的结构信息部分进行标注和分类,以得到准确的分类结果。应可以理解,为了对于这些相对于计算机节点底层文件系统的不同结构信息进行统一,以实现各个计算机节点底层文件系统到云存储的格式统一,就需要对这些结构信息进行准确的分类和标注,以生成准确的分类和标注结果。
具体地,在本申请实施例中,将所述转移矩阵通过类Softmax分类函数以获得每个所述结构信息相对于每个标签的分类概率的过程,包括:将所述转移矩阵通过具有如下公式的类Softmax分类函数,以获得所述转移矩阵中每个位置的特征值对应的类Softmax分类函数值作为每个所述结构信息相对于每个标签的分类概率;其中,所述公式为:p=exp(-wi,j)/∑i,j exp(-wi,j)。
综上,本申请实施例的基于云存储的文件操作方法被阐明,其为了能够实现各个计算机节点底层文件系统到云存储的格式统一,采用基于深度学习技术的自然语义理解模型来进行文本信息的分类和标注,以对于各个相对于计算机节点底层文件系统的不同结构信息进行统一。通过这样的方式,可以使得分布式文件系统隐藏内部的实现细节,对用户和应用程序屏蔽各个计算机节点底层文件系统之间的差异,以提供给用户统一的访问接口和方便的资源管理手段。
示例性系统
图4图示了根据本申请实施例的基于云存储的文件操作系统的框图。如图4所示,根据本申请实施例的基于云存储的文件操作系统400,包括:文本数据获取单元410,用于获取待存储到云的文件的文本数据;文本数据识别单元420,用于识别所述文本数据获取单元410获得的所述文本数据中的文本内容部分和结构信息部分;语义理解模型处理单元430,用于将所述文本数据获取单元410获得的所述文本数据通过能够进行令牌类型区分的语义理解模型以获得对应于所述文本数据识别单元420获得的所述文本内容部分的文本内容特征向量序列和对应于所述文本数据识别单元420获得的所述结构信息部分的结构信息特征向量序列,其中,所述语义理解模型以所述结构信息部分作为令牌,并将所述文本内容部分作为实体;编码处理单元440,用于将所述语义理解模型处理单元430获得的所述文本内容特征向量序列和所述语义理解模型处理单元430获得的所述结构信息特征向量序列进行基于上下文的编码以获得多个结构信息特征向量;标签序列生成单元450,用于基于所述云的存储的文本结构,获得与所述文本结构对应的结构信息的标签序列;标签特征向量生成单元460,用于将所述标签序列生成单元450获得的所述标签序列通过所述语义理解模型以获得多个标签特征向量;转移矩阵生成单元470,用于获得所述编码处理单元440获得的所述多个结构信息特征向量到所述标签特征向量生成单元460获得的所述多个标签特征向量的转移矩阵,其中,所述转移矩阵的每个位置的特征值对应于预定序列的所述结构信息特征向量和对应于预定序列的所述标签特征向量;分类概率值生成单元480,用于将所述转移矩阵生成单元470获得的所述转移矩阵通过类Softmax分类函数以获得每个所述结构信息相对于每个标签的分类概率;以及,标注分类单元490,用于基于所述分类概率生成单元480获得的所述每个所述结构信息相对于每个标签的分类概率,对所述文本数据的结构信息部分进行标注和分类。
在一个示例中,在上述基于云存储的文件操作系统400中,所述编码处理单元440,进一步用于:将所述文本内容特征向量序列和所述结构信息特征向量序列按照所述文书数据中的顺序进行重新排列后输入第二语义理解模型以获得所述多个结构信息特征向量。
在一个示例中,在上述基于云存储的文件操作系统400中,所述第二语义模型为双向LSTM网络模型。
在一个示例中,在上述基于云存储的文件操作系统400中,所述转移矩阵生成单元470,进一步用于:基于矩阵乘法获得所述多个结构信息特征向量到所述多个标签特征向量的转移矩阵,其中,设定所述转移矩阵为W,所述多个结构信息特征向量为Vi,i=1~m,所述多个标签特征向量为Lj,j=1~n;其中,所述转移矩阵、所述多个标签特征向量和所述多个结构信息特征向量满足关系:L1×m=Wm×n×V1×n,其中转移矩阵W的每个位置的特征值wi,j对应于所述结构信息特征向量Vi和所述标签特征向量Lj
在一个示例中,在上述基于云存储的文件操作系统400中,所述分类概率值生成单元480,进一步用于:将所述转移矩阵通过具有如下公式的类Softmax分类函数,以获得所述转移矩阵中每个位置的特征值对应的类Softmax分类函数值作为每个所述结构信息相对于每个标签的分类概率;其中,所述公式为:p=exp(-wi,j)/∑i,j exp(-wi,j)。
在一个示例中,在上述基于云存储的文件操作系统400中,所述语义理解模型为Bert语义理解模型。
这里,本领域技术人员可以理解,上述基于云存储的文件操作系统400中的各个单元和模块的具体功能和操作已经在上面参考图1到图3的基于云存储的文件操作方法的描述中得到了详细介绍,并因此,将省略其重复描述。
如上所述,根据本申请实施例的基于云存储的文件操作系统400可以实现在各种终端设备中,例如基于云存储的文件操作算法的服务器等。在一个示例中,根据本申请实施例的基于云存储的文件操作系统400可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该基于云存储的文件操作系统400可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于云存储的文件操作系统400同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该基于云存储的文件操作系统400与该终端设备也可以是分立的设备,并且该基于云存储的文件操作系统400可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
示例性电子设备
下面,参考图5来描述根据本申请实施例的电子设备。如图5所示,电子设备包括10包括一个或多个处理器11和存储器12。所述处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的基于云存储的文件操作方法的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如结构信息特征向量、标签特征向量、转移矩阵等各种内容。
在一个示例中,电子设备10还可以包括:输入系统13和输出系统14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入系统13可以包括例如键盘、鼠标等等。
该输出系统14可以向外部输出各种信息,包括分类概率、标注和分类结果等。该输出系统14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图5中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的基于云存储的文件操作方法中的功能中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的基于云存储的文件操作方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (10)

1.一种基于云存储的文件操作方法,其特征在于,包括:
获取待存储到云的文件的文本数据;
识别所述文本数据中的文本内容部分和结构信息部分;
将所述文本数据通过能够进行令牌类型区分的语义理解模型以获得对应于所述文本内容部分的文本内容特征向量序列和对应于所述结构信息部分的结构信息特征向量序列,其中,所述语义理解模型以所述结构信息部分作为令牌,并将所述文本内容部分作为实体;
将所述文本内容特征向量序列和所述结构信息特征向量序列进行基于上下文的编码以获得多个结构信息特征向量;
基于所述云的存储的文本结构,获得与所述文本结构对应的结构信息的标签序列;
将所述标签序列通过所述语义理解模型以获得多个标签特征向量;
获得所述多个结构信息特征向量到所述多个标签特征向量的转移矩阵,其中,所述转移矩阵的每个位置的特征值对应于预定序列的所述结构信息特征向量和对应于预定序列的所述标签特征向量;
将所述转移矩阵通过类Softmax分类函数以获得每个所述结构信息相对于每个标签的分类概率;以及
基于所述每个所述结构信息相对于每个标签的分类概率,对所述文本数据的结构信息部分进行标注和分类。
2.根据权利要求1所述的基于云存储的文件操作方法,其中,将所述文本内容特征向量序列和所述结构信息特征向量序列进行基于上下文的编码以获得多个结构信息特征向量,包括:
将所述文本内容特征向量序列和所述结构信息特征向量序列按照所述文书数据中的顺序进行重新排列后输入第二语义理解模型以获得所述多个结构信息特征向量。
3.根据权利要求2所述的基于云存储的文件操作方法,其中,所述第二语义模型为双向LSTM网络模型。
4.根据权利要求1所述的基于云存储的文件操作方法,其中,获得所述多个结构信息特征向量到所述多个标签特征向量的转移矩阵,包括:
基于矩阵乘法获得所述多个结构信息特征向量到所述多个标签特征向量的转移矩阵,其中,设定所述转移矩阵为W,所述多个结构信息特征向量为Vi,i=1~m,所述多个标签特征向量为Lj,j=1~n;
其中,所述转移矩阵、所述多个标签特征向量和所述多个结构信息特征向量满足关系:
L1×m=Wm×n×V1×n,其中转移矩阵W的每个位置的特征值wi,j对应于所述结构信息特征向量Vi和所述标签特征向量Lj
5.根据权利要求1所述的基于云存储的文件操作方法,其中,将所述转移矩阵通过类Softmax分类函数以获得每个所述结构信息相对于每个标签的分类概率,包括:
将所述转移矩阵通过具有如下公式的类Softmax分类函数,以获得所述转移矩阵中每个位置的特征值对应的类Softmax分类函数值作为每个所述结构信息相对于每个标签的分类概率;
其中,所述公式为:p=exp(-wi,j)/∑i,jexp(-wi,j)。
6.根据权利要求1所述的基于云存储的文件操作方法,其中,所述语义理解模型为Bert语义理解模型。
7.一种基于云存储的文件操作系统,其特征在于,包括:
文本数据获取单元,用于获取待存储到云的文件的文本数据;
文本数据识别单元,用于识别所述文本数据获取单元获得的所述文本数据中的文本内容部分和结构信息部分;
语义理解模型处理单元,用于将所述文本数据获取单元获得的所述文本数据通过能够进行令牌类型区分的语义理解模型以获得对应于所述文本数据识别单元获得的所述文本内容部分的文本内容特征向量序列和对应于所述文本数据识别单元获得的所述结构信息部分的结构信息特征向量序列,其中,所述语义理解模型以所述结构信息部分作为令牌,并将所述文本内容部分作为实体;
编码处理单元,用于将所述语义理解模型处理单元获得的所述文本内容特征向量序列和所述语义理解模型处理单元获得的所述结构信息特征向量序列进行基于上下文的编码以获得多个结构信息特征向量;
标签序列生成单元,用于基于所述云的存储的文本结构,获得与所述文本结构对应的结构信息的标签序列;
标签特征向量生成单元,用于将所述标签序列生成单元获得的所述标签序列通过所述语义理解模型以获得多个标签特征向量;
转移矩阵生成单元,用于获得所述编码处理单元获得的所述多个结构信息特征向量到所述标签特征向量生成单元获得的所述多个标签特征向量的转移矩阵,其中,所述转移矩阵的每个位置的特征值对应于预定序列的所述结构信息特征向量和对应于预定序列的所述标签特征向量;
分类概率值生成单元,用于将所述转移矩阵生成单元获得的所述转移矩阵通过类Softmax分类函数以获得每个所述结构信息相对于每个标签的分类概率;以及
标注分类单元,用于基于所述分类概率生成单元获得的所述每个所述结构信息相对于每个标签的分类概率,对所述文本数据的结构信息部分进行标注和分类。
8.根据权利要求7所述的基于云存储的文件操作系统,其中,所述编码处理单元,进一步用于:
将所述文本内容特征向量序列和所述结构信息特征向量序列按照所述文书数据中的顺序进行重新排列后输入第二语义理解模型以获得所述多个结构信息特征向量。
9.根据权利要求7所述的基于云存储的文件操作系统,其中,所述转移矩阵生成单元,进一步用于:
基于矩阵乘法获得所述多个结构信息特征向量到所述多个标签特征向量的转移矩阵,其中,设定所述转移矩阵为W,所述多个结构信息特征向量为Vi,i=1~m,所述多个标签特征向量为Lj,j=1~n;
其中,所述转移矩阵、所述多个标签特征向量和所述多个结构信息特征向量满足关系:
L1×m=Wm×n×V1×n,其中转移矩阵W的每个位置的特征值wi,j对应于所述结构信息特征向量Vi和所述标签特征向量Lj
10.一种电子设备,包括:
处理器;以及
存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如权利要求1-6中任一项所述的基于云存储的文件操作方法。
CN202110874080.3A 2021-07-30 2021-07-30 基于云存储的文件操作方法、系统和电子设备 Withdrawn CN113722475A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110874080.3A CN113722475A (zh) 2021-07-30 2021-07-30 基于云存储的文件操作方法、系统和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110874080.3A CN113722475A (zh) 2021-07-30 2021-07-30 基于云存储的文件操作方法、系统和电子设备

Publications (1)

Publication Number Publication Date
CN113722475A true CN113722475A (zh) 2021-11-30

Family

ID=78674560

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110874080.3A Withdrawn CN113722475A (zh) 2021-07-30 2021-07-30 基于云存储的文件操作方法、系统和电子设备

Country Status (1)

Country Link
CN (1) CN113722475A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114117453A (zh) * 2021-12-08 2022-03-01 深圳市辰星瑞腾科技有限公司 基于数据深度关联的计算机防御系统以及防御方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114117453A (zh) * 2021-12-08 2022-03-01 深圳市辰星瑞腾科技有限公司 基于数据深度关联的计算机防御系统以及防御方法
CN114117453B (zh) * 2021-12-08 2022-08-12 深圳市辰星瑞腾科技有限公司 基于数据深度关联的计算机防御系统以及防御方法

Similar Documents

Publication Publication Date Title
Bouguila Clustering of count data using generalized Dirichlet multinomial distributions
CN115203380A (zh) 基于多模态数据融合的文本处理系统及其方法
CN115796173B (zh) 针对监管报送需求的数据处理方法和系统
CN112084337A (zh) 文本分类模型的训练方法、文本分类方法及设备
CN109471944B (zh) 文本分类模型的训练方法、装置及可读存储介质
CN115860271B (zh) 艺术设计用方案管理系统及其方法
US10796203B2 (en) Out-of-sample generating few-shot classification networks
US20230206670A1 (en) Semantic representation of text in document
US20190108280A1 (en) Image search and index building
CN115373813A (zh) 云计算环境中基于gpu虚拟化的调度方法、系统和电子设备
CN109271624B (zh) 一种目标词确定方法、装置及存储介质
CN116089648B (zh) 基于人工智能的档案管理系统及方法
CN115409018A (zh) 基于大数据的公司舆情监测系统及其方法
CN115205788A (zh) 食材质量监控系统
CN116151604A (zh) 一种web环境下办公系统流程分析系统及其方法
US8214310B2 (en) Cross descriptor learning system, method and program product therefor
CN114884772A (zh) 裸机vxlan的部署方法、系统和电子设备
CN113722475A (zh) 基于云存储的文件操作方法、系统和电子设备
US11983183B2 (en) Techniques for training machine learning models using actor data
Myasnikov et al. Detection of sensitive textual information in user photo albums on mobile devices
CN115827856B (zh) 一种基于计算机的军工领域消息的传递方法
CN113138773B (zh) 云计算分布式服务集群方法
CN113723107A (zh) 智能终端间的联系人信息传送提取方法、系统和电子设备
CN112580706B (zh) 应用于数据管理平台的训练数据处理方法、装置和电子设备
US10910014B2 (en) Method and apparatus for generating video

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20211130