CN118260439A - 密集架系统的信息管理系统及方法 - Google Patents
密集架系统的信息管理系统及方法 Download PDFInfo
- Publication number
- CN118260439A CN118260439A CN202410347546.8A CN202410347546A CN118260439A CN 118260439 A CN118260439 A CN 118260439A CN 202410347546 A CN202410347546 A CN 202410347546A CN 118260439 A CN118260439 A CN 118260439A
- Authority
- CN
- China
- Prior art keywords
- attribute
- feature
- information
- archive
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 239000013598 vector Substances 0.000 claims description 293
- 238000004458 analytical method Methods 0.000 claims description 68
- 238000007726 management method Methods 0.000 claims description 66
- 239000011159 matrix material Substances 0.000 claims description 38
- 238000012545 processing Methods 0.000 claims description 36
- 230000011218 segmentation Effects 0.000 claims description 20
- 238000000605 extraction Methods 0.000 claims description 17
- 230000010365 information processing Effects 0.000 claims description 17
- 238000013508 migration Methods 0.000 claims description 13
- 230000005012 migration Effects 0.000 claims description 13
- 238000005259 measurement Methods 0.000 claims description 12
- 230000004927 fusion Effects 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000011176 pooling Methods 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 8
- 230000009467 reduction Effects 0.000 claims description 6
- 230000002457 bidirectional effect Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 230000017105 transposition Effects 0.000 claims description 2
- 238000003062 neural network model Methods 0.000 claims 1
- 238000013527 convolutional neural network Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 238000012935 Averaging Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/387—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及信息管理技术领域,且更为具体地公开了一种密集架系统的信息管理系统及方法,通过获取待存放档案的属性特征信息和每个档案槽的位置特征信息,得到档案属性语义特征向量和档案槽位置文本理解特征向量,然后,将这些特征向量融合,得到目标位置分析解码特征向量,最后,通过解码器将解码特征向量转化为解码值,用于表示待存放档案的目标放置位置。这样可以提高密集架系统的管理效率和质量,实现自动化的档案存放管理。
Description
技术领域
本申请涉及信息管理技术领域,且更为具体地,涉及一种密集架系统的信息管理系统及方法。
背景技术
密集架作为档案的现代化集中存放管理系统的重要组成部分,随着自动控制技术的不断发展,智能型密集架的自动化控制程度、以及集中度越来越高,构成越来越复杂,存放管理的功能越来越强。但是,如果密集架系统仅仅依靠其自身的系统来建立数据库信息管理,由于受到软、硬件等因素的影响和制约,其集中度、规模、管理控制功能都存在很大的局限性,只有通过相应的信息交互平台实现跨系统、网络化信息共享才能进一步提高密集架管理系统的规模化、自动化程度,这是密集架系统发展的一个新的途径。
现有的档案管理方法通常是对档案存放进行记录,但随着新档案的加入以及档案的存取,需要对档案槽中存放的档案进行重新放置。但是目前,通常是由档案管理人员人工来确定档案的重新放置位置,档案的管理效率较低,且管理过程中难免出现纰漏,无法保证档案管理质量。
因此,期望一种密集架系统的信息管理系统及方法。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种密集架系统的信息管理系统及方法,通过获取档案的属性和位置信息,并利用特征向量分析和解码器来实现自动化的密集架档案存放管理。
相应地,根据本申请的一个方面,提供了一种密集架系统的信息管理系统,其包括:
密集架信息采集模块,用于获取待存放档案的属性特征信息,以及获取每个档案槽的位置特征信息;
密集架信息处理模块,用于分别从所述待存放档案的属性特征信息和所述每个档案槽的位置特征信息获得档案属性语义特征向量和档案槽位置文本理解特征向量;
密集架信息融合模块,用于构造所述档案属性语义特征向量和所述档案槽位置文本理解特征向量之间的目标位置分析解码特征向量,并对所述目标位置分析解码特征向量进行概率密度域相关迁移超凸投影度量以得到优化目标位置分析解码特征向量;
密集架信息分析模块,用于将所述优化目标位置分析解码特征向量通过解码器以获得解码值,所述解码值用于表示待存放档案的目标放置位置。
根据本申请的另一个方面,还提供了一种密集架系统的信息管理方法,其包括:
获取待存放档案的属性特征信息,以及获取每个档案槽的位置特征信息;
分别从所述待存放档案的属性特征信息和所述每个档案槽的位置特征信息获得档案属性语义特征向量和档案槽位置文本理解特征向量;
构造所述档案属性语义特征向量和所述档案槽位置文本理解特征向量之间的目标位置分析解码特征向量,并对所述目标位置分析解码特征向量进行概率密度域相关迁移超凸投影度量以得到优化目标位置分析解码特征向量;
将所述优化目标位置分析解码特征向量通过解码器以获得解码值,所述解码值用于表示待存放档案的目标放置位置。
与现有技术相比,本申请提供的一种密集架系统的信息管理系统及方法,通过获取待存放档案的属性特征信息和每个档案槽的位置特征信息,得到档案属性语义特征向量和档案槽位置文本理解特征向量,然后,将这些特征向量融合,得到目标位置分析解码特征向量,最后,通过解码器将解码特征向量转化为解码值,用于表示待存放档案的目标放置位置。这样可以提高密集架系统的管理效率和质量,实现自动化的档案存放管理。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的密集架系统的信息管理系统的框图示意图。
图2为根据本申请实施例的密集架系统的信息管理系统中密集架信息处理模块的框图示意图。
图3为根据本申请实施例的密集架系统的信息管理系统中档案属性信息提取单元的框图示意图。
图4为根据本申请实施例的密集架系统的信息管理系统中档案槽位置信息处理单元的框图示意图。
图5为根据本申请实施例的密集架系统的信息管理方法的流程图。
具体实施方式
以下将参考附图详细说明本申请的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好地说明本申请,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本申请同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本申请的主旨。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
图1图示了根据本申请实施例的密集架系统的信息管理系统的框图示意图。如图1所示,根据本申请实施例的密集架系统的信息管理系统100,包括:密集架信息采集模块110,用于获取待存放档案的属性特征信息,以及获取每个档案槽的位置特征信息;密集架信息处理模块120,用于分别从所述待存放档案的属性特征信息和所述每个档案槽的位置特征信息获得档案属性语义特征向量和档案槽位置文本理解特征向量;密集架信息融合模块130,用于构造所述档案属性语义特征向量和所述档案槽位置文本理解特征向量之间的目标位置分析解码特征向量,并对所述目标位置分析解码特征向量进行概率密度域相关迁移超凸投影度量以得到优化目标位置分析解码特征向量;密集架信息分析模块140,用于将所述优化目标位置分析解码特征向量通过解码器以获得解码值,所述解码值用于表示待存放档案的目标放置位置。
在本申请实施例中,密集架信息采集模块110,用于获取待存放档案的属性特征信息,以及获取每个档案槽的位置特征信息。应可以理解,属性特征信息可以包括档案的类别、关键词、标签等,这些信息可以帮助确定档案的特点和归类规则。而档案槽的位置特征信息可以包括槽位编号、位置坐标等,这些信息可以用于确定档案的具体存放位置。通过获取这些特征信息,可以建立起档案与存储位置之间的关联,从而实现更有效的档案管理和存放控制。不同类别的档案可能具有不同的特征和处理方式。通过标记档案的类别,可以更容易地对其进行分类和组织,从而实现更高效的档案管理。档案通常包含大量的文本信息,通过提取关键词可以快速了解档案的主题、内容或重要特征。这些关键词可以用于检索和索引,使得查找和归档档案更加方便和准确。通过为档案添加标签,可以为其附加额外的信息,如状态、重要性、权限等。这些标签可以帮助确定档案的处理流程和访问权限,从而更好地控制和管理档案。为每个存放档案的槽位分配唯一的编号,可以方便地标识和定位档案的存放位置。通过槽位编号,可以快速找到指定档案的存放位置,提高存取效率。对于大型档案库或仓库,使用位置坐标可以更精确地确定档案的存放位置。通过记录档案的坐标信息,可以实现高效的档案定位和检索。因此,通过获取属性特征信息和位置特征信息,可以建立起档案与存储位置之间的关联,实现更有效的档案管理和存放控制。这样的关联可以帮助快速定位和访问档案,减少管理和检索的时间和努力。
在本申请实施例中,密集架信息处理模块120,用于分别从所述待存放档案的属性特征信息和所述每个档案槽的位置特征信息获得档案属性语义特征向量和档案槽位置文本理解特征向量。应可以理解,属性特征信息中的类别、关键词和标签等可以提供档案的语义特征。将这些信息转化为语义特征向量,可以更好地描述档案的内容、特点和属性。通过使用自然语言处理技术,可以将文本信息转化为数值表示。例如,可以使用词嵌入(wordembedd i ngs)技术将关键词转化为向量表示,将类别和标签信息转化为独热编码或二进制向量表示。将这些语义特征向量应用于档案管理系统中的分类、检索和推荐等任务,可以实现更准确和高效的档案处理和操作。档案槽的位置特征信息包括槽位编号和位置坐标等,这些信息描述了档案在存储设施中的具体位置。通过将位置特征信息转化为文本理解特征向量,可以使机器能够理解和处理这些位置信息。这对于档案的定位、检索和管理非常重要。可以使用编码技术将槽位编号转化为向量表示。对于位置坐标,可以将其转化为数值向量,以便进行计算和比较。通过将属性特征信息和位置特征信息转化为特征向量,可以实现对档案的语义理解和位置理解。这样的特征向量可用于机器学习、信息检索和决策系统中,以支持档案管理和存放控制的各种任务和功能。
具体地,在本申请的一个实施例中,图2图示了根据本申请实施例的密集架系统的信息管理系统中密集架信息处理模块的框图示意图。如图2所示,在上述密集架系统的信息管理系统100中,所述密集架信息处理模块120,包括:档案属性信息提取单元121,用于将所述待存放档案的属性特征信息通过卷积编码以得到所述档案属性语义特征向量;档案槽位置信息处理单元122,用于将每个档案槽的位置特征信息进行分词处理后通过特征提取以获得所述档案槽位置文本理解特征向量。
相应地,在本申请一个具体的示例中,所述档案属性信息提取单元121,用于将所述待存放档案的属性特征信息通过卷积编码以得到所述档案属性语义特征向量。应可以理解,卷积编码在处理文本时可以通过滑动窗口的方式捕捉局部特征。这对于档案的属性特征信息往往是有益的,因为档案中的关键词或短语可能在文本中的不同位置出现。卷积编码可以通过卷积操作在不同位置上提取特征,从而捕捉到这种局部特征。卷积编码在一定程度上共享参数,减少了需要学习的参数数量。这对于属性特征信息的处理有利,因为不同属性之间往往存在一定的相似性。共享参数可以提高模型的泛化能力,并减少过拟合的风险。卷积编码可以通过池化操作将输入的维度减小,从而减少了特征向量的维度。这对于属性特征信息的处理有益,因为属性特征信息往往是高维的,通过维度减少可以降低计算复杂度并节省存储空间。卷积编码在处理文本时可以保留一定的顺序信息。这对于属性特征信息的处理有益,因为属性特征信息的顺序往往对于档案的语义有一定的影响。通过卷积编码,可以保留一定的顺序信息,并将其编码到语义特征向量中。
进一步,图3图示了根据本申请实施例的密集架系统的信息管理系统中档案属性信息提取单元的框图示意图。如图3所示,在上述密集架系统的信息管理系统100的密集架信息处理模块120中,所述档案属性信息提取单元122,包括:属性信息转化向量子单元1211,用于使用语义理解模型从所述待存放档案的属性特征信息获得待存放档案的属性特征向量;属性信息转化二值化向量子单元1212,用于将所述待存放档案的属性特征信息进行基于条件的二值化以获得待存放档案的属性二值化特征向量;档案属性关联子单元1213,用于将所述待存放档案的属性特征向量乘以所述待存放档案的属性二值化特征向量的转置以获得用于表达所述待存放档案的属性特征信息的档案属性关联特征矩阵;第一卷积编码子单元1214,用于将所述档案属性关联特征矩阵输入基于第一卷积神经网络模型的属性提取器以获得所述档案属性语义特征向量。
具体地,所述属性信息转化向量子单元1211,用于使用语义理解模型从所述待存放档案的属性特征信息获得待存放档案的属性特征向量。应可以理解,语义理解模型可以分析文本的语义信息,即文本的意义和含义,而不仅仅关注表面的词语。对于待存放档案的属性特征信息,语义理解模型可以更好地理解其中的语义内容,包括词义的多样性、上下文关联等。通过提取语义信息,可以获得更准确、更全面的属性特征向量。语义理解模型可以考虑文本中的上下文关系,捕捉词语之间的相关性。对于待存放档案的属性特征信息,语境相关性非常重要,因为不同的属性特征可能在特定的上下文中才具有特定的含义。语义理解模型可以通过上下文建模,将属性特征信息与其语境相结合,从而更准确地生成属性特征向量。属性特征信息往往是高维稀疏的,其中可能存在大量的无关或冗余信息。语义理解模型可以通过降维或特征选择等技术,将属性特征信息转化为更紧凑、更有信息量的属性特征向量。这样可以减少存储空间的需求,并提高后续处理任务的效率。语义理解模型在大规模数据集上进行训练,具有较好的泛化能力,可以处理不同领域、不同类型的属性特征信息。通过使用语义理解模型获得属性特征向量,可以更好地适应不同类型的档案属性特征信息,提高模型的适用性和泛化能力。总之,使用语义理解模型从待存放档案的属性特征信息中获取属性特征向量可以充分利用模型的语义理解能力、上下文关联性和特征处理技术,从而获得更准确、更有表达力的属性特征向量,为后续的档案管理和存放控制任务提供更好的基础。
相应地,所述属性信息转化向量子单元,包括:词向量转化二级子单元,用于使用所述语义理解模型的词嵌入层将所述待存放档案的属性特征信息中各个词映射为词向量以获得待存放档案的属性特征信息词向量序列;语义处理二级子单元,用于使用所述语义理解模型的Bert模型对所述待存放档案的属性特征信息词向量序列进行处理以获得待存放档案的属性特征信息词特征向量序列;上下文编码二级子单元,用于使用所述语义理解模型的双向LSTM网络对所述待存放档案的属性特征信息词特征向量序列进行上下文编码以获得所述待存放档案的属性特征向量。
进一步,所述词向量转化二级子单元,用于使用所述语义理解模型的词嵌入层将所述待存放档案的属性特征信息中各个词映射为词向量以获得待存放档案的属性特征信息词向量序列。应可以理解,词嵌入是一种将词语映射到连续向量空间的技术,它可以将词语的语义信息编码为向量表示。通过使用词嵌入层,可以将待存放档案的属性特征信息中的每个词转换为对应的向量表示,从而捕捉每个词的语义特征。这样可以更好地表示属性特征信息中的语义含义,为后续的处理任务提供更丰富的语义信息。同一个词在不同的上下文中可能具有不同的含义。词嵌入层可以将每个词映射为一个向量,使得不同上下文下的相似词在向量空间中距离更近,从而更好地捕捉并区分词义的多样性。对于待存放档案的属性特征信息,词嵌入层可以帮助模型更好地理解和区分具有不同语义的词语。属性特征信息往往是高维稀疏的,其中可能存在大量的无关或冗余信息。将属性特征信息中的词语映射为词向量序列可以将高维稀疏的表示转换为低维稠密的向量表示,从而减少存储空间的需求,并降低后续处理任务的复杂度。此外,词嵌入层可以通过学习到的向量表示,捕捉属性特征信息中的重要特征,减少维度灾难的影响。词嵌入层通常是在大规模语料库上进行训练的,具有较好的泛化能力。通过使用预训练好的词嵌入模型,可以将这种泛化能力应用到待存放档案的属性特征信息中,使得模型能够更好地处理未见过的词语和语境,提高模型的泛化性能。因此,使用语义理解模型的词嵌入层将待存放档案的属性特征信息中的词映射为词向量序列可以更好地表示语义信息、处理词义的多样性、减少稀疏性和维度灾难,并提高模型的泛化能力。这样可以为后续的属性特征分析和处理任务提供更好的基础。
进一步,所述语义处理二级子单元,用于使用所述语义理解模型的Bert模型对所述待存放档案的属性特征信息词向量序列进行处理以获得待存放档案的属性特征信息词特征向量序列。应可以理解,BERT模型是一种基于Transformer架构的预训练语言模型,它具有强大的上下文建模能力。对于待存放档案的属性特征信息,其中的词语需要考虑其上下文的语境才能准确理解。BERT模型可以通过双向上下文建模,同时利用前向和后向的上下文信息,更好地捕捉属性特征信息中词语的语义和语境关联。BERT模型通过预训练阶段的掩码语言建模任务和下一句预测任务,学习到了丰富的词语关系表示。这使得BERT模型能够对属性特征信息中的词语之间的关系进行建模,包括词义的相似性、上下文的相关性等。通过对词向量序列进行BERT模型处理,可以获得更丰富的词语关系特征,从而提高属性特征信息的表达能力。BERT模型不仅可以处理单个词语的特征,还可以提取句子级的特征表示。对于待存放档案的属性特征信息,可能会包含多个词语组成的短语或句子。通过使用BERT模型,可以将整个属性特征信息作为一个句子输入,从而获得句子级的特征表示,更全面地表达属性特征信息的语义和语境。BERT模型是在大规模语料上进行预训练的,具有较好的泛化能力。通过使用预训练好的BERT模型对属性特征信息词向量序列进行处理,可以将BERT模型在大规模数据上学习到的语义和语境知识应用到待存放档案的属性特征信息中,提高模型的泛化性能。
进一步,所述上下文编码二级子单元,用于使用所述语义理解模型的双向LSTM网络对所述待存放档案的属性特征信息词特征向量序列进行上下文编码以获得所述待存放档案的属性特征向量。应可以理解,LSTM(长短期记忆)网络是一种递归神经网络,具有良好的序列建模能力。对于待存放档案的属性特征信息,其中的词语在上下文中可能具有不同的语义含义。通过使用双向LSTM网络,可以对属性特征信息中的词特征向量序列进行上下文建模,捕捉词语在不同上下文中的语义特征,并将上下文信息编码到属性特征向量中。LSTM网络通过门控机制,可以有效地处理长期依赖关系。对于属性特征信息中的词语序列,可能存在较长的上下文依赖关系,其中前面的词语对后面的词语有重要影响。LSTM网络可以通过长短期记忆单元来记忆和传递重要的上下文信息,从而更好地捕捉长期依赖关系,提高属性特征向量的表达能力。双向LSTM网络由前向和后向两个方向的LSTM层组成,可以同时利用前向和后向的上下文信息。这样可以更全面地捕捉属性特征信息中词语的语义和上下文关联。通过双向信息融合,可以更好地理解词语在整个属性特征信息中的语义含义和相关性。LSTM网络可以对整个序列进行特征提取,而不仅仅是单个词语的特征。对于待存放档案的属性特征信息,可能包含多个词语组成的序列,其中序列的整体特征对于属性特征的理解和表达很重要。通过使用双向LSTM网络,可以将整个属性特征信息序列作为输入,获得序列级的特征表示,更全面地表达属性特征信息的语义和语境。
具体地,所述二值化向量子单元1212,用于将所述待存放档案的属性特征信息进行基于条件的二值化以获得待存放档案的属性二值化特征向量。应可以理解,属性特征信息通常包含多个维度的连续值或离散值。将属性特征信息进行二值化可以将其简化为只有两个取值(0或1)的特征向量,减少了特征的维度,降低了计算和存储的复杂性。基于条件的二值化可以根据具体的条件或阈值将属性特征信息转化为二值特征。通过选择适当的条件或阈值,可以保留属性特征信息中的重要信息,并且将不重要的信息过滤掉。这样可以更好地捕捉属性特征的关键特点,并减少噪声和冗余信息的影响。二值化的属性特征向量更易于解释和理解。将属性特征信息转化为二值特征后,每个特征的取值只有两种情况,可以更直观地理解每个特征对于待存放档案的属性的影响。这有助于后续的档案管理和存放控制任务,提高可解释性和可理解性。例如,选择二值化条件或阈值:选择图像文件作为条件。对属性特征进行二值化:将每个档案的文件类型与条件进行比较,如果是图像文件,则将其二值化为1,表示满足条件;如果不是图像文件,则将其二值化为0,表示不满足条件。
具体地,所述档案属性关联子单元1213,用于将所述待存放档案的属性特征向量乘以所述待存放档案的属性二值化特征向量的转置以获得用于表达所述待存放档案的属性特征信息的档案属性关联特征矩阵。应可以理解,将待存放档案的属性特征向量乘以属性二值化特征向量的转置可以获得档案属性关联特征矩阵,可以用于表达待存放档案的属性特征信息。这是因为属性二值化特征向量的转置可以看作是一个权重矩阵,用于对属性特征向量进行加权。通过乘法运算,可以将属性特征向量中相应位置为1的属性特征提取出来,形成一个新的特征向量,其中只包含与属性二值化特征向量中为1对应的属性特征。例如,假设待存放档案有N个属性特征,属性特征向量的维度为N,而属性二值化特征向量的维度也为N。对应位置为1的属性特征,将被保留下来,而对应位置为0的属性特征将被忽略。通过乘法运算,可以得到一个新的特征向量,其维度为属性二值化特征向量中为1的位置的数量。这样得到的档案属性关联特征矩阵可以用于表达待存放档案的属性特征信息。它可以捕捉到与属性二值化特征向量中为1对应的属性特征之间的关联关系,进一步用于档案管理、数据分析或机器学习任务。通过这种方式,我们可以提取出与特定条件或阈值相关的属性特征,从而更好地理解和利用档案的属性信息。
相应地,所述档案属性关联子单元,用于:以如下公式对所述待存放档案的属性特征向量和所述待存放档案的属性二值化特征向量进行联合编码以生成所述档案属性关联特征矩阵;
其中,所述公式为:
其中表示向量相乘,M表示所述档案属性关联特征矩阵,V1表示所述待存放档案的属性特征向量,V2表示所述待存放档案的属性二值化特征向量,表示所述待存放档案的属性二值化特征向量的转置。
具体地,所述第一卷积编码子单元1214,用于将所述档案属性关联特征矩阵输入基于第一卷积神经网络模型的属性提取器以获得所述档案属性语义特征向量。应可以理解,将档案属性关联特征矩阵输入基于第一卷积神经网络模型的属性提取器可以获得档案属性的语义特征向量。这是因为卷积神经网络在图像处理和特征提取方面具有很强的能力,可以从输入的特征矩阵中提取出高级语义特征。当将档案属性关联特征矩阵输入到基于卷积神经网络的属性提取器时,网络的卷积层和池化层可以自动学习局部特征和抽象特征,而全连接层可以将这些特征组合成更高级的语义特征。通过训练,卷积神经网络可以学习到一组权重参数,用于将输入的特征矩阵映射到语义特征空间中。通过这个过程,我们可以将档案属性关联特征矩阵转化为具有语义含义的特征表示,即档案属性语义特征向量。这些语义特征向量可以更好地表达档案属性的重要特征,捕捉到属性之间的关联和重要性。这样的特征向量可以用于进一步的数据分析、模式识别或机器学习任务,例如分类、聚类或预测等。因此,通过将档案属性关联特征矩阵输入基于卷积神经网络的属性提取器,可以从原始的属性特征中提取出高级的语义特征,为后续的任务提供更有信息量和表达能力的特征表示。
相应地,在本申请一个具体的示例中,所述档案槽位置信息处理单元122,用于将每个档案槽的位置特征信息进行分词处理后通过特征提取以获得所述档案槽位置文本理解特征向量。应可以理解,将每个档案槽的位置特征信息进行分词处理后,通过特征提取可以获得档案槽位置文本理解特征向量。这是因为分词处理可以将连续的文本序列划分为离散的词汇单元,从而更好地捕捉文本的语义和语法信息。通过将档案槽位置特征信息进行分词处理,可以将复杂的文本序列转化为一系列离散的词汇表示。每个词汇单元代表一个具体的语义单元,例如一个词或一个短语。这样可以将文本的语义信息分散到不同的词汇表示中,使得后续的特征提取更加有效。通过特征提取,可以将分词后的档案槽位置文本转化为特征向量。特征提取方法可以包括词袋模型、TF-IDF(词频-逆文档频率)等。这些方法可以统计每个词汇单元在文本中的出现频率或重要性,将其表示为向量的形式。通过这样的特征提取过程,我们可以将档案槽位置文本的语义信息转化为数值化的特征向量。获得的档案槽位置文本理解特征向量可以用于进一步的文本分析、模式识别或机器学习任务。例如,可以将特征向量用于文本分类、情感分析、文本匹配等任务,以理解和利用档案槽位置文本的语义信息。因此,通过将档案槽位置特征信息进行分词处理,并通过特征提取将其转化为特征向量,可以更好地理解和利用档案槽位置文本的语义信息。这样的特征向量可以在后续的任务中提供更有信息量和表达能力的特征表示。
进一步,图4图示了根据本申请实施例的密集架系统的信息管理系统中档案槽位置信息处理单元的框图示意图。如图4所示,在上述密集架系统的信息管理系统100的密集架信息处理模块120中,所述档案槽位置信息处理单元122,包括:位置信息分词处理子单元1221,用于将所述每个档案槽的位置特征信息进行分词处理后通过基于转换器的第一上下文编码器以得到多个档案槽的位置特征向量;向量二维排列子单元1222,用于将所述多个档案槽的位置特征向量进行二维排列为档案槽位置特征矩阵后通过作为特征提取器的文本卷积神经网络以得到档案槽位置文本关联特征图;特征图降维子单元1223,用于对所述档案槽位置文本关联特征图的各个特征矩阵进行全局均值池化以得到所述档案槽位置文本理解特征向量。
具体地,所述位置信息分词处理子单元1221,用于将所述每个档案槽的位置特征信息进行分词处理后通过基于转换器的第一上下文编码器以得到多个档案槽的位置特征向量。应可以理解,将每个档案槽的位置特征信息进行分词处理后,通过基于转换器的第一上下文编码器可以得到多个档案槽的位置特征向量。这是因为基于转换器的模型,如BERT(Bi d i rect iona lEncoder Representat ions from Transformers),在自然语言处理任务中表现出色,能够捕捉文本的语义和上下文信息。分词处理将每个档案槽的位置特征信息划分为离散的词汇单元,使其可以作为输入序列传递给基于转换器的第一上下文编码器。基于转换器的模型通过自注意力机制,能够同时考虑输入序列中的所有词汇单元,并根据它们的上下文关系来生成表示。通过基于转换器的第一上下文编码器,可以将每个档案槽的位置特征信息转化为对应的特征向量。这些特征向量捕捉了每个档案槽位置在整个输入序列中的语义和上下文信息。由于转换器模型是基于预训练的,它能够从大规模的文本数据中学习通用的语言表示,因此能够为每个档案槽位置生成具有丰富语义信息的特征向量。获得的多个档案槽位置特征向量可以用于多个目的,例如文本分类、序列标注、命名实体识别等任务。这些特征向量可以提供更丰富的语义信息,帮助理解和利用档案槽位置的特征。因此,通过将每个档案槽的位置特征信息进行分词处理,并通过基于转换器的第一上下文编码器生成特征向量,可以获得多个档案槽位置的语义和上下文信息。这样的特征向量可以为后续的文本处理任务提供更准确和有用的特征表示。
相应地,所述位置信息分词处理子单元,包括:位置信息嵌入转化二级子单元,用于将所述档案槽的位置特征信息通过嵌入层以将所述档案槽的位置特征信息中各个档案槽的位置特征信息转化为位置特征信息嵌入向量以得到位置特征信息嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个档案槽的位置特征信息进行嵌入编码;位置信息编码二级子单元,用于将所述位置特征信息嵌入向量的序列通过所述基于转换器的第一上下文编码器以得到所述多个档案槽的位置特征向量。
具体地,所述向量二维排列子单元1222,用于将所述多个档案槽的位置特征向量进行二维排列为档案槽位置特征矩阵后通过作为特征提取器的文本卷积神经网络以得到档案槽位置文本关联特征图。应可以理解,将多个档案槽的位置特征向量进行二维排列为档案槽位置特征矩阵,然后通过作为特征提取器的文本卷积神经网络(CNN)可以得到档案槽位置文本关联特征图。这是因为CNN在图像和文本领域都展现出了强大的特征提取能力,可以有效地捕捉局部和全局的特征信息。将多个档案槽位置特征向量排列为矩阵形式,可以将每个档案槽在特征矩阵中对应的位置上进行表示。这样,特征矩阵可以将多个档案槽的位置特征信息整合在一起,形成一个完整的输入表示。这种矩阵表示方式可以保留档案槽之间的关联信息,有助于捕捉档案槽位置文本的整体结构和上下文关系。通过将特征矩阵输入文本卷积神经网络,可以利用CNN的卷积操作和池化操作来提取档案槽位置文本的关联特征。卷积操作可以通过滑动窗口的方式在特征矩阵上提取局部特征,捕捉档案槽位置之间的局部关联。池化操作可以对卷积后的特征进行降维和压缩,保留主要的特征信息。通过这样的特征提取过程,文本卷积神经网络可以将档案槽位置特征矩阵转化为档案槽位置文本关联特征图。这个特征图可以表示档案槽位置文本的重要特征和关联信息,有助于后续的文本分析和理解任务。因此,通过将多个档案槽的位置特征向量排列为特征矩阵,并通过文本卷积神经网络提取特征,可以得到档案槽位置文本关联特征图。这样的特征图能够捕捉档案槽位置之间的关联信息,为进一步的文本处理任务提供更具有表达能力和信息量的特征表示。
具体地,所述特征图降维子单元1223,用于对所述档案槽位置文本关联特征图的各个特征矩阵进行全局均值池化以得到所述档案槽位置文本理解特征向量。应可以理解,对档案槽位置文本关联特征图的各个特征矩阵进行全局均值池化可以得到档案槽位置文本理解特征向量。这是因为全局均值池化可以将特征矩阵中的每个特征图进行降维,提取出整个特征图的全局特征。在全局均值池化中,对于每个特征图,将其所有元素的平均值作为该特征图的池化值。这样,针对每个特征图都可以得到一个单一的数值,代表了该特征图的全局特征。对于档案槽位置文本关联特征图中的所有特征矩阵,进行全局均值池化后,可以得到一个特征向量,其中包含了整个特征图的全局理解特征。通过全局均值池化,可以实现特征的降维和压缩,同时保留了特征图的全局信息。这样的特征向量可以更好地表达档案槽位置文本的整体特征和语义信息,有助于后续的文本理解和分类任务。因此,对档案槽位置文本关联特征图的各个特征矩阵进行全局均值池化可以得到档案槽位置文本理解特征向量。这个特征向量包含了整个特征图的全局特征,能够更好地表达档案槽位置文本的整体语义和特征信息。
在本申请实施例中,密集架信息融合模块130,用于构造所述档案属性语义特征向量和所述档案槽位置文本理解特征向量之间的目标位置分析解码特征向量,并对所述目标位置分析解码特征向量进行概率密度域相关迁移超凸投影度量以得到优化目标位置分析解码特征向量。应可以理解,融合档案属性语义特征向量和档案槽位置文本理解特征向量可以获得目标位置分析解码特征向量。这是因为档案属性语义特征向量和档案槽位置文本理解特征向量分别捕捉了不同方面的信息,将它们融合在一起可以综合利用它们的优势,得到更丰富和全面的特征表达。档案属性语义特征向量是通过对档案属性进行语义分析得到的,它反映了档案属性的语义信息和相关特征。这个特征向量可以包含档案属性的关键特征、类别信息或其他语义相关的特征。它可以提供关于档案属性的重要线索和信息。档案槽位置文本理解特征向量是通过对档案槽位置文本进行特征提取和理解得到的,它反映了档案槽位置文本的语义关联和上下文信息。这个特征向量可以捕捉到档案槽位置之间的关联关系、语义相似性和其他文本特征。它可以提供关于档案槽位置文本的整体理解和上下文信息。融合档案属性语义特征向量和档案槽位置文本理解特征向量可以通过简单的向量拼接或其他融合方法实现。这样的融合可以将两个特征向量的信息整合在一起,得到一个综合的解码特征向量。这个解码特征向量包含了档案属性语义特征和档案槽位置文本理解特征的信息,能够更好地支持目标位置分析任务,提供更准确和全面的特征表达。
特别地,在本申请技术方案中,考虑到档案属性语义特征向量是通过语义理解模型从待存放档案的属性特征信息中提取得到的。这个特征向量的维度取决于语义理解模型的设计和参数设置。由于语义理解模型可能采用不同的方法和模型结构,因此得到的特征向量的维度可能与其他特征向量不一致。而档案槽位置文本理解特征向量是通过将每个档案槽的位置特征信息进行分词处理后,通过基于转换器的上下文编码器得到的。分词处理后的位置特征信息可以表示为一个文本序列,通过上下文编码器处理后得到的特征向量的维度取决于编码器的设计和参数设置。由于文本序列的长度可能不同于其他特征向量的维度,导致维度不对齐的情况。当融合档案属性语义特征向量和档案槽位置文本理解特征向量以得到目标位置分析解码特征向量时,由于维度不对齐的问题,可能会导致融合得到的特征向量存在分布外特征值。这是因为在融合过程中,维度不对齐可能导致特征向量的某些部分无法正确对齐,从而引入了不相关或错误的信息,进而影响了目标位置分析解码特征向量的质量。为了解决这个问题,在本申请技术方案中,对所述目标位置分析解码特征向量进行概率密度域相关迁移超凸投影度量。
相应地,在本申请的一个实施例中,所述密集架信息融合模块,所述密集架信息融合模块,包括:融合单元,用于融合所述档案属性语义特征向量和所述档案槽位置文本理解特征向量以得到目标位置分析解码特征向量;优化单元,用于对所述目标位置分析解码特征向量进行概率密度域相关迁移超凸投影度量以得到优化目标位置分析解码特征向量。
具体地,在本申请一个具体的示例中,所述优化单元,用于:预解码概率值子单元,用于将所述目标位置分析解码特征向量通过归一化指数函数以得到预解码概率值;计算倒数值子单元,用于计算所述目标位置分析解码特征向量的预定位置的特征值的倒数值;计算第一差值子单元,用于计算以所述目标位置分析解码特征向量的预定位置的特征值为底数的自然对数函数值减去一再减去倒数值以得到第一差值;计算第一对数值子单元,用于计算所述第一差值的绝对值的以2为底的对数函数值以得到第一对数值;计算第一积值子单元,用于计算所述预定超参数乘以所述目标位置分析解码特征向量的预定位置的特征值以得到以第一积值;计算目标位置子单元,用于计算所述预解码概率值乘以所述第一对数值再加上所述第一对数值以得到优化目标位置分析解码特征向量的预定位置的特征值。
也就是,在通过融合所述档案属性语义特征向量和所述档案槽位置文本理解特征向量的过程中,所述档案属性语义特征向量和所述档案槽位置文本理解特征向量之间存在维度不对齐导致融合得到的所述目标位置分析解码特征向量存在分布外特征值。
针对上述技术问题,在本申请的技术方案中,对所述目标位置分析解码特征向量进行概率密度域相关迁移超凸投影度量,其通过概率密度域相关迁移超凸投影度量函数将所述目标位置分析解码特征向量从原始空间映射到一个超凸空间,使得不同数据密度的特征向量在超凸空间中具有相同的维度和分布,通过超凸空间映射可以消除旅游景点全局特征向量和点云坐标关联特征向量之间的维度不对齐和分布不一致的问题,从而使得融合得到的目标位置分析解码特征向量不存在分布外特征值,而是具有更加紧凑和鲁棒的特征表示。也就是,利用概率密度域相关迁移超凸投影度量函数对所述目标位置分析解码特征向量进行特征的边界约束合成,这可以避免特征值集合由于集合的分布外样本而导致在解码目标域内的决策区域的过度碎片化,提高了所述目标位置分析解码特征向量的解码性能。
在本申请实施例中,密集架信息分析模块140,用于将所述优化目标位置分析解码特征向量通过解码器以获得解码值,所述解码值用于表示待存放档案的目标放置位置。应可以理解,将目标位置分析解码特征向量通过解码器以获得解码值,然后使用这个解码值来表示待存放档案的目标放置位置。这是因为解码器可以将高维的解码特征向量映射到目标放置位置的表示空间,从而得到一个具体的解码值或位置。解码器是一个用于将输入特征向量映射到目标输出空间的模型。在目标位置分析任务中,解码器的作用是将目标位置分析解码特征向量映射到表示待存放档案的目标放置位置的解码值。解码器可以通过学习从特征向量到解码值的映射关系,将抽象的特征转化为具体的目标位置。解码值可以表示待存放档案的目标放置位置。它可以是一个具体的空间坐标、一个离散的位置标识符或其他形式的位置表示。通过解码器得到的解码值可以用于确定将档案放置在什么位置,以实现目标位置分析任务的目标。
综上,基于本申请实施例的所述密集架系统的信息管理系统及方法,通过获取待存放档案的属性特征信息和每个档案槽的位置特征信息,得到档案属性语义特征向量和档案槽位置文本理解特征向量,然后,将这些特征向量融合,得到目标位置分析解码特征向量,最后,通过解码器将解码特征向量转化为解码值,用于表示待存放档案的目标放置位置。这样可以提高密集架系统的管理效率和质量,实现自动化的档案存放管理。
如上所述,根据本申请实施例的所述密集架系统的信息管理系统100可以实现在各种终端设备中,例如密集架系统的信息管理系统的服务器等。在一个示例中,根据密集架系统的信息管理系统100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该密集架系统的信息管理系统100可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该密集架系统的信息管理系统100同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该密集架系统的信息管理系统100与该终端设备也可以是分立的设备,并且该密集架系统的信息管理系统100可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
图5为根据本申请实施例的密集架系统的信息管理方法的流程图。如图5所示,根据本申请实施例的所述密集架系统的信息管理方法,包括步骤:S110,获取待存放档案的属性特征信息,以及获取每个档案槽的位置特征信息;S120,分别从所述待存放档案的属性特征信息和所述每个档案槽的位置特征信息获得档案属性语义特征向量和档案槽位置文本理解特征向量;S130,构造所述档案属性语义特征向量和所述档案槽位置文本理解特征向量之间的目标位置分析解码特征向量,并对所述目标位置分析解码特征向量进行概率密度域相关迁移超凸投影度量以得到优化目标位置分析解码特征向量;S140,将所述优化目标位置分析解码特征向量通过解码器以获得解码值,所述解码值用于表示待存放档案的目标放置位置。
这里,本领域技术人员可以理解,上述密集架系统的信息管理方法中的各个步骤的具体操作已经在上面参考图1到图4的密集架系统的信息管理系统的描述中得到了详细介绍,并因此,将省略其重复描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-On l y Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种密集架系统的信息管理系统,其特征在于,包括:
密集架信息采集模块,用于获取待存放档案的属性特征信息,以及获取每个档案槽的位置特征信息;
密集架信息处理模块,用于分别从所述待存放档案的属性特征信息和所述每个档案槽的位置特征信息获得档案属性语义特征向量和档案槽位置文本理解特征向量;
密集架信息融合模块,用于构造所述档案属性语义特征向量和所述档案槽位置文本理解特征向量之间的目标位置分析解码特征向量,并对所述目标位置分析解码特征向量进行概率密度域相关迁移超凸投影度量以得到优化目标位置分析解码特征向量;
密集架信息分析模块,用于将所述优化目标位置分析解码特征向量通过解码器以获得解码值,所述解码值用于表示待存放档案的目标放置位置。
2.根据权利要求1所述的密集架系统的信息管理系统,其特征在于,所述密集架信息处理模块,包括:
档案属性信息提取单元,用于将所述待存放档案的属性特征信息通过卷积编码以得到所述档案属性语义特征向量;
档案槽位置信息处理单元,用于将每个档案槽的位置特征信息进行分词处理后通过特征提取以获得所述档案槽位置文本理解特征向量。
3.根据权利要求2所述的密集架系统的信息管理系统,其特征在于,所述档案属性信息提取单元,包括:
属性信息转化向量子单元,用于使用语义理解模型从所述待存放档案的属性特征信息获得待存放档案的属性特征向量;
属性信息转化二值化向量子单元,用于将所述待存放档案的属性特征信息进行基于条件的二值化以获得待存放档案的属性二值化特征向量;
档案属性关联子单元,用于将所述待存放档案的属性特征向量乘以所述待存放档案的属性二值化特征向量的转置以获得用于表达所述待存放档案的属性特征信息的档案属性关联特征矩阵;
第一卷积编码子单元,用于将所述档案属性关联特征矩阵输入基于第一卷积神经网络模型的属性提取器以获得所述档案属性语义特征向量。
4.根据权利要求3所述的密集架系统的信息管理系统,其特征在于,所述属性信息转化向量子单元,包括:
词向量转化二级子单元,用于使用所述语义理解模型的词嵌入层将所述待存放档案的属性特征信息中各个词映射为词向量以获得待存放档案的属性特征信息词向量序列;
语义处理二级子单元,用于使用所述语义理解模型的Bert模型对所述待存放档案的属性特征信息词向量序列进行处理以获得待存放档案的属性特征信息词特征向量序列;
上下文编码二级子单元,用于使用所述语义理解模型的双向LSTM网络对所述待存放档案的属性特征信息词特征向量序列进行上下文编码以获得所述待存放档案的属性特征向量。
5.根据权利要求4所述的密集架系统的信息管理系统,其特征在于,所述档案属性关联子单元,用于:以如下公式对所述待存放档案的属性特征向量和所述待存放档案的属性二值化特征向量进行联合编码以生成所述档案属性关联特征矩阵;
其中,所述公式为:
其中表示向量相乘,M表示所述档案属性关联特征矩阵,V1表示所述待存放档案的属性特征向量,V2表示所述待存放档案的属性二值化特征向量,表示所述待存放档案的属性二值化特征向量的转置。
6.根据权利要求5所述的密集架系统的信息管理系统,其特征在于,所述档案槽位置信息处理单元,包括:
位置信息分词处理子单元,用于将所述每个档案槽的位置特征信息进行分词处理后通过基于转换器的第一上下文编码器以得到多个档案槽的位置特征向量;
向量二维排列子单元,用于将所述多个档案槽的位置特征向量进行二维排列为档案槽位置特征矩阵后通过作为特征提取器的文本卷积神经网络以得到档案槽位置文本关联特征图;
特征图降维子单元,用于对所述档案槽位置文本关联特征图的各个特征矩阵进行全局均值池化以得到所述档案槽位置文本理解特征向量。
7.根据权利要求6所述的密集架系统的信息管理系统,其特征在于,所述位置信息分词处理子单元,包括:
位置信息嵌入转化二级子单元,用于将所述档案槽的位置特征信息通过嵌入层以将所述档案槽的位置特征信息中各个档案槽的位置特征信息转化为位置特征信息嵌入向量以得到位置特征信息嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个档案槽的位置特征信息进行嵌入编码;
位置信息编码二级子单元,用于将所述位置特征信息嵌入向量的序列通过所述基于转换器的第一上下文编码器以得到所述多个档案槽的位置特征向量。
8.根据权利要求7所述的密集架系统的信息管理系统,其特征在于,所述密集架信息融合模块,包括:
融合单元,用于融合所述档案属性语义特征向量和所述档案槽位置文本理解特征向量以得到目标位置分析解码特征向量;
优化单元,用于对所述目标位置分析解码特征向量进行概率密度域相关迁移超凸投影度量以得到优化目标位置分析解码特征向量。
9.根据权利要求8所述的密集架系统的信息管理系统,其特征在于,所述优化单元,用于:
预解码概率值子单元,用于将所述目标位置分析解码特征向量通过归一化指数函数以得到预解码概率值;
计算倒数值子单元,用于计算所述目标位置分析解码特征向量的预定位置的特征值的倒数值;
计算第一差值子单元,用于计算以所述目标位置分析解码特征向量的预定位置的特征值为底数的自然对数函数值减去一再减去倒数值以得到第一差值;
计算第一对数值子单元,用于计算所述第一差值的绝对值的以2为底的对数函数值以得到第一对数值;
计算第一积值子单元,用于计算所述预定超参数乘以所述目标位置分析解码特征向量的预定位置的特征值以得到以第一积值;
计算目标位置子单元,用于计算所述预解码概率值乘以所述第一对数值再加上所述第一对数值以得到优化目标位置分析解码特征向量的预定位置的特征值。
10.一种密集架系统的信息管理方法,其特征在于,包括:
获取待存放档案的属性特征信息,以及获取每个档案槽的位置特征信息;
分别从所述待存放档案的属性特征信息和所述每个档案槽的位置特征信息获得档案属性语义特征向量和档案槽位置文本理解特征向量;
构造所述档案属性语义特征向量和所述档案槽位置文本理解特征向量之间的目标位置分析解码特征向量,并对所述目标位置分析解码特征向量进行概率密度域相关迁移超凸投影度量以得到优化目标位置分析解码特征向量;
将所述优化目标位置分析解码特征向量通过解码器以获得解码值,所述解码值用于表示待存放档案的目标放置位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410347546.8A CN118260439A (zh) | 2024-03-26 | 2024-03-26 | 密集架系统的信息管理系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410347546.8A CN118260439A (zh) | 2024-03-26 | 2024-03-26 | 密集架系统的信息管理系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118260439A true CN118260439A (zh) | 2024-06-28 |
Family
ID=91607191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410347546.8A Pending CN118260439A (zh) | 2024-03-26 | 2024-03-26 | 密集架系统的信息管理系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118260439A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118553411A (zh) * | 2024-07-30 | 2024-08-27 | 四川红天月信息技术有限公司 | 一种职工门诊共济监管平台及方法 |
-
2024
- 2024-03-26 CN CN202410347546.8A patent/CN118260439A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118553411A (zh) * | 2024-07-30 | 2024-08-27 | 四川红天月信息技术有限公司 | 一种职工门诊共济监管平台及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112084337B (zh) | 文本分类模型的训练方法、文本分类方法及设备 | |
CN110580292B (zh) | 一种文本标签生成方法、装置和计算机可读存储介质 | |
CN108804530B (zh) | 对图像的区域加字幕 | |
CN111581961A (zh) | 一种中文视觉词汇表构建的图像内容自动描述方法 | |
CN112131350B (zh) | 文本标签确定方法、装置、终端及可读存储介质 | |
CN111783474B (zh) | 一种评论文本观点信息处理方法、装置及存储介质 | |
CN109635150B (zh) | 文本生成方法、装置以及存储介质 | |
CN112015859A (zh) | 文本的知识层次抽取方法及装置、计算机设备及可读介质 | |
CN111695052A (zh) | 标签分类方法、数据处理设备、可读存储介质 | |
CN117435716B (zh) | 电网人机交互终端的数据处理方法及系统 | |
CN118260439A (zh) | 密集架系统的信息管理系统及方法 | |
CN111695053A (zh) | 序列标注方法、数据处理设备、可读存储介质 | |
CN118113855B (zh) | 一种舰船试验训练场景问答方法、系统、设备和介质 | |
CN113836896A (zh) | 一种基于深度学习的专利文本摘要生成方法和装置 | |
CN115221369A (zh) | 视觉问答的实现方法和基于视觉问答检验模型的方法 | |
CN114048354A (zh) | 基于多元表征和度量学习的试题检索方法、装置及介质 | |
CN111144093A (zh) | 一种智能文本处理方法、装置、电子设备及存储介质 | |
CN118155231B (zh) | 文档的识别方法、装置、设备、介质及产品 | |
CN117217277A (zh) | 语言模型的预训练方法、装置、设备、存储介质及产品 | |
CN116975199A (zh) | 一种文本预测方法、装置、设备和存储介质 | |
CN117171413B (zh) | 用于数字藏品管理的数据处理系统及其方法 | |
CN110633363B (zh) | 一种基于nlp和模糊多准则决策的文本实体推荐方法 | |
CN116976283A (zh) | 语言处理方法、训练方法、装置、设备、介质及程序产品 | |
CN115203206A (zh) | 数据内容搜索方法、装置、计算机设备及可读存储介质 | |
CN111768214A (zh) | 产品属性的预测方法、系统、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |