CN117349406A - 基于大数据的专利信息检索系统及方法 - Google Patents
基于大数据的专利信息检索系统及方法 Download PDFInfo
- Publication number
- CN117349406A CN117349406A CN202311435682.4A CN202311435682A CN117349406A CN 117349406 A CN117349406 A CN 117349406A CN 202311435682 A CN202311435682 A CN 202311435682A CN 117349406 A CN117349406 A CN 117349406A
- Authority
- CN
- China
- Prior art keywords
- search image
- alternative
- sequence
- feature
- patent information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000004458 analytical method Methods 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims description 203
- 230000004927 fusion Effects 0.000 claims description 79
- 230000003993 interaction Effects 0.000 claims description 66
- 238000012937 correction Methods 0.000 claims description 22
- 230000007246 mechanism Effects 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 7
- 238000011176 pooling Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000004422 calculation algorithm Methods 0.000 abstract description 5
- 230000002452 interceptive effect Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 238000011550 data transformation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/11—Patent retrieval
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种基于大数据的专利信息检索系统及方法,其通过采集用户的输入检索图像,并在后端引入图像处理和分析算法来进行该检索图像的特征分析,同时利用语义编码技术对专利数据库中的备选专利进行语义分析,然后再将所述检索图像的语义特征与所述备选专利的语义特征进行交互关联后通过分类器,以此来判断两者的匹配度是否满足要求。这样,能够避免传统专利信息检索方式带来的低便利性、低效率和低准确性的问题,从而提高了专利信息检索的准确性和效率,以更好地满足用户的需求。
Description
技术领域
本申请涉及信息检索领域,且更为具体地,涉及一种基于大数据的专利信息检索系统及方法。
背景技术
专利信息检索系统是为了满足人们对专利文献的检索需求而开发的一种信息检索系统。专利文献包含了各个领域的技术创新和发明的详细描述,对于科研人员、工程师和企业等具有重要的参考价值。专利信息检索系统旨在通过用户提供的关键词或其他检索条件,从庞大的专利数据库中快速准确地检索出相关的专利文献。
传统的专利信息检索系统通常基于文本关键词匹配的方式进行检索。用户通过输入关键词或关键词组合来描述自己的检索需求,系统会根据这些关键词在专利文献中的出现频率和位置等信息进行匹配,然后返回与关键词相关的专利文献列表。然而,传统的文本关键词匹配方案主要依赖于关键词的表面形式,无法准确理解关键词的语义和含义,这导致了检索结果的准确性和相关性不高,往往需要用户进行反复的试错和调整。并且,由于专利文献的篇幅较长且内容复杂,传统专利信息检索方案可能会导致很多有价值的信息可能被忽略或无法被充分利用,也就是说,传统的文本关键词匹配方法无法捕捉到文本之间的语义关联和上下文信息,导致检索结果的覆盖范围有限,很难满足用户的具体需求。此外,传统的专利信息检索系统需要用户主动提供关键词或其他检索条件,这对于一些非专业用户来说可能存在一定的困难,同时,用户需要根据检索结果进行进一步的筛选和判断,这需要用户具备一定的专业知识和判断能力。
因此,期望一种优化的专利信息检索系统。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于大数据的专利信息检索系统及方法,其通过采集用户的输入检索图像,并在后端引入图像处理和分析算法来进行该检索图像的特征分析,同时利用语义编码技术对专利数据库中的备选专利进行语义分析,然后再将所述检索图像的语义特征与所述备选专利的语义特征进行交互关联后通过分类器,以此来判断两者的匹配度是否满足要求。这样,能够避免传统专利信息检索方式带来的低便利性、低效率和低准确性的问题,从而提高了专利信息检索的准确性和效率,以更好地满足用户的需求。
根据本申请的一个方面,提供了一种基于大数据的专利信息检索系统,其包括:
检索图像采集模块,用于获取由用户输入的检索图像;
检索图像语义分析模块,用于对所述检索图像进行局部语义分析以得到检索图像区域局部特征向量的序列;
备选专利获取模块,用于从专利数据库获取第一备选专利;
备选专利语义分析模块,用于对所述第一备选专利进行描述词语义分析以得到第一备选专利信息描述词特征向量的序列;
检索图像-备选专利语义交互融合模块,用于对所述检索图像区域局部特征向量的序列和所述第一备选专利信息描述词特征向量的序列进行跨模态交互融合以得到检索图像-备选专利跨模态交互融合特征;
检索图像-备选专利匹配模块,用于基于所述检索图像-备选专利跨模态交互融合特征,确定检索图像与第一备选专利之间的匹配度是否超过预定阈值。
根据本申请的另一个方面,提供了一种基于大数据的专利信息检索方法,其包括:
获取由用户输入的检索图像;
对所述检索图像进行局部语义分析以得到检索图像区域局部特征向量的序列;
从专利数据库获取第一备选专利;
对所述第一备选专利进行描述词语义分析以得到第一备选专利信息描述词特征向量的序列;
对所述检索图像区域局部特征向量的序列和所述第一备选专利信息描述词特征向量的序列进行跨模态交互融合以得到检索图像-备选专利跨模态交互融合特征;
基于所述检索图像-备选专利跨模态交互融合特征,确定检索图像与第一备选专利之间的匹配度是否超过预定阈值。
与现有技术相比,本申请提供的一种基于大数据的专利信息检索系统及方法,其通过采集用户的输入检索图像,并在后端引入图像处理和分析算法来进行该检索图像的特征分析,同时利用语义编码技术对专利数据库中的备选专利进行语义分析,然后再将所述检索图像的语义特征与所述备选专利的语义特征进行交互关联后通过分类器,以此来判断两者的匹配度是否满足要求。这样,能够避免传统专利信息检索方式带来的低便利性、低效率和低准确性的问题,从而提高了专利信息检索的准确性和效率,以更好地满足用户的需求。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的基于大数据的专利信息检索系统的框图;
图2为根据本申请实施例的基于大数据的专利信息检索系统的系统架构图;
图3为根据本申请实施例的基于大数据的专利信息检索系统中检索图像-备选专利匹配模块的框图;
图4为根据本申请实施例的基于大数据的专利信息检索系统中特征修正单元的框图;
图5为根据本申请实施例的基于大数据的专利信息检索方法的流程图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
虽然本申请对根据本申请的实施例的系统中的某些模块做出了各种引用,然而,任何数量的不同模块可以被使用并运行在用户终端和/或服务器上。所述模块仅是说明性的,并且所述系统和方法的不同方面可以使用不同模块。
本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,根据需要,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
传统的专利信息检索系统通常基于文本关键词匹配的方式进行检索。用户通过输入关键词或关键词组合来描述自己的检索需求,系统会根据这些关键词在专利文献中的出现频率和位置等信息进行匹配,然后返回与关键词相关的专利文献列表。然而,传统的文本关键词匹配方案主要依赖于关键词的表面形式,无法准确理解关键词的语义和含义,这导致了检索结果的准确性和相关性不高,往往需要用户进行反复的试错和调整。并且,由于专利文献的篇幅较长且内容复杂,传统专利信息检索方案可能会导致很多有价值的信息可能被忽略或无法被充分利用,也就是说,传统的文本关键词匹配方法无法捕捉到文本之间的语义关联和上下文信息,导致检索结果的覆盖范围有限,很难满足用户的具体需求。此外,传统的专利信息检索系统需要用户主动提供关键词或其他检索条件,这对于一些非专业用户来说可能存在一定的困难,同时,用户需要根据检索结果进行进一步的筛选和判断,这需要用户具备一定的专业知识和判断能力。因此,期望一种优化的专利信息检索系统。随着大数据技术的发展和应用,专利信息检索系统也在不断演进和改进。传统的专利信息检索系统主要基于文本关键词匹配,存在着语义理解不准确、信息检索效果不佳等问题。而图像检索作为一种新兴的检索方式,可以通过分析和比对图像的视觉特征,提供更准确和直观的检索结果。
在本申请的技术方案中,提出了一种基于大数据的专利信息检索系统。图1为根据本申请实施例的基于大数据的专利信息检索系统的框图。图2为根据本申请实施例的基于大数据的专利信息检索系统的系统架构图。如图1和图2所示,根据本申请的实施例的基于大数据的专利信息检索系统300,包括:检索图像采集模块310,用于获取由用户输入的检索图像;检索图像语义分析模块320,用于对所述检索图像进行局部语义分析以得到检索图像区域局部特征向量的序列;备选专利获取模块330,用于从专利数据库获取第一备选专利;备选专利语义分析模块340,用于对所述第一备选专利进行描述词语义分析以得到第一备选专利信息描述词特征向量的序列;检索图像-备选专利语义交互融合模块350,用于对所述检索图像区域局部特征向量的序列和所述第一备选专利信息描述词特征向量的序列进行跨模态交互融合以得到检索图像-备选专利跨模态交互融合特征;检索图像-备选专利匹配模块360,用于基于所述检索图像-备选专利跨模态交互融合特征,确定检索图像与第一备选专利之间的匹配度是否超过预定阈值。
特别地,所述检索图像采集模块310,用于获取由用户输入的检索图像。
特别地,所述检索图像语义分析模块320,用于对所述检索图像进行局部语义分析以得到检索图像区域局部特征向量的序列。也就是,在本申请的技术方案中,使用在图像的隐含特征提取方面具有优异表现性能的卷积神经网络模型来进行所述检索图像的特征挖掘。特别地,考虑到图像中的不同局部区域可能会存在有关于用户想要检索的重要特征信息,而通过使用卷积神经网络模型来进行所述检索图像的特征分析虽然能够有效地捕捉到图像中的特征分布,但是对于图像中局部区域语义特征的感知度和刻画充分度较低。应可以理解,RCNN(Region-based Convolutional Neural Network)是一种用于图像中区域特征提取的方法,其能够通过将图像分成多个候选区域,并对每个区域进行特征提取,来实现区域特征表示。因此,在本申请的技术方案中,进一步将所述检索图像通过基于RCNN模型的图像区域特征提取器以得到检索图像区域局部特征向量的序列。特别地,在专利信息检索系统中,将所述检索图像通过所述基于RCNN模型的图像区域特征提取器可以获得图像中不同区域的局部特征向量,这些局部特征向量可以捕捉到图像中不同区域的视觉和语义特征。通过提取图像局部区域的分布特征,可以更细粒度地描述图像内容,从而提高图像检索的准确性和精度。
特别地,所述备选专利获取模块330,用于从专利数据库获取第一备选专利。应可以理解,为了从专利数据库中匹配出与所述用户输入的检索图像关联度较高的专利,需要进行该专利数据库中的备选专利和所述检索图像之间的语义特征匹配。因此,在本申请的技术方案中,还需要进一步从专利数据库获取第一备选专利。
特别地,所述备选专利语义分析模块340,用于对所述第一备选专利进行描述词语义分析以得到第一备选专利信息描述词特征向量的序列。也就是,在本申请的技术方案中,对所述第一备选专利进行语义编码以得到第一备选专利信息描述词特征向量的序列。特别地,这里,通过语义编码处理能够捕捉到所述第一备选专利中基于词粒度的语义关联和上下文信息。因此,所述第一备选专利信息描述词特征向量的序列可以表示专利文献中的专利名称、专利号、申请人、发明人、摘要、权利要求等语义特征信息,并且具备语义相关性。具体地,对所述第一备选专利进行分词处理以将所述第一备选专利转化为由多个词组成的词序列;使用所述包含嵌入层的语义编码器的嵌入层分别将所述词序列中各个词映射为词嵌入向量以得到词嵌入向量的序列;使用所述包含嵌入层的语义编码器的转换器对所述词嵌入向量的序列进行基于转换器思想的全局上下文语义编码以得到多个全局上下文语义特征向量;以及,将所述多个全局上下文语义特征向量进行级联以得到所述第一备选专利信息描述词特征向量的序列。
值得一提的是,语义编码是将文本或其他形式的数据转换为具有语义信息的向量表示的过程。语义编码的目标是捕捉数据的语义含义和相关性,以便在后续的任务中进行语义理解、语义搜索、相似性计算等操作。在自然语言处理领域中,语义编码通常用于将文本转换为向量表示。常见的语义编码方法包括:词嵌入:词嵌入是将单词映射到连续向量空间的方法。通过词嵌入,每个单词可以表示为一个稠密的向量,其中相似的单词在向量空间中距离较近。常用的词嵌入模型包括Word2Vec、GloVe和FastText;句子嵌入:句子嵌入是将整个句子或短语映射到向量表示的方法。与词嵌入类似,句子嵌入可以通过将句子表示为向量来捕捉句子的语义信息。常见的句子嵌入模型包括基于递归神经网络的模型、基于卷积神经网络的模型以及Transformer模型。
特别地,所述检索图像-备选专利语义交互融合模块350,用于对所述检索图像区域局部特征向量的序列和所述第一备选专利信息描述词特征向量的序列进行跨模态交互融合以得到检索图像-备选专利跨模态交互融合特征。应可以理解,在专利信息检索系统中,所述检索图像区域局部特征向量序列捕捉了所述检索图像中不同局部区域的视觉语义特征,而所述第一备选专利信息描述词特征向量序列表示了专利文献中基于词粒度的语义特征信息。为了将这两种不同模态的特征进行交互融合,以获得更全面和准确的特征表示,可以引入跨模态融合注意力机制模块。具体地,在本申请的技术方案中,将所述检索图像区域局部特征向量的序列和所述第一备选专利信息描述词特征向量的序列通过跨模态融合注意力机制模块以得到检索图像-备选专利跨模态交互融合特征向量。应可以理解,所述跨模态融合注意力机制模块可以根据所述检索图像区域局部特征向量序列和所述专利信息描述词特征向量序列之间的关联程度,自动学习并分配注意力权重,以对不同特征序列之间的重要性进行建模。这样的注意力权重可以用于加权融合检索图像和备选专利信息的特征表示,使得重要和相关的特征得到更高的权重,而不重要或不相关的特征得到较低的权重。因此,通过所述跨模态融合注意力机制模块,可以得到综合检索图像和第一备选专利信息的视觉和语义信息,具备更全面和准确的表示能力。具体地,将所述检索图像区域局部特征向量的序列和所述第一备选专利信息描述词特征向量的序列通过跨模态融合注意力机制模块以得到检索图像-备选专利跨模态交互融合特征向量作为所述检索图像-备选专利跨模态交互融合特征,包括:计算所述检索图像区域局部特征向量的序列和所述第一备选专利信息描述词特征向量的序列中任意两个特征向量之间的相关度以得到检索图像-第一备选专利关联特征矩阵的序列;基于所述检索图像-第一备选专利关联特征矩阵的序列,对所述检索图像区域局部特征向量的序列和所述第一备选专利信息描述词特征向量的序列进行特征交互注意力编码以得到注意力增强检索图像区域局部特征向量的序列和注意力增强第一备选专利信息描述词特征向量的序列;融合所述检索图像区域局部特征向量的序列和所述注意力增强检索图像区域局部特征向量的序列中相应位置的特征向量以得到检索图像区域融合局部特征向量的序列,并融合所述第一备选专利信息描述词特征向量的序列和所述注意力增强第一备选专利信息描述词特征向量的序列中相应位置的特征向量以得到第一备选专利信息描述词融合特征向量的序列;对所述检索图像区域融合局部特征向量的序列进行最大值池化处理以得到检索图像区域融合局部最大值池化特征向量,并对所述第一备选专利信息描述词融合特征向量的序列进行最大值池化处理以得到第一备选专利信息描述词融合最大值池化特征向量;以及,融合所述检索图像区域融合局部最大值池化特征向量和所述第一备选专利信息描述词融合最大值池化特征向量以得到所述检索图像-备选专利跨模态交互融合特征向量。
特别地,所述检索图像-备选专利匹配模块360,用于基于所述检索图像-备选专利跨模态交互融合特征,确定检索图像与第一备选专利之间的匹配度是否超过预定阈值。特别地,在本申请的一个具体示例中,如图3所示,所述检索图像-备选专利匹配模块360,包括:特征修正单元361,用于对所述检索图像-备选专利跨模态交互融合特征向量进行特征分布优化以得到优化检索图像-备选专利跨模态交互融合特征向量;匹配度计算单元362,用于将所述优化检索图像-备选专利跨模态交互融合特征向量通过分类器以得到分类结果,所述分类结果用于表示检索图像与第一备选专利之间的匹配度是否超过预定阈值。
具体地,所述特征修正单元361,用于对所述检索图像-备选专利跨模态交互融合特征向量进行特征分布优化以得到优化检索图像-备选专利跨模态交互融合特征向量。特别地,在本申请的一个具体示例中,如图4所示,所述特征修正单元361,包括:级联子单元3611,用于将所述检索图像区域局部特征向量的序列进行级联以得到的第一级联特征向量,并将所述第一备选专利信息描述词特征向量的序列进行级联以得到的第二级联特征向量;特征平衡化修正子单元3612,用于对所述第一级联特征向量和所述第二级联特征向量进行特征平衡化修正以得到校正特征向量;以及,校正特征融合子单元3613,用于融合所述校正特征向量和所述检索图像-备选专利跨模态交互融合特征向量以得到所述优化检索图像-备选专利跨模态交互融合特征向量。
更具体地,所述级联子单元3611,用于将所述检索图像区域局部特征向量的序列进行级联以得到的第一级联特征向量,并将所述第一备选专利信息描述词特征向量的序列进行级联以得到的第二级联特征向量。应可以理解,将检索图像区域局部特征向量的序列进行级联,可以得到第一级联特征向量。这种级联操作可以将图像的局部特征整合为一个全局特征向量,以捕捉图像的整体信息;将第一备选专利信息描述词特征向量的序列进行级联,可以得到第二级联特征向量。通过级联操作可以将专利的描述词特征整合为一个全局特征向量,以表示专利的语义信息和描述内容。
更具体地,所述特征平衡化修正子单元3612,用于对所述第一级联特征向量和所述第二级联特征向量进行特征平衡化修正以得到校正特征向量。特别地,在本申请的技术方案中,所述检索图像区域局部特征向量的序列表达所述检索图像的局部关联的图像语义特征,而所述第一备选专利信息描述词特征向量的序列表达所述第一备选专利的文本语义特征,由此,在将所述检索图像区域局部特征向量的序列和所述第一备选专利信息描述词特征向量的序列通过跨模态融合注意力机制模块进行融合时,考虑到图像语义特征和文本语义特征间的特征分布表达强度的差异,即所述检索图像区域局部特征向量的序列的图像语义特征分布表达强度要大于所述第一备选专利信息描述词特征向量的序列的文本语义特征分布表达强度,因此,考虑到图像语义特征和文本语义特征的特征表达维度上的不同的分布强度,融合所述检索图像区域局部特征向量的序列和所述第一备选专利信息描述词特征向量的序列得到的所述检索图像-备选专利跨模态交互融合特征向量会具有表达不均衡,从而影响所述检索图像-备选专利跨模态交互融合特征向量的表达效果。基于此,优选地,对于所述检索图像区域局部特征向量的序列级联得到的第一级联特征向量,例如记为V1和所述第一备选专利信息描述词特征向量的序列级联得到的第二级联特征向量,例如记为V2进行特征插值式融合的目的损失自监督平衡化,以获得校正特征向量,例如记为Vc:
其中V1表示所述第一级联特征向量,V2表示所述第二级联特征向量,和/>分别表示所述第一级联特征向量和所述第二级联特征向量的全局均值的倒数,且I是单位向量,/>表示按位置点乘,/>表示按位置作差,/>表示按位置相加,Vc表示所述校正特征向量。也就是,在考虑到基于图像语义特征分布和文本语义特征分布的跨模态注意力机制融合的情况下,如果将待融合的所述第一级联特征向量V1视为所述第二级联特征向量V2的强语义特征增强输入,则可能损失所述第二级联特征向量V2的目标特征流形在类空间内的目标分布信息,导致类回归目的损失,因此通过对特征分布相对于彼此的离群分布(outlierdistribution)进行交叉惩罚的方式,可以在特征插值式融合时实现特征增强和回归鲁棒的自监督式平衡,以提升所述第一级联特征向量V1和所述第二级联特征向量V2的特征融合效果。这样,再将所述校正特征向量Vc与所述检索图像-备选专利跨模态交互融合特征向量融合,就可以提升所述检索图像-备选专利跨模态交互融合特征向量的表达效果,以提升其通过分类器得到的分类结果的准确性。这样,能够根据用户输入的检索图像自动从专利数据库中检索所需专利,从而提高了专利信息检索的准确性和效率,以更好地满足用户的需求。
更具体地,所述校正特征融合子单元3613,用于融合所述校正特征向量和所述检索图像-备选专利跨模态交互融合特征向量以得到所述优化检索图像-备选专利跨模态交互融合特征向量。应可以理解,通过融合所述校正特征向量和所述检索图像-备选专利跨模态交互融合特征向量,可以更好地表达图像和专利的关联性,以此来捕捉到更丰富的语义和视觉特征,进一步提高检索的效果。
值得一提的是,在本申请的其他具体示例中,还可以通过其他方式对所述检索图像-备选专利跨模态交互融合特征向量进行特征分布优化以得到优化检索图像-备选专利跨模态交互融合特征向量,例如:对原始的检索图像-备选专利跨模态交互融合特征向量进行预处理;对预处理后的特征向量进行分布分析,了解其统计特性和分布情况。可以使用直方图、密度估计等方法来可视化和分析特征向量的分布;根据特征分布分析的结果,采取相应的优化方法来改善特征向量的分布。常见的优化方法包括:数据变换:应用数据变换方法,如对数变换、指数变换、Box-Cox变换等,来调整特征向量的分布形态;标准化:使用标准化方法,如Z-score标准化、最大最小值标准化等,将特征向量的分布调整为均值为0、方差为1或在指定范围内的标准分布;分位数映射:通过将特征向量的分布映射到指定的分位数范围内,来调整特征向量的分布形态;特征选择:根据特征分布分析的结果,选择合适的特征子集,去除对匹配度判断贡献较小的特征,以提高特征向量的判别能力;根据所选的优化方法,对特征向量进行重建。将经过优化的特征分布应用于原始的检索图像-备选专利跨模态交互融合特征向量,生成优化后的检索图像-备选专利跨模态交互融合特征向量。
具体地,所述匹配度计算单元362,用于将所述优化检索图像-备选专利跨模态交互融合特征向量通过分类器以得到分类结果,所述分类结果用于表示检索图像与第一备选专利之间的匹配度是否超过预定阈值。也就是,利用所述检索图像的分布特征和所述第一备选专利的语义特征之间的跨模态注意力交互融合特征信息来进行分类处理,以此来判断两者的匹配度是否满足要求。值得一提的是,可以通过循环上述步骤,从专利数据库中找到与检索图像匹配度满足要求的专利为止。这样,能够根据用户输入图像实现自动化的专利检索,避免传统专利信息检索方式带来的低便利性、低效率和低准确性的问题,从而提高了专利信息检索的准确性和效率,以更好地满足用户的需求。更具体地,将所述优化检索图像-备选专利跨模态交互融合特征向量通过分类器以得到分类结果,所述分类结果用于表示检索图像与第一备选专利之间的匹配度是否超过预定阈值,包括:使用所述分类器的多个全连接层对所述优化检索图像-备选专利跨模态交互融合特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
值得一提的是,在本申请的其他具体示例中,还可以通过其他方式基于所述检索图像-备选专利跨模态交互融合特征,确定检索图像与第一备选专利之间的匹配度是否超过预定阈值,例如:选择适当的匹配度度量方法,例如余弦相似度、欧氏距离、曼哈顿距离等,用于衡量检索图像与第一备选专利之间的相似性;使用所述匹配度度量方法,计算检索图像与第一备选专利之间的匹配度分数。这可以通过计算检索图像-备选专利跨模态交互融合特征之间的相似性分数来实现;根据具体任务需求,设置一个预定阈值。该阈值可以根据实验或经验确定,用于判断匹配度是否超过预期;将计算得到的匹配度分数与预定阈值进行比较。如果匹配度分数超过预定阈值,则判断检索图像与第一备选专利匹配;否则,认为不匹配。
如上所述,根据本申请实施例的基于大数据的专利信息检索系统300可以实现在各种无线终端中,例如具有基于大数据的专利信息检索算法的服务器等。在一种可能的实现方式中,根据本申请实施例的基于大数据的专利信息检索系统300可以作为一个软件模块和/或硬件模块而集成到无线终端中。例如,该基于大数据的专利信息检索系统300可以是该无线终端的操作系统中的一个软件模块,或者可以是针对于该无线终端所开发的一个应用程序;当然,该基于大数据的专利信息检索系统300同样可以是该无线终端的众多硬件模块之一。
替换地,在另一示例中,该基于大数据的专利信息检索系统300与该无线终端也可以是分立的设备,并且该基于大数据的专利信息检索系统300可以通过有线和/或无线网络连接到该无线终端,并且按照约定的数据格式来传输交互信息。
进一步地,还提供一种基于大数据的专利信息检索方法。
图5为根据本申请实施例的基于大数据的专利信息检索方法的流程图。如图5所示,根据本申请实施例的基于大数据的专利信息检索方法,包括步骤:S1,获取由用户输入的检索图像;S2,对所述检索图像进行局部语义分析以得到检索图像区域局部特征向量的序列;S3,从专利数据库获取第一备选专利;S4,对所述第一备选专利进行描述词语义分析以得到第一备选专利信息描述词特征向量的序列;S5,对所述检索图像区域局部特征向量的序列和所述第一备选专利信息描述词特征向量的序列进行跨模态交互融合以得到检索图像-备选专利跨模态交互融合特征;S6,基于所述检索图像-备选专利跨模态交互融合特征,确定检索图像与第一备选专利之间的匹配度是否超过预定阈值。
综上,根据本申请实施例的基于大数据的专利信息检索方法被阐明,其通过采集用户的输入检索图像,并在后端引入图像处理和分析算法来进行该检索图像的特征分析,同时利用语义编码技术对专利数据库中的备选专利进行语义分析,然后再将所述检索图像的语义特征与所述备选专利的语义特征进行交互关联后通过分类器,以此来判断两者的匹配度是否满足要求。这样,能够避免传统专利信息检索方式带来的低便利性、低效率和低准确性的问题,从而提高了专利信息检索的准确性和效率,以更好地满足用户的需求。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (9)
1.一种基于大数据的专利信息检索系统,其特征在于,包括:
检索图像采集模块,用于获取由用户输入的检索图像;
检索图像语义分析模块,用于对所述检索图像进行局部语义分析以得到检索图像区域局部特征向量的序列;
备选专利获取模块,用于从专利数据库获取第一备选专利;
备选专利语义分析模块,用于对所述第一备选专利进行描述词语义分析以得到第一备选专利信息描述词特征向量的序列;
检索图像-备选专利语义交互融合模块,用于对所述检索图像区域局部特征向量的序列和所述第一备选专利信息描述词特征向量的序列进行跨模态交互融合以得到检索图像-备选专利跨模态交互融合特征;
检索图像-备选专利匹配模块,用于基于所述检索图像-备选专利跨模态交互融合特征,确定检索图像与第一备选专利之间的匹配度是否超过预定阈值。
2.根据权利要求1所述的基于大数据的专利信息检索系统,其特征在于,所述检索图像语义分析模块,用于:将所述检索图像通过基于RCNN模型的图像区域特征提取器以得到所述检索图像区域局部特征向量的序列。
3.根据权利要求2所述的基于大数据的专利信息检索系统,其特征在于,所述备选专利语义分析模块,用于:对所述第一备选专利进行语义编码以得到所述第一备选专利信息描述词特征向量的序列。
4.根据权利要求3所述的基于大数据的专利信息检索系统,其特征在于,所述检索图像-备选专利语义交互融合模块,用于:将所述检索图像区域局部特征向量的序列和所述第一备选专利信息描述词特征向量的序列通过跨模态融合注意力机制模块以得到检索图像-备选专利跨模态交互融合特征向量作为所述检索图像-备选专利跨模态交互融合特征。
5.根据权利要求4所述的基于大数据的专利信息检索系统,其特征在于,所述检索图像-备选专利语义交互融合模块,包括:
相关度计算单元,用于计算所述检索图像区域局部特征向量的序列和所述第一备选专利信息描述词特征向量的序列中任意两个特征向量之间的相关度以得到检索图像-第一备选专利关联特征矩阵的序列;
特征交互注意力编码单元,用于基于所述检索图像-第一备选专利关联特征矩阵的序列,对所述检索图像区域局部特征向量的序列和所述第一备选专利信息描述词特征向量的序列进行特征交互注意力编码以得到注意力增强检索图像区域局部特征向量的序列和注意力增强第一备选专利信息描述词特征向量的序列;
特征向量融合单元,用于融合所述检索图像区域局部特征向量的序列和所述注意力增强检索图像区域局部特征向量的序列中相应位置的特征向量以得到检索图像区域融合局部特征向量的序列,并融合所述第一备选专利信息描述词特征向量的序列和所述注意力增强第一备选专利信息描述词特征向量的序列中相应位置的特征向量以得到第一备选专利信息描述词融合特征向量的序列;
最大值池化单元,用于对所述检索图像区域融合局部特征向量的序列进行最大值池化处理以得到检索图像区域融合局部最大值池化特征向量,并对所述第一备选专利信息描述词融合特征向量的序列进行最大值池化处理以得到第一备选专利信息描述词融合最大值池化特征向量;以及
融合单元,用于融合所述检索图像区域融合局部最大值池化特征向量和所述第一备选专利信息描述词融合最大值池化特征向量以得到所述检索图像-备选专利跨模态交互融合特征向量。
6.根据权利要求5所述的基于大数据的专利信息检索系统,其特征在于,所述检索图像-备选专利匹配模块,包括:
特征修正单元,用于对所述检索图像-备选专利跨模态交互融合特征向量进行特征分布优化以得到优化检索图像-备选专利跨模态交互融合特征向量;
匹配度计算单元,用于将所述优化检索图像-备选专利跨模态交互融合特征向量通过分类器以得到分类结果,所述分类结果用于表示检索图像与第一备选专利之间的匹配度是否超过预定阈值。
7.根据权利要求6所述的基于大数据的专利信息检索系统,其特征在于,所述特征修正单元,包括:
级联子单元,用于将所述检索图像区域局部特征向量的序列进行级联以得到的第一级联特征向量,并将所述第一备选专利信息描述词特征向量的序列进行级联以得到的第二级联特征向量;
特征平衡化修正子单元,用于对所述第一级联特征向量和所述第二级联特征向量进行特征平衡化修正以得到校正特征向量;以及
校正特征融合子单元,用于融合所述校正特征向量和所述检索图像-备选专利跨模态交互融合特征向量以得到所述优化检索图像-备选专利跨模态交互融合特征向量。
8.根据权利要求7所述的基于大数据的专利信息检索系统,其特征在于,所述匹配度计算单元,包括:
全连接编码子单元,用于使用所述分类器的多个全连接层对所述优化检索图像-备选专利跨模态交互融合特征向量进行全连接编码以得到编码分类特征向量;以及
分类结果生成子单元,用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
9.一种基于大数据的专利信息检索方法,其特征在于,包括:
获取由用户输入的检索图像;
对所述检索图像进行局部语义分析以得到检索图像区域局部特征向量的序列;
从专利数据库获取第一备选专利;
对所述第一备选专利进行描述词语义分析以得到第一备选专利信息描述词特征向量的序列;
对所述检索图像区域局部特征向量的序列和所述第一备选专利信息描述词特征向量的序列进行跨模态交互融合以得到检索图像-备选专利跨模态交互融合特征;
基于所述检索图像-备选专利跨模态交互融合特征,确定检索图像与第一备选专利之间的匹配度是否超过预定阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311435682.4A CN117349406A (zh) | 2023-10-30 | 2023-10-30 | 基于大数据的专利信息检索系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311435682.4A CN117349406A (zh) | 2023-10-30 | 2023-10-30 | 基于大数据的专利信息检索系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117349406A true CN117349406A (zh) | 2024-01-05 |
Family
ID=89362985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311435682.4A Withdrawn CN117349406A (zh) | 2023-10-30 | 2023-10-30 | 基于大数据的专利信息检索系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117349406A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117637153A (zh) * | 2024-01-23 | 2024-03-01 | 吉林大学 | 患者安全护理的信息化管理系统及方法 |
CN118013621A (zh) * | 2024-02-01 | 2024-05-10 | 其无(武汉)设计有限公司 | 用于室内设计的智能数据处理系统及其方法 |
-
2023
- 2023-10-30 CN CN202311435682.4A patent/CN117349406A/zh not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117637153A (zh) * | 2024-01-23 | 2024-03-01 | 吉林大学 | 患者安全护理的信息化管理系统及方法 |
CN117637153B (zh) * | 2024-01-23 | 2024-03-29 | 吉林大学 | 患者安全护理的信息化管理系统及方法 |
CN118013621A (zh) * | 2024-02-01 | 2024-05-10 | 其无(武汉)设计有限公司 | 用于室内设计的智能数据处理系统及其方法 |
CN118013621B (zh) * | 2024-02-01 | 2024-08-02 | 其无(武汉)设计有限公司 | 用于室内设计的智能数据处理系统及其方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111177446B (zh) | 一种用于足迹图像检索的方法 | |
US8254699B1 (en) | Automatic large scale video object recognition | |
CN117349406A (zh) | 基于大数据的专利信息检索系统及方法 | |
US20090282025A1 (en) | Method for generating a representation of image content using image search and retrieval criteria | |
CN108519971B (zh) | 一种基于平行语料库的跨语种新闻主题相似性对比方法 | |
CN108229588B (zh) | 一种基于深度学习的机器学习识别方法 | |
CN103473327A (zh) | 图像检索方法与系统 | |
CN113806482A (zh) | 视频文本跨模态检索方法、装置、存储介质和设备 | |
WO2022089467A1 (zh) | 视频数据的排序方法、装置、计算机设备和存储介质 | |
CN113222149A (zh) | 模型训练方法、装置、设备和存储介质 | |
CN114461890A (zh) | 分层多模态的知识产权搜索引擎方法与系统 | |
KR20190008699A (ko) | 토픽 모델링 기반 시맨틱 이미지 검색 방법, 시스템 및 컴퓨터 프로그램 | |
CN117743517A (zh) | 基于人工智能的智慧冰雪旅游管理系统及方法 | |
CN115168590A (zh) | 文本特征提取方法、模型训练方法、装置、设备及介质 | |
CN110209865B (zh) | 一种基于深度学习的物体识别及匹配方法 | |
CN113032573B (zh) | 一种结合主题语义与tf*idf算法的大规模文本分类方法及系统 | |
CN118312816A (zh) | 基于成员选择的簇加权聚类集成医学数据处理方法及系统 | |
CN114588633A (zh) | 一种内容推荐方法 | |
CN113255828B (zh) | 特征检索方法、装置、设备及计算机存储介质 | |
Sowmyayani et al. | STHARNet: Spatio-temporal human action recognition network in content based video retrieval | |
CN114328812A (zh) | 一种基于文本聚类的社区居民事件识别方法及装置 | |
CN113535928A (zh) | 基于注意力机制下长短期记忆网络的服务发现方法及系统 | |
CN107193979B (zh) | 一种同源图片检索的方法 | |
CN109934248B (zh) | 一种针对迁移学习的多模型随机生成与动态自适应组合方法 | |
CN111310048A (zh) | 基于多层感知机的新闻推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20240105 |
|
WW01 | Invention patent application withdrawn after publication |