CN112559820A - 基于深度学习的样本数据集智能出题方法、装置及设备 - Google Patents

基于深度学习的样本数据集智能出题方法、装置及设备 Download PDF

Info

Publication number
CN112559820A
CN112559820A CN202011499622.5A CN202011499622A CN112559820A CN 112559820 A CN112559820 A CN 112559820A CN 202011499622 A CN202011499622 A CN 202011499622A CN 112559820 A CN112559820 A CN 112559820A
Authority
CN
China
Prior art keywords
data
text
feature vector
vector
search text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011499622.5A
Other languages
English (en)
Other versions
CN112559820B (zh
Inventor
孙显
张文凯
付琨
袁志强
陈佳良
赵良瑾
于泓峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aerospace Information Research Institute of CAS
Original Assignee
Aerospace Information Research Institute of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aerospace Information Research Institute of CAS filed Critical Aerospace Information Research Institute of CAS
Priority to CN202011499622.5A priority Critical patent/CN112559820B/zh
Publication of CN112559820A publication Critical patent/CN112559820A/zh
Application granted granted Critical
Publication of CN112559820B publication Critical patent/CN112559820B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提出一种基于深度学习的样本数据集智能出题方法、装置及设备,该方法包括:获取搜索文本,根据搜索文本生成句表征向量;提取数据库中数据的特征,生成数据的特征向量;其中,数据库中数据包括图像信息或文本信息或非结构化数据;根据句表征向量及数据的特征向量计算搜索文本和数据的距离相似度;根据距离相似度排序获取与搜索文本匹配的数据。该方法可以通过深度学习的方法智能化地获取所需要的数据,而且能够实现对多种数据类型的智能检索,解决了传统搜索模式所造成的数据贫乏的问题。

Description

基于深度学习的样本数据集智能出题方法、装置及设备
技术领域
本公开涉及数据库智能搜索技术,具体涉及一种基于深度学习的样本数据集智能出题方法、装置及设备。
背景技术
随着大数据相关技术的发展,数据库系统得到了广泛的应用。数据库是按照数据结构来组织、存储和管理数据的仓库,数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。数据库有很多种类型,从最简单的存储有各种数据的表格到能够进行海量数据存储的大型数据库系统都在各个方面得到了广泛的应用。在信息化社会,充分有效地管理和利用各类信息资源,是进行科学研究和决策管理的前提条件。
目前关于数据库的检索仍局限于传统模式,即按照特定方式和方法来对数据进行检索。常用的检索方法有两种,第一种是族性检索,即从学科分类角度检索所需信息,通常是采用分类检索或分类浏览。第二种是特性检索,即已知某一条件,例如书名、著者或关键词,查找与该条件匹配的文献或信息。然而,对于人工智能领域,尤其是在对深度学习模型评估时,这样的检索模式显然不能做到全面的评估模型。
发明内容
本公开一方面提供一种基于深度学习的样本数据集智能出题方法,包括:获取搜索文本,根据搜索文本生成句表征向量;提取数据库中数据的特征,生成数据的特征向量;其中,数据库中数据包括图像信息或文本信息或非结构化数据;根据句表征向量及数据的特征向量计算搜索文本和数据的距离相似度;根据距离相似度排序获取与搜索文本匹配的数据。
可选地,当数据为图像信息时,根据句表征向量及数据的特征向量计算搜索文本和数据的距离相似度,包括:将句表征向量与图像特征向量进行融合,输出与图像对应的第一文本特征向量;其中,图像特征向量为根据图像信息生成的特征向量;根据图像信息与第一文本特征向量计算搜索文本与图像信息的余弦相似度距离。
可选地,当数据为文本信息时,根据句表征向量及数据的特征向量计算搜索文本和数据的距离相似度,包括:根据句表征向量与第二文本特征向量计算搜索文本与文本信息的欧式距离相似度;其中,第二文本特征向量为根据文本信息生成的特征向量。
可选地,当数据为非结构化数据时,根据句表征向量及数据的特征向量计算搜索文本和数据之间的距离相似度,包括:将句表征向量与非结构化数据特征向量进行融合,输出与非结构化数据对应的第三文本特征向量;其中,非结构化数据特征向量为根据非结构化数据生成的特征向量;根据非结构化数据与第三文本特征向量计算搜索文本和非结构化数据的距离相似度。
可选地,根据搜索文本生成句表征向量,包括:对搜索文本进行预处理,以得到表征词;将表征词进行词义嵌入和位置嵌入,生成句表征向量。
可选地,将表征词进行词义嵌入和位置嵌入,生成句表征向量,包括:对表征词进行One-Hot编码,将其映射为稀疏向量;将稀疏向量进行词义嵌入,将其编码为稠密向量;将表征词进行位置编码,根据位置编码后的特征与稠密向量生成句表征向量。
本公开另一方面提供一种基于深度学习的样本数据集智能出题装置,包括:获取模块,用于获取搜索文本以及数据库中数据;其中,数据库中数据包括图像信息或文本信息或非结构化数据;编码模块,用于接收搜索文本以及数据,对搜索文本和数据进行特征提取,对特征进行编码并分别生成句表征向量和数据的特征向量;匹配模块,用于根据句表征向量和数据的特征向量计算搜索文本和数据的距离相似度,并根据距离相似度排序获取与搜索文本匹配的数据。
可选地,上述装置还包括:融合模块,当数据为图像信息或非结构化数据时,用于将句表征向量与图像信息的特征向量或非结构化数据的特征向量进行融合,输出与图像信息对应的第一文本特征向量或与非结构化数据对应的第三文本特征向量;其中,图像信息的特征向量或非结构化数据的特征向量为编码模块根据图像信息或非结构化数据生成的特征向量;匹配模块根据图像信息与第一文本特征向量计算搜索文本与图像信息的余弦相似度距离;匹配模块根据非结构化数据与第三文本特征向量计算搜索文本和非结构化数据的距离相似度。
可选地,当数据为文本信息时,匹配模块根据句表征向量和数据的特征向量计算搜索文本和数据的距离相似度,包括:匹配模块根据句表征向量与第二文本特征向量计算搜索文本与文本信息的欧式距离相似度;其中,第二文本特征向量为编码模块根据文本信息生成的特征向量。
本公开的另一方面提供一种电子设备,电子设备包括处理器和存储器,存储器中存储有至少一条指令,指令在被处理器执行时实现如上所述的方法。
本公开的又一方面提供一种计算机可读存储介质,存储介质中存储有至少一条指令,指令在被处理器执行时实现如上所述的方法。
与现有技术相比,本公开的有益效果为:
(1)相比于传统的检索方式,本公开提出的基于深度学习的样本数据集智能出题方法可以通过深度学习的方法智能化地获取所需要的数据,而且能够实现对多种数据类型例如图像信息、文本信息和非结构化数据等的智能检索。
(2)本公开可实现搜索文本的多样性,解决了传统搜索模式所造成的数据贫乏的问题,该方法可应用于有检索多种数据需求的场景(例如应用于智能出题)。
附图说明
图1示意性示出了本公开实施例的基于深度学习的样本数据集智能出题方法的流程图;
图2示意性示出了根据本公开实施例的基于深度学习的样本数据集智能出题方法中由搜索文本生成句表征向量的流程图;
图3示意性示出了根据本公开实施例的基于深度学习的样本数据集智能出题方法检索与搜索文本匹配的图像信息的结构图;
图4示意性示出了根据本公开实施例的基于深度学习的样本数据集智能出题方法检索与搜索文本匹配的文本信息的结构图;
图5示意性示出了本公开实施例的基于深度学习的样本数据集智能出题方法检索与搜索文本匹配的非结构化数据的结构图;
图6A示意性示出了根据本公开实施例的基于深度学习的样本数据集智能出题装置的框图;
图6B示意性示出了根据本公开另一实施例的基于深度学习的样本数据集智能出题装置的框图;
图7示意性示出了根据本公开实施例的电子设备的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。
针对需要检索多种数据的场景,例如,在利用数据库进行检索智能出题的应用场景中,现有技术中的检索方法检索的数据过于单一,无法实现对多种数据形式的信息进行检索,使用过程较为不便,而且也无法满足智能出题应用中的检索需求。针对上述存在的技术问题,本公开提供了一种基于深度学习的样本数据集智能出题方法、装置、电子设备和介质,用于解决上述技术问题的至少之一。
图1示意性示出了本公开实施例的基于深度学习的样本数据集智能出题方法的流程图。
如图1所示,该基于深度学习的样本数据集智能出题方法包括操作S110~S140。
在操作S110中,获取搜索文本,根据搜索文本生成句表征向量。
在操作S120中,提取数据库中数据的特征,生成数据的特征向量;其中,数据库中数据包括图像信息或文本信息或非结构化数据。
在操作S130中,根据句表征向量及数据的特征向量计算搜索文本和数据的距离相似度。
在操作S140中,根据距离相似度排序获取与搜索文本匹配的数据。
图2示意性示出了根据本公开实施例的基于深度学习的样本数据集智能出题方法中由搜索文本生成句表征向量的流程图。
如图2所示,根据本公开实施例,在操作S110中,根据搜索文本生成表征向量还包括操作S111~S112。
在操作S111中,对搜索文本进行预处理,以得到表征词。
具体地,对获取的搜索文本进行繁简转换,去掉符号以及与语义不符合的停用词以获得干净的搜索文本。然后对干净的搜索文本使用开源的jieba分词进行处理,并得到具有特定含义的表征词。为了防止jieba分词的不准确性,应预先设定与数据相符合的关键词。使用jieba分词分割之后,每一个句子就变成了离散的一个个的词。
在操作S112中,将表征词进行词义嵌入和位置嵌入,生成句表征向量。具体地,根据本公开实施例,上述操作S112中还包括操作S1121~S1123。
在操作S1121中,对表征词进行One-Hot编码,将其映射为稀疏向量,以此来降低模型复杂度,提高程序运行效率。
在操作S1122中,为了降低句子的表征空间,将稀疏向量进行词义嵌入,将其编码为稠密向量。
无论是词还是句子的表示,向量都过于稀疏,除了少数维度之外的大多数维度都为零。每个词所对应的向量在空间上都两两正交,任意一对向量之间的内积等数值特征都为零,无法表达词语之间的语义关联和差异。句子的向量表示丢失了词序特征,例如,“我很不开心”和“不我很开心”对应的向量相同,而这显然是不符合语义的。
对稀疏向量进行词义嵌入的目的是为了使用低维、稠密、实值的词向量来表示每一个词,从而赋予词语丰富的语义含义,并使得计算词语相关度成为可能。以最简单的情况为例,如果使用二维向量来表示词语,那么可以将每个词看作平面上的一个点,点的位置即横纵坐标由对应的二维向量确定,可以是任意且连续的。如果希望点的位置中蕴含词的语义,那么平面上位置相邻的点应当具有相关或相似的语义。用数学的语言来说,两个词具有语义相关或相似,则它们所对应的词向量之间距离相近,因此,通过度量向量之间的距离即可获得与搜索文本匹配的数据。
在操作S1123中,进一步地,为了记录表征词原始的位置信息,对其进行位置编码,根据位置编码后的特征与稠密向量生成句表征向量。位置编码的具体流程为使用余弦曲线与原始的词表征进行相加,在得到了位置编码后的特征之后,使简单的使用搜索句中所有表征词的叠加作为搜索句的最后表征,也即获得句表征向量。
为了更清楚地说明本公开实施例的技术方案,以下将结合具体实施例对本公开实施例的基于深度学习的样本数据集智能出题方法在检索图像信息、文本信息和非结构数据方面的应用进行示例性说明。
图3~图5示意性示出了根据本公开实施例的基于深度学习的样本数据集智能出题方法检索与搜索文本匹配的数据的结构图。需要注意的是,图3~图5所示仅为可以应用本公开实施例的基于深度学习的样本数据集智能出题方法的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于检索其他类型的数据。
图3示意性示出了根据本公开实施例的基于深度学习的样本数据集智能出题方法检索与搜索文本匹配的图像信息的结构图。
当待检索数据为图像信息时,如图3所示,利用搜索文本获取的句表征向量以及该图像信息计算得到与搜索文本匹配的图像信息的具体操作包括S310~S340。
在操作S310中,提取数据库中的图像信息的特征,得到代表图像的特征向量。具体地,对待检索的图像进行特征抽取,得到与操作S110输出的句表征向量相同维度的图像特征。
在操作S320中,将上述句表征向量与图像特征向量进行融合,输出与图像信息对应的第一文本特征向量。
在操作S330中,根据图像信息与第一文本特征向量计算搜索文本与图像信息的余弦相似度距离。具体地,根据图像信息和第一文本特征向量进行余弦相似度计算,计算之后对最后一维进行加和,得到向量之间的距离表示。
在操作S340中,根据上述余弦相似度距离排序获取与搜索文本匹配的数据。具体地,在得到距离之后,便可根据距离的远近对数据库中的数据进行相似度排序,得到与搜索文本最为相近的一副或多副图像。
图4示意性示出了根据本公开实施例的基于深度学习的样本数据集智能出题方法检索与搜索文本匹配的文本信息的结构图。
当数据为文本信息时,如图4所示,根据操作S110得到的句表征向量及文本信息计算与搜索文本匹配的文本信息的具体操作包括S410~S430。
在操作S410中,提取数据库中的文本信息,将该文本信息进行与操作S110相同的处理,输出与数据库中文本信息对应的第二文本特征向量。
具体地,将文本信息进行预处理,获得干净的搜索文本。然后对干净的搜索文本使用开源的jieba分词进行处理,并得到具有特定含义的表征词;然后将表证词进行词义嵌入和位置嵌入,最后得到与数据库中文本信息对应的第二文本特征向量。上述对文本信息的具体处理与操作S110相同,在此不再赘述。
在操作S420中,根据句表征向量与第二文本特征向量计算搜索文本与文本信息的距离相似度。具体的,由于数据库中文本信息和搜索文本使用同一种表征方式,因此,可以直接通过计算两者的欧式距离来判断两者的相似程度。
在操作S430中,根据上述欧式距离排序获取与搜索文本匹配的数据。具体地,在得到距离之后,便可根据距离的远近对数据库中的文本信息数据进行相似度排序,得到与搜索文本最为相近的文本信息。
图5示意性示出了本公开实施例的基于深度学习的样本数据集智能出题方法检索与搜索文本匹配的非结构化数据的结构图。
当数据为非结构化数据时,如图5所示,根据句表征向量及非结构化数据计算得到与搜索文本匹配的非结构化数据的具体操作包括S510~S540。
在本公开实施例中,非结构化数据包括但不限于所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等。在利用本公开实施例中的检索方法检索非结构化数据时,可以根据非结构化数据的形式来进行特征提取以及距离相似度计算。例如,对于图数据和树等难以用传统的神经网络来表示的数据,可以使用预训练好的图神经网络提取出图数据的特征表示。例如对于音频数据,可以首先抽取出音频信息的频谱图,进而将其当作图像按照图3中所示的操作进行处理。
以下将以音频数据为例对非结构化数据的检索应用进行说明。需要注意的是,在本实施例中以音频数据为例进行示例性说明,仅为了便于理解本公开实施例的技术方案,并非为了限制本公开的范围。
在操作S510中,提取数据库中的非结构化数据,得到代表该非结构化数据的特征向量。
例如对于音频数据,可以首先抽取出音频信息的频谱图,进而将其当作图像按照图3中所示的操作进行处理。具体地,在操作S510中,在得到频谱图后,提取该频谱图中的特征,得到代表该音频信息的特征向量。
在操作S520中,将句表征向量与非结构化数据特征向量进行融合,输出与非结构化数据对应的第三文本特征向量。
具体地,将操作S510中提取的代表音频信息的特征向量与句表征向量进行融合,输出与音频信息对应的第三文本特征向量。
在操作S530中,根据非结构化数据与第三文本特征向量计算搜索文本和非结构化数据的距离相似度。
具体地,根据音频信息的频谱图和第三文本特征向量进行余弦相似度计算,计算之后对最后一维进行加和,得到向量之间的距离表示。
在操作S540中,根据上述余弦相似度距离排序获取与搜索文本匹配的数据。具体地,在得到距离之后,便可根据距离的远近对数据库中的数据进行相似度排序,得到与搜索文本最为相近的音频信息。
与现有技术相比,本公开提出的基于深度学习的样本数据集智能出题方法可以通过深度学习的方法智能化地获取所需要的数据,而且能够实现对多种数据类型例如图像信息、文本信息和非结构化数据等的智能检索。此外,本公开可实现搜索文本的多样性,解决了传统搜索模式所造成的数据贫乏的问题,该方法可应用于有检索多种数据需求的场景,例如应用于智能出题。
图6A和图6B示意性示出了根据本公开实施例的基于深度学习的样本数据集智能出题装置的框图。
如图6A所示,该基于深度学习的样本数据集智能出题装置600包括获取模块610、编码模块620和匹配模块630。
获取模块610用于获取搜索文本以及数据库中数据;其中,数据库中数据包括图像信息或文本信息或非结构化数据。
编码模块620用于接收搜索文本以及数据,对搜索文本和数据进行特征提取,对特征进行编码并分别生成句表征向量和数据的特征向量。
匹配模块630用于根据句表征向量和数据的特征向量计算搜索文本和数据的距离相似度,并根据距离相似度排序获取与搜索文本匹配的数据。
如图6B所示,该基于深度学习的样本数据集智能出题装置600还包括:融合模块640。
根据本公开实施例,当上述数据库中数据为图像信息或非结构化数据时,用于将句表征向量与图像信息的特征向量或非结构化数据的特征向量进行融合,输出与图像信息对应的第一文本特征向量或与非结构化数据对应的第三文本特征向量。其中,图像信息的特征向量或非结构化数据的特征向量为编码模块620根据图像信息或非结构化数据生成的特征向量。
根据本公开实施例,匹配模块630根据图像信息与第一文本特征向量计算搜索文本与图像信息的余弦相似度距离,以及匹配模块630根据非结构化数据与第三文本特征向量计算搜索文本和非结构化数据的距离相似度。
根据本公开实施例,当上述数据为文本信息时,匹配模块630根据句表征向量和数据的特征向量计算搜索文本和数据的距离相似度,包括:匹配模块630根据句表征向量与第二文本特征向量计算搜索文本与文本信息的欧式距离相似度。其中,第二文本特征向量为编码模块620根据文本信息生成的特征向量。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,获取模块610、编码模块620、匹配模块630和融合模块640中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,获取模块610、编码模块620、匹配模块630和融合模块640中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,获取模块610、编码模块620、匹配模块630和融合模块640中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图7示意性示出了根据本公开实施例的适于实现上文描述的方法的电子设备的方框图。图7示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图7所示,电子设备700包括处理器710、计算机可读存储介质720。该电子设备700可以执行根据本公开实施例的方法。
具体地,处理器710例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器710还可以包括用于缓存用途的板载存储器。处理器710可以是用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
计算机可读存储介质720,例如可以是非易失性的计算机可读存储介质,具体示例包括但不限于:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;等等。
计算机可读存储介质720可以包括计算机程序721,该计算机程序721可以包括代码/计算机可执行指令,其在由处理器710执行时使得处理器710执行根据本公开实施例的方法或其任何变形。
计算机程序721可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序721中的代码可以包括一个或多个程序模块,例如包括721A、模块721B、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器710执行时,使得处理器710可以执行根据本公开实施例的方法或其任何变形。
根据本发明的实施例,获取模块610、编码模块620、匹配模块630和融合模块640中的至少一个可以实现为参考图7描述的计算机程序模块,其在被处理器710执行时,可以实现上面描述的相应操作。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。

Claims (10)

1.一种基于深度学习的样本数据集智能出题方法,其特征在于,包括:
获取搜索文本,根据所述搜索文本生成句表征向量;
提取数据库中数据的特征,生成所述数据的特征向量;其中,所述数据库中数据包括图像信息或文本信息或非结构化数据;
根据所述句表征向量及所述数据的特征向量计算所述搜索文本和所述数据的距离相似度;
根据所述距离相似度排序获取与所述搜索文本匹配的所述数据。
2.如权利要求1所述的方法,其特征在于,当所述数据为图像信息时,所述根据所述句表征向量及所述数据的特征向量计算所述搜索文本和所述数据的距离相似度,包括:
将所述句表征向量与图像特征向量进行融合,输出与所述图像对应的第一文本特征向量;其中,所述图像特征向量为根据所述图像信息生成的特征向量;
根据所述图像信息与所述第一文本特征向量计算所述搜索文本与所述图像信息的余弦相似度距离。
3.如权利要求1所述的方法,其特征在于,当所述数据为文本信息时,所述根据所述句表征向量及所述数据的特征向量计算所述搜索文本和所述数据的距离相似度,包括:
根据所述句表征向量与第二文本特征向量计算所述搜索文本与所述文本信息的欧式距离相似度;其中,所述第二文本特征向量为根据所述文本信息生成的特征向量。
4.如权利要求1所述的方法,其特征在于,当所述数据为非结构化数据时,所述根据所述句表征向量及所述数据的特征向量计算所述搜索文本和所述数据之间的距离相似度,包括:
将所述句表征向量与非结构化数据特征向量进行融合,输出与所述非结构化数据对应的第三文本特征向量;其中,所述非结构化数据特征向量为根据所述非结构化数据生成的特征向量;
根据所述非结构化数据与所述第三文本特征向量计算所述搜索文本和所述非结构化数据的距离相似度。
5.如权利要求1所述的方法,其特征在于,所述根据所述搜索文本生成句表征向量,包括:
对所述搜索文本进行预处理,以得到表征词;
将所述表征词进行词义嵌入和位置嵌入,生成句表征向量。
6.如权利要求5所述的方法,其特征在于,所述将所述表征词进行词义嵌入和位置嵌入,生成句表征向量,包括:
对所述表征词进行One-Hot编码,将其映射为稀疏向量;
将所述稀疏向量进行词义嵌入,将其编码为稠密向量;
将所述表征词进行位置编码,根据所述位置编码后的特征与所述稠密向量生成所述句表征向量。
7.一种基于深度学习的样本数据集智能出题装置,其特征在于,包括:
获取模块,用于获取搜索文本以及数据库中数据;其中,所述数据库中数据包括图像信息或文本信息或非结构化数据;
编码模块,用于接收所述搜索文本以及所述数据,对所述搜索文本和所述数据进行特征提取,对所述特征进行编码并分别生成句表征向量和所述数据的特征向量;
匹配模块,用于根据所述句表征向量和所述数据的特征向量计算所述搜索文本和所述数据的距离相似度,并根据所述距离相似度排序获取与所述搜索文本匹配的所述数据。
8.如权利要求7所述的装置,其特征在于,所述装置还包括:
融合模块,当所述数据为图像信息或非结构化数据时,用于将所述句表征向量与图像信息的特征向量或非结构化数据的特征向量进行融合,输出与所述图像信息对应的第一文本特征向量或与所述非结构化数据对应的第三文本特征向量;其中,所述图像信息的特征向量或所述非结构化数据的特征向量为所述编码模块根据所述图像信息或所述非结构化数据生成的特征向量;
所述匹配模块根据所述图像信息与所述第一文本特征向量计算所述搜索文本与所述图像信息的余弦相似度距离;
所述匹配模块根据所述非结构化数据与所述第三文本特征向量计算所述搜索文本和所述非结构化数据的距离相似度。
9.如权利要求7所述的装置,其特征在于,当所述数据为文本信息时,所述匹配模块根据所述句表征向量和所述数据的特征向量计算所述搜索文本和所述数据的距离相似度,包括:
所述匹配模块根据所述句表征向量与第二文本特征向量计算所述搜索文本与所述文本信息的欧式距离相似度;其中,所述第二文本特征向量为所述编码模块根据所述文本信息生成的特征向量。
10.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令在被所述处理器执行时实现如权利要求1-6中任一项所述的方法。
CN202011499622.5A 2020-12-17 2020-12-17 基于深度学习的样本数据集智能出题方法、装置及设备 Active CN112559820B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011499622.5A CN112559820B (zh) 2020-12-17 2020-12-17 基于深度学习的样本数据集智能出题方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011499622.5A CN112559820B (zh) 2020-12-17 2020-12-17 基于深度学习的样本数据集智能出题方法、装置及设备

Publications (2)

Publication Number Publication Date
CN112559820A true CN112559820A (zh) 2021-03-26
CN112559820B CN112559820B (zh) 2022-08-30

Family

ID=75063826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011499622.5A Active CN112559820B (zh) 2020-12-17 2020-12-17 基于深度学习的样本数据集智能出题方法、装置及设备

Country Status (1)

Country Link
CN (1) CN112559820B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425757A (zh) * 2013-07-31 2013-12-04 复旦大学 融合多模态信息的跨媒体人物新闻检索方法与系统
CN104298749A (zh) * 2014-10-14 2015-01-21 杭州淘淘搜科技有限公司 一种图像视觉和文本语义融合商品检索方法
US20170061250A1 (en) * 2015-08-28 2017-03-02 Microsoft Technology Licensing, Llc Discovery of semantic similarities between images and text
CN107832400A (zh) * 2017-11-01 2018-03-23 山东大学 一种基于位置的lstm和cnn联合模型进行关系分类的方法
WO2019011936A1 (en) * 2017-07-10 2019-01-17 Katholieke Universiteit Leuven IMAGE EVALUATION METHOD
CN109299216A (zh) * 2018-10-29 2019-02-01 山东师范大学 一种融合监督信息的跨模态哈希检索方法和系统
US20190205393A1 (en) * 2016-07-11 2019-07-04 Peking University Shenzhen Graduate School A cross-media search method
CN110069650A (zh) * 2017-10-10 2019-07-30 阿里巴巴集团控股有限公司 一种搜索方法和处理设备
CN110298037A (zh) * 2019-06-13 2019-10-01 同济大学 基于增强注意力机制的卷积神经网络匹配的文本识别方法
CN110348007A (zh) * 2019-06-14 2019-10-18 北京奇艺世纪科技有限公司 一种文本相似度确定方法及装置
CN110866129A (zh) * 2019-11-01 2020-03-06 中电科大数据研究院有限公司 一种基于跨媒体统一表征模型的跨媒体检索方法
CN111046221A (zh) * 2019-12-17 2020-04-21 腾讯科技(深圳)有限公司 歌曲推荐方法、装置、终端设备以及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425757A (zh) * 2013-07-31 2013-12-04 复旦大学 融合多模态信息的跨媒体人物新闻检索方法与系统
CN104298749A (zh) * 2014-10-14 2015-01-21 杭州淘淘搜科技有限公司 一种图像视觉和文本语义融合商品检索方法
US20170061250A1 (en) * 2015-08-28 2017-03-02 Microsoft Technology Licensing, Llc Discovery of semantic similarities between images and text
US20190205393A1 (en) * 2016-07-11 2019-07-04 Peking University Shenzhen Graduate School A cross-media search method
WO2019011936A1 (en) * 2017-07-10 2019-01-17 Katholieke Universiteit Leuven IMAGE EVALUATION METHOD
CN110069650A (zh) * 2017-10-10 2019-07-30 阿里巴巴集团控股有限公司 一种搜索方法和处理设备
CN107832400A (zh) * 2017-11-01 2018-03-23 山东大学 一种基于位置的lstm和cnn联合模型进行关系分类的方法
CN109299216A (zh) * 2018-10-29 2019-02-01 山东师范大学 一种融合监督信息的跨模态哈希检索方法和系统
CN110298037A (zh) * 2019-06-13 2019-10-01 同济大学 基于增强注意力机制的卷积神经网络匹配的文本识别方法
CN110348007A (zh) * 2019-06-14 2019-10-18 北京奇艺世纪科技有限公司 一种文本相似度确定方法及装置
CN110866129A (zh) * 2019-11-01 2020-03-06 中电科大数据研究院有限公司 一种基于跨媒体统一表征模型的跨媒体检索方法
CN111046221A (zh) * 2019-12-17 2020-04-21 腾讯科技(深圳)有限公司 歌曲推荐方法、装置、终端设备以及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KAIQIANG CHEN 等: "《Deep Semantic Segmentation of Aerial Imagery Based on Multi-Modal Data》", 《IEEE》 *
曹玉东: "基于融合特征的近似图像检测方法", 《计算机技术与发展》 *
韩红旗: "《语义指纹著者姓名消歧理论及应用》", 31 July 2018 *

Also Published As

Publication number Publication date
CN112559820B (zh) 2022-08-30

Similar Documents

Publication Publication Date Title
CA2817103C (en) Learning tags for video annotation using latent subtags
CN107205016B (zh) 物联网设备的检索方法
CN111263238B (zh) 基于人工智能的生成视频评论的方法及设备
CN112528053A (zh) 多媒体库分类检索管理系统
CN112085120B (zh) 多媒体数据的处理方法、装置、电子设备及存储介质
CN116975615A (zh) 基于视频多模态信息的任务预测方法和装置
CN116955707A (zh) 内容标签的确定方法、装置、设备、介质及程序产品
CN113408282B (zh) 主题模型训练和主题预测方法、装置、设备及存储介质
Huang et al. Tag refinement of micro-videos by learning from multiple data sources
CN112559820B (zh) 基于深度学习的样本数据集智能出题方法、装置及设备
Ibrahim et al. Large-scale text-based video classification using contextual features
CN117009578A (zh) 视频数据的标注方法、装置、电子设备及存储介质
Shrivastav et al. Towards an ontology based framework for searching multimedia contents on the web
Choe et al. Semantic video event search for surveillance video
Zhang et al. Hybrid improvements in multimodal analysis for deep video understanding
TWI656448B (zh) 主題提供裝置及其雲儲存檔案提示方法
Song et al. Domain knowledge ontology building for semantic video event description
KR101643979B1 (ko) 비디오 컨텐츠 증강 방법
Cheng et al. Retrieving Articles and Image Labeling Based on Relevance of Keywords
CN117931858B (zh) 数据查询方法、装置、计算机设备和存储介质
CN116150428B (zh) 视频标签获取方法、装置、电子设备及存储介质
CN118227910B (zh) 一种媒体资源聚合方法、装置、设备及存储介质
US11170044B2 (en) Personalized video and memories creation based on enriched images
CN116933069A (zh) 内容资源检测模型的训练方法、内容资源检测方法及装置
Wallnöfer A system for improving the validity of semantic tagging by multimedia mining

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant