CN109685137A - 一种题目分类方法、装置、电子设备及存储介质 - Google Patents
一种题目分类方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN109685137A CN109685137A CN201811583166.5A CN201811583166A CN109685137A CN 109685137 A CN109685137 A CN 109685137A CN 201811583166 A CN201811583166 A CN 201811583166A CN 109685137 A CN109685137 A CN 109685137A
- Authority
- CN
- China
- Prior art keywords
- formula
- text
- picture
- feature vector
- topic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开实施例公开了一种题目分类方法、装置、电子设备及存储介质,其中所述方法包括:对获取到的题目数据中的文本、公式和图片分别进行编码,得到所述文本、公式和图片各自对应的特征向量;将所述文本、公式和图片各自对应的特征向量进行拼接,得到融合特征向量,并将所述融合特征向量输入预先训练好的神经网络分类器,所述神经网络分类器输出题目分类标签。本公开实施通过提取并融合题目中的文本、图片和公式信息的特征,并将其输入到神经网络分类器中,以达到对题目进行自动精准分类的目的。
Description
技术领域
本公开涉及在线教育领域,尤其涉及一种题目分类方法、装置、电子设备及存储介质。
背景技术
在K12(kindergarten through twelfth grade)教育的题库构建、智能测评、自适应学校等领域均需要对题目进行分类,以便更好地检测学生当前的学习水平和状态,并相应地实时调整学习活动和进程,帮助学生实现差异化和个性化的学习,通常可以根据题目的知识点、难度、题型等对题目进行分类。
针对题目的分类方法,现有的技术方案一般基于传统的短文本分类方法,通常其分类流程为利用分词工具对文本进行分词处理、提取特征、利用传统的分类器如SVM或RF进行分类。这类技术方案有如下问题:
1.K12教育中的题目往往连带着图片,如物理中的电路图,化学中的流程图,数学中的程序框图等,现有的文本分类方法无法利用图片中存在的特征。
2.K12教育中的题目基本存在着公式。公式作为一种特殊形式的文本,有着自己内在的结构和特殊性。现有的文本分类方法无法有效地利用公式中存在的信息进行分类。
公开内容
本公开实施例提供了一种题目分类方法、装置、电子设备及存储介质,以解决现有技术中传统的短文本分类方法无法有效利用题目中图片和公式,使得题目分类的准确度低的技术问题。
第一方面,本公开实施例提供了一种题目分类方法,包括:
对获取到的题目数据中的文本、公式和图片分别进行编码,得到所述文本、公式和图片各自对应的特征向量;
将所述文本、公式和图片各自对应的特征向量进行拼接,得到融合特征向量,并将所述融合特征向量输入预先训练好的神经网络分类器,所述神经网络分类器输出题目分类标签。
第二方面,本公开实施例还提供了一种题目分类装置,包括:
编码模块,用于对获取到的题目数据中的文本、公式和图片分别进行编码,得到所述文本、公式和图片各自对应的特征向量;
分类模块,用于将所述文本、公式和图片各自对应的特征向量进行拼接,得到融合特征向量,并将所述融合特征向量输入预先训练好的神经网络分类器,所述神经网络分类器输出题目分类标签。
第三方面,本公开实施例还提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开实施例中任一所述的题目分类方法。
第四方面,本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开实施例中任一所述的题目分类方法。
本公开实施例提供的一种题目分类方法、装置、电子设备及存储介质,通过对题目数据中的文本、公式和图片进行编码,并将编码后的文本、公式和图片各自对应的特征向量融合,基于融合后的特征向量,利用神经网络分类器题目进行自动、高效、准确的分类。
附图说明
图1a是本公开一实施例提供的一种题目分类方法的流程示意图;
图1b是本公开实施例提供的对题目数据中的文本、公式和图片分别进行编码的流程图;
图2是本公开实施例提供的一种题目分类装置的结构示意图;
图3是本公开实施例提供的一种电子设备器的结构图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本公开,而非对本公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公开相关的部分而非全部结构。
图1a是本公开实施例提供的一种题目分类方法的流程图,本实施例可适用于对题目进行高效准确分类的情况,该方法可以由题目分类装置来执行,该装置例如可以配置在电子设备中。所述方法具体包括:
S110、对获取到的题目数据中的文本、公式和图片分别进行编码,得到所述文本、公式和图片各自对应的特征向量。
题目数据通常是指试题所包括的内容信息,示例性的,如考试测评用的试题或者各类科目的题库中的试题。其中,题目数据包括文本、公式和图片,其中,公式作为一种特殊形式的文本,有着自己内在的结构和特殊性,因此,在获取到待分类的题目数据之后,首先要从题目数据中将公式提取出来。示例性的,可以通过编译器提取题目中的公式。而且在对获取到的题目数据中的文本、公式和图片分别进行编码之前,需要对所述文本、公式和图片进行预处理操作。对题目数据中的文本、公式和图片分别进行编码是同步进行的,不分先后,图1b示出了对题目数据中的文本、公式和图片分别进行编码的流程。具体的编码流程如下:
1、对题目数据中的文本进行编码。
在对文本进行编码之前,需要将题目数据中的文本转换成对应的词向量,示例性的,可以利用统计的方法构建矩阵来定义词向量或者通过神经网络语言模型对出现在上下文环境里的词进行预测以获得词向量。因此,在对文本进行编码时,只需将预先获得的词向量输入到多层反馈神经网络或卷积神经网络中,通过多层反馈神经网络(RNN)或卷积神经网络(CNN)即可实现对输入的文本进行特征提取,并将所述文本编码成文本特征向量,示例性的,将文本编码成1×N维文本特征向量。
2、对题目数据中的公式进行编码。
在将公式从题目中提取出来后,需要对公式进行预处理,以便后续对公式进行编码。其中,对公式进行预处理包括:基于语法编译器,将所述题目数据中的公式解析成语法树。具体的,首先将提取到的公式转换成预设格式的公式,其中,预设格式可以为标准化的latex格式,示例性的,公式为转换成标准化的latex格式后为:\frac{\partial f}{\partial x}=2\,\sqrt{a}\,x。然后,基于语法编译器,将转换后的预设格式的公式解析成公式语法树,其中公式语法树用于以树形结构图来表示转换后的公式,示例性的,将latex格式的公式转换成一棵语法树。
在完成对公式信息的预处理后,可以通过以下两种方法对题目数据中的公式进行编码,以获得公式所对应的特征向量。
(1)通过树形多层反馈神经网络对输入的所述语法树进行特征提取,将所述语法树编码成公式特征向量。
示例性的,可直接将公式转换成的语法树输入到树形多层反馈神经网络(Tree-RNN)中,根据树形多层反馈神经网络的输出将语法树编码成1×N维的公式特征向量。
(2)根据预设的教研规则在语法树上抽取多个预先定义的特征,并对所述多个预先定义的特征进行独热编码,其中所述预先定义的特征包括公式含参、公式的自由度或公式含有参数的个数。
其中,独热编码(one-hot编码)是一种离散型特征编码方式,将离散型特征的每一种取值都看成一种状态,若一特征中有N个不相同的取值,那么就可以将该特征抽象成N种不同的状态,独热编码保证了每一个取值只会使得一种状态处于“激活态”,也即是这N种状态中只有一个状态位值为1,其他状态位都是0。示例性的,根据教研规则,从语法树上抽取公式参数,示例性的,参数分别为x,y和r,对参数分别独热编码,x对应的向量[1,0,0],y对应的向量[0,1,0],r对应的向量[0,0,1],将抽取的参数编码成1×N维向量后为[1,0,0,0,1,0,0,0,1]。
3、对题目数据中的图片进行编码。
在对题目数据中的图片进行编码之前,同样需要对图片进行预处理。由于采用卷积神经神经网络对图片进行编码以获取图片特征向量,因此必须根据所选择的卷积神经网络对图片进行与之对应的预处理。示例性的,若卷积神经网络是基于深度学习框架ResNet50构建而成,则图片大小应限定在224*224。同时对图片数据进行归一化处理,例如将其限定在(0,1)之间。对于完成预处理的图片,通过卷积神经神经网络将其编码成1×N维的图片特征向量。
S120、将所述文本、公式和图片各自对应的特征向量进行拼接,得到融合特征向量,并将所述融合特征向量输入预先训练好的神经网络分类器,所述神经网络分类器输出题目分类标签。
本实施例在现有技术只能通过单一文本特征对题目分类的基础上,将题目数据中的文本特征与图片特征和公式特征相结合,以增加题目数据对应的特征种类及数量,以提高题目分类的精度。示例性的,将在S110中获得的与文本、公式和图片各自对应1×N维的特征向量进行拼接,以合成一个1×3N维的融合特征向量,示例性的,该操作可以通过神经网络的融合层来执行。
根据获得的融合特征向量,可以直接通过预先训练好的神经网络分类器对题目进行分类,神经网络分类器可以直接输出题目分类标签。示例性的,可直接将融合特征向量输入到神经网络的全连接层,以达到题目分类的目的。其中,题目分类标签用于标识该题目所包含的知识点、题目的难易程度和题目类型等。
在本实施例中,通过特有的特征提取方法分别对题目数据中的文本、公式和图片进行编码,增大题目数据的特征数量,并将编码后的文本、公式和图片各自对应的特征向量融合,基于融合后的特征向量,利用神经网络分类器题目进行自动、高效、准确的分类。
图2是本公开实施例提供的一种题目分类装置的结构示意图,如图2所示,所述装置包括:
编码模块210,用于对获取到的题目数据中的文本、公式和图片分别进行编码,得到所述文本、公式和图片各自对应的特征向量;
分类模块220,用于将所述文本、公式和图片各自对应的特征向量进行拼接,得到融合特征向量,并将所述融合特征向量输入预先训练好的神经网络分类器,所述神经网络分类器输出题目分类标签。
在本实施例提供的题目分类装置,通过编码模块210对题目数据中的文本、公式和图片进行编码,并通过分类模块220将编码后的文本、公式和图片各自对应的特征向量进行融合,基于融合后的特征向量,对题目进行高效准确的分类。
在上述实施例的基础上,所述装置还包括:
解析模块,用于基于语法编译器,将所述题目数据中公式解析成语法树;
相应的,所述编码模块包括公式编码单元,该公式编码单元用于:
通过树形多层反馈神经网络对输入的所述语法树进行特征提取,将所述语法树编码成公式特征向量;或
根据预设的教研规则在语法树上抽取多个预先定义的特征,并对所述多个预先定义的特征进行独热编码。
在上述实施例的基础上,所述解析模块还包括:
提取转换单元,用于从所述题目数据中提取公式,并将其转换成预设格式的公式;
解析单元,用于基于语法编译器,将转换后的预设格式的公式解析成语法树。
在上述实施例的基础上,所述编码模块还包括:
文本编码单元,用于通过多层反馈神经网络对输入的文本进行特征提取,将所述文本编码成文本特征向量。
在上述实施例的基础上,所述编码模块还包括:
图片编码单元,用于通过卷积神经网络对输入的图片进行特征提取,将所述图片编码成图片特征向量。
本公开实施例所提供的题目分类装置可执行本公开任意实施例所提供的题目分类方法,具备执行方法相应的功能模块和有益效果。
本实施例提供了一种电子设备,其包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本公开上述实施例所提供的一种题目分类方法。
参考图3,其示出了适于用来实现本公开实施例的电子设备300的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图3示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图3所示,电子设备300可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储装置308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理,例如实现本公开实施例所提供的题目分类方法,该方法包括:
对获取到的题目数据中的文本、公式和图片分别进行编码,得到所述文本、公式和图片各自对应的特征向量;
将所述文本、公式和图片各自对应的特征向量进行拼接,得到融合特征向量,并将所述融合特征向量输入预先训练好的神经网络分类器,所述神经网络分类器输出题目分类标签。
在RAM 303中,还存储有电子设备300操作所需的各种程序和数据。处理装置301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
通常,以下装置可以连接至I/O接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图3示出了具有各种装置的电子设备300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置308被安装,或者从ROM 302被安装。在该计算机程序被处理装置301执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:对获取到的题目数据中的文本、公式和图片分别进行编码,得到所述文本、公式和图片各自对应的特征向量;将所述文本、公式和图片各自对应的特征向量进行拼接,得到融合特征向量,并将所述融合特征向量输入预先训练好的神经网络分类器,所述神经网络分类器输出题目分类标签。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,提取转换单元,还可以被描述为,从所述题目数据中提取公式,并将其转换成预设格式的公式的单元。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种题目分类方法,其特征在于,所述方法包括:
对获取到的题目数据中的文本、公式和图片分别进行编码,得到所述文本、公式和图片各自对应的特征向量;
将所述文本、公式和图片各自对应的特征向量进行拼接,得到融合特征向量,并将所述融合特征向量输入预先训练好的神经网络分类器,所述神经网络分类器输出题目分类标签。
2.根据权利要求1所述的方法,其特征在于,在对获取到的所述题目数据中的文本、公式和图片分别进行编码之前,所述方法还包括:
基于语法编译器,将所述题目数据中的公式解析成语法树;
相应的,对题目数据中的公式进行编码,得到公式对应的特征向量,包括:
通过树形多层反馈神经网络对输入的所述语法树进行特征提取,将所述语法树编码成公式特征向量;或
根据预设的教研规则在语法树上抽取多个预先定义的特征,并对所述多个预先定义的特征进行独热编码。
3.根据权利要求2所述的方法,其特征在于,所述基于语法编译器,将所述题目数据中公式解析成语法树,包括:
从所述题目数据中提取公式,并将公式转换成预设格式的公式;
基于语法编译器,将转换后的预设格式的公式解析成语法树。
4.根据权利要求1所述的方法,其特征在于,对获取到的所述题目数据中的文本进行编码,包括:
通过多层反馈神经网络或卷积神经网络对输入的文本进行特征提取,将所述文本编码成文本特征向量。
5.根据权利要求1所述的方法,其特征在于,对获取到的所述题目数据中的图片进行编码,包括:
通过卷积神经网络对输入的图片进行特征提取,将所述图片编码成图片特征向量。
6.一种题目分类装置,其特征在于,所述装置包括:
编码模块,用于对获取到的题目数据中的文本、公式和图片分别进行编码,得到所述文本、公式和图片各自对应的特征向量;
分类模块,用于将所述文本、公式和图片各自对应的特征向量进行拼接,得到融合特征向量,并将所述融合特征向量输入预先训练好的神经网络分类器,所述神经网络分类器输出题目分类标签。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
解析模块,用于基于语法编译器,将所述题目数据中公式解析成语法树;
相应的,所述编码模块包括公式编码单元,该公式编码单元用于:
通过树形多层反馈神经网络对输入的所述语法树进行特征提取,将所述语法树编码成公式特征向量;或
根据预设的教研规则在语法树上抽取多个预先定义的特征,并对所述多个预先定义的特征进行独热编码。
8.根据权利要求7所述的装置,其特征在于,所述解析模块包括:
提取转换单元,用于从所述题目数据中提取公式,并将其转换成预设格式的公式;
解析单元,用于基于语法编译器,将转换后的预设格式的公式解析成语法树。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的题目分类方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的题目分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811583166.5A CN109685137A (zh) | 2018-12-24 | 2018-12-24 | 一种题目分类方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811583166.5A CN109685137A (zh) | 2018-12-24 | 2018-12-24 | 一种题目分类方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109685137A true CN109685137A (zh) | 2019-04-26 |
Family
ID=66188227
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811583166.5A Pending CN109685137A (zh) | 2018-12-24 | 2018-12-24 | 一种题目分类方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109685137A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413789A (zh) * | 2019-07-31 | 2019-11-05 | 广西师范大学 | 一种基于svm的习题自动分类方法 |
CN110837560A (zh) * | 2019-11-15 | 2020-02-25 | 北京字节跳动网络技术有限公司 | 标签挖掘方法、装置、设备、存储介质 |
CN111125177A (zh) * | 2019-12-26 | 2020-05-08 | 北京奇艺世纪科技有限公司 | 生成数据标签的方法、装置、电子设备及可读存储介质 |
CN111639155A (zh) * | 2020-05-11 | 2020-09-08 | 广东小天才科技有限公司 | 数学口算算式题型分析方法、装置、电子设备和存储介质 |
CN112102126A (zh) * | 2020-08-31 | 2020-12-18 | 湖北美和易思教育科技有限公司 | 一种基于神经网络学生动手能力培养方法及装置 |
CN112183402A (zh) * | 2020-09-30 | 2021-01-05 | 北京有竹居网络技术有限公司 | 一种信息处理的方法、装置、电子设备及存储介质 |
CN112395858A (zh) * | 2020-11-17 | 2021-02-23 | 华中师范大学 | 融合试题数据和解答数据的多知识点标注方法和系统 |
CN112434162A (zh) * | 2020-11-26 | 2021-03-02 | 广州宏途教育网络科技有限公司 | 一种笔记的整理方法、装置、计算机设备和存储介质 |
CN112907409A (zh) * | 2021-03-08 | 2021-06-04 | 北京有竹居网络技术有限公司 | 应用题求解方法、装置、介质及电子设备 |
CN112989058A (zh) * | 2021-05-10 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 信息分类方法、试题分类方法、设备、服务器和存储介质 |
CN113569741A (zh) * | 2021-07-29 | 2021-10-29 | 小船出海教育科技(北京)有限公司 | 图像试题的答案生成方法、装置、电子设备及可读介质 |
CN113626588A (zh) * | 2020-05-09 | 2021-11-09 | 北京金山数字娱乐科技有限公司 | 卷积神经网络训练的方法和装置、文章分类的方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105550278A (zh) * | 2015-12-10 | 2016-05-04 | 天津海量信息技术有限公司 | 基于深度学习的网页区域识别算法 |
CN105740226A (zh) * | 2016-01-15 | 2016-07-06 | 南京大学 | 使用树形神经网络和双向神经网络实现中文分词 |
CN106599054A (zh) * | 2016-11-16 | 2017-04-26 | 福建天泉教育科技有限公司 | 一种题目分类及推送的方法及系统 |
CN107301165A (zh) * | 2016-04-14 | 2017-10-27 | 科大讯飞股份有限公司 | 一种试题难度分析方法及系统 |
US20180357207A1 (en) * | 2017-06-13 | 2018-12-13 | Microsoft Technology Licensing, Llc | Evaluating documents with embedded mathematical expressions |
-
2018
- 2018-12-24 CN CN201811583166.5A patent/CN109685137A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105550278A (zh) * | 2015-12-10 | 2016-05-04 | 天津海量信息技术有限公司 | 基于深度学习的网页区域识别算法 |
CN105740226A (zh) * | 2016-01-15 | 2016-07-06 | 南京大学 | 使用树形神经网络和双向神经网络实现中文分词 |
CN107301165A (zh) * | 2016-04-14 | 2017-10-27 | 科大讯飞股份有限公司 | 一种试题难度分析方法及系统 |
CN106599054A (zh) * | 2016-11-16 | 2017-04-26 | 福建天泉教育科技有限公司 | 一种题目分类及推送的方法及系统 |
US20180357207A1 (en) * | 2017-06-13 | 2018-12-13 | Microsoft Technology Licensing, Llc | Evaluating documents with embedded mathematical expressions |
Non-Patent Citations (1)
Title |
---|
王睿佳: "科技文献的多模态语义关联特征提取与表示体系研究——以数学公式为例", 《万方数据知识服务平台》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413789A (zh) * | 2019-07-31 | 2019-11-05 | 广西师范大学 | 一种基于svm的习题自动分类方法 |
CN110837560A (zh) * | 2019-11-15 | 2020-02-25 | 北京字节跳动网络技术有限公司 | 标签挖掘方法、装置、设备、存储介质 |
CN110837560B (zh) * | 2019-11-15 | 2022-03-15 | 北京字节跳动网络技术有限公司 | 标签挖掘方法、装置、设备、存储介质 |
CN111125177A (zh) * | 2019-12-26 | 2020-05-08 | 北京奇艺世纪科技有限公司 | 生成数据标签的方法、装置、电子设备及可读存储介质 |
CN111125177B (zh) * | 2019-12-26 | 2024-01-16 | 北京奇艺世纪科技有限公司 | 生成数据标签的方法、装置、电子设备及可读存储介质 |
CN113626588A (zh) * | 2020-05-09 | 2021-11-09 | 北京金山数字娱乐科技有限公司 | 卷积神经网络训练的方法和装置、文章分类的方法和装置 |
CN111639155A (zh) * | 2020-05-11 | 2020-09-08 | 广东小天才科技有限公司 | 数学口算算式题型分析方法、装置、电子设备和存储介质 |
CN112102126A (zh) * | 2020-08-31 | 2020-12-18 | 湖北美和易思教育科技有限公司 | 一种基于神经网络学生动手能力培养方法及装置 |
CN112183402A (zh) * | 2020-09-30 | 2021-01-05 | 北京有竹居网络技术有限公司 | 一种信息处理的方法、装置、电子设备及存储介质 |
CN112395858A (zh) * | 2020-11-17 | 2021-02-23 | 华中师范大学 | 融合试题数据和解答数据的多知识点标注方法和系统 |
CN112395858B (zh) * | 2020-11-17 | 2024-04-23 | 华中师范大学 | 融合试题数据和解答数据的多知识点标注方法和系统 |
CN112434162A (zh) * | 2020-11-26 | 2021-03-02 | 广州宏途教育网络科技有限公司 | 一种笔记的整理方法、装置、计算机设备和存储介质 |
CN112434162B (zh) * | 2020-11-26 | 2024-04-05 | 广州宏途数字科技有限公司 | 一种笔记的整理方法、装置、计算机设备和存储介质 |
CN112907409A (zh) * | 2021-03-08 | 2021-06-04 | 北京有竹居网络技术有限公司 | 应用题求解方法、装置、介质及电子设备 |
WO2022188742A1 (zh) * | 2021-03-08 | 2022-09-15 | 北京有竹居网络技术有限公司 | 信息处理方法、装置、介质及电子设备 |
CN112989058A (zh) * | 2021-05-10 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 信息分类方法、试题分类方法、设备、服务器和存储介质 |
CN113569741A (zh) * | 2021-07-29 | 2021-10-29 | 小船出海教育科技(北京)有限公司 | 图像试题的答案生成方法、装置、电子设备及可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109685137A (zh) | 一种题目分类方法、装置、电子设备及存储介质 | |
CN106887225B (zh) | 基于卷积神经网络的声学特征提取方法、装置和终端设备 | |
CN109635100A (zh) | 一种相似题目的推荐方法、装置、电子设备及存储介质 | |
CN109740018A (zh) | 用于生成视频标签模型的方法和装置 | |
CN109919244A (zh) | 用于生成场景识别模型的方法和装置 | |
CN113836866B (zh) | 文本编码方法、装置、计算机可读介质及电子设备 | |
CN109376268A (zh) | 视频分类方法、装置、电子设备及计算机可读存储介质 | |
CN114090779B (zh) | 篇章级文本的层级多标签分类方法、系统、设备及介质 | |
CN110489087A (zh) | 一种生成分形结构的方法、装置、介质和电子设备 | |
CN114443899A (zh) | 视频分类方法、装置、设备及介质 | |
CN110532983A (zh) | 视频处理方法、装置、介质和设备 | |
WO2023142914A1 (zh) | 日期识别方法、装置、可读介质及电子设备 | |
CN115954001A (zh) | 语音识别方法和模型训练方法 | |
CN114495916A (zh) | 背景音乐的插入时间点确定方法、装置、设备和存储介质 | |
US20210349920A1 (en) | Method and apparatus for outputting information | |
CN110399811A (zh) | 一种人脸识别方法、装置及存储介质 | |
CN110070042A (zh) | 文字识别方法、装置和电子设备 | |
CN110414450A (zh) | 关键词检测方法、装置、存储介质及电子设备 | |
CN117725159A (zh) | 数据处理、模型训练方法、装置及电子设备 | |
CN116227629B (zh) | 一种信息解析方法、模型训练方法、装置及电子设备 | |
CN113761924A (zh) | 一种命名实体模型的训练方法、装置、设备及存储介质 | |
CN117036827A (zh) | 多模态分类模型训练、视频分类方法、装置、介质及设备 | |
WO2023130925A1 (zh) | 字体识别方法、装置、可读介质及电子设备 | |
CN110889717A (zh) | 文本中的广告内容过滤方法、装置、电子设备及存储介质 | |
CN110414527A (zh) | 字符识别方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190426 |