CN110309857A - 基于人工智能的图书分类装置、方法、设备及存储介质 - Google Patents
基于人工智能的图书分类装置、方法、设备及存储介质 Download PDFInfo
- Publication number
- CN110309857A CN110309857A CN201910477640.4A CN201910477640A CN110309857A CN 110309857 A CN110309857 A CN 110309857A CN 201910477640 A CN201910477640 A CN 201910477640A CN 110309857 A CN110309857 A CN 110309857A
- Authority
- CN
- China
- Prior art keywords
- module
- memory
- vector
- books
- described problem
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000013473 artificial intelligence Methods 0.000 title abstract description 12
- 230000015654 memory Effects 0.000 claims abstract description 209
- 238000012549 training Methods 0.000 claims abstract description 55
- 230000004044 response Effects 0.000 claims abstract description 47
- 230000007246 mechanism Effects 0.000 claims abstract description 31
- 238000003066 decision tree Methods 0.000 claims description 57
- 230000000007 visual effect Effects 0.000 claims description 7
- 238000013461 design Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 238000009434 installation Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 4
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及预测模型领域,提供一种基于人工智能的图书分类装置、方法、设备及存储介质,该装置包括输入模块、问题模块、片段记忆模块和回答模块;输入模块用于从获取待分类的图书中获取图书的特征信息;将特征信息转换为词向量,向片断记忆模块输入词向量,向问题模块输入图书分类关键词的问题向量;问题模块用于从输入模块接收问题向量,向片断记忆模块输入所述问题向量;片段记忆模块用于采用关注力机制,根据问题向量、片断记忆模块中的历史记忆和历史问题,在输入模块输出的词向量上进行迭代,产生新记忆,得到记忆特征训练模型;回答模块用于根据记忆特征训练模型预测图书类别,并据新记忆生成与问题向量对应的回答。通过采用本方案,能够提高图书类别划分的准确率。
Description
技术领域
本申请涉及预测模型领域,尤其涉及一种基于人工智能的图书分类装置、方法、设备及存储介质。
背景技术
在对图书分类时,一般根据图书名、摘要等文字信息对图书进行类别划分。例如采用长短期记忆网络(Long Short-Term Memory,LSTM)模型实现类别划分,但是该LSTM模型的训练复杂度较高、结构单一、也难以识别反问句、疑问句或比较句等复杂句式,最终导致划分图书类别的准确率较低。
发明内容
本申请提供了一种基于人工智能的图书分类装置、方法、设备及存储介质,能够解决现有技术中划分图书类别的准确率较低的问题。
第一方面,本申请提供一种基于人工智能的图书分类装置,所述装置包括输入模块、问题模块、片段记忆模块和回答模块;
所述输入模块,用于从获取待分类的图书中获取图书的特征信息;将特征信息转换为词向量,向所述片断记忆模块输入所述词向量,以及向所述问题模块输入图书分类关键词的问题向量;
所述问题模块,用于从所述输入模块接收所述问题向量,向所述片断记忆模块输入所述问题向量;
所述片段记忆模块,用于采用关注力机制,根据所述问题向量、所述片断记忆模块中的历史记忆和历史问题,在所述输入模块输出的所述词向量上进行迭代,迭代产生新记忆,得到记忆特征训练模型;
所述回答模块,用于根据所述记忆特征训练模型预测图书类别,并根据所述新记忆生成与所述问题向量对应的回答。
在一些可能的设计中,所述回答模块具体用于:
获取自所述输入模块输入的问题;
获取所述片断记忆模块更新的新记忆;
利用所述片断记忆模块更新的新记忆,根据所述新记忆的记忆特征训练模型预测与所述问题匹配的目标类别的图书。
在一些可能的设计中,所述关注力机制用于指示着重关注部分信息。
在一些可能的设计中,所述关注力机制包括视觉注意力机制,所述片段记忆模块具体用于:
以高于预设速度的速度扫描全局图像,以获取待着重关注的目标区域,优先为所述目标区域分配注意力资源,以从所述目标区域中获取待着重关注的目标的细节信息,并抑制非关注目标的无用信息。
在一些可能的设计中,所述回答模块具体用于:
获取所述输入模块输入的问题;
若期望所述记忆特征训练模型的最终预测结果是与所述问题匹配的目标类别的图书,则根据所述片断记忆模块更新的新记忆和所述记忆特征训练模型预测所述目标类别的图书。
在一些可能的设计中,所述回答模块具体用于:
从所述输入模块接收所述问题;
将所述问题输入句型决策树;
根据所述句型决策树分析所述问题的句型和语义,确定所述问题的句型为疑问句以及语义为运动类别;
若期望所述记忆特征训练模型的最终预测结果是运动类别的图书,则根据所述片断记忆模块更新的新记忆和所述记忆特征训练模型预测与所述问题匹配且为所述运动类别的图书。
在一些可能的设计中,所述回答模块还用于:
若根据所述句型决策树无法分析出所述问题的句型,则分别将所述问题输入特殊陈述句决策树、疑问句决策树和否定句决策树;
根据所述特殊陈述句决策树、所述疑问句决策树和所述否定句决策树判断所述问题的句型。
第二方面,本申请提供一种图书分类的方法,所述方法包括:
所述输入模块从获取待分类的图书中获取图书的特征信息;将特征信息转换为词向量,向所述片断记忆模块输入所述词向量,以及向所述问题模块输入图书分类关键词的问题向量;
所述问题模块从所述输入模块接收所述问题向量,向所述片断记忆模块输入所述问题向量;
所述片段记忆模块采用关注力机制,根据所述问题向量、所述片断记忆模块中的历史记忆和历史问题,在所述输入模块输出的所述词向量上进行迭代,迭代产生新记忆,得到记忆特征训练模型;
所述回答模块根据所述记忆特征训练模型预测图书类别,并根据所述新记忆生成与所述问题向量对应的回答。
在一些可能的设计中,所述方法还包括:
所述回答模块获取自所述输入模块输入的问题;获取所述片断记忆模块,新的新记忆;利用所述片断记忆模块更新的新记忆,根据所述新记忆的记忆特征训练模型预测与所述问题匹配的目标类别的图书。
在一些可能的设计中,所述关注力机制用于指示着重关注部分信息。
在一些可能的设计中,所述关注力机制包括视觉注意力机制,所述方法还包括:
所述片段记忆模块以高于预设速度的速度扫描全局图像,以获取待着重关注的目标区域,优先为所述目标区域分配注意力资源,以从所述目标区域中获取待着重关注的目标的细节信息,并抑制非关注目标的无用信息。
在一些可能的设计中,所述回答模块根据所述记忆特征训练模型预测图书类别,包括:
获取所述输入模块输入的问题;
若期望所述记忆特征训练模型的最终预测结果是与所述问题匹配的目标类别的图书,则根据所述片断记忆模块更新的新记忆和所述记忆特征训练模型预测所述目标类别的图书。
在一些可能的设计中,所述回答模块根据所述记忆特征训练模型预测图书类别,包括:
所述回答模块从所述输入模块接收所述问题;将所述问题输入句型决策树;根据所述句型决策树分析所述问题的句型和语义,确定所述问题的句型为疑问句以及语义为运动类别;若期望所述记忆特征训练模型的最终预测结果是运动类别的图书,则根据所述片断记忆模块更新的新记忆和所述记忆特征训练模型预测与所述问题匹配且为所述运动类别的图书。
在一些可能的设计中,所述方法还包括:
若根据所述句型决策树无法分析出所述问题的句型,则所述回答模块分别将所述问题输入特殊陈述句决策树、疑问句决策树和否定句决策树;根据所述特殊陈述句决策树、所述疑问句决策树和所述否定句决策树判断所述问题的句型。
本申请又一方面提供了一种计算机装置,其包括至少一个连接的处理器、存储器和输入输出单元,其中,所述存储器用于存储程序代码,所述处理器用于调用所述存储器中的程序代码来执行上述第一方面所述的操作。
本申请又一方面提供了一种计算机存储介质,其包括指令,当其在计算机上运行时,使得计算机执行上述第一方面所述的操作。
相较于现有技术,本申请提供的方案中,输入模块从获取待分类的图书中获取图书的特征信息;将特征信息转换为词向量,向片断记忆模块输入词向量,向问题模块输入图书分类关键词的问题向量;问题模块从输入模块接收问题向量,向片断记忆模块输入所述问题向量;片段记忆模块采用关注力机制,根据问题向量、片断记忆模块中的历史记忆和历史问题,在输入模块输出的词向量上进行迭代,产生新记忆,得到记忆特征训练模型;回答模块根据记忆特征训练模型预测图书类别,并据新记忆生成与问题向量对应的回答。可见,通过采用本方案,能够提高图书类别划分的准确率。
附图说明
图1为本申请实施例中基于人工智能的图书分类装置的一种结构示意图;
图2为本申请实施例中动态记忆网络模型的一种逻辑结构示意图;
图3为本申请实施例图书分类的方法的一种流程示意图;
图4为本申请实施例中执行图书分类的方法的计算机装置的一种结构示意图;
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块,本申请中所出现的模块的划分,仅仅是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个系统中,或一些特征可以忽略,或不执行。
本申请提供一种基于人工智能的图书分类装置、方法、设备及存储介质,能够用于图书分类和音像制品分类。
为解决上述技术问题,本申请主要提供以下技术方案:
通过在图书分类问题上构建动态记忆网络模型,动态记忆网络模型包括输入模块、问题模块、片段记忆模块和回答模块。将图书名称和图书摘要等信息以词向量形式作为输入模块的输入,在问题模块中输入图书分类关键词的问题,片段记忆模块采用关注力机制迭代产生新的记忆,回答模块根据记忆特征训练模型,预测图书类别。能够识别反问句、疑问等复杂句式,提高图书类别划分的准确率。
请参照图1,以下介绍本申请的一种基于人工智能的图书分类装置10,所述图书分类装置10包括输入模块101、问题模块102、片段记忆模块103和回答模块104。
本申请实施例中,所述输入模块101用于对输入的图书分类的原始文本进行编码处理,以得到向量文本。例如,将输入的原始文本输入编码器,编码成分布式向量表示.NLP问题中,输入的原始文本可以是一个句子、一个故事、电影评论、新闻文章或者维基百科文章等。
所述问题模块102是对输入模块101中的关键词设计问题。问题模块与输入模块都是神经网络,问题模块的输入是问题,问题模块的输出则是输出至片段记忆模块。所述输入模块101和所述问题模块102都是神经网络,神经网络是一种节点定向连接成环的人工神经网络,神经网络的内部状态可以展示动态时序行为。
片段记忆模块103通过关注力机制决定关注输入片断记忆模块103的事实中的目标部分,并根据历史记忆和历史问题产生新记忆。具体来说,所述片段记忆模块在自所述输入模块101输出的事实(例如编码得到的向量文本)和所述问题模块102输出的问题上进行迭代,以产生新记忆,并更新内部的片段记忆。每次迭代都是根据历史记忆和历史问题和事实产生新的片段(即新记忆),并且生成一个答案的向量表示(可简称为答案向量)。片断记忆模块包括多跳注意力子模块和记忆更新子模块。
回答模块104用于根据片断记忆模块103输出的最终记忆(即上述新记忆)生成与问题向量对应的回答。回答模块是门控循环单元(Gated Recurrent Unit,GRU)网络。回答模块104也可称为答案模块。
如图2为本申请中动态记忆网络模型的一种逻辑结构示意图。
下面分别介绍上述图书分类装置10应用到图书分类时各功能模块的功能:
所述输入模块101,用于从获取待分类的图书中获取图书的特征信息;将特征信息转换为词向量,向所述片断记忆模块103输入所述词向量,以及向所述问题模块输入图书分类关键词的问题向量。其中,图书的特征信息包括图书名称、图书摘要信息等信息。一些实施方式中,将特征信息映射到向量空间,以将特征信息转换为词向量。其中,词向量(Wordembedding),又叫Word嵌入,词向量是自然语言处理(NLP)中的一组语言建模和特征学习技术的统称,其中来自词汇表的单词或短语被映射到实数的向量,即词向量是指从每个单词一维的空间到具有更低维度的连续向量空间的数学嵌入。词向量目的在于:基于语言数据的大样本中的分布属性来量化和分类语言项之间的语义相似性。生成这种映射的方法包括神经网络、单词共生矩阵的降维、概率模型、可解释的知识库方法和术语的显式表示单词出现的背景。当词向量用作底层的输入时,嵌入单词和短语能够提高NLP任务的性能,例如进行语法分析和情感分析。
所述问题模块102,用于从所述输入模块101接收所述问题向量,向所述片断记忆模块103输入所述问题向量。
所述片段记忆模块103,用于采用关注力机制,根据所述问题向量、所述片断记忆模块103中的历史记忆和历史问题,在所述输入模块101输出的所述词向量上进行迭代,迭代产生新记忆,得到记忆特征训练模型。
所述回答模块104,用于根据所述记忆特征训练模型预测图书类别,并根据所述新记忆生成与所述问题向量对应的回答。
与现有机制相比,本申请实施例中,输入模块101从获取待分类的图书中获取图书的特征信息;将特征信息转换为词向量,向片断记忆模块103输入词向量,向问题模块102输入图书分类关键词的问题向量;问题模块102从输入模块101接收问题向量,向片断记忆模块103输入所述问题向量;片段记忆模块103采用关注力机制,根据问题向量、片断记忆模块103中的历史记忆和历史问题,在输入模块101输出的词向量上进行迭代,产生新记忆,得到记忆特征训练模型;回答模块104根据记忆特征训练模型预测图书类别,并据新记忆生成与问题向量对应的回答。可见,通过采用本方案,能够提高图书类别划分的准确率。
可选的,在本申请的一些实施例中,所述回答模块104具体用于:
获取自所述输入模块101输入的问题;
获取所述片断记忆模块103更新的新记忆;
利用所述片断记忆模块103更新的新记忆,根据所述新记忆的记忆特征训练模型预测与所述问题匹配的目标类别的图书。
可选的,在本申请的一些实施例中,所述关注力机制用于指示着重关注部分信息;所述关注力机制包括视觉注意力机制,视觉注意力机制是人类视觉所特有的大脑信号处理机制。所述片段记忆模块103具体用于:
以高于预设速度的速度扫描全局图像,以获取待着重关注的目标区域(目标区域可称为用户的注意力焦点,该目标区域可能包括需要关注的目标),优先为所述目标区域分配注意力资源,以从所述目标区域中获取待着重关注的目标的细节信息,并抑制非关注目标的无用信息。
可选的,在本申请的一些实施例中,所述回答模块104具体用于:
获取所述输入模块101输入的问题;
若期望所述记忆特征训练模型的最终预测结果是与所述问题匹配的目标类别的图书,则根据所述片断记忆模块更新的新记忆和所述记忆特征训练模型预测所述目标类别的图书。
可选的,在本申请的一些实施例中,考虑到输入的问题可能为反问句、疑问句或比较句等复杂句式,为提高划分图书类别的准确率,本申请还在回答模块104中引入决策树。所述回答模块104具体用于:
从所述输入模块101接收所述问题;
将所述问题输入句型决策树;
根据所述句型决策树分析所述问题的句型和语义,确定所述问题的句型为疑问句以及语义为运动类别;
若期望所述记忆特征训练模型的最终预测结果是运动类别的图书,则根据所述片断记忆模块103更新的新记忆和所述记忆特征训练模型预测与所述问题匹配且为所述运动类别的图书。
举例来说,回答模块104可包括句类分析模块、疑问句分析模块、疑问中心分析模块和句类模式匹配模块。由用户输入的疑问句启动检索,由回答模块104输出按照语义相关程度排序的答。首先对所述问题进行句类分析处理,获得具有标注的待选答案句知识库;其次,调用句类分析模块处理获得该问题的句类结构,进入疑问句分析模块进行分析,然后进入疑问中心分析模块中处理,并在此基础上抽取目标答案句模式,生成等语义目标句模式序列;然后知识库中已经标注的待选答案句与目标答案句模式(或者序列)经过句类模式匹配模块对词语,语义块进行概念相似度计算,对待选句与目标句进行比较,获得句类模式匹配结果、语义关系结构识别匹配结果、和答案准确度得分;按照答案正确度排序,并返回结果。
为便于理解,以具体应用场景为例。例如,片断记忆模块103更新了新记忆,例如更新了“姚明是运动员,NBA是一种运动”等新记忆,输入模块101输入的图书信息为“姚明与NBA的关系”,那么希望记忆特征训练模型最终预测的结果是“运动”类别的图书。在回答模块104中则利用片断记忆模块103更新的新记忆,例如利用“姚明是运动员,NBA是一种运动”等新记忆,根据记忆特征训练模型预测“运动”类别的图书。
可见,通过引入所述句型决策树分析所述问题的句型和语义,能够准确的识别出问题的句型,提高划分图书类别的准确率。
可选的,在本申请的一些实施例中,所述回答模块104还用于:
若根据所述句型决策树无法分析出所述问题的句型,则分别将所述问题输入特殊陈述句决策树、疑问句决策树和否定句决策树;
根据所述特殊陈述句决策树、所述疑问句决策树和所述否定句决策树判断所述问题的句型。
一些实施方式中,所述回答模块104可采用以下计算方式计算预测结果:
yp=softmax(W(o)mk+b(o))
其中yp表示类别的概率分布,W(o)表示输出层参数矩阵,b(o)表示输出层偏置参数mk表示第k次更新后的新记忆,k为正整数。所述回答模块104进行模型训练时可通过以下损失函数实现:
其中D代表训练数据集,C为图书类别种类,θ表示模型参数,yc表示真实类别标签,λ是L2正则参数项。
可见,通过引入所述句型决策树、特殊句型决策树、疑问句决策树和否定句决策树,能够加强分析所述问题的句型和语义,进一步识别出问题的真实句型,提高划分图书类别的准确率。
上述各实施例中提及的各项技术特征也同样适用于本申请中的图3和图4所对应的实施例,后续类似之处不再赘述。
以上对本申请中一种基于人工智能的图书分类装置进行说明,以下对图书分类的方法进行介绍。
如图3所示,本申请提供一种图书分类的方法,所述方法包括:
301、所述输入模块从获取待分类的图书中获取图书的特征信息;将特征信息转换为词向量,向所述片断记忆模块输入所述词向量,以及向所述问题模块输入图书分类关键词的问题向量。
302、所述问题模块从所述输入模块接收所述问题向量,向所述片断记忆模块输入所述问题向量。
303、所述片段记忆模块采用关注力机制,根据所述问题向量、所述片断记忆模块中的历史记忆和历史问题,在所述输入模块输出的所述词向量上进行迭代,迭代产生新记忆,得到记忆特征训练模型。
一些实施方式中,所述关注力机制用于指示着重关注部分信息,所述关注力机制包括视觉注意力机制,视觉注意力机制是人类视觉所特有的大脑信号处理机制。所述方法还包括:
所述片段记忆模块以高于预设速度的速度扫描全局图像,以获取待着重关注的目标区域(目标区域可称为用户的注意力焦点,该目标区域可能包括需要关注的目标),优先为所述目标区域分配注意力资源,以从所述目标区域中获取待着重关注的目标的细节信息,并抑制非关注目标的无用信息。
可见,在迭代时,通过历史记忆、历史问题和事实进行迭代,产生的新记忆,进而更新动态记忆网络模型,优化动态记忆网络模型,提高动态记忆网络的预测准确率。
304、所述回答模块根据所述记忆特征训练模型预测图书类别,并根据所述新记忆生成与所述问题向量对应的回答。
一些实施方式中,所述回答模块根据所述记忆特征训练模型预测图书类别,包括:
获取所述输入模块输入的问题;
若期望所述记忆特征训练模型的最终预测结果是与所述问题匹配的目标类别的图书,则根据所述片断记忆模块更新的新记忆和所述记忆特征训练模型预测所述目标类别的图书。
另一些实施方式中,所述回答模块根据所述记忆特征训练模型预测图书类别,包括:
所述回答模块获取自所述输入模块输入的问题;获取所述片断记忆模块,新的新记忆;利用所述片断记忆模块更新的新记忆,根据所述新记忆的记忆特征训练模型预测与所述问题匹配的目标类别的图书。
本申请实施例中,输入模块从获取待分类的图书中获取图书的特征信息;将特征信息转换为词向量,向片断记忆模块输入词向量,向问题模块输入图书分类关键词的问题向量;问题模块从输入模块接收问题向量,向片断记忆模块输入所述问题向量;片段记忆模块采用关注力机制,根据问题向量、片断记忆模块中的历史记忆和历史问题,在输入模块输出的词向量上进行迭代,产生新记忆,得到记忆特征训练模型;回答模块根据记忆特征训练模型预测图书类别,并据新记忆生成与问题向量对应的回答。可见,通过采用本方案,能够提高图书类别划分的准确率。
可选的,在本申请的一些实施例中,考虑到输入的问题可能为反问句、疑问句或比较句等复杂句式,为提高划分图书类别的准确率,本申请还在回答模块中引入决策树。具体来说,所述回答模块从所述输入模块接收所述问题;将所述问题输入句型决策树;根据所述句型决策树分析所述问题的句型和语义,确定所述问题的句型为疑问句以及语义为运动类别;
若期望所述记忆特征训练模型的最终预测结果是运动类别的图书,则所述回答模块根据所述片断记忆模块更新的新记忆和所述记忆特征训练模型预测与所述问题匹配且为所述运动类别的图书。
可见,通过引入所述句型决策树分析所述问题的句型和语义,能够准确的识别出问题的句型,提高划分图书类别的准确率。
一些实施方式中,若根据所述句型决策树无法分析出所述问题的句型,则所述回答模块分别将所述问题输入特殊陈述句决策树、疑问句决策树和否定句决策树;根据所述特殊陈述句决策树、所述疑问句决策树和所述否定句决策树判断所述问题的句型。可见,通过引入所述句型决策树、特殊句型决策树、疑问句决策树和否定句决策树,能够加强分析所述问题的句型和语义,进一步识别出问题的真实句型,提高划分图书类别的准确率。
上面从模块化功能实体的角度分别介绍了本申请实施例中的图书分类装置,以下从硬件角度介绍一种计算机装置,如图4所示,其包括:处理器、存储器、输入输出单元以及存储在所述存储器中并可在所述处理器上运行的计算机程序。例如,该计算机程序可以为图2所对应的实施例中图书分类的方法对应的程序。例如,当计算机装置实现如图1所示的基于人工智能的图书分类装置的功能时,所述处理器执行所述计算机程序时实现上述上述各实施例中由问题模块102、片段记忆模块103和回答模块104所执行的各项步骤;或者,所述处理器执行所述计算机程序时实现上述图1所对应的实施例的基于人工智能的图书分类装置中问题模块102、片段记忆模块103和回答模块104的功能。又例如,该计算机程序可以为图3所对应的实施例中图书分类的方法对应的程序。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、视频数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
所述输入输出单元也可以用输入单元和输出单元代替,可以为相同或者不同的物理实体。为相同的物理实体时,可以统称为输入输出单元。该输入输出单元可以为收发器。所述输入输出单元能够实现图1所对应的实施例中输入模块101和回答模块104的功能。
所述存储器可以集成在所述处理器中,也可以与所述处理器分开设置。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,这些均属于本申请的保护之内。
Claims (10)
1.一种图书分类装置,其特征在于,所述装置包括输入模块、问题模块、片段记忆模块和回答模块;
所述输入模块,用于从获取待分类的图书中获取图书的特征信息;将特征信息转换为词向量,向所述片断记忆模块输入所述词向量,以及向所述问题模块输入图书分类关键词的问题向量;
所述问题模块,用于从所述输入模块接收所述问题向量,向所述片断记忆模块输入所述问题向量;
所述片段记忆模块,用于采用关注力机制,根据所述问题向量、所述片断记忆模块中的历史记忆和历史问题,在所述输入模块输出的所述词向量上进行迭代,迭代产生新记忆,得到记忆特征训练模型;
所述回答模块,用于根据所述记忆特征训练模型预测图书类别,并根据所述新记忆生成与所述问题向量对应的回答。
2.根据权利要求1所述的装置,其特征在于,所述回答模块具体用于:
获取自所述输入模块输入的问题;
获取所述片断记忆模块更新的新记忆;
利用所述片断记忆模块更新的新记忆,根据所述新记忆的记忆特征训练模型预测与所述问题匹配的目标类别的图书。
3.根据权利要求1或2所述的装置,其特征在于,所述关注力机制用于指示着重关注部分信息。
4.根据权利要求3所述的装置,其特征在于,所述关注力机制包括视觉注意力机制,所述片段记忆模块具体用于:
以高于预设速度的速度扫描全局图像,以获取待着重关注的目标区域,优先为所述目标区域分配注意力资源,以从所述目标区域中获取待着重关注的目标的细节信息,并抑制非关注目标的无用信息。
5.根据权利要求4所述的装置,其特征在于,所述回答模块具体用于:
获取所述输入模块输入的问题;
若期望所述记忆特征训练模型的最终预测结果是与所述问题匹配的目标类别的图书,则根据所述片断记忆模块更新的新记忆和所述记忆特征训练模型预测所述目标类别的图书。
6.根据权利要求5所述的装置,其特征在于,所述回答模块具体用于:
从所述输入模块接收所述问题;
将所述问题输入句型决策树;
根据所述句型决策树分析所述问题的句型和语义,确定所述问题的句型为疑问句以及语义为运动类别;
若期望所述记忆特征训练模型的最终预测结果是运动类别的图书,则根据所述片断记忆模块更新的新记忆和所述记忆特征训练模型预测与所述问题匹配且为所述运动类别的图书。
7.根据权利要求6所述的装置,其特征在于,所述回答模块还用于:
若根据所述句型决策树无法分析出所述问题的句型,则分别将所述问题输入特殊陈述句决策树、疑问句决策树和否定句决策树;
根据所述特殊陈述句决策树、所述疑问句决策树和所述否定句决策树判断所述问题的句型。
8.一种图书分类的方法,其特征在于,所述方法包括:
输入模块从获取待分类的图书中获取图书的特征信息;将特征信息转换为词向量,向所述片断记忆模块输入所述词向量,以及向问题模块输入图书分类关键词的问题向量;
所述问题模块从所述输入模块接收所述问题向量,向片断记忆模块输入所述问题向量;
所述片段记忆模块采用关注力机制,根据所述问题向量、所述片断记忆模块中的历史记忆和历史问题,在所述输入模块输出的所述词向量上进行迭代,迭代产生新记忆,得到记忆特征训练模型;
回答模块根据所述记忆特征训练模型预测图书类别,并根据所述新记忆生成与所述问题向量对应的回答。
9.一种计算机设备,其特征在于,所述计算机设备包括:
至少一个处理器、存储器和输入输出单元;
其中,所述存储器用于存储程序代码,所述处理器用于调用所述存储器中存储的程序代码来执行如权利要求1-7中任一项所述的操作。
10.一种计算机存储介质,其特征在于,其包括指令,当其在计算机上运行时,使得计算机执行如权利要求1-7中任一项所述的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910477640.4A CN110309857A (zh) | 2019-06-03 | 2019-06-03 | 基于人工智能的图书分类装置、方法、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910477640.4A CN110309857A (zh) | 2019-06-03 | 2019-06-03 | 基于人工智能的图书分类装置、方法、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110309857A true CN110309857A (zh) | 2019-10-08 |
Family
ID=68075228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910477640.4A Pending CN110309857A (zh) | 2019-06-03 | 2019-06-03 | 基于人工智能的图书分类装置、方法、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110309857A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112052663A (zh) * | 2020-08-31 | 2020-12-08 | 平安科技(深圳)有限公司 | 客服语句质检方法及相关设备 |
CN112559866A (zh) * | 2020-12-16 | 2021-03-26 | 郑州工程技术学院 | 大学图书阅读推荐方法、装置、设备及存储介质 |
CN113935332A (zh) * | 2021-11-02 | 2022-01-14 | 海信集团控股股份有限公司 | 图书分级方法及图书分级设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001265808A (ja) * | 2000-03-22 | 2001-09-28 | Skysoft Inc | 情報検索システム及び情報検索方法 |
CN107145514A (zh) * | 2017-04-01 | 2017-09-08 | 华南理工大学 | 基于决策树和svm混合模型的中文句型分类方法 |
CN109657750A (zh) * | 2018-12-12 | 2019-04-19 | 枣庄学院 | 一种图书馆图书自动分类方法 |
-
2019
- 2019-06-03 CN CN201910477640.4A patent/CN110309857A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001265808A (ja) * | 2000-03-22 | 2001-09-28 | Skysoft Inc | 情報検索システム及び情報検索方法 |
CN107145514A (zh) * | 2017-04-01 | 2017-09-08 | 华南理工大学 | 基于决策树和svm混合模型的中文句型分类方法 |
CN109657750A (zh) * | 2018-12-12 | 2019-04-19 | 枣庄学院 | 一种图书馆图书自动分类方法 |
Non-Patent Citations (2)
Title |
---|
ANKIT KUMAR等: ""Ask Me Anything:Dynamic Memory Networks for Natural Language Processing"", 《ARXIV:1506.07285V5 [CS.CL]》, 5 March 2016 (2016-03-05), pages 1 - 10, XP055447087 * |
张俊林: ""目前主流的attention方法都有哪些?"", Retrieved from the Internet <URL:https://www.zhihu.com/question/68482809/answer/264632289> * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112052663A (zh) * | 2020-08-31 | 2020-12-08 | 平安科技(深圳)有限公司 | 客服语句质检方法及相关设备 |
CN112559866A (zh) * | 2020-12-16 | 2021-03-26 | 郑州工程技术学院 | 大学图书阅读推荐方法、装置、设备及存储介质 |
CN113935332A (zh) * | 2021-11-02 | 2022-01-14 | 海信集团控股股份有限公司 | 图书分级方法及图书分级设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN117033608B (zh) | 一种基于大语言模型的知识图谱生成式问答方法及系统 | |
CN112084331B (zh) | 文本处理、模型训练方法、装置、计算机设备和存储介质 | |
KR102288249B1 (ko) | 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체 | |
CN111949787A (zh) | 基于知识图谱的自动问答方法、装置、设备及存储介质 | |
CN110032632A (zh) | 基于文本相似度的智能客服问答方法、装置及存储介质 | |
CN114565104A (zh) | 语言模型的预训练方法、结果推荐方法及相关装置 | |
CN111680147A (zh) | 一种数据处理方法、装置、设备以及可读存储介质 | |
CN109033277A (zh) | 基于机器学习的类脑系统、方法、设备及存储介质 | |
CN111241232B (zh) | 业务服务的处理方法、装置、服务平台及存储介质 | |
CN113239169A (zh) | 基于人工智能的回答生成方法、装置、设备及存储介质 | |
CN110309857A (zh) | 基于人工智能的图书分类装置、方法、设备及存储介质 | |
CN111400461A (zh) | 智能客服问题匹配方法及装置 | |
CN113656563A (zh) | 一种神经网络搜索方法及相关设备 | |
CN113821587B (zh) | 文本相关性确定方法、模型训练方法、装置及存储介质 | |
CN112818120B (zh) | 习题标注方法、装置、存储介质及电子设备 | |
CN113342958A (zh) | 问答匹配方法、文本匹配模型的训练方法和相关设备 | |
CN117520503A (zh) | 基于llm模型的金融客服对话生成方法、装置、设备及介质 | |
CN117453885A (zh) | 提问信息处理方法、装置、设备、存储介质及产品 | |
CN112529151B (zh) | 一种数据处理方法以及装置 | |
CN116542297A (zh) | 基于文本数据训练生成对抗网络的方法及装置 | |
CN112287084A (zh) | 一种基于集成学习的问答方法及系统 | |
CN118097341A (zh) | 一种目标检测方法、模型训练方法及相关装置 | |
CN116450855A (zh) | 基于知识图谱的问答机器人的回复生成策略方法及系统 | |
CN115617975B (zh) | 针对少样本多轮对话的意图识别方法及装置 | |
CN115129863A (zh) | 意图识别方法、装置、设备、存储介质和计算机程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |