CN111125330A - 一种基于人机对话的智能问答方法和装置以及设备 - Google Patents

一种基于人机对话的智能问答方法和装置以及设备 Download PDF

Info

Publication number
CN111125330A
CN111125330A CN201911313839.XA CN201911313839A CN111125330A CN 111125330 A CN111125330 A CN 111125330A CN 201911313839 A CN201911313839 A CN 201911313839A CN 111125330 A CN111125330 A CN 111125330A
Authority
CN
China
Prior art keywords
question
man
machine
conversation
human
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911313839.XA
Other languages
English (en)
Inventor
李威
肖龙源
蔡振华
李稀敏
刘晓葳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Kuaishangtong Technology Co Ltd
Original Assignee
Xiamen Kuaishangtong Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Kuaishangtong Technology Co Ltd filed Critical Xiamen Kuaishangtong Technology Co Ltd
Priority to CN201911313839.XA priority Critical patent/CN111125330A/zh
Publication of CN111125330A publication Critical patent/CN111125330A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于人机对话的智能问答方法和装置以及设备。其中,所述方法包括:采用卷积神经网络方式,对人机对话中的原始对话进行特征词语提取,和根据该提取的特征词语,对人机对话中的原始对话进行语句分类,和采用问答匹配的方式,将该语句分类标注在人机对话中的原始对话中,和根据该标注语句分类后的人机对话中的原始对话,来建立关联人机对话的问答对之间的匹配关系模型,和根据该建立的匹配关系模型,构建基于人机对话的问答对数据库,以及根据该构建的基于人机对话的问答对数据库,对人机对话进行自动问答回复。通过上述方式,能够实现无需人工能够自动对人机对话进行问答回复,降低了人工成本,提高了问答回复的效率。

Description

一种基于人机对话的智能问答方法和装置以及设备
技术领域
本发明涉及人机对话技术领域,尤其涉及一种基于人机对话的智能问答方法和装置以及设备。
背景技术
随着人工智能的发展,人机对话在智能家居、智能助理等领域得到长足的发展。特别是近年来随着深度学习技术、自然语言处理技术和人工构造的知识库规模的提升,人机对话涌现出大量的研究成果和方案。
然而,现有的基于人机对话的问答方案,一般是由人工来进行问答回复,人工成本高,问答回复的效率一般。
发明内容
有鉴于此,本发明的目的在于提出一种基于人机对话的智能问答方法和装置以及设备,能够实现无需人工能够自动对人机对话进行问答回复,降低了人工成本,提高了问答回复的效率。
根据本发明的一个方面,提供一种基于人机对话的智能问答方法,包括:采用卷积神经网络方式,对人机对话中的原始对话进行特征词语提取;根据所述提取的特征词语,对人机对话中的原始对话进行语句分类;采用问答匹配的方式,将所述语句分类标注在人机对话中的原始对话中;根据所述标注语句分类后的人机对话中的原始对话,来建立关联人机对话的问答对之间的匹配关系模型;根据所述建立的匹配关系模型,构建基于人机对话的问答对数据库;根据所述构建的基于人机对话的问答对数据库,对人机对话进行自动问答回复。
其中,所述采用卷积神经网络方式,对人机对话中的原始对话进行特征词语提取,包括:将卷积神经网络应用到人机对话中的原始对话的文本分类任务中,并采用所述应用到所述文本分类任务中的卷积神经网络中的至少两个不同的批尺寸的内核来提取所述原始对话中的关键信息的方式,对人机对话中的原始对话进行特征词语提取。
其中,所述根据所述标注语句分类后的人机对话中的原始对话,来建立关联人机对话的问答对之间的匹配关系模型,包括:根据所述标注语句分类后的人机对话中的原始对话,采用卷积神经网络对所述标注语句分类后的人机对话中的原始对话中的每个句子进行编码,和将所述经编码后的每个句子的标注转换为向量,和将所述向量作为输入,输入到长短期记忆网络中,和将所述经编码后的每个句子的信息记录在长短期记忆网络层的实现单元中,和在输出时预测所述当前每个句子的标注输出,经过逻辑回归模型函数,将当前的输出层输出映射到对应的标注,来建立关联人机对话的问答对之间的匹配关系模型,来建立关联人机对话的问答对之间的匹配关系模型。
其中,所述根据所述建立的匹配关系模型,构建基于人机对话的问答对数据库,包括:根据所述建立的匹配关系模型,对人机对话的每对问答对打上语句分类,根据所述打上的语句分类,构建基于人机对话的问答对数据库。
其中,在所述根据所述构建的基于人机对话的问答对数据库,对人机对话进行自动问答回复之后,还包括:采用最佳匹配问答对的方式,对所述构建的基于人机对话的问答对数据库中的人机对话的问答对进行优化。
根据本发明的另一个方面,还提供一种基于人机对话的智能问答装置,包括:提取模块、分类模块、标注模块、建立模块、构建模块和回复模块;所述提取模块,用于采用卷积神经网络方式,对人机对话中的原始对话进行特征词语提取;所述分类模块,用于根据所述提取的特征词语,对人机对话中的原始对话进行语句分类;所述标注模块,用于采用问答匹配的方式,将所述语句分类标注在人机对话中的原始对话中;所述建立模块,用于根据所述标注语句分类后的人机对话中的原始对话,来建立关联人机对话的问答对之间的匹配关系模型;所述构建模块,用于根据所述建立的匹配关系模型,构建基于人机对话的问答对数据库;所述回复模块,用于根据所述构建的基于人机对话的问答对数据库,对人机对话进行自动问答回复。
其中,所述提取模块,具体用于:将卷积神经网络应用到人机对话中的原始对话的文本分类任务中,并采用所述应用到所述文本分类任务中的卷积神经网络中的至少两个不同的批尺寸的内核来提取所述原始对话中的关键信息的方式,对人机对话中的原始对话进行特征词语提取。
其中,所述建立模块,具体用于:根据所述标注语句分类后的人机对话中的原始对话,采用卷积神经网络对所述标注语句分类后的人机对话中的原始对话中的每个句子进行编码,和将所述经编码后的每个句子的标注转换为向量,和将所述向量作为输入,输入到长短期记忆网络中,和将所述经编码后的每个句子的信息记录在长短期记忆网络层的实现单元中,和在输出时预测所述当前每个句子的标注输出,经过逻辑回归模型函数,将当前的输出层输出映射到对应的标注,来建立关联人机对话的问答对之间的匹配关系模型,来建立关联人机对话的问答对之间的匹配关系模型。
其中,所述构建模块,具体用于:根据所述建立的匹配关系模型,对人机对话的每对问答对打上语句分类,根据所述打上的语句分类,构建基于人机对话的问答对数据库。
其中,所述基于人机对话的智能问答装置,还包括:优化模块;所述优化模块,用于采用最佳匹配问答对的方式,对所述构建的基于人机对话的问答对数据库中的人机对话的问答对进行优化。
可以发现,以上方案,可以采用卷积神经网络方式,对人机对话中的原始对话进行特征词语提取,和可以根据该提取的特征词语,对人机对话中的原始对话进行语句分类,和可以采用问答匹配的方式,将该语句分类标注在人机对话中的原始对话中,和可以根据该标注语句分类后的人机对话中的原始对话,来建立关联人机对话的问答对之间的匹配关系模型,和可以根据该建立的匹配关系模型,构建基于人机对话的问答对数据库,以及可以根据该构建的基于人机对话的问答对数据库,对人机对话进行自动问答回复,能够实现无需人工能够自动对人机对话进行问答回复,降低了人工成本,提高了问答回复的效率。
进一步的,以上方案,可以将卷积神经网络应用到人机对话中的原始对话的文本分类任务中,并采用该应用到该文本分类任务中的卷积神经网络中的至少两个不同的批尺寸的内核来提取该原始对话中的关键信息的方式,对人机对话中的原始对话进行特征词语提取,这样的好处是能够实现更好的提取人机对话中的原始对话特征词语的局部相关性。
进一步的,以上方案,可以根据该标注语句分类后的人机对话中的原始对话,采用卷积神经网络对该标注语句分类后的人机对话中的原始对话中的每个句子进行编码,和将该经编码后的每个句子的标注转换为向量,和将该向量作为输入,输入到长短期记忆网络中,和将该经编码后的每个句子的信息记录在长短期记忆网络层的实现单元中,和在输出时预测该当前每个句子的标注输出,经过逻辑回归模型函数,将当前的输出层输出映射到对应的标注,来建立关联人机对话的问答对之间的匹配关系模型,这样的好处是能够提高对人机对话的问答对之间的匹配关系的准确率。
进一步的,以上方案,可以根据该建立的匹配关系模型,对人机对话的每对问答对打上语句分类,根据该打上的语句分类,构建基于人机对话的问答对数据库,这样的好处是能够实现准确构建基于人机对话的问答对数据库。
进一步的,以上方案,可以采用最佳匹配问答对的方式,对该构建的基于人机对话的问答对数据库中的人机对话的问答对进行优化,这样的好处是能够提高自动对人机对话进行问答回复的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明基于人机对话的智能问答方法一实施例的流程示意图;
图2是本发明基于人机对话的智能问答方法另一实施例的流程示意图;
图3是本发明基于人机对话的智能问答装置一实施例的结构示意图;
图4是本发明基于人机对话的智能问答装置另一实施例的结构示意图;
图5是本发明基于人机对话的智能问答设备一实施例的结构示意图。
具体实施方式
下面结合附图和实施例,对本发明作进一步的详细描述。特别指出的是,以下实施例仅用于说明本发明,但不对本发明的范围进行限定。同样的,以下实施例仅为本发明的部分实施例而非全部实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明提供一种基于人机对话的智能问答方法,能够实现无需人工能够自动对人机对话进行问答回复,降低了人工成本,提高了问答回复的效率。
请参见图1,图1是本发明基于人机对话的智能问答方法一实施例的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图1所示的流程顺序为限。如图1所示,该方法包括如下步骤:
S101:采用CNN(Convolutional Neural Networks,卷积神经网络)方式,对人机对话中的原始对话进行特征词语提取。
其中,该采用卷积神经网络方式,对人机对话中的原始对话进行特征词语提取,可以包括:
将卷积神经网络应用到人机对话中的原始对话的文本分类任务中,并采用该应用到该文本分类任务中的卷积神经网络中的至少两个不同的Batchsize(批尺寸)的Kernel(内核)来提取该原始对话中的关键信息的方式,对人机对话中的原始对话进行特征词语提取,这样的好处是能够实现更好的提取人机对话中的原始对话特征词语的局部相关性。
S102:根据该提取的特征词语,对人机对话中的原始对话进行语句分类。
在本实施例中,该语句分类可以是引导句、咨询句、陈述句、介绍句等,本发明不加以限定。
S103:采用问答匹配的方式,将该语句分类标注在人机对话中的原始对话中。
在本实施例中,可以采用批注引导句、咨询句、陈述句、介绍句等语句分类的问答匹配的方式,将该语句分类标注在人机对话中的原始对话中,这样的好处是便于建立人机对话的问答对之间的匹配关系模型。
S104:根据该标注语句分类后的人机对话中的原始对话,来建立关联人机对话的问答对之间的匹配关系模型。
其中,该根据该标注语句分类后的人机对话中的原始对话,来建立关联人机对话的问答对之间的匹配关系模型,可以包括:
根据该标注语句分类后的人机对话中的原始对话,采用卷积神经网络对该标注语句分类后的人机对话中的原始对话中的每个句子进行编码,和将该经编码后的每个句子的标注转换为向量,和将该向量作为输入,输入到LSTM(LongShort-Term Memory,长短期记忆网络)中,和将该经编码后的每个句子的信息记录在LSTM cell(长短期记忆网络层的实现单元)中,和在输出时预测该当前每个句子的标注输出,经过softmax(逻辑回归模型)函数,将当前的输出层输出映射到对应的标注,来建立关联人机对话的问答对之间的匹配关系模型,这样的好处是能够提高对人机对话的问答对之间的匹配关系的准确率。
S105:根据该建立的匹配关系模型,构建基于人机对话的问答对数据库。
其中,该根据该建立的匹配关系模型,构建基于人机对话的问答对数据库,可以包括:
根据该建立的匹配关系模型,对人机对话的每对问答对打上语句分类,根据该打上的语句分类,构建基于人机对话的问答对数据库,这样的好处是能够实现准确构建基于人机对话的问答对数据库。
S106:根据该构建的基于人机对话的问答对数据库,对人机对话进行自动问答回复。
其中,在该根据该构建的基于人机对话的问答对数据库,对人机对话进行自动问答回复之后,还可以包括:
采用最佳匹配问答对的方式,对该构建的基于人机对话的问答对数据库中的人机对话的问答对进行优化,这样的好处是能够提高自动对人机对话进行问答回复的准确率。
可以发现,在本实施例中,可以采用卷积神经网络方式,对人机对话中的原始对话进行特征词语提取,和可以根据该提取的特征词语,对人机对话中的原始对话进行语句分类,和可以采用问答匹配的方式,将该语句分类标注在人机对话中的原始对话中,和可以根据该标注语句分类后的人机对话中的原始对话,来建立关联人机对话的问答对之间的匹配关系模型,和可以根据该建立的匹配关系模型,构建基于人机对话的问答对数据库,以及可以根据该构建的基于人机对话的问答对数据库,对人机对话进行自动问答回复,能够实现无需人工能够自动对人机对话进行问答回复,降低了人工成本,提高了问答回复的效率。
进一步的,在本实施例中,可以将卷积神经网络应用到人机对话中的原始对话的文本分类任务中,并采用该应用到该文本分类任务中的卷积神经网络中的至少两个不同的批尺寸的内核来提取该原始对话中的关键信息的方式,对人机对话中的原始对话进行特征词语提取,这样的好处是能够实现更好的提取人机对话中的原始对话特征词语的局部相关性。
进一步的,在本实施例中,可以根据该标注语句分类后的人机对话中的原始对话,采用卷积神经网络对该标注语句分类后的人机对话中的原始对话中的每个句子进行编码,和将该经编码后的每个句子的标注转换为向量,和将该向量作为输入,输入到长短期记忆网络中,和将该经编码后的每个句子的信息记录在长短期记忆网络层的实现单元中,和在输出时预测该当前每个句子的标注输出,经过逻辑回归模型函数,将当前的输出层输出映射到对应的标注,来建立关联人机对话的问答对之间的匹配关系模型,这样的好处是能够提高对人机对话的问答对之间的匹配关系的准确率。
进一步的,在本实施例中,可以根据该建立的匹配关系模型,对人机对话的每对问答对打上语句分类,根据该打上的语句分类,构建基于人机对话的问答对数据库,这样的好处是能够实现准确构建基于人机对话的问答对数据库。
请参见图2,图2是本发明基于人机对话的智能问答方法另一实施例的流程示意图。本实施例中,该方法包括以下步骤:
S201:采用卷积神经网络方式,对人机对话中的原始对话进行特征词语提取。
可如上S101所述,在此不作赘述。
S202:根据该提取的特征词语,对人机对话中的原始对话进行语句分类。
可如上S102所述,在此不作赘述。
S203:采用问答匹配的方式,将该语句分类标注在人机对话中的原始对话中。
可如上S103所述,在此不作赘述。
S204:根据该标注语句分类后的人机对话中的原始对话,来建立关联人机对话的问答对之间的匹配关系模型。
可如上S104所述,在此不作赘述。
S205:根据该建立的匹配关系模型,构建基于人机对话的问答对数据库。
可如上S105所述,在此不作赘述。
S206:根据该构建的基于人机对话的问答对数据库,对人机对话进行自动问答回复。
可如上S106所述,在此不作赘述。
S207:采用最佳匹配问答对的方式,对该构建的基于人机对话的问答对数据库中的人机对话的问答对进行优化。
可以发现,在本实施例中,可以采用最佳匹配问答对的方式,对该构建的基于人机对话的问答对数据库中的人机对话的问答对进行优化,这样的好处是能够提高自动对人机对话进行问答回复的准确率。
本发明还提供一种基于人机对话的智能问答装置,能够实现无需人工能够自动对人机对话进行问答回复,降低了人工成本,提高了问答回复的效率。
请参见图3,图3是本发明基于人机对话的智能问答装置一实施例的结构示意图。本实施例中,该基于人机对话的智能问答装置30包括提取模块31、分类模块32、标注模块33、建立模块34、构建模块35和回复模块36。
该提取模块31,用于采用卷积神经网络方式,对人机对话中的原始对话进行特征词语提取。
该分类模块32,用于根据该提取的特征词语,对人机对话中的原始对话进行语句分类。
该标注模块33,用于采用问答匹配的方式,将该语句分类标注在人机对话中的原始对话中。
该建立模块34,用于根据该标注语句分类后的人机对话中的原始对话,来建立关联人机对话的问答对之间的匹配关系模型。
该构建模块35,用于根据该建立的匹配关系模型,构建基于人机对话的问答对数据库。
该回复模块36,用于根据该构建的基于人机对话的问答对数据库,对人机对话进行自动问答回复。
可选地,该提取模块31,可以具体用于:
将卷积神经网络应用到人机对话中的原始对话的文本分类任务中,并采用该应用到该文本分类任务中的卷积神经网络中的至少两个不同的批尺寸的内核来提取该原始对话中的关键信息的方式,对人机对话中的原始对话进行特征词语提取。
可选地,该建立模块34,可以具体用于:
根据该标注语句分类后的人机对话中的原始对话,采用卷积神经网络对该标注语句分类后的人机对话中的原始对话中的每个句子进行编码,和将该经编码后的每个句子的标注转换为向量,和将该向量作为输入,输入到长短期记忆网络中,和将该经编码后的每个句子的信息记录在长短期记忆网络层的实现单元中,和在输出时预测该当前每个句子的标注输出,经过逻辑回归模型函数,将当前的输出层输出映射到对应的标注,来建立关联人机对话的问答对之间的匹配关系模型。
可选地,该构建模块35,可以具体用于:
根据该建立的匹配关系模型,对人机对话的每对问答对打上语句分类,根据该打上的语句分类,构建基于人机对话的问答对数据库。
请参见图4,图4是本发明基于人机对话的智能问答装置另一实施例的结构示意图。区别于上一实施例,本实施例所述基于人机对话的智能问答装置40还包括优化模块41。
该优化模块41,用于采用最佳匹配问答对的方式,对该构建的基于人机对话的问答对数据库中的人机对话的问答对进行优化。
该基于人机对话的智能问答装置30/40的各个单元模块可分别执行上述方法实施例中对应步骤,故在此不对各单元模块进行赘述,详细请参见以上对应步骤的说明。
本发明又提供一种基于人机对话的智能问答设备,如图5所示,包括:至少一个处理器51;以及,与至少一个处理器51通信连接的存储器52;其中,存储器52存储有可被至少一个处理器51执行的指令,指令被至少一个处理器51执行,以使至少一个处理器51能够执行上述的基于人机对话的智能问答方法。
其中,存储器52和处理器51采用总线方式连接,总线可以包括任意数量的互联的总线和桥,总线将一个或多个处理器51和存储器52的各种电路连接在一起。总线还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路连接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口在总线和收发机之间提供接口。收发机可以是一个元件,也可以是多个元件,比如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。经处理器51处理的数据通过天线在无线介质上进行传输,进一步,天线还接收数据并将数据传送给处理器51。
处理器51负责管理总线和通常的处理,还可以提供各种功能,包括定时,外围接口,电压调节、电源管理以及其他控制功能。而存储器52可以被用于存储处理器51在执行操作时所使用的数据。
本发明再提供一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述方法实施例。
可以发现,以上方案,可以采用卷积神经网络方式,对人机对话中的原始对话进行特征词语提取,和可以根据该提取的特征词语,对人机对话中的原始对话进行语句分类,和可以采用问答匹配的方式,将该语句分类标注在人机对话中的原始对话中,和可以根据该标注语句分类后的人机对话中的原始对话,来建立关联人机对话的问答对之间的匹配关系模型,和可以根据该建立的匹配关系模型,构建基于人机对话的问答对数据库,以及可以根据该构建的基于人机对话的问答对数据库,对人机对话进行自动问答回复,能够实现无需人工能够自动对人机对话进行问答回复,降低了人工成本,提高了问答回复的效率。
进一步的,以上方案,可以将卷积神经网络应用到人机对话中的原始对话的文本分类任务中,并采用该应用到该文本分类任务中的卷积神经网络中的至少两个不同的批尺寸的内核来提取该原始对话中的关键信息的方式,对人机对话中的原始对话进行特征词语提取,这样的好处是能够实现更好的提取人机对话中的原始对话特征词语的局部相关性。
进一步的,以上方案,可以根据该标注语句分类后的人机对话中的原始对话,采用卷积神经网络对该标注语句分类后的人机对话中的原始对话中的每个句子进行编码,和将该经编码后的每个句子的标注转换为向量,和将该向量作为输入,输入到长短期记忆网络中,和将该经编码后的每个句子的信息记录在长短期记忆网络层的实现单元中,和在输出时预测该当前每个句子的标注输出,经过逻辑回归模型函数,将当前的输出层输出映射到对应的标注,来建立关联人机对话的问答对之间的匹配关系模型,这样的好处是能够提高对人机对话的问答对之间的匹配关系的准确率。
进一步的,以上方案,可以根据该建立的匹配关系模型,对人机对话的每对问答对打上语句分类,根据该打上的语句分类,构建基于人机对话的问答对数据库,这样的好处是能够实现准确构建基于人机对话的问答对数据库。
进一步的,以上方案,可以采用最佳匹配问答对的方式,对该构建的基于人机对话的问答对数据库中的人机对话的问答对进行优化,这样的好处是能够提高自动对人机对话进行问答回复的准确率。
在本发明所提供的几个实施方式中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本发明各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的部分实施例,并非因此限制本发明的保护范围,凡是利用本发明说明书及附图内容所作的等效装置或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于人机对话的智能问答方法,其特征在于,包括:
采用卷积神经网络方式,对人机对话中的原始对话进行特征词语提取;
根据所述提取的特征词语,对人机对话中的原始对话进行语句分类;
采用问答匹配的方式,将所述语句分类标注在人机对话中的原始对话中;
根据所述标注语句分类后的人机对话中的原始对话,来建立关联人机对话的问答对之间的匹配关系模型;
根据所述建立的匹配关系模型,构建基于人机对话的问答对数据库;
根据所述构建的基于人机对话的问答对数据库,对人机对话进行自动问答回复。
2.如权利要求1所述的基于人机对话的智能问答方法,其特征在于,所述采用卷积神经网络方式,对人机对话中的原始对话进行特征词语提取,包括:
将卷积神经网络应用到人机对话中的原始对话的文本分类任务中,并采用所述应用到所述文本分类任务中的卷积神经网络中的至少两个不同的批尺寸的内核来提取所述原始对话中的关键信息的方式,对人机对话中的原始对话进行特征词语提取。
3.如权利要求1所述的基于人机对话的智能问答方法,其特征在于,所述根据所述标注语句分类后的人机对话中的原始对话,来建立关联人机对话的问答对之间的匹配关系模型,包括:
根据所述标注语句分类后的人机对话中的原始对话,采用卷积神经网络对所述标注语句分类后的人机对话中的原始对话中的每个句子进行编码,和将所述经编码后的每个句子的标注转换为向量,和将所述向量作为输入,输入到长短期记忆网络中,和将所述经编码后的每个句子的信息记录在长短期记忆网络层的实现单元中,和在输出时预测所述当前每个句子的标注输出,经过逻辑回归模型函数,将当前的输出层输出映射到对应的标注,来建立关联人机对话的问答对之间的匹配关系模型,来建立关联人机对话的问答对之间的匹配关系模型。
4.如权利要求1所述的基于人机对话的智能问答方法,其特征在于,所述根据所述建立的匹配关系模型,构建基于人机对话的问答对数据库,包括:
根据所述建立的匹配关系模型,对人机对话的每对问答对打上语句分类,根据所述打上的语句分类,构建基于人机对话的问答对数据库。
5.如权利要求1所述的基于人机对话的智能问答方法,其特征在于,在所述根据所述构建的基于人机对话的问答对数据库,对人机对话进行自动问答回复之后,还包括:
采用最佳匹配问答对的方式,对所述构建的基于人机对话的问答对数据库中的人机对话的问答对进行优化。
6.一种基于人机对话的智能问答装置,其特征在于,包括:
提取模块、分类模块、标注模块、建立模块、构建模块和回复模块;
所述提取模块,用于采用卷积神经网络方式,对人机对话中的原始对话进行特征词语提取;
所述分类模块,用于根据所述提取的特征词语,对人机对话中的原始对话进行语句分类;
所述标注模块,用于采用问答匹配的方式,将所述语句分类标注在人机对话中的原始对话中;
所述建立模块,用于根据所述标注语句分类后的人机对话中的原始对话,来建立关联人机对话的问答对之间的匹配关系模型;
所述构建模块,用于根据所述建立的匹配关系模型,构建基于人机对话的问答对数据库;
所述回复模块,用于根据所述构建的基于人机对话的问答对数据库,对人机对话进行自动问答回复。
7.如权利要求6所述的基于人机对话的智能问答装置,其特征在于,所述提取模块,具体用于:
将卷积神经网络应用到人机对话中的原始对话的文本分类任务中,并采用所述应用到所述文本分类任务中的卷积神经网络中的至少两个不同的批尺寸的内核来提取所述原始对话中的关键信息的方式,对人机对话中的原始对话进行特征词语提取。
8.如权利要求6所述的基于人机对话的智能问答装置,其特征在于,所述建立模块,具体用于:
根据所述标注语句分类后的人机对话中的原始对话,采用卷积神经网络对所述标注语句分类后的人机对话中的原始对话中的每个句子进行编码,和将所述经编码后的每个句子的标注转换为向量,和将所述向量作为输入,输入到长短期记忆网络中,和将所述经编码后的每个句子的信息记录在长短期记忆网络层的实现单元中,和在输出时预测所述当前每个句子的标注输出,经过逻辑回归模型函数,将当前的输出层输出映射到对应的标注,来建立关联人机对话的问答对之间的匹配关系模型,来建立关联人机对话的问答对之间的匹配关系模型。
9.如权利要求6所述的基于人机对话的智能问答装置,其特征在于,所述构建模块,具体用于:
根据所述建立的匹配关系模型,对人机对话的每对问答对打上语句分类,根据所述打上的语句分类,构建基于人机对话的问答对数据库。
10.如权利要求6所述的基于人机对话的智能问答装置,其特征在于,所述基于人机对话的智能问答装置,还包括:
优化模块;
所述优化模块,用于采用最佳匹配问答对的方式,对所述构建的基于人机对话的问答对数据库中的人机对话的问答对进行优化。
CN201911313839.XA 2019-12-19 2019-12-19 一种基于人机对话的智能问答方法和装置以及设备 Pending CN111125330A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911313839.XA CN111125330A (zh) 2019-12-19 2019-12-19 一种基于人机对话的智能问答方法和装置以及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911313839.XA CN111125330A (zh) 2019-12-19 2019-12-19 一种基于人机对话的智能问答方法和装置以及设备

Publications (1)

Publication Number Publication Date
CN111125330A true CN111125330A (zh) 2020-05-08

Family

ID=70499868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911313839.XA Pending CN111125330A (zh) 2019-12-19 2019-12-19 一种基于人机对话的智能问答方法和装置以及设备

Country Status (1)

Country Link
CN (1) CN111125330A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112100353A (zh) * 2020-09-15 2020-12-18 京东方科技集团股份有限公司 人机对话方法及系统、计算机设备及介质
CN112100353B (zh) * 2020-09-15 2024-06-07 京东方科技集团股份有限公司 人机对话方法及系统、计算机设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107562863A (zh) * 2017-08-30 2018-01-09 深圳狗尾草智能科技有限公司 聊天机器人回复自动生成方法及系统
JP2018028752A (ja) * 2016-08-16 2018-02-22 国立研究開発法人情報通信研究機構 対話システム及びそのためのコンピュータプログラム
CN110188175A (zh) * 2019-04-29 2019-08-30 厦门快商通信息咨询有限公司 一种基于BiLSTM-CRF模型的问答对抽取方法、系统及存储介质
CN110222163A (zh) * 2019-06-10 2019-09-10 福州大学 一种融合cnn与双向lstm的智能问答方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018028752A (ja) * 2016-08-16 2018-02-22 国立研究開発法人情報通信研究機構 対話システム及びそのためのコンピュータプログラム
CN107562863A (zh) * 2017-08-30 2018-01-09 深圳狗尾草智能科技有限公司 聊天机器人回复自动生成方法及系统
CN110188175A (zh) * 2019-04-29 2019-08-30 厦门快商通信息咨询有限公司 一种基于BiLSTM-CRF模型的问答对抽取方法、系统及存储介质
CN110222163A (zh) * 2019-06-10 2019-09-10 福州大学 一种融合cnn与双向lstm的智能问答方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
周小强等: "交互式问答的关系结构体系及标注", 《中文信息学报》, no. 05, 15 May 2018 (2018-05-15) *
金丽娇等: "基于卷积神经网络的自动问答", 《华东师范大学学报(自然科学版)》, no. 05, 31 December 2017 (2017-12-31) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112100353A (zh) * 2020-09-15 2020-12-18 京东方科技集团股份有限公司 人机对话方法及系统、计算机设备及介质
CN112100353B (zh) * 2020-09-15 2024-06-07 京东方科技集团股份有限公司 人机对话方法及系统、计算机设备及介质

Similar Documents

Publication Publication Date Title
CN109299458B (zh) 实体识别方法、装置、设备及存储介质
CN111222317B (zh) 序列标注方法、系统和计算机设备
CN112364660B (zh) 语料文本处理方法、装置、计算机设备及存储介质
CN111401084B (zh) 一种机器翻译的方法、设备以及计算机可读存储介质
CN108959246A (zh) 基于改进的注意力机制的答案选择方法、装置和电子设备
US10853421B2 (en) Segmented sentence recognition method and device for human-machine intelligent question answer system
CN111209740B (zh) 文本模型训练方法、文本纠错方法、电子设备及存储介质
CN111666427A (zh) 一种实体关系联合抽取方法、装置、设备及介质
CN111079432B (zh) 文本检测方法、装置、电子设备及存储介质
CN113449489B (zh) 标点符号标注方法、装置、计算机设备和存储介质
CN111695338A (zh) 基于人工智能的面试内容精炼方法、装置、设备及介质
CN113536801A (zh) 阅读理解模型的训练方法及装置、阅读理解方法及装置
CN115687610A (zh) 文本意图分类模型训练方法、识别方法、装置、电子设备及存储介质
CN113705191A (zh) 样本语句的生成方法、装置、设备及存储介质
CN114168707A (zh) 一种面向推荐的情绪型对话方法
CN115359799A (zh) 语音识别方法、训练方法、装置、电子设备及存储介质
CN116341651A (zh) 实体识别模型训练方法、装置、电子设备及存储介质
CN110210035B (zh) 序列标注方法、装置及序列标注模型的训练方法
CN116821306A (zh) 对话回复生成方法、装置、电子设备和存储介质
CN111125330A (zh) 一种基于人机对话的智能问答方法和装置以及设备
CN111274813A (zh) 语言序列标注方法、装置存储介质及计算机设备
CN115204142A (zh) 开放关系抽取方法、设备及存储介质
CN114398482A (zh) 一种词典构造方法、装置、电子设备及存储介质
CN113377951A (zh) 智能客服机器人的语料构建方法及装置
CN111143527A (zh) 一种基于人机对话的自动问答方法和装置以及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200508