CN106844512B - 智能问答方法及系统 - Google Patents

智能问答方法及系统 Download PDF

Info

Publication number
CN106844512B
CN106844512B CN201611233970.1A CN201611233970A CN106844512B CN 106844512 B CN106844512 B CN 106844512B CN 201611233970 A CN201611233970 A CN 201611233970A CN 106844512 B CN106844512 B CN 106844512B
Authority
CN
China
Prior art keywords
question
actor
user
sentence
knowledge base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611233970.1A
Other languages
English (en)
Other versions
CN106844512A (zh
Inventor
简仁贤
叶茂
杨亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Emotibot Technologies Ltd
Original Assignee
Emotibot Technologies Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Emotibot Technologies Ltd filed Critical Emotibot Technologies Ltd
Priority to CN201611233970.1A priority Critical patent/CN106844512B/zh
Publication of CN106844512A publication Critical patent/CN106844512A/zh
Application granted granted Critical
Publication of CN106844512B publication Critical patent/CN106844512B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种智能回答方法及系统,方法为:获取知识库中存储问题及对应回答,根据人称模型计算问题的施动和受动人称;计算用户问题的关键词与知识库中问题的关键词的相似度,得到第一问题集合,并在知识库中得到第一问题集合中问题对应的施动和受动人称;计算用户的问题对应的施动和受动人称;将与用户的问题对应的施动和受动人称不一致的问题去除,得到第二问题集合;随机取得第二问题集合中的一个问题作为匹配问题,其对应的回答为用户的问题的回答。本发明通过人称模型计算用户提出问题中的施动和受动人称,去除与用户提出的问题的施动和受动人称不一致的问题,匹配到相似的问题,给出准确的回答。

Description

智能问答方法及系统
技术领域
本发明涉及电数字数据处理和人工智能技术领域,尤其涉及一种智能问答方法及系统。
背景技术
在智能对话系统中,通常使用问题和问题匹配的方法寻找答案。在知识库中保存问题和相应的回答,当用户询问一个问题A时,从知识库中找到与问题A相似的问题B,然后将问题B的答案返回给用户。通常通过关键词比较计算两个问题的相似度,即基于问题A和问题B的关键词计算其相似度。为了提高召回率,通常不要求关键词完全匹配,然而,这种方法这可能会引入错误。因为两个问题中提取的关键词可能有很高的相似度,但两个问题中包含的人称在句子中的顺序不同,即施动人称和受动人称不同,问题A中的施动人称为X1,受动人称为Y1,而问题B中的施动人称为X2,受动人称为Y2,因此,如果忽略问题中包含的施动人称和受动人称不同问题,很可能给出问题的回答是不准确的。例如,例如,question A:我喜欢你question B:你喜欢我,这两个question的关键词都是“我”“喜欢”“你”,因此会有很高的相似度,但是由于两个句子中的施动人称和受动人称不同,导致其语义完全不同,因此很可能给出问题的回答不准确。
因此,现有技术中的缺陷是,在智能对话系统中,无法根据问题中包含的施动人称和受动人称进行语义分析,导致给出的回答不准确。
发明内容
针对上述技术问题,本发明提供一种智能回答方法及系统,通过人称模型计算用户提出问题中的施动人称和受动人称,根据知识库中保存的问题及其施动人称和受动人称,在知识库中去除与用户提出的问题的施动人称和受动人称不一致的问题,进而匹配到与用户提出问题相似的问题,并给出准确的回答。
为解决上述技术问题,本发明提供的技术方案是:
第一方面,本发明提供一种智能回答方法,包括:
步骤S1,获取知识库,所述知识库中存储问题及对应回答,根据预先建立的人称模型计算所述问题的施动人称和受动人称,存入所述知识库;
步骤S2,获取用户的问题,计算所述用户问题的关键词;
步骤S3,计算所述用户问题的关键词与所述知识库中问题的关键词的相似度,在所述知识库中得到所述相似度为预设阈值的第一问题集合,并在所述知识库中得到所述第一问题集合中问题对应的施动人称和受动人称;
步骤S4,根据所述用户的问题,通过所述人称模型计算所述用户的问题对应的施动人称和受动人称;
步骤S5,将所述用户的问题对应的施动人称和受动人称与所述所述第一问题集合中问题对应的施动人称和受动人称进行比较,将与所述用户的问题对应的施动人称和受动人称不一致的问题去除,得到第二问题集合;
步骤S6,根据所述第二问题集合,随机取得一个问题作为匹配问题,所述匹配问题对应的回答为所述用户的问题的回答。
本发明的智能回答方法的技术方案为:获取知识库,所述知识库中存储问题及对应回答,根据预先建立的人称模型计算所述问题的施动人称和受动人称,存入所述知识库;获取用户的问题,计算所述用户问题的关键词;计算所述用户问题的关键词与所述知识库中问题的关键词的相似度,在所述知识库中得到所述相似度为预设阈值的第一问题集合,并在所述知识库中得到所述第一问题集合中问题对应的施动人称和受动人称;
根据所述用户的问题,通过所述人称模型计算所述用户的问题对应的施动人称和受动人称;将所述用户的问题对应的施动人称和受动人称与所述所述第一问题集合中问题对应的施动人称和受动人称进行比较,将与所述用户的问题对应的施动人称和受动人称不一致的问题去除,得到第二问题集合;根据所述第二问题集合,随机取得一个问题作为匹配问题,所述匹配问题对应的回答为所述用户的问题的回答。
本发明的智能问答方法,通过人称模型计算用户提出问题中的施动人称和受动人称,根据知识库中保存的问题及其施动人称和受动人称,首先根据问题中的关键词相似度得到第一问题集合,然后在知识库中去除与用户提出的问题的施动人称和受动人称不一致的问题,得到第二问题集合,在第二问题集合中匹配到相似的问题,并给出准确的回答。
进一步地,所述语义模型的建立,具体为:
所述人称模型的建立,具体为:
获取训练语料,所述训练语料包括句子、施动人称和受动人称;
通过最大熵模型对所述训练语料进行训练,得到人称模型。
进一步地,通过最大熵模型对所述训练语料进行训练,得到人称模型,具体为:
获取训练语料中的特征,所述特征为从所述句子、所述施动人称和受动人称中得到的特征序列;
对所述特征序列进行训练,得到人称模型。
进一步地,所述特征包括二元特征,所述二元特征为句子中前后两个字符形成的特征序列;句首的两个字符,句尾的两个字符,句首的三个字符,句尾的三个字符,句子中的第2个和第3个字符,句子中的倒数第2个和倒数第3个字符,句子中的字符被,句子中的字符把,句子中的字符跟、和、与、同,句首的人称词语,句子的分词序列,句子的分词及其词性序列。
第二方面,本发明提供一种智能问答系统,包括:
知识库获取模块,用于获取知识库,所述知识库中存储问题及对应回答,根据预先建立的人称模型计算所述问题的施动人称和受动人称,存入所述知识库;
关键词获取模块,获取用户的问题,计算所述用户问题的关键词;
第一问题集合模块,用于计算所述用户问题的关键词与所述知识库中问题的关键词的相似度,在所述知识库中得到所述相似度为预设阈值的第一问题集合,并在所述知识库中得到所述第一问题集合中问题对应的施动人称和受动人称;
人称模型计算模块,用于根据所述用户的问题,通过所述人称模型计算所述用户的问题对应的施动人称和受动人称;
第二问题集合模块,用于将所述用户的问题对应的施动人称和受动人称与所述所述第一问题集合中问题对应的施动人称和受动人称进行比较,将与所述用户的问题对应的施动人称和受动人称不一致的问题去除,得到第二问题集合;
回答获取模块,用于根据所述第二问题集合,随机取得一个问题作为匹配问题,所述匹配问题对应的回答为所述用户的问题的回答。
本发明的智能问答系统的技术方案为:先通过知识库获取模块,用于获取知识库,所述知识库中存储问题及对应回答,根据预先建立的人称模型计算所述问题的施动人称和受动人称,存入所述知识库;接着通过关键词获取模块,获取用户的问题,计算所述用户问题的关键词;然后通过第一问题集合模块,用于计算所述用户问题的关键词与所述知识库中问题的关键词的相似度,在所述知识库中得到所述相似度为预设阈值的第一问题集合,并在所述知识库中得到所述第一问题集合中问题对应的施动人称和受动人称;
接着通过人称模型计算模块,用于根据所述用户的问题,通过所述人称模型计算所述用户的问题对应的施动人称和受动人称;然后通过第二问题集合模块,用于将所述用户的问题对应的施动人称和受动人称与所述所述第一问题集合中问题对应的施动人称和受动人称进行比较,将与所述用户的问题对应的施动人称和受动人称不一致的问题去除,得到第二问题集合;最后通过回答获取模块,用于根据所述第二问题集合,随机取得一个问题作为匹配问题,所述匹配问题对应的回答为所述用户的问题的回答。
本发明的智能问答系统,通过人称模型计算用户提出问题中的施动人称和受动人称,根据知识库中保存的问题及其施动人称和受动人称,首先根据问题中的关键词相似度得到第一问题集合,然后在知识库中去除与用户提出的问题的施动人称和受动人称不一致的问题,得到第二问题集合,在第二问题集合中匹配到相似的问题,并给出准确的回答。
进一步地,还包括人称模型建立模块,用于:
获取训练语料,所述训练语料包括句子、施动人称和受动人称;
通过最大熵模型对所述训练语料进行训练,得到人称模型。
进一步地,所述人称模型建立模块,具体用于:
获取训练语料中的特征,所述特征为从所述句子、所述施动人称和受动人称中得到的特征序列;
对所述特征序列进行训练,得到人称模型。
进一步地,所述特征包括二元特征,所述二元特征为句子中前后两个字符形成的特征序列;句首的两个字符,句尾的两个字符,句首的三个字符,句尾的三个字符,句子中的第2个和第3个字符,句子中的倒数第2个和倒数第3个字符,句子中的字符被,句子中的字符把,句子中的字符跟、和、与、同,句首的人称词语,句子的分词序列,句子的分词及其词性序列。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。
图1示出了本发明实施例所提供的一种智能问答方法的流程图;
图2示出了本发明实施例所提供的一种智能问答系统的示意图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只是作为示例,而不能以此来限制本发明的保护范围。
实施例一
图1示出了本发明实施例所提供的一种智能问答方法的流程图;如图1所示实施例一提供的一种智能问答方法,包括:
步骤S1,获取知识库,知识库中存储问题及对应回答,根据预先建立的人称模型计算问题的施动人称和受动人称,存入知识库;
步骤S2,获取用户的问题,计算用户问题的关键词;
计算用户问题的关键词有两种方法,一种方法是:
根据用户的问题,对用户的问题进行分词和词性标注,得到指定词;
将指定词作为关键词。
其中,指定词包括动词、名词和人称代词;
另一种方法是:
根据用户的问题,获得用户的问题中的分词结果、词性和依存句法;
根据分词结果、词性和依存句法,进行分析,得到分析结果;
根据分析结果,提取特征并训练最大熵模型,通过最大熵模型标注关键词。
步骤S3,计算用户问题的关键词与知识库中问题的关键词的相似度,在知识库中得到相似度为预设阈值的第一问题集合,并在知识库中得到第一问题集合中问题对应的施动人称和受动人称;
步骤S4,根据用户的问题,通过人称模型计算用户的问题对应的施动人称和受动人称;
步骤S5,将用户的问题对应的施动人称和受动人称与第一问题集合中问题对应的施动人称和受动人称进行比较,将与用户的问题对应的施动人称和受动人称不一致的问题去除,得到第二问题集合;
步骤S6,根据第二问题集合,随机取得一个问题作为匹配问题,匹配问题对应的回答为用户的问题的回答。
本发明的智能回答方法的技术方案为:获取知识库,知识库中存储问题及对应回答,根据预先建立的人称模型计算问题的施动人称和受动人称,存入知识库;获取用户的问题,计算用户问题的关键词;计算用户问题的关键词与知识库中问题的关键词的相似度,在知识库中得到相似度为预设阈值的第一问题集合,并在知识库中得到第一问题集合中问题对应的施动人称和受动人称;
根据用户的问题,通过人称模型计算用户的问题对应的施动人称和受动人称;将用户的问题对应的施动人称和受动人称与第一问题集合中问题对应的施动人称和受动人称进行比较,将与用户的问题对应的施动人称和受动人称不一致的问题去除,得到第二问题集合;根据第二问题集合,随机取得一个问题作为匹配问题,匹配问题对应的回答为用户的问题的回答。
本发明的智能问答方法,通过人称模型计算用户提出问题中的施动人称和受动人称,根据知识库中保存的问题及其施动人称和受动人称,首先根据问题中的关键词相似度得到第一问题集合,然后在知识库中去除与用户提出的问题的施动人称和受动人称不一致的问题,得到第二问题集合,在第二问题集合中匹配到相似的问题,并给出准确的回答。
需要说明的是,知识库中存储大量的问题,及问题对应的回答,只有存储的问题足够多,才可以给用户提供更准确的回答。
具体地,语义模型的建立,具体为:
人称模型的建立,具体为:
获取训练语料,训练语料包括句子、施动人称和受动人称;
通过最大熵模型对训练语料进行训练,得到人称模型。
具体地,通过最大熵模型对训练语料进行训练,得到人称模型,具体为:
获取训练语料中的特征,特征为从句子、施动人称和受动人称中得到的特征序列;
对特征序列进行训练,得到人称模型。
通过最大熵模型将训练语料中表示受动人称和施动人称的特征进行提取训练,得到人称模型,最大熵模型的优点为:建模时,试验者只需集中精力选择特征,而不需要花费精力考虑如何使用这些特征;特征选择灵活,且不需要额外的独立假定或者内在约束;模型应用在不同领域时的可移植性强;可结合更丰富的信息。因此本发明中选用最大熵模型对训练语料进行训练,得到人称模型。
具体地,特征包括二元特征,二元特征为句子中前后两个字符形成的特征序列;句首的两个字符,句尾的两个字符,句首的三个字符,句尾的三个字符,句子中的第2个和第3个字符,句子中的倒数第2个和倒数第3个字符,句子中的字符被,句子中的字符把,句子中的字符跟、和、与、同,句首的人称词语,句子的分词序列,句子的分词及其词性序列。
具体地,预设阈值为60%。经验证,在预设阈值为60%时,即相似度为60%时,在知识库中得到的第一问题集合中的问题与用户提出的问题相似。
图2示出了本发明实施例所提供的一种智能问答系统的示意图,如图2所示,本发明实施例提供一种智能问答系统10,包括:
知识库获取模块101,用于获取知识库,知识库中存储问题及对应回答,根据预先建立的人称模型计算问题的施动人称和受动人称,存入知识库;
关键词获取模块102,获取用户的问题,计算用户问题的关键词;
计算用户问题的关键词有两种方法,一种方法是:
根据用户的问题,对用户的问题进行分词和词性标注,得到指定词;
将指定词作为关键词。
其中,指定词包括动词、名词和人称代词;
另一种方法是:
根据用户的问题,获得用户的问题中的分词结果、词性和依存句法;
根据分词结果、词性和依存句法,进行分析,得到分析结果;
根据分析结果,提取特征并训练最大熵模型,通过最大熵模型标注关键词。
第一问题集合模块103,用于计算用户问题的关键词与知识库中问题的关键词的相似度,在知识库中得到相似度为预设阈值的第一问题集合,并在知识库中得到第一问题集合中问题对应的施动人称和受动人称;
人称模型计算模块104,用于根据用户的问题,通过人称模型计算用户的问题对应的施动人称和受动人称;
第二问题集合模块105,用于将用户的问题对应的施动人称和受动人称与第一问题集合中问题对应的施动人称和受动人称进行比较,将与用户的问题对应的施动人称和受动人称不一致的问题去除,得到第二问题集合;
回答获取模块106,用于根据第二问题集合,随机取得一个问题作为匹配问题,匹配问题对应的回答为用户的问题的回答。
本发明的智能问答系统10的技术方案为:先通过知识库获取模块101,用于获取知识库,知识库中存储问题及对应回答,根据预先建立的人称模型计算问题的施动人称和受动人称,存入知识库;接着通过关键词获取模块102,获取用户的问题,计算用户问题的关键词;然后通过第一问题集合模块103,用于计算用户问题的关键词与知识库中问题的关键词的相似度,在知识库中得到相似度为预设阈值的第一问题集合,并在知识库中得到第一问题集合中问题对应的施动人称和受动人称;
接着通过人称模型计算模块104,用于根据用户的问题,通过人称模型计算用户的问题对应的施动人称和受动人称;然后通过第二问题集合模块105,用于将用户的问题对应的施动人称和受动人称与第一问题集合中问题对应的施动人称和受动人称进行比较,将与用户的问题对应的施动人称和受动人称不一致的问题去除,得到第二问题集合;最后通过回答获取模块106,用于根据第二问题集合,随机取得一个问题作为匹配问题,匹配问题对应的回答为用户的问题的回答。
本发明的智能问答系统10,通过人称模型计算用户提出问题中的施动人称和受动人称,根据知识库中保存的问题及其施动人称和受动人称,首先根据问题中的关键词相似度得到第一问题集合,然后在知识库中去除与用户提出的问题的施动人称和受动人称不一致的问题,得到第二问题集合,在第二问题集合中匹配到相似的问题,并给出准确的回答。
具体地,还包括人称模型建立模块,用于:
获取训练语料,训练语料包括句子、施动人称和受动人称;
通过最大熵模型对训练语料进行训练,得到人称模型。
具体地,人称模型建立模块,具体用于:
获取训练语料中的特征,特征为从句子、施动人称和受动人称中得到的特征序列;
对特征序列进行训练,得到人称模型。
通过最大熵模型将训练语料中表示受动人称和施动人称的特征进行提取训练,得到人称模型,最大熵模型的优点为:建模时,试验者只需集中精力选择特征,而不需要花费精力考虑如何使用这些特征;特征选择灵活,且不需要额外的独立假定或者内在约束;模型应用在不同领域时的可移植性强;可结合更丰富的信息。因此本发明中选用最大熵模型对训练语料进行训练,得到人称模型。
具体地,特征包括二元特征,二元特征为句子中前后两个字符形成的特征序列;句首的两个字符,句尾的两个字符,句首的三个字符,句尾的三个字符,句子中的第2个和第3个字符,句子中的倒数第2个和倒数第3个字符,句子中的字符被,句子中的字符把,句子中的字符跟、和、与、同,句首的人称词语,句子的分词序列,句子的分词及其词性序列。
具体地,预设阈值为60%。经验证,在预设阈值为60%时,即相似度为60%时,在知识库中得到的第一问题集合中的问题与用户提出的问题相似。
实施例二
基于实施例一中的智能问答方法和智能问答系统10,进行智能问答过程的具体说明:
1、将问题(question)和回答(answer)加入知识库,
例如:
Figure BDA0001195007370000111
2、通过关键词进行索引;同时,根据人称模型M计算question的施动人称和受动人称,存入知识库中;
以上question的关键词及施动人称和受动人称如下:
Figure BDA0001195007370000112
3、根据用户提供的问题question A“我喜欢你”,计算其关键词为“我喜欢你”;
4、根据关键词,从知识库中得到相似度为top n(预设阈值)的question集合CQS1(第一问题集合)。计算得到question A与知识库中question的相似度(根据相同关键词数/总关键词数计算)如下:
Figure BDA0001195007370000121
5、根据用户提供的问题question A“我喜欢你”,根据人称模型M计算其施动人称为第一人称,受动人称为第二人称;
6、利用question A的施动人称和受动人称,从集合CQS1(第一问题集合)中过滤施动人称和受动人称不一致的question,得到集合CQS2(第二问题集合);CQS2集合如下:
相似的question 施动人称 受动人称
我喜欢你 第一人称 第二人称
我非常喜欢你 第一人称 第二人称
7、对于集合CQS2中的每一个问题,将其对应的答案返回给用户,因此用户得到的答案是“我也喜欢你”或者“我也非常喜欢你”。
通过本发明的智能问答方法及系统进行智能回答,可根据问题的施动人称和受动人称,给用户提供更准确的回答。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (8)

1.智能问答方法,其特征在于,包括:
步骤S1,获取知识库,所述知识库中存储问题及对应回答,根据预先建立的人称模型计算所述问题的施动人称和受动人称,存入所述知识库;
步骤S2,获取用户的问题,计算所述用户问题的关键词;
步骤S3,计算所述用户问题的关键词与所述知识库中问题的关键词的相似度,在所述知识库中得到所述相似度为预设阈值的第一问题集合,并在所述知识库中得到所述第一问题集合中问题对应的施动人称和受动人称;
步骤S4,根据所述用户的问题,通过所述人称模型计算所述用户的问题对应的施动人称和受动人称;
步骤S5,将所述用户的问题对应的施动人称和受动人称与所述所述第一问题集合中问题对应的施动人称和受动人称进行比较,将与所述用户的问题对应的施动人称和受动人称不一致的问题去除,得到第二问题集合;
步骤S6,根据所述第二问题集合,随机取得一个问题作为匹配问题,所述匹配问题对应的回答为所述用户的问题的回答。
2.根据权利要求1所述的智能问答方法,其特征在于,
所述人称模型的建立,具体为:
获取训练语料,所述训练语料包括句子、施动人称和受动人称;
通过最大熵模型对所述训练语料进行训练,得到人称模型。
3.根据权利要求2所述的智能问答方法,其特征在于,
通过最大熵模型对所述训练语料进行训练,得到人称模型,具体为:
获取训练语料中的特征,所述特征为从所述句子、所述施动人称和受动人称中得到的特征序列;
对所述特征序列进行训练,得到人称模型。
4.根据权利要求3所述的智能问答方法,其特征在于,
所述特征包括二元特征,所述二元特征为句子中前后两个字符形成的特征序列;句首的两个字符,句尾的两个字符,句首的三个字符,句尾的三个字符,句子中的第2个和第3个字符,句子中的倒数第2个和倒数第3个字符,句子中的字符被,句子中的字符把,句子中的字符跟、和、与、同,句首的人称词语,句子的分词序列,句子的分词及其词性序列。
5.智能问答系统,其特征在于,包括:
知识库获取模块,用于获取知识库,所述知识库中存储问题及对应回答,根据预先建立的人称模型计算所述问题的施动人称和受动人称,存入所述知识库;
关键词获取模块,获取用户的问题,计算所述用户问题的关键词;
第一问题集合模块,用于计算所述用户问题的关键词与所述知识库中问题的关键词的相似度,在所述知识库中得到所述相似度为预设阈值的第一问题集合,并在所述知识库中得到所述第一问题集合中问题对应的施动人称和受动人称;
人称模型计算模块,用于根据所述用户的问题,通过所述人称模型计算所述用户的问题对应的施动人称和受动人称;
第二问题集合模块,用于将所述用户的问题对应的施动人称和受动人称与所述所述第一问题集合中问题对应的施动人称和受动人称进行比较,将与所述用户的问题对应的施动人称和受动人称不一致的问题去除,得到第二问题集合;
回答获取模块,用于根据所述第二问题集合,随机取得一个问题作为匹配问题,所述匹配问题对应的回答为所述用户的问题的回答。
6.根据权利要求5所述的智能问答系统,其特征在于,
还包括人称模型建立模块,用于:
获取训练语料,所述训练语料包括句子、施动人称和受动人称;
通过最大熵模型对所述训练语料进行训练,得到人称模型。
7.根据权利要求6所述的智能问答系统,其特征在于,
所述人称模型建立模块,具体用于:
获取训练语料中的特征,所述特征为从所述句子、所述施动人称和受动人称中得到的特征序列;
对所述特征序列进行训练,得到人称模型。
8.根据权利要求7所述的智能问答系统,其特征在于,
所述特征包括二元特征,所述二元特征为句子中前后两个字符形成的特征序列;句首的两个字符,句尾的两个字符,句首的三个字符,句尾的三个字符,句子中的第2个和第3个字符,句子中的倒数第2个和倒数第3个字符,句子中的字符被,句子中的字符把,句子中的字符跟、和、与、同,句首的人称词语,句子的分词序列,句子的分词及其词性序列。
CN201611233970.1A 2016-12-28 2016-12-28 智能问答方法及系统 Active CN106844512B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611233970.1A CN106844512B (zh) 2016-12-28 2016-12-28 智能问答方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611233970.1A CN106844512B (zh) 2016-12-28 2016-12-28 智能问答方法及系统

Publications (2)

Publication Number Publication Date
CN106844512A CN106844512A (zh) 2017-06-13
CN106844512B true CN106844512B (zh) 2020-06-19

Family

ID=59114388

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611233970.1A Active CN106844512B (zh) 2016-12-28 2016-12-28 智能问答方法及系统

Country Status (1)

Country Link
CN (1) CN106844512B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107980130A (zh) * 2017-11-02 2018-05-01 深圳前海达闼云端智能科技有限公司 自动回答方法、装置、存储介质及电子设备
CN109241269B (zh) * 2018-07-27 2020-07-17 深圳追一科技有限公司 任务型机器人词槽填充方法
CN109145099B (zh) * 2018-08-17 2021-02-23 百度在线网络技术(北京)有限公司 基于人工智能的问答方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573028A (zh) * 2015-01-14 2015-04-29 百度在线网络技术(北京)有限公司 实现智能问答的方法和系统
CN104915340A (zh) * 2014-03-10 2015-09-16 北京大学 自然语言问答方法及装置
CN106095833A (zh) * 2016-06-01 2016-11-09 竹间智能科技(上海)有限公司 人机对话内容处理方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006078094A1 (en) * 2005-01-22 2006-07-27 Nhn Corporation System and method for sharing knowledge through on-line human network

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915340A (zh) * 2014-03-10 2015-09-16 北京大学 自然语言问答方法及装置
CN104573028A (zh) * 2015-01-14 2015-04-29 百度在线网络技术(北京)有限公司 实现智能问答的方法和系统
CN106095833A (zh) * 2016-06-01 2016-11-09 竹间智能科技(上海)有限公司 人机对话内容处理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
中文问答系统中的句型理论及其应用研究;刘朝涛;《中国博士学位论文全文数据库》;20110715(第2011年第07期);第I138-131页 *

Also Published As

Publication number Publication date
CN106844512A (zh) 2017-06-13

Similar Documents

Publication Publication Date Title
CN106980652B (zh) 智能问答方法及系统
CN108334487B (zh) 缺失语意信息补全方法、装置、计算机设备和存储介质
CN110019843B (zh) 知识图谱的处理方法及装置
US20180336193A1 (en) Artificial Intelligence Based Method and Apparatus for Generating Article
CN107633060B (zh) 一种信息处理方法及电子设备
CN106570180B (zh) 基于人工智能的语音搜索方法及装置
KR102491172B1 (ko) 자연어 질의응답 시스템 및 그 학습 방법
CN108763535B (zh) 信息获取方法及装置
CN109933785A (zh) 用于实体关联的方法、装置、设备和介质
CN111222305A (zh) 一种信息结构化方法和装置
CN109522397B (zh) 信息处理方法及装置
CN109408821B (zh) 一种语料生成方法、装置、计算设备及存储介质
CN111159363A (zh) 一种基于知识库的问题答案确定方法及装置
CN110096567A (zh) 基于qa知识库推理的多轮对话回复选择方法、系统
CN106126619A (zh) 一种基于视频内容的视频检索方法及系统
CN111414763A (zh) 一种针对手语计算的语义消歧方法、装置、设备及存储装置
CN111291177A (zh) 一种信息处理方法、装置和计算机存储介质
CN113821605B (zh) 一种事件抽取方法
CN106844512B (zh) 智能问答方法及系统
CN105528437A (zh) 一种基于结构化文本知识提取的问答系统构建方法
CN110019955A (zh) 一种视频标签标注方法及装置
CN115062134B (zh) 知识问答模型训练及知识问答方法、装置和计算机设备
CN112417119A (zh) 一种基于深度学习的开放域问答预测方法
CN110659392B (zh) 检索方法及装置、存储介质
CN110717021A (zh) 人工智能面试中获取输入文本和相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant