CN100565515C - 一种中文自动应答方法及系统 - Google Patents

一种中文自动应答方法及系统 Download PDF

Info

Publication number
CN100565515C
CN100565515C CNB2006101459852A CN200610145985A CN100565515C CN 100565515 C CN100565515 C CN 100565515C CN B2006101459852 A CNB2006101459852 A CN B2006101459852A CN 200610145985 A CN200610145985 A CN 200610145985A CN 100565515 C CN100565515 C CN 100565515C
Authority
CN
China
Prior art keywords
statement
user
answer
keyword sequence
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CNB2006101459852A
Other languages
English (en)
Other versions
CN101178711A (zh
Inventor
杨海松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tencent Computer Systems Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CNB2006101459852A priority Critical patent/CN100565515C/zh
Publication of CN101178711A publication Critical patent/CN101178711A/zh
Application granted granted Critical
Publication of CN100565515C publication Critical patent/CN100565515C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种中文自动应答方法及系统,用以解决现有技术中采用模式匹配技术实现中文自动应答时,建立中文问答语句库的工作量巨大且覆盖面窄的问题。所述方法包括步骤:确定用户输入的中文语句的类别及关键词序列,从问答语句库中查找与用户输入语句类别相同的关键词序列,将用户输入语句的关键词序列与所述查找到的关键词序列进行匹配,将其中匹配成功的关键词序列对应的应答语句返回给用户;所述系统包括用户语句分析模块和查询模块。本发明提高了问答语句库的内容覆盖面,减少了建库的工作量,同时显著的提高了中文自动应答系统的准确率及召回率。

Description

一种中文自动应答方法及系统
技术领域
本发明涉及计算机应用领域,尤其涉及一种中文自动应答方法及系统。
背景技术
自然语言理解技术是人工智能领域中的一个重要研究方向,它使计算机能够理解和运用人类的自然语言,可以实现人与计算机之间基于自然语言的有效通信。这里的自然语言包括人类使用的各种自然语言,例如中文、英文等等。QA(automatic Question Answering,自动应答)系统是一种以自然语言理解技术为核心,一方面完成对用户问题的分析处理,另一方面完成正确答案生成的系统。
自动应答系统的性能主要通过准确率和召回率两个指标进行表征,下面分别予以说明:
自动应答系统的准确率是指自动应答系统做出正确应答的次数与总共的应答次数的比值,例如用户向自动应答系统输入了100个问题语句,自动应答系统做出了100次应答,其中有20个是正确的,那么这个自动应答系统的准确率就是20%。
自动应答系统的召回率是指自动应答系统做出正确应答的次数与自动应答系统问答语句库中对应存在正确应答的个数的比值,例如用户向自动应答系统中输入了100个问题语句,自动应答系统做出了100次应答,其中有20次是正确的,但是针对用户输入的100个问题语句,自动应答系统问答语句库中具有其中25个问题语句的正确应答,那么这个自动应答系统的召回率就是80%。
现有技术中的中文自动应答系统大多是参考英文自动应答系统,采用简单的模式匹配技术实现的。其基本的算法就是从第一个词开始,对用户当前输入的问题语句和问答语句库中预先存储的全部问题语句进行匹配,如果两个词相同就继续下一个词的匹配,重复这一过程直到用户输入的整个问题语句匹配完毕,如果匹配成功就将问答语句库中的该问题语句对应的系统应答返回给用户。但是相比英文句子而言,中文句子具有用词灵活、句法复杂多变的特点,因此仅采用简单的模式匹配技术的中文自动应答系统普遍存在问答语句库覆盖面窄、系统的准确率和召回率低的缺点,下面举例说明采用简单的模式匹配技术实现的中文自动应答系统的缺点。
假设自动应答系统的问答语句库中存在以下一组问答语句对,其中包括一个问题语句和相应的系统应答:
问题语句:地球为什么围绕太阳转?
系统应答:因为地球是太阳的行星。
这样当用户向自动应答系统中输入“地球为什么围绕太阳转?”这一问题语句时,系统会将用户当前输入的问题语句和问答语句库中预先存储的全部问题语句进行匹配,通过匹配能够查找到问答语句库中存储的上述问答语句对,将该问答语句对中的系统应答取出返回给用户。但是,当用户输入与上述问题语句的句义相同,句法不同的其他句子时,由于系统问答语句库中没有存储相应的问题语句,因此无法给出正确的应答。例如,当用户输入“地球为何围绕太阳转?”或者“地球围绕太阳转是什么原因?”时,系统无法给出正确的应答。
若希望在现有中文自动应答系统中解决上述问题,就必须在系统的问答语句库中再构造下面两组问答语句对:
用户句子:地球为何围绕太阳转?
系统应答:因为地球是太阳的行星。
以及
用户句子:地球围绕太阳转是什么原因?
系统应答:因为地球是太阳的行星。
但是中文的句法非常灵活,而且用词灵活多变,所以通过增加问答语句对来解决上述问题,无论是从工作量还是系统效率的角度来看,都是不可接受的。
综上可见,现有技术中采用简单的模式匹配技术实现中文自动应答时,存在着建立中文问答语句库工作量巨大,且覆盖面窄的问题。
发明内容
本发明提供一种中文自动应答方法及系统,用以解决现有技术中采用模式匹配技术实现中文自动应答时,建立中文问答语句库的工作量巨大且覆盖面窄的问题。
本发明技术方案包括:
一种中文自动应答方法,包括步骤:
A、确定用户输入的中文语句的类别及关键词序列,从问答语句库中查找与用户输入语句类别相同的关键词序列;
B、将用户输入语句的关键词序列与所述查找到的关键词序列进行匹配,将其中匹配成功的关键词序列对应的应答语句返回给用户。
较佳的,确定用户输入语句的类别及关键词序列的具体步骤为:
对用户输入语句进行中文分词处理,得到词序列;
根据所述词序列中包含的句类特征词确定用户输入语句的类别,将句类特征词及停用词从所述词序列中删除,余下的词序列为用户输入语句的关键词序列。
较佳的,所述步骤B中,若匹配不成功,则向用户返回缺省应答语句。
较佳的,所述步骤B具体包括步骤:
B1、提取用户输入语句的关键词序列中的第一个关键词做为匹配依据,将所述查找到的关键词序列全部添加到结果集合中;
B2、将做为匹配依据的关键词与结果集合中各关键词序列的相应位置的内容分别进行匹配,将其中匹配不成功的关键词序列从结果集合中剔除;
B3、判断所述结果集合中是否有剩余的关键词序列,若是,执行步骤B4,否则,随机选择一个与用户输入语句的类别相对应的缺省应答语句返回给用户;
B4、判断用户输入语句的关键词序列中是否存在下一个关键词,若存在,将其做为匹配依据,返回步骤B2,否则,将当前结果集合中的关键词序列对应的应答语句返回给用户。
较佳的,所述步骤B2中,按照做为匹配依据的关键词在用户输入语句的关键词序列中的位置,查找结果集合中各关键词序列在该位置的内容,若该位置的内容为任意词通配符或者与做为匹配依据的关键词相同,则本次匹配成功。
较佳的,所述问答语句库用于存储已定义的问答语句对,所述问答语句对由管理员输入的问题语句的关键词序列、类别及相应的应答语句构成。
较佳的,利用管理员输入的问答语句对更新问答语句库的过程为:
确定所述问答语句对中的问题语句的类别及关键词序列;
查找问答语句库中是否存在与所述问题语句类别相同的关键词序列,若存在,则将所述问答语句对中的应答语句添加到问答语句库中,与查找到的关键词序列关联保存,否则,将所述问题语句的关键词序列、类别与问答语句对中的应答语句关联保存到问答语句库中。
较佳的,确定所述问答语句对中的问题语句的类别及关键词序列的具体过程为:
对管理员输入的问题语句进行中文分词处理,得到词序列;
根据所述词序列中包含的句类特征词确定所述问题语句的类别,将句类特征词及停用词从所述词序列中删除,余下的词序列为所述问题语句的关键词序列。
较佳的,若管理员输入的问题语句中包含有任意词通配符,则该问题语句的关键词序列中包含有任意词通配符。
一种中文自动应答系统,包括:
用户语句分析模块,用于确定用户输入的中文语句的类别及关键词序列;
查询模块,用于从问答语句库中查找与用户输入语句类别相同的关键词序列,将用户输入语句的关键词序列与所述查找到的关键词序列进行匹配,将其中匹配成功的关键词序列对应的应答语句返回给用户。
较佳的,所述用户语句分析模块具体包括:
第一分词子模块,用于对用户输入语句进行中文分词处理,得到词序列;
第一句类分析子模块,用于根据所述词序列中包含的句类特征词确定用户输入语句的类别,并将句类特征词及停用词从所述词序列中删除,得到用户输入语句的关键词序列。
较佳的,所述查询模块具体包括:
匹配处理子模块,用于从问答语句库中查找与用户输入语句类别相同的关键词序列,将用户输入语句的关键词序列与所述查找到的关键词序列进行匹配,若匹配成功,则将匹配成功的关键词序列对应的应答语句发送给结果反馈子模块,否则,随机选择一个与用户输入语句的类别相对应的缺省应答语句发送给结果反馈子模块;
结果反馈子模块,用于将匹配处理子模块发出的应答语句返回给用户。
较佳的,还包括:
管理员语句分析模块,用于确定管理员输入的问答语句对中的问题语句的类别及关键词序列;
更新模块,用于查找问答语句库中是否存在与所述问题语句类别相同的关键词序列,若存在,则将该问答语句对中的应答语句添加到问答语句库中,与查找到的关键词序列关联保存,否则,将所述问题语句的关键词序列、类别与应答语句对中的应答语句关联保存到问答语句库中。
较佳的,所述管理员语句分析模块具体包括:
第二分词子模块,用于对管理员输入的问题语句进行中文分词处理,得到词序列;
第二句类分析子模块,用于根据所述词序列中包含的句类特征词确定管理员输入的问题语句的类别,并将句类特征词及停用词从所述词序列中删除,得到管理员输入的问题语句的关键词序列。
本发明有益效果如下:
本发明技术方案在对用户输入的中文问题语句进行自动应答处理时,通过确定出用户输入的中文问题语句的类别及关键词序列,然后在问答语句库中查找与用户输入语句类别相同的问题语句的关键词序列,将用户输入语句的关键词序列与所述查找到的关键词序列进行匹配,将其中匹配成功的关键词序列对应的应答语句返回给用户,从而消除了由于中文句法灵活而导致的用户输入的问题语句与问答语句库中的问题语句之间的不匹配,提高了问答语句库的内容覆盖面,减少了建库的工作量,同时显著的提高了中文自动应答系统的准确率及召回率。
附图说明
图1为本发明中文自动应答方法的实施例的流程图;
图2为本发明中对问答语句库中存储的内容进行更新的流程图;
图3为本发明中文自动应答系统的结构框图。
具体实施方式
本发明技术方案的主要设计构思是针对现有的中文自动应答系统采用模式匹配技术实现中文自动应答时,建立中文问答语句库的工作量巨大且覆盖面窄的问题,而提出一种能够减小建立中文问答语句库的工作量,并且显著提高问答语句库的内容覆盖面的解决方案,该方案首先确定出用户输入的中文语句的类别及关键词序列,然后在问答语句库中查找与用户输入语句类别相同的问题语句的关键词序列,将用户输入语句的关键词序列与所述查找到的关键词序列进行匹配,将其中匹配成功的关键词序列对应的应答语句返回给用户。从而消除了由于中文句法灵活而导致的用户输入的问题语句与问答语句库中的问题语句之间的不匹配,提高了问答语句库的内容覆盖面,减少了建库的工作量,同时显著的提高了中文自动应答系统的准确率及召回率。
下面将结合各个附图对本发明技术方案的具体实施过程进行进一步详细的阐述。
请参阅图1,该图为本发明中文自动应答方法的实施例的流程图,其主要实现过程为:
步骤S10、用户向自动应答系统输入中文问题语句。
步骤S11,自动应答系统利用预设的词库对用户输入的中文问题语句进行分词处理,得到词序列。
下面举例说明自动应答系统对用户输入的中文问题语句进行中文分词处理的具体过程:
1)对用户输入的中文问题语句进行原子切分,将其中每一个原子标注为一个切分单元,所述原子为分词的最小单位,典型的一个汉字就是一个原子,一个连续的半角字符串也是一个原子;
2)对切分词图中的原子序列进行遍历,根据所述预设词库中包含的词汇,查找该原子序列中包含的在词库中出现过的词,将其标注为切分单元;
3)根据切分单元的标注结果确定出该问题语句的概率最大的分词路径,得到相应的词序列。
步骤S12、自动应答系统根据所述词序列中包含的句类特征词确定出用户输入的中文问题语句的类别,将句类特征词及停用词从所述词序列中删除,余下的词序列为用户输入的中文问题语句的关键词序列。
其中,所述句类特征词是句子类别的标志词,根据预先定义的句类特征词可对用户输入的中文问题语句的类别进行判定;所述停用词为对句子的句义贡献很小的词。
步骤S13、自动应答系统从问答语句库中查找与用户输入的中文问题语句类别相同的关键词序列。
所述问答语句库用于存储已定义的问答语句对,所述问答语句对由管理员输入的问题语句的关键词序列、类别及相应的应答语句构成。
步骤S14、自动应答系统将用户输入的问题语句的关键词序列中的第一个关键词做为匹配依据,将上述步骤S13中查找到的关键词序列做为结果集合。
步骤S15、自动应答系统将做为匹配依据的关键词与结果集合中各关键词序列的相应位置的内容分别进行匹配,将其中匹配不成功的关键词序列从结果集合中剔除。
自动应答系统进行匹配处理的具体过程如下:
按照做为匹配依据的关键词在用户输入语句的关键词序列中的位置,查找结果集合中各关键词序列在该位置的内容,若该位置的内容为任意词通配符或者与做为匹配依据的关键词相同,则本次匹配成功。
步骤S16、自动应答系统判断所述结果集合中是否有剩余的关键词序列,若是,执行步骤S18,否则,执行步骤S17。
步骤S17、随机选择一个与用户输入语句的类别相对应的缺省应答语句,并返回给用户,流程结束。
步骤S18、自动应答系统判断用户输入语句的关键词序列中是否存在下一个关键词,若存在,执行步骤S19,否则,执行步骤S20。
步骤S19、将用户输入语句的关键词序列中的下一个关键词做为匹配依据,返回步骤S15。
步骤S20、自动应答系统将结果集合中的关键词序列对应的应答语句返回给用户,流程结束。
本发明中,问答语句库用于存储已定义的问答语句对,所述问答语句对由管理员输入的问题语句的关键词序列、类别及相应的应答语句构成。请参阅图2,该图为本发明中对问答语句库中存储的内容进行更新的流程图,其主要实现过程为:
步骤S30、管理员向自动应答系统输入中文问答语句对。
步骤S31、自动应答系统利用预设词库对管理员输入的问答语句对中的问题语句进行中文分词处理,得到词序列。
步骤S32、自动应答系统根据所述词序列中包含的句类特征词确定管理员输入的问题语句的类别,将句类特征词及停用词从词序列中删除,余下的词序列为管理员输入的问题语句的关键词序列。
若管理员输入的问题语句中包含有任意词通配符,则该问题语句的关键词序列中包含有任意词通配符。
步骤S33、自动应答系统判断问答语句库中是否存在与管理员输入的问题语句类别相同的关键词序列,若存在,执行步骤S34,否则,执行步骤S35。
步骤S34、自动应答系统将管理员输入的问答语句对中的应答语句添加到问答语句库中,与查找到的关键词序列关联保存。
步骤S35、自动应答系统将所述问题语句的关键词序列、类别与管理员输入的应答语句关联保存到问答语句库中。
相应于本发明上述中文自动应答方法,本发明进而提出了一种中文自动应答系统,请参阅图3,该图为本发明中文自动应答系统的结构框图,其主要包括用户语句分析模块30和查询模块40,其中各组成模块的主要作用如下:
用户语句分析模块30,用于确定用户输入的中文问题语句的类别及关键词序列;
查询模块40,用于从问答语句库中查找与用户输入的中文问题语句类别相同的关键词序列,将用户输入的中文问题语句的关键词序列与所述查找到的关键词序列进行匹配,将其中匹配成功的关键词序列对应的应答语句返回给用户。
所述用户语句分析模块30具体包括第一分词子模块301和第一句类分析子模块302,其中各子模块的主要作用如下:
第一分词子模块301,用于利用预设词库对用户输入的中文问题语句进行中文分词处理,得到词序列,将其输出给第一句类分析子模块302;
第一句类分析子模块302,用于根据所述词序列中包含的句类特征词确定用户输入的中文问题语句的类别,并将句类特征词及停用词从所述词序列中删除,得到用户输入的中文问题语句的关键词序列。
所述查询模块40具体包括匹配处理子模块401和结果反馈子模块402,其中各子模块的主要作用如下:
匹配处理子模块401,用于从问答语句库中查找与用户输入语句类别相同的关键词序列,将用户输入语句的关键词序列与所述查找到的关键词序列进行匹配,若匹配成功,则将匹配成功的关键词序列对应的应答语句发送给结果反馈子模块402,否则,随机选择一个与用户输入语句的类别相对应的缺省应答语句发送给结果反馈子模块402;
所述匹配处理子模块401将用户输入的中文问题语句的关键词序列与所述查找到的关键词序列进行匹配的具体步骤如下:
1)将用户输入的问题语句的关键词序列中的第一个关键词做为匹配依据,将所述查找到的与用户输入的中文问题语句类别相同的关键词序列做为结果集合;
2)将做为匹配依据的关键词与当前结果集合中各关键词序列的相应位置的内容分别进行匹配,将其中匹配不成功的关键词序列从结果集合中剔除;
3)判断所述结果集合中是否有剩余的关键词序列,若是,执行步骤4),否则,执行步骤6);
4)判断用户输入的问题语句的关键词序列中是否存在下一个关键词,若存在,将其做为匹配依据,返回步骤2),否则,执行步骤5);
5)将结果集合中的关键词序列对应的应答语句发送给结果反馈子模块402;
6)随机选择一个与用户输入语句的类别相对应的缺省应答语句发送给结果反馈子模块402。
结果反馈子模块402,用于将匹配处理子模块发出的应答语句返回给用户。
本发明中,管理员通过向中文自动应答系统输入问答语句对对问答语句库中存储的内容进行更新,因此本发明中文自动应答系统还包括:
管理员语句分析模块50,用于确定管理员输入的问答语句对中的问题语句的类别及关键词序列;
更新模块60,用于查找问答语句库中是否存在与所述问题语句类别相同的关键词序列,若存在,则将该问答语句对中的应答语句添加到问答语句库中,与查找到的关键词序列关联保存,否则,将所述问题语句的关键词序列、类别与应答语句对中的应答语句关联保存到问答语句库中。
所述管理员语句分析模块50具体包括第二分词子模块501和第二句类分析子模块502,其中各个子模块的具体作用如下:
第二分词子模块501,用于对管理员输入的问题语句进行中文分词处理,得到词序列;
第二句类分析子模块502,用于根据所述词序列中包含的句类特征词确定管理员输入的问题语句的类别,并将句类特征词及停用词从所述词序列中删除,得到管理员输入的问题语句的关键词序列。
综上可见,本发明在对用户输入的中文问题语句进行自动应答处理时,通过确定出用户输入的中文问题语句的类别及关键词序列,然后在问答语句库中查找与用户输入语句类别相同的问题语句的关键词序列,将用户输入语句的关键词序列与所述查找到的关键词序列进行匹配,将其中匹配成功的关键词序列对应的应答语句返回给用户,从而消除了由于中文句法灵活而导致的用户输入的问题语句与问答语句库中的问题语句之间的不匹配,提高了问答语句库的内容覆盖面,减少了建库的工作量,同时显著的提高了中文自动应答系统的准确率及召回率。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (12)

1、一种中文自动应答方法,其特征在于,包括步骤:
A、对用户输入语句进行中文分词处理,得到词序列,根据所述词序列中包含的句类特征词确定用户输入语句的类别,将句类特征词及停用词从所述词序列中删除,余下的词序列为用户输入语句的关键词序列,从问答语句库中查找与用户输入语句类别相同的关键词序列;
B、将用户输入语句的关键词序列与所述查找到的关键词序列进行匹配,将其中匹配成功的关键词序列对应的应答语句返回给用户。
2、如权利要求1所述的方法,其特征在于,所述步骤B中,若匹配不成功,则向用户返回缺省应答语句。
3、如权利要求1或2所述的方法,其特征在于,所述步骤B具体包括步骤:
B1、提取用户输入语句的关键词序列中的第一个关键词做为匹配依据,将所述查找到的关键词序列全部添加到结果集合中;
B2、将做为匹配依据的关键词与结果集合中各关键词序列的相应位置的内容分别进行匹配,将其中匹配不成功的关键词序列从结果集合中剔除;
B3、判断所述结果集合中是否有剩余的关键词序列,若是,执行步骤B4,否则,随机选择一个与用户输入语句的类别相对应的缺省应答语句返回给用户;
B4、判断用户输入语句的关键词序列中是否存在下一个关键词,若存在,将其做为匹配依据,返回步骤B2,否则,将当前结果集合中的关键词序列对应的应答语句返回给用户。
4、如权利要求3所述的方法,其特征在于,所述步骤B2中,按照做为匹配依据的关键词在用户输入语句的关键词序列中的位置,查找结果集合中各关键词序列在该位置的内容,若该位置的内容为任意词通配符或者与做为匹配依据的关键词相同,则本次匹配成功。
5、如权利要求1所述的方法,其特征在于,所述问答语句库用于存储已定义的问答语句对,所述问答语句对由管理员输入的问题语句的关键词序列、类别及相应的应答语句构成。
6、如权利要求5所述的方法,其特征在于,利用管理员输入的问答语句对更新问答语句库的过程为:
确定所述问答语句对中的问题语句的类别及关键词序列;
查找问答语句库中是否存在与所述问题语句类别相同的关键词序列,若存在,则将所述问答语句对中的应答语句添加到问答语句库中,与查找到的关键词序列关联保存,否则,将所述问题语句的关键词序列、类别与问答语句对中的应答语句关联保存到问答语句库中。
7、如权利要求6所述的方法,其特征在于,确定所述问答语句对中的问题语句的类别及关键词序列的具体过程为:
对管理员输入的问题语句进行中文分词处理,得到词序列;
根据所述词序列中包含的句类特征词确定所述问题语句的类别,将句类特征词及停用词从所述词序列中删除,余下的词序列为所述问题语句的关键词序列。
8、如权利要求6所述的方法,其特征在于,若管理员输入的问题语句中包含有任意词通配符,则该问题语句的关键词序列中包含有任意词通配符。
9、一种中文自动应答系统,其特征在于,包括:
用户语句分析模块,用于确定用户输入的中文语句的类别及关键词序列;
查询模块,用于从问答语句库中查找与用户输入语句类别相同的关键词序列,将用户输入语句的关键词序列与所述查找到的关键词序列进行匹配,将其中匹配成功的关键词序列对应的应答语句返回给用户;
所述用户语句分析模块具体包括:
第一分词子模块,用于对用户输入语句进行中文分词处理,得到词序列;
第一句类分析子模块,用于根据所述词序列中包含的句类特征词确定用户输入语句的类别,并将句类特征词及停用词从所述词序列中删除,得到用户输入语句的关键词序列。
10、如权利要求9所述的系统,其特征在于,所述查询模块具体包括:
匹配处理子模块,用于从问答语句库中查找与用户输入语句类别相同的关键词序列,将用户输入语句的关键词序列与所述查找到的关键词序列进行匹配,若匹配成功,则将匹配成功的关键词序列对应的应答语句发送给结果反馈子模块,否则,随机选择一个与用户输入语句的类别相对应的缺省应答语句发送给结果反馈子模块;
结果反馈子模块,用于将匹配处理子模块发出的应答语句返回给用户。
11、如权利要求9所述的系统,其特征在于,还包括:
管理员语句分析模块,用于确定管理员输入的问答语句对中的问题语句的类别及关键词序列;
更新模块,用于查找问答语句库中是否存在与所述问题语句类别相同的关键词序列,若存在,则将该问答语句对中的应答语句添加到问答语句库中,与查找到的关键词序列关联保存,否则,将所述问题语句的关键词序列、类别与应答语句对中的应答语句关联保存到问答语句库中。
12、如权利要求11所述的系统,其特征在于,所述管理员语句分析模块具体包括:
第二分词子模块,用于对管理员输入的问题语句进行中文分词处理,得到词序列;
第二句类分析子模块,用于根据所述词序列中包含的句类特征词确定管理员输入的问题语句的类别,并将句类特征词及停用词从所述词序列中删除,得到管理员输入的问题语句的关键词序列。
CNB2006101459852A 2006-11-30 2006-11-30 一种中文自动应答方法及系统 Active CN100565515C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2006101459852A CN100565515C (zh) 2006-11-30 2006-11-30 一种中文自动应答方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2006101459852A CN100565515C (zh) 2006-11-30 2006-11-30 一种中文自动应答方法及系统

Publications (2)

Publication Number Publication Date
CN101178711A CN101178711A (zh) 2008-05-14
CN100565515C true CN100565515C (zh) 2009-12-02

Family

ID=39404969

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2006101459852A Active CN100565515C (zh) 2006-11-30 2006-11-30 一种中文自动应答方法及系统

Country Status (1)

Country Link
CN (1) CN100565515C (zh)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794304B (zh) * 2010-02-10 2016-05-25 深圳先进技术研究院 行业信息服务系统及方法
CN102546456B (zh) * 2010-12-22 2015-04-08 北大方正集团有限公司 一种信息反馈方法及信息反馈装置
CN102289431A (zh) * 2011-06-24 2011-12-21 华南理工大学 一种基于自然语言理解并提供短信回复选项的方法
CN103186616A (zh) * 2011-12-30 2013-07-03 上海博泰悦臻电子设备制造有限公司 车载信息处理系统、云服务中心和车载设备
CN103297389B (zh) * 2012-02-24 2018-09-07 腾讯科技(深圳)有限公司 人机对话方法及装置
CN102831207B (zh) * 2012-08-06 2015-01-28 小米科技有限责任公司 一种计算机终端及其信息交互方法
CN103079008B (zh) * 2013-01-07 2015-05-27 播思通讯技术(北京)有限公司 根据短信内容自动生成回复建议的方法和系统
CN104182059A (zh) * 2013-05-23 2014-12-03 华为技术有限公司 自然语言的生成方法及系统
CN104516921B (zh) * 2013-09-30 2018-02-06 华为技术有限公司 自动回复方法及装置
CN104699708B (zh) * 2013-12-09 2018-01-30 中国移动通信集团北京有限公司 一种客服机器人的自学习方法及装置
CN104679815B (zh) * 2014-12-08 2018-02-23 北京云知声信息技术有限公司 一种筛选问答对并实时更新问答库的方法及系统
CN104834704A (zh) * 2015-04-29 2015-08-12 深圳市梦网科技股份有限公司 应答方法及系统
CN105279274B (zh) * 2015-10-30 2018-11-02 北京京东尚科信息技术有限公司 基于自然语义问答系统的答案合成与匹配的方法和系统
CN105574128A (zh) * 2015-12-12 2016-05-11 天津南大通用数据技术股份有限公司 商业智能系统数据完成复杂运算的方法
CN105630917A (zh) * 2015-12-22 2016-06-01 成都小多科技有限公司 智能应答方法及装置
CN106021463B (zh) 2016-05-17 2019-07-09 北京百度网讯科技有限公司 基于人工智能提供智能服务的方法、智能服务系统及智能终端
CN106056220A (zh) * 2016-05-27 2016-10-26 大连楼兰科技股份有限公司 汽车养护方向的智能沟通平台
CN106055628A (zh) * 2016-05-27 2016-10-26 大连楼兰科技股份有限公司 汽车养护方向的智能沟通方法、装置、系统及应用
CN106202270B (zh) * 2016-06-28 2020-03-20 广州幽联信息技术有限公司 基于自然语言的人机对话方法及装置
CN106487660A (zh) * 2016-11-04 2017-03-08 广东亿迅科技有限公司 一种统一管理多个信息频道的方法及其系统
CN106503918A (zh) * 2016-11-07 2017-03-15 新乡学院 一种基于计算机集成的物业管理系统
CN107393538A (zh) * 2017-07-26 2017-11-24 上海与德通讯技术有限公司 机器人交互方法及系统
CN108491378B (zh) * 2018-03-08 2021-11-09 国网福建省电力有限公司 电力信息运维智能应答系统
CN109002540B (zh) * 2018-07-23 2021-03-16 电子科技大学 一种中文通告文档问题答案对自动生成方法
CN110059171B (zh) * 2019-04-12 2021-01-01 中国工商银行股份有限公司 智能问答性能提升方法及系统
CN110069614A (zh) * 2019-04-28 2019-07-30 北京车薄荷科技有限公司 一种问答交互方法及装置
CN113297362A (zh) * 2021-05-27 2021-08-24 平安科技(深圳)有限公司 机器人问答方法、装置、计算机设备及存储介质
CN113392335A (zh) * 2021-06-30 2021-09-14 深圳本地宝新媒体技术有限公司 通过社交平台公众号接口进行消息回复的方法及装置
CN114168722B (zh) * 2021-11-23 2022-06-14 安徽经邦软件技术有限公司 基于人工智能技术的财务问答机器人

Also Published As

Publication number Publication date
CN101178711A (zh) 2008-05-14

Similar Documents

Publication Publication Date Title
CN100565515C (zh) 一种中文自动应答方法及系统
CN110647614B (zh) 智能问答方法、装置、介质及电子设备
CN101097573B (zh) 一种自动问答系统及方法
CN106919655B (zh) 一种答案提供方法和装置
CN106708893B (zh) 搜索查询词纠错方法和装置
CN107992585B (zh) 通用标签挖掘方法、装置、服务器及介质
CN106537370B (zh) 在存在来源和翻译错误的情况下对命名实体鲁棒标记的方法和系统
CN101819578B (zh) 检索方法、索引建立方法和装置及检索系统
CN109344230B (zh) 代码库文件生成、代码搜索、联结、优化以及移植方法
CN103678576A (zh) 基于动态语义分析的全文检索系统
CN103491205A (zh) 一种基于视频搜索的关联资源地址的推送方法和装置
CN108932218B (zh) 一种实例扩展方法、装置、设备和介质
CN109933708A (zh) 信息检索方法、装置、存储介质及计算机设备
CN107861753B (zh) App生成索引、检索方法和系统及可读存储介质
CN109522397B (zh) 信息处理方法及装置
CN102339294A (zh) 一种对关键词进行预处理的搜索方法和系统
CN103324626A (zh) 一种建立多粒度词典的方法、分词的方法及其装置
CN107480197B (zh) 实体词识别方法及装置
CN112417875B (zh) 配置信息的更新方法、装置、计算机设备及介质
CN113434767A (zh) Ugc文本内容的挖掘方法、系统、设备和存储介质
CN110008312A (zh) 一种文档写作助手实现方法、系统及电子设备
CN104778232A (zh) 一种基于长查询的搜索结果的优化方法和装置
CN111930911B (zh) 一种快速领域问答方法及其装置
CN103544167A (zh) 一种基于中文检索的逆向分词方法及装置
CN112905752A (zh) 一种智能交互方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160111

Address after: The South Road in Guangdong province Shenzhen city Fiyta building 518057 floor 5-10 Nanshan District high tech Zone

Patentee after: Shenzhen Tencent Computer System Co., Ltd.

Address before: 2, 518044, East 410 room, SEG science and Technology Park, Zhenxing Road, Shenzhen, Guangdong, Futian District

Patentee before: Tencent Technology (Shenzhen) Co., Ltd.