CN105677636A - 智能问答系统的信息处理方法及信息处理装置 - Google Patents

智能问答系统的信息处理方法及信息处理装置 Download PDF

Info

Publication number
CN105677636A
CN105677636A CN201511024918.0A CN201511024918A CN105677636A CN 105677636 A CN105677636 A CN 105677636A CN 201511024918 A CN201511024918 A CN 201511024918A CN 105677636 A CN105677636 A CN 105677636A
Authority
CN
China
Prior art keywords
word
spoken
statement
customer problem
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201511024918.0A
Other languages
English (en)
Inventor
曾永梅
李波
朱频频
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhizhen Intelligent Network Technology Co Ltd
Original Assignee
Shanghai Zhizhen Intelligent Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhizhen Intelligent Network Technology Co Ltd filed Critical Shanghai Zhizhen Intelligent Network Technology Co Ltd
Priority to CN201511024918.0A priority Critical patent/CN105677636A/zh
Publication of CN105677636A publication Critical patent/CN105677636A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Abstract

本发明提供了一种智能问答系统的信息处理方法,该智能问答系统包括标准问数据库,该信息处理方法包括:执行用户问题与该标准问数据库的语义相似度计算以确定该用户问题是否被定位至该标准问数据库中的标准问;响应于该用户问题未被定位至该标准问数据库中的标准问判断该用户问题是否包括口语化表述;响应于该用户问题包括口语化表述对该用户问题进行语句调整;以及用经语句调整后的用户问题执行与该标准问数据库的相似度计算来定位标准问。

Description

智能问答系统的信息处理方法及信息处理装置
技术领域
本发明涉及人机交互技术领域,尤其涉及智能问答系统的信息处理方法及信息处理装置。
背景技术
人机交互是研究系统与用户之间的交互关系的科学。系统可以是各种各样的机器,也可以是计算机化的系统和软件。例如,通过人机交互可以实现各种人工智能系统,例如,智能客服系统、语音控制系统等等。人工智能语义识别是人机交互的基础,其能够对人类语言进行识别,以转换成机器能够理解的语言。
智能问答系统是人机交互的一种典型应用,其中当用户提出问题后,智能问答系统给出该问题的答案。为此,智能问答系统中有一套知识库,里面有大量的问题和与每个问题相对应的答案。智能问答系统首先需要识别用户所提出的问题,即从知识库中找到与该用户问题所对应的问题,然后找出与该问题相匹配的答案。
如何提高智能问答系统的答复正确率是一项重要挑战。
发明内容
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
根据本发明的一方面,提供了一种智能问答系统的信息处理方法,该智能问答系统包括标准问数据库,该信息处理方法包括:
执行用户问题与该标准问数据库的语义相似度计算以确定该用户问题是否被定位至该标准问数据库中的标准问;
响应于该用户问题未被定位至该标准问数据库中的标准问判断该用户问题是否包括口语化表述;
响应于该用户问题包括口语化表述对该用户问题进行语句调整;以及
用经语句调整后的用户问题执行与该标准问数据库的相似度计算来定位标准问。
在一实例中,该判断该用户问题是否包括口语化表述:
对该用户问题分词以得到多个词;
对照口语数据库以查找该用户问题是否包括属于口语化表述的词。
在一实例中,该对用户问题进行语句调整包括:
对该多个词中属于该口语化表述的词进行口语校正处理,该口语校正处理包括词序颠倒、删除、替换中的任意一者或任意组合。
在一实例中,该口语化表述包括词序颠倒的连续两个单字词,该对该多个词进行口语校正处理具体包括:
对该多个词中的词序颠倒的连续两个单字词进行调序处理,以构成一个新词。
在一实例中,该口语化表述包括口语语气词,该对该多个词进行口语校正处理包括:
将介于第一词和第二词之间的口语语气词删除;以及
将该第一词和该第二词组合在一起以构成一个新词。
在一实例中,该口语语气词包括以下一者或多者:的、个、了、一个、一下、下。
在一实例中,该口语化表述包括口语否定词,该对该多个词进行口语校正处理具体包括:
用正式否定词来替换该口语否定词;
将分别位于口语否定词前后的第三词和第四词组合在一起构成一个新词;以及
将该正式否定词放置在所构成的新词之前。
在一实例中,该口语否定词包括以下一者或多者:不了、不上。
根据本发明的另一方面,提供了一种智能问答系统的信息处理装置,该智能问答系统包括标准问数据库,该信息处理装置包括:
语义相似度计算模块,用于执行用户问题与该标准问数据库的语义相似度计算以确定该用户问题是否被定位至该标准问数据库中的标准问;
口语判断模块,用于响应于该用户问题未被定位至该标准问数据库中的标准问判断该用户问题是否包括口语化表述;以及
语句调整模块,用于响应于该用户问题包括口语化表述对该用户问题进行语句调整,
其中该语义相似度计算模块还用经语句调整后的用户问题执行与该标准问数据库的相似度计算来定位标准问。
在一实例中,该口语判断模块包括:
分词模块,用于对该用户问题分词以得到多个词;以及
查找模块,用于对照口语数据库以查找该用户问题是否包括属于口语化表述的词。
在一实例中,该语句调整模块包括:
口语校正模块,用于对该多个词中属于该口语化表述的词进行口语校正处理,该口语校正处理包括词序颠倒、删除、替换中的任意一者或任意组合。
在一实例中,该口语化表述包括词序颠倒的连续两个单字词,该口语校正模块包括:
词序编辑模块,用于对该多个词中的词序颠倒的连续两个单字词进行调序处理,以构成一个新词。
在一实例中,该口语化表述包括口语语气词,该口语校正模块包括:
删除模块,用于将介于第一词和第二词之间的口语语气词删除;以及
重组模块,用于将该第一词和该第二词组合在一起以构成一个新词。
在一实例中,该口语化表述包括口语否定词,该口语校正模块包括:
替换模块,用于用正式否定词来替换该口语否定词;
重组模块,用于将分别位于口语否定词前后的第三词和第四词组合在一起构成一个新词;以及
词序编辑模块,用于将该正式否定词放置在所构成的新词之前。
由于用户问题经过了调整,那些包括口语化表述以致无法识别的用户问题就可以精确定位至对应的标准问,从而可以极大地提高智能问答系统的答复正确率,并且可以加快知识运维效率,降低知识运维的人工成本。
附图说明
在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本发明的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。
图1是示出了根据本发明的一方面的智能问答系统的信息处理方法的流程图;以及
图2是示出了根据本发明的一方面的智能问答系统的信息处理装置的框图。
具体实施方式
以下结合附图和具体实施例对本发明作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本发明的保护范围进行任何限制。
知识库中的基本知识点最原始和最简单的形式就是平时常用的FAQ,一般的形式是“问-答”对。在本发明中,“标准问”是用来表示某个知识点的文字,主要目标是表达清晰,便于维护。例如,“彩铃的资费”就是表达清晰的标准问描述。这里的“问”不应被狭义地理解为“询问”,而应广义地来理解一“输入”,该“输入”具有对应的“输出”。例如,对于用于控制系统的语义识别而言,用户的一个指令,例如“打开收音机”也应可以被理解为是一个“问”,此时对应的“答”可以是用于执行相应控制的控制程序的调用。
用户在向机器输入时,最理想的情况是使用标准问,则机器的智能语义识别系统马上能够理解用户的意思。但是,往往用户使用的问题与标准问有一定差异。因此,实践中,会对用户问题与标准问执行语义相似度计算,只要语义相似度达到一定程度,则认为用户所问的问题即对应该标准问,从而提供与该标准问对应的答案。
由于标准问一般是比较正式规范的问句,因此当用户提出的问题采用比较规范的表述时,比较容易定位到该用户问题所对应的标准问。然而当用户采用非常口语化的问句时,可能难以定位该用户问题所对应的标准问。
在本发明中,可以对用户的口语化的用户问题进行适当调整,将口语化的用户问题调整为比较规范的问句,从而大大提高了定位该用户问题所对应的标准问的成功率。
图1是示出了根据本发明的一方面的智能问答系统的信息处理方法100的流程图,智能问答系统包括标准问数据库。
在步骤102,执行用户问题与标准问数据库的语义相似度计算以确定该用户问题是否被定位至标准问数据库中的标准问。
该语义相似度计算可以采用任何常用的语义相似度算法。例如,可采用文本聚类分析、LDA分析或序列分析中的任一者或任意组合来执行该语义相似度计算。
然后,找出与该用户问题具有最高语义相似度的标准问,若该最高的语义相似度高于预设阈值,例如0.9,则认为定位到了与该用户问题相匹配的对应标准问。反之,若小于该预设阈值,则视为定位失败,未找到与该用户问题匹配的对应标准问。
在步骤104,响应于该用户问题未被定位至标准问数据库中的标准问判断该用户问题是否包括口语化表述。
若该用户问题未被定位至标准问数据库中的标准问,则判断该用户问题是否包括口语化表述。
在一实例中,该判断过程可包括分词步骤,在分词步骤中对用户问题分词以得到多个词。例如:
用户问题:“拍个照要多少钱”
分词为:拍个照要多少钱
用户问题:“中了奖如何领”
分词为:中了奖如何领
用户问题:开一下门
分词为:开一下门
用户问题:款付了吗
分词为:款付了吗
用户问题:什么时候发的货
分词为:什么时候发的货
用户问题:电脑怎么开不了机
分词为:电脑怎么开不了机
用户问题:手机怎么充不上电
分词为:手机怎么充不上电
然后,对照口语数据库以查找该用户问题是否包括属于口语化表述的词,若包括属于口语化表述的词,则该用户问题包括口语化表述。
在一实例中,口语化表述可包括例如词序颠倒的连续两个单字词,如“款付”。在另一实例中,口语化表述可包括口语语气词,例如“个”,“了”、“的”、“一个”、“一下”、“下”等。在再一实例中,口语化表述可包括口语否定词,例如“不了”、“不上”等。
在步骤106,响应于用户问题包括口语化表述对用户问题进行语句调整。
在一实例中,可对该多个词中属于口语化表述的词进行口语校正处理,口语校正处理包括词序颠倒、删除、替换中的任意一者或任意组合。
在口语化表述包括词序颠倒的连续两个单字词的实例中,可对这多个词中的词序颠倒的连续两个单字词进行调序处理,以构成一个新词。例如:
用户问题:款付了吗
分词为:款付了吗
调整后为:付款了吗
在口语化表述包括口语语气词的实例中,可将介于第一词和第二词之间的口语语气词删除,然后将第一词和第二词组合在一起以构成一个新词。例如:
用户问题:“拍个照要多少钱”
分词为:拍个照要多少钱
调整后为:拍照要多少钱
用户问题:开一下门
分词为:开一下门
调整后为:开门
用户问题:“中了奖如何领”
分词为:中了奖如何领
调整后为:中奖如何领
用户问题:什么时候发的货
分词为:什么时候发的货
调整后为:什么时候发货
在口语化表述包括口语否定词的实例中,可用正式否定词来替换口语否定词,然后将分别位于口语否定词前后的第三词和第四词组合在一起构成一个新词,最后将所述正式否定词放置在所构成的新词之前。例如:
用户问题:电脑怎么开不了机
分词为:电脑怎么开不了机
其中的“不了”为口语否定词,因此可以用正式否定词例如“无法”来替换它。
因此,最后调整后为:电脑怎么无法开机。
用户问题:手机怎么充不上电
分词为:手机怎么充不上电
其中的“不上”为口语否定词,因此可以用正式否定词例如“不能”来替换它。
因此,最后调整后为:手机怎么不能充电。
在步骤108,可用经语句调整后的用户问题执行与标准问数据库的相似度计算来定位标准问。
由于用户问题经过了调整,那些包括口语化表述以致无法识别的用户问题就可以精确定位至对应的标准问,从而可以极大地提高智能问答系统的答复正确率,并且可以加快知识运维效率,降低知识运维的人工成本。尽管为使解释简单化将上述方法图示并描述为一系列动作,但是应理解并领会,这些方法不受动作的次序所限,因为根据一个或多个实施例,一些动作可按不同次序发生和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他动作并发地发生。
图2是示出了根据本发明的一方面的智能问答系统的信息处理装置200的框图,智能问答系统包括标准问数据库。
信息处理装置200可包括语义相似度计算模块202、口语判断模块204、语句调制模块206。
语义相似度计算模块202可执行用户问题与标准问数据库的语义相似度计算以确定该用户问题是否被定位至标准问数据库中的标准问。
该语义相似度计算模块202可以采用任何常用的语义相似度算法。例如,可采用文本聚类分析、LDA分析或序列分析中的任一者或任意组合来执行该语义相似度计算。
然后,找出与该用户问题具有最高语义相似度的标准问,若该最高的语义相似度高于预设阈值,例如0.9,则认为定位到了与该用户问题相匹配的对应标准问。反之,若小于该预设阈值,则视为定位失败,未找到与该用户问题匹配的对应标准问。
口语判断模块204可响应于该用户问题未被定位至标准问数据库中的标准问判断该用户问题是否包括口语化表述。
若该用户问题未被定位至标准问数据库中的标准问,则口语判断模块204判断该用户问题是否包括口语化表述。
在一实例中,该判断模块204可包括分词模块和查找模块(图中未示出)。分词模块可在分词步骤中对用户问题分词以得到多个词。例如:
用户问题:“拍个照要多少钱”
分词为:拍个照要多少钱
用户问题:“中了奖如何领”
分词为:中了奖如何领
用户问题:开一下门
分词为:开一下门
用户问题:款付了吗
分词为:款付了吗
用户问题:什么时候发的货
分词为:什么时候发的货
用户问题:电脑怎么开不了机
分词为:电脑怎么开不了机
用户问题:手机怎么充不上电
分词为:手机怎么充不上电
然后,查找模块可对照口语数据库以查找该用户问题是否包括属于口语化表述的词,若包括属于口语化表述的词,则该用户问题包括口语化表述。
在一实例中,口语化表述可包括例如词序颠倒的连续两个单字词,如“款付”。在另一实例中,口语化表述可包括口语语气词,例如“个”,“了”、“的”、“一个”、“一下”、“下”等。在再一实例中,口语化表述可包括口语否定词,例如“不了”、“不上”等。
语句调整模块206可响应于用户问题包括口语化表述对用户问题进行语句调整。
在一实例中,语句调整模块206可包括口语校正模块2061,该口语校正模块2061可对该多个词中属于口语化表述的词进行口语校正处理,口语校正处理包括词序颠倒、删除、替换中的任意一者或任意组合。
在一实例中,该口语校正模块可包括词序编辑模块(图中未示出),以在口语化表述包括词序颠倒的连续两个单字词的实例中,可对这多个词中的词序颠倒的连续两个单字词进行调序处理,以构成一个新词。例如:
用户问题:款付了吗
分词为:款付了吗
调整后为:付款了吗
用户问题:开一下门
分词为:开一下门
调整后为:开门
在另一实例中,该口语校正模块可包括删除模块和重组模块(图中未示出)。在口语化表述包括口语语气词的实例中,删除模块可将介于第一词和第二词之间的口语语气词删除,然后重组模块可将第一词和第二词组合在一起以构成一个新词。例如:
用户问题:“拍个照要多少钱”
分词为:拍个照要多少钱
调整后为:拍照要多少钱
用户问题:“中了奖如何领”
分词为:中了奖如何领
调整后为:中奖如何领
用户问题:什么时候发的货
分词为:什么时候发的货
调整后为:什么时候发货
在再一实例中,该口语校正模块可包括替换模块、重组模块和词序编辑模块(图中未示出)。在口语化表述包括口语否定词的实例中,替换模块可用正式否定词来替换口语否定词,然后重组模块可将分别位于口语否定词前后的第三词和第四词组合在一起构成一个新词,最后词序编辑模块可将该正式否定词放置在所构成的新词之前。例如:
用户问题:电脑怎么开不了机
分词为:电脑怎么开不了机
其中的“不了”为口语否定词,因此可以用正式否定词例如“无法”来替换它。
因此,最后调整后为:电脑怎么无法开机。用户问题:手机怎么充不上电
分词为:手机怎么充不上电
其中的“不上”为口语否定词,因此可以用正式否定词例如“不能”来替换它。
因此,最后调整后为:手机怎么不能充电。
经过调整后,语义相似度计算模块202可用经语句调整后的用户问题执行与标准问数据库的相似度计算来定位标准问。
由于用户问题经过了调整,那些包括口语化表述以致无法识别的用户问题就可以精确定位至对应的标准问,从而可以极大地提高智能问答系统的答复正确率,并且可以加快知识运维效率,降低知识运维的人工成本。本领域技术人员将进一步领会,结合本文中所公开的实施例来描述的各种解说性逻辑板块、模块、电路、和算法步骤可实现为电子硬件、计算机软件、或这两者的组合。为清楚地解说硬件与软件的这一可互换性,各种解说性组件、框、模块、电路、和步骤在上面是以其功能性的形式作一般化描述的。此类功能性是被实现为硬件还是软件取决于具体应用和施加于整体系统的设计约束。技术人员对于每种特定应用可用不同的方式来实现所描述的功能性,但这样的实现决策不应被解读成导致脱离了本发明的范围。
软件应当被宽泛地解释成意味着指令、指令集、代码、代码段、程序代码、程序、子程序、软件模块、应用、软件应用、软件包、例程、子例程、对象、可执行件、执行的线程、规程、函数等,无论其是用软件、固件、中间件、微代码、硬件描述语言、还是其它术语来述及皆是如此。
结合本文所公开的实施例描述的各种解说性逻辑板块、模块、和电路可用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如DSP与微处理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其他此类配置。
结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取和写入信息。
提供对本公开的先前描述是为使得本领域任何技术人员皆能够制作或使用本公开。对本公开的各种修改对本领域技术人员来说都将是显而易见的,且本文中所定义的普适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此,本公开并非旨在被限定于本文中所描述的示例和设计,而是应被授予与本文中所公开的原理和新颖性特征相一致的最广范围。

Claims (14)

1.一种智能问答系统的信息处理方法,所述智能问答系统包括标准问数据库,所述信息处理方法包括:
执行用户问题与所述标准问数据库的语义相似度计算以确定所述用户问题是否被定位至所述标准问数据库中的标准问;
响应于所述用户问题未被定位至所述标准问数据库中的标准问判断所述用户问题是否包括口语化表述;
响应于所述用户问题包括口语化表述对所述用户问题进行语句调整;以及
用经语句调整后的用户问题执行与所述标准问数据库的相似度计算来定位标准问。
2.如权利要求1所述的信息处理方法,其特征在于,所述判断所述用户问题是否包括口语化表述:
对所述用户问题分词以得到多个词;
对照口语数据库以查找所述用户问题是否包括属于口语化表述的词。
3.如权利要求2所述的信息处理方法,其特征在于,所述对用户问题进行语句调整包括:
对所述多个词中属于所述口语化表述的词进行口语校正处理,所述口语校正处理包括词序颠倒、删除、替换中的任意一者或任意组合。
4.如权利要求3所述的信息处理方法,其特征在于,所述口语化表述包括词序颠倒的连续两个单字词,所述对所述多个词进行口语校正处理具体包括:
对所述多个词中的词序颠倒的连续两个单字词进行调序处理,以构成一个新词。
5.如权利要求3所述的信息处理方法,其特征在于,所述口语化表述包括口语语气词,所述对所述多个词进行口语校正处理包括:
将介于第一词和第二词之间的口语语气词删除;以及
将所述第一词和所述第二词组合在一起以构成一个新词。
6.如权利要求5所述的信息处理方法,其特征在于,所述口语语气词包括以下一者或多者:的、个、了、一个、一下、下。
7.如权利要求3所述的信息处理方法,其特征在于,所述口语化表述包括口语否定词,所述对所述多个词进行口语校正处理具体包括:
用正式否定词来替换所述口语否定词;
将分别位于口语否定词前后的第三词和第四词组合在一起构成一个新词;以及
将所述正式否定词放置在所构成的新词之前。
8.如权利要求7所述的信息处理方法,其特征在于,所述口语否定词包括以下一者或多者:不了、不上。
9.一种智能问答系统的信息处理装置,所述智能问答系统包括标准问数据库,所述信息处理装置包括:
语义相似度计算模块,用于执行用户问题与所述标准问数据库的语义相似度计算以确定所述用户问题是否被定位至所述标准问数据库中的标准问;
口语判断模块,用于响应于所述用户问题未被定位至所述标准问数据库中的标准问判断所述用户问题是否包括口语化表述;以及
语句调整模块,用于响应于所述用户问题包括口语化表述对所述用户问题进行语句调整,
其中所述语义相似度计算模块还用经语句调整后的用户问题执行与所述标准问数据库的相似度计算来定位标准问。
10.如权利要求9所述的信息处理装置,其特征在于,所述口语判断模块包括:
分词模块,用于对所述用户问题分词以得到多个词;以及
查找模块,用于对照口语数据库以查找所述用户问题是否包括属于口语化表述的词。
11.如权利要求10所述的信息处理装置,其特征在于,所述语句调整模块包括:
口语校正模块,用于对所述多个词中属于所述口语化表述的词进行口语校正处理,所述口语校正处理包括词序颠倒、删除、替换中的任意一者或任意组合。
12.如权利要求11所述的信息处理装置,其特征在于,所述口语化表述包括词序颠倒的连续两个单字词,所述口语校正模块包括:
词序编辑模块,用于对所述多个词中的词序颠倒的连续两个单字词进行调序处理,以构成一个新词。
13.如权利要求11所述的信息处理装置,其特征在于,所述口语化表述包括口语语气词,所述口语校正模块包括:
删除模块,用于将介于第一词和第二词之间的口语语气词删除;以及
重组模块,用于将所述第一词和所述第二词组合在一起以构成一个新词。
14.如权利要求11所述的信息处理装置,其特征在于,所述口语化表述包括口语否定词,所述口语校正模块包括:
替换模块,用于用正式否定词来替换所述口语否定词;
重组模块,用于将分别位于口语否定词前后的第三词和第四词组合在一起构成一个新词;以及
词序编辑模块,用于将所述正式否定词放置在所构成的新词之前。
CN201511024918.0A 2015-12-30 2015-12-30 智能问答系统的信息处理方法及信息处理装置 Pending CN105677636A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511024918.0A CN105677636A (zh) 2015-12-30 2015-12-30 智能问答系统的信息处理方法及信息处理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511024918.0A CN105677636A (zh) 2015-12-30 2015-12-30 智能问答系统的信息处理方法及信息处理装置

Publications (1)

Publication Number Publication Date
CN105677636A true CN105677636A (zh) 2016-06-15

Family

ID=56298212

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511024918.0A Pending CN105677636A (zh) 2015-12-30 2015-12-30 智能问答系统的信息处理方法及信息处理装置

Country Status (1)

Country Link
CN (1) CN105677636A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528759A (zh) * 2016-11-04 2017-03-22 上海智臻智能网络科技股份有限公司 智能问答系统的信息处理方法及装置
CN109063004A (zh) * 2018-07-09 2018-12-21 深圳追科技有限公司 一种自动生成faq相似问句的方法和装置
CN109783506A (zh) * 2018-12-05 2019-05-21 北京国电通网络技术有限公司 一种智能问答系统的口语语意理解方法、装置和电子设备
CN109871437A (zh) * 2018-11-30 2019-06-11 阿里巴巴集团控股有限公司 用于用户问题语句处理的方法及装置
CN110019732A (zh) * 2017-12-27 2019-07-16 杭州华为数字技术有限公司 一种智能问答方法以及相关装置
CN110809095A (zh) * 2019-10-25 2020-02-18 大唐网络有限公司 语音外呼的方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079026A (zh) * 2007-07-02 2007-11-28 北京百问百答网络技术有限公司 文本相似度、词义相似度计算方法和系统及应用系统
CN101086843A (zh) * 2006-06-07 2007-12-12 中国科学院自动化研究所 一种应用于语音问答系统中的句子相似度识别方法
WO2009048434A1 (en) * 2007-10-11 2009-04-16 Agency For Science, Technology And Research A dialogue system and a method for executing a fully mixed initiative dialogue (fmid) interaction between a human and a machine
CN101645064A (zh) * 2008-12-16 2010-02-10 中国科学院声学研究所 一种浅层自然口语理解系统及方法
CN102543082A (zh) * 2012-01-19 2012-07-04 北京赛德斯汽车信息技术有限公司 使用自然语言的车载信息服务系统语音操作方法及系统
CN103823799A (zh) * 2012-11-16 2014-05-28 镇江诺尼基智能技术有限公司 新一代行业知识全文检索方法
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101086843A (zh) * 2006-06-07 2007-12-12 中国科学院自动化研究所 一种应用于语音问答系统中的句子相似度识别方法
CN101079026A (zh) * 2007-07-02 2007-11-28 北京百问百答网络技术有限公司 文本相似度、词义相似度计算方法和系统及应用系统
WO2009048434A1 (en) * 2007-10-11 2009-04-16 Agency For Science, Technology And Research A dialogue system and a method for executing a fully mixed initiative dialogue (fmid) interaction between a human and a machine
CN101645064A (zh) * 2008-12-16 2010-02-10 中国科学院声学研究所 一种浅层自然口语理解系统及方法
CN102543082A (zh) * 2012-01-19 2012-07-04 北京赛德斯汽车信息技术有限公司 使用自然语言的车载信息服务系统语音操作方法及系统
CN103823799A (zh) * 2012-11-16 2014-05-28 镇江诺尼基智能技术有限公司 新一代行业知识全文检索方法
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
宗成庆 等: "限定领域汉语口语对话语料分析", 《全国第五界计算语言联合学术会议论文集》 *
翟飞飞,宗成庆: "口语对话中冗余词汇识别方法研究", 《中文信息学报》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528759A (zh) * 2016-11-04 2017-03-22 上海智臻智能网络科技股份有限公司 智能问答系统的信息处理方法及装置
CN106528759B (zh) * 2016-11-04 2019-04-02 上海智臻智能网络科技股份有限公司 智能问答系统的信息处理方法及装置
CN110019732A (zh) * 2017-12-27 2019-07-16 杭州华为数字技术有限公司 一种智能问答方法以及相关装置
CN109063004A (zh) * 2018-07-09 2018-12-21 深圳追科技有限公司 一种自动生成faq相似问句的方法和装置
CN109871437A (zh) * 2018-11-30 2019-06-11 阿里巴巴集团控股有限公司 用于用户问题语句处理的方法及装置
CN109871437B (zh) * 2018-11-30 2023-04-21 阿里巴巴集团控股有限公司 用于用户问题语句处理的方法及装置
CN109783506A (zh) * 2018-12-05 2019-05-21 北京国电通网络技术有限公司 一种智能问答系统的口语语意理解方法、装置和电子设备
CN110809095A (zh) * 2019-10-25 2020-02-18 大唐网络有限公司 语音外呼的方法和装置

Similar Documents

Publication Publication Date Title
CN109871545B (zh) 命名实体识别方法及装置
CN110147726B (zh) 业务质检方法和装置、存储介质及电子装置
CN105677636A (zh) 智能问答系统的信息处理方法及信息处理装置
CN105677783A (zh) 智能问答系统的信息处理方法及装置
US20200251091A1 (en) System and method for defining dialog intents and building zero-shot intent recognition models
CN106649825B (zh) 语音交互系统及其创建方法和装置
WO2018157805A1 (zh) 一种自动问答处理方法及自动问答系统
CN110309283A (zh) 一种智能问答的答案确定方法及装置
CN110399609B (zh) 意图识别方法、装置、设备及计算机可读存储介质
US10803253B2 (en) Method and device for extracting point of interest from natural language sentences
CN110444198B (zh) 检索方法、装置、计算机设备和存储介质
CN108959246A (zh) 基于改进的注意力机制的答案选择方法、装置和电子设备
WO2018214895A1 (zh) 数据处理方法、数据处理装置、存储设备及网络设备
CN109920414A (zh) 人机问答方法、装置、设备和存储介质
TW202020691A (zh) 特徵詞的確定方法、裝置和伺服器
CN112699686B (zh) 基于任务型对话系统的语义理解方法、装置、设备及介质
CN111046667A (zh) 一种语句识别方法、语句识别装置及智能设备
CN109543005A (zh) 客服机器人对话状态识别方法及装置、设备、存储介质
CN106649253A (zh) 基于后验证的辅助控制方法及系统
CN109670148A (zh) 基于语音识别的催收辅助方法、装置、设备和存储介质
CN110717021A (zh) 人工智能面试中获取输入文本和相关装置
CN110046231A (zh) 一种客服信息处理方法、服务器和系统
CN105677637A (zh) 智能问答系统中抽象语义库的更新方法及更新装置
CN110532562B (zh) 神经网络训练方法、成语误用检测方法、装置和电子设备
CN112632248A (zh) 问答方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160615

RJ01 Rejection of invention patent application after publication