CN108763217A - 基于多语义的集外词处理方法、智能问答方法及装置 - Google Patents
基于多语义的集外词处理方法、智能问答方法及装置 Download PDFInfo
- Publication number
- CN108763217A CN108763217A CN201810556386.2A CN201810556386A CN108763217A CN 108763217 A CN108763217 A CN 108763217A CN 201810556386 A CN201810556386 A CN 201810556386A CN 108763217 A CN108763217 A CN 108763217A
- Authority
- CN
- China
- Prior art keywords
- word
- semantic
- semanteme
- collection
- justice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本申请实施例提供了一种基于多语义的集外词处理方法、智能问答方法及装置。所述方法包括:根据集外词在句子中的上下词,获取集外词的每个语义的权重;根据每个语义中义原的词向量,生成每个语义的语义向量;根据每个语义的权重,对每个语义的语义向量加权求和,生成仿真词向量。本申请提供的技术方案生成的仿真词向量,能够实现在匹配句子句义的同时,兼顾到集外词的其他语义,使仿真词向量所表达的语义更丰富饱满,适应更丰富的语义环境;当仿真词向量用于智能问答系统中时,能够使应答与问题的关联度高,提高应答准确率,并适应更丰富的对话环境,使智能问答系统表现的更智能,极大地提高用户好感度,解决了现有技术中的集外词问题。
Description
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种基于多语义的集外词处理方法、智能问答方法及装置。
背景技术
随着自然语言处理技术的发展,基于自然语言处理技术建立起来的对话系统也得到了广泛的应用,常用的对话系统例如聊天机器人,能够根据用户输入的聊天内容,自动生成相应地应答。
现有技术中,对话系统根据不同的应答方法可分为基于知识库的检索式对话系统和基于深度学习模型的生成式对话系统。其中,基于深度学习模型的对话系统,通过建立一个基于RNN(递归神经网络:Recurrent Neural Networks)的对话模型,并使用该模型进行大量的语料训练,使对话模型能够从问答对中学习到对未知对话的潜在应答模式,从而其回答内容不仅局限于训练语料中已有的知识。
基于深度学习模型的对话系统在进行语料训练和语料应答时,以词向量为操作对象,词向量是对语料中分词的一种数学化的表达形式。词向量在深度学习中的贡献是:通过将两个词向量计算余弦夹角或欧氏距离,能够得到两个分词的距离,两个分词的距离越小,表示两个分词的相似度越高。在对话系统的训练过程中,会根据训练语料生成包含已知分词词向量的词向量空间;在对话系统的应答过程中,根据问题分词的词向量与已知分词的词向量之间的距离,并结合机器学习的算法生成问题的应答内容。
但是,基于语料训练得到的词向量空间对于专业领域的业务术语、方言词汇、外文、组合词的包含能力较差,因此,在问题内容不受限的开放式对话系统中,对话系统经常会遇到集外词(OOV:out-of-vocabulary),是指词向量空间中未包含的分词。当对话系统遇到包含集外词的问题时,其给出应答内容的准确率就会下降,这种情况被称为集外词(OOV)问题。目前,现有技术对集外词问题缺乏有效的解决办法。
发明内容
本申请实施例提供了一种基于多语义的集外词处理方法、智能问答方法及装置,以解决现有技术中存在的问题。
第一方面,本申请实施例提供了一种基于多语义的集外词处理方法,包括:
根据集外词在句子中的上下词,获取集外词的每个语义的权重;所述上下词包括集外词在句子中的至少一个前序分词和至少一个后序分词;
根据每个语义中义原的词向量,生成每个语义的语义向量;
根据每个语义的权重,对每个语义的语义向量加权求和,生成仿真词向量。
第二方面,本申请实施例提供了一种智能问答方法,应用于本申请实施例提供的基于多语义的集外词处理方法,包括:
从未知问题的分词结果中获取集外词;
基于所述集外词的多语义,生成所述集外词的仿真词向量;
根据所述仿真词向量和所述问题中其余分词的词向量,从已训练的问答模型中匹配问题答案。
第三方面,本申请实施例提供了一种基于多语义的集外词处理装置,包括:
语义权重获取单元,用于根据集外词在句子中的上下词,获取集外词的每个语义的权重;所述上下词包括集外词在句子中的至少一个前序分词和至少一个后序分词;
语义向量生成单元,用于根据每个语义中义原的词向量,生成每个语义的语义向量;
仿真词向量生成单元,用于根据每个语义的权重,对每个语义的语义向量加权求和,生成仿真词向量。
第四方面,本申请实施例提供了一种智能问答装置,应用于本申请实施例提供的基于多语义的集外词处理方法,包括:
集外词获取单元,用于从未知问题的分词结果中获取集外词;
集外词处理单元,用于基于所述集外词的多语义,生成所述集外词的仿真词向量;
作答单元,用于根据所述仿真词向量和所述问题中其余分词的词向量,从已训练的问答模型中匹配问题答案。
由以上技术方案可知,本申请实施例提供了一种基于多语义的集外词处理方法、智能问答方法及装置。包括:根据集外词在句子中的上下词,获取集外词的每个语义的权重;所述上下词包括集外词在句子中的至少一个前序分词和至少一个后序分词;根据每个语义中义原的词向量,生成每个语义的语义向量;根据每个语义的权重,对每个语义的语义向量加权求和,生成仿真词向量。本申请提供的技术方案生成的仿真词向量基于集外词的多个语义,并根据集外词与上下词的语义相关性,按照不同的权重融合生成;从而,能够实现在匹配句子句义的同时,兼顾到集外词的其他语义,使仿真词向量所表达的语义更丰富饱满,适应更丰富的语义环境;因此,当本申请实施例生成的仿真词向量用于智能问答系统中时,能够使应答与问题的关联度高,提高应答准确率,并适应更丰富的对话环境,使智能问答系统表现的更智能,极大地提高用户好感度,解决了现有技术中的集外词问题。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例示出的一种基于多语义的集外词处理方法的流程图;
图2为本申请实施例示出的一种基于多语义的集外词处理方法步骤S110的流程图;
图3为本申请实施例示出的一种基于多语义的集外词处理方法步骤S111的流程图;
图4为本申请实施例示出的一种基于多语义的集外词处理方法步骤S112的流程图;
图5为本申请实施例示出的一种基于多语义的集外词处理方法步骤S120的流程图;
图6为本申请实施例示出的一种智能问答方法的流程图;
图7为本申请实施例示出的一种基于多语义的集外词处理装置框图;
图8为本申请实施例示出的一种智能问答装置框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
基于深度学习模型的对话系统在进行语料训练和语料应答时,以词向量为操作对象,词向量是对语料中分词的一种数学化的表达形式。词向量在深度学习中的贡献是:通过将两个词向量计算余弦夹角或欧氏距离,能够得到两个分词的距离,两个分词的距离越小,表示两个分词的相似度越高。
在自然语言处理技术领域,一种词向量是One-Hot Representation型,这种词向量根据分词词典中已知分词的数量来确定词向量的维度,其中,词向量中的每个维度代表分词词典中的一个分词,因此,在one-hot representation型的词向量中,只有一个维度的数值为1,其余维度均为0。由于,在一个分词词典中已知分词的数量通常很多,因此,One-Hot Representation型的词向量维度非常高。但是,高维度的词向量在运用到深度学习领域中时,容易受到维度灾难的困扰,并且,由于这种词向量中每个分词独立拥有一个维度,因此很难反映出两个词之间的相似性,不适用于深度学习模型。
因此,在基于深度学习模型的对话系统中,通常使用的是另一种词向量:Distributed Representation。这种词向量是通过语料训练将每个分词映射成一种固定长度的低维实数向量,将所有Distributed Representation型的词向量放在一起会形成一个词向量空间,在词向量空间中,每个词向量对应词向量空间的一个点,例如,某个词向量为:[0.792,-0.177,-0.107,0.109,…]。在词向量空间中,两个点之间的距离就代表了两个分词之间的相似度,可用两个词向量之间的余弦夹角和欧式距离表示。基于DistributedRepresentation型词向量的特性,本申请中的词向量优选Distributed Representation型。
现有技术中,受语料数量和内容丰富程度的限制,词向量空间对专业领域的业务术语、方言词汇、外文、组合词的包含能力较差,因此,在问题内容不受限的开放式对话系统中,对话系统经常会遇到集外词(OOV:out-of-vocabulary),由于集外词不存在于词向量空间中,当对话系统遇到包含集外词的问题时,无法利用词向量空间进行答案匹配,因此,对包含集外词的问题不能给出应答。
为了解决现有技术中的集外词问题,一种方案是:当用户提出的问题包含集外词时,使用随机生成的方式对集外词生成一个随机词向量,这个随机词向量能够映射到词向量空间中的一个点,然后用这个随机词向量作为集外词的词向量进行词向量的匹配,从而对包含集外词的问题给出应答。这种方案能够解决现有技术的基于深度学习的对话系统中对集外词不能给出应答的问题,但是,由于在这种方案中,集外词的词向量是随机生成,具有不确定性,因此,虽然能够对包含集外词的问题进行应答,但是其应答的内容得不到保证,无应答准确性可言,集外词问题依然没有得到彻底的解决。
实施例一
为了解决现有技术中的集外词问题,本申请实施例提供了一种基于多语义的集外词处理方法,参见图1,为本申请实施例示出的一种基于多语义的集外词处理方法的流程图,所述方法包括以下步骤:
步骤S110,根据集外词在句子中的上下词,获取集外词的每个语义的权重;
集外词通常会包含有多个语义,本申请中,集外词的语义可以从知网(英文名称为HowNet)中获得,知网是一个以汉语和英语的词语所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库。在知网中,义原是最基本的、不易于再分割的意义的最小单位,一个词可以有多个语义,每个语义可以包含多个义原,例如,词的语义及其义原可以用以下形式表示:
其中,每一行列出了一个词的语义和每个语义的义原。其中,在每一行中,第一列表示词本身,第二列表示词的语义的数量,从第二列以后,分别用数字+义原的方式表达出了每个语义中义原的数量和义原的内容。例如:“词”共有6个语义;其中,第1个语义有2个义原:功能词、进展;第2个语义有1个义原:功能词;第3个语义有1个义原:活着;等等。
在句子中,分词的语义是句子句义的组成部分,因此在表达不同句义的句子中,分词的语义是不同的,举个例子,下面列出两个句子:
句子1:我希望生日礼物是一台苹果电脑。
句子2:我喜欢吃苹果。
在上述例子示出的两个句子中,“苹果”的语义显然是不同的;并且在句子中,与目标分词临近的其他分词在语义上会与目标分词相关,共同表达出句子的局部句义。
例如,在句子1中,“苹果”的前后相邻的分词分别为“一台”“电脑”,其中,“苹果电脑”表示的是苹果品牌的电脑,“一台”为“苹果电脑”的计数单位,可见,“一台”“苹果”“电脑”在语义上相关;此外,在句子2中,“吃”作为动词,与句子2中的“苹果”也存在语义上的相关。
基于分词在不同句子中语义不同,以及,句子中相邻分词的语义相关的特点,本申请在步骤S110中,根据集外词在句子中的上下词,获取集外词的每个语义的权重;从而通过权重反映出集外词的每个语义在特定的句子中对句义的贡献程度。
本申请中定义了上下词的概念,上下词包括集外词在句子中的至少一个前序分词和至少一个后序分词,具体为:在句子中以集外词为中心,向句子前远离集外词的方向依次查找至少一个分词,以及,向句子后远离集外词的方向依次查找至少一个分词。
图2为本申请实施例示出的一种基于多语义的集外词处理方法步骤S110的流程图。
在一种可选择的实施方式中,如图2所示,步骤S110包括以下步骤:
步骤S111,获取集外词在句子中的上下词;
本申请中,上下词可以为集外词在句子中一个前序分词和一个后序分词,可以为集外词在句子中的两个前序分词和两个后序分词,也可以为集外词在句子中的多个前序分词和多个后序分词。图3为本申请实施例示出的一种基于多语义的集外词处理方法步骤S111的流程图。
为了从句子中以可遵循的方法定量地获取集外词的上下词,在一种可选择的实施方式中,如图3所示,步骤S111可以包括以下步骤:
步骤S1111,设置用于约束所述上下词数量的取词窗口值C,C为整数且大于或等于1;
本申请实施例中,定义了取值窗口C,取值窗口C用于约束上下词的数量,当句子中位于集外词前方和后方的分词数量均大于C时,上下词的数量为2C。
步骤S1112,根据所述取词窗口值C,从包含所述集外词的句子的分词中获取所述上下词;
其中,所述上下词包括句子中位于所述集外词前序的C个分词和后序的C个分词。
示例地,设置取词窗口值C=1;包含集外词的句子为:我想买一个苹果电脑;句子中的集外词为:苹果。
首先获得句子中的所有分词,即:我想买一个苹果电脑
由于,取词窗口值C=1,因此,上下词为集外词在句子中的前一个分词和后一个分词,即:一个、电脑。
示例地,设置取词窗口值C=2,包含集外词的句子为:我想买一个苹果电脑;句子中的集外词为:苹果。
首先获得句子中的所有分词,即:我想买一个苹果电脑
由于,取词窗口值C=2,因此,上下词为集外词在句子中的前两个分词和后两个分词。但是,在句子中,集外词的后方只有一个分词,对于这种情况,本申请在获取上下词时,如果向前或向后获取到句子的开头或结尾,则停止继续获取。因此,当取词窗口值C=2,从句子中获取的“苹果”的上下词为:想买、一个、电脑。
步骤S112,获取所述上下词与每个语义的第一类距离;
在句子中,上下词与集外词在语义上相关,为了获取上下词与集外词每个语义的相关程度,从而合理地确定集外词每个语义的权重,本申请在步骤S112中,获取上下词和每个语义的第一类距离,其中,第一类距离可以是上下词与语义的余弦距离、欧式距离等。
图4为本申请实施例示出的一种基于多语义的集外词处理方法步骤S112的流程图。
在一种可选择的实施方式中,如图4所示,步骤S112包括以下步骤:
步骤S1121,获取所述上下词的每个分词与每个语义中每个义原的余弦距离;
示例地,“苹果”的语义和义原为:
苹果3 5携带样式值特定牌子电脑能1水果3树水果生殖
取值窗口值C=1时,“苹果”的上下词共包含以下分词:一个、电脑。
获取上下词“一个”与第一个语义中每个义原的余弦距离,以COS(语义,义原)表示,分别为:
COS(一个,携带)、COS(一个,样式值)、COS(一个,样式值)、COS(一个,电脑)、COS(一个,能)
获取上下词“电脑”与第一个语义中每个义原的余弦距离,以COS(语义,义原)表示,分别为:
COS(电脑,携带)、COS(电脑,样式值)、COS(电脑,样式值)、COS(电脑,电脑)、COS(电脑,能)
获取上下词“一个”与第二个语义中每个义原的余弦距离,以COS(语义,义原)表示,分别为:
COS(一个,水果)
获取上下词“电脑”与第二个语义中每个义原的余弦距离,以COS(语义,义原)表示,分别为:
COS(电脑,水果)
获取上下词“一个”与第三个语义中每个义原的余弦距离,以COS(语义,义原)表示,分别为:
COS(一个,树)、COS(一个,水果)、COS(一个,生殖)
获取上下词“电脑”与第三个语义中每个义原的余弦距离,以COS(语义,义原)表示,分别为:
COS(电脑,树)、COS(电脑,水果)、COS(电脑,生殖)
步骤S1122,根据所述余弦距离,获取所述上下词的每个分词与每个语义中所有义原的平均距离;
示例地,以Da表示步骤S1122中的所述平均距离,“苹果”的上下词的数量为2,“苹果”的语义数量为3,因此共能够得到6(2×3)个距离Da:
Da(一个,语义1)=[COS(一个,携带)+COS(一个,样式值)+COS(一个,样式值)+COS(一个,电脑)+COS(一个,能)]÷5
Da(电脑,语义1)=[COS(电脑,携带)+COS(电脑,样式值)+COS(电脑,样式值)+COS(电脑,电脑)+COS(电脑,能)]÷5
Da(一个,语义2)=COS(一个,水果)
Da(电脑,语义2)=COS(电脑,水果)
Da(一个,语义3)=[COS(一个,树)+COS(一个,水果)+COS(一个,生殖)]÷3
Da(电脑,语义3)=[COS(电脑,树)+COS(电脑,水果)+COS(电脑,生殖)]÷3
步骤S1123,根据所述平均距离,获取所述上下词与每个语义的第一类距离。
本申请实施例中,上下词包括多个分词,上下词与每个语义的第一类距离为这些分词与每个语义的距离Da的平均值。
示例地:
上下词与第一个语义的第一类距离D1=[Da(一个,语义1)+Da(电脑,语义1)]÷2
上下词与第二个语义的第一类距离D2=[Da(一个,语义2)+Da(电脑,语义2)]÷2
上下词与第三个语义的第一类距离D3=[Da(一个,语义3)+Da(电脑,语义3)]÷2
步骤S113,根据所述第一类距离,计算每个语义的权重。
本申请中第一类距离是通过余弦距离计算获得,第一类距离的数值越高,表示上下词与语义的相关程度越高,权重也应相应地较高。可见,本申请中,第一类距离的数值与语义权重的数值呈正向相关。
基于正向相关的关系,在一种可选择的实施方式中,集外词的每个语义的权重使用以下公式计算:
其中,n为集外词语义的数量,Wm为集外词第m个语义的权重,Dm为所述上下词与集外词第m个语义的第一类距离,为集外词所有语义的第一类距离的和。
步骤S120,根据每个语义中义原的词向量,生成每个语义的语义向量;
图5为本申请实施例示出的一种基于多语义的集外词处理方法步骤S120的流程图。
在一种可选择的实施方式中,如图5所示,步骤S120包括以下步骤:
步骤S121,获取集外词的每个语义中每个义原的义原词向量;
示例地,集外词“苹果”共有3个语义,在步骤S121中,需要分别获得这3个语义中每个义原的义原词向量,例如:获得语义1中的义原词向量T11~T15、语义2中的义原词向量T21、以及语义3中的义原词向量T31~T33。
步骤S122,根据每个语义中义原的数量,对每个语义中的每个义原设置义原权重;
本申请实施例中,义原权重的大小根据语义中义原的数量确定,义原的数量越多,每个义原分摊到的义原权重就越小,以体现每个义原对语义的贡献程度。
在一种可选择的实施方式中,在每个语义内,所有义原的义原权重可以相同,并使用以下公式获得:
Wp=1/x
其中,Wp为义原权重,x为语义中义原的数量。
示例地,义原词向量T11~T15的义原权重为W1=1/5;
义原词向量T21的义原权重为W2=1;
义原词向量T31~T33的义原权重为W3=1/3。
步骤S123,根据所述义原权重,对每个语义中义原的词向量进行加权求和,生成每个语义的语义向量。
步骤S123对每个语义的语义向量使用以下公式获得:
其中,Ti为第i个语义的语义向量,n为第i个语义中义原的数量,Tij为第i个语义中第j个义原的义原词向量,Wi为第i个语义中第j个义原的义原权重。
示例地,根据步骤S122中得到的集外词“苹果”的第1个语义的义原词向量T11~T15和义原权重W11~W15,计算“苹果”第一个语义的语义向量为:
T1=T11×W11+T12×W12++T13×W13+T14×W14+T15×W15
本申请中,Tij可以为Distributed Representation型的低维向量,例如维数m=50或维数m=100。
步骤S130,根据每个语义的权重,对每个语义的语义向量加权求和,生成仿真词向量。
本申请实施例在步骤S110和步骤S120中,分别获取了集外词的每个语义的权重,以及每个语义的语义向量。在步骤S130中,通过使用语义向量对语义的权重进行加权求和的方式,能够生成一个融合了集外词多语义的仿真词向量。
示例地,根据步骤S110和步骤S120对集外词“苹果”生成的语义向量T1~T3,以及,语义的权重W1~W3,加权求和生成的仿真词向量Tout:
Tout=T1×W1+T2×W2+T3×W3
从上述公式中可以看出,仿真词向量Tout基于集外词的多个语义,并根据集外词与上下词的语义相关性,按照不同的权重融合生成;因此,本申请实施例生成的仿真词向量能够在匹配句子句义的同时,又兼顾到集外词的其他语义,使仿真词向量所表达的语义更丰富饱满,适应更丰富的语义环境;因此,本申请实施例生成的仿真词向量在用于智能问答系统中时,能够使应答与问题的关联度高,提高应答准确率,又能够使智能问答系统适应更丰富的对话环境,使智能问答系统表现的更智能,极大地提高用户好感度,解决了现有技术中的集外词问题。
由以上技术方案可知,本申请实施例提供了一种基于多语义的集外词处理方法,包括:根据集外词在句子中的上下词,获取集外词的每个语义的权重;所述上下词包括集外词在句子中的至少一个前序分词和至少一个后序分词;根据每个语义中义原的词向量,生成每个语义的语义向量;根据每个语义的权重,对每个语义的语义向量加权求和,生成仿真词向量。本申请实施例生成的仿真词向量基于集外词的多个语义,并根据集外词与上下词的语义相关性,按照不同的权重融合生成;能够实现在匹配句子句义的同时,兼顾到集外词的其他语义,使仿真词向量所表达的语义更丰富饱满,适应更丰富的语义环境;因此,当本申请实施例生成的仿真词向量用于智能问答系统中时,能够使应答与问题的关联度高,提高应答准确率,并适应更丰富的对话环境,使智能问答系统表现的更智能,极大地提高用户好感度,解决了现有技术中的集外词问题。
实施例二
本申请实施例提供了一种智能问答方法,其中,应用了本申请实施例一提供的基于多语义的集外词处理方法,图6为本申请实施例示出的一种智能问答方法的流程图,如图6所示,所述方法包括以下步骤:
步骤S210,从未知问题的分词结果中获取集外词;
智能问答系统需要通过训练语料的训练才能具备应答能力,在训练过程中,智能问答系统会根据已知的分词生成用来表达已知分词词向量的词向量空间;当用户向训练后的智能问答系统进行提问时,智能问答系统根据预设的分词切词规则对未知问题进行分词,并根据能够根据分词结果获取到不存在于词向量空间中的集外词。
在智能问答系统中,集外词由于不存在于词向量空间中,因此,无法匹配到对应的词向量,导致智能问答系统在遇到集外词时,无法通过匹配到准确的应答。
步骤S220,基于所述集外词的多语义,生成所述集外词的仿真词向量;
在步骤S220中,使用本申请实施例一提供的基于多语义的集外词处理方法对步骤S210获取到的集外词生成仿真词向量;
步骤S230,根据所述仿真词向量和所述问题中其余分词的词向量,从已训练的问答模型中匹配问题答案。
由以上技术方案可知,本申请实施例提供了一种智能问答方法,包括:从未知问题的分词结果中获取集外词;基于所述集外词的多语义,生成所述集外词的仿真词向量;根据所述仿真词向量和所述问题中其余分词的词向量,从已训练的问答模型中匹配问题答案。本申请实施例提供的智能问答方法,在遇到未知问题中的集外词时,基于集外词的多语义,生成集外词的仿真词向量,在生成仿真词向量的过程中,应用了本申请提供的基于多语义的集外词处理方法,使智能问答系统生成应答时,能够使应答与问题的关联度高,提高应答准确率,并适应更丰富的对话环境,使智能问答系统表现的更智能,极大地提高用户好感度,解决了现有技术中的集外词问题。
实施例三
本申请实施例提供了一种基于多语义的集外词处理装置,图7为本申请实施例示出的一种基于多语义的集外词处理装置框图,如图7所示,所述装置包括:
语义权重获取单元310,用于根据集外词在句子中的上下词,获取集外词的每个语义的权重;
语义向量生成单元320,用于根据每个语义中义原的词向量,生成每个语义的语义向量;
仿真词向量生成单元330,用于根据每个语义的权重,对每个语义的语义向量加权求和,生成仿真词向量。
由以上技术方案可知,本申请实施例提供了一种基于多语义的集外词处理装置,用于根据集外词在句子中的上下词,获取集外词的每个语义的权重;所述上下词包括集外词在句子中的至少一个前序分词和至少一个后序分词;根据每个语义中义原的词向量,生成每个语义的语义向量;根据每个语义的权重,对每个语义的语义向量加权求和,生成仿真词向量。本申请实施例生成的仿真词向量基于集外词的多个语义,并根据集外词与上下词的语义相关性,按照不同的权重融合生成;能够实现在匹配句子句义的同时,兼顾到集外词的其他语义,使仿真词向量所表达的语义更丰富饱满,适应更丰富的语义环境;因此,当本申请实施例生成的仿真词向量用于智能问答系统中时,能够使应答与问题的关联度高,提高应答准确率,并适应更丰富的对话环境,使智能问答系统表现的更智能,极大地提高用户好感度,解决了现有技术中的集外词问题。
实施例四
本申请实施例提供了一种智能问答装置,其中,应用了本申请实施例一提供的基于多语义的集外词处理方法,图8为本申请实施例示出的一种智能问答装置框图,如图8所示,所述装置包括:
集外词获取单元410,用于从未知问题的分词结果中获取集外词;
集外词处理单元420,用于基于所述集外词的多语义,生成所述集外词的仿真词向量;
作答单元430,用于根据所述仿真词向量和所述问题中其余分词的词向量,从已训练的问答模型中匹配问题答案。
由以上技术方案可知,本申请实施例提供了一种智能问答装置,所述装置用于从未知问题的分词结果中获取集外词;基于所述集外词的多语义,生成所述集外词的仿真词向量;根据所述仿真词向量和所述问题中其余分词的词向量,从已训练的问答模型中匹配问题答案。本申请实施例提供的智能问答方法,在遇到未知问题中的集外词时,基于集外词的多语义,生成集外词的仿真词向量,在生成仿真词向量的过程中,应用了本申请提供的基于多语义的集外词处理方法,使智能问答系统生成应答时,能够使应答与问题的关联度高,提高应答准确率,并适应更丰富的对话环境,使智能问答系统表现的更智能,极大地提高用户好感度,解决了现有技术中的集外词问题。
本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
本领域技术人员在考虑说明书及实践这里公开的申请后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
Claims (10)
1.一种基于多语义的集外词处理方法,其特征在于,包括:
根据集外词在句子中的上下词,获取集外词的每个语义的权重;所述上下词包括集外词在句子中的至少一个前序分词和至少一个后序分词;
根据每个语义中义原的词向量,生成每个语义的语义向量;
根据每个语义的权重,对每个语义的语义向量加权求和,生成仿真词向量。
2.根据权利要求1所述的方法,其特征在于,所述根据集外词在句子中的上下词,获取集外词的每个语义的权重的步骤,包括:
获取集外词在句子中的上下词;
获取所述上下词与每个语义的第一类距离;
根据所述第一类距离,计算每个语义的权重。
3.根据权利要求2所述的方法,其特征在于,所述获取上下词与每个语义的第一类距离的步骤,包括:
获取所述上下词的每个分词与每个语义中每个义原的余弦距离;
根据所述余弦距离,获取所述上下词的每个分词与每个语义中所有义原的平均距离;
根据所述平均距离,获取所述上下词与每个语义的第一类距离。
4.根据权利要求2所述的方法,其特征在于,所述根据所述第一类距离,计算每个语义的权重的步骤,使用以下公式:
其中,n为集外词语义的数量,Wm为集外词第m个语义的权重,Dm为所述上下词与集外词第m个语义的第一类距离,为集外词所有语义的第一类距离的和。
5.根据权利要求1所述的方法,其特征在于,所述根据每个语义中义原的词向量,生成每个语义的语义向量的步骤,包括:
获取集外词的每个语义中每个义原的义原词向量;
根据每个语义中义原的数量,对每个语义中的每个义原设置义原权重;
根据所述义原权重,对每个语义中义原的词向量进行加权求和,生成每个语义的语义向量。
6.根据权利要求2所述的方法,其特征在于,所述获取集外词在句子中的上下词的步骤,包括:
设置用于约束所述上下词数量的取词窗口值C,C为整数且大于或等于1;
根据所述取词窗口值C,从包含所述集外词的句子的分词中获取所述上下词;
其中,所述上下词包括句子中位于所述集外词前序的C个分词和后序的C个分词。
7.根据权利要求5所述的方法,其特征在于,
所述根据每个语义中义原的数量,对每个语义中的每个义原设置义原权重,使用以下公式:
Wp=1/x
其中,Wp为义原权重,x为语义中义原的数量。
8.一种智能问答方法,其特征在于,应用于权利要求1-7任一所述的方法,包括:
从未知问题的分词结果中获取集外词;
基于所述集外词的多语义,生成所述集外词的仿真词向量;
根据所述仿真词向量和所述问题中其余分词的词向量,从已训练的问答模型中匹配问题答案。
9.一种基于多语义的集外词处理装置,其特征在于,包括:
语义权重获取单元,用于根据集外词在句子中的上下词,获取集外词的每个语义的权重;所述上下词包括集外词在句子中的至少一个前序分词和至少一个后序分词;
语义向量生成单元,用于根据每个语义中义原的词向量,生成每个语义的语义向量;
仿真词向量生成单元,用于根据每个语义的权重,对每个语义的语义向量加权求和,生成仿真词向量。
10.一种智能问答装置,其特征在于,应用于权利要求1-7任一所述的方法,包括:
集外词获取单元,用于从未知问题的分词结果中获取集外词;
集外词处理单元,用于基于所述集外词的多语义,生成所述集外词的仿真词向量;
作答单元,用于根据所述仿真词向量和所述问题中其余分词的词向量,从已训练的问答模型中匹配问题答案。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810556386.2A CN108763217A (zh) | 2018-06-01 | 2018-06-01 | 基于多语义的集外词处理方法、智能问答方法及装置 |
CN201811498210.2A CN109614618B (zh) | 2018-06-01 | 2018-12-07 | 基于多语义的集外词处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810556386.2A CN108763217A (zh) | 2018-06-01 | 2018-06-01 | 基于多语义的集外词处理方法、智能问答方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108763217A true CN108763217A (zh) | 2018-11-06 |
Family
ID=64001970
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810556386.2A Pending CN108763217A (zh) | 2018-06-01 | 2018-06-01 | 基于多语义的集外词处理方法、智能问答方法及装置 |
CN201811498210.2A Active CN109614618B (zh) | 2018-06-01 | 2018-12-07 | 基于多语义的集外词处理方法及装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811498210.2A Active CN109614618B (zh) | 2018-06-01 | 2018-12-07 | 基于多语义的集外词处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN108763217A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109740162A (zh) * | 2019-01-09 | 2019-05-10 | 安徽省泰岳祥升软件有限公司 | 文本表示方法、装置及介质 |
CN109740163A (zh) * | 2019-01-09 | 2019-05-10 | 安徽省泰岳祥升软件有限公司 | 应用于深度学习模型的语义表示资源生成方法及装置 |
CN110147446A (zh) * | 2019-04-19 | 2019-08-20 | 中国地质大学(武汉) | 一种基于双层attention机制的词嵌入方法、设备及存储设备 |
CN111125333A (zh) * | 2019-06-06 | 2020-05-08 | 北京理工大学 | 一种基于表示学习与多层覆盖机制的生成式知识问答方法 |
CN112036163A (zh) * | 2020-08-28 | 2020-12-04 | 南京航空航天大学 | 电力预案文本序列标注中集外词处理方法 |
US11120214B2 (en) | 2018-06-29 | 2021-09-14 | Alibaba Group Holding Limited | Corpus generating method and apparatus, and human-machine interaction processing method and apparatus |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113486142A (zh) * | 2021-04-16 | 2021-10-08 | 华为技术有限公司 | 一种基于义原的词语语义的预测方法及计算机设备 |
CN113254616B (zh) * | 2021-06-07 | 2021-10-19 | 佰聆数据股份有限公司 | 面向智能问答系统的句向量生成方法及系统 |
CN113468308B (zh) * | 2021-06-30 | 2023-02-10 | 竹间智能科技(上海)有限公司 | 一种对话行为分类方法及装置、电子设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107291783B (zh) * | 2016-04-12 | 2021-04-30 | 芋头科技(杭州)有限公司 | 一种语义匹配方法及智能设备 |
CN107798140B (zh) * | 2017-11-23 | 2020-07-03 | 中科鼎富(北京)科技发展有限公司 | 一种对话系统构建方法、语义受控应答方法及装置 |
CN108038105B (zh) * | 2017-12-22 | 2020-06-05 | 中科鼎富(北京)科技发展有限公司 | 一种对未登录词生成仿真词向量的方法及装置 |
-
2018
- 2018-06-01 CN CN201810556386.2A patent/CN108763217A/zh active Pending
- 2018-12-07 CN CN201811498210.2A patent/CN109614618B/zh active Active
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11120214B2 (en) | 2018-06-29 | 2021-09-14 | Alibaba Group Holding Limited | Corpus generating method and apparatus, and human-machine interaction processing method and apparatus |
CN109740162A (zh) * | 2019-01-09 | 2019-05-10 | 安徽省泰岳祥升软件有限公司 | 文本表示方法、装置及介质 |
CN109740163A (zh) * | 2019-01-09 | 2019-05-10 | 安徽省泰岳祥升软件有限公司 | 应用于深度学习模型的语义表示资源生成方法及装置 |
CN109740162B (zh) * | 2019-01-09 | 2023-07-11 | 安徽省泰岳祥升软件有限公司 | 文本表示方法、装置及介质 |
CN110147446A (zh) * | 2019-04-19 | 2019-08-20 | 中国地质大学(武汉) | 一种基于双层attention机制的词嵌入方法、设备及存储设备 |
CN111125333A (zh) * | 2019-06-06 | 2020-05-08 | 北京理工大学 | 一种基于表示学习与多层覆盖机制的生成式知识问答方法 |
CN111125333B (zh) * | 2019-06-06 | 2022-05-27 | 北京理工大学 | 一种基于表示学习与多层覆盖机制的生成式知识问答方法 |
CN112036163A (zh) * | 2020-08-28 | 2020-12-04 | 南京航空航天大学 | 电力预案文本序列标注中集外词处理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109614618A (zh) | 2019-04-12 |
CN109614618B (zh) | 2023-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108763217A (zh) | 基于多语义的集外词处理方法、智能问答方法及装置 | |
CN110427463B (zh) | 搜索语句响应方法、装置及服务器和存储介质 | |
TW202009749A (zh) | 人機對話方法、裝置、電子設備及電腦可讀媒體 | |
CN110516245A (zh) | 细粒度情感分析方法、装置、计算机设备及存储介质 | |
CN111291549B (zh) | 文本处理方法、装置、存储介质和电子设备 | |
CN110489755A (zh) | 文本生成方法和装置 | |
CN109710916B (zh) | 一种标签提取方法、装置、电子设备及存储介质 | |
CN108846138B (zh) | 一种融合答案信息的问题分类模型构建方法、装置和介质 | |
CN109284502B (zh) | 一种文本相似度计算方法、装置、电子设备及存储介质 | |
CN107832439B (zh) | 多轮状态追踪的方法、系统及终端设备 | |
CN105912527A (zh) | 根据自然语言输出答案的方法、装置及系统 | |
CN110895656B (zh) | 一种文本相似度计算方法、装置、电子设备及存储介质 | |
CN109635294B (zh) | 基于单语义的未登录词处理方法、智能问答方法及装置 | |
CN110245253B (zh) | 一种基于环境信息的语义交互方法及系统 | |
CN105446955A (zh) | 一种自适应的分词方法 | |
CN112749556A (zh) | 多语言模型的训练方法和装置、存储介质和电子设备 | |
CN111897955B (zh) | 基于编解码的评语生成方法、装置、设备和存储介质 | |
CN112231554A (zh) | 一种搜索推荐词生成方法、装置、存储介质和计算机设备 | |
Kowsher et al. | Knowledge-base optimization to reduce the response time of bangla chatbot | |
Volkova et al. | Lightly supervised learning of procedural dialog systems | |
US11507993B2 (en) | Modification of food recipes based on geographic origin of produce | |
CN116662960A (zh) | 通过有限身份信息生成自我介绍的系统、方法及存储介质 | |
CN104090918B (zh) | 一种基于信息量的句子相似度计算方法 | |
WO2023166747A1 (ja) | 学習データ生成装置、学習データ生成方法、及びプログラム | |
CN115809663A (zh) | 习题分析方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20181106 |