CN106326211B - 交互语句的关键词间距离的确定方法和装置 - Google Patents

交互语句的关键词间距离的确定方法和装置 Download PDF

Info

Publication number
CN106326211B
CN106326211B CN201610685770.3A CN201610685770A CN106326211B CN 106326211 B CN106326211 B CN 106326211B CN 201610685770 A CN201610685770 A CN 201610685770A CN 106326211 B CN106326211 B CN 106326211B
Authority
CN
China
Prior art keywords
distance
node
relationship
keyword
knowledge mapping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610685770.3A
Other languages
English (en)
Other versions
CN106326211A (zh
Inventor
胡伟凤
殷腾龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Group Co Ltd
Original Assignee
Hisense Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Group Co Ltd filed Critical Hisense Group Co Ltd
Priority to CN201610685770.3A priority Critical patent/CN106326211B/zh
Publication of CN106326211A publication Critical patent/CN106326211A/zh
Application granted granted Critical
Publication of CN106326211B publication Critical patent/CN106326211B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开揭示了一种交互语句的关键词间距离的确定方法和装置。所述方法包括:获取交互语句中的关键词;确定所述关键词在知识图谱中对应的节点;对所述关键词在知识图谱中对应的节点,确定节点之间的关系和距离;根据所述节点之间的关系,确定所述节点之间的距离权重,其中,所述节点之间的关系的优先级越高,所述节点之间的距离权重越小;根据所述节点之间的距离和距离权重,确定所述关键词之间的距离。这将使得关键词之间的距离是与在知识图谱中对应的节点之间的关系相符的,准确地衡量了关键词之间的距离,提高了关键词之间距离的准确性和业务定位的准确性。

Description

交互语句的关键词间距离的确定方法和装置
技术领域
本公开涉及数据处理技术领域,特别涉及一种交互语句的关键词间距离的确定方法和装置。
背景技术
随着人机交互的快速发展,用户越来越多的通过关键词的查询进入所需要的业务。具体的,关键词查询是通过构建的知识图谱实现的,知识图谱为人机交互中众多领域的查询提供了非常大的便利。例如,通过关键词,用户可以进行与影视内容、音乐内容、天气信息、日期信息、股票信息和百科信息等业务的查询,此时,将通过构建的知识图谱在短时间内准确定位用户意图,并返回结果,以通过此结果进入相应的业务。
现有的知识图谱构建中,每一业务均构建了与之对应的知识图谱。根据关键词在知识图谱的距离,来判别最有可能进入的业务,实现业务定位。
知识图谱包括了代表着相应词汇的节点和边,节点之间通过边进行相互连接,并通过边所对应的词间距离来获得两个节点之间的距离,此距离即为两个节点所分别代表两个词汇的词间距离。
每一条边的词间距离默认为1,对于进行查询的关键词之间,在一业务对应的知识图谱中,关键词之间存在着若干个节点,并通过若干条边连接起来,例如,n条边,则n即为查询的关键词在知识图谱中的距离。
但是,不同业务所对应的知识图谱中,由于建立结构,例如,节点之间的关系各不相同,因此,节点之间实际所对应的量化距离并不一致。现有知识图谱中采用每条边的词间距离默认为1的方式并不能够准确衡量词间距离,进而也是导致了业务定位不准确的问题。
发明内容
为了解决相关技术中存在的节点之间的距离未能够准确衡量,进而导致业务定位不准确的技术问题,本公开提供了一种知识图谱中节点距离的确定方法和装置。
一种交互语句的关键词间距离的确定方法,包括:
获取交互语句中的关键词;
确定所述关键词在知识图谱中对应的节点;
对所述关键词在知识图谱中对应的节点,确定节点之间的关系和距离;
根据所述节点之间的关系,确定所述节点之间的距离权重,其中,所述节点之间的关系的优先级越高,所述节点之间的距离权重越小;
根据所述节点之间的距离和距离权重,确定所述关键词之间的距离。
一种交互语句的关键词间距离的确定装置,包括:
关键词获取模块,用于获取交互语句中的关键词;
第一确定模块,用于确定所述关键词在知识图谱中对应的节点;
第二确定模块,用于对所述关键词在知识图谱中对应的节点,确定节点之间的关系和距离;
距离权重确定模块,用于根据所述节点之间的关系,确定所述节点之间的距离权重,其中,所述节点之间的关系的优先级越高,所述节点之间的距离权重越小;
关键词距离确定模块,用于根据所述节点之间的距离和距离权重,确定所述关键词之间的距离。
本公开的实施例提供的技术方案可以包括以下有益效果:
在交互语句的关键词间距离的确定过程中,首先获取交互语句中的关键词,在知识图谱中确定关键词对应的节点,对关键词在知识图谱中对应的节点,确定节点之间的关系和距离,根据节点之间的关系,确定节点之间的距离权重,以得到节点之间关系的优先级越高,数值越小的距离权重,根据节点之间的距离和距离权重,确定关键词之间的距离,在这将使得关键词之间的距离是与在知识图谱中对应的节点之间的关系相符的,准确地衡量了关键词之间的距离,提高了关键词之间距离的准确性和业务定位的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种交互语句的关键词间距离的确定方法的流程图;
图2是根据一示例性实施例示出的关键词在知识图谱中对应的节点的示意图;
图3是根据另一示例性实施例示出的一种交互语句的关键词间距离的确定方法的流程图;
图4是图3对应实施例中对根据关系中节点搭配出现的概率,确定关系的优先级步骤的流程图;
图5是根据另一示例性实施例示出的一种交互语句的关键词间距离的确定方法的流程图;
图6是根据一示例性实施例示出的天气知识图谱的示意图;
图7是根据一示例性实施例示出的歌曲知识图谱的示意图;
图8是根据一示例性实施例示出的一种交互语句的关键词间距离的确定装置的框图;
图9是根据另一一示例性实施例示出的一种交互语句的关键词间距离的确定装置的框图;
图10是图9对应实施例中对优先级确定模块的细节进行描述的框图;
图11是根据一示例性实施例示出的一种装置的框图。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种交互语句的关键词间距离的确定方法的流程图。该交互语句的关键词间距离的确定方法,如图1所示,可以包括以下步骤。
在步骤110中,获取交互语句的关键词。
其中,交互语句是指进行的人机交互中用户所输入的语句。对于用户通过输入交互语句而进行的业务定位而言,将首先确定交互语句中的关键词,进而得到一个或者两个以上的关键词对,以便于在各业务所对应的知识图谱中通过确定的关键词对确定交互语句在知识图谱中对应的距离。
用户通过输入的交互语句发起业务定位中业务的查询,例如,所查询的业务可以包括:影视内容、音乐内容、天气信息、日期信息、股票信息和百科信息等业务。
在一个示例性实施例中,交互语句可以是用户通过终端中的键盘操作、屏幕操作和语音输入等任意一种方式所获得的。
在步骤130中,确定关键词在知识图谱中对应的节点。
其中,可以理解的,为实现通过交互语句而发起的业务定位,预先为各业务构建了相应的知识图谱,即每一业务均有与之相对应的知识图谱,进而由此确定用户进入此业务的可能性。
在通过步骤110确定了交互语句的关键词之后,即在每一业务所对应的知识图谱中以交互语句中一对或者两对以上的关键词作为输入,确定关键词在知识图谱中对应的节点。
具体而言,在知识图谱中,将以一对关键词作为输入,可以确定关键词之间所存在的相互连接的节点,关键词之间所存在的相互连接的节点将用于描述关键词之间的距离。
例如,图2示出了一知识图谱中,关键词“明天”和关键词“阴天”在知识图谱中对应的节点,即词汇“时间”所在节点。
通过此过程,对于多个业务分别对应的各个知识图谱,在每一业务对应的知识图谱都能够确定关键词在此知识图谱中对应的节点,进而方便进行关键词在知识图谱的距离确定,以在每一业务对应的知识图谱中确定关键词之间的距离。
在步骤150中,对关键词在知识图谱中对应的节点,确定节点之间的关系和距离。
其中,所指的节点之间的关系,用于表示节点代表的词汇之间的语义关系。节点之间的关系可以包括亲属关系、社交关系、作品关系、从属关系、修饰关系、并列关系等。例如,词汇“时间”所在的节点和词汇“阴天”所在的节点之间的关系为修饰关系;词汇“明天”所在的节点和词汇“时间”所在的节点之间的关系为从属关系。
又例如,如下表所示的,节点之间的关系,包括但不限于下表所列举的内容:
其中,在对每一种关系所进行的举例中,连接线的首端和未端分别对应于两个节点上的词汇,连接两个节点上词汇的是所列举关系中包含的子关系。
对于一知识谱图,预先进行了关系的统计,诸如上表中列举的关系,进而基于所预先统计的关系预先确定知识图谱中各节点之间的关系。
对于关键词在知识图谱中对应的节点,其相互之间的距离,是一设定的默认值,例如,其可为1。
所指的节点之间的关系和距离,是对应于相互连接的两个节点之间的,也就是雨,对于关键词在知识图谱中对应的节点,其相互连接的两个节点之间,都有对应的关系和距离。
在一个示例性实施例中,步骤150包括:根据关键词在知识图谱中对应节点间的连接关系,确定关键词在知识图谱中节点之间的关系和距离。
其中,对于确定所得到的关键词在知识图谱中对应的节点,其数量为多个,并且相互连接。
如前所述的,关键词之间相互连接的节点将描述了关键词之间的距离。换而言之,关键词之间的距离将是由节点之间的距离所确定的,因此,对于关键词在知识图谱中对应节点间的连接关系,得到几组相互连接的两个节点,确定每一组相互连接的节点之间的关系和距离。
在步骤170中,根据节点之间的关系,确定节点之间的距离权重,其中,节点之间的关系的优先级越高,节点之间的距离权重越小。
其中,在引入节点之间的关系所实现的关键词间距离的确定中,将确定此关系所对应的距离权重,由距离权重和此关系对应的节点之间的距离来确定关键词之间的距离。
首先需要说明的是,在节点之间,其关系和距离权重两者之间,是通过关系的优先级建立关联关系的,即关系的优先级越高,距离权重越小。
而对于根据节点之间关系所进行的距离权重确定,遵循关系和距离权重之间通过优先级建立的关联关系,通过预先配置的关系与关系中节点之间距离权重的映射关系实现的。
在一个示例性实施例中,步骤170包括:节点间的关系与节点之间距离权重的映射关系,确定关键词对应节点之间的距离权重。
其中,映射关系中,关系中节点之间的距离权重是根据关系的优先级确定的。对于两个相互连接的节点,将根据这两个节点之间的关系在配置的映射关系中确定其距离权重。
在另一个示例性实施例中,对关键词在知识图谱中对应的节点,所进行的节点之间关系的确定,可以是通过连接节点之间的边所标示或映射的距离权重实现。
具体的,知识图谱中,节点之间是通过边相连接的,因此,可以预先按照节点之间的关系为连接节点的边设定距离权重,以在此条边上标示距离权重,或者建立此条边与距离权重的映射关系。
在步骤190中,根据节点之间的距离和距离权重,确定关键词之间的距离。
其中,通过如前所述的步骤170,对关键词在知识图谱中对应的节点,确定了节点之间的距离权重之后,结合步骤150所确定得到的节点之间的距离,确定关键词之间的距离。
具体的,对关键词在知识图谱中对应的节点,相互连接的节点之间,都有对应的距离和距离权重,由此得到一组或者两组以上的距离和距离权重。
对于一组距离和距离权重,将通过此距离和距离权重的乘积确定得到关键词之间的距离。
对于两组以上的距离和距离权重,将对此进行加权运算,以此来确定关键词之间的距离。
如上所述的过程,通过节点之间具备的关系,为知识图谱中节点之间的真实距离的确定实现了归一化处理,进而能够相对不同业务对应的知识图谱得到准确的关键词之间的距离,进而为后续业务定位的精准完成奠定基础,精准进入相应的业务。
通过如上所述的过程,实现了各业务对应知识图谱中关键词之间距离的确定,进而使得一业务所对应的知识图谱中,以及相对其它业务所对应的知识图谱,均能够准确衡量距离,能够针对不同业务,通过此过程具备非常准确的聚合性。
图3是根据一示例性实施例示出的一种交互语句的关键词间距离的确定方法的流程图。该交互语句的关键词间距离的确定方法,如图3所示,可以包括以下步骤。
在步骤210中,根据关系中节点搭配出现的概率,确定关系的优先级,其中,关系中节点搭配出现的概率越大,关系的优先级越高。
其中,根据前述描述,可以理解的,词是以节点的形态在知识图谱中存在在的,两个相互连接的节点对应了两个搭配出现的关系词,因此,所指的关系中节点搭配出现的概率,即为关系词搭配出现的概率。
由于每一业务的相关领域将是各不相同的,因此,其知识图谱中存在的关系也将是多种多样,各不相同的。需要对每一业务对应的知识图谱预先进行关系的统计,进而获知此业务对应的知识图谱中存在的各种关系。
在知识图谱中,对于一种类型的关系而言,其对应于关系中两个搭配出现的节点。例如,在修饰关系中,存在节点“最新”和节点“电影”,这两个节点搭配出现,此外,也存在着其它一些搭配出现的节点,以构成此修饰关系。
对于此关系,其节点搭配出现概率的高低将表征了此关系的出现概率,此关系的出现概率越高,则说明此关系的重要程度,即优先级越高,因此,关系中节点搭配出现的概率越大,关系的优先级越高。
基于此,即可确定预先统计得到的关系中,各关系所分别对应的优先级。
图4是根据一示例性实施例对步骤210的细节进行的描述。该步骤210,如图5所示,可以包括以下步骤。
在步骤211中,获取知识图谱中各节点之间的关系。
其中,如前所述的,预先进行知识图谱中各节点之间关系的统计,进而可以获取得到知识图谱中各节点之间的关系。在此需要说明的是,用于进行关系获取的两个节点,是指在知识图谱中相互连接的节点。
具体而言,将对知识图谱中相互连接的两个节点,均获取两者之间的关系,进而得到知识图谱中所有相互连接的两个节点之间分别对应的关系。
在步骤213中,确定关系中各节点在各个知识图谱中搭配出现的概率。
在步骤215中,根据关系中各节点在各个知识图谱中搭配出现的概率,配置关系的优先级,其中,关系中节点搭配出现的概率越大,关系的优先级越高。
进一步的,基于此,将确定知识图谱中统计得到的关系的优先级顺序。
在步骤230中,根据关系的优先级,配置节点间的关系与节点之间距离权重的映射关系,其中,关系的优先级越高,节点之间的距离权重越小。
其中,关系中节点之间距离权重用于对节点之间的距离进行精准控制。如前所述的,节点之间的距离,为一统一设定的默认值,将在节点之间距离权重的作用下进行节点之间距离的修正,以得到实际所对应的距离,进而精准实现知识图谱中关键词之间距离的精准确定。
也就是说,对于一种类型的关系,其优先级越高,对应于此关系的距离权重也将越小。
知识图谱中,对预先统计得到的关系,都按照关系的优先级高低配置此关系中节点之间的距离权重,进而建立此关系与此关系中节点之间距离权重的映射关系,以方便对1对应实施例中能够根据确定的关系来进一步确定距离权重。
通过如上的过程,为图1对应实施例所进行的知识图谱中关键词之间距离的确定准确实现了距离权重的确定,进而为图1对应实施例中距离属性的配置提供了具体实现,在此基础上,使得任一业务对应的知识图谱,能够实现节点间距离的准确衡量,进而使得所有知识图谱都能够精准描述关键词之间的距离,得以提高业务定位的准确性。
另外,通过此过程所实现的距离权重确定,将使得图1对应实施例所实现的知识图谱中关键词之间距离的确定是与自然语句中存在的语义关系相符的,进而能够为后续准确识别用户意图奠定了基础。
此方式所实现的知识图谱中节点之间距离权重的确定,对于现有的知识图谱,即已构建并维护的知识图谱而言,能够实现兼容,进而修正现有知识图谱进行节点之间距离确定所存在的不准确的缺陷,提高现有知识图谱进行业务定位的准确性和可靠性。
图5是根据一示例性实施例示出的一种交互语句的关键词间距离的确定方法的流程图。步骤190之后,该交互语句的关键词间距离的确定方法,还可以包括以下步骤。
在步骤310中,根据关键词之间的距离得到交互语句在知识图谱中对应的语句距离。
其中,在通过步骤190确定了交互语句中关键词之间的距离之后,将以关键词之间的距离为依据,确定交互语句在知识图谱中对应的语句距离。
对于交互语句在知识图谱中对应的语句距离,在一个示例性实施例中,对交互语句中关键词之间的距离进行求和,由此所得到的数值即为交互语句在知识图谱中对应的语句距离。
在另一个示例性实施例中,在通过图1对应实施例中步骤190确定了关键词之间的距离之后,还可根据这一对关键词在交互语句中的修饰关系来对关键词之间的距离实现交互语句在知识图谱中语句距离的确定,以此来进一步提高语句距离的准确性。
修饰关系权重用于表征映射的修饰关系在交互语句中的重要程度。通过将修饰关系权重引入语句距离的确定,使得最终所得到的语句距离更为具备语句性,能够更为合理精准地识别用户意图。
具体的,在语句距离的确定中,对于存在修饰关系的关键词,都有相应的距离和修饰关系权重,因此,通过距离和修饰关系权重对所有存在修饰关系的关键词进行加权计算,即可确定交互语句在知识图谱中对应的语句距离。
需要说明的是,通过上述过程,将确定了交互语句在每一业务对应的知识图谱中对应的语句距离,进而能够以此为依据,确定交互语句中关键词所对应的业务。
在步骤330中,确定语句距离中的最小值,并根据语句距离中最小值对应的知识图谱,返回所述交互语句对应的业务。
其中,通过步骤310所进行的语句距离的确定,将确定得到交互语句在每一业务对应的知识图谱中对应的语句距离,也就是说,确定得到了多个语句距离。
对于交互语句而言,语句距离越大,则用户通过交互语句请求进入的业务是输出此语句距离的知识图谱对应的业务的可能性则越低;而语句距离越小,则用户通过交互语句请求进入的业务是输出此语句距离的知识图谱对应的业务的可能性则越高,因此,需要确定语句距离中的最小值,即数值最小的语句距离。
由语句距离中的最小值确定输出此最小值的知识图谱,输出此最小值的知识图谱即为用户通过交互语句的输入而请求进入业务所对应的知识图谱。
具体的,在根据语句距离中的最小值确定了知识图谱之后,根据知识图谱与业务之间的对应关系,确定交互语句对应的业务,此时,所确定的业务即为交互语句的业务定位中最终定位的业务。
通过如上所述的过程,得以实现交互语句在各业务对应知识图谱中的距离确定,进而得到交互语句在每一知识图谱中对应的语句距离,由此语句距离的确定中参考了节点之间的关系,甚至于关键词在交互语句中的修饰关系,因此,能够获得非常高的准确性,进而区分交互语句在各知识图谱中语句距离的细微差别,因此,能够实现业务的精准定位。
结合具体应用场景,描述该交互语句的关键词间距离的确定方法,以交互语句“明天阴天吧”,知识图谱分别为歌曲知识图谱和天气知识图谱为例,进行描述。
由交互语句“明天阴天吗”可以得到关键词“明天”和关键词“阴天”,进而确定关键词“明天”和关键词“阴天”在天气知识图谱以及歌曲知识图谱中对应的节点。
如图6所示的,在天气知识图谱中,关键词“明天”所在的节点410和关键词“阴天”所在的节点430之间,存在着其它节点,即“时间”节点450。
首先需要说明的是,知识图谱中,每条边所默认的距离为1。
在天气知识图谱中,关键词“明天”所在的节点410和“时间”节点450之间相互连接,并且由于存在着从属关系,可以由此确定其距离权重,进而根据节点之间默认的距离和距离权重。
关键词“阴天”所在的节点430和“时间”节点450之间相互连接,并且由于存在着修饰关系,由此而确定得到的距离权重为0.6。因此,其节点之间的实际距离应当为0.6,即默认距离1与距离权重0.6之间的乘积。
由此所最终得到的关键词在天气知识图谱中的距离即为1+0.6=1.6。
如图7所示的,在歌曲知识图谱中,关键词“明天”所在的节点510和关键词“阴天”所在的节点530之间,存在着其它节点,即“歌曲”节点550。
关键词“明天”所在的节点510和“歌曲”节点550之间相互连接,并且由于存在着从属关系,映射的距离权重为1。因此,节点之间的实际距离应当为1。
关键词“阴天”所在的节点530和“歌曲”节点550之间相互连接,并且由于存在着从属关系,映射的距离权重为1。因此,节点之间的实际距离为1。
由此所最终得到的关键词在天气知识图谱中的距离即为1+1=2。
在此,通过节点之间的关系,以及以节点之间的关系为依据所进行的距离权重的确定,能够精准区分知识图谱中的差别,能够避免业务定位异常的缺陷,在同一尺度上对比用户输入在各个可能业务的知识图谱中的距离,有效判别可能进入的业务。
在此需要说明的是,预先按照关系词搭配出现的概率越大,则优先级越高,修饰关系的优先级大于从属关系的优先级。在此基础上,由于优先级越高,距离权重越小,从属关系所确定的距离权重将大于修饰关系所确定的距离权重。
述为本公开装置实施例,可以用于执行本公开的知识图谱中节点间距离的确定方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开知识图谱中节点间距离的确定方法实施例。
图8是根据一示例性实施例示出的一种交互语句的关键词间距离的确定装置的框图,该交互语句的关键词间距离的确定装置用于执行图1所示的交互语句的关键词间距离的确定方法的全部步骤。如图8所示,包括但不限于:关键词获取模块610、第一确定模块630、第二确定模块650、距离权重确定模块670和关键词距离确定模块690。
关键词获取模块610,用于获取交互语句中的关键词。
第一确定模块630,用于确定关键词在知识图谱中对应的节点。
第二确定模块650,用于对关键词在知识图谱中对应的节点,确定节点之间的关系和距离。
距离权重确定模块670,用于根据节点之间的关系,确定节点之间的距离权重,其中,节点之间的关系的优先级越高,节点之间的距离权重越小。
关键词距离确定模块690,用于根据节点之间的距离和距离权重,确定关键词之间的距离。
在一个示例性实施例中,距离权重确定模块670具体用于:
根据节点间的关系与所述节点之间距离权重的映射关系,确定所述关键词对应节点之间的距离权重。
图9是根据一示例性实施例示出的一种交互语句的关键词间距离的确定装置的框图,该交互语句的关键词间距离的确定装置,如图9所示,还包括但不限于:优先级确定模块710和映射关系配置模块730。
优先级确定模块710,用于根据关系中节点搭配出现的概率,确定关系的优先级,其中,关系中节点搭配出现的概率越大,关系的优先级越高。
映射关系配置模块730,用于根据所述关系的优先级,配置所述节点间的关系与所述节点之间距离权重的映射关系,其中,所述关系的优先级越高,所述节点之间的距离权重越小。
图10是根据一示例性实施例示出的对优先级确定模块的细节进行的描述。该优先级确定模块710,如图10所示,包括但不限于:关系获取子模块711、概率确定子模块713和优先级配置子模块715。
关系获取子模块711,用于获取知识图谱中各节点之间的关系。
概率确定子模块713,用于确定关系中各节点在各个知识图谱中搭配出现的概率。
优先级配置子模块715,用于根据关系中各节点在各个知识图谱中搭配出现的概率,配置关系的优先级,其中,关系中节点搭配出现的概率越大,关系的优先级越高。
图11是根据一示例性实施例示出的一种装置800的框图。例如,装置800可以是图1所示实施环境中的移动终端和智能设备。移动终端比如可以是智能手机、平板电脑。智能设备比如可以是各种智能家居设备,比如智能电视、智能电视机顶盒、智能空调以及智能摄像头等。
参照图11,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,传感器组件814以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作以及记录操作相关联的操作等。处理组件802可以包括一个或多个处理器818来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储器804中还存储有一个或多个模块,该一个或多个模块被配置成由该一个或多个处理器818执行,以完成上述图1、图3、图4和图5任一所示方法中的全部或者部分步骤。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,传感器组件814还可以检测装置800或装置800一个组件的位置改变以及装置800的温度变化。在一些实施例中,该传感器组件814还可以包括磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件216经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
可选的,本公开还提供一种知识图谱中节点间距离的确定装置,该知识图谱中节点间距离的确定装置执行图1、图3、图4和图5任一所示的知识图谱中节点间距离的确定方法的全部或者部分步骤。所述装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行:
获取交互语句中的关键词;
确定所述关键词在知识图谱中对应的节点;
对所述关键词在知识图谱中对应的节点,确定节点之间的关系和距离;
根据所述节点之间的关系,确定所述节点之间的距离权重,其中,所述节点之间的关系的优先级越高,所述节点之间的距离权重越小;
根据所述节点之间的距离和距离权重,确定所述关键词之间的距离。
该实施例中的装置的处理器执行操作的具体方式已经在有关该知识图谱中节点间距离的确定方法的实施例中执行了详细描述,此处将不做详细阐述说明。
在示例性实施例中,还提供了一种存储介质,该存储介质为计算机可读存储介质,例如可以为包括指令的临时性和非临时性计算机可读存储介质。该存储介指例如包括指令的存储器804,上述指令可由装置800的处理器818执行以完成上述交互语句的关键词间距离的确定方法。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (10)

1.一种交互语句的关键词间距离的确定方法,其特征在于,所述方法包括:
获取交互语句中的关键词,所述关键词用于发起业务定位中业务的查询;
在不同业务对应知识图谱中,以一对关键词作为输入,确定关键词之间所存在的相互连接的节点,各业务都有对应的知识图谱;
对所述关键词在知识图谱中对应的节点,确定节点之间的关系和距离;
根据所述节点之间的关系,确定所述节点之间的距离权重,其中,所述节点之间的关系的优先级越高,所述节点之间的距离权重越小,所述关系中节点搭配出现的概率越大,所述关系的优先级越高;
根据所述节点之间的距离和距离权重,确定所述关键词之间的距离,所述距离用于确定交互语句在所述知识图谱中对应的语句距离,输出所述语句距离中最小值的知识图谱即对应于用户通过所述交互语句的输入而请求进入的业务。
2.根据权利要求1所述的方法,其特征在于,所述根据所述节点之间的关系,确定所述节点之间的距离权重,包括:
根据节点间的关系与所述节点之间距离权重的映射关系,确定所述关键词对应节点之间的距离权重。
3.根据权利要求1所述的方法,其特征在于,所述根据所述节点之间的关系,确定所述节点之间的距离权重之前,所述方法还包括:
根据所述关系中节点搭配出现的概率,确定所述关系的优先级;
根据所述关系的优先级,配置所述节点间的关系与所述节点之间距离权重的映射关系。
4.根据权利要求1至3任意一项所述的方法,其特征在于,所述根据所述节点之间的距离和距离权重,确定所述关键词之间的距离之后,所述方法还包括:
根据所述关键词之间的距离得到所述交互语句在所述知识图谱中对应的语句距离;
确定所述语句距离中的最小值,并根据所述语句距离中最小值对应的知识图谱,返回所述交互语句对应的业务。
5.根据权利要求1所述的方法,其特征在于,所述对所述关键词在知识图谱中对应的节点,确定节点之间的关系和距离,包括:
根据所述关键词在所述知识图谱中对应节点间的连接关系,确定所述关键词在知识图谱中节点之间的关系和距离。
6.根据权利要求3所述的方法,其特征在于,所述根据所述关系中节点搭配出现的概率,确定所述关系的优先级,包括:
获取知识图谱中各节点之间的关系;
确定所述关系中各节点在各个知识图谱中搭配出现的概率;
根据所述关系中各节点在各个知识图谱中搭配出现的概率,配置所述关系的优先级,其中,所述关系中节点搭配出现的概率越大,所述关系的优先级越高。
7.一种交互语句的关键词间距离的确定装置,其特征在于,包括:
关键词获取模块,用于获取交互语句中的关键词,所述关键词用于发起业务定位中业务的查询;
第一确定模块,用于在不同业务对应知识图谱中,以一对关键词作为输入,确定关键词之间所存在的相互连接的节点,各业务都有对应的知识图谱;
第二确定模块,用于对所述关键词在知识图谱中对应的节点,确定节点之间的关系和距离;
距离权重确定模块,用于根据所述节点之间的关系,确定所述节点之间的距离权重,其中,所述节点之间的关系的优先级越高,所述节点之间的距离权重越小,所述关系中节点搭配出现的概率越大,所述关系的优先级越高;
关键词距离确定模块,用于根据所述节点之间的距离和距离权重,确定所述关键词之间的距离,所述距离用于确定交互语句在所述知识图谱中对应的语句距离,输出所述语句距离中最小值的知识图谱即对应于用户通过所述交互语句的输入而请求进入的业务。
8.根据权利要求7所述的装置,其特征在于,所述距离权重确定模块具体用于:
根据节点间的关系与所述节点之间距离权重的映射关系,确定所述关键词对应节点之间的距离权重。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
优先级确定模块,用于根据所述关系中节点搭配出现的概率,确定所述关系的优先级;
映射关系配置模块,用于根据所述关系的优先级,配置所述节点间的关系与所述节点之间距离权重的映射关系。
10.根据权利要求9所述的装置,共特征在于,所述优先级确定模块包括:
关系获取子模块,用于获取知识图谱中各节点之间的关系;
概率确定子模块,用于确定所述关系中各节点在各个知识图谱中搭配出现的概率;
优先级配置子模块,用于根据所述关系中各节点在各个知识图谱中搭配出现的概率,配置所述关系的优先级,其中,所述关系中节点搭配出现的概率越大,所述关系的优先级越高。
CN201610685770.3A 2016-08-17 2016-08-17 交互语句的关键词间距离的确定方法和装置 Active CN106326211B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610685770.3A CN106326211B (zh) 2016-08-17 2016-08-17 交互语句的关键词间距离的确定方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610685770.3A CN106326211B (zh) 2016-08-17 2016-08-17 交互语句的关键词间距离的确定方法和装置

Publications (2)

Publication Number Publication Date
CN106326211A CN106326211A (zh) 2017-01-11
CN106326211B true CN106326211B (zh) 2019-09-20

Family

ID=57744203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610685770.3A Active CN106326211B (zh) 2016-08-17 2016-08-17 交互语句的关键词间距离的确定方法和装置

Country Status (1)

Country Link
CN (1) CN106326211B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108536702B (zh) * 2017-03-02 2022-12-02 腾讯科技(深圳)有限公司 一种相关实体确定方法、装置及计算设备
CN110019826B (zh) * 2017-07-27 2023-02-28 北大医疗信息技术有限公司 医疗知识图谱的构建方法、构建装置、设备和存储介质
US20190340255A1 (en) * 2018-05-07 2019-11-07 Apple Inc. Digital asset search techniques
CN109885693B (zh) * 2019-01-11 2021-08-03 武汉大学 基于知识图谱的快速知识对比方法及系统
CN109710621B (zh) * 2019-01-16 2022-06-21 福州大学 结合语义类节点与边权重的关键词搜索ksanew方法
CN111177405A (zh) * 2019-12-18 2020-05-19 深圳壹账通智能科技有限公司 数据搜索匹配方法、装置、计算机设备和存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000339317A (ja) * 1999-05-25 2000-12-08 Nippon Telegr & Teleph Corp <Ntt> リンク情報とキーワードの関連度計算方法、装置、及びその方法を記憶した記録媒体
CN101630314B (zh) * 2008-07-16 2011-12-07 中国科学院自动化研究所 一种基于领域知识的语义查询扩展方法
CN103593792B (zh) * 2013-11-13 2016-09-28 复旦大学 一种基于中文知识图谱的个性化推荐方法与系统
CN104090955A (zh) * 2014-07-07 2014-10-08 科大讯飞股份有限公司 一种音视频标签自动标注方法及系统
CN104063521B (zh) * 2014-07-17 2018-09-11 百度在线网络技术(北京)有限公司 搜索业务实现方法和装置
CN105447005B (zh) * 2014-08-08 2020-03-17 北京小度互娱科技有限公司 一种对象推送方法及装置

Also Published As

Publication number Publication date
CN106326211A (zh) 2017-01-11

Similar Documents

Publication Publication Date Title
CN106326211B (zh) 交互语句的关键词间距离的确定方法和装置
JP6618223B2 (ja) 音声処理方法及び装置
CN106896932B (zh) 一种候选词推荐方法及装置
CN108877770A (zh) 用于测试智能语音设备的方法、装置和系统
CN106547886A (zh) 应用程序推荐方法、装置、终端和服务器
CN108509412A (zh) 一种数据处理方法、装置、电子设备以及存储介质
CN109493852A (zh) 一种语音识别的评测方法及装置
US20190180734A1 (en) Keyword confirmation method and apparatus
CN108804440A (zh) 提供视频搜索结果的方法和装置
CN110290280A (zh) 一种终端状态的识别方法、装置及存储介质
WO2019101099A1 (zh) 视频节目识别方法、设备、终端、系统和存储介质
CN108495168A (zh) 弹幕信息的显示方法及装置
CN110033784A (zh) 一种音频质量的检测方法、装置、电子设备及存储介质
US11056103B2 (en) Real-time utterance verification system and method thereof
CN112954602B (zh) 语音控制方法、传输方法、装置、电子设备及存储介质
US8406755B2 (en) Method for testing wireless connection function of mobile phone
CN106598858B (zh) 资源调用分析方法及装置
CN105302335B (zh) 词汇推荐方法和装置及计算机可读存储介质
CN106354762B (zh) 交互语句的业务定位方法和装置
US10803861B2 (en) Method and apparatus for identifying information
CN109992503A (zh) 自动化测试方法及装置
CN110334004A (zh) 一种测试数据构造方法及装置、电子设备及存储介质
CN113393834B (zh) 一种控制方法及装置
CN109862408A (zh) 一种用于智能电视语音遥控器的用户语音识别控制方法
CN109460458A (zh) 查询改写意图的预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant