CN110781280A - 基于知识图谱的语音辅助方法及装置 - Google Patents

基于知识图谱的语音辅助方法及装置 Download PDF

Info

Publication number
CN110781280A
CN110781280A CN201911001544.9A CN201911001544A CN110781280A CN 110781280 A CN110781280 A CN 110781280A CN 201911001544 A CN201911001544 A CN 201911001544A CN 110781280 A CN110781280 A CN 110781280A
Authority
CN
China
Prior art keywords
user
graph
module
data
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911001544.9A
Other languages
English (en)
Inventor
唐希元
姜瑾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jianlian Technology Guangdong Co ltd
Original Assignee
Shenzhen Zhongyi Weirong Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zhongyi Weirong Technology Co Ltd filed Critical Shenzhen Zhongyi Weirong Technology Co Ltd
Priority to CN201911001544.9A priority Critical patent/CN110781280A/zh
Publication of CN110781280A publication Critical patent/CN110781280A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开实施例公开了一种基于知识图谱的语音辅助方法及装置。其中,该方法包括:根据用户已有的信息,提取整体知识图谱中所述用户的数据建立所述用户个人的子图谱;接收所述用户语音输入的问题并进行识别;基于所述识别的结果,在所述子图谱中搜索与所述问题相关的所述用户的关系数据;基于所述关系数据在知识库中查询所述问题的答案,至少以音频方式播报给所述用户。

Description

基于知识图谱的语音辅助方法及装置
技术领域
本公开涉及人工智能技术领域,具体涉及一种基于知识图谱的语音辅助方法、装置、电子设备及存储介质。
背景技术
近年来,随着认知智能技术的发展,语音识别的成功率得到了大幅提升,基于语音识别的应用也得以全面推广。除语音输入等基础应用之外,语音遥控、语音助手这种基于语音的人机交互应用也逐渐成为智能系统的标准配置。其中,语音助手这种问答式的交互可以大幅减少人工客服的工作量,但同时对智能系统的认知能力、知识搜索和知识匹配能力也有更高的要求。
现有技术中,语音助手通常与知识库搭配使用,前端首先对用户的语音输入进行识别,将语音信息转换成文本信息之后在知识库中进行查询,然后将查询到的与语音内容相匹配的结果通过音频播放给用户。然而,相对于文字交互而言,语音交互存在着更大的随意性,用户提出的问题经常会出现不规范的表述方式,很少会与预设的问题完全匹配,而给出多个选项让用户选择的操作方式对语音交互来说又体验太差,这都给语音问题识别带来了不小的压力。此外,语音交互经常会收到专业性的问题或与用户个人密切相关的问题,对于常规的知识库来说,也往往会因为信息缺失而很难给出准确的答复。
发明内容
针对现有技术中的上述技术问题,本公开实施例提出了一种基于知识图谱的语音辅助方法、装置、电子设备及计算机可读存储介质,以解决现有技术中语音交互问题识别难、答案与用户无关等问题。
本公开实施例的第一方面提供了一种基于知识图谱的语音辅助方法,包括:
根据用户已有的信息,提取整体知识图谱中所述用户的数据建立所述用户个人的子图谱;
接收所述用户语音输入的问题并进行识别;
基于所述识别的结果,在所述子图谱中搜索与所述问题相关的所述用户的关系数据;
基于所述关系数据在知识库中查询所述问题的答案,至少以音频方式播报给所述用户。
在一些实施例中,所述提取整体知识图谱中所述用户的数据包括:
根据所述用户已有的信息,在所述整体知识图谱中唯一确定所述用户的个人节点;
从所述用户的个人节点出发,提取与所述用户的个人节点一度关联的节点的信息;
从所述一度关联的节点出发,根据所述用户的权限和/或数据的隐私程度,提取与所述用户的个人节点二度关联以上的节点的全部信息或统计信息。
在一些实施例中,所述识别包括:
根据语音分词将所述语音输入识别为至少一个文本信息;
对所述至少一个文本信息进行语义分析,提取出一个或多个特定类型的文本。
在一些实施例中,所述基于所述关系数据在知识库中查询所述问题的答案包括:
使用分类器在所述知识库的问题列表中对所述识别的结果文本进行匹配;
在所述匹配的置信度分数低于预设阈值时,使用所述分类器结合所述关系数据进行二次匹配;
在所述匹配或所述二次匹配的置信度分数大于等于所述预设阈值时,从所述问题列表中确定所述问题及对应的答案。
在一些实施例中,所述方法还包括:
在所述二次匹配的置信度分数仍低于预设阈值时,提示所述用户对所述问题进行人工标记。
本公开实施例的第二方面提供了一种基于知识图谱的语音辅助装置,包括:
子图谱建立模块,用于根据用户已有的信息,提取整体知识图谱中所述用户的数据建立所述用户个人的子图谱;
语音识别模块,用于接收所述用户语音输入的问题并进行识别;
子图谱搜索模块,用于基于所述识别的结果,在所述子图谱中搜索与所述问题相关的所述用户的关系数据;
问题查询模块,用于基于所述关系数据在知识库中查询所述问题的答案,至少以音频方式播报给所述用户。
在一些实施例中,所述子图谱建立模块包括:
用户标识模块,用于根据所述用户已有的信息,在所述整体知识图谱中唯一确定所述用户的个人节点;
一度提取模块,用于从所述用户的个人节点出发,提取与所述用户的个人节点一度关联的节点的信息;
二度提取模块,用于从所述一度关联的节点出发,根据所述用户的权限和/或数据的隐私程度,提取与所述用户的个人节点二度关联以上的节点的全部信息或统计信息。
在一些实施例中,所述语音识别模块包括:
文本识别模块,用于根据语音分词将所述语音输入识别为至少一个文本信息;
语义分析模块,用于对所述至少一个文本信息进行语义分析,提取出一个或多个特定类型的文本。
在一些实施例中,所述问题查询模块包括:
初次匹配模块,用于使用分类器在所述知识库的问题列表中对所述识别的结果文本进行匹配;
二次匹配模块,在所述匹配的置信度分数低于预设阈值时,使用所述分类器结合所述关系数据进行二次匹配;
匹配结果获取模块,用于在所述匹配或所述二次匹配的置信度分数大于等于所述预设阈值时,从所述问题列表中确定所述问题及对应的答案。
在一些实施例中,所述问题查询模块还包括:
异常处理模块,用于在所述二次匹配的置信度分数仍低于预设阈值时,提示所述用户对所述问题进行人工标记。
本公开实施例的第三方面提供了一种电子设备,包括:
存储器以及一个或多个处理器;
其中,所述存储器与所述一个或多个处理器通信连接,所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行时,所述电子设备用于实现如前述各实施例所述的方法。
本公开实施例的第四方面提供了一种计算机可读存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被计算装置执行时,可用来实现如前述各实施例所述的方法。
本公开实施例的第五方面提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,可用来实现如前述各实施例所述的方法。
本公开实施例通过知识图谱获取用户的关系数据,帮助获得问题中的隐含条件,实现了对语音问题的准确识别,从而提升了语音交互的成功率和效率。
附图说明
通过参考附图会更加清楚的理解本公开的特征和优点,附图是示意性的而不应理解为对本公开进行任何限制,在附图中:
图1是根据本公开的一些实施例所示的一种典型知识图谱的图结构示意图;
图2是根据本公开的一些实施例所示的一种基于知识图谱的语音辅助方法流程示意图;
图3是根据本公开的一些实施例所示的一种智能语音助手逻辑结构示意图;
图4是根据本公开的一些实施例所示的一种基于知识图谱和人工智能的风险控制系统结构示意图;
图5是根据本公开的一些实施例所示的一种多个图数据库的典型应用场景示意图;
图6是根据本公开的一些实施例所示的一种基于知识图谱的语音辅助装置的模块结构示意图;
图7是根据本公开的一些实施例所示的一种电子设备的结构示意图。
具体实施方式
在下面的详细描述中,通过示例阐述了本公开的许多具体细节,以便提供对相关披露的透彻理解。然而,对于本领域的普通技术人员来讲,本公开显而易见的可以在没有这些细节的情况下实施。应当理解的是,本公开中使用“系统”、“装置”、“单元”和/或“模块”术语,是用于区分在顺序排列中不同级别的不同部件、元件、部分或组件的一种方法。然而,如果其他表达式可以实现相同的目的,这些术语可以被其他表达式替换。
应当理解的是,当设备、单元或模块被称为“在……上”、“连接到”或“耦合到”另一设备、单元或模块时,其可以直接在另一设备、单元或模块上,连接或耦合到或与其他设备、单元或模块通信,或者可以存在中间设备、单元或模块,除非上下文明确提示例外情形。例如,本公开所使用的术语“和/或”包括一个或多个相关所列条目的任何一个和所有组合。
本公开所用术语仅为了描述特定实施例,而非限制本公开范围。如本公开说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的特征、整体、步骤、操作、元素和/或组件,而该类表述并不构成一个排它性的罗列,其他特征、整体、步骤、操作、元素和/或组件也可以包含在内。
参看下面的说明以及附图,本公开的这些或其他特征和特点、操作方法、结构的相关元素的功能、部分的结合以及制造的经济性可以被更好地理解,其中说明和附图形成了说明书的一部分。然而,可以清楚地理解,附图仅用作说明和描述的目的,并不意在限定本公开的保护范围。可以理解的是,附图并非按比例绘制。
本公开中使用了多种结构图用来说明根据本公开的实施例的各种变形。应当理解的是,前面或下面的结构并不是用来限定本公开。本公开的保护范围以权利要求为准。
由于用户语音输入具有极大的随意性,且不方便接收系统提示(通过语音向用户反复提问既耗时又容易引起反感),因而当前智能设备很难准确掌握用户语音提问的实际含义,现有的语音交互仅能执行简单的遥控操作或回答少量比较明确的问题,对于隐含条件过多或表述不清楚的问题往往无法作答,这使得现有的语音助手应用范围有限,用户体验不佳。举例来说,口语中人们习惯于简化表述或是关注自身相关的事情,比如“我爸爸是不是可以办这个业务?”这种问题就属于隐含过多条件以及与用户自身相关的,普通语音助手很难直接识别该问题的关键信息,因而也无法立刻给出正确的答复,只能反复向用户提问、或是给出一个模糊的答案、又或是给出一些文字答案/链接让用户自己研究,这些方式的用户体验均较差。
在本公开的实施例中,利用知识图谱来帮助语音助手获取隐含条件和用户个人的关系数据,从而实现对语音问题的正确识别,提升语音交互的成功率和效率。其中,语音助手指的是能与用户通过语音进行智能交流的语音交互功能模块,一般常见于各种个人智能终端设备中。按照人们的语言表达习惯,主谓宾式的一句话通常由目标A、B以及A和B之间的关系构成,提出的问题一般是询问和A处于某种关系的目标是什么,这种关系表达方式与图数据库的关系数据有很高的契合度,因而使用图数据库支持语音助手是一个不错的选择。典型地,图数据库(知识图谱数据库)中存储有关系数据,一般是按现实世界中的实体与关系来存储;不同的实体对应不同的节点,不同的实体间通过关系来完成连接,节点与关系还进一步包括不同的属性,用于定义实体的类型和关系的类型。如图1所示,在一个示例性的图数据库实例中,知识图谱展示了基于个人信息构建的用户关系网络,其中不同的实体构成了图1中不同形状的节点,实体之间的关系构成了节点之间的连线。比如“张明”和“李强”为两个个人实体,每个实体通过例如“工作于”或“拥有电话”等关系与其他的“手机号”或“公司”等实体相连。
有鉴于此,本公开实施例提供了一种基于知识图谱的语音辅助方法,通过知识图谱获取用户的关系数据,帮助获得问题中的隐含条件,实现了对语音问题的准确识别,从而提升了语音交互的成功率和效率。如图2所示,在本公开的一个实施例中,基于知识图谱的语音辅助方法包括步骤:
S201,根据用户已有的信息,提取整体知识图谱中所述用户的数据建立所述用户个人的子图谱;
S202,接收所述用户语音输入的问题并进行识别;
S203,基于所述识别的结果,在所述子图谱中搜索与所述问题相关的所述用户的关系数据;
S204,基于所述关系数据在知识库中查询所述问题的答案,至少以音频方式播报给所述用户。
其中,在本公开的一个实施例中,所述知识图谱优选使用Neo4j图数据库,该图数据库将知识图谱(比如图1的示例)的全部信息按节点和边存储,节点或边还包括对应的属性。完整的知识图谱包含更为详尽的信息,理论上说可以实现更为精确的搜索,但其在安全性和效率方面又存在一定的缺陷:完整的知识图谱是搜集和记录全体用户数据得到的,如果直接在整体知识图谱中进行数据操作,一方面有可能破坏数据,另一方面有可能泄露不应被某用户所了解的其他用户信息;同时整体知识图谱的数据量显然是海量级的,在海量数据中进行搜索的效率也显然不会太理想,系统响应的实时性很难满足用户需求。
因此,在本公开的一个优选实施例中,进一步先筛选数据建立用户个人的子图谱,将对用户问题的搜索放在子图谱中进行,既避免了对整体知识图谱的误操作,又可按照用户的权限或关联度来呈现其他用户的信息,同时缩小了数据搜索范围,在提升系统可靠性、数据安全性的同时提升了响应效率。其中,用户已有的信息可以是用户在系统里注册时提供的信息,也可以是在用户使用系统的过程中记录的信息,还可以是单独呈现的表单页面中要求用户按项目输入的信息。典型地,根据用户已有的信息(比如从表单中接收的用户输入信息),判断是否存在第一用户信息,若存在,则根据第一用户信息输出子图谱,若不存在,则根据第二信息查询系统记录并根据综合得到的第三用户信息进行校验,校验成功后输出子图谱。其中,第一用户信息指的是具有唯一性,能唯一确定用户身份的信息,第二信息和第三信息指的是唯一性较差的信息。根据第二信息查询时,系统可能返回多个用户结果,根据第三信息乃至更多的信息进行校验比对,从中选择最优结果。由于子图是根据用户输入的信息建立的,而用户输入的信息无法保证全面和准确,因而可能需要其他信息来唯一标识用户。比如,身份证号等信息具有最高的唯一性;而电话号码虽然唯一,但会由于运营商二次投放等事件导致唯一性稍差;姓名地址等其他信息重复率较高,则唯一性更差。但当不存在最高唯一性信息时,将几个唯一性较差的信息结合后,同样也能锁定唯一一个用户。
信息提取和子图建立步骤根据需要,可以在用户提问后判断需要建立子库时进行,也可以在用户填写完部分信息后,无论用户是否提问,直接执行信息提取和子图建立操作。根据用户已有的信息,首先可以在整体知识图谱中确定该用户的个人节点(以下称第一个人节点),再从该第一个人节点出发,提取直接归属于(一度关联)该第一个人节点的节点信息(非人的属性节点,比如个人电话、工作单位等),同时提取与该第一个人节点直接关联(一度关联)的第二个人节点(数量不限,可以没有也可以有任意多个,以用户节点的实际关联关系为准);随后对于与该第一个人节点二度关联以上的节点(包括但不限于第二个人节点的属性节点和与第一个人节点间接关联的第三个人节点等),仅提取统计信息。根据提取到的信息(第一个人节点的属性节点、第二个人节点及其他节点的统计信息)建立该用户个人的子图谱,从而可以在既有效又安全的数据范围内进行有针对性的搜索。
举例来说,完整的图数据库的结构是通过多个数据源得到的存量关系图数据库,其目的在于进行变量计算进而得到反欺诈识别结果。而子图谱的数据结构存在的目的在于用于智能语音助理的问答推理,因此子图谱的建立不是直接将大图数据库的边和结点复制并存于另外一个图数据库。相反,子图建立模块将按照结构和规则两个维度对大图数据库进行数据获取和数据处理,进而建立新的子图数据库。在数据获取部分,子图建立模块将按照预定边和结点的类型提取申请人的相关数据,例如当前申请人的一度或二度关联数据按照隐私判定规则进行提取,当申请人的关联结点为非隐私节点时,提取对应的数据,反之则不提取对应的数据。在提取数据之后,子图建立模块将按照转换结构对数据进行计算,得到用于信贷问答推理的数据结点。例如,申请人的关联结点中的黑点分别为张三、李四、王五。该部对应数据不应出现在申请人的子图数据库中,尤其是黑点判别结果不能被智能虚拟助理向外泄露,因此子图建立模块将计算一个变量“黑点联系人数量是否超标”,并存于申请人的子图数据中的一个属性。至此,子图建立模块从大图数据库中提取了对应的信息,并生成了可供虚拟助理问答推理可用的子图数据库。
通过本公开的实施例,可以将语音助手应用到更为专业的领域,也可帮助用户解答更为复杂的问题,从而进一步降低人工客服的工作量和系统成本。其中,图3给出了一种智能语音助手的典型逻辑结构示意图:系统通过话筒接收用户语音输入,语音识别模块将接收到的语音进行识别并提取出特定类型的文本,比如格式为域、意图、槽(Slot)等结构;进一步将所提取的文本与存储在代理定义结构(分类器)中的可能的用户问题/命令的列表相比较以确定最可能与用户的意图匹配的问题/命令。如果匹配到与用户的意图匹配的问题/命令,则执行语音问题/命令中所需的操作(应答或执行命令);如果不匹配,则通过与分类器中的一者或多者进行匹配确定置信度分数,基于置信度分数来选择分类器,并基于与该分类器相关联的问题/命令来确定最可能与用户的意图匹配的问题/命令;其中,该匹配可以是基于统计、概率方法、决策树、其它规则、其它合适的匹配准则中的一个或多个组合;如果置信度分数大于等于设定的阈值,则执行语音问题/命令中所需的操作;如果置信度分数低于设定的阈值,则认为分类器中不存在与用户语音相关的内容,将通过用户使用标记工具来输入请求,系统在得到用户的文字输入后,更新分类器模型,同时执行用户的请求。在本公开的实施例中,在使用分类器进行匹配之前,进一步还利用前述步骤得到的子图谱对语音识别结果进行优化,以获取用户语音输入中的隐含信息。
典型地,基于语音识别的结果,将结果中表述不明确的文字先在子图谱中进行搜索,从而获得与用户相关的更为明确的信息,这些信息通常是与所述问题相关的所述用户的关系数据。比如,对于用户语音输入中“我的爸爸”这一表述,在语音识别为文本后,利用该文本在用户个人的子图谱中搜索,获得“我的爸爸”所对应的姓名和/或标识符(比如用户ID等)信息;对于用户语音输入中“是不是可以办这个业务”这一表述,在语音识别为文本后,利用该文本在用户个人的子图谱中搜索,获得“我的爸爸”的业务相关信息(比如年龄、收入、地区等基本信息,或是已办理业务情况、征信信息等)。当然,如前所述,为保证其他用户的隐私,当前用户的子图谱中可能只能搜索到一些统计信息,比如年龄信息只能获得年龄区间或“中年/老年”等描述,收入、地区等也类似,征信信息只能获得“优、良好、一般或高风险”等评价,这些统计信息在保护用户隐私的同时又可支持后续分类器的匹配,实现了安全性和系统成功率的兼顾。
在获得足够的关系数据之后,可以将关系数据与表述明确的文本一起在知识库中进行查询,即使用前述的分类器进行匹配,来获得最相关的答案,并将答案反馈给用户。在本公开的优选实施例中,关注的是语音交互的实现,因而优选采用音频的方式播报给用户,但实际情况中,音频只是反馈的一种形式,采用文字、链接、图片或视频等任意一种形式或多种形式的组合均是可选的反馈方式,在此不做具体的限制。
在本公开的实施例中,对于一些特定的系统而言,如信贷系统,用户会提出针对性更高的专业问题,这些问题的答案通常无法从常识数据库中获取,因此用户无法得到自己想要的答案。用户针对信贷方面的专业问题,如我的父亲是否能作为推荐人等,在常识数据库中无法得到答案,但是在信贷系统的知识图谱中,是有可能获得答案的,例如,若检测到当前用户的父亲为黑名单,不适合作为推荐人,则返回不能给用户。再例如,用户询问能否给我提供一些帮助,在知识图谱中经过搜索发现该用户一度关联用户平均学历很高,则可给出提示:填写最高学历有助于提高贷款成功率等。
对于专业领域的语音交互,例如信贷领域,在一些情况中,用户提出的问题可能是常识数据库中就能够直接回答的,如用户可能想要查询贷款五级分类都有哪些。为了回答这个问题,语音助手最好的工作方式应当是在常识库中进行检索,无法找到结果时再在更为广泛的通用搜索引擎中寻找,然后为用户返回结果。而对于隐含条件或关系型问题,如我的父亲是否能作为联系人,则需要征信图谱进行支持。因此,在本公开的实施例中,对用户输入的语音进行语音识别,将语音转换为文字,再对文字内容进行分词,分词后将结果导入用户意图分析模型,用户意图分析模型指的一种自然语言分类模型,根据分词统计,对内容进行分类,根据分类结果判断是在常识库中提取答案还是到子图谱中提取答案。当然,在常识库直接获取答案的处理与现有技术相同,未能体现本公开的关键改进,在此不再展开描述;本公开的实施例着重介绍知识图谱对语音交互的支持,因而优选处理的是无法在常识库中直接获取答案的情况,在此情况下,先在子图谱中获取与问题相关的尽可能多的关系数据,再将关系数据与问题一起在常识库中查询,从而使分类器能够发现与问题最匹配的答案,在不进一步询问用户的情况下即可获得能让用户满意的答复。
如图4所示,给出了一种基于知识图谱和人工智能的风险控制系统示意图,例如某公司的智能风险控制系统。其中,用户通过互联网前端系统,例如SDK(SoftwareDevelopment Kit)、H5页面、互联网金融APP程序提交一个金融进项申请,其中金融APP还可以提供智能语音助手功能,图4所示的APP模块中右下角图标即代表智能语音助手,该功能的推出很大程度上可以减轻用户通过手机软键盘录入个人相关资料的压力,用户只需要通过语音就可以完成资料的录入,当不适合通过手机软键盘输入信息时该功能将非常有用;然后通过有线或无线通信网络,将该金融进项接入到任务匹配服务器;在任务分配服务器中一个金融进项会被自动匹配到不同的金融服务供应商;一般地,匹配服务器为第三方金融机构所拥有;进一步,对于进入金融服务系统中的进项数据,首先会经过数据预处理,然后存入图谱数据库中;所述图谱数据库,可以是Neo4J的图数据库,用于存储大量关于金融业务的知识图谱数据。进一步地,该金融进项会生成一个风险控制分析任务,该任务通过图查询的方式从图谱数据库中得到基于关系的数据,得到与该进项相关的关系数据。将这些关系数据输入至变量计算模块,得到关系数据对应的评估变量。进一步地,将评估变量输入至一个反欺诈评估模型,完成反欺诈识别;其中反欺诈评估模型可以基于机器学习的评估模型,例如该模型可以是基于决策树的GDBT模型或基于神经网络的深度模型。进一步地,将反欺诈识别的结果和变量数据输入至反欺和风控系统模块,该模块基于对应的决策流以及可选的人工的干预,完成对该进项的评估。
图5中给出了本公开多个图数据库和使用这些数据库的功能模块的示意图,其中子图构建模块负责从全量图数据库中抽取、计算并生成子图数据库。智能虚拟助理的意图分析模块将识别当前问答是基于常识图数据库还是信贷子图数据库中进行推理。反欺诈识别模块仍然基于全量图数据库。
根据之前用户语音输入问题,在子图谱中查询检索,并对检索结果进行加密处理,在不涉及隐私的情况下回答用户的问题。寻找问题的答案。如,用户问题为:我的父亲能否成为我的联系人。则在子图谱中检索一度边,寻找和当前用户关系为父亲的节点,若当前节点为黑则回答不能,基于保密的原则,部分答案的具体原因不会告知用户。既,子图是用真实信息建立的,系统通过真实信息在子图中进行查询,但是在返回结果时,对结果进行加工处理,返回加工后的结果,保证用户的隐私不被泄露。例如,当用户询问能否给我提供建议时,搜索模块在子图中查询该用户的一度关系,发现超过80%的一度关系用户都具有硕士学历并且为白名单,则返回结果:填写最高学历可以提高贷款成功率;而不会返回XXX和XXX都具有硕士学历,建议填写最高学历。
本公开可以提高特定专业系统提供的语音助手回答问题的准确度,同时提升响应速度,并且在提供语音助手服务的过程中,对系统中本就存在的图数据库进行复用,在没有引入太多额外消耗的情况下,改进了系统的功能。
图6是根据本公开的一些实施例所示的一种基于知识图谱的语音辅助装置示意图。如图6所示,基于知识图谱的语音辅助装置600包括子图谱建立模块601、语音识别模块602、子图谱搜索模块603和问题查询模块604;其中,
子图谱建立模块601,用于根据用户已有的信息,提取整体知识图谱中所述用户的数据建立所述用户个人的子图谱;
语音识别模块602,用于接收所述用户语音输入的问题并进行识别;
子图谱搜索模块603,用于基于所述识别的结果,在所述子图谱中搜索与所述问题相关的所述用户的关系数据;
问题查询模块604,用于基于所述关系数据在知识库中查询所述问题的答案,至少以音频方式播报给所述用户。
在一些实施例中,所述子图谱建立模块包括:
用户标识模块,用于根据所述用户已有的信息,在所述整体知识图谱中唯一确定所述用户的个人节点;
一度提取模块,用于从所述用户的个人节点出发,提取与所述用户的个人节点一度关联的节点的信息;
二度提取模块,用于从所述一度关联的节点出发,根据所述用户的权限和/或数据的隐私程度,提取与所述用户的个人节点二度关联以上的节点的全部信息或统计信息。
在一些实施例中,所述语音识别模块包括:
文本识别模块,用于根据语音分词将所述语音输入识别为至少一个文本信息;
语义分析模块,用于对所述至少一个文本信息进行语义分析,提取出一个或多个特定类型的文本。
在一些实施例中,所述问题查询模块包括:
初次匹配模块,用于使用分类器在所述知识库的问题列表中对所述识别的结果文本进行匹配;
二次匹配模块,在所述匹配的置信度分数低于预设阈值时,使用所述分类器结合所述关系数据进行二次匹配;
匹配结果获取模块,用于在所述匹配或所述二次匹配的置信度分数大于等于所述预设阈值时,从所述问题列表中确定所述问题及对应的答案。
在一些实施例中,所述问题查询模块还包括:
异常处理模块,用于在所述二次匹配的置信度分数仍低于预设阈值时,提示所述用户对所述问题进行人工标记。
参考附图7,为本申请一个实施例提供的电子设备示意图。如图7所示,该电子设备700包括:
存储器730以及一个或多个处理器710;
其中,所述存储器730与所述一个或多个处理器710通信连接,所述存储器730中存储有可被所述一个或多个处理器执行的指令732,所述指令732被所述一个或多个处理器710执行,以使所述一个或多个处理器710执行本申请前述实施例中的方法。
具体地,处理器710和存储器730可以通过总线或者其他方式连接,图7中以通过总线740连接为例。处理器710可以为中央处理器(Central Processing Unit,CPU)。处理器710还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器730作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本申请实施例中的级联渐进网络等。处理器710通过运行存储在存储器730中的非暂态软件程序、指令以及功能模块732,从而执行处理器的各种功能应用以及数据处理。
存储器730可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器710所创建的数据等。此外,存储器730可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器730可选包括相对于处理器710远程设置的存储器,这些远程存储器可以通过网络(比如通过通信接口720)连接至处理器710。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本申请的一个实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可执行指令被执行后执行本申请前述实施例中的方法。
前述的计算机可读取存储介质包括以存储如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方式或技术来实现的物理易失性和非易失性、可移动和不可移动介质。计算机可读取存储介质具体包括,但不限于,U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、可擦除可编程只读存储器(EPROM)、电可擦可编程只读存储器(EEPROM)、闪存或其他固态存储器技术、CD-ROM、数字多功能盘(DVD)、HD-DVD、蓝光(Blue-Ray)或其他光存储设备、磁带、磁盘存储或其他磁性存储设备、或能用于存储所需信息且可以由计算机访问的任何其他介质。
尽管此处所述的主题是在结合操作系统和应用程序在计算机系统上的执行而执行的一般上下文中提供的,但本领域技术人员可以认识到,还可结合其他类型的程序模块来执行其他实现。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其他类型的结构。本领域技术人员可以理解,此处所述的本主题可以使用其他计算机系统配置来实践,包括手持式设备、多处理器系统、基于微处理器或可编程消费电子产品、小型计算机、大型计算机等,也可使用在其中任务由通过通信网络连接的远程处理设备执行的分布式计算环境中。在分布式计算环境中,程序模块可位于本地和远程存储器存储设备的两者中。
本领域普通技术人员可以意识到,结合本文中所本申请的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对原有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
综上所述,本公开提出了一种基于知识图谱的语音辅助方法、装置、电子设备及其计算机可读存储介质。本公开实施例通过知识图谱获取用户的关系数据,帮助获得问题中的隐含条件,实现了对语音问题的准确识别,从而提升了语音交互的成功率和效率。
应当理解的是,本公开的上述具体实施方式仅仅用于示例性说明或解释本公开的原理,而不构成对本公开的限制。因此,在不偏离本公开的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。此外,本公开所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims (10)

1.一种基于知识图谱的语音辅助方法,其特征在于,包括:
根据用户已有的信息,提取整体知识图谱中所述用户的数据建立所述用户个人的子图谱;
接收所述用户语音输入的问题并进行识别;
基于所述识别的结果,在所述子图谱中搜索与所述问题相关的所述用户的关系数据;
基于所述关系数据在知识库中查询所述问题的答案,至少以音频方式播报给所述用户。
2.根据权利要求1所述的方法,其特征在于,所述提取整体知识图谱中所述用户的数据包括:
根据所述用户已有的信息,在所述整体知识图谱中唯一确定所述用户的个人节点;
从所述用户的个人节点出发,提取与所述用户的个人节点一度关联的节点的信息;
从所述一度关联的节点出发,根据所述用户的权限和/或数据的隐私程度,提取与所述用户的个人节点二度关联以上的节点的全部信息或统计信息。
3.根据权利要求1所述的方法,其特征在于,所述识别包括:
根据语音分词将所述语音输入识别为至少一个文本信息;
对所述至少一个文本信息进行语义分析,提取出一个或多个特定类型的文本。
4.根据权利要求1所述的方法,其特征在于,所述基于所述关系数据在知识库中查询所述问题的答案包括:
使用分类器在所述知识库的问题列表中对所述识别的结果文本进行匹配;
在所述匹配的置信度分数低于预设阈值时,使用所述分类器结合所述关系数据进行二次匹配;
在所述匹配或所述二次匹配的置信度分数大于等于所述预设阈值时,从所述问题列表中确定所述问题及对应的答案。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
在所述二次匹配的置信度分数仍低于预设阈值时,提示所述用户对所述问题进行人工标记。
6.一种基于知识图谱的语音辅助装置,其特征在于,包括:
子图谱建立模块,用于根据用户已有的信息,提取整体知识图谱中所述用户的数据建立所述用户个人的子图谱;
语音识别模块,用于接收所述用户语音输入的问题并进行识别;
子图谱搜索模块,用于基于所述识别的结果,在所述子图谱中搜索与所述问题相关的所述用户的关系数据;
问题查询模块,用于基于所述关系数据在知识库中查询所述问题的答案,至少以音频方式播报给所述用户。
7.根据权利要求6所述的装置,其特征在于,所述子图谱建立模块包括:
用户标识模块,用于根据所述用户已有的信息,在所述整体知识图谱中唯一确定所述用户的个人节点;
一度提取模块,用于从所述用户的个人节点出发,提取与所述用户的个人节点一度关联的节点的信息;
二度提取模块,用于从所述一度关联的节点出发,根据所述用户的权限和/或数据的隐私程度,提取与所述用户的个人节点二度关联以上的节点的全部信息或统计信息。
8.根据权利要求6所述的装置,其特征在于,所述语音识别模块包括:
文本识别模块,用于根据语音分词将所述语音输入识别为至少一个文本信息;
语义分析模块,用于对所述至少一个文本信息进行语义分析,提取出一个或多个特定类型的文本。
9.根据权利要求6所述的装置,其特征在于,所述问题查询模块包括:
初次匹配模块,用于使用分类器在所述知识库的问题列表中对所述识别的结果文本进行匹配;
二次匹配模块,在所述匹配的置信度分数低于预设阈值时,使用所述分类器结合所述关系数据进行二次匹配;
匹配结果获取模块,用于在所述匹配或所述二次匹配的置信度分数大于等于所述预设阈值时,从所述问题列表中确定所述问题及对应的答案。
10.根据权利要求9所述的装置,其特征在于,所述问题查询模块还包括:
异常处理模块,用于在所述二次匹配的置信度分数仍低于预设阈值时,提示所述用户对所述问题进行人工标记。
CN201911001544.9A 2019-10-21 2019-10-21 基于知识图谱的语音辅助方法及装置 Pending CN110781280A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911001544.9A CN110781280A (zh) 2019-10-21 2019-10-21 基于知识图谱的语音辅助方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911001544.9A CN110781280A (zh) 2019-10-21 2019-10-21 基于知识图谱的语音辅助方法及装置

Publications (1)

Publication Number Publication Date
CN110781280A true CN110781280A (zh) 2020-02-11

Family

ID=69386175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911001544.9A Pending CN110781280A (zh) 2019-10-21 2019-10-21 基于知识图谱的语音辅助方法及装置

Country Status (1)

Country Link
CN (1) CN110781280A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111708898A (zh) * 2020-06-13 2020-09-25 广州华建工智慧科技有限公司 一种基于知识图谱的智能施工信息传递方法及系统
CN111739517A (zh) * 2020-07-01 2020-10-02 腾讯科技(深圳)有限公司 语音识别方法、装置、计算机设备及介质
CN111753063A (zh) * 2020-02-28 2020-10-09 北京沃东天骏信息技术有限公司 一种应答方法、装置、服务器及存储介质
CN111914180A (zh) * 2020-08-19 2020-11-10 腾讯科技(深圳)有限公司 基于图结构的用户特征确定方法、装置、设备及介质
CN113254666A (zh) * 2021-06-02 2021-08-13 上海酒贝乐信息技术有限公司 一种人工智能自我学习和成长完善的方法及系统
US11650980B2 (en) 2021-01-29 2023-05-16 Walmart Apollo, Llc Methods and apparatus for retrieving information via an intermediate representation

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107248937A (zh) * 2017-06-30 2017-10-13 北京百度网讯科技有限公司 一种基于物联网的与用户进行交互的方法与系统
CN108452526A (zh) * 2017-11-28 2018-08-28 腾讯科技(上海)有限公司 游戏故障原因的查询方法和装置、存储介质、电子装置
CN109241251A (zh) * 2018-07-27 2019-01-18 众安信息技术服务有限公司 一种会话交互方法
CN109360558A (zh) * 2018-10-15 2019-02-19 珠海格力电器股份有限公司 一种语音应答的方法和设备
CN110059173A (zh) * 2019-04-19 2019-07-26 辽宁工程技术大学 一种基于知识图谱的智能厨房问答助手系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107248937A (zh) * 2017-06-30 2017-10-13 北京百度网讯科技有限公司 一种基于物联网的与用户进行交互的方法与系统
CN108452526A (zh) * 2017-11-28 2018-08-28 腾讯科技(上海)有限公司 游戏故障原因的查询方法和装置、存储介质、电子装置
CN109241251A (zh) * 2018-07-27 2019-01-18 众安信息技术服务有限公司 一种会话交互方法
CN109360558A (zh) * 2018-10-15 2019-02-19 珠海格力电器股份有限公司 一种语音应答的方法和设备
CN110059173A (zh) * 2019-04-19 2019-07-26 辽宁工程技术大学 一种基于知识图谱的智能厨房问答助手系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111753063A (zh) * 2020-02-28 2020-10-09 北京沃东天骏信息技术有限公司 一种应答方法、装置、服务器及存储介质
CN111708898A (zh) * 2020-06-13 2020-09-25 广州华建工智慧科技有限公司 一种基于知识图谱的智能施工信息传递方法及系统
CN111739517A (zh) * 2020-07-01 2020-10-02 腾讯科技(深圳)有限公司 语音识别方法、装置、计算机设备及介质
CN111739517B (zh) * 2020-07-01 2024-01-30 腾讯科技(深圳)有限公司 语音识别方法、装置、计算机设备及介质
CN111914180A (zh) * 2020-08-19 2020-11-10 腾讯科技(深圳)有限公司 基于图结构的用户特征确定方法、装置、设备及介质
CN111914180B (zh) * 2020-08-19 2024-04-16 腾讯科技(深圳)有限公司 基于图结构的用户特征确定方法、装置、设备及介质
US11650980B2 (en) 2021-01-29 2023-05-16 Walmart Apollo, Llc Methods and apparatus for retrieving information via an intermediate representation
CN113254666A (zh) * 2021-06-02 2021-08-13 上海酒贝乐信息技术有限公司 一种人工智能自我学习和成长完善的方法及系统

Similar Documents

Publication Publication Date Title
CN110781280A (zh) 基于知识图谱的语音辅助方法及装置
CN107797984B (zh) 智能交互方法、设备及存储介质
TWI700632B (zh) 使用者意圖識別方法及裝置
US9582757B1 (en) Scalable curation system
CN111177359A (zh) 多轮对话方法和装置
CN110275965B (zh) 假新闻检测方法、电子装置及计算机可读存储介质
CN106202270B (zh) 基于自然语言的人机对话方法及装置
CN110110038B (zh) 话务预测方法、装置、服务器及存储介质
CN110347810B (zh) 对话式检索回答方法、装置、计算机设备及存储介质
US11526512B1 (en) Rewriting queries
CN110597844A (zh) 异构数据库数据统一访问方法及相关设备
CN111159334A (zh) 用于房源跟进信息处理的方法及系统
CN112785347A (zh) 基于知识图谱的智能客服问答推荐方法及系统
CN114091477A (zh) 一种数据处理方法及装置
CN111723559B (zh) 一种实时信息抽取方法及装置
CN113436614A (zh) 语音识别方法、装置、设备、系统及存储介质
CN112966076A (zh) 智能问答问题的生成方法、装置、计算机设备及存储介质
CN112288584A (zh) 保险报案处理方法、装置、计算机可读介质及电子设备
CN109388695B (zh) 用户意图识别方法、设备及计算机可读存储介质
CN113190660A (zh) 问卷调查的方法和装置
CN113111157B (zh) 问答处理方法、装置、计算机设备和存储介质
US20190279623A1 (en) Method for speech recognition dictation and correction by spelling input, system and storage medium
CN114242047A (zh) 一种语音处理方法、装置、电子设备及存储介质
CN112395402A (zh) 基于深度模型的推荐话术生成方法、装置和计算机设备
CN114154513B (zh) 一种领域语义网自动构建方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220613

Address after: 510000 floor 7, building S6, poly Yuzhu port, No. 848, Huangpu Avenue East, Huangpu District, Guangzhou, Guangdong

Applicant after: Jianlian Technology (Guangdong) Co.,Ltd.

Address before: 510623 Room 201, building a, No. 1, Qianwan 1st Road, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong

Applicant before: SHENZHEN ZHONGYING WEIRONG TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20200211

RJ01 Rejection of invention patent application after publication