CN113536788A - 信息处理方法、装置、存储介质及设备 - Google Patents

信息处理方法、装置、存储介质及设备 Download PDF

Info

Publication number
CN113536788A
CN113536788A CN202110855844.4A CN202110855844A CN113536788A CN 113536788 A CN113536788 A CN 113536788A CN 202110855844 A CN202110855844 A CN 202110855844A CN 113536788 A CN113536788 A CN 113536788A
Authority
CN
China
Prior art keywords
sentence pattern
target
keywords
information
business
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110855844.4A
Other languages
English (en)
Other versions
CN113536788B (zh
Inventor
童怡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shanghai Co ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202110855844.4A priority Critical patent/CN113536788B/zh
Publication of CN113536788A publication Critical patent/CN113536788A/zh
Application granted granted Critical
Publication of CN113536788B publication Critical patent/CN113536788B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种信息处理方法、装置、存储介质及设备。方法包括:对获取到的业务咨询信息进行关键词提取,以得到N个第一关键词;从第一映射表中确定N个第一关键词分别对应的实体类别,并对N个第一关键词分别对应的实体类别进行拼接处理,得到待匹配句式,从目标标注句式集合中确定与待匹配句式匹配的目标标注句式;在业务资料库中查询与目标标注句式和N个第一关键词均相关联的资料信息,输出资料信息。通过本申请,可以提高用于回复业务咨询信息的资料信息的准确性。

Description

信息处理方法、装置、存储介质及设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种信息处理方法、装置、存储介质及设备。
背景技术
从人工智能研究的初期开始,人们就致力于开发智能化的人机对话系统,为人民服务,代替一部分人工。人机对话被广泛的应用到各个领域和应用中,如苹果的siri、微软的cortana、百度度秘、阿里小蜜等个人助手,可穿戴设备、智能家居、智能客服等也都纷纷包含了对话系统。人机对话系统可以快速、高效、不间断的为人们提供服务,从而提升服务体验,在帮助企业提高服务质量的同时又能有效降低人力成本。
目前的对话系统中,一般是采用意图识别方法或者标准问题匹配方法,对用户问题进行理解,但由于用户问题无法明确界定,理解存在不确定性,进行单一的意图匹配或者问题匹配,准确性较低,对特殊领域(如金融或者化学等特定领域)中词语的理解比较不准确,进而导致回复用户问题的回复语的准确性较低。
发明内容
本申请实施例所要解决的技术问题在于,提供一种信息处理方法、装置、存储介质及设备,可以提高用于回复业务咨询信息的资料信息的准确性。
第一方面,本申请提供一种信息处理方法,包括:
对获取到的业务咨询信息进行关键词提取,以得到N个第一关键词,N为正整数;
从第一映射表中确定该N个第一关键词分别对应的实体类别,并对该N个第一关键词分别对应的实体类别进行拼接处理,得到待匹配句式,该第一映射表中包括关键词与实体类别之间的对应关系;
从目标标注句式集合中确定与该待匹配句式匹配的目标标注句式,该目标标注句式集合中包括多个标注句式,该目标标注句式是该目标标注句式集合中与该待匹配句式之间的匹配度最大的标注句式;
在业务资料库中查询与该目标标注句式和该N个第一关键词均相关联的资料信息,输出该资料信息,该业务资料库中包括一个或者多个查询组合对应的资料信息,一个该查询组合为一个标注句式与一个或者多个关键词之间的组合。
可见,本方案中通过确定业务咨询信息对应的目标标注句式,可以缩小业务咨询信息所要咨询的范围,这样也可以解决同一词语不同含义而导致理解错误等问题,可以改善不同业务咨询信息之间的混淆和交叉等问题。通过在业务资料库中确定与目标标注句式和N个第一关键词均相关联的资料信息,可以更好地确定业务咨询信息对应的资料信息,也可以提高资料信息的准确性。通过本申请,可以提高用于回复业务咨询信息的资料信息的准确性。
结合第一方面,在一些可能的实现方式中,该对获取到的业务咨询信息进行关键词提取,以得到N个第一关键词,包括:
对获取到的业务咨询信息进行关键词提取,获得该业务咨询信息中的N个初始关键词;
获取该N个初始关键词中的初始关键词Ti分别与关键词库中多个候选关键词之间的第一匹配度,i为小于或者等于N的正整数;
将该初始关键词Ti与该关键词库中多个候选关键词之间的多个第一匹配度中最大的第一匹配度所对应的候选关键词,确定为该初始关键词Ti对应的第一关键词;
从该关键词库中分别获取该N个初始关键词对应的第一关键词,得到N个第一关键词。
结合第一方面,在一些可能的实现方式中,该从目标标注句式集合中确定与该待匹配句式匹配的目标标注句式之前,该方法还包括:
对该业务咨询信息进行分类处理,得到该业务咨询信息所属的目标咨询类别;
从多个候选标注句式集合中,确定该目标咨询类别对应的目标标注句式集合,其中一个候选标注句式集合属于一个咨询类别,该目标标注句式集合是该多个候选标注句式集合中属于该目标咨询类别的候选标注句式集合。
结合第一方面,在一些可能的实现方式中,该从多个候选标注句式集合中确定该目标咨询类别对应的目标标注句式集合,包括:
获取第二映射表,该第二映射表中包括咨询类别与候选标注句式集合之间的对应关系;
从该第二映射表包括的多个候选标注句式集合中确定该目标咨询类别对应的候选标注句式集合;
将该目标咨询类别对应的候选标注句式集合,确定为该目标标注句式集合。
结合第一方面,在一些可能的实现方式中,该从目标标注句式集合中确定与该待匹配句式匹配的目标标注句式,包括:
获取该待匹配句式分别与该目标标注句式集合中多个标注句式之间的第二匹配度;
若该待匹配句式与该目标标注句式集合中多个标注句式之间的多个第二匹配度中存在等于预设阈值的第二匹配度,则将等于该预设阈值的第二匹配度所对应的标注句式,确定为目标标注句式;
若该待匹配句式与该目标标注句式集合中多个标注句式之间的多个第二匹配度中不存在等于该预设阈值的第二匹配度,则将该多个第二匹配度中最大的第二匹配度所对应的标注句式,确定为目标标注句式。
结合第一方面,在一些可能的实现方式中,该在业务资料库中查询与该目标标注句式以及该N个第一关键词均相关联的资料信息,输出该资料信息,包括:
将该目标标注句式与该N个第一关键词进行组合,得到目标查询组合;
获取业务资料库对应的接口数据,该业务资料库中包括一个或者多个查询组合对应的资料信息,一个该查询组合为一个标注句式与一个或者多个关键词之间的组合;
调用该接口数据,在该业务资料库中获取与该目标查询组合匹配度最大的查询组合对应的资料信息;
输出该资料信息。
结合第一方面,在一些可能的实现方式中,该在业务资料库中查询与该目标标注句式和该N个第一关键词均相关联的资料信息,输出该资料信息之前,该方法还包括:
获取该业务咨询信息对应的历史咨询信息,对该历史咨询信息进行关键词提取,得到该历史咨询信息对应的P个第二关键词,该历史咨询信息携带的用户标识与该业务咨询信息携带的用户标识相同,P为正整数;
从该第一映射表中获取该P个第二关键词分别对应的实体类别;
根据该P个第二关键词分别对应的实体类别,对该目标标注句式进行补充,得到补充后的目标标注句式;
该在业务资料库中查询与该目标标注句式和该N个第一关键词均相关联的资料信息,输出该资料信息,包括:
在业务资料库中查询与该补充后的目标标注句式和该N个第一关键词均相关联的资料信息,输出与该补充后的目标标注句式以及该N个第一关键词均相关联的资料信息。
第二方面,本申请提供一种信息处理装置,包括:
第一关键词提取模块,用于对获取到的业务咨询信息进行关键词提取,以得到N个第一关键词,N为正整数;
拼接处理模块,用于从第一映射表中确定该N个第一关键词分别对应的实体类别,并对该N个第一关键词分别对应的实体类别进行拼接处理,得到待匹配句式,该第一映射表中包括关键词与实体类别之间的对应关系;
第一确定模块,用于从目标标注句式集合中确定与该待匹配句式匹配的目标标注句式,该目标标注句式集合中包括多个标注句式,该目标标注句式是该目标标注句式集合中与该待匹配句式之间的匹配度最大的标注句式;
输出模块,用于在业务资料库中查询与该目标标注句式和该N个第一关键词均相关联的资料信息,输出该资料信息,该业务资料库中包括一个或者多个查询组合对应的资料信息,一个该查询组合为一个标注句式与一个或者多个关键词之间的组合。
结合第二方面,在一些可能的实现方式中,第一关键词提取模块包括:
关键词提取单元,用于对获取到的业务咨询信息进行关键词提取,获得该业务咨询信息中的N个初始关键词;
第一获取单元,用于获取该N个初始关键词中的初始关键词Ti分别与关键词库中多个候选关键词之间的第一匹配度,i为小于或者等于N的正整数;
第一确定单元,用于将该初始关键词Ti与该关键词库中多个候选关键词之间的多个第一匹配度中最大的第一匹配度所对应的候选关键词,确定为该初始关键词Ti对应的第一关键词;
第二获取单元,用于从该关键词库中分别获取该N个初始关键词对应的第一关键词,得到N个第一关键词。
结合第二方面,在一些可能的实现方式中,信息处理装置还包括:
分类处理模块,用于对该业务咨询信息进行分类处理,得到该业务咨询信息所属的目标咨询类别;
第二确定模块,用于从多个候选标注句式集合中确定该目标咨询类别对应的目标标注句式集合,其中一个候选标注句式集合属于一个咨询类别,该目标标注句式集合是该多个候选标注句式集合中属于该目标咨询类别的候选标注句式集合。
结合第二方面,在一些可能的实现方式中,第二确定模块包括:
第三获取单元,用于获取第二映射表,该第二映射表中包括咨询类别与候选标注句式集合之间的对应关系;
第二确定单元,用于从该第二映射表包括的多个候选标注句式集合中确定该目标咨询类别对应的候选标注句式集合;将该目标咨询类别对应的候选标注句式集合,确定为该目标标注句式集合。
结合第二方面,在一些可能的实现方式中,第一确定模块包括:
第四获取单元,用于获取该待匹配句式分别与该目标标注句式集合中多个标注句式之间的第二匹配度;
第三确定单元,用于若该待匹配句式与该目标标注句式集合中多个标注句式之间的多个第二匹配度中存在等于预设阈值的第二匹配度,则将等于该预设阈值的第二匹配度所对应的标注句式,确定为目标标注句式;
第四确定单元,用于若该待匹配句式与该目标标注句式集合中多个标注句式之间的多个第二匹配度中不存在等于该预设阈值的第二匹配度,则将该多个第二匹配度中最大的第二匹配度所对应的标注句式,确定为目标标注句式。
结合第二方面,在一些可能的实现方式中,输出模块包括:
组合单元,用于将该目标标注句式与该N个第一关键词进行组合,得到目标查询组合;
第五获取单元,用于获取业务资料库对应的接口数据,该业务资料库中包括一个或者多个查询组合对应的资料信息,一个该查询组合为一个标注句式与一个或者多个关键词之间的组合;
调用单元,用于调用该接口数据,在该业务资料库中获取与该目标查询组合匹配度最大的查询组合对应的资料信息;
第一输出单元,用于输出该资料信息。
结合第二方面,在一些可能的实现方式中,信息处理装置还包括:
第二关键词提取模块,用于获取该业务咨询信息对应的历史咨询信息,对该历史咨询信息进行关键词提取,得到该历史咨询信息对应的P个第二关键词,该历史咨询信息携带的用户标识与该业务咨询信息携带的用户标识相同,P为正整数;
获取模块,用于从该第一映射表中获取该P个第二关键词分别对应的实体类别;
补充模块,用于根据该P个第二关键词分别对应的实体类别,对该目标标注句式进行补充,得到补充后的目标标注句式;
该输出模块还包括:
第二输出单元,用于在业务资料库中查询与该补充后的目标标注句式和该N个第一关键词均相关联的资料信息,输出与该补充后的目标标注句式以及该N个第一关键词均相关联的资料信息。
第三方面,本申请提供了一种计算机设备,包括存储器和处理器,存储器与处理器相连,存储器用于存储计算机程序,处理器用于调用计算机程序,以使得该计算机设备执行上述第一方面提供的方法。
第四方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,计算机程序适于由处理器加载并执行,以使得具有处理器的计算机设备执行上述第一方面提供的方法。
第五方面,本申请一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面中的方法。
本申请实施例中,通过对获取到的业务咨询信息进行关键词提取,以得到N个第一关键词,从第一映射表中确定N个第一关键词分别对应的实体类别,并对N个第一关键词分别对应的实体类别进行拼接处理,得到待匹配句式,从目标标注句式集合中确定与待匹配句式匹配的目标标注句式。通过确定业务咨询信息对应的目标标注句式,可以缩小业务咨询信息所要咨询的范围,这样也可以解决同一词语不同含义而导致理解错误等问题,可以改善不同业务咨询信息之间的混淆和交叉等问题。在业务资料库中查询与目标标注句式和N个第一关键词均相关联的资料信息,输出资料信息。业务资料库中的资料信息是业务开展过程中所积累的,相对于在一般资料库中直接搜索与目标标注句式和N个第一关键词均相关联的资料信息,本方案中通过在业务资料库中确定与目标标注句式和N个第一关键词均相关联的资料信息,可以更好地确定业务咨询信息对应的资料信息,也可以提高资料信息的准确性。通过本申请,可以提高用于回复业务咨询信息的资料信息的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种信息处理系统的架构示意图;
图2是本申请实施例提供的一种信息处理方法的流程示意图;
图3是本申请实施例提供的一种确定业务咨询信息对应的资料信息方法的示意图;
图4是本申请实施例提供的一种信息处理的应用场景图;
图5是本申请实施例提供的一种信息处理方法的流程示意图;
图6是本申请实施例提供的一种信息处理装置的结构示意图;
图7是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
见图1,图1是本申请实施例提供的一种信息处理系统的结构示意图。如图1所示,该信息处理系统可以包括服务器10和用户终端集群。该用户终端集群可以包括一个或者多个用户终端,这里将不对用户终端的数量进行限制。如图1所示,具体可以包括用户终端100a、用户终端100b、用户终端100c、…、用户终端100n。如图1所示,用户终端100a、用户终端100b、用户终端100c、…、用户终端100n可以分别与上述服务器10进行网络连接,以便于每个用户终端可以通过该网络连接与服务器10进行数据交互。
其中,该用户终端集群中的每个用户终端均可以包括:智能手机、平板电脑、笔记本电脑、桌上型电脑、可穿戴设备、智能家居、头戴设备等具有信息处理的智能终端。应当理解,如图1所示的用户终端集群中的每个用户终端均可以安装有目标应用(即应用客户端),当该应用客户端运行于各用户终端中时,可以分别与上述图1所示的服务器10之间进行数据交互。
其中,如图1所示,该服务器10可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
为便于理解,本申请实施例可以在图1所示的多个用户终端中选择一个用户终端作为目标用户终端,该目标用户终端可以包括:智能手机、平板电脑、笔记本电脑、桌上型电脑、智能电视等携带信息处理功能的智能终端。例如,为便于理解,本申请实施例可以将图1所示的用户终端100a作为目标用户终端为例。当用户终端100a接收到目标用户输入的业务咨询信息后,需要确定该业务咨询信息对应的回复资料信息时,用户终端可以将接收到的业务咨询信息发送给服务器10。服务器10接收到用户终端100a发送的业务咨询信息后,可以对该业务咨询信息进行关键词提取,以得到业务咨询信息中的N个第一关键词,N为正整数,如N可以取值为1,2,3…。服务器可以从第一映射表中确定N个第一关键词分别对应的实体类别,并对N个第一关键词分别对应的实体类别进行拼接处理,得到待匹配句式,该第一映射表中包括关键词与实体类别之间的对应关系。服务器10可以从目标标注句式集合中确定与待匹配句式匹配的目标标注句式,并在业务资料库中查询与目标标注句式和N个第一关键词均相关联的资料信息,输出该资料信息,该资料信息用于回复目标用户输入的业务咨询信息。通过本申请,可以提高用于回复目标用户输入的业务咨询信息的资料信息的准确性。
请参见图2,图2是本申请实施例提供的一种信息处理方法的流程示意图。该信息处理方法可由客户端和服务器交互执行,该客户端和服务器可以为服务器(如上述图1中的服务器10),或者用户终端(如上述图1的用户终端集群中的任一用户终端),或者为服务器和用户终端组成的系统,本申请对此不做限定。如图2所示,该信息处理方法可以包括步骤S101-S104。
S101,对获取到的业务咨询信息进行关键词提取,以得到N个第一关键词。
具体的,当计算机设备接收到用户输入的业务咨询信息后,可以获取业务咨询信息对应的资料信息,输出该资料信息,对用户输入的业务咨询信息进行解答。其中,计算机设备接收到用户输入的业务咨询信息后,可以对获取到的业务咨询信息进行关键词提取,以得到业务咨询信息中的N个第一关键词。其中,计算机设备对业务咨询信息进行关键词提取时,可以从关键词库中确定与业务咨询信息中的词语相匹配的候选关键词,作为第一关键词,该关键词库中包括多个候选关键词。例如,可以将关键词库中与业务咨询信息中的词语匹配度最大的候选关键词,作为第一关键。其中,计算机设备可以预先设置关键词库,该关键词库中包括多个候选关键词,计算机设备可以将业务开展过程中所收集的词语,添加至关键词库中,以此增加关键词库中的候选关键词的数量,以便更好的对用户输入的业务咨询信息进行关键词提取,提供关键词提取的准确性。另外,当开展业务为特定领域(如金融、化学等小领域)时,由于特定领域内的词语的含义有别于常规含义,或者采用常规解释不能准确的解释,设置关键词库时,可以通过与关键词库中的候选关键词进行匹配,可以更好地对业务咨询信息进行关键词提取,提高关键词提取的准确性。
可选的,计算机设备对获取到的业务咨询信息进行关键词提取,以得到N个第一关键词的具体方式可以包括:对获取到的业务咨询信息进行关键词提取,获得业务咨询信息中的N个初始关键词。获取N个初始关键词中的初始关键词Ti分别与关键词库中多个候选关键词之间的第一匹配度,i为小于或者等于N的正整数。将初始关键词Ti与关键词库中多个候选关键词之间的多个第一匹配度中最大的第一匹配度所对应的候选关键词,确定为初始关键词Ti对应的第一关键词。从关键词库中分别获取N个初始关键词对应的第一关键词,得到N个第一关键词。
具体的,计算机设备可以对获取到的业务咨询信息进行关键词提取,获得业务咨询信息中的N个初始关键词,获取预先设置的关键词库,该关键词库中包括多个候选关键词。计算机设备可以获取该N个初始关键词中的初始关键词Ti分别与关键词库中多个候选关键词之间的第一匹配度,i为正整数,如i可以取值为1,2,3……。将初始关键词Ti与关键词库中多个候选关键词之间的多个第一匹配度中最大的第一匹配度所对应的候选关键词,确定为初始关键词Ti对应的第一关键词。例如,初始关键词T1与关键词库中候选关键词1的匹配度为99%,与关键词库中候选关键词2的匹配度为20%,与关键词库中候选关键词3的匹配度为50%....。其中,初始关键词T1与关键词库中多个候选关键词之间的多个第一匹配度中最大的第一匹配度所对应的候选关键词为候选关键词1,因此可以将候选关键词1确定为初始关键词T1对应的第一关键词。计算机设备可以从关键词库中分别获取N个初始关键词中每个初始关键词对应的第一关键词,得到N个第一关键词。
S102,从第一映射表中确定N个第一关键词分别对应的实体类别,并对N个第一关键词分别对应的实体类别进行拼接处理,得到待匹配句式。
具体的,计算机设备可以从第一映射表中确定N个第一关键词分别对应的实体类别,即确定每个第一关键词分别对应的实体类别,该第一映射表中包括关键词与实体类别之间的对应关系。其中,实体类别可以是指对象类别,该对象可以是指产品、物品、学校、业务服务等具体对象,如金融领域内的对象包括易方达蓝筹、安增益等等,金融领域内的实体类别可以包括产品名称、基金类别、贷款业务名称、投资类别等等,可以根据具体业务领域进行自定义。其中,易方达蓝筹的实体类别可以是指产品名称,安增益的实体类别也可以是指产品名称。其中,计算机设备可以收集业务开展过程中的关键词,通过人工标注,确定收集到的关键词对应的实体类别,并将收集到的关键词与其对应的实体类别之间的对应关系存储至第一映射表中。其中,第一映射表可以是ES(ElasticSearch,分布式文档数据库),该ES中每个字段均可被索引,而且每个字段的数据均可被搜索,能够横向扩展至数以百计的服务器存储。通过ES,可以使关键词与实体类别直接关联起来,可以提高确定每个第一关键词对应的实体类别的准确性。计算机设备得到N个第一关键词中每个第一关键词分别对应的实体类别后,可以对N个第一关键词分别对应的实体类别进行拼接处理,得到待匹配句式。
例如,当用户输入的业务咨询信息为“易方达蓝筹的类别是什么”时,计算机设备可以对该业务咨询信息“易方达蓝筹的类别是什么”进行关键词提取,得到“易方达蓝筹”、“类别”两个第一关键词。计算机设备可以根据第一映射表,确定“易方达蓝筹”第一关键词对应的实体类别是产品名称,“类别”第一关键词对应的实体类别是基金类别。计算机设备对该“易方达蓝筹”、“类别”两个第一关键词分别对应的产品名称、基金类别进行拼接,得到待匹配句式【产品名称+基金类别】。
S103,从目标标注句式集合中确定与待匹配句式匹配的目标标注句式。
具体的,计算机设备得到业务咨询信息对应的待匹配句式后,可以从目标标注句式集合中确定与待匹配句式匹配的目标标注句式,目标标注句式集合中包括多个标注句式,目标标注句式是目标标注句式集合中与待匹配句式之间的匹配度最大的标注句式。目标标注句式集合中的多个标注句式是业务开展过程中,人工对用户的历史业务咨询信息进行标注得到,通过在目标标注句式集合中确定待匹配句式对应的目标标注句式,可以更好的在业务资料库中查找业务咨询信息对应的资料信息,也可以增加后续在业务资料库中确定相关资料的准确性,也能更好的确定业务咨询信息所需要咨询的内容。
可选的,计算机设备在从目标标注句式集合中确定与待匹配句式匹配的目标标注句式之前,还可以对业务咨询信息进行分类处理,得到业务咨询信息所属的目标咨询类别。从多个候选标注句式集合中确定目标咨询类别对应的目标标注句式集合,其中一个候选标注句式集合属于一个咨询类别,目标标注句式集合是多个候选标注句式集合中属于目标咨询类别的候选标注句式集合。
具体的,计算机设备可以对用户输入的业务咨询信息进行分类处理,得到业务咨询信息所属的目标咨询类别,如可以通过咨询类别分类模型,对业务咨询信息进行分类处理,得到业务咨询信息对应的目标咨询类别。其中,目标咨询类别可以根据具体业务领域进行设置,如在金融业务领域,目标咨询类别可以是产品购买咨询类别、产品咨询类别以及产品售后咨询类别等,可以根据具体情况进行具体设置,本申请实施例在此不做限制。例如,用户输入的业务咨询范围为“易方达蓝筹的类别是什么”时,该业务咨询信息所属的目标咨询类别可以为产品咨询类别。通过确定业务咨询信息所属的目标咨询类别,可以过滤掉一些不相关的其他咨询类别,从而缩小业务咨询信息的咨询类别范围,即缩小业务咨询信息所需要咨询的问题范围。
其中,计算机设备得到业务咨询信息所属的目标咨询类别后,可以从多个候选标注句式集合中,确定目标咨询类别对应的目标标注句式集合。其中,一个候选标注句式集合中包括的多个标注句式均属于一个咨询类别,目标标注句式集合是多个候选标注句式集合中属于目标咨询类别的候选标注句式集合。每个候选标注句式集合中的标识句式,是人工对用户的历史业务咨询信息进行整理标注得到的,每个历史业务咨询信息都有所属的咨询类别,因此可以历史业务咨询信息所属的咨询类别,确定为整理标注得到的标注句式所属的咨询类别。如用户的历史业务咨询信息为“易方达蓝筹的类别是什么”,人工整理标注得到的标注句式为【产品名称+基金类别】,历史业务咨询信息为“易方达蓝筹的类别是什么”所属的咨询类别为产品咨询类别,因此标注句式为【产品名称+基金类别】所属的咨询类别为产品咨询类别,可以将标注句式【产品名称+基金类别】放入产品咨询类别对应的候选标注句式集合中。以此,每个候选标注句式集合中的多个标注句式均有所属的咨询类别,且一个候选标注句式集合中的多个标注句式均属于一个咨询类别。
可选的,计算机设备从多个候选标注句式集合中确定目标咨询类别对应的目标标注句式集合的具体方式可以包括:获取第二映射表,第二映射表中包括咨询类别与候选标注句式集合之间的对应关系。从第二映射表包括的多个候选标注句式集合中确定目标咨询类别对应的候选标注句式集合,将目标咨询类别对应的候选标注句式集合,确定为目标标注句式集合。
具体的,计算机设备可以获取第二映射表,该第二映射表中包括咨询类别与候选标注句式集合之间的对应关系,一个咨询类别对应一个候选标注句式集合,一个候选标注句式集合中包括多个标注句式,即一个候选标注句式集合中的多个标注句式均属于一个咨询类别。从第二映射表包括的多个候选标注句式集合中,确定目标咨询类别对应的候选标注句式集合,将目标咨询类别对应的候选标注句式集合,确定为目标标注句式集合。通过目标咨询类别,从多个候选标注句式集合中确定目标标注句式集合,这样可以减少待匹配句式的匹配范围,提高对待匹配句式进行匹配的匹配准确性,以此使匹配得到的目标标注句式更能反映出用户的业务咨询信息的咨询范围,同时也可以减少匹配的计算量,提高匹配效率。
可选的,计算机设备从目标标注句式集合中确定与待匹配句式匹配的目标标注句式的具体方式可以包括:获取待匹配句式分别与目标标注句式集合中多个标注句式之间的第二匹配度。若待匹配句式与目标标注句式集合中多个标注句式之间的多个第二匹配度中存在等于预设阈值的第二匹配度,则将等于预设阈值的第二匹配度所对应的标注句式,确定为目标标注句式。若待匹配句式与目标标注句式集合中多个标注句式之间的多个第二匹配度中不存在等于预设阈值的第二匹配度,则将多个第二匹配度中最大的第二匹配度所对应的标注句式,确定为目标标注句式。
具体的,计算机设备可以获取待匹配句式分别与目标标注句式集合中多个标注句式之间的第二匹配度,即待匹配句式与目标标注句式集合中的一个标注句式产生一个第二匹配度。若待匹配句式与目标标注句式集合中多个标注句式之间的多个第二匹配度中存在等于预设阈值的第二匹配度,则将等于预设阈值的第二匹配度所对应的标注句式,确定为目标标注句式。预设阈值可以是指100%、90%或者80%等,可以根据具体情况进行设置,本申请实施例在此不作限制。例如,当预设阈值为100%时,若待匹配句式与目标标注句式集合中多个标注句式之间的多个第二匹配度中存在100%的第二匹配度,则将等于100%的第二匹配度所对应的第一标注句式,确定为目标标注句式。若待匹配句式与目标标注句式集合中多个标注句式之间的多个第二匹配度中不存在等于预设阈值的第二匹配度,则将多个第二匹配度中最大的第二匹配度所对应的标注句式,确定为目标标注句式。例如,当预设阈值为100%时,待匹配句式与目标标注句式集合中多个标注句式之间的多个第二匹配度为96%、90%以及80%,不存在等于100%的第二匹配度,则将多个第二匹配度96%、90%以及80%中最大的第二匹配度96%所对应的第二标注句式,确定为目标标注句式。
例如,当待匹配句式为【产品名称+基金类别】,目标标注句式集合中存在标注句式【产品名称+基金类别】和【产品名称+基金净值】,其中标注句式【产品名称+基金类别】与待匹配句式【产品名称+基金类别】之间的匹配度为100%,标注句式【产品名称+基金净值】与待匹配句式【产品名称+基金类别】之间的匹配度为75%。当预设阈值为100%,则待匹配句式对应的目标标注句式为【产品名称+基金类别】。该目标标注句式可以用于确定需要查询的资料信息,不同标注句式所需要查询的资料信息是不一样的,如目标标注句式【产品名称+基金类别】所需要查询的资料信息为产品的名称以及该产品对应的基金类别。目标标注句式【产品名称+基金类别+基金净值】需要查询的资料信息为产品的名称、该产品对应的基金类别以及该产品对应的基金净值,两个目标标注句式所对应的资料信息是不一样的。
S104,在业务资料库中查询与目标标注句式和N个第一关键词均相关联的资料信息,输出资料信息。
具体的,计算机设备确定目标标注句式后,可以在业务资料库汇总查询与目标标注句式和N个第一关键词均相关联的资料信息,将该资料信息作为用户输入的业务咨询信息对应的咨询反馈信息,向用户输出该资料信息。其中,业务资料库中包括一个或者多个查询组合对应的资料信息,一个查询组合为一个标注句式与一个或者多个关键词之间的组合,即一个查询组合中包括一个标注句式和一个关键词,或者,一个查询组合中包括一个标注句式和多个关键词。可以在业务资料库中,查询与目标标注句式和N个第一关键词均相关联的资料信息,该业务资料库可以根据具体业务领域进行设置,如一个业务领域设置一个业务资料库,如金融业务领域设置一个业务资料库。这样,可以减少确定与目标标注句式和N个第一关键词均相关联的资料信息的查询范围,可以提高查询效率,同时也可以提高查询的准确性。
可选的,计算机设备在业务资料库中查询与目标标注句式以及N个第一关键词均相关联的资料信息,输出资料信息的具体方式可以包括:将目标标注句式与N个第一关键词进行组合,得到目标查询组合。获取业务资料库对应的接口数据,业务资料库中包括一个或者多个查询组合对应的资料信息,一个查询组合为一个标注句式与一个或者多个关键词之间的组合。调用接口数据,在业务资料库中获取与目标查询组合匹配度最大的查询组合对应的资料信息,输出资料信息。
具体的,计算机设备可以将目标标注句式与N个第一关键词进行组合,得到目标查询组合,即直接组合得到目标查询组合,例如目标标注句式为【产品名称+基金类别】,N个第一关键词为【易方达蓝筹,类别】,则可以直接对目标标注句式【产品名称+基金类别】和N个第一关键词【易方达蓝筹,类别】进行组合,得到目标查询组合【产品名称+基金类别】+【易方达蓝筹,类别】。计算机设备可以获取业务资料库对应的接口数据,该业务资料库中包括一个或者多个查询组合对应的资料信息,一个查询组合为一个标注句式与一个或者多个关键词之间的组合。调用业务数据库对应的接口数据,在业务资料库中获取与目标查询组合匹配度最大的查询组合对应的资料信息,输出该资料信息。即可以在业务资料库中,确定与目标查询组合匹配度最大的咨询组合,将该匹配度最大的查询组合对应的资料信息,确定为目标查询组合对应的资料信息。
其中,业务资料库中的资料信息是在进行业务处理过程中所积累得到的,这样,在确定业务咨询信息对应的资料信息时,可以更好的利用当前已有的资料信息,也可以解决一些特定领域内词语比较生僻,采用常规的解释含义进行理解容易导致理解错误等问题。其中,在设置业务资料库时,可以根据业务种类进行设置,一个业务种类对应一个业务资料库,如金融业务领域对应一个业务资料库,这样,可以更快速且准确的查询到业务咨询信息对应的资料信息,可以提高资料信息的准确性。
例如,当用户输入的业务咨询信息为“苹果7多少钱”时,终端设备在获取业务咨询信息“苹果7多少钱”中的第一关键词“苹果7”和第一关键词“价格”。当获取第一关键词“苹果7”和第一关键词“价格”分别对应的实体类别时,第一关键词“苹果7”对应的实体类别为产品名称,第一关键词“价格”对应的实体类别为产品价格,对产品名称和产品价格进行拼接,得到待匹配句式【产品名称+产品价格】。对待匹配句式【产品名称+产品价格】进行匹配时,待匹配句式【产品名称+产品价格】对应的目标标注句式为【产品名称+产品价格】,这样,根据目标标注句式【产品名称+产品价格】,以及第一关键词“苹果7”和第一关键词“价格”,可以更准确的业务资料库中确定用户“苹果7多少钱”对应的资料信息(即用户回复语)。而相关技术中直接对用户问题“苹果7多少钱”进行意图识别或者标准问题匹配时,可以能会存在对苹果的含义进行识别时出现偏差,导致业务咨询信息对应的目标回复语句不准确,或者,当第一关键词过于生僻时,不能识别出第一关键词的含义。其中,本方案通过在业务资料库中获取业务咨询信息对应的资料信息,相对于直接在相关网站进行搜索,可以很好地回复特定领域的业务咨询信息。
如图3所示,图3是本申请实施例提供的一种确定业务咨询信息对应的资料信息方法的示意图,如图3所示,计算机设备获取到用户输入的业务咨询信息30a后,可以将业务咨询信息30a输入分词系统30b中,对业务咨询信息30a进行关键词提取,以得到业务咨询信息中的N个第一关键词。计算机设备还可以将业务咨询信息30a输入咨询类别过滤模块30c中,对业务咨询信息30a进行分类处理,得到业务咨询信息30a对应的目标咨询类别。计算机设备可以获取N个第一关键词分别对应的实体类别,对N个第一关键词分别对应的实体类别进行拼接处理,得到待匹配句式。计算机设备可以根据目标咨询类别确定目标标注句式集合,在句式匹配模块30d中,从目标标注句式集合中确定与待匹配句式匹配的目标标注句式。计算机设备可以根据目标标注句式以及N个第一关键词,从业务资料库30e中,确定业务咨询信息对应的资料信息30f。
如图4所示,图4是本申请实施例提供的一种信息处理的应用场景图,如图4所示,业务咨询信息可以是指金融业务咨询信息,目标用户40a可以通过用户终端40b输入针对金融业务的业务咨询信息。如图4所示,通过展示页面40c,对与目标用户40a交互的过程进行展示,用户终端40b接收到目标用户40a输入的业务咨询信息“易方达蓝筹的类别是什么”后,可以将该业务咨询信息“易方达蓝筹的类别是什么”发送给服务器40d。服务器40d接收到用户终端发送的业务咨询信息“易方达蓝筹的类别是什么”后,获取业务咨询信息“易方达蓝筹的类别是什么”中的N个第一关键词以及目标标注句式,并根据N个第一关键词以及目标标注句式,在业务资料库中查询业务咨询信息“易方达蓝筹的类别是什么”对应的资料信息。服务器可以将业务咨询信息对应的资料信息返回给用户终端40b。如图4所示,通过展示页面40e,对业务咨询信息对应的资料信息进行展示,以回复用户输入的业务咨询信息“易方达蓝筹的类别是什么”。
在本申请实施例中,通过对获取到的业务咨询信息进行关键词提取,以得到N个第一关键词,从第一映射表中确定N个第一关键词分别对应的实体类别,并对N个第一关键词分别对应的实体类别进行拼接处理,得到待匹配句式。从目标标注句式集合中确定与待匹配句式匹配的目标标注句式,通过确定业务咨询信息的目标咨询类别,通过目标咨询类别,从多个候选标注句式集合中确定目标标注句式集合,这样可以减少待匹配句式的匹配范围,提高对待匹配句式进行匹配的匹配准确性,以此使匹配得到的目标标注句式更能反映出用户的业务咨询信息的咨询范围,同时也可以减少匹配的计算量,提高匹配效率。通过确定业务咨询信息对应的目标标注句式,可以缩小业务咨询信息所要咨询的范围,这样也可以解决同一词语不同含义而导致理解错误等问题,可以改善不同业务咨询信息之间的混淆和交叉等问题。在业务资料库中查询与目标标注句式和N个第一关键词均相关联的资料信息,输出资料信息。业务资料库中的资料信息是业务开展过程中所积累的,相对于在一般资料库中直接搜索与目标标注句式和N个第一关键词均相关联的资料信息,本方案中通过在业务资料库中确定与目标标注句式和N个第一关键词均相关联的资料信息,可以更好地确定业务咨询信息对应的资料信息,也可以提高资料信息的准确性。通过本申请,可以提高用于回复业务咨询信息的资料信息的准确性。
请参见图5,图5是本申请实施例提供的一种信息处理方法的流程示意图。该信息处理方法可由计算机设备执行,该计算机设备可以为服务器(如上述图1中的服务器10),或者用户终端(如上述图1的用户终端集群中的任一用户终端),或者为服务器和用户终端组成的系统,本申请对此不做限定。如图5所示,该信息处理方法可以包括步骤S201-S207。
S201,对获取到的业务咨询信息进行关键词提取,以得到N个第一关键词。
S202,从第一映射表中确定N个第一关键词分别对应的实体类别,并对N个第一关键词分别对应的实体类别进行拼接处理,得到待匹配句式。
S203,从目标标注句式集合中确定与待匹配句式匹配的目标标注句式。
具体的,本申请实施例中步骤S201-S203的具体内容可以参看图2实施例中步骤S101-S103的内容,本申请实施例在此不再累述。
S204,获取业务咨询信息对应的历史咨询信息,对历史咨询信息进行关键词提取,得到历史咨询信息对应的P个第二关键词。
具体的,由于该业务咨询信息是由用户输入的,因此计算机设备可以获取业务咨询信息所携带的用户标识,根据该用户标识,获取用户标识对应的目标用户历史输入的历史咨询信息,即获取业务咨询信息对应的历史咨询信息。其中,该历史咨询信息可以是指用户标识对应的目标用户在预设时间内的历史咨询信息,计算机设备可以获取业务咨询信息的第一时间戳,根据该第一时间戳,确定目标用户在预设时间内的历史咨询信息。例如,若预设时间为12小时,业务咨询信息的第一时间戳为13:40,则可以将目标用户在1:40-13:40内的咨询信息确定为历史咨询信息。计算机设备得到业务咨询信息对应的历史咨询信息后,可以对历史咨询信息进行关键词提取,得到历史咨询信息对应的P个第二关键词。其中,对历史咨询信息进行关键词提取的方法,可以参看图2所描述的实施例中对业务咨询信息进行关键词提取的方法,本申请实施例在此不再累述。
S205,从第一映射表中获取P个第二关键词分别对应的实体类别。
具体的,计算机设备得到P个第二关键词后,可以从第一映射表中,查询P个第二关键词分别对应的实体类别。
S206,根据P个第二关键词分别对应的实体类别,对目标标注句式进行补充,得到补充后的目标标注句式。
具体的,计算机设备可以根据P个第二关键词分别对应的实体类别,对目标标注句式进行补充,补全目标标注句式中缺少的关键词,得到补充后的目标标注句式。其中,计算机设备在对目标标注句式进行补充时,可以对目标标注句式进行检测,检测目标标注句式中是否缺少实体类别。其中,可以通过检测模型对目标标注句式进行检测,检测目标标注句式中是否缺少实体类别,该检测模型用于检测标注句式中缺少的实体类别,该检测模型可以通过人工标注训练数据进行训练得到。当检测出目标标注句式中缺少的缺失实体类别后,可以从P个第二关键词分别对应的实体类别中,获取目标标注句式所缺少的实体类别,对目标标注句式进行补充,得到补充后的目标标注句式。
例如,用户输入的历史咨询信息为“易方达蓝筹的类别是什么”,用户输入的业务咨询信息为“那基金净值呢”,从而出现业务咨询信信息中存在部分关键省略的问题。这样,计算机设备获取业务咨询信息“那基金净值呢”中的第一关键词为基金净值,该第一关键词基金净值对应的实体类别也为基金净值,因此计算机设备获取到业务咨询信息对应的目标标注句式为【基金净值】。同理,计算机设备可以确定历史咨询信息为“易方达蓝筹的类别是什么”的目标标注句式为【产品名称+基金类别】。计算机设备采用预测模型检测业务咨询信息对应的目标标注句式【基金净值】中是否存在缺少实体类别时,可以检测出该目标标注句式【基金净值】是缺少实体类别的,即缺少对象实体类别。因此可以采用历史咨询信息对应的实体类别【产品名称+基金类别】,对业务咨询信息对应的实体类别【基金净值】进行补充,得到补充后的目标标注句式【产品名称+基金净值】。即在确定用户的业务咨询信息对应的资料信息时,可以结合用户输入的历史咨询信息,对业务咨询信息进行补充,可以解决业务咨询信息中指代不明的问题,即利用上文信息预测下一轮的回复内容。这样补全业务咨询信息中部分内容省略的内容,可以提高业务咨询信息对应的资料信息的准确性,从而提高用户的对话体验感。
S207,在业务资料库中查询与补充后的目标标注句式和N个第一关键词均相关联的资料信息,输出与补充后的目标标注句式以及N个第一关键词均相关联的资料信息。
具体的,计算机设备得到补充后的目标标注句式后,可以在业务资料库中,查询与补充后的目标标注句式和N个第一关键均相关联的资料信息,输出与补充后的目标标注句式以及N个第一关键词均相关联的资料信息。其中,在在业务资料库中查询资料信息时,可以结合P个第二关键词,确定与补充后的目标标注句式和N个第一关键均相关联的资料信息。这样,可以提高业务咨询信息对应的资料信息的准确性。
其中,业务资料库中的资料信息是在业务开展过程中所积累的,嵌入了个性化的结构数据,利用某个特定领域内业务资料库的资料信息的优势,可以解决用户输入的特定业务咨询信息,可以提高人机对话的准确性,提高用户的对话体验感。
在本申请实施例中,通过对获取到的业务咨询信息进行关键词提取,以得到N个第一关键词,从第一映射表中确定N个第一关键词分别对应的实体类别,并对N个第一关键词分别对应的实体类别进行拼接处理,得到待匹配句式。从目标标注句式集合中确定与待匹配句式匹配的目标标注句式,通过确定业务咨询信息的目标咨询类别,通过目标咨询类别,从多个候选标注句式集合中确定目标标注句式集合,这样可以减少待匹配句式的匹配范围,提高对待匹配句式进行匹配的匹配准确性,以此使匹配得到的目标标注句式更能反映出用户的业务咨询信息的咨询范围,同时也可以减少匹配的计算量,提高匹配效率。通过确定业务咨询信息对应的目标标注句式,可以缩小业务咨询信息所要咨询的范围,这样也可以解决同一词语不同含义而导致理解错误等问题,可以改善不同业务咨询信息之间的混淆和交叉等问题。得到目标标注句式后,还可以根据历史咨询信息中P个第二关键词分别对应的实体类别,对目标标注句式进行补充,这样,这补全业务咨询信息中部分内容省略的内容,可以提高业务咨询信息对应的资料信息的准确性,从而提高用户的对话体验感。在业务资料库中查询与补充后的目标标注句式和N个第一关键词均相关联的资料信息,输出资料信息。业务资料库中的资料信息是业务开展过程中所积累的,相对于在一般资料库中直接搜索与目标标注句式和N个第一关键词均相关联的资料信息,本方案中通过在业务资料库中确定与目标标注句式和N个第一关键词均相关联的资料信息,可以更好地确定业务咨询信息对应的资料信息,也可以提高资料信息的准确性。通过本申请,可以提高用于回复业务咨询信息的资料信息的准确性。
请参见图6,图6是本申请实施例提供的一种信息处理装置的结构示意图。上述信息处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码),例如该信息处理装置为一个应用软件;该信息处理装置可以用于执行本申请实施例提供的信息处理方法中的相应步骤。如图6所示,该信息处理装置可以包括:第一关键词提取模块11、拼接处理模块12、第一确定模块13、输出模块14、分类处理模块15、第二确定模块16、第二关键词提取模块17、获取模块18、补充模块19。
第一关键词提取模块11,用于对获取到的业务咨询信息进行关键词提取,以得到N个第一关键词,N为正整数;
拼接处理模块12,用于从第一映射表中确定该N个第一关键词分别对应的实体类别,并对该N个第一关键词分别对应的实体类别进行拼接处理,得到待匹配句式,该第一映射表中包括关键词与实体类别之间的对应关系;
第一确定模块13,用于从目标标注句式集合中确定与该待匹配句式匹配的目标标注句式,该目标标注句式集合中包括多个标注句式,该目标标注句式是该目标标注句式集合中与该待匹配句式之间的匹配度最大的标注句式;
输出模块14,用于在业务资料库中查询与该目标标注句式和该N个第一关键词均相关联的资料信息,输出该资料信息,该业务资料库中包括一个或者多个查询组合对应的资料信息,一个该查询组合为一个标注句式与一个或者多个关键词之间的组合。
结合第二方面,在一些可能的实现方式中,第一关键词提取模块11包括:
关键词提取单元1101,用于对获取到的业务咨询信息进行关键词提取,获得该业务咨询信息中的N个初始关键词;
第一获取单元1102,用于获取该N个初始关键词中的初始关键词Ti分别与关键词库中多个候选关键词之间的第一匹配度,i为小于或者等于N的正整数;
第一确定单元1103,用于将该初始关键词Ti与该关键词库中多个候选关键词之间的多个第一匹配度中最大的第一匹配度所对应的候选关键词,确定为该初始关键词Ti对应的第一关键词;
第二获取单元1104,用于从该关键词库中分别获取该N个初始关键词对应的第一关键词,得到N个第一关键词。
结合第二方面,在一些可能的实现方式中,信息处理装置还包括:
分类处理模块15,用于对该业务咨询信息进行分类处理,得到该业务咨询信息所属的目标咨询类别;
第二确定模块16,用于从多个候选标注句式集合中确定该目标咨询类别对应的目标标注句式集合,其中一个候选标注句式集合属于一个咨询类别,该目标标注句式集合是该多个候选标注句式集合中属于该目标咨询类别的候选标注句式集合。
结合第二方面,在一些可能的实现方式中,第二确定模块16包括:
第三获取单元1601,用于获取第二映射表,该第二映射表中包括咨询类别与候选标注句式集合之间的对应关系;
第二确定单元1602,用于从该第二映射表包括的多个候选标注句式集合中确定该目标咨询类别对应的候选标注句式集合;将该目标咨询类别对应的候选标注句式集合,确定为该目标标注句式集合。
结合第二方面,在一些可能的实现方式中,第一确定模块13包括:
第四获取单元1301,用于获取该待匹配句式分别与该目标标注句式集合中多个标注句式之间的第二匹配度;
第三确定单元1302,用于若该待匹配句式与该目标标注句式集合中多个标注句式之间的多个第二匹配度中存在等于预设阈值的第二匹配度,则将等于该预设阈值的第二匹配度所对应的标注句式,确定为目标标注句式;
第四确定单元1303,用于若该待匹配句式与该目标标注句式集合中多个标注句式之间的多个第二匹配度中不存在等于该预设阈值的第二匹配度,则将该多个第二匹配度中最大的第二匹配度所对应的标注句式,确定为目标标注句式。
结合第二方面,在一些可能的实现方式中,输出模块14包括:
组合单元1401,用于将该目标标注句式与该N个第一关键词进行组合,得到目标查询组合;
第五获取单元1402,用于获取业务资料库对应的接口数据,该业务资料库中包括一个或者多个查询组合对应的资料信息,一个该查询组合为一个标注句式与一个或者多个关键词之间的组合;
调用单元1403,用于调用该接口数据,在该业务资料库中获取与该目标查询组合匹配度最大的查询组合对应的资料信息;
第一输出单元1404,用于输出该资料信息。
结合第二方面,在一些可能的实现方式中,信息处理装置还包括:
第二关键词提取模块17,用于获取该业务咨询信息对应的历史咨询信息,对该历史咨询信息进行关键词提取,得到该历史咨询信息对应的P个第二关键词,该历史咨询信息携带的用户标识与该业务咨询信息携带的用户标识相同,P为正整数;
获取模块18,用于从该第一映射表中获取该P个第二关键词分别对应的实体类别;
补充模块19,用于根据该P个第二关键词分别对应的实体类别,对该目标标注句式进行补充,得到补充后的目标标注句式;
该输出模块14还包括:
第二输出单元1405,用于在业务资料库中查询与该补充后的目标标注句式和该N个第一关键词均相关联的资料信息,输出与该补充后的目标标注句式以及该N个第一关键词均相关联的资料信息。
根据本申请的一个实施例,图6所示的信息处理装置中的各个模块可以分别或全部合并为一个或若干个单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个子单元,可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述模块是基于逻辑功能划分的,在实际应用中,一个模块的功能也可以由多个单元来实现,或者多个模块的功能由一个单元实现。在本申请的其它实施例中,信息处理装置也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
在本申请实施例中,通过对获取到的业务咨询信息进行关键词提取,以得到N个第一关键词,从第一映射表中确定N个第一关键词分别对应的实体类别,并对N个第一关键词分别对应的实体类别进行拼接处理,得到待匹配句式。从目标标注句式集合中确定与待匹配句式匹配的目标标注句式,通过确定业务咨询信息的目标咨询类别,通过目标咨询类别,从多个候选标注句式集合中确定目标标注句式集合,这样可以减少待匹配句式的匹配范围,提高对待匹配句式进行匹配的匹配准确性,以此使匹配得到的目标标注句式更能反映出用户的业务咨询信息的咨询范围,同时也可以减少匹配的计算量,提高匹配效率。通过确定业务咨询信息对应的目标标注句式,可以缩小业务咨询信息所要咨询的范围,这样也可以解决同一词语不同含义而导致理解错误等问题,可以改善不同业务咨询信息之间的混淆和交叉等问题。得到目标标注句式后,还可以根据历史咨询信息中P个第二关键词分别对应的实体类别,对目标标注句式进行补充,这样,这补全业务咨询信息中部分内容省略的内容,可以提高业务咨询信息对应的资料信息的准确性,从而提高用户的对话体验感。在业务资料库中查询与补充后的目标标注句式和N个第一关键词均相关联的资料信息,输出资料信息。业务资料库中的资料信息是业务开展过程中所积累的,相对于在一般资料库中直接搜索与目标标注句式和N个第一关键词均相关联的资料信息,本方案中通过在业务资料库中确定与目标标注句式和N个第一关键词均相关联的资料信息,可以更好地确定业务咨询信息对应的资料信息,也可以提高资料信息的准确性。通过本申请,可以提高用于回复业务咨询信息的资料信息的准确性。
请参见图7,图7是本申请实施例提供的一种计算机设备的结构示意图。如图7所示,上述计算机设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,上述计算机设备1000还可以包括:目标用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,目标用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选目标用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非易失性的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图7所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、目标用户接口模块以及设备控制应用程序。
在图7所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而目标用户接口1003主要用于为目标用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
对获取到的业务咨询信息进行关键词提取,以得到N个第一关键词,N为正整数;
从第一映射表中确定该N个第一关键词分别对应的实体类别,并对该N个第一关键词分别对应的实体类别进行拼接处理,得到待匹配句式,该第一映射表中包括关键词与实体类别之间的对应关系;
从目标标注句式集合中确定与该待匹配句式匹配的目标标注句式,该目标标注句式集合中包括多个标注句式,该目标标注句式是该目标标注句式集合中与该待匹配句式之间的匹配度最大的标注句式;
在业务资料库中查询与该目标标注句式和该N个第一关键词均相关联的资料信息,输出该资料信息,该业务资料库中包括一个或者多个查询组合对应的资料信息,一个该查询组合为一个标注句式与一个或者多个关键词之间的组合。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文图2或者图5所对应实施例中对信息处理方法的描述,也可执行前文图6所对应实施例中对信息处理装置的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且计算机可读存储介质中存储有前文提及信息处理装置所执行的计算机程序,且计算机程序包括程序指令,当处理器执行程序指令时,能够执行前文图2或者图5所对应实施例中对信息处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。作为示例,程序指令可被部署在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行,分布在多个地点且通过通信网络互连的多个计算设备可以组成区块链系统。
此外,需要说明的是:本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或者计算机程序可以包括计算机指令,该计算机指令可以存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器可以执行该计算机指令,使得该计算机设备执行前文图2或者图5所对应实施例中对信息处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机程序产品或者计算机程序实施例中未披露的技术细节,请参照本申请方法实施例的描述。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本申请实施例装置中的模块可以根据实际需要进行合并、划分和删减。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,上述的存储介质可为磁盘、光盘、只读存储器(Read-Only Memory,ROM)或随机存储器(Random Access Memory,RAM)等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (10)

1.一种信息处理方法,其特征在于,包括:
对获取到的业务咨询信息进行关键词提取,以得到N个第一关键词,N为正整数;
从第一映射表中确定所述N个第一关键词分别对应的实体类别,并对所述N个第一关键词分别对应的实体类别进行拼接处理,得到待匹配句式,所述第一映射表中包括关键词与实体类别之间的对应关系;
从目标标注句式集合中确定与所述待匹配句式匹配的目标标注句式,所述目标标注句式集合中包括多个标注句式,所述目标标注句式是所述目标标注句式集合中与所述待匹配句式之间的匹配度最大的标注句式;
在业务资料库中查询与所述目标标注句式和所述N个第一关键词均相关联的资料信息,输出所述资料信息,所述业务资料库中包括一个或者多个查询组合对应的资料信息,一个所述查询组合为一个标注句式与一个或者多个关键词之间的组合。
2.根据权利要求1所述的方法,其特征在于,所述对获取到的业务咨询信息进行关键词提取,以得到N个第一关键词,包括:
对获取到的业务咨询信息进行关键词提取,获得所述业务咨询信息中的N个初始关键词;
获取所述N个初始关键词中的初始关键词Ti分别与关键词库中多个候选关键词之间的第一匹配度,i为小于或者等于N的正整数;
将所述初始关键词Ti与所述关键词库中多个候选关键词之间的多个第一匹配度中最大的第一匹配度所对应的候选关键词,确定为所述初始关键词Ti对应的第一关键词;
从所述关键词库中分别获取所述N个初始关键词对应的第一关键词,得到N个第一关键词。
3.根据权利要求1所述的方法,其特征在于,所述从目标标注句式集合中确定与所述待匹配句式匹配的目标标注句式之前,所述方法还包括:
对所述业务咨询信息进行分类处理,得到所述业务咨询信息所属的目标咨询类别;
从多个候选标注句式集合中,确定所述目标咨询类别对应的目标标注句式集合,其中一个候选标注句式集合属于一个咨询类别,所述目标标注句式集合是所述多个候选标注句式集合中属于所述目标咨询类别的候选标注句式集合。
4.根据权利要求3所述的方法,其特征在于,所述从多个候选标注句式集合中确定所述目标咨询类别对应的目标标注句式集合,包括:
获取第二映射表,所述第二映射表中包括咨询类别与候选标注句式集合之间的对应关系;
从所述第二映射表包括的多个候选标注句式集合中确定所述目标咨询类别对应的候选标注句式集合;
将所述目标咨询类别对应的候选标注句式集合,确定为所述目标标注句式集合。
5.根据权利要求3所述的方法,其特征在于,所述从目标标注句式集合中确定与所述待匹配句式匹配的目标标注句式,包括:
获取所述待匹配句式分别与所述目标标注句式集合中多个标注句式之间的第二匹配度;
若所述待匹配句式与所述目标标注句式集合中多个标注句式之间的多个第二匹配度中存在等于预设阈值的第二匹配度,则将等于所述预设阈值的第二匹配度所对应的标注句式,确定为目标标注句式;
若所述待匹配句式与所述目标标注句式集合中多个标注句式之间的多个第二匹配度中不存在等于所述预设阈值的第二匹配度,则将所述多个第二匹配度中最大的第二匹配度所对应的标注句式,确定为目标标注句式。
6.根据权利要求1所述的方法,其特征在于,所述在业务资料库中查询与所述目标标注句式以及所述N个第一关键词均相关联的资料信息,输出所述资料信息,包括:
将所述目标标注句式与所述N个第一关键词进行组合,得到目标查询组合;
获取业务资料库对应的接口数据,所述业务资料库中包括一个或者多个查询组合对应的资料信息,一个所述查询组合为一个标注句式与一个或者多个关键词之间的组合;
调用所述接口数据,在所述业务资料库中获取与所述目标查询组合匹配度最大的查询组合对应的资料信息;
输出所述资料信息。
7.根据权利要求1所述的方法,其特征在于,所述在业务资料库中查询与所述目标标注句式和所述N个第一关键词均相关联的资料信息,输出所述资料信息之前,所述方法还包括:
获取所述业务咨询信息对应的历史咨询信息,对所述历史咨询信息进行关键词提取,得到所述历史咨询信息对应的P个第二关键词,所述历史咨询信息携带的用户标识与所述业务咨询信息携带的用户标识相同,P为正整数;
从所述第一映射表中获取所述P个第二关键词分别对应的实体类别;
根据所述P个第二关键词分别对应的实体类别,对所述目标标注句式进行补充,得到补充后的目标标注句式;
所述在业务资料库中查询与所述目标标注句式和所述N个第一关键词均相关联的资料信息,输出所述资料信息,包括:
在业务资料库中查询与所述补充后的目标标注句式和所述N个第一关键词均相关联的资料信息,输出与所述补充后的目标标注句式以及所述N个第一关键词均相关联的资料信息。
8.一种信息处理装置,其特征在于,包括:
第一关键词提模块,用于对获取到的业务咨询信息进行关键词提取,以得到N个第一关键词,N为正整数;
拼接处理模块,用于从第一映射表中确定所述N个第一关键词分别对应的实体类别,并对所述N个第一关键词分别对应的实体类别进行拼接处理,得到待匹配句式,所述第一映射表中包括关键词与实体类别之间的对应关系;
第一确定模块,用于从目标标注句式集合中确定与所述待匹配句式匹配的目标标注句式,所述目标标注句式集合中包括多个标注句式,所述目标标注句式是所述目标标注句式集合中与所述待匹配句式之间的匹配度最大的标注句式;
输出模块,用于在业务资料库中查询与所述目标标注句式和所述N个第一关键词均相关联的资料信息,输出所述资料信息,所述业务资料库中包括一个或者多个查询组合对应的资料信息,一个所述查询组合为一个标注句式与一个或者多个关键词之间的组合。
9.一种电子设备,其特征在于,包括:处理器和存储器;
所述处理器和存储器相连,其中,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行如权利要求1-7任一项所述的方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时,执行如权利要求1-7任一项所述的方法。
CN202110855844.4A 2021-07-28 2021-07-28 信息处理方法、装置、存储介质及设备 Active CN113536788B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110855844.4A CN113536788B (zh) 2021-07-28 2021-07-28 信息处理方法、装置、存储介质及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110855844.4A CN113536788B (zh) 2021-07-28 2021-07-28 信息处理方法、装置、存储介质及设备

Publications (2)

Publication Number Publication Date
CN113536788A true CN113536788A (zh) 2021-10-22
CN113536788B CN113536788B (zh) 2023-12-05

Family

ID=78089369

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110855844.4A Active CN113536788B (zh) 2021-07-28 2021-07-28 信息处理方法、装置、存储介质及设备

Country Status (1)

Country Link
CN (1) CN113536788B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100094846A1 (en) * 2008-10-14 2010-04-15 Omid Rouhani-Kalleh Leveraging an Informational Resource for Doing Disambiguation
US20170011068A1 (en) * 2015-07-07 2017-01-12 Adobe Systems Incorporated Extrapolative Search Techniques
CN111428483A (zh) * 2020-03-31 2020-07-17 华为技术有限公司 语音交互方法、装置和终端设备
CN111444326A (zh) * 2020-03-30 2020-07-24 腾讯科技(深圳)有限公司 一种文本数据处理方法、装置、设备以及存储介质
WO2021068615A1 (zh) * 2019-10-12 2021-04-15 深圳壹账通智能科技有限公司 文书中问答数据获取方法、装置、计算机设备和存储介质
CN113076397A (zh) * 2021-03-29 2021-07-06 Oppo广东移动通信有限公司 意图识别方法、装置、电子设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100094846A1 (en) * 2008-10-14 2010-04-15 Omid Rouhani-Kalleh Leveraging an Informational Resource for Doing Disambiguation
US20170011068A1 (en) * 2015-07-07 2017-01-12 Adobe Systems Incorporated Extrapolative Search Techniques
WO2021068615A1 (zh) * 2019-10-12 2021-04-15 深圳壹账通智能科技有限公司 文书中问答数据获取方法、装置、计算机设备和存储介质
CN111444326A (zh) * 2020-03-30 2020-07-24 腾讯科技(深圳)有限公司 一种文本数据处理方法、装置、设备以及存储介质
CN111428483A (zh) * 2020-03-31 2020-07-17 华为技术有限公司 语音交互方法、装置和终端设备
CN113076397A (zh) * 2021-03-29 2021-07-06 Oppo广东移动通信有限公司 意图识别方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN113536788B (zh) 2023-12-05

Similar Documents

Publication Publication Date Title
CN109872162B (zh) 一种处理用户投诉信息的风控分类识别方法及系统
CN110019149A (zh) 一种客服知识库的建立方法、装置及设备
CN111125343A (zh) 适用于人岗匹配推荐系统的文本解析方法及装置
CN110929125A (zh) 搜索召回方法、装置、设备及其存储介质
CN113836314B (zh) 知识图谱构建方法、装置、设备以及存储介质
CN112926308B (zh) 匹配正文的方法、装置、设备、存储介质以及程序产品
EP3961426A2 (en) Method and apparatus for recommending document, electronic device and medium
CN110941702A (zh) 一种法律法规和法条的检索方法及装置、可读存储介质
CN111563382A (zh) 文本信息的获取方法、装置、存储介质及计算机设备
CN111190946A (zh) 报告生成方法、装置、计算机设备和存储介质
CN113657088A (zh) 接口文档解析方法、装置、电子设备以及存储介质
CN111126058A (zh) 文本信息自动抽取方法、装置、可读存储介质和电子设备
CN115204889A (zh) 文本处理方法、装置、计算机设备及存储介质
CN112948526A (zh) 用户画像的生成方法及装置、电子设备、存储介质
CN117112595A (zh) 一种信息查询方法、装置、电子设备及存储介质
CN110750643A (zh) 上市公司非定期公告的分类方法、装置及存储介质
CN114444514B (zh) 语义匹配模型训练、语义匹配方法及相关装置
CN113591881B (zh) 基于模型融合的意图识别方法、装置、电子设备及介质
CN113536788B (zh) 信息处理方法、装置、存储介质及设备
CN115525761A (zh) 一种文章关键词筛选类别的方法、装置、设备及存储介质
CN113609833A (zh) 文件的动态生成方法、装置、计算机设备及存储介质
CN111460268A (zh) 数据库查询请求的确定方法、装置和计算机设备
CN110308931B (zh) 一种数据处理方法及相关装置
CN116991873A (zh) 基于知识图谱的目标报送数据处理方法、装置和服务器
CN117608490A (zh) 基于投资系统的数据管理方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20231011

Address after: 200232 Room 301-2, No. 206 Kaibin Road, Xuhui District, Shanghai

Applicant after: Ping An Technology (Shanghai) Co.,Ltd.

Address before: 518000 Guangdong, Shenzhen, Futian District Futian street Fu'an community Yitian road 5033, Ping An financial center, 23 floor.

Applicant before: PING AN TECHNOLOGY (SHENZHEN) Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant