CN111881283A - 一种业务关键词库创建方法、智能聊天引导方法及装置 - Google Patents
一种业务关键词库创建方法、智能聊天引导方法及装置 Download PDFInfo
- Publication number
- CN111881283A CN111881283A CN202010767970.XA CN202010767970A CN111881283A CN 111881283 A CN111881283 A CN 111881283A CN 202010767970 A CN202010767970 A CN 202010767970A CN 111881283 A CN111881283 A CN 111881283A
- Authority
- CN
- China
- Prior art keywords
- service
- information
- keyword
- text information
- voice text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000010224 classification analysis Methods 0.000 claims abstract description 18
- 238000002372 labelling Methods 0.000 claims abstract description 13
- 230000002452 interceptive effect Effects 0.000 claims description 108
- 230000011218 segmentation Effects 0.000 claims description 22
- 238000004458 analytical method Methods 0.000 claims description 19
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 26
- 230000006870 function Effects 0.000 description 8
- 230000003993 interaction Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本申请公开了一种业务关键词库创建方法、智能聊天引导方法及装置,创建时,基于用户产生的交互语音文本信息,按照业务类型进行聚类和文本分析得到关键词,创建包括每个业务类型对应的至少一个关键词的业务关键词库。聊天引导时,对用户聊天时产生的语音文本信息进行文本分类分析和序列标注,确定目标业务类型和业务关键词,在业务关键词库中查询对应的目标业务信息,将目标业务信息作为聊天引导信息显示在聊天背景界面中。本发明提供的方法及装置,根据用户实时语音文本信息和业务关键词库及时发觉用户的潜在业务意图,并将目标业务信息显示在聊天背景界面中,以对用户的聊天进行有针对性的引导,从而满足用户的潜在需求。
Description
技术领域
本申请涉及智能聊天技术领域,尤其涉及一种业务关键词库创建方法、智能聊天引导方法及装置。
背景技术
随着智能语音交互技术的发展,在显示设备、智能终端等终端设备上可实现智能语音聊天功能。在实现智能语音聊天功能时,需在终端设备上配置智能语音助手。
用户在与终端设备进行语音交互时,现有的智能语音助手为实现聊天功能,通常基于用户产生的语音交互信息,利用已有数据进行固定回复,已有数据是指智能语音助手内存储的与用户交互时的常用回复信息。
可见,现有的智能语音助手只能进行简单式回复,无法根据用户实时产生的语音交互信息及时调整回复内容,即不具有引导聊天功能,导致聊天趣味性低,用户容易产生疲惫心态。
发明内容
本申请提供了一种业务关键词库创建方法、智能聊天引导方法及装置,以解决在智能聊天时无法及时发觉用户潜在业务意图进行业务引导的问题。
第一方面,本申请提供了一种业务关键词库创建方法,包括:
获取每个用户产生的交互语音文本信息;
根据业务类型,对每个所述交互语音文本信息进行聚类,得到每个所述业务类型对应的文本信息聚类,所述文本信息聚类中包括同一业务类型对应的多个交互语音文本信息;
对每个所述文本信息聚类中的交互语音文本信息进行文本分析,得到每个所述交互语音文本信息对应的至少一个关键词;
创建包括每个所述业务类型对应的至少一个关键词的业务关键词库,所述业务关键词库用于在用户聊天时基于用户产生的语音文本信息提供聊天引导信息。
本申请的一些实施例中,所述根据业务类型,对每个所述交互语音文本信息进行聚类,得到每个业务类型对应的文本信息聚类,包括:
提取每个所述交互语音文本信息中携带的业务类型标签;
将具有同一所述业务类型标签对应的交互语音文本信息划分为一类,得到每个业务类型对应的文本信息聚类。
本申请的一些实施例中,所述对每个所述文本信息聚类中的交互语音文本信息进行文本分析,得到每个交互语音文本信息对应的至少一个关键词,包括:
对每个所述文本信息聚类中的交互语音文本信息进行分词处理,得到每个所述交互语音文本信息对应的多个词语;
对每个所述词语进行序列标注,将序列标注后的词语作为每个交互语音文本信息对应的关键词。
本申请的一些实施例中,所述创建包括每个所述业务类型对应的至少一个关键词的业务关键词库,包括:
计算每个所述业务类型对应的至少一个关键词的权重值;
基于每个所述业务类型对应的所述权重值满足预设阈值的至少一个关键词,建立业务关键词库。
本申请的一些实施例中,所述计算每个所述业务类型对应的至少一个关键词的权重值,包括:
计算所述关键词在所属交互语音文本信息中产生的词频率,以及,所述关键词在所有交互语音文本信息中产生的逆文本频率;
基于所述词频率和所述逆文本频率的乘积,确定所述关键词的权重值。
本申请的一些实施例中,所述基于每个所述业务类型对应的所述权重值满足预设阈值的至少一个关键词,建立业务关键词库,包括:
将每个所述关键词的权重值与所述预设阈值进行对比;
将所述权重值大于或等于所述预设阈值对应的关键词确定为目标关键词;
获取每个所述关键词的标签;
如果所述标签为指定标签,则将标签为指定标签的关键词作为优选关键词;
基于每个所述业务类型对应的所述目标关键词和优选关键词,建立业务关键词库。
第二方面,本申请还提供了一种智能聊天引导方法,所述方法包括:
获取业务关键词库和用户聊天时产生的语音文本信息,所述业务关键词库包括每个业务类型对应的至少一个关键词;
对所述语音文本信息进行文本分类分析,确定所述语音文本信息对应的目标业务类型;
对所述语音文本信息进行序列标注,提取对应的业务关键词;
基于所述目标业务类型和所述业务关键词,在所述业务关键词库中查询对应的目标业务信息,所述目标业务信息是指所述目标业务类型对应的与所述业务关键词相关的信息;
将所述目标业务信息作为聊天引导信息显示在用户聊天时的聊天背景界面中。
本申请的一些实施例中,所述对所述语音文本信息进行文本分类分析,确定所述语音文本信息对应的目标业务类型,包括:
对所述语音文本信息进行分词处理,得到所述交互语音文本信息对应的多个词语;
计算每个所述词语在每个业务类型中产生的分类概率;
将所述词语的分类概率最高对应的业务类型,确定为所述语音文本信息对应的目标业务类型。
本申请的一些实施例中,所述对语音文本信息进行序列标注,提取对应的业务关键词,包括:
对所述语音文本信息进行分词处理,得到所述交互语音文本信息对应的多个词语;
对每个所述词语分别添加标签,所述标签用于表征所述词语的文本类别标记;
获取每个所述标签对应的权重值;
将所述权重值最高的标签对应的词语确定为业务关键词。
本申请的一些实施例中,所述将目标业务信息作为聊天引导信息显示在用户聊天时的聊天背景界面中,包括:
获取每个所述目标业务信息对应的相关度分数;
将多个所述目标业务信息按照相关度分数由高到低进行排序,生成推荐列表;
将所述推荐列表作为聊天引导信息显示在用户聊天时的聊天背景界面中。
第三方面,本申请还提供了一种业务关键词库创建装置,包括:
历史信息获取模块,用于获取每个用户产生的交互语音文本信息;
文本聚类模块,用于根据业务类型,对每个所述交互语音文本信息进行聚类,得到每个所述业务类型对应的文本信息聚类,所述文本信息聚类中包括同一业务类型对应的多个交互语音文本信息;
文本分析模块,用于对每个所述文本信息聚类中的交互语音文本信息进行文本分析,得到每个所述交互语音文本信息对应的至少一个关键词;
业务关键词库创建模块,用于创建包括每个所述业务类型对应的至少一个关键词的业务关键词库,所述业务关键词库用于在用户聊天时基于用户产生的语音文本信息提供聊天引导信息。
第四方面,本申请还提供了一种智能聊天引导装置,包括:
实时信息获取模块,用于获取业务关键词库和用户聊天时产生的语音文本信息,所述业务关键词库包括每个业务类型对应的至少一个关键词;
文本分类分析模块,用于对所述语音文本信息进行文本分类分析,确定所述语音文本信息对应的目标业务类型;
业务关键词提取模块,用于对所述语音文本信息进行序列标注,提取对应的业务关键词;
目标业务信息查询模块,用于基于所述目标业务类型和所述业务关键词,在所述业务关键词库中查询对应的目标业务信息,所述目标业务信息是指所述目标业务类型对应的与所述业务关键词相关的信息;
聊天引导信息显示模块,用于将所述目标业务信息作为聊天引导信息显示在用户聊天时的聊天背景界面中。
第五方面,本申请还提供了一种存储介质,该计算机存储介质可存储有程序,该程序执行时可实现包括本申请提供的业务关键词库创建方法和智能聊天引导方法各实施例中的部分或全部步骤。
由以上技术方案可知,本发明实施例提供的一种业务关键词库创建方法、智能聊天引导方法及装置,在创建业务关键词库时,基于每个用户产生的交互语音文本信息,按照业务类型进行聚类,得到每个业务类型对应的文本信息聚类。对每个文本信息聚类下的交互语音文本信息进行文本分析,得到多个关键词,创建包括每个业务类型对应的至少一个关键词的业务关键词库。在进行聊天引导时,对用户聊天时产生的语音文本信息进行文本分类分析,以确定对应的目标业务类型,并对语音文本信息进行序列标注,提取出对应的业务关键词;基于目标业务类型和业务关键词,在业务关键词库中查询对应的目标业务信息,将目标业务信息作为聊天引导信息显示在用户聊天时的聊天背景界面中。本发明提供的方法及装置,可根据用户实时语音文本信息和业务关键词库及时发觉用户的潜在业务意图,并将发觉出的目标业务信息作为聊天引导信息显示在聊天背景界面中,以对用户的聊天进行有针对性的引导,及时调整回复方向,从而满足用户的潜在需求。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1中示例性示出了根据一些实施例的业务关键词库创建方法的流程图;
图2中示例性示出了根据一些实施例的业务关键词库创建方法的数据流图;
图3中示例性示出了根据一些实施例的文本聚类方法的流程图;
图4中示例性示出了根据一些实施例的文本分析的方法流程图;
图5中示例性示出了根据一些实施例的创建业务关键词库的方法流程图;
图6中示例性示出了根据一些实施例的智能聊天引导方法的流程图;
图7中示例性示出了根据一些实施例的智能聊天引导方法的数据流图;
图8中示例性示出了根据一些实施例的确定目标业务类型方法的流程图;
图9中示例性示出了根据一些实施例的提取业务关键词方法的流程图;
图10中示例性示出了根据一些实施例的显示聊天引导信息方法的流程图;
图11中示例性示出了根据一些实施例的聊天背景界面的显示示意图;
图12中示例性示出了根据一些实施例的业务关键词库创建装置的结构框图;
图13中示例性示出了根据一些实施例的智能聊天引导装置的结构框图。
具体实施方式
用户在与智能终端,如手机、iPad等,通过语音交互进行智能聊天,或者,用户在与显示设备,如智能电视及带有显示器的智能产品等,通过语音交互进行智能聊天时,终端设备(智能终端和显示设备)通过借助自身配置的智能语音助手实现聊天回复。
但是,目前各种版本的智能语音助手的聊天功能都是基于已有数据进行固定回复,通常为简单式回复,其不能及时调整回复方向,做引导式聊天,导致聊天趣味性,用户容易产生疲惫心态。并且,用户在使用聊天功能时,聊天的背景界面都是一成不变的,不能及时发觉用户潜在业务意图进行业务引导,和对相关潜在意图进行展现,从而不能满足用户的潜在需求。
因此,为能够在用户与终端设备进行智能聊天时,能够根据用户的实时语音信息及时调整回复方向,本发明实施例提供一种智能聊天引导方法,其可以根据用户实时语音信息及时发觉用户的潜在业务意图,以进行业务引导,并将业务引导信息显示在聊天所在背景界面中,以满足用户的潜在需求。
为准确获得与用户实时语音信息相匹配的聊天引导信息,本发明实施例提供的方法,需先创建业务关键词库,业务关键词库中包括关键词名称和对应的各种业务类型的业务信息。在根据用户的实时语音信息识别出用户的潜在业务意图(关键词),即可在业务关键词库中检索到相对应的业务信息,作为聊天引导信息显示在聊天背景界面中。
图1中示例性示出了根据一些实施例的业务关键词库创建方法的流程图;图2中示例性示出了根据一些实施例的业务关键词库创建方法的数据流图。参见图1和图2,本发明实施例提供的一种业务关键词库创建方法,执行主体为终端设备中配置的控制器,该方法包括以下步骤:
S11、获取每个用户产生的交互语音文本信息。
在创建业务关键词库时,所依据的数据来源为与该终端设备进行交互的多个用户的历史交互语音数据,如交互语音文本信息。每个用户在历史阶段与终端设备进行交互时,通常会采用比较常见说法,用户每产生一种常见说法,均会以交互语音文本信息的形式存储在智能聊天助手的日志上。
控制器由日志中存储的数据来获取到每个用户产生的交互语音文本信息,与终端设备进行交互的用户可为多个,而每个用户也会产生多个交互语音文本信息。
S12、根据业务类型,对每个交互语音文本信息进行聚类,得到每个业务类型对应的文本信息聚类,文本信息聚类中包括同一业务类型对应的多个交互语音文本信息。
为便于识别出用户的潜在业务意图,在创建业务关键词库时,可根据不同的业务类型,对用户产生的每个交互语音文本信息进行聚类。业务类型包括音乐、影视、综艺等。
经过文本聚类后,每个文本信息聚类对应一个业务类型,即文本信息聚类与业务类型为一对一的关系,且每个文本信息聚类中包括多个同属于一个业务类型的交互语音文本信息。
在一些实施例中,在进行文本聚类时,可采用层次化聚类算法,先将每个对象(交互语音文本信息)作为一个簇,然后合并这些原子簇为越来越大的簇(文本信息聚类),知道所有对象都在一个簇中,或者某个终结条件被满足。
图3中示例性示出了根据一些实施例的文本聚类方法的流程图。参见图3,根据业务类型,对每个交互语音文本信息进行聚类,得到每个业务类型对应的文本信息聚类,包括以下步骤:
S121、提取每个交互语音文本信息中携带的业务类型标签。
S122、将具有同一业务类型标签对应的交互语音文本信息划分为一类,得到每个业务类型对应的文本信息聚类。
每个交互语音文本信息通常携带业务类型标签,控制器将每个业务类型标签作为一个对象,计算两两之间的最小距离,将距离最小的两个对象合并成一类,重新计算新类与所有对象之间的距离,直到将所有对象合并成一类,即文本信息聚类。
具有相同业务类型标签的交互语音文本信息,其距离相近,因此,可将具有同一业务类型标签对应的交互语音文本信息划分为一类,得到每个业务类型对应的文本信息聚类。
S13、对每个文本信息聚类中的交互语音文本信息进行文本分析,得到每个交互语音文本信息对应的至少一个关键词。
在将各交互语音文本信息按照业务类型进行文本聚类后,对同一文本信息聚类中的交互语音文本信息进行文本分析,以得到同一文本信息聚类对应的多个关键词。在一些实施例中,文本分析包括分词处理和序列标注处理。
图4中示例性示出了根据一些实施例的文本分析的方法流程图。参见图4,在一些实施例中,对每个文本信息聚类中的交互语音文本信息进行文本分析,得到每个交互语音文本信息对应的至少一个关键词,包括以下步骤:
S131、对每个文本信息聚类中的交互语音文本信息进行分词处理,得到每个交互语音文本信息对应的多个词语。
S132、对每个词语进行序列标注,将序列标注后的词语作为每个交互语音文本信息对应的关键词。
为准确确定每个交互语音文本信息中的关键词,需先对交互语音文本信息进行分词处理,得到每个交互语音文本信息对应的多个词语。在一些实施例中,分词处理可采用开源分词工具JIEBA。
例如,交互语音文本信息为“你知道刘德华是谁吗”,经过分词处理后,可得到“你”、“知道”、“刘德华”、“是谁吗”四个词语。
再对每个词语进行序列标注,以标识每个词语在交互语音文本信息中的文本类别。在一些实施例中,序列标注可采用命名实体识别(NER),其采用的序列标注技术主要是对于给定的一个序列,对序列中的每个元素做一个标记,或者,给每个元素打一个标签。
例如,可将元素“刘德华”打上“明星名字”的标签。将每个添加序列标注的词语作为交互语音文本信息对应的关键词,每个交互语音文本信息对应多个关键词。
在一些实施例中,除了上述依据序列标注的方法确定每个交互语音文本信息的关键词外,还可由用户自定义关键词,将依据序列标注确定的关键词和用户自定义的关键词共同作为每个交互语音文本信息的关键词。
S14、创建包括每个业务类型对应的至少一个关键词的业务关键词库,业务关键词库用于在用户聊天时基于用户产生的语音文本信息提供聊天引导信息。
同一业务类型包括多个交互语音文本信息,而每个交互语音文本信息对应多个关键词,因此,同一业务类型对应多个关键词。基于每个业务类型对应的多个关键词,创建业务关键词库。
业务关键词库中包括各个业务类型对应的关键词名称和业务信息,形成关键词表,以便于在用户实时产生语音文本信息时,根据实时语音文本信息对应的关键词和业务类型,在业务关键词库筛选出对应的业务信息,作为聊天引导信息展示在聊天背景界面中。
由于交互语音文本信息中对应的关键词,可能会存在与业务不相关的词语,例如,交互语音文本信息“你知道刘德华是谁吗”中,关键词“你”、“知道”、“是谁吗”三个词语与业务不相关。因此,为保证创建的业务关键词库能够包括更多的与业务相关的关键词,可在创建业务关键词库时,对关键词进行过滤。
图5中示例性示出了根据一些实施例的创建业务关键词库的方法流程图。参见图5,在一些实施例中,为对关键词进行过滤,创建包括每个所述业务类型对应的至少一个关键词的业务关键词库,包括以下步骤:
S141、计算每个业务类型对应的至少一个关键词的权重值。
S142、基于每个业务类型对应的权重值满足预设阈值的至少一个关键词,建立业务关键词库。
为对每个业务类型中每个交互语音文本信息对应的关键词进行精准过滤,可先计算每个关键词的权重值。将权重值不满足预设阈值的关键词过滤掉,只根据权重值满足预设阈值的关键词建立业务关键词库。
在一些实施例中,计算每个所述业务类型对应的至少一个关键词的权重值,包括:
步骤1411、计算关键词在所属交互语音文本信息中产生的词频率,以及,关键词在所有交互语音文本信息中产生的逆文本频率。
步骤1412、基于词频率和逆文本频率的乘积,确定关键词的权重值。
在计算关键词的权重值时,可采用TF-IDF的计算方法。TF-IDF(词频-逆文本频率)用以估计一个单词(关键词)在一个文档集合或语料库(文本信息聚类)中的重要程度。
TF(Term Frequency,词频)计算方法的主要思想表示一个给定词语t在一篇给定文档d中出现的频率,即某个关键词在对应的交互语音文本信息中产生的词频率。TF越高,则词语t对文档d来说越重要,TF越低,则词语t对文档d来说越不重要。对于在某一文档dj里的词语ti来说,ti的词频可表示为:
式中,ni,j是词语ti在文档dj中的出现次数,分母则是在文件dj中所有词语出现次数之和。
利用上式,即可计算出某个关键词在对应的交互语音文本信息中产生的词频率。
IDF(Inverse Document Frequency,逆向文件频率)计算方法的主要思想是:如果包含词语t的文档越少,则IDF越大,说明词语t在整个文档集层面上具有很好的类别区分能力。对于整个文档集而言,评价词语重要性的标准就是IDF。某一特定词语的IDF,可以由总文件数除以包含该词语的文件数,再将得到的商取对数得到:
式中,|D|是语料库中所有文档总数,分母是包含词语ti的所有文档数。
依据上式,根据同一文本信息聚类中的交互语音文本信息的总数量,和同一文本信息聚类中包含某个关键词的所有交互语音文本信息的总数量,计算该关键词在同一文本信息聚类中所有交互语音文本信息中产生的逆文本频率。
TF-IDF实际上是:TF*IDF。主要思想是:如果某个词或短语在一篇文章中出现的频率高(即TF高),并且在其他文章中很少出现(即IDF高),则认为此词或者短语具有很好的类别区分能力,适合用来分类。
因此,计算某个关键词的词频和逆文本频率的乘积,即可确定该关键词的权重值。某个关键词的权重值越高,说明该关键词在某个交互语音文本信息中出现的频率高(即TF高),且在同一文本信息聚类中其他交互语音文本信息中很少出现(即IDF高)。
在确定出每个关键词的权重值后,即可对关键词进行过滤。在一些实施例中,在基于过滤后的关键词创建业务关键词库时,控制器基于每个业务类型对应的权重值满足预设阈值的至少一个关键词,建立业务关键词库,包括以下步骤:
步骤1421、将每个关键词的权重值与预设阈值进行对比。
步骤1422、将权重值大于或等于预设阈值对应的关键词确定为目标关键词。
步骤1423、获取每个关键词的标签。
步骤1424、如果标签为指定标签,则将标签为指定标签的关键词作为优选关键词。
步骤1425、基于每个业务类型对应的目标关键词和优选关键词,建立业务关键词库。
业务关键词库中的关键词包括权重值满足预设阈值对应的关键词,还包括具有指定标签的关键词。
根据每个关键词的权重值与预设阈值进行对比,预设阈值可设定为0.5,如果关键词的权重值大于或等于0.5,则将这种关键词确定为目标关键词。
如果某个关键词的权重值小于0.5,但该关键词具有指定标签,则可将该关键词的权重值进行调高,使其满足预设阈值。将此类关键词确定为优选关键词。
指定标签是指前述对每个关键词进行序列标注时添加的标签,提高权重值至预设阈值以上的标准是关键词上添加有指定标签,指定标签包括明星名字、歌曲名称、作品名称等具有特定标注的标签。
获取每个关键词的标签,如果该关键词上添加的标签为指定标签,则不管该关键词的权重值是否满足预设阈值,均将添加有指定标签的关键词作为优选关键词。
将每个业务类型对应的目标关键词和优选关键词,形成关键词表,建立业务关键词库。
在一些实施例中,在创建业务关键词库时,除了基于用户交互产生的历史交互语音文本信息建立关键词表外,还可依据智能语音助手提供的已有关键词表,基于建立的关键词表和已有关键词表共同创建业务关键词库。
可见,本发明实施例提供的业务关键词库的创建方法,基于每个用户产生的交互语音文本信息,按照业务类型进行聚类,得到每个业务类型对应的文本信息聚类。对每个文本信息聚类下的交互语音文本信息进行文本分析,得到多个关键词,创建包括每个业务类型对应的至少一个关键词的业务关键词库,业务关键词库用于在用户聊天时基于用户产生的语音文本信息提供聊天引导信息。可见,本发明实施例创建的业务关键词库,可为根据用户实时语音信息及时发觉用户的潜在业务意图提供信息筛选依据,以进行业务引导,并将筛选出的业务信息作为聊天引导信息显示在聊天所在背景界面中,以满足用户的潜在需求。
在进行智能聊天引导时,根据用户实时与智能聊天助手交互时产生的语音文本信息,在业务关键词库中检索到对应的业务信息,作为聊天引导信息。
图6中示例性示出了根据一些实施例的智能聊天引导方法的流程图;图7中示例性示出了根据一些实施例的智能聊天引导方法的数据流图。参见图6和图7,本发明实施例提供的一种智能聊天引导方法,执行主体为终端设备中配置的控制器,该方法包括以下步骤:
S21、获取业务关键词库和用户聊天时产生的语音文本信息,业务关键词库包括每个业务类型对应的至少一个关键词。
用户聊天时产生的语音文本信息可为语音信息,也可为文本信息。若为语音信息时,控制器需先将语音信息转换为文本信息,以便后续基于文本信息进行识别。
业务关键词库是由图1所示的创建业务关键词库方法创建的,包括各个业务类型对应的关键词和业务信息,相关创建方法可参照前述实施例的内容,此处不再赘述。
S22、对语音文本信息进行文本分类分析,确定语音文本信息对应的目标业务类型。
为便于根据用户实时产生的语音文本信息来查询对应的业务信息,以做到及时引导聊天,在一些实施例中,需先对语音文本信息进行文本分类分析,以识别出语音文本信息对应的目标业务类型。
例如,如果用户实时产生的语音文本信息为“你知道刘德华是谁吗”,则确定出该语音文本信息对应的业务类型是影视、音乐或综艺。
图8中示例性示出了根据一些实施例的确定目标业务类型方法的流程图。在一些实施例中,参见图8,控制器对语音文本信息进行文本分类分析,确定所述语音文本信息对应的目标业务类型,包括:
S221、对语音文本信息进行分词处理,得到交互语音文本信息对应的多个词语。
S222、计算每个词语在每个业务类型中产生的分类概率。
S223、将词语的分类概率最高对应的业务类型,确定为语音文本信息对应的目标业务类型。
在确定用户实时聊天产生的语音文本信息所对应的目标业务类型时,需先对语音文本信息进行分词处理,得到多个词语。在一些实施例中,分词处理可采用开源分词工具JIEBA。
例如,语音文本信息为“你知道刘德华是谁吗”,经过分词处理后,可得到“你”、“知道”、“刘德华”、“是谁吗”四个词语。
在文本分类预测时,采用TextCNN文本分类算法计算每个词语在每个业务类型中产生的分类概率。计算过程包括:输入层,将文本中的每个词语转换成相同维度的词向量进行输入;卷积层,通过不同卷积核的大小kernel_size=(1,2,3,4,5)做卷积运算,抽取文本特征;池化层,使用1-Max-pooling最大池化,即抽取每个特征向量的最大值表示该特征,最后将每个所有特征向量拼接传到全连接层中。在全连接层中,第一层可以加上relu作为激活函数,第二层则使用softmax激活函数得到属于每个类的概率,即每个词语在每个业务类型中产生的分类概率。
根据每个词语在每个业务类型中产生的分类概率,即能够判断出每个词语的分类结果。例如,计算“你”、“知道”、“刘德华”、“是谁吗”四个词语分别在每个业务类型中产生的分类概率。如果最大的分类概率为0.89,对应影视,则可确定语音文本信息对应的目标业务类型为“影视”。
S23、对语音文本信息进行序列标注,提取对应的业务关键词。
在对语音文本信息进行文本分类分析,以确定语音文本信息的目标业务类型的同时,控制器同步对语音文本信息进行序列标注,以获得对应的业务关键词。
图9中示例性示出了根据一些实施例的提取业务关键词方法的流程图。在一些实施例中,参见图9,控制器对语音文本信息进行序列标注,提取对应的业务关键词,包括:
S231、对语音文本信息进行分词处理,得到交互语音文本信息对应的多个词语。
S232、对每个词语分别添加标签,标签用于表征词语的文本类别标记。
S233、获取每个标签对应的权重值。
S234、将权重值最高的标签对应的词语确定为业务关键词。
在确定用户实时聊天产生的语音文本信息所对应的业务关键词时,需先对语音文本信息进行分词处理,得到多个词语。在一些实施例中,分词处理可采用开源分词工具JIEBA。
例如,语音文本信息为“你知道刘德华是谁吗”,经过分词处理后,可得到“你”、“知道”、“刘德华”、“是谁吗”四个词语。
再对每个词语进行序列标注,以标识每个词语在交互语音文本信息中的文本类别。在一些实施例中,序列标注可采用命名实体识别(NER),其采用的序列标注技术主要是对于给定的一个序列,对序列中的每个元素做一个标记,或者,给每个元素打一个标签。
分别给每个词语添加对应的标签,例如,可将元素“刘德华”打上“明星名字”的标签,可将元素“知道”打上“动词”标签。可见,在打标签时,标签的类别并不相同,有些词语打上词性标签,而有写词语则打上文本类别标签。
将打上文本类别标签作为指定标签,不同的标签对应有不同的权重值,权重值可根据前述IF-IDF计算方法进行确定,此处不再赘述。指定标签包括但不限于明星名字、歌曲名称、作品名称等。
在一些实施例中,设定指定标签的权重值高于普通词性标签的权重值。打有指定标签的词语更接近于用户的业务意图,因此,将权重值最高的标签对应的词语确定为业务关键词。
打有指定标签的词语为业务关键词,在用户实时聊天产生的语音文本信息中,可能会存在多个添加有指定标签的词语,因此,业务关键词也可为多个。
S24、基于目标业务类型和业务关键词,在业务关键词库中查询对应的目标业务信息,目标业务信息是指目标业务类型对应的与业务关键词相关的信息。
根据步骤S22确定出的基于用户实时语音聊天产生的语音文本信息对应的目标业务类型,以及,根据步骤S23确定出的基于用户实时语音聊天产生的语音文本信息对应的业务关键词,可在业务关键词库中进行检索,判断是否能够检索到业务关键词和目标业务类型对应的业务信息。
由于业务关键词库中存储有相对应的业务类型和关键词、业务信息,因此,可根据目标业务类型先筛选出对应的目标关键词和对应的业务信息,再根据业务关键词与目标关键词进行匹配,筛选出与业务关键词对应的关键词和业务信息,将与业务关键词对应的业务信息确定为目标业务信息。
S25、将目标业务信息作为聊天引导信息显示在用户聊天时的聊天背景界面中。
目标业务信息即为根据用户实时聊天产生的语音文本信息发觉出的用户潜在业务意图对应的信息,将目标业务信息作为聊天引导信息,以对用户的聊天进行有针对性的引导,及时调整回复方向,从而满足用户的潜在需求。
同时将目标业务信息作为聊天引导信息显示在用户聊天时的聊天背景界面中,以实时改变聊天时一成不变的聊天背景界面,使得聊天背景界面不再显示统一的界面,便于用户能够更直观地观看到聊天引导信息。
如果基于用户实时聊天产生的语音文本信息,识别出其对应的业务关键词为多个,那么在基于业务关键词库进行检索时,可能会检索到多个业务信息,此时,可同时将多个业务信息进行展示。
图10中示例性示出了根据一些实施例的显示聊天引导信息方法的流程图。参见图10,在一些实施例中,在显示多个业务信息时,控制器将目标业务信息作为聊天引导信息显示在用户聊天时的聊天背景界面中,包括:
S251、获取每个目标业务信息对应的相关度分数。
S252、将多个目标业务信息按照相关度分数由高到低进行排序,生成推荐列表。
S253、将推荐列表作为聊天引导信息显示在用户聊天时的聊天背景界面中。
如果语音文本信息为“你知道刘德华和张学友吗”,则可确定出业务关键词包括“刘德华”和“张学友”,目标业务类型为“影视”。则基于“影视”、“刘德华”和“张学友”在业务关键词库中进行检索,可检索到相关的多个目标业务信息。
每个目标业务信息与业务关键词和目标业务类型会产生不同的相关度分数,检索出的目标业务信息与业务关键词和目标业务类型越接近,则相关度分数越高。按照相关度分数的高低,将多个目标业务信息进行排序,得到推荐列表。
推荐列表包括各目标业务信息的信息内容,将推荐列表作为聊天引导信息显示在用户聊天时的聊天背景界面中。
图11中示例性示出了根据一些实施例的聊天背景界面的显示示意图。参见图11中(a),其为未显示聊天引导信息时的聊天背景界面,此时的聊天背景界面仅显示用户与智能语音助手聊天时的文本内容。参见图11中(b),其为显示有聊天引导信息时的聊天背景界面,此时的聊天背景界面不仅显示用户与智能语音助手聊天时的文本内容,还显示有基于用户实时聊天产生的语音文本信息发觉出的用户潜在业务意图对应的聊天引导信息,以对用户的聊天进行有针对性的引导,及时调整回复方向,从而满足用户的潜在需求。
聊天引导信息可基于用户实时聊天产生的语音文本信息的改变而动态调整,以便于能够及时调整回复方向,并及时发觉用户潜在业务意图。聊天背景界面的显示内容也随聊天引导信息的变化而变化显示,以根据用户潜在业务意图及时更换聊天背景界面,满足用户的潜在心理需求。
可见,本发明实施例提供的智能聊天引导方法,对用户聊天时产生的语音文本信息进行文本分类分析,以确定对应的目标业务类型,并对语音文本信息进行序列标注,提取出对应的业务关键词;基于目标业务类型和业务关键词,在业务关键词库中查询对应的目标业务信息,将目标业务信息作为聊天引导信息显示在用户聊天时的聊天背景界面中。可见,本发明提供的方法在进行聊天引导时,根据用户实时聊天产生的语音文本信息发觉出的用户潜在业务意图,并将发觉出的目标业务信息作为聊天引导信息显示在聊天背景界面中,以对用户的聊天进行有针对性的引导,及时调整回复方向,从而满足用户的潜在需求。
图12中示例性示出了根据一些实施例的业务关键词库创建装置的结构框图。参见图12,本发明实施例提供的一种业务关键词库创建装置,包括:历史信息获取模块110,用于获取每个用户产生的交互语音文本信息;文本聚类模块120,用于根据业务类型,对每个所述交互语音文本信息进行聚类,得到每个所述业务类型对应的文本信息聚类,所述文本信息聚类中包括同一业务类型对应的多个交互语音文本信息;文本分析模块130,用于对每个所述文本信息聚类中的交互语音文本信息进行文本分析,得到每个所述交互语音文本信息对应的至少一个关键词;业务关键词库创建模块140,用于创建包括每个所述业务类型对应的至少一个关键词的业务关键词库,所述业务关键词库用于在用户聊天时基于用户产生的语音文本信息提供聊天引导信息。
图13中示例性示出了根据一些实施例的智能聊天引导装置的结构框图。参见图13,本发明实施例提供的一种智能聊天引导装置,其特征在于,包括:实时信息获取模块210,用于获取业务关键词库和用户聊天时产生的语音文本信息,所述业务关键词库包括每个业务类型对应的至少一个关键词;文本分类分析模块220,用于对所述语音文本信息进行文本分类分析,确定所述语音文本信息对应的目标业务类型;业务关键词提取模块230,用于对所述语音文本信息进行序列标注,提取对应的业务关键词;目标业务信息查询模块240,用于基于所述目标业务类型和所述业务关键词,在所述业务关键词库中查询对应的目标业务信息,所述目标业务信息是指所述目标业务类型对应的与所述业务关键词相关的信息;聊天引导信息显示模块250,用于将所述目标业务信息作为聊天引导信息显示在用户聊天时的聊天背景界面中。
由以上技术方案可知,本发明实施例提供的一种业务关键词库创建方法、智能聊天引导方法及装置,在创建业务关键词库时,基于每个用户产生的交互语音文本信息,按照业务类型进行聚类,得到每个业务类型对应的文本信息聚类。对每个文本信息聚类下的交互语音文本信息进行文本分析,得到多个关键词,创建包括每个业务类型对应的至少一个关键词的业务关键词库。在进行聊天引导时,对用户聊天时产生的语音文本信息进行文本分类分析,以确定对应的目标业务类型,并对语音文本信息进行序列标注,提取出对应的业务关键词;基于目标业务类型和业务关键词,在业务关键词库中查询对应的目标业务信息,将目标业务信息作为聊天引导信息显示在用户聊天时的聊天背景界面中。本发明提供的方法及装置,可根据用户实时语音文本信息和业务关键词库及时发觉用户的潜在业务意图,并将发觉出的目标业务信息作为聊天引导信息显示在聊天背景界面中,以对用户的聊天进行有针对性的引导,及时调整回复方向,从而满足用户的潜在需求。
具体实现中,本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的业务关键词库创建方法和智能聊天引导方法的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于业务关键词库创建装置和智能聊天引导装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
以上所述的本发明实施方式并不构成对本发明保护范围的限定。
Claims (12)
1.一种业务关键词库创建方法,其特征在于,包括:
获取每个用户产生的交互语音文本信息;
根据业务类型,对每个所述交互语音文本信息进行聚类,得到每个所述业务类型对应的文本信息聚类,所述文本信息聚类中包括同一业务类型对应的多个交互语音文本信息;
对每个所述文本信息聚类中的交互语音文本信息进行文本分析,得到每个所述交互语音文本信息对应的至少一个关键词;
创建包括每个所述业务类型对应的至少一个关键词的业务关键词库,所述业务关键词库用于在用户聊天时基于用户产生的语音文本信息提供聊天引导信息。
2.根据权利要求1所述的方法,其特征在于,所述根据业务类型,对每个所述交互语音文本信息进行聚类,得到每个业务类型对应的文本信息聚类,包括:
提取每个所述交互语音文本信息中携带的业务类型标签;
将具有同一所述业务类型标签对应的交互语音文本信息划分为一类,得到每个业务类型对应的文本信息聚类。
3.根据权利要求1所述的方法,其特征在于,所述对每个所述文本信息聚类中的交互语音文本信息进行文本分析,得到每个交互语音文本信息对应的至少一个关键词,包括:
对每个所述文本信息聚类中的交互语音文本信息进行分词处理,得到每个所述交互语音文本信息对应的多个词语;
对每个所述词语进行序列标注,将序列标注后的词语作为每个交互语音文本信息对应的关键词。
4.根据权利要求1所述的方法,其特征在于,所述创建包括每个所述业务类型对应的至少一个关键词的业务关键词库,包括:
计算每个所述业务类型对应的至少一个关键词的权重值;
基于每个所述业务类型对应的所述权重值满足预设阈值的至少一个关键词,建立业务关键词库。
5.根据权利要求4所述的方法,其特征在于,所述计算每个所述业务类型对应的至少一个关键词的权重值,包括:
计算所述关键词在所属交互语音文本信息中产生的词频率,以及,所述关键词在所有交互语音文本信息中产生的逆文本频率;
基于所述词频率和所述逆文本频率的乘积,确定所述关键词的权重值。
6.根据权利要求4所述的方法,其特征在于,所述基于每个所述业务类型对应的所述权重值满足预设阈值的至少一个关键词,建立业务关键词库,包括:
将每个所述关键词的权重值与所述预设阈值进行对比;
将所述权重值大于或等于所述预设阈值对应的关键词确定为目标关键词;
获取每个所述关键词的标签;
如果所述标签为指定标签,则将标签为指定标签的关键词作为优选关键词;
基于每个所述业务类型对应的所述目标关键词和优选关键词,建立业务关键词库。
7.一种智能聊天引导方法,其特征在于,所述方法包括:
获取业务关键词库和用户聊天时产生的语音文本信息,所述业务关键词库包括每个业务类型对应的至少一个关键词;
对所述语音文本信息进行文本分类分析,确定所述语音文本信息对应的目标业务类型;
对所述语音文本信息进行序列标注,提取对应的业务关键词;
基于所述目标业务类型和所述业务关键词,在所述业务关键词库中查询对应的目标业务信息,所述目标业务信息是指所述目标业务类型对应的与所述业务关键词相关的信息;
将所述目标业务信息作为聊天引导信息显示在用户聊天时的聊天背景界面中。
8.根据权利要求7所述的方法,其特征在于,所述对所述语音文本信息进行文本分类分析,确定所述语音文本信息对应的目标业务类型,包括:
对所述语音文本信息进行分词处理,得到所述交互语音文本信息对应的多个词语;
计算每个所述词语在每个业务类型中产生的分类概率;
将所述词语的分类概率最高对应的业务类型,确定为所述语音文本信息对应的目标业务类型。
9.根据权利要求7所述的方法,其特征在于,所述对语音文本信息进行序列标注,提取对应的业务关键词,包括:
对所述语音文本信息进行分词处理,得到所述交互语音文本信息对应的多个词语;
对每个所述词语分别添加标签,所述标签用于表征所述词语的文本类别标记;
获取每个所述标签对应的权重值;
将所述权重值最高的标签对应的词语确定为业务关键词。
10.根据权利要求7所述的方法,其特征在于,所述将目标业务信息作为聊天引导信息显示在用户聊天时的聊天背景界面中,包括:
获取每个所述目标业务信息对应的相关度分数;
将多个所述目标业务信息按照相关度分数由高到低进行排序,生成推荐列表;
将所述推荐列表作为聊天引导信息显示在用户聊天时的聊天背景界面中。
11.一种业务关键词库创建装置,其特征在于,包括:
历史信息获取模块,用于获取每个用户产生的交互语音文本信息;
文本聚类模块,用于根据业务类型,对每个所述交互语音文本信息进行聚类,得到每个所述业务类型对应的文本信息聚类,所述文本信息聚类中包括同一业务类型对应的多个交互语音文本信息;
文本分析模块,用于对每个所述文本信息聚类中的交互语音文本信息进行文本分析,得到每个所述交互语音文本信息对应的至少一个关键词;
业务关键词库创建模块,用于创建包括每个所述业务类型对应的至少一个关键词的业务关键词库,所述业务关键词库用于在用户聊天时基于用户产生的语音文本信息提供聊天引导信息。
12.一种智能聊天引导装置,其特征在于,包括:
实时信息获取模块,用于获取业务关键词库和用户聊天时产生的语音文本信息,所述业务关键词库包括每个业务类型对应的至少一个关键词;
文本分类分析模块,用于对所述语音文本信息进行文本分类分析,确定所述语音文本信息对应的目标业务类型;
业务关键词提取模块,用于对所述语音文本信息进行序列标注,提取对应的业务关键词;
目标业务信息查询模块,用于基于所述目标业务类型和所述业务关键词,在所述业务关键词库中查询对应的目标业务信息,所述目标业务信息是指所述目标业务类型对应的与所述业务关键词相关的信息;
聊天引导信息显示模块,用于将所述目标业务信息作为聊天引导信息显示在用户聊天时的聊天背景界面中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010767970.XA CN111881283B (zh) | 2020-08-03 | 2020-08-03 | 一种业务关键词库创建方法、智能聊天引导方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010767970.XA CN111881283B (zh) | 2020-08-03 | 2020-08-03 | 一种业务关键词库创建方法、智能聊天引导方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111881283A true CN111881283A (zh) | 2020-11-03 |
CN111881283B CN111881283B (zh) | 2024-10-22 |
Family
ID=73205367
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010767970.XA Active CN111881283B (zh) | 2020-08-03 | 2020-08-03 | 一种业务关键词库创建方法、智能聊天引导方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111881283B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112784030A (zh) * | 2021-01-28 | 2021-05-11 | 北京三快在线科技有限公司 | 一种生成样本的方法、装置、存储介质及电子设备 |
CN113505292A (zh) * | 2021-06-15 | 2021-10-15 | 深圳追一科技有限公司 | 信息推送方法、装置、电子设备及存储介质 |
CN114374572A (zh) * | 2021-12-30 | 2022-04-19 | 广州趣丸网络科技有限公司 | 一种语音信息处理方法和装置 |
CN117093785A (zh) * | 2023-10-19 | 2023-11-21 | 厦门她趣信息技术有限公司 | 基于社交引导用户的方法、系统、设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017041372A1 (zh) * | 2015-09-07 | 2017-03-16 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
CN106649405A (zh) * | 2015-11-04 | 2017-05-10 | 陈包容 | 一种获取聊天发起句的回复提示内容的方法及装置 |
CN107590125A (zh) * | 2017-09-07 | 2018-01-16 | 国网山东省电力公司 | 一种基于随机算法的大数据文本实时交互方法和装置 |
US20180225365A1 (en) * | 2017-02-08 | 2018-08-09 | International Business Machines Corporation | Dialog mechanism responsive to query context |
CN109101620A (zh) * | 2018-08-08 | 2018-12-28 | 广州神马移动信息科技有限公司 | 相似度计算方法、聚类方法、装置、存储介质及电子设备 |
CN109920414A (zh) * | 2019-01-17 | 2019-06-21 | 平安城市建设科技(深圳)有限公司 | 人机问答方法、装置、设备和存储介质 |
CN110019149A (zh) * | 2019-01-30 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 一种客服知识库的建立方法、装置及设备 |
US10444945B1 (en) * | 2016-10-10 | 2019-10-15 | United Services Automobile Association | Systems and methods for ingesting and parsing datasets generated from disparate data sources |
-
2020
- 2020-08-03 CN CN202010767970.XA patent/CN111881283B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017041372A1 (zh) * | 2015-09-07 | 2017-03-16 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
CN106649405A (zh) * | 2015-11-04 | 2017-05-10 | 陈包容 | 一种获取聊天发起句的回复提示内容的方法及装置 |
US10444945B1 (en) * | 2016-10-10 | 2019-10-15 | United Services Automobile Association | Systems and methods for ingesting and parsing datasets generated from disparate data sources |
US20180225365A1 (en) * | 2017-02-08 | 2018-08-09 | International Business Machines Corporation | Dialog mechanism responsive to query context |
CN107590125A (zh) * | 2017-09-07 | 2018-01-16 | 国网山东省电力公司 | 一种基于随机算法的大数据文本实时交互方法和装置 |
CN109101620A (zh) * | 2018-08-08 | 2018-12-28 | 广州神马移动信息科技有限公司 | 相似度计算方法、聚类方法、装置、存储介质及电子设备 |
CN109920414A (zh) * | 2019-01-17 | 2019-06-21 | 平安城市建设科技(深圳)有限公司 | 人机问答方法、装置、设备和存储介质 |
CN110019149A (zh) * | 2019-01-30 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 一种客服知识库的建立方法、装置及设备 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112784030A (zh) * | 2021-01-28 | 2021-05-11 | 北京三快在线科技有限公司 | 一种生成样本的方法、装置、存储介质及电子设备 |
CN112784030B (zh) * | 2021-01-28 | 2022-08-26 | 北京三快在线科技有限公司 | 一种生成样本的方法、装置、存储介质及电子设备 |
CN113505292A (zh) * | 2021-06-15 | 2021-10-15 | 深圳追一科技有限公司 | 信息推送方法、装置、电子设备及存储介质 |
CN114374572A (zh) * | 2021-12-30 | 2022-04-19 | 广州趣丸网络科技有限公司 | 一种语音信息处理方法和装置 |
CN114374572B (zh) * | 2021-12-30 | 2023-12-01 | 广州趣丸网络科技有限公司 | 一种语音信息处理方法和装置 |
CN117093785A (zh) * | 2023-10-19 | 2023-11-21 | 厦门她趣信息技术有限公司 | 基于社交引导用户的方法、系统、设备及存储介质 |
CN117093785B (zh) * | 2023-10-19 | 2024-01-23 | 厦门她趣信息技术有限公司 | 基于社交引导用户的方法、系统、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111881283B (zh) | 2024-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111753060B (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
CN110188168B (zh) | 语义关系识别方法和装置 | |
CN106919619B (zh) | 一种商品聚类方法、装置及电子设备 | |
CN111881283B (zh) | 一种业务关键词库创建方法、智能聊天引导方法及装置 | |
CN105824959B (zh) | 舆情监控方法及系统 | |
US8788503B1 (en) | Content identification | |
CN104471568A (zh) | 对自然语言问题的基于学习的处理 | |
CN112000776B (zh) | 基于语音语义的话题匹配方法、装置、设备及存储介质 | |
CN114238573A (zh) | 基于文本对抗样例的信息推送方法及装置 | |
CN113806588B (zh) | 搜索视频的方法和装置 | |
CN111078835A (zh) | 简历评估方法、装置、计算机设备及存储介质 | |
CN111274822A (zh) | 语义匹配方法、装置、设备及存储介质 | |
CN111666766A (zh) | 数据处理方法、装置和设备 | |
CN113821588A (zh) | 文本处理方法、装置、电子设备及存储介质 | |
CN115168567B (zh) | 一种基于知识图谱的对象推荐方法 | |
CN112084406B (zh) | 短信处理方法、装置、电子设备和存储介质 | |
CN114255067A (zh) | 数据定价方法和装置、电子设备、存储介质 | |
CN111737607B (zh) | 数据处理方法、装置、电子设备以及存储介质 | |
TW201243627A (en) | Multi-label text categorization based on fuzzy similarity and k nearest neighbors | |
CN116882414B (zh) | 基于大规模语言模型的评语自动生成方法及相关装置 | |
CN116798417B (zh) | 语音意图识别方法、装置、电子设备及存储介质 | |
CN114780601A (zh) | 一种数据查询方法、装置、电子设备和存储介质 | |
CN114138928A (zh) | 文本内容提取的方法、系统、装置、电子设备及介质 | |
CN118095296B (zh) | 基于知识图谱的语义分析方法、系统和介质 | |
CN110837740B (zh) | 一种基于词典改进lda模型的评论方面观点级挖掘方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |