CN113111153A - 一种数据分析方法、装置、设备及存储介质 - Google Patents
一种数据分析方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113111153A CN113111153A CN202110524756.6A CN202110524756A CN113111153A CN 113111153 A CN113111153 A CN 113111153A CN 202110524756 A CN202110524756 A CN 202110524756A CN 113111153 A CN113111153 A CN 113111153A
- Authority
- CN
- China
- Prior art keywords
- information
- business
- business activity
- activity
- time range
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000000694 effects Effects 0.000 claims abstract description 253
- 238000013179 statistical model Methods 0.000 claims abstract description 36
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 70
- 238000004590 computer program Methods 0.000 claims description 11
- 238000003062 neural network model Methods 0.000 claims description 5
- 230000000306 recurrent effect Effects 0.000 claims description 5
- 238000002372 labelling Methods 0.000 claims description 4
- 238000007726 management method Methods 0.000 abstract description 27
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 10
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/383—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Library & Information Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例涉及大数据领域,公开了一种数据分析方法、装置、设备及存储介质,该方法包括:获取业务代理人输入的语音信息;对语音信息进行识别得到文本信息,并确定目标核心信息;确定与目标核心信息中的业务活动经营信息和/或客户信息对应的结构化关键信息,并将结构化关键信息存储到业务日志中;根据预设的统计时间点从业务日志中获取在预设时间范围内发生业务活动的结构化关键信息,并将结构化关键信息输入业务活动量统计模型,得到业务活动量信息。这种方式可以准确、有效地获取线下业务经营活动的数据,量化统计业务代理人线下业务经营活动的数据。本发明涉及区块链技术,如可将文本信息写入区块链中,以用于数据取证等场景。
Description
技术领域
本发明涉及大数据领域,尤其涉及一种数据分析方法、装置、设备及存储介质。
背景技术
数字化转型对任何一家业务公司都是至关重要的,但长期以来无法解决的问题就是:业务公司的营收主要依赖业务代理人的线下业务经营活动,但这些线下业务经营活动的数据无法被结构化精准获取,从而导致公司层面只能要求结果却无法了解、优化过程。这种局面极大的限制了业务代理人群体业务经营行为的升级,以及公司的数字化转型和经营模式升级。因此,如何有效地获取线下业务经营活动的数据成为关键点。
发明内容
本发明实施例提供了一种数据分析方法、装置、设备及存储介质,可以准确、有效地获取线下业务经营活动的数据,量化统计业务代理人线下业务经营活动的数据,有助于提升对客户信息的管理效率。
第一方面,本发明实施例提供了一种数据分析方法,所述方法包括:
获取业务代理人输入的语音信息,所述语音信息包括所述业务代理人线下经营业务活动的关联信息;
对所述语音信息进行识别,得到与所述语音信息对应的文本信息,并根据所述文本信息确定目标核心信息,所述目标核心信息包括业务活动经营信息和/或客户信息;
根据所述目标核心信息确定与所述业务活动经营信息和/或客户信息对应的结构化关键信息,并将所述结构化关键信息存储到业务日志中;
根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息,并将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息。
进一步地,所述对所述语音信息进行识别,得到与所述语音信息对应的文本信息之前,还包括:
获取样本语音信息的语音信号序列,并对所述样本语音信号序列进行分类和标注;
将所述分类和标注后的样本语音信号序列输入预设的循环神经网络模型进行训练,得到联合识别模型。
进一步地,所述对所述语音信息进行识别,得到与所述语音信息对应的文本信息,包括:
获取所述语音信息的语音信号序列,并在所述语音信号序列的指定位置处添加指定标识符,所述指定标识符用于指示业务活动类型;
将所述添加指定标识符的语音信号序列输入所述联合识别模型,识别得到所述业务代理人的业务活动信息。
进一步地,所述将所述添加指定标识符的语音信号序列输入所述联合识别模型,识别得到所述业务代理人的业务活动信息,包括:
将所述添加指定标识符的语音信号序列输入所述联合识别模型,识别得到所述语音信号序列中每个字符对应的标签,其中,所述标签包括前缀和后缀,所述前缀用于标识所述标签的位置,所述后缀用于标识所述标签的类型;
根据所述语音信号序列中每个字符对应的标签和所述指定标识符确定所述业务代理人的业务活动信息。
进一步地,所述业务活动信息包括业务活动类型和业务活动元素;所述根据所述语音信号序列中每个字符对应的标签和所述指定标识符确定所述业务代理人的业务活动信息,包括:
根据所述语音信号序列中每个字符对应的标签确定所述业务代理人的业务活动元素;
根据所述语音信号序列的指定位置处添加的指定标识符确定所述业务代理人的业务活动元素。
进一步地,所述根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息,包括:
根据预设的统计时间点从所述业务日志中获取在预设时间范围内所述业务代理人发生业务活动的结构化关键信息;
所述将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息,包括:
将在所述预设时间范围内所述业务代理人发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内所述业务代理人的业务活动量信息。
进一步地,所述根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息,包括:
获取所述业务代理人的团队标识,并根据预设的统计时间点从所述业务日志中获取在预设时间范围内与所述团队标识对应的所有业务代理人发生业务活动的结构化关键信息;
所述将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息,包括:
将在所述预设时间范围内与所述团队标识对应的所有业务代理人发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内所述业务代理人的业务活动量信息。
第二方面,本发明实施例提供了一种数据分析装置,包括:
获取单元,用于获取业务代理人输入的语音信息,所述语音信息包括所述业务代理人线下经营业务活动的关联信息;
识别单元,用于对所述语音信息进行识别,得到与所述语音信息对应的文本信息,并根据所述文本信息确定目标核心信息,所述目标核心信息包括业务活动经营信息和/或客户信息;
确定单元,用于根据所述目标核心信息确定与所述业务活动经营信息和/或客户信息对应的结构化关键信息,并将所述结构化关键信息存储到业务日志中;
统计单元,用于根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息,并将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息。
第三方面,本发明实施例提供了一种计算机设备,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储支持数据分析装置执行上述方法的计算机程序,所述计算机程序包括程序,所述处理器被配置用于调用所述程序,执行上述第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行以实现上述第一方面的方法。
本发明实施例可以获取业务代理人输入的语音信息,所述语音信息包括所述业务代理人线下经营业务活动的关联信息;对所述语音信息进行识别,得到与所述语音信息对应的文本信息,并根据所述文本信息确定目标核心信息,所述目标核心信息包括业务活动经营信息和/或客户信息;根据所述目标核心信息确定与所述业务活动经营信息和/或客户信息对应的结构化关键信息,并将所述结构化关键信息存储到业务日志中;根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息,并将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息。通过这种实施方式,可以准确、有效地获取线下业务经营活动的数据,量化统计业务代理人线下业务经营活动的数据,有助于提升对客户信息的管理效率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种数据分析方法的示意流程图;
图2是本发明实施例提供的一种语音信号序列的示意图;
图3是本发明实施例提供的一种业务活动量的示意图;
图4是本发明实施例提供的另一种业务活动量的示意图;
图5是本发明实施例提供的一种数据分析装置的示意框图;
图6是本发明实施例提供的一种计算机设备的示意框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的数据分析方法可以应用于一种数据分析装置,在某些实施例中,所述数据分析装置设置于计算机设备中。在某些实施例中,所述计算机设备包括但不限于智能手机、平板电脑、膝上型电脑等中的一种或者多种。
下面结合附图1对本发明实施例提供的数据分析方法进行示意性说明。
请参见图1,图1是本发明实施例提供的一种数据分析方法的示意流程图,如图1所示,该方法可以由数据分析装置执行,所述数据分析装置设置于计算机设备中。具体地,本发明实施例的所述方法包括如下步骤。
S101:获取业务代理人输入的语音信息,所述语音信息包括所述业务代理人线下经营业务活动的关联信息。
本发明实施例中,数据分析装置可以获取业务代理人输入的语音信息,所述语音信息包括所述业务代理人线下经营业务活动的关联信息。
在一个实施例中,数据分析装置在获取业务代理人输入的语音信息时,可以获取业务代理人通过对话机器人等录入的语音信息。在某些实施例中,所述语音信息可以是代理人录入的自己已经完成的业务经营活动的内容;在其他实施例中,所述语音信息还可以是代理人记录的自己在一次线下与客户接触过程中收获的有价值的客户信息,如客户的家庭情况、个人意愿等。
S102:对所述语音信息进行识别,得到与所述语音信息对应的文本信息,并根据所述文本信息确定目标核心信息,所述目标核心信息包括业务活动经营信息和/或客户信息。
本发明实施例中,数据分析装置可以对所述语音信息进行识别,得到与所述语音信息对应的文本信息,并根据所述文本信息确定目标核心信息,所述目标核心信息包括业务活动经营信息和/或客户信息。
在某些实施例中,所述业务活动经营信息可以包括但不限于业务活动名称、业务活动时间、业务活动地点等中的一种或多种。在某些实施例中,所述客户信息可以包括但不限于客户姓名、电话号码、身份证号码、家庭情况、个人意愿等任意一种或多种。
在一个实施例中,数据分析装置在对所述语音信息进行识别,得到与所述语音信息对应的文本信息之前,可以获取样本语音信息的语音信号序列,并对所述样本语音信号序列进行分类和标注;将所述分类和标注后的样本语音信号序列输入预设的循环神经网络模型进行训练,得到联合识别模型。
在一个实施例中,数据分析装置在对所述语音信息进行识别,得到与所述语音信息对应的文本信息时,可以获取所述语音信息的语音信号序列,并在所述语音信号序列的指定位置处添加指定标识符,所述指定标识符用于指示业务活动类型;将所述添加指定标识符的语音信号序列输入所述联合识别模型,识别得到所述业务代理人的业务活动信息。
在一个实施例中,数据分析装置在将所述添加指定标识符的语音信号序列输入所述联合识别模型,识别得到所述业务代理人的业务活动信息时,可以将所述添加指定标识符的语音信号序列输入所述联合识别模型,识别得到所述语音信号序列中每个字符对应的标签,其中,所述标签包括前缀和后缀,所述前缀用于标识所述标签的位置,所述后缀用于标识所述标签的类型;根据所述语音信号序列中每个字符对应的标签和所述指定标识符确定所述业务代理人的业务活动信息。
在一个实施例中,所述业务活动信息包括业务活动类型和业务活动元素;数据分析装置在根据所述语音信号序列中每个字符对应的标签和所述指定标识符确定所述业务代理人的业务活动信息时,可以根据所述语音信号序列中每个字符对应的标签确定所述业务代理人的业务活动元素;根据所述语音信号序列的指定位置处添加的指定标识符确定所述业务代理人的业务活动元素。在某些实施例中,所述业务活动元素包括但不限于业务活动时间、客户名称等。
例如,假设识别语音信息得到的文本信息为:今天上午拜访了孙志权,介绍了平安福,他说再考虑一下,因此,可以确定该文本信息的语音信号序列,该文本信息的语音信号序列如图2所示,图2是本发明实施例提供的一种语音信号序列的示意图。以如图2所示的语音信号序列中“今/天/上/午”对应的“B-TIME/I-TIME/I-TIME/I-TIME”四个标签为例,B-TIME表示一个时间短语的开头,I-TIME表示一个时间短语的中间部分,连在一起就能表示“今天上午”是一个应该被抽取为表示业务活动时间的短语;特别地,联合模型对句末添加的<EOS>指定标识符标识的是这个句子代表的业务活动类型,在本例中,<EOS>对应标签B-VISIT,表示这个模型预测这个句子描述的是一个拜访的业务活动。
S103:根据所述目标核心信息确定与所述业务活动经营信息和/或客户信息对应的结构化关键信息,并将所述结构化关键信息存储到业务日志中。
本发明实施例中,数据分析装置可以根据所述目标核心信息确定与所述业务活动经营信息和/或客户信息对应的结构化关键信息,并将所述结构化关键信息存储到业务日志中。在某些实施例中,所述结构化关键信息包括但不限于业务活动时间、地点、客户信息,例如,假设识别语音信息得到的文本信息为:今天上午拜访了孙志权,介绍了平安福,他说再考虑一下,确定的结构化关键信息包括7月60日(即今天)、孙志权、介绍了平安福,他说考虑一下。
在一个实施例中,数据分析装置在将所述结构化关键信息存储到业务日志中后,可以生成通知消息,并输出显示所述通知消息,所述通知消息用于通知业务代理人语音信息对应的结构化关键信息已存储备案。
通过将所述结构化关键信息以日志形式进行记录,可以支持业务代理人按照客户姓名进行查询,代理人记录的内容即可以按照时间顺序查看,又能够按照客户称呼进行查询,极大的提升信息查询效率,有助于业务代理人结合客户信息制定个性化的销售服务方案等。
S104:根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息,并将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息。
本发明实施例中,数据分析装置可以根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息,并将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息。
在一个实施例中,数据分析装置在根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息时,可以根据预设的统计时间点从所述业务日志中获取在预设时间范围内所述业务代理人发生业务活动的结构化关键信息。
在一个实施例中,数据分析装置在将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息时,可以将在所述预设时间范围内所述业务代理人发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内所述业务代理人的业务活动量信息。
在一个实施例中,数据分析装置可以获取数据查询请求,所述数据查询请求中可以携带业务代理人标识,数据分析装置可以根据所述数据查询请求中携带的业务代理人标识从所述业务日志中查询在预设时间范围内所述业务代理人标识对应的业务代理人的业务活动量信息。
在一个实施例中,数据分析装置可以获取数据查询请求,所述数据查询请求中可以携带业务代理人标识和查询时间范围,数据分析装置可以根据所述数据查询请求中携带的业务代理人标识和查询时间范围,从所述业务日志中查询在所述查询时间范围内所述业务代理人标识对应的业务代理人的业务活动量信息。具体可以图3为例,图3是本发明实施例提供的一种业务活动量的示意图。
在一个实施例中,数据分析装置在根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息时,可以获取所述业务代理人的团队标识,并根据预设的统计时间点从所述业务日志中获取在预设时间范围内与所述团队标识对应的所有业务代理人发生业务活动的结构化关键信息。
在一个实施例中,数据分析装置在将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息时,可以将在所述预设时间范围内与所述团队标识对应的所有业务代理人发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内所述业务代理人的业务活动量信息。具体可以图4为例,图4是本发明实施例提供的另一种业务活动量的示意图。
本发明实施例中,数据分析装置可以获取业务代理人输入的语音信息,所述语音信息包括所述业务代理人线下经营业务活动的关联信息;对所述语音信息进行识别,得到与所述语音信息对应的文本信息,并根据所述文本信息确定目标核心信息,所述目标核心信息包括业务活动经营信息和/或客户信息;根据所述目标核心信息确定与所述业务活动经营信息和/或客户信息对应的结构化关键信息,并将所述结构化关键信息存储到业务日志中;根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息,并将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息。通过这种实施方式,可以准确、有效地获取线下业务经营活动的数据,量化统计业务代理人线下业务经营活动的数据,有助于提升对客户信息的管理效率。
本发明实施例还提供了一种数据分析装置,该数据分析装置用于执行前述任一项所述的方法的单元。具体地,参见图5,图5是本发明实施例提供的一种数据分析装置的示意框图。本实施例的数据分析装置包括:获取单元501、识别单元502、确定单元503以及统计单元504。
获取单元501,用于获取业务代理人输入的语音信息,所述语音信息包括所述业务代理人线下经营业务活动的关联信息;
识别单元502,用于对所述语音信息进行识别,得到与所述语音信息对应的文本信息,并根据所述文本信息确定目标核心信息,所述目标核心信息包括业务活动经营信息和/或客户信息;
确定单元503,用于根据所述目标核心信息确定与所述业务活动经营信息和/或客户信息对应的结构化关键信息,并将所述结构化关键信息存储到业务日志中;
统计单元504,用于根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息,并将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息。
进一步地,所述识别单元502对所述语音信息进行识别,得到与所述语音信息对应的文本信息之前,还用于:
获取样本语音信息的语音信号序列,并对所述样本语音信号序列进行分类和标注;
将所述分类和标注后的样本语音信号序列输入预设的循环神经网络模型进行训练,得到联合识别模型。
进一步地,所述识别单元502对所述语音信息进行识别,得到与所述语音信息对应的文本信息时,具体用于:
获取所述语音信息的语音信号序列,并在所述语音信号序列的指定位置处添加指定标识符,所述指定标识符用于指示业务活动类型;
将所述添加指定标识符的语音信号序列输入所述联合识别模型,识别得到所述业务代理人的业务活动信息。
进一步地,所述识别单元502将所述添加指定标识符的语音信号序列输入所述联合识别模型,识别得到所述业务代理人的业务活动信息时,具体用于:
将所述添加指定标识符的语音信号序列输入所述联合识别模型,识别得到所述语音信号序列中每个字符对应的标签,其中,所述标签包括前缀和后缀,所述前缀用于标识所述标签的位置,所述后缀用于标识所述标签的类型;
根据所述语音信号序列中每个字符对应的标签和所述指定标识符确定所述业务代理人的业务活动信息。
进一步地,所述业务活动信息包括业务活动类型和业务活动元素;所述识别单元502根据所述语音信号序列中每个字符对应的标签和所述指定标识符确定所述业务代理人的业务活动信息时,具体用于:
根据所述语音信号序列中每个字符对应的标签确定所述业务代理人的业务活动元素;
根据所述语音信号序列的指定位置处添加的指定标识符确定所述业务代理人的业务活动元素。
进一步地,所述统计单元504根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息时,具体用于:
根据预设的统计时间点从所述业务日志中获取在预设时间范围内所述业务代理人发生业务活动的结构化关键信息;
所述统计单元504将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息时,具体用于:
将在所述预设时间范围内所述业务代理人发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内所述业务代理人的业务活动量信息。
进一步地,所述统计单元504根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息时,具体用于:
获取所述业务代理人的团队标识,并根据预设的统计时间点从所述业务日志中获取在预设时间范围内与所述团队标识对应的所有业务代理人发生业务活动的结构化关键信息;
所述统计单元504将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息时,具体用于:
将在所述预设时间范围内与所述团队标识对应的所有业务代理人发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内所述业务代理人的业务活动量信息。
本发明实施例中,数据分析装置可以获取业务代理人输入的语音信息,所述语音信息包括所述业务代理人线下经营业务活动的关联信息;对所述语音信息进行识别,得到与所述语音信息对应的文本信息,并根据所述文本信息确定目标核心信息,所述目标核心信息包括业务活动经营信息和/或客户信息;根据所述目标核心信息确定与所述业务活动经营信息和/或客户信息对应的结构化关键信息,并将所述结构化关键信息存储到业务日志中;根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息,并将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息。通过这种实施方式,可以准确、有效地获取线下业务经营活动的数据,量化统计业务代理人线下业务经营活动的数据,有助于提升对客户信息的管理效率。
参见图6,图6是本发明实施例提供的一种计算机设备的示意框图。如图所示的本实施例中的设备可以包括:一个或多个处理器601;一个或多个输入设备602,一个或多个输出设备603和存储器604。上述处理器601、输入设备602、输出设备603和存储器604通过总线605连接。存储器604用于存储计算机程序,所述计算机程序包括程序,处理器601用于执行存储器604存储的程序。其中,处理器601被配置用于调用所述程序执行:
获取业务代理人输入的语音信息,所述语音信息包括所述业务代理人线下经营业务活动的关联信息;
对所述语音信息进行识别,得到与所述语音信息对应的文本信息,并根据所述文本信息确定目标核心信息,所述目标核心信息包括业务活动经营信息和/或客户信息;
根据所述目标核心信息确定与所述业务活动经营信息和/或客户信息对应的结构化关键信息,并将所述结构化关键信息存储到业务日志中;
根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息,并将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息。
进一步地,所述处理器601对所述语音信息进行识别,得到与所述语音信息对应的文本信息之前,还用于:
获取样本语音信息的语音信号序列,并对所述样本语音信号序列进行分类和标注;
将所述分类和标注后的样本语音信号序列输入预设的循环神经网络模型进行训练,得到联合识别模型。
进一步地,所述处理器601对所述语音信息进行识别,得到与所述语音信息对应的文本信息时,具体用于:
获取所述语音信息的语音信号序列,并在所述语音信号序列的指定位置处添加指定标识符,所述指定标识符用于指示业务活动类型;
将所述添加指定标识符的语音信号序列输入所述联合识别模型,识别得到所述业务代理人的业务活动信息。
进一步地,所述处理器601将所述添加指定标识符的语音信号序列输入所述联合识别模型,识别得到所述业务代理人的业务活动信息时,具体用于:
将所述添加指定标识符的语音信号序列输入所述联合识别模型,识别得到所述语音信号序列中每个字符对应的标签,其中,所述标签包括前缀和后缀,所述前缀用于标识所述标签的位置,所述后缀用于标识所述标签的类型;
根据所述语音信号序列中每个字符对应的标签和所述指定标识符确定所述业务代理人的业务活动信息。
进一步地,所述业务活动信息包括业务活动类型和业务活动元素;所述处理器601根据所述语音信号序列中每个字符对应的标签和所述指定标识符确定所述业务代理人的业务活动信息时,具体用于:
根据所述语音信号序列中每个字符对应的标签确定所述业务代理人的业务活动元素;
根据所述语音信号序列的指定位置处添加的指定标识符确定所述业务代理人的业务活动元素。
进一步地,所述处理器601根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息时,具体用于:
根据预设的统计时间点从所述业务日志中获取在预设时间范围内所述业务代理人发生业务活动的结构化关键信息;
所述处理器601将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息时,具体用于:
将在所述预设时间范围内所述业务代理人发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内所述业务代理人的业务活动量信息。
进一步地,所述处理器601根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息时,具体用于:
获取所述业务代理人的团队标识,并根据预设的统计时间点从所述业务日志中获取在预设时间范围内与所述团队标识对应的所有业务代理人发生业务活动的结构化关键信息;
所述处理器601将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息时,具体用于:
将在所述预设时间范围内与所述团队标识对应的所有业务代理人发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内所述业务代理人的业务活动量信息。
本发明实施例中,计算机设备可以获取业务代理人输入的语音信息,所述语音信息包括所述业务代理人线下经营业务活动的关联信息;对所述语音信息进行识别,得到与所述语音信息对应的文本信息,并根据所述文本信息确定目标核心信息,所述目标核心信息包括业务活动经营信息和/或客户信息;根据所述目标核心信息确定与所述业务活动经营信息和/或客户信息对应的结构化关键信息,并将所述结构化关键信息存储到业务日志中;根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息,并将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息。通过这种实施方式,可以准确、有效地获取线下业务经营活动的数据,量化统计业务代理人线下业务经营活动的数据,有助于提升对客户信息的管理效率。
应当理解,在本发明实施例中,所称处理器601可以是中央处理单元(CenSralProcessing UniS,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigiSalSignal Processor,DSP)、专用集成电路(ApplicaSion Specific InSegraSed CircuiS,ASIC)、现成可编程门阵列(Field-Programmable GaSe Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入设备602可以包括触控板、麦克风等,输出设备603可以包括显示器(LCD等)、扬声器等。
该存储器604可以包括只读存储器和随机存取存储器,并向处理器601提供指令和数据。存储器604的一部分还可以包括非易失性随机存取存储器。例如,存储器604还可以存储设备类型的信息。
具体实现中,本发明实施例中所描述的处理器601、输入设备602、输出设备603可执行本发明实施例提供的图1所述的方法实施例中所描述的实现方式,也可执行本发明实施例图5所描述的数据分析装置的实现方式,在此不再赘述。
本发明实施例中还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现图1所对应实施例中描述的数据分析方法,也可实现本发明图5所对应实施例的数据分析装置,在此不再赘述。
所述计算机可读存储介质可以是前述任一实施例所述的数据分析装置的内部存储单元,例如数据分析装置的硬盘或内存。所述计算机可读存储介质也可以是所述数据分析装置的外部存储装置,例如所述数据分析装置上配备的插接式硬盘,智能存储卡(SmarSMedia Card,SMC),安全数字(Secure DigiSal,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述数据分析装置的内部存储单元也包括外部存储装置。所述计算机可读存储介质用于存储所述计算机程序以及所述数据分析装置所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。所述的计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
需要强调的是,为进一步保证上述数据的私密和安全性,上述数据还可以存储于一区块链的节点中。其中,本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
以上所述,仅为本发明的部分实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种数据分析方法,其特征在于,所述方法包括:
获取业务代理人输入的语音信息,所述语音信息包括所述业务代理人线下经营业务活动的关联信息;
对所述语音信息进行识别,得到与所述语音信息对应的文本信息,并根据所述文本信息确定目标核心信息,所述目标核心信息包括业务活动经营信息和/或客户信息;
根据所述目标核心信息确定与所述业务活动经营信息和/或客户信息对应的结构化关键信息,并将所述结构化关键信息存储到业务日志中;
根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息,并将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息。
2.根据权利要求1所述的方法,其特征在于,所述对所述语音信息进行识别,得到与所述语音信息对应的文本信息之前,还包括:
获取样本语音信息的语音信号序列,并对所述样本语音信号序列进行分类和标注;
将所述分类和标注后的样本语音信号序列输入预设的循环神经网络模型进行训练,得到联合识别模型。
3.根据权利要求2所述的方法,其特征在于,所述对所述语音信息进行识别,得到与所述语音信息对应的文本信息,包括:
获取所述语音信息的语音信号序列,并在所述语音信号序列的指定位置处添加指定标识符,所述指定标识符用于指示业务活动类型;
将所述添加指定标识符的语音信号序列输入所述联合识别模型,识别得到所述业务代理人的业务活动信息。
4.根据权利要求3所述的方法,其特征在于,所述将所述添加指定标识符的语音信号序列输入所述联合识别模型,识别得到所述业务代理人的业务活动信息,包括:
将所述添加指定标识符的语音信号序列输入所述联合识别模型,识别得到所述语音信号序列中每个字符对应的标签,其中,所述标签包括前缀和后缀,所述前缀用于标识所述标签的位置,所述后缀用于标识所述标签的类型;
根据所述语音信号序列中每个字符对应的标签和所述指定标识符确定所述业务代理人的业务活动信息。
5.根据权利要求4所述的方法,其特征在于,所述业务活动信息包括业务活动类型和业务活动元素;所述根据所述语音信号序列中每个字符对应的标签和所述指定标识符确定所述业务代理人的业务活动信息,包括:
根据所述语音信号序列中每个字符对应的标签确定所述业务代理人的业务活动元素;
根据所述语音信号序列的指定位置处添加的指定标识符确定所述业务代理人的业务活动元素。
6.根据权利要求1所述的方法,其特征在于,所述根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息,包括:
根据预设的统计时间点从所述业务日志中获取在预设时间范围内所述业务代理人发生业务活动的结构化关键信息;
所述将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息,包括:
将在所述预设时间范围内所述业务代理人发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内所述业务代理人的业务活动量信息。
7.根据权利要求1所述的方法,其特征在于,所述根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息,包括:
获取所述业务代理人的团队标识,并根据预设的统计时间点从所述业务日志中获取在预设时间范围内与所述团队标识对应的所有业务代理人发生业务活动的结构化关键信息;
所述将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息,包括:
将在所述预设时间范围内与所述团队标识对应的所有业务代理人发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内所述业务代理人的业务活动量信息。
8.一种数据分析装置,其特征在于,包括:
获取单元,用于获取业务代理人输入的语音信息,所述语音信息包括所述业务代理人线下经营业务活动的关联信息;
识别单元,用于对所述语音信息进行识别,得到与所述语音信息对应的文本信息,并根据所述文本信息确定目标核心信息,所述目标核心信息包括业务活动经营信息和/或客户信息;
确定单元,用于根据所述目标核心信息确定与所述业务活动经营信息和/或客户信息对应的结构化关键信息,并将所述结构化关键信息存储到业务日志中;
统计单元,用于根据预设的统计时间点从所述业务日志中获取在预设时间范围内发生业务活动的结构化关键信息,并将在所述预设时间范围内发生业务活动的结构化关键信息输入业务活动量统计模型,得到在所述预设时间范围内的业务活动量信息。
9.一种计算机设备,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序,所述处理器被配置用于调用所述程序,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110524756.6A CN113111153B (zh) | 2021-05-13 | 2021-05-13 | 一种数据分析方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110524756.6A CN113111153B (zh) | 2021-05-13 | 2021-05-13 | 一种数据分析方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113111153A true CN113111153A (zh) | 2021-07-13 |
CN113111153B CN113111153B (zh) | 2023-10-31 |
Family
ID=76722532
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110524756.6A Active CN113111153B (zh) | 2021-05-13 | 2021-05-13 | 一种数据分析方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113111153B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113780580A (zh) * | 2021-09-09 | 2021-12-10 | 平安银行股份有限公司 | 基于机器学习的数据分析方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106779403A (zh) * | 2016-12-13 | 2017-05-31 | 郑州云海信息技术有限公司 | 一种电子政务系统的绩效评估方法及系统 |
WO2019205291A1 (zh) * | 2018-04-28 | 2019-10-31 | 平安科技(深圳)有限公司 | 保险销售实时监控方法、装置、设备及存储介质 |
CN111881252A (zh) * | 2020-07-31 | 2020-11-03 | 平安国际融资租赁有限公司 | 工作报告处理方法、装置、计算机设备及存储介质 |
CN112002323A (zh) * | 2020-08-24 | 2020-11-27 | 平安科技(深圳)有限公司 | 语音数据处理方法、装置、计算机设备及存储介质 |
CN112527602A (zh) * | 2020-12-16 | 2021-03-19 | 平安养老保险股份有限公司 | 业务数据统计方法、装置、计算机设备及存储介质 |
-
2021
- 2021-05-13 CN CN202110524756.6A patent/CN113111153B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106779403A (zh) * | 2016-12-13 | 2017-05-31 | 郑州云海信息技术有限公司 | 一种电子政务系统的绩效评估方法及系统 |
WO2019205291A1 (zh) * | 2018-04-28 | 2019-10-31 | 平安科技(深圳)有限公司 | 保险销售实时监控方法、装置、设备及存储介质 |
CN111881252A (zh) * | 2020-07-31 | 2020-11-03 | 平安国际融资租赁有限公司 | 工作报告处理方法、装置、计算机设备及存储介质 |
CN112002323A (zh) * | 2020-08-24 | 2020-11-27 | 平安科技(深圳)有限公司 | 语音数据处理方法、装置、计算机设备及存储介质 |
CN112527602A (zh) * | 2020-12-16 | 2021-03-19 | 平安养老保险股份有限公司 | 业务数据统计方法、装置、计算机设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113780580A (zh) * | 2021-09-09 | 2021-12-10 | 平安银行股份有限公司 | 基于机器学习的数据分析方法、装置、设备及存储介质 |
CN113780580B (zh) * | 2021-09-09 | 2024-04-19 | 平安银行股份有限公司 | 基于机器学习的数据分析方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113111153B (zh) | 2023-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020134657A1 (zh) | 系统日志脱敏方法、脱敏系统、计算机设备及存储介质 | |
CN110083623B (zh) | 一种业务规则生成方法及装置 | |
CN110826006B (zh) | 基于隐私数据保护的异常采集行为识别方法和装置 | |
CN107862425B (zh) | 风控数据采集方法、设备、系统及可读存储介质 | |
CN112162965A (zh) | 一种日志数据处理的方法、装置、计算机设备及存储介质 | |
CN111552680A (zh) | 业务欺诈识别数据库的构建方法、装置和计算机设备 | |
CN108830562B (zh) | 一种考勤打卡方法及相关设备 | |
CN115329381A (zh) | 基于敏感数据的分析预警方法、装置、计算机设备及介质 | |
CN112860662A (zh) | 数据血缘关系建立方法、装置、计算机设备及存储介质 | |
CN114817968A (zh) | 无特征数据的路径追溯方法、装置、设备及存储介质 | |
CN110310020B (zh) | 基于数据分析的项目方案管理方法、相关装置及存储介质 | |
CN112632409A (zh) | 同一用户识别方法、装置、计算机设备和存储介质 | |
JP2003196476A (ja) | セキュリティポリシーの作成支援システムおよびセキュリティ対策決定支援システム | |
CN113111153A (zh) | 一种数据分析方法、装置、设备及存储介质 | |
CN112669850A (zh) | 语音质量检测方法、装置、计算机设备及存储介质 | |
CN113780580B (zh) | 基于机器学习的数据分析方法、装置、设备及存储介质 | |
CN112084408B (zh) | 名单数据筛选方法、装置、计算机设备及存储介质 | |
CN111144091B (zh) | 客服成员的确定方法、装置以及群成员身份的确定方法 | |
CN114861076A (zh) | 信息处理方法、装置、计算机设备和存储介质 | |
CN111353768A (zh) | 一种图书借阅监管方法、装置、设备及存储介质 | |
CN112581322A (zh) | 裁判文书的处理方法及相关装置 | |
CN110555716A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN114662007B (zh) | 数据推荐方法、装置、计算机设备和存储介质 | |
US20230120348A1 (en) | Systems and methods of personally identifiable information (pii) tracking in a network | |
CN112613917A (zh) | 基于用户画像的信息推送方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |