CN112256836A - 记录数据的处理方法、装置和服务器 - Google Patents
记录数据的处理方法、装置和服务器 Download PDFInfo
- Publication number
- CN112256836A CN112256836A CN202011214882.3A CN202011214882A CN112256836A CN 112256836 A CN112256836 A CN 112256836A CN 202011214882 A CN202011214882 A CN 202011214882A CN 112256836 A CN112256836 A CN 112256836A
- Authority
- CN
- China
- Prior art keywords
- target
- data
- processing
- text data
- target text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 330
- 238000000034 method Methods 0.000 claims abstract description 96
- 230000008451 emotion Effects 0.000 claims abstract description 80
- 230000006399 behavior Effects 0.000 claims abstract description 67
- 238000004458 analytical method Methods 0.000 claims abstract description 54
- 230000008569 process Effects 0.000 claims abstract description 51
- 238000012216 screening Methods 0.000 claims description 13
- 238000002372 labelling Methods 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 12
- 238000001514 detection method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 241001122315 Polites Species 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004141 dimensional analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004884 risky behavior Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/12—Hotels or restaurants
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Development Economics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Primary Health Care (AREA)
- Entrepreneurship & Innovation (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书提供了记录数据的处理方法、装置和服务器。基于该方法,在接收到记录目标服务实施过程的目标记录数据之后,可以先将目标记录数据转化为统一形式的目标文本数据;再根据相匹配的目标处理规则,处理该目标文本数据,得到基于语义维度的第一处理结果;同时,通过对该目标文本数据进行情感分析处理,得到基于情感维度的第二处理结果;再综合利用上述基于两种不同维度得到的第一处理和第二处理结果,来判断出数据执行对象在实施该目标服务时是否存在风险行为,是否符合预设的行为规则。从而能够高效、准确地发现数据执行对象在实施目标服务时的风险行为,检测出不符合预设的行为规则的服务行为,并及时进行提示,以提高服务质量。
Description
技术领域
本说明书属于互联网技术领域,尤其涉及记录数据的处理方法、装置和服务器。
背景技术
在许多应用场景中,业务人员在向客户提供所负责的业务服务时,往往会通过文字、视频等形式记录下服务的具体实施过程,作为一种记录数据进行存档。业务管理方可以根据上述记录数据来检测业务人员在实施业务服务时是否存在风险行为。
而基于现有的记录数据的处理方法,在根据记录数据检测业务人员实施业务服务是否存在风险行为时往往存在处理效率低、误差大的技术问题。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本说明书提供了一种记录数据的处理方法、装置和服务器,以能够高效、准确根据所接收到的记录数据判断出数据执行对象在实施目标服务时是否存在风险行为,检测出不符合预设的行为规则的服务行为,并及时进行提示,以提高服务质量。
本说明书提供的一种记录数据的处理方法,包括:
接收待检测的记录数据,作为目标记录数据;其中,所述目标记录数据记录有目标服务的实施过程;
将所述目标记录数据转化为对应的目标文本数据;
确定出与所述目标文本数据匹配的处理规则,作为目标处理规则;
根据所述目标处理规则,处理所述目标文本数据,得到对应的第一处理结果;其中,所述目标处理规则至少包含一个或多个风险关键词;
对所述目标文本数据进行情感分析处理,得到对应的第二处理结果;
根据所述第一处理结果和所述第二处理结果,确定所述目标服务在实施过程中是否存在风险行为。
在一个实施例中,所述目标记录数据包括以下至少之一:视频数据、音频数据、图片数据。
在一个实施例中,确定出与所述目标文本数据匹配的处理规则,作为目标处理规则,包括:
确定所述目标文本数据所对应的目标应用场景;
从多个预设的处理规则中,筛选出与所述目标应用场景匹配的预设的处理规则,作为目标处理规则。
在一个实施例中,所述目标记录数据还携带有目标服务的类型标识;
相应的,所述确定所述目标文本数据所对应的目标应用场景,包括:
根据所述目标服务的类型标识确定所述目标应用场景。
在一个实施例中,所述方法还包括:
接收用户输入的自定义规则;
通过组合与所述目标应用场景匹配的预设的处理规则,以及所述自定义规则,生成所述目标处理规则。
在一个实施例中,在将所述目标记录数据转化为对应的目标文本数据之后,所述方法还包括:
对所述目标文本数据进行过滤处理,以去除目标文本数据中的无效词组。
在一个实施例中,根据所述目标处理规则,处理所述目标文本数据,得到对应的第一处理结果,包括:
根据所述目标处理规则,检索目标文本数据,确定目标文本数据中是否存在风险关键词;在确定所述目标文本数据中存在风险关键词的情况下,统计所述目标文本数据中风险关键词的数量;
根据所述目标文本数据中风险关键词的数量,确定所述第一处理结果。
在一个实施例中,在根据所述目标处理规则,检索目标文本数据,确定目标文本数据中是否存在风险关键词之后,所述方法还包括:
计算目标文本数据中除风险关键词以外的待定词组与所述风险关键词之间的语义距离;
筛选出与所述风险关键词之间的语义距离小于预设的距离阈值的待定词组,作为风险近义词组;
统计所述目标文本数据中风险近义词组的数量;
相应的,根据所述目标文本数据中风险关键词的数量和所述目标文本数据中风险近义词组的数量,确定所述第一处理结果。
在一个实施例中,对所述目标文本数据进行情感分析处理,得到对应的第二处理结果,包括:
从多个预设的情感分析处理模型中筛选出与所述目标应用场景匹配的预设的情感分析处理模型,作为目标处理模型;
调用所述目标处理模型,对所述目标文本数据进行情感分析处理,以得到所述第二处理结果。
在一个实施例中,所述预设的情感分析处理模型按照以下方式建立:
获取所对应的预设的应用场景中的历史文本记录数据作为样本数据;
根据与所述预设的应用场景匹配的标注规则,判断所述样本数据所属的情感类型和情感等级,并对所述样本数据进行相应标注,得到标注后的样本数据;
利用所述标注后的样本数据进行模型训练,以得到与所述预设的应用场景对应的预设的情感分析处理模型。
在一个实施例中,所述目标服务包括以下至少之一:交通服务、提醒服务、餐厅服务。
在一个实施例中,在所述目标服务包括提醒服务的情况下,在根据所述第一处理结果和所述第二处理结果,确定所述目标服务在实施过程中存在风险行为之后,所述方法还包括:
确定出所述目标记录数据中负责实施所述提醒服务的数据执行对象;
针对所述数据执行对象发送风险提示信息,以提示所述数据执行对像根据预设的行为规则实施所述提醒服务。
本说明书还提供了一种记录数据的处理装置,包括:
接收模块,用于接收待检测的记录数据,作为目标记录数据;其中,所述目标记录数据记录有目标服务的实施过程;
转化模块,用于将所述目标记录数据转化为对应的目标文本数据;
第一确定模块,用于确定出与所述目标文本数据匹配的处理规则,作为目标处理规则;
第一处理模块,用于根据所述目标处理规则,处理所述目标文本数据,得到对应的第一处理结果;其中,所述目标处理规则至少包含一个或多个风险关键词;
第二处理模块,用于对所述目标文本数据进行情感分析处理,得到对应的第二处理结果;
第二确定模块,用于根据所述第一处理结果和所述第二处理结果,确定所述目标服务在实施过程中是否存在风险行为。
本说明书还提供了一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现接收待检测的记录数据,作为目标记录数据;其中,所述目标记录数据记录有目标服务的实施过程;将所述目标记录数据转化为对应的目标文本数据;确定出与所述目标文本数据匹配的处理规则,作为目标处理规则;根据所述目标处理规则,处理所述目标文本数据,得到对应的第一处理结果;其中,所述目标处理规则至少包含一个或多个风险关键词;对所述目标文本数据进行情感分析处理,得到对应的第二处理结果;根据所述第一处理结果和所述第二处理结果,确定所述目标服务在实施过程中是否存在风险行为。
本说明书还提供了一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现接收待检测的记录数据,作为目标记录数据;其中,所述目标记录数据记录有目标服务的实施过程;将所述目标记录数据转化为对应的目标文本数据;确定出与所述目标文本数据匹配的处理规则,作为目标处理规则;根据所述目标处理规则,处理所述目标文本数据,得到对应的第一处理结果;其中,所述目标处理规则至少包含一个或多个风险关键词;对所述目标文本数据进行情感分析处理,得到对应的第二处理结果;根据所述第一处理结果和所述第二处理结果,确定所述目标服务在实施过程中是否存在风险行为。
本说明书提供的一种记录数据的处理方法、装置和服务器,通过在接收到记录目标服务的实施过程的目标记录数据之后,先将目标记录数据转化为统一形式的目标文本数据;再根据与目标应用场景相匹配的目标处理规则,处理该目标文本数据,得到基于语义维度的第一处理结果;同时,通过对该目标文本数据进行情感分析处理,得到基于情感维度的第二处理结果;再通过综合利用上述基于两种不同维度得到的第一处理和第二处理结果,来根据记录数据判断出数据执行对象在实施该目标服务时是否存在风险行为,是否符合预设的行为规则,从而能够高效、准确地识别出数据执行对象在实施目标服务时的风险行为,检测出不符合预设的行为规则的服务行为,并及时针对该数据执行对象进行提示,以提高服务质量,解决现有方法中存在的检测记录数据时效率低、误差大的技术问题。
附图说明
为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是应用本说明书实施例提供的记录数据的处理方法的系统的结构组成的一个实施例的示意图;
图2是本说明书的一个实施例提供的记录数据的处理方法的流程示意图;
图3是本说明书的一个实施例提供的服务器的结构组成示意图;
图4是本说明书的一个实施例提供的记录数据的处理装置的结构组成示意图;
图5是在一个场景示例中,应用本说明书实施例提供的记录数据的处理方法的一种实施例的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
考虑到现有的记录数据的处理方法往往需要依赖技术人员人工对记录数据中所记录的目标服务的实施过程进行检测,以确定出数据执行对象(例如,数据提醒员、餐厅服务员等)在实施目标服务时是否存在风险行为。例如,检测数据执行对象子在实施目标服务时是否存在诸如对用户不礼貌,或者不符合规范等负面行为。但上述方法具体实施时,需要耗费大量的人力和时间,且很容易由于技术人员的个人的失误出现误差。导致现有方法具体实施时,往往会存在检测记录数据时效率低、误差大的技术问题。
针对产生上述问题的根本原因,本说明书考虑可以先将目标记录数据转化为统一形式的目标文本数据;再根据相匹配的目标处理规则,处理该目标文本数据,得到基于语义维度的第一处理结果;同时,通过对该目标文本数据进行情感分析处理,得到基于情感维度的第二处理结果;再通过综合利用上述基于两种不同维度得到的第一处理和第二处理结果,来判断出数据执行对象在实施该目标服务时是否存在风险行为,是否符合预设的行为规则,从而能够高效、准确地判断出数据执行对象在实施目标服务时是否存在风险行为,检测出不符合预设的行为规则的服务行为,并及时进行提示,提高服务质量。
本说明书实施例提供一种记录数据的处理方法,该方法具体可以应用于包含有终端设备和服务器的系统中。可以参阅图1所示,系统中的终端设备和服务器可以通过有线或无线的方式相连,以进行数据交互。
具体实施时,上述终端设备可以部署于数据执行对象实施目标服务的区域,具体可以用于采集记录有目标服务的实施过程的记录数据,并将该记录数据作为一种待检测的记录数据发送至服务器。
上述服务器具体可以用于接收待检测的记录数据,作为目标记录数据;并将所述目标记录数据转化为对应的目标文本数据。
进一步,服务器可以用于确定出与所述目标文本数据匹配的处理规则,作为目标处理规则。再根据所述目标处理规则,处理所述目标文本数据,得到对应的第一处理结果;其中,所述目标处理规则至少包含一个或多个风险关键词;同时,服务器还可以用于对所述目标文本数据进行情感分析处理,得到对应的第二处理结果。
进而,服务器可以用于根据所述第一处理结果和所述第二处理结果,确定所述目标服务在实施过程中是否存在风险行为。
在本实施例中,所述服务器具体可以包括一种能够实现数据传输、数据处理等功能的后台负责数据处理的服务器。具体的,所述服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者,所述服务器也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施例中,并不具体限定所述服务器所包含的服务器的数量。所述服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。
在本实施例中,所述终端设备具体可以包括一种能够实现数据采集、数据传输等功能的前端电子设备。具体的,所述终端设备例如可以为台式电脑、平板电脑、笔记本电脑、智能手机、摄像头、录音笔等。或者,所述终端设备也可以为能够运行于上述电子设备中的软件应用。例如,可以是在手机上运行的某APP等。
本说明书提供了一种记录数据的处理方法。参阅图2所示,该方法具体实施时,可以包括以下内容。
S201:接收待检测的记录数据,作为目标记录数据;其中,所述目标记录数据记录有目标服务的实施过程;
S202:将所述目标记录数据转化为对应的目标文本数据;
S203:确定出与所述目标文本数据匹配的处理规则,作为目标处理规则;
S204:根据所述目标处理规则,处理所述目标文本数据,得到对应的第一处理结果;其中,所述目标处理规则至少包含一个或多个风险关键词;
S205:对所述目标文本数据进行情感分析处理,得到对应的第二处理结果;
S206:根据所述第一处理结果和所述第二处理结果,确定所述目标服务在实施过程中是否存在风险行为。
在一个实施例中,上述待检测的记录数据具体可以理解为终端设备所采集到的记录有数据执行对象实施目标服务时的实施过程的记录数据。
在一个实施例中,服务器可以接收终端设备所采集到的待检测的记录数据,并将该待检测的记录数据确定为目标记录数据。
在一个实施例中,上述目标记录数据可以包括不同数据类型的记录数据。具体的,目标记录数据可以包括视频数据、音频数据、图片数据等多种不同类型的数据。当然,上述所列举的数据的类型只是一种示意性说明。具体实施时,根据具体的应用场景和处理需求,上述目标记录数据还可以包括其他数据类型的数据。例如,上述目标记录数据还可以包括文本数据等。对此,本说明书不作限定。
在一个实施例中,随着目标记录数据的类型的不同,终端设备可以通过不同的方式来采集相应类型的目标记录数据。例如,在目标记录数据为视频数据的情况下,终端设备可以通过摄像头拍摄数据执行对象实施目标服务的过程视频内容作为上述目标记录数据。又例如,在目标记录数据为音频数据的情况下,终端设备可以通过录音笔记录下数据执行对象实施目标服务的过程语音内容作为上述目标记录数据等。
在一个实施例中,上述数据执行对象具体可以理解为负责具体实施目标服务的人或机器。
在一个实施例中,对应于不同的应用场景,上述目标服务具体可以包括包含有不同服务内容的服务。具体的,上述目标服务可以包括:交通服务、提醒服务、餐厅服务等。
其中,上述交通服务具体可以包括道路上的交警或辅警为司机提供的交通引导服务。上述餐厅服务具体可以包括餐厅服务员为食客提供的用餐服务等。
上述提醒服务具体可以包括业务员为用户提供的数据信息提醒服务。例如,用户A在某银行办理的房贷业务,按照合同用户A需要每月的约定时间前向该银行偿还约定的资金数据。银行业务员可以为用户A提供以下多项提醒服务:在约定时间临近的时候,提醒用户A及时偿还所约定的资金数据;以及在超过约定时间,且用户A还没有偿还约定的资金数据的情况下,提醒用户A还款已超期,并再一次提醒用户A及时还款。
在一个实施例中,对应于不同的应用场景,上述数据执行对象也可以是不同类型的执行对象。例如,在交通服务场景中,上述数据执行对象可以是交警或辅警等。在餐厅服务场景中,上述数据执行对象可以是餐厅服务员等。在提醒服务场景中,上述数据执行对象可以是银行负责提醒服务的业务员,例如,借贷催收员等。当然,上述所列举的数据执行对象只是一种示意性说明。具体实施时,根据具体的应用场景,以及所涉及到的具体服务,上述数据执行对象还可以包括其他类型的执行对象。对此,本说明书不作限定。
在一个实施例中,数据执行对象在具体实施目标服务时,终端设备可以处于开启的状态,从而可以通过终端设备采集到该数据执行对象实施目标服务的记录数据,并将该记录数据作为待检测的目标记录数据发送给服务器。
在一个实施例中,上述将所述目标记录数据转化为对应的目标文本数据,具体实施时,可以包括:根据目标记录数据的数据类型,采用匹配的方式将所述目标记录数据转化为对应的目标文本数据。
具体的,例如,在目标记录数据为图像数据的情况下,服务器可以通过图像识别,识别出该图像数据中所包含的信息内容,进而根据所识别出的信息内容,生成与该图像数据对应的目标文本数据。在目标数据为音频数据的情况下,服务器可以通过语音识别,识别出该音频数据中所包含的信息内容,进而根据所识别出的信息内容,生成与该音频数据对应的目标文本数据等。
通过上述方式,服务器可以先将不同数据类型的目标记录数据,转化为统一形式的文本数据;进而后续可以统一采用针对文本数据的处理方式对不同的目标记录数据进行进一步的检测处理。
在一个实施例中,上述确定出与所述目标文本数据匹配的处理规则,作为目标处理规则,具体实施时,可以包括以下内容:确定所述目标文本数据所对应的目标应用场景;从多个预设的处理规则中,筛选出与所述目标应用场景匹配的预设的处理规则,作为目标处理规则。
在本实施例中,具体实施前,可以预先针对多个不同的预设的应用场景配置好相对应的预设的处理规则。其中,每一个预设的处理规则分别包含有基于语义维度的与所对应的预设的应用场景相关的风险关键词。对应不同的预设的应用场景的预设的处理规则所包含的风险关键词可以存在差异。
其中,上述多个预设的应用场景具体可以包括交通服务场景、提醒服务场景、餐厅服务场景等。上述风险关键词具体可以理解为一种根据预设的行为规则在所对应的预设的应用场景中实施目标服务时,不应当出现的词组。例如,会对客户造成威胁、恐吓的词组等。
在一个实施例中,为了能够更加精细、准确地处理目标记录数据,还可以将上述预设的应用场景进行进一步细分,得到更加精细的场景,以便可以针对不同场景的具体特点,配置更加精细、有效的处理规则。
例如,针对上述提醒服务场景,还可以根据所涉及到的业务产品的类型的不同,进一步还可以包括:A类借款数据的提醒场景(对应于A类借贷产品)、B类借款数据的提醒场景(对应于B类借贷产品)、C类借款数据的提醒场景(对应于C类借贷产品)等。
在一个实施例中,所述目标记录数据具体还可以携带有目标服务的类型标识;相应的,所述确定所述目标文本数据所对应的目标应用场景,具体实施时,可以包括:根据所述目标服务的类型标识确定所述目标应用场景。
在本实施例中,上述类型标识具体可以理解为一种用于指示目标服务的类型的标识信息。具体的,例如,交通服务的类型标识可以表示为JT,提醒服务的类型标识可以表示为TX等。
在本实施例中,终端设备在采集记录数据时,可以同时在记录数据上设置所对应的目标服务的类型标识,进而可以得到并将携带有类型标识的目标记录数据发送给服务器。
相应的,服务器可以根据目标记录数据中所携带的类型标识,确定出目标服务的类型;进而可以根据目标服务的类型,从多个预设的应用场景中确定出所对应的目标应用场景。进而可以根据目标应用场景从预先配置好的多个预设的处理规则中,筛选出于该目标应用场景匹配的预设的处理规则,作为目标处理规则。其中,上述目标处理规则包含有与该目标场景相关的风险关键词。
在一个实施例中,所述方法具体实施时,还可以包括:接收用户输入的自定义规则;通过组合与所述目标应用场景匹配的预设的处理规则,以及所述自定义规则,生成所述目标处理规则。
在本实施例中,用户还可以根据自己的个性化需求,通过终端设备设置符合自己要求的自定义规则。其中,上述自定义规则包含有用户自定义的风险关键词。进而,服务器可以通过组合与目标应用场景匹配的预设的处理规则和用户设置的自定义规则,得到更加全面、准确,符合用户个性化要求的目标处理规则。
具体的,例如,预设的处理规则中原本没有将词组“XX”作为风险关键词。但是,近段时间随着网络语言的流行,词组“XX”变成了一种具有胁迫性质的词组,即“XX”实质上已经成为了一种新的风险关键词。这时,用户可以通过设置自定义规则,将上述词组“XX”设置为自定义的风险关键词。进而服务器可以通过组合预设的处理和自定义规则,得到包含有“XX”风险关键词的目标处理规则。
在一个实施例中,具体实施时,可以通过根据目标处理规则,处理目标文本数据,以检测目标文本数据中是否包含有目标规则中的风险关键等词组,得到基于语义维度的第一处理结果。
在一个实施例中,在将所述目标记录数据转化为对应的目标文本数据之后,在根据所述目标处理规则,处理所述目标文本数据之前,所述方法具体实施时,还可以包括以下内容:对所述目标文本数据进行过滤处理,以去除目标文本数据中的无效词组。
在本实施例中,上述无效词组具体可以理解为一种不能表征有效语义的词组。具体的,例如,上述无效词组可以包括感叹词、语气词、人名等。当然,上述所列举的无效词组只是一种示意性说明。具体实施时,根据具体的应用场景,上述无效词组还可以包含有其他类型的词组。对此,本说明书不作限定。
在本实施例中,具体实施时,可以先根据预设的无效词组表,检索目标文本数据中是否存在无效词组;在检测到存在与所述预设的无效词组表匹配的无效词组时,删除目标文本数据中的该无效词组,从而可以对目标文本数据进行过滤,以去除目标文本数据中的无效词组。其中,上述预设的无效词组表具体可以包含有一个或多个使用较频繁,但不能表征有效语义的词组。
通过上述方式可以先检测并去除目标文本数据中所包含的无效词组,进而可以基于去除了无效词组后的目标文本数据进行后续处理,避免了无效词组在后续处理过程中产生干扰,同时也能在一定程度上降低后续处理的数据处理量。
在一个实施例中,还可以预先针对不同的预设的应用场景,确定出该预设的应用场景中使用较为频繁的不能表征有效语义的词组作为无效词组,进而可以配置对应不同预设的应用场景的不同的预设的无效词组表。相应的,在对目标文本数据进行过滤处理时,可以先根据目标文本数据所对应的目标应用场景确定出相匹配的预设的无效词组表,进而可以根据相匹配的无效词组表,对目标文本数据进行无效词的过滤处理。
在一个实施例中,上述根据所述目标处理规则,处理所述目标文本数据,得到对应的第一处理结果,具体实施时,可以包括以下内容:根据所述目标处理规则,检索目标文本数据,确定目标文本数据中是否存在风险关键词;在确定所述目标文本数据中存在风险关键词的情况下,统计所述目标文本数据中风险关键词的数量;根据所述目标文本数据中风险关键词的数量,确定所述第一处理结果。
在本实施例中,上述第一处理结果具体可以理解为基于目标文本数据中的词组的语义所确定出的能够反映出目标文本数据所描述的目标服务的实施过程中是否存在风险行为的结果数据。
在一个实施例中,根据第一处理结果,确定出目标文本数据中存在风险关键词,且风险关键词的数量较多(例如,大于预设的数量阈值),或者风险关键词的数量在目标文本数据中的占较大(例如,占比大于预设的比例阈值),则可以判断目标文本数据所描述的目标服务的实施过程中有较大概率可能存在风险行为。
在一个实施例中,考虑到目标文本数据中的一些与风险关键词不同,但所表征的语义与风险关键词相同或相近的词组,本身也具有类似于风险关键词的特性,能够用于指示风险行为。因此,为了能够得到更加准确的第一处理结果,在根据目标处理规则检测统计风险关键词的同时,还可以检测统计目标文本数据中与风险关键词语义相同或相近的近义词组(记为风险近义词组);进而可以综合风险关键词和风险近义词组这两种词组,生成更加准确、全面的第一处理结果。
在一个实施例中,在根据所述目标处理规则,检索目标文本数据,确定目标文本数据中是否存在风险关键词之后,所述方法具体实施时,还可以包括以下内容:计算目标文本数据中除风险关键词以外的待定词组与所述风险关键词之间的语义距离;筛选出与所述风险关键词之间的语义距离小于预设的距离阈值的待定词组,作为风险近义词组;统计所述目标文本数据中风险近义词组的数量;相应的,根据所述目标文本数据中风险关键词的数量和所述目标文本数据中风险近义词组的数量,确定所述第一处理结果。
在本实施例中,在检测风险近义词时,可以通过计算目标文本数据中除风险关键词以外的其他词组(记为待定词组)与风险关键词之间的语义距离;进而可以以语义距离作为依据,从待定词组中找到与风险关键词之间的语义距离较小(例如,语义距离小于预设的距离阈值)的待定词组,作为与风险关键词语义相同或相近的风险建议词组。进而可以通过统计目标文本数据中风险关键词的数量,和风险近义词组的数量,来得到较为准确、全面的第一处理结果。
在一个实施例中,为了能够更加精准地对目标文本数据进行检测判断,除了基于语义维度,对目标文本数据进行处理,得到对应的第一处理结果外;还同时基于情感维度,对目标文本数据进行相应处理,得到对应的第二处理结果。进而可以综合基于两种不同维度得到的处理结果,更加精准地判断出目标文本数据所记录的目标服务的实施过程中是否存在风险行为。
在本实施例中,上述第二处理结果具体可以理解为基于目标文本数据所描述的数据执行对象在实施目标服务的过程中所表现出的情感状态(包括情感类型和情感等级等)所确定出的能够反映出目标文本数据所描述的目标服务的实施过程中是否存在风险行为的结果数据。
在一个实施例中,上述对所述目标文本数据进行情感分析处理,得到对应的第二处理结果,具体实施时,可以包括以下内容:从多个预设的情感分析处理模型中筛选出与所述目标应用场景匹配的预设的情感分析处理模型,作为目标处理模型;调用所述目标处理模型,对所述目标文本数据进行情感分析处理,以得到所述第二处理结果。
在本实施例中,具体实施时,可以预先针对多种不同的预设的应用场景训练得到对应的,适用于该预设的应用场景的预设的情感分析处理模型。
在一个实施例中,所述预设的情感分析处理模型具体可以按照以下方式建立得到:获取所对应的预设的应用场景中的历史文本记录数据作为样本数据;根据与所述预设的应用场景匹配的标注规则,判断所述样本数据所属的情感类型和情感等级,并对所述样本数据进行相应标注,得到标注后的样本数据;利用所述标注后的样本数据进行模型训练,以得到与所述预设的应用场景对应的预设的情感分析处理模型。
其中,上述情感类型具体可以包括:高兴、难过、愤怒、惊恐等。上述情感等级具体可以用于表征情感程度。例如,以情感类型“高兴”为例,情感等级可以包括以下所列举的情感程度逐渐增强的三种等级:“普通高兴(对应第一等级)”、“很高兴(对应第二等级)”、“特别高兴(对应第三等级)”。
在一个实施例中,上述所对应的预设的应用场景中的历史文本记录数据具体可以是对历史上部署在预设的应用场景中的终端设备所采集的历史视频数据,和/或,历史音频数据等进行转化得到的文本数据。
在一个实施例中,考虑到不同应用场景中对于同一行为情感上的表现会存在差异,因此,可以针对不同的预设的应用场景配置对应的标注规则。在具体标注样本数据时,可以根据与预设的应用场景匹配的标注规则来对样本数据所属的情感类型和情感等级进行标注,从而可以更加精细、准确地完成样本数据的标注。
在一个实施例中,上述调用所述目标处理模型,对所述目标文本数据进行情感分析处理,以得到所述第二处理结果,具体实施时,可以包括:将目标文本数据作为模型输入,输入至相匹配的目标处理模型中;运行目标处理模型,得到对应的模型输出,作为所述第二处理结果。
在一个实施例中,根据所述第二处理结果可以确定出目标文本数据所描述出的数据执行对象在实施目标服务的过程中所表现出的情感类型和情感等级;进而可以根据上述情感类型和情感等级,基于情感维度来判断数据执行对象在实施目标服务时是否存在风险行为。
具体的,例如,在根据第二处理结果确定数据执行对象在实施目标服务时表现出了负面情感类型(例如,愤怒等),并且负面情感的情感等级较高(例如,高于预设的等级阈值),则可以判断该目标文本数据所描述的数据执行对象在具体实施目标服务的过程中有较大概率存在风险行为。
在一个实施例中,具体实施时,服务器可以综合上述第一处理结果和第二处理结果,从语义维度和情感维度两个不同的维度来最终确定出目标文本数据所描述的目标服务在实施过程中是否存在风险行为。
具体的,例如,在根据第一处理结果,确定目标文本数据包含有风险关键词和/或风险近义词组,且所包含的风险关键词和/或风险近义词组的数量的占比大于预设的比例阈值;同时,根据第二处理结果,确定目标文本数据所描述的数据执行对象在实施目标服务的过程中表现出负面的情感类型,且情感等级大于预设的等级阈值的情况下,可以确定目标服务在实施过程中存在风险行为。
在本实施例中,通过上述处理方式,在将目标记录数据转化为统一形式的目标文本数据后,可以综合根据该目标文本数据基于语义维度得到第一处理结果,以及基于情感维度得到的第二处理结果,较为精准地确定出目标文本数据中所描述的目标服务的实施过程中是否存在风险行为,完成对目标记录数据的检测。
在一个实施例中,所述目标服务具体可以包括以下至少之一:交通服务、提醒服务、餐厅服务等。当然,上述所列举的服务内容只是一种示意性说明。具体实施时,根据具体的应用场景和处理需求,上述目标服务还可以包含有其他的服务内容。对此,本说明书不作限定。
在一个实施例中,在所述目标服务包括提醒服务的情况下,在根据所述第一处理结果和所述第二处理结果,确定所述目标服务在实施时是否存在风险行为之后,所述方法具体实施时,还可以包括以下内容:确定出所述目标记录数据中负责实施所述提醒服务的数据执行对象;针对所述数据执行对象发送风险提示信息,以提示所述数据执行对像根据预设的行为规则实施所述提醒服务。
在本实施例中,具体实施时,在根据目标记录数据,确定数据对象在执行目标服务的过程中存在风险行为的情况下,可以针对数据执行对象生成并发送相应的风险提示信息,以提示该数据执行对象当前在实施目标服务时已经出现与预设的行为规则不符的风险行为。例如,出现了怠慢客户,或者威胁客户的行为。进而可以提醒数据执行对象及时根据预设的行为规则调整、规范自己在实施目标服务时相关行为,以为客户提供质量较高的目标服务,从而可以提高客户的服务体验。
由上可见,本说明书实施例提供的记录数据的处理方法,在接收到记录目标服务的实施过程的目标记录数据之后,可以先将目标记录数据转化为统一形式的目标文本数据;再根据相匹配的目标处理规则,处理该目标文本数据,得到基于语义维度的第一处理结果;同时,通过对该目标文本数据进行情感分析处理,得到基于情感维度的第二处理结果;再通过综合利用上述基于两种不同维度得到的第一处理和第二处理结果,来判断出数据执行对象在实施该目标服务时是否存在风险行为,是否符合预设的行为规则,从而能够高效、准确地判断出数据执行对象在实施目标服务时是否存在风险行为,检测出不符合预设的行为规则的服务行为,并及时进行提示,提高服务质量。
本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:接收待检测的记录数据,作为目标记录数据;其中,所述目标记录数据记录有目标服务的实施过程;将所述目标记录数据转化为对应的目标文本数据;确定出与所述目标文本数据匹配的处理规则,作为目标处理规则;根据所述目标处理规则,处理所述目标文本数据,得到对应的第一处理结果;其中,所述目标处理规则至少包含一个或多个风险关键词;对所述目标文本数据进行情感分析处理,得到对应的第二处理结果;根据所述第一处理结果和所述第二处理结果,确定所述目标服务在实施过程中是否存在风险行为。
为了能够更加准确地完成上述指令,参阅图3所示,本说明书实施例还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口301、处理器302以及存储器303,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。
其中,所述网络通信端口301,具体可以用于接收待检测的记录数据,作为目标记录数据;其中,所述目标记录数据记录有目标服务的实施过程。
所述处理器302,具体可以用于将所述目标记录数据转化为对应的目标文本数据;确定出与所述目标文本数据匹配的处理规则,作为目标处理规则;根据所述目标处理规则,处理所述目标文本数据,得到对应的第一处理结果;其中,所述目标处理规则至少包含一个或多个风险关键词;对所述目标文本数据进行情感分析处理,得到对应的第二处理结果;根据所述第一处理结果和所述第二处理结果,确定所述目标服务在实施过程中是否存在风险行为。
所述存储器303,具体可以用于存储相应的指令程序。
在本实施例中,所述网络通信端口301可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的端口,也可以是负责进行FTP数据通信的端口,还可以是负责进行邮件数据通信的端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。
在本实施例中,所述处理器302可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。
在本实施例中,所述存储器303可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
本说明书实施例还提供了一种基于上述记录数据的处理方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:接收待检测的记录数据,作为目标记录数据;其中,所述目标记录数据记录有目标服务的实施过程;将所述目标记录数据转化为对应的目标文本数据;确定出与所述目标文本数据匹配的处理规则,作为目标处理规则;根据所述目标处理规则,处理所述目标文本数据,得到对应的第一处理结果;其中,所述目标处理规则至少包含一个或多个风险关键词;对所述目标文本数据进行情感分析处理,得到对应的第二处理结果;根据所述第一处理结果和所述第二处理结果,确定所述目标服务在实施过程中是否存在风险行为。
在本实施例中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施例中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
参阅图4所示,在软件层面上,本说明书实施例还提供了一种记录数据的处理装置。该装置具体可以包括以下的结构模块。
接收模块401,具体可以用于接收待检测的记录数据,作为目标记录数据;其中,所述目标记录数据记录有目标服务的实施过程;
转化模块402,具体可以用于将所述目标记录数据转化为对应的目标文本数据;
第一确定模块403,具体可以用于确定出与所述目标文本数据匹配的处理规则,作为目标处理规则;
第一处理模块404,具体可以用于根据所述目标处理规则,处理所述目标文本数据,得到对应的第一处理结果;其中,所述目标处理规则至少包含一个或多个风险关键词;
第二处理模块405,具体可以用于对所述目标文本数据进行情感分析处理,得到对应的第二处理结果;
第二确定模块406,具体可以用于根据所述第一处理结果和所述第二处理结果,确定所述目标服务在实施过程中是否存在风险行为。
在一个实施例中,所述目标记录数据具体可以包括以下至少之一:视频数据、音频数据、图片数据等。
在一个实施例中,上述第一确定模块403具体实施时,可以用于确定所述目标文本数据所对应的目标应用场景;从多个预设的处理规则中,筛选出与所述目标应用场景匹配的预设的处理规则,作为目标处理规则。
在一个实施例中,所述目标记录数据还携带有目标服务的类型标识;相应的,上述第一确定模块403可以用于根据所述目标服务的类型标识确定所述目标应用场景。
在一个实施例中,具体实施时,上述第一确定模块403还用于接收用户输入的自定义规则;通过组合与所述目标应用场景匹配的预设的处理规则,以及所述自定义规则,生成所述目标处理规则。
在一个实施例中,所述装置在将所述目标记录数据转化为对应的目标文本数据之后,还用于对所述目标文本数据进行过滤处理,以去除目标文本数据中的无效词组。
在一个实施例中,根据所述目标处理规则,处理所述目标文本数据,得到对应的第一处理结果,包括:
在一个实施例中,上述第一处理模块404具体实施时,可以用于根据所述目标处理规则,检索目标文本数据,确定目标文本数据中是否存在风险关键词;在确定所述目标文本数据中存在风险关键词的情况下,统计所述目标文本数据中风险关键词的数量;根据所述目标文本数据中风险关键词的数量,确定所述第一处理结果。
在一个实施例中,上述第一处理模块404在根据所述目标处理规则,检索目标文本数据,确定目标文本数据中是否存在风险关键词之后,还可以用于计算目标文本数据中除风险关键词以外的待定词组与所述风险关键词之间的语义距离;筛选出与所述风险关键词之间的语义距离小于预设的距离阈值的待定词组,作为风险近义词组;统计所述目标文本数据中风险近义词组的数量;相应的,根据所述目标文本数据中风险关键词的数量和所述目标文本数据中风险近义词组的数量,确定所述第一处理结果。
在一个实施例中,上述第二处理模块405具体实施时,可以用于从多个预设的情感分析处理模型中筛选出与所述目标应用场景匹配的预设的情感分析处理模型,作为目标处理模型;调用所述目标处理模型,对所述目标文本数据进行情感分析处理,以得到所述第二处理结果。
在一个实施例中,所述装置还包括建模模块,其中,该建模模块用于按照以下方式建立预设的情感分析处理模型:获取所对应的预设的应用场景中的历史文本记录数据作为样本数据;根据与所述预设的应用场景匹配的标注规则,判断所述样本数据所属的情感类型和情感等级,并对所述样本数据进行相应标注,得到标注后的样本数据;利用所述标注后的样本数据进行模型训练,以得到与所述预设的应用场景对应的预设的情感分析处理模型。
在一个实施例中,所述目标服务具体可以包括以下至少之一:交通服务、提醒服务、餐厅服务等。
在一个实施例中,所述装置还包括提示模块,具体用于在所述目标服务包括提醒服务的情况下,在根据所述第一处理结果和所述第二处理结果,确定所述目标服务在实施时是否存在风险行为之后,确定出所述目标记录数据中负责实施所述提醒服务的数据执行对象;针对所述数据执行对象发送风险提示信息,以提示所述数据执行对像根据预设的行为规则实施所述提醒服务。
需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
由上可见,本说明书实施例提供的记录数据的处理装置,能够高效、准确地判断出数据执行对象在实施目标服务时是否存在风险行为,检测出不符合预设的行为规则的服务行为,并及时进行提示,提高服务质量。
在一个具体的场景示例中,可以应用本说明书提供的记录数据的处理方法对零售催收服务的服务质量进行监控。具体实施过程可以参阅图5所示,包括以下内容。
S1:参数配置。
作为程序运行的基础,可以根据业务需要预先配置好对应产品和对应场景的筛选规则(例如基础规则,即预设的处理规则)、运行周期,和勾选需要进行质量监控的催收记录(例如目标记录数据),在配置完成后,相应的质量监控方法即可运行(即对目标记录数据进行检测)。具体监控过程可以参阅图5所示。
S2:催收记录文本化(即将目标记录数据转化为统一的目标文本数据)。
具体的,对于不同类型的催收记录(例如,视频数据或音频数据等数据类型),可以运用不同的方式将其进行文本化。例如,对于语音和视频相关的记录,利用语音识别和图像识别的方式进行文本化,和以文字为记录的催收记录一同,利用特定的规则对于文本进行清洗和筛选。
S3:依照规则对记录进行数据化。
首先,可以利用基于正则表达式的方法,根据用户设定的规则(例如个性化规则,即自定义规则),对于文本化的数据生成初步的分析报告(例如,第一处理结果);并在此基础上,还通过对于文本进行情感分析,实现对于催收记录更进一步的解析和检测(得到第二处理结果)。
S4:依据分析结果进行多维度分析。
可以综合S3所得到的数据,并关联所配置的可视化分析与逻辑表达设定,利用图像等工具,对于质量监控结果进行多维度智能分析,得到最终的检测结果。
具体的,可以根据配置的可视化分析设定,利用Tableau(一种桌面系统简单的商业智能工具软件)交互进行可视化分析与展示;同时根据逻辑表达设定,利用人工智能生成文字分析结果。进而可以根据分析结果,监控催收服务在实施时是否规范,是否存在违规的风险行为。
通过上述场景示例,验证了本说明书提供的记录数据的处理方法可以适应不断变化的业务需求,通过读取配置规则,对于催收记录进行自动且快速的检测处理,减少应用程序的开发和扩展性成本。并且具有如下优势:该服务根据设定的规则,可以自动并快速地对于需要进行质检的催收记录进行分析与检测,减少由于数量庞大的催收案件而造成的人工成本和时间成本;该服务能够在保持精确性的情况下,降低由于人工失误所带来的失误率;该服务能够满足不同产品的个性化需求,并在保持原有的基础上,进行快速的更新,减少产品更新换代所带来的损失;该服务能够在其基础上,不断地提高精确性,进而提高用户的效率和分析报告的准确性。
虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施例的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。
Claims (15)
1.一种记录数据的处理方法,其特征在于,包括:
接收待检测的记录数据,作为目标记录数据;其中,所述目标记录数据记录有目标服务的实施过程;
将所述目标记录数据转化为对应的目标文本数据;
确定出与所述目标文本数据匹配的处理规则,作为目标处理规则;
根据所述目标处理规则,处理所述目标文本数据,得到对应的第一处理结果;其中,所述目标处理规则至少包含一个或多个风险关键词;
对所述目标文本数据进行情感分析处理,得到对应的第二处理结果;
根据所述第一处理结果和所述第二处理结果,确定所述目标服务在实施过程中是否存在风险行为。
2.根据权利要求1所述的方法,其特征在于,所述目标记录数据包括以下至少之一:视频数据、音频数据、图片数据。
3.根据权利要求1所述的方法,其特征在于,确定出与所述目标文本数据匹配的处理规则,作为目标处理规则,包括:
确定所述目标文本数据所对应的目标应用场景;
从多个预设的处理规则中,筛选出与所述目标应用场景匹配的预设的处理规则,作为目标处理规则。
4.根据权利要求3所述的方法,其特征在于,所述目标记录数据还携带有目标服务的类型标识;
相应的,所述确定所述目标文本数据所对应的目标应用场景,包括:
根据所述目标服务的类型标识确定所述目标应用场景。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
接收用户输入的自定义规则;
通过组合与所述目标应用场景匹配的预设的处理规则,以及所述自定义规则,生成所述目标处理规则。
6.根据权利要求3所述的方法,其特征在于,在将所述目标记录数据转化为对应的目标文本数据之后,所述方法还包括:
对所述目标文本数据进行过滤处理,以去除目标文本数据中的无效词组。
7.根据权利要求4所述的方法,其特征在于,根据所述目标处理规则,处理所述目标文本数据,得到对应的第一处理结果,包括:
根据所述目标处理规则,检索目标文本数据,以确定所述目标文本数据中是否存在风险关键词;
在确定所述目标文本数据中存在风险关键词的情况下,统计所述目标文本数据中风险关键词的数量;
根据所述目标文本数据中风险关键词的数量,确定所述第一处理结果。
8.根据权利要求7所述的方法,其特征在于,在根据所述目标处理规则,检索目标文本数据,以确定所述目标文本数据中是否存在风险关键词之后,所述方法还包括:
计算目标文本数据中除风险关键词以外的待定词组与所述风险关键词之间的语义距离;
筛选出与所述风险关键词之间的语义距离小于预设的距离阈值的待定词组,作为风险近义词组;
统计所述目标文本数据中风险近义词组的数量;
相应的,根据所述目标文本数据中风险关键词的数量和所述目标文本数据中风险近义词组的数量,确定所述第一处理结果。
9.根据权利要求3所述的方法,其特征在于,对所述目标文本数据进行情感分析处理,得到对应的第二处理结果,包括:
从多个预设的情感分析处理模型中筛选出与所述目标应用场景匹配的预设的情感分析处理模型,作为目标处理模型;
调用所述目标处理模型,对所述目标文本数据进行情感分析处理,以得到所述第二处理结果。
10.根据权利要求9所述的方法,其特征在于,所述预设的情感分析处理模型按照以下方式建立:
获取所对应的预设的应用场景中的历史文本记录数据作为样本数据;
根据与所述预设的应用场景匹配的标注规则,判断所述样本数据所属的情感类型和情感等级,并对所述样本数据进行相应标注,得到标注后的样本数据;
利用所述标注后的样本数据进行模型训练,以得到与所述预设的应用场景对应的预设的情感分析处理模型。
11.根据权利要求1所述的方法,其特征在于,所述目标服务包括以下至少之一:交通服务、提醒服务、餐厅服务。
12.根据权利要求11所述的方法,其特征在于,在所述目标服务包括提醒服务的情况下,在根据所述第一处理结果和所述第二处理结果,确定所述目标服务在实施过程中存在风险行为之后,所述方法还包括:
确定出所述目标记录数据中负责实施所述提醒服务的数据执行对象;
针对所述数据执行对象发送风险提示信息,以提示所述数据执行对像根据预设的行为规则实施所述提醒服务。
13.一种记录数据的处理装置,其特征在于,包括:
接收模块,用于接收待检测的记录数据,作为目标记录数据;其中,所述目标记录数据记录有目标服务的实施过程;
转化模块,用于将所述目标记录数据转化为对应的目标文本数据;
第一确定模块,用于确定出与所述目标文本数据匹配的处理规则,作为目标处理规则;
第一处理模块,用于根据所述目标处理规则,处理所述目标文本数据,得到对应的第一处理结果;其中,所述目标处理规则至少包含一个或多个风险关键词;
第二处理模块,用于对所述目标文本数据进行情感分析处理,得到对应的第二处理结果;
第二确定模块,用于根据所述第一处理结果和所述第二处理结果,确定所述目标服务在实施过程中是否存在风险行为。
14.一种服务器,其特征在于,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1至12中任一项所述方法的步骤。
15.一种计算机可读存储介质,其特征在于,其上存储有计算机指令,所述指令被执行时实现权利要求1至12中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011214882.3A CN112256836A (zh) | 2020-11-04 | 2020-11-04 | 记录数据的处理方法、装置和服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011214882.3A CN112256836A (zh) | 2020-11-04 | 2020-11-04 | 记录数据的处理方法、装置和服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112256836A true CN112256836A (zh) | 2021-01-22 |
Family
ID=74268178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011214882.3A Pending CN112256836A (zh) | 2020-11-04 | 2020-11-04 | 记录数据的处理方法、装置和服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112256836A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112818699A (zh) * | 2021-03-03 | 2021-05-18 | 深圳前海微众银行股份有限公司 | 风险分析方法、装置、设备及计算机可读存储介质 |
CN116112317A (zh) * | 2023-01-31 | 2023-05-12 | 中国联合网络通信集团有限公司 | 数据管理方法、装置及可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101662550A (zh) * | 2009-09-11 | 2010-03-03 | 中兴通讯股份有限公司 | 呼叫中心服务质量检测方法及系统 |
CN105141787A (zh) * | 2015-08-14 | 2015-12-09 | 上海银天下科技有限公司 | 服务录音的合规检查方法及装置 |
US20160142544A1 (en) * | 2014-11-19 | 2016-05-19 | Electronics And Telecommunications Research Institute | Apparatus and method for customer interaction service |
CN106529804A (zh) * | 2016-11-09 | 2017-03-22 | 国网江苏省电力公司南京供电公司 | 基于文本挖掘技术的客户投诉预警监测分析方法 |
CN110442712A (zh) * | 2019-07-05 | 2019-11-12 | 阿里巴巴集团控股有限公司 | 风险的确定方法、装置、服务器和文本审理系统 |
CN110796565A (zh) * | 2019-10-14 | 2020-02-14 | 广州供电局有限公司 | 监理日志的分析方法及分析系统 |
CN111314566A (zh) * | 2020-01-20 | 2020-06-19 | 北京神州泰岳智能数据技术有限公司 | 一种语音质检方法、装置与系统 |
CN111756938A (zh) * | 2020-07-01 | 2020-10-09 | 蒋芳 | 一种呼叫中心电话智能分析监控方法和系统 |
-
2020
- 2020-11-04 CN CN202011214882.3A patent/CN112256836A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101662550A (zh) * | 2009-09-11 | 2010-03-03 | 中兴通讯股份有限公司 | 呼叫中心服务质量检测方法及系统 |
US20160142544A1 (en) * | 2014-11-19 | 2016-05-19 | Electronics And Telecommunications Research Institute | Apparatus and method for customer interaction service |
CN105141787A (zh) * | 2015-08-14 | 2015-12-09 | 上海银天下科技有限公司 | 服务录音的合规检查方法及装置 |
CN106529804A (zh) * | 2016-11-09 | 2017-03-22 | 国网江苏省电力公司南京供电公司 | 基于文本挖掘技术的客户投诉预警监测分析方法 |
CN110442712A (zh) * | 2019-07-05 | 2019-11-12 | 阿里巴巴集团控股有限公司 | 风险的确定方法、装置、服务器和文本审理系统 |
CN110796565A (zh) * | 2019-10-14 | 2020-02-14 | 广州供电局有限公司 | 监理日志的分析方法及分析系统 |
CN111314566A (zh) * | 2020-01-20 | 2020-06-19 | 北京神州泰岳智能数据技术有限公司 | 一种语音质检方法、装置与系统 |
CN111756938A (zh) * | 2020-07-01 | 2020-10-09 | 蒋芳 | 一种呼叫中心电话智能分析监控方法和系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112818699A (zh) * | 2021-03-03 | 2021-05-18 | 深圳前海微众银行股份有限公司 | 风险分析方法、装置、设备及计算机可读存储介质 |
CN116112317A (zh) * | 2023-01-31 | 2023-05-12 | 中国联合网络通信集团有限公司 | 数据管理方法、装置及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20120136812A1 (en) | Method and system for machine-learning based optimization and customization of document similarities calculation | |
CN107437038B (zh) | 一种网页篡改的检测方法及装置 | |
US20150033077A1 (en) | Leveraging user-to-tool interactions to automatically analyze defects in it services delivery | |
CN110020002A (zh) | 事件处理方案的查询方法、装置、设备和计算机存储介质 | |
US20190114711A1 (en) | Financial analysis system and method for unstructured text data | |
CN110392155B (zh) | 通知消息的显示、处理方法、装置及设备 | |
CN109918678B (zh) | 一种字段含义识别方法和装置 | |
CN113051362B (zh) | 数据的查询方法、装置和服务器 | |
CN112613569A (zh) | 图像识别方法、图像分类模型的训练方法及装置 | |
CN112256836A (zh) | 记录数据的处理方法、装置和服务器 | |
CN114297140A (zh) | 一种基于人工智能的档案管理系统 | |
CN113568934B (zh) | 一种数据查询方法、装置、电子设备和存储介质 | |
CN111191046A (zh) | 一种实现信息搜索的方法、装置、计算机存储介质及终端 | |
CN111126071A (zh) | 提问文本数据的确定方法、装置和客服群的数据处理方法 | |
CN111259975B (zh) | 分类器的生成方法及装置、文本的分类方法及装置 | |
CN110674123B (zh) | 数据预处理方法、装置、设备及介质 | |
CN110827049A (zh) | 一种数据推送方法及装置 | |
CN111553597A (zh) | 一种对企业进行财务舞弊风险识别的方法及装置 | |
CN105786929A (zh) | 一种信息监测方法及装置 | |
CN114693435A (zh) | 催收名单的智能回访的方法、装置、电子设备及存储介质 | |
CN114358879A (zh) | 一种基于大数据的物价实时监测方法和系统 | |
CN113706207A (zh) | 基于语义解析的订单成交率分析方法、装置、设备及介质 | |
CN113344674A (zh) | 基于用户购买力的产品推荐方法、装置、设备及存储介质 | |
CN113157948A (zh) | 非结构化数据的审计方法、电子设备及存储介质 | |
CN111383050A (zh) | 产品数据整合及分析方法、装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |