CN110287318B - 业务操作的检测方法及装置、存储介质、电子装置 - Google Patents
业务操作的检测方法及装置、存储介质、电子装置 Download PDFInfo
- Publication number
- CN110287318B CN110287318B CN201910491804.9A CN201910491804A CN110287318B CN 110287318 B CN110287318 B CN 110287318B CN 201910491804 A CN201910491804 A CN 201910491804A CN 110287318 B CN110287318 B CN 110287318B
- Authority
- CN
- China
- Prior art keywords
- service
- target
- information
- scene
- business
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title description 9
- 238000000034 method Methods 0.000 claims abstract description 41
- 238000013145 classification model Methods 0.000 claims description 65
- 238000004590 computer program Methods 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract description 4
- 230000006399 behavior Effects 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012935 Averaging Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 235000012054 meals Nutrition 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 206010034719 Personality change Diseases 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明提供了一种业务操作的检测方法及装置、存储介质、电子装置,该方法包括:获取采集到的第一目标对象的语音信息;在确定出语音信息中包括预设业务信息的情况下,确定预设业务信息所应用的业务场景;确定预设业务信息所应用的业务场景是否与目标业务场景匹配,得到匹配结果;基于匹配结果检测第一目标对象执行的业务操作是否为目标业务场景下允许执行的业务操作集合中的操作。通过本发明,解决了人工分类识别文本效率低,不能有效的对业务人员的行为进行检测的问题,达到有效检测业务人员的操作行为的效果。
Description
技术领域
本发明涉及计算机领域,具体而言,涉及一种业务操作的检测方法及装置、存储介质、电子装置。
背景技术
在线下语音识别使用场景中,业务员的日常对话以及任何无关业务场景的对话所识别出的文本往往是种干扰。监管者在审核一个业务员的日常行为是否规范时,只关心业务员的业务对话,但语音识别的结果中通常也包括了许多业务无关的对话,这不仅增大了在识别出的文本中查找有效信息的难度,同时也涉及到了业务员个人隐私泄露的问题。
由此可知,相关技术中存在着人工分类识别文本效率低,不能有效的对业务人员的行为进行检测的问题。
针对上述中存在的问题,相关技术中尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种业务操作的检测方法及装置、存储介质、电子装置,以至少解决相关技术中人工分类识别文本效率低,不能有效的对业务人员的行为进行检测的问题。
根据本发明的一个实施例,提供了一种业务操作的检测方法,包括:获取采集到的第一目标对象的语音信息;在确定出所述语音信息中包括预设业务信息的情况下,确定所述预设业务信息所应用的业务场景;确定所述预设业务信息所应用的业务场景是否与目标业务场景匹配,得到匹配结果;基于所述匹配结果检测所述第一目标对象执行的业务操作是否为所述目标业务场景下允许执行的业务操作集合中的操作。
根据本发明的另一个实施例,提供了一种业务操作的检测装置,包括:获取模块,用于获取采集到的第一目标对象的语音信息;第一确定模块,用于在确定出所述语音信息中包括预设业务信息的情况下,确定所述预设业务信息所应用的业务场景;第二确定模块,用于确定所述预设业务信息所应用的业务场景是否与目标业务场景匹配,得到匹配结果;处理模块,用于基于所述匹配结果检测所述第一目标对象执行的业务操作是否为所述目标业务场景下允许执行的业务操作集合中的操作。
根据本发明的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,由于获取采集到的第一目标对象的语音信息;在确定出语音信息中包括预设业务信息的情况下,确定预设业务信息所应用的业务场景;确定预设业务信息所应用的业务场景是否与目标业务场景匹配,得到匹配结果;基于匹配结果检测第一目标对象执行的业务操作是否为目标业务场景下允许执行的业务操作集合中的操作。可以实现通过预设业务信息和预设业务信息所对应的场景对业务人员的操作进行检测。因此,可以解决人工分类识别文本效率低,不能有效的对业务人员的行为进行检测的问题,达到有效检测业务人员的操作行为的效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种业务操作的检测方法的移动终端的硬件结构框图;
图2是根据本发明实施例的业务操作的检测方法的流程图;
图3是本实施例中的整体示意图;
图4是根据本发明实施例的业务操作的检测装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种业务操作的检测方法的移动终端的硬件结构框图。如图1所示,移动终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的业务操作的检测方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种业务操作的检测方法,图2是根据本发明实施例的业务操作的检测方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,获取采集到的第一目标对象的语音信息;
步骤S204,在确定出语音信息中包括预设业务信息的情况下,确定预设业务信息所应用的业务场景;
步骤S206,确定预设业务信息所应用的业务场景是否与目标业务场景匹配,得到匹配结果;
步骤S208,基于匹配结果检测第一目标对象执行的业务操作是否为目标业务场景下允许执行的业务操作集合中的操作。
通过本发明,由于获取采集到的第一目标对象的语音信息;在确定出语音信息中包括预设业务信息的情况下,确定预设业务信息所应用的业务场景;确定预设业务信息所应用的业务场景是否与目标业务场景匹配,得到匹配结果;基于匹配结果检测第一目标对象执行的业务操作是否为目标业务场景下允许执行的业务操作集合中的操作。可以实现通过预设业务信息和预设业务信息所对应的场景对业务人员的操作进行检测。因此,可以解决人工分类识别文本效率低,不能有效的对业务人员的行为进行检测的问题,达到有效检测业务人员的操作行为的效果。
可选地,上述步骤的执行主体可以为终端等,但不限于此。
在本实施例中,第一目标对象可以是业务人员,例如,餐厅的服务人员,银行的业务员等等。语音信息可以是在业务人员工作的场景中采集得到的。预设业务信息可以预先存储,是和工作内容相关的信息,例如餐厅的服务人员在接待顾客时说的“您点什么菜?”等等。
在本实施例中,不同的预设业务信息对应于不同的应用场景,例如,采集到语音信息是“您点什么菜?”,则认为所应用的是餐厅的点菜场景。将从语音信息中获取的与业务相关的信息的应用场景与实际的场景进行匹配,可以有效的检测出业务人员的操作是否符合相关规范,相关规范即可以是业务操作集合中的操作,业务操作集合中的操作是用户基于客观的应用场景预先存储的。
在一个可选的实施例中,业务操作集合中的操作并不是一成不变的,而是可以不断的进行更新的,具体如下:获取第二目标对象的语音信息;从第二目标对象的语音信息中提取出未包括在业务操作集合中的需求信息;将需求信息添加至业务操作集合中,以更新业务操作集合。在本实施例中,第二目标对象可以是顾客,从顾客的语音信息中提取出顾客新的需求,例如,顾客在用餐的过程中询问“是否有充电宝?”,而业务操作集合中的操作事先并未存储是否有充电宝的操作。即可以将是否有充电宝的操作存储至业务操作集合,以不断的更新业务操作集合。
在一个可选的实施例中,在基于匹配结果检测第一目标对象执行的业务操作是目标业务场景下允许执行的业务操作集合中的操作之后,可以从第一目标对象的语音信息中确定出第一目标对象执行的业务操作的顺序;确定第一目标对象执行的业务操作的顺序是否与业务操作集合中的操作顺序相同,以确定第一目标对象执行的业务操作是否在目标业务场景下不允许执行的业务操作集合中的操作。在本实施例中,不仅可以检测第一目标对象的操作是否正确,而且可以进一步的检测操作的顺序是否正确,可以有效的检测第一目标对象的操作。
在一个可选的实施例中,基于匹配结果检测第一目标对象执行的业务操作是目标业务场景下允许执行的业务操作集合中的操作之后,从第一目标对象的语音信息中确定出第一目标对象执行的业务操作的时间;确定第一目标对象执行的业务操作的时间是否大于第一预设值,以确定第一目标对象执行的业务操作是否超时。在本实施例中,一方面可以检测第一目标对象的操作是否正确,另一方面可以检测第一目标对象执行操作的时间是否在预设的业务操作的时间范围之内,如果第一目标对象执行操作的时间过长,也是不符合业务操作的。
在一个可选的实施例中,在获取采集到的第一目标对象的语音信息之前,将语音信息转换为目标文本信息,即是文字信息;将目标文本信息输入到目标文本分类模型中,得到目标文本分类模型输出的目标文本信息中包括的目标业务文本,其中,目标文本分类模型为使用样本文本信息对原始文本分类模型进行训练所得到的模型,目标文本分类模型用于确定目标文本信息中所包括的目标业务文本;确定目标业务文本是否包括预设业务信息,以确定语音信息中是否包括预设业务信息。在本实施例中,通过训练得到的目标文本分类模型输出语音信息中是否包括预设业务信息,让机器分类识别好的文本,只保留与业务相关的对话文本。节省人工提取有效信息的时间。
此外,可以通过以下方式训练目标文本分类模型:生成目标业务文本中各个业务词语的预设数量的相关词语;将各个业务词语替换为各个业务词语的相关词语,得到多个目标业务文本;将多个目标业务文本输入到原始文本分类模型中进行训练,得到目标文本分类模型。在本实施例中,预设数量可以是4个。目标文本分类模型可以是应用skip-gram方法训练的模型,将目标文本信息输入至目标文本分类模型中,用相关词语代替目标业务文本中的词语,词组成员由该相关词语和词语本身组成。此外,在生成所有可能词语序列后,应用tf-idf计算每个序列与业务相关文本及不相关文本的余弦相似度。将相似度求平均,将该文本分类为相似度高的场景。由于目标文本分类模型是基于该场景的语料库训练而成,对于句子的变形,关键字的变换具有良好的健壮性。
在一个可选的实施例中,在确定出语音信息中包括预设业务信息的情况下,确定预设业务信息所应用的业务场景包括:将预设业务信息输入到目标场景分类模型中,得到目标场景分类模型输出的预设业务信息所对应的业务场景,其中,目标场景分类模型为使用样本场景信息对原始场景分类模型进行训练所得到的模型,目标场景分类模型用于确定预设业务信息所对应的业务场景。在本实施例中,目标场景分类模型可以是应用CBOW方法训练的模型。
在一个可选的实施例中,可以通过以下方式训练目标场景分类模型:将语音信息转换为目标文本信息;确定目标文本信息中所包括的业务词语;确定出业务词语在各个业务场景中出现的概率;将业务词语出现概率最高的业务场景确定为业务词语所对应的业务场景;将业务词语和业务词语所在的业务场景之间的对应关系输入到场景分类模型中进行训练,得到目标场景分类模型。在本实施例中,可以将目标文本信息输入至目标场景分类模型,取窗口大小为4,为目标文本信息中的每个词语的位置计算其出现的概率。将每个词语出现的概率相乘,获得该业务场景下该词语出现的概率;判断该文本为概率最高的业务场景。
在一个可选的实施例中,在确定所述第一目标对象执行的业务操作不是所述目标业务场景下不允许执行的业务操作集合中的操作的情况下,通过目标设备向所述第一对象发送提示信息,其中,所述提示信息用于提示所述第一目标对象执行的业务操作不是所述目标业务场景下不允许执行的业务操作集合中的操作。在本实施例中,提示信息可以是语音信息,也可以是文字信息,目标设备可以是播放语音的语音设备。通过提示信息的提示,可以规范第一目标对象的操作。
在一个可选的实施例中,确定所述预设业务信息所应用的业务场景是否与目标业务场景匹配包括:确定在预设时间段内所述预设业务信息中的每个业务词语所应用的业务场景,得到多个业务场景;确定所述多个业务场景中包括的目标业务场景的数量;确定所述目标业务场景的数量在所述多个业务场景中所占的比例是否大于第二预设值,以确定所述预设业务信息所应用的业务场景是否与目标业务场景匹配。在本实施例中,通过相关业务场景所占比例的比较,可以更加准确的确定出业务场景。
下面结合具体实施例对本发明进行说明:
针对在实际业务场景中,即使有规定好的话术,业务员也不可能一字一句按照话术说话。并且在监管者的角度,适度的句子变形,减字,加字,换词都是允许的。实际能命中关键词的对话数量并不大,且命中的关键词序列也未必会与设置好的话术一致。也就是说,刻板的按照特定关键字词频序列并不能很好的表征出某类场景中的对话特征。
针对上述技术问题,本实施例通过训练目标文本分类模型,让机器分类识别好的文本,只保留与业务相关的对话文本。节省人工提取有效信息的时间。由于文档分类的模型是基于该场景的语料库训练而成,对于句子的变形,关键字的变换具有良好的健壮性。
图3是本实施例中的整体示意图,如图3所示,本方案包括以下步骤:
步骤一:为目标文本信息标注场景标签,场景标签有两个粒度,粗粒度标签为是否是目标业务文本。细粒度标签则是具体为哪个场景。分别为粗粒度标签及细粒度标签训练文档分类模型。分类模型主要思想为word2vec。
步骤二:应用skip-gram训练粗粒度模型(相当于上述中的目标文本分类模型),分类方法如下:
1)将目标业务文本送入应用skip-gram方法训练的模型,为目标业务文本中每个词语生成四个相关词语;
2)用词组代替目标业务文本中的词语,词组成员由该位置前后词语生成的四个相关词语及它本身组成。
3)生成所有可能词语序列,应用tf-idf计算每个序列与业务相关文本及不相关文本的余弦相似度。将相似度求平均,将该文本分类为相似度高的场景。
步骤三:应用CBOW为每个业务场景训练细粒度模型(相当于上述中的目标场景分类模型),分类方法如下:
1)将目标文本信息送入应用CBOW方法训练的模型,取窗口大小为4,为目标文本信息中的每个词语的位置计算其出现的概率。
2)将每个词语出现的概率相乘,获得该业务场景下该词语出现的概率。
3)判断该目标文本信息为概率最高的业务场景。
由上述可知,粗粒度模型应用skip-gram,因为一句话一般是短序列,而其可能会有许多变形;同时业务无关对话和业务相关对话分类粗糙,有可能一个词语的变化就会使其分类改变,考虑一句话所有的变形可以降低误判的可能性。
细粒度模型应用CBOW,因为细粒度分类业务场景时,每个场景会有相应的话术规定,导致不同场景下的语句相似度会很高,因此判断整个句子在不同场景下的概率会有较大区别,并且每个句子用词的变化有限,因此考虑单个词的概率进而计算整句话的概率更合适。
步骤四:打好场景标签的语句后可以再加上说话人标签,监察者可以方便的判断该业务员是否按照规定话术为客人服务。
本实施例相比人工核查时间要少,相比普通的关键词命中词频准确性要高,并且可以保护业务员的个人隐私。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种业务操作的检测装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是根据本发明实施例的业务操作的检测装置的结构框图,如图4所示,该装置包括:获取模块42,第一确定模块44,第二确定模块46,处理模块48,下面对该装置进行详细说明:
获取模块42,用于获取采集到的第一目标对象的语音信息;
第一确定模块44,用于在确定出语音信息中包括预设业务信息的情况下,确定预设业务信息所应用的业务场景;
第二确定模块46,用于确定预设业务信息所应用的业务场景是否与目标业务场景匹配,得到匹配结果;
处理模块48,用于基于匹配结果检测第一目标对象执行的业务操作是否为目标业务场景下允许执行的业务操作集合中的操作。
通过本发明,由于获取采集到的第一目标对象的语音信息;在确定出语音信息中包括预设业务信息的情况下,确定预设业务信息所应用的业务场景;确定预设业务信息所应用的业务场景是否与目标业务场景匹配,得到匹配结果;基于匹配结果检测第一目标对象执行的业务操作是否为目标业务场景下允许执行的业务操作集合中的操作。可以实现通过预设业务信息和预设业务信息所对应的场景对业务人员的操作进行检测。因此,可以解决人工分类识别文本效率低,不能有效的对业务人员的行为进行检测的问题,达到有效检测业务人员的操作行为的效果。
可选地,上述步骤的执行主体可以为终端等,但不限于此。
在本实施例中,第一目标对象可以是业务人员,例如,餐厅的服务人员,银行的业务员等等。语音信息可以是在业务人员工作的场景中采集得到的。预设业务信息可以预先存储,是和工作内容相关的信息,例如餐厅的服务人员在接待顾客时说的“您点什么菜?”等等。
在本实施例中,不同的预设业务信息对应于不同的应用场景,例如,采集到语音信息是“您点什么菜?”,则认为所应用的是餐厅的点菜场景。将从语音信息中获取的与业务相关的信息的应用场景与实际的场景进行匹配,可以有效的检测出业务人员的操作是否符合相关规范,相关规范即可以是业务操作集合中的操作,业务操作集合中的操作是用户基于客观的应用场景预先存储的。
在一个可选的实施例中,业务操作集合中的操作并不是一成不变的,而是可以不断的进行更新的,具体如下:获取第二目标对象的语音信息;从第二目标对象的语音信息中提取出未包括在业务操作集合中的需求信息;将需求信息添加至业务操作集合中,以更新业务操作集合。在本实施例中,第二目标对象可以是顾客,从顾客的语音信息中提取出顾客新的需求,例如,顾客在用餐的过程中询问“是否有充电宝?”,而业务操作集合中的操作事先并未存储是否有充电宝的操作。即可以将是否有充电宝的操作存储至业务操作集合,以不断的更新业务操作集合。
在一个可选的实施例中,在基于匹配结果检测第一目标对象执行的业务操作是目标业务场景下允许执行的业务操作集合中的操作之后,可以从第一目标对象的语音信息中确定出第一目标对象执行的业务操作的顺序;确定第一目标对象执行的业务操作的顺序是否与业务操作集合中的操作顺序相同,以确定第一目标对象执行的业务操作是否在目标业务场景下不允许执行的业务操作集合中的操作。在本实施例中,不仅可以检测第一目标对象的操作是否正确,而且可以进一步的检测操作的顺序是否正确,可以有效的检测第一目标对象的操作。
在一个可选的实施例中,基于匹配结果检测第一目标对象执行的业务操作是目标业务场景下允许执行的业务操作集合中的操作之后,从第一目标对象的语音信息中确定出第一目标对象执行的业务操作的时间;确定第一目标对象执行的业务操作的时间是否大于第一预设值,以确定第一目标对象执行的业务操作是否超时。在本实施例中,一方面可以检测第一目标对象的操作是否正确,另一方面可以检测第一目标对象执行操作的时间是否在预设的业务操作的时间范围之内,如果第一目标对象执行操作的时间过长,也是不符合业务操作的。
在一个可选的实施例中,在获取采集到的第一目标对象的语音信息之前,将语音信息转换为目标文本信息,即是文字信息;将目标文本信息输入到目标文本分类模型中,得到目标文本分类模型输出的目标文本信息中包括的目标业务文本,其中,目标文本分类模型为使用样本文本信息对原始文本分类模型进行训练所得到的模型,目标文本分类模型用于确定目标文本信息中所包括的目标业务文本;确定目标业务文本是否包括预设业务信息,以确定语音信息中是否包括预设业务信息。在本实施例中,通过训练得到的目标文本分类模型输出语音信息中是否包括预设业务信息,让机器分类识别好的文本,只保留与业务相关的对话文本。节省人工提取有效信息的时间。
此外,可以通过以下方式训练目标文本分类模型:生成目标业务文本中各个业务词语的预设数量的相关词语;将各个业务词语替换为各个业务词语的相关词语,得到多个目标业务文本;将多个目标业务文本输入到原始文本分类模型中进行训练,得到目标文本分类模型。在本实施例中,预设数量可以是4个。目标文本分类模型可以是应用skip-gram方法训练的模型,将目标文本信息输入至目标文本分类模型中,用相关词语代替目标业务文本中的词语,词组成员由该相关词语和词语本身组成。此外,在生成所有可能词语序列后,应用tf-idf计算每个序列与业务相关文本及不相关文本的余弦相似度。将相似度求平均,将该文本分类为相似度高的场景。由于目标文本分类模型是基于该场景的语料库训练而成,对于句子的变形,关键字的变换具有良好的健壮性。
在一个可选的实施例中,在确定出语音信息中包括预设业务信息的情况下,确定预设业务信息所应用的业务场景包括:将预设业务信息输入到目标场景分类模型中,得到目标场景分类模型输出的预设业务信息所对应的业务场景,其中,目标场景分类模型为使用样本场景信息对原始场景分类模型进行训练所得到的模型,目标场景分类模型用于确定预设业务信息所对应的业务场景。在本实施例中,目标场景分类模型可以是应用CBOW方法训练的模型。
在一个可选的实施例中,可以通过以下方式训练目标场景分类模型:将语音信息转换为目标文本信息;确定目标文本信息中所包括的业务词语;确定出业务词语在各个业务场景中出现的概率;将业务词语出现概率最高的业务场景确定为业务词语所对应的业务场景;将业务词语和业务词语所在的业务场景之间的对应关系输入到场景分类模型中进行训练,得到目标场景分类模型。在本实施例中,可以将目标文本信息输入至目标场景分类模型,取窗口大小为4,为目标文本信息中的每个词语的位置计算其出现的概率。将每个词语出现的概率相乘,获得该业务场景下该词语出现的概率;判断该文本为概率最高的业务场景。
在一个可选的实施例中,在确定所述第一目标对象执行的业务操作不是所述目标业务场景下不允许执行的业务操作集合中的操作的情况下,通过目标设备向所述第一对象发送提示信息,其中,所述提示信息用于提示所述第一目标对象执行的业务操作不是所述目标业务场景下不允许执行的业务操作集合中的操作。在本实施例中,提示信息可以是语音信息,也可以是文字信息,目标设备可以是播放语音的语音设备。通过提示信息的提示,可以规范第一目标对象的操作。
在一个可选的实施例中,确定所述预设业务信息所应用的业务场景是否与目标业务场景匹配包括:确定在预设时间段内所述预设业务信息中的每个业务词语所应用的业务场景,得到多个业务场景;确定所述多个业务场景中包括的目标业务场景的数量;确定所述目标业务场景的数量在所述多个业务场景中所占的比例是否大于第二预设值,以确定所述预设业务信息所应用的业务场景是否与目标业务场景匹配。在本实施例中,通过相关业务场景所占比例的比较,可以更加准确的确定出业务场景。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以上各步骤的计算机程序。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以上各步骤。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (11)
1.一种业务操作的检测方法,其特征在于,包括:
获取采集到的第一目标对象的语音信息;
在确定出所述语音信息中包括预设业务信息的情况下,确定所述预设业务信息所应用的业务场景;
确定所述预设业务信息所应用的业务场景是否与目标业务场景匹配,得到匹配结果;
基于所述匹配结果检测所述第一目标对象执行的业务操作是否为所述目标业务场景下允许执行的业务操作集合中的操作;
其中,确定所述预设业务信息所应用的业务场景是否与目标业务场景匹配包括:确定在预设时间段内所述预设业务信息中的每个业务词语所应用的业务场景,得到多个业务场景;确定所述多个业务场景中包括的目标业务场景的数量;确定所述目标业务场景的数量在所述多个业务场景中所占的比例是否大于第二预设值,以确定所述预设业务信息所应用的业务场景是否与目标业务场景匹配。
2.根据权利要求1所述的方法,其特征在于,在获取采集到的目标对象的语音信息之后,所述方法还包括:
获取第二目标对象的语音信息;
从所述第二目标对象的语音信息中提取出未包括在所述业务操作集合中的需求信息;
将所述需求信息添加至所述业务操作集合中,以更新所述业务操作集合。
3.根据权利要求1所述的方法,其特征在于,在基于所述匹配结果检测所述第一目标对象执行的业务操作是所述目标业务场景下允许执行的业务操作集合中的操作之后,所述方法还包括:
从所述第一目标对象的语音信息中确定出所述第一目标对象执行的业务操作的顺序;
确定所述第一目标对象执行的业务操作的顺序是否与所述业务操作集合中的操作顺序相同,以确定所述第一目标对象执行的业务操作是否在所述目标业务场景下不允许执行的业务操作集合中的操作。
4.根据权利要求1所述的方法,其特征在于,基于所述匹配结果检测所述第一目标对象执行的业务操作是所述目标业务场景下允许执行的业务操作集合中的操作之后,所述方法还包括:
从所述第一目标对象的语音信息中确定出所述第一目标对象执行的业务操作的时间;
确定所述第一目标对象执行的业务操作的时间是否大于第一预设值,以确定所述第一目标对象执行的业务操作是否超时。
5.根据权利要求1所述的方法,其特征在于,在获取采集到的第一目标对象的语音信息之前,所述方法包括:
将所述语音信息转换为目标文本信息;
将所述目标文本信息输入到目标文本分类模型中,得到所述目标文本分类模型输出的所述目标文本信息中包括的目标业务文本,其中,所述目标文本分类模型为使用样本文本信息对原始文本分类模型进行训练所得到的模型,所述目标文本分类模型用于确定所述目标文本信息中所包括的所述目标业务文本;
确定所述目标业务文本是否包括所述预设业务信息,以确定所述语音信息中是否包括所述预设业务信息。
6.根据权利要求5所述的方法,其特征在于,通过以下方式训练所述目标文本分类模型:
生成所述目标业务文本中各个业务词语的预设数量的相关词语;
将所述各个业务词语替换为所述各个业务词语的相关词语,得到多个目标业务文本;
将所述多个目标业务文本输入到所述原始文本分类模型中进行训练,得到所述目标文本分类模型。
7.根据权利要求1所述的方法,其特征在于,在确定出所述语音信息中包括预设业务信息的情况下,确定所述预设业务信息所应用的业务场景包括:
将所述预设业务信息输入到目标场景分类模型中,得到所述目标场景分类模型输出的所述预设业务信息所对应的业务场景,其中,所述目标场景分类模型为使用样本场景信息对原始场景分类模型进行训练所得到的模型,所述目标场景分类模型用于确定所述预设业务信息所对应的业务场景。
8.根据权利要求7所述的方法,其特征在于,通过以下方式训练所述目标场景分类模型:
将所述语音信息转换为目标文本信息;
确定所述目标文本信息中所包括的业务词语;
确定出所述业务词语在各个业务场景中出现的概率;
将所述业务词语出现概率最高的业务场景确定为所述业务词语所对应的业务场景;
将所述业务词语和所述业务词语所在的业务场景之间的对应关系输入到所述场景分类模型中进行训练,得到所述目标场景分类模型。
9.一种业务操作的检测装置,其特征在于,包括:
获取模块,用于获取采集到的第一目标对象的语音信息;
第一确定模块,用于在确定出所述语音信息中包括预设业务信息的情况下,确定所述预设业务信息所应用的业务场景;
第二确定模块,用于确定所述预设业务信息所应用的业务场景是否与目标业务场景匹配,得到匹配结果;
处理模块,用于基于所述匹配结果检测所述第一目标对象执行的业务操作是否为所述目标业务场景下允许执行的业务操作集合中的操作;
其中,所述第二确定模块还用于:确定在预设时间段内所述预设业务信息中的每个业务词语所应用的业务场景,得到多个业务场景;确定所述多个业务场景中包括的目标业务场景的数量;确定所述目标业务场景的数量在所述多个业务场景中所占的比例是否大于第二预设值,以确定所述预设业务信息所应用的业务场景是否与目标业务场景匹配。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至8任一项中所述的方法。
11.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至8任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910491804.9A CN110287318B (zh) | 2019-06-06 | 2019-06-06 | 业务操作的检测方法及装置、存储介质、电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910491804.9A CN110287318B (zh) | 2019-06-06 | 2019-06-06 | 业务操作的检测方法及装置、存储介质、电子装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110287318A CN110287318A (zh) | 2019-09-27 |
CN110287318B true CN110287318B (zh) | 2021-09-17 |
Family
ID=68003466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910491804.9A Active CN110287318B (zh) | 2019-06-06 | 2019-06-06 | 业务操作的检测方法及装置、存储介质、电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110287318B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126071B (zh) * | 2019-12-02 | 2023-05-12 | 支付宝(杭州)信息技术有限公司 | 提问文本数据的确定方法、装置和客服群的数据处理方法 |
CN112116457B (zh) * | 2020-09-29 | 2024-02-23 | 中国银行股份有限公司 | 一种银行柜面业务的监督方法、装置及设备 |
CN112286775B (zh) * | 2020-10-30 | 2023-01-24 | 深圳前海微众银行股份有限公司 | 一种疲劳状态检测的方法、设备及存储介质 |
CN113593545A (zh) * | 2021-06-24 | 2021-11-02 | 青岛海尔科技有限公司 | 联动场景执行方法和装置、存储介质及电子设备 |
CN114217800A (zh) * | 2021-12-21 | 2022-03-22 | 北京达佳互联信息技术有限公司 | 页面生成方法、装置、电子设备及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060020792A (ko) * | 2004-09-01 | 2006-03-07 | 하나로텔레콤 주식회사 | 인터넷 전화 서비스 품질 통계 제공 방법 및 그 시스템 |
CN104301554A (zh) * | 2013-07-18 | 2015-01-21 | 中兴通讯股份有限公司 | 一种对客服人员的服务质量进行质检的装置及方法 |
CN107885719A (zh) * | 2017-09-20 | 2018-04-06 | 北京百度网讯科技有限公司 | 基于人工智能的词汇类别挖掘方法、装置及存储介质 |
CN108429632A (zh) * | 2017-02-15 | 2018-08-21 | 阿里巴巴集团控股有限公司 | 一种业务监控方法和装置 |
CN109446524A (zh) * | 2018-10-25 | 2019-03-08 | 第四范式(北京)技术有限公司 | 一种语音质检方法及装置 |
CN109543516A (zh) * | 2018-10-16 | 2019-03-29 | 深圳壹账通智能科技有限公司 | 签约意向判断方法、装置、计算机设备和存储介质 |
CN109729383A (zh) * | 2019-01-04 | 2019-05-07 | 深圳壹账通智能科技有限公司 | 双录视频质量检测方法、装置、计算机设备和存储介质 |
CN109740154A (zh) * | 2018-12-26 | 2019-05-10 | 西安电子科技大学 | 一种基于多任务学习的在线评论细粒度情感分析方法 |
-
2019
- 2019-06-06 CN CN201910491804.9A patent/CN110287318B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060020792A (ko) * | 2004-09-01 | 2006-03-07 | 하나로텔레콤 주식회사 | 인터넷 전화 서비스 품질 통계 제공 방법 및 그 시스템 |
CN104301554A (zh) * | 2013-07-18 | 2015-01-21 | 中兴通讯股份有限公司 | 一种对客服人员的服务质量进行质检的装置及方法 |
CN108429632A (zh) * | 2017-02-15 | 2018-08-21 | 阿里巴巴集团控股有限公司 | 一种业务监控方法和装置 |
CN107885719A (zh) * | 2017-09-20 | 2018-04-06 | 北京百度网讯科技有限公司 | 基于人工智能的词汇类别挖掘方法、装置及存储介质 |
CN109543516A (zh) * | 2018-10-16 | 2019-03-29 | 深圳壹账通智能科技有限公司 | 签约意向判断方法、装置、计算机设备和存储介质 |
CN109446524A (zh) * | 2018-10-25 | 2019-03-08 | 第四范式(北京)技术有限公司 | 一种语音质检方法及装置 |
CN109740154A (zh) * | 2018-12-26 | 2019-05-10 | 西安电子科技大学 | 一种基于多任务学习的在线评论细粒度情感分析方法 |
CN109729383A (zh) * | 2019-01-04 | 2019-05-07 | 深圳壹账通智能科技有限公司 | 双录视频质量检测方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110287318A (zh) | 2019-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110287318B (zh) | 业务操作的检测方法及装置、存储介质、电子装置 | |
CN106919661B (zh) | 一种情感类型识别方法及相关装置 | |
CN110597952A (zh) | 信息处理方法、服务器及计算机存储介质 | |
US10796077B2 (en) | Rule matching method and device | |
CN110362601B (zh) | 元数据标准的映射方法、装置、设备及存储介质 | |
CN107784051A (zh) | 在线客服应答系统及方法 | |
CN110890088B (zh) | 语音信息反馈方法、装置、计算机设备和存储介质 | |
CN113360622B (zh) | 用户对话信息的处理方法、装置及计算机设备 | |
CN108121455B (zh) | 识别纠正方法及装置 | |
CN113591463B (zh) | 意图识别方法、装置、电子设备及存储介质 | |
CN109508367A (zh) | 自动提取问答语料的方法、在线智能客服系统及电子设备 | |
CN110457454A (zh) | 一种对话方法、服务器、对话系统及存储介质 | |
CN110459223A (zh) | 数据跟踪处理方法、设备、存储介质及装置 | |
CN112364622A (zh) | 对话文本分析方法、装置、电子装置及存储介质 | |
CN112632248A (zh) | 问答方法、装置、计算机设备和存储介质 | |
WO2020199590A1 (zh) | 情绪检测分析方法及相关装置 | |
CN110750626B (zh) | 一种基于场景的任务驱动的多轮对话方法及系统 | |
CN111354354B (zh) | 一种基于语义识别的训练方法、训练装置及终端设备 | |
CN111062211A (zh) | 信息提取方法、装置、电子设备及存储介质 | |
CN112581297B (zh) | 基于人工智能的信息推送方法、装置及计算机设备 | |
CN110705258A (zh) | 文本实体识别方法及装置 | |
CN114528851B (zh) | 回复语句确定方法、装置、电子设备和存储介质 | |
CN115906797A (zh) | 文本实体对齐方法、装置、设备及介质 | |
CN115019788A (zh) | 语音交互方法、系统、终端设备及存储介质 | |
CN114254088A (zh) | 自动应答模型的构建方法和自动应答方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |