CN114022954A - 一种服务标准化方法及装置 - Google Patents
一种服务标准化方法及装置 Download PDFInfo
- Publication number
- CN114022954A CN114022954A CN202111235709.6A CN202111235709A CN114022954A CN 114022954 A CN114022954 A CN 114022954A CN 202111235709 A CN202111235709 A CN 202111235709A CN 114022954 A CN114022954 A CN 114022954A
- Authority
- CN
- China
- Prior art keywords
- service
- action
- shopping guide
- key point
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011425 standardization method Methods 0.000 title claims abstract description 18
- 230000009471 action Effects 0.000 claims abstract description 116
- 230000004927 fusion Effects 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims description 50
- 238000000034 method Methods 0.000 claims description 25
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 238000000926 separation method Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 14
- 238000004891 communication Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0281—Customer communication at a business location, e.g. providing product or service information, consulting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Biomedical Technology (AREA)
- Accounting & Taxation (AREA)
- Molecular Biology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Biophysics (AREA)
- Databases & Information Systems (AREA)
- Animal Behavior & Ethology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种服务标准化方法及装置,在获取包含导购员的音频数据和动作视频的多媒体视频数据后;对多媒体视频数据进行解析,得到导购员对应的音频数据和动作视频;从动作视频中提取导购员的关键点信息,通过关键点时序网络进行动作识别,生成第一识别结果;将音频数据转化为文字信息,通过预设知识图谱对文字信息进行分析,生成第二识别结果;将第一识别结果和第二识别结果输入至预设融合网络,生成多媒体视频数据对应的服务话术和服务动作;最后,将服务话术和服务动作分别与对应的标准话术和标准动作进行比较,以确保导购员的服务为标准化服务。本申请可以指导线下导购人员的语言和动作,使连锁门店可以提供标准化的服务。
Description
技术领域
本申请涉及服务标准化技术领域,特别的,尤其涉及一种服务标准化方法及装置。
背景技术
目前,导购员的标准话术已经广泛使用在线下连锁店铺,通过录音,利用语音识别技术,构建的知识图谱,可以定量分析特点话术对销售的影响,其可以有力的促进产品的销售,但对销售人员的动作行为的标准化却很难实现,虽然现有技术中存在一些方案可以实现销售人员的特征提取,但是均是将检测到的人作为一个整体进行特征提取,因此,就目前的现有技术来说,语音识别只能实现话术的标准化,无法做到动作标准化,进而无法做到导购员服务的话术和动作的标准化。
发明内容
鉴于上述内容中的问题,本申请提供了一种服务标准化方法及装置,通过融合语音和动作信息,指导线下导购人员的语言和动作,使连锁门店可以提供标准化的服务。
为了实现上述目的,本申请提供了以下技术方案:
一种服务标准化方法,包括:
获取包含导购员的音频数据和动作视频的多媒体视频数据;
对所述多媒体视频数据进行解析,得到所述导购员对应的音频数据和动作视频;
从所述动作视频中提取所述导购员的关键点信息,通过关键点时序网络进行动作识别,生成第一识别结果,所述关键点时序网络为基于导购员的关键点信息的动作识别网络;
将所述音频数据转化为文字信息,通过预设知识图谱对所述文字信息进行分析,生成第二识别结果,所述预设知识图谱为包含以关键词为节点的知识图谱;
将所述第一识别结果和所述第二识别结果输入至预设融合网络,生成所述多媒体视频数据对应的服务话术和服务动作;
将所述服务话术和所述服务动作分别与对应的标准话术和标准动作进行比较,以确保所述导购员的服务为标准化服务,所述标准话术和所述标准动作是预先制定的。
进一步的,所述对所述多媒体视频数据进行解析,得到对应的音频数据和图像数据,包括:
对所述多媒体视频数据进行声音分离处理,得到对应的声音文件,生成所述音频数据;
对所述多媒体视频数据进行动作视频分离处理,得到对应的所述动作视频
进一步的,所述关键点时序网络的构建方法,包括:
获取包含导购员关键点的动作视频,将其作为样本数据;
从所述动作视频中提取导购员关键点信息,将所述导购员关键点信息作为图神经网络的训练集,对所述图神经网络进行训练,得到所述关键点时序网络。
进一步的,所述预设知识图谱的生成方法,包括:
获取包含关键词的文字信息,将其作为样本数据;
从所述文字信息中提取关键词,将所述关键词作为知识图谱中的实体,构建所述预设知识图谱。
一种服务标准化装置,包括:
第一处理单元,用于获取包含导购员的音频数据和动作视频的多媒体视频数据;
第二处理单元,用于对所述多媒体视频数据进行解析,得到所述导购员对应的音频数据和动作视频;
第三处理单元,用于从所述动作视频中提取所述导购员的关键点信息,通过关键点时序网络进行动作识别,生成第一识别结果,所述关键点时序网络为基于导购员的关键点信息的动作识别网络;
第四处理单元,用于将所述音频数据转化为文字信息,通过预设知识图谱对所述文字信息进行分析,生成第二识别结果,所述预设知识图谱为包含以关键词为节点的知识图谱;
第五处理单元,用于将所述第一识别结果和所述第二识别结果输入至预设融合网络,生成所述多媒体视频数据对应的服务话术和服务动作;
第六处理单元,用于将所述服务话术和所述服务动作分别与对应的标准话术和标准动作进行比较,以确保所述导购员的服务为标准化服务,所述标准话术和所述标准动作是预先制定的。
进一步的,所述第二处理单元具体用于:
对所述多媒体视频数据进行声音分离处理,得到对应的声音文件,生成所述音频数据;
对所述多媒体视频数据进行动作视频分离处理,得到对应的所述动作视频
进一步的,所述第三处理单元具体还用于:
获取包含导购员关键点的动作视频,将其作为样本数据;
从所述动作视频中提取导购员关键点信息,将所述导购员关键点信息作为图神经网络的训练集,对所述图神经网络进行训练,得到所述关键点时序网络。
进一步的,所述第四处理单元具体还用于:
获取包含关键词的文字信息,将其作为样本数据;
从所述文字信息中提取关键词,将所述关键词作为知识图谱中的实体,构建所述预设知识图谱。
一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在的设备执行如上述所述的服务标准化方法。
一种电子设备,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如上述所述的服务标准化方法。
本申请所述的服务标准化方法及装置,在获取包含导购员的音频数据和动作视频的多媒体视频数据后;对所述多媒体视频数据进行解析,得到所述导购员对应的音频数据和动作视频;从所述动作视频中提取所述导购员的关键点信息,通过关键点时序网络进行动作识别,生成第一识别结果;将所述音频数据转化为文字信息,通过预设知识图谱对所述文字信息进行分析,生成第二识别结果;将所述第一识别结果和所述第二识别结果输入至预设融合网络,生成所述多媒体视频数据对应的服务话术和服务动作;最后,将所述服务话术和所述服务动作分别与对应的标准话术和标准动作进行比较,以确保所述导购员的服务为标准化服务。本申请通过融合语音和动作信息,指导线下导购人员的语言和动作,使连锁门店可以提供标准化的服务。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的一种服务标准化方法的流程示意图;
图2为本申请实施例公开的一种服务标准化方法流程示意图;
图3为本申请实施例公开的一种服务标准化装置的结构示意图;
图4为本申请实施例公开的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参见附图1,为本申请实施例提供的一种服务标准化方法流程示意图。如图1所示,本申请实施例提供了一种服务标准化方法,该方法包括如下步骤:
S101:获取包含导购员的音频数据和动作视频的多媒体视频数据;
本步骤中,多媒体视频数据是通过现场多媒体设备获取得到的,多媒体设备可以为视频摄像头或其他音视频设备。特别说明的是,多媒体视频数据包括音频数据和动作视频,因此,对应的多媒体设备需要具体音频收集和动作视频收集功能。
S102:对所述多媒体视频数据进行解析,得到导购员对应的音频数据和动作视频;
本步骤中,上述对所述多媒体视频数据进行解析,得到对应的音频数据和动作视频,包括:对所述多媒体视频数据进行声音分离处理,得到对应的声音文件,生成所述音频数据;对所述多媒体视频数据进行动作视频分离处理,得到对应的所述动作视频。
需要说明的是,需要从多媒体视频数据中分离出声音文件和图像数据,才能得到对应的音频数据和动作视频。
S103:从所述图像数据中提取所述导购员的关键点信息,通过关键点时序网络进行动作识别,生成第一识别结果,所述关键点时序网络为基于导购员的关键点信息的动作识别网络;
本步骤中,需要先从图像数据中提取导购员的关键点信息,通过关键点时序网络进行动作识别,生成第一识别结果,如图2所示,具体的,所述预设动作识别网络为基于导购员的关键点信息的动作识别网络。
需要说明的是,所述关键点时序网络的构建方法,包括:获取包含导购员的关键点的动作视频,将其作为样本数据;从所述动作视频中提取导购员关键点信息,将所述导购员关键点信息作为图神经网络的训练集,对所述图神经网络进行训练,得到所述关键点时序网络。
S104:将所述音频数据转化为文字信息,通过预设知识图谱对所述文字信息进行分析,生成第二识别结果,所述预设知识图谱为包含以关键词为节点的知识图谱;
本步骤中,需要先将音频数据通过语音转换方法转化为文字信息,通过预设知识图谱对所述文字信息进行分析,生成第二识别结果,如图2所示,所述预设知识图谱为包含以关键词为节点的知识图谱。
需要说明的是,所述预设知识图谱的生成方法,包括:获取包含关键词的文字信息,将其作为样本数据;从所述文字信息中提取关键词,将所述关键词作为知识图谱中的实体,构建所述预设知识图谱。
S105:将所述第一识别结果和所述第二识别结果输入至预设融合网络,生成所述多媒体视频数据对应的服务话术和服务动作。
S106:将所述服务话术和所述服务动作分别与对应的标准话术和标准动作进行比较,以确保所述导购员的服务为标准化服务,所述标准话术和所述标准动作是预先制定的。
本申请实施例提供的一种服务标准化方法,在获取包含导购员的音频数据和动作视频的多媒体视频数据后;对所述多媒体视频数据进行解析,得到所述导购员对应的音频数据和动作视频;从所述动作视频中提取所述导购员的关键点信息,通过关键点时序网络进行动作识别,生成第一识别结果;将所述音频数据转化为文字信息,通过预设知识图谱对所述文字信息进行分析,生成第二识别结果;将所述第一识别结果和所述第二识别结果输入至预设融合网络,生成所述多媒体视频数据对应的服务话术和服务动作;最后,将所述服务话术和所述服务动作分别与对应的标准话术和标准动作进行比较,以确保所述导购员的服务为标准化服务。本申请实施例通过融合语音和动作信息,指导线下导购人员的语言和动作,使连锁门店可以提供标准化的服务。
请参阅图3,基于上述实施例公开的一种服务标准化方法,本实施例对应公开了一种服务标准化装置,该装置包括:
第一处理单元301,用于获取包含导购员的音频数据和动作视频的多媒体视频数据;
第二处理单元302,用于对所述多媒体视频数据进行解析,得到所述导购员对应的音频数据和动作视频;
第三处理单元303,用于从所述动作视频中提取所述导购员的关键点信息,通过关键点时序网络进行动作识别,生成第一识别结果,所述关键点时序网络为基于导购员的关键点信息的动作识别网络;
第四处理单元304,用于将所述音频数据转化为文字信息,通过预设知识图谱对所述文字信息进行分析,生成第二识别结果,所述预设知识图谱为包含以关键词为节点的知识图谱;
第五处理单元305,用于将所述第一识别结果和所述第二识别结果输入至预设融合网络,生成所述多媒体视频数据对应的服务话术和服务动作;
第六处理单元306,用于将所述服务话术和所述服务动作分别与对应的标准话术和标准动作进行比较,以确保所述导购员的服务为标准化服务,所述标准话术和所述标准动作是预先制定的。
进一步的,所述第二处理单元302具体用于:
对所述多媒体视频数据进行声音分离处理,得到对应的声音文件,生成所述音频数据;
对所述多媒体视频数据进行动作视频分离处理,得到对应的所述动作视频
进一步的,所述第三处理单元303具体还用于:
获取包含导购员关键点的动作视频,将其作为样本数据;
从所述动作视频中提取导购员关键点信息,将所述导购员关键点信息作为图神经网络的训练集,对所述图神经网络进行训练,得到所述关键点时序网络。
进一步的,所述第四处理单元304具体还用于:
获取包含关键词的文字信息,将其作为样本数据;
从所述文字信息中提取关键词,将所述关键词作为知识图谱中的实体,构建所述预设知识图谱。
所述服务标准化装置包括处理器和存储器,上述第一处理单元、第二处理单元、第三处理单元、第四处理单元、第五处理单元和第六处理单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来达到通过融合语音和动作信息,指导线下导购人员的语言和动作,使连锁门店可以提供标准化的服务的目的。
本申请实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述服务标准化方法。
本申请实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述服务标准化方法。
本申请实施例提供了一种电子设备,如图4所示,该电子设备40包括至少一个处理器401、以及与所述处理器连接的至少一个存储器402、总线403;其中,所述处理器401、所述存储器402通过所述总线403完成相互间的通信;处理器401用于调用所述存储器402中的程序指令,以执行上述的所述服务标准化方法。
本文中的电子设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
获取包含导购员的音频数据和动作视频的多媒体视频数据;
对所述多媒体视频数据进行解析,得到所述导购员对应的音频数据和动作视频;
从所述动作视频中提取所述导购员的关键点信息,通过关键点时序网络进行动作识别,生成第一识别结果,所述关键点时序网络为基于导购员的关键点信息的动作识别网络;
将所述音频数据转化为文字信息,通过预设知识图谱对所述文字信息进行分析,生成第二识别结果,所述预设知识图谱为包含以关键词为节点的知识图谱;
将所述第一识别结果和所述第二识别结果输入至预设融合网络,生成所述多媒体视频数据对应的服务话术和服务动作;
将所述服务话术和所述服务动作分别与对应的标准话术和标准动作进行比较,以确保所述导购员的服务为标准化服务,所述标准话术和所述标准动作是预先制定的。
进一步的,所述对所述多媒体视频数据进行解析,得到对应的音频数据和图像数据,包括:
对所述多媒体视频数据进行声音分离处理,得到对应的声音文件,生成所述音频数据;
对所述多媒体视频数据进行动作视频分离处理,得到对应的所述动作视频
进一步的,所述关键点时序网络的构建方法,包括:
获取包含导购员关键点的动作视频,将其作为样本数据;
从所述动作视频中提取导购员关键点信息,将所述导购员关键点信息作为图神经网络的训练集,对所述图神经网络进行训练,得到所述关键点时序网络。
进一步的,所述预设知识图谱的生成方法,包括:
获取包含关键词的文字信息,将其作为样本数据;
从所述文字信息中提取关键词,将所述关键词作为知识图谱中的实体,构建所述预设知识图谱。
本申请是根据本申请实施例的方法、设备(系统)、计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
在一个典型的配置中,设备包括一个或多个处理器(CPU)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种服务标准化方法,其特征在于,包括:
获取包含导购员的音频数据和动作视频的多媒体视频数据;
对所述多媒体视频数据进行解析,得到所述导购员对应的音频数据和动作视频;
从所述动作视频中提取所述导购员的关键点信息,通过关键点时序网络进行动作识别,生成第一识别结果,所述关键点时序网络为基于导购员的关键点信息的动作识别网络;
将所述音频数据转化为文字信息,通过预设知识图谱对所述文字信息进行分析,生成第二识别结果,所述预设知识图谱为包含以关键词为节点的知识图谱;
将所述第一识别结果和所述第二识别结果输入至预设融合网络,生成所述多媒体视频数据对应的服务话术和服务动作;
将所述服务话术和所述服务动作分别与对应的标准话术和标准动作进行比较,以确保所述导购员的服务为标准化服务,所述标准话术和所述标准动作是预先制定的。
2.根据权利要求1所述的方法,其特征在于,所述对所述多媒体视频数据进行解析,得到对应的音频数据和图像数据,包括:
对所述多媒体视频数据进行声音分离处理,得到对应的声音文件,生成所述音频数据;
对所述多媒体视频数据进行动作视频分离处理,得到对应的所述动作视频。
3.根据权利要求1所述的方法,其特征在于,所述关键点时序网络的构建方法,包括:
获取包含导购员关键点的动作视频,将其作为样本数据;
从所述动作视频中提取导购员关键点信息,将所述导购员关键点信息作为图神经网络的训练集,对所述图神经网络进行训练,得到所述关键点时序网络。
4.根据权利要求1所述的方法,其特征在于,所述预设知识图谱的生成方法,包括:
获取包含关键词的文字信息,将其作为样本数据;
从所述文字信息中提取关键词,将所述关键词作为知识图谱中的实体,构建所述预设知识图谱。
5.一种服务标准化装置,其特征在于,包括:
第一处理单元,用于获取包含导购员的音频数据和动作视频的多媒体视频数据;
第二处理单元,用于对所述多媒体视频数据进行解析,得到所述导购员对应的音频数据和动作视频;
第三处理单元,用于从所述动作视频中提取所述导购员的关键点信息,通过关键点时序网络进行动作识别,生成第一识别结果,所述关键点时序网络为基于导购员的关键点信息的动作识别网络;
第四处理单元,用于将所述音频数据转化为文字信息,通过预设知识图谱对所述文字信息进行分析,生成第二识别结果,所述预设知识图谱为包含以关键词为节点的知识图谱;
第五处理单元,用于将所述第一识别结果和所述第二识别结果输入至预设融合网络,生成所述多媒体视频数据对应的服务话术和服务动作;
第六处理单元,用于将所述服务话术和所述服务动作分别与对应的标准话术和标准动作进行比较,以确保所述导购员的服务为标准化服务,所述标准话术和所述标准动作是预先制定的。
6.根据权利要求5所述的装置,其特征在于,所述第二处理单元具体用于:
对所述多媒体视频数据进行声音分离处理,得到对应的声音文件,生成所述音频数据;
对所述多媒体视频数据进行动作视频分离处理,得到对应的所述动作视频。
7.根据权利要求5所述的装置,其特征在于,所述第三处理单元具体还用于:
获取包含导购员关键点的动作视频,将其作为样本数据;
从所述动作视频中提取导购员关键点信息,将所述导购员关键点信息作为图神经网络的训练集,对所述图神经网络进行训练,得到所述关键点时序网络。
8.根据权利要求5所述的装置,其特征在于,所述第四处理单元具体还用于:
获取包含关键词的文字信息,将其作为样本数据;
从所述文字信息中提取关键词,将所述关键词作为知识图谱中的实体,构建所述预设知识图谱。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在的设备执行如权利要求1至4中任一项所述的服务标准化方法。
10.一种电子设备,其特征在于,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行如权利要求1至4中任一项所述的服务标准化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111235709.6A CN114022954A (zh) | 2021-10-22 | 2021-10-22 | 一种服务标准化方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111235709.6A CN114022954A (zh) | 2021-10-22 | 2021-10-22 | 一种服务标准化方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114022954A true CN114022954A (zh) | 2022-02-08 |
Family
ID=80057240
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111235709.6A Pending CN114022954A (zh) | 2021-10-22 | 2021-10-22 | 一种服务标准化方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114022954A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108515991A (zh) * | 2018-04-18 | 2018-09-11 | 大连奇辉计算机网络有限公司 | 一种接发列车标准化作业检测系统 |
CN112017633A (zh) * | 2020-09-10 | 2020-12-01 | 北京地平线信息技术有限公司 | 语音识别方法、装置、存储介质及电子设备 |
CN112233516A (zh) * | 2020-10-12 | 2021-01-15 | 萱闱(北京)生物科技有限公司 | 一种医师cpr考试训练与考核的评分方法及系统 |
CN112287868A (zh) * | 2020-11-10 | 2021-01-29 | 上海依图网络科技有限公司 | 一种人体动作识别方法及装置 |
CN112633037A (zh) * | 2019-09-24 | 2021-04-09 | 北京国双科技有限公司 | 一种对象监测方法、装置、存储介质及电子设备 |
GB202106077D0 (en) * | 2020-04-28 | 2021-06-09 | Sony Interactive Entertainment Inc | Notifications determined using one or more neural networks |
-
2021
- 2021-10-22 CN CN202111235709.6A patent/CN114022954A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108515991A (zh) * | 2018-04-18 | 2018-09-11 | 大连奇辉计算机网络有限公司 | 一种接发列车标准化作业检测系统 |
CN112633037A (zh) * | 2019-09-24 | 2021-04-09 | 北京国双科技有限公司 | 一种对象监测方法、装置、存储介质及电子设备 |
GB202106077D0 (en) * | 2020-04-28 | 2021-06-09 | Sony Interactive Entertainment Inc | Notifications determined using one or more neural networks |
CN112017633A (zh) * | 2020-09-10 | 2020-12-01 | 北京地平线信息技术有限公司 | 语音识别方法、装置、存储介质及电子设备 |
CN112233516A (zh) * | 2020-10-12 | 2021-01-15 | 萱闱(北京)生物科技有限公司 | 一种医师cpr考试训练与考核的评分方法及系统 |
CN112287868A (zh) * | 2020-11-10 | 2021-01-29 | 上海依图网络科技有限公司 | 一种人体动作识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111984779B (zh) | 一种对话文本分析方法、装置、设备和可读介质 | |
CN106878632B (zh) | 一种视频数据的处理方法和装置 | |
US20240212706A1 (en) | Audio data processing | |
CN111026843A (zh) | 一种人工智能语音外呼方法、系统及存储介质 | |
CN111739537B (zh) | 语义识别方法、装置、存储介质及处理器 | |
JP7567028B2 (ja) | ターゲットビデオを生成するための方法、装置、サーバ及び媒体 | |
CN115665325A (zh) | 一种智能外呼的方法、装置、电子设备及存储介质 | |
CN112800269A (zh) | 会议记录的生成方法及装置 | |
CN114022955A (zh) | 一种动作识别方法及装置 | |
CN110047473B (zh) | 一种人机协作交互方法及系统 | |
CN116521821A (zh) | 文本语义匹配方法及制冷设备系统 | |
CN108597522B (zh) | 一种语音处理方法及装置 | |
CN113989924A (zh) | 一种暴力行为的预警方法及装置 | |
CN118114679A (zh) | 服务对话质量管控方法、系统、电子设备及存储介质 | |
CN113963440A (zh) | 一种客户购买意愿分析方法及装置 | |
CN114022954A (zh) | 一种服务标准化方法及装置 | |
CN116860938A (zh) | 一种基于大语言模型的语音问答构建方法、装置及介质 | |
CN111354350A (zh) | 语音处理方法及装置、语音处理设备、电子设备 | |
CN115759048A (zh) | 一种剧本文本处理方法及装置 | |
KR20230103887A (ko) | 광고 적합 콘텐츠 탐색 시스템 및 방법 | |
Hukkeri et al. | Erratic navigation in lecture videos using hybrid text based index point generation | |
CN113704541A (zh) | 训练数据的获取、视频推送方法、装置、介质及电子设备 | |
CN112287104A (zh) | 一种自然语言处理方法和装置 | |
CN112632241A (zh) | 智能会话的方法、装置、设备和计算机可读介质 | |
CN113221533B (zh) | 一种针对体验声音的标签提取方法、装置以及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |