CN111522943A - 逻辑节点的自动化测试方法、装置、设备及存储介质 - Google Patents
逻辑节点的自动化测试方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111522943A CN111522943A CN202010216976.8A CN202010216976A CN111522943A CN 111522943 A CN111522943 A CN 111522943A CN 202010216976 A CN202010216976 A CN 202010216976A CN 111522943 A CN111522943 A CN 111522943A
- Authority
- CN
- China
- Prior art keywords
- scene
- word vector
- test
- voice
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010998 test method Methods 0.000 title abstract description 6
- 238000012360 testing method Methods 0.000 claims abstract description 198
- 238000000034 method Methods 0.000 claims abstract description 32
- 239000013598 vector Substances 0.000 claims description 121
- 238000006243 chemical reaction Methods 0.000 claims description 42
- 238000012549 training Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 4
- 239000004576 sand Substances 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims 1
- 238000013473 artificial intelligence Methods 0.000 abstract description 9
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000001172 regenerating effect Effects 0.000 description 4
- 230000004913 activation Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/527—Centralised call answering arrangements not requiring operator intervention
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0631—Creating reference templates; Clustering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种人工智能技术,揭露了一种逻辑节点的自动化测试方法,包括:接收原始语音对话集,对所述原始语音对话集按照应用场景进行逻辑分类,得场景语音对话集;根据所述场景语音对话集中应用场景的不同,将所述场景语音对话集中的各场景语音对话归类存储到预设文档;获取逻辑节点的应用场景测试的标准测试文本;利用预设的调用方法调用所述预设文档中的场景语音对话集,并将所述标准测试文本输入到所述场景语音对话集,对所述场景语音对话集进行逻辑节点的应用场景测试,得到测试结果。本发明还提出一种逻辑节点的自动化测试装置、电子设备以及一种计算机可读存储介质。本发明可以解决逻辑节点测试慢,消耗大量人力资本的问题。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种逻辑节点的自动化测试方法、装置、电子设备及计算机可读存储介质。
背景技术
随着大数据及人工智能的兴起,利用AI机器人进行电话销售已经越来越普及,AI机器人对于语义分析,逻辑处理的要求越来越高,随着支持的场景越来越复杂,人工对语音对话中的逻辑进行测试也越来越难。
目前逻辑节点的测试方法是人工打电话听录音,用户实际进行回答,反复对各种对话的应用场景中的逻辑用不同语句进行测试,来检测机器人响应是否正确,此方法耗时长且占用大量人力资源,且在测试过程中,缺少对测试结果和真实结果的对比判断,进而导致很大可能影响到对后续测试结果的利用。
发明内容
本发明提供一种逻辑节点的自动化测试方法、装置、电子设备及计算机可读存储介质,其主要目的在于解决逻辑节点测试方法复杂并占用大量人力资源的问题。
接收原始语音对话集,对所述原始语音对话集内的原始语音对话按照应用场景进行逻辑分类,得到一组或多组场景语音对话集;
根据所述场景语音对话集中应用场景的不同,将所述场景语音对话集中的各场景语音对话归类存储到预设文档;
获取逻辑节点的应用场景测试的标准测试文本;
调用所述预设文档中的场景语音对话集,并将所述标准测试文本输入到所述场景语音对话集,对所述场景语音对话集进行逻辑节点的应用场景测试,得到测试结果。
可选地,所述获取逻辑节点的应用场景测试的标准测试文本,包括:
构建一个词向量转化模型,并对所述词向量转化模型进行训练;
利用训练后的词向量转化模型将标准测试语音对话集转化为词向量集;
输出所述词向量集,得到所述标准测试文本。
可选地,所述对预设的词向量转化模型进行训练,包括:
步骤A:随机生成训练语音对话集,以及所述训练语音对话集对应的标准词向量集;
步骤B:利用所述词向量转化模型对所述训练语音对话集进行转化,得到转化词向量集;
步骤C:将所述转化词向量集和所述标准词向量集进行对比判断,若所述转化词向量集和所述标准词向量集存在差异,则调整所述词向量转化模型的参数后返回步骤B继续执行词向量集的转化。
步骤D:若所述转化词向量集和所述标准词向量集不存在差异,则完成所述训练,生成训练后的词向量转化模型。
可选地,所述将所述转化词向量集和所述标准词向量集进行对比判断,包括:
用下述公式进行所述转化词向量集和所述标准词向量集的相似度的相似度计算:
Simtopic=Pearson(TPS,TPT)
其中,Simtopic为所述转化词向量集和所述标准词向量集的相似度;TPT为所述转化词向量集,TPS为所述标准词向量集。
若上述得到的计算结果小于或等于预设的相似度阈值,则认为转化词向量集与标准词向量集存在差异,调整所述词向量转化模型的参数,重新进行转化。若上述得到的计算结果大于预设的相似度阈值,则认为转化词向量集与标准词向量集不存在差异,将所述词向量集输出,得到所述标准测试文本。
可选地,所述对所述场景语音对话集进行逻辑节点的应用场景测试之前,该方法还包括步骤:设置场景语音对话集的准入原则,该步骤包括:
计算所述场景语音对话集中每个场景语音对话集的准入值ti:
ti=Pi+di+Ai+Ti;
其中,Pi表示场景语音对话集的队列优先级;di表示场景语音对话集的绝对截止期限;Ai为场景语音对集话的提交时间;Ti为场景语音对话集的周期;
若所述ti小于或等于一个准入阈值X,则拒绝所述场景语音对话集共同进行测试;
若所述ti大于所述准入阈值X,则对所述场景语音对话集共同进行测试。
可选地,所述准入阈值X通过下述函数计算得到:
其中,i为所述场景语音对话集中场景语音对话的个数,ti为所述场景语音对话集。
可选地,该方法还包括将所述测试结果与真实结果进行对比,得到对比结果:
对于所述测试结果X和真实结果Y,利用下列式子进行计算:
其中n是相应回答的个数,Xi是每个测试结果,Yi是每个真实结果。
根据所述对比结果显示出所述真实结果和测试结果的差异来对逻辑节点对测试方案进行调整完善。
为了解决上述问题,本发明还提供一种逻辑节点的自动化测试装置,所述装置包括:
逻辑分类模块,用于接收原始语音对话集,对所述原始语音对话集内的原始语音对话按照应用场景进行逻辑分类,得到一组或多组场景语音对话集;
存储模块,用于根据所述场景语音对话集中应用场景的不同,将所述场景语音对话集中的各场景语音对话归类存储到预设文档;
测试文本获取模块,用于获取逻辑节点的应用场景测试的标准测试文本;
逻辑节点测试模块,用于调用所述预设文档中的场景语音对话集,并将所述标准测试文本输入到所述场景语音对话集,对所述场景语音对话集进行逻辑节点的应用场景测试,得到测试结果。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现上述中任意一项所述的逻辑节点的自动化测试方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述中任意一项所述的逻辑节点的自动化测试方法。
本发明综合来说,根据所述场景语音对话集中应用场景的不同,将所述场景语音对话集中的各场景语音对话归类存储到预设文档,方便后续直接对所述场景语音对话集的定向调用;获取逻辑节点的应用场景测试的标准测试文本,实现了利用统一标准来进行测试,使测试结果具有可比性;利用预设的调用方法调用所述预设文档中的场景语音对话集,并将所述标准测试文本输入到所述场景语音对话集,对所述场景语音对话集进行逻辑节点的应用场景测试,得到测试结果,实现了自动化的测试,节省了时间成本,减少了人力资源的浪费。
附图说明
图1为本发明一实施例提供的逻辑节点的自动化测试方法的流程示意图;
图2为本发明一实施例提供的逻辑节点的自动化测试方法的模块示意图
图3为本发明一实施例提供的逻辑节点的自动化测试方法的电子设备的内部结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种逻辑节点的自动化测试方法。参照图1所示,为本发明一实施例提供的逻辑节点的自动化测试方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,所述逻辑节点的自动化测试方法包括:
S1、接收原始语音对话集,对所述原始语音对话集内的原始语音对话按照应用场景进行逻辑分类,得到一组或多组场景语音对话集。
在本案的较佳实施例中,所述原始语音对话集可以包括AI(ArtificialIntelligence,人工智能)机器人进行电话销售时的语音对话。
详细地,本发明实施例中,所述对所述原始语音对话集按照应用场景进行逻辑分类,可以分成逻辑肯定场景及逻辑否定场景。
例如,所述应用场景可以包括向用户推荐新产品的场景,向用户提供售后服务的场景等。当应用场景中的对话最终得到的是肯定结果,如用户接收了新产品的推荐或用户同意了某份协议,则将所述应用场景划分为逻辑肯定场景;当应用场景中的对话最终得到的是否定结果,如用户拒绝了新产品的推荐或用户否定了某项意见,则将所述应用场景划分为逻辑否定场景。
S2、根据所述场景语音对话集中应用场景的不同,将所述场景语音对话集中的各场景语音对话归类存储到预设文档。
较佳地,本发明实施例中所述将所述场景语音对话集中的各场景语音对话归类存储到预设文档,包括:
对所述场景语音对话集中的各场景语音对话按照逻辑上应用场景的不同,归类存储到相同预设文档的不同位置或者不同的预设文档中。如存储到excel的不同表格中,通过表格对所述场景语音对话集进行管理。其中excel中的不同表格的组成需要覆盖的不同应用场景,以方便进行逻辑节点的应用场景测试时调用。
S3、获取逻辑节点的应用场景测试的标准测试文本。
详细地,本发明实施例中,所述可由用户输入的用于进行逻辑节点的应用场景测试的标准测试语音对话集中提取得到所述标准测试文本。
详细地,所述获取逻辑节点的应用场景测试的标准测试文本包括:
构建一个词向量转化模型,并对所述词向量转化模型进行训练;
利用训练后的词向量转化模型将所述标准测试语音对话集转化为词向量集。
本发明实施例中所述词向量转化模型可以是CBOW(Continouns bags of words,连续词袋模型)模型,所述CBOW模型是一个具有特征提取功能的卷积神经网络。
进一步地,本发明实施例中所述对所述词向量转化模型进行训练,包括:
步骤A:随机生成训练语音对话集,以及所述训练语音对话集对应的标准词向量集;
步骤B:利用所述词向量转化模型对所述训练语音对话集进行转化,得到转化词向量集;
步骤C:将所述转化词向量集和所述标准词向量集进行对比判断,若所述转化词向量集和所述标准词向量集存在差异,则调整所述词向量转化模型的参数后返回步骤B继续执行词向量集的转化。
步骤D:若所述转化词向量集和所述标准词向量集不存在差异,则完成所述训练,生成训练后的词向量转化模型。
进一步地,在本发明实施例对所述转化词向量集和所述标准词向量集采用sigmoid函数进行相似度计算,得到计算结果:
Simtopic=Pearson(TPS,TPT)
其中TPT为所述转化词向量集,TPS为所述标准词向量集。
所述sigmoid函数也叫Logistic函数,常被用作卷积神经网络的激活函数,取值范围为(0,1)。本发明利用sigmoid函数将上述计算结果限制在[0,1]区间内。
进一步地,本发明实施例可以预设的相似度阈值为0.6。若上述得到的计算结果小于或等于0.6,则认为转化词向量集与标准词向量集存在差异,调整所述词向量转化模型的参数,重新进行转化。若上述得到的计算结果大于0.6,则认为转化词向量集与标准词向量集不存在差异,将所述转化词向量集输出,得到所述标准测试文本。
S4、利用预设的调用方法调用所述预设文档中的场景语音对话集,并将所述标准测试文本输入到所述场景语音对话集,对所述场景语音对话集进行逻辑节点的应用场景测试,得到测试结果。
进一步地,所述利用预设的调用方法调用所述预设文档中的场景语音对话可以包括通过调用预设excel文档,获取场景语音对话集。
详细地,本发明实施例中所述对所述场景语音对话集进行逻辑节点的应用场景测试,包括:
调用存储在所述预设文档中的场景语音对话集;
根据归类存储时所述场景语音对话集在所述预设文档中的位置确定所述场景语音对话集中的应用场景;
从所述标准测试文本中选择一个与所述应用场景像对应的转化词向量;
将所述标准文本中选择出的转化词向量输入至所述场景语音对话集中进行所述逻辑节点的应用场景测试,得到测试结果;
将所述测试结果与所述场景语音对话集中应用场景中的真实进行对比判断,若所述测试结果和所述真实结果不一致,则重新生成所述标准测试文本进行测试;
若所述测试结果和所述真实结果一致,则完成所述逻辑节点的应用场景测试。
例如,在所述场景语音对话集的应用场景中,若用户表达的是否定意见,此时可在所述标准测试文本中随机选取其中一个否定的转化词向量,如“不是”,输入至所述场景语音对话集进行所述逻辑节点的应用场景测试,得到测试结果;
若所述测试结果未表达否定意见,说明与所述场景语音对话集的应用场景中用户表达的意见不一致,则返回S3,重新生成所述标准测试文本进行测试
若所述测试结果表达否定意见,说明与所述场景语音对话集的应用场景中用户表达的意见一致,则完成所述逻辑节点的应用场景测试。
进一步地,为加快测试速度,在本发明较佳实施例可以通过设置场景语音对话集准入原则实现场景语音对话集的共同进行测试。
所述场景语音对话集准入原则是当新场景语音对话集i到来时候,设置如下场景语音对话集的准入原则:
计算所述场景语音对话集中每个场景语音对话集的准入值ti:
ti=Pi+du+Ai+Ti;
其中,Pi表示场景语音对话集的队列优先级;di表示场景语音对话集的绝对截止期限;Ai为场景语音对集话的提交时间;Ti为场景语音对话集的周期;
若所述ti小于或等于一个准入阈值X,则拒绝所述场景语音对话集共同进行测试;
若所述ti大于所述准入阈值X,则对所述场景语音对话集共同进行测试。
进一步地,所述对所述场景语音对话集进行逻辑节点的应用场景测试,得到测试结果之后,本发明实施例还包括将所述测试结果进行输出并将所述测试结果与真实结果进行对比,得到对比结果。
进一步地,所述准入阈值X可通过下述函数计算得到:
其中,i为所述场景语音对话集中场景语音对话的个数,ti为所述场景语音对话集。
较佳地,本发明实施例使用测试比对模型对测试中得到的测试结果与真实结果进行比对。
所述真实结果是所述场景语音对话集中原本的逻辑。
进一步地,所述测试比对模型是用向量空间中两个向量夹角的余弦值作为衡量两个向量间差异大小的度量,余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似。
详细地,对于所述得到的测试结果X和真实结果Y,本发明实施例利用下列公式进行计算:
其中n是相应回答的个数,Xi是每个测试结果,Yi是每个真实结果。
上述公式产生的相似性范围[-1,1]:-1表示两个向量指向的方向正好截然相反,1表示它们的指向是完全相同的,0表示它们之间是独立的;而在这之间的值则表示中度的相似性或相异性。
详细地,对所述测试结果和实际结果进行比对,显示出真实结果和测试结果的差异,方便对所述逻辑节点的测试方法进行后续改善。
如图2所示,是本发明逻辑节点的自动化测试装置的功能模块图。
本发明所述逻辑节点的自动化测试装置100可以安装于电子设备中。根据实现的功能,所述逻辑节点的自动化测试装置可以包括逻辑分类模块101、存储模块102、测试文本获取模块103和逻辑节点测试模块104。本发所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
逻辑分类模块101,用于接收原始语音对话集,对所述原始语音对话集内的原始语音对话按照应用场景进行逻辑分类,得到一组或多组场景语音对话集;
存储模块102,用于根据所述场景语音对话集中应用场景的不同,将所述场景语音对话集中的各场景语音对话归类存储到预设文档;
测试文本获取模块103,用于获取逻辑节点的应用场景测试的标准测试文本;
逻辑节点测试模块104,用于调用所述预设文档中的场景语音对话集,并将所述标准测试文本输入到所述场景语音对话集,对所述场景语音对话集进行逻辑节点的应用场景测试,得到测试结果。
详细地,所述逻辑节点的自动化测试装置各模块的具体实施步骤如下:
逻辑分类模块101,用于接收原始语音对话集,对所述原始语音对话集内的原始语音对话按照应用场景进行逻辑分类,得到一组或多组场景语音对话集。
在本案的较佳实施例中,所述原始语音对话集可以包括AI(ArtificialIntelligence,人工智能)机器人进行电话销售时的语音对话。
详细地,本发明实施例中,所述对所述原始语音对话集按照应用场景进行逻辑分类,可以分成逻辑肯定场景及逻辑否定场景。
例如,所述应用场景可以包括向用户推荐新产品的场景,向用户提供售后服务的场景等。当应用场景中的对话最终得到的是肯定结果,如用户接收了新产品的推荐或用户同意了某份协议,则将所述应用场景划分为逻辑肯定场景;当应用场景中的对话最终得到的是否定结果,如用户拒绝了新产品的推荐或用户否定了某项意见,则将所述应用场景划分为逻辑否定场景。
存储模块102、根据所述场景语音对话集中应用场景的不同,将所述场景语音对话集中的各场景语音对话归类存储到预设文档。
较佳地,本发明实施例中所述将所述场景语音对话集中的各场景语音对话归类存储到预设文档,包括:
对所述场景语音对话集中的各场景语音对话按照逻辑上应用场景的不同,归类存储到相同预设文档的不同位置或者不同的预设文档中。如存储到excel的不同表格中,通过表格对所述场景语音对话集进行管理。其中excel中的不同表格的组成需要覆盖的不同应用场景,以方便进行逻辑节点的应用场景测试时调用。
测试文本获取模块103、获取逻辑节点的应用场景测试的标准测试文本。
详细地,本发明实施例中,所述可由用户输入的用于进行逻辑节点的应用场景测试的标准测试语音对话集中提取得到所述标准测试文本。
详细地,所述获取逻辑节点的应用场景测试的标准测试文本包括:
构建一个词向量转化模型,并对所述词向量转化模型进行训练;
利用训练后的词向量转化模型将所述标准测试语音对话集转化为词向量集。
本发明实施例中所述词向量转化模型可以是CBOW(Continouns bags of words,连续词袋模型)模型,所述CBOW模型是一个具有特征提取功能的卷积神经网络。
进一步地,本发明实施例中所述对所述词向量转化模型进行训练,包括:
步骤A:随机生成训练语音对话集,以及所述训练语音对话集对应的标准词向量集;
步骤B:利用所述词向量转化模型对所述训练语音对话集进行转化,得到转化词向量集;
步骤C:将所述转化词向量集和所述标准词向量集进行对比判断,若所述转化词向量集和所述标准词向量集存在差异,则调整所述词向量转化模型的参数后返回步骤B继续执行词向量集的转化。
步骤D:若所述转化词向量集和所述标准词向量集不存在差异,则完成所述训练,生成训练后的词向量转化模型。
进一步地,在本发明实施例对所述转化词向量集和所述标准词向量集采用sigmoid函数进行相似度计算,得到计算结果:
Simtopic=Pearson(TPS,TPT)
其中TPT为所述转化词向量集,TPS为所述标准词向量集。
所述sigmoid函数也叫Logistic函数,常被用作卷积神经网络的激活函数,取值范围为(0,1)。本发明利用sigmoid函数将上述计算结果限制在[0,1]区间内。
进一步地,本发明实施例可以预设的相似度阈值为0.6。若上述得到的计算结果小于或等于0.6,则认为转化词向量集与标准词向量集存在差异,调整所述词向量转化模型的参数,重新进行转化。若上述得到的计算结果大于0.6,则认为转化词向量集与标准词向量集不存在差异,将所述转化词向量集输出,得到所述标准测试文本。
逻辑节点测试模块104、利用预设的调用方法调用所述预设文档中的场景语音对话集,并将所述标准测试文本输入到所述场景语音对话集,对所述场景语音对话集进行逻辑节点的应用场景测试,得到测试结果。
进一步地,所述利用预设的调用方法调用所述预设文档中的场景语音对话可以包括通过调用预设excel文档,获取场景语音对话集。
详细地,本发明实施例中所述对所述场景语音对话集进行逻辑节点的应用场景测试,包括:
调用存储在所述预设文档中的场景语音对话集;
根据归类存储时所述场景语音对话集在所述预设文档中的位置确定所述场景语音对话集中的应用场景;
从所述标准测试文本中选择一个与所述应用场景像对应的转化词向量;
将所述标准文本中选择出的转化词向量输入至所述场景语音对话集中进行所述逻辑节点的应用场景测试,得到测试结果;
将所述测试结果与所述场景语音对话集中应用场景中的真实进行对比判断,若所述测试结果和所述真实结果不一致,则重新生成所述标准测试文本进行测试;
若所述测试结果和所述真实结果一致,则完成所述逻辑节点的应用场景测试。
例如,在所述场景语音对话集的应用场景中,若用户表达的是否定意见,此时可在所述标准测试文本中随机选取其中一个否定的转化词向量,如“不是”,输入至所述场景语音对话集进行所述逻辑节点的应用场景测试,得到测试结果;
若所述测试结果未表达否定意见,说明与所述场景语音对话集的应用场景中用户表达的意见不一致,则返回S3,重新生成所述标准测试文本进行测试
若所述测试结果表达否定意见,说明与所述场景语音对话集的应用场景中用户表达的意见一致,则完成所述逻辑节点的应用场景测试。
进一步地,为加快测试速度,在本发明较佳实施例可以通过设置场景语音对话集准入原则实现场景语音对话集的共同进行测试。
所述场景语音对话集准入原则是当新场景语音对话集i到来时候,设置如下场景语音对话集的准入原则:
计算所述场景语音对话集中每个场景语音对话集的准入值ti:
ti=Pi+di+Ai+Ti;
其中,Pi表示场景语音对话集的队列优先级;di表示场景语音对话集的绝对截止期限;Ai为场景语音对集话的提交时间;Ti为场景语音对话集的周期;
若所述ti小于或等于一个准入阈值X,则拒绝所述场景语音对话集共同进行测试;
若所述ti大于所述准入阈值X,则对所述场景语音对话集共同进行测试。
进一步地,所述对所述场景语音对话集进行逻辑节点的应用场景测试,得到测试结果之后,本发明实施例还包括将所述测试结果进行输出并将所述测试结果与真实结果进行对比,得到对比结果。
进一步地,所述准入阈值X可通过下述函数计算得到:
其中,i为所述场景语音对话集中场景语音对话的个数,ti为所述场景语音对话集。
较佳地,本发明实施例使用测试比对模型对测试中得到的测试结果与真实结果进行比对。
所述真实结果是所述场景语音对话集中原本的逻辑。
进一步地,所述测试比对模型是用向量空间中两个向量夹角的余弦值作为衡量两个向量间差异大小的度量,余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似。
详细地,对于所述得到的测试结果X和真实结果Y,本发明实施例利用下列公式进行计算:
其中n是相应回答的个数,Xi是每个测试结果,Yi是每个真实结果。
上述公式产生的相似性范围[-1,1]:-1表示两个向量指向的方向正好截然相反,1表示它们的指向是完全相同的,0表示它们之间是独立的;而在这之间的值则表示中度的相似性或相异性。
详细地,对所述测试结果和实际结果进行比对,显示出真实结果和测试结果的差异,方便对所述逻辑节点的测试方法进行后续改善。
如图3所示,是本发明实现逻辑节点的自动化测试方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如资源调度程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行资源调度程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的逻辑节点的自动化测试程序12是多个指令的组合,在所述处理器10中运行时,可以实现:
获取原始信息数据集,根据预先构建的假设计算方法,对所述原始信息数据集执行假设计算得到假设信息数据集。
将所述假设信息数据集存储到预先建立的假设数据库中。
利用预设的目标查询语句,从所述假设数据库中查询得到目标信息数据集,并生成所述目标信息数据集的查询日志和所述假设数据库的性能日志。
提取所述查询日志和所述性能日志内的关键字得到日志关键字集,对所述日志关键字集进行异常判断得到日志判断结果并输出所述日志判断内容。
根据所述日志判断内容,对所述目标信息数据集内的数据内容进行管理。
具体地,所述处理器10对上述指令的具体实现方法可参考图2对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种逻辑节点的自动化测试方法,其特征在于,所述方法包括:
接收原始语音对话集,对所述原始语音对话集内的原始语音对话按照应用场景进行逻辑分类,得到一组或多组场景语音对话集;
根据所述场景语音对话集中应用场景的不同,将所述场景语音对话集中的各场景语音对话归类存储到预设文档;
获取逻辑节点的应用场景测试的标准测试文本;
调用所述预设文档中的场景语音对话集,并将所述标准测试文本输入到所述场景语音对话集,对所述场景语音对话集进行逻辑节点的应用场景测试,得到测试结果。
2.如权利要求1所述的逻辑节点的自动化测试方法,其特征在于,所述获取逻辑节点的应用场景测试的标准测试文本,包括:
构建一个词向量转化模型,并对所述词向量转化模型进行训练;
利用训练后的词向量转化模型将标准测试语音对话集转化为词向量集;
输出所述词向量集,得到所述标准测试文本。
3.如权利要求2所述的逻辑节点的自动化测试方法,其特征在于,所述对预设的词向量转化模型进行训练,包括:
步骤A:随机生成训练语音对话集,以及所述训练语音对话集对应的标准词向量集;
步骤B:利用所述词向量转化模型对所述训练语音对话集进行转化,得到转化词向量集;
步骤C:将所述转化词向量集和所述标准词向量集进行对比判断,若所述转化词向量集和所述标准词向量集存在差异,则调整所述词向量转化模型的参数后返回步骤B继续执行词向量集的转化。
步骤D:若所述转化词向量集和所述标准词向量集不存在差异,则完成所述训练,生成训练后的词向量转化模型。
4.如权利要求3所述的逻辑节点的自动化测试方法,其特征在于,所述将所述转化词向量集和所述标准词向量集进行对比判断,包括:
用下述公式进行所述转化词向量集和所述标准词向量集的相似度的相似度计算:
Simtopic=Pearson(TPS,TPT)
其中,Simtopic为所述转化词向量集和所述标准词向量集的相似度;TPT为所述转化词向量集,TPS为所述标准词向量集。
若上述得到的计算结果小于或等于预设的相似度阈值,则认为转化词向量集与标准词向量集存在差异,调整所述词向量转化模型的参数,重新进行转化。若上述得到的计算结果大于预设的相似度阈值,则认为转化词向量集与标准词向量集不存在差异,将所述词向量集输出,得到所述标准测试文本。
5.如权利要求1所述的逻辑节点的自动化测试方法,其特征在于,所述对所述场景语音对话集进行逻辑节点的应用场景测试之前,该方法还包括步骤:设置场景语音对话集的准入原则,该步骤包括:
计算所述场景语音对话集中每个场景语音对话集的准入值ti:
ti=Pi+di+Ai+Ti;
其中,Pi表示场景语音对话集的队列优先级;di表示场景语音对话集的绝对截止期限;Ai为场景语音对集话的提交时间;Ti为场景语音对话集的周期;
若所述ti小于或等于一个准入阈值X,则拒绝所述场景语音对话集共同进行测试;
若所述ti大于所述准入阈值X,则对所述场景语音对话集共同进行测试。
8.一种逻辑节点的自动化测试装置,其特征在于,所述装置包括:
逻辑分类模块,用于接收原始语音对话集,对所述原始语音对话集内的原始语音对话按照应用场景进行逻辑分类,得到一组或多组场景语音对话集;
存储模块,用于根据所述场景语音对话集中应用场景的不同,将所述场景语音对话集中的各场景语音对话归类存储到预设文档;
测试文本获取模块,用于获取逻辑节点的应用场景测试的标准测试文本;
逻辑节点测试模块,用于利用预设的调用方法调用所述预设文档中的场景语音对话集,并将所述标准测试文本输入到所述场景语音对话集,对所述场景语音对话集进行逻辑节点的应用场景测试,得到测试结果。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一所述的逻辑节点的自动化测试方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一所述的逻辑节点的自动化测试方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010216976.8A CN111522943A (zh) | 2020-03-25 | 2020-03-25 | 逻辑节点的自动化测试方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010216976.8A CN111522943A (zh) | 2020-03-25 | 2020-03-25 | 逻辑节点的自动化测试方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111522943A true CN111522943A (zh) | 2020-08-11 |
Family
ID=71901310
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010216976.8A Pending CN111522943A (zh) | 2020-03-25 | 2020-03-25 | 逻辑节点的自动化测试方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111522943A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112417109A (zh) * | 2020-10-26 | 2021-02-26 | 出门问问(苏州)信息科技有限公司 | 一种人机对话系统的测试方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109933477A (zh) * | 2019-03-25 | 2019-06-25 | 北京六行君通信息科技股份有限公司 | 验证自动应答电话机器人应答话术逻辑匹配准确性的装置 |
CN110010121A (zh) * | 2019-03-08 | 2019-07-12 | 平安科技(深圳)有限公司 | 验证应答话术的方法、装置、计算机设备和存储介质 |
CN110287283A (zh) * | 2019-05-22 | 2019-09-27 | 中国平安财产保险股份有限公司 | 意图模型训练方法、意图识别方法、装置、设备及介质 |
CN110556098A (zh) * | 2019-07-23 | 2019-12-10 | 平安科技(深圳)有限公司 | 语音识别结果测试方法、装置、计算机设备和介质 |
-
2020
- 2020-03-25 CN CN202010216976.8A patent/CN111522943A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110010121A (zh) * | 2019-03-08 | 2019-07-12 | 平安科技(深圳)有限公司 | 验证应答话术的方法、装置、计算机设备和存储介质 |
CN109933477A (zh) * | 2019-03-25 | 2019-06-25 | 北京六行君通信息科技股份有限公司 | 验证自动应答电话机器人应答话术逻辑匹配准确性的装置 |
CN110287283A (zh) * | 2019-05-22 | 2019-09-27 | 中国平安财产保险股份有限公司 | 意图模型训练方法、意图识别方法、装置、设备及介质 |
CN110556098A (zh) * | 2019-07-23 | 2019-12-10 | 平安科技(深圳)有限公司 | 语音识别结果测试方法、装置、计算机设备和介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112417109A (zh) * | 2020-10-26 | 2021-02-26 | 出门问问(苏州)信息科技有限公司 | 一种人机对话系统的测试方法及装置 |
CN112417109B (zh) * | 2020-10-26 | 2023-08-01 | 问问智能信息科技有限公司 | 一种人机对话系统的测试方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109299344A (zh) | 排序模型的生成方法、搜索结果的排序方法、装置及设备 | |
CN112733042B (zh) | 推荐信息的生成方法、相关装置及计算机程序产品 | |
CN111639153A (zh) | 基于法律知识图谱的查询方法、装置、电子设备及介质 | |
CN112992187B (zh) | 基于上下文的语音情感检测方法、装置、设备及存储介质 | |
CN112560453A (zh) | 语音信息校验方法、装置、电子设备及介质 | |
CN111901627B (zh) | 视频处理方法、装置、存储介质及电子设备 | |
CN112559687A (zh) | 问题识别及查询方法、装置、电子设备及存储介质 | |
CN113064994A (zh) | 会议质量评估方法、装置、设备及存储介质 | |
CN111835926A (zh) | 基于语音交互的智能语音外呼方法、装置、设备及介质 | |
CN112951233A (zh) | 语音问答方法、装置、电子设备及可读存储介质 | |
CN113435582A (zh) | 基于句向量预训练模型的文本处理方法及相关设备 | |
CN114880449A (zh) | 智能问答的答复生成方法、装置、电子设备及存储介质 | |
CN114639152A (zh) | 基于人脸识别的多模态语音交互方法、装置、设备及介质 | |
CN113869456A (zh) | 采样监测方法、装置、电子设备及存储介质 | |
CN111522943A (zh) | 逻辑节点的自动化测试方法、装置、设备及存储介质 | |
CN112632260A (zh) | 智能问答方法、装置、电子设备及计算机可读存储介质 | |
CN113011164A (zh) | 数据质量检测方法、装置、电子设备及介质 | |
CN113205814A (zh) | 语音数据标注方法、装置、电子设备及存储介质 | |
CN112214602A (zh) | 基于幽默度的文本分类方法、装置、电子设备及存储介质 | |
CN112632264A (zh) | 智能问答方法、装置、电子设备及存储介质 | |
CN109766089B (zh) | 基于动图的代码生成方法、装置、电子设备及存储介质 | |
CN111522707A (zh) | 大数据平台调度预警方法、装置及计算机可读存储介质 | |
CN116820714A (zh) | 一种算力设备的调度方法、装置、设备和存储介质 | |
CN114548114A (zh) | 文本情绪识别方法、装置、设备及存储介质 | |
CN113888265A (zh) | 产品推荐方法、装置、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |