CN117473069B - 业务语料生成方法、装置、设备及计算机可读存储介质 - Google Patents
业务语料生成方法、装置、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN117473069B CN117473069B CN202311804167.9A CN202311804167A CN117473069B CN 117473069 B CN117473069 B CN 117473069B CN 202311804167 A CN202311804167 A CN 202311804167A CN 117473069 B CN117473069 B CN 117473069B
- Authority
- CN
- China
- Prior art keywords
- corpus
- business
- query
- natural
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 239000013598 vector Substances 0.000 claims abstract description 94
- 230000009469 supplementation Effects 0.000 claims description 6
- 230000004048 modification Effects 0.000 claims description 2
- 238000012986 modification Methods 0.000 claims description 2
- 238000003058 natural language processing Methods 0.000 abstract description 5
- 238000004590 computer program Methods 0.000 description 14
- 230000003993 interaction Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 230000001502 supplementing effect Effects 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种业务语料生成方法、装置、设备及计算机可读存储介质,属于自然语言处理技术领域。本发明通过获取针对于目标业务输入的自然查询语料;根据所述自然查询语料的语料特征向量,确定对应的标准查询语料,其中,所述标准查询语料是指符合所述目标业务的查询标准的自然查询语料;根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料,解决了现有语音助手对自然语料意图的识别准确率低的技术问题。
Description
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种业务语料生成方法、装置、电子设备及计算机可读存储介质。
背景技术
随着计算机运算能力的提高,人工智能领域也得到飞速的发展,在日常生活出现了越来越多的语音助手应用于各行各业,便利了人们的生活和工作。
现有的语音助手主要支持语音、文本交互,一般用于执行指令和根据指令完成任务,在语音助手模型中存有设定的指令语言以及该指令对应的执行动作,因此,用户与语音助手进行对话只能通过固定的执行指令,当用户输入的自然语料不存在对应的执行指令时,由于语音交互系统对复杂信息的理解能力较差,语义理解处理度低,从而出现对自然语料的识别效果较差而导致执行命令响应错误的技术问题,因此,现有语音助手对自然语料意图的识别准确率低。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种业务语料生成方法、装置、电子设备及计算机可读存储介质,旨在解决现有语音助手对自然语料意图的识别准确率低的技术问题。
为实现上述目的,本发明提供一种业务语料生成方法,所述业务语料生成方法包括:
获取针对于目标业务输入的自然查询语料;
根据所述自然查询语料的语料特征向量,确定对应的标准查询语料,其中,所述标准查询语料是指符合所述目标业务的查询标准的自然查询语料;
根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料。
可选地,所述根据所述自然查询语料的语料特征向量,确定对应的标准查询语料的步骤包括:
将所述语料特征向量与预设语料集中的目标特征向量进行相似度比较,确定语料相似值;
根据所述语料相似值,在所述预设语料集中确定对应的标准查询语料。
可选地,所述根据所述自然查询语料的语料特征向量,确定对应的标准查询语料的步骤包括:
获取所述自然查询语料对应的业务类别;
根据所述业务类别,在所述预设语料集中确定至少一条所述业务类别下的标准查询语料;
根据所述语料特征向量,检测所述自然查询语料对应的标准查询语料。
可选地,所述根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料的步骤包括:
当所述语料相似值大于或者等于预设值时,在所述预设语料集中确定预设数量的标准查询语料;
根据所述标准查询语料,生成所述业务语料。
可选地,所述根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料的步骤包括:
当所述语料相似值大于或者等于预设值时,请求所述自然查询语料的上文语料信息和/或下文语料信息;
通过将所述自然查询语料、所述上文语料信息和/或所述下文语料信息进行组装,生成所述业务语料。
可选地,在所述根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料的步骤之后,所述业务语料生成方法还包括:
确定所述业务语料在各所述标准查询语料中的匹配占比;
将所述匹配占比与预设占比进行比较;
在所述匹配占比小于所述预设占比时,根据所述自然查询语料,对所述预设语料集进行语料补充。
可选地,在所述根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料的步骤之后,所述业务语料生成方法包括:
获取所述业务语料对应的业务内容;
根据针对于所述业务内容执行的调整操作,调整所述业务内容。
此外,为实现上述目的,本发明还提供一种业务语料生成装置,所述业务语料生成装置包括:
获取模块,用于获取针对于目标业务输入的自然查询语料;
确定模块,用于根据所述自然查询语料的语料特征向量,确定对应的标准查询语料,其中,所述标准查询语料是指符合所述目标业务的查询标准的自然查询语料;
生成模块,用于根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料。
可选地,所述确定模块还用于:
将所述语料特征向量与预设语料集中的目标特征向量进行相似度比较,确定语料相似值;
根据所述语料相似值,在所述预设语料集中确定对应的标准查询语料。可选地,所述确定模块还用于:
获取所述自然查询语料对应的业务类别;
根据所述业务类别,在所述预设语料集中确定至少一条所述业务类别下的标准查询语料;
根据所述语料特征向量,检测所述自然查询语料对应的标准查询语料。可选地,所述生成模块还用于:
当所述语料相似值大于或者等于预设值时,在所述预设语料集中确定预设数量的标准查询语料;
根据所述标准查询语料,生成所述业务语料。
可选地,所述生成模块还用于:
当所述语料相似值大于或者等于预设值时,请求所述自然查询语料的上文语料信息和/或下文语料信息;
通过将所述自然查询语料、所述上文语料信息和/或所述下文语料信息进行组装,生成所述业务语料。
可选地,所述业务语料生成装置还包括:
确定所述业务语料在各所述标准查询语料中的匹配占比;
将所述匹配占比与预设占比进行比较;
在所述匹配占比小于所述预设占比时,根据所述自然查询语料,对所述预设语料集进行语料补充。
可选地,所述业务语料生成装置还包括:
获取所述业务语料对应的业务内容;
根据针对于所述业务内容执行的调整操作,调整所述业务内容。
本申请还提供一种电子设备,所述电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的业务语料生成程序,所述业务语料生成程序配置为实现上述的业务语料生成方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有实现业务语料生成方法的程序,所述实现业务语料生成方法的程序被处理器执行以实现如上所述业务语料生成方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的业务语料生成方法的步骤。
本申请通过获取针对于目标业务输入的自然查询语料,根据自然查询语料的语料特征向量,检测该自然查询语料和预设语料集的匹配结果,根据匹配结果,在预设语料集中生成对应的业务语料,由此可以通过对自然语料信息进行识别,根据自然语料的语料特征向量匹配对应的业务信息,并能够适应各种复杂的应用场景,实现实时的目标业务匹配,提高了语音交互系统对复杂信息的理解能力,克服了对自然语料的识别效率低而导致语音交互系统效果差的技术问题,因此,对自然语料意图的识别准确率高。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例一业务语料生成方法提供的流程示意图;
图2为本申请实施例一业务语料生成方法提供的语料生成流程图;
图3为本申请实施例一业务语料生成方法提供的语料相似值示意图;
图4为本申请实施例一业务语料生成方法提供的匹配流程图;
图5为本申请实施例二业务语料生成方法提供的流程示意图;
图6为本申请实施例二业务语料生成方法提供的匹配时序图;
图7为本申请实施例三业务语料生成装置的模块结构示意图;
图8为本申请实施例四中业务语料生成方法涉及的硬件运行环境的设备结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例一
本申请提出第一实施例的业务语料生成方法,请参照图1,所述业务语料生成方法包括:
步骤S10,获取针对于目标业务输入的自然查询语料;
步骤S20,根据所述自然查询语料的语料特征向量,确定对应的标准查询语料,其中,所述标准查询语料是指符合所述目标业务的查询标准的自然查询语料;
步骤S30,根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料。
在本实施例中,需要说明的是,自然查询语料用于表示用户输入的自然语言信息,具体可以是语音信息、文本信息或图像信息,自然查询语料中含有用户的输入意图,标准查询语料用于表示预先训练过且存储在语音交互系统中的自然语料,语料特征向量用于表示自然查询语料的词向量和句向量等向量值,该向量值具体可以是embedding(嵌入)向量,其中,embedding表示将高维度的数据(例如文字、图片、音乐和视频等)映射到低维度空间,而embedding向量通常是一个由实数构成的向量,将输入的高维度数据用一个连续的数值空间中的点来表示,同时,embedding可以根据单词在语言上下文中的出现模式进行学习,从而表示单词或者语句的语义。
另外地,需要说明的是,语料相似值用于表示自然查询语料和标准查询语料所要表达的意图的相似程度,业务语料表示与目标业务相关的语料信息,可以由机器进行识别,具体地,语料相似值越大则自然查询语料和标准查询语料越相似,同时,由于标准查询语料对应有指令信息和意图内容,因此可以根据语料相似值,确定自然查询语料的所对应的业务语料。
示例性地,为了助于理解本申请的技术构思或技术原理,请参照图2,图2提供了一种语料生成流程图,当用户通过语音输入自然语言信息时,使用自动语音识别技术(Automatic Speech Recognition,ASR)或其他语音识别技术,将人的语音转换为文本,然后对文本信息进行预判和纠错改写等预处理操作,由自然语言理解(Natural LanguageUnderstanding,NLU)技术相关的大语言模型对文本信息进行语言理解,并进行意图判决,通过各种推荐策略和算法生成用户想要的反馈信息,该反馈信息可以经由自然语言生成(Natural Language Generation,NLG)所构成的话术平台生成对应的回复话术,再传递至人机互动界面,也可以直接根据反馈信息生成执行指令,以进行人机互动。
作为一种示例,步骤S10至步骤S30包括:将用户输入的自然语料信息作为自然查询语料并进行识别,通过获取自然语料的语料特征向量,确定存在与自然查询语料具有一定相似性的标准查询语料,根据标准查询语料对应业务语料,确定自然查询语料的目标业务。
本申请通过获取自然查询语料,其中,自然查询语料为用户输入的自然语言信息,然后将自然查询语料与预设语料集中的各标准查询语料进行相似度比较,确定语料相似值,并根据语料相似值,匹配自然查询语料的业务语料,由此可以通过对自然语料信息进行识别,匹配对应的意图信息,提高了语音交互系统对复杂信息的理解能力,克服了对自然语料的识别效率低而导致语音交互系统效果差的技术问题,因此,对自然语料意图的识别准确率高。
其中,所述根据所述自然查询语料的语料特征向量,确定对应的标准查询语料的步骤包括:
步骤A10,将所述语料特征向量与预设语料集中的目标特征向量进行相似度比较,确定语料相似值;
步骤A20,根据所述语料相似值,在所述预设语料集中确定对应的标准查询语料。
在本实施例中,需要说明的是,预设语料集用于表示由标准查询语料所组成的语料集合,具体可以包括语料文本、语料文本对应的指令、语料文本对应的embedding值和语料文本对应的业务标识(即,该条语料所属的业务类型),目标特征向量用于表示标准查询语句的词向量或句向量等向量值,语料相似值用于表示语料特征向量和目标特征向量之间的相似值,具体可以为语料特征向量和目标特征向量的余弦相似度,其中,取值范围在-1到1之间,具体地,当语料相似值接近1时,表示语料特征向量与目标特征向量这两个向量的方向非常接近,夹角接近于0度,即该自然查询语料与标准查询语料非常相似,当语料相似值与-1接近时,表示语料特征向量与目标特征向量这两个向量的方向相反,夹角接近于180度,即该自然查询语料与标准查询语料非常不相似;当语料相似值接近0时,表示语料特征向量与目标特征向量这两个向量之间的方向近似正交,夹角接近于90度,即该自然查询语料与标准查询语料的相似性较低或不存在相似性。
在一种可能的实施方式中,语料相似值具体可以通过计算语料特征向量与目标特征向量之间的余弦相似度得到,其中,余弦相似度(Cosine Similarity)是一种用于比较两个向量之间相似性的度量方法,通过计算两个向量的夹角余弦值来评估这两个向量的相似度,在自然语言处理(Natural Language Processing,NLP)和信息检索领域中经常使用余弦相似度来计算文本之间的相似度。
示例性地,为了助于理解本申请的技术构思或技术原理,请参照图3,图3提供了一种语料相似值示意图,在一种可能的实施方式中,假设预设语料集里面存有两句标准查询语料,其中,标准查询语料1为:帮我查找客户,对应指令为 filterCustomer,生成的embedding值映射到向量空间上是向量d1;标准查询语料2为:帮我跟进客户,对应指令为followUp,生成的embedding值映射到向量空间上是向量d2;用户输入的自然查询语料为:帮我查找昨日跟进的客户,生成的embedding值映射到向量空间上是向量q。为了识别自然查询语料与标准查询语料1和标准查询语料2的相似程度,可以通过分别计算自然查询语料对应的向量q 和标准查询语料对应向量夹角的余弦值进行判断,由于两个向量的夹角越小,余弦值越大,余弦相似度越高,由图3可知,向量q和向量d1的夹角是α,向量q和向量d2的夹角θ,由于α<θ,那么cosα>cosθ,也就是向量d1更靠近向量q(d1和q的余弦相似度更高),所以标准查询语料1与用户输入的描述更相似。
作为一种示例,步骤A10至步骤A20包括:通过计算语料特征向量和预设语料集中目标特征向量的语料相似值,使得标准查询语句可以和自然查询语句相匹配,从而确定自然查询语料对应的标准查询语料。
其中,所述根据所述自然查询语料的语料特征向量,确定对应的标准查询语料的步骤包括:
步骤B10,获取所述自然查询语料对应的业务类别;
步骤B20,根据所述业务类别,在所述预设语料集中确定至少一条所述业务类别下的标准查询语料;
步骤B30,根据所述语料特征向量,检测所述自然查询语料对应的标准查询语料。
在本实施例中,需要说明的是,业务类别用于表示自然查询语料所对应的业务种类,具体可以包括面向不同行业或同一行业不同部门等业务类型,在生成预设语料集之前,还会对标准查询语料按照业务类别进行分类,由此,可以通过先对自然查询语料的业务类别进行确定,直接在该业务类别下匹配对应的标准查询语料,另外地,不同语料所对应的embedding值不同,因此,需要将语料特征向量和各目标特征向量进行相似度比较,以在预设语料集中确定自然查询语料的业务语料,例如可以通过计算两个向量之间的余弦相似度或两个向量之间的相关系数以确定语料相似值。
作为一种示例,步骤B10至步骤B30包括:确定自然查询语料所属的业务类别,并在预设语料集中选取与该业务类别一致的语料,然后根据语料特征向量和各目标特征向量的相似情况,计算相应的语料相似值。
其中,所述根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料的步骤包括:
步骤C10,当所述语料相似值大于或者等于预设值时,在所述预设语料集中确定预设数量的标准查询语料;
步骤C20,根据所述标准查询语料,生成所述业务语料。
在本实施例中,需要说明的是,预设数量的标准查询语料具体可以是5个、10个或15个等,标准查询语料表示由与自然查询语料所表示的意图相似度较高的标准查询语料所组成的合集,在获得语料相似值后,还可以对各标准查询语料按照语料相似值从大到小进行排序,并按照排序结果,从高到低选择预设数量的标准查询语料,并将被选择的标准查询语料组成意图比对集,具体地,可以将语料相似值按照从大到小进行排序,选取排在前十位的语料相似值对应的标准查询语料,然后将被选取的标准查询语料进行组合以补充至预设大语言模型中。
作为一种示例,步骤C10至步骤C20包括:获取匹配结果,当匹配结果为匹配成功时,在预设语料集中选择出语料相似值大于或等于预设值的一个或多个标准查询语料,从而将选取得到的标准查询语料作为业务语料。
其中,所述根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料的步骤包括:
步骤D10,当所述语料相似值大于或者等于预设值时,请求所述自然查询语料的上文语料信息和/或下文语料信息;
步骤D20,通过将所述自然查询语料、所述上文语料信息和/或所述下文语料信息进行组装,生成所述业务语料。
在本实施例中,需要说明的是,上文语料信息和下文语料信息分别用于表示用户在当前自然查询语料之前和之后所发送的自然语料信息,在对自然查询语料进行业务语料生成时,还需要对自然查询语料的上下文语料信息进行判断,若存在上文语料信息和/或下文语料信息,则需要根据语料相似值的匹配结果、上下文语料信息内容以及预设语义格式,确定自然查询语料的业务语料,若不存在上文语料信息和/或下文语料信息,则可以直接根据语料相似值匹配自然查询语料的业务语料。
在一种可能的实施方式中,若用户的当前聊天存在聊天上下文时,则需要按照预设的格式构造上下文内容,确定上下文的语料意图,并与用户最新发送的自然语料信息进行拼接,组合成需要进行业务语料生成的自然查询语料,然后根据预设大语言模型,匹配自然查询语料的业务语料。
示例性地,为了助于理解本申请的技术构思或技术原理,请参照图4,图4提供了一种匹配流程图,首先通过获取当前会话上下文和对应指令以及用户输入的自然语言内容,并根据用户输入内容,筛选出Top10的语料和指令,由openai对语料和指令进行处理,以此对用户输入文本进行解析,若解析成功,则可以直接返回动作对应的指令,若解析失败,则判断当前会话上下文是否为空,若是,则继续判断用户输入内容是否与当前会话上下文有关联,若是,则返回当前会话上下文对应的指令,若当前上下文为空或用户输入内容与当前会话上下文无关联,则根据其他规则,结合top10语料指令进行匹配,返回匹配到的指令。
作为一种示例,步骤D10至步骤D20包括:对自然查询语料的上文语料信息和/或下文语料信息进行检测,若存在上下文语料信息,则需要判断该带识别语料与上下文语料信息是否相关,并将语料相似值、上文语料信息和/或下文语料信息进行组合,从而对自然查询语料的业务语料以匹配,若不存在上下文语料信息,则需要根据语料相似值,匹配自然查询语料的业务语料。
实施例二
基于本申请第一实施例,在本申请另一实施例中,与上述实施例一相同或相似的内容,可以参考上文介绍,后续不再赘述。在此基础上,请参照图5,在所述根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料的步骤之后,所述业务语料生成方法包括:
其中,在所述根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料的步骤之后,所述业务语料生成方法包括:
步骤E10,确定所述业务语料在各所述标准查询语料中的匹配占比;
步骤E20,将所述匹配占比与预设占比进行比较;
步骤E30,在所述匹配占比小于所述预设占比时,根据所述自然查询语料,对所述预设语料集进行语料补充。
在本实施例中,需要说明的是,匹配占比用于表示在标准查询语料所得到的业务语料中,与预设意图一致的比率,预设占比用于表示在生成的业务语料中,与预设意图相一致的预期比率,具体地,在得到Top10的标准查询语料后,还可以对预设意图在业务语料中的匹配占比进行求解,若匹配占比大于或者等于预设占比,则确定本次Top10语料的匹配中,准确性较好,可以选择性地补充语料;若匹配占比小于预设占比,则确定预设语料集不存在足够丰富的语料来支持当前用户输入文本的目标指令匹配,并需要补充与本次用户输入的自然语言类似的语料。
另外地,需要说明的是,业务语料生成的准确性还可以通过人为介入周期性观察,以判断自然查询语料与业务语料是否一致,具体地,可以通过定期查询自然查询语料和业务语料结果生成的表格信息,观察用户输入内容与匹配到的业务语料是否合理,在匹配不合理时,针对用户输入的自然语料信息,对预设语料集进行语料补充。
作为一种示例,在一种可能的实施方式中,用户输入的自然查询语料为“帮我打开张三详情页”,对应的预设意图为filterCustomer,预设意图在Top10语料指令中的预设占比为60%。假设筛选到Top10语料指令中,有7条语料指令是 followUp,3条语料指令是filterCustomer,那么预设意图在Top10语料指令中的匹配占比为30%,此时,匹配占比小于预设占比,需要针对自然查询语料的语料类型描述对预设语料集进行补充。
作为另一种示例,用户输入的自然语料信息与生成的业务语料结果将会被存储为表格,该表格将会被定期获取,并以邮件的方式定时发送给负责人,例如:每天早上十点发送昨天所有顾问的指令匹配情况,负责人要去观察顾问的表达与匹配到的指令是否合理,如果存在不合理的情况,需要针对本次表达的自然语言信息,使用指令测试工具进行测试,以对语料集做进一步优化补充。
作为一种示例,步骤E10至步骤E30包括:获取针对自然查询语料的预设意图,确定预设意图与意图比对集中各标准查询语料对应的业务语料中的匹配占比,将匹配占比与预设占比进行比较,在匹配占比小于预设占比时,将输入的自然查询语料补充至预设语料集中,在匹配占比大于或等于预设占比时,确定语料匹配成功。
其中,在所述根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料的步骤之后,所述业务语料生成方法包括:
步骤F10,获取所述业务语料对应的业务内容;
步骤F20,根据针对于所述业务内容执行的调整操作,调整所述业务内容。
在本实施例中,需要说明的是,调整操作用于表示在人机交互界面所进行的操作,具体可以是用户通过鼠标或触摸的方式,在基于文本或图形用户界面来选择和移动业务内容,业务内容表示根据用于业务语料生成所对应的指令以及该指令生成的结果,具体地,在对用户返回生成的自然语言结果后,还可以根据用户光标所处的位置,对自然语言结果进行选择、关键词高亮和编辑操作。
在一种可能的实施方式中,人机交互界面为GUI界面(Graphical UserInterface,图形用户界面),自然语言结果存在于GUI界面的文本框,当文本框中存在关键词时,需要创建一个新元素,将文本框中的文本数据复制到该元素中,然后用特定标签包裹高亮文本,并设置 Z 轴位置,将该元素放在文本框的下层,并设置该元素的文字样式,使其与文本框的大小相同,同时将字体颜色设置为透明,最后对高亮元素的标签,设置字体颜色为黑色,并设置高亮颜色,以此实现对关键词的高亮显示,另外地,实时检测文本框中的数据内容,当文本框中存在关键词时,首先需要确定当前光标与文本框的位置关系,然后在整个页面的文档中的检测光标的位置变化情况,当光标位置发生变化时,根据光标的位置和选中的文本,确定当前文本选择是否包含关键词,如果光标没有选中文字,则需要判断光标位置是否位于关键词内,若是,则选择整个关键词;如果光标已选中文字,则检查选中的文字是否包含未完全选中的关键词部分,如果有,则更新光标的选中范围,使其包含关键词的首尾,并将光标的起始位置与高亮词的起始位置进行比较,由此计算光标与高亮词的相对位置,以确定高亮词是否处于部分选中状态。
作为一种示例,步骤F10至步骤F20包括:将业务语料对应的自然语言结果进行输出,然后通过获取针对于所述业务内容执行的调整操作,实现对自然语言结果的选择、编辑和修改等文本操作。
示例性地,为了助于理解本申请的技术构思或技术原理,请参照图6,图6提供了一种匹配时序图,具体地,当应用在销售服务场景中,对用户输入的自然查询语料进行业务语料生成时,需要经过移动销售交互界面、科大讯飞语音转文字模型、移动销售服务指令生成模块、openai文本转向量模块以及MySQL向量及指令查询模块等,用户为销售顾问并在交互界面发送语音信息,由科大讯飞将语音信息转换为文本信息,然后该文本信息被发送至指令服务模块,由指令服务模块根据openai对文本信息解析得到的向量信息以及文本信息的业务标识,在MySQL中获取对应的指令,结合文本的向量和查询到的语料的向量做余弦相似度匹配,取Top10做为结果集,利用Top10语料按照规定格式构造用户和系统聊天示例,利用上面构造的聊天示例补充prompt(提示)规则中的例子,判断是否有对话上下文信息,若有,按照格式构造用户和系统的聊天对话,并拼接用户最新一次提问,封装成最终的用户聊天内容,完善后的prompt规则和最新用户聊天上下文文本,根据prompt规则进行判断匹配,返回指令信息。
本实施例通过对识别结果进行检测,在业务语料与预设意图不一致时,根据自然查询语料对预设语料集进行补充,优化参数模型,以提高业务语料生成的准确率和匹配效率,并且,通过获取用户在移动设备上的触摸操作,以实现对业务内容的调整,如文本的快速选择或将所选中的文本高亮显示等操作,以方便用户识别,由此可以提供如复制、剪切和粘贴等文本编辑功能,并且可以兼容各种移动浏览器,从而满足用户对文本进行快速编辑的需求。
实施例三
本发明实施例还提供一种业务语料生成装置,请参照图7,所述业务语料生成装置包括:
获取模块101,用于获取针对于目标业务输入的自然查询语料;
确定模块102,用于根据所述自然查询语料的语料特征向量,确定对应的标准查询语料,其中,所述标准查询语料是指符合所述目标业务的查询标准的自然查询语料;
生成模块103,用于根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料。
可选地,所述确定模块102还用于:
将所述语料特征向量与预设语料集中的目标特征向量进行相似度比较,确定语料相似值;
根据所述语料相似值,在所述预设语料集中确定对应的标准查询语料。可选地,所述确定模块102还用于:
获取所述自然查询语料对应的业务类别;
根据所述业务类别,在所述预设语料集中确定至少一条所述业务类别下的标准查询语料;
根据所述语料特征向量,检测所述自然查询语料对应的标准查询语料。
可选地,所述生成模块103还用于:
当所述语料相似值大于或者等于预设值时,在所述预设语料集中确定预设数量的标准查询语料;
根据所述标准查询语料,生成所述业务语料。
可选地,所述生成模块103还用于:
当所述语料相似值大于或者等于预设值时,请求所述自然查询语料的上文语料信息和/或下文语料信息;
通过将所述自然查询语料、所述上文语料信息和/或所述下文语料信息进行组装,生成所述业务语料。
可选地,所述业务语料生成装置还包括:
确定所述业务语料在各所述标准查询语料中的匹配占比;
将所述匹配占比与预设占比进行比较;
在所述匹配占比小于所述预设占比时,根据所述自然查询语料,对所述预设语料集进行语料补充。
可选地,所述业务语料生成装置还包括:
获取所述业务语料对应的业务内容;
根据针对于所述业务内容执行的调整操作,调整所述业务内容。
本发明提供的业务语料生成装置,采用上述实施例一或实施例二中的业务语料生成方法,能够解决现有语音助手对自然语料意图的识别准确率低的技术问题。与现有技术相比,本发明实施例提供的业务语料生成装置的有益效果与上述实施例提供的业务语料生成方法的有益效果相同,且所述业务语料生成装置中的其他技术特征与上一实施例方法公开的特征相同,在此不做赘述。
实施例四
本发明实施例提供一种电子设备,电子设备包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施例一中的业务语料生成方法。
下面参考图8,其示出了适于用来实现本公开实施例的电子设备的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(Personal Digital Assistant:个人数字助理)、PAD(Portable ApplicationDescription:平板电脑)、PMP(Portable Media Player:便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图8示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,电子设备可以包括处理装置1001(例如中央处理器、图形处理器等),其可以根据存储在只读存储器(ROM:Read Only Memory)1002中的程序或者从存储装置1003加载到随机访问存储器(RAM:Random Access Memory)1004中的程序而执行各种适当的动作和处理。在RAM1004中,还存储有电子设备操作所需的各种程序和数据。处理装置1001、ROM1002以及RAM1004通过总线1005彼此相连。输入/输出(I/O)接口1006也连接至总线。通常,以下系统可以连接至I/O接口1006:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置1007;包括例如液晶显示器(LCD:LiquidCrystal Display)、扬声器、振动器等的输出装置1008;包括例如磁带、硬盘等的存储装置1003;以及通信装置1009。通信装置1009可以允许电子设备与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种系统的电子设备,但是应理解的是,并不要求实施或具备所有示出的系统。可以替代地实施或具备更多或更少的系统。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储装置1003被安装,或者从ROM1002被安装。在该计算机程序被处理装置1001执行时,执行本公开实施例的方法中限定的上述功能。
本发明提供的电子设备,采用上述实施例中的业务语料生成方法,能解决现有语音助手对自然语料意图的识别准确率低的技术问题。与现有技术相比,本发明实施例提供的电子设备的有益效果与上述实施例提供的业务语料生成方法的有益效果相同,且该电子设备中的其他技术特征与上一实施例方法公开的特征相同,在此不做赘述。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式的描述中,具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
实施例五
本发明实施例提供一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,计算机可读程序指令用于执行上述实施例一中的业务语料生成方法。
本发明实施例提供的计算机可读存储介质例如可以是U盘,但不限于电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。计算机可读存储介质的更具体地例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM:Random Access Memory)、只读存储器(ROM:Read Only Memory)、可擦式可编程只读存储器(EPROM:Erasable Programmable Read Only Memory或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM:CD-Read Only Memory)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、系统或者器件使用或者与其结合使用。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(Radio Frequency:射频)等等,或者上述的任意合适的组合。
上述计算机可读存储介质可以是电子设备中所包含的;也可以是单独存在,而未装配入电子设备中。
上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被电子设备执行时,使得电子设备:获取针对于目标业务输入的自然查询语料;根据所述自然查询语料的语料特征向量,确定对应的标准查询语料,其中,所述标准查询语料是指符合所述目标业务的查询标准的自然查询语料;根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN:Local Area Network)或广域网(WAN:Wide Area Network)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该单元本身的限定。
本发明提供的可读存储介质为计算机可读存储介质,所述计算机可读存储介质存储有用于执行上述业务语料生成方法的计算机可读程序指令,能够解决现有语音助手对自然语料意图的识别准确率低的技术问题。与现有技术相比,本发明实施例提供的计算机可读存储介质的有益效果与上述实施例一或实施例二提供的业务语料生成方法的有益效果相同,在此不做赘述。
实施例六
本发明实施例还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的业务语料生成方法的步骤。
本申请提供的计算机程序产品能够解决现有语音助手对自然语料意图的识别准确率低的技术问题。与现有技术相比,本发明实施例提供的计算机程序产品的有益效果与上述实施例一或实施例二提供的业务语料生成方法的有益效果相同,在此不做赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还 包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、 方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体 现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (6)
1.一种业务语料生成方法,其特征在于,所述业务语料生成方法包括:
获取针对于目标业务输入的自然查询语料;
根据所述自然查询语料的语料特征向量,确定对应的标准查询语料,其中,所述标准查询语料是指符合所述目标业务的查询标准的自然查询语料;
其中,所述根据所述自然查询语料的语料特征向量,确定对应的标准查询语料的步骤包括:
将所述语料特征向量与预设语料集中的目标特征向量进行相似度比较,确定语料相似值;
根据所述语料相似值,在所述预设语料集中确定对应的标准查询语料;
根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料;
在所述根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料的步骤之后,所述业务语料生成方法包括:
获取所述业务语料对应的业务内容;
根据针对于所述业务内容执行的调整操作,调整所述业务内容,
其中,根据针对于所述业务内容执行的调整操作,调整所述业务内容的步骤包括:
将所述业务语料对应的自然语言结果进行输出,根据所述业务内容执行调整操作,以实现对所述自然语言结果的文本操作,其中,所述文本操作包括选择、编辑和修改文本操作;
所述根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料的步骤包括:
当所述语料相似值大于或者等于预设值时,在所述预设语料集中确定预设数量的标准查询语料;
根据所述标准查询语料,生成所述业务语料;
在所述根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料的步骤之后,所述业务语料生成方法还包括:
确定所述业务语料在各所述标准查询语料中的匹配占比;
将所述匹配占比与预设占比进行比较;
在所述匹配占比小于所述预设占比时,根据所述自然查询语料,对所述预设语料集进行语料补充。
2.如权利要求1所述的业务语料生成方法,其特征在于,所述根据所述自然查询语料的语料特征向量,确定对应的标准查询语料的步骤包括:
获取所述自然查询语料对应的业务类别;
根据所述业务类别,在所述预设语料集中确定至少一条所述业务类别下的标准查询语料;
根据所述语料特征向量,检测所述自然查询语料对应的标准查询语料。
3.如权利要求1所述的业务语料生成方法,其特征在于,所述根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料的步骤包括:
当所述语料相似值大于或者等于预设值时,请求所述自然查询语料的上文语料信息和/或下文语料信息;
通过将所述自然查询语料、所述上文语料信息和/或所述下文语料信息进行组装,生成所述业务语料。
4.一种业务语料生成装置,其特征在于,所述业务语料生成装置包括:
获取模块,用于获取针对于目标业务输入的自然查询语料;
确定模块,用于根据所述自然查询语料的语料特征向量,确定对应的标准查询语料,其中,所述标准查询语料是指符合所述目标业务的查询标准的自然查询语料,所述确定模块具体用于将所述语料特征向量与预设语料集中的目标特征向量进行相似度比较,确定语料相似值;根据所述语料相似值,在所述预设语料集中确定对应的标准查询语料;
生成模块,用于根据所述标准查询语料的语料相似值,生成所述目标业务的业务语料,所述生成模块,具体用于当所述语料相似值大于或者等于预设值时,在所述预设语料集中确定预设数量的标准查询语料;根据所述标准查询语料,生成所述业务语料;
其中,所述业务语料生成装置还包括获取所述业务语料对应的业务内容;
根据针对于所述业务内容执行的调整操作,调整所述业务内容其中,根据针对于所述业务内容执行的调整操作,调整所述业务内容的步骤包括:
将所述业务语料对应的自然语言结果进行输出,根据所述业务内容执行调整操作,以实现对所述自然语言结果的文本操作,其中,所述文本操作包括选择、编辑和修改文本操作,
所述业务语料生成装置还包括:确定所述业务语料在各所述标准查询语料中的匹配占比;
将所述匹配占比与预设占比进行比较;
在所述匹配占比小于所述预设占比时,根据所述自然查询语料,对所述预设语料集进行语料补充。
5.一种电子设备,其特征在于,所述电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的业务语料生成程序,所述业务语料生成程序配置为实现如权利要求1至3中任一项所述的业务语料生成方法的步骤。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有业务语料生成程序,所述程序被处理器执行时实现如权利要求1至3任一项所述业务语料生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311804167.9A CN117473069B (zh) | 2023-12-26 | 2023-12-26 | 业务语料生成方法、装置、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311804167.9A CN117473069B (zh) | 2023-12-26 | 2023-12-26 | 业务语料生成方法、装置、设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117473069A CN117473069A (zh) | 2024-01-30 |
CN117473069B true CN117473069B (zh) | 2024-04-12 |
Family
ID=89639927
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311804167.9A Active CN117473069B (zh) | 2023-12-26 | 2023-12-26 | 业务语料生成方法、装置、设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117473069B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106844400A (zh) * | 2015-12-07 | 2017-06-13 | 南京中兴新软件有限责任公司 | 智能应答方法及装置 |
CN110674268A (zh) * | 2019-08-23 | 2020-01-10 | 深圳追一科技有限公司 | 人机对话方法及相关设备 |
KR20200032893A (ko) * | 2018-09-19 | 2020-03-27 | 좌우지간 주식회사 | 챗봇 서비스를 위한 커뮤니케이션 정보 처리 시스템 및 그 제어 방법 |
CN111797214A (zh) * | 2020-06-24 | 2020-10-20 | 深圳壹账通智能科技有限公司 | 基于faq数据库的问题筛选方法、装置、计算机设备及介质 |
CN112749266A (zh) * | 2021-01-19 | 2021-05-04 | 海尔数字科技(青岛)有限公司 | 一种工业问答方法、装置、系统、设备及存储介质 |
CN115114424A (zh) * | 2022-07-14 | 2022-09-27 | 北京百度网讯科技有限公司 | 查询请求的应答方法及装置 |
CN115391539A (zh) * | 2022-08-31 | 2022-11-25 | 中国银行股份有限公司 | 语料数据的处理方法、装置及电子设备 |
WO2023236252A1 (zh) * | 2022-06-07 | 2023-12-14 | 来也科技(北京)有限公司 | 答案生成方法、装置、电子设备及存储介质 |
-
2023
- 2023-12-26 CN CN202311804167.9A patent/CN117473069B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106844400A (zh) * | 2015-12-07 | 2017-06-13 | 南京中兴新软件有限责任公司 | 智能应答方法及装置 |
KR20200032893A (ko) * | 2018-09-19 | 2020-03-27 | 좌우지간 주식회사 | 챗봇 서비스를 위한 커뮤니케이션 정보 처리 시스템 및 그 제어 방법 |
CN110674268A (zh) * | 2019-08-23 | 2020-01-10 | 深圳追一科技有限公司 | 人机对话方法及相关设备 |
CN111797214A (zh) * | 2020-06-24 | 2020-10-20 | 深圳壹账通智能科技有限公司 | 基于faq数据库的问题筛选方法、装置、计算机设备及介质 |
CN112749266A (zh) * | 2021-01-19 | 2021-05-04 | 海尔数字科技(青岛)有限公司 | 一种工业问答方法、装置、系统、设备及存储介质 |
WO2023236252A1 (zh) * | 2022-06-07 | 2023-12-14 | 来也科技(北京)有限公司 | 答案生成方法、装置、电子设备及存储介质 |
CN115114424A (zh) * | 2022-07-14 | 2022-09-27 | 北京百度网讯科技有限公司 | 查询请求的应答方法及装置 |
CN115391539A (zh) * | 2022-08-31 | 2022-11-25 | 中国银行股份有限公司 | 语料数据的处理方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN117473069A (zh) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022142014A1 (zh) | 基于多模态信息融合的文本分类方法、及其相关设备 | |
JP6647351B2 (ja) | 候補応答情報を生成する方法及び装置 | |
US9299342B2 (en) | User query history expansion for improving language model adaptation | |
CN108985358B (zh) | 情绪识别方法、装置、设备及存储介质 | |
CN113391871B (zh) | 一种rpa元素智能融合拾取的方法与系统 | |
US10332297B1 (en) | Electronic note graphical user interface having interactive intelligent agent and specific note processing features | |
KR20210037619A (ko) | 멀티 모달 콘텐츠 처리 방법, 장치, 기기 및 저장 매체 | |
CN110415679B (zh) | 语音纠错方法、装置、设备和存储介质 | |
CN109032731B (zh) | 一种面向操作系统的基于语义理解的语音互动方法及系统 | |
EP3251114B1 (en) | Transcription correction using multi-token structures | |
CN111144128A (zh) | 语义解析方法和装置 | |
CN111341308A (zh) | 用于输出信息的方法和装置 | |
EP3688624A1 (en) | Intelligent inferences of authoring from document layout and formatting | |
US9280973B1 (en) | Navigating content utilizing speech-based user-selectable elements | |
CN112182255A (zh) | 用于存储媒体文件和用于检索媒体文件的方法和装置 | |
WO2021104274A1 (zh) | 图文联合表征的搜索方法、系统、服务器和存储介质 | |
Chai et al. | Mind: A context-based multimodal interpretation framework in conversational systems | |
CN117473069B (zh) | 业务语料生成方法、装置、设备及计算机可读存储介质 | |
CN117112595A (zh) | 一种信息查询方法、装置、电子设备及存储介质 | |
CN116629236A (zh) | 一种待办事项提取方法、装置、设备及存储介质 | |
CN116978028A (zh) | 视频处理方法、装置、电子设备及存储介质 | |
CN110851574A (zh) | 语句处理方法、装置和系统 | |
US20190325322A1 (en) | Navigation and Cognitive Dialog Assistance | |
CN112148751B (zh) | 用于查询数据的方法和装置 | |
CN113672699A (zh) | 基于知识图谱的nl2sql生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |