CN114444469A - 基于95598客户服务数据资源的处理装置 - Google Patents
基于95598客户服务数据资源的处理装置 Download PDFInfo
- Publication number
- CN114444469A CN114444469A CN202210028152.7A CN202210028152A CN114444469A CN 114444469 A CN114444469 A CN 114444469A CN 202210028152 A CN202210028152 A CN 202210028152A CN 114444469 A CN114444469 A CN 114444469A
- Authority
- CN
- China
- Prior art keywords
- data
- word
- text
- processing
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 79
- 230000011218 segmentation Effects 0.000 claims abstract description 46
- 239000013598 vector Substances 0.000 claims abstract description 36
- 238000013528 artificial neural network Methods 0.000 claims abstract description 27
- 238000013519 translation Methods 0.000 claims abstract description 23
- 238000000034 method Methods 0.000 claims abstract description 13
- 238000002372 labelling Methods 0.000 claims description 11
- 208000035126 Facies Diseases 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 4
- 238000012549 training Methods 0.000 abstract description 5
- 238000004458 analytical method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000013475 authorization Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000036651 mood Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 229920002803 thermoplastic polyurethane Polymers 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于95598客户服务数据资源的处理装置,包括:存储模块,存储客户的语音转译文本数据;数据分词模块,对所述语音转译文本数据进行分句,进行分词处理,获得分词后的结果数据;数据向量化模块,将分词后的结果数据生成词向量;词向量处理模块,将所述词向量输入客户诉求识别算法单元,通过神经网络结构,提取文本的核心语义;结果输出模块,根据所述语义识别得到客户的语音转译文本数据的诉求分类,将诉求分类发送至相应的处理模块;处理模块对收到的诉求进行处理。本发明对计算资源消耗少,能够在较低的计算资源下,实现对文本语义的提取,不需要使用GPU服务器,即可在几小时内完成数据训练,以及数据的分类处理,处理速度快。
Description
技术领域
本发明属于通信数据处理技术领域,涉及一种基于95598客户服务数据资源的处理装置。
背景技术
基于95598客户服务数据资源和95598重大服务事件的判定依据,利用文本分词、机器学习训练等方法构建重大服务事件判别的分析模型,通过模型对疑似95598重大服务事件进行识别,以此辅助开展95598重大服务事件的处置工作,防止漏报和服务风险的升级。
目前,对于文本内容分析,传统技术方案采用的多为基于统计的文字分析方法,目前这几年普遍开始使用神经网络+机器学习的方法来进行文本分析。
神经网络技术方案,主要的区别点在于网络模型的设计,虽然都使用神经网络,但是网络结构不同,最终所达到的效果也会大大不同。
神经网络就是模拟动物神经网络的结构,所设计的一种用来处理数据的网状结构,这种结构是通过软件来实现的一种逻辑结构,体现为一段程序代码,这段程序代码的输入就是待分析的文本。神经网络要想能够很好的工作,是需要人对它进行一些训练的,这个过程类似小孩子学习的过程,逐步通过学习,学会对文本进行识别,分类。
学习的过程,首先需要人来对一些现有的文本数据进行标注,这个标注就是告诉机器,这个文本对应的分类是什么。譬如某段对话,是关于停电的,那么我们就给这段文本标注一个标签–停电。另外一段关于欠费的,我们就标注上–欠费。这样子,事先通过人工标注,积累好一大批的标注数据。然后将数据传入神经网络之中,这时候,训练程序会根据事先标签的结果,来核对神经网络出来的结果是否正确,如果结果不正确,那么通过使用一个叫反向传播的方法,来更新神经网络的参数,更新完成后,再重新把文本送入神经网络,核验结果。重复这个步骤,直到神经网络的结果与标签结果一致,然后开始下一条语料的训练,当语料的数量足够多的时候,最终训练完毕的神经网络,就具备了非常好的分类性能,准确度可以接近人的水平。
现有技术的一大缺点就是对计算力消耗非常大,以现在Google Bert网络为例,它需要16个Cloud TPU连续4天的计算才能够得到结果。然而现实情况经常并不具备如此大规模的硬件条件,同时,客户希望的对每天的数据进行计算,然后当天得到结果,这对时间也提了很高的要求。
发明内容
本发明的目的在于提供一种基于95598客户服务数据资源的处理装置,能够减少计算资源消耗,加快处理速度。
本发明采取的技术方案如下:
基于95598客户服务数据资源的处理装置,其特征在于,包括:
存储模块,存储客户的语音转译文本数据;
数据分词模块,对所述语音转译文本数据进行分句,去掉无效句,对每句话的词,进行分词处理,获得分词后的结果数据;
数据向量化模块,将分词后的结果数据生成词向量:
具体为,将所述分词后的结果数据全部进行向量化,转化为能够被神经网络处理的一串数字,根据全部的词组,对这串数字,建立一个向量空间,然后用每个向量来表示每个词、字,获得词向量;
词向量处理模块,将所述词向量输入客户诉求识别算法单元,通过神经网络结构,提取文本的核心语义,捕捉整个句意中不同词/字在整句句意的语义;
结果输出模块,根据所述语义识别得到客户的语音转译文本数据的诉求分类,将诉求分类结果发送至相应的处理模块;
处理模块,处理模块对收到的诉求进行处理。
优选地,所述数据分词模块的分词的原理是通过统计海量的文章和文本,来制作一个字典库的数据库,使用trie型树的数据结构来保存所有的词组,然后根据trie型树,生成有相无环图的数据结构。
优选地,所述数据分词模块的分词处理是使用动态规划算法进行分词的,并在获得分词结果之后,对语音转译文本格式进行调整,去掉停用词,停用词包括语气助词、副词、介词、连接词。
优选地,数据分词模块还对含有重大服务事件关键词的结果数据进行标注,经过标注的结果数据含有标注信息;
处理模块还对收到的含有标注信息的诉求分类进行优先处理。
优选地,词向量处理模块的客户诉求识别算法单元结合了时序神经网络的记忆力,并从字/词意、句意和文本意三个层级提取文本的核心语义。
优选地,词向量处理模块在提取文本的核心语义时,同时兼顾句全局和文本全局的不同部分对整个文本语义的贡献。
优选地,词向量处理模块在提取文本的核心语义时,通过句层的注意力机制把握句意的核心词/字,从而获取整句的语义;通过文本层的注意力机制,获得不同语句的语义,从而识别得到客户语音转译文本数据的诉求分类。
优选地,所述处理装置基于如下网络模型实现:所述网络模型是通过Tensorflow框架,搭建双层的BiLSTM+Self-Attention+Fully Connected+Softmax的网络模型。
本发明的优点:
对计算资源消耗少,不需要使用GPU服务器,即可在几小时内完成数据训练,以及数据的分类处理,处理速度快;
能够在较低的计算资源下,实现对文本语义的提取,特征的生成,然后对比不同文本语义特征,完成对客户的语音转译文本数据的识别,并对含有重大服务事件关键词的结果数据进行标注,以达到判断文本内容的目的,并实现了重大服务事件的识别;因此,能够对疑似95598重大服务事件进行识别,防止了重大服务事件的漏报和服务风险的升级;
不同的诉求被发送至对应的处理模块,各个处理模块获得精准的诉求信息,能够根据诉求信息进行针对性处理,有效开展精准服务;还能结合含有标注信息对相应的重大服务事件进行优先处理,提升了客户服务水平。
附图说明
图1是本发明的诉求分析原理图;
图2是本发明基于95598客户服务数据资源的处理装置的结构示意图;
图3是本发明的有相无环图的数据结构示意图。
具体实施方式
本发明针对的都是来电通话的文本,而通话语音到文本的转译工作,由客户现有的转译系统完成。
本发明采用神经网络技术,构基于客户服务语音数据的电力客户诉求识别模型,能够快速、准确地挖掘出客户在致电95598过程中提出的诉求内容,实现通过客户服务数据识别客户服务过程中存在的群体性服务风险,从而便于精准服务的开展。
基于95598客户服务数据资源的处理装置,如图2,包括:
存储模块,存储客户的语音转译文本数据;
数据分词模块,对所述语音转译文本数据进行分句,去掉无效句,对每句话的词,进行分词处理,获得分词后的结果数据;
数据向量化模块,将分词后的结果数据生成词向量:
具体为,将所述分词后的结果数据全部进行向量化,转化为能够被神经网络处理的一串数字,根据全部的词组,对这串数字,建立一个向量空间,然后用每个向量来表示每个词、字,获得词向量;
词向量处理模块,将所述词向量输入客户诉求识别算法单元,通过神经网络结构,提取文本的核心语义,捕捉整个句意中不同词/字在整句句意的语义;
结果输出模块,根据所述语义识别得到客户的语音转译文本数据的诉求分类,将诉求分类结果发送至相应的处理模块;
处理模块,处理模块对收到的诉求进行处理。
其中,数据分词模块的分词的原理是通过统计海量的文章和文本,来制作一个字典库的数据库,使用trie型树的数据结构来保存所有的词组,然后根据trie型树,生成有相无环图的数据结构。
数据分词模块的分词处理是使用动态规划算法进行分词的,并在获得分词结果之后,对语音转译文本格式进行调整,去掉停用词,停用词包括语气助词、副词、介词、连接词。
数据分词模块还对含有重大服务事件关键词的结果数据进行标注,经过标注的结果数据含有标注信息,重大服务事件关键词可以是停电、欠费等;相应地,处理模块还对收到的含有标注信息的诉求分类进行优先处理。
词向量处理模块的客户诉求识别算法单元结合了时序神经网络的记忆力,并从字/词意、句意和文本意三个层级提取文本的核心语义。
词向量处理模块在提取文本的核心语义时,同时兼顾句全局和文本全局的不同部分对整个文本语义的贡献。
词向量处理模块在提取文本的核心语义时,通过句层的注意力机制把握句意的核心词/字,从而获取整句的语义;通过文本层的注意力机制,获得不同语句的语义,从而识别得到客户语音转译文本数据的诉求分类。
处理装置基于如下网络模型实现:所述网络模型是通过Tensorflow框架,搭建双层的BiLSTM+Self-Attention+Fully Connected+Softmax的网络模型。
见图1,本发明基于95598客户服务数据资源的处理装置的原理说明如下:
(一)模型构建
通过Tensorflow框架,搭建双层的BiLSTM+Self-Attention+Fully Connected+Softmax网络模型,用于客户诉求识别。
根据我们实际工程上的经验,采用一层的BiLSTM网络对语料进行处理,由于有些电话的对话语句很长,无法有效的保留全部特征,因此分类识别效果不佳,Self-Attention网络对于长句的特征提取,有更好的性能表现,而目前流行的做法是采用多层的Self-Attention组合来做语义提取,Google的Bert就是12层的Self-Attention组合,但是这种网络结构的缺点是对计算资源占用极大,需要专业的,多台GPU服务器,才能获得理想的处理速度。但是考虑到实际情况,我们的计算资源有限,因此需要寻求一个折中的设计方案。因此,我们使用BiLSTM+Self-Attention组合的网络模型,寻求一个性能和计算量的均衡。
(二)数据处理
1.中文分词。
语音转译文本无法直接作为网络模型的输入数据,需要对数据进行预处理,首先要对数据进行分句,去掉无效句,然后对每句话的词,进行分词处理,中文语句都是连续的词组组成的,中间并没有进行分隔,而网络模型本身不具备识别词组的能力,因此需要先对每句话中的词组进行分隔。
分词的原理是通过统计海量的文章,文本,来制作一个叫字典库的数据库,使用了trie型树的数据结构来保存所有的词组,然后根据trie树,生成一个叫有相无环图的数据结构,示意图如图3。
图中每个节点上的字,与其他所有可能组成词组的字均有连接,因此有可能一个字对应多个字,这也是对应中文断句中有可能出现多种断句可能性的情况,同时,每个字也都是有权重的,这个权重就是在海量文本中统计的词频,因此接下来使用动态规划算法就可以获得一句话的最佳分词结果。
在获得分词结果之后,对文本格式进行调整,去掉停用词。(为了提高对文字的处理效率,通常在进行文字处理之前,会将一些无意义的词过滤掉,这些过滤掉的词,叫停用词。一般是语气助词、副词、介词、连接词等,比如常见的“的”,“在”这类词)
在分词过程中,还对含有重大服务事件关键词的结果数据进行标注,经过标注的结果数据含有标注信息;重大服务事件关键词可以为停电或欠费等。
2.向量化。
神经网络无法像人一样,直接理解每个词,因此需要将词字转化为神经网络可以处理的一串数字,这串数字,目前普遍的转换方式,是根据全部的词组,建立一个向量空间,然后用每个向量来表示每个词,字。例如:
你,我,他,三个词可以生成一个维度为3的向量空间[0,0,0],如果是你,向量表示为[1,0,0],我[0,1,0],他[0,0,1]。实际当中,汉字词语组成的向量空间会是一个几千位长的向量。此例仅为示意说明。
将中文分词后的结果数据生成词向量。考虑到电力客服内容词汇的专业性和语音识别中不可避免的识别错误、语义间断、口语化等现象,因此,将词和字全部进行向量化,将其语义传递给后面的分析网络从而提高信息提取的准确性。
(三)词向量处理
将语音转译文本数据的处理结果输入客户诉求识别算法模型,通过神经网络结构,捕捉整个句意中不同词/字对整句句意的语义贡献,实现字/词语义特征的再编码。该模型从字/词意——句意——文本意三个层级提取文本的核心语义,结合了时序神经网络的记忆力,又兼顾句全局和文本全局的不同部分对整个文本语义的贡献。句层的注意力机制精准的把握句意的核心词/字,从而获取整句的语义;文本层的注意力机制,又获得不同语句对最终分类任务的作用,从而识别得到统文的诉求分类。
(四)结果输出
将得到客户的语音转译文本数据的诉求分类,发送至相应的处理模块。
(五)数据处理
处理模块对收到的诉求进行处理,同时,还对收到的含有标注信息的诉求分类进行优先处理。
Claims (8)
1.基于95598客户服务数据资源的处理装置,其特征在于,包括:
存储模块,存储客户的语音转译文本数据;
数据分词模块,对所述语音转译文本数据进行分句,去掉无效句,对每句话的词,进行分词处理,获得分词后的结果数据;
数据向量化模块,将分词后的结果数据生成词向量:
具体为,将所述分词后的结果数据全部进行向量化,转化为能够被神经网络处理的一串数字,根据全部的词组,对这串数字,建立一个向量空间,然后用每个向量来表示每个词、字,获得词向量;
词向量处理模块,将所述词向量输入客户诉求识别算法单元,通过神经网络结构,提取文本的核心语义,捕捉整个句意中不同词/字在整句句意的语义;
结果输出模块,根据所述语义识别得到客户的语音转译文本数据的诉求分类,将诉求分类结果发送至相应的处理模块;
处理模块,处理模块对收到的诉求进行处理。
2.根据权利要求1所述的处理装置,其特征在于,所述数据分词模块的分词的原理是通过统计海量的文章和文本,来制作一个字典库的数据库,使用trie型树的数据结构来保存所有的词组,然后根据trie型树,生成有相无环图的数据结构。
3.根据权利要求1所述的处理装置,其特征在于,所述数据分词模块的分词处理是使用动态规划算法进行分词的,并在获得分词结果之后,对语音转译文本格式进行调整,去掉停用词,停用词包括语气助词、副词、介词、连接词。
4.根据权利要求1所述的处理装置,其特征在于,数据分词模块还对含有重大服务事件关键词的结果数据进行标注,经过标注的结果数据含有标注信息;
处理模块还对收到的含有标注信息的诉求分类进行优先处理。
5.根据权利要求1所述的处理装置,其特征在于,词向量处理模块的客户诉求识别算法单元结合了时序神经网络的记忆力,并从字/词意、句意和文本意三个层级提取文本的核心语义。
6.根据权利要求1所述的处理装置,其特征在于,词向量处理模块在提取文本的核心语义时,同时兼顾句全局和文本全局的不同部分对整个文本语义的贡献。
7.根据权利要求1所述的处理装置,其特征在于,词向量处理模块在提取文本的核心语义时,通过句层的注意力机制把握句意的核心词/字,从而获取整句的语义;通过文本层的注意力机制,获得不同语句的语义,从而识别得到客户语音转译文本数据的诉求分类。
8.根据权利要求1所述的处理装置,其特征在于,所述处理装置基于如下网络模型实现:所述网络模型是通过Tensorflow框架,搭建双层的BiLSTM+Self-Attention+FullyConnected+Softmax的网络模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210028152.7A CN114444469B (zh) | 2022-01-11 | 2022-01-11 | 基于95598客户服务数据资源的处理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210028152.7A CN114444469B (zh) | 2022-01-11 | 2022-01-11 | 基于95598客户服务数据资源的处理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114444469A true CN114444469A (zh) | 2022-05-06 |
CN114444469B CN114444469B (zh) | 2024-07-09 |
Family
ID=81368011
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210028152.7A Active CN114444469B (zh) | 2022-01-11 | 2022-01-11 | 基于95598客户服务数据资源的处理装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114444469B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017010528A (ja) * | 2015-06-17 | 2017-01-12 | パナソニックIpマネジメント株式会社 | 意味情報生成方法、意味情報生成装置、およびプログラム |
CN108021679A (zh) * | 2017-12-07 | 2018-05-11 | 国网山东省电力公司电力科学研究院 | 一种并行化的电力设备缺陷文本分类方法 |
CN109800412A (zh) * | 2018-12-10 | 2019-05-24 | 鲁东大学 | 一种中文分词和大数据信息检索方法及装置 |
CN110297906A (zh) * | 2019-06-28 | 2019-10-01 | 谭浩 | 生成访谈报告的方法、计算机可读存储介质和终端设备 |
CN111401034A (zh) * | 2018-12-28 | 2020-07-10 | 深圳市优必选科技有限公司 | 文本的语义分析方法、语义分析装置及终端 |
-
2022
- 2022-01-11 CN CN202210028152.7A patent/CN114444469B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017010528A (ja) * | 2015-06-17 | 2017-01-12 | パナソニックIpマネジメント株式会社 | 意味情報生成方法、意味情報生成装置、およびプログラム |
CN108021679A (zh) * | 2017-12-07 | 2018-05-11 | 国网山东省电力公司电力科学研究院 | 一种并行化的电力设备缺陷文本分类方法 |
CN109800412A (zh) * | 2018-12-10 | 2019-05-24 | 鲁东大学 | 一种中文分词和大数据信息检索方法及装置 |
CN111401034A (zh) * | 2018-12-28 | 2020-07-10 | 深圳市优必选科技有限公司 | 文本的语义分析方法、语义分析装置及终端 |
CN110297906A (zh) * | 2019-06-28 | 2019-10-01 | 谭浩 | 生成访谈报告的方法、计算机可读存储介质和终端设备 |
Also Published As
Publication number | Publication date |
---|---|
CN114444469B (zh) | 2024-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110491382B (zh) | 基于人工智能的语音识别方法、装置及语音交互设备 | |
CN111145728B (zh) | 语音识别模型训练方法、系统、移动终端及存储介质 | |
CN111199727B (zh) | 语音识别模型训练方法、系统、移动终端及存储介质 | |
CN111210807B (zh) | 语音识别模型训练方法、系统、移动终端及存储介质 | |
CN111709242B (zh) | 一种基于命名实体识别的中文标点符号添加方法 | |
CN111477216A (zh) | 一种用于对话机器人的音意理解模型的训练方法及系统 | |
CN111858932A (zh) | 基于Transformer的多重特征中英文情感分类方法及系统 | |
CN111445898B (zh) | 语种识别方法、装置、电子设备和存储介质 | |
CN109033073B (zh) | 基于词汇依存三元组的文本蕴含识别方法及装置 | |
CN112349294B (zh) | 语音处理方法及装置、计算机可读介质、电子设备 | |
CN113326367A (zh) | 基于端到端文本生成的任务型对话方法和系统 | |
CN115759119A (zh) | 一种金融文本情感分析方法、系统、介质和设备 | |
CN113779987A (zh) | 一种基于自注意力增强语义的事件共指消岐方法及系统 | |
CN117725432A (zh) | 文本语义相似度对比方法、装置、设备及可读存储介质 | |
CN111104806B (zh) | 神经机器翻译模型的构建方法及装置、翻译方法及装置 | |
CN116522165A (zh) | 一种基于孪生结构的舆情文本匹配系统及方法 | |
CN111310892A (zh) | 一种基于独立循环神经网络的语言模型建模方法 | |
CN114611529B (zh) | 意图识别方法和装置、电子设备及存储介质 | |
CN114444469B (zh) | 基于95598客户服务数据资源的处理装置 | |
CN116978367A (zh) | 语音识别方法、装置、电子设备和存储介质 | |
CN115481636A (zh) | 一种面向技术文献的技术功效矩阵构建方法 | |
CN112131343B (zh) | 一种中文小说对话人物识别方法 | |
CN115050351A (zh) | 生成时间戳的方法、装置及计算机设备 | |
CN110245331A (zh) | 一种语句转换方法、装置、服务器及计算机存储介质 | |
CN111091011B (zh) | 领域预测方法、领域预测装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |