CN112988964A - 文本韵律边界预测的方法、装置、设备及存储介质 - Google Patents

文本韵律边界预测的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112988964A
CN112988964A CN202110193245.0A CN202110193245A CN112988964A CN 112988964 A CN112988964 A CN 112988964A CN 202110193245 A CN202110193245 A CN 202110193245A CN 112988964 A CN112988964 A CN 112988964A
Authority
CN
China
Prior art keywords
text
word
information
classification
predicted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110193245.0A
Other languages
English (en)
Other versions
CN112988964B (zh
Inventor
孙奥兰
王健宗
程宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202110193245.0A priority Critical patent/CN112988964B/zh
Priority to PCT/CN2021/084280 priority patent/WO2022174499A1/zh
Publication of CN112988964A publication Critical patent/CN112988964A/zh
Application granted granted Critical
Publication of CN112988964B publication Critical patent/CN112988964B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本申请涉及人工智能技术领域,公开了一种文本韵律边界预测的方法、装置、计算机设备及计算机可读存储介质,该方法包括:通过将获取到的待预测文本输入预置文本韵律边界模型中;通过所述预训练语言模型,获取所述待预测文本对应的词向量信息;根据所述词向量信息,获取对应的多维向量信息;通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息;通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息,实现将待预测文本变成多维向量,从而可以运用二维卷积网络对其做卷积,提高韵律边界预测的准确度,以及提高模型的运行速度。

Description

文本韵律边界预测的方法、装置、设备及存储介质
技术领域
本申请涉人工智能技术领域,尤其涉及一种文本韵律边界预测的方法、装置、计算机设备及计算机可读存储介质。
背景技术
随着科学与技术的发展,高自然度的语音合成成了人工智能、人机交互领域的一个重要研究课题,韵律边界的预测对于语音合成中语料库的韵律标注具有非常重要的意义,其预测的准确性关系到合成语音的自然度和可理解性。中文韵律的预测分为三个层级,分别是:韵律词、韵律短语和语调短语,然而目前大部分基于深度学习的韵律预测模型使用的是基于预训练语言(Bert)的词性标注模型(BLSTM-CRF),且三个层级的韵律边界预测分开,即要预测一句话的韵律边界,需要三次模型推理,再加上双向长短时记忆网络(BLSTM)本身的循环计算特性,无法并行计算,模型的运行效率较低,影响了整体的语音合成效率。
发明内容
本申请的主要目的在于提供一种文本韵律边界预测的方法、装置、计算机设备及计算机可读存储介质,旨在目前大部分基于深度学习的韵律预测模型,无法并行计算,模型的运行效率较低,影响了整体的语音合成效率的技术问题。
第一方面,本申请提供一种文本韵律边界预测的方法,所述文本韵律边界预测的方法包括以下步骤:
将获取到的待预测文本输入预置文本韵律边界模型中,其中,所述文本韵律边界模型包括预训练语言模型、二维卷积模型、分类层;
通过所述预训练语言模型,获取所述待预测文本对应的词向量信息;
根据所述词向量信息,获取对应的多维向量信息;
通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息;
通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息。
第二方面,本申请还提供一种文本韵律边界预测装置,所述文本韵律边界预测装置包括:
第一获取模块,用于将获取到的待预测文本输入预置文本韵律边界模型中,其中,所述文本韵律边界模型包括预训练语言模型、二维卷积模型、分类层;
第二获取模块,用于通过所述预训练语言模型,获取所述待预测文本对应的词向量信息;
第三获取模块,用于根据所述词向量信息,获取对应的多维向量信息;
第四获取模块,用于通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息;
确定模块,用于通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息。
第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上述的文本韵律边界预测的方法的步骤。
第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上述的文本韵律边界预测的方法的步骤。
本申请提供一种文本韵律边界预测的方法、装置、计算机设备及计算机可读存储介质,通过将获取到的待预测文本输入预置文本韵律边界模型中,其中,所述文本韵律边界模型包括预训练语言模型、二维卷积模型、分类层;通过所述预训练语言模型,获取所述待预测文本对应的词向量信息;根据所述词向量信息,获取对应的多维向量信息;通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息;通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息,实现将待预测文本变成多维向量,从而可以运用二维卷积网络对其做卷积,提高韵律边界预测的准确度,以及提高模型的运行速度。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种文本韵律边界预测的方法的流程示意图;
图2为图1中的文本韵律边界预测的方法的子步骤流程示意图;
图3为图1中的文本韵律边界预测的方法的子步骤流程示意图;
图4为图1中的文本韵律边界预测的方法的子步骤流程示意图;
图5为本申请实施例提供的另一种文本韵律边界预测的方法的流程示意图;
图6为本申请实施例提供的一种文本韵律边界预测装置的示意性框图;
图7为本申请一实施例涉及的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本申请实施例提供一种文本韵律边界预测的方法、装置、计算机设备及计算机可读存储介质。其中,该文本韵律边界预测的方法可应用于计算机设备中,该计算机设备可以是笔记本电脑、台式电脑等电子设备。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参照图1,图1为本申请的实施例提供的一种文本韵律边界预测的方法的流程示意图。
如图1所示,该文本韵律边界预测的方法包括步骤S101至步骤S105。
步骤S101、将获取到的待预测文本输入预置文本韵律边界模型中,其中,所述预置文本韵律边界模型包括预训练语言模型、二维卷积模型、分类层。
示范性的,获取待预测文本,该待预测文本包括短语或短句等。获取的方法包括获取预置存储路径中的待预测数据,或,获取预置区块链中的存储的待预测数据,该待预测数据包括多个待预测文本。在获取到待预测文本时,将待预测文本输入到预置文本韵律边界模型,该预置文本韵律边界模型包括预训练语言模型和二维卷积模型。
步骤S102、通过所述预训练语言模型,获取所述待预测文本对应的词向量信息。
示范性的,直接将该待预测文本输入到预训练语言模型中,通过该预训练语言模型,得到待预测文本对应的词向量信息,该词向量信息的数据规则为{B、L、E},其中,B为待预测文本的样本标识,L为待预测文本的字词长度,E为预置词向量长度。
在一实施例中,具体地,参照图2,步骤S102包括:子步骤S1021至子步骤S1022。
子步骤S1021,通过所述预训练语言模型的应用层对所述待预测文本进行分析,获取所述待预测文本中的样本标识和所述待预测文本中的字词长度。
示范性的,将该待预测文本输入到预训练语言模型,通过该预训练语言模型的应用层对该待预测文本进行分析,获取待预测文本的样本标识和待预测文本中的字词长度。例如,该待预测文本包括至少一个样本,通过该预训练语言模型的应用层对该待预测文本进行分析,获取待预测文本中的样本标识。若该预测文本只有一个样本,则该样本标识为1;若该待预测文本有两个样本,则该样本标识为2。以及获取该样本中的字词长度,例如,该样本为8个字词组成,则该样本的字词长度为8。
子步骤S1022,基于所述样本标识、所述字词长度和预置词向量长度,获取所述预训练语言模型的输出层输出所述待预测文本的词向量信息。
示范性的,在获取到待预测文本的样本标识以及对应的字词长度,并获取预训练语言模型中的预置词向量长度。预训练语言模型的输出层通过该样本标识、字词长度以及预置词向量信息输出待预测文本的词向量信息。例如,获取待预测文本的样本标识B,待预测文本的字词长度L,预置词向量长度E,将获取到样本标识B、字词长度L以及预置词向量长度E进行组合,得到{B、L、E},将该{B、L、E}作为待预测文本的向量信息,其中当有多个字词长度时,取长度最长的字词长度。
步骤S103、根据所述词向量信息,获取对应的多维向量信息。
示范性的,在获取到待预测文本的词向量信息时,通过对该词向量信息进行维度变换和维度切分,得到对应的多维向量信息。
在一实施例中,具体的,所述词向量信息包括样本标识、字词长度和预置词向量长度;所述根据所述词向量信息,得到对应的多维向量信息,包括:获取所述向量信息中字词长度和所述预置词向量长度的位置,并将所述词向量信息中字词长度和所述预置词向量长度位置进行变换,得到对应的维度向量信息;对所述维度向量信息中预置词向量长度进行维度拆分,得到多维向量信息。
示范性的,在获取到待预测文本的词向量信息时,对该词向量信息进行维度变换,得到对应的维度向量信息。例如,在获取到词向量信息为{B、L、E},将该{B、L、E}中的L维度和E维度调换位置,得到维度变换后的维度向量信息{B、E、L}。在得到维度向量信息时,对该维度向量信息进行维度拆分,例如,获取到待预测文本中字词长度E,将字词长度E按照预置维度,分为多段维度,若获取到待预测文本中字词长度E[1,2,3,4,5,6,7,8]被切分为了[1,2],[3,4],[5,6],[7,8],则变为二维向量[[1,2],[3,4],[5,6],[7,8]])。
步骤S104、通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息。
示范性的,在获取到待预测文本的多维向量信息时,将该多维向量信息输入到二维卷积模型中,通过该二维卷积模型中的多个卷积层对该多维向量进行卷积处理,得到该待预测文本中各个字词的分类标签信息。例如,该二维卷积模型中包括多个卷积层,每一个卷积层对多维向量信息进行卷积处理。
在一实施例中,具体地,参照图3,步骤S104包括:子步骤S1041至子步骤S1042。
子步骤S1041、根据所述卷积层对所述多维向量信息进行卷积计算,得到所述多维向量信息的目标数据规则信息。
示范性的,该二维卷积模型包括卷积层,通过该卷积层对该多维向量信息进行卷积计算,得到该多维向量信息的目标数据规则信息。其中,该卷积层包括多层。例如,当第一层为depthwise分通道卷积,卷积核大小为3x3,padding=1,stride=1,即输出与输入的数据规格不变,多维向量信息中的数据规则依然为[B,E,H,W]。第二层为pointwise的1x1卷积,即卷积核大小为1x1,padding=0,stride=1,卷积核个数与通道数E相等,因此经过第二层后数据的规格依然不变,还是[B,E,H,W]。第三层与第一层一样,第四层与第二层相比,除了卷积核个数变为通道数E的一半外,其他不变,即第四层输出的数据规格为[B,E/2,H,W],且对输入数据进行1x1卷积,使得其数据规格与第四层的输出一致,两者进行残差连接,即相加作为第四层最终的输出。第五层为maxpooling层,输出的数据规格为[B,E/2,H/2,W/2]。第六层与第七层与第一第二层完全一样,因此得到的数据规格依然为[B,E/2,H/2,W/2]。
第八层为上采样层,基于全卷机网络中的逆卷积,使得第三、第四维度的规格变大一倍,即输出为[B,E/2,H,W]。接着将四维的数据恢复到原来的三维,变成[B,E/2,H*W],最为后续网络的输入。(原本数据维度为[B,E/2,H,W],现在需要将数据维度变回3维向量,即可将最后的两个维度相乘,即可得到维度为[B,E/2,H*W]的向量,作为下一层网络的输入),第八层采用一维卷积,卷积核大小为3x3,padding=1,stride=1,卷积核个数为E/4,因此该层输出数据的规格为[B,E/4,H*W],第九层与第八层类似,区别在于卷积核变成E/8,即输出为[B,E/8,H*W]。
子步骤S1042、基于所述全连接层对所述目标数据规则信息进行分类,得到所述待预测文本中各个字词的分类标签信息。
示范性的,在获取到多维向量信息的目标数据规则信息时,将该目标数据规则信息输入到全连接层中,通过该全连接层对该目标数据规则信息进行分类,得到该待预测文本中各个字词的分类标签信息。
具体的,在所述基于所述全连接层对所述目标数据规则进行分类,得到所述待预测文本中各个字词的分类标签信息,包括:通过所述全连接层中预置分类器对所述目标数据规则信息进行分类,得到各个字词对应的分类向量信息;基于各个所述字词的分类向量信息,得到各个所述字词的分类标签信息。
示范性的,该全连接层包括预置分类器,通过该预置分类型基于该目标数据规则信息进行分类,得到各个字词分类向量信息,通过预置权重矩阵和各个字词分类向量信息,得到各个字词的分类标签信息。
步骤S105、通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息。
示范性的,在获取到各个字词的分类标签信息时,通过该各个字词的分类标签信息,确定各个字词的韵律边界。例如,该分类标签信息包括分类信息和分类标签信息,通过分类信息和标签信息确定待预测文本中各个字词的韵律边界信息信息。
在一实施例中,具体地,参照图4,步骤S105包括:子步骤S1051至子步骤S1054。
子步骤S1051、若通过所述分类层识别所述分类信息为韵律分类,则通过标签信息确定各个所述字词是否为韵律词。
示范性的,若分类信息为韵律分类,则获取该韵律分类对应的标签信息,通过该标签信息确定各个字词是否为韵律词。例如,若获取标签信息为0时,则该词不为韵律词,若获取到标签信息为1时,则该词为韵律词。
子步骤S1052、若通过所述分类层识别所述分类信息为韵律短语分类,则通过标签信息确定各个所述字词是否为韵律短语。
示范性的,若分类信息为韵律短语分类,则获取该韵律短语分类对应的标签信息,通过该标签信息确定各个字词是否为韵律短语。例如,若获取标签信息为0时,则该词不为韵律短语,若获取到标签信息为1时,则该词为韵律短语。
子步骤S1053、若通过所述分类层识别所述分类信息为语调短语分类,则通过标签信息确定各个所述字词是否为语调短语。
示范性的,若分类信息为语调短语分类,则获取该语调短语分类对应的标签信息,通过该标签信息确定各个字词是否为语调短语。例如,若获取标签信息为0时,则该词不为语调短语,若获取到标签信息为1时,则该词为语调短语。
子步骤S1054、若通过所述分类层识别所述分类信息不是韵律分类、韵律短语分类和语调短语分类,则确定各个所述字词为背景类。
示范性的,若分类信息不是韵律分类、韵律短语分类和语调短语分类,则确定该字词为背景类。若确定该字词为背景类,则确定该字词不是韵律边界。
在本申请实施例中,通过将获取到的待预测文本输入到预置文本韵律边界模型中,通过该预置文本韵律边界模型中的预训练语言模型,得到该预置待预测文本的词向量信息,通过对词向量信息进行维度变换和维度切分,得到多维向量信息,通过二维卷积模型对该多维向量信息进行卷积处理,得到待预测文本中各个字词对应的分类标签信息,通过该分类标签信息,确定各个字词的韵律边界信息,实现将待预测文本变成多维向量,从而可以运用二维卷积网络对其做卷积,提高韵律边界预测的准确度,以及提高模型的运行速度。
请参照图5,图5为本申请的实施例提供的另一种文本韵律边界预测的方法的流程示意图。
如图5所示,该文本韵律边界预测的方法包括步骤S201至步骤S209。
步骤S201、获取多个带标注文本。
示范性的,获取多个带标注文本,其中,每个带标注文本包括每个字词的标注信息,该标注信息包括分类信息以及标签信息。
步骤S202、将多个所述带标注文本输入预置待训练模型。
示范性的,在获取到多个带标注文本时,将多个带标注文本输入预置待训练模型中,该预置待训练模型包括预置预训练语言模型和预置二维卷积模型。
步骤S203、通过多个所述带标注文本对所述预置待训练模型进行训练,获取对应的损失交叉熵函数。
示范性的,通过多个带标注文本对预置待训练模型进行训练,获取对应的损失交叉熵函数。例如,通过该带标注文本对预置待训练模型进行训练,得到对应的预测分类标签信息,通过该预测分类标签信息和带标注文本中的标注分类标签信息,得到对应的损失交叉熵函数。
步骤S204、通过所述损失交叉熵函数对所述预置待训练模型的模型参数进行更新,生成对应的文本韵律边界模型。
示范性的,通过该损失交叉熵函数对预置待训练模型的模型参数进行更新,确定更新后的预置待训练模型是否处于收敛状态,若该预置待训练模型处于收敛状态,则生成对应的文本韵律边界模型,若不出收敛状态,则训练对预置待训练模型进行模型训练。
步骤S205、将获取到的待预测文本输入预置文本韵律边界模型中,其中,所述预置文本韵律边界模型包括预训练语言模型、二维卷积模型、分类层。
示范性的,获取待预测文本,该待预测文本包括短语或短句等。获取的方法包括获取预置存储路径中的待预测数据,或,获取预置区块链中的存储的待预测数据,该待预测数据包括多个待预测文本。在获取到待预测文本时,将待预测文本输入到预置文本韵律边界模型,该预置文本韵律边界模型包括预训练语言模型和二维卷积模型。
步骤S206、通过所述预训练语言模型,获取所述待预测文本对应的词向量信息。
示范性的,直接将该待预测文本输入到预训练语言模型中,通过该预训练语言模型,得到待预测文本对应的词向量信息,该词向量信息的数据规则为{B、L、E},其中,B为待预测文本的样本标识,L为待预测文本的字词长度,E为预置词向量长度。
步骤S207、根据所述词向量信息,获取对应的多维向量信息。
示范性的,在获取到待预测文本的词向量信息时,通过对该词向量信息进行维度变换和维度切分,得到对应的多维向量信息。
具体的,所述根据所述词向量信息,得到对应的多维向量信息,包括:对所述词向量信息进行维度变换,得到对应的维度向量信息;对所述维度向量信息进行维度拆分,得到对应的多维向量信息。
示范性的,在获取到待预测文本的词向量信息时,对该词向量信息进行维度变换,得到对应的维度向量信息。例如,在获取到词向量信息为{B、L、E},将该{B、L、E}中的L维度和E维度调换位置,得到维度变换后的维度向量信息{B、E、L}。在得到维度向量信息时,对该维度向量信息进行维度拆分,例如,获取到待预测文本中字词长度E,将字词长度E按照预置维度,分为多段维度,若获取到待预测文本中字词长度E[1,2,3,4,5,6,7,8]被切分为了[1,2],[3,4],[5,6],[7,8],则变为二维向量[[1,2],[3,4],[5,6],[7,8]])。
步骤S208、通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息。
示范性的,在获取到待预测文本的多维向量信息时,将该多维向量信息输入到二维卷积模型中,通过该二维卷积模型中的多个卷积层对该多维向量进行卷积处理,得到该待预测文本中各个字词的分类标签信息。例如,该二维卷积模型中包括多个卷积层,每一个卷积层对多维向量信息进行卷积处理。
步骤S209、通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息。
示范性的,在获取到各个字词的分类标签信息时,通过该各个字词的分类标签信息,确定各个字词的韵律边界。例如,该分类标签信息包括分类信息和分类标签信息,通过分类信息和标签信息确定待预测文本中各个字词的韵律边界信息信息。
在本申请实施例中,通过带标注文本对预置待训练模型进行训练,生成对应的文本韵律边界模型,通过该预置文本韵律边界模型中的预训练语言模型,得到该预置待预测文本的词向量信息,通过对词向量信息进行维度变换和维度切分,得到多维向量信息,通过二维卷积模型对该多维向量信息进行卷积处理,得到待预测文本中各个字词对应的分类标签信息,通过该分类标签信息,确定各个字词的韵律边界信息,实现将待预测文本变成多维向量,从而可以运用二维卷积网络对其做卷积,提高韵律边界预测的准确度,以及提高模型的运行速度。
请参照图6,图6为本申请实施例提供的一种文本韵律边界预测装置的示意性框图。
如图6所示,该文本韵律边界预测装置400,包括:第一获取模块401、第二获取模块402、第三获取模块403、第四获取模块404、确定模块405。
第一获取模块401,用于将获取到的待预测文本输入预置文本韵律边界模型中,其中,所述文本韵律边界模型包括预训练语言模型、二维卷积模型、分类层;
第二获取模块402,用于通过所述预训练语言模型,获取所述待预测文本对应的词向量信息;
第三获取模块403,用于根据所述词向量信息,获取对应的多维向量信息;
第四获取模块404,用于通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息;
确定模块405,用于通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息。
其中,第二获取模块402具体还用于:
通过所述预训练语言模型的应用层对所述待预测文本进行分析,获取所述待预测文本中的样本标识和所述待预测文本中的字词长度;
基于所述样本标识、所述字词长度和预置词向量长度,获取所述预训练语言模型的输出层输出所述待预测文本的词向量信息。
其中,第三获取模块403具体还用于:
获取所述向量信息中字词长度和所述预置词向量长度的位置,并将所述词向量信息中字词长度和所述预置词向量长度位置进行变换,得到对应的维度向量信息;
对所述维度向量信息中预置词向量长度进行维度拆分,得到多维向量信息。
其中,第四获取模块404具体还用于:
根据所述卷积层对所述多维向量信息进行卷积计算,得到所述多维向量信息的目标数据规则信息;
基于所述全连接层对所述目标数据规则信息进行分类,得到所述待预测文本中各个字词的分类标签信息。
其中,第四获取模块404具体还用于:
通过所述全连接层中预置分类器对所述目标数据规则信息进行分类,得到各个字词对应的分类向量信息;
基于各个所述字词的分类向量信息,得到各个所述字词的分类标签信息。
其中,确定模块405具体还用于:
若通过所述分类层识别所述分类信息为韵律分类,则通过标签信息确定各个所述字词是否为韵律词;
若通过所述分类层识别所述分类信息为韵律短语分类,则通过标签信息确定各个所述字词是否为韵律短语;
若通过所述分类层识别所述分类信息为语调短语分类,则通过标签信息确定各个所述字词是否为语调短语;
若通过所述分类层识别所述分类信息不是韵律分类、韵律短语分类和语调短语分类,则确定各个所述字词为背景类。
其中,文本韵律边界预测装置还用于:
获取多个带标注文本;
将多个所述带标注文本输入预置待训练模型;
通过多个所述带标注文本对所述预置待训练模型进行训练,获取对应的损失交叉熵函数;
通过所述损失交叉熵函数对所述预置待训练模型的模型参数进行更新,生成对应的文本韵律边界模型。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块及单元的具体工作过程,可以参考前述文本韵律边界预测的方法实施例中的对应过程,在此不再赘述。
上述实施例提供的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图7所示的计算机设备上运行。
请参阅图7,图7为本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以为终端。
如图7所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种文本韵律边界预测的方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种文本韵律边界预测的方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
将获取到的待预测文本输入预置文本韵律边界模型中,其中,所述预置文本韵律边界模型包括预训练语言模型、二维卷积模型、分类层;
通过所述预训练语言模型,获取所述待预测文本对应的词向量信息;
根据所述词向量信息,获取对应的多维向量信息;
通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息;
通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息。
在一个实施例中,所述处理器所述预训练语言模型包括预置词向量长度;所述通过所述预训练语言模型,获取所述待预测文本对应的词向量信息实现时,用于实现:
通过所述预训练语言模型的应用层对所述待预测文本进行分析,获取所述待预测文本中的样本标识和所述待预测文本中的字词长度;
基于所述样本标识、所述字词长度和预置词向量长度,获取所述预训练语言模型的输出层输出所述待预测文本的词向量信息。
在一个实施例中,所述处理器所述词向量信息包括样本标识、字词长度和预置词向量长度;所述根据所述词向量信息,得到对应的多维向量信息实现时,用于实现:
获取所述向量信息中字词长度和所述预置词向量长度的位置,并将所述词向量信息中字词长度和所述预置词向量长度位置进行变换,得到对应的维度向量信息;
对所述维度向量信息中预置词向量长度进行维度拆分,得到多维向量信息。
在一个实施例中,所述处理器所述二维卷积模型包括卷积层和全连接层;所述通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息实现时,用于实现:
根据所述卷积层对所述多维向量信息进行卷积计算,得到所述多维向量信息的目标数据规则信息;
基于所述全连接层对所述目标数据规则信息进行分类,得到所述待预测文本中各个字词的分类标签信息。
在一个实施例中,所述处理器所述基于所述全连接层对所述目标数据规则进行分类,得到所述待预测文本中各个字词的分类标签信息实现时,用于实现:
通过所述全连接层中预置分类器对所述目标数据规则信息进行分类,得到各个字词对应的分类向量信息;
基于各个所述字词的分类向量信息,得到各个所述字词的分类标签信息。在一个实施例中,所述处理器所述分类标签信息包括分类信息和标签信息;所述通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息实现时,用于实现:
若通过所述分类层识别所述分类信息为韵律分类,则通过标签信息确定各个所述字词是否为韵律词;
若通过所述分类层识别所述分类信息为韵律短语分类,则通过标签信息确定各个所述字词是否为韵律短语;
若通过所述分类层识别所述分类信息为语调短语分类,则通过标签信息确定各个所述字词是否为语调短语;
若通过所述分类层识别所述分类信息不是韵律分类、韵律短语分类和语调短语分类,则确定各个所述字词为背景类。
在一个实施例中,所述处理器所述将获取到的待预测文本输入预置文本韵律边界模型中之前实现时,用于实现:
获取多个带标注文本;
将多个所述带标注文本输入预置待训练模型;
通过多个所述带标注文本对所述预置待训练模型进行训练,获取对应的损失交叉熵函数;
通过所述损失交叉熵函数对所述预置待训练模型的模型参数进行更新,生成对应的文本韵律边界模型。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时所实现的方法可参照本申请文本韵律边界预测的方法的各个实施例。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本申请所指区块链是预置文本韵律边界模型的存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种文本韵律边界预测的方法,其特征在于,包括:
将获取到的待预测文本输入预置文本韵律边界模型中,其中,所述预置文本韵律边界模型包括预训练语言模型、二维卷积模型、分类层;
通过所述预训练语言模型,获取所述待预测文本对应的词向量信息;
根据所述词向量信息,获取对应的多维向量信息;
通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息;
通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息。
2.如权利要求1所述的文本韵律边界预测的方法,其特征在于,所述预训练语言模型包括预置词向量长度;所述通过所述预训练语言模型,获取所述待预测文本对应的词向量信息,包括:
通过所述预训练语言模型的应用层对所述待预测文本进行分析,获取所述待预测文本中的样本标识和所述待预测文本中的字词长度;
基于所述样本标识、所述字词长度和预置词向量长度,获取所述预训练语言模型的输出层输出所述待预测文本的词向量信息。
3.如权利要求1所述的文本韵律边界预测的方法,其特征在于,所述词向量信息包括样本标识、字词长度和预置词向量长度;所述根据所述词向量信息,得到对应的多维向量信息,包括:
获取所述向量信息中字词长度和所述预置词向量长度的位置,并将所述词向量信息中字词长度和所述预置词向量长度位置进行变换,得到对应的维度向量信息;
对所述维度向量信息中预置词向量长度进行维度拆分,得到多维向量信息。
4.如权利要求1所述的文本韵律边界预测的方法,其特征在于,所述二维卷积模型包括卷积层和全连接层;所述通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息,包括:
根据所述卷积层对所述多维向量信息进行卷积计算,得到所述多维向量信息的目标数据规则信息;
基于所述全连接层对所述目标数据规则信息进行分类,得到所述待预测文本中各个字词的分类标签信息。
5.如权利要求4所述的文本韵律边界预测的方法,其特征在于,所述基于所述全连接层对所述目标数据规则进行分类,得到所述待预测文本中各个字词的分类标签信息,包括:
通过所述全连接层中预置分类器对所述目标数据规则信息进行分类,得到各个字词对应的分类向量信息;
基于各个所述字词的分类向量信息,得到各个所述字词的分类标签信息。
6.如权利要求1所述的文本韵律边界预测的方法,其特征在于,所述分类标签信息包括分类信息和标签信息;所述通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息,包括:
若通过所述分类层识别所述分类信息为韵律分类,则通过标签信息确定各个所述字词是否为韵律词;
若通过所述分类层识别所述分类信息为韵律短语分类,则通过标签信息确定各个所述字词是否为韵律短语;
若通过所述分类层识别所述分类信息为语调短语分类,则通过标签信息确定各个所述字词是否为语调短语;
若通过所述分类层识别所述分类信息不是韵律分类、韵律短语分类和语调短语分类,则确定各个所述字词为背景类。
7.如权利要求1所述的文本韵律边界预测的方法,其特征在于,所述将获取到的待预测文本输入预置文本韵律边界模型中之前,包括:
获取多个带标注文本;
将多个所述带标注文本输入预置待训练模型;
通过多个所述带标注文本对所述预置待训练模型进行训练,获取对应的损失交叉熵函数;
通过所述损失交叉熵函数对所述预置待训练模型的模型参数进行更新,生成对应的文本韵律边界模型。
8.一种文本韵律边界预测装置,其特征在于,包括:
第一获取模块,用于将获取到的待预测文本输入预置文本韵律边界模型中,其中,所述文本韵律边界模型包括预训练语言模型、二维卷积模型、分类层;
第二获取模块,用于通过所述预训练语言模型,获取所述待预测文本对应的词向量信息;
第三获取模块,用于根据所述词向量信息,获取对应的多维向量信息;
第四获取模块,用于通过所述二维卷积模型对所述多维向量信息进行卷积处理,得到所述待预测文本中各个字词对应的分类标签信息;
确定模块,用于通过所述分类层识别所述分类标签信息,确定各个所述字词的韵律边界信息。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1至7中任一项所述的文本韵律边界预测的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的文本韵律边界预测的方法的步骤。
CN202110193245.0A 2021-02-20 2021-02-20 文本韵律边界预测的方法、装置、设备及存储介质 Active CN112988964B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110193245.0A CN112988964B (zh) 2021-02-20 2021-02-20 文本韵律边界预测的方法、装置、设备及存储介质
PCT/CN2021/084280 WO2022174499A1 (zh) 2021-02-20 2021-03-31 文本韵律边界预测的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110193245.0A CN112988964B (zh) 2021-02-20 2021-02-20 文本韵律边界预测的方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112988964A true CN112988964A (zh) 2021-06-18
CN112988964B CN112988964B (zh) 2024-03-08

Family

ID=76393765

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110193245.0A Active CN112988964B (zh) 2021-02-20 2021-02-20 文本韵律边界预测的方法、装置、设备及存储介质

Country Status (2)

Country Link
CN (1) CN112988964B (zh)
WO (1) WO2022174499A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114091444A (zh) * 2021-11-15 2022-02-25 北京声智科技有限公司 文本处理方法、装置、计算机设备及存储介质
CN114416213A (zh) * 2022-03-29 2022-04-29 北京沃丰时代数据科技有限公司 词向量文件加载方法、装置及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108345633A (zh) * 2017-12-29 2018-07-31 天津南大通用数据技术股份有限公司 一种自然语言处理方法及装置
CN110119786A (zh) * 2019-05-20 2019-08-13 北京奇艺世纪科技有限公司 文本话题分类方法及装置
CN110427456A (zh) * 2019-06-26 2019-11-08 平安科技(深圳)有限公司 一种词语联想的方法及装置
CN110782870A (zh) * 2019-09-06 2020-02-11 腾讯科技(深圳)有限公司 语音合成方法、装置、电子设备及存储介质
CN111261140A (zh) * 2020-01-16 2020-06-09 云知声智能科技股份有限公司 韵律模型训练方法及装置
US20200320388A1 (en) * 2019-04-03 2020-10-08 Mashtraxx Limited Method of training a neural network to reflect emotional perception and related system and method for categorizing and finding associated content

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105185374B (zh) * 2015-09-11 2017-03-29 百度在线网络技术(北京)有限公司 韵律层级标注方法和装置
CN107451115B (zh) * 2017-07-11 2020-03-06 中国科学院自动化研究所 端到端的汉语韵律层级结构预测模型的构建方法及系统
CN108305612B (zh) * 2017-11-21 2020-07-31 腾讯科技(深圳)有限公司 文本处理、模型训练方法、装置、存储介质和计算机设备
CN109886294B (zh) * 2019-01-11 2024-01-23 平安科技(深圳)有限公司 知识融合方法、装置、计算机设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108345633A (zh) * 2017-12-29 2018-07-31 天津南大通用数据技术股份有限公司 一种自然语言处理方法及装置
US20200320388A1 (en) * 2019-04-03 2020-10-08 Mashtraxx Limited Method of training a neural network to reflect emotional perception and related system and method for categorizing and finding associated content
CN110119786A (zh) * 2019-05-20 2019-08-13 北京奇艺世纪科技有限公司 文本话题分类方法及装置
CN110427456A (zh) * 2019-06-26 2019-11-08 平安科技(深圳)有限公司 一种词语联想的方法及装置
CN110782870A (zh) * 2019-09-06 2020-02-11 腾讯科技(深圳)有限公司 语音合成方法、装置、电子设备及存储介质
CN111261140A (zh) * 2020-01-16 2020-06-09 云知声智能科技股份有限公司 韵律模型训练方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114091444A (zh) * 2021-11-15 2022-02-25 北京声智科技有限公司 文本处理方法、装置、计算机设备及存储介质
CN114416213A (zh) * 2022-03-29 2022-04-29 北京沃丰时代数据科技有限公司 词向量文件加载方法、装置及存储介质
CN114416213B (zh) * 2022-03-29 2022-06-28 北京沃丰时代数据科技有限公司 词向量文件加载方法、装置及存储介质

Also Published As

Publication number Publication date
WO2022174499A1 (zh) 2022-08-25
CN112988964B (zh) 2024-03-08

Similar Documents

Publication Publication Date Title
CN112464641B (zh) 基于bert的机器阅读理解方法、装置、设备及存储介质
CN108959246B (zh) 基于改进的注意力机制的答案选择方法、装置和电子设备
CN110347835B (zh) 文本聚类方法、电子装置及存储介质
Kuang et al. SymNMF: nonnegative low-rank approximation of a similarity matrix for graph clustering
JP2020520492A (ja) 文書要約自動抽出方法、装置、コンピュータ機器及び記憶媒体
GB2571825A (en) Semantic class localization digital environment
CN112686049A (zh) 文本审核方法、装置、设备及存储介质
CN111985229A (zh) 一种序列标注方法、装置及计算机设备
CN112528634A (zh) 文本纠错模型训练、识别方法、装置、设备及存储介质
CN112052684A (zh) 电力计量的命名实体识别方法、装置、设备和存储介质
WO2022174496A1 (zh) 基于生成模型的数据标注方法、装置、设备及存储介质
CN112988964B (zh) 文本韵律边界预测的方法、装置、设备及存储介质
CN115244587A (zh) 高效基础事实注释
WO2014073206A1 (ja) 情報処理装置、及び、情報処理方法
CN114064852A (zh) 自然语言的关系抽取方法、装置、电子设备和存储介质
CN113886601A (zh) 电子文本事件抽取方法、装置、设备及存储介质
CN104699660A (zh) 概述非线性回归问题中的结构化矩阵
CN115237410A (zh) 一种用户界面的生成方法及装置
CN108875024B (zh) 文本分类方法、系统、可读存储介质及电子设备
CN113360654A (zh) 文本分类方法、装置、电子设备及可读存储介质
CN112446205A (zh) 语句判别方法、装置、设备及存储介质
CN111723186A (zh) 用于对话系统的基于人工智能的知识图谱生成方法、电子设备
CN114691716A (zh) Sql语句转换方法、装置、设备及计算机可读存储介质
CN115238645A (zh) 资产数据识别方法、装置、电子设备和计算机存储介质
CN111767710B (zh) 印尼语的情感分类方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant