CN113302683A - 多音字预测方法及消歧方法、装置、设备及计算机可读存储介质 - Google Patents

多音字预测方法及消歧方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN113302683A
CN113302683A CN201980003196.0A CN201980003196A CN113302683A CN 113302683 A CN113302683 A CN 113302683A CN 201980003196 A CN201980003196 A CN 201980003196A CN 113302683 A CN113302683 A CN 113302683A
Authority
CN
China
Prior art keywords
polyphone
text
polyphonic
word
texts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201980003196.0A
Other languages
English (en)
Other versions
CN113302683B (zh
Inventor
白洛玉
李贤�
张皓
黄东延
丁万
熊友军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ubtech Technology Co ltd
Original Assignee
Shenzhen Ubtech Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Ubtech Technology Co ltd filed Critical Shenzhen Ubtech Technology Co ltd
Publication of CN113302683A publication Critical patent/CN113302683A/zh
Application granted granted Critical
Publication of CN113302683B publication Critical patent/CN113302683B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/10Prosody rules derived from text; Stress or intonation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

一种多音字预测方法及消歧方法、装置、设备及计算机可读存储介质,该多音字预测方法包括如下步骤:获取待预测文本中的多音字文本、以及多音字文本在待预测文本中的上文文本和/或下文文本(S20);构建多音字文本、上文文本、下文文本各自对应的一个或多个特征向量(S30);将上文文本的特征向量、多音字文本的特征向量、下文文本的特征向量输入多音字预测模型获得多音字预测结果;多音字预测模型包括第一神经网络模块、第二神经网络模块和第三神经网络模块;第一神经网络模块输入上文文本的特征向量并得到第一输出向量,第二神经网络模块输入多音字文本的特征向量并得到第二输出向量,第三神经网络模块输入下文文本的特征向量并得到第三输出向量;多音字预测结果包括多音字的每种读音的发音概率,通过将第一输出向量、第二输出向量和第三输出向量进行拼接来获得(S40);基于多音字的每种读音的发音概率来确定多音字在待预测文本中的读音(S50)。有利于提高对多音字读音预测的准确度,有效避免分类干扰,编解码实现容易。

Description

PCT国内申请,说明书已公开。

Claims (18)

  1. PCT国内申请,权利要求书已公开。
CN201980003196.0A 2019-12-24 2019-12-24 多音字预测方法及消歧方法、装置、设备及计算机可读存储介质 Active CN113302683B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2019/127956 WO2021127987A1 (zh) 2019-12-24 2019-12-24 多音字预测方法及消歧方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN113302683A true CN113302683A (zh) 2021-08-24
CN113302683B CN113302683B (zh) 2023-08-04

Family

ID=76573435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980003196.0A Active CN113302683B (zh) 2019-12-24 2019-12-24 多音字预测方法及消歧方法、装置、设备及计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN113302683B (zh)
WO (1) WO2021127987A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114417832A (zh) * 2021-12-08 2022-04-29 马上消费金融股份有限公司 消歧方法、消歧模型的训练方法及装置
CN114662478A (zh) * 2022-03-23 2022-06-24 京东科技信息技术有限公司 发音预测方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017067206A1 (zh) * 2015-10-20 2017-04-27 百度在线网络技术(北京)有限公司 个性化多声学模型的训练方法、语音合成方法及装置
CN106910497A (zh) * 2015-12-22 2017-06-30 阿里巴巴集团控股有限公司 一种中文词语发音预测方法及装置
CN107515850A (zh) * 2016-06-15 2017-12-26 阿里巴巴集团控股有限公司 确定多音字发音的方法、装置和系统
CN107729313A (zh) * 2017-09-25 2018-02-23 百度在线网络技术(北京)有限公司 基于深度神经网络的多音字读音的判别方法和装置
WO2019200806A1 (zh) * 2018-04-20 2019-10-24 平安科技(深圳)有限公司 文本分类模型的生成装置、方法及计算机可读存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5936698B2 (ja) * 2012-08-27 2016-06-22 株式会社日立製作所 単語意味関係抽出装置
CN102915299B (zh) * 2012-10-23 2015-04-08 海信集团有限公司 一种分词方法及装置
CN105336322B (zh) * 2015-09-30 2017-05-10 百度在线网络技术(北京)有限公司 多音字模型训练方法、语音合成方法及装置
CN106803422B (zh) * 2015-11-26 2020-05-12 中国科学院声学研究所 一种基于长短时记忆网络的语言模型重估方法
CN107402933A (zh) * 2016-05-20 2017-11-28 富士通株式会社 实体多音字消歧方法和实体多音字消歧设备
KR102329127B1 (ko) * 2017-04-11 2021-11-22 삼성전자주식회사 방언을 표준어로 변환하는 방법 및 장치
CN107464559B (zh) * 2017-07-11 2020-12-15 中国科学院自动化研究所 基于汉语韵律结构和重音的联合预测模型构建方法及系统
CN109117480B (zh) * 2018-08-17 2022-05-27 腾讯科技(深圳)有限公司 词预测方法、装置、计算机设备及存储介质
CN110277085B (zh) * 2019-06-25 2021-08-24 腾讯科技(深圳)有限公司 确定多音字发音的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017067206A1 (zh) * 2015-10-20 2017-04-27 百度在线网络技术(北京)有限公司 个性化多声学模型的训练方法、语音合成方法及装置
CN106910497A (zh) * 2015-12-22 2017-06-30 阿里巴巴集团控股有限公司 一种中文词语发音预测方法及装置
CN107515850A (zh) * 2016-06-15 2017-12-26 阿里巴巴集团控股有限公司 确定多音字发音的方法、装置和系统
CN107729313A (zh) * 2017-09-25 2018-02-23 百度在线网络技术(北京)有限公司 基于深度神经网络的多音字读音的判别方法和装置
WO2019200806A1 (zh) * 2018-04-20 2019-10-24 平安科技(深圳)有限公司 文本分类模型的生成装置、方法及计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
范明;胡国平;王仁华;: "汉语字音转换中的多层面多音字读音消歧", 计算机工程与应用, no. 02 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114417832A (zh) * 2021-12-08 2022-04-29 马上消费金融股份有限公司 消歧方法、消歧模型的训练方法及装置
CN114662478A (zh) * 2022-03-23 2022-06-24 京东科技信息技术有限公司 发音预测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
WO2021127987A1 (zh) 2021-07-01
CN113302683B (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
US11403680B2 (en) Method, apparatus for evaluating review, device and storage medium
CN110162627B (zh) 数据增量方法、装置、计算机设备及存储介质
CN108711422B (zh) 语音识别方法、装置、计算机可读存储介质和计算机设备
CN111753531B (zh) 基于人工智能的文本纠错方法、装置、设备及存储介质
CN107729313B (zh) 基于深度神经网络的多音字读音的判别方法和装置
JP7441864B2 (ja) 多音字の発音を予測する方法、装置、設備、および記憶媒体
JP5901001B1 (ja) 音響言語モデルトレーニングのための方法およびデバイス
US9508341B1 (en) Active learning for lexical annotations
CN112836514B (zh) 嵌套实体识别方法、装置、电子设备和存储介质
CN111192568B (zh) 一种语音合成方法及语音合成装置
CN110895559B (zh) 模型训练、文本处理方法、装置以及设备
CN112084769B (zh) 依存句法模型优化方法、装置、设备及可读存储介质
CN111291565A (zh) 一种用于命名实体识别的方法与装置
CN113302683B (zh) 多音字预测方法及消歧方法、装置、设备及计算机可读存储介质
CN113190669A (zh) 智能对话方法、装置、终端及存储介质
US9658999B2 (en) Language processing method and electronic device
JP5441937B2 (ja) 言語モデル学習装置、言語モデル学習方法、言語解析装置、及びプログラム
US11893344B2 (en) Morpheme analysis learning device, morpheme analysis device, method, and program
CN110968661A (zh) 事件抽取方法及系统、计算机可读存储介质及电子设备
CN117153142A (zh) 一种语音信号合成方法、装置、电子设备及存储介质
CN117475985A (zh) 语音合成方法、装置、计算机设备及存储介质
CN116579327A (zh) 文本纠错模型训练方法、文本纠错方法、设备及存储介质
CN109144284B (zh) 信息显示方法和装置
KR20230064304A (ko) 자동 레이블링 장치 및 이를 이용한 발화 문장의 레이블링 방법
CN114444492A (zh) 一种非标准词类判别方法及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant