CN113302683A - 多音字预测方法及消歧方法、装置、设备及计算机可读存储介质 - Google Patents
多音字预测方法及消歧方法、装置、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN113302683A CN113302683A CN201980003196.0A CN201980003196A CN113302683A CN 113302683 A CN113302683 A CN 113302683A CN 201980003196 A CN201980003196 A CN 201980003196A CN 113302683 A CN113302683 A CN 113302683A
- Authority
- CN
- China
- Prior art keywords
- polyphone
- text
- polyphonic
- word
- texts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 85
- 239000013598 vector Substances 0.000 claims abstract description 173
- 238000013528 artificial neural network Methods 0.000 claims abstract description 56
- 230000011218 segmentation Effects 0.000 claims description 128
- 238000012549 training Methods 0.000 claims description 37
- 230000015654 memory Effects 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 15
- 238000013507 mapping Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 6
- 230000006403 short-term memory Effects 0.000 claims description 2
- 230000007774 longterm Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
一种多音字预测方法及消歧方法、装置、设备及计算机可读存储介质,该多音字预测方法包括如下步骤:获取待预测文本中的多音字文本、以及多音字文本在待预测文本中的上文文本和/或下文文本(S20);构建多音字文本、上文文本、下文文本各自对应的一个或多个特征向量(S30);将上文文本的特征向量、多音字文本的特征向量、下文文本的特征向量输入多音字预测模型获得多音字预测结果;多音字预测模型包括第一神经网络模块、第二神经网络模块和第三神经网络模块;第一神经网络模块输入上文文本的特征向量并得到第一输出向量,第二神经网络模块输入多音字文本的特征向量并得到第二输出向量,第三神经网络模块输入下文文本的特征向量并得到第三输出向量;多音字预测结果包括多音字的每种读音的发音概率,通过将第一输出向量、第二输出向量和第三输出向量进行拼接来获得(S40);基于多音字的每种读音的发音概率来确定多音字在待预测文本中的读音(S50)。有利于提高对多音字读音预测的准确度,有效避免分类干扰,编解码实现容易。
Description
PCT国内申请,说明书已公开。
Claims (18)
- PCT国内申请,权利要求书已公开。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2019/127956 WO2021127987A1 (zh) | 2019-12-24 | 2019-12-24 | 多音字预测方法及消歧方法、装置、设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113302683A true CN113302683A (zh) | 2021-08-24 |
CN113302683B CN113302683B (zh) | 2023-08-04 |
Family
ID=76573435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980003196.0A Active CN113302683B (zh) | 2019-12-24 | 2019-12-24 | 多音字预测方法及消歧方法、装置、设备及计算机可读存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113302683B (zh) |
WO (1) | WO2021127987A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114417832A (zh) * | 2021-12-08 | 2022-04-29 | 马上消费金融股份有限公司 | 消歧方法、消歧模型的训练方法及装置 |
CN114662478A (zh) * | 2022-03-23 | 2022-06-24 | 京东科技信息技术有限公司 | 发音预测方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017067206A1 (zh) * | 2015-10-20 | 2017-04-27 | 百度在线网络技术(北京)有限公司 | 个性化多声学模型的训练方法、语音合成方法及装置 |
CN106910497A (zh) * | 2015-12-22 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 一种中文词语发音预测方法及装置 |
CN107515850A (zh) * | 2016-06-15 | 2017-12-26 | 阿里巴巴集团控股有限公司 | 确定多音字发音的方法、装置和系统 |
CN107729313A (zh) * | 2017-09-25 | 2018-02-23 | 百度在线网络技术(北京)有限公司 | 基于深度神经网络的多音字读音的判别方法和装置 |
WO2019200806A1 (zh) * | 2018-04-20 | 2019-10-24 | 平安科技(深圳)有限公司 | 文本分类模型的生成装置、方法及计算机可读存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5936698B2 (ja) * | 2012-08-27 | 2016-06-22 | 株式会社日立製作所 | 単語意味関係抽出装置 |
CN102915299B (zh) * | 2012-10-23 | 2015-04-08 | 海信集团有限公司 | 一种分词方法及装置 |
CN105336322B (zh) * | 2015-09-30 | 2017-05-10 | 百度在线网络技术(北京)有限公司 | 多音字模型训练方法、语音合成方法及装置 |
CN106803422B (zh) * | 2015-11-26 | 2020-05-12 | 中国科学院声学研究所 | 一种基于长短时记忆网络的语言模型重估方法 |
CN107402933A (zh) * | 2016-05-20 | 2017-11-28 | 富士通株式会社 | 实体多音字消歧方法和实体多音字消歧设备 |
KR102329127B1 (ko) * | 2017-04-11 | 2021-11-22 | 삼성전자주식회사 | 방언을 표준어로 변환하는 방법 및 장치 |
CN107464559B (zh) * | 2017-07-11 | 2020-12-15 | 中国科学院自动化研究所 | 基于汉语韵律结构和重音的联合预测模型构建方法及系统 |
CN109117480B (zh) * | 2018-08-17 | 2022-05-27 | 腾讯科技(深圳)有限公司 | 词预测方法、装置、计算机设备及存储介质 |
CN110277085B (zh) * | 2019-06-25 | 2021-08-24 | 腾讯科技(深圳)有限公司 | 确定多音字发音的方法及装置 |
-
2019
- 2019-12-24 CN CN201980003196.0A patent/CN113302683B/zh active Active
- 2019-12-24 WO PCT/CN2019/127956 patent/WO2021127987A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017067206A1 (zh) * | 2015-10-20 | 2017-04-27 | 百度在线网络技术(北京)有限公司 | 个性化多声学模型的训练方法、语音合成方法及装置 |
CN106910497A (zh) * | 2015-12-22 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 一种中文词语发音预测方法及装置 |
CN107515850A (zh) * | 2016-06-15 | 2017-12-26 | 阿里巴巴集团控股有限公司 | 确定多音字发音的方法、装置和系统 |
CN107729313A (zh) * | 2017-09-25 | 2018-02-23 | 百度在线网络技术(北京)有限公司 | 基于深度神经网络的多音字读音的判别方法和装置 |
WO2019200806A1 (zh) * | 2018-04-20 | 2019-10-24 | 平安科技(深圳)有限公司 | 文本分类模型的生成装置、方法及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
范明;胡国平;王仁华;: "汉语字音转换中的多层面多音字读音消歧", 计算机工程与应用, no. 02 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114417832A (zh) * | 2021-12-08 | 2022-04-29 | 马上消费金融股份有限公司 | 消歧方法、消歧模型的训练方法及装置 |
CN114662478A (zh) * | 2022-03-23 | 2022-06-24 | 京东科技信息技术有限公司 | 发音预测方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2021127987A1 (zh) | 2021-07-01 |
CN113302683B (zh) | 2023-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11403680B2 (en) | Method, apparatus for evaluating review, device and storage medium | |
CN110162627B (zh) | 数据增量方法、装置、计算机设备及存储介质 | |
CN108711422B (zh) | 语音识别方法、装置、计算机可读存储介质和计算机设备 | |
CN111753531B (zh) | 基于人工智能的文本纠错方法、装置、设备及存储介质 | |
CN107729313B (zh) | 基于深度神经网络的多音字读音的判别方法和装置 | |
JP7441864B2 (ja) | 多音字の発音を予測する方法、装置、設備、および記憶媒体 | |
JP5901001B1 (ja) | 音響言語モデルトレーニングのための方法およびデバイス | |
US9508341B1 (en) | Active learning for lexical annotations | |
CN112836514B (zh) | 嵌套实体识别方法、装置、电子设备和存储介质 | |
CN111192568B (zh) | 一种语音合成方法及语音合成装置 | |
CN110895559B (zh) | 模型训练、文本处理方法、装置以及设备 | |
CN112084769B (zh) | 依存句法模型优化方法、装置、设备及可读存储介质 | |
CN111291565A (zh) | 一种用于命名实体识别的方法与装置 | |
CN113302683B (zh) | 多音字预测方法及消歧方法、装置、设备及计算机可读存储介质 | |
CN113190669A (zh) | 智能对话方法、装置、终端及存储介质 | |
US9658999B2 (en) | Language processing method and electronic device | |
JP5441937B2 (ja) | 言語モデル学習装置、言語モデル学習方法、言語解析装置、及びプログラム | |
US11893344B2 (en) | Morpheme analysis learning device, morpheme analysis device, method, and program | |
CN110968661A (zh) | 事件抽取方法及系统、计算机可读存储介质及电子设备 | |
CN117153142A (zh) | 一种语音信号合成方法、装置、电子设备及存储介质 | |
CN117475985A (zh) | 语音合成方法、装置、计算机设备及存储介质 | |
CN116579327A (zh) | 文本纠错模型训练方法、文本纠错方法、设备及存储介质 | |
CN109144284B (zh) | 信息显示方法和装置 | |
KR20230064304A (ko) | 자동 레이블링 장치 및 이를 이용한 발화 문장의 레이블링 방법 | |
CN114444492A (zh) | 一种非标准词类判别方法及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |