BR112015018205A2 - método e dispositivo para a formação de modelo de linguagem acústica - Google Patents
método e dispositivo para a formação de modelo de linguagem acústicaInfo
- Publication number
- BR112015018205A2 BR112015018205A2 BR112015018205A BR112015018205A BR112015018205A2 BR 112015018205 A2 BR112015018205 A2 BR 112015018205A2 BR 112015018205 A BR112015018205 A BR 112015018205A BR 112015018205 A BR112015018205 A BR 112015018205A BR 112015018205 A2 BR112015018205 A2 BR 112015018205A2
- Authority
- BR
- Brazil
- Prior art keywords
- word
- class labels
- language model
- segmentation data
- contain
- Prior art date
Links
- 238000000034 method Methods 0.000 title abstract 3
- 230000015572 biosynthetic process Effects 0.000 title abstract 2
- 230000011218 segmentation Effects 0.000 abstract 9
- 238000006467 substitution reaction Methods 0.000 abstract 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
- G10L15/05—Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0631—Creating reference templates; Clustering
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
resumo patente de invenção: "método e dispositivo para a formação de modelo de linguagem acústica". a presente invenção refere-se ao método e ao dispositivo para formar um modelo de linguagem acústica, que inclui: a realização de segmentação de palavra para as amostras de formação em um corpo de formação com o uso de um modelo de linguagem inicial que não contém os rótulos de classe de palavra para obter os dados de segmentação de palavra inicial que não contêm os rótulos de classe de palavra; realizar a substituição de classe de palavra para os dados de segmentação de palavra inicial que não contêm os rótulos de classe de palavra para obter os primeiros dados de segmentação de palavra que contêm os rótulos de classe de palavra, com o uso dos primeiros dados de segmentação de palavra que contêm os rótulos de classe de palavra para formar um primeiro modelo de linguagem que contêm os rótulos de classe de palavra; utilizar o primeiro modelo de linguagem que contêm os rótulos de classe de palavra para realizar a segmentação de palavra para as amostras de formação no corpo de formação para obter o segundo dado de segmentação de palavra que contêm os rótulos de classe de palavra; e em conformidade com o segundo dado de segmentação de palavra que corresponde a um ou mais critérios predeterminados, utilizar o segundo dado de segmentação de palavra que contêm os rótulos de classe de palavra para formar o modelo de linguagem acústica.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310040085.1 | 2013-02-01 | ||
CN201310040085.1A CN103971677B (zh) | 2013-02-01 | 2013-02-01 | 一种声学语言模型训练方法和装置 |
PCT/CN2013/085948 WO2014117548A1 (en) | 2013-02-01 | 2013-10-25 | Method and device for acoustic language model training |
Publications (2)
Publication Number | Publication Date |
---|---|
BR112015018205A2 true BR112015018205A2 (pt) | 2017-07-18 |
BR112015018205B1 BR112015018205B1 (pt) | 2022-02-15 |
Family
ID=51241096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112015018205-4A BR112015018205B1 (pt) | 2013-02-01 | 2013-10-25 | Método e sistema para a formação de modelo de linguagem acústica, e meio de armazenamento legível por computador. |
Country Status (6)
Country | Link |
---|---|
JP (1) | JP5901001B1 (pt) |
CN (1) | CN103971677B (pt) |
BR (1) | BR112015018205B1 (pt) |
CA (1) | CA2899532C (pt) |
TW (1) | TWI512719B (pt) |
WO (1) | WO2014117548A1 (pt) |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106486114A (zh) * | 2015-08-28 | 2017-03-08 | 株式会社东芝 | 改进语言模型的方法和装置以及语音识别方法和装置 |
JP6312942B2 (ja) * | 2015-10-09 | 2018-04-18 | 三菱電機株式会社 | 言語モデル生成装置、言語モデル生成方法とそのプログラム |
CN105654945B (zh) * | 2015-10-29 | 2020-03-06 | 乐融致新电子科技(天津)有限公司 | 一种语言模型的训练方法及装置、设备 |
CN107204184B (zh) * | 2017-05-10 | 2018-08-03 | 平安科技(深圳)有限公司 | 语音识别方法及系统 |
CN109427330B (zh) * | 2017-09-05 | 2023-04-07 | 中国科学院声学研究所 | 一种基于统计语言模型得分规整的语音识别方法及系统 |
TWI639997B (zh) * | 2017-09-28 | 2018-11-01 | 大仁科技大學 | 基於機率規則之對話理解方法 |
CN110019305B (zh) * | 2017-12-18 | 2024-03-15 | 上海智臻智能网络科技股份有限公司 | 知识库扩展方法及存储介质、终端 |
CN110083820B (zh) * | 2018-01-26 | 2023-06-27 | 普天信息技术有限公司 | 一种基准分词模型的改进方法及装置 |
CN108197116B (zh) * | 2018-01-31 | 2021-05-28 | 天闻数媒科技(北京)有限公司 | 一种中文文本分词的方法、装置、分词设备及存储介质 |
CN110648657B (zh) * | 2018-06-27 | 2024-02-02 | 北京搜狗科技发展有限公司 | 一种语言模型训练方法、构建方法和装置 |
CN109616121A (zh) * | 2018-11-28 | 2019-04-12 | 北京捷通华声科技股份有限公司 | 一种数字转换方法和装置 |
CN109949797B (zh) * | 2019-03-11 | 2021-11-12 | 北京百度网讯科技有限公司 | 一种训练语料的生成方法、装置、设备及存储介质 |
CN110110041B (zh) * | 2019-03-15 | 2022-02-15 | 平安科技(深圳)有限公司 | 错词纠正方法、装置、计算机装置及存储介质 |
CN111694962A (zh) * | 2019-03-15 | 2020-09-22 | 阿里巴巴集团控股有限公司 | 数据处理方法和装置 |
US11417313B2 (en) | 2019-04-23 | 2022-08-16 | Lg Electronics Inc. | Speech synthesizer using artificial intelligence, method of operating speech synthesizer and computer-readable recording medium |
US11393447B2 (en) | 2019-06-18 | 2022-07-19 | Lg Electronics Inc. | Speech synthesizer using artificial intelligence, method of operating speech synthesizer and computer-readable recording medium |
CN110442859B (zh) * | 2019-06-28 | 2023-05-26 | 中国人民解放军国防科技大学 | 标注语料生成方法、装置、设备及存储介质 |
CN110489744B (zh) * | 2019-07-25 | 2024-05-14 | 腾讯科技(深圳)有限公司 | 一种语料的处理方法、装置、电子设备和存储介质 |
CN110781660A (zh) * | 2019-10-25 | 2020-02-11 | 腾讯科技(深圳)有限公司 | 语句识别方法、装置以及计算机可读介质 |
CN111143521B (zh) * | 2019-10-28 | 2023-08-15 | 广州恒巨信息科技有限公司 | 基于知识图谱的法条检索方法、系统、装置及存储介质 |
CN110992939B (zh) * | 2019-12-18 | 2023-06-27 | 广州市百果园信息技术有限公司 | 语言模型训练方法、解码方法、装置、存储介质及设备 |
CN111125360B (zh) * | 2019-12-19 | 2023-10-20 | 网易(杭州)网络有限公司 | 游戏领域的情感分析方法、装置及其模型训练方法、装置 |
CN111291560B (zh) * | 2020-03-06 | 2023-05-23 | 深圳前海微众银行股份有限公司 | 样本扩充方法、终端、装置及可读存储介质 |
CN111507104B (zh) | 2020-03-19 | 2022-03-25 | 北京百度网讯科技有限公司 | 建立标签标注模型的方法、装置、电子设备和可读存储介质 |
CN112397054B (zh) * | 2020-12-17 | 2023-11-24 | 北京中电飞华通信有限公司 | 一种电力调度语音识别方法 |
CN112735380B (zh) * | 2020-12-28 | 2022-05-13 | 思必驰科技股份有限公司 | 重打分语言模型的打分方法及语音识别方法 |
CN113177109B (zh) * | 2021-05-27 | 2024-07-16 | 中国平安人寿保险股份有限公司 | 文本的弱标注方法、装置、设备以及存储介质 |
CN116612750A (zh) * | 2023-05-23 | 2023-08-18 | 苏州科帕特信息科技有限公司 | 一种语言模型自动训练方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6404925B1 (en) * | 1999-03-11 | 2002-06-11 | Fuji Xerox Co., Ltd. | Methods and apparatuses for segmenting an audio-visual recording using image similarity searching and audio speaker recognition |
JP4590692B2 (ja) * | 2000-06-28 | 2010-12-01 | パナソニック株式会社 | 音響モデル作成装置及びその方法 |
CN1141697C (zh) * | 2000-09-27 | 2004-03-10 | 中国科学院自动化研究所 | 一种带调三音子模型及训练方法 |
US20050256715A1 (en) * | 2002-10-08 | 2005-11-17 | Yoshiyuki Okimoto | Language model generation and accumulation device, speech recognition device, language model creation method, and speech recognition method |
DE10350652B3 (de) * | 2003-10-29 | 2005-06-30 | Yazaki Europe Ltd., Hemel Hempstead | Steckverbindergehäuse mit Kurzschlußbrücke |
US7684987B2 (en) * | 2004-01-21 | 2010-03-23 | Microsoft Corporation | Segmental tonal modeling for tonal languages |
FR2892846A1 (fr) * | 2005-11-03 | 2007-05-04 | France Telecom | Procede et dispositif de calcul de mesure de similarite entre une representation d'un segment audio de reference et une representation d'un segment audio a tester et procede et dispositif de suivi d'un locuteur de reference |
TWI297487B (en) * | 2005-11-18 | 2008-06-01 | Tze Fen Li | A method for speech recognition |
WO2007138875A1 (ja) * | 2006-05-31 | 2007-12-06 | Nec Corporation | 音声認識用単語辞書・言語モデル作成システム、方法、プログラムおよび音声認識システム |
WO2007148493A1 (ja) * | 2006-06-23 | 2007-12-27 | Panasonic Corporation | 感情認識装置 |
US7617103B2 (en) * | 2006-08-25 | 2009-11-10 | Microsoft Corporation | Incrementally regulated discriminative margins in MCE training for speech recognition |
CN101261832B (zh) * | 2008-04-21 | 2011-05-25 | 北京航空航天大学 | 汉语语音情感信息的提取及建模方法 |
TWI389100B (zh) * | 2008-11-19 | 2013-03-11 | Inst Information Industry | 語音情緒的分類方法及其情緒語意模型的建立方法 |
CN102568477A (zh) * | 2010-12-29 | 2012-07-11 | 盛乐信息技术(上海)有限公司 | 一种半监督的发音模型建模系统及方法 |
CN102651217A (zh) * | 2011-02-25 | 2012-08-29 | 株式会社东芝 | 用于合成语音的方法、设备以及用于语音合成的声学模型训练方法 |
-
2013
- 2013-02-01 CN CN201310040085.1A patent/CN103971677B/zh active Active
- 2013-10-25 WO PCT/CN2013/085948 patent/WO2014117548A1/en active Application Filing
- 2013-10-25 CA CA2899532A patent/CA2899532C/en active Active
- 2013-10-25 BR BR112015018205-4A patent/BR112015018205B1/pt active IP Right Grant
- 2013-10-25 JP JP2015555551A patent/JP5901001B1/ja active Active
-
2014
- 2014-01-07 TW TW103100469A patent/TWI512719B/zh active
Also Published As
Publication number | Publication date |
---|---|
BR112015018205B1 (pt) | 2022-02-15 |
WO2014117548A1 (en) | 2014-08-07 |
JP5901001B1 (ja) | 2016-04-06 |
TWI512719B (zh) | 2015-12-11 |
JP2016513269A (ja) | 2016-05-12 |
CN103971677A (zh) | 2014-08-06 |
CN103971677B (zh) | 2015-08-12 |
CA2899532A1 (en) | 2014-08-07 |
TW201432669A (zh) | 2014-08-16 |
CA2899532C (en) | 2017-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR112015018205A2 (pt) | método e dispositivo para a formação de modelo de linguagem acústica | |
BR112014017937A8 (pt) | método, aparelho e dispositivo terminal para processamento de imagem | |
BR112015012297A2 (pt) | conexões implícitas de gráfico social | |
BR112018013427A2 (pt) | transmissão de identificação digital a abordo de veículo | |
BR112016024007A2 (pt) | métodos e sistemas para gerenciar os diálogos de um robô | |
BR112017003784A2 (pt) | ferramentas de produtividade para autorização de conteúdo | |
BR112017012796A2 (pt) | métodos para entender consulta incompleta em linguagem natural | |
BR112017009666A2 (pt) | método e dispositivo para mineração de dados com base em plataforma social | |
BR112013010516A2 (pt) | sistema e método para gerar um modelo geoestatístico de um volume geológico relevante, que é limitado por um modelo baseado em processo do volume geológico relevante | |
BR102013002579A8 (pt) | métodos, sistemas e produtos de programa baseados na localização para execução de uma ação no dispositivo de um usuário | |
EP2857983A3 (en) | Analyzing font similarity for presentation | |
BRPI1004942A8 (pt) | Sistema de processamento de dados, meio legível por computador não transitório, e método para execução de um mecanismo de escrita | |
BR112019009519A8 (pt) | Sistema de transação biométrica | |
BR112016025340A8 (pt) | configurar fluxos de trabalho em um dispositivo anfitrião que opera em um sistema de controle de processo | |
BR112015015959A2 (pt) | método, dispositivo de armazenamento legível por máquina e sistema | |
BR112015019326A2 (pt) | dispositivo de registro de amostragem e armazenamento para análise de gás respiratório | |
BR112015030492A2 (pt) | aparelho e método de processamento de informação, e, dispositivo de armazenamento legível por computador não temporário | |
BR112016017406A2 (pt) | Método e dispositivo para determinar um modelo ambiental de dimensão n+1 e aparelho de prospecção | |
BR112015000809A2 (pt) | métodos e aparelhos para integrar uma parte de componentes de elemento seguro em um sistema em chip | |
BR112017003627A2 (pt) | ferramentas de produtividade para elaboração de conteúdo | |
BR112017007201A2 (pt) | buscas múltiplas e tarefas múltiplas em busca | |
BR112019001236A2 (pt) | sistemas e métodos para a execução de um funcionamento suplementar para uma consulta de linguagem natural | |
BR112017013615A2 (pt) | sistema e método para localizar automaticamente efeitos hápticos em um corpo | |
BR112015019056A2 (pt) | sistemas e métodos para realização de controle de ganho | |
BR112015029368A2 (pt) | sistema e método para processar plástico, e plástico processado a partir dos mesmos |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B06U | Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 25/10/2013, OBSERVADAS AS CONDICOES LEGAIS. |