JP2019211747A - 音声接続合成の処理方法及び装置、コンピュータ設備及び読取り可能な媒体 - Google Patents
音声接続合成の処理方法及び装置、コンピュータ設備及び読取り可能な媒体 Download PDFInfo
- Publication number
- JP2019211747A JP2019211747A JP2018239323A JP2018239323A JP2019211747A JP 2019211747 A JP2019211747 A JP 2019211747A JP 2018239323 A JP2018239323 A JP 2018239323A JP 2018239323 A JP2018239323 A JP 2018239323A JP 2019211747 A JP2019211747 A JP 2019211747A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- synthesis
- voice
- library
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/027—Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/06—Elementary speech units used in speech synthesisers; Concatenation rules
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
Abstract
Description
予めに訓練された音声合成モデル及び取得された合成テキストに基づいて、音声ライブラリを拡張すること、
拡張された上記音声ライブラリを利用して音声接続合成処理を行うこと、を含み、
但し、拡張する前の上記音声ライブラリには人工的に採集された原始コーパスを含む。
上記音声合成モデル及び取得された上記合成テキストを利用して、上記合成テキストに対応する合成音声を合成すること、
上記合成テキスト及び対応する上記合成音声を合成コーパスとして、上記音声ライブラリを更新すること、を含む。
拡張する前の上記音声ライブラリにおける人工的に採集された上記原始コーパスに基づいて、上記音声合成モデルを訓練することを含む。
音声ライブラリにおける人工的に採集された原始コーパスに基づいて、音声合成モデルを訓練することは、具体的に、
上記原始テキスト及び対応する上記原始音声に基づいて、上記音声合成モデルを訓練することを含む。
ネットワークから上記合成テキストを抽出することを含む。
本発明に関する音声接続合成の処理装置であって、
予めに訓練された音声合成モデル及び取得された合成テキストに基づいて、音声ライブラリを拡張するための拡張モジュールと、
拡張された上記音声ライブラリを利用して音声接続合成処理を行うための処理モジュールと、を含み、
ただし、拡張する前の上記音声ライブラリには人工的に採集された原始コーパスを含む。
上記音声合成モデル及び取得された上記合成テキストを利用して、上記合成テキストに対応する合成音声を合成し、
上記合成テキスト及び対応する上記合成音声を合成コーパスとして、上記音声ライブラリを更新するために用いられる。
拡張する前の上記音声ライブラリにおける人工的に採集された上記原始コーパスに基づいて、上記音声合成モデルを訓練するための訓練モジュールを含む。
上記訓練モジュールは、具体的に、上記原始テキスト及び対応する上記原始音声に基づいて、上記音声合成モデルを訓練するために用いられる。
ネットワークから上記合成テキストを抽出するための抽出モジュールを含む。
1つ或いは複数のプロセッサと、
1つ或いは複数のプログラムが記憶されているメモリと、を含み、
上記1つ或いは複数のプログラムが上記1つ或いは複数のプロセッサによって実行される時、上記1つ或いは複数のプロセッサに上記音声接続合成の処理方法を実現させる。
予めに訓練された音声合成モデル及び取得された合成テキストに基づいて、音声ライブラリを拡張するための拡張モジュール10と、
拡張モジュール10によって拡張された音声ライブラリを利用して音声接続合成処理を行うための処理モジュール11と、を含むことができ、
但し、拡張する前の音声ライブラリには人工的に採集された原始コーパスを含む。
音声合成モデル及び取得された合成テキストを利用して、該合成テキストに対応する合成音声を合成すること、
合成テキスト及び対応する合成音声を合成コーパスとして音声ライブラリを更新することのために用いられる。
拡張する前の音声ライブラリにおける、人工的に採集された原始コーパスに基づいて、音声合成モデルを訓練するための訓練モジュール12を更に含む。
訓練モジュール12は、具体的に、原始テキスト及び対応する原始音声に基づいて、音声合成モデルを訓練するために用いられる。
Claims (14)
- 音声接続合成の処理方法であって、
予めに訓練された音声合成モデル及び取得された合成テキストに基づいて、音声ライブラリを拡張すること、
拡張された前記音声ライブラリを利用して音声接続合成処理を行うこと、を含み、
但し、拡張する前の前記音声ライブラリには人工的に採集された原始コーパスを含む
音声接続合成の処理方法。 - 予めに訓練された音声合成モデル及び取得された合成テキストに基づいて、音声ライブラリを拡張することは、具体的に、
前記音声合成モデル及び取得された前記合成テキストを利用して、前記合成テキストに対応する合成音声を合成すること、
前記合成テキスト及び対応する前記合成音声を合成コーパスとして、前記音声ライブラリを更新すること、を含む
請求項1に記載の音声接続合成の処理方法。 - 予めに訓練された音声合成モデル及び取得された合成テキストに基づいて、音声ライブラリを拡張する前、前記音声接続合成の処理方法は、
拡張する前の前記音声ライブラリにおける人工的に採集された前記原始コーパスに基づいて、前記音声合成モデルを訓練することを含む
請求項1または2に記載の音声接続合成の処理方法。 - 前記原始コーパスには原始テキスト及び対応する原始音声を含み、
音声ライブラリにおける人工的に採集された原始コーパスに基づいて、音声合成モデルを訓練することは、具体的に、
前記原始テキスト及び対応する前記原始音声に基づいて、前記音声合成モデルを訓練することを含む
請求項3に記載の音声接続合成の処理方法。 - 予めに訓練された音声合成モデル及び取得された合成テキストに基づいて、音声ライブラリを拡張する前、前記音声接続合成の処理方法は、
ネットワークから前記合成テキストを抽出することを含む
請求項1〜4のいずれか1項に記載の音声接続合成の処理方法。 - 前記音声合成モデルとしてWaveNetモデルを採用する
請求項1〜5のいずれか1項に記載の音声接続合成の処理方法。 - 音声接続合成の処理装置であって、
予めに訓練された音声合成モデル及び取得された合成テキストに基づいて、音声ライブラリを拡張するための拡張モジュールと、
拡張された前記音声ライブラリを利用して音声接続合成処理を行うための処理モジュールと、を含み、
ただし、拡張する前の前記音声ライブラリには人工的に採集された原始コーパスを含む
音声接続合成の処理装置。 - 前記拡張モジュールは、具体的に
前記音声合成モデル及び取得された前記合成テキストを利用して、前記合成テキストに対応する合成音声を合成し、
前記合成テキスト及び対応する前記合成音声を合成コーパスとして、前記音声ライブラリを更新するために用いられる
請求項7に記載の音声接続合成の処理装置。 - 前記音声接続合成の処理装置は、更に
拡張する前の前記音声ライブラリにおける人工的に採集された前記原始コーパスに基づいて、前記音声合成モデルを訓練するための訓練モジュールを含む
請求項7または8に記載の音声接続合成の処理装置。 - 前記原始コーパスには原始テキスト及び対応する原始音声を含み、
前記訓練モジュールは、具体的に、前記原始テキスト及び対応する前記原始音声に基づいて、前記音声合成モデルを訓練するために用いられる
請求項9に記載の音声接続合成の処理装置。 - 前記音声接続合成の処理装置は、更に
ネットワークから前記合成テキストを抽出するための抽出モジュールを含む
請求項7〜10のいずれか1項に記載の音声接続合成の処理装置。 - 前記音声合成モデルとしてWaveNetモデルを採用する
請求項7〜11のいずれか1項に記載の音声接続合成の処理装置。 - コンピュータ設備であって、
1つ或いは複数のプロセッサと、
1つ或いは複数のプログラムが記憶されているメモリと、を含み、
前記1つ或いは複数のプログラムが前記1つ或いは複数のプロセッサによって実行される時、前記1つ或いは複数のプロセッサに請求項1〜6のいずれか1項に記載の音声接続合成の処理方法を実現させる
コンピュータ設備。 - プロセッサによって実行される時、請求項1〜6のいずれか1項に記載の音声接続合成の処理方法を実現する
コンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810552365.3A CN108877765A (zh) | 2018-05-31 | 2018-05-31 | 语音拼接合成的处理方法及装置、计算机设备及可读介质 |
CN201810552365.3 | 2018-05-31 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019211747A true JP2019211747A (ja) | 2019-12-12 |
JP6786751B2 JP6786751B2 (ja) | 2020-11-18 |
Family
ID=64335626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018239323A Active JP6786751B2 (ja) | 2018-05-31 | 2018-12-21 | 音声接続合成の処理方法及び装置、コンピュータ設備及びコンピュータプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10803851B2 (ja) |
JP (1) | JP6786751B2 (ja) |
CN (1) | CN108877765A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111862933A (zh) * | 2020-07-20 | 2020-10-30 | 北京字节跳动网络技术有限公司 | 用于生成合成语音的方法、装置、设备和介质 |
JP7393585B2 (ja) | 2020-07-09 | 2023-12-06 | グーグル エルエルシー | テキスト読み上げのためのWaveNetの自己トレーニング |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180197438A1 (en) * | 2017-01-10 | 2018-07-12 | International Business Machines Corporation | System for enhancing speech performance via pattern detection and learning |
CN108877765A (zh) * | 2018-05-31 | 2018-11-23 | 百度在线网络技术(北京)有限公司 | 语音拼接合成的处理方法及装置、计算机设备及可读介质 |
CN111369966A (zh) * | 2018-12-06 | 2020-07-03 | 阿里巴巴集团控股有限公司 | 一种用于个性化语音合成的方法和装置 |
CN109448694A (zh) * | 2018-12-27 | 2019-03-08 | 苏州思必驰信息科技有限公司 | 一种快速合成tts语音的方法及装置 |
CN110162176B (zh) * | 2019-05-20 | 2022-04-26 | 北京百度网讯科技有限公司 | 语音指令的挖掘方法和装置终端、计算机可读介质 |
CN112242134A (zh) * | 2019-07-01 | 2021-01-19 | 北京邮电大学 | 语音合成方法及装置 |
CN110390928B (zh) * | 2019-08-07 | 2022-01-11 | 广州多益网络股份有限公司 | 一种自动拓增语料的语音合成模型训练方法和系统 |
KR20210042696A (ko) * | 2019-10-10 | 2021-04-20 | 삼성전자주식회사 | 모델 학습 방법 및 장치 |
CN112634860B (zh) * | 2020-12-29 | 2022-05-03 | 思必驰科技股份有限公司 | 儿童语音识别模型训练语料筛选方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005292433A (ja) * | 2004-03-31 | 2005-10-20 | Toshiba Corp | 音声合成装置、音声合成方法および音声合成プログラム |
JP2008545995A (ja) * | 2005-03-28 | 2008-12-18 | レサック テクノロジーズ、インコーポレーテッド | ハイブリッド音声合成装置、方法および用途 |
JP2010237323A (ja) * | 2009-03-30 | 2010-10-21 | Toshiba Corp | 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法 |
JP2015052748A (ja) * | 2013-09-09 | 2015-03-19 | 株式会社日立超エル・エス・アイ・システムズ | 音声データベース生成システム、音声データベース生成方法、及びプログラム |
CN106297766A (zh) * | 2015-06-04 | 2017-01-04 | 科大讯飞股份有限公司 | 语音合成方法及系统 |
CN107393556A (zh) * | 2017-07-17 | 2017-11-24 | 京东方科技集团股份有限公司 | 一种实现音频处理的方法及装置 |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7082396B1 (en) * | 1999-04-30 | 2006-07-25 | At&T Corp | Methods and apparatus for rapid acoustic unit selection from a large speech corpus |
US6865533B2 (en) * | 2000-04-21 | 2005-03-08 | Lessac Technology Inc. | Text to speech |
JP4680429B2 (ja) * | 2001-06-26 | 2011-05-11 | Okiセミコンダクタ株式会社 | テキスト音声変換装置における高速読上げ制御方法 |
JP2003058181A (ja) * | 2001-08-14 | 2003-02-28 | Oki Electric Ind Co Ltd | 音声合成装置 |
US20040030555A1 (en) * | 2002-08-12 | 2004-02-12 | Oregon Health & Science University | System and method for concatenating acoustic contours for speech synthesis |
US7280967B2 (en) * | 2003-07-30 | 2007-10-09 | International Business Machines Corporation | Method for detecting misaligned phonetic units for a concatenative text-to-speech voice |
US7430503B1 (en) * | 2004-08-24 | 2008-09-30 | The United States Of America As Represented By The Director, National Security Agency | Method of combining corpora to achieve consistency in phonetic labeling |
US7475016B2 (en) * | 2004-12-15 | 2009-01-06 | International Business Machines Corporation | Speech segment clustering and ranking |
CN1889170B (zh) * | 2005-06-28 | 2010-06-09 | 纽昂斯通讯公司 | 基于录制的语音模板生成合成语音的方法和系统 |
JP2007024960A (ja) * | 2005-07-12 | 2007-02-01 | Internatl Business Mach Corp <Ibm> | システム、プログラムおよび制御方法 |
CN101350195B (zh) * | 2007-07-19 | 2012-08-22 | 财团法人工业技术研究院 | 语音合成器产生系统与方法 |
WO2011025532A1 (en) * | 2009-08-24 | 2011-03-03 | NovaSpeech, LLC | System and method for speech synthesis using frequency splicing |
CN102117614B (zh) * | 2010-01-05 | 2013-01-02 | 索尼爱立信移动通讯有限公司 | 个性化文本语音合成和个性化语音特征提取 |
JPWO2011118207A1 (ja) * | 2010-03-25 | 2013-07-04 | 日本電気株式会社 | 音声合成装置、音声合成方法および音声合成プログラム |
JP5758713B2 (ja) * | 2011-06-22 | 2015-08-05 | 株式会社日立製作所 | 音声合成装置、ナビゲーション装置および音声合成方法 |
CN104142909B (zh) * | 2014-05-07 | 2016-04-27 | 腾讯科技(深圳)有限公司 | 一种汉字注音方法及装置 |
US9679554B1 (en) * | 2014-06-23 | 2017-06-13 | Amazon Technologies, Inc. | Text-to-speech corpus development system |
US10186251B1 (en) * | 2015-08-06 | 2019-01-22 | Oben, Inc. | Voice conversion using deep neural network with intermediate voice training |
CN105304080B (zh) * | 2015-09-22 | 2019-09-03 | 科大讯飞股份有限公司 | 语音合成装置及方法 |
US9697820B2 (en) * | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
CN105206258B (zh) * | 2015-10-19 | 2018-05-04 | 百度在线网络技术(北京)有限公司 | 声学模型的生成方法和装置及语音合成方法和装置 |
CN105185372B (zh) * | 2015-10-20 | 2017-03-22 | 百度在线网络技术(北京)有限公司 | 个性化多声学模型的训练方法、语音合成方法及装置 |
US10147416B2 (en) * | 2015-12-09 | 2018-12-04 | Amazon Technologies, Inc. | Text-to-speech processing systems and methods |
US9934775B2 (en) * | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US10319365B1 (en) * | 2016-06-27 | 2019-06-11 | Amazon Technologies, Inc. | Text-to-speech processing with emphasized output audio |
US10339925B1 (en) * | 2016-09-26 | 2019-07-02 | Amazon Technologies, Inc. | Generation of automated message responses |
US10448115B1 (en) * | 2016-09-28 | 2019-10-15 | Amazon Technologies, Inc. | Speech recognition for localized content |
WO2018058425A1 (zh) * | 2016-09-29 | 2018-04-05 | 中国科学院深圳先进技术研究院 | 虚拟现实引导催眠语音处理方法及装置 |
US11069335B2 (en) * | 2016-10-04 | 2021-07-20 | Cerence Operating Company | Speech synthesis using one or more recurrent neural networks |
US10565989B1 (en) * | 2016-12-16 | 2020-02-18 | Amazon Technogies Inc. | Ingesting device specific content |
US10276149B1 (en) * | 2016-12-21 | 2019-04-30 | Amazon Technologies, Inc. | Dynamic text-to-speech output |
US10325599B1 (en) * | 2016-12-28 | 2019-06-18 | Amazon Technologies, Inc. | Message response routing |
US10872598B2 (en) * | 2017-02-24 | 2020-12-22 | Baidu Usa Llc | Systems and methods for real-time neural text-to-speech |
US20180330713A1 (en) * | 2017-05-14 | 2018-11-15 | International Business Machines Corporation | Text-to-Speech Synthesis with Dynamically-Created Virtual Voices |
US10896669B2 (en) * | 2017-05-19 | 2021-01-19 | Baidu Usa Llc | Systems and methods for multi-speaker neural text-to-speech |
US10418033B1 (en) * | 2017-06-01 | 2019-09-17 | Amazon Technologies, Inc. | Configurable output data formats |
US10332517B1 (en) * | 2017-06-02 | 2019-06-25 | Amazon Technologies, Inc. | Privacy mode based on speaker identifier |
US10446147B1 (en) * | 2017-06-27 | 2019-10-15 | Amazon Technologies, Inc. | Contextual voice user interface |
US10672416B2 (en) * | 2017-10-20 | 2020-06-02 | Board Of Trustees Of The University Of Illinois | Causing microphones to detect inaudible sounds and defense against inaudible attacks |
US10600408B1 (en) * | 2018-03-23 | 2020-03-24 | Amazon Technologies, Inc. | Content output management based on speech quality |
US10770063B2 (en) * | 2018-04-13 | 2020-09-08 | Adobe Inc. | Real-time speaker-dependent neural vocoder |
CN108877765A (zh) * | 2018-05-31 | 2018-11-23 | 百度在线网络技术(北京)有限公司 | 语音拼接合成的处理方法及装置、计算机设备及可读介质 |
CN108550363B (zh) * | 2018-06-04 | 2019-08-27 | 百度在线网络技术(北京)有限公司 | 语音合成方法及装置、计算机设备及可读介质 |
-
2018
- 2018-05-31 CN CN201810552365.3A patent/CN108877765A/zh active Pending
- 2018-12-19 US US16/226,321 patent/US10803851B2/en active Active
- 2018-12-21 JP JP2018239323A patent/JP6786751B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005292433A (ja) * | 2004-03-31 | 2005-10-20 | Toshiba Corp | 音声合成装置、音声合成方法および音声合成プログラム |
JP2008545995A (ja) * | 2005-03-28 | 2008-12-18 | レサック テクノロジーズ、インコーポレーテッド | ハイブリッド音声合成装置、方法および用途 |
JP2010237323A (ja) * | 2009-03-30 | 2010-10-21 | Toshiba Corp | 音声モデル生成装置、音声合成装置、音声モデル生成プログラム、音声合成プログラム、音声モデル生成方法および音声合成方法 |
JP2015052748A (ja) * | 2013-09-09 | 2015-03-19 | 株式会社日立超エル・エス・アイ・システムズ | 音声データベース生成システム、音声データベース生成方法、及びプログラム |
CN106297766A (zh) * | 2015-06-04 | 2017-01-04 | 科大讯飞股份有限公司 | 语音合成方法及系统 |
CN107393556A (zh) * | 2017-07-17 | 2017-11-24 | 京东方科技集团股份有限公司 | 一种实现音频处理的方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7393585B2 (ja) | 2020-07-09 | 2023-12-06 | グーグル エルエルシー | テキスト読み上げのためのWaveNetの自己トレーニング |
CN111862933A (zh) * | 2020-07-20 | 2020-10-30 | 北京字节跳动网络技术有限公司 | 用于生成合成语音的方法、装置、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
US20190371291A1 (en) | 2019-12-05 |
JP6786751B2 (ja) | 2020-11-18 |
CN108877765A (zh) | 2018-11-23 |
US10803851B2 (en) | 2020-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6786751B2 (ja) | 音声接続合成の処理方法及び装置、コンピュータ設備及びコンピュータプログラム | |
JP6752872B2 (ja) | 音声合成方法及び装置、コンピュータ設備、読取り可能な媒体及びプログラム | |
CN106688034B (zh) | 具有情感内容的文字至语音转换 | |
CN104538024B (zh) | 语音合成方法、装置及设备 | |
JP6019108B2 (ja) | 文字に基づく映像生成 | |
CN108573694B (zh) | 基于人工智能的语料扩充及语音合成系统构建方法及装置 | |
JP6936298B2 (ja) | 三次元仮想ポートレートの口形の変化を制御する方法および装置 | |
JP2014519082A5 (ja) | ||
JP2019015951A (ja) | 電子機器のウェイクアップ方法、装置、デバイス及びコンピュータ可読記憶媒体 | |
JP2021168139A (ja) | マンマシンインタラクションのための方法、装置、機器および媒体 | |
US11847726B2 (en) | Method for outputting blend shape value, storage medium, and electronic device | |
CN110085244A (zh) | 直播互动方法、装置、电子设备及可读存储介质 | |
US10453434B1 (en) | System for synthesizing sounds from prototypes | |
CN112365877A (zh) | 语音合成方法、装置、电子设备和存储介质 | |
CN109754783A (zh) | 用于确定音频语句的边界的方法和装置 | |
CN111161695B (zh) | 歌曲生成方法和装置 | |
WO2021227308A1 (zh) | 一种视频资源的生成方法和装置 | |
CN115691544A (zh) | 虚拟形象口型驱动模型的训练及其驱动方法、装置和设备 | |
CN111696520A (zh) | 智能配音方法、装置、介质及电子设备 | |
CN111105776A (zh) | 有声播放装置及其播放方法 | |
CN112381926A (zh) | 用于生成视频的方法和装置 | |
CN112185340A (zh) | 语音合成方法、语音合成装置、存储介质与电子设备 | |
CN109300472A (zh) | 一种语音识别方法、装置、设备及介质 | |
CN114999441A (zh) | 虚拟形象生成方法、装置、设备、存储介质以及程序产品 | |
CN113963674A (zh) | 作品生成的方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200428 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200929 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201001 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6786751 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |