JP2014232145A - ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム - Google Patents
ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム Download PDFInfo
- Publication number
- JP2014232145A JP2014232145A JP2013111680A JP2013111680A JP2014232145A JP 2014232145 A JP2014232145 A JP 2014232145A JP 2013111680 A JP2013111680 A JP 2013111680A JP 2013111680 A JP2013111680 A JP 2013111680A JP 2014232145 A JP2014232145 A JP 2014232145A
- Authority
- JP
- Japan
- Prior art keywords
- pose
- model
- grant
- perplexity
- gram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 19
- 230000015572 biosynthetic process Effects 0.000 claims description 8
- 238000003786 synthesis reaction Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000009977 dual effect Effects 0.000 claims 1
- 238000010187 selection method Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】この発明のポーズ付与モデル選択装置は、複数の言語モデルと、ポーズ付与モデル選択部と、を具備する。複数の言語モデルは、様々なドメインの学習テキストを用いて構築した品詞N-gramモデルとポーズ付与モデルとの組からなる。ポーズ付与モデル選択部は、ポーズ付与対象のテキスト情報を入力として、当該テキスト情報のパープレキシティを各ドメインの品詞N-gramモデルを用いて算出し、当該パープレキシティが最も小さいドメインに対応するポーズ付与モデルを選択して選択済みポーズ付与モデルとして出力する。
【選択図】図1
Description
図1に、この発明のポ−ズ付与モデル選択装置100の機能構成例を示す。その動作フローを図2に示す。ポーズ付与モデル選択装置100は、複数の言語モデル1101〜110Nと、ポーズ付与モデル選択部120と、制御部130と、を具備する。ポーズ付与モデル選択装置100は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。以降で説明する他の実施例についても同様である。
〔ポーズ付与装置〕
図4に、この発明のポーズ付与装置200の機能構成例を示す。ポーズ付与装置200は、上記したポーズ付与モデル選択装置100で選択した選択済みポーズ付与モデル150を用いて、テキスト情報にポーズを付与するものである。
Claims (8)
- 様々なドメインの学習テキストを用いて構築した品詞N-gramモデルとポーズ付与モデルとの組からなる複数の言語モデルと、
ポーズ付与対象のテキスト情報を入力として、当該テキスト情報のパープレキシティを上記各ドメインの品詞N-gramモデルを用いて算出し、当該パープレキシティが最も小さいドメインに対応するポーズ付与モデルを選択済みポーズ付与モデルとして出力するポーズ付与モデル選択部と、
を具備するポーズ付与モデル選択装置。 - 請求項1に記載したポーズ付与モデル選択装置と、
上記ポーズ付与対象のテキスト情報を入力として、当該テキスト情報に上記選択済みポーズ付与モデルを用いてポーズを付与して出力するポーズ付与部と、
を具備するポーズ付与装置。 - 請求項2に記載したポーズ付与装置において、
上記複数の言語モデルは、様々な異なる口調の学習テキストを用いて構築した当該口調ごとの2つ組N-gramモデルとポーズ付与モデルとの組からなる複数の言語モデルであり、
上記ポーズ付与モデル選択部は、合成対象の話者のポーズラベル付テキストを入力として、当該ポーズラベル付テキストのパープレキシティを上記2つ組みN-gramモデルを用いて算出し、当該パープレキシティが最も小さいドメインに対応するポーズ付与モデルを選択済みポーズ付与モデルとして出力するもの、
であることを特徴とするポーズ付与装置。 - 様々な異なる口調の学習テキスト用いて構築した2つ組N-gramモデルと当該学習テキストとの組からなる複数の言語モデルと、
合成対象の話者のポーズラベル付きテキスト情報を入力として、当該ポーズラベル付テキストから2つ組の系列を作成し、当該2つ組の系列の各口調の2つ組N-gramモデルにおけるパープレキシティを算出し、当該パープレキシティが小さい2つ組N-gramモデルの口調に対応する学習テキストをパープレキシティが小さい順にN個選択し、当該選択したN個の学習テキストと上記合成対象の話者のポーズラベル付きテキストを重み付きで足し合わせてポーズ付与モデルの学習を行いポーズ付与モデルを出力するポーズ付与モデル学習部と、
上記合成対象の話者のポーズラベル付きテキスト情報を入力として、当該テキスト情報に上記ポーズ付与モデルを用いてポーズを付与して出力するポーズ付与部と、
を具備するポーズ付与装置。 - 請求項2に記載したポーズ付与装置でポーズを付与した確率の高い上位N候補のポーズ付与結果と、請求項3に記載したポーズ付与装置で選択したパープレキシティが最も小さい値を示すドメインの2つ組N-gramモデルと、を入力として、
上記上位N候補のポーズ付与結果の各候補におけるパープレキシティを上記2つ組N-gramモデルを用いて計算し、当該計算結果のうち最もパープレキシティが小さいポーズ付与結果を出力するポーズ決定部を、
具備するポーズ付与装置。 - ポーズ付与対象のテキスト情報を入力として、様々なドメインの学習テキストを用いて構築した品詞N-gramモデルとポーズ付与モデルとの組からなる複数の言語モデルを参照し、上記テキスト情報のパープレキシティを、様々なドメインの学習テキストを用いて構築した品詞N-gramモデルを用いて算出した当該パープレキシティが最も小さいドメインに対応するポーズ付与モデルを、選択済みポーズ付与モデルとして出力するポーズ付与モデル選択過程を備えるポーズ付与モデル選択方法。
- 請求項6に記載したポーズ付与モデル選択方法と、
上記ポーズ付与対象のテキスト情報を入力として、当該テキスト情報に上記選択済みポーズ付与モデルを用いてポーズを付与して出力するポーズ付与過程と、
を備えるポーズ付与方法。 - 請求項1に記載したポーズ付与モデル選択装置、請求項2乃至5の何れかに記載したポーズ付与装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013111680A JP6082657B2 (ja) | 2013-05-28 | 2013-05-28 | ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013111680A JP6082657B2 (ja) | 2013-05-28 | 2013-05-28 | ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014232145A true JP2014232145A (ja) | 2014-12-11 |
JP6082657B2 JP6082657B2 (ja) | 2017-02-15 |
Family
ID=52125581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013111680A Expired - Fee Related JP6082657B2 (ja) | 2013-05-28 | 2013-05-28 | ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6082657B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150146373A (ko) * | 2014-06-19 | 2015-12-31 | 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 | 큰 말뭉치에 기초하여 음성 합성을 하기 위한 방법 및 장치 |
CN105225658A (zh) * | 2015-10-21 | 2016-01-06 | 百度在线网络技术(北京)有限公司 | 韵律停顿信息的确定方法和装置 |
JP2018200513A (ja) * | 2017-05-26 | 2018-12-20 | 国立大学法人茨城大学 | 株価予測システム、株価予測方法及び株価予測プログラム |
WO2024116266A1 (ja) * | 2022-11-29 | 2024-06-06 | 日本電信電話株式会社 | 話し方ラベル学習装置、話し方ラベル学習方法及びプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08146994A (ja) * | 1994-11-15 | 1996-06-07 | Nec Corp | 音声合成装置 |
JPH0962286A (ja) * | 1995-08-22 | 1997-03-07 | Sony Corp | 音声合成装置および音声合成方法 |
WO2011145272A1 (ja) * | 2010-05-20 | 2011-11-24 | 日本電気株式会社 | パープレキシティ算出装置 |
-
2013
- 2013-05-28 JP JP2013111680A patent/JP6082657B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08146994A (ja) * | 1994-11-15 | 1996-06-07 | Nec Corp | 音声合成装置 |
JPH0962286A (ja) * | 1995-08-22 | 1997-03-07 | Sony Corp | 音声合成装置および音声合成方法 |
WO2011145272A1 (ja) * | 2010-05-20 | 2011-11-24 | 日本電気株式会社 | パープレキシティ算出装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150146373A (ko) * | 2014-06-19 | 2015-12-31 | 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 | 큰 말뭉치에 기초하여 음성 합성을 하기 위한 방법 및 장치 |
JP2016004267A (ja) * | 2014-06-19 | 2016-01-12 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | 大規模コーパスに基づく音声合成方法及び装置 |
KR102139387B1 (ko) | 2014-06-19 | 2020-07-30 | 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 | 큰 말뭉치에 기초하여 음성 합성을 하기 위한 방법 및 장치 |
CN105225658A (zh) * | 2015-10-21 | 2016-01-06 | 百度在线网络技术(北京)有限公司 | 韵律停顿信息的确定方法和装置 |
JP2018200513A (ja) * | 2017-05-26 | 2018-12-20 | 国立大学法人茨城大学 | 株価予測システム、株価予測方法及び株価予測プログラム |
WO2024116266A1 (ja) * | 2022-11-29 | 2024-06-06 | 日本電信電話株式会社 | 話し方ラベル学習装置、話し方ラベル学習方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6082657B2 (ja) | 2017-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019347734B2 (en) | Conversational agent pipeline trained on synthetic data | |
KR102494139B1 (ko) | 뉴럴 네트워크 학습 장치 및 방법과, 음성 인식 장치 및 방법 | |
US10936664B2 (en) | Dialogue system and computer program therefor | |
CN106469552B (zh) | 语音识别设备和方法 | |
US9818409B2 (en) | Context-dependent modeling of phonemes | |
KR20210158344A (ko) | 디지털 어시스턴트를 위한 머신 러닝 시스템 | |
JP4762103B2 (ja) | 韻律統計モデル訓練方法及び装置、並びに韻律解析方法及び装置 | |
WO2017127296A1 (en) | Analyzing textual data | |
JP2017032839A (ja) | 音響モデル学習装置、音声合成装置、音響モデル学習方法、音声合成方法、プログラム | |
CN112825249B (zh) | 语音处理方法和设备 | |
CN115662435B (zh) | 一种虚拟教师拟真化语音的生成方法及终端 | |
JP6810580B2 (ja) | 言語モデル学習装置およびそのプログラム | |
JP6082657B2 (ja) | ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム | |
CN106843523A (zh) | 基于人工智能的文字输入方法和装置 | |
JP2015001695A (ja) | 音声認識装置、音声認識方法及びプログラム | |
CN113345410A (zh) | 通用语音、目标语音合成模型的训练方法及相关装置 | |
CN115116443A (zh) | 语音识别模型的训练方法、装置、电子设备及存储介质 | |
JP7235136B2 (ja) | ポーズ推定モデル学習装置、ポーズ推定装置、それらの方法、およびプログラム | |
WO2020162239A1 (ja) | パラ言語情報推定モデル学習装置、パラ言語情報推定装置、およびプログラム | |
JP5860439B2 (ja) | 言語モデル作成装置とその方法、そのプログラムと記録媒体 | |
JP6009396B2 (ja) | 発音付与方法とその装置とプログラム | |
JPWO2018066083A1 (ja) | 学習プログラム、情報処理装置および学習方法 | |
JP6309852B2 (ja) | 強調位置予測装置、強調位置予測方法及びプログラム | |
CN114822492B (zh) | 语音合成方法及装置、电子设备、计算机可读存储介质 | |
WO2019044583A1 (ja) | コンフュージョンネットワーク分散表現生成装置、コンフュージョンネットワーク分類装置、コンフュージョンネットワーク分散表現生成方法、コンフュージョンネットワーク分類方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150731 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160913 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170123 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6082657 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |