JP2014232145A - ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム - Google Patents
ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム Download PDFInfo
- Publication number
- JP2014232145A JP2014232145A JP2013111680A JP2013111680A JP2014232145A JP 2014232145 A JP2014232145 A JP 2014232145A JP 2013111680 A JP2013111680 A JP 2013111680A JP 2013111680 A JP2013111680 A JP 2013111680A JP 2014232145 A JP2014232145 A JP 2014232145A
- Authority
- JP
- Japan
- Prior art keywords
- pose
- model
- grant
- perplexity
- imparting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
図1に、この発明のポ−ズ付与モデル選択装置100の機能構成例を示す。その動作フローを図2に示す。ポーズ付与モデル選択装置100は、複数の言語モデル1101〜110Nと、ポーズ付与モデル選択部120と、制御部130と、を具備する。ポーズ付与モデル選択装置100は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。以降で説明する他の実施例についても同様である。
〔ポーズ付与装置〕
図4に、この発明のポーズ付与装置200の機能構成例を示す。ポーズ付与装置200は、上記したポーズ付与モデル選択装置100で選択した選択済みポーズ付与モデル150を用いて、テキスト情報にポーズを付与するものである。
Claims (8)
- 様々なドメインの学習テキストを用いて構築した品詞N-gramモデルとポーズ付与モデルとの組からなる複数の言語モデルと、
ポーズ付与対象のテキスト情報を入力として、当該テキスト情報のパープレキシティを上記各ドメインの品詞N-gramモデルを用いて算出し、当該パープレキシティが最も小さいドメインに対応するポーズ付与モデルを選択済みポーズ付与モデルとして出力するポーズ付与モデル選択部と、
を具備するポーズ付与モデル選択装置。 - 請求項1に記載したポーズ付与モデル選択装置と、
上記ポーズ付与対象のテキスト情報を入力として、当該テキスト情報に上記選択済みポーズ付与モデルを用いてポーズを付与して出力するポーズ付与部と、
を具備するポーズ付与装置。 - 請求項2に記載したポーズ付与装置において、
上記複数の言語モデルは、様々な異なる口調の学習テキストを用いて構築した当該口調ごとの2つ組N-gramモデルとポーズ付与モデルとの組からなる複数の言語モデルであり、
上記ポーズ付与モデル選択部は、合成対象の話者のポーズラベル付テキストを入力として、当該ポーズラベル付テキストのパープレキシティを上記2つ組みN-gramモデルを用いて算出し、当該パープレキシティが最も小さいドメインに対応するポーズ付与モデルを選択済みポーズ付与モデルとして出力するもの、
であることを特徴とするポーズ付与装置。 - 様々な異なる口調の学習テキスト用いて構築した2つ組N-gramモデルと当該学習テキストとの組からなる複数の言語モデルと、
合成対象の話者のポーズラベル付きテキスト情報を入力として、当該ポーズラベル付テキストから2つ組の系列を作成し、当該2つ組の系列の各口調の2つ組N-gramモデルにおけるパープレキシティを算出し、当該パープレキシティが小さい2つ組N-gramモデルの口調に対応する学習テキストをパープレキシティが小さい順にN個選択し、当該選択したN個の学習テキストと上記合成対象の話者のポーズラベル付きテキストを重み付きで足し合わせてポーズ付与モデルの学習を行いポーズ付与モデルを出力するポーズ付与モデル学習部と、
上記合成対象の話者のポーズラベル付きテキスト情報を入力として、当該テキスト情報に上記ポーズ付与モデルを用いてポーズを付与して出力するポーズ付与部と、
を具備するポーズ付与装置。 - 請求項2に記載したポーズ付与装置でポーズを付与した確率の高い上位N候補のポーズ付与結果と、請求項3に記載したポーズ付与装置で選択したパープレキシティが最も小さい値を示すドメインの2つ組N-gramモデルと、を入力として、
上記上位N候補のポーズ付与結果の各候補におけるパープレキシティを上記2つ組N-gramモデルを用いて計算し、当該計算結果のうち最もパープレキシティが小さいポーズ付与結果を出力するポーズ決定部を、
具備するポーズ付与装置。 - ポーズ付与対象のテキスト情報を入力として、様々なドメインの学習テキストを用いて構築した品詞N-gramモデルとポーズ付与モデルとの組からなる複数の言語モデルを参照し、上記テキスト情報のパープレキシティを、様々なドメインの学習テキストを用いて構築した品詞N-gramモデルを用いて算出した当該パープレキシティが最も小さいドメインに対応するポーズ付与モデルを、選択済みポーズ付与モデルとして出力するポーズ付与モデル選択過程を備えるポーズ付与モデル選択方法。
- 請求項6に記載したポーズ付与モデル選択方法と、
上記ポーズ付与対象のテキスト情報を入力として、当該テキスト情報に上記選択済みポーズ付与モデルを用いてポーズを付与して出力するポーズ付与過程と、
を備えるポーズ付与方法。 - 請求項1に記載したポーズ付与モデル選択装置、請求項2乃至5の何れかに記載したポーズ付与装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013111680A JP6082657B2 (ja) | 2013-05-28 | 2013-05-28 | ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013111680A JP6082657B2 (ja) | 2013-05-28 | 2013-05-28 | ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014232145A true JP2014232145A (ja) | 2014-12-11 |
JP6082657B2 JP6082657B2 (ja) | 2017-02-15 |
Family
ID=52125581
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013111680A Expired - Fee Related JP6082657B2 (ja) | 2013-05-28 | 2013-05-28 | ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6082657B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150146373A (ko) * | 2014-06-19 | 2015-12-31 | 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 | 큰 말뭉치에 기초하여 음성 합성을 하기 위한 방법 및 장치 |
CN105225658A (zh) * | 2015-10-21 | 2016-01-06 | 百度在线网络技术(北京)有限公司 | 韵律停顿信息的确定方法和装置 |
JP2018200513A (ja) * | 2017-05-26 | 2018-12-20 | 国立大学法人茨城大学 | 株価予測システム、株価予測方法及び株価予測プログラム |
WO2024116266A1 (ja) * | 2022-11-29 | 2024-06-06 | 日本電信電話株式会社 | 話し方ラベル学習装置、話し方ラベル学習方法及びプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08146994A (ja) * | 1994-11-15 | 1996-06-07 | Nec Corp | 音声合成装置 |
JPH0962286A (ja) * | 1995-08-22 | 1997-03-07 | Sony Corp | 音声合成装置および音声合成方法 |
WO2011145272A1 (ja) * | 2010-05-20 | 2011-11-24 | 日本電気株式会社 | パープレキシティ算出装置 |
-
2013
- 2013-05-28 JP JP2013111680A patent/JP6082657B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08146994A (ja) * | 1994-11-15 | 1996-06-07 | Nec Corp | 音声合成装置 |
JPH0962286A (ja) * | 1995-08-22 | 1997-03-07 | Sony Corp | 音声合成装置および音声合成方法 |
WO2011145272A1 (ja) * | 2010-05-20 | 2011-11-24 | 日本電気株式会社 | パープレキシティ算出装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150146373A (ko) * | 2014-06-19 | 2015-12-31 | 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 | 큰 말뭉치에 기초하여 음성 합성을 하기 위한 방법 및 장치 |
JP2016004267A (ja) * | 2014-06-19 | 2016-01-12 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | 大規模コーパスに基づく音声合成方法及び装置 |
KR102139387B1 (ko) | 2014-06-19 | 2020-07-30 | 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 | 큰 말뭉치에 기초하여 음성 합성을 하기 위한 방법 및 장치 |
CN105225658A (zh) * | 2015-10-21 | 2016-01-06 | 百度在线网络技术(北京)有限公司 | 韵律停顿信息的确定方法和装置 |
JP2018200513A (ja) * | 2017-05-26 | 2018-12-20 | 国立大学法人茨城大学 | 株価予測システム、株価予測方法及び株価予測プログラム |
WO2024116266A1 (ja) * | 2022-11-29 | 2024-06-06 | 日本電信電話株式会社 | 話し方ラベル学習装置、話し方ラベル学習方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6082657B2 (ja) | 2017-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102754124B1 (ko) | 숫자 시퀀스에 대한 종단 간 자동 음성 인식 | |
AU2019347734B2 (en) | Conversational agent pipeline trained on synthetic data | |
US10936664B2 (en) | Dialogue system and computer program therefor | |
KR102494139B1 (ko) | 뉴럴 네트워크 학습 장치 및 방법과, 음성 인식 장치 및 방법 | |
CN107590135B (zh) | 自动翻译方法、设备和系统 | |
CN106469552B (zh) | 语音识别设备和方法 | |
CN106688034B (zh) | 具有情感内容的文字至语音转换 | |
KR20210158344A (ko) | 디지털 어시스턴트를 위한 머신 러닝 시스템 | |
JP4762103B2 (ja) | 韻律統計モデル訓練方法及び装置、並びに韻律解析方法及び装置 | |
CN108073574A (zh) | 用于处理自然语言以及训练自然语言模型的方法和设备 | |
WO2017127296A1 (en) | Analyzing textual data | |
CN112966106A (zh) | 文本的情绪识别方法、装置、设备及存储介质 | |
CN112825249A (zh) | 语音处理方法和设备 | |
JP6810580B2 (ja) | 言語モデル学習装置およびそのプログラム | |
CN112397056A (zh) | 语音评测方法及计算机存储介质 | |
JP6082657B2 (ja) | ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム | |
CN113345410A (zh) | 通用语音、目标语音合成模型的训练方法及相关装置 | |
JP2022067223A (ja) | 生成装置および生成方法 | |
CN111613219A (zh) | 语音数据识别方法、设备及介质 | |
CN112289305B (zh) | 韵律预测方法、装置、设备以及存储介质 | |
JP2020140674A (ja) | 回答選択装置及びプログラム | |
JP7235136B2 (ja) | ポーズ推定モデル学習装置、ポーズ推定装置、それらの方法、およびプログラム | |
JP5860439B2 (ja) | 言語モデル作成装置とその方法、そのプログラムと記録媒体 | |
JP6002598B2 (ja) | 強調位置予測装置、その方法、およびプログラム | |
JP6009396B2 (ja) | 発音付与方法とその装置とプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150731 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160913 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170123 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6082657 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |