JP6320397B2 - 音声選択支援装置、音声選択方法、およびプログラム - Google Patents
音声選択支援装置、音声選択方法、およびプログラム Download PDFInfo
- Publication number
- JP6320397B2 JP6320397B2 JP2015537534A JP2015537534A JP6320397B2 JP 6320397 B2 JP6320397 B2 JP 6320397B2 JP 2015537534 A JP2015537534 A JP 2015537534A JP 2015537534 A JP2015537534 A JP 2015537534A JP 6320397 B2 JP6320397 B2 JP 6320397B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- unit
- text
- selection
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/027—Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Description
(第1実施形態)
話者A:S1=0.2、S2=0.3、S3=0、Sim=0.5
話者B:S1=0.4、S2=0.3、S3=1、Sim=0.8
話者C:S1=0.3、S2=0.0、S3=0、Sim=0.3
話者D:S1=0.1、S2=0.1、S3=0、Sim=0.2
話者E:S1=0.2、S2=0.3、S3=1、Sim=0.6
話者F:S1=0.1、S2=0.1、S3=0、Sim=0.2
となり、Vmax=話者Bが出力される。
Claims (4)
- テキストの入力を受ける受理部と、
入力された前記テキストの特徴分析に用いられるテキスト解析知識を参照して前記テキストの特徴を分析する解析部と、
音声辞書の音声属性と前記テキストの特徴との類似度を評価する評価部と、
前記類似度に基づいて前記テキストに適した前記音声辞書の候補を提示する提示部と、
利用者からの指示に基づいて、提示された前記音声辞書の候補の前記音声辞書を用いて、入力テキストの全部、又は一部を音声化して利用者に提示する音声合成部と、
利用者による前記音声辞書の選択指示を受け付ける選択受理部と、
選択結果を出力する結果出力部と、
前記結果出力部から受け取った前記選択結果、及び前記テキストを選択履歴として履歴記憶部に記憶させる履歴記憶制御部と、
前記履歴記憶部に記憶された前記選択履歴に基づいて前記音声辞書の音声属性を更新する更新部と、
を備えることを特徴とする音声選択支援装置。 - 前記音声辞書の前記音声属性を、所定の前記特徴を有する前記テキストに対して、前記類似度が低くなる態様で属性記憶部に記憶させる属性記憶制御部を更に備える
ことを特徴とする請求項1に記載の音声選択支援装置。 - 受理部がテキストの入力を受けるステップと、
解析部が入力された前記テキストの特徴分析に用いられるテキスト解析知識を参照して前記テキストの特徴を分析するステップと、
評価部が、音声辞書の音声属性と前記テキストの特徴との類似度を評価するステップと、
候補提示部が前記類似度に基づいて前記テキストに適した前記音声辞書の候補を提示するステップと、
音声合成部が、利用者からの指示に基づいて、提示された前記音声辞書の候補の前記音声辞書を用いて、入力テキストの全部、又は一部を音声化して利用者に提示するステップと、
選択受理部が、利用者による前記音声辞書の選択指示を受け付けるステップと、
結果出力部が、選択結果を出力するステップと、
履歴記憶制御部が、前記結果出力部から受け取った前記選択結果、及び前記テキストを選択履歴として履歴記憶部に記憶させるステップと、
更新部が、前記履歴記憶部に記憶された前記選択履歴に基づいて前記音声辞書の音声属性を更新するステップと、
を含むことを特徴とする音声選択方法。 - コンピュータを
テキストの入力を受ける受理部と、
入力された前記テキストの特徴分析に用いられるテキスト解析知識を参照して前記テキストの特徴を分析する解析部と、
音声辞書の音声属性と前記テキストの特徴との類似度を評価する評価部と、
前記類似度に基づいて前記テキストに適した前記音声辞書の候補を提示する候補提示部と、
利用者からの指示に基づいて、提示された前記音声辞書の候補の前記音声辞書を用いて、入力テキストの全部、又は一部を音声化して利用者に提示する音声合成部と、
利用者による前記音声辞書の選択指示を受け付ける選択受理部と、
選択結果を出力する結果出力部と、
前記結果出力部から受け取った前記選択結果、及び前記テキストを選択履歴として履歴記憶部に記憶させる履歴記憶制御部と、
前記履歴記憶部に記憶された前記選択履歴に基づいて前記音声辞書の音声属性を更新する更新部、
として機能させるためのプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2013/075581 WO2015040751A1 (ja) | 2013-09-20 | 2013-09-20 | 音声選択支援装置、音声選択方法、およびプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017044979A Division JP2017122928A (ja) | 2017-03-09 | 2017-03-09 | 音声選択支援装置、音声選択方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2015040751A1 JPWO2015040751A1 (ja) | 2017-03-02 |
JP6320397B2 true JP6320397B2 (ja) | 2018-05-09 |
Family
ID=52688432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015537534A Active JP6320397B2 (ja) | 2013-09-20 | 2013-09-20 | 音声選択支援装置、音声選択方法、およびプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US9812119B2 (ja) |
JP (1) | JP6320397B2 (ja) |
CN (1) | CN105531757B (ja) |
WO (1) | WO2015040751A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017122928A (ja) * | 2017-03-09 | 2017-07-13 | 株式会社東芝 | 音声選択支援装置、音声選択方法、およびプログラム |
US10453456B2 (en) * | 2017-10-03 | 2019-10-22 | Google Llc | Tailoring an interactive dialog application based on creator provided content |
US10417328B2 (en) * | 2018-01-05 | 2019-09-17 | Searchmetrics Gmbh | Text quality evaluation methods and processes |
WO2020031292A1 (ja) * | 2018-08-08 | 2020-02-13 | 株式会社ウフル | 音声aiモデル切替システム、音声aiモデル切替方法、及びプログラム |
CN111916065A (zh) * | 2020-08-05 | 2020-11-10 | 北京百度网讯科技有限公司 | 用于处理语音的方法和装置 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2892031B2 (ja) * | 1989-03-20 | 1999-05-17 | 株式会社リコー | テキスト音声合成装置 |
JP2000214874A (ja) * | 1999-01-26 | 2000-08-04 | Canon Inc | 音声合成装置及びその方法、コンピュ―タ可読メモリ |
US6751593B2 (en) * | 2000-06-30 | 2004-06-15 | Fujitsu Limited | Data processing system with block attribute-based vocalization mechanism |
JP2004362419A (ja) * | 2003-06-06 | 2004-12-24 | Matsushita Electric Ind Co Ltd | 情報処理装置および方法 |
JP2005070430A (ja) * | 2003-08-25 | 2005-03-17 | Alpine Electronics Inc | 音声出力装置および方法 |
CN100517463C (zh) * | 2004-11-01 | 2009-07-22 | 英业达股份有限公司 | 语音合成系统以及方法 |
CN101000765B (zh) * | 2007-01-09 | 2011-03-30 | 黑龙江大学 | 基于韵律特征的语音合成方法 |
JP2009139390A (ja) * | 2007-12-03 | 2009-06-25 | Nec Corp | 情報処理システム、処理方法及びプログラム |
JP5198046B2 (ja) * | 2007-12-07 | 2013-05-15 | 株式会社東芝 | 音声処理装置及びそのプログラム |
JP4840476B2 (ja) * | 2009-06-23 | 2011-12-21 | セイコーエプソン株式会社 | 音声データ作成装置および音声データ作成方法 |
CN102651217A (zh) * | 2011-02-25 | 2012-08-29 | 株式会社东芝 | 用于合成语音的方法、设备以及用于语音合成的声学模型训练方法 |
JP2012198277A (ja) | 2011-03-18 | 2012-10-18 | Toshiba Corp | 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム |
JP2013072957A (ja) | 2011-09-27 | 2013-04-22 | Toshiba Corp | 文書読み上げ支援装置、方法及びプログラム |
JP5689774B2 (ja) * | 2011-10-04 | 2015-03-25 | 日本電信電話株式会社 | 対話型情報発信装置、対話型情報発信方法、及びプログラム |
US9483461B2 (en) * | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
-
2013
- 2013-09-20 CN CN201380079572.7A patent/CN105531757B/zh active Active
- 2013-09-20 WO PCT/JP2013/075581 patent/WO2015040751A1/ja active Application Filing
- 2013-09-20 JP JP2015537534A patent/JP6320397B2/ja active Active
-
2016
- 2016-03-10 US US15/066,007 patent/US9812119B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN105531757A (zh) | 2016-04-27 |
WO2015040751A1 (ja) | 2015-03-26 |
JPWO2015040751A1 (ja) | 2017-03-02 |
US9812119B2 (en) | 2017-11-07 |
US20160189704A1 (en) | 2016-06-30 |
CN105531757B (zh) | 2019-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4263181B2 (ja) | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム | |
US9548052B2 (en) | Ebook interaction using speech recognition | |
JP5257071B2 (ja) | 類似度計算装置及び情報検索装置 | |
JP4745036B2 (ja) | 音声翻訳装置および音声翻訳方法 | |
JP5620349B2 (ja) | 対話装置、対話方法および対話プログラム | |
JP6320397B2 (ja) | 音声選択支援装置、音声選択方法、およびプログラム | |
US20130080160A1 (en) | Document reading-out support apparatus and method | |
US11501764B2 (en) | Apparatus for media entity pronunciation using deep learning | |
US20140019137A1 (en) | Method, system and server for speech synthesis | |
JP6914094B2 (ja) | 発話生成装置、発話生成方法及び発話生成プログラム | |
WO2003085550A1 (en) | Conversation control system and conversation control method | |
JP2007102104A (ja) | 応答文生成装置、応答文生成方法、そのプログラムおよび記憶媒体 | |
US11176943B2 (en) | Voice recognition device, voice recognition method, and computer program product | |
JP2015219582A (ja) | 対話方法、対話装置、対話プログラム及び記録媒体 | |
JP6260208B2 (ja) | テキスト要約装置 | |
US10540987B2 (en) | Summary generating device, summary generating method, and computer program product | |
JP6821542B2 (ja) | 複数種の対話を続けて実施可能な対話制御装置、プログラム及び方法 | |
JP2017122928A (ja) | 音声選択支援装置、音声選択方法、およびプログラム | |
JP2014109998A (ja) | 対話装置及びコンピュータ対話方法 | |
JP5196114B2 (ja) | 音声認識装置およびプログラム | |
JP2014021180A (ja) | 手話翻訳装置及び手話翻訳プログラム | |
JP2018181041A (ja) | 対話ルール選択装置、対話装置、対話ルール選択方法、対話方法、対話ルール選択プログラム、及び対話プログラム | |
JP6289950B2 (ja) | 読み上げ装置、読み上げ方法及びプログラム | |
JP6988715B2 (ja) | 回答文選択装置、方法、およびプログラム | |
JP6843689B2 (ja) | コンテキストに応じた対話シナリオを生成する装置、プログラム及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170815 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171002 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180306 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180403 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6320397 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |