JPWO2015040751A1 - 音声選択支援装置、音声選択方法、およびプログラム - Google Patents
音声選択支援装置、音声選択方法、およびプログラム Download PDFInfo
- Publication number
- JPWO2015040751A1 JPWO2015040751A1 JP2015537534A JP2015537534A JPWO2015040751A1 JP WO2015040751 A1 JPWO2015040751 A1 JP WO2015040751A1 JP 2015537534 A JP2015537534 A JP 2015537534A JP 2015537534 A JP2015537534 A JP 2015537534A JP WO2015040751 A1 JPWO2015040751 A1 JP WO2015040751A1
- Authority
- JP
- Japan
- Prior art keywords
- text
- voice
- unit
- speech
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/027—Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
- G10L13/10—Prosody rules derived from text; Stress or intonation
Abstract
Description
(第1実施形態)
話者A:S1=0.2、S2=0.3、S3=0、Sim=0.5
話者B:S1=0.4、S2=0.3、S3=1、Sim=0.8
話者C:S1=0.3、S2=0.0、S3=0、Sim=0.3
話者D:S1=0.1、S2=0.1、S3=0、Sim=0.2
話者E:S1=0.2、S2=0.3、S3=1、Sim=0.6
話者F:S1=0.1、S2=0.1、S3=0、Sim=0.2
となり、Vmax=話者Bが出力される。
Claims (6)
- テキストの入力を受ける受理部と、
入力された前記テキストの特徴分析に用いられるテキスト解析知識を記憶する解析知識記憶部と、
前記テキスト解析知識を参照して前記テキストの特徴を分析する解析部と、
音声辞書ごとの音声属性を記憶する属性記憶手段と、
前記音声辞書の前記音声属性と前記テキストの特徴との類似度を評価する評価部と、
前記類似度に基づいて前記テキストに適した前記音声辞書の候補を提示する提示手段と、
を備えることを特徴とする音声選択支援装置。 - 前記音声辞書を記憶する辞書記憶手段と、
利用者からの指示に基づいて、提示された前記音声辞書の候補の前記音声辞書を用いて、入力テキストの全部、又は一部を音声化して利用者に提示する音声合成部と、
利用者による前記音声辞書の選択指示を受け付ける選択受理部と、
選択結果を出力する結果出力部と、
を更に備えることを特徴とする請求項1に記載の音声選択支援装置。 - 前記音声属性記憶部は、前記音声辞書の前記音声属性を、当該音声辞書を所定の前記特徴を有する前記テキストに対して、前記類似度が低くなる態様で記憶する
ことを特徴とする請求項1、又は2に記載の音声選択支援装置。 - 前記結果出力部から受け取った前記選択結果、及び前記テキストを選択履歴として記憶する履歴記憶手段と、
前記履歴記憶手段に記憶された前記選択履歴に基づいて前記音声辞書の音声属性を更新する更新手段と、
を更に備えることを特徴とする請求項2に記載の音声選択支援装置。 - 受理部がテキストの入力を受けるステップと、
解析部が入力された前記テキストの特徴分析に用いられるテキスト解析知識を参照して前記テキストの特徴を分析するステップと、
評価部が、音声辞書の音声属性と前記テキストの特徴との類似度を評価するステップと、
候補提示部が前記類似度に基づいて前記テキストに適した前記音声辞書の候補を提示するステップと、
を含むことを特徴とする音声選択方法。 - コンピュータを
テキストの入力を受ける受理部と、
入力された前記テキストの特徴分析に用いられるテキスト解析知識を記憶するテキスト
解析知識記憶手段と、
前記テキスト解析知識を参照して前記テキストの特徴を分析する解析部と、
音声辞書ごとの音声属性を記憶する音声属性記憶部と、
前記音声辞書の前記音声属性と前記テキストの特徴との類似度を評価する評価部と、
前記類似度に基づいて前記テキストに適した前記音声辞書の候補を提示する候補提示部と、
として実行させるためのプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2013/075581 WO2015040751A1 (ja) | 2013-09-20 | 2013-09-20 | 音声選択支援装置、音声選択方法、およびプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017044979A Division JP2017122928A (ja) | 2017-03-09 | 2017-03-09 | 音声選択支援装置、音声選択方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2015040751A1 true JPWO2015040751A1 (ja) | 2017-03-02 |
JP6320397B2 JP6320397B2 (ja) | 2018-05-09 |
Family
ID=52688432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015537534A Active JP6320397B2 (ja) | 2013-09-20 | 2013-09-20 | 音声選択支援装置、音声選択方法、およびプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US9812119B2 (ja) |
JP (1) | JP6320397B2 (ja) |
CN (1) | CN105531757B (ja) |
WO (1) | WO2015040751A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017122928A (ja) * | 2017-03-09 | 2017-07-13 | 株式会社東芝 | 音声選択支援装置、音声選択方法、およびプログラム |
US10453456B2 (en) * | 2017-10-03 | 2019-10-22 | Google Llc | Tailoring an interactive dialog application based on creator provided content |
US10417328B2 (en) * | 2018-01-05 | 2019-09-17 | Searchmetrics Gmbh | Text quality evaluation methods and processes |
WO2020031292A1 (ja) * | 2018-08-08 | 2020-02-13 | 株式会社ウフル | 音声aiモデル切替システム、音声aiモデル切替方法、及びプログラム |
CN111916065A (zh) * | 2020-08-05 | 2020-11-10 | 北京百度网讯科技有限公司 | 用于处理语音的方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02247696A (ja) * | 1989-03-20 | 1990-10-03 | Ricoh Co Ltd | テキスト音声合成装置 |
JP2004362419A (ja) * | 2003-06-06 | 2004-12-24 | Matsushita Electric Ind Co Ltd | 情報処理装置および方法 |
JP2009139390A (ja) * | 2007-12-03 | 2009-06-25 | Nec Corp | 情報処理システム、処理方法及びプログラム |
JP2012198277A (ja) * | 2011-03-18 | 2012-10-18 | Toshiba Corp | 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム |
JP2013080362A (ja) * | 2011-10-04 | 2013-05-02 | Nippon Telegr & Teleph Corp <Ntt> | 対話型情報発信装置、対話型情報発信方法、及びプログラム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000214874A (ja) * | 1999-01-26 | 2000-08-04 | Canon Inc | 音声合成装置及びその方法、コンピュ―タ可読メモリ |
US6751593B2 (en) * | 2000-06-30 | 2004-06-15 | Fujitsu Limited | Data processing system with block attribute-based vocalization mechanism |
JP2005070430A (ja) * | 2003-08-25 | 2005-03-17 | Alpine Electronics Inc | 音声出力装置および方法 |
CN100517463C (zh) * | 2004-11-01 | 2009-07-22 | 英业达股份有限公司 | 语音合成系统以及方法 |
CN101000765B (zh) * | 2007-01-09 | 2011-03-30 | 黑龙江大学 | 基于韵律特征的语音合成方法 |
JP5198046B2 (ja) * | 2007-12-07 | 2013-05-15 | 株式会社東芝 | 音声処理装置及びそのプログラム |
JP4840476B2 (ja) * | 2009-06-23 | 2011-12-21 | セイコーエプソン株式会社 | 音声データ作成装置および音声データ作成方法 |
CN102651217A (zh) * | 2011-02-25 | 2012-08-29 | 株式会社东芝 | 用于合成语音的方法、设备以及用于语音合成的声学模型训练方法 |
JP2013072957A (ja) | 2011-09-27 | 2013-04-22 | Toshiba Corp | 文書読み上げ支援装置、方法及びプログラム |
US9483461B2 (en) * | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
-
2013
- 2013-09-20 CN CN201380079572.7A patent/CN105531757B/zh active Active
- 2013-09-20 WO PCT/JP2013/075581 patent/WO2015040751A1/ja active Application Filing
- 2013-09-20 JP JP2015537534A patent/JP6320397B2/ja active Active
-
2016
- 2016-03-10 US US15/066,007 patent/US9812119B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02247696A (ja) * | 1989-03-20 | 1990-10-03 | Ricoh Co Ltd | テキスト音声合成装置 |
JP2004362419A (ja) * | 2003-06-06 | 2004-12-24 | Matsushita Electric Ind Co Ltd | 情報処理装置および方法 |
JP2009139390A (ja) * | 2007-12-03 | 2009-06-25 | Nec Corp | 情報処理システム、処理方法及びプログラム |
JP2012198277A (ja) * | 2011-03-18 | 2012-10-18 | Toshiba Corp | 文書読み上げ支援装置、文書読み上げ支援方法および文書読み上げ支援プログラム |
JP2013080362A (ja) * | 2011-10-04 | 2013-05-02 | Nippon Telegr & Teleph Corp <Ntt> | 対話型情報発信装置、対話型情報発信方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN105531757A (zh) | 2016-04-27 |
WO2015040751A1 (ja) | 2015-03-26 |
JP6320397B2 (ja) | 2018-05-09 |
US9812119B2 (en) | 2017-11-07 |
US20160189704A1 (en) | 2016-06-30 |
CN105531757B (zh) | 2019-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10056078B1 (en) | Output of content based on speech-based searching and browsing requests | |
US11823678B2 (en) | Proactive command framework | |
JP4263181B2 (ja) | コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム | |
JP4745036B2 (ja) | 音声翻訳装置および音声翻訳方法 | |
JP5620349B2 (ja) | 対話装置、対話方法および対話プログラム | |
US9548052B2 (en) | Ebook interaction using speech recognition | |
JP6320397B2 (ja) | 音声選択支援装置、音声選択方法、およびプログラム | |
US20130080160A1 (en) | Document reading-out support apparatus and method | |
WO2018200268A1 (en) | Automatic song generation | |
JPWO2008016102A1 (ja) | 類似度計算装置及び情報検索装置 | |
US11501764B2 (en) | Apparatus for media entity pronunciation using deep learning | |
JP5221768B2 (ja) | 翻訳装置、及びプログラム | |
JP2013083897A (ja) | 認識装置、認識プログラム、認識方法、生成装置、生成プログラムおよび生成方法 | |
JP2010048953A (ja) | 対話文生成装置 | |
JP2018190077A (ja) | 発話生成装置、発話生成方法及び発話生成プログラム | |
WO2003085550A1 (en) | Conversation control system and conversation control method | |
JP2007102104A (ja) | 応答文生成装置、応答文生成方法、そのプログラムおよび記憶媒体 | |
US11176943B2 (en) | Voice recognition device, voice recognition method, and computer program product | |
JP2015219582A (ja) | 対話方法、対話装置、対話プログラム及び記録媒体 | |
JP6260208B2 (ja) | テキスト要約装置 | |
Otake et al. | Lexical selection in action: Evidence from spontaneous punning | |
JP2017122928A (ja) | 音声選択支援装置、音声選択方法、およびプログラム | |
JP5196114B2 (ja) | 音声認識装置およびプログラム | |
JP2019203998A (ja) | 会話装置、ロボット、会話装置制御方法及びプログラム | |
JP2014109998A (ja) | 対話装置及びコンピュータ対話方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170309 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170815 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171002 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180306 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180403 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6320397 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |