JP2018128607A - 音声処理方法および音声処理装置 - Google Patents
音声処理方法および音声処理装置 Download PDFInfo
- Publication number
- JP2018128607A JP2018128607A JP2017022418A JP2017022418A JP2018128607A JP 2018128607 A JP2018128607 A JP 2018128607A JP 2017022418 A JP2017022418 A JP 2017022418A JP 2017022418 A JP2017022418 A JP 2017022418A JP 2018128607 A JP2018128607 A JP 2018128607A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- signal
- speech
- language
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
また、本発明の好適な態様に係る音声処理装置は、指定文字列のうちの第1部分を第1言語で発音した音声と、前記指定文字列のうち前記第1部分とは相違する第2部分を発音した音声とを表す音声信号を生成する音声合成部を具備し、前記音声合成部は、前記第2部分について、前記第1言語とは相違する第2言語用の音声合成データを利用した音声合成処理を実行する。
図1は、本発明の第1実施形態に係る音声処理装置100の構成図である。図1に例示される通り、第1実施形態の音声処理装置100は、電車等の交通機関の施設内(例えば駅構内)に設置され、当該施設に関する案内を表す音声(以下「案内音声」という)Gを施設内の利用者に対して放音する音響システムである。
本発明の第2実施形態について説明する。以下に例示する各構成において作用または機能が第1実施形態と同様である要素については、第1実施形態の説明で使用した符号を流用して各々の詳細な説明を適宜に省略する。
図9は、第3実施形態に係る音声処理装置100の構成図である。図9に例示される通り、第3実施形態の記憶装置12は、第1言語用の音声合成プログラムP1および音声合成データD1と、第2言語用の発音規則データDa2(音声合成データD2)とを記憶する。第1言語用の音声合成データD1は、発音規則データDa1と音声素片データDb1とを含んで構成される。第2言語用の発音規則データDa2は、第1実施形態で前述した通り、第2言語の文字列と発音記号との関係を規定する。
図12は、第4実施形態に係る音声処理装置100の機能に着目した構成図である。図12に例示される通り、第4実施形態の記憶装置12は、相異なる指定文字列Q(具体的には定型部分Qa)に対応する複数の配信情報Vを記憶する。任意の1種類の指定文字列Qに対応する配信情報Vは、当該指定文字列Qに関連する情報(以下「関連情報」という)Cを識別するための識別情報である。関連情報Cは、案内音声Gの再生とともに施設の利用者に提示すべき情報である。例えば指定文字列Qに関連する文字列、または、当該文字列を他言語に翻訳した文字列が、関連情報Cの好適例である。
以上に例示した各形態は多様に変形され得る。前述の各形態に適用され得る具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は、相互に矛盾しない範囲で適宜に併合され得る。
<態様1>
本発明の好適な態様(態様1)に係る音声処理方法は、指定文字列のうちの第1部分を第1言語で発音した音声と、前記指定文字列のうち前記第1部分とは相違する第2部分を発音した音声とを表す音声信号を生成し、前記音声信号の生成においては、前記第2部分について、前記第1言語とは相違する第2言語用の音声合成データを利用した音声合成処理を実行する。以上の態様では、指定文字列のうちの第1部分を第1言語で発音した音声と、指定文字列のうち第2部分を発音した音声とを表す音声信号を生成する過程において、第2部分については第2言語用の音声合成データを利用した音声合成処理が実行される。したがって、指定文字列の全体について第1言語用の音声合成データを利用した音声合成処理を実行する場合と比較して、第2部分について音韻および抑揚が聴感的に自然である音声の音声信号を生成できる。
<態様2>
態様1の好適例(態様2)において、前記音声信号の生成は、前記指定文字列のうち前記第1部分に対応する音声を表す第1信号を、事前に収録された音声を表す複数の収録信号から選択する第1処理と、前記指定文字列のうち前記第2部分に対応する音声を表す第2信号を、前記第2言語用の音声合成データを利用した音声合成処理により生成する第2処理と、前記第1処理で選択した前記第1信号と前記第2処理で生成した前記第2信号とを接続することで前記音声信号を生成する接続処理とを含む。以上の態様では、指定文字列のうち第1部分に対応する音声を表す第1信号が複数の収録信号から選択される。したがって、高音質な音声で第1部分が発音された音声信号を生成できるという利点がある。
<態様3>
態様1の好適例(態様3)において、前記音声信号の生成は、前記指定文字列のうち前記第1部分に対応する音声を表す第1信号を、前記第1言語用の音声合成データを利用した音声合成処理により生成する第1処理と、前記指定文字列のうち前記第2部分に対応する音声を表す第2信号を、前記第2言語用の音声合成データを利用した音声合成処理により生成する第2処理と、前記第1処理で生成した前記第1信号と前記第2処理で生成した前記第2信号とを接続することで前記音声信号を生成する接続処理とを含む。以上の態様では、指定文字列のうち第1部分に対応する音声を表す第1信号が、第1言語用の音声合成データを利用した音声合成処理により生成される。したがって、第1部分の音声を事前に収録する必要がないという利点がある。
<態様4>
態様1の好適例(態様4)では、前記音声信号の生成において、前記第1言語用の発音規則データにより前記第1部分の発音記号を決定し、前記第1言語用の発音規則データとは相違する前記第2言語用の発音規則データにより前記第2部分の発音記号を決定し、前記第1部分および前記第2部分について決定した発音記号の音声を表す前記音声信号を生成する。以上の態様では、第1部分の発音記号が第1言語用の発音規則データにより決定され、第2部分の発音記号が第2言語用の発音規則データにより決定されて、各発音記号の音声を表す音声信号が生成される。したがって、発音記号から音声信号を生成する処理を第1部分と第2部分とで共通化できるという利点がある。
<態様5>
態様1から態様4の何れかの好適例(態様5)において、前記第2部分は、前記指定文字列のうち固有名詞の部分である。指定文字列のうち固有名詞の部分は一般的に使用頻度が低いから、音声を事前に収録することは困難である。指定文字列のうち固有名詞の部分を第2部分とした構成によれば、使用頻度が低い第2部分についても音声を生成できるという利点がある。
<態様6>
態様1から態様5の何れかの好適例(態様6)において、前記音声信号と、当該音声信号が表す音声に対応した関連情報を示す配信情報を音響成分として含む変調信号とを混合して放音装置に供給する。以上の態様では、配信情報を音響成分として含む変調信号が音声信号に混合されたうえで放音装置から再生される。すなわち、音声信号が表す音声を放音するための放音装置が、配信情報を送信するための送信機として利用される。したがって、配信情報の送信に専用される送信機が必要である構成と比較して、装置構成が簡素化されるという利点がある。
<態様7>
本発明の好適な態様(態様7)に係る音声処理装置は、指定文字列のうちの第1部分を第1言語で発音した音声と、前記指定文字列のうち前記第1部分とは相違する第2部分を発音した音声とを表す音声信号を生成する音声合成部を具備し、前記音声合成部は、前記第2部分について、前記第1言語とは相違する第2言語用の音声合成データを利用した音声合成処理を実行する。以上の態様では、指定文字列のうちの第1部分を第1言語で発音した音声と、指定文字列のうち第2部分を発音した音声とを表す音声信号を生成する音声合成部が、第2部分については第2言語用の音声合成データを利用した音声合成処理を実行する。したがって、指定文字列の全体について第1言語用の音声合成データを利用した音声合成処理を実行する構成と比較して、第2部分について音韻および抑揚が聴感的に自然である音声の音声信号を生成できる。
Claims (7)
- 指定文字列のうちの第1部分を第1言語で発音した音声と、前記指定文字列のうち前記第1部分とは相違する第2部分を発音した音声とを表す音声信号を生成し、
前記音声信号の生成においては、前記第2部分について、前記第1言語とは相違する第2言語用の音声合成データを利用した音声合成処理を実行する
音声処理方法。 - 前記音声信号の生成は、
前記指定文字列のうち前記第1部分に対応する音声を表す第1信号を、事前に収録された音声を表す複数の収録信号から選択する第1処理と、
前記指定文字列のうち前記第2部分に対応する音声を表す第2信号を、前記第2言語用の音声合成データを利用した音声合成処理により生成する第2処理と、
前記第1処理で選択した前記第1信号と前記第2処理で生成した前記第2信号とを接続することで前記音声信号を生成する接続処理とを含む
請求項1の音声処理方法。 - 前記音声信号の生成は、
前記指定文字列のうち前記第1部分に対応する音声を表す第1信号を、前記第1言語用の音声合成データを利用した音声合成処理により生成する第1処理と、
前記指定文字列のうち前記第2部分に対応する音声を表す第2信号を、前記第2言語用の音声合成データを利用した音声合成処理により生成する第2処理と、
前記第1処理で生成した前記第1信号と前記第2処理で生成した前記第2信号とを接続することで前記音声信号を生成する接続処理とを含む
請求項1の音声処理方法。 - 前記音声信号の生成において、前記第1言語用の発音規則データにより前記第1部分の発音記号を決定し、前記第1言語用の発音規則データとは相違する前記第2言語用の発音規則データにより前記第2部分の発音記号を決定し、前記第1部分および前記第2部分について決定した発音記号の音声を表す前記音声信号を生成する
請求項1の音声処理方法。 - 前記第2部分は、前記指定文字列のうち固有名詞の部分である
請求項1から請求項4の何れかの音声処理方法。 - 前記音声信号と、当該音声信号が表す音声に対応した関連情報を示す配信情報を音響成分として含む変調信号とを混合して放音装置に供給する
請求項1から請求項5の何れかの音声処理方法。 - 指定文字列のうちの第1部分を第1言語で発音した音声と、前記指定文字列のうち前記第1部分とは相違する第2部分を発音した音声とを表す音声信号を生成する音声合成部を具備し、
前記音声合成部は、前記第2部分について、前記第1言語とは相違する第2言語用の音声合成データを利用した音声合成処理を実行する
音声処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017022418A JP6897132B2 (ja) | 2017-02-09 | 2017-02-09 | 音声処理方法、音声処理装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017022418A JP6897132B2 (ja) | 2017-02-09 | 2017-02-09 | 音声処理方法、音声処理装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018128607A true JP2018128607A (ja) | 2018-08-16 |
JP6897132B2 JP6897132B2 (ja) | 2021-06-30 |
Family
ID=63172844
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017022418A Active JP6897132B2 (ja) | 2017-02-09 | 2017-02-09 | 音声処理方法、音声処理装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6897132B2 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003295880A (ja) * | 2002-03-28 | 2003-10-15 | Fujitsu Ltd | 録音音声と合成音声を接続する音声合成システム |
JP2006030384A (ja) * | 2004-07-13 | 2006-02-02 | Sony Corp | テキスト音声合成装置及びテキスト音声合成方法 |
JP2006048056A (ja) * | 2004-08-05 | 2006-02-16 | Motorola Inc | 混合言語テキスト音声合成 |
US20130132069A1 (en) * | 2011-11-17 | 2013-05-23 | Nuance Communications, Inc. | Text To Speech Synthesis for Texts with Foreign Language Inclusions |
JP2013195928A (ja) * | 2012-03-22 | 2013-09-30 | Yamaha Corp | 音声素片切出装置 |
JP2016153905A (ja) * | 2014-07-29 | 2016-08-25 | ヤマハ株式会社 | 情報管理システム |
-
2017
- 2017-02-09 JP JP2017022418A patent/JP6897132B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003295880A (ja) * | 2002-03-28 | 2003-10-15 | Fujitsu Ltd | 録音音声と合成音声を接続する音声合成システム |
JP2006030384A (ja) * | 2004-07-13 | 2006-02-02 | Sony Corp | テキスト音声合成装置及びテキスト音声合成方法 |
JP2006048056A (ja) * | 2004-08-05 | 2006-02-16 | Motorola Inc | 混合言語テキスト音声合成 |
US20130132069A1 (en) * | 2011-11-17 | 2013-05-23 | Nuance Communications, Inc. | Text To Speech Synthesis for Texts with Foreign Language Inclusions |
JP2013195928A (ja) * | 2012-03-22 | 2013-09-30 | Yamaha Corp | 音声素片切出装置 |
JP2016153905A (ja) * | 2014-07-29 | 2016-08-25 | ヤマハ株式会社 | 情報管理システム |
Also Published As
Publication number | Publication date |
---|---|
JP6897132B2 (ja) | 2021-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2015297648B2 (en) | Terminal device, information providing system, information presentation method, and information providing method | |
AU2015297647B2 (en) | Information management system and information management method | |
CN111402843B (zh) | 说唱音乐生成方法、装置、可读介质及电子设备 | |
JP2010160316A (ja) | 情報処理装置及びテキスト読み上げ方法 | |
JP2016153905A (ja) | 情報管理システム | |
KR20150105075A (ko) | 자동 통역 장치 및 방법 | |
KR101877559B1 (ko) | 모바일 단말기를 이용한 언어 자가학습 서비스 제공방법, 이를 실행하는 모바일 단말기 및 이를 실행하기 위한 애플리케이션을 저장하는 기록매체 | |
US11790913B2 (en) | Information providing method, apparatus, and storage medium, that transmit related information to a remote terminal based on identification information received from the remote terminal | |
JP6596903B2 (ja) | 情報提供システムおよび情報提供方法 | |
JP6897132B2 (ja) | 音声処理方法、音声処理装置およびプログラム | |
KR102416041B1 (ko) | 다국어 동시 학습 시스템 | |
JP6809177B2 (ja) | 情報処理システムおよび情報処理方法 | |
JP6686306B2 (ja) | 情報提供装置および情報提供方法 | |
JP6984769B2 (ja) | 情報提供方法および情報提供システム | |
JP6834634B2 (ja) | 情報提供方法および情報提供システム | |
JP7192948B2 (ja) | 情報提供方法、情報提供システムおよびプログラム | |
JP6780529B2 (ja) | 情報提供装置および情報提供システム | |
KR20180103273A (ko) | 음성 합성 장치 및 음성 합성 방법 | |
KR20180115994A (ko) | 사용자 고유 tts 기반의 서비스 제공 시스템 및 방법 | |
JP2010079190A (ja) | 音声合成用辞書更新方法、端末装置および音声合成システム | |
KR20100008422A (ko) | 텍스트 음성 변환 기술을 이용한 언어 학습 시스템 및 그의구동방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191219 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200819 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200901 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201029 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210316 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210511 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210524 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6897132 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |