JP3570364B2 - 音声合成方法及びその装置 - Google Patents
音声合成方法及びその装置 Download PDFInfo
- Publication number
- JP3570364B2 JP3570364B2 JP2000271106A JP2000271106A JP3570364B2 JP 3570364 B2 JP3570364 B2 JP 3570364B2 JP 2000271106 A JP2000271106 A JP 2000271106A JP 2000271106 A JP2000271106 A JP 2000271106A JP 3570364 B2 JP3570364 B2 JP 3570364B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- waveform
- sound
- listening sound
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Description
【発明の属する技術分野】
本発明は、一般の産業用、家庭用等の電気機器に搭載され、機器の操作の確認や動作状態の確認、さらに電気機器が獲得した情報を文章として合成音声によりユーザに伝達する音声合成装置に関するものである。
【0002】
【従来の技術】
従来、音声合成装置は特開平11−259094号公報に記載されたものが知られている。
【0003】
図4は、従来の音声合成装置の構成を示しており、伝達内容を入力する伝達内容入力手段301と、データ等を記憶する主記憶装置302と、起動されたプログラム処理に応じて処理を行う情報処理装置303と、音声合成プログラムや音声片データベース等を格納する外部記憶装置306と、出力される音声等の音量等を制御する音響出力制御装置304と、スピーカ等に代表される合成された音声等を出力する音響出力装置305とで構成されており、入力されて伝達内容を音声波形に変換し、合成波形を出力している。
【0004】
【発明が解決しようとする課題】
上記従来の音声合成装置では、単に入力されて伝達内容を音声波形に変換し、合成波形を出力しているのみであり、近年では電気機器に搭載された音声合成装置においては、ユーザに伝達すべき内容を正確に誤解なく伝達できることが要求されている。
【0005】
本発明は、このような音声合成装置において、伝達内容を聞き漏らしないように、文章の最初から傾聴させることを目的とする。
【0006】
【課題を解決するための手段】
この課題を解決するために本発明は、伝達内容を音声波形として出力しようとしたとき、伝達内容より作成された音声波形の前部に、意外感を伴い傾聴を阻害する「ピ」や「ポ」という音に代表される人工的な電子音ではなく、人間が音声を発声するときに自然に出てしまう生理的な音、例えば呼気音などを挿入することで、聞き手を違和感無く自然に伝達内容に導く、音声傾聴音を挿入するように構成したものである。
【0007】
これにより、伝達内容を聞き漏らしないように、文章の最初から傾聴させることが可能な音声合成装置が得られる。
【0008】
【発明の実施の形態】
本発明の請求項1に記載の発明は、伝達内容を入力するステップと、入力された前記伝達内容毎に文字列変換を行うステップと、前記伝達内容毎に変換された文字列に基づき音声波形を作成するステップと、前記作成された伝達内容毎の音声波形の前部に挿入される人間が本来持っている生理的な音声傾聴音の音声波形が、予め定めた継続長を超過する場合は、前期継続長まで前記音声傾聴音の音声波形を短縮して挿入するステップと、前記音声傾聴音が挿入された音声波形を出力するステップとを有するものであり、音声傾聴音により伝達内容を聞き漏らしないように、文章の最初から傾聴させることが可能であるという作用を有する。
本発明の請求項2に記載の発明は、前記傾聴音を挿入するステップは、前記音声傾聴音の音声波形を、前記伝達内容毎に変換された音声波形の長さに比例して、前記予め定めた継続長まで伸縮する請求項1記載の音声合成方法としたものであり、聞き手を違和感無く自然に伝達内容に導くことができるという作用を有する。
【0009】
請求項3に記載の発明は、前記音声傾聴音を呼気音とした請求項1記載の音声合成方法としたものであり、音声傾聴音として呼気音を使用することにより伝達内容を聞き漏らしないように、文章の最初から傾聴させることが可能であるという作用を有する。
【0010】
請求項4に記載の発明は、前記音声傾聴音をリップノイズとした請求項1記載の音声合成方法としたものであり、音声傾聴音としリップノイズを使用することにより伝達内容を聞き漏らしないように、文章の最初から傾聴させることが可能であるという作用を有する。
【0011】
請求項5に記載の発明は、前記音声傾聴音を咳払い音とした請求項1記載の音声合成方法としたものであり、音声傾聴音とし咳払い音を使用することにより伝達内容を聞き漏らしないように、文章の最初から傾聴させることが可能であるという作用を有する。
請求項6に記載の発明は、前記音声傾聴音は、前記伝達内容に基づき変換された音声波形の予め定めた期間の強さに応じて増幅する音声波形である請求項1ないし5のいずれか記載の音声合成方法としたものであり、聞き手を違和感無く自然に伝達内容に導くことができるという作用を有する。
【0012】
請求項7に記載の発明は、伝達内容を入力する入力手段と、入力された前記伝達内容毎に文字列変換を行う文字列変換手段と、前記伝達内容毎に変換された文字列に基づき音声波形を作成する音声波形生成手段と、前記作成された伝達内容毎の音声波形の前部に挿入される人間が本来持っている生理的な音声傾聴音の音声波形が、予め定めた継続長を超過する場合は、前記継続長まで前記音声傾聴音の音声波形を短縮して挿入する傾聴音挿入手段と、前記音声傾聴音が挿入された音声波形を出力する音声出力手段とを有するものであり、音声傾聴音により伝達内容を聞き漏らしないように、文章の最初から傾聴させることが可能であるという作用を有する。
請求項8に記載の発明は、前記傾聴音挿入手段は、前記音声傾聴音の音声波形を、前記伝達内容毎に変換された音声波形の長さに比例して、予め定めた継続長まで伸縮する請求項7記載の音声合成装置としたものであり、聞き手を違和感無く自然に伝達内容に導くことができるという作用を有する。
【0013】
請求項9に記載の発明は、前記音声傾聴音を呼気音とした請求項7記載の音声合成装置としたものであり、音声傾聴音として呼気音を使用することにより伝達内容を聞き漏らしないように、文章の最初から傾聴させることが可能であるという作用を有する。
【0014】
請求項10に記載の発明は、前記音声傾聴音をリップノイズとした請求項7記載の音声合成装置としたものであり、音声傾聴音としてリップノイズを使用することにより伝達内容を聞き漏らしないように、文章の最初から傾聴させることが可能であるという作用を有する。
【0015】
請求項11に記載の発明は、前記音声傾聴音を咳払い音とした請求項7記載の音声合成装置としたものであり、音声傾聴音としし咳払い音を使用することにより伝達内容を聞き漏らしないように、文章の最初から傾聴させることが可能であるという作用を有する。
請求項12に記載の発明は、前記傾聴音挿入手段は、前記音声傾聴音を、前記伝達内容に基づき変換された音声波形の予め定めた期間の強さに応じて増幅する音声波形である請求項7ないし11のいずれか記載の音声合成装置としたものであり、聞き手を違和感無く自然に伝達内容に導くことができるという作用を有する。
【0016】
請求項13に記載の発明は、プログラムされたコンピュータによって音声を合成するプログラムを記録した記録媒体であって、伝達内容を入力するステップと、入力された前記伝達内容毎に文字列変換を行うステップと、前記伝達内容毎に変換された文字列に基づき音声波形を作成するステップと、前記作成された伝達内容毎の音声波形の前部に挿入される人間が本来持っている生理的な音声傾聴音の音声波形が、予め定めた継続長を超過する場合は、前記継続長まで前記音声傾聴音の音声波形を短縮して挿入するステップと、前記音声傾聴音が挿入された音声波形を出力するステップとを有するプログラムを記憶したコンピュータ読み取り可能な記憶媒体としたものであり、音声傾聴音により伝達内容を聞き漏らしないように、文章の最初から傾聴させることが可能であるという作用を有する。
【0017】
以下、本発明の実施の形態について、図を用いて説明する。
【0018】
(実施の形態1)
図1に、本発明の実施の形態1における音声合成装置のシステム構成図を示し、以下に説明する。図1において、101は伝達内容を文字列に変換する装置への入力手段、102はデータやプログラムを記憶する主記憶装置、103はプログラムに従ってデータを処理したり装置全体を制御する情報処理装置、104は伝達内容から作成された音声波形を音響出力装置を使って出力するときの音響出力制御装置、105は音声波形を出力する音響出力装置、106はデータやプログラムを格納している外部記憶装置であり、161は外部記憶装置106上にあり伝達内容入力手段101によって伝達内容から変換された文字列に基づき音声波形を作成する音声合成プログラム、162は外部記憶装置106上にあり音声波形を出力する音響出力制御装置4を制御するプログラム、163は外部記憶装置106上にあり伝達内容を変換した文字列に基づいて音声波形を作成する際に用いる音声片の音声波形を蓄積した音声片データベース、164は外部記憶装置106上にあり作成された音声波形の前部に人間が本来持っている生理的な音声傾聴音である呼気音を挿入する音声傾聴音挿入プログラム、165は外部記憶装置106上にあり傾聴音波形を作成するときに用いる傾聴音を記録した傾聴音データベースとから構成されている。
【0019】
図2は、音声合成装置の処理手順を表すフローチャートであり、このフローチャートを用いて、音声合成装置の処理手順を説明する。なお、図中Sは各処理ステップを表す。
【0020】
まず、キーボードやファイル等の伝達内容入力手段101から伝達内容を取り込む(S21)。入力された伝達内容を文字列に変換する(S22)。伝達内容から変換した文字列に基づき、音声片データベース163から対応する音声片を選択し、文字列の順番に音声片を接続し音声波形を作成する(S23)。伝達内容から作成された音声波形の前部に、人間が本来持っている生理的な音声傾聴音である鼻及び口で呼吸するときの「すー」という音に代表される呼気音の音声波形を、傾聴音データベース165から対応する音声波形を読み出し挿入する(S24)。なお、傾聴音データベースは、合成音の音声片データベース作成時に必要な音声データ収録時に、通常の音声片と同様に、あらかじめ収録しておくものとする。
【0021】
図3は、呼気音を挿入する方法を示す図である。図3における(音声波形1)は音声片を用いて作成された伝達内容の音声波形であり、(音声波形2)は(音声波形1)の条件により変形する呼気音であり、(音声波形3)は(音声波形1)と(音声波形2)を接続し合成した出力音声である。図3において、呼気音(音声波形2)の長さtは、人間が相手の発声の開始を待つことが可能な最大継続長500msを超えない範囲で、伝達内容(音声波形1)の長さTに比例して伸縮し変形する。
【0022】
また、呼気音(音声波形2)の強さpは、伝達内容(音声波形1)の最初のS msの強さPに比例して決定し増幅する。このような方法で呼気音(音声波形2)を(音声波形1)の条件により変形し、伝達内容(音声波形3)と接続し、合成した出力音声波形(音声波形3)を得る。
【0023】
このようにして得られた音声傾聴音を前部に挿入した音声波形を音響出力制御装置104に送り、合成音声として音響出力装置105より出力する(S25)。
【0024】
なお、以上の説明では、音声傾聴音挿入プログラムで呼気音を挿入するプログラムで構成した例で説明したが、その他舌及び唇が触れ合う「ぺちゃ、くちゃ」という音に代表されるリップノイズや、咳払いの時に自然に発せられる「んうん」という音に代表される咳払い音についても同様に実施可能である。
【0025】
【発明の効果】
以上のように本発明によれば、電気機器に搭載される音声合成装置において、伝達内容を聞き漏らしないように、伝達内容を出力する前に傾聴音で注意を引くことにより、文章の最初から傾聴させることが可能であるという有利な効果が得られる。
【図面の簡単な説明】
【図1】本発明の実施の形態1による音声合成装置を示すシステム構成図
【図2】本発明の実施の形態1による音声合成装置の処理手順を表すフローチャート
【図3】本発明の実施の形態1による音声合成装置の呼気音挿入の方法を表す図
【図4】従来の音声合成装置を示すシステム構成図
【符号の説明】
101 伝達内容入力手段
102 主記憶装置
103 情報処理装置
104 音響出力制御装置
105 音響出力装置
106 外部記憶装置
161 音声合成プログラム
162 音声出力プログラム
163 音声片データベース
164 音声傾聴音挿入プログラム
165 傾聴音データベース
Claims (13)
- 伝達内容を入力するステップと、入力された前記伝達内容毎に文字列変換を行うステップと、前記伝達内容毎に変換された文字列に基づき音声波形を作成するステップと、前記作成された伝達内容毎の音声波形の前部に挿入される人間が本来持っている生理的な音声傾聴音の音声波形が、予め定めた継続長を超過する場合は、前記継続長まで前記音声傾聴音の音声波形を短縮して挿入するステップと、前記音声傾聴音が挿入された音声波形を出力するステップとを有することを特徴とする音声合成方法。
- 前記傾聴音を挿入するステップは、前記音声傾聴音の音声波形を、前記伝達内容毎に変換された音声波形の長さに比例して、前記予め定めた継続長まで伸縮する請求項1記載の音声合成方法。
- 前記音声傾聴音を呼気音とした請求項1記載の音声合成方法。
- 前記音声傾聴音をリップノイズとした請求項1記載の音声合成方法。
- 前記音声傾聴音を咳払い音とした請求項1記載の音声合成方法。
- 前記音声傾聴音は、前記伝達内容に基づき変換された音声波形の予め定めた期間の強さに応じて増幅する音声波形である請求項1ないし5のいずれか記載の音声合成方法。
- 伝達内容を入力する入力手段と、入力された前記伝達内容毎に文字列変換を行う文字列変換手段と、前記伝達内容毎に変換された文字列に基づき音声波形を作成する音声波形生成手段と、前記作成された伝達内容毎の音声波形の前部に挿入される人間が本来持っている生理的な音声傾聴音の音声波形が、予め定めた継続長を超過する場合は、前記継続長まで前記音声傾聴音の音声波形を短縮して挿入する傾聴音挿入手段と、前記音声傾聴音が挿入された音声波形を出力する音声出力手段とを有することを特徴とする音声合成装置。
- 前記傾聴音挿入手段は、前記音声傾聴音の音声波形を、前記伝達内容毎に変換された音声波形の長さに比例して、前記予め定めた継続長まで伸縮する請求項7記載の音声合成装置。
- 前記音声傾聴音を呼気音とした請求項7記載の音声合成装置。
- 前記音声傾聴音をリップノイズとした請求項7記載の音声合成装置。
- 前記音声傾聴音を咳払い音とした請求項7記載の音声合成装置。
- 前記傾聴音挿入手段は、前記音声傾聴音を、前記伝達内容に基づき変
換された音声波形の予め定めた期間の強さに応じて増幅する音声波形である請求項7ないし11のいずれか記載の音声合成装置。 - プログラムされたコンピュータによって音声を合成するプログラムを記録した記録媒体であって、伝達内容を入力するステップと、入力された前記伝達内容毎に文字列変換を行うステップと、前記伝達内容毎に変換された文字列に基づき音声波形を作成するステップと、前記作成された伝達内容毎の音声波形の前部に挿入される人間が本来持っている生理的な音声傾聴音の音声波形が、予め定めた継続長を超過する場合は、前記継続長まで前記音声傾聴音の音声波形を短縮して挿入するステップと、前記音声傾聴音が挿入された音声波形を出力するステップとを有するプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000271106A JP3570364B2 (ja) | 2000-09-07 | 2000-09-07 | 音声合成方法及びその装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000271106A JP3570364B2 (ja) | 2000-09-07 | 2000-09-07 | 音声合成方法及びその装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2002082687A JP2002082687A (ja) | 2002-03-22 |
JP2002082687A5 JP2002082687A5 (ja) | 2004-08-19 |
JP3570364B2 true JP3570364B2 (ja) | 2004-09-29 |
Family
ID=18757439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000271106A Expired - Lifetime JP3570364B2 (ja) | 2000-09-07 | 2000-09-07 | 音声合成方法及びその装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3570364B2 (ja) |
-
2000
- 2000-09-07 JP JP2000271106A patent/JP3570364B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2002082687A (ja) | 2002-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100591655B1 (ko) | 음성 합성을 위한 음성 합성 방법, 음성 합성 장치 및 컴퓨터 판독 가능 기록 매체 | |
US7465867B2 (en) | MIDI-compatible hearing device | |
EP1561641A3 (en) | Dummy sound generating apparatus and dummy sound generating method and computer product | |
JP4701684B2 (ja) | 音声処理装置およびプログラム | |
WO2002099780A3 (en) | System and methods of generating control signals | |
JP5803720B2 (ja) | 電子管楽器、振動制御装置及びプログラム | |
JP2001209820A (ja) | 感情表出装置及びプログラムを記録した機械読み取り可能な記録媒体 | |
CN101295504A (zh) | 用于仅文本的应用的娱乐音频 | |
JP2017021125A (ja) | 音声対話装置 | |
JP6648805B2 (ja) | 音声制御方法、音声制御装置およびプログラム | |
JP3570364B2 (ja) | 音声合成方法及びその装置 | |
JP2005062420A (ja) | コンテンツ生成システム、コンテンツ生成方法およびコンテンツ生成プログラム | |
JP2000148175A (ja) | テキスト音声変換装置 | |
JP2003150186A (ja) | ロボットシステム、ロボット制御方法、ロボット制御装置及びロボット制御プログラム | |
JP6566076B2 (ja) | 音声合成方法およびプログラム | |
JP2002082687A5 (ja) | ||
JP3068370B2 (ja) | 携帯用音声認識出力補助装置 | |
JP2004185055A (ja) | 電子メールシステム及び通信端末 | |
TWI277293B (en) | Interactive brainwave learning device | |
JP2001242881A (ja) | 音声合成方法及び装置 | |
KR100400558B1 (ko) | 이동통신 단말기의 음파 발생방법 | |
JPH06342297A (ja) | 音声合成装置 | |
JP2536896B2 (ja) | 音声合成装置 | |
JP2003140677A (ja) | 読み上げシステム | |
JP2018007723A (ja) | 嚥下情報提示装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20031210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040127 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040312 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040601 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040614 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 3570364 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070702 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080702 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090702 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100702 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110702 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110702 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120702 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120702 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130702 Year of fee payment: 9 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |