JPS62191892A - 音声の画像表示装置 - Google Patents
音声の画像表示装置Info
- Publication number
- JPS62191892A JPS62191892A JP61034392A JP3439286A JPS62191892A JP S62191892 A JPS62191892 A JP S62191892A JP 61034392 A JP61034392 A JP 61034392A JP 3439286 A JP3439286 A JP 3439286A JP S62191892 A JPS62191892 A JP S62191892A
- Authority
- JP
- Japan
- Prior art keywords
- parameters
- color
- shape
- image
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015572 biosynthetic process Effects 0.000 claims description 17
- 238000003786 synthesis reaction Methods 0.000 claims description 17
- 230000001755 vocal effect Effects 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 11
- 235000016496 Panda oleosa Nutrition 0.000 claims description 7
- 240000000220 Panda oleosa Species 0.000 claims description 7
- 238000000034 method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000009291 secondary effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
し産業上の利用分野〕
本発明は音声の画像表示装置に関する。
従来、音声を視覚的に表現するビジプルスピーチ(Vj
slle 8peeh)の手法として、音声のスペ、g クトルハタンを表示するツナグラムが一般によく知られ
ているが、他に、音声を色彩パターンで表示する手法が
ある。
slle 8peeh)の手法として、音声のスペ、g クトルハタンを表示するツナグラムが一般によく知られ
ているが、他に、音声を色彩パターンで表示する手法が
ある。
例えば、日本音響学会講演論文集1−3−12、昭和6
0年度9〜10月に「有声・無声子音を含む無意味単語
の色彩表示の可能性」と題して発表された論文の方式は
、単語音声の音素系列と各音素の継続時間とを与えて、
ホルマント、ピッチ軌跡等、単語音声の合成パターンを
作り、これを入力としてカラーテレビジョン画面に下か
ら上へ流れる色彩パターンとして表示している。
0年度9〜10月に「有声・無声子音を含む無意味単語
の色彩表示の可能性」と題して発表された論文の方式は
、単語音声の音素系列と各音素の継続時間とを与えて、
ホルマント、ピッチ軌跡等、単語音声の合成パターンを
作り、これを入力としてカラーテレビジョン画面に下か
ら上へ流れる色彩パターンとして表示している。
上述した従来の音声の画像表示装置は、音声のスペクト
ルパターンを表示するツナグラムでハ価格は安いが、こ
のスペクトルパターンを見て音声を読みとることは困難
であり、学習による理解の同上もあまり望めない。
ルパターンを表示するツナグラムでハ価格は安いが、こ
のスペクトルパターンを見て音声を読みとることは困難
であり、学習による理解の同上もあまり望めない。
又、音声を色彩パターンで表示する方式は、ツナグラム
に比べて理解度が高く学習による理解の向上も期待でき
ることがわかっているが1色彩が表示の重要なパラメー
タであるためカラーディスプレイでなければならず、白
黒ディスプレイに比べて高価になるという問題点がある
。
に比べて理解度が高く学習による理解の向上も期待でき
ることがわかっているが1色彩が表示の重要なパラメー
タであるためカラーディスプレイでなければならず、白
黒ディスプレイに比べて高価になるという問題点がある
。
本発明の目的は、カラーディスプレイテモ白黒ディスプ
レイでも表示可能で、学資によって容易に理解できる音
声の画像表示装置を提供することにある。
レイでも表示可能で、学資によって容易に理解できる音
声の画像表示装置を提供することにある。
本発明の第1の発明の音声の画像表示装置は、漢字かな
混じり文字列を入力として前記漢字かな混じり文字列か
ら声道形状パラメータ及び音源パラメータを生成する音
声合成パラメータ生成部と、前記声道形状パラメータを
入力して画像の形状パラメータを生成する形状パラメー
タ生成部と、前記音源パラメータを入力して画像の色彩
又は濃淡パラメータを生成する色彩パラメータ生成部と
、前記形状パラメータと色彩又は濃淡パラメータとを入
力して画像を形成し表示する表示装置とを有している。
混じり文字列を入力として前記漢字かな混じり文字列か
ら声道形状パラメータ及び音源パラメータを生成する音
声合成パラメータ生成部と、前記声道形状パラメータを
入力して画像の形状パラメータを生成する形状パラメー
タ生成部と、前記音源パラメータを入力して画像の色彩
又は濃淡パラメータを生成する色彩パラメータ生成部と
、前記形状パラメータと色彩又は濃淡パラメータとを入
力して画像を形成し表示する表示装置とを有している。
本発明の第2の発明の音声の画像表示装置は、自然音声
を入力として前記自然音声を分析し声道形状パラメータ
及び音源パラメータを生成する音声分析回路と、前記声
道パラメータを入力して画像の形状パラメータを生成す
る形状パラメータ生成部と、前記音源パラメータを入力
して画像の色彩又は濃淡パラメータを生成する色彩パラ
メータ生成部と、前記形状パラメータと色彩又は濃淡パ
ラメータとを入力して画像を形成し表示する表示装置と
を有している。
を入力として前記自然音声を分析し声道形状パラメータ
及び音源パラメータを生成する音声分析回路と、前記声
道パラメータを入力して画像の形状パラメータを生成す
る形状パラメータ生成部と、前記音源パラメータを入力
して画像の色彩又は濃淡パラメータを生成する色彩パラ
メータ生成部と、前記形状パラメータと色彩又は濃淡パ
ラメータとを入力して画像を形成し表示する表示装置と
を有している。
本発明の第1の発明では、音声合成パラメータ生成部は
、漢字かな混じり文字列のテキストを入力し、この入力
テキストに対して簡単な文章解析を行′い単語に分割し
て、単語辞書から読み及びアクセント情報等をとりだし
、声道形状パラメータ及び音源パラメータからなる音声
合成パラメータを生成する。
、漢字かな混じり文字列のテキストを入力し、この入力
テキストに対して簡単な文章解析を行′い単語に分割し
て、単語辞書から読み及びアクセント情報等をとりだし
、声道形状パラメータ及び音源パラメータからなる音声
合成パラメータを生成する。
文章解析の手法としては、例えば、情報処理学析万式−
」と題して発表された論文の手法が用いられる。
」と題して発表された論文の手法が用いられる。
式による規則型音声合成システム」と題して発表された
論文の手法が用いられる。
論文の手法が用いられる。
この音声合成パラメータ生成の手法では、単位音声に対
するホルマント等の合成パラメータハ、予め自然音声か
ら分析、抽出されたものをメモリに持っている。この合
成パラメータのなががら、ホルマントや振幅の情報を画
像の形状を表わす要素として取出す。
するホルマント等の合成パラメータハ、予め自然音声か
ら分析、抽出されたものをメモリに持っている。この合
成パラメータのなががら、ホルマントや振幅の情報を画
像の形状を表わす要素として取出す。
音声データのなかでは、ホルマント周波数が声道形状の
特徴を表わしておシ、中でも低次のホルマントの寄与が
大きいことはよく知られている。
特徴を表わしておシ、中でも低次のホルマントの寄与が
大きいことはよく知られている。
そこで、第1. 臆2ホルマントと声の強さを表わす振
幅の値を用いて、形状をもって声道形状特性を表現する
。早3図は声道形状パラメータの出カッ−9jlを示す
特性図で、縦軸が第1ホルマント、横軸が第2ホルマン
トである。
幅の値を用いて、形状をもって声道形状特性を表現する
。早3図は声道形状パラメータの出カッ−9jlを示す
特性図で、縦軸が第1ホルマント、横軸が第2ホルマン
トである。
また、上述した音声の合成パラメータのなかから、音源
の性質を表わすピッチ周波数や有声・無声の情報を画像
の色彩又は濃淡を表わす伎素として取出す。声道の形状
パラメータと色彩パラメータから、画面に形状と色彩、
又は形状と濃淡によって音声を画像表示する。
の性質を表わすピッチ周波数や有声・無声の情報を画像
の色彩又は濃淡を表わす伎素として取出す。声道の形状
パラメータと色彩パラメータから、画面に形状と色彩、
又は形状と濃淡によって音声を画像表示する。
次に、本発明の第2の発明では、自然音声を入力とした
場合である。
場合である。
音声合成パラメータは自然音声から分析し抽出されたも
のであるから、漢字かな混じ9文字列を入力とした場合
と同様に実現できる。
のであるから、漢字かな混じ9文字列を入力とした場合
と同様に実現できる。
次に、本発明の実施例について図面を参照して説明する
。
。
第1図は本発明の早1の発明の一実施例のブロック図で
ある。
ある。
第1図において、入力された漢字かな混じり文字列1は
音声合成パラメータ生成部2で文章解析した後、単語辞
書から情報を取出し音声合成パラメータを生成する。
音声合成パラメータ生成部2で文章解析した後、単語辞
書から情報を取出し音声合成パラメータを生成する。
音声合成パラメータのうち形状を表現する要素であるホ
ルマントや振幅の情報からなる声道形状パラメータ3を
形状パラメータ生成部4に送シ、形状パラメータ生成部
4で形状パラメータ7tl−生成する。又、音声合成パ
ラメータのうち、色彩や濃淡を表現する要素であるピッ
チや有声書無声の情報からなる音源パラメータ5を色彩
パラメータ生成部6に送り、色彩パラメータ生成部6で
色彩パラメータ8を生成する。
ルマントや振幅の情報からなる声道形状パラメータ3を
形状パラメータ生成部4に送シ、形状パラメータ生成部
4で形状パラメータ7tl−生成する。又、音声合成パ
ラメータのうち、色彩や濃淡を表現する要素であるピッ
チや有声書無声の情報からなる音源パラメータ5を色彩
パラメータ生成部6に送り、色彩パラメータ生成部6で
色彩パラメータ8を生成する。
−し 、−
表示装置9は形状パラメータと色彩ハフメータ8とを入
力して、これらのパラメータから画像を作成し表示する
。
力して、これらのパラメータから画像を作成し表示する
。
第2図は本発明のa$2の発明の一実施例のブロック図
である。
である。
第2図において、入力された自然音声10は音声分析回
路11で分析し、ホルマントやピッチなど音声のもつ情
報を抽出する。
路11で分析し、ホルマントやピッチなど音声のもつ情
報を抽出する。
音声分析回路11で分析して得られた情報のうち、形状
を表わす要素であるホルマントや奈幅の情報からなる声
道形状パラメー?)3を形状パラメータ生成部4に送り
、形状パラメータ生成部4は形状パラメータ7を生成す
る。
を表わす要素であるホルマントや奈幅の情報からなる声
道形状パラメー?)3を形状パラメータ生成部4に送り
、形状パラメータ生成部4は形状パラメータ7を生成す
る。
又、音声分析回路11で分析して得られた情報のうち、
色彩又は濃淡を表わす要素であるピッチや有声・無声の
情報からなる音源パラメータ5t−色彩パラメータ生成
部6に送シ、色彩パラメータ生成部6は色彩パラメータ
8を生成する。
色彩又は濃淡を表わす要素であるピッチや有声・無声の
情報からなる音源パラメータ5t−色彩パラメータ生成
部6に送シ、色彩パラメータ生成部6は色彩パラメータ
8を生成する。
それ以下の動作は、上述した第1図の実施例の場合と同
様なので説明を省略する。
様なので説明を省略する。
々お、色彩又は濃淡で表わす代りに単純な模様で表わす
ことも可能である。
ことも可能である。
るか、又は自然音声を音声分析して音声合成パラメータ
を作成した後、音声合成パラメータのうち形状を示す情
報から形状パラメータ、色彩又は濃淡を示す情報から色
彩パラメータを作成することにより、カラーでも白黒で
も表示可能で、かつ学習によって容易に理解できる音声
画像の表示ができるという効果がある。
を作成した後、音声合成パラメータのうち形状を示す情
報から形状パラメータ、色彩又は濃淡を示す情報から色
彩パラメータを作成することにより、カラーでも白黒で
も表示可能で、かつ学習によって容易に理解できる音声
画像の表示ができるという効果がある。
更に、聴覚に頼った学習や、会話が困難な人や困難な場
での学習や会話を可能にするという副次的効果がある。
での学習や会話を可能にするという副次的効果がある。
第1図は本発明の第1の発明の一実施例を示すブロック
図、第2図は本発明の@2の発明の一実施例を示すブロ
ック図、第3図は声道形状パラメータの出力の一例を示
す特性図である。 2・・・・・・音声合成パラメータ生成部、4・・・・
・・形状パラメータ生成部、6・・・・・・色彩パラメ
ータ生成部、9・・・・・・表示装置、11・・・・・
・音声分析回路。 K二\ 、I−(1゜ 代理人 弁理士 内 原 詩乙。 ”1.。 ギ り 閏 兼 3 I
図、第2図は本発明の@2の発明の一実施例を示すブロ
ック図、第3図は声道形状パラメータの出力の一例を示
す特性図である。 2・・・・・・音声合成パラメータ生成部、4・・・・
・・形状パラメータ生成部、6・・・・・・色彩パラメ
ータ生成部、9・・・・・・表示装置、11・・・・・
・音声分析回路。 K二\ 、I−(1゜ 代理人 弁理士 内 原 詩乙。 ”1.。 ギ り 閏 兼 3 I
Claims (2)
- (1)漢字かな混じり文字列を入力として前記漢字かな
混じり文字列から声道形状パラメータ及び音源パラメー
タを生成する音声合成パラメータ生成部と、前記声道形
状パラメータを入力して画像の形状パラメータを生成す
る形状パラメータ生成部と、前記音源パラメータを入力
して画像の色彩又は濃淡パラメータを生成する色彩パラ
メータ生成部と、前記形状のパラメータと色彩又は濃淡
パラメータとを入力して画像を形成し表示する表示装置
とを有する音声の画像表示装置。 - (2)自然音声を入力として前記自然音声を分析し声道
形状パラメータ及び音源パラメータを生成する音声分析
回路と、前記声道形状パラメータを入力して画像の形状
パラメータを生成する形状パラメータ生成部と、前記音
源パラメータを入力して画像の色彩又は濃淡パラメータ
を生成する色彩パラメータ生成部と、前記形状パラメー
タと色彩又は濃淡パラメータとを入力して画像を形成し
表示する表示装置とを有する音声の画像表示装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61034392A JPS62191892A (ja) | 1986-02-18 | 1986-02-18 | 音声の画像表示装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61034392A JPS62191892A (ja) | 1986-02-18 | 1986-02-18 | 音声の画像表示装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS62191892A true JPS62191892A (ja) | 1987-08-22 |
Family
ID=12412897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61034392A Pending JPS62191892A (ja) | 1986-02-18 | 1986-02-18 | 音声の画像表示装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62191892A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04502523A (ja) * | 1989-07-06 | 1992-05-07 | シルス,リチャード アール | 合成音声信号の調節のための方法及び装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5421016U (ja) * | 1977-07-13 | 1979-02-10 | ||
JPS6083137A (ja) * | 1983-10-13 | 1985-05-11 | Fujitsu Ltd | 読上修正装置 |
-
1986
- 1986-02-18 JP JP61034392A patent/JPS62191892A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5421016U (ja) * | 1977-07-13 | 1979-02-10 | ||
JPS6083137A (ja) * | 1983-10-13 | 1985-05-11 | Fujitsu Ltd | 読上修正装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04502523A (ja) * | 1989-07-06 | 1992-05-07 | シルス,リチャード アール | 合成音声信号の調節のための方法及び装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8219398B2 (en) | Computerized speech synthesizer for synthesizing speech from text | |
US6865533B2 (en) | Text to speech | |
US7890330B2 (en) | Voice recording tool for creating database used in text to speech synthesis system | |
US5940797A (en) | Speech synthesis method utilizing auxiliary information, medium recorded thereon the method and apparatus utilizing the method | |
US20070009865A1 (en) | Method, system, program and data set which are intended to facilitate language learning thorugh learning and comprehension of phonetics and phonology | |
Breen | Speech synthesis models: a review | |
JPH07181992A (ja) | 文書読上げ装置及び方法 | |
JPS62191892A (ja) | 音声の画像表示装置 | |
JPH077335B2 (ja) | 会話型文章読み上げ装置 | |
Shah et al. | Bi-Lingual Text to Speech Synthesis System for Urdu and Sindhi | |
JP2006139162A (ja) | 語学学習装置 | |
Cashman | International best practice in the teaching of lyric diction to conservatorium-level singers | |
KR20160016313A (ko) | 어순과 억양 정보를 이용한 언어 학습 방법 | |
JPH08272388A (ja) | 音声合成装置及びその方法 | |
JPH0916190A (ja) | 文章読上装置 | |
JP3988270B2 (ja) | 発音表示装置、発音表示方法及び発音表示機能をコンピュータに実行させるためのプログラム | |
JPH05341705A (ja) | 会話訓練装置 | |
JPH01119822A (ja) | 文章読み上げ装置 | |
Vila et al. | A computerized phonetics instructor: BABEL | |
JP2966954B2 (ja) | 文書読上げ指示装置 | |
JPH1165410A (ja) | 発音練習装置 | |
FalDessai | Development of a Text to Speech System for Devanagari Konkani | |
Afolabi et al. | Implementation of Yoruba text-to-speech E-learning system | |
JPH04199421A (ja) | 文書読上げ装置 | |
Dogrusöz | Spectrographic Analysis Of Sound: A Sample Of Turkish Vocal Music. |