JPH06230796A - スペクトログラム出力システム - Google Patents

スペクトログラム出力システム

Info

Publication number
JPH06230796A
JPH06230796A JP5284784A JP28478493A JPH06230796A JP H06230796 A JPH06230796 A JP H06230796A JP 5284784 A JP5284784 A JP 5284784A JP 28478493 A JP28478493 A JP 28478493A JP H06230796 A JPH06230796 A JP H06230796A
Authority
JP
Japan
Prior art keywords
spectrogram
area
power value
formant
output system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5284784A
Other languages
English (en)
Inventor
Takahiko Niimura
貴彦 新村
Noriya Murakami
憲也 村上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP5284784A priority Critical patent/JPH06230796A/ja
Publication of JPH06230796A publication Critical patent/JPH06230796A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 ホルマントの持つパワー値が変化しても、容
易にホルマントのコントラストを調節することができ、
モノカラーで明瞭にホルマントを表したスペクトログラ
ムを出力することができるようにする。 【構成】 音声のホルマント分析に用いるスペクトログ
ラムを、モノカラーで出力するスペクトログラム出力シ
ステムにおいて、入力された音声から生成されたスペク
トログラムからパワー値を取り出すパワー抽出部と、こ
のパワー値抽出部で取り出したパワー値を面積に写像す
る面積写像部と、制御関数のパラメータ(傾きとしきい
値)を更新するパラメータ更新部と、スペクトログラム
のパワー値分布を検出するパワー分布情報作成部と、入
力された音声から無音声区間を検出する無音声区間抽出
部とを具備する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声の生成や認識技術
における音声のスペクトル分析技術に関し、特にモノカ
ラーのスペクトログラム上でのホルマントを明瞭に表す
ために好適なスペクトログラム出力システムに関するも
のである。
【0002】
【従来の技術】従来より、音声の認識技術においては、
例えば、中田和男著『音声の合成と認識(エレクトロニ
クスによる口と耳』(1980年、総合電子出版発行)の第
82項〜第104項に記載されているように、音声の周波数
スペクトル分析、特にスペクトログラムを用いて音声を
特徴付けるホルマントの分析が行われている。スペクト
ログラムとは、一般に音声波の周波数対強度の平面上へ
の出力を、時間的変化に対応させて複数個並べたもので
あって、音声の周波数スペクトルを時間と周波数および
強度の3次元で表したものである。音韻のホルマントを
分析するとき、ホルマントは、スペクトログラム上では
周波数スペクトログラムの山の部分となって現われるの
で、ホルマントと時間的変化の対応を観測し易い。近
年、ホルマントの分析のため、スペクトログラムをカラ
ー画像出力するシステムが開発されている。しかしなが
ら、カラー画像を出力する装置は高価であり、特にプリ
ンタ(印字出力装置)に関しては、白黒等のモノカラー
(単色)での出力を行うレーザービームプリンタが一般
に用いられている。そのために、ホルマント分析は、モ
ノカラーに出力されたスペクトログラムを用いることが
一般的である。この場合、ホルマントの様子をモノカラ
ーで明瞭に表すスペクトログラムの出力技術が必要にな
る。このようなホルマントを、白黒のレーザービームプ
リンタ等で出力するための従来技術の1つとして、次の
図5、図6で示すように、パワー値に対応したパターン
を出力するものがある。
【0003】図5、図6は、従来のスペクトログラム出
力システムがスペクトログラムの出力に用いるパターン
例を示す説明図である。図5は、スペクトログラム表示
を行うための基本となる単位パターン群を示しており、
各単位パターンはそれぞれ異なる密度で構成されてい
る。図6は、パワー値(dB)の大きさに対応して、各
単位パターンを組み合わせて作成される合成パターン群
を示し、各合成パターンはパワー値(dB)の大きさに
対応した濃度値を持つことになる。このように、基本と
なる単位パターンを用意し、パワー値に対応したパター
ンを合成する。そして、小さな領域をこの合成パターン
で埋め尽くして、領域をつなげたものがスペクトログラ
ムとして表現される。特に、ホルマント部分が濃く表さ
れる。しかしながら、パワー値の大きさを、このような
点の密度で表現しようとすると、1つのパワー値に対し
てパターンの組み合わせを決めて表示することになる。
そのため、スペクトログラム上のホルマントが明瞭に表
示されるようなルールを考えて、このルールに従ってパ
ターンの合成を行う必要がある。このパワー値と出力図
形を対応させるルールの作成は極めて難かしいものであ
り、特にホルマント分布の変化に対応して、ホルマント
のコントラストを自由に調節することができず、モノカ
ラーのスペクトログラム上でホルマントを明確に表すこ
とができない。
【0004】
【発明が解決しようとする課題】解決しようとする問題
点は、従来の技術では、パワー値と図形とを対応させる
ルールを容易に作成することができず、ホルマントの持
つパワー値分布の変化に応じて、ホルマントをモノカラ
ーで明瞭に出力することができない点、および無音声区
間の印刷を省略できない点である。本発明の目的は、こ
れら従来技術の課題を解決し、ホルマントの持つパワー
値が変化しても、容易にホルマントのコントラストの調
整が可能であり、かつ無音声区間の出力を省略すること
も可能であり、モノカラーでの明瞭なホルマントの出力
を可能とするスペクトログラム出力システムを提供する
ことにある。
【0005】
【課題を解決するための手段】上記目的を達成するた
め、本発明のスペクトログラム出力システムは、(1)
音声のホルマント分析に用いるスペクトログラムを、モ
ノカラーで出力するスペクトログラム出力システムにお
いて、入力された音声から生成されたスペクトログラム
から取り出したパワー値を面積に写像する面積写像部を
設けることを特徴とする。また、(2)上記(1)に記
載のスペクトログラム出力システムにおいて、面積写像
部がパワー値の面積への写像に用いる非線形連続関数を
登録する関数登録部を設けことを特徴とする。また、
(3)上記(2)に記載のスペクトログラム出力システ
ムにおいて、関数登録部に登録する非線形連続関数とし
て、シグモイド関数を用いることを特徴とする。また、
(4)上記(3)に記載のスペクトログラム出力システ
ムにおいて、操作者からの指示入力に基づき、関数登録
部に登録するシグモイド関数の傾きのパラメータの設定
を更新するパラメータ更新部を設けることを特徴とす
る。また、(5)上記(1)から(4)のいずれかに記
載のスペクトログラム出力システムにおいて、面積写像
部でパワー値を写像する面積を長方形の面積とすること
を特徴とする。さらに、(6)入力音声のホルマントが
持つパワー値を制御関数の出力値に従って面積値に写像
し、パワー値に対応したコントラストのスペクトログラ
ムを出力するスペクトログラム出力システムにおいて、
制御関数のしきい値のパラメータを自動的に更新するパ
ラメータ更新部と、スペクトログラムのパワー値分布を
検出するパワー分布情報作成部と、無音声区間は印字し
ないように、入力された音声から無音声区間を検出する
無音声区間抽出部とを少なくとも具備することを特徴と
する。
【0006】
【作用】本発明においては、シグモイド関数等の非線形
連続関数を用いて、パワー値を図形の面積で写像させて
いる。このため、従来技術で必要であった困難な写像ル
ールの作成が不要となる。また、シグモイド関数の傾き
としきい値を変更することにより、図形の面積とパワー
値の対応を容易に行うことができ、ホルマント分布に応
じて、ホルマントのコントラストを適切に調節すること
が容易であり、ホルマントの持つパワー値が変化して
も、ホルマントを明瞭に出力することができる。このと
き、シグモイド関数におけるしきい値は、パワー値の分
布情報を利用することにより、最適なしきい値のパラメ
ータ値を自動的に計算できる。さらに、入力された音声
波形の無音声区間を検出することにより、スペクトログ
ラムを出力する際に、無音声区間だけを印刷しないよう
にすることも可能であるため、印刷速度の向上およびプ
リンタバッファの負担を軽減することが可能である。
【0007】
【実施例】以下、本発明の実施例を、図面により詳細に
説明する。図1は、本発明の一実施例を示すスペクトロ
グラム出力システムの機能ブロック図である。図1にお
いて、1aは入力された音声波形を保持するための音声
波形保持部、1bはスペクトログラムを抽出するための
スペクトログラム抽出部、1は音声から生成されたスペ
クトログラムを保存するためのスペクトログラム保存
部、2はスペクトログラム保存部1で保存しているスペ
クトログラムからパワー値を取り出すためのパワー値抽
出部、3は本発明に関するものであり、パワー値抽出部
2で抽出したパワー値を長方形の面積に写像する面積写
像部、4は面積写像部3がパワー値を面積に写像する時
に用いるシグモイド関数を登録する関数登録部、4aは
関数登録部4に登録したシグモイド関数の傾きとしきい
値等のホルマントを明瞭に表すためのパラメータのう
ち、傾きを操作者からの更新指示入力に基づき、またし
きい値をしきい値パラメータ決定部4dからの出力に基
づき、それぞれ変更するパラメータ更新部、5は描画す
る図形の寸法を制御するための図形寸法制御部、6はホ
ルマントを表すスペクトログラムをモノカラーで出力す
る白黒レーザビームプリンタ等の出力部、7は出力部6
を制御する命令を保持する出力制御命令保持部、8は出
力部6に送るデータを作成するためのデータ作成部であ
る。また、4bはパワー分布情報作成部、4cはパワー
分布情報作成部4bで作成されたパワー値分布情報を保
持するためのパワー分布情報保持部、4dは閾値パラメ
ータ決定部、4eは音声波形の無音声区間を抽出する無
音声区間抽出部、4fは無音声区間抽出部4eで抽出さ
れた無音声区間情報を保持する無音声区間情報保持部で
ある。
【0008】このような構成により、本実施例のスペク
トログラム出力システムは、スペクトログラムのパワー
データから、シグモイド関数を用いて写像した面積を使
用し、スペクトログラムをモノカラーで出力する。以下
に、その処理動作を説明する。音声波形保持部1aで保
持された音声波形から無音声区間抽出部4eで無音声区
間を取り出し、無音声区間情報保持部4fに保持し、デ
ータ作成のときに無音声区間検出に使われる。スペクト
ログラム保存部1に保存されるスペクトログラムは、音
声波形保持部1aの音声から切り出した音声データを変
換して、周波数対強度のパワー値を求め、時間軸上にこ
のパワー値を並べて生成される。パワー分布情報作成部
4bは、スペクトログラムからパワー分布の情報を作成
し、パワー分布情報作成部4cにこれを保存して、面積
制御関数のしきい値パラメータ決定部4dに渡される。
このしきい値決定のアルゴリズムを図4に示す。すなわ
ち、しきい値パラメータ決定部4dは、図4(a)に示
すように、先ず0〜120dBまでのパワー値の頻度を
求め(ステップ101)、その頻度の平均値をNaとす
る(ステップ102)。次に、NθをθdBの頻度とし
て、θ=120として降順に、Nθ≧Na(グラフが凸
型の場合) Nθ≦Na(グラフがオツ型の場合) となるNθと見つけて、θを閾値とする(ステップ10
3)。凹型のグラフの場合のパワー値の頻度とθの関係
は、図4(b)に示すようになる。
【0009】図1において、パワー値抽出部2は、スペ
クトログラム保存部1に保存されたスペクトログラムか
らパワー値を抽出し、このパワー値を面積写像部3に入
力する。面積写像部3は、シグモイド関数でパワー値を
長方形の面積に写像する。なお、シグモイド関数とは、
次式(1)に示すように、『0』と『1』に収束し、点
(0,0.5)を中心に点対称となる関数で、後述の図
2(a)(b)に示すグラフで表すことができる。 f(X)=1/{1+exp(−X)} ・・・・・・・・・・・・(1) (ただし、f(X)は関数、Xは入力値) この関数f(X)の傾きを変化させれば、点対称の中心
付近で変化率が急激に変化する。本実施例では、パワー
値を図形の面積で表しているが、このような関数f
(X)の性質を利用して指定したパワー値を越えると、
図形の面積を急激に変化させることができる。さらに、
この関数は単調に変化して、『0』と『1』に収束値を
持つので、関数の出力値と図形の面積を対応させ易い。 X=a(x−θ) ・・・・・・・・・・・・・・・・・・・・・・(2) (ただし、xは入力値) 上式(2)のように変換することにより、関数の傾き
(α)としきい値(θ)を自由に変化させることができ
る。この関数の傾き(α)としきい値(θ)はパラメー
タであって、図1の関数登録部4に設定される。
【0010】これらのパラメータ(α)としきい値
(θ)の変化により、面積写像部3による写像の面積が
変わり、ホルマントのコントラストが変化する。例え
ば、ホルマントのパワー値がおよそ『90dB』の時、
しきい値(θ)を『90』とし、かつコントラストを弱
める場合には、傾き(α)を小さくし、また強める場合
には、傾き(α)を大きくする。このように、傾き
(α)を大きな値に変化させれば、しきい値(θ)の前
後で関数の出力値は大きく変化し、この出力に基づいた
面積も顕著に変化する。図2(a)は、しきい値(θ)
を『90』とし、関数f(x)の傾き(α)を『0.2
0』とした場合のグラフであり、図2(b)は、しきい
値(θ)を『90』とし、関数f(x)の傾き(α)を
『0.30』とした場合のグラフである。図2(a)に
示すグラフでは、図2(b)に示すグラフに比べて、関
数f(x)の傾き(α)が小さく(『0.20』<
『0.30』)、入力値(x)の変化に対応する関数f
(x)の変化が小さい。その結果、図2(a)側のパラ
メータ(傾きα=0.20)のシグモイド関数を用いた
場合には、図2(b)側のパラメータ(傾きα=0.3
0)のシグモイド関数を用いた場合に比べて、ホルマン
トのコントラストが弱くなる。
【0011】図1において、図形寸法制御部5は、面積
写像部3がパワー値を面積に写像した図形を、視覚的に
一様に見えるように、具体的な図形の寸法を決定する。
ここでは、面積写像部3の出力値は、『0〜1.0』の
範囲であるので、出力値と長方形の面積を比較させるた
めに、出力値の平方根を求め、この平方根と辺の上限値
との積を求め、図形の寸法とする。次に、データ作成部
8においては、このようにして得られた寸法通りに出力
部6から出力させるため、出力部6に送信するデータを
出力部制御命令を用いて作成する。この出力部制御命令
は、出力部制御命令保持部7に設定されている。データ
作成部8は、このようにして作成したデータを出力部6
に送信し、出力部6から後述の図3に示すようなスペク
トログラムが出力される。
【0012】図3は、図1におけるスペクトログラム出
力システムから出力されたスペクトログラムの一例を示
す図である。本実施例のスペクトログラムは、『バ』,
『ク』,『オ』,『ン』の音声に対応するものであり、
関数の傾き(α)を『0.30』、しきい値(θ)を
『90』とした時の出力例である。この関数の傾き
(α)を変化させれば、ホルマント部分の面積も顕著に
変化し、コントラストが変化する。
【0013】以上、図1〜図4を用いて説明したよう
に、本実施例のスペクトログラム出力システムにおいて
は、パワー値を図形の面積で表し、パワー値と図形の面
積との対応を非線形連続関数であるシグモイド関数を用
いて写像する。これにより、従来のパターン組み合わせ
技術に見られるように、パワー値と何等かの図形を対応
させて出力する場合に問題となっていたパワー値から出
力図形への写像ルールの困難さを解消することができ
る。また、ホルマントの持つパワー値分布の変化に応じ
て、ホルマントのコントラストを容易に調節でき、視覚
的に明瞭なホルマントを表すスペクトログラムを白黒レ
ーザービームプリンタ等から容易に出力させることがで
きる。さらに、本発明では、無音声区間の印刷も省略す
ることが可能となる。なお、本発明は、図1〜図4に示
す実施例に限定されることなく、他の実施例も可能であ
り、種々の変更が可能である。
【0014】
【発明の効果】以上説明したように、本発明によれば、
ホルマントの持つパワー値が変化しても容易にホルマン
トのコントラストを調整することができ、モノカラーに
おける明瞭なホルマントを表したスペクトログラムを出
力することが可能となる。
【図面の簡単な説明】
【図1】本発明の一実施例を示すスペクトログラム出力
システムの機能ブロック図である。
【図2】図1におけるスペクトログラム出力システムで
用いるシグモイド関数のグラフ一実施例を示す図であ
る。
【図3】図1におけるスペクトログラム出力システムか
ら出力されたスペクトログラムの一例を示す図である。
【図4】図1におけるスペクトログラム出力システムの
しきい値パラメータ決定部の動作フローチャート、およ
びパワー分布の説明図である。
【図5】従来のスペクトログラム出力システムから出力
されたスペクトログラムの一例を示す図である。
【符号の説明】 1a 音声波形保持部 1b スペクトログラム抽出部 1 スペクトログラム保存部 2 パワー値抽出部 3 面積写像部 5 図形寸法制御部 6 出力部 7 出力部制御命令保持部 8 データ作成部 4 関数登録部 4a パラメータ更新部 4b パワー分布情報作成部 4c パワー分布情報保持部 4d しきい値パラメータ決定部 4e 無音声区間抽出部 4f 無音声区間情報保持部
【手続補正書】
【提出日】平成6年2月18日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】図6
【補正方法】追加
【補正内容】
【図6】従来におけるパワー値と組合わせパターン群を
示す図である。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 音声のホルマント分析に用いるスペクト
    ログラムをモノカラーで出力するスペクトログラム出力
    システムにおいて、 入力された音声から生成された上記スペクトログラムか
    ら抽出したパワー値を面積に写像する面積写像手段を具
    備したことを特徴とするスペクトログラム出力システ
    ム。
  2. 【請求項2】 請求項1に記載のスペクトログラム出力
    システムにおいて、上記面積写像手段が上記パワー値の
    面積への写像に用いる非線形連続関数を登録する関数登
    録手段を具備することを特徴とするスペクトログラム出
    力システム。
  3. 【請求項3】 請求項2に記載のスペクトログラム出力
    システムにおいて、上記関数登録手段に登録する上記非
    線形連続関数として、シグモイド関数を用いることを特
    徴とするスペクトログラム出力システム。
  4. 【請求項4】 請求項3に記載のスペクトログラム出力
    システムにおいて、上記関数登録手段に登録された上記
    シグモイド関数の傾きとしきい値のパラメータを、操作
    者からの指示入力に基づいて更新するパラメータ更新手
    段を具備することを特徴とするスペクトログラム出力シ
    ステム。
  5. 【請求項5】 請求項1から請求項4のいずれかに記載
    のスペクトログラム出力システムにおいて、上記面積写
    像手段で上記パワー値を写像する面積を長方形の面積と
    することを特徴とするスペクトログラム出力システム。
  6. 【請求項6】 入力音声のホルマントが持つパワー値を
    制御関数の出力値に従って面積値に写像し、該パワー値
    に対応したコントラストのスペクトログラムを出力する
    スペクトログラム出力システムにおいて、 上記制御関数のしきい値のパラメータを自動的に更新す
    るパラメータ更新手段と、無音声区間は印字しないよう
    に、入力された音声から無音声区間を検出する無音声区
    間抽出手段とを少なくとも具備することを特徴とするス
    ペクトログラム出力システム。
JP5284784A 1992-12-08 1993-11-15 スペクトログラム出力システム Pending JPH06230796A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5284784A JPH06230796A (ja) 1992-12-08 1993-11-15 スペクトログラム出力システム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP4-327845 1992-12-08
JP32784592 1992-12-08
JP5284784A JPH06230796A (ja) 1992-12-08 1993-11-15 スペクトログラム出力システム

Publications (1)

Publication Number Publication Date
JPH06230796A true JPH06230796A (ja) 1994-08-19

Family

ID=26555606

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5284784A Pending JPH06230796A (ja) 1992-12-08 1993-11-15 スペクトログラム出力システム

Country Status (1)

Country Link
JP (1) JPH06230796A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013195402A (ja) * 2012-03-22 2013-09-30 Toshiba Corp 信号分析装置、方法及びプログラム
CN113257232A (zh) * 2021-07-07 2021-08-13 深圳市声扬科技有限公司 语谱图的生成方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013195402A (ja) * 2012-03-22 2013-09-30 Toshiba Corp 信号分析装置、方法及びプログラム
CN113257232A (zh) * 2021-07-07 2021-08-13 深圳市声扬科技有限公司 语谱图的生成方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN107705782A (zh) 用于确定音素发音时长的方法和装置
JP7465992B2 (ja) オーディオデータ処理方法、装置、機器、記憶媒体及びプログラム
JPH06230796A (ja) スペクトログラム出力システム
SE516526C2 (sv) Metod och anordning vid automatisk extrahering av prosodisk information
JPH06250693A (ja) スペクトログラム出力システム
JPH04199098A (ja) 規則音声合成装置
JP2001134290A (ja) 音声認識システム、方法及び記録媒体
JPH05134691A (ja) 音声合成方法および装置
Olives et al. Towards a high quality finnish talking head
JP2575252B2 (ja) 発音辞書管理方法
JPH05341705A (ja) 会話訓練装置
JP2703253B2 (ja) 音声合成装置
CN108628839A (zh) 一种使用卷积神经网络算法翻译普通话和西班牙语的方法
JPH0877152A (ja) 音声合成装置
JP2003223180A (ja) 音声素片生成方法と装置及びプログラム、並びに音声合成方法と装置
JPH06161491A (ja) 音声合成装置の継続時間長処理方式
JP4366918B2 (ja) 携帯端末
KR20240080691A (ko) 인공지능 음성 변조를 이용한 외국어 통번역 장치 및 방법
JPH02236600A (ja) 合成音声情緒付与回路
JPS62191892A (ja) 音声の画像表示装置
JP3218639B2 (ja) 規則音声合成装置におけるエネルギ制御方法
JPH04298794A (ja) 音声データ修正システム
JP2573587B2 (ja) ピッチパタン生成装置
Mentyukov Followers of Theremin from Siberia
JPH09160583A (ja) 音声情報処理方法及び装置