JP3623820B2 - 音声処理装置 - Google Patents

音声処理装置 Download PDF

Info

Publication number
JP3623820B2
JP3623820B2 JP12307095A JP12307095A JP3623820B2 JP 3623820 B2 JP3623820 B2 JP 3623820B2 JP 12307095 A JP12307095 A JP 12307095A JP 12307095 A JP12307095 A JP 12307095A JP 3623820 B2 JP3623820 B2 JP 3623820B2
Authority
JP
Japan
Prior art keywords
data
voice
power
frequency
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP12307095A
Other languages
English (en)
Other versions
JPH08292791A (ja
Inventor
英人 苫米地
Original Assignee
株式会社ジャストシステム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社ジャストシステム filed Critical 株式会社ジャストシステム
Priority to JP12307095A priority Critical patent/JP3623820B2/ja
Publication of JPH08292791A publication Critical patent/JPH08292791A/ja
Application granted granted Critical
Publication of JP3623820B2 publication Critical patent/JP3623820B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【産業上の利用分野】
本発明は音声処理装置に係り、詳細には、スペクトル解析された音声データを変更する音声処理装置に関する。
【0002】
【従来の技術】
音声や音楽等の情報の記録と再生を行うものとして、テープレコーダやCDプレーヤ等の種々の機器が使用されている。これらの機器では、音声等の信号をアナログデータとして、または、PCM(Pulse Code Modulation) によるディジタルデータとして、音声等の記録と再生を行うようになっている。
一方、パーソナルコンピュータ等の各種OA機器がオフィスや工場において広く普及しており、これらの機器においても、データの処理だけでなく、音声や音楽等といった音のデータの保存や再生に利用されている。パーソナルコンピュータで音声の保存等を行う場合には、PCMによるディジタルデータとしてフロッピーディスクやハードディスク等の記憶媒体に保存するようにしている。
【0003】
【発明が解決しようとする課題】
しかし、これらの各機器に記録された音声データを加工する場合、カセットテープレコーダの場合には、再生時の回転数を変えることで音程を変更することができるが、再生速度も変化するため不自然である。また、様々な形態に音声データを変更することはできなかった。
また、PCMにより記録された音声データの場合、音声データの内容がコード化された“0”と“1”の連続であるため、データを変更した場合にどの様に変化するのかを予測することができなかった。
【0004】
そこで、本発明は以上説明した従来の課題を解決するためになされたもので、音声データを変更することが容易な音声処理装置を提供することを目的とする。
【0005】
【課題を解決するための手段】
請求項1記載の発明では、ディジタルデータ化された音声データを獲得する音声獲得手段と、この音声獲得手段で獲得された音声データについてスペクトル解析し、時間、周波数、パワーの3要素からなるスペクトル音声データに変換するスペクトル解析手段と、前記スペクトル解析手段で解析されたスペクトル音声データについて、各時間および各周波数に対するパワーを画像表示する表示手段と、前記表示手段で表示された画像上で、任意の領域を指定する領域指定手段と、前記領域指定手段で指定された領域の移動先を、前記表示手段で表示された画像上で指定する移動先指定手段と、前記領域指定手段で指定される領域内に存在するスペクトル音声データについて、時間、パワー、周波数の少なくとも1のデータについて変更を行うデータ変更手段と、このデータ変更手段で変更された処理音声データを出力する出力手段と、を具備し、前記データ変更手段は、前記領域指定手段で指定される領域内に存在するスペクトル音声データを、前記移動先指定手段により指定された移動先へ移動することにより前記目的を達成する。
【0006】
請求項記載の発明では、請求項1記載の音声処理装置において、前記データ変更手段は、時間、周波数、パワーについて特定の処理を行うためのスケールを複数記憶したスケール記憶手段、及び前記スケールを指定するスケール指定手段を備え、前記スケール指定手段で指定されたスケールに従ってデータ変更を行う。
【0007】
請求項記載の発明では、請求項1または請求項2記載の音声処理装置において、前記出力手段は、前記データ変更手段で変更された後の処理音声データについての時間、周波数、パワーから、スペクトル逆変換により音声を再生して出力する音声再生手段を具備する。
請求項記載の発明では、請求項1から請求項のうちのいずれか1の請求項に記載された音声処理装置において、前記出力手段は、前記スペクトル解析手段で解析されたスペクトル音声データについて、各時間および各周波数に対するパワーを文字列データに変換する文字列変換手段と、この文字列変換手段で変換された文字列データを送信する送信手段とを具備する。
【0008】
請求項記載の発明では、請求項1から請求項のうちのいずれか1の請求項に記載された音声処理装置において、前記出力手段は、前記スペクトル解析手段で解析されたスペクトル音声データ、または、前記データ変更手段で変更された処理音声データについて、各時間および各周波数に対するパワーを画像表示する画像表示手段を具備する。
請求項記載の発明では、請求項1から請求項のうちのいずれか1の請求項に記載の音声処理装置において、前記表示手段は、前記パワーを、その値に応じた色でカラー表示する。
【0009】
【作用】
請求項1記載の音声処理装置では、音声獲得手段で獲得したディジタルデータ化された音声データを、スペクトル解析手段において、スペクトル解析し、時間、周波数、パワーの3要素からなるスペクトル音声データに変換する。そして、表示手段において、スペクトル解析された音声データについて、各時間および各周波数に対するパワーを画像表示し、領域指定手段において、表示された画像上で、任意の領域を指定する。指定された領域内に存在するスペクトル音声データについて、時間、パワー、周波数の少なくとも1のデータの変更を変更手段で行い、出力手段により出力する。詳しくは、領域指定手段で指定された移動先へ、時間、周波数、パワーについてのデータ移動を行う。
【0010】
請求項記載の音声処理装置では、データ変更手段が、スケール指定手段で指定されたスケールに従って時間、周波数、パワーについて特定の処理を行う。
【0011】
請求項記載の音声処理装置では、出力手段の音声再生手段が、データ変更手段で変更された後の処理音声データについての時間、周波数、パワーから、スペクトル逆変換により音声を再生して出力する。
請求項記載の音声処理装置では、出力手段の文字列変換手段がスペクトル解析手段で解析されたスペクトル音声データについて、各時間および各周波数に対するパワーを文字列データに変換し、変換された文字列データを送信手段で送信する。
【0012】
請求項記載の音声処理装置では、表示手段が、データ変更手段で変更された処理音声データについて、各時間および各周波数に対するパワーを画像表示する。
請求項記載の音声処理装置では、表示手段が、パワーを、その値に応じた色でカラー表示する。
【0013】
【実施例】
以下、本発明の音声処理装置における一実施例を図1から図8を参照して詳細に説明する。
図1は、音声処理装置の構成を表したものである。この図に示すように、音声処理装置は、CPU(中央処理装置)11を備えており、データバス等のバスライン12を介して、ROM13、RAM14、通信制御装置15、プリンタ16、表示装置17、入力装置18、FFT装置(高速フーリエ変換装置)21、逆FFT装置22と接続されている。
【0014】
ここで、ROM13は、音声処理装置の機能を実現するための基本的なプログラムやデータ通信用プログラム等の各種プログラム等が格納されたリード・オンリ・メモリである。またROM13には、これら各種のプログラムの実行により必要とされる各種データも格納されている。例えば、音声処理のためのデータとして、時間、周波数、パワーについて特定の音声処理を行うためのスケールデータが格納れている。
RAM14は、ROM13に格納された所定のプログラムがダウンロードされると共に、CPU11のワーキングメモリとして使用されるランダム・アクセス・メモリである。このRAM14には、FFT装置21により時間、周波数、パワーの3要素にスペクトル解析された音声データが格納される、スペクトル音声データ格納領域や、このスペクトル音声データを入力装置から入力された指示データやROM13のスケールデータに従って変更処理した後のデータが格納される処理音声データ格納領域や、文字列データ(テキストデータ)に変更されたスペクトル音声データや処理音声データが格納される文字列データ格納領域等の各種データの格納領域が確保されるようになっている。
【0015】
通信制御装置15は、電話回線網、LAN、パーソナルコンピュータ通信網等の各種の通信網2を介して、他の通信制御装置との間で文字列データに変換された、音声データの送受信を行う。文字列データへの変換は、RAM14に格納されたスペクトル音声データや処理音声データである。また通信制御装置15は、PCM化された音声データや、音声のアナログデータも受信できるようになっている。
【0016】
プリンタ16は、レーザプリンタやドットプリンタ等を備えており、入力データや、送受信する文書の内容を印刷するようになっている。また、表示装置17に画像表示されたスペクトル音声データや、処理音声データを印刷するようになっている。このプリンタ16は、表示装置17のカラー画像表示に対応したカラー印刷を行うことができるようになっている。
表示装置17は、CRTディスプレイや液晶ディスプレイ等の画像表示部と表示制御部とを備えており、送信する文書や受信した文書を表示するようになっている。また、表示装置17は、RAM14に格納されたスペクトル音声データや処理音声データについて、時間軸、周波数軸、パワー軸の三次元表示し、各時間と周波数に対するパワーを表示するようになっている。パワーの表示は、棒グラフや三次元平面により表示する。そして3次元表示の際に、パワーの値に応じた色でカラー表示するようになっている。カラー表示は、例えば、パワーが高いほど赤く、低いほど青くなるように表現する。
また、表示装置17の表示画面には、音声データの三次元表示と共に、音声処理の指示内容等も表示されるようになっている。
【0017】
入力装置18は、FFT装置21のパラメータの変更や設定条件等を入力したり、文章の入力処理等を行うための入力装置であり、数字を入力するテンキー、文字を入力する文字キー、各種の機能を実現するための機能キー等が配置されている。入力装置18からは、これらのキー操作により、RAM14の音声処理を行うためのスケールを指定したり、スケールによらない任意処理により音声について、時間、周波数、パワーの各要素についての指示を入力するようになっている。
この入力装置には、ポインティングデバイスとしてのマウス19が接続されている。
【0018】
FFT装置21には、マイク等の音声入力装置23が接続されている。このFFT装置21は、音声入力装置23から入力されたアナログの音声データを、ディジタルに変換すると共に、離散的フーリエ変換によりスペクトル解析を行う。また、FFT装置21は、通信制御装置15で受信したPCM化された音声データや、音声のアナログデータについても、スペクトル解析を行う。FFT21でスペクトル解析された音声データは、RAM14のスペクトル音声データ格納領域に格納されるようになっている。
逆FFT装置22には、スピーカ等の音声出力装置24が接続されている。逆FFT装置22は、RAM14に格納されているスペクトル音声データや、処理音声データについて、逆FFT変換処理を行うことでアナログの音声データを生成し、音声出力装置24から出力する。また、逆FFT装置22は、通信制御装置15で他の装置から受信したスペクトルデータ(スペクトル音声データや処理音声データ)についての音声の再生も行うようになっている。
【0019】
次に、このように構成された実施例の動作について説明する。
図2は、音声入力装置23から入力された音声データの状態を表したものである。
この図2に示すようなアナログの音声データが音声入力装置23から入力されると、そのアナログデータは順次FFT装置21に供給される。FFT装置21では、アナログ音声データを22KHzでサンプリングし、16ビットのPCMデータにA/D変換し、図示しない記憶装置に格納する。
【0020】
次いでFFT装置21では、方形窓、ハミング(Hamming)窓、ハニング(Hannig)窓等の時間窓の形や、ポイント数等のパラメータに従って、各時刻tn(n=1、2、…)毎に、高速フーリエ変換(FFT)処理によりディジタル音声データのスペクトル解析を行う。すなわち、FFT装置21は、各時刻tn毎に、各周波数fmに対するパワーPnmを算出する。
そして、FFT装置21のスペクトル解析で算出された各時間と各周波数に対するパワー値は、図3に示すように、RAM14のスペクトル音声データ格納領域に格納される。なお、スペクトル音声データとしては、図示した実数部以外に、各パワー値に対応した虚数部のデータもRAM14に格納されるようになっている。
【0021】
また、CPU11は、RAM14に格納したスペクトル音声データに基づいて、音声入力装置23から入力された音声データについてのスペクトルを、図4に示すように、三次元的に表示装置17に表示する。
このように、スペクトル解析されたデータを画像表示することで、ユーザは、音声データの内容をグラフィックに確認しながら、音声処理を行うことができる。
【0022】
音声処理を行う場合、ユーザは、入力装置18のキー操作により音声処理を選択すると共に、スペクトル音声データの処理をスケールによるか、または任意処理によるかを選択する。
スペクトル音声データ処理するために予め用意されたスケールとしては、例えば、早口処理、遅口処理、高音処理、低音処理、男性音化処理、女性音化処理、子供音声化処理、大人音声化処理、暗音声化処理、明音声化処理、怒音声化処理、笑声化音声処理、抑揚変更処理、等の各種スケールが存在する。
【0023】
例えば、早口処理の場合には、指定された速さに応じて、所定時間tnのデータを間引くことで、早口処理される。これによって、音声の音程を変えることなく、高速再生を行うことができ、早口で喋っているような状態とすることができる。
また、暗音声化処理では、図5の斜線部Aで示すように、低周波数のパワーを大きくすることで同一人の音声について暗い感じの音声に変えることができる。女性の音声であれば、低い周波数のパワーを大きくすることで男性音声化され、逆に、高い周波数のパワーを大きくするとこで男性の音声を女性の音声のように処理することができる。
さらに、怒音声処理では、例えば、パワーデータを全体的に高周波数側に移動させると共に、全周波数に対するパワーを、音声の最初の部分(t=0近辺)で大きくし、以後、全周波数に対するパワーを一定の周期で小さくたり大きくしたりする。
このように、所定の時間や周波数に対するパワーについて、一定のスケールに従って、変更することが可能となる。
【0024】
一方、任意処理の場合、表示装置17に表示されたスペクトル音声データを見ながら、入力装置のキーボードやマウス19を使用して、任意位置のパワーを変更する。
図6は任意処理の状態を表したものである。
この図6(a)に示すように、任意処理の場合、例えばマウス19を使用して特定の周波数位置61にカーソルを移動してクリックすることで、変更する周波数を指定する。マウス19で指定された周波数のパワーは点々で塗りつぶれ、明確に表示される。そして、カーソルの移動と共に一点鎖線で示すようにパワーの値も変化する。カーソルを変更したい位置62で再度クリックすると、図6(b)に示すように、その位置にパワーの値が変更される。
【0025】
また、一定範囲の周波数に付いて一括して変更する場合、範囲変更処理を指定する。その後、変更したい範囲の左上63と右下64をクリックすることで範囲指定がされ、指定された範囲が点線65で表示されると共に、その範囲内にパワーの値が含まれている周波数のパワーが点々で塗り潰される。そして、カーソルを上下に移動することで一点鎖線の指定範囲67が上下に移動すると共に、点々で塗り潰された周波数のパワーがカーソルの移動量に応じて上下に変化する。カーソルの移動により希望する位置66に指定範囲が移動した段階でマウス19をクリックすると、図6(b)に示すように、その位置にパワーが変化する。
なお、範囲指定する場合、左上63と右下64ではなく、右上と左下をクリックすることでも同一範囲を指定することができる。
【0026】
さらに、所定の周波数をキーボードから指定することも可能である。すなわち、キーボードから周波数fpとfqを指定すると、その範囲の全周波数が点線表示される。その後パワーの増減量をキーボードから入力することで、図6(b)に示すように、パワー値が変更される。また、マウス19を点線表示された範囲に移動してクリックすることで、点線65で示したようにマウス処理に移行させ、マウス19の移動でパワーの値を変更することも可能である。
また、各周波数に対するパワーについて、他の周波数に移動したり、複写したりすることも可能である。この複写や移動についても、左上と右下の位置を指定することで範囲指定することができる。
【0027】
なお、図6では、時間軸については表示されていないが、入力装置18により、任意の時間軸trについて指定することで、その時間軸trについての各周波数とパワーを表示装置17に表示し、変更することができる。また、任意の周波数軸fsを指定することで、指定された周波数における、時間軸とパワー軸とからなる時間とパワーとの関係を表示装置17に表示するようにしてもよい。
更に、図4に示す、スペクトルの三次元表示の状態で変更処理を行うようにてもよい。
【0028】
以上のようにしてスペクトル音声データについての音声処理が行われると、各変更処理毎に、変更後のデータが、RAM14の処理音声データ格納領域に格納される。なお、スペクトル音声データ格納領域に格納されている各パワーの値を直接変更するようにしてもよい。
【0029】
そして、ユーザは、表示装置17を見ながらスペクトル変更を行うと共に、変更処理後に、入力装置18から音声再生操作を行うことで、変更後の音声を確認することができる。すなわち、音声再生の指示が入力されると、CPU11は、RAM14の処理音声データ領域に格納された処理音声データ(時間、周波数、パワーからなるスペクトルデータ)を読み出し、順次逆FFT装置22に供給する。逆FFT装置22では、供給されたスペクトルデータについて逆FFT変換を行う。すなわち、各周波数とそのパワーから、各時間tn毎の音声波形を順次再生し、音声出力装置24から変更後の音声を出力する。
出力音声を聞いて、良くなければ再度音声処理を行う。このように、変更した後の音声を確認しながら音声処理を行うことで、容易に自分の思うような音声に変更処理することができる。
なお、RAM14に格納されているスペクトル音声データや、音声処理後の処理音声データは、フロッピーディスクやCD−ROM等の記憶媒体に格納しておくことも可能である。
【0030】
また、ユーザは、変更処理後の処理音声データについて、通信制御装置15を介して、他のユーザに送信することができる。送信する場合、RAM14に格納されている各時間と各周波数に対するパワーの値を、PCMデータではなく、図3に示した数字による文字列データ(テキストデータ)に変換して送受信する。また、文字列データとして、さらに、アスキーコードによる128進法や、a〜zのアルファベットによる26進法等に変換して送信するようにしてもよい。このように、音声のスペクトルデータを文字列データに変換することで、文字列のみを送受信対象としている電子メールでの伝送や、パーソナルコンピュータ通信等が可能になる。
【0031】
以上説明した実施例では、スペクトルデータについて、三次元の棒グラフで表示装置17に画像表示したが、本発明はこれに限定されるものではなく、他の方法によることも可能である。例えば、図7に示すように、スペクトルデータについて三次元平面により表現することも可能である。
また、本発明では、図8に示すように、パワーの値に応じた色でカラー表示することも可能である。
このように、三次元平面や、カラー表示することで、音声に対するスペクトルデータの状態をより分かりやすく表現することができる。
【0032】
また、本実施例の音声処理装置を電話機として使用するようにしてよもい。この場合、予め、音声変更処理を行うスケールや、任意変更における変更値を指定しておく。そして、音声入力装置23から入力された音声データについて、FFT装置21で分析した各時間tn毎のスペクトル音声データ(各周波数Fに対応するパワー)情報を、指定されたスケールや変更値に応じて変更し、通信制御装置15からリアルタイムで逐次送信する。なお、電話通信に音声処理装置を使用する場合、必ずしも16ビット、22KHzで音声をサンプリングする必要はなく、16ビット、4KHzまたは、8ビット、4KHzのように、nビット、mKHzによるサンプリングでもよい。また、通話者の選択により、nビット、mKHzの値を決定するようにしてもよい。
【0033】
また、以上説明した実施例では、音声入力装置23から入力された音声をFFT装置21でスペクトル解析すると共に、音声処理後の処理音声データを逆FFT装置22で音声再生して音声出力装置24から出力する構成としたが、本発明では、この構成に限定されるものではない。例えば、FFTおよび逆FFT等の離散的フーリエ変換とその逆変換を行うプログラムをROM13に格納しておき、このプログラムに従って入力音声からのスペクトル解析や、音声再生処理をCPU11が行うようにしてよもい。
さらに、本実施例ではFFT装置、および逆FFT装置により、音声データのスペクトル解析を行ったが、本発明では、DCT(離散コサイン変換)等の他の周波数解析方法を使用してもよい。
【0034】
また、本実施例では、音声データを音声入力装置23から獲得する場合について説明したが、通信制御装置15により、PCM化された音声データや、音声のアナログデータも受信するようにしてもよい。受信した音声データは、アナログの場合にはディジタルに変換した後、スペクトル解析を行う。
【0035】
【発明の効果】
以上説明したように請求項1記載の音声処理装置によれば、ディジタルデータ化された音声データを獲得する音声獲得手段と、この音声獲得手段で獲得された音声データについてスペクトル解析し、時間、周波数、パワーの3要素からなるスペクトル音声データに変換するスペクトル解析手段と、このスペクトル解析手段で解析されたスペクトル音声データについて、各時間および各周波数に対するパワーを画像表示する表示手段と、表示手段で表示された画像上で、任意の領域を指定する領域指定手段と、領域指定手段で指定された領域の移動先を、表示手段で表示された画像上で指定する移動先指定手段と、領域指定手段で指定される領域内に存在するスペクトル音声データについて、時間、パワー、周波数の少なくとも1のデータの変更を行うデータ変更手段と、このデータ変更手段で変更された処理音声データを出力する出力手段と、を具備移動先指定手段で指定された移動先へ、領域指定手段で指定される領域内に存在するスペクトル音声データを移動することにより、表示された音声データを見ながら、任意位置のスペクトル音声データを移動することができるため、音声データを変更することが容易になる。
請求項記載の音声処理装置によれば、スケール記憶手段に記憶された、時間、周波数、パワーについて特定の処理を行うためのスケールをスケール指定手段で指定することで、スケールに従ったデータ変更を行うことができる。
請求項記載の音声処理装置によれば、データ変更手段で変更された後の処理音声データについての時間、周波数、パワーから、スペクトル逆変換により音声を再生することができる。
請求項記載の音声処理装置によれば、スペクトル解析手段で解析された各時間および各周波数に対するパワーを文字列データに変換して送信することができる。
請求項記載の音声処理装置によれば、データ変更手段で変更された処理音声データについて、各時間および各周波数に対するパワーを画像表示することができる。
請求項記載の音声処理装置によれば、パワーを、その値に応じた色でカラー表示することができる。
【図面の簡単な説明】
【図1】本発明の一実施例における音声処理装置の構成図である。
【図2】同上、音声入力装置から入力された音声データを示す説明図である。
【図3】同上、音声処理装置のRAMに格納されるスペクトル音声データの内容を示す説明図である。
【図4】同上、音声処理装置のRAMに格納されたスペクトル音声データを表示装置に三次元的に表示した説明図である。
【図5】同上、音声処理装置において、スケールによる暗音声化処理の説明図である。
【図6】同上、音声処理装置において、任意処理の説明図である。
【図7】同上、音声処理装置において、スペクトルデータを三次元平面で表示装置に画像表示した状態を示す説明図である。
【図8】同上、音声処理装置において、スペクトルデータをパワーの値に応じた色でカラー表示した状態を示す説明図である。
【符号の説明】
11 CPU
13 ROM
14 RAM
15 通信制御装置
16 プリンタ
17 表示装置
18 入力装置
21 FFT装置
22 逆FFT装置
23 音声入力装置
24 音声出力装置

Claims (6)

  1. ディジタルデータ化された音声データを獲得する音声獲得手段と、
    この音声獲得手段で獲得された音声データについてスペクトル解析し、時間、周波数、パワーの3要素からなるスペクトル音声データに変換するスペクトル解析手段と、
    前記スペクトル解析手段で解析されたスペクトル音声データについて、各時間および各周波数に対するパワーを画像表示する表示手段と、
    前記表示手段で表示された画像上で、任意の領域を指定する領域指定手段と、
    前記領域指定手段で指定された領域の移動先を、前記表示手段で表示された画像上で指定する移動先指定手段と、
    前記領域指定手段で指定される領域内に存在するスペクトル音声データについて、時間、パワー、周波数の少なくとも1のデータについて変更を行うデータ変更手段と、
    このデータ変更手段で変更された処理音声データを出力する出力手段と、を具備し、
    前記データ変更手段は、前記領域指定手段で指定される領域内に存在するスペクトル音声データを、前記移動先指定手段により指定された移動先へ移動することを特徴とするを特徴とする音声処理装置。
  2. 前記データ変更手段は、時間、周波数、パワーについて特定の処理を行うためのスケールを複数記憶したスケール記憶手段、及び前記スケールを指定するスケール指定手段を備え、前記スケール指定手段で指定されたスケールに従ってデータ変更を行うことを特徴とする請求項記載の音声処理装置。
  3. 前記出力手段は、前記データ変更手段で変更された後の処理音声データについての時間、周波数、パワーから、スペクトル逆変換により音声を再生して出力する音声再生手段を具備することを特徴とする請求項1または請求項2記載の音声処理装置。
  4. 前記出力手段は、前記スペクトル解析手段で解析されたスペクトル音声データについて、各時間および各周波数に対するパワーを文字列データに変換する文字列変換手段と、
    この文字列変換手段で変換された文字列データを送信する送信手段と、
    を具備することを特徴とする請求項1から請求項のうちのいずれか1の請求項に記載された音声処理装置。
  5. 前記表示手段は、前記データ変更手段で変更された処理音声データについて、各時間および各周波数に対するパワーを画像表示することを特徴とする請求項1から請求項のうちのいずれか1の請求項に記載された音声処理装置。
  6. 前記表示手段は、前記パワーを、その値に応じた色でカラー表示することを特徴とする請求項1から請求項のうちのいずれか1の請求項に記載された音声処理装置。
JP12307095A 1995-04-24 1995-04-24 音声処理装置 Expired - Fee Related JP3623820B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12307095A JP3623820B2 (ja) 1995-04-24 1995-04-24 音声処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12307095A JP3623820B2 (ja) 1995-04-24 1995-04-24 音声処理装置

Publications (2)

Publication Number Publication Date
JPH08292791A JPH08292791A (ja) 1996-11-05
JP3623820B2 true JP3623820B2 (ja) 2005-02-23

Family

ID=14851456

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12307095A Expired - Fee Related JP3623820B2 (ja) 1995-04-24 1995-04-24 音声処理装置

Country Status (1)

Country Link
JP (1) JP3623820B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105404642A (zh) * 2015-10-23 2016-03-16 广东欧珀移动通信有限公司 一种音频播放方法及用户终端
US11748594B2 (en) 2019-10-23 2023-09-05 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4813774B2 (ja) * 2004-05-18 2011-11-09 テクトロニクス・インターナショナル・セールス・ゲーエムベーハー 周波数分析装置の表示方法
JP4543261B2 (ja) 2005-09-28 2010-09-15 国立大学法人電気通信大学 再生装置
JP5019807B2 (ja) * 2006-07-07 2012-09-05 シャープ株式会社 音声合成装置、音声合成方法および音声合成方法を実現するためのプログラム
JP5462474B2 (ja) * 2008-11-25 2014-04-02 富士フイルム株式会社 超音波診断装置
US9826959B2 (en) 2008-11-04 2017-11-28 Fujifilm Corporation Ultrasonic diagnostic device
JP6134309B2 (ja) * 2014-12-16 2017-05-24 アンリツ株式会社 移動端末試験装置及び移動端末試験方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105404642A (zh) * 2015-10-23 2016-03-16 广东欧珀移动通信有限公司 一种音频播放方法及用户终端
CN105404642B (zh) * 2015-10-23 2019-03-15 Oppo广东移动通信有限公司 一种音频播放方法及用户终端
US11748594B2 (en) 2019-10-23 2023-09-05 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof

Also Published As

Publication number Publication date
JPH08292791A (ja) 1996-11-05

Similar Documents

Publication Publication Date Title
JP3753007B2 (ja) 演奏支援装置、演奏支援方法並びに記憶媒体
EP2015278B1 (en) Media Interface
JP2011516907A (ja) 音楽の学習及びミキシングシステム
EP1212747A1 (en) Method and apparatus for playing musical instruments based on a digital music file
US6205427B1 (en) Voice output apparatus and a method thereof
Hynninen et al. GuineaPig-A generic subjective test system for multichannel audio
JP3623820B2 (ja) 音声処理装置
KR100405061B1 (ko) 언어 학습장치 및 그것의 언어 분석방법
CN106471569A (zh) 语音合成设备、语音合成方法及其程序
EP1845528A1 (en) Music data processing apparatus and method
JPH11161465A (ja) 情報処理装置、情報処理システムおよびその方法、ならびに情報媒体
US20040194152A1 (en) Data processing method and data processing apparatus
JP4720974B2 (ja) 音声発生装置およびそのためのコンピュータプログラム
JP3987172B2 (ja) 対話型コミュニケーション端末装置
JP3620423B2 (ja) 楽曲情報入力編集装置
JP2009093191A (ja) 配信方法、配信システム、携帯端末機及びコンピュータプログラム
JP2007235865A (ja) 再生システム
JP2016206591A (ja) 語学学習用コンテンツ配信システム、語学学習用コンテンツ生成装置、および、語学学習用コンテンツ再生プログラム
JP3267193B2 (ja) 音声読み上げ装置
KR20020074816A (ko) 휴대용 다기능 전자책 및 그 제어방법
KR20010017323A (ko) 어학 학습 기능을 갖는 웹 브라이징 장치 및 방법
JP2001022744A (ja) 音声処理装置及び音声処理プログラムを記録した記録媒体
JP2000338952A (ja) 文字アニメーション編集装置および文字アニメーション再生表示装置
JPH0773320A (ja) イメージ音楽生成装置
JP2001215978A (ja) 音声によるカラオケ歌曲選定システム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040511

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040709

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041126

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101203

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees