JP3008701B2 - 音声解析方法及び装置 - Google Patents

音声解析方法及び装置

Info

Publication number
JP3008701B2
JP3008701B2 JP4310563A JP31056392A JP3008701B2 JP 3008701 B2 JP3008701 B2 JP 3008701B2 JP 4310563 A JP4310563 A JP 4310563A JP 31056392 A JP31056392 A JP 31056392A JP 3008701 B2 JP3008701 B2 JP 3008701B2
Authority
JP
Japan
Prior art keywords
sound
voice
analog
electric signal
phase portrait
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4310563A
Other languages
English (en)
Other versions
JPH05313700A (ja
Inventor
尚哉 宮野
学 藤戸
明 三城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Sumitomo Metal Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Metal Industries Ltd filed Critical Sumitomo Metal Industries Ltd
Priority to JP4310563A priority Critical patent/JP3008701B2/ja
Publication of JPH05313700A publication Critical patent/JPH05313700A/ja
Application granted granted Critical
Publication of JP3008701B2 publication Critical patent/JP3008701B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声解析に関し、より詳
細には医療・生体エレクトロニクスで使用される音声の
解析方法及びその実施に使用する装置に関する。
【0002】
【従来の技術】従来より音の解析は、客観的な解析が困
難であったが、近年、デジタル信号処理等を用いること
によって客観的に解析できるようになってきた。その代
表的な例としてマイクロホンから入力された音声を電気
信号に変換し、その電気信号の強度の時間的変化を表し
た曲線(時系列変動曲線)や電気信号の強度の周波数分
布を示した図(パワースペクトラム)によって解析する
方法がある。図6はある被験者が「あ」を発声したとき
の時系列変動曲線である。時系列変動曲線による音声解
析方法は、図6に示すような曲線の形状によって音声を
解析しようとする方法である。また、図7は同じ被験者
が「あ」を発声したときのパワースペクトラムを示した
図である。パワースペクトラムによる音声解析方法は、
図7に示すようなピークの位置(周波数)とその強度に
よって音声を解析しようとする方法である。
【0003】
【発明が解決しようとする課題】しかしながら、時系列
変動曲線による音声解析方法では強度の時間的変動から
判断するため、強度の時間的変動が同じ傾向を示す音声
を識別することが難しく、音声の解析が困難なことがあ
る。また、長時間に亘る発声の音声以外は解析できない
という課題がある。
【0004】一方、パワースペクトルによる音声解析方
法では長時間にわたる発生の経時変化は解析できないと
いう課題がある。さらに、時系列変動曲線及び、パワー
スペクトルによる音声解析方法では視覚的識別が容易で
ないという課題がある。本発明はこのような従来方法の
問題を解決するためなされたものであり、カオス力学系
理論における位相ポートレート作成方法を利用すること
により、解析対象音声は長時間、短時間のいずれの発声
でもよく、また視覚的識別が容易な特徴を抽出すること
ができる音声解析方法及びその実施に使用する音声解析
装置を提供することを目的とする。
【0005】
【課題を解決するための手段】本発明に係る音声解析方
法は、音声を電気信号に変換してこれを解析する方法に
おいて、前記電気信号の値を一定周期でサンプリング
し、サンプリングしたデータを要素とする時系列集合か
ら一定時間を隔てた複数の前記要素から成る座標値を選
択し、複数の前記座標値から位相ポートレートを作成
し、該位相ポートレートの情報から音声を解析すること
を特徴とする。
【0006】また本発明に係る音声解析装置は、音声を
アナログの電気信号に変換する音電変換器と、該音電変
換器によって変換された電気信号をアナログ/ディジタ
ル変換するアナログ/ディジタル変換器と、該アナログ
/ディジタル変換器で変換されたディジタル信号から位
相ポートレートを作成する手段と、該手段で作成された
位相ポートレートを表示又は出力する手段とを備えるこ
とを特徴とする。
【0007】
【作用】この時系列情報又は図形は略々同じものとなる
ので長時間の音声であっても短時間のものと同様に現れ
る。位相ポートレートは音声ごとに視覚的識別がしやす
い特徴を示すのでコンピュータのみならず人間の官能に
よる識別が可能となる。
【0008】
【実施例】以下本発明をその実施例を示す図面に基づい
て詳述する。図1は本発明方法の説明図、図2は本発明
装置のブロック図である。マイクロホン1によって集音
した音声はこれによって電気信号に変換される。これを
増幅器2で増幅してA/D(アナログ/ディジタル)変
換器3でディジタル化してコンピュータへ入力する。図
2中の4はコンピュータによって実現される位相ポート
レート作成部である。
【0009】図1(a) はこのディジタル化の説明図であ
る。解析対象の音声電気信号 (アナログ) に対するサン
プリング/ディジタル化の周期をt(例えば20μsec)と
し、必要に応じて定めるN個のサンプル値vi (i=
1,2…N)を得る。コンピュータはvi
【0010】
【数1】
【0011】(τはサンプリング周期tの自然数倍又は
n倍(n=±1,±2,…)。解析対象、目的に応じて
適宜に選択すればよい。) の組合せのベクトル
【0012】
【数2】
【0013】を作成し、これを図1(b) に示すような
i,i+τ直交座標面にプロットし、iの順に、つまり
時間経過の順に
【0014】
【数3】
【0015】の点を結ぶ。このようにして得られた軌
跡、つまり位相ポートレートが本発明で得られる音声の
特徴である。この位相ポートレートはプロッタ,CRT デ
ィスプレイ等の出力/表示部5によって出力され、又は
表示される。
【0016】図3(a) 〜(e) は「あ」, 「い」「う」,
「え」, 「お」夫々の
【0017】
【数4】
【0018】の軌跡であり、被験者は同一である。図4
(a) 〜(c) は「あ」の
【0019】
【数5】
【0020】の軌跡であり、被験者は別々である。周波
数及び強度の変化は軌跡のずれとして現れることにな
る。図5(a) 〜(e) は同一被験者の「あ」の
【0021】
【数6】
【0022】の軌跡であり、連続5日間に亘る変化を示
している。
【0023】いずれの図からも明らかなように極めて特
徴ある視覚識別がし易い図形が得られる。また図4に見
られるように被験者の相違による相異が見られる一方
で、同一音に対する共通性も見られる。
【0024】本発明は時間の長さ又はサンプル数の多さ
によっても周波数及び強度に変化がなければその軌跡が
略々同じ処をなぞられていくだけであるので、これらに
よる図形の大きな変化又は処理の困難性、解析の困難性
はない。
【0025】以上のようにして抽出された特徴は比較基
準として予め記憶させてある図形と、解析対象とする音
声について得られた図形とを比較することにより音声認
識(voice recognition 及びspeech recognition )に適
用することができる。この比較に際しては従来の如く両
者の距離又は類似度演算によればよいが視覚による人的
判定も可能である。また図5のような経時変化を調べて
被験者の体調又は声帯の様子を知るような用途への利用
も可能である。
【0026】
【発明の効果】以上の如き本発明による音声解析方法,
装置は解析対象の音声の時間長に依らず同様の特徴を抽
出でき、更に視覚的識別が容易な特徴を抽出することが
できる。したがって、医療・生体エレクトロニクスの分
野で利用することができる。
【図面の簡単な説明】
【図1】本発明方法の説明図である。
【図2】本発明装置のブロック図である。
【図3】特徴のパターン図である。
【図4】特徴のパターン図である。
【図5】特徴のパターン図である。
【図6】音声「あ」の時系列変動曲線を示した図であ
る。
【図7】音声「あ」のフーリエスぺクトルを示した図で
ある。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平1−97998(JP,A) 特開 平1−49095(JP,A) 特表 昭62−502293(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 3/00,7/10

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声を電気信号に変換して該音声を解析
    する方法において、前記電気信号の値を一定周期でサン
    プリングし、サンプリングしたデータを要素とする時系
    列集合から一定時間を隔てた複数の前記要素からなる座
    標値を選択し、複数の前記座標値から位相ポートレート
    を作成し、該位相ポートレートの情報から音声を解析す
    ることを特徴とする音声解析方法。
  2. 【請求項2】 音声をアナログの電気信号に変換する音
    電変換器と、該音電変換器によって変換された電気信号
    をアナログ/ディジタル変換するアナログ/ディジタル
    変換器と、該アナログ/ディジタル変換器で変換された
    ディジタル信号から位相ポートレートを作成する手段
    と、該手段で作成された位相ポートレートを表示又は出
    力する手段とを備えることを特徴とする音声解析装置。
JP4310563A 1992-03-09 1992-11-19 音声解析方法及び装置 Expired - Lifetime JP3008701B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4310563A JP3008701B2 (ja) 1992-03-09 1992-11-19 音声解析方法及び装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP4-86459 1992-03-09
JP8645992 1992-03-09
JP4310563A JP3008701B2 (ja) 1992-03-09 1992-11-19 音声解析方法及び装置

Publications (2)

Publication Number Publication Date
JPH05313700A JPH05313700A (ja) 1993-11-26
JP3008701B2 true JP3008701B2 (ja) 2000-02-14

Family

ID=26427570

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4310563A Expired - Lifetime JP3008701B2 (ja) 1992-03-09 1992-11-19 音声解析方法及び装置

Country Status (1)

Country Link
JP (1) JP3008701B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6831112B2 (en) 2000-09-28 2004-12-14 Sanyo Chemical Industries, Ltd. Polyether, active-hydrogen ingredient, resin-forming composition, and process for producing foam

Also Published As

Publication number Publication date
JPH05313700A (ja) 1993-11-26

Similar Documents

Publication Publication Date Title
WO2001009876A1 (en) Electronic music system for detecting pitch
EP0572531A1 (en) Acoustic method and apparatus for identifying human sonic sources
US5976081A (en) Method for detecting suicidal predisposition
US5774850A (en) Sound characteristic analyzer with a voice characteristic classifying table, for analyzing the voices of unspecified persons
EP0134238A4 (en) SIGNAL PROCESSING AND SYNTHETIZING METHOD AND DEVICE.
JP3008701B2 (ja) 音声解析方法及び装置
JP4496378B2 (ja) 定常雑音下における音声区間検出に基づく目的音声の復元方法
US20120006183A1 (en) Automatic analysis and manipulation of digital musical content for synchronization with motion
Jamieson et al. CSRE: A speech research environment
JPH0527751A (ja) 自動採譜装置等に用いられるテンポ抽出装置
JPH05127668A (ja) 自動採譜装置
ABDULLA et al. Real-time spoken Arabic digit recognizer
Majda-Zdancewicz et al. Parametric analysis of pilot voice signals in Parkinson? s disease diagnostics
KR100381372B1 (ko) 음성특징 추출장치
Davis Digital signal processing in studies of animal acoustical communication, including human speech
JPS63235999A (ja) 音声始端検出装置
Anderson et al. The detection and analysis of point processes in biological signals
EP0285354A2 (en) Speech analysis method
Khan et al. Detection of Acoustic Events by using MFCC and Spectro-Temporal Gabor Filterbank Features
CN117679050A (zh) 基于短时能量的肌电信号识别方法、装置、设备及介质
JP3263067B2 (ja) 周波数分析方法
JP2604409B2 (ja) 自動採譜方法及び装置
JPH04261592A (ja) 自動採譜装置
JPH04323696A (ja) 自動採譜装置
Yasukawa et al. Sound Scène Analysis with Psycho-acoustics Parameter