JP4568826B2 - 声門閉鎖区間検出装置および声門閉鎖区間検出プログラム - Google Patents

声門閉鎖区間検出装置および声門閉鎖区間検出プログラム Download PDF

Info

Publication number
JP4568826B2
JP4568826B2 JP2005261008A JP2005261008A JP4568826B2 JP 4568826 B2 JP4568826 B2 JP 4568826B2 JP 2005261008 A JP2005261008 A JP 2005261008A JP 2005261008 A JP2005261008 A JP 2005261008A JP 4568826 B2 JP4568826 B2 JP 4568826B2
Authority
JP
Japan
Prior art keywords
glottal
closure segment
band
frequency
voice signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005261008A
Other languages
English (en)
Other versions
JP2007068847A (ja
Inventor
達也 北村
浩典 竹本
整治 足立
パーハム・モクタリ
清志 本多
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATR Advanced Telecommunications Research Institute International
Original Assignee
ATR Advanced Telecommunications Research Institute International
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATR Advanced Telecommunications Research Institute International filed Critical ATR Advanced Telecommunications Research Institute International
Priority to JP2005261008A priority Critical patent/JP4568826B2/ja
Publication of JP2007068847A publication Critical patent/JP2007068847A/ja
Application granted granted Critical
Publication of JP4568826B2 publication Critical patent/JP4568826B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

この発明は、音声信号から当該音声の発声の際の声門閉鎖区間を検出することが可能な声門閉鎖区間検出装置および声門閉鎖区間検出方法に関する。
人の声帯ヒダは、発声中1秒間に100回以上、ときには1,000回も振動する。このため、個々の振動の状態を肉眼で直接見ることはできない。
そこで、声帯の振動の様子を観察するためにこれを可視化する方法には、喉頭の画像を機器の応用によって可視化する直接的な方法と、声門の開閉運動のみを検出記録する間接的な方法とに大別することができる。直接的観測法には喉頭高速度映画、喉頭ストロボスコピー、フォトキモグラフィ、半導体撮像素子法などがあり、間接的観測法には、光電グロトグラフィ、電気グロトグラフィ(Electro-glottogram:EGG)、超音波グロトグラフィなどがある。
このうち、EGGは、左右の甲状軟骨板外側の皮膚面に電極をおいて高周波電流を流しておき、声門の開閉による電気的インピーダンスの変化を検出記録する方法である。
非特許文献1によれば、図7に示すとおり、発声中の声帯粘膜の運動は決して単純な左右方向の開閉運動ではなく、上下方向の波動を伴った3次元の運動である。図7において、1〜3は、声門の開大期、3〜7は閉小期、7〜10は閉鎖期をそれぞれ示す。
しかし、喉頭での発声を考える際には、気流に直角な平面上での声門面積の変化が最も問題になるので、声帯振動の観測に当たっては、声門面積波形(声門面積を時間の関数として表示したもの)を把握することが、最も重要な課題となる。
図8は、このような声門面積波形を示す図である。声門面積波形では、振動サイクルごとに、上述した開大期、閉小期、閉鎖期の3つの位相を区別する。1回の振動に要する時間を、基本周期という。また単位時間当たりの振動回数を、基本周波数という。音声の基本周期は、声帯振動の基本周期に一致する。したがって音声の基本周波数は、声帯振動の基本周波数に等しい。
一方で、音声の伝送・認識において、声道伝達特性を正確に推定することは極めて重要であり、その推定のための方法の1つとして、従来、線形予測法が用いられている。しかしながら、通常の線形予測法を用いて正確な声道伝達特性を得るためには、励起源が単一のインパルスあるいは白色雑音でなければならない。ところが、現実には、このような仮定は成り立たず、ホルマント周波数推定には励起源の影響が生じる。
このような励起源の影響を軽減する方法には、分析窓長を1ピッチ周期以下と短くして声門閉止(閉鎖)期間すなわち自由振動区間のみ推定し、これを分析対象とする方法(たとえば、非特許文献2を参照)や、残差情報を参照することで線形予測モデルに適合する音声標本点を選択する標本選択線形予測法において、標本の選択処理を予測誤差の大局的な特徴を考慮して行い、かつこの処理を2段階行って、声門開口期間の音声標本を非予測標本から除く「2段標本選択線形予測法」などが提案されている(たとえば、非特許文献3を参照)。
日本音声言語医学会編,医歯薬出版株式会社,「第2版 声の検査法」p.97−p.99,1994年 K.Steiglitz and B.Dickinson: "The use of time-domain selection for improved linear prediction", IEEE Tran. Acoust., Speech & Signal process, ASSp-25, pp.34-39(1977) 三好 義昭,大和 一晴,柳田 益造、角所 収著:「2段階標本選択線形予測法による高ピッチ音声の分析」,電子情報通信学会論文誌 A Vol. J70-A No.8 pp.1146-1156 1987年8月
しかしながら、前者においては、自然音声の声門閉止区間を正確に推定するのは一般に困難であり、後者にあっては、残差の絶対値がしきい値以上となるものを被予測標本から除くという処理を行うものの声門の状態の観察結果との対比が行われている訳ではない。
また、声門の閉鎖区間を簡単に検出できれば、ボイストレーニングなどにおいては、明瞭な発声の指標として使用することが期待でき、また、言語聴覚療法においては、声門閉鎖不全音声の診断やリハビリの支援に活用できることが期待できるものの、上述した声帯振動の観察方法は、自然発声中の観察には不向きであったり、測定には被験者に身体的あるいは精神的な負担を強いるためにリハビリなどの用途には不向きであるなどの問題点があった。
本発明は、上述したような問題点を解決するためになされたものであって、その目的は、自然な発声状態における声門の閉鎖区間の検出を簡単な構成で可能とする声門閉鎖区間検出装置および声門閉鎖区間検出方法を提供することである。
このような目的を達成するために、本発明の1つの局面にしたがうと、声門閉鎖区間検出装置であって、入力された音声信号のうち、喉頭腔共鳴に対応する周波数帯域の音声信号を選択的に抽出する帯域抽出手段と、抽出された音声信号の強度に基づいて、声門閉鎖区間を判定する演算手段とを備える。
好ましくは、帯域抽出手段は、通過帯域を可変に変更できる帯域通過型フィルタ手段を含み、声門閉鎖区間検出装置は、入力された音声信号を周波数分析して、喉頭腔共鳴に対応する周波数帯域を特定して、帯域通過型フィルタ手段の通過帯域として設定するための通過帯域設定手段をさらに備え、演算手段は、抽出された音声信号の強度が設定されたしきい値を超えることに応じて、対応する音声信号の区間を声門閉鎖区間と判定する。
好ましくは、通過帯域設定手段は、音声信号の周波数スペクトルに基づいて、第4ホルマントを喉頭腔共鳴に対応する周波数と判定する。
この発明の他の局面に従うと、メモリと音声入力装置と演算装置とを備えるコンピュータに、声門閉鎖区間検出の処理を実行させるための声門閉鎖区間検出プログラムであって、被験者の音声を音声入力装置が音声信号に変換し、メモリに格納された音声信号のデータから、演算装置が、喉頭腔共鳴に対応する周波数帯域の音声信号を選択的に抽出するステップと、演算装置が、抽出された音声信号の強度に基づいて、声門閉鎖区間を判定するステップとをコンピュータに実行させる
好ましくは、抽出するステップは、演算装置が、入力された音声信号を周波数分析して、喉頭腔共鳴に対応する周波数帯域を特定するステップと、演算装置が、特定された喉頭腔共鳴に対応する周波数帯域を帯域通過型フィルタ手段の通過帯域として設定するステップとを含み、判定するステップは、演算装置が、帯域通過型フィルタ手段の出力の強度が設定されたしきい値を超えることに応じて、対応する音声信号の区間を声門閉鎖区間と判定するステップを含む。
本発明に係る声門閉鎖区間検出装置および声門閉鎖区間検出方法によれば、特殊な装置を必要とせず、簡単な装置構成で、声門の閉鎖区間の検出を行うことが可能である。
また、本発明に係る声門閉鎖区間検出装置および声門閉鎖区間検出方法によれば、発声の内容によらず、被験者の自然な発声状態において、声門の閉鎖区間の検出を行うことが可能である。
以下、図面を参照して本発明の実施の形態について説明する。
[ハードウェア構成]
図1は、本発明の声門閉鎖区間検出方法が適用される声門閉鎖区間検出装置100の一例を示すブロック図である。
図1を参照して、声門閉鎖区間検出装置100は、基本的には、パーソナルコンピュータに音声処理インタフェースを設けることで構成される。
すなわち、この声門閉鎖区間検出装置100は、CD−ROM(Compact Disc Read-Only Memory )118などの光ディスク上の情報を読込むための光ディスクドライブ108およびフレキシブルディスク(Flexible Disk、以下FD)116に情報を読み書きするためのFDドライブ106を備えたコンピュータ本体102と、コンピュータ本体102に接続された表示装置としてのモニタ104と、同じくコンピュータ本体102に接続された入力装置としてのキーボード110およびマウス112と、音声入力装置としてのマイク132と、音声出力装置としてのスピーカ134とを含む。
このコンピュータ本体102は、光ディスクドライブ108およびFDドライブ106に加えて、それぞれバスBSに接続された演算処理部であるCPU(Central Processing Unit )120と、ROM(Read Only Memory) およびRAM (Random Access Memory)を含むメモリ122と、直接アクセスメモリ装置、たとえば、ハードディスク124と、マイク132またはスピーカ134とデータの授受を行うための音声処理インタフェース部128とを含んでいる。
なお、CD−ROM118は、コンピュータ本体に対してインストールされるプログラム等の情報を記録可能な媒体であれば、他の媒体、たとえば、DVD−ROM(Digital Versatile Disc)やメモリカードなどでもよく、その場合は、コンピュータ本体102には、これらの媒体を読取ることが可能なドライブ装置が設けられる。
本発明の声門閉鎖区間検出装置の主要部は、コンピュータハードウェアと、CPU120により実行される声門閉鎖区間検出装置を制御するためのソフトウェアとにより構成される。一般的にこうしたソフトウェアはCD−ROM118、FD116等の記憶媒体に格納されて流通し、CD−ROMドライブ108またはFDドライブ106等により記憶媒体から読取られてハードディスク124に一旦格納される。または、当該装置がネットワーク310に接続されている場合には、ネットワーク上のサーバから一旦ハードディスク124にコピーされる。そうしてさらにハードディスク124からメモリ122中のRAMに読出されてCPU120により実行される。なお、ネットワーク接続されている場合には、ハードディスク124に格納することなくRAMに直接ロードして実行するようにしてもよい。
図1に示したコンピュータのハードウェア自体およびその動作原理は一般的なものである。したがって、本発明の最も本質的な部分は、FD116、CD−ROM118、ハードディスク124等の記憶媒体に記憶されたソフトウェアである。
なお、一般的傾向として、コンピュータのオペレーティングシステムの一部として様々なプログラムモジュールを用意しておき、アプリケーションプログラムはこれらモジュールを所定の配列で必要な時に呼び出して処理を進める方式が一般的である。そうした場合、当該声門閉鎖区間検出装置を実現するためのソフトウェア自体にはそうしたモジュールは含まれず、当該コンピュータでオペレーティングシステムと協働してはじめて声門閉鎖区間検出装置が実現することになる。しかし、一般的なプラットフォームを使用する限り、そうしたモジュールを含ませたソフトウェアを流通させる必要はなく、それらモジュールを含まないソフトウェア自体およびそれらソフトウェアを記録した記録媒体(およびそれらソフトウェアがネットワーク上を流通する場合のデータ信号)が実施の形態を構成すると考えることができる。
図2は、図1に示した音声処理インタフェース部128の構成をより詳しく説明するための機能ブロック図である。なお、図2においては、マイク132からの音声信号の入力処理に関する部分のみを抜き出して示す。
図2を参照して、切換器202は、マイク132からアナログの音声信号を直接受け取るとともに、マイク132からの音声信号が通過帯域可変のバンドパスフィルタ(以下、BPFと呼ぶ)200を通過した後の信号を受ける。BPF200の通過帯域および切換器202がいずれの信号を選択するかについては、CPU120により制御される。
切換器202の出力は、A/D変換器204によりデジタル信号に変換された後、バッファメモリ部206に格納される。周波数分析部208は、バッファメモリ部206に格納された音声信号に対して周波数スペクトルを求めて、CPU120に対して出力する。
CPU120は、周波数スペクトルに基づいて、後に説明するように喉頭腔共鳴に相当するホルマント(第4ホルマント)の周波数領域を検出し、これに基づいて、第4ホルマントの領域を通過させるようにBPF200の通過帯域を制御する。また、CPU120での処理の結果は、たとえば、表示装置104に表示される。
なお、図2においては、BPF200としては、アナログ方式の帯域可変フィルタを用いるものとして説明した。しかしながら、BPF200と切換器202とをA/D変換器204の後段に配置して、デジタル方式の帯域可変フィルタを用いることも可能である。あるいは、マイク132からの音声信号をA/D変換器204がデジタル信号に変換して直接バッファメモリ部206に格納することとし、このバッファメモリ206内の音声信号データに対して、CPU120が演算処理を行うことで、デジタルフィルタ処理を行うこととしてもよい。
また、バッファメモリ部206は、必ずしも音声処理インタフェース部128内に設けられる必要はなく、たとえば、メモリ122またはハードディスク124をバッファメモリとして使用してもよい。さらに、周波数分析部208についても、必ずしも音声処理インタフェース部128内に設けられる必要はなく、たとえば、CPU120のフーリエ変換などの演算処理により同等の処理を行うことも可能である。
図3は、等価回路モデルで求めた声道伝達特性における声門開口面積Agの影響を結果を示す図である。
図3においては、声門開口面積Agを0.0cm2(声門閉鎖)、0.1cm2、0.2cm2の3段階に変化させている。この図から声門の開放により3.1kHzのホルマント(低周波側から4番目のピーク:第4ホルマント)が消失することがわかる。このホルマントは、喉頭腔により生じるホルマント(喉頭腔共鳴)と一致する。
従って、喉頭腔共鳴は声門の閉鎖区間で出現し、開放区間で消失することが予測される。したがって、この喉頭腔共鳴の周期内変動を検出することによって音声から声門閉鎖区間を抽出できると考えられる。
図4は、図1および図2に示した声門閉鎖区間検出装置100の動作を説明するためのフローチャートである。
図4を参照して、まず、CPU120により制御されて、切換器202はマイク132から直接受け取った信号をA/D変換器204に与え、バッファメモリ部206にデジタル化された音声信号が格納される。このバッファメモリ部206中のデータに対して、周波数分析部208が、周波数分析を行う(S100)。
周波数分析の結果得られる周波数スペクトルをCPU120が解析することにより、被験者の第4ホルマントの周波数領域を特定する(S102)。
続いて、CPU120は、第4ホルマントの音声信号を通過させるようにBPF200の通過帯域を調整する(S104)。特に限定されないが、たとえば、第4ホルマントのピーク位置がわかれば、これに対して周波数の上下について所定の周波数分だけの帯域の信号を通過させるように調整することとしてもよい。
このようにBPF200の通過帯域を調整した後、CPU120は、切換器202を制御して、BPF200を通過した信号が、バッファメモリ部206に格納されるように調整する。以後は、同一の被験者についての同一の入力条件については、調整されたBPF200からの信号強度に応じて、声門の閉鎖区間を検出する(S106)。すなわち、声門の閉鎖区間においては、BPF200からの信号強度が大きくなるので、しきい値を設定して、CPU120は、信号強度がこのしきい値を超える区間は、声門閉鎖区間であると判定できる。特に限定されないが、このようなしきい値は、ユーザが表示装置104に出力される測定結果を見て、マニュアルで設定してもよいし、CPU120が、BPF200を通過した信号の強度に応じて、たとえば、その最高強度の絶対値の所定割合となるように設定してもよい。
(実験結果)
図5および図6は、男女各1名が座位で持続発声した日本語母音/a/および/i/を無響室にて収録した結果を示す図である。図5は、男性の測定結果を、図6は女性の測定結果をそれぞれ示す。
図5および図6示した実験においては、音声と同時にEGG信号も収録した。EGG信号はカットオフ1.6Hzのハイパスフィルタにより直流成分を除去した。これらの信号は標本化周波数48kHz、量子化16bitで収録した。音声とEGG信号の間には声門からマイクロホンまでの距離に対応する時間差が存在するため、EGG信号をこの時間差分シフトさせた。
また、BPF200としては、理想的なフィルタ特性のフーリエ級数に窓関数をかける方法でFIR(Finite Impulse Response)型のバンドパスフィルタを作成した。窓関数として101点のハミング窓を用いた。
音声データのスペクトログラムから男性話者のバンドパスフィルタの通過帯域は2.8kHzから3.8kHz、女性話者の通過帯域は3.8kHzから4.8kHzと決定した。音声データにこのバンドパスフィルタをかけ、その出力とEGG 信号とを比較した。
図5および図6では、母音の30msecの音声波形、対応するEGG信号、およびバンドパスフィルタの出力(第4ホルマント信号)ならびに比較のために第2ホルマント信号も示している。EGG信号は声帯の接触面積に比例するため、その値の大きい区間が声門閉鎖区間となる。
図5および図6から、声門閉鎖区間においてバンドパスフィルタの出力の振幅が相対的に大きくなることがわかる。この結果は、図3に示したシミュレーション結果と同様に、実音声でもピッチ周期のうち声門閉鎖区間で喉頭腔共鳴(第4ホルマント)が出現し、声門開放区間においてこの共鳴が消失することを示している。声帯振動の1周期内で声門は急激に閉鎖し緩徐に開放する。バンドパスフィルタ出力もこれに対応し、声門閉鎖の開始時点で振幅が急激に増加し、その後ゆるやかに振幅が減衰する。
従って、バンドパスフィルタ出力、すなわち、第4ホルマントに対応する信号の包絡線では、明確にオン・オフの変化が検出でき、しきい値処理により声門閉鎖区間を判定できる。これに対して、第2ホルマントではなだらかに減衰し、明確なオン・オフの変化が検出できない。
以上説明したとおり、母音の喉頭腔共鳴パターンが1ピッチ周期内で変動することを利用して、声門閉鎖区間を検出すること可能となる。本発明の声門閉鎖区間の検出方法は、後舌母音にも適用でき、より自然な発声状態における声門開閉を記録することが可能である。また、この方法は、基本的に、マイクロホンとバンドパスフィルタを用いれば、音声入出力機能を有するコンピュータで実現できる。さらに、喉頭腔共鳴は他のホルマントと異なり母音によらずほぼ一定した周波数帯域に現れるため、バンドパスフィルタの通過帯域を一旦決めればどの母音でも利用することができる。
また、ボイストレーニングなどにおいて、検出された声門閉鎖区間を、明瞭な発声の指標として使用することが可能である。あるいは、言語聴覚療法においては、声門閉鎖不全音声の診断やリハビリの支援に活用できる。
なお、以上の説明では、単に、声門の閉鎖区間の検出について説明した。しかし、一般に、音声処理技術は、発声時に声門が閉じていることを前提としている。従って、音声の特徴量抽出の際には声門閉鎖区間のみから抽出する必要がある。本発明の声門の閉鎖区間の検出方法を使って声門閉鎖区間を検出し、そこから特徴量抽出を行うという応用も可能である。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
本発明の声門閉鎖区間検出方法が適用される声門閉鎖区間検出装置100の一例を示すブロック図である。 音声処理インタフェース部128の構成をより詳しく説明するための機能ブロック図である。 等価回路モデルで求めた声道伝達特性における声門開口面積Agの影響を結果を示す図である。 声門閉鎖区間検出装置100の動作を説明するためのフローチャートである。 男性被験者が座位で持続発声した日本語母音/a/および/i/を無響室にて収録した結果を示す図である。 女性被験者が座位で持続発声した日本語母音/a/および/i/を無響室にて収録した結果を示す図である。 発声中の声帯粘膜の運動を示す概念図である。 声門面積波形を示す図である。
符号の説明
100 声門閉鎖区間検出装置、102 コンピュータ本体、104 表示装置、106 FDドライブ、108 光ディスクドライブ、110 キーボード、112 マウス、116 フレキシブルディスク、118 CD−ROM、120 CPU、122 メモリ、124 ハードディスク、128 音声処理インタフェース部、132 マイク、134 スピーカ、200 BPF、202 切換器、204 A/D変換器、206 バッファメモリ部。

Claims (5)

  1. 入力された音声信号のうち、喉頭腔共鳴に対応する周波数帯域の音声信号を選択的に抽出する帯域抽出手段と、
    抽出された前記音声信号の強度に基づいて、声門閉鎖区間を判定する演算手段とを備える、声門閉鎖区間検出装置。
  2. 前記帯域抽出手段は、通過帯域を可変に変更できる帯域通過型フィルタ手段を含み、
    入力された前記音声信号を周波数分析して、前記喉頭腔共鳴に対応する周波数帯域を特定して、前記帯域通過型フィルタ手段の前記通過帯域として設定するための通過帯域設定手段をさらに備え、
    前記演算手段は、前記抽出された音声信号の強度が設定されたしきい値を超えることに応じて、対応する音声信号の区間を前記声門閉鎖区間と判定する、請求項1記載の声門閉鎖区間検出装置。
  3. 前記通過帯域設定手段は、前記音声信号の周波数スペクトルに基づいて、第4ホルマントを前記喉頭腔共鳴に対応する周波数と判定する、請求項2記載の声門閉鎖区間検出装置。
  4. メモリと音声入力装置と演算装置とを備えるコンピュータに、声門閉鎖区間検出の処理を実行させるための声門閉鎖区間検出プログラムであって、
    被験者の音声を前記音声入力装置が音声信号に変換し、前記メモリに格納された前記音声信号のデータから、前記演算装置が、喉頭腔共鳴に対応する周波数帯域の音声信号を選択的に抽出するステップと、
    前記演算装置が、抽出された前記音声信号の強度に基づいて、声門閉鎖区間を判定するステップとをコンピュータに実行させる、声門閉鎖区間検出プログラム
  5. 前記抽出するステップは、
    前記演算装置が、入力された前記音声信号を周波数分析して、前記喉頭腔共鳴に対応する周波数帯域を特定するステップと、
    前記演算装置が、特定された前記喉頭腔共鳴に対応する周波数帯域を帯域通過型フィルタ手段の通過帯域として設定するステップとを含み、
    前記判定するステップは、
    前記演算装置が、前記帯域通過型フィルタ手段の出力の強度が設定されたしきい値を超えることに応じて、対応する音声信号の区間を前記声門閉鎖区間と判定するステップを含む、請求項4記載の声門閉鎖区間検出プログラム
JP2005261008A 2005-09-08 2005-09-08 声門閉鎖区間検出装置および声門閉鎖区間検出プログラム Expired - Fee Related JP4568826B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005261008A JP4568826B2 (ja) 2005-09-08 2005-09-08 声門閉鎖区間検出装置および声門閉鎖区間検出プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005261008A JP4568826B2 (ja) 2005-09-08 2005-09-08 声門閉鎖区間検出装置および声門閉鎖区間検出プログラム

Publications (2)

Publication Number Publication Date
JP2007068847A JP2007068847A (ja) 2007-03-22
JP4568826B2 true JP4568826B2 (ja) 2010-10-27

Family

ID=37930805

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005261008A Expired - Fee Related JP4568826B2 (ja) 2005-09-08 2005-09-08 声門閉鎖区間検出装置および声門閉鎖区間検出プログラム

Country Status (1)

Country Link
JP (1) JP4568826B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2917281B1 (fr) * 2007-06-14 2009-10-09 Centre Nat Rech Scient Procede et equipement non-invasif de photoelectroglottographie
WO2009044525A1 (ja) 2007-10-01 2009-04-09 Panasonic Corporation 音声強調装置および音声強調方法
AT507844B1 (de) * 2009-02-04 2010-11-15 Univ Graz Tech Methode zur trennung von signalpfaden und anwendung auf die verbesserung von sprache mit elektro-larynx
JP5705086B2 (ja) * 2011-10-14 2015-04-22 日本電信電話株式会社 声道スペクトル抽出装置、声道スペクトル抽出方法及びプログラム
JP6502099B2 (ja) * 2015-01-15 2019-04-17 日本電信電話株式会社 声門閉鎖時刻推定装置、ピッチマーク時刻推定装置、ピッチ波形接続点推定装置、その方法及びプログラム
JP7076732B2 (ja) * 2018-03-01 2022-05-30 公立大学法人広島市立大学 アデノイド肥大判定装置、アデノイド肥大判定方法及びプログラム
CN112634266B (zh) * 2021-01-06 2024-03-19 厦门大学 喉镜图像的半自动标注方法、介质、设备及装置
CN114120758A (zh) * 2021-10-14 2022-03-01 深圳大学 一种基于智能穿戴设备的声乐训练辅助系统
CN116884437B (zh) * 2023-09-07 2023-11-17 北京惠朗时代科技有限公司 基于人工智能的语音识别处理器

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05143098A (ja) * 1990-02-08 1993-06-11 British Technol Group Ltd スペクトル分析のための方法及び装置
JPH06348298A (ja) * 1993-06-04 1994-12-22 Sumitomo Electric Ind Ltd 音声分析装置
JPH1185197A (ja) * 1997-09-02 1999-03-30 Atr Onsei Honyaku Tsushin Kenkyusho:Kk 音声信号分析装置
JP2003122380A (ja) * 2001-10-09 2003-04-25 Canon Inc ピッチマーク付与装置およびその処理方法ならびに記憶媒体
JP2003150181A (ja) * 2001-11-15 2003-05-23 Canon Inc ピッチマーク付与装置および方法、ならびにプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05143098A (ja) * 1990-02-08 1993-06-11 British Technol Group Ltd スペクトル分析のための方法及び装置
JPH06348298A (ja) * 1993-06-04 1994-12-22 Sumitomo Electric Ind Ltd 音声分析装置
JPH1185197A (ja) * 1997-09-02 1999-03-30 Atr Onsei Honyaku Tsushin Kenkyusho:Kk 音声信号分析装置
JP2003122380A (ja) * 2001-10-09 2003-04-25 Canon Inc ピッチマーク付与装置およびその処理方法ならびに記憶媒体
JP2003150181A (ja) * 2001-11-15 2003-05-23 Canon Inc ピッチマーク付与装置および方法、ならびにプログラム

Also Published As

Publication number Publication date
JP2007068847A (ja) 2007-03-22

Similar Documents

Publication Publication Date Title
JP4568826B2 (ja) 声門閉鎖区間検出装置および声門閉鎖区間検出プログラム
Owren et al. Measuring emotion-related vocal acoustics
US7089177B2 (en) System and method for characterizing voiced excitations of speech and acoustic signals, removing acoustic noise from speech, and synthesizing speech
JPH02242298A (ja) 声門波形に基づく話者識別装置
CN108896878A (zh) 一种基于超声波的局部放电检测方法
Mittal et al. Analysis of production characteristics of laughter
Maruri et al. V-speech: Noise-robust speech capturing glasses using vibration sensors
Illner et al. Validation of freely-available pitch detection algorithms across various noise levels in assessing speech captured by smartphone in Parkinson’s disease
WO2013187826A2 (en) Cepstral separation difference
Arsikere et al. Automatic estimation of the first three subglottal resonances from adults’ speech signals with application to speaker height estimation
Orlandi et al. Effective pre-processing of long term noisy audio recordings: An aid to clinical monitoring
JP3673507B2 (ja) 音声波形の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、音声信号の特徴を高い信頼性で示す部分を決定するための装置およびプログラム、ならびに擬似音節核抽出装置およびプログラム
Dupont et al. Combined use of close-talk and throat microphones for improved speech recognition under non-stationary background noise
Gilbert et al. Restoring speech following total removal of the larynx by a learned transformation from sensor data to acoustics
Schultz et al. A tutorial review on clinical acoustic markers in speech science
WO2020235089A1 (ja) 評価装置、訓練装置、それらの方法、およびプログラム
Akafi et al. Assessment of hypernasality for children with cleft palate based on cepstrum analysis
Airas et al. Emotions in short vowel segments: effects of the glottal flow as reflected by the normalized amplitude quotient
Sahoo et al. Analyzing the vocal tract characteristics for out-of-breath speech
Wang et al. Feature extraction based on mel-scaled wavelet transform for heart sound analysis
Akafi et al. Detection of hypernasal speech in children with cleft palate
Paul et al. Speech recognition of throat microphone using MFCC approach
Fux et al. Talker-to-listener distance effects on the variations of the intensity and the fundamental frequency of speech
JP4177751B2 (ja) 声質モデル生成方法、声質変換方法、並びにそれらのためのコンピュータプログラム、当該プログラムを記録した記録媒体、及び当該プログラムによりプログラムされたコンピュータ
JP2023517175A (ja) 音声録音と体内からの音の聴音を使用した医学的状態の診断

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100430

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100622

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100713

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130820

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4568826

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees