JP4495907B2

JP4495907B2 - 音声の分析の方法及び装置

Info

Publication number: JP4495907B2
Application number: JP2002543426A
Authority: JP
Inventors: クラボ，ビョーイェ
Original assignee: トランスパシフィック・インテリジェンス，リミテッド・ライアビリティ・カンパニー
Priority date: 2000-11-17
Filing date: 2001-11-09
Publication date: 2010-07-07
Anticipated expiration: 2021-11-09
Also published as: DE10196858T1; US20040002853A1; AU2002214476A1; SE0004221D0; GB2384903A; US7092874B2; USRE43406E1; WO2002041300A1; SE0004221L; GB2384903B; SE517026C2; GB0311031D0; JP2004514178A

Description

【０００１】
発明の技術分野
本発明は、人間の音声（speech）を分析するための方法及び装置に関する。本発明はまた、音声トレーニングの方法及び装置、音声の合成（syntheses）を提供するための方法及び装置、ならびに病理学的状態を診断するための装置にも関する。
【０００２】
発明の背景
人間が話をするとき、聞き手は実際に発声されているもの、つまり発声された語の客観的内容を超えた印象及び信号を受け取る。これらの付加的な印象及び信号は、発声された語の事実内容を聞き手が解釈するのを助け、話し手の信憑性、気分などの意識的又は無意識的な判断をも導く。
【０００３】
このような付加的信号は、話し手が用いるテンポ、すなわち話し手が言葉を発する速度及び話し手が用いるリズムなどであり得る。また、音声のピッチは、いくらかの情報を伝達し、例えば深みのある暗い低音の声は、信頼や自信、なぐさめと受け取られる。
【０００４】
人間の音声は、１つの基本トーン（fundamental tone；基音）といくつかのより高いピッチの上音（over tone）を含む。このようにして、基音（fundamental note）は、あらゆる、一定の時において知覚可能な最低の周波数であり、音声及び歌の基音を測定するための機器はすでに知られている。例えばＥＰ０８２１３４５号公報及びＵＳ６０１４６１７号公報から、人間の音声における音（notes）の識別がすでに知られている。
【０００５】
さらに、音声の基音が次第に変化し、通常このような変化は、状況すなわち音声の内容及び音声が行なわれる環境によって支配されるということはすでに知られている。音声の合成におけるこのような状況依存性変動を再度作り出すための試みもなされてきた。この現象については、例えば、ＥＰ０６７４３０７号公報に記述されている。
【０００６】
さらに、話し手のボディランゲージは、聞き手に対して信号を送る。
【０００７】
しかしながら、人間の音声を介して伝達される多くの情報は意識的に知覚されず、従って分析できない。その結果、改良された音声の分析及び／又は音声のさらなる側面の分析のための方法及び装置といったような手段に対する必要性が存在する。
【０００８】
発明の目的
したがって、先行技術において固有の上述の問題を完全に又は少なくとも部分的に解決する音声分析のための方法及び装置を提供することが本発明の目的である。
【０００９】
この問題は、本発明に従った方法及び装置を用いて解決される。
【００１０】
発明の概要
本発明の発明者は、驚くべきことに通常の音声において通常起こる基音の連続的な変化及びそのために使用される間隔（interval；音程）が音声の知覚にとって重要であるということを示してきた。この連続的なピッチの変化は、本発明の教示に従うとこれらの変化の中で用いられる音程に基づいて分析され、異なる音程の発生は、その音声の知覚のされ方に影響を及ぼす。異なる音程の使用範囲に応じて、例えば、音声は異なる気分、異なる感情の状態、異なる信頼度などを表現することができる。音声を用いて、このように感情の伝達が行なわれ、これは潜在意識のレベルで、用いられる音程に応じて聞き手により知覚され、これは実際に発声された言葉、声のピッチ、言語のテンポ及びその音声のその他の明らかに伝達的な部分を超えて行われる。しかしながら、話し手も聞き手も、通常は音声のこの付加的な伝達的側面に全く気づいていない。
【００１１】
通常の音声で用いられる音程の選択は、無意識レベルで起こるが、それは、ある程度影響を受ける可能性があることがわかってきた。したがって、音程の選択を意識的に修正し、このようにして音声及び音声にある種の求められている表現を付与するために、本発明を使用することが可能である。これは、本発明のもう１つの側面の一部である。
【００１２】
その上、予期せぬことに、人間が話すときに行なう潜在意識による音程の選択は、その個人の心理的及び生理的健康状態により影響されるということが見出された。このようにして、本発明に従った分析を用いると、話し手の心理的又は生理的状態の劣化を知覚し、実際の病理学的状態を知覚することも可能である。数多くの種類の疾病において、この診断は、その他の数多くの代替的診断方法によって可能となるよりも、或る疾病の進行のより早期において可能であろう。この特徴は、本発明のもう１つの態様の一部を成すものである。
【００１３】
以下、いくつかの実施形態及び、添付図面を参照して、例示を目的として本発明をさらに詳細に説明する。
【００１４】
好ましい実施形態の詳細な説明
図１は、本発明に従った音声分析方法の１つの実施形態の流れ図を概略的に表わしている。第１のステップＳ１においては、音声シーケンスが録音される。これは、処理ユニット内での分析のために音声を直接録音することによって行うことができ、その後の分析は有利には、リアルタイムで行われる。しかしながら、カセットテープといったような記録媒体上、ＣＤディスク上、コンピュータメモリ内などに事前に音声シーケンスを録音することも同様に可能である。
【００１５】
好ましくは、ステップＳ２でフィルタリング（ｆｉｌｔｅｒｉｎｇ）が行なわれる。このようなフィルタリングでは、過度に短かい音の分離を行うことができ、充分な持続時間、好ましくは予め定められた時間閾値を超える音のみが分析のために転送される。代替的には、又は補足的に、フィルタリング作業には、充分に高い強さ、好ましくは予め定められた振幅閾値を超える音の認識を行うことができる。このような方法で、非常に弱い音はふるい落とされる。
【００１６】
代替的に、又は補足的に、フィルタリング作業では、予め定められた時間隔の間のピッチの平均値の形成を行うようにすることができ、このように形成された平均値は、その後の分析の中で使用される。このようにして、グリッサンド（ｇｌｉｓｓａｎｄｏ）、すなわち、複数の音全体にわたり滑るようなピッチ移動、示唆などを適切な形で取扱うことが可能となる。
【００１７】
ステップＳ３では、フィルタリング工程で残った音が診断され、これにより基音が識別される。識別工程は、音声の音の分析及び最低の可聴又は発声周波数の識別を含む。これは、例えば、ＥＰ０８２１３４５号公報及びＵＳ６０１４６１７号公報で記述されている方法によりもたらされうるが、その他の方法によっても同様に可能である。好ましくは、メリスマ的（ｍｅｌｉｓｍａｔｉｃａｌｌｙ）ならびに音節的（ｓｙｌｌａｂｉｃａｌｌｙ）に発生する音が識別される。
【００１８】
しかしながら、代替的には、識別工程をこれに代えてフィルタリング工程の前に実施することもできる。
【００１９】
このようにして識別された基音は、次にステップＳ４でさらに分析され、これにより、近い基音間の少なくともいくつかの間隔（interval；音程）が識別される。好ましくは、隣接する音の間のすべての音程が識別されるが、分析の現行の目的にとって特に重要であるとみなされている音程のすべて又は少なくとも多数部分だけを識別することも同様に可能である。同様にして、少なくともいくつかの応用のために、音程を識別する工程では、近い音の間の周波数の相違の確立が行われるだけではなく、変化が発生する方向、すなわち上昇又は下降するピッチ／間隔の確立も行われることが正当化されうる。
【００２０】
ステップＳ５では、適当な統計的方法が、分析の中心である音程が分析すべき音声シーケンス内でどれほどの頻度で起こるかの測定を確立するために使用される。このような測定は、例えば次のもののうちの１つ又は数種のものを含む可能性がある：
− すべての音程の中の、ある音程の割合；
− 予め定められた数の音程の中の、ある一定の音程の割合、
− １つ、２つ又は数種の選択された音程の発生の割合。
【００２１】
しかしながら、同様にして、ある一定の音程シーケンス、すなわち連続した３つ又は数種の基音の間の音程の発生及び音程の場所、すなわちそれらのピッチ位置を決定することも可能であり、そしていくつかの場合では有用である。
【００２２】
このようにして決定された音程の分析のためには、以下の特質を、異なる音程と一般に結びつけることができる：
− 同度（unison）、完全一度（perfect prime）（Ｒ１）：思慮深い（内省的）、進歩的
− 短２度（minor second）（Ｌ３）：綿密な、適応性ある
− 長２度（major second）（Ｓ２）：優美な、自己表出的
− 短３度（minor third）（Ｌ３）：メランコリックな、受動的
− 長３度（major third）（Ｓ３）：楽天的、強引な
− 完全４度（perfect fourth）（Ｒ４）：友好的
− 増４度（augmented fourth）／減５度（diminished fifth）／三全音（ tritone）（Trit）：創造的、強情な
− 減６度（minor sixth）（Ｌ６）：ソフトな
− 増６度（major sixth）（Ｓ６）：刺激的
− 短７度（minor seventh）（Ｌ７）：悲痛な
− 増７度（major seventh）（Ｓ７）：乱暴な、怒っている
− オクターブ（Ｒ８）：楽しい、勇気づける。
【００２３】
１オクターブ以上の音程は通常、別途分類されグループ分けされ得るか、代替的には１オクターブ未満の対応する音程と組合わされ得る。
【００２４】
数多くの検査について、サブグループ〔Ａ〕：同度（Ｒ１）、短２度（Ｌ２）、長２度（Ｓ２）、短３度（Ｌ３）、長３度（Ｓ３）、短６度（Ｌ６）、及び長６度（Ｓ６）、又は〔Ｂ〕：完全４度（Ｒ４）、増４度／減５度（三全音）、完全５度（Ｒ５）、短７度（Ｌ７）、長７度（Ｓ７）及びオクターブ（Ｒ８）の中の音程を識別することが有用である。
【００２５】
さらに、ほとんどが上昇方向に発生する音程を、「確かな信念」と特徴づけることができ、ほとんど下降するものとして発生する音程を「独立性」として特徴づけることができ、同じような頻度で上昇及び下降するものとして本質的に発生する音程を「外交性」として特徴づけすることができる。
【００２６】
識別にとって特に重要なシーケンスは、長和音（major chord）又は、短和音（minor chord）の一部を成す音、すなわち基音、３度及び５度を含むシーケンスである。なかでも重要なものは、反転した又は反転していない３つの音を含む基本位置アルペッジョ（fundamental-positioned arpeggio）である。しかしながら、基音は、２つの位置でも発生しうる（すなわち１オクターブの音程）。しかしながら、分析の意図された用途に応じてその他の和音シーケンスも重要である。
【００２７】
とりわけ、短３度（Ｌ３）及び長３度（Ｓ３）の発生を比較することもしばしば重要である。三全音和音展開（tritone chord movements）の発生を区別することならびに、同度（Ｒ１）の発生、特にリタルタンド（ritardandoes）の場合、特にその反復を分離することも重要である。これは、例えば、ためらい、思慮深さなどの現れでありうる。異なる音程の位置、すなわち、その始め又は終りのピッチレベルは、異なる状態を表示する有意な特徴でありうる。
【００２８】
上記の分析は、さまざまな異なる方法で使用可能である。１つの利用分野は、話し手の心理分析であり、これは、人間性、話し手の気分及び感情の状態などを査定（assess）するのに使用できる利用分野である。したがって、この方法は、このような心理的調査及び分析が関心事である数多くの場合、例えば就職面接の場合、臨床的に精神科医療のため、嘘発見目的のためなどに応用可能である。
【００２９】
この音声分析を、話し手の生理的健康を解釈するため、そしてその帰結として異なる病理学的状態の診断のためにも、使用することができる。例えば、数多くの病理学的状態において、非基本展開（すなわち三全音和音展開）の発生は低減するか又は完全に消滅することを表し、短間隔（minor interval）（Ｌ３）の発生は、多くの病理学的状態においてより頻度が高いことを表す。
【００３０】
いくつかの明確な目的のために該分析を使用する場合、その後の判断工程Ｓ６も通常行われる。この判断は、正常値との比較に基づくものとできる。これらの正常値は、一般的なものであってもよく、又は好ましくはさまざまカテゴリーに適合させることもできる。これらのカテゴリーは、例えば言語の所属、国籍及び／又はその他の環境面及び前後関係面を反映し得る。代替的に又は補足的に、カテゴリー別のグループ分けは、性別、年令、以前の経験などといった個人的特性に基づくものであってもよい。さまざまな標準値及び比較も、意図された目標に応じて適切に使用することができる。
【００３１】
しかし、標準値の代りに、又は、この種の比較の補足として、同様に、同じ話し手に関して行なわれた先の分析を使用することも可能である。このようにして、経時的な差異、つまり精神的又は生理的な性質の病理学的状態を識別するためなどに用いることのできる変化を知覚することが可能となる。
【００３２】
上記の分析は、音声トレーニングの目的でも使用可能であり、その場合、査定された音程周波数（interval frequencies）は、好ましい値と比較される。これらの好ましい値は、異なる状況及び感情の状態に合わせるように抽出可能である。さらに、比較は、好ましくはリアルタイムでユーザーに提示され得る。分析された音声と好ましい値の間の差異を低減するために、好ましい評価（measures）を自動的に選別することも好ましい。これは、例えば差異が最大である音程又は最も重要であるとみなされている音程を識別し、それに基づき、適切な評価を示唆する予め記憶された命令を検索することによって達成され得る。音声トレーニング方法は、言語学習、俳優のトレーニング、公衆の面前での話術のトレーニングなどのために使用することができる。
【００３３】
上述のような方法を実施するための装置は、一実施形態においては、音声のシーケンスを録音するための手段１及び記録されたシーケンスを記憶するための記録媒体２を含む。録音手段は、例えばマイクロホンと、カセット、データメモリ、ＣＤディスクなどの記録媒体であり得る。分析のために予め記憶された音声シーケンスを使用することもできる。さらに、リアルタイムで分析を実施することも可能であり、その場合、記録媒体は除くことができる。
【００３４】
装置はさらに、録音された信号をフィルタリングするためのフィルタリング手段３を含む。フィルタは、予め指示されたフィルタリング作業の一部又はすべてを実施するように設計可能である。フィルタは、いくつかのフィルタリングユニットを含むこともできる。
【００３５】
さらに、装置は、音声信号の基音を決定するための測定手段４を含む。この装置は、例えばＤＳＰ（デジタル信号処理）ユニットであってよく、あるいは、本明細書に参考として組み込まれているＥＰ０８２１３４５号公報又はＵＳ６０１４６１７号公報に記載されている方法で作動し得る。基音を決定することのできるその他の測定用手段も組み込み可能である。代替的には、測定手段をフィルタリング手段の前に配置することもできる。
【００３６】
分析された基音は、前述したように、近い基音の間の音程を識別するように設計された手段５へと転送され、識別された音程は、求められている音程のうちの少なくとも一部が発生する周波数の査定のための手段まで転送される。有利には、この手段は、市販の統計プログラムを含むことができる。
【００３７】
装置は、音程の査定のうちの少なくともいくつかの結果を比較するように構成されている比較手段６も含むことができる。この比較手段は、このとき、好ましくは、前述のように一部の又はすべての音程についての査定された周波数を事前に決定された好ましい周波数と比較する。予め定められた値は、好ましくはメモリーユニット又はデータベース６に記憶されている。
【００３８】
有利には、装置はまた、発見された差異を分析するように構成された判断手段７も含む。判断手段はまた、判断、診断などのための命令の自動的供給のため、データベース８に接続され得る。これらの命令、比較作業の結果等は、有利にも、ディスプレイ、ラウドスピーカーなどでありうる、提示手段９を介してユーザーに提示することができる。
【００３９】
前述の装置は、信号処理用のサウンドカード及びマイクロホンが備わった従来のＰＣユニットの形で好ましくは実現することができる。データベースは、コンピュータ内の１つ又はいくつかのメモリに記憶することもできるし、又はインターネットのような通信網を介してアクセス可能であってもよい。
【００４０】
上述のような分析のための方法及び装置は、同様にして音声分析の制御のために使用することができる。この場合、従来の及び先行技術の音声合成方法及び装置を使用することができ、これらの方法及び装置は、本発明によって開示された分析に従って制御される。合成は、異なる感情の状態、気分及びその他の表現を伝えるように制御されうる。さらに、この点において、異なる個人又は個人のグループをシミュレーションするように音声の合成を適合させることが可能である。
【００４１】
本発明は、本明細書においてさまざまな実施形態を用いて記述されてきた。しかしながら、本明細書で規定されているもの以外の本発明のその他の変形形態も可能であるということを認識すべきである。例えば、少数の音程のみを識別することもできるし、その他の音程又は音程のグループを分析のために使用することもでき、基音を他の方法で測定することもできる、などがある。同様に、音声トレーニング及び診断のため以外の目的で本発明の分析方法及び装置を使用することが可能である。例えば、この種の分析は、嘘発見のため、例えば就職面接と合わせた個人の予備診断のためなどに使用可能である。識別を目的として音声シーケンスのより詳細な分析を使用することができる可能性が高い。さらに、本発明によって教示されている或る種の分析は、異なる集団などに個人を選択しグループ分けするために使用することができ、、グループ内の調和及び協力的状況を得る確率を増大させることを目的として調整を行なうことを可能にする。
【００４２】
これらの及びその他の密に関係する変形形態も、添付の請求の範囲により限定されるとおり、本発明により包含されるものとみなすべきである。
【図面の簡単な説明】
図１は、本発明に従った方法の第１の実施形態の概略流れ図であり、
図２は、本発明に従った装置の第１の実施形態の概略ブロック図である。

Claims

音声シーケンスの基音を測定するステップと、
前記基音をフィルタリングして、予め定められた時間閾値以下の持続時間の基音を除去し、かつ、予め定められた振幅閾値以下の振幅を有する基音を除去するステップと、
前記フィルタリングされた連続する基音のうちの少なくとも２つの間の周波数間隔を識別するステップと、
このようにして識別された周波数間隔のうちの少なくとも１つを前記音声シーケンス中で発生する周波数を査定するステップと、
を含む、人間の音声を分析する方法。
前記音声シーケンスの基音を測定するステップは、予め定められた時間隔の間におけるピッチ平均値を確立するステップと、このようにして得られる前記平均値を前記基音の識別ために使用するステップと、を含む、請求項１に記載の方法。
前記周波数間隔の識別が、前記周波数間隔が上昇であるか下降であるかの識別をも含む、請求項１又は２に記載の方法。
少なくとも短３度（Ｌ３）及び長３度（Ｓ３）が識別される、請求項１〜３のいずれかに記載の方法。
同度（Ｒ１）、短２度（Ｌ２）、長２度（Ｓ２）、短３度（Ｌ３）、長３度（Ｓ３）、短６度（Ｌ６）及び長６度（Ｓ６）という群の少なくとも１つの周波数間隔及び、完全４度（Ｒ４）、増４度／減５度（３全音）、完全５度（Ｒ５）、短７度（Ｌ７）及び長７度（Ｓ７）から成る群の少なくとも１つの周波数間隔の識別を含む、請求項１〜４のいずれかに記載の方法。
識別された周波数間隔が、少なくとも以下の下位群、すなわち同音（Ｒ１）、短２度（Ｌ２）、長２度（Ｓ２）、短３度（Ｌ３）、長３度（Ｓ３）、短６度（Ｌ６）及び長６度（Ｓ６）；又は、完全４度（Ｒ４）、増４度／減５度（３全音）、完全５度（Ｒ５）、短７度（Ｌ７）、長７度（Ｓ７）及び完全オクターブ（Ｒ８）へと分類される、請求項１〜５のいずれかに記載の方法。
連続した前記基音のうちの少なくとも３個を含む少なくとも１つの群の音の間の周波数間隔シーケンスの識別を含む、請求項１〜６のいずれかに記載の方法。
識別された前記周波数間隔シーケンスが、長和音又は短和音の音を含む、請求項７に記載の方法。
識別された前記周波数間隔シーケンスが、長和音又は短和音の上昇又は下降アルペッジョを含む、請求項８に記載の方法。
音声シーケンスの基音を測定するための測定手段と、
前記基音をフィルタリングして、予め定められた時間閾値以下の持続時間の基音を除去し、かつ、予め定められた振幅閾値以下の振幅を有する基音を除去するための手段と、
連続する前記基音のうちの少なくとも２つの間の周波数間隔を識別するための手段と、
このようにして識別された周波数間隔のうちの少なくとも１つを前記音声シーケンスの中で発生する周波数を査定するための手段と、
を備える、人間の音声を分析するための装置。
基音を測定するための前記測定手段が、予め定められた時間隔の間、ピッチ平均値を確立するための手段をさらに備える、請求項１０に記載の装置。
前記周波数間隔の識別のための手段が、少なくとも短３度（Ｌ３）及び長３度（Ｓ３）を識別するように設計されている、請求項１０又は１１に記載の装置。
前記周波数間隔の識別のための手段がさらに、連続する前記基音のうちの少なくとも３つを含む少なくとも１つの群の音の間の周波数間隔シーケンスを識別するように設計されている、請求項１０〜１２のいずれかに記載の装置。
音声シーケンスの基音を測定するステップと、
前記基音をフィルタリングして、予め定められた時間閾値以下の持続時間の基音を除去し、かつ、予め定められた振幅閾値以下の振幅を有する基音を除去するステップと、
前記フィルタリングされた連続する基音のうちの少なくとも２つの間の周波数間隔を識別するステップと、
このようにして識別された周波数間隔のうちの少なくとも１つを前記音声シーケンス中で発生する周波数を査定するステップと、
関係するユーザーのために事前に決定された好ましい周波数と、前記査定された周波数間隔の周波数とを比較するステップと、
を含む、自動音声トレーニングのための方法。
前記査定された周波数間隔の周波数と、関係するユーザーのために事前に決定された前記好ましい周波数との間の比較結果の提示をさらに含む、請求項１４に記載の方法。
前記査定された周波数間隔の周波数と、事前に決定された前記好ましい周波数との間の差を減少させるための適切な判断の識別をさらに含む、請求項１４又は１５に記載の方法。
前記方法が、リアルタイムで行なわれる、請求項１４〜１６のいずれかに記載の方法。
関係するユーザーのために事前に決定された前記好ましい周波数が標準値を含む、請求項１４〜１７のいずれかに記載の方法。
前記標準値が、ユーザータイプ及び音声トレーニングの目的というカテゴリーのうちの少なくとも１つにグループ分けされる、請求項１８に記載の方法。
話された音声シーケンスを記録するための手段と、
前記音声シーケンスの基音を測定するための手段と、
前記基音をフィルタリングして、予め定められた時間閾値以下の持続時間の基音を除去し、かつ、予め定められた振幅閾値以下の振幅を有する基音を除去するための手段と、
連続する前記基音のうちの少なくとも２つの間の周波数間隔を識別するための手段と、
このようにして識別された周波数間隔のうちの少なくとも１つを前記音声シーケンスの中で発生する周波数を査定するための手段と、
関係するユーザーのために事前に決定された好ましい周波数と、前記査定された周波数間隔の周波数とを比較するための手段と、
を備える、音声トレーニング装置。
前記査定された周波数間隔の周波数と、関係するユーザーのために事前に決定された前記好ましい周波数との間の比較の結果を提示するための手段をさらに備える、請求項２０に記載の装置。
前記査定された周波数間隔の周波数と、事前に決定された前記好ましい周波数との間の差を減少させるための適切な評価を確認するための手段をさらに備える、請求項２０又は２１に記載の装置。
関係するユーザーのために事前に決定された前記好ましい周波数として使用されるべき少なくとも１組の標準値、及びユーザータイプ及び音声トレーニング目的というカテゴリーのうちの少なくとも１つに関してグループ分けされた、好ましくは複数の標準値の組を有するデータベースをさらに備える、請求項２０〜２２のいずれかに記載の装置。
患者が発生した音声シーケンスの基音を測定するステップと、
前記基音をフィルタリングして、予め定められた時間閾値以下の持続時間の基音を除去し、かつ、予め定められた振幅閾値以下の振幅を有する基音を除去するステップと、
前記フィルタリングされた連続する基音のうちの少なくとも２つの間の周波数間隔を識別するステップと、
このようにして、識別された周波数間隔のうちの少なくとも１つを前記音声シーケンスの中で発生する周波数を査定するステップと、
診断を目的として事前に決定された周波数と比較することにより、少なくとも１つの前記査定された周波数間隔の周波数を評価するステップと、
を含む、音声分析に基づいて病理学的状態を診断するための方法。
前記事前に決定された周波数が、同じ患者からの音声シーケンスの少なくとも１つの対応する事前の分析に基づいている、請求項２４に記載の方法。
前記事前に決定された周波数が、同じ患者からの少なくとも２つ、好ましくは数個の音声シーケンスの対応する分析の鑑定に基づいている、請求項２５に記載の方法。
前記事前に決定された周波数が、正常値に基づいている、請求項２４に記載の方法。
患者がさらに複数のカテゴリーにグループ分けされ、前記事前に決定された周波数が、関係するユーザーのカテゴリーに該当する正常値に基づいている請求項２７に記載の方法。
前記周波数間隔の周波数と、前記事前に決定された周波数との間の比較の評価結果を提示するための手段をさらに含む、請求項２４〜２８のいずれか１項に記載の方法。
発声された音声シーケンスを記録するための手段と、
前記音声シーケンスの発音を測定するための測定手段と、
前記基音をフィルタリングして、予め定められた時間閾値以下の持続時間の基音を除去し、かつ、予め定められた振幅閾値以下の振幅を有する基音を除去するための手段と、
連続する前記基音のうちの少なくとも２つの間の周波数間隔を識別するための識別手段と、
このようにして識別された周波数間隔のうちの少なくとも１つを前記音声シーケンスの中で発生する周波数を査定するための査定手段と、
診断を目的として事前に決定された周波数と比較することにより、少なくとも１つのこのように査定された周波数間隔の周波数を評価するための手段と、
を備える、音声分析に基づいて病理学的状態を診断するための装置。
前記査定された周波数間隔の周波数を提示するための提示手段をさらに備える、請求項３０に記載の装置。
関係するユーザーのために事前に決定された好ましい周波数として使用されるべき少なくとも１組の標準値、及びユーザータイプ及び診断目的というカテゴリーのうちの少なくとも１つに関してグループ分けされた好ましくは複数の標準値の組を有するデータベースをさらに備える、請求項３０又は３１に記載の装置。
請求項１〜９のいずれかに記載の分析方法を用いて少なくとも１人の人物からの少なくとも１つの音声シーケンスを分析するステップ、及び前記分析に基づいて、前記分析の少なくとも１つの側面に基づく合成音声の生成を制御するステップを含む、音声合成方法。
前記分析には、同じ個人からの複数の音声シーケンスの鑑定が含まれる、請求項３３に記載の方法。
前記分析には数名の異なる個人からの音声シーケンスの鑑定が含まれる、請求項３３又は３４に記載の方法。
少なくとも１人の個人からの少なくとも１つの音声シーケンスを分析するための請求項１０〜１３のいずれかに記載の分析装置、及び合成音声を生成するための手段を含み、前記合成音声を生成するための手段が、前記分析装置によって生成された分析の少なくとも一部の側面に基づいて制御されている、合成音声のための装置。