JP2021022883A

JP2021022883A - 音声増幅装置及びプログラム

Info

Publication number: JP2021022883A
Application number: JP2019139211A
Authority: JP
Inventors: 大聖今田; Taisei Imada; 啓一善甫; Keiichi Zempo
Original assignee: Imada Taisei; Zempo Keiichi
Current assignee: Imada Taisei; Zempo Keiichi
Priority date: 2019-07-29
Filing date: 2019-07-29
Publication date: 2021-02-18

Abstract

【課題】ユーザの音声を話し相手に伝わりやすくすると共に、ユーザのストレスを低減させる音声増幅装置を提供する。【解決手段】音声増幅装置１は、音声マイク４０と環境マイク５０と制御部と増幅部とスピーカ７０と、を有する。音声マイクはユーザの音声を音声電気信号に変換し、環境マイクはユーザ周辺の環境音響を環境音電気信号に変換する。制御部は、解析部と、検出部と、設定部と、を有する。解析部は、音声電気信号の周波数スペクトル及び環境音響電気信号の周波数スペクトルを解析する。検出部は、ユーザのストレスをストレス指数として検出する。設定部は音声電気信号の周波数スペクトルと環境音響電気信号の周波数スペクトルとストレス指数とに基づいて増幅パラメータを設定する。増幅部は、増幅パラメータに基づいて入力された音声電気信号を増幅する。スピーカは、増幅された音声電気信号に対応する音声を出力する。【選択図】図１

Description

本発明は、音声増幅装置及びプログラムに関する。

雑音環境下において音声を強調する技術がある。特許文献１には、音声の明瞭性に影響を与えるフォルマント帯域のＳＮ比を改善するように音声の周波数のスペクトルを制御することで、様々な特定を持つ雑音に対して、事前の制御量のチューニングを必要とせずに、聞き取りやすい音声の特徴を反映させる音声強調装置が記載されている。

特許第５９８６９０１号公報

しかし、ユーザの音声が増幅された場合であっても、話し相手に音声が伝わらない場合もある。このような場合、ユーザのストレスとなっていた。特許文献１の技術では、ユーザがストレスを感じても、音声の増幅には何ら反映されないため、音声が伝われない状態は継続し、ユーザのストレスは低減されない問題があった。

本発明は、かかる事情を鑑みてなされたものであり、ユーザの音声を話し相手に伝わりやすくすると共に、ユーザのストレスを低減させる技術を提供することを目的とする。

本発明の一態様によれば、音声増幅装置であって、音声マイクと、環境マイクと、制御部と、増幅部と、スピーカと、を有し、前記音声マイクは、ユーザの音声を音声電気信号に変換し、前記環境マイクは、ユーザ周辺の環境音響を環境音電気信号に変換し、前記制御部は、解析部と、検出部と、設定部と、を有し、前記解析部は、前記音声電気信号の周波数スペクトルである第１周波数スペクトル及び前記環境音響電気信号の周波数スペクトルである第２周波数スペクトルを解析し、前記検出部は、ユーザのストレスをストレス指数として検出し、前記設定部は、前記第１周波数スペクトルと前記第２周波数スペクトルと前記ストレス指数とに基づいて、増幅周波数帯域と増幅率とを含む増幅パラメータを設定し、前記増幅部は、前記増幅パラメータに基づいて、入力された前記音声電気信号を増幅し、前記スピーカは、前記増幅された音声電気信号に対応する音声を出力する、音声増幅装置が提供される。

本発明の一態様に係る音声増幅装置では、ユーザの音声を話し相手に伝わりやすくすると共に、ユーザのストレスを低減させる技術を提供することができる。

本発明の一実施形態に係る音声増幅装置１の斜視図の一例である。音声増幅装置１の機能ブロック図である。音声増幅装置１による音声増幅処理を示すアクティビティ図の一例である。図４Ａは、増幅部６０による音声増幅処理後の波形を表す模式図である。図４Ｂは、ストレス指数が予め定められた閾値を超えた場合におけるさらなる音声増幅処理後の波形を表す模式図である。

以下、図面を用いて本発明の実施形態について説明する。以下に示す実施形態中で示した各種特徴事
特に、本明細書において「部」とは、例えば、広義の回路によって実施されるハードウェア資源と、これらのハードウェア資源によって具体的に実現されうるソフトウェアの情報処理とを合わせたものも含みうる。また、本実施形態においては様々な情報を取り扱うが、これら情報は、０又は１で構成される２進数のビット集合体として信号値の高低によって表され、広義の回路上で通信・演算が実行されうる。

また、広義の回路とは、回路（Ｃｉｒｃｕｉｔ）、回路類（Ｃｉｒｃｕｉｔｒｙ）、プロセッサ（Ｐｒｏｃｅｓｓｏｒ）、及びメモリ（Ｍｅｍｏｒｙ）等を少なくとも適当に組み合わせることによって実現される回路である。すなわち、特定用途向け集積回路（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ：ＡＳＩＣ）、プログラマブル論理デバイス（例えば、単純プログラマブル論理デバイス（ＳｉｍｐｌｅＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ：ＳＰＬＤ）、複合プログラマブル論理デバイス（ＣｏｍｐｌｅｘＰｒｏｇｒａｍｍａｂｌｅＬｏｇｉｃＤｅｖｉｃｅ：ＣＰＬＤ）、及びフィールドプログラマブルゲートアレイ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ：ＦＰＧＡ））等を含むものである。

１．音声増幅装置１の概要
図１は、音声増幅装置１の外観の一例を示す図である。音声増幅装置１は、音声マイク４０、環境マイク５０、スピーカ７０を備える。本実施形態では、音声増幅装置１は、ウェアラブルデバイスであって、眼鏡のように両耳の上に掛ける形態である。但し、他の例として、首掛けヘッドホンのように首に掛ける形態であってもよい。音声マイク４０は、ユーザの音声を取得する。環境マイク５０は、ユーザの周辺の環境音を取得する。スピーカ７０は、音声を出力する。なお、音声マイク４０、環境マイク５０、スピーカ７０の数及び配置位置は図１に示した態様に限られない。

音声増幅装置１は、周囲の環境音に含まれるノイズを分析し、ユーザーの音声と干渉しにくい周波数帯において、ユーザーの音声を表す音声データを増幅する。これにより、音声増幅装置１のスピーカ７０から出力されるユーザの音声は、ノイズの多い環境下でも声が通りやすくなるように拡張される。ユーザは、音声増幅装置１を用いることにより、騒がしい環境に行くと周りの音と自分の声の周波数帯が干渉し、声が伝わりづらくなる問題を解決することができる。

図２に示すように、音声増幅装置１は、制御部１０、通信部２０、記憶部３０、音声マイク４０、環境マイク５０、増幅部６０、スピーカ７０、生体情報計測部８０を備える。

＜通信部２０＞
通信部２０は、他の機能部材又は他の音声増幅装置と有線又は無線によりデータ通信可能に構成される。本実施形態では、通信部２０は、所定の範囲に存在する他のユーザの音声増幅装置と通信し、他のユーザの音声増幅装置に設定された増幅周波数帯域に関するパラメータを取得可能に構成される。ここで、増幅周波数帯域については後述する。

＜音声マイク４０及び環境マイク５０＞
音声マイク４０は、ユーザーの音声を収集するものであり、ユーザの音声を音声電気信号に変換する。環境マイク５０は、ユーザーの周辺の環境音を収集するものであり、環境音を電気信号に変換する。

＜増幅部６０＞
増幅部６０は、増幅パラメータに基づいて、入力された音声電気信号を増幅する。ここで、増幅パラメータは、増幅周波数帯域と増幅率とを含むパラメータである。本実施形態における増幅周波数帯域は、ユーザーの音声に対応する音声電気信号に含まれる周波数のうち、増幅部６０が増幅する周波数帯域を表す。また、増幅率は、増幅部６０により増幅される度合いを表す。

＜スピーカ７０＞
スピーカ７０は、増幅部６０により増幅された音声電気信号に対応する音声を出力する。なお、スピーカ７０は、増幅部６０により増幅されていない音声電気信号に対応する音声を出力することもできる。

＜生体情報計測部８０＞
生体情報計測部８０は、ユーザーの脈拍、脳波、表情、筋電位、発汗、体温、血圧のうち、少なくとも１つ以上の生体情報を計測する。生体情報計測部８０は、音声増幅装置１と一体型のセンサーでもよく、音声増幅装置１と別に設けられたセンサーでもよい。また、生体情報計測部８０は、ウェアラブル端末に実装されるバイタルデータ収集機能により実現されてもよい。この場合、ウェアラブル端末と生体情報計測部８０がデータ通信可能に構成され、ウェアラブル端末により収集されたバイタルデータが音声増幅装置１に送信される。さらに、任意のカメラを用いて画像処理により発汗等を計測することもできる。

＜制御部１０＞
制御部１０は、解析部１０１、検出部１０２、設定部１０３、認識部１０４、モード制御部１０５を備える。

＜解析部１０１＞
解析部１０１は、音声電気信号の周波数スペクトルである第１周波数スペクトル及び環境音電気信号の周波数スペクトルである第２周波数スペクトルを解析する。解析部１０１は、例えばケプストラム解析を利用して第１周波数スペクトル及び第２周波数スペクトルを解析する。具体的には、解析部１０１は、第１周波数スペクトルに含まれるピークの周期性を特定することにより、音声に含まれる倍音ｆ０を推定する。また、解析部１０１は、第２周波数スペクトルのうち、比較的空いている周波数帯域を特定する。

ここで、解析部１０１は、第２周波数スペクトルを構成する周波数帯域のうち、突発的なノイズであるか、定常的な環境音であるかを推定することが好ましい。そして、第２周波数スペクトルを構成する周波数帯域のうち、定常的な環境音に対応する周波数帯域を避けて音声電気信号を増幅することが好ましい。これにより、定常的な環境音との干渉を低減させ、ユーザーの音声を効率的に増幅することができる。

＜検出部１０２＞
検出部１０２は、ユーザのストレスをストレス指数として検出する。ここで、ストレス指数とは、予め定められた指数であって、ユーザーの感じているストレスの度合いを表すものである。ストレス指数の定め方は任意であり、絶対値で表してもよく、割合で表してもよい。

検出部１０２は、ユーザの音声の周波数スペクトルに含まれるスペクトルピークの時間的繰り返しから、ストレス指数を検出してもよい。具体的には、環境音の存在下でユーザーが話している場合に、環境音が大きいために他の人物に声が届かないと、ユーザーは話の内容を何回も繰り返すことがある。このとき、特定の単語やフレーズが繰り返されると、ユーザの音声の周波数スペクトルに含まれるスペクトルピークが周期的に現れる。以上より、検出部１０２は、ユーザの音声の周波数スペクトルに含まれるスペクトルピークの時間的繰り返しが観測されると、ユーザーが特定の単語やフレーズを繰り返し伝えようとしていると判断し、ストレス指数が大きく算出される。本実施形態では、時間的繰り返しの回数又は頻度が多いほど、高いストレス指数が検出される。

なお、繰り返されるスペクトルピークの形状が同一、類似又は相似である場合に限られず、異なるスペクトルピークを１組のスペクトルピークとして扱うことも可能である。これは、ユーザーが、特定の意味を表す単語を発声し、続いて同じ意味の単語を別の表現で発声した場合、最初の発声ではうまく相手に伝わらなかったので、異なる言い回しになった場合を想定している。かかる処理は、予め特定の単語又はフレーズに対応するスペクトルピークの形状と、異なる表現に対応するスペクトルピークの形状と、を対応付けて記憶することにより実現される。

さらに、検出部１０２は、スペクトル分布から声色を推定し、声色の特徴からストレス指数を検出してもよい。具体的には、声色の特徴が緊張状態を表す場合、高いストレス指数が検出される。一方、声色の特徴が緩和状態を表す場合、低いストレス指数が検出される。また、音声の大きさ等を考慮してストレス指数を検出してもよい。

＜設定部１０３＞
設定部１０３は、第１周波数スペクトルと第２周波数スペクトルとストレス指数とに基づいて、増幅周波数帯域と増幅率とを含む増幅パラメータを設定する。本実施形態では、第１周波数スペクトルと第２周波数スペクトルを解析し、第２周波数スペクトルの周波数帯域のうち、比較的空いている周波数帯域か、第１周波数スペクトルと近い強度の周波数帯域を増幅周波数帯域として設定する。また、ストレス指数が大きいほど、増幅率を高く設定する。

また、設定部１０３は、解析部１０１による解析結果に基づいて、増幅周波数帯域を設定してもよい。例えば、設定部１０３、第１周波数スペクトルのうち、低周波数側からｍ個（ｍ：自然数）のピーク位置を含む周波数を増幅周波数帯域として設定してもよい。また、設定部１０３は、第１周波数スペクトルのうち、レベルが最大となる周波数からレベルが高い順にｎ個（ｎ：自然数）のピーク位置を含む周波数を増幅周波数帯域として設定してもよい。

さらに、設定部１０３は、ストレス指数が予め定められた閾値を超えた場合、増幅率をさらに大きく設定してもよい。かかる処理により、音声が増幅された後であっても環境音によっては相手に伝わりにくい場合があり、このときに受けるストレスが閾値を超えた場合には、ユーザーの音声をさらに増幅させることができる。

さらに、設定部１０３は、解析部１０１により求められた音声電気信号の基本周波数に対して、整数倍の周波数を含む範囲で増幅周波数帯域を設定してもよい。

さらに、設定部１０３は、通信部２０により取得されたパラメータをもとに、他の音声増幅装置に設定された増幅周波数帯域を避けて自装置（音声増幅装置１）の増幅周波数帯域を設定してもよい。

さらに、音声に含まれる倍音ｆ０を推定し、ｆ１，ｆ２，・・・，ｆｎ（ｎ：自然数）を求め、環境音とｆ１，ｆ２，・・・，ｆｎのスペクトルの大小関係を比較してもよい。そして、音声スペクトルの方が大きい順にｎ番目までを選択し、選択された周波数ピークを中心に、増幅帯域の幅を決定してもよい。

さらに、音声に含まれるｆ０の整数倍の倍音を増幅してもよい。例えば、ｆ０が２００Ｈｚの場合、４００，６００，８００，１０００，１２００ＨＺを増幅してもよい。

＜認識部１０４＞
認識部１０４は、音声電気信号からユーザが発する言葉を認識する。そして、検出部１０２は、認識部１０４が認識した言葉を含む同義語の繰り返し、又は繰り返しを意味するキーワードの検出から、ストレス指数を検出する。これにより、スペクトルピークの形状が異なる場合であっても、ユーザーが同じような内容を伝えようと繰り返し話をしている場合には、大きいストレス指数を検出することができる。

＜モード制御部１０５＞
モード制御部１０５は、音声増幅装置１を通常モードと低電力モードに切り替え可能に構成される。ここで、通常モードとは、音声増幅装置１の種々の機能を発揮できる状態である。また、低電力モードとは、種々の機能を制限し、消費電力を低減させた状態である。

環境音が小さい場合には、音声増幅装置１は低電力モードとなっていることが好ましい。そして、音声増幅装置１は、低電力モードにおいても環境マイク５０から環境音を取得し、環境音が所定値より大きくなった場合には、モード制御部１０５により音声増幅装置１のモードが低電力モードから通常モードに切り替えられる。

また、モード制御部１０５は、所定の条件が満たされた場合、音声増幅装置１を低電力モードから通常モードに変更してもよい。ここで、所定の条件が満たされた場合とは、例えば、喉の筋電に所定の変化があった場合、又は、ユーザの口が開かれたと判定された場合である。すなわち、音声増幅装置１のユーザーが今から話始める直前に、音声増幅装置１のモードを低電力モードから通常モードに切り替えることにより、スムーズな音声増幅が可能になる。

＜記憶部３０＞
記憶部３０は、種々のプログラム及びデータを記憶するものであり、例えばメモリ、ハードディスク、ＳＳＤ等により構成される。本実施形態では、記憶部３０は、ユーザーデータ及びプログラムを記憶する。ここで、ユーザーデータは、ユーザーの氏名、ユーザーＩＤ、電子メールアドレス、ストレスの感じやすさ等を対応付けたデータである。プログラムは、制御部１０による処理を規定するものである。

ここで、音声増幅装置１を構成する各構成要素は、ソフトウェアによって実現してもよく、ハードウェアによって実現してもよい。ソフトウェアによって実現する場合、ＣＰＵがプログラムを実行することによって各種機能を実現することができる。プログラムは、内蔵の記憶部に格納してもよく、コンピュータ読み取り可能な非一時的な記録媒体に格納してもよい。また、外部の記憶部に格納されたプログラムを読み出し、いわゆるクラウドコンピューティングにより実現してもよい。ハードウェアによって実現する場合、ＡＳＩＣ、ＦＰＧＡ、又はＤＲＰなどの種々の回路によって実現することができる。本実施形態においては、様々な情報やこれを包含する概念を取り扱うが、これらは、０又は１で構成される２進数のビット集合体として信号値の高低によって表され、上記のソフトウェア又はハードウェアの態様によって通信や演算が実行され得るものである。

２．音声増幅装置１の処理
次に、図３及び図４を用いて、音声増幅装置１による処理について説明する。

図３に示すように、Ａ１１において、音声マイク４０により、ユーザーの音声が取得される。そして、Ａ１２において、解析部１０１により、音声電気信号の周波数スペクトルである第１周波数スペクトルが解析される。

Ａ２１において、環境マイク５０により、ユーザーの周囲の環境音が取得される。そして、Ａ２２において、解析部１０１により、環境音響電気信号の周波数スペクトルである第２周波数スペクトルが解析される。

Ａ３１において、検出部１０２により、ユーザーの感じているストレスの度合いを表すストレス指数が検出される。

このとき、検出部１０２は、ユーザの音声の周波数スペクトルに含まれるスペクトルピークの時間的繰り返しから、ストレス指数を検出してもよい。また、検出部１０２は、スペクトル分布から声色を推定し、声色の特徴から前記ストレス指数を検出してもよい。また、検出部１０２は、認識部１０４認が認識した言葉を含む同義語の繰り返し、又は繰り返しを意味するキーワードの検出から、ストレス指数を検出してもよい。さらに、検出部１０２は、生体情報計測部８０が計測した脈拍、脳波、表情、筋電位、発汗、体温、血圧のうち、少なくとも１つ以上の生体情報に基づいて、ストレス指数を検出してもよい。

ここで、Ａ１１，Ａ１２と、Ａ２１，Ａ２２と、Ａ３１の処理は、任意の順で実行されてもよく、同時に実行されてもよい。

ここで、図３の例では、Ａ４が実行される時点において、Ａ３１で検出したストレス指数が予め定められた閾値以下である場合について説明する。

Ａ４において、設定部１０３により、第１周波数スペクトルと第２周波数スペクトルとストレス指数とに基づいて、増幅周波数帯域と増幅率とを含む増幅パラメータが設定される。

ここで、図４Ａに示すように、増幅周波数帯域は、環境音と元の音声の周波数スペクトルのうち、増幅後の音声が環境音に埋もれないような範囲に設定される。

また、設定部１０３は、解析部１０１により求められた音声電気信号の基本周波数に対して、整数倍の周波数を含む範囲で増幅周波数帯域を設定してもよい。これにより、複数の倍音を含む複合音のうち、本来存在しない周波数に対応する基本周波数（ｆ０）の音が知覚されるミッシング・ファンダメンタル（ｍｉｓｓｉｎｇｆｕｎｄａｍｅｎｔａｌ）現象を発生させることができる。これにより、相手の脳に低周波の音を知覚させることができ、環境音に阻害されずにユーザーの音声が伝わりやすくなる。

次に、Ａ５において、増幅部６０により、増幅パラメータに基づいて、入力された音声電気信号が増幅される。

そして、Ａ６において、スピーカ７０により、増幅された音声電気信号に対応する音声が出力される。

ユーザーが音声増幅装置１を利用して増幅された音声で会話をしていた場合でも、環境音によっては相手に音声が伝わりにくい場合がある。そこで、本実施形態では、環境マイク５０は、所定のタイミング（一定間隔、ランダムなタイミング、又は常に）で環境音を取得している。そして、ストレス指数が予め定められた閾値以下である状態が続く場合、Ａ４において設定された増幅パラメータが維持される（Ａ７２）。一方、ストレス指数が予め定められた閾値を超えた場合、ユーザーの会話が相手に届きづらいと推定されるので、Ａ７１において、Ａ４で設定された増幅率をさらに増大させる。

そして、Ａ８において、増幅後の増幅率で音声が出力される。ここで、Ａ８における処理は、設定部１０３、増幅部６０及びスピーカ７０により実現される。これにより、図４Ｂに示すように、さらに増幅された音声は、環境音に負けない強度となる。なお、図４Ａ及び図４Ｂはあくまで模式図であり、実際のスペクトルを表すものではないことに留意されたい。

３．その他の実施形態
（３−１）他の音声増幅装置との連携
次に、他の音声増幅装置との連携について説明する。本実施形態では、音声増幅装置１の通信部２０は、所定の範囲に存在する他のユーザの音声増幅装置と通信し、他のユーザの音声増幅装置に設定された増幅周波数帯域に関するパラメータを取得する。そして、設定部１０３は、通信部２０により取得されたパラメータをもとに、他のユーザの音声増幅装置に設定された増幅周波数帯域を避けて自装置（音声増幅装置１）の増幅周波数帯域を設定する。これにより、他のユーザーの音声増幅装置により増幅された他のユーザーの音声と、音声増幅装置１により増幅されたユーザーの音声の干渉を低減することができる。

（３−２）低減力モードと通常モードの切替
所定の条件が満たされた場合、モード制御部１０５により、音声増幅装置１を低電力モードから通常モードに切り替えられる構成としてもよい。ここで、所定の条件は、喉の筋電に所定の変化があった場合、又は、ユーザの口が開かれたと判定された場合であってもよい。これにより、通常は低減力モードで電力の消費を抑えつつ、ユーザーが発話する直前で、自動的に通常モードに切り替えることが可能になる。

（３−３）フィードバック
増幅された音声がスピーカ７０から出力されているときに、スピーカ７０から出力されている音声の状態をユーザーにフィードバックさせてもよい。ここで、音声の状態は、例えば、増幅の度合い、ストレス指数等である。また、フィードバックの手法は特に限定されず、振動、音、光、匂い、画像等のユーザーが知覚可能な態様であればよい。これにより、ユーザが発話状況を認識し、自信の会話が相手に伝わっていることを確認可能となり安心できる。

４．その他
本発明に係る音声増幅装置１は、以下の態様でも実施可能である。

コンピュータを、音声増幅装置として機能させ、
前記音声増幅装置は、音声マイクと、環境マイクと、制御部と、増幅部と、スピーカと、を有し、
前記音声マイクは、ユーザの音声を音声電気信号に変換し、
前記環境マイクは、ユーザ周辺の環境音響を環境音電気信号に変換し、
前記制御部は、解析部と、検出部と、設定部と、を有し、
前記解析部は、前記音声電気信号の周波数スペクトルである第１周波数スペクトル及び前記環境音響電気信号の周波数スペクトルである第２周波数スペクトルを解析し、
前記検出部は、ユーザのストレスをストレス指数として検出し、
前記設定部は、前記第１周波数スペクトルと前記第２周波数スペクトルと前記ストレス指数とに基づいて、増幅周波数帯域と増幅率とを含む増幅パラメータを設定し、
前記増幅部は、前記増幅パラメータに基づいて、入力された前記音声電気信号を増幅し、
前記スピーカは、前記増幅された前記音声電気信号に対応する音声を出力する、
プログラム。

また、上述のプログラムを格納する、コンピュータ読み取り可能な非一時的な記録媒体として提供してもよい。

さらに、本発明に係る音声増幅装置１は、以下の態様でも実施可能である。
・音声に含まれるｆ０の非整数倍の倍音を増幅してもよい。例えば、ｆ０が１００Ｈｚの場合、２２０，３３０，４４０，５５０ＨＺを増幅してもよい。これにより、元の音声と声色が異なることになるが、会話の内容を相手に伝えるという目的を達成することができる。
・環境音から環境を推定し、環境に応じて増幅周波数帯域と増幅率とを含む増幅パラメータを設定する。例えば、ユーザーが車を運転中の場合、予めエンジン等の定常的に発生する環境音に含まれる周波数帯域を避けて音声を増幅してもよい。

最後に、本発明に係る種々の実施形態を説明したが、これらは、例として提示したものであり、発明の範囲を限定することは意図していない。新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。実施形態やその変形は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。

また、上述した実施形態及び変形例は任意に組み合わせて実施することができる。

１：音声増幅装置
１０：制御部
２０：通信部
３０：記憶部
４０：音声マイク
５０：環境マイク
６０：増幅部
７０：スピーカ
８０：生体情報計測部
１０１：解析部
１０２：検出部
１０３：設定部
１０４：認識部
１０５：モード制御部

Claims

音声増幅装置であって、
音声マイクと、環境マイクと、制御部と、増幅部と、スピーカと、を有し、
前記音声マイクは、ユーザの音声を音声電気信号に変換し、
前記環境マイクは、ユーザ周辺の環境音響を環境音電気信号に変換し、
前記制御部は、解析部と、検出部と、設定部と、を有し、
前記解析部は、前記音声電気信号の周波数スペクトルである第１周波数スペクトル及び前記環境音響電気信号の周波数スペクトルである第２周波数スペクトルを解析し、
前記検出部は、ユーザのストレスをストレス指数として検出し、
前記設定部は、前記第１周波数スペクトルと前記第２周波数スペクトルと前記ストレス指数とに基づいて、増幅周波数帯域と増幅率とを含む増幅パラメータを設定し、
前記増幅部は、前記増幅パラメータに基づいて、入力された前記音声電気信号を増幅し、
前記スピーカは、前記増幅された音声電気信号に対応する音声を出力する、
音声増幅装置。
請求項１に記載の音声増幅装置において、
前記検出部は、前記ユーザの音声の周波数スペクトルに含まれるスペクトルピークの時間的繰り返しから、前記ストレス指数を検出する、
音声増幅装置。
請求項１又は請求項２に記載の音声増幅装置において、
前記検出部は、前記スペクトル分布から声色を推定し、前記声色の特徴から前記ストレス指数を検出する、
音声増幅装置。
請求項１〜請求項３の何れか１項に記載の音声増幅装置において、
前記制御部は、認識部を更に有し、
前記認識部は、前記音声電気信号からユーザが発する言葉を認識し、
前記検出部は、前記認識部が認識した言葉を含む同義語の繰り返し、又は繰り返しを意味するキーワードの検出から、前記ストレス指数を検出する、
音声増幅装置。
請求項１〜請求項４の何れか１項に記載の音声増幅装置において、
前記音声増幅装置は、生体情報計測部を更に有し、
前記生体情報計測部は、脈拍、脳波、表情、筋電位、発汗、体温、血圧のうち、少なくとも１つ以上の生体情報を計測し、
前記検出部は、前記生体情報に基づいて、前記ストレス指数を検出する、
音声増幅装置。
請求項１〜請求項５の何れか１項に記載の音声増幅装置において、
前記設定部は、前記解析部による解析結果に基づいて、前記増幅周波数帯域を設定する、
音声増幅装置。
請求項１〜請求項６の何れか１項に記載の音声増幅装置において、
前記設定部は、前記ストレス指数が予め定められた閾値を超えた場合、前記増幅率をさらに大きく設定する、
音声増幅装置。
請求項１〜請求項７の何れか１項に記載の音声増幅装置において、
前記設定部は、前記解析部により求められた前記音声電気信号の基本周波数に対して、整数倍の周波数を含む範囲で増幅周波数帯域を設定可能に構成される、
音声増幅装置。
請求項１〜請求項８の何れか１項に記載の音声増幅装置において、
前記音声増幅装置は、通信部を有し、
前記通信部は、所定の範囲に存在する他のユーザの音声増幅装置と通信し、
前記他のユーザの音声増幅装置に設定された増幅周波数帯域に関するパラメータを取得し、
前記設定部は、前記取得したパラメータをもとに、前記他のユーザの音声増幅装置に設定された前記増幅周波数帯域を避けて自装置の増幅周波数帯域を設定する、
音声増幅装置。
請求項１〜請求項９の何れか１項に記載の音声増幅装置において、
前記制御部は、モード制御部を更に有し、
所定の条件が満たされた場合、前記モード制御部は、前記音声増幅装置を低電力モードから通常モードに変更する、
音声増幅装置。
請求項１０に記載の音声増幅装置において、
前記所定の条件が満たされた場合とは、喉の筋電に所定の変化があった場合、又は、ユーザの口が開かれたと判定された場合である、
音声増幅装置。
請求項１〜請求項１１の何れか１項に記載の音声増幅装置において、
前記音声増幅装置は、ウェアラブルデバイスである、
音声増幅装置。
コンピュータを、音声増幅装置として機能させ、
前記音声増幅装置は、音声マイクと、環境マイクと、制御部と、増幅部と、スピーカと、を有し、
前記音声マイクは、ユーザの音声を音声電気信号に変換し、
前記環境マイクは、ユーザ周辺の環境音響を環境音電気信号に変換し、
前記制御部は、解析部と、検出部と、設定部と、を有し、
前記解析部は、前記音声電気信号の周波数スペクトルである第１周波数スペクトル及び前記環境音響電気信号の周波数スペクトルである第２周波数スペクトルを解析し、
前記検出部は、ユーザのストレスをストレス指数として検出し、
前記設定部は、前記第１周波数スペクトルと前記第２周波数スペクトルと前記ストレス指数とに基づいて、増幅周波数帯域と増幅率とを含む増幅パラメータを設定し、
前記増幅部は、前記増幅パラメータに基づいて、入力された前記音声電気信号を増幅し、
前記スピーカは、前記増幅された前記音声電気信号に対応する音声を出力する、
プログラム。