JP6590511B2 - 音声入力装置並びに音声入力装置の制御方法及び制御プログラム - Google Patents

音声入力装置並びに音声入力装置の制御方法及び制御プログラム Download PDF

Info

Publication number
JP6590511B2
JP6590511B2 JP2015087638A JP2015087638A JP6590511B2 JP 6590511 B2 JP6590511 B2 JP 6590511B2 JP 2015087638 A JP2015087638 A JP 2015087638A JP 2015087638 A JP2015087638 A JP 2015087638A JP 6590511 B2 JP6590511 B2 JP 6590511B2
Authority
JP
Japan
Prior art keywords
input device
voice input
microphone
user
microphones
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015087638A
Other languages
English (en)
Other versions
JP2016208266A (ja
Inventor
健太 湯本
健太 湯本
隆介 浜川
隆介 浜川
大西 孝史
孝史 大西
堀内 忠
忠 堀内
勝久 川口
勝久 川口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Corp filed Critical Olympus Corp
Priority to JP2015087638A priority Critical patent/JP6590511B2/ja
Publication of JP2016208266A publication Critical patent/JP2016208266A/ja
Application granted granted Critical
Publication of JP6590511B2 publication Critical patent/JP6590511B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、音声入力装置並びに音声入力装置の制御方法及び制御プログラムに関する。
従来、複数のマイクロホン(マイク)を用いて異なる位置の音源から発せられた音声を記録する音声入力装置が知られている。また、この種の音声入力装置に関する技術として、複数のマイクを介して記録された音声から音源の位置変化を推定する技術が知られている。例えば、特許文献1において提案されている音記録装置は、複数のマイクシステムで集音された音を表す音データを、その音データが出力された時刻情報とその音データが出力されたマイクシステムを識別するマイク識別情報とに関連付けて記憶するようにしている。このような情報を記憶しておくことにより、特許文献1において提案されている音記録装置は、音源の位置変化を音データの表す波形の変化として表示できるようにしている。
特開2008−15773号公報
近年、小型の音声入力装置が開発されている。この種の音声入力装置には、ユーザが手に持って使用したり、また、机に置いて使用したりするといった種々の使われ方がされる。一方で、この種の音声入力装置では、マイクの持つ指向性のため、音声入力装置の持ち方によって、十分な音量の音声を記録することができなかったり、多くのノイズ音が記録されたりすることがある。
本発明は、前記の事情に鑑みてなされたもので、複数のマイクを有する音声入力装置の持ち方等をガイドすることが可能する音声入力装置並びにその制御方法及び制御プログラムを提供することを目的とする。
前記の目的を達成するために、本発明の第1の態様の音声入力装置は、指向性の方向の異なる複数のマイクロホンを備えた音声入力装置であって、前記音声入力装置のユーザによる把持のされ方を判定する把持判定部と、前記把持判定部によって判定された把持のされ方が適切でない場合に、前記ユーザに対して警告をする警告制御部とを具備し、前記把持判定部は、前記複数のマイクロホンのそれぞれで取得される音声信号の間の位相差に基づいて前記把持のされ方を判定する
また、前記の目的を達成するために、本発明の第2の態様の音声入力装置の制御方法は、指向性の方向の異なる複数のマイクロホンを備えた音声入力装置の制御方法であって、前記音声入力装置のユーザによる把持のされ方を判定することと、前記把持のされ方が適切でない場合に、前記ユーザに対して警告をすることとを具備し、前記把持のされ方を判定することは、前記複数のマイクロホンのそれぞれで取得される音声信号の間の位相差に基づいて前記把持のされ方を判定することを含む
また、前記の目的を達成するために、本発明の第3の態様の音声入力装置の制御プログラムは、指向性の方向の異なる複数のマイクロホンを備えた音声入力装置の制御プログラムであって、前記音声入力装置のユーザによる把持のされ方を判定することと、前記把持のされ方が適切でない場合に、前記ユーザに対して警告をすることとをコンピュータに実行させ、前記把持のされ方を判定することは、前記複数のマイクロホンのそれぞれで取得される音声信号の間の位相差に基づいて前記把持のされ方を判定することを含む
本発明によれば、複数のマイクを有する音声入力装置の持ち方等をガイドすることが可能する音声入力装置並びにその制御方法及び制御プログラムを提供することができる。
本発明の一実施形態に係る音声入力装置の構成を示すブロック図である。 図2(a)は音声入力装置を前面から見た外観図であり、図2(b)は音声入力装置を側面から見た外観図である。 図3(a)はAマイクの使用例を示す図であり、図3(b)はBマイクの使用例を示す図である。 音声入力装置の動作を示すフローチャートの第1図である。 音声入力装置の動作を示すフローチャートの第2図である。 音声入力装置の把持のされ方の判定について説明するための図である。 図6(a)はレベル表示の例であり、図6(b)は警告表示の例である。 把持のされ方の判定の別の手法を説明するための図である。 図8(a)は把持のされ方の判定の別の手法においてAマイクで取得される音声信号を示す図であり、図8(b)は把持のされ方の判定の別の手法においてBマイクで取得される音声信号を示す図である。
以下、図面を参照して本発明の実施形態を説明する。図1は、本発明の一実施形態に係る音声入力装置の構成を示すブロック図である。図2(a)は、音声入力装置を前面から見た外観図である。また、図2(b)は、音声入力装置を側面から見た外観図である。ここで、前面は、例えば音声入力装置のタッチパネル(表示部)が設けられている面とする。また、上面は、LEDが設けられている面とする。
図1に示す音声入力装置100は、Aマイクロホン(マイク)102a及びBマイクロホン(マイク)102bと、把持判定部104と、表示部106と、LED108と、振動部110と、記録部112と、スピーカ114と、タッチパネル116と、通信部118と、制御部120とを有している。音声入力装置100は、例えば、音声記録機能に加えて通話機能等の各種の機能を備えた携帯機器である。しかしながら、音声入力装置100は必ずしも通話機能を備えていなくてもよい。音声入力装置100は、異なる用途に使用される複数のマイクを有していればよい。音声入力装置100は、ICレコーダ、スマートフォン等であってもよい。さらには、音声入力装置100は、音声記録機能を必ずしも有していなくてもよい。
Aマイク102a及び102bは、音声入力装置100の外部からの音声を電気信号に変換する。Aマイク102aとBマイク102bとは、それぞれ異なる用途に用いられる。Aマイク102aは、図2(a)及び図2(b)に示すように、例えば音声入力装置100の上面に配置されており、音声入力装置100の上方向に沿った方向の指向性を有している。このため、Aマイク102aは音声入力装置100の上方からの音声を感度良く検出する。このような、Aマイク102aは、例えば、図3(a)に示すようにユーザが音声入力装置100の表示部106とは別の表示部を見ながら使用されるマイクである。また、Bマイク102bは、図2(b)に示すように、例えば音声入力装置100の前面下部に配置されており、音声入力装置100の前方向に沿った方向の指向性を有している。このため、Bマイク102bは音声入力装置100の前方からの音声を感度良く検出する。このようなBマイク102bは、例えば、図3(b)に示すようにユーザが音声入力装置100の表示部106を見ながら使用されるマイクである。
把持判定部104は、現在の音声入力装置100の把持のされ方を検出する。把持判定部104は、例えばAマイク102aを介して取得される音声信号とBマイク102bを介して取得される音声信号との位相差に応じて把持のされ方を判定する。詳細については後で説明する。また、後述のタッチパネル116や操作部で検出された、ユーザの機器へのタッチを加味してもよく、重力等を利用した姿勢センサを具備して把持状態の判定時に、その結果を加味してもよい。
表示部106は、例えば液晶ディスプレイであって、各種の画像を表示する。例えば、表示部106は、ユーザが音声入力装置100の各種の設定を行うためのメニュー画面を表示する。また、表示部106は、把持判定部104で判定された音声入力装置100の把持のされ方に応じて各種の警告表示を行う。LED108は、表示部106と同様に、把持判定部104で判定された音声入力装置100の把持のされ方に応じて各種の警告表示を行う。振動部110は、例えば超音波素子であり、把持判定部104で判定された音声入力装置100の把持のされ方に応じて振動する。
記録部112は、例えばフラッシュメモリであり、Aマイク102aを介して取得される音声信号に基づいて生成された音声データ又はBマイク102bを介して取得される音声信号に基づいて生成された音声データを音声ファイルの形式で記録する。
スピーカ114は、記録部112に記録された音声ファイルに基づく音声信号に従って音声を発する。
タッチパネル116は、表示部106に重ねられるように設けられている。もちろん、表示部外に設けてもよい。タッチパネル116は、ユーザによる接触操作を検出し、検出した接触操作に応じた信号を制御部120に入力する。この接触状態を検出して把持判定に利用しても良い。機器の形状にもよるが、利用時にタッチされるべきでない所がタッチされたりしていれば、それだけで把持がおかしいと考えられる。また、そもそも把持がされていないとか、ポケットに入っている等も、タッチパネルの配置や感度に従って検出することが可能である。なお、図1では、音声入力装置100の操作部としてタッチパネル116が示されている。音声入力装置100は、タッチパネル116以外の操作部を有していてもよい。
通信部118は、例えば携帯電話回線であり、他の音声入力装置との通信を行う。ここでは携帯電話回線としているが、無線LAN回線等であってもよい。
制御部120は、例えばCPU及びメモリを備えたASICであり、音声入力装置100の動作を制御する。制御部120は、音声記録制御部120aと、音声再生制御部120bと、表示制御部120cと、警告制御部120dとを有している。音声記録制御部120aは、Aマイク102a又は102bを介して取得される音声信号を記録部112に記録するまでの一連の処理を制御する。音声再生制御部120bは、記録部112に記録されている音声ファイルに基づく音声をスピーカ114において再生するまでの一連の処理を制御する。表示制御部120cは、表示部106における各種の表示を制御する。警告制御部120dは、把持判定部104で判定された音声入力装置100の把持のされ方によって各種の警告を行う。
以下、本実施形態における音声入力装置100の動作を説明する。図4A及び図4Bは、音声入力装置100の動作を示すフローチャートである。
ステップS101において、制御部120は、音声入力装置100で各種の機能を実行するためのアプリケーションソフトウェア(以下、アプリケーションと記す)の一覧を表示する。アプリケーションは、録音アプリケーションを少なくとも含む。アプリケーションは、通話等のアプリケーションを含んでいてもよい。
ステップS102において、制御部120は、例えばタッチパネル116の出力から、ユーザによって録音アプリケーションが選択されたか否かを判定する。ステップS102において録音アプリケーションが選択されたと判定された場合に、処理はステップS103に移行する。ステップS103において録音アプリケーションが選択されていないと判定された場合に、処理はステップS120に移行する。
ステップS103において、制御部120は、録音アプリケーションを起動する。そして、制御部120は、例えばタッチパネル116の出力から、録音開始指示がされたか否かを判定する。ステップS103において録音開始指示がされたと判定された場合には、処理はステップS104に移行する。ステップS103において録音開始指示がされていないと判定された場合には、処理は待機される。なお、処理の待機中において録音アプリケーションを終了させたり、別のアプリケーションを起動したりできるように音声入力装置100が構成されていてもよい。
ステップS104において、制御部120は、Aマイク102a及びBマイク102bを介して音声信号を取得する。ステップS105において、制御部120は、Aマイク102a及びBマイク102bを介して取得された音声信号を把持判定部104に入力する。これを受けて把持判定部104は、音声入力装置100の把持のされ方を判定するために、Aマイク102aから取得される音声信号とBマイク102bから取得される音声信号のそれぞれのノイズを除去する。ノイズの除去は、例えば特定の周波数帯域の音声信号を除去するフィルタをAマイク102aから取得される音声信号とBマイク102bから取得される音声信号のそれぞれに適用することで行われる。この他、ノイズの除去は、雑音に相当する音声信号をAマイク102aから取得される音声信号とBマイク102bから取得される音声信号のそれぞれから減算することでも行われ得る。なお、ステップS104のノイズ除去は、ステップS105の把持のされ方の判定をし易くするための処理である。ノイズが小さいことが分かっている場合等では、ステップS105のノイズ除去は必ずしも行われなくてもよい。
ステップS106において、把持判定部104は、ノイズ除去された音声信号から音声入力装置100の把持のされ方を判定する。以下、把持のされ方の判定について図5を参照して説明する。
まず、本実施形態における音声入力装置100の好ましい把持のされ方は、図5(a)又は図5(b)の何れかの把持のされ方であるとする。また、音声入力装置100の上下方向の長さがdであるとする。さらに、音速をvsとする。なお、音速vsは、例えば1気圧の乾燥空気、20度における音速である344m/sである。
図5(a)で示す把持のされ方は、Aマイク102aのマイク面に対してユーザが発した音声が垂直に入射され、かつ、Aマイク102aのマイク面とユーザの口元Mとの距離が所定距離DAとなる把持のされ方である。一方、図5(b)で示す把持のされ方は、Bマイク102bのマイク面に対してユーザが発した音声が垂直に入射され、かつ、Bマイク102bのマイク面とユーザの口元Mとの距離が所定距離DBとなる把持のされ方である。所定距離DA及びDBは、マイクで録音するのに近すぎず、遠すぎでもない最適な距離であって、例えば実験によって設定される距離である。この図から明らかなように、ユーザが重力方向に顔の上下を揃えている状態では装置、機器の傾きが明らかに異なるので、複数の検出軸を有する傾きセンサによって機器の傾きを判定して把持状態の判定に利用してもよく、この図5では図示していないが、ユーザが機器を持つ時の手の接触位置も、どのマイクを使うかで異なるので、自然とタッチ位置が変わることから、このタッチ状態をタッチパネル等で判定しても把持のされ方の判定は可能である。これらの音声や傾きやタッチを総合的に判断、あるいは選択的に判断して把持のされ方情報を得ればよい。ここでは、最も単純で、録音機器なら必ず有するマイクの入力を用いて把持のされ方を判定する方法を説明する。
図5(a)で示すような把持のされ方がされている場合、ユーザの口元Mから発せられた音声は、ユーザの口元Mから距離DAだけ離れたAマイク102aと距離Db(=DA+d)だけ離れたBマイク102bで取得される。距離の異なる2つのマイクのそれぞれで音声が取得されるので、それぞれの音声信号の間には位相差PABが生じる。このとき、以下の(式1)で示す関係が成立する。
PAB×vs=Db−DA=d (式1)
つまり、Aマイク102aを介して取得される音声信号とBマイク102bを介して取得される音声信号との間の位相差が(式1)に示す関係を満足していれば、ユーザは音声入力装置100を図5(a)で示すようにして把持していると考えることができる。一方、位相差が(式1)に示す関係を満足していなければ、ユーザは音声入力装置100を図5(a)で示すようにして把持しておらず、この結果、ユーザの発した音声は効率よくAマイク102aに入射していないと考えることができる。なお、位相差PABが音声信号の1周期内に収まっていれば、位相差PABからユーザの口元Mと音声入力装置100との距離を推定することが可能である。
また、図5(b)で示すような把持のされ方がされている場合も、ユーザの口元Mから発せられた音声は、ユーザの口元Mから距離DBだけ離れたBマイク102aと距離Daだけ離れたAマイク102aで取得される。この場合も、距離の異なる2つのマイクのそれぞれで音声が取得されるので、それぞれの音声信号の間には位相差PABが生じる。このとき、以下の(式2)で示す関係が成立する。
PAB×vs=Da−DB (式2)
ただし、Da=√(DB+d
つまり、Aマイク102aを介して取得される音声信号とBマイク102bを介して取得される音声信号との間の位相差が(式2)に示す関係を満足していれば、ユーザは音声入力装置100を図5(b)で示すようにして把持していると考えることができる。一方、位相差が(式2)に示す関係を満足していなければ、ユーザは音声入力装置100を図5(b)で示すようにして把持しておらず、この結果、ユーザの発した音声は効率よくBマイク102bに入射していないと考えることができる。
ここで、図4A及び図4Bの説明に戻る。ステップS107において、制御部120は、現在、ユーザによってAマイクが利用されているか否かを判定する。ステップS107では、例えば、Aマイク102aを介して取得される音声信号のほうがBマイク102bを介して取得される音声信号よりも大きければ図5(a)に近い把持のされ方がされている、すなわちAマイクが利用されていると判定され、Bマイク102bを介して取得される音声信号のほうがAマイク102aを介して取得される音声信号よりも大きければ図5(b)に近い把持のされ方がされている、すなわちBマイクが利用されていると判定される。ステップS107においてAマイク102aが利用されていると判定された場合には、処理はステップS108に移行する。ステップS107においてBマイク102bが利用されていると判定された場合には、処理はステップS115に移行する。なお、どのマイクが使われているかの検出に、この図5で説明したように、傾き情報を利用してもよい。さらに、ユーザが機器を持つ時の手の接触位置がどのマイクを使うかで異なること、また、タッチ位置が変わることから、これらのタッチ状態をタッチパネル等で判定してマイクの使われ方の判定をしてもよい。これらの音声や傾きやタッチを総合的に判断、あるいは選択的に判断して把持のされ方(マイクの使われ方)情報を得れば精度を高めたり、判定の簡便性を高めたり、設計の自由度を高めることができる。
ステップS108において、制御部120は、Aマイク102aを介して取得される音声の音量が規定値を超えているか否かを判定する。ステップS108において、音量が規定値を超えていないと判定された場合には、処理はステップS109に移行する。音量が規定値を超えていると判定された場合には、処理はステップS110に移行する。
ステップS109において、制御部120は、十分な音量の音声が取得できていないので、Aマイク102aに口を近づけるようにユーザに警告する。その後、処理はステップS112に移行する。なお、図5(a)に近い把持のされ方では、ユーザは、表示部106の表示を見ることが困難である。したがって、制御部120は、LED108を点滅させたり、振動部110を振動させたりして警告を行う。振動のさせ方も、複数の振動部を選択して、把持の仕方を反映させて、最適な振動を発生させてもよい。もちろん、振動に限らず警告表示を出しても良く、LEDを点滅させたり、音声ガイドを行うようにしても良い。
ステップS110において、制御部120は、把持判定部104における判定結果から、Aマイク102aを介して取得される音声信号とBマイク102bを介して取得される音声信号との間の位相差が(式1)に示す関係を満足しているか否かを判定する。なお、厳密に(式1)の関係を満たしていなくてもよい。すなわち、多少の誤差は許容される。ステップS110において位相差が(式1)に示す関係を満足していると判定された場合には、処理はステップS111に移行する。ステップS110において位相差が(式1)に示す関係を満足していないと判定された場合には、処理はステップS112に移行する。
ステップS111において、制御部120は、図5(a)のような把持のされ方で音声入力装置100が把持されていないことを警告する。その後、処理はステップS112に移行する。ステップS111においても制御部120は、LED108を点滅させたり、振動部110を振動させたりして警告を行う。この際、ステップS109における警告とはLED108の点滅パターンや点滅色を変更したり、振動部110の振動パターンを変更したりすることで、ステップS109の警告とステップS111の警告とをユーザが識別できるようにすることが望ましい。
ステップS112において、制御部120は、例えばタッチパネル116の出力から、録音終了指示がされたか否かを判定する。ステップS112において録音終了指示がされていないと判定された場合には、処理はステップS104に戻る。ステップS112において録音終了指示がされたと判定された場合には、処理はステップS113に移行する。
ステップS113において、制御部120は、録音開始から録音終了までに取得された音声信号から音声ファイルを生成する。ステップS114において、制御部120は、生成した音声ファイルのヘッダに各種の情報を記録する。各種の情報は、音声ファイルのファイル名等である。その後、処理はステップS101に戻る。
ステップS115において、制御部120は、Bマイク102bを介して取得される音声の音量が規定値を超えているか否かを判定する。ステップS115において、音量が規定値を超えていないと判定された場合には、処理はステップS116に移行する。音量が規定値を超えていると判定された場合には、処理はステップS117に移行する。
ステップS116において、制御部120は、十分な音量の音声が取得できていないので、Bマイク102bに口を近づけるようにユーザに警告する。その後、処理はステップS112に移行する。なお、図5(b)に近い把持のされ方では、ユーザは、表示部106の表示を見ることができる。したがって、制御部120は、表示部106によって警告を行う。勿論、ステップS116においてLED108を点滅させたり、振動部110を振動させたりして警告が行われるように構成されていてもよい。
ステップS117において、制御部120は、Bマイク102bを介して取得される音量を示すレベル表示を表示部106に対して行う。図6(a)はレベル表示の例を示している。
ステップS118において、制御部120は、把持判定部104における判定結果から、Aマイク102aを介して取得される音声信号とBマイク102bを介して取得される音声信号との間の位相差が(式2)に示す関係を満足しているか否かを判定する。なお、厳密に(式2)の関係を満たしていなくてもよい。すなわち、多少の誤差は許容される。ステップS118において位相差が(式2)に示す関係を満足していると判定された場合には、処理はステップS119に移行する。ステップS118において位相差が(式2)に示す関係を満足していないと判定された場合には、処理はステップS112に移行する。
ステップS119において、制御部120は、図5(b)のような把持のされ方で音声入力装置100が把持されていないことを警告する。その後、処理はステップS112に移行する。ステップS119においても制御部120は、表示部106によって警告を行う。図6(b)は警告表示の例を示している。図6(b)は、ユーザの口元Mと音声入力装置100との距離が近すぎる場合の警告表示の例である。このとき、ユーザの口元Mと音声入力装置100との距離が近すぎるので、音声入力装置100とユーザの口元Mとの距離を離すように促す警告が行われる。なお、ステップS119においてLED108を点滅させたり、振動部110を振動させたりして警告が行われるように構成されていてもよい。
ステップS120において、制御部120は、通話を開始するか否かを判定する。ステップS120においては、着信応答がされたか又は発信操作がされたか通話を開始すると判定される。ステップS120において通話を開始すると判定された場合には、処理はステップS121に移行する。ステップS120において通話を開始しないと判定された場合には、処理はステップS129に移行する。
ステップS121において、制御部120は、Aマイク102a及びBマイク102bを介して音声信号を取得する。ステップS122において、制御部120は、Aマイク102a及びBマイク102bを介して取得された音声信号を把持判定部104に入力する。これを受けて把持判定部104は、音声入力装置100の把持のされ方を判定するために、Aマイク102aから取得される音声信号とBマイク102bから取得される音声信号のそれぞれのノイズを除去する。なお、通話の場合はユーザによってBマイク102bが利用されるものとする。したがって、録音時のような把持のされ方の判定は省略される。
ステップS123において、把持判定部104は、ノイズ除去された音声信号の音圧の大きさ、すなわち音量が規定値を超えているか否かを判定する。ステップS123において、音量が規定値を超えていないと判定された場合には、処理はステップS124に移行する。音量が規定値を超えていると判定された場合には、処理はステップS125に移行する。
ステップS124において、制御部120は、ステップS116において、制御部120は、十分な音量の音声が取得できていないので、Bマイク102bに口を近づけるようにユーザに警告する。その後、処理はステップS128に移行する。なお、図5(b)に近い把持のされ方では、ユーザは、表示部106の表示を見ることができる。したがって、制御部120は、表示部106によって警告を行う。勿論、ステップS116においてLED108を点滅させたり、振動部110を振動させたりして警告が行われるように構成されていてもよい。
ステップS125において、制御部120は、通話用の各種の表示を表示部106に対して行う。
ステップS126において、制御部120は、把持判定部104における判定結果から、Aマイク102aを介して取得される音声信号とBマイク102bを介して取得される音声信号との間の位相差が(式2)に示す関係を満足しているか否かを判定する。なお、厳密に(式2)の関係を満たしていなくてもよい。すなわち、多少の誤差は許容される。ステップS126において位相差が(式2)に示す関係を満足していると判定された場合には、処理はステップS127に移行する。ステップS126において位相差が(式2)に示す関係を満足していないと判定された場合には、処理はステップS128に移行する。
ステップS127において、制御部120は、図5(b)のような把持のされ方で音声入力装置100が把持されていないことを警告する。その後、処理はステップS128に移行する。ステップS127においても制御部120は、表示部106によって警告を行う。勿論、LED108を点滅させたり、振動部110を振動させたりして警告が行われるように構成されていてもよい。
ステップS128において、制御部120は、通話を終了するか否かを判定する。ステップS128においては、ユーザ自身又は通話の相手によって通話終了指示がされたと判定された場合に、通話を終了すると判定される。ステップS128において通話を終了すると判定された場合には、処理はステップS101に戻る。ステップS128において録音を終了しないと判定された場合には、処理はステップS121に戻る。
ステップS129において、制御部120は、録音又は通話以外のその他の処理を行う。その他の処理の終了後、処理はステップS101に戻る。
以上説明したように本実施形態によれば、それぞれが異なる方向の指向性を有する複数のマイクを備えた音声入力装置100の把持のされ方が適正でない場合に警告が行われる。これにより、Aマイク102a又はBマイク102bのうちで現在使用中であると推定されるほうのマイクに効率よく音声を入射させることが可能である。
また、本実施形態によれば、Aマイク102aとBマイク102bとで取得される音量の差により、Aマイク102aが利用されているのか又はBマイク102bが利用されているのかが判定される。このように、何れのマイクが使用中であるかを判定することにより、より適切な把持のされ方の判定が行われる。
[変形例]
以下、本実施形態の変形例を説明する。前述した実施形態では、Aマイク102a及びBマイク102bからそれぞれ取得される音声信号の位相差によって把持のされ方が適正であるか否かが判定される。把持のされ方の判定の別の手法として、図7で示した手法がある。図7の別の手法では、音声入力装置100に音源122が設けられている。音源122の種類は特に限定されない。
図7のような構成において、音源122からユーザに向けて音波が射出される。この音波のユーザからの反射音波は、Aマイク102a及びBマイク102bのそれぞれで取得される。
実際には、例えば、図5(a)で示すような把持のされ方がされている場合、Aマイク102aでは、ユーザからの反射音波に基づく音声信号SUは殆ど取得されず、図8(a)の実線で示す音源122自体の振動に基づく音声信号が取得される。一方、Bマイク102bでは、図8(b)の実線で示す音源122自体の振動に基づく音声信号SUが取得されるのに加え、図8(b)の破線で示すユーザからの反射音波に基づく音声信号SRも取得される。音声信号SRは、音声信号SUに対して遅れ位相になる。すなわち、Bマイク102bにおいて音声信号SRが取得される時間と音声信号SUが取得される時間とは異なる。したがって、この時間差が適切な値であるか否かを判定することにより、前述した実施形態と同様に音声入力装置100が適切に把持されているか否かを判定することが可能である。なお、図7は、図5(a)で示すような把持のされ方がされている場合の例である。しかしながら、図5(b)で示すような把持のされ方がされている場合であっても同様の考え方で判定が行われ得る。
また、図7の例では、音源122から音波が射出される。この音波の射出タイミングは、Aマイク102aで取得される音声の音量がないときであることが望ましい。このように音波の射出のタイミングを制御することにより、録音中に不要な音が混入してしまうことを防止できる。
また、把持のされ方の判定は、必ずしも音声信号に基づいて行われなくてもよい。例えば、把持判定部104に加速度センサ等の姿勢センサを設けるようにすることができる。この場合、姿勢センサの出力から音声入力装置100の把持のされ方は判定され得る。音声入力装置100の姿勢も併せて判定をすることにより、音声入力装置100が適切な角度で把持されているか、適切な角度にするためにユーザが音声入力装置100をどの程度傾ければよいかといった情報も取得できる。タッチパネル情報を利用してもよいこともすでに記載したとおりである。
この他に、タッチパネル116の出力からも把持のされ方は判定され得る。例えば図5(a)と図5(b)では、図5(a)ではタッチパネル116の押圧が検出され、図5(b)では検出されない。このようなタッチパネル116の出力差から把持のされ方は判定され得る。このように、本実施形態及び変形例の技術では、音声入力装置100の把持のされ方の判定手法は特定の手法に限定されない。
以上実施形態に基づいて本発明を説明したが、本発明は上述した実施形態に限定されるものではなく、本発明の要旨の範囲内で種々の変形や応用が可能なことは勿論である。また、前述の各動作フローチャートの説明において、便宜上「まず」、「次に」等を用いて動作を説明しているが、この順で動作を実施することが必須であることを意味するものではない。
また、前述した実施形態による各処理は、コンピュータとしてのCPU等に実行させることができるプログラムとして記憶させておくこともできる。この他、メモリカード、磁気ディスク、光ディスク、半導体メモリ等の外部記憶装置の記憶媒体に格納して配布することができる。そして、CPU等は、この外部記憶装置の記憶媒体に記憶されたプログラムを読み込み、この読み込んだプログラムによって動作が制御されることにより、前述した処理を実行することができる。
さらに、上記した実施形態には種々の段階の発明が含まれており、開示される複数の構成要件の適当な組合せにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件からいくつかの構成要件が削除されても、上述したような課題を解決でき、上述したような効果が得られる場合には、この構成要件が削除された構成も発明として抽出され得る。
100 音声入力装置、102a Aマイクロホン(マイク)、102b Bマイクロホン(マイク)、104 把持判定部、106 表示部、110 振動部、112 記録部、114 スピーカ、116 タッチパネル、118 通信部、120 制御部、120a 音声記録制御部、120b 音声再生制御部、120c 表示制御部、120d 警告制御部、122 音源

Claims (7)

  1. 指向性の方向の異なる複数のマイクロホンを備えた音声入力装置であって、
    前記音声入力装置のユーザによる把持のされ方を判定する把持判定部と、
    前記把持判定部によって判定された把持のされ方が適切でない場合に、前記ユーザに対して警告をする警告制御部と、
    を具備し、
    前記把持判定部は、前記複数のマイクロホンのそれぞれで取得される音声信号の間の位相差に基づいて前記把持のされ方を判定する音声入力装置。
  2. 前記警告制御部は、前記ユーザから発せられて前記複数のマイクロホンのそれぞれで取得される音声の音量の最も大きなマイクロホンを基準として前記把持のされ方が適切であるか否かを判定する請求項1に記載の音声入力装置。
  3. 前記把持判定部は、前記複数のマイクロホンのそれぞれで取得される音声信号のノイズを除去してから前記把持のされ方を判定する請求項に記載の音声入力装置。
  4. 前記音声入力装置の姿勢を検出する姿勢センサをさらに具備し、
    前記把持判定部は、さらに前記姿勢センサの出力に基づいて前記把持のされ方を判定する請求項に記載の音声入力装置。
  5. 前記複数のマイクロホンは、前記音声入力装置の本体の異なる面内に設けられている請求項1乃至の何れか1項に記載の音声入力装置。
  6. 指向性の方向の異なる複数のマイクロホンを備えた音声入力装置の制御方法であって、
    前記音声入力装置のユーザによる把持のされ方を判定することと、
    前記把持のされ方が適切でない場合に、前記ユーザに対して警告をすることと、
    を具備し、
    前記把持のされ方を判定することは、前記複数のマイクロホンのそれぞれで取得される音声信号の間の位相差に基づいて前記把持のされ方を判定することを含む音声入力装置の制御方法。
  7. 指向性の方向の異なる複数のマイクロホンを備えた音声入力装置の制御プログラムであって、
    前記音声入力装置のユーザによる把持のされ方を判定することと、
    前記把持のされ方が適切でない場合に、前記ユーザに対して警告をすることと、
    をコンピュータに実行させ、
    前記把持のされ方を判定することは、前記複数のマイクロホンのそれぞれで取得される音声信号の間の位相差に基づいて前記把持のされ方を判定することを含む音声入力装置の制御プログラム。
JP2015087638A 2015-04-22 2015-04-22 音声入力装置並びに音声入力装置の制御方法及び制御プログラム Active JP6590511B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015087638A JP6590511B2 (ja) 2015-04-22 2015-04-22 音声入力装置並びに音声入力装置の制御方法及び制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015087638A JP6590511B2 (ja) 2015-04-22 2015-04-22 音声入力装置並びに音声入力装置の制御方法及び制御プログラム

Publications (2)

Publication Number Publication Date
JP2016208266A JP2016208266A (ja) 2016-12-08
JP6590511B2 true JP6590511B2 (ja) 2019-10-16

Family

ID=57489705

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015087638A Active JP6590511B2 (ja) 2015-04-22 2015-04-22 音声入力装置並びに音声入力装置の制御方法及び制御プログラム

Country Status (1)

Country Link
JP (1) JP6590511B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI128100B (en) * 2018-09-13 2019-09-30 Zoy Oy Jewelry

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9491404B2 (en) * 2011-10-27 2016-11-08 Polycom, Inc. Compensating for different audio clocks between devices using ultrasonic beacon
JP2014175932A (ja) * 2013-03-11 2014-09-22 Sharp Corp 電子機器

Also Published As

Publication number Publication date
JP2016208266A (ja) 2016-12-08

Similar Documents

Publication Publication Date Title
KR102481454B1 (ko) 방향성 인터페이스를 갖는 핸즈 프리 디바이스
KR102378762B1 (ko) 지향성의 사운드 변형
JP6129343B2 (ja) 録音装置、及び録音装置の制御方法
US9031256B2 (en) Systems, methods, apparatus, and computer-readable media for orientation-sensitive recording control
US10341499B2 (en) Communication terminal device, incoming call control method, and program
CN106489130A (zh) 用于使音频均衡以便在电子设备上播放的系统和方法
KR20180012055A (ko) 전자 장치 및 전자 장치의 동작 방법
US20140168176A1 (en) Multi-purpose stylus for a computing device
KR102608630B1 (ko) 바이노럴 오디오를 생성하는 헤드-웨어러블 장치
KR102115222B1 (ko) 사운드를 제어하는 전자 장치 및 그 동작 방법
JP2017509181A (ja) ジェスチャ相互作用式の装着可能な空間オーディオシステム
CN103631375B (zh) 根据电子设备中的情形感知控制振动强度的方法和设备
US9516429B2 (en) Hearing aid and method for controlling hearing aid
KR102478393B1 (ko) 노이즈가 정제된 음성 신호를 획득하는 방법 및 이를 수행하는 전자 장치
JP2015153325A (ja) 情報処理装置、操作支援方法及び操作支援プログラム
CN104052886A (zh) 一种信息处理方法及电子设备
US20220366926A1 (en) Dynamic beamforming to improve signal-to-noise ratio of signals captured using a head-wearable apparatus
JP6590511B2 (ja) 音声入力装置並びに音声入力装置の制御方法及び制御プログラム
US11462230B1 (en) System for filtering mechanical coupling from a microphone signal
WO2015131634A1 (zh) 声音降噪方法及终端
CN109360582B (zh) 音频处理方法、装置及存储介质
US20160227320A1 (en) Multi-channel microphone mapping
WO2018116678A1 (ja) 情報処理装置及びその制御方法
KR20200058354A (ko) 사운드를 제어하는 전자 장치 및 그 동작 방법
KR20200112791A (ko) 이어셋을 이용한 통역기능 제공 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180206

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190820

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190917

R151 Written notification of patent or utility model registration

Ref document number: 6590511

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250