WO2019181955A1

WO2019181955A1 - 音声／振動変換装置

Info

Publication number: WO2019181955A1
Application number: PCT/JP2019/011502
Authority: WO
Inventors: 史善吉岡; 哲三永久; 佐藤　克彦; 池谷　直泰; 柴田　晃秀; 岩田　浩
Original assignee: 日本電産株式会社
Priority date: 2018-03-23
Filing date: 2019-03-19
Publication date: 2019-09-26

Abstract

振動デバイスと、音声信号を取り込む音声取り込み部と、前記音声取り込み部に取り込まれた音声信号に基づいてスペクトル計算を行うスペクトル計算部と、前記スペクトル計算部による計算結果の少なくとも一部に基づいて触覚振動を構成する振動構成部と、前記振動構成部による振動構成結果に基づいて前記振動デバイスを駆動する振動デバイス駆動部と、を備え、前記スペクトル計算部は、複数の計算処理部を有し、前記計算処理部ごとに前記音声信号の音声取り込み時間は異なり、前記振動構成部は、前記音声取り込み時間の短い前記計算処理部ほど、スペクトル計算結果における高い周波数について前記触覚振動の構成を行う音声／振動変換装置。

Description

音声／振動変換装置

　本発明は、音声／振動変換装置に関する。

　従来、音声信号を振動に変換することでユーザにハプティック効果を与える装置が提案されており、当該装置の一例は特許文献１に開示される。

　特許文献１の装置では、メモリに取り込んだ音声データをＦＦＴ（高速フーリエ変換）処理によりスペクトル分解した後、高／中／低周波数信号に分解する。

日本国公開公報：特開２０１２－２７５０９号公報

　すなわち、特許文献１では、周波数帯域に依らず、スペクトル分解する際の音声データは高／中／低周波数で同じデータを用いる。

　ここで、ＦＦＴでは、スペクトル計算対象のデータの取得時間Ｄ[s]は、下記（１）式で表される。但し、ｆｓ[Hz]：サンプリング周波数、ＢＬ：サンプルサイズである。サンプルサイズＢＬは、データの個数であり、２のｎ乗の値をとる（１２８，２５６，５１２，１０２４，２０４８等）。
　Ｄ＝ＢＬ／ｆｓ　（１）

　また、ＦＦＴでは、上記取得時間Ｄの逆数として、下記（２）式に示す周波数分解能ｄｆ[Hz]が規定される。なお、周波数分解能は、その値が小さいほど分解能が高い。
　ｄｆ＝１／Ｄ＝ｆｓ／ＢＬ　（２）

　ＦＦＴでは、周波数分解能ｄｆ以上の周波数についてのスペクトル計算が可能である。
従って、上記特許文献１のように高／中／低周波数についてのスペクトル計算を行うには、ＦＦＴ条件を、高い周波数分解能が必要な低周波検出用に、高周波、中周波検出時も合わせる必要がある。例えば、低周波数が５０[Hz]とすると、周波数分解能ｄｆは５０[Hz]が必要となる。

　上記特許文献１では、周波数帯域に依らず、メモリへの音声データの取込み時間は、必要な周波数分解能ｄｆの逆数である取得時間Ｄとなる。上述のように周波数分解能ｄｆの値が小さいため、取得時間Ｄは長くなる。例えば、上述の周波数分解能ｄｆが５０[Hz]の場合、取得時間Ｄは１[s]／５０[Hz]＝２０[msec]となる。

　ここで、音声の発生するタイミングが本来、振動デバイスにより振動を発生させるべきタイミングであるが、実際には、音声の発生から振動の発生までに遅延が生じる。音声データの取込み時間は、上記遅延時間に影響する。すなわち、取込み時間が長くなると、遅延時間が長くなる。本願発明者が実験によって確認したところ、音声発生から振動発生までの許容される遅延時間は、音声の周波数が高くなるほど、短くなった。すなわち、許容される遅延時間は厳しい条件となった。従って、上記特許文献１では、取得時間Ｄが長くなり、高周波の音声に対して遅延時間が許容値を超え、触覚振動効果を感じたユーザに違和感を与える虞があった。

　上記実験において、例えば３０００[Hz]の音声に対しては、上記遅延時間が２０[msec]となると、ユーザにとって強い違和感が生じた。従って、上記のように取得時間Ｄ＝２０[msec]では、高周波の音声に対して遅延時間が許容値を超える虞がある。なお、上記実験の詳細については後述する。

　上記状況に鑑み、本発明は、ユーザに与える触覚振動効果の違和感を抑制することが可能となる音声／振動変換装置を提供することを目的とする。

　本発明の例示的な音声／振動変換装置は、振動デバイスと、音声信号を取り込む音声取り込み部と、前記音声取り込み部に取り込まれた音声信号に基づいてスペクトル計算を行うスペクトル計算部と、前記スペクトル計算部による計算結果の少なくとも一部に基づいて触覚振動を構成する振動構成部と、前記振動構成部による振動構成結果に基づいて前記振動デバイスを駆動する振動デバイス駆動部と、を備え、前記スペクトル計算部は、複数の計算処理部を有し、前記計算処理部ごとに前記音声信号の音声取り込み時間は異なり、前記振動構成部は、前記音声取り込み時間の短い前記計算処理部ほど、スペクトル計算結果における高い周波数について前記触覚振動の構成を行う。

　本発明の例示的な音声／振動変換装置によれば、ユーザに与える触覚振動効果の違和感を抑制することが可能となる。

図１は、音声機器と音声／振動変換装置を有するシステムの一実施形態を示す概略図である。図２は、音声／振動変換装置におけるマイコンの具体的構成例を示すブロック図である。図３Ａは、音声メモリ、ＦＦＴ計算部、および振動判定部の具体的構成の一実施形態を示すブロック図である。図３Ｂは、音声メモリ、ＦＦＴ計算部、および振動判定部の具体的構成の別実施形態を示すブロック図である。図４は、音声処理の流れの一例について示すフローチャートである。図５は、第１メモリ部に取り込まれる音声信号の一例を示すグラフである。図６Ａは、所定の取り込み区間で取り込んだ音声信号に対して第１ＦＦＴ処理部によりＦＦＴ処理を行った結果を示すグラフである。図６Ｂは、所定の取り込み区間で取り込んだ音声信号に対して第１ＦＦＴ処理部によりＦＦＴ処理を行った結果を示すグラフである。図６Ｃは、所定の取り込み区間で取り込んだ音声信号に対して第１ＦＦＴ処理部によりＦＦＴ処理を行った結果を示すグラフである。図７は、第３メモリ部に取り込まれる音声信号の一例を示すグラフである。図８は、所定の取り込み区間で取り込んだ音声信号に対して第３ＦＦＴ処理部によりＦＦＴ処理を行った結果を示すグラフである。図９は、音声が発生してから振動デバイスにより振動が発生するまでの遅延の音声周波数への依存性に関する実験の結果を示す表である。図１０は、音声機器と音声／振動変換装置からなる一変形例に係るシステムを示す概略図である。図１１は、一変形例に係る音声機器を示す概略図である。

　以下に本発明の例示的な実施形態について図面を参照して説明する。

＜システムの概要＞
　図１は、音声機器と音声／振動変換装置を有するシステムの一実施形態を示す概略図である。図１に示すスマートフォン１０は、音声機器の一例である。但し、音声機器は、スマートフォンに限らず、タブレットコンピュータ、ＰＣ（パーソナルコンピュータ）等、各種を採用できる。

　音声／振動変換装置２０は、スマートフォン１０から入力されたアナログ音声信号ＡＳを触覚振動に変換する装置であり、スマートフォン１０に対して外付けとなる。音声／振動変換装置２０は、スマートフォン１０のイヤホンジャック１０１と接続され、イヤホンジャック１０１から出力されるアナログ音声信号ＡＳを取り込む。

　図１では、音声／振動変換装置２０の筐体にイヤホンジャック１０１に着脱可能な端子２０１が設けられる。端子２０１とイヤホンジャック１０１は直接接続してもよいし、ケーブルを介して接続してもよい。端子２０１を介してアナログ音声信号ＡＳが後述のマイコン１に入力される。

　なお、音声／振動変換装置２０の筐体から外部へ引き出されたケーブルの先端にイヤホンジャック１０１に着脱可能な端子が設けられてもよい。

　イヤホンジャック１０１から出力されるアナログ音声信号ＡＳは、例えば、スマートフォン１０で実行されるゲームの音声である。この場合、音声には、ゲーム中の効果音およびＢＧＭ（バックグラウンドミュージック）等が含まれる。これにより、例えば、ユーザは、スマートフォン１０のスピーカーからゲームの音声を聴きつつ、音声／振動変換装置２０によって音声に応じた触覚振動を感じることができる。

　なお、音声／振動変換装置２０に操作部を設ける場合は、音声／振動変換装置２０からスマートフォン１０へ操作信号を送り、音声／振動変換装置２０によってゲームを操作することも可能である。これにより、ユーザは、音声／振動変換装置２０を手で把持しつつ、ゲームを操作し、触覚振動を感じることができる。

　音声／振動変換装置２０は、マイコン１と、振動デバイス駆動部２と、振動デバイス３と、を有する。マイコン１は、入力されるアナログ音声信号ＡＳを取り込み、取り込んだ音声信号に基づいてスペクトル計算を行い、スペクトル計算結果に基づいて振動情報ＶＩを生成して振動デバイス駆動部２に出力する。マイコン１は、振動情報ＶＩを生成することで触覚振動を構成する。

　振動デバイス駆動部２は、振動情報ＶＩに基づいて駆動信号Ｄｒを生成して振動デバイス３に出力する。振動デバイス３は、駆動信号Ｄｒに基づいて振動を生成する。

＜音声／振動変換装置の内部構成＞
　図２は、音声／振動変換装置２０におけるマイコン１の具体的構成例を示すブロック図である。マイコン１は、音声取り込み部１１と、ＦＦＴ計算部１２と、振動構成部１３と、を有する。なお、音声取り込み部１１、ＦＦＴ計算部１２、および振動構成部１３は、一つのマイコンに含まれる形態に限らず、それぞれ別個のハードウェアによって構成されてもよい。

　音声取り込み部１１は、Ａ／Ｄ変換部１１１と、音声メモリ１１２と、を有する。Ａ／Ｄ変換部１１１は、端子２０１を介して入力されたアナログ音声信号ＡＳをＡ／Ｄ変換してデジタル音声信号ＤＳを生成する。音声メモリ１１２は、Ａ／Ｄ変換部１１１による変換後のデジタル音声信号ＤＳを格納する。すなわち、音声取り込み部１１は、アナログ音声信号ＡＳをデジタル信号として音声メモリ１１２に取り込む。

　ＦＦＴ計算部１２は、音声メモリ１１２に格納されたデジタル音声信号ＤＳに対してＦＦＴ処理を行ってスペクトル計算を行う。これにより、音声の周波数ごとのスペクトルを取得できる。なお、スペクトル計算には、ＦＦＴ以外のアルゴリズムを用いることも可能である。

　振動構成部１３は、振動判定部１３１と、振動情報出力部１３２と、を有する。振動判定部１３１は、ＦＦＴ計算部１２による計算結果に基づいて振動を構成するか否かを判定する。振動情報出力部１３２は、振動判定部１３１による判定結果に基づいて振動情報ＶＩを振動デバイス駆動部２に出力する。

　振動デバイス駆動部２は、不図示のゲートドライバを有し、振動情報ＶＩに基づいてゲートドライバを動作させることで、振動情報ＶＩを増幅した信号である駆動信号Ｄｒを生成する。

　振動デバイス３は、例えば、ＬＲＡ（Linear Resonant Actuator）により構成される。
ＬＲＡには、縦リニア型アクチュエータと横リニア型アクチュエータが含まれる。縦リニア型アクチュエータでは、コイルが実装された基板の実装面に対して垂直な方向に振動体が振動する。横リニア型アクチュエータでは、コイルが実装された基板の実装面に対して平行な方向に振動体が振動する。なお、振動デバイス３は、他にも例えば、偏心型の振動アクチュエータにより構成してもよい。

　なお、振動デバイス駆動部２は必須ではなく、振動情報出力部１３２からの出力を直接、振動デバイス３へ入力させてもよい。この場合、振動構成部１３は、触覚振動を構成するとともに、振動デバイス３を駆動する振動デバイス駆動部としても機能する。

　図３Ａは、音声メモリ１１２、ＦＦＴ計算部１２、および振動判定部１３１の具体的構成の一実施形態を示すブロック図である。図３Ａの例では、音声メモリ１１２は、第１メモリ部１１２Ａと、第２メモリ部１１２Ｂと、第３メモリ部１１２Ｃを有する。第１メモリ部１１２Ａ、第２メモリ部１１２Ｂ、および第３メモリ部１１２Ｃには、それぞれＡ／Ｄ変換部１１１から出力される同一のデジタル音声信号ＤＳが格納される。すなわち、時間軸に沿って同一に変化する波形を有するデジタル音声信号ＤＳが格納される。

　ＦＦＴ計算部１２は、第１ＦＦＴ処理部１２Ａと、第２ＦＦＴ処理部１２Ｂと、第３ＦＦＴ処理部１２Ｃと、を有する。第１ＦＦＴ処理部１２Ａは、第１メモリ部１１２Ａに格納されたデジタル音声信号ＤＳに対してＦＦＴ処理を行うことでスペクトルを計算する。
第２ＦＦＴ処理部１２Ｂは、第２メモリ部１１２Ｂに格納されたデジタル音声信号ＤＳに対してＦＦＴ処理を行うことでスペクトルを計算する。第３ＦＦＴ処理部１２Ｃは、第３メモリ部１１２Ｃに格納されたデジタル音声信号ＤＳに対してＦＦＴ処理を行うことでスペクトルを計算する。

　振動判定部１３１は、高周波信号用判定部１３１Ａと、中周波信号用判定部１３１Ｂと、低周波信号用判定部１３１Ｃと、を有する。高周波信号用判定部１３１Ａは、第１ＦＦＴ処理部１２Ａにより算出された高周波帯域のスペクトルが所定の第１閾値を超えている
か否かを判定する。第１閾値を超えている場合、振動を構成すると判定し、そうでない場合は、振動を構成しないと判定する。中周波信号用判定部１３１Ｂは、第２ＦＦＴ処理部１２Ｂにより算出された中周波帯域のスペクトルが所定の第２閾値を超えているか否かを判定する。第２閾値を超えている場合、振動を構成すると判定し、そうでない場合は、振動を構成しないと判定する。低周波信号用判定部１３１Ｃは、第３ＦＦＴ処理部１２Ｃにより算出された低周波帯域のスペクトルが所定の第３閾値を超えているか否かを判定する。第３閾値を超えている場合、振動を構成すると判定し、そうでない場合は、振動を構成
しないと判定する。

　高周波信号用判定部１３１Ａ、中周波信号用判定部１３１Ｂ、および低周波信号用判定部１３１Ｃは、例えば、それぞれ振動を構成すると判定した場合、判定した周波数帯域の信号を振動情報出力部１３２に送る。振動情報出力部１３２は、送られた信号の周波数を所定倍率で低下させて、低下させた後の周波数の信号を振動情報ＶＩとして振動デバイス駆動部２に出力する。これにより、振動デバイス３は、振動構成結果に応じて、高／中／低周波で振動を生成する。

　これにより、例えば、ゲームにおける金属同士が衝突した際に発生する高い周波数の音が発生したときは、高周波信号用判定部１３１Ａによって高周波音声用の振動を構成すると判定され、振動デバイス３により高周波の振動が発生する。また、例えば、ドラム音の低音が発生したときは、低周波信号用判定部１３１Ｃによって低周波音声用の振動を構成すると判定され、振動デバイス３により低周波の振動が発生する。これにより、ユーザは、ゲーム等で発生する音声の周波数に応じた触覚振動を感じることができ、ゲーム等の臨場感を向上させることができる。

　なお、振動情報出力部１３２は、例えば他にも、予め振動デバイス駆動部２へ出力する各種周波数の振動信号が格納され、振動判定部１３１から送られる判定結果に応じて上記振動信号を選択して振動情報ＶＩとして振動デバイス駆動部２に出力してもよい。

　また、振動判定部１３１において判定に用いる上記第１～第３閾値は、同じ値であっても、異なる値であってもよい。

＜音声処理＞
　次に、本実施形態における音声処理のより詳細について説明する。図４は、本実施形態における音声処理の流れの一例について示すフローチャートである。

　まず、図４のステップＳ１において、第１メモリ部１１２Ａ、第２メモリ部１１２Ｂ、および第３メモリ部１１２Ｃのそれぞれに同一のデジタル音声信号ＤＳが格納される。すなわち、デジタル音声信号ＤＳが音声メモリ１１２に取り込まれる。

　ステップＳ２１で、第１ＦＦＴ処理部１２Ａは、４８[kHz]のサンプリング周波数でデータ数が２５６個のデジタル音声信号ＤＳが第１メモリ部１１２Ａに取り込まれたタイミングで、取り込まれたデジタル音声信号ＤＳに対してＦＦＴ処理を行う。すなわち、１／４８[kHz]×２５６＝５．３[msec]の音声取り込み時間で高周波信号用ＦＦＴ処理が行われる。なお、この場合、上記（１）式におけるサンプルサイズＢＬの値が２５６となり、取得時間Ｄ＝５．３[msec]となる。

　図５は、第１メモリ部１１２Ａに取り込まれる音声信号の一例を示すグラフである。図５において、横軸は時間ｔを示し、５．３[msec]の音声取り込み時間の一単位に相当する取り込み期間Ｗｈを枠として示す。

　図６Ａ～図６Ｃは、それぞれ、図５に示す取り込み区間Ｔ１～Ｔ３で取り込んだ音声信号に対して第１ＦＦＴ処理部１２ＡによりＦＦＴ処理を行った結果を示す。図６Ａ～図６Ｃは、周波数に対するスペクトルを示す。図６Ａ～図６Ｃに示すように、上記（２）式による周波数分解能ｄｆ＝４８[kHz]／２５６＝１８７．５[Hz]以上の周波数でスペクトル計算が行える。高周波帯域を例えば１０００～１００００[Hz]とすれば、当該高周波帯域でのスペクトル計算が行える。なお、上記高周波帯域の最低周波数１０００[Hz]は周期１[msec]に相当し、音声取り込み時間５．３[msec]は、周期１[msec]以上となる。

　図６Ａおよび図６Ｃでは、第１閾値ＴＨ１を－２０[dB]とした場合、高周波帯域１０００～１００００[Hz]において、スペクトルのピークが第１閾値ＴＨ１以上となるので、ステップＳ３において、高周波信号用判定部１３１Ａは、振動を構成すると判定する。これにより、振動デバイス３は、駆動されて、高周波音声に適した触覚振動を発生させる。一方、図６Ｂでは、高周波帯域１０００～１００００[Hz]において、スペクトルのピークは第１閾値ＴＨ１以上とならないので、振動は構成されない。

　また、図４においてステップＳ２２で、第２ＦＦＴ処理部１２Ｂは、４８[kHz]のサンプリング周波数でデータ数が５１２個のデジタル音声信号ＤＳが第２メモリ部１１２Ｂに取り込まれたタイミングで、取り込まれたデジタル音声信号ＤＳに対してＦＦＴ処理を行う。すなわち、１／４８[kHz]×５１２＝１０．６[msec]の音声取り込み時間で中周波信号用ＦＦＴ処理が行われる。なお、この場合、上記（１）式におけるサンプルサイズＢＬの値が５１２となり、取得時間Ｄ＝１０．６[msec]となる。

　これにより、上記（２）式による周波数分解能ｄｆ＝４８[kHz]／５１２＝９３．７５[Hz]以上の周波数でスペクトル計算が行える。中周波帯域を例えば２００～１０００ [Hz]とすれば、当該中周波帯域でのスペクトル計算が行える。なお、上記中周波帯域の最低周波数２００[Hz]は周期５[msec]に相当し、音声取り込み時間１０．６[msec]は、周期５[msec]以上となる。

　そして、ステップＳ３において、中周波信号用判定部１３１Ｂは、第２ＦＦＴ処理部１２Ｂにより計算されたスペクトルのうち中周波帯域において、ピークが第２閾値以上となるか否かに応じて振動を構成するか否かを判定する。振動を構成すると判定された場合は、振動デバイス３は、駆動されて、中周波音声に適した触覚振動を発生させる。

　また、ステップＳ２３で、第３ＦＦＴ処理部１２Ｃは、４８[kHz]のサンプリング周波数でデータ数が１０２４個のデジタル音声信号ＤＳが第３メモリ部１１２Ｃに取り込まれたタイミングで、取り込まれたデジタル音声信号ＤＳに対してＦＦＴ処理を行う。すなわち、１／４８[kHz]×１０２４＝２１．３[msec]の音声取り込み時間で低周波信号用ＦＦＴ処理が行われる。なお、この場合、上記（１）式におけるサンプルサイズＢＬの値が１０２４となり、取得時間Ｄ＝２１．３[msec]となる。

　図７は、第３メモリ部１１２Ｃに取り込まれる音声信号の一例を示すグラフである。図７において、横軸は時間ｔを示し、２１．３[msec]の音声取り込み時間の一単位に相当する取り込み期間Ｗｌを枠として示す。

　図８は、図７に示す取り込み区間Ｔ１１で取り込んだ音声信号に対して第３ＦＦＴ処理部１２ＣによりＦＦＴ処理を行った結果を示す。図８は、周波数に対するスペクトルを示す。図８に示すように、上記（２）式による周波数分解能ｄｆ＝４８[kHz]／１０２４＝４６．８７５[Hz]以上の周波数でスペクトル計算が行える。低周波帯域を例えば５０～２００[Hz]とすれば、当該低周波帯域でのスペクトル計算が行える。なお、上記低周波帯域の最低周波数５０[Hz]は周期２０[msec]に相当し、音声取り込み時間２１．３[msec]は、周期２０[msec]以上となる。

　図８では、第３閾値ＴＨ３を－２０[dB]とした場合、低周波帯域５０～２００[Hz]において、スペクトルのピークが第３閾値ＴＨ３以上となるので、ステップＳ３において、低周波信号用判定部１３１Ｃは、振動を構成すると判定する。これにより、振動デバイス３は、駆動されて、低周波音声に適した触覚振動を発生させる。

　このように、本実施形態では、５．３[msec]ごとに高周波信号用ＦＦＴ処理が行われ、１０．６[msec]ごとに中周波信号用ＦＦＴ処理が行われ、２１．３[msec]ごとに低周波信号用ＦＦＴ処理が行われる。従って、同一のデジタル音声信号ＤＳに対して、低周波信号用ＦＦＴを１回行う間に、高周波信号用ＦＦＴ処理は４回、中周波信号用ＦＦＴ処理は２回行われる。

　これにより、より確実に音声の周波数成分を検出し、触覚振動効果を生成することができる。例えば、上記音声取り込み時間で異なる周波数のＦＦＴ処理を時系列順に行ってもよいが、この場合、音声の周波数成分検出の確実性が低くなる虞がある。例えば、高周波音声が発生した場合に、そのタイミングではたまたま低周波信号用ＦＦＴ処理が行われた場合、高周波音声を検出できないことが生じうる。これに対して上記実施形態であれば、高周波音声を検出できる。

＜振動の遅延＞
　ここで、本願発明者は、音声が発生してから振動デバイスにより振動が発生するまでの遅延の音声周波数への依存性について次のような実験を行った。

　音声ファイル（ＷＡＶファイル）のＬ（左）チャンネルに振動信号を記録し、Ｒ（右）チャンネルに音声信号を記録した。振動信号は、振動デバイスの共振周波数である１５０[Hz]の固定周波数とした。音声信号は、１５０，８００，３０００，８０００[Hz]の各データを用意した。また、Ｌチャンネルの振動信号は、Ｒチャンネルの音声信号に比べて０～６０[msec]だけ遅延させた。

　そして、被験者に、Ｒチャンネルの音声信号による音声をスピーカーで聞きつつ、Ｌチャンネルにアンプ増幅接続した振動デバイスの振動を手で感じさせた。被験者には、音声が鳴った後、振動発生までに遅れを感じたかを判断させた。

　図９は、上記実験の結果を示す。図９では、音声信号周波数Ｆと振動信号の遅延時間ＤＬとの組み合わせについて、遅れを感じなかった場合を○、若干遅れを感じた場合を△、遅れを感じた場合を×で示す。

　図９に示すように、遅延時間の許容値は、１５０[Hz]では２５[msec]、８００[Hz]では１５[msec]、３０００[Hz]では１０ [msec]、８０００[Hz]では１０[msec]となった。すなわち、音声信号が高周波となるほど、遅延時間の許容値は小さくなり、遅延を感じやすくなり、遅延に対する条件が厳しい結果となった。

　上述したように本実施形態においては、高周波用、中周波用、低周波用で音声取り込み時間を５．３[msec]、１０．６[msec]、２１．３[msec]と変化させている。音声取り込み時間は、遅延時間に影響する。本実施形態では、図９に示した周波数と遅延時間の許容値との関係に基づき、遅延時間が許容値以下となる音声取り仕込み時間を定める。すなわち、高周波になるほど遅延時間の許容値が小さくなるので、音声取り込み時間も短くする。
このとき、例えば、図９に示す周波数と遅延時間の許容値とのデータに対する近似曲線を考慮する。

　これにより、音声周波数に依らず、振動の遅延による違和感を抑制することができる。特に、遅延を感じやすい高周波音声に対しては、音声取り込み時間を短くすることで遅延時間を短くし、遅延による違和感を抑制することができる。

　このように、本実施形態の音声／振動変換装置２０は、振動デバイス３と、音声信号を取り込む音声取り込み部１１と、音声取り込み部１１に取り込まれた音声信号に基づいてスペクトル計算を行うスペクトル計算部１２と、スペクトル計算部１２による計算結果の少なくとも一部に基づいて触覚振動を構成する振動構成部１３と、振動構成部１３による振動構成結果に基づいて振動デバイス３を駆動する振動デバイス駆動部２と、を備える。
スペクトル計算部１２は、複数の計算処理部１２Ａ～１２Ｃを有し、計算処理部１２Ａ～１２Ｃごとに前記音声信号の音声取り込み時間は異なり、振動構成部１３は、前記音声取り込み時間の短い計算処理部ほど、スペクトル計算結果における高い周波数について前記触覚振動の構成を行う。

　これにより、高い周波数の音声に対しては、短い音声取り込み時間によるスペクトル計算結果に基づき触覚振動構成が行われる。これにより、音声が発生してから振動デバイスを駆動させるまでの時間を短くする。これにより、振動デバイスを駆動するまでの遅延時間の許容時間が短い高い周波数の音声に対して、ユーザは違和感を抑えた触覚振動効果を感じることが可能となる。

　また、スペクトル計算部１２は、データ取り込み数に基づいて前記音声取り込み時間を判断する。

　これにより、所望の音声取り込み時間が経過したことを容易に判断できる。

　また、前記音声取り込み時間は、対応する周波数の１周期以上である。

　これにより、対象となる周波数のスペクトル計算をより確実に行うことができる。

　また、前記音声取り込み時間は、音声周波数Ｆ[Hz]と音声発生から振動発生までの遅延時間の許容値ＤＴ[msec]との下記対応関係に基づく。
　Ｆ[Hz]　　ＤＴ[msec]
　１５０　　２５
　８００　　１５
　３０００　１０
　８０００　１０

　これにより、遅延時間によるユーザの違和感をより抑制することが可能となる。

　また、複数の計算処理部１２Ａ～１２Ｃは、共通の音声信号に対してスペクトル計算を行う。

　これにより、より確実に音声の周波数成分を検出し、触覚振動効果を与えることができる。

　また、計算処理部１２Ａ～１２Ｃは、それぞれ高／中／低周波信号用のスペクトル計算を行う。

　これにより、より多くの周波数の音声に応じて触覚振動効果を与えることができる。

　また、高／中／低周波信号用の前記音声取り込み時間は、音声取り込み部１１にデジタル音声信号がそれぞれ２５６個、５１２個、１０２４個取り込まれる時間である。

　これにより、スペクトル計算にＦＦＴ（高速フーリエ変換）を用いることができる。

　また、振動構成部１３は、スペクトル計算により得られたスペクトルで各周波数部分に一定以上のピークが存在するか否かによって振動を構成するか否かを判定する振動判定部１３１を有する。

　これにより、簡易な制御によって各周波数の音声が発生したことを検出できる。

＜音声メモリの変形例＞
　図３Ｂは、音声メモリ１１２の構成に関する変形例を示すブロック図である。図３Ｂでは、図３Ａに比べて、音声メモリ１１２が一つのメモリ部１１２１によって構成されることが異なる。メモリ部１１２１には、一つのデジタル音声信号ＤＳが格納される。メモリ部１１２１に格納されたデジタル音声信号ＤＳは、ＦＦＴ計算部１２における各周波数のＦＦＴ処理部１２Ａ～１２ＣによるＦＦＴ処理に共通に使用される。

　先述したように、例えば、高周波用、中周波用、低周波用で音声取り込み時間を５．３[msec]、１０．６[msec]、２１．３[msec]とすれば、低周波用の音声取り込み時間が経過した段階で取り込んだ音声信号は不要となる。

　すなわち、音声取り込み部１１は、一つの音声信号を格納するメモリ部１１２１を有し、複数の計算処理部１２Ａ～１２Ｃは、メモリ部１１２１を共通に使用する。これにより、メモリ容量を削減し、コストの低減を図れる。

＜音声／振動変換装置の接続構成＞
　先述した図１に示す音声／振動変換装置２０は、スマートフォン１０のイヤホンジャック１０１と接続する構成であった。すなわち、音声／振動変換装置２０は、外部機器１０に対して着脱可能である端子２０１をさらに有し、外部機器１０から出力される音声信号ＡＳは、端子２０１を介して音声取り込み部１１に入力される。これにより、ユーザは、音声／振動変換装置を異なる外部機器に対して接続し、触覚振動効果を得ることができる。

　なお、音声／振動変換装置２０の接続構成については例えば下記のような変形例としてもよい。

　図１０は、音声機器と音声／振動変換装置からなる第１変形例に係るシステムを示す概略図である。図１０において、音声機器１０Ａは、内部構成１０Ａ１と、無線通信部１０Ａ２と、イヤホンジャック１０Ａ３と、を有する。内部構成１０Ａ１から出力されたアナログ音声信号ＡＳは、イヤホンジャック１０Ａ３への経路を介してイヤホンジャック１０Ａ３へ送られるとともに、イヤホンジャック１０Ａ３への経路から分岐した経路を介して無線通信部１０Ａ２にも送られる。無線通信部１０Ａ２は、送られたアナログ音声信号ＡＳを無線信号に変換し、音声／振動変換装置２０へ送る。この場合、音声／振動変換装置
２０においては、音声取り込み部は、受信した無線信号を音声信号に変換する無線通信部を有する。なお、無線通信部１０Ａ２は、例えば、Bluetooth（登録商標）の規格に準ずる。

　また、図１１は、第２変形例に係る音声機器１０Ｂを示す概略図である。本変形例では、音声／振動変換装置２０は、音声機器１０Ｂの内部に設けられる。図１１において、音声機器１０Ｂは、内部構成１０Ｂ１と、イヤホンジャック１０Ｂ２と、音声／振動変換装置２０と、を有する。内部構成１０Ｂ１から出力されたアナログ音声信号ＡＳは、イヤホンジャック１０Ｂ２への経路を介してイヤホンジャック１０Ｂ２へ送られるとともに、イヤホンジャック１０Ｂ２への経路から分岐した経路を介して音声／振動変換装置２０にも送られる。本変形例であれば、ユーザは、イヤホンジャック１０Ｂ２に接続されたイヤホンから音声を聴きつつ、音声／振動変換装置２０によって音声機器１０Ｂに与えられた触覚振動を感じることができる。

　すなわち、音声取り込み部に入力される音声信号は、イヤホンジャック１０Ａ３，１０Ｂ２への経路から分岐した経路のアナログ音声信号ＡＳである。これにより、容易に音声信号を取得することが可能となる。

＜その他＞
　以上、本発明の実施形態について説明したが、本発明の趣旨の範囲内であれば、実施形態は種々の変形が可能である。

　本発明は、例えば、ゲーム等の音声の触覚振動への変換に利用することができる。

　１・・・マイコン、２・・・振動デバイス駆動部、３・・・振動デバイス、１０・・・スマートフォン、１０１・・・イヤホンジャック、１１・・・音声取り込み部、１１１・・・Ａ／Ｄ変換部、１１２・・・音声メモリ、１１２Ａ・・・第１メモリ部、１１２Ｂ・・・第２メモリ部、１１２Ｃ・・・第３メモリ部、１１２１・・・メモリ部、１２・・・ＦＦＴ計算部、１２Ａ・・・第１ＦＦＴ処理部、１２Ｂ・・・第２ＦＦＴ処理部、１２Ｃ・・・第３ＦＦＴ処理部、１３・・・振動構成部、１３１・・・振動判定部、１３１Ａ・・・高周波信号用判定部、１３１Ｂ・・・中周波信号用判定部、１３１Ｃ・・・低周波信号用判定部、１３２・・・振動情報出力部、２０・・・音声／振動変換装置、２０１・・・端子、１０Ａ・・・音声機器、１０Ａ１・・・内部構成、１０Ａ２・・・無線通信部、１０Ａ３・・・イヤホンジャック、１０Ｂ・・・音声機器、１０Ｂ１・・・内部構成、１０Ｂ２・・・イヤホンジャック、ＡＳ・・・アナログ音声信号、ＤＳ・・・デジタル音声信号、ＶＩ・・・振動情報、Ｄｒ・・・駆動信号

Claims

　振動デバイスと、
　音声信号を取り込む音声取り込み部と、
　前記音声取り込み部に取り込まれた音声信号に基づいてスペクトル計算を行うスペクトル計算部と、
　前記スペクトル計算部による計算結果の少なくとも一部に基づいて触覚振動を構成する振動構成部と、
　前記振動構成部による振動構成結果に基づいて前記振動デバイスを駆動する振動デバイス駆動部と、
　を備え、
　前記スペクトル計算部は、複数の計算処理部を有し、
　前記計算処理部ごとに前記音声信号の音声取り込み時間は異なり、
　前記振動構成部は、前記音声取り込み時間の短い前記計算処理部ほど、スペクトル計算結果における高い周波数について前記触覚振動の構成を行う、
　音声／振動変換装置。
　前記スペクトル計算部は、データ取り込み数に基づいて前記音声取り込み時間を判断する、請求項１に記載の音声／振動変換装置。
　前記音声取り込み時間は、対応する周波数の１周期以上である、請求項１または請求項２に記載の音声／振動変換装置。
　前記音声取り込み時間は、音声周波数Ｆ[Hz]と音声発生から振動発生までの遅延時間の許容値ＤＴ[msec]との下記対応関係に基づく、請求項１から請求項３のいずれか１項に記載の音声／振動変換装置。
　Ｆ[Hz]　　ＤＴ[msec]
　１５０　　２５
　８００　　１５
　３０００　１０
　８０００　１０
　前記複数の計算処理部は、共通の音声信号に対してスペクトル計算を行う、請求項１から請求項４のいずれか１項に記載の音声／振動変換装置。
　前記音声取り込み部は、一つの音声信号を格納するメモリ部を有し、
　前記複数の計算処理部は、前記メモリ部を共通に使用する、請求項５に記載の音声／振動変換装置。
　前記計算処理部は、それぞれ高／中／低周波信号用のスペクトル計算を行う、請求項１から請求項６のいずれか１項に記載の音声／振動変換装置。
　高／中／低周波信号用の前記音声取り込み時間は、前記音声取り込み部にデジタル音声信号がそれぞれ２５６個、５１２個、１０２４個取り込まれる時間である、請求項７に記載の音声／振動変換装置。
　前記振動構成部は、スペクトル計算により得られたスペクトルで各周波数部分に一定以上のピークが存在するか否かによって振動を構成するか否かを判定する振動判定部を有する、請求項１から請求項８のいずれか１項に記載の音声／振動変換装置。
　外部機器に対して着脱可能である端子をさらに有し、
　前記外部機器から出力される音声信号は、前記端子を介して前記音声取り込み部に入力される、請求項１から請求項９のいずれか１項に記載の音声／振動変換装置。
　前記音声取り込み部に入力される音声信号は、イヤホンジャックへの経路から分岐した経路のアナログ音声信号である、請求項１から請求項１０のいずれか１項に記載の音声／振動変換装置。