WO2024090309A1

WO2024090309A1 - 音出力装置、音出力方法及びプログラム

Info

Publication number: WO2024090309A1
Application number: PCT/JP2023/037722
Authority: WO
Inventors: 正太郎長尾; 利知金岡; 絵里香山本
Original assignee: 京セラ株式会社
Priority date: 2022-10-27
Filing date: 2023-10-18
Publication date: 2024-05-02

Abstract

音出力装置は、外部音のデータを記憶する記憶部と、制御部とを備える。制御部は、外部音のデータを複数の音部分に分割し、複数の音部分の少なくとも一部をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生する。

Description

音出力装置、音出力方法及びプログラム

関連出願へのクロスリファレンス

　本出願は、２０２２年１０月２７日に日本国に特許出願された特願２０２２－１７２７３５の優先権を主張するものであり、この先の出願の開示全体をここに参照のために取り込む。

　本開示は、音出力装置、音出力方法及びプログラムに関する。

　録音した音を再生する技術が知られている。例えば、特許文献１には、運転者からの巻き戻し要求を受けて、音声を巻き戻す音声再生装置が開示されている。

特開２０１６－１１９１３３号公報

　本開示の一実施形態に係る音出力装置は、
　外部音のデータを記憶する記憶部と、
　前記外部音のデータを複数の音部分に分割し、前記複数の音部分の少なくとも一部をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生する制御部と、
　を備える。

　本開示の一実施形態に係る音出力方法は、
　外部音のデータを記憶することと、
　前記外部音のデータを複数の音部分に分割し、前記複数の音部分の少なくとも一部をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生することと、
　を含む。

　本開示の一実施形態に係るプログラムは、
　コンピュータに、
　外部音のデータを記憶することと、
　前記外部音のデータを複数の音部分に分割し、前記複数の音部分の少なくとも一部をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生することと、
　を含む動作を実行させる。

本開示の一実施形態に係る音出力装置の概略構成を示す図である。ユーザに対する音像位置の一例を示す図である。図１に示す音出力装置のブロック図である。本開示の一実施形態に係る音出力方法の手順例を示すフローチャートである。本開示の他の実施形態に係る音部分の再生を説明するための図である。本開示の他の実施形態に係る音部分の再生を説明するための図である。本開示の他の実施形態に係る音部分の再生を説明するための図である。本開示の他の実施形態に係る音部分の再生を説明するための図である。本開示の他の実施形態に係る音出力方法の手順例を示すフローチャートである。

　録音した音を再生する従来の技術には、改善の余地がある。例えば、ユーザ操作に応じて、再生する音が長すぎたり、短すぎたりしてしまう場合がある。本開示の一実施形態によれば、改善された、録音した音を再生する技術を提供することができる。

　以下、本開示に係る実施形態について、図面を参照して説明する。

　図１に示すような音出力装置１は、ヒアラブルデバイスである。本実施形態では、音出力装置１は、骨伝導イヤホンである。ただし、音出力装置１は、ヒアラブルデバイスであれば、骨伝導イヤホンに限定されない。他の例として、音出力装置１は、耳掛け型イヤホン、首掛け型スピーカ、インナーイヤー型イヤホン、カナル型イヤホン又はヘッドホンであってもよい。音出力装置１は、インナーイヤー型イヤホン又はヘッドホンである場合、外部音の取り込み機能を有してよい。外部音の取り込み機能は、音出力装置１の外部音を集音してユーザに出力する機能である。外部音とは、音出力装置１の外部で発せられる音である。一例として、外部音には、ユーザの周囲で発せられる音が含まれる。外部音には、ユーザ自身が発する音が含まれてよい。

　音出力装置１は、筐体１Ｌと、筐体１Ｒと、固定部材１Ｆとを含む。筐体１Ｌは、ユーザの左側のこめかみ部分に当てられる。筐体１Ｒは、ユーザの右側のこめかみ部分に当てられる。固定部材１Ｆは、筐体１Ｌ及び筐体１Ｒをそれぞれユーザの左側及び右側のこめかみ部分に固定する。固定部材１Ｆは、ユーザの左耳に掛けられる左用のイヤーフックと、ユーザの右耳に掛けられる右用のイヤーフックと、これらのイヤーフックを接続するバンドとを含む。固定部材１Ｆは、後述の通信部１３等を収容可能な筐体を含んでもよい。

　音出力装置１は、ユーザの頭部に装着される。ユーザは、音出力装置１を頭部に装着した状態で、外部音を聞くことができる。しかしながら、ユーザは、他の物事に注意を向けていると、必要な情報を含む外部音を聞き逃してしまうことがある。例えば、ユーザは、パソコンで書類作成をしていたり、本を読んでいたりすると、必要な情報を含む外部音を聞き逃してしまうことがある。このような場合でも、ユーザは、選択的注意によって、必要な情報を含む外部音を聞き逃したと感じることができる。選択的注意とは、例えば、多様な外部音が存在する環境下において、選択的に特定の情報に注意を向けることである。本実施形態では、ユーザは、必要な情報を含む外部音を聞き逃したと感じた場合、後述の第１入力によって音出力装置１に外部音を再生させることができる。音出力装置１に外部音を再生させることにより、ユーザは、必要な情報が外部音に含まれるか否かを確認することができる。

　例えば、ユーザが電車に乗っているものとする。さらに、電車内に、外部音である「乗り換えのご案内です。Ａ鉄道線、…Ｄ鉄道線、…Ｈ鉄道線は、お乗り換えください」とのアナウンス音が流れるものとする。また、「Ｄ鉄道線」の情報がユーザに必要な情報であるものとする。この場合、ユーザは、「Ｄ鉄道線」との外部音を聞き逃したと感じた場合、後述の第１入力によって音出力装置１にアナウンス音を再生させることができる。

　音出力装置１は、外部音を再生する際、外部音のデータを複数の音部分に分割し、複数の音部分をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部を重複させて再生する。音部分とは、所定の長さを有する外部音等の音を、所定の長さを有する複数の部分に分割した一部を意味する。分割後の複数の部分のそれぞれの長さは、同じであってもよいし、異なってもよい。例えば、図２に示すように、音出力装置１は、アナウンス音を音部分２ａ，２ｂ，２ｃ，２ｄ，２ｅに分割する。音部分２ａ～２ｅは、時間的に連続する。「時間的に連続する」とは、外部音において音部分が互いに隣り合っていることを意味する。「時間的に連続する」は、連続する音部分２ａ及び音部分２ｂのうち、音部分２ａの後尾部分と音部分２ｂの先頭部分が重複していることも含んでよい。音部分２ａは、アナウンス音の先頭部分を含む。音部分２ｅは、アナウンス音の後尾部分を含む。音部分２ａは、「乗り換えのご案内です。Ａ鉄道線」との音を含む。音部分２ｂは、「Ｂ鉄道線、Ｃ鉄道線」との音を含む。音部分２ｃは、「Ｄ鉄道線、Ｅ鉄道線」との音を含む。音部分２ｄは、「Ｆ鉄道線、Ｇ鉄道線」との音を含む。音部分２ｅは、「Ｈ鉄道線は、お乗り換えください」との音を含む。音出力装置１は、音部分２ａ，２ｂ，２ｃ，２ｄ，２ｅをそれぞれ異なる音像位置２Ａ，２Ｂ，２Ｃ，２Ｄ，２Ｅに定位させ、時間的に少なくとも一部重複させて再生する。「音部分を時間的に少なくとも一部重複させて再生する」とは、例えば、音部分２ａと音部分２ｂのそれぞれの少なくとも一部が同時に再生されることを意味する。例えば、音部分２ａの再生が終了する前に、音部分２ｂの再生を開始する場合を含む。複数の音部分を時間的に重複させて再生されることにより、ユーザは、「乗り換えのご案内です。Ａ鉄道線、Ｂ鉄道線…、Ｅ鉄道線は、お乗り換えください」とのアナウンス音の全てを連続して聞き返す場合よりも、短い時間でアナウンス音に「Ｄ鉄道線」の情報が含まれているか否かを確認することができる。

　音部分を定位させる音像位置は、マスキング効果を考慮して設定されてよい。マスキング効果とは、複数の音のうち、一部の音が他の音によって妨害されて聞こえなくなる現象である。マスキング効果において、複数の音のうち、妨害されて聞こえなくなる音は、「マスキー」と称される。また、複数の音のうち、妨害する音は、「マスカー」と称される。音像位置は、方向性マスキングを考慮して設定されてよい。方向性マスキングとは、マスキーとマスカーとが同じ方向からユーザに到来する場合では、マスキーとマスカーとが異なる方向からユーザに到来する場合よりも、マスキング量が大きくなる現象である。マスキング量とは、マスキング効果が発生するときのマスキーの聴覚閾値の上昇量である。本実施形態では、音出力装置１が複数の音部分をそれぞれ異なる音像位置に定位させて再生することにより、マスキング量を低減させることができる。つまり、図２では、ユーザは、音部分２ａ～２ｅをそれぞれ聞き分けることができる。

　音像位置の設定例として、図２に示すように、ユーザを中心としてユーザの左側から前方を経て右側に向けて４５度の間隔で音像位置２Ａ～２Ｅが設定されてよい。マスカーとマスキーの周波数が１［ｋＨｚ］である場合、マスカーがユーザに到来する方向とマスキーがユーザに到来する方向との差が４５度程度であると、マスキング量が－１８［ｄＢ］程度小さくなることが知られている。そのため、アナウンス音の周波数が１［ｋＨｚ］である場合は、図２に示すように４５度の間隔で音像位置２Ａ～２Ｅを設定することにより、マスキング量を－１８［ｄＢ］程度小さくすることができる。ただし、音像位置の設定例は、図２に示す構成に限定されない。他の例として、音像位置は、ユーザの後方に設定されてもよいし、ユーザの上方に設定されてもよいし、下方に設定されてもよい。また、複数の音像位置の間隔及び各音像位置とのユーザとの間の距離は、特定の値に限定されない。

　図３に示すように、音出力装置１は、電子機器３と通信可能であってよい。電子機器３は、音出力装置１を装着するユーザによって使用される。電子機器３は、例えば、スマートホンである。音出力装置１の各種設定又は操作が電子機器３によって可能であってよい。

　図３に示すように、音出力装置１は、スピーカ部１０と、マイク部１１と、入力部１２と、通信部１３と、記憶部１４と、制御部１５とを備える。通信部１３、記憶部１４及び制御部１５は、図１に示すような、筐体１Ｌ及び筐体１Ｒの何れかに収容されてもよいし、固定部材１Ｆに含まれる筐体に収容されてもよい。

　スピーカ部１０は、音を出力可能である。本実施形態では、スピーカ部１０は、左用の骨伝導スピーカ及び右用の骨伝導スピーカを含んで構成される。骨伝導スピーカは、ユーザの頭蓋骨に振動を伝達させることにより、音をユーザに対して出力する。左用の骨伝導スピーカは、筐体１Ｌに収容される。右用の骨伝導スピーカは、筐体１Ｒに収容される。

　マイク部１１は、音出力装置１の周囲の外部音を集音可能である。マイク部１１は、左用のマイク及び右用のマイクを含んで構成される。左用のマイクは、筐体１Ｌに収容される。右用のマイクは、筐体１Ｒに収容される。マイク部１１は、左用のマイク及び右用のマイクによって、外部音をステレオ音として集音する。

　入力部１２は、ユーザからの入力を受け付け可能である。入力部１２は、ユーザからの入力を受け付け可能な少なくとも１つの入力用インタフェースを含んで構成される。入力用インタフェースは、例えば、物理キー、静電容量キー、慣性センサ、光センサ又はマイク等である。物理キー及び静電容量キーは、筐体１Ｌ及び筐体１Ｒの何れかの表面に位置してよい。慣性センサ、光センサ及びマイクは、図１に示すような、筐体１Ｌ及び筐体１Ｒの何れかに収容されてもよいし、固定部材１Ｆに含まれる筐体に収容されてもよい。

　入力部１２は、物理キー又は静電容量キーを含んで構成される場合、物理キー又は静電容量キーに対するユーザ操作をユーザからの入力として受け付ける。

　入力部１２は、慣性センサ、光センサ又はマイクを含んで構成される場合、ユーザのジェスチャーを検出可能である。ジェスチャーは、入力部１２が慣性センサを含んで構成される場合、頭部を傾ける動作を含んでよい。ジェスチャーは、入力部１２が光センサを含んで構成される場合、光センサに手をかざす動作を含んでよい。ジェスチャーは、入力部１２がマイクを含んで構成される場合、マイクをたたく動作を含んでよい。入力部１２は、検出したジェスチャーをユーザからの入力として受け付ける。

　通信部１３は、電子機器３と通信可能な少なくとも１つの通信モジュールを含んで構成される。通信モジュールは、例えば、Bluetooth（登録商標）等の近距離無線通信規格に対応した通信モジュールである。

　記憶部１４は、少なくとも１つの半導体メモリ、少なくとも１つの磁気メモリ、少なくとも１つの光メモリ又はこれらのうちの少なくとも２種類の組み合わせを含んで構成される。半導体メモリは、例えば、ＲＡＭ（Random Access Memory）又はＲＯＭ（Read Only Memory）等である。ＲＡＭは、例えば、ＳＲＡＭ（Static Random Access Memory）又はＤＲＡＭ（Dynamic Random Access Memory）等である。ＲＯＭは、例えば、ＥＥＰＲＯＭ(Electrically Erasable Programmable Read Only Memory)等である。記憶部１４は、主記憶装置、補助記憶装置又はキャッシュメモリとして機能してよい。記憶部１４は、音出力装置１の動作に用いられるデータと、音出力装置１の動作によって得られたデータとを記憶する。

　制御部１５は、少なくとも１つのプロセッサ、少なくとも１つの専用回路又はこれらの組み合わせを含んで構成される。プロセッサは、ＣＰＵ（Central Processing Unit）若しくはＧＰＵ（Graphics Processing Unit）等の汎用プロセッサ又は特定の処理に特化した専用プロセッサである。専用回路は、例えば、ＦＰＧＡ（Field-Programmable Gate Array）又はＡＳＩＣ（Application Specific Integrated Circuit）等である。制御部１５は、音出力装置１の各部を制御しながら、音出力装置１の動作に関わる処理を実行する。

　制御部１５は、音出力装置１の周囲すなわちユーザの周囲の外部音をマイク部１１によって集音する。マイク部１１によって集音される外部音は、上述したように、ステレオ音である。制御部１５は、集音したステレオ音のデータを記憶部１４に記憶させる。制御部１５は、現在時刻から所定時間前までのステレオ音のデータを記憶部１４に記憶させてよい。所定時間は、後述の設定時間よりも長い。所定時間は、例えば、２分である。記憶部１４は、ステレオ音のデータを記憶するためのリングバッファを含んでもよい。リングバッファからは、所定時間以前のステレオ音のデータが順次削除されてよい。

　制御部１５は、第１入力を入力部１２によって受け付け得る。第１入力は、現在時刻から設定時間前までの外部音を複数の音部分に分割して再生させるための入力である。ユーザは、必要な情報を含む外部音を聞き逃したこと感じた場合、第１入力を入力部１２から入力する。設定時間は、ユーザによって予め設定されてもよいし、音出力装置１の仕様に応じて予め設定されてもよい。設定時間は、例えば、３０秒である。

　制御部１５は、第１入力を受け付けると、現在時刻から設定時間前までのステレオ音のデータを記憶部１４から取得する。例えば、図２では、制御部１５は、現在時刻から設定時間前までのステレオ音のデータとして、「乗り換えのご案内です。Ａ鉄道線、…Ｄ鉄道線、…Ｈ鉄道線は、お乗り換えください」とのアナウンス音のデータを取得する。制御部１５は、取得したステレオ音のデータをモノラル音のデータに変換する。

　制御部１５は、変換後のモノラル音のデータを複数の音部分に分割する。分割後の複数の音部分の数は、設定時間の長さ又は予め設定される音像位置の数に基づいて設定されてよい。例えば、図２では、制御部１５は、アナウンス音を５つの音部分すなわち音部分２ａ～２ｅに分割する。

　分割処理の一例として、制御部１５は、モノラル音のデータを同じ時間間隔で分割することにより、複数の音部分に分割してもよい。この時間間隔は、設定時間の長さ及び予め設定される音像位置の数に基づいて設定されてよい。この時間間隔は、例えば、６秒である。

　分割処理の他の例として、制御部１５は、モノラル音のデータから発話区間を検出することにより、複数の音部分に分割してもよい。発話区間は、発話が続く区間である。一般的に、人間は、発話途中において息継ぎ又は句読点等に到達した際に発話を休止する。このような人間が発話を休止する位置が、発話区間の区切りとされてよい。発話を休止する位置を発話区間の区切りとすることにより、制御部１５は、発話の発生しない無音区間を除き、且つ発話途中で分割のない単語単位で発話区間を検出することができる。制御部１５は、検出した発話区間の数が予め設定される音像位置の数よりも多い場合、時間的に連続する複数の発話区間を１つ音部分とすることにより、分割後の複数の音部分の数と音像位置の数とが同じになるように調整してもよい。また、制御部１５は、時間的に連続する複数の発話区間を１つ音部分とすることにより、分割後の複数の音部分の長さの差が所定範囲内になるように調整してもよい。所定範囲内は、例えば、１秒以内であってよい。

　分割処理のさらに他の例として、制御部１５は、モノラル音のデータに対して音声認識処理を実行し、モノラル音のデータを単語単位で複数の音部分に分割してもよい。制御部１５は、時間的に連続する複数の単語を１つにまとめることにより、分割後の複数の音部分の数と音像位置の数とが同じになるように調整してもよいし、分割後の複数の音部分の長さの差が所定範囲内になるように調整してもよい。

　制御部１５は、分割後の複数の音部分の数に応じて、音像位置の数及び配置を決定してもよい。例えば、制御部１５は、アナウンス音を図２のように５つの音部分すなわち音部分２ａ～２ｅに分割した場合、音像位置を、ユーザを中心に４５度ずつ異なる角度の方向に５つ配置すると決定する。

　複数の音部分に分割すると、制御部１５は、分割後の複数の音部分のうちで、音の周波数が近い複数の音部分が存在するか否かを判定する。周波数が近い複数の音部分とは、例えば、複数の音部分のそれぞれの周波数のうち、最も低い周波数と他の周波数との差分が閾値以下となる複数の音部分である。周波数が近い複数の音部分とは、例えば、複数の音部分のそれぞれの平均周波数の差が閾値以下となる複数の音部分であってもよい。閾値は、周波数マスキングを考慮して設定されてよい。周波数マスキングとは、マスカーの周波数とマスキーの周波数が近いほど、マスキング量が増加する現象である。閾値は、例えば、許容可能なマスキング量になるときのマスカーの周波数とマスキーの周波数との差分に基づいて設定される。制御部１５は、音の周波数が近い複数の音部分が存在すると判定した場合、例えばマスキング量が許容可能な量に低減するまで、複数の音部分の周波数を異ならせる。制御部１５は、音の周波数が近い複数の音部分のうち、一部の音部分の周波数を他の音部分の周波数よりも高くしてもよいし、低くしてもよい。例えば、図２に示すような音部分２ａ～２ｅの周波数が近い場合、制御部１５は、音部分２ａから音部分２ｅに向けて、徐々に周波数が高くなるようにしてもよいし、周波数が低くなるようにしてもよい。ここで、マスキング効果では、一般的に、低い周波数よりも高い周波数の音の方が聞こえにくくなることが知られている。そこで、制御部１５は、一部の音部分の周波数を他の音部分の周波数よりも高くする場合、低くする場合よりも、周波数の変更量を大きくしてよい。複数の音部分に分割した後又は音の周波数を異ならせた後、制御部１５は、複数の音部分のそれぞれがユーザに等価に聞こえるように、複数の音部分の音量を調整してよい。

　制御部１５は、スピーカ部１０によって、複数の音部分をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生する。例えば、制御部１５は、スピーカ部１０の左用の骨伝導スピーカから出力する音量とスピーカ部１０の右用の骨伝導スピーカから出力する音量とを調整することにより、複数の音部分をそれぞれ異なる音像位置に定位させる。ここで、制御部１５は、継時マスキングに基づいて、複数の音部分のそれぞれの再生を開始するタイミングを異ならせてもよい。継時マスキングとは、マスカーが発生したとき、マスカーの発生前２０［ｍｓ］からマスカーの発生後１００「ｍｓ」までマスキング効果が続く現象である。例えば、図２では、制御部１５は、音部分２ａ～２ｅのそれぞれの再生を開始するタイミングを１００「ｍｓ」以上ずつずらしてよい。制御部１５は、音部分２ａから音部分２ｅに向けて、再生を開始するタイミングが１００「ｍｓ」ずつ遅くなるようにしてもよい。この場合、音部分２ｂは、音部分２ａに対して、１００［ｍｓ］遅れたタイミングで再生が開始される。音部分２ｃは、音部分２ｂに対して、１００［ｍｓ］遅れたタイミングで再生が開始される。音部分２ｄは、音部分２ｅに対して、１００［ｍｓ］遅れたタイミングで再生が開始される。音部分２ａ～２ｅのそれぞれの再生を開始するタイミングが１００「ｍｓ」ずつ早くなるようにしてもよい。

　制御部１５は、複数の音像位置のうちの隣り合う２つの音像位置に、複数の音部分のうちの時間的に連続する２つの音部分を定位させてもよい。隣り合う２つ音像位置とは、複数の音像位置のうちで、その間の距離が最も近くなる２つの音像位置であってよい。音像位置が所定の法則に従って配置されている場合には、その配置方向において連続する位置の音像位置が、隣り合う音像位置とされてよい。例えば、図２では、制御部１５は、時間的に連続する音部分２ａ，２ｂをそれぞれ隣り合う音像位置２Ａ，２Ｂに定位させ、時間的に連続する音部分２ｂ，２ｃをそれぞれ隣り合う音像位置２Ｂ，２Ｃに定位させる。また、制御部１５は、時間的に連続する音部分２ｃ，２ｄをそれぞれ隣り合う音像位置２Ｃ，２Ｄに定位させ、時間的に連続する音部分２ｄ，２ｅをそれぞれ隣り合う音像位置２Ｄ，２Ｅに定位させる。

　制御部１５は、複数の音部分を再生した後、ユーザから、複数の音部分のうちの何れかを選択する入力を入力部１２によって受け付けてよい。例えば、ユーザは、再生された複数の音部分を聞くことにより、図２に示すような「Ｄ鉄道線」の情報がアナウンス音に含まれると確認することができる。この場合、ユーザは、「Ｄ鉄道線」からの外部音を聞き返したいと考える。ユーザは、音部分２ａ～２ｅのうちで音部分２ｃを選択する入力を入力部１２から入力する。

　複数の音部分のうちの何れかを選択する入力は、音像位置を示す入力であってもよい。例えば、音部分２ｃを選択する入力は、音像位置２Ｃを示す入力であってもよい。この場合、制御部１５は、音像位置を示すジェスチャーを入力部１２によって検出することにより、音像位置を示す入力を受け付けてもよい。一例として、ジェスチャーは、入力部１２がマイクを含んで構成される場合、マイクをたたく回数であってよい。マイクをたたく回数は、例えば、音像位置がユーザの右側から何番目の音像位置であるかに対応してよい。他の例として、ジェスチャーは、入力部１２が慣性センサを含んで構成される場合、音像位置の方へ頭部を傾けることであってよい。

　入力部１２の代わりに、電子機器３が用いられてもよい。この場合、制御部１５は、音像位置の情報を電子機器３に通信部１３によって送信する。電子機器３は、音像位置の情報を受信すると、ユーザに対する音像位置を示す画像を表示する。例えば、図３に示すように、電子機器３は、位置３ａ，３ｂ，３ｃ，３ｄ，３ｅ，３ｆを示す画像を表示する。位置３ａ～３ｅは、それぞれ、図２に示すような音像位置２Ａ～２ｅに対応する。位置３ｆは、ユーザの位置に対応する。位置３ａ～３ｅには、それぞれ、「左」、「左斜め前」、「前」、「右斜め前」及び「右」との文字が付されている。ユーザは、電子機器３の画面を視認し、選択したい音部分の音像位置を示す位置をタッチする。例えば、ユーザは、音部分２ｃを選択したい場合、音像位置２Ｃを示す位置３ｃをタップする。電子機器３は、位置に対するタップを検出すると、タップされた位置に対応する音像位置を示す信号を音出力装置１に送信する。制御部１５は、音像位置を示す信号を通信部１３によって受信することにより、音像位置を示す入力をユーザから受け付ける。

　制御部１５は、複数の音部分のうちの何れかを選択する入力を受け付けると、選択された音部分から外部音をスピーカ部１０によって再生する。制御部１５は、ユーザが選択した音部分を再生した後、分割後の複数の音部分のうち、ユーザが選択した音部分に時間的に後続する一部又は全ての音部分を再生してよい。時間的に後続する音部分とは、時刻が進む方向に続く音部分であってよい。例えば、図２に示すような音部分２ｃが選択されるものとする。この場合、制御部１５は、音部分２ｃから音部分２ｅまでの外部音すなわち「Ｄ鉄道線、Ｅ鉄道線…Ｈ鉄道線は、お乗り換えください」との外部音を再生する。制御部１５は、入力部１２から受け付けるユーザ入力に応じて、選択された音部分からの外部音の再生速度を、通常の再生速度よりも高速にしてもよい。

　図４は、本開示の一実施形態に係る音出力方法の手順例を示すフローチャートである。制御部１５は、例えば音出力装置１の電源がオン状態になると、ステップＳ１の処理を開始する。

　制御部１５は、音出力装置１の周囲すなわちユーザの周囲の外部音を、マイク部１１によってステレオ音として集音する。制御部１５は、ステレオ音として集音した外部音のデータを記憶部１４に記憶させる（ステップＳ１）。

　制御部１５は、第１入力を入力部１２によって受け付けたか否かを判定する（ステップＳ２）。制御部１５は、第１入力を受け付けたと判定した場合（ステップＳ２：ＹＥＳ）、ステップＳ３の処理に進む。一方、制御部１５は、第１入力を受け付けたと判定しない場合（ステップＳ２：ＮＯ）、ステップＳ１の処理に戻る。

　ステップＳ３の処理では、制御部１５は、現在時刻から設定時間前までのステレオ音のデータを記憶部１４から取得する。制御部１５は、ステップＳ３の処理で取得したステレオ音のデータをモノラル音のデータに変換する（ステップＳ４）。制御部１５は、変換後のモノラル音のデータを複数の音部分に分割する（ステップＳ５）。

　制御部１５は、複数の音部分のうちで、音の周波数が近い複数の音部分が存在するか否かを判定する（ステップＳ６）。

　制御部１５は、音の周波数が近い複数の音部分が存在すると判定した場合（ステップＳ６：ＹＥＳ）、ステップＳ７の処理に進む。ステップＳ７の処理では、制御部１５は、マスキング量が許容可能な量に低減するまで、複数の音部分の周波数を異ならせる。

　制御部１５は、音の周波数が近い複数の音部分が存在すると判定しない場合（ステップＳ６：ＮＯ）、ステップＳ８の処理に進む。

　ステップＳ８の処理では、制御部１５は、複数の音部分のそれぞれがユーザに等価に聞こえるように、複数の音部分の音量を調整する。

　制御部１５は、スピーカ部１０によって、複数の音部分をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生する（ステップＳ９）。制御部１５は、複数の音部分の再生を継続する（ステップＳ１０）。

　制御部１５は、複数の音部分の再生を終了する入力を受け付けたか否かを判定する（ステップＳ１１）。制御部１５は、複数の音部分の再生を終了する入力を受け付けたと判定した場合（ステップＳ１１：ＹＥＳ）、図４に示すような音出力方法の処理を終了する。制御部１５は、複数の音部分の再生を終了する入力を受け付けたと判定しない場合（ステップＳ１１：ＮＯ）、ステップＳ１２の処理に進む。

　ステップＳ１２の処理では、制御部１５は、複数の音部分のうちの何れかを選択する入力を入力部１２によって受け付けたか否かを判定する。

　制御部１５は、複数の音部分のうちの何れかを選択する入力を受け付けたと判定した場合（ステップＳ１２：ＹＥＳ）、ステップＳ１３の処理に進む。ステップＳ１３の処理では、制御部１５は、選択された音部分から外部音をスピーカ部１０によって再生する。このようなステップＳ１３の処理により、選択された音部分から外部音の再生が開始される。ステップＳ１３の処理後、制御部１５は、図４に示すような音出力方法の処理を終了する。

　制御部１５は、複数の音部分のうちの何れかを選択する入力を受け付けたと判定しない場合（ステップＳ１２：ＮＯ）、ステップＳ１０の処理に戻る。ステップＳ１０～Ｓ１２の処理を繰り返し実行する場合に、制御部１５が複数の音部分の再生を終了する入力及び複数の音部分のうちの何れかを選択する入力を受け付けずに、複数の音部分の再生が終了する場合がある。この場合、制御部１５は、ステップＳ９の処理を実行してから所定時間経過したとき、図４に示すような音出力方法の処理を終了してもよい。所定時間は、ユーザによって設定されてもよいし、音出力装置１の仕様に応じて設定されてもよい。

　制御部１５は、図４に示すような音出力方法の処理後、任意のタイミングでステップＳ１からの処理を再開してよい。

　このように音出力装置１では、制御部１５は、外部音のデータを複数の音部分に分割し、複数の音部分の少なくとも一部をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生する。本実施形態では、制御部１５は、複数の音部分の少なくとも一部として、分割後の複数の音部分をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生する。例えば、図２に示すように、制御部１５は、音部分２ａ～２ｅをそれぞれ異なる音像位置２Ａ～２Ｅに定位させ、時間的に少なくとも一部重複させて再生する。複数の音部分をそれぞれ異なる音像位置に定位させることにより、ユーザは、複数の音部分をそれぞれ聞き分けることができる。

　ここで、比較例として、外部音のデータをユーザが指定した時間だけ巻き戻して再生することを考える。このような比較例では、ユーザが指定した時間が長いと、ユーザは、その時間分の外部音のデータを全て聞き返して必要な情報を探さなければならない。例えば、ユーザは、図２に示すような「Ｄ鉄道線」の情報が必要であるものとする。また、ユーザは、「乗り換えのご案内です。Ａ鉄道線、…Ｄ鉄道線、…Ｈ鉄道線は、お乗り換えください」とのアナウンス音の時間だけ巻き戻すものとする。この場合、ユーザは、「乗り換えのご案内です。Ａ鉄道線、…Ｄ鉄道線、…Ｈ鉄道線は、お乗り換えください」とのアナウンス音を全て聞き返して「Ｄ鉄道線」の情報が含まれるか否かを確認しなければならない。また、ユーザが指定した時間が短いと、ユーザは、必要な情報を見つけるまで、何回も、外部音のデータを巻き戻さなければならない。上記アナウンス音の例では、ユーザは、「Ｄ鉄道線」の音が再生されるまで、何回も、アナウンス音を巻き戻さなければならない。

　このような比較例に対し、本実施形態では、制御部１５は、複数の音部分を時間的に少なくとも一部重複させて再生する。複数の音部分を時間的に少なくとも一部重複させて再生することにより、ユーザは、外部音の内容を短い時間で確認することができる。例えば、ユーザは、「乗り換えのご案内です。Ａ鉄道線、…Ｄ鉄道線、…Ｈ鉄道線は、お乗り換えください」とのアナウンス音を全て聞き返す場合よりも、短い時間で「Ｄ鉄道線」との情報がアナウンス音に含まれるか否かを確認することができる。また、複数の音部分を時間的に少なくとも一部重複させて再生することにより、比較例のように必要な情報を見つけるまで何回も外部音のデータを巻き戻さなければならないといった事態を回避することができる。

　よって、本実施形態によれば、改善された、録音した音を再生する技術を提供することができる。

　さらに、本実施形態では、制御部１５は、複数の音部分のそれぞれの再生を開始するタイミングを異ならせてもよい。制御部１５は、継時マスキングに基づいて、複数の音部分のそれぞれの再生を開始するタイミングを異ならせてもよい。このような構成により、マスキング量が低減され、ユーザは、複数の音部分をそれぞれより明確に聞き分けることができる。

　また、本実施形態では、制御部１５は、複数の音部分の周波数を異ならせて再生してもよい。制御部１５は、音の周波数が近い複数の音部分が存在すると判定した場合、例えばマスキング量が許容可能な量に低減するまで、複数の音部分の周波数を異ならせてもよい。このような処理の結果、制御部１５は、複数の音部分の周波数を、外部音において対応する部分とは異ならせて再生し得る。複数の音部分の周波数を異ならせて再生することにより、マスキング量が低減され、ユーザは、複数の音部分をそれぞれより明確に聞き分けることができる。

　また、本実施形態では、制御部１５は、複数の音像位置のうちの隣り合う２つの音像位置に、複数の音部分のうちの時間的に連続する２つの音部分を定位させてもよい。例えば、図２では、上述したように、制御部１５は、時間的に連続する音部分２ａ，２ｂをそれぞれ隣り合う音像位置２Ａ，２Ｂに定位させる等してよい。時間的に連続する２つの音部分が隣り合う２つの音像位置に定位されることにより、ユーザは、音部分の時間的な前後関係を把握することができる。

　また、本実施形態では、制御部１５は、再生済みの複数の音部分のうち、ユーザが選択した音部分から外部音を再生してもよい。制御部１５は、ユーザが選択した音部分を再生した後、分割後の複数の音部分のうち、ユーザが選択した音部分に時間的に後続する音部分を再生してもよい。例えば、図２に示すような音部分２ｃが選択された場合、制御部１５は、音部分２ｃから音部分２ｅまでの外部音すなわち「Ｄ鉄道線、Ｅ鉄道線…Ｈ鉄道線は、お乗り換えください」との外部音を再生する。このような構成により、ユーザは、必要とする情報の詳細を確認することができる。

　また、本実施形態では、制御部１５は、外部音のデータを分割する際、外部音のデータを同じ時間間隔で分割することにより、複数の音部分に分割してもよい。同じ時間間隔で分割することにより、分割後の複数の音部分の長さを同じにすることができる。分割後の複数の音部分の長さを同じにすることにより、ユーザは、複数の音部分が再生されるとき、複数の音部分のそれぞれに対して同等に注意を払うことができる。

　（他の実施形態）
　制御部１５は、第２入力を入力部１２によって受け付けてもよい。第２入力は、外部音を音部分ずつ巻き戻して再生させるための入力である。制御部１５は、第２入力を複数回受け付けてもよい。

　制御部１５は、第２入力を最初に受け付けた場合、上述した処理と同じ又は類似に、現在時刻から設定時間前までのステレオ音のデータを記憶部１４から取得する。上述した処理と同じ又は類似に、制御部１５は、取得したステレオ音のデータをモノラル音のデータに変換し、変換後のモノラル音のデータを複数の音部分に分割する。ここで、制御部１５は、第２入力を最初に受け付けた場合、分割後の複数の音部分のうち、直近の音部分をスピーカ部１０によって再生する。直近の音部分は、分割前のモノラル音である外部音の後尾部分を含む。例えば、分割後の複数の音部分は、図２に示すような音部分２ａ～２ｅを含むものとする。この場合、第２入力を最初に受け付けたことにより、図５に示すように、制御部１５は、音部分２ａ～２ｅのうち、直近の音部分２ｅをスピーカ部１０によって再生する。制御部１５は、音部分２ｅを音像位置２Ａに定位させる。ユーザは、再生される音部分を聞き、再生された音部分に確認したい情報が含まれないと思った場合、第２入力をさらに入力部１２に入力する。制御部１５は、第２入力を音部分の再生中に受け付けてもよいし、音部分の再生終了後から所定時間以内に受け付けてもよい。所定時間は、ユーザの利便性を考慮して設定されてよい。

　制御部１５は、第２入力を次に受け付けた場合、再生済みの音部分と、再生済みの音部分に先行する音部分とをスピーカ部１０によって再生する。この際、制御部１５は、再生済みの音部分と、再生済みの音部分に先行する音部分とをそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生する。例えば、図５に示すような音部分２ｅの再生中又は音部分２ｅの再生終了後の所定時間以内に、制御部１５は、第２入力を受け付けるものとする。この場合、図６に示すように、制御部１５は、再生済みの音部分２ｅと、外部音において音部分２ｅに先行する音部分２ｄとをスピーカ部１０によって再生する。制御部１５は、音部分２ｅを音像位置２Ｂに定位させ、音部分２ｄを音像位置２Ａに定位させる。つまり、制御部１５は、再生する音部分２ｄ，２ｅのうち、アナウンス音において最も古い音部分２ｄを特定の音像位置である音像位置２Ａに定位させる。ユーザは、再生される音部分を聞き、再生された音部分に確認したい情報が含まれないと思った場合、第２入力をさらに入力部１２に入力する。上述と同じ又は類似に、制御部１５は、第２入力を音部分の再生中に受け付けてもよいし、音部分の再生終了後から所定時間以内に受け付けてもよい。

　制御部１５は、第２入力をさらに受け付けた場合、上述した処理と同じ又は類似に、再生済みの音部分と、外部音において再生済みの音部分に先行する音部分とをスピーカ部１０によって再生する。例えば、図６に示すように音部分２ｅ，２ｄを再生した後、制御部１５は、第２入力を受け付けるものとする。この場合、図７に示すように、制御部１５は、再生済みの音部分２ｅ，２ｄと、外部音において音部分２ｄに先行する音部分２ｃとをスピーカ部１０によって再生する。制御部１５は、音部分２ｅを音像位置２Ｃに定位させ、音部分２ｄを音像位置２Ｂに定位させ、音部分２ｃを音像位置２Ａに定位させる。つまり、制御部１５は、再生する音部分２ｃ，２ｄ，２ｅのうち、アナウンス音において最も古い音部分２ｃを特定の音像位置である音像位置２Ａに定位させる。

　このように、制御部１５は、第２入力を複数回受け付けた場合、分割後の複数の音部分のうち、第２入力を受け付けた回数と同じ数の複数の音部分をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生する。また、制御部１５は、第２入力を受け付ける毎に、複数の音部分のうち、再生済みの音部分を再生しつつ、外部音において再生済みの音部分に先行する音部分を追加して再生する。制御部１５は、再生済みの音部分のうち、既に再生した回数が最も少ない再生済みの音部分に先行する音部分を追加して再生する。

　例えば、図６では、制御部１５は、図５に示す構成にて再生済みの音部分２ｅを再生しつつ、再生済みの音部分２ｅに先行する音部分２ｄを追加して再生する。

　例えば、図７では、制御部１５は、図６に示す構成にて再生済みの音部分２ｄ，２ｅを再生しつつ、再生済みの音部分２ｄに先行する音部分２ｃを追加して再生する。ここで、図７では、音部分２ｅは、図５及び図６に示す構成にて既に２回再生されている。また、音部分２ｄは、図６に示す構成にて既に１回再生されている。つまり、図７では、再生済みの音部分２ｄ，２ｅのうち、音部分２ｄの方が音部分２ｅよりも既に再生された回数が少ない。そのため、図７では、制御部１５は、再生済みの音部分２ｄ，２ｅのうち、既に再生した回数が最も少ない再生済みの音部分２ｄに先行する音部分２ｃを追加して再生する。

　制御部１５は、複数の音部分を再生する場合、追加して再生する音部分を定位させる音像位置を固定してもよい。さらに、制御部１５は、再生済みの音部分については、既に再生した回数に応じて音部分を定位させる音像位置を変えてもよい。一例として、制御部１５は、既に再生した回数が多い音部分を定位させる音像位置ほど、ユーザを中心に所定の回転方向にシフトするようにしてもよい。例えば、図５～図７では、制御部１５は、追加して再生する音部分を定位させる音像位置を音像位置２Ａに固定している。つまり、図６では、追加して再生する音部分２ｄを音像位置２Ａに定位させ、図７では、追加して再生する音部分２ｃを音像位置２Ａに定位させている。さらに、制御部１５は、既に再生した回数が多い音部分を定位させる音像位置ほど、ユーザを中心に右回りにシフトするようにしている。例えば、図６に示す構成では、音部分２ｅは、図５に示す構成において既に１回再生されている。図７に示す構成では、音部分２ｅは、図５及び図６に示す構成において既に２回再生されている。図７において音部分２ｅを定位させる音像位置２Ｃは、図６において音部分２ｅを定位させる音像位置２Ｂよりも、音像位置２Ａからユーザを中心に右回りにシフトしている。

　制御部１５は、複数の音部分を再生する場合、既に再生した回数が多い音部分ほど、その音量が小さくなるように、音部分の音量を調整してもよい。音量を小さくする度合いは、ユーザの利便性を考慮して設定されてよい。例えば、図７に示す構成では、音部分２ｅが図５及び図６に示す構成において既に２回再生され、音部分２ｄが図６に示す構成において既に１回再生され、音部分２ｃが追加されて再生される。制御部１５は、音部分２ｃ，２ｄ，２ｅの順に音量が小さくなるように調整する。

　制御部１５は、再生した回数に応じて音部分の音量を小さくしていった結果、その音部分の音量が音量閾値を下回った場合、その音部分を再生しなくてもよい。音量閾値は、ユーザが注意を払うことができる音量に基づいて設定されてよい。例えば、図８に示す構成では、分割後の音部分は、音部分２ａ～２ｅに加えて、「ａａａ鉄道線をご利用いただき、ありがとうございます」との音部分２ａ１を含む。音部分２ａ１は、音部分２ａに先行する音部分である。図８では、再生した回数に応じて音部分２ｅの音量を小さくしていった結果、音部分２ｅの音量が音量閾値を下回る。そのため、制御部１５は、音部分２ｅを再生していない。

　制御部１５は、外部音における、再生済みの音部分及び再生済みの音部分に先行する音部分の時間的な順序に応じた音像位置に、再生済みの音部分及び再生済みの音部分に先行する音部分を定位させてもよい。例えば、図８に示す構成では、音像位置２Ａ～２Ｅの順に、アナウンス音において古い音部分２ａ１から新しい音部分２ｄが定位される。

　制御部１５は、複数の音部分を再生する場合、再生する複数の音部分のうちで、上述した処理と同じ又は類似に、音の周波数が近い複数の音部分が存在するか否かを判定してもよい。上述した処理と同じ又は類似に、制御部１５は、音の周波数が近い複数の音部分が存在すると判定した場合、マスキング量が許容可能な量に低減するまで、複数の音部分の周波数を異ならせてよい。

　制御部１５は、複数の音部分を再生する場合、上述した処理と同じ又は類似に、継時マスキングに基づいて、複数の音部分のそれぞれの再生を開始するタイミングを異ならせてもよい。

　制御部１５は、第２入力を受け付けた場合であっても、分割後の複数の音部分の全てが再生済みである場合、音部分の再生を停止してもよい。

　制御部１５は、上述した処理と同じ又は類似に、ユーザから、再生済みの複数の音部分のうちの何れかを選択する入力を入力部１２によって受け付けてよい。上述した処理と同じ又は類似に、制御部１５は、再生済みの複数の音部分のうちの何れかを選択する入力を受け付けると、選択された音部分から外部音をスピーカ部１０によって再生してよい。

　図９は、本開示の他の実施形態に係る音出力方法の手順例を示すフローチャートである。制御部１５は、例えば音出力装置１の電源がオン状態になると、ステップＳ２１の処理を開始する。

　制御部１５は、図４に示すようなステップＳ１の処理と同じ又は類似に、ステップＳ２１の処理を実行する。

　制御部１５は、第２入力を入力部１２によって受け付けたか否かを判定する（ステップＳ２２）。制御部１５は、第２入力を受け付けたと判定した場合（ステップＳ２２：ＹＥＳ）、ステップＳ２３の処理に進む。一方、制御部１５は、第２入力を受け付けたと判定しない場合（ステップＳ２２：ＮＯ）、ステップＳ２１の処理に戻る。

　制御部１５は、図４に示すようなステップＳ３，Ｓ４，Ｓ５，Ｓ６，Ｓ７の処理と同じ又は類似に、ステップＳ２３，Ｓ２４，Ｓ２５，Ｓ２６，Ｓ２７の処理を実行する。ただし、制御部１５は、ステップＳ２７の処理後、ステップＳ２８の処理に進む。また、制御部１５は、音の周波数が近い複数の音部分が存在すると判定しない場合（ステップＳ２６：ＮＯ）、ステップＳ２８の処理に進む。

　制御部１５は、既に再生した回数が多い音部分ほど、その音量が小さくなるように、音部分の音量を調整する（ステップＳ２８）。制御部１５は、再生する音部分の数が１個である場合すなわち第２入力を最初に受け付けた場合、ステップＳ２８の処理を実行しなくてもよい。

　制御部１５は、スピーカ部１０によって、複数の音部分をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生する（ステップＳ２９）。

　ステップＳ２９の処理では、制御部１５は、上述したように、追加して再生する音部分を定位させる音像位置を固定してもよい。さらに、制御部１５は、再生済みの音部分については、既に再生した回数に応じて音部分を定位させる音像位置を変えてもよい。

　ステップＳ２９の処理では、制御部１５は、ステップＳ２８の処理の結果、その音部分の音量が音量閾値を下回った場合、その音部分を再生しなくてもよい。

　制御部１５は、第２入力を入力部１２によって受け付けたか否かを判定する（ステップＳ３０）。制御部１５は、第２入力を受け付けたと判定した場合（ステップＳ３０：ＹＥＳ）、ステップＳ３１の処理に進む。一方、制御部１５は、第２入力を受け付けたと判定しない場合（ステップＳ３０：ＮＯ）、ステップＳ３２の処理に進む。

　ステップＳ３１の処理では、制御部１５は、ステップＳ２５の処理によって分割された複数の音部分の全てが再生済みであるか否かを判定する。制御部１５は、複数の音部分の全てが再生済みであると判定した場合（ステップＳ３１：ＹＥＳ）、ステップＳ３２の処理に進む。一方、制御部１５は、複数の音部分の全てが再生済みであると判定しない場合（ステップＳ３１：ＮＯ）、ステップＳ２８の処理に進む。

　制御部１５は、図４に示すようなステップＳ１２，Ｓ１３の処理と同じ又は類似に、ステップＳ３２，３３の処理を実行する。ただし、制御部１５は、複数の音部分のうちの何れかを選択する入力を受け付けたと判定しない場合（ステップＳ３２：ＮＯ）、図９に示すような音出力方法の処理を終了する。

　このように他の実施形態に係る音出力装置１では、制御部１５は、複数の音部分の少なくとも一部として、第２入力を受け付けた回数と同じ数の複数の音部分をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生する。上述した実施形態と同じ又は類似に、複数の音部分をそれぞれ異なる音像位置に定位させることにより、ユーザは、複数の音部分をそれぞれ聞き分けることができる。上述した実施形態と同じ又は類似に、複数の音部分を時間的に少なくとも一部重複させて再生することにより、ユーザは、外部音の内容を短い時間で確認することができる。

　さらに、他の実施形態では、制御部１５は、第２入力を受け付ける毎に、分割後の複数の音部分のうち、再生済みの音部分を再生しつつ、再生済みの音部分に先行する音部分を追加して再生してもよい。このような構成により、ユーザは、再生済みの音部分を確認しつつ、追加された音部分を確認することができる。

　また、他の実施形態では、制御部１５は、追加して再生する音部分を定位させる音像位置を固定し、再生済みの音部分については、既に再生した回数に応じて音部分を定位させる音像位置を変えてもよい。追加して再生する音部分を定位させる音像位置を固定することにより、ユーザは、追加された音部分すなわち新たに再生される音部分が到来する方向を把握することができる。また、再生済みの音部分について既に再生した回数に応じて音部分を定位させる音像位置を変えることにより、ユーザは、音部分が到来する方向によって、何回目に再生された音部分であるかを把握することができる。

　また、他の実施形態では、制御部１５は、再生済みの音部分について、既に再生した回数が多い音部分ほど、その音量が小さくなるように音部分の音量を調整してもよい。このような構成により、ユーザは、再生された回数が少ない音部分に注意を払うことができる。

　他の実施形態に係る音出力装置１の構成及び効果は、上述した実施形態と同じ又は類似である。

　一実施形態において、（１）音出力装置は、
　外部音のデータを記憶する記憶部と、
　前記外部音のデータを複数の音部分に分割し、前記複数の音部分の少なくとも一部をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生する制御部と、
　を備える。

　（２）上記（１）の音出力装置では、
　前記制御部は、前記複数の音部分のそれぞれの再生を開始するタイミングを異ならせてもよい。

　（３）上記（１）又は（２）に記載の音出力装置では、
　前記制御部は、前記複数の音部分の周波数を、前記外部音において対応する部分と異ならせて再生してもよい。

　（４）上記（１）から（３）までの何れか１つに記載の音出力装置では、
　前記制御部は、前記複数の音像位置のうちの隣り合う２つの音像位置に、前記複数の音部分のうちの時間的に連続する２つの音部分を定位させてもよい。

　（５）上記（１）から（４）までの何れか１つに記載の音出力装置では、
　前記制御部は、再生済みの前記複数の音部分のうち、ユーザが選択した音部分から前記外部音を再生してもよい。

　（６）上記（１）から（５）までの何れか１つに記載の音出力装置では、
　前記制御部は、前記ユーザが選択した音部分を再生した後、前記ユーザが選択した音部分に時間的に後続する音部分を再生してもよい。

　（７）上記（１）から（６）までの何れか１つに記載の音出力装置では、
　前記制御部は、前記外部音のデータを同じ時間間隔で分割することにより、前記複数の音部分に分割してもよい。

　（８）上記（１）から（７）までの何れか１つに記載の音出力装置では、
　前記制御部は、第１入力を受け付けると、前記記憶部に記憶された現在時刻から設定時間前までの外部音のデータを前記複数の音部分に分割してもよい。

　（９）上記（１）から（８）までの何れか１つに記載の音出力装置では、
　前記制御部は、第２入力を受け付けた回数と同じ数の複数の音部分をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生してもよい。

　（１０）上記（１）から（９）までの何れか１つに記載の音出力装置では、
　前記制御部は、前記第２入力を受け付ける毎に、前記複数の音部分のうち、再生済みの音部分及び前記再生済みの音部分に先行する音部分を追加して再生してもよい。

　（１１）上記（１）から（１０）までの何れか１つに記載の音出力装置では、
　前記制御部は、追加して再生する音部分を定位させる音像位置を固定し、前記再生済みの音部分については、既に再生した回数に応じて定位させる音像位置を変えてもよい。

　（１２）上記（１）から（１１）までの何れか１つに記載の音出力装置では、
　前記制御部は、前記外部音における、再生済みの音部分及び前記再生済みの音部分に先行する音部分の時間的な順序に応じた音像位置に、再生済みの音部分及び前記再生済みの音部分に先行する音部分を定位させてもよい。

　（１３）上記（１）から（１２）までの何れか１つに記載の音出力装置では、
　前記制御部は、前記再生済みの音部分について、既に再生した回数が多い音部分ほど、その音量が小さくなるように音部分の音量を調整してもよい。

　一実施形態において、（１４）音出力方法は、
　外部音のデータを記憶することと、
　前記外部音のデータを複数の音部分に分割し、前記複数の音部分の少なくとも一部をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生することと、
　を含む。

　一実施形態において、（１５）プログラムは、
　コンピュータに、
　外部音のデータを記憶することと、
　前記外部音のデータを複数の音部分に分割し、前記複数の音部分の少なくとも一部をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生することと、
　を含む動作を実行させる。

　本開示を諸図面及び実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形又は修正を行うことが容易であることに注意されたい。したがって、これらの変形又は修正は本開示の範囲に含まれることに留意されたい。例えば、各機能部に含まれる機能等は論理的に矛盾しないように再配置可能である。複数の機能部等は、１つに組み合わせられたり、分割されたりしてよい。上述した本開示に係る各実施形態は、それぞれ説明した各実施形態に忠実に実施することに限定されるものではなく、適宜、各特徴を組み合わせたり、一部を省略したりして実施され得る。つまり、本開示の内容は、当業者であれば本開示に基づき種々の変形及び修正を行うことができる。したがって、これらの変形及び修正は本開示の範囲に含まれる。例えば、各実施形態において、各機能部、各手段又は各ステップ等は論理的に矛盾しないように他の実施形態に追加し、若しくは、他の実施形態の各機能部、各手段又は各ステップ等と置き換えることが可能である。また、各実施形態において、複数の各機能部、各手段又は各ステップ等を１つに組み合わせたり、或いは分割したりすることが可能である。また、上述した本開示の各実施形態は、それぞれ説明した各実施形態に忠実に実施することに限定されるものではなく、適宜、各特徴を組み合わせたり、一部を省略したりして実施することもできる。

　例えば、音出力装置１では、制御部１５は、第１入力を受け付けた後、第２入力を受け付けてもよい。例えば、制御部１５は、図４に示すようなステップＳ９の処理後、図９に示すようなステップＳ２２の処理に進んでもよい。この場合、制御部１５は、図９に示すステップのうち、図４と処理内容が重複するステップについては、実行しなくてよい。例えば、制御部１５は、図９に示すようなステップＳ２３，Ｓ２４，Ｓ２５，Ｓ２６，Ｓ２７の処理を実行しなくてもよい。

　例えば、音出力装置１の制御部１５は、図４に示すようなステップＳ１３の実行中すなわち外部音の再生中、ステップＳ１２の処理を実行してもよい。制御部１５は、複数の音部分のうちの何れかを選択する入力を受け付けたと判定した場合（ステップＳ１２：ＹＥＳ）、新たに選択された音部分から外部音をスピーカ部１０によって再生してよい。ステップＳ１２，１３の処理と同じ又は類似に、制御部１５は、図９に示すようなステップＳ３３の実行中、ステップＳ３２に処理を実行してもよい。

　例えば、汎用のコンピュータを、上述した実施形態に係る音出力装置１として機能させる実施形態も可能である。具体的には、上述した実施形態に係る音出力装置１の各機能を実現する処理内容を記述したプログラムを、汎用のコンピュータのメモリに格納し、プロセッサによって当該プログラムを読み出して実行させる。したがって、本開示は、プロセッサが実行可能なプログラム、又は、当該プログラムを記憶する非一時的なコンピュータ可読媒体としても実現可能である。

　本開示において「第１」及び「第２」等の記載は、当該構成を区別するための識別子である。本開示における「第１」及び「第２」等の記載で区別された構成は、当該構成における番号を交換することができる。例えば、第１入力は、第２入力と識別子である「第１」と「第２」とを交換することができる。識別子の交換は同時に行われる。識別子の交換後も当該構成は区別される。識別子は削除してよい。識別子を削除した構成は、符号で区別される。本開示における「第１」及び「第２」等の識別子の記載のみに基づいて、当該構成の順序の解釈、小さい番号の識別子が存在することの根拠に利用してはならない。

　１　音出力装置
　１Ｆ　固定部材
　１Ｌ，１Ｒ　筐体
　２Ａ，２Ｂ，２Ｃ，２Ｄ，２Ｅ　音像位置
　２ａ，２ａ１，２ｂ，２ｃ，２ｄ，２ｅ，　音部分
　３　電子機器
　３ａ，３ｂ，３ｃ，３ｄ，３ｅ　位置
　１０　スピーカ部
　１１　マイク部
　１２　入力部
　１３　通信部
　１４　記憶部
　１５　制御部

Claims

　外部音のデータを記憶する記憶部と、
　前記外部音のデータを複数の音部分に分割し、前記複数の音部分の少なくとも一部をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生する制御部と、
　を備える、音出力装置。
　前記制御部は、前記複数の音部分のそれぞれの再生を開始するタイミングを異ならせる、請求項１に記載の音出力装置。
　前記制御部は、前記複数の音部分の周波数を、前記外部音において対応する部分と異ならせて再生する、請求項１に記載の音出力装置。
　前記制御部は、前記複数の音像位置のうちの隣り合う２つの音像位置に、前記複数の音部分のうちの時間的に連続する２つの音部分を定位させる、請求項１に記載の音出力装置。
　前記制御部は、再生済みの前記複数の音部分のうち、ユーザが選択した音部分から前記外部音を再生する、請求項１に記載の音出力装置。
　前記制御部は、前記ユーザが選択した音部分を再生した後、前記ユーザが選択した音部分に時間的に後続する音部分を再生する、請求項５に記載の音出力装置。
　前記制御部は、前記外部音のデータを同じ時間間隔で分割することにより、前記複数の音部分に分割する、請求項１に記載の音出力装置。
　前記制御部は、第１入力を受け付けると、前記記憶部に記憶された現在時刻から設定時間前までの外部音のデータを前記複数の音部分に分割する、請求項１から７までの何れか一項に記載の音出力装置。
　前記制御部は、第２入力を受け付けた回数と同じ数の複数の音部分をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生する、請求項１から７までの何れか一項に記載の音出力装置。
　前記制御部は、前記第２入力を受け付ける毎に、前記複数の音部分のうち、再生済みの音部分及び前記再生済みの音部分に先行する音部分を追加して再生する、請求項９に記載の音出力装置。
　前記制御部は、追加して再生する音部分を定位させる音像位置を固定し、前記再生済みの音部分については、既に再生した回数に応じて定位させる音像位置を変える、請求項１０に記載の音出力装置。
　前記制御部は、前記外部音における、再生済みの音部分及び前記再生済みの音部分に先行する音部分の時間的な順序に応じた音像位置に、再生済みの音部分及び前記再生済みの音部分に先行する音部分を定位させる、請求項９に記載の音出力装置。
　前記制御部は、前記再生済みの音部分について、既に再生した回数が多い音部分ほど、その音量が小さくなるように音部分の音量を調整する、請求項１０に記載の音出力装置。
　外部音のデータを記憶することと、
　前記外部音のデータを複数の音部分に分割し、前記複数の音部分の少なくとも一部をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生することと、
　を含む、音出力方法。
　コンピュータに、
　外部音のデータを記憶することと、
　前記外部音のデータを複数の音部分に分割し、前記複数の音部分の少なくとも一部をそれぞれ異なる音像位置に定位させ、時間的に少なくとも一部重複させて再生することと、
　を含む動作を実行させる、プログラム。