WO2016009850A1

WO2016009850A1 - 音声信号再生装置、音声信号再生方法、プログラム、および、記録媒体

Info

Publication number: WO2016009850A1
Application number: PCT/JP2015/069163
Authority: WO
Inventors: 健明末永; 純生佐藤; 永雄服部; 拓人市川
Original assignee: シャープ株式会社
Priority date: 2014-07-16
Filing date: 2015-07-02
Publication date: 2016-01-21

Abstract

　複数の音声信号の各々の示す音声をユーザが容易に聞き分けることができるようにする。複数の音声信号を取得する音声信号取得部（１１）と、取得された各音声信号の優先度を決定する優先度決定部（１２１）と、決定された優先度によって上記各音声信号の示す音声の仮想出力位置を決定する位置決定部（１２２）と、決定された各仮想出力位置に応じて各音声信号に立体音響処理を施す音声信号処理部（１２３）と、立体音響処理の施された各音声信号を再生する音声信号再生部（１３）を備える音声信号再生装置（１）。

Description

音声信号再生装置、音声信号再生方法、プログラム、および、記録媒体

　本発明は、複数の音声信号を再生可能な音声信号再生装置、および、音声信号再生方法に関する。また、音声信号再生装置としてコンピュータを動作させるためのプログラム、および、そのようなプログラムが記録されている記録媒体に関する。

　昨今、スマートフォンなどに代表される、個人向けの情報端末の普及により、各個人が受け取る情報量が増大しつつある。これらの情報端末では、通常複数のアプリケーションが非同期に動作しており、各アプリケーションが不定期かつ高頻度に情報を発信している。

　このような、情報端末（又はアプリケーション）により発信される情報が例えば画像情報や文字情報などである場合、当該情報端末本体に具備されるディスプレイ又は情報端末と接続された外部の表示端末に画像又は文字として表示されることにより、ユーザに提供される。例えば、特許文献１には、眼鏡型の画像情報表示端末が開示されている。

　また、上記のような情報が音声信号である場合、情報端末に具備されるスピーカ又は情報端末に接続されたヘッドホンまたはイヤホンなどを通じて、ステレオ形式または立体音響形式などにより音声として出力され、ユーザに提供される。例えば、特許文献２には、音声により聴取者に方向の指示を与える立体音響制御装置が開示されている。

日本国公開特許公報「特開２００６－２０９１４４号公報（２００６年８月１０日公開）」日本国公開特許公報「特開２００８－１５１７６６号公報（２００８年７月３日公開）」

　しかしながら、特許文献１に示されるような、情報端末から通知された情報を画像として表示する端末では、ユーザはディスプレイなどの画像表示部を注視するために、直前まで行っていた作業を中断する必要があるなど、手間が発生する。

　これに対し、作業の中断を回避するために、画像や文字を表示するのではなく、音声信号を利用することが考えられる。しかし、特許文献２に示されるような、音声信号で情報を通知する装置は、１つのアプリケーションからの情報提示を前提としており、複数のアプリケーションから発信される情報を音声として効率よくユーザに提供することができないという問題がある。

　本発明はかかる事情に鑑みてなされたものであり、その主たる目的は、複数の音声信号の各々の示す音声をユーザが容易に聞き分けることができる音声信号再生装置を提供することである。

　上記課題を解決するために、本発明の一態様に係る音声信号再生装置は、複数の音声信号を取得する音声信号取得部と、上記音声信号取得部により取得された各音声信号の優先度を決定する優先度決定部と、上記優先度決定部により決定された優先度に応じて、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を決定する位置決定部と、上記位置決定部により決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理部と、上記音声信号処理部により立体音響処理の施された各音声信号を再生する音声信号再生部と、を備えている。

　上記の構成によれば、音声信号再生装置は、複数の音声信号を取得し、各音声信号の優先度を決定し、さらに優先度に応じて各音声信号の示す音声の仮想出力位置を決定する。そして、音声信号再生装置は、決定した仮想出力位置に応じて各音声信号に立体音響処理を施すとともに、それらの音声信号を再生する。

　これにより、音声信号再生装置は、当該音声信号再生装置から出力された音声信号の示す音声を聴取するユーザが、仮想出力位置から各音声信号の示す音声が出力されていると知覚するような音声信号を再生することができる。つまり、ユーザには、音声信号再生装置において再生される音声信号の示す音声が、あたかも仮想出力位置から出力されているように聴こえることになるため、ユーザは、仮想出力位置の距離や方向に応じて複数の音声を聞き分けることができる。

　したがって、音声信号再生装置は、同時に複数の音声信号の示す音声を再生する場合であっても、これらの複数の音声信号の各々の示す音声をユーザが容易に聞き分けられるように再生することができる。なお、音声信号再生装置において再生される音声信号の示す音声は、例えば、スピーカ、ヘッドホン又はイヤホンなどから音声として出力されればよいが、特に限定されるものではない。

　本発明の一態様に係る音声信号再生装置は、複数の音声信号を取得する音声信号取得部と、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を指定する仮想出力位置指定情報を取得する情報取得部と、上記情報取得部により取得された仮想出力位置指定情報に従って、上記仮想出力位置を決定する位置決定部と、上記位置決定部により決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理部と、上記音声信号処理部により立体音響処理の施された各音声信号を再生する音声信号再生部と、を備えている。

　上記の構成によれば、音声信号再生装置は、仮想出力位置指定情報を取得し、その情報によって各音声信号の優先度を決定する。従って、音声信号再生装置は、複数の音声信号の示す音声を、各音声信号の仮想出力位置指定情報に応じて決定された優先度に対応する仮想出力位置から出力されているように再生することができる。

　本発明の一態様に係る音声信号再生方法は、音声信号再生装置の音声信号再生方法であって、複数の音声信号を取得する音声信号取得ステップと、上記音声信号取得ステップにおいて取得された各音声信号の優先度を決定する優先度決定ステップと、上記優先度決定ステップにおいて決定された優先度に応じて、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を決定する位置決定ステップと、上記位置決定ステップにおいて決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理ステップと、上記音声信号処理ステップにおいて立体音響処理の施された各音声信号を再生する音声信号再生ステップと、を含んでいる。

　本発明の一態様に係る音声信号再生方法は、音声信号再生装置の音声信号再生方法であって、複数の音声信号を取得する音声信号取得ステップと、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を指定する仮想出力位置指定情報を取得する情報取得ステップと、上記情報取得ステップにおいて取得された仮想出力位置指定情報に従って、上記仮想出力位置を決定する位置決定ステップと、上記位置決定ステップにおいて決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理ステップと、上記音声信号処理ステップにおいて立体音響処理の施された各音声信号を再生する音声信号再生ステップと、を含んでいる。

　本発明の一態様によれば、複数の音声信号の各々の示す音声をユーザが容易に聞き分けることができるという効果を奏する。

本発明の実施形態１に係る音声信号再生装置の構成を示すブロック図である。本発明の実施形態１に係る音声信号再生システムの構成を示すブロック図である。本発明の実施形態１に係る所定時刻における音声信号の優先度を示す図であり、（ａ）は時刻Ｔ＝ｔ＋２での各音声信号の優先度を示し、（ｂ）は時刻Ｔ＝ｔ＋４での各音声信号の優先度を示す。本発明の実施形態１に係る所定時刻における音声信号の優先度を示す図であり、（ａ）は時刻Ｔ＝ｔでの各音声信号の優先度を示し、（ｂ）は時刻Ｔ＝ｔ＋１での各音声信号の優先度を示す。本発明の実施形態１に係る音声信号の仮想音源位置決定処理の流れを示すフローチャートであり、音声信号の優先度に変化がある度に仮想音源位置を変更する処理を示す。本発明の実施形態１に係る聴取者と、その周囲に配置される仮想音源位置を示す図である。本発明の実施形態１の変形例に係る音声信号の仮想音源位置決定処理の流れを示すフローチャートであり、各音声信号の仮想音源位置が一度決定されると、変更されない処理を示す。本発明の実施形態２に係る音声信号再生装置の構成を示すブロック図である。実施形態２に係る付加情報の構成例を示す図であり、（ａ）は仮想音源位置を含む付加情報を示し、（ｂ）は通知重要度を含む付加情報を示し、（ｃ）は音声信号名、通知重要度および仮想音源位置を含む付加情報を示す。本発明の実施形態２に係る音声信号再生装置の構成を示すブロック図である。本発明の実施形態２に係る通知重要度と、優先度との対応付けを示す図である。本発明の実施形態２に係る音声信号の仮想音源位置決定処理の流れを示すフローチャートであり、（ａ）は音声信号の仮想音源位置決定処理の流れの概要を示し、（ｂ）は各音声信号の仮想音源位置更新処理の流れを示す。本発明の実施形態２に係る音声信号名、仮想音源位置および位置重要度を含む付加情報を示す図である。本発明の実施形態３に係る音声信号再生装置の構成を示すブロック図である。本発明の実施形態４に係る音声信号再生装置の構成を示すブロック図である。本発明の実施形態４に係る音声信号再生装置の構成を示すブロック図である。

　以下、本発明の実施の形態について、詳細に説明する。ただし、この実施形態に記載されている構成は、特に特定的な記載がない限り、この発明の範囲をそれのみに限定する趣旨ではなく、単なる説明例に過ぎない。

　〔実施形態１〕
　本発明の実施形態１に係る音声信号再生装置は、複数の音声信号を取得し、各音声信号の優先度を決定し、その優先度に従って、予め設定された複数の位置に各音声信号を配置する。そして、当該位置に応じて各音声信号に立体音響処理を施した上で、各音声信号を出力する。以下、実施形態１の詳細について説明する。

　なお、本実施形態に係る音声信号再生装置は、例えば、チューナ、デッキ（プレーヤ）およびスピーカなどにより構成されるオーディオシステム（各構成要素は別体であってもよいし、一体に形成されていてもよい）において、スピーカなどに音声信号を出力するデッキ（プレーヤ）により実現することができる。なお、オーディオシステムとしては、例えば、ポータブルプレーヤなどを挙げることもできるし、特に限定されるものではない。

　〈装置の構成と概要〉
　まず、本実施形態に係る音声信号再生装置１について、図１を参照して説明する。図１は、本実施形態に係る音声信号再生装置１の構成を示すブロック図である。音声信号再生装置１は、音声信号取得部１１、制御部１２、音声信号再生部１３および記憶部１４を備える。制御部１２は、音声信号取得部１１、音声信号再生部１３および記憶部１４を制御し、それら各部との間でデータの入出力を行うものであり、例えばＣＰＵ（Central Processing Unit）が所定のメモリに格納されたプログラムを実行することによって実現される。記憶部１４は、制御部１２からデータを記憶したり、記憶したデータを読み出したりするものであり、例えば、ＨＤＤ（Hard Disk Drive）およびＳＳＤ（Solid State Drive）などの不揮発性記憶装置によって実現される。

　また、図１に示すように、制御部１２は、機能ブロックとして、優先度決定部１２１、位置決定部１２２および音声信号処理部１２３を備える。

　音声信号再生装置１の各部の概要を簡単に説明すると、音声信号取得部１１は、外部から複数の音声信号を取得する。次に、制御部１２の備える優先度決定部１２１は、各音声信号の優先度を決定し、位置決定部１２２が、優先度に基づいて各音声信号の示す音声が仮想的に出力される仮想出力位置を決定し、音声信号処理部１２３は、仮想出力位置に応じて各音声信号に音響効果処理を施す。そして、音声信号再生部１３は、音響効果処理の施された各音声信号を外部に再生出力する。

　以下に、音声信号再生装置１の備える音声信号取得部１１、優先度決定部１２１、位置決定部１２２、音声信号処理部１２３および音声信号再生部１３の処理の詳細について、図１および図２を参照して説明する。図２は、音声信号再生装置１を備える音声信号再生システム１００の構成の概要を示す図である。図２に示すように、音声信号再生システム１００は、音声信号再生装置１に加え、信号受信装置３、デジタル－アナログ変換装置（ＤＡＣ）４、増幅装置５およびイヤホン６を含んで構成されている。

　（音声信号取得部）
　音声信号取得部１１は、音声信号再生装置１の外部から１つまたは複数の音声信号を取得し、それらの音声信号を優先度決定部１２１に受け渡す。より具体的には、音声信号取得部１１は、外部から有線通信又は無線通信により外部から音声信号を受信する信号受信装置３を介して音声信号を取得する。例えば、図２に示すように、音声信号取得部１１は、スマートフォンなどの携帯端末２から、信号受信装置３を介して、音声信号を受信する。無線通信としては、Ｂｌｕｅｔｏｏｔｈ（登録商標）やＷｉ－Ｆｉ（ＷｉｒｅｌｅｓｓＦｉｄｅｌｉｔｙ；登録商標）等の無線伝送技術を用いることができるが、特に限定されるものではない。ここで、音声信号は、１つのモノラル音声信号などであればよい。

　なお、説明の簡単のため、本実施形態では、特に断りがない限り、音声信号はＢｌｕｅｔｏｏｔｈ（登録商標）を用いた無線通信により取得され、音声信号取得部１１の取得する音声信号がデジタル信号である場合について説明する。また、音声信号取得部１１は、入力される音声信号が複数の音声信号をインタリーブした形の音声信号である場合には、音声信号取得部１１に入力された場合、複数のモノラル音声信号にデインタリーブする。

　（優先度決定部）
　優先度決定部１２１は、音声信号取得部１１が取得した１または複数の音声信号それぞれに優先度を付与し、各音声信号の優先度を位置決定部１２２に通知する。優先度は、位置決定部１２２が各音声信号の位置決めを行う際の指標となる。

　優先度決定部１２１は、各音声信号に関して、ゲインが所定値Ｔｈ以上になった時刻を音声再生開始時刻として特定し、ゲインが所定値Ｔｈより低くなった時刻を音声再生終了時刻として特定し、音声再生開始時刻および音声再生終了時刻を対応する音声信号に関連付けて記憶部１４に記憶するとともに、音声再生開始時刻に応じた優先度を音声信号に付与し、当該優先度を対応する音声信号に関連付けて記憶部１４に記憶する。なお、優先度は、時々刻々と更新されるものであり、音声再生の終了時刻が経過した後の音声信号には、最低の優先度が割り当てられる。

　（位置決定部）
　位置決定部１２２は、優先度決定部１２１により決定された各音声信号の優先度に基づいて、仮想出力位置を決定する。また、位置決定部１２２は、優先度に加え、予め記憶部１４に記憶された前提条件に基づいて、各音声信号の仮想出力位置を決定してもよい。位置決定部１１２は、決定した仮想出力位置を各音声信号に付与し、各音声信号の仮想出力位置を音声信号処理部１２３に通知する。

　聴取者は、各音声信号の表す音声を、イヤホン（又はスピーカ）などの実際の音源ではなく、音声信号処理部１２３の音響効果処理により設定される仮想的な音源から出力される音声として知覚することになるため、以下、各音声信号の示す音声が仮想的に出力される音源を「仮想音源」と呼び、その音源の位置を「仮想音源位置」（仮想出力位置）と呼ぶ。仮想音源位置は、聴取者の周囲に配置される仮想音源の、聴取者に対する相対位置であり、例えば、聴取者の右耳および左耳の中間位置を原点とする３次元座標により特定される。なお、上記の前提条件は、例えば、音声を聴く聴取者の周囲に配置される仮想音源の個数、位置などである。

　（音声信号処理部）
　音声信号処理部１２３は、音声信号取得部１１が受け取った任意の個数の音声信号に頭部伝達関数（ＨＲＴＦ）を適用し、立体音響方式の音声信号に変換し（立体音響処理を施し）、変換後の音声信号を音声信号再生部１３に受け渡す。具体的には、下記の式１に示すように、Ｎ個の入力信号Ｉ_ｎ（ｚ）に頭部伝達関数（ＨＲＴＦ）であるＨＬ_ｎ（ｚ）及びＨＲ_ｎ（ｚ）を乗算した上で合算し、左耳用信号Ｌ_ＯＵＴおよび右耳用信号Ｒ_ＯＵＴを生成する。

　ただし、ＨＬ_ｎ（ｚ）は、それぞれ入力信号Ｉ_ｎ（ｚ）の設定された仮想音源位置における左耳用ＨＲＴＦであり、ＨＲ_ｎ（ｚ）は、それぞれ入力信号Ｉ_ｎ（ｚ）の設定された仮想音源位置における右耳用のＨＲＴＦである。本実施形態１では、これらＨＲＴＦは、離散的なテーブル情報として、記憶部１４に予め記憶されているものとする。

　（音声信号再生部）
　音声信号再生部１３は、音声信号処理部１２３が算出した音声信号Ｌ_ＯＵＴおよびＲ_ＯＵＴを、任意の音声フォーマットに変換し、外部に再生出力する。図２に示すように、音声信号再生装置１が再生出力したデジタル音声信号を、デジタル－アナログ変換装置（ＤＡＣ）４がアナログ音声信号に変換し、さらに増幅装置５が当該アナログ音声信号を適切に信号増幅した上で、イヤホン６が出力するような構成であるとき、音声信号再生部１３は、例えばＩｎｔｅｒ－ＩＣ　Ｓｏｕｎｄ（Ｉ^２Ｓ）フォーマットで音声信号を再生出力する。

　〈音声信号の優先度〉
　次に、音声信号の優先度およびその変化について、図３および図４を参照して説明する。図３および図４は、所定時刻における音声信号の優先度を示す図である。図３（ａ）は、時刻Ｔ＝ｔ＋２での各音声信号の優先度を示す。音声信号Ｉ１は、音声再生開始時刻がｔであり、音声再生終了時刻がｔ＋４である。音声信号Ｉ２は、音声再生開始時刻がｔ＋１であり、音声再生終了時刻がｔ＋６である。音声信号Ｉ３は、音声再生開始時刻がｔ＋２であり、音声再生終了時刻がｔ＋５である。図示のように、優先度決定部１２１は、音声再生開始時刻が早い方の、音声信号の優先度が高くなるように設定する。ここでの優先度は、数値の小さい方が高いものとする。

　なお、時刻ｔは、音声信号再生装置１が所定の時間帯において複数の音声信号を取り扱う際に、基準となる時刻である。音声信号取得部１１においては、最初の音声信号の取得を開始した時刻が時刻ｔであり、その時刻ｔは外部から音声信号を受信したタイミングにより決まる。一方、音声信号再生部１３においては、最初の音声信号の再生出力を開始すべき時刻が時刻ｔであり、その時刻ｔは音声信号の出力を開始するタイミングとして決められる。

　図３（ｂ）は、時刻Ｔ＝ｔ＋４での各音声信号の優先度を示す。図示のように、時刻Ｔ＝ｔ＋４においては、音声信号Ｉ１の再生が終了しているため、優先度が最も低くなる。このとき、優先度決定部１２１は、音声信号Ｉ１に対して、９９９を最低ランクの優先度として設定する。この時点で再生状態にある音声信号の中で優先度が最も高いものは音声信号Ｉ２となるので、音声信号Ｉ２の優先度が最も高く設定され、次いで音声信号Ｉ３の優先度が高く設定される。

　上記においては、音声再生開始時刻が早い音声信号の優先度が高くなるように設定されるが、他の条件により優先度を決定することにしてもよい。図４は、任意の時刻において、最も直近に音声再生が開始された音声信号の優先度が最も高くなるように設定する例を示す図である。図４（ａ）は、時刻Ｔ＝ｔでの各音声信号の優先度を示す。図示のように、時刻Ｔ＝ｔにおいて、優先度決定部１２１は、音声信号Ｉ１に最も高い優先度１を設定し、まだ再生が開始されていない音声信号Ｉ２およびＩ３に対しては、最も低い優先度９９９を設定する。図４（ｂ）は、時刻Ｔ＝ｔ＋１での各音声信号の優先度を示す。図示のように、時刻Ｔ＝ｔ＋１において、優先度決定部１２１は、直近に音声再生が開始された音声信号Ｉ２に最も高い優先度１を設定し、先に再生が始まっていた音声信号Ｉ１の優先度を音声信号Ｉ２より下げるように設定してもよい。

　〈仮想音源位置決定処理〉
　図５は、音声信号の仮想音源位置決定処理の流れを示すフローチャートであり、特に、音声信号の優先度に変化がある度に仮想音源位置を変更する処理を示す。図示のように、まず、位置決定部１２２は、任意の音声信号Ｉｎについて、その優先度に変更があったか否かを判定する（Ｓ１０１）。音声信号Ｉｎの優先度が変化していない場合に（Ｓ１０１のＮＯ）、同音声信号または別の音声信号の優先度の変化があるまで判定を繰り返す。音声信号Ｉｎの優先度の変化があった場合に（Ｓ１０１のＹＥＳ）、位置決定部１２２は、音声信号Ｉｎに仮想音源位置が設定されているか否かに関わらず、その優先度に応じた仮想音源位置を設定する（Ｓ１０２）。以上のように、音声信号再生装置１がシステムとして動作している間は（Ｓ１０３のＮＯ）、任意の音声信号の優先度の変化に伴って仮想音源位置の更新を行う処理を継続し、システムの終了（Ｓ１０３のＹＥＳ）と共に更新処理を終了する。

　図６は、聴取者と、その周囲に配置される仮想音源位置を示す図である。図６を用いて、図５の処理を具体的に説明する。

　図６（ａ）は、仮想音源位置Ｐ１、Ｐ２、Ｐ３および聴取者Ｐ４を模式的に示した平面図である。本実施形態の前提条件として、仮想音源の位置および個数は予め決定されており、例えば、３つの仮想音源が、聴取者Ｐ４を中心とする同一円周上に等間隔で配置されているものとして説明する。また、仮想音源位置に仮想音源を配置する順序、すなわち、優先度の高い音声信号の仮想音源をＰ１～Ｐ３のいずれの位置に配置するかについても、予め決定されているものとする。ここでは、音声信号取得部１１が取得する音声信号の個数および仮想音源の個数をそれぞれ３とし、Ｐ１、Ｐ２、Ｐ３の順に優先度の高い音声信号の仮想音源が配置されるものとする。なお、上記の前提条件を示す情報が、予め記憶部１４に記憶されているものとする。

　このとき、位置決定部１２２は、図６（ｂ）に示すように、時刻Ｔ＝ｔにおいて優先度の最も高い音声信号Ｉ１の仮想音源をＰ１に配置し、図６（ｃ）に示すように、時刻Ｔ＝ｔ＋１において音声信号Ｉ２をＰ２に配置し、図６（ｄ）に示すように、時刻Ｔ＝ｔ＋２では音声信号Ｉ３をＰ３に配置する。時刻Ｔ＝ｔ＋４においては、図３（ｂ）に示すように、音声信号Ｉ１の再生終了に伴って、音声信号Ｉ２およびＩ３の優先度が更新されるため、位置決定部１２２は、図６（ｅ）に示すように、音声信号Ｉ２の仮想音源位置をＰ１に変更し、音声信号Ｉ３の仮想音源位置をＰ２に変更する。

　＜変形例＞
　上記の実施形態では、音声信号の優先度に変化がある度に仮想音源位置を変更する処理を説明したが、これに限定されるものではない。例えば、各音声信号について仮想音源位置が一度決定されると、その位置を変更しない構成としてもよい。その場合の処理の詳細を、図７を参照して説明する。

　図７は、各音声信号の仮想音源位置が一度決定されると、変更されない処理を示すフローチャートである。

　音声信号再生装置１において、まず、位置決定部１２２は、任意の音声信号Ｉｎについて、その優先度に変更があったか否かを判定する（Ｓ２０１）。ここで、音声信号Ｉｎは、音声信号取得部１１が受け取った１つまたは複数の音声信号のうち、ある１つの音声信号を示す。音声信号Ｉｎの優先度が変化しない場合に（Ｓ２０１のＮＯ）、同音声信号または別の音声信号の優先度が変化する（Ｓ２０１のＹＥＳ）まで判定を繰り返す。本実施形態では音声信号Ｉｎの優先度は、図３を用いて説明したように、各音声信号の再生開始時刻に変化するものとするが、他の条件で変化するものとしてもよい。

　音声信号Ｉｎの優先度の変化があった場合に（Ｓ２０１のＹＥＳ）、位置決定部１２２は、音声信号Ｉｎに対して仮想音源位置が未設定か否かを判定し（Ｓ２０２）、未設定であれば（Ｓ２０２のＹＥＳ）、音声信号Ｉｎに仮想音源位置を設定する（Ｓ２０３）。一方で、音声信号Ｉｎに既に仮想音源位置が設定されていれば（Ｓ２０２のＮＯ）、位置決定部１２２は、音声信号取得部１１が受け取った音声信号すべての仮想音源位置を決定したか否かを判定し（Ｓ２０４）、音声信号すべての仮想音源位置を決定したと判定した場合（Ｓ２０４のＹＥＳ）、処理を終了する。すべての音声信号にはまだ仮想音源位置が付与されていないと判定した場合（Ｓ２０４のＮＯ）、位置決定部１２２は、仮想音源位置の設定されていない音声信号について、優先度の変化が検知されるまで（Ｓ２０１のＹＥＳ）判定処理を続ける。

　図６を用いて、図７の示す処理を具体的に説明する。なお、音源に関する前提条件は、図５の示す処理を説明した際の前提条件と同様である。

　このとき、位置決定部１２２は、音声再生開始時刻の早い音声信号の優先度が高くなるように設定する場合に、図６（ｂ）に示すように、時刻Ｔ＝ｔにおいて優先度の最も高い音声信号Ｉ１をＰ１に配置し、図６（ｃ）に示すように、時刻Ｔ＝ｔ＋１において音声信号Ｉ２をＰ２に配置し、図６（ｄ）に示すように、時刻Ｔ＝ｔ＋２において音声信号Ｉ３をＰ３に配置する。そして、図６（ｅ）に示すように、時刻Ｔ＝ｔ＋４においては、音声信号Ｉ１の再生が終了するので、音声信号Ｉ２およびＩ３をそれぞれＰ１およびＰ２に配置変更する。

　以上、図７の示すフローチャートを用いて説明した実施形態においては、各音声信号の仮想音源位置は一度決定されると、そのときの音声信号に対する仮想音源位置決定処理が終了するまで変更されることはない。

　なお、上記の説明に限ることなく、ユーザが、仮想音源位置決定処理の前提条件として仮想音源の位置および仮想音源を配置すべき位置の優先順位を決定してもよく、音声信号再生装置１に接続されるボタンなどのインタフェース、スマートフォンなどの外部機器を通じて、当該決定した値を音声信号再生装置１に対して設定してもよい。

　〔実施形態２〕
　実施形態１では、各音声信号の再生開始時刻に応じて各音声信号の優先度を決定する構成を例に説明したが、本発明はこれに限定されるものではない。本実施形態では、各音声信号に付随する付加情報に基づいて各音声信号の優先度を決定する構成について、図８から図１３を参照して説明する。

　〈音声信号再生装置の概要〉
　まず、図８を参照して本実施形態に係る音声信号再生装置の構成の概要について説明する。図８は、実施形態２に係る音声信号再生装置１ａの全体構成を示すブロック図である。

　音声信号再生装置１ａは、図８に示すように、ハードウェアとして、音声信号取得部１１、制御部１２ａ、音声信号再生部１３、記憶部１４および付加情報取得部１５（情報取得部）を備える。制御部１２ａは、機能ブロックとして、優先度決定部１２１ａ、位置決定部１２２ａおよび音声信号処理部１２３を備える。

　なお、実施形態１の構成と異なるのは、音声信号再生装置１ａが、付加情報取得部１５をさらに備える構成である。これに伴って、優先度決定部１２１ａおよび位置決定部１２２ａの処理が実施形態１の処理とは異なるが、図１と同じ番号を付した他部の処理については、実施形態１と同様のため、説明を割愛する。

　また、図８の矢印が示すデータの流れに従って説明すると、音声信号再生装置１ａにおいて、音声信号取得部１１が外部から複数の音声信号を取得すると共に、付加情報取得部１５が各音声信号に付随する付加情報を取得する。次に、制御部１２の備える優先度決定部１２１ａが、各付加情報に基づいて各音声信号の優先度を決定し、位置決定部１２２ａが、各付加情報、および、各優先度によって各音声信号の仮想音源位置を決定する。

　以下、付加情報取得部１５、優先度決定部１２１ａおよび位置決定部１２２ａの詳細について説明する。

　（付加情報取得部）
　付加情報取得部１５は、音声信号取得部１１に入力される音声信号に付随する付加情報（所謂メタデータ）を取得する。より具体的には、付加情報取得部１５は、音声信号に付随する付加情報を、音声信号取得部１１による音声信号の取得とは別に外部から取得する。なお、付加情報取得部１５は、有線および無線のいずれの伝送経路を介して付加情報を取得してもよい。

　ここで、付加情報について図９を参照して説明する。図９は、実施形態２に係る付加情報の構成例を示す図である。図９（ａ）は各音声信号の仮想電源を定位させる仮想音源位置を示し、図９（ｂ）は音声信号の示す音声の内容の重要性の度合いである通知重要度を示す。実際の付加情報は、これらの情報のいずれか一方または両方を含むように構成されるものとする。例えば、図９（ｃ）は、音声信号名、通知重要度および仮想音源位置を指定する仮想音源位置指定情報（図９（ｃ）における「仮想音源位置」）を含む付加情報を示す。なお、音声信号名は、例えば、音声の内容を端的に表すものであることが好ましいが、とくに限定されるものではない。

　図９（ｃ）に示すように、音声信号名（音声の内容）が「音楽」である音声信号Ｉ１、音声信号名が「ＳＮＳ新着通知」である音声信号Ｉ３、音声信号名が「ラジオ」である音声信号Ｉ６および音声信号名が「ニュース・天気」である音声信号Ｉ７の通知重要度には、「通常」が設定されている。音声信号名が「電話着信通知」である音声信号Ｉ２および音声信号名が「スケジュールアラート」である音声信号Ｉ４の通知重要度には、「重要」が設定されている。また、音声信号名が「緊急地震速報」である音声信号Ｉ５の通知重要度には、「緊急」に設定されている。

　付加情報は、例えば上述のような形式で構成されており、付加情報取得部１５により取得された付加情報は、優先度決定部１２１ａに通知される。なお、図９（ａ）および（ｃ）に示す仮想音源位置は、例えば、図６（ａ）と同様に、聴取者を中心とし、所定長を半径とする同一円周上に配置されていてもよいし、その他の配置になっていてもよい。

　なお、実施形態２において、付加情報は時々刻々と変化するものであり、所定時間ごとに、または、付加情報の内容に変化があった時点で、例えば、スマートフォンなどの外部機器から適宜送信されるものとして説明する。ただし、付加情報が固定値しかとらない場合には、この限りではなく、例えば、初期設定時に一度送られるだけであってもよい。また、実施形態２において、音声信号と、付加情報とは別々に入力されるものとして説明を行う。

　ただし、音声信号および付加情報が統合された情報（以下、入力データと呼ぶ）として入力されてもよい。この場合、図１０に示すように、音声信号再生装置１ｂが入力データ分離部１６をさらに設けてもよい。このとき、入力データ分離部１６は、外部から入力データを取得し、その入力データを音声信号および付加情報に分離し、音声信号を音声信号取得部１１に受け渡し、付加情報を付加情報取得部１５に受け渡す。なお、入力データ分離部１６は、音声信号再生装置１ｂの外部に接続されていてもよい。

　（優先度決定部）
　優先度決定部１２１ａは、音声信号取得部１１が取得した複数の音声信号と、付加情報取得部１５が取得した、各音声信号に付随する付加情報とに応じて、後述する位置決定部１２２ａにおいて仮想音源の位置決めの際に用いられる優先度を決定し、各音声信号に付与する。

　図９（ｂ）に示すような音声信号それぞれの通知重要度が与えられた場合に、優先度決定部１２１ａは、その通知重要度に応じて、図１１に示すような優先度を決定する。本実施形態では、通知重要度を３段階とし、当該通知優先度のうち、「緊急」に対して優先度１を割り当て、「重要」に対して優先度２を割り当て、「通常」に対して優先度３を割り当てる。ここで与えられる優先度は、実施形態１と同様、数値が小さいほど優先度が高いことを示すものとする。

　なお、通知重要度の割り当ては、上記のような単純な割り当てに限らず、それ以外の手法を用いてもよい。例えば、下記の式２を用いて、図１１に示した重要度に加えて、時間の経過を加味した、連続値をとる優先度Ａを算出することとしてもよい。

　ここで、Ａ（Ｔ）は時刻Ｔでの優先度、αは予め設定された任意の係数、Ｈ（ｘ）は、上記した通知重要度ｘに対する優先度である。

　（位置決定部）
　位置決定部１２２ａは、付加情報取得部１５により取得される付加情報に含まれる仮想出力位置指定情報に基づき、仮想出力位置を決定する。さらに、本実施形態に係る位置決定部１１２ａは、仮想出力位置指定情報に従って決定した仮想出力位置を、優先度に基づいて調整する。また、位置決定部１２２ａは、仮想出力位置指定情報および優先度に加え、予め記憶部１４に設定された前提条件に基づいて、仮想音源位置を決定してもよい。

　〈仮想音源位置決定処理〉
　次に、仮想音源位置決定処理の流れについて、図１２を参照して説明する。図１２は、音声信号の仮想音源位置決定処理の流れを示すフローチャートである。図１２（ａ）は、音声信号の仮想音源位置決定処理の流れの概要を示す。

　まず、位置決定部１２２ａは、任意の音声信号Ｉｎについて、その付加情報が変化したか否かを判定する（Ｓ３０１）。音声信号Ｉｎの付加情報が変化しない場合には（Ｓ３０１のＮＯ）、同音声信号または別の音声信号の付加情報が変化がするまで判定を繰り返す。音声信号Ｉｎの付加情報（例えば、通知重要度）が変化した場合に（Ｓ３０１のＹＥＳ）、当該音声信号の仮想音源位置を更新する（Ｓ３０２）。

　音声信号再生装置１ａの仮想音源位置更新処理では、位置決定部１２２ａが、各音声信号の示す音声を聴く聴取者にとって、当該各音声の仮想音源が異なる方向に位置付くように、音声信号の仮想音源位置を設定する。以上のように、任意の音声信号Ｉｎの付加情報の変化に伴って仮想音源位置の更新を行う処理は、音声信号再生装置１ａがシステムとして動作している間（Ｓ３０３のＮＯ）継続し、システムの終了（Ｓ３０３のＹＥＳ）と共に更新処理を終了する。

　図１２（ｂ）は、各音声信号Ｉｎの仮想音源位置更新処理の流れを示す。本処理は、複数の音声信号のうちの任意の２つの音声信号の仮想音源位置間の距離が所定の距離未満である場合に、当該任意の２つの音声信号のうち上記優先度の低い音声信号に係る仮想出力位置を、他方の音声信号に係る仮想出力位置から所定の距離以上離れた位置に変更する。ここで、所定の距離とは、２個の仮想音源の出力する音声が聴取者にとって異なる方向から聴こえて、区別できることが担保されるような距離を示す。

　まず、位置決定部１２２ａは、音声信号Ｉｎに対して、付加情報に含まれる当該音声信号の仮想音源位置を設定する（Ｓ３０２１）。次に、音声信号Ｉｎの付近に別の音声信号Ｉｍが存在するか否かを判定する（Ｓ３０２２）。ここで、音声信号Ｉｎの仮想音源位置を（ｘ_ｎ, ｙ_ｎ, ｚ_ｎ）、音声信号Ｉｍの仮想音源位置を（ｘ_ｍ, ｙ_ｍ, ｚ_ｍ）とするとき、下記の式３を満たす場合に「音声信号Ｉｎの付近に音声信号Ｉｍが存在する」ものと定義する。

　ただし、βは記憶部１４に予め設定された値である。

　音声信号Ｉｎの付近に別の音声信号Ｉｍが存在しない場合に（Ｓ３０２２のＮＯ）、すべての音声信号をチェックしたときに（Ｓ３０２６のＹＥＳ）、音声信号の仮想音源位置更新処理を終了する（リターン）。すべての音声信号をチェックしていないときに（Ｓ３０２６のＮＯ）、付近に別の音声信号が存在する音声信号について処理を続ける。

　音声信号Ｉｎの付近に別の音声信号Ｉｍが存在する場合に（Ｓ３０２２のＹＥＳ）、音声信号Ｉｎの仮想音源と、音声信号Ｉｍの仮想音源とが近い位置にあるため、聴取者が、音声信号Ｉｎが表す音声の方向と、音声信号Ｉｍが表す音声の方向との区別が付かず、聞き分けることが難しい可能性がある。そこで、位置決定部１２２ａが、予め設定されている２つの音声信号の優先度を比較する（Ｓ３０２３）。そして、音声信号Ｉｎの優先度が音声信号Ｉｍの優先度より高い場合に（Ｓ３０２３のＹＥＳ）、音声信号Ｉｍの仮想音源を本来の位置から上記の式３を満たさなくなる位置まで移動させる（Ｓ３０２４）。一方、音声信号Ｉｎの優先度が音声信号Ｉｍの優先度以下の場合（Ｓ３０２３のＮＯ）、音声信号Ｉｎの仮想音源位置を本来の位置から上記の式３を満たさなくなる位置まで移動させる（Ｓ３０２５）。その後、Ｓ３０２２の判定に戻る。

　仮想音源位置の移動方法については、例えば予め設定された係数γ_ｘ、γ_ｙ、γ_ｚをそれぞれ移動対象の仮想音源位置のｘ座標、ｙ座標、ｚ座標に加算又は乗算することにより、仮想音源位置を変更するものとする。また、仮想音源を移動した後の位置の付近に、他の仮想音源が存在しないように、移動先の位置を設定するものとする。さらに、各仮想音源が聴取者を中心とする同一円周上に配置されるように移動してもよいし、その場合において、各仮想音源の間隔を所定距離β以上とするのが困難なときには、上記円周の半径を長くしてもよい。

　上記に示した通り、音声信号再生装置１ａの位置決定部１２２ａは、各音声信号に紐づけられた付加情報、特に本実施形態では通知重要度および仮想音源位置に基づいて仮想音源の位置関係を決定する。例えば、図９（ｃ）に示すような付加情報を受け取ったと仮定する。そして、音声信号Ｉ１「音楽」が仮想音源位置(x₁, y₁, z₁)で再生されている最中に、音声信号Ｉ２「電話着信通知」の再生が仮想音源位置(x₂, y₂, z₂)で開始されたとする。上記に示した処理の流れによれば、位置決定部１２２ａは、上記の２つの音声信号の仮想音源位置が下記の式４を満たす位置関係であるときに（Ｓ３０２２のＹＥＳ）、その通知重要度を比較すると、音声信号Ｉ１「音楽」の優先度が音声信号Ｉ２「電話着信通知」の優先度より低くなるので（Ｓ３０２３のＮＯ）、音声信号Ｉ１「音楽」の仮想音源位置を（ｘ_１＋γ_ｘ,ｙ_１＋γ_ｙ,ｚ₁＋γ_z）に更新する（Ｓ３０２５）。

　ただし、βは記憶部１４に予め設定された値である。

　音声信号Ｉ１「音楽」の仮想音源は、音声信号Ｉ２「電話着信通知」の再生が続く間には、更新された位置に継続して配置されるが、音声信号Ｉ２「電話着信通知」の再生が終了した後には、音声信号Ｉ１「音楽」の元位置の付近に仮想音源が存在しなくなるため（Ｓ３０２２のＮＯ）、音声信号Ｉ１「音楽」に付加情報として与えられた仮想音源位置に基づき、元の位置 (x₁, y₁, z₁)に再設定される（Ｓ３０２１）。

　また、上記の説明では、音声信号の通知重要度に基づいて音声信号の仮想音源位置を変更するか否かを決定したが、仮想音源位置自体に関する重要性の度合いを示す位置重要度を加味して仮想音源位置を決定してもよい。

　図１３は、音声信号名、仮想音源位置および位置重要度を含む付加情報を示す図である。例えば、指定した仮想音源位置に可能な限り固定したいと考える音声信号に対しては、位置重要度に「高」を設定する。一方、仮想音源位置にあまりこだわらない音声信号に対しては、位置重要度に「低」を設定する。

　図１３に示すように、音声信号Ｉ１「音楽」の位置重要度が「低」であり、音声信号Ｉ２「ナビゲーション」の位置重要度が「高」であった場合に、これらの２つの音声信号の仮想音源が上記の式４を満たす位置関係であったときに、音声信号Ｉ２「ナビゲーション」の仮想音源位置を(x₂, y₂, z₂)の位置に固定することが優先されるため、音声信号Ｉ１「音楽」の仮想音源位置が移動することになり、（x₁＋γ_x, y₁＋γ_y, z₁＋γ_z）に更新される。

　〔実施形態３〕
　実施形態１では、外部から音声信号を取得する構成について説明したが、本発明はこれに限定されるものではなく、外部から変換可能なデータを取得し、そのデータから音声信号を生成する構成を採用することもできる。本実施形態では、音声信号に変換可能なデータを取得し、そのデータから音声信号を生成する音声信号再生装置１ｃの構成について、図１４を参照して以下に説明する。

　図１４は、実施形態３に係る音声信号再生装置１ｃの全体構成を示すブロック図である。音声信号再生装置１ｃは、ハードウェアとして、音声合成部１７、制御部１２、音声信号再生部１３および記憶部１４を備える。制御部１２は、機能ブロックとして、優先度決定部１２１、位置決定部１２２および音声信号処理部１２３を備える。

　実施形態１の構成と異なるのは、音声信号再生装置１ｃが、音声信号取得部１１の代わりに音声合成部１７を備える構成である。図１と同じ番号を付した他部の処理については、実施形態１と同様のため、説明を割愛する。

　以下、音声合成部１７の詳細について説明する。

　（音声合成部）
　音声合成部１７は、複数の通知信号（変換可能なデータ）であって音声信号とは異なる複数の通知信号を取得すると共に、取得した複数の通知信号の各々に対して音声合成処理を施して上記複数の音声信号の各々に対応した音声信号を生成する。なお、以降では、通知信号が示す情報を通知情報とも呼称する。ここで、通知情報は、例えばテキスト形式の情報である。そして、音声合成部１７は、音声合成処理により生成（音声信号に変換）した音声信号を、優先度決定部１２１に受け渡す。

　なお、通知情報は、必ずしもテキスト形式である必要はなく、例えば、外部からの通知情報としてフラグ値だけを通知するようにしてもよい。この場合、記憶部１４は、予め決められたフラグ値と、当該フラグ値に対応付けられた読み上げ音声とを含む対応データを記憶しておく。そして、音声合成部１７は、外部からフラグ値を取得し、記憶部１４の対応データを参照してフラグ値から読み上げ音声を特定し、その読み上げ音声を優先度決定部１２１に出力する。

　また、実施形態１、２と同様に、通知情報の入力手段は、有線および無線のいずれの伝送経路を使用してもよい。

　〔実施形態４〕
　本発明の実施形態４に係る音声信号再生装置１ｄは、音声信号に変換可能なデータにキーワードが含まれているか否かに応じて、通知重要度を設定することもできる。本実施形態に係る音声信号再生装置１ｃの構成について、図１５を参照して説明する。

　図１５は、実施形態４に係る音声信号再生装置１ｄの構成を示すブロック図である。音声信号再生装置１ｄは、ハードウェアとして、音声合成部１７、制御部１２ｄ、音声信号再生部１３および記憶部１４を備える。制御部１２ｄは、機能ブロックとして、優先度決定部１２１ａ、位置決定部１２２ａ、音声信号処理部１２３および付加情報生成部１２４（検出部）を備える。

　実施形態３の構成と異なるのは、制御部１２ｄが、機能ブロックとして付加情報生成部１２４をさらに備える構成である。図１および図１４と同じ番号を付した他の処理部の動作については同図を用いて説明した実施形態１および３と同様のため、説明を割愛する。

　音声信号再生装置１ｄは、外部から１つまたは複数の通知情報を、例えばテキスト形式により取得する。これらの通知情報は、音声合成部１７だけでなく、付加情報生成部１２４にも入力される。

　（付加情報生成部）
　付加情報生成部１２４は、外部から取得したテキスト情報から所定のキーワードを検出すると共に、検出したキーワードに基づいて通知重要度を設定する。具体的には、付加情報生成部１２４は、テキスト情報に、ユーザによって予め設定されて記憶部１４に記憶されているキーワードが含まれるか否かをチェックする。キーワードが含まれる場合に、対応する音声信号の通知重要度を「重要」に設定し、キーワードが含まれていない場合に、対応する音声信号の通知重要度を「通常」に設定するとともに、その対応付けを含む付加情報を生成し、記憶部１４に記憶し、優先度決定部１２１ａに受け渡す。なお、優先度決定部１２１ａは、付加情報生成部１２４により検出されたキーワードに基づいて設定された通知重要度によって、音声信号の優先度を決定する。

　＜変形例＞
　また、本実施形態に係る音声信号再生装置１ｅは、音声信号からキーワードを抽出することもできる。本変形例に係る音声信号再生装置１ｅについて、図１６を参照して説明する。図１６は、実施形態４に係る音声信号再生装置１ｅの構成を示すブロック図である。

　図１６に示すように、本変形例に係る音声信号再生装置１ｅは、図１４に示す音声信号再生装置１ｄの音声合成部１７及び付加情報生成部１２４に替えて、音声信号取得部１１及び音声信号解析部１７（検出部）を備えている。なお、音声信号取得部１１については上述の通りであるため、ここではその説明は省略する。

　（音声信号解析部）
　音声信号解析部１２５は、音声情報取得部１１により取得された音声信号から所定のキーワードを検出すると共に、検出したキーワードに基づいて通知重要度を設定する。具体的には、音声信号解析部１２５は、音声信号取得部１１が取得した音声信号を解析してテキストデータ化し、テキストデータ化されたデータに予め設定されたキーワードが含まれるか否かを判定する。そして、音声信号解析部１２５は、キーワードが含まれる場合に、対応する音声信号の通知重要度を「重要」に設定し、キーワードが含まれていない場合に、対応する音声信号の通知重要度を「通常」に設定するとともに、その対応付けを含む付加情報を生成し、記憶部１４に記憶し、優先度決定部１２１ａに受け渡す。なお、優先度決定部１２１ａは、音声信号解析部１２５により検出されたキーワードに基づいて設定された通知重要度によって、音声信号の優先度を決定する。

　〔まとめ〕
　上記課題を解決するために、本発明の態様１に係る音声信号再生装置は、複数の音声信号を取得する音声信号取得部と、上記音声信号取得部により取得された各音声信号の優先度を決定する優先度決定部と、上記優先度決定部により決定された優先度に応じて、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を決定する位置決定部と、上記位置決定部により決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理部と、上記音声信号処理部により立体音響処理の施された各音声信号を再生する音声信号再生部と、を備えている。

　本発明の態様２に係る音声信号再生装置は、上記態様１において、上記位置決定部が、上記各仮想出力位置が上記音声信号再生部により再生される各音声信号の示す音声を聴く聴取者から互いに異なる方向に位置するように、上記各仮想出力位置を決定することとしてもよい。

　上記の構成によれば、音声信号再生装置は、ユーザから見て異なる方向になるように各仮想出力位置を決定し、それらの位置に応じて各音声信号に立体音響処理を施して、それらの音声信号を出力する。したがって、音声信号再生装置は、複数の音声信号の各々の示す音声があたかも異なる仮想出力位置から出力されているように再生することができる。また、これにより、ユーザは、各音声信号の示す音声を異なる方向から聴くことができるので、各音声信号再生装置において再生される複数の音声を容易に聞き分けることができる。

　本発明の態様３に係る音声信号再生装置は、上記態様１および２において、上記優先度決定部が、上記音声信号の再生開始時刻に応じて当該音声信号の優先度を決定することとしてもよい。

　上記の構成によれば、音声信号再生装置は、優先度を決定する際に、各音声信号の再生開始時刻が早いか、遅いかを優先度に反映する。これによれば、音声信号再生装置は、再生開始の順序に応じた優先度に応じて各音声信号の仮想出力位置が決定することができる。したがって、音声信号再生装置は、複数の音声信号を、再生開始時刻に応じて決定した仮想出力位置から出力されているように再生することができる。

　本発明の態様４に係る音声信号再生装置は、複数の音声信号を取得する音声信号取得部と、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を指定する仮想出力位置指定情報を取得する情報取得部と、上記情報取得部により取得された仮想出力位置指定情報に従って、上記仮想出力位置を決定する位置決定部と、上記位置決定部により決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理部と、上記音声信号処理部により立体音響処理の施された各音声信号を再生する音声信号再生部と、を備えている。

　本発明の態様５に係る音声信号再生装置は、上記態様４において、上記各音声信号の優先度を決定する優先度決定部をさらに備え、上記情報取得部が、上記音声信号の示す音声の内容の重要性の度合いを示す通知重要度をさらに取得し、上記優先度決定部が、上記通知重要度に応じて上記各音声信号の優先度を決定し、上記位置決定部が、上記仮想出力位置指定情報、及び、上記優先度に応じて、上記仮想出力位置を決定することとしてもよい。

　上記の構成によれば、音声信号再生装置は、通知重要度を取得することにより、各音声信号の示す音声をユーザに通知すべき重要性に応じて優先度を決定する。そして、音声信号再生装置は、仮想出力位置指定情報、及び、優先度に応じて、仮想出力位置を決定する。これによれば、仮想出力位置指定情報だけでなく、優先度を含めて考慮して、音声信号に係る仮想出力位置を決定することができる。

　本発明の態様６に係る音声信号再生装置は、上記態様５において、上記位置決定部が、上記仮想出力位置指定情報に応じて決定した上記仮想出力位置を、上記優先度に応じて調整することとしてもよい。

　上記の構成によれば、音声信号再生装置は、各音声信号の仮想出力位置および通知重要度を取得し、通知重要度に応じて各音声信号の優先度を決定し、仮想出力位置および優先度に応じて音声信号の仮想出力位置を決定する。

　これによれば、アプリケーションの提供者が意図する位置に音声信号の仮想出力位置を配置することができる。そして、仮想出力位置に支障があれば、優先度に応じて音声信号の配置を調整することができる。

　本発明の態様７に係る音声信号再生装置は、上記態様６において、上記位置決定部が、上記複数の音声信号のうちの任意の２つの音声信号の仮想出力位置間の距離が所定の距離未満である場合に、当該任意の２つの音声信号のうち上記優先度の低い音声信号の仮想出力位置を、他方の音声信号の仮想出力位置から上記所定の距離以上離れた位置に調整することとしてもよい。

　２個の音声信号の示す音声の仮想出力位置の間が所定距離未満である場合には、ユーザから見て２つの仮想出力位置の距離や方向があまり変わらないため、ユーザが聞き分けられない可能性がある。上記の構成によれば、音声信号再生装置は、そのような場合に、２個の音声信号のうち、優先度が低い方の音声信号に対応する仮想出力位置を所定距離以上離れるように移動する。これによれば、ユーザから見て２つの音声の仮想出力位置を異なる方向にすることにより、ユーザが各音声信号の示す音声を聞き分けることができる。

　本発明の態様８に係る音声信号再生装置は、上記態様５から７において、上記音声信号取得部により取得された音声信号または通知信号から所定のキーワードを検出する検出部をさらに備え、上記優先度決定部が、上記検出部により検出されたキーワードに応じて上記優先度を設定することとしてもよい。

　本発明の態様９に係る音声信号再生装置は、上記態様１から８において、上記音声信号取得部が、音声信号とは異なる複数の通知信号を取得すると共に、取得した複数の通知信号の各々に対して音声合成処理を施して上記複数の通知信号の各々に対応した音声信号を生成することによって、上記複数の音声信号を取得することとしてもよい。

　本発明の態様１０に係る音声信号再生方法は、音声信号再生装置の音声信号再生方法であって、複数の音声信号を取得する音声信号取得ステップと、上記音声信号取得ステップにおいて取得された各音声信号の優先度を決定する優先度決定ステップと、上記優先度決定ステップにおいて決定された優先度に応じて、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を決定する位置決定ステップと、上記位置決定ステップにおいて決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理ステップと、上記音声信号処理ステップにおいて立体音響処理の施された各音声信号を再生する音声信号再生ステップと、を含んでいる。

　本発明の態様１１に係る音声信号再生方法は、音声信号再生装置の音声信号再生方法であって、複数の音声信号を取得する音声信号取得ステップと、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を指定する仮想出力位置指定情報を取得する情報取得ステップと、上記情報取得ステップにおいて取得された仮想出力位置指定情報に従って、上記仮想出力位置を決定する位置決定ステップと、上記位置決定ステップにおいて決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理ステップと、上記音声信号処理ステップにおいて立体音響処理の施された各音声信号を再生する音声信号再生ステップと、を含んでいる。

　なお、本発明の各態様に係る音声信号再生装置は、コンピュータによって実現してもよく、この場合には、コンピュータを上記音声信号再生装置が備える各部として動作させることにより上記音声信号再生装置をコンピュータにて実現させるプログラム、及びそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。

　〔ソフトウェアによる実現例〕
　図１、図８、図１０、図１４、図１５および図１６に示す音声信号再生装置の各ブロックは、集積回路（ＩＣチップ）等に形成された論理回路（ハードウェア）によって実現してもよいし、ＣＰＵ（Central Processing Unit）を用いてソフトウェアによって実現してもよい。

　後者の場合、音声信号再生装置は、各機能を実現するソフトウェアであるプログラムの命令を実行するＣＰＵ、上記プログラム及び各種データがコンピュータ（又はＣＰＵ）で読み取り可能に記録されたＲＯＭ（Read Only Memory）又は記憶装置（これらを「記録媒体」と称する）、上記プログラムを展開するＲＡＭ（Random Access Memory）等を備えている。そして、コンピュータ（又はＣＰＵ）が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路等を用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体（通信ネットワークや放送波等）を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。

　本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。さらに、各実施形態にそれぞれ開示された技術的手段を組み合わせることにより、新しい技術的特徴を形成することができる。

　本発明は、複数のアプリケーションが発信する音声信号を取得し、複数の音声信号が表す音声を聴取者が聴きやすい形式にして、音声信号を再生出力するシステムに利用することができる。

　１、１ａ、１ｂ、１ｃ、１ｄ、１ｅ　音声信号再生装置
　１１　音声信号取得部
　１２　制御部
　１３　音声信号再生部
　１４　記憶部
　１５　付加情報取得部（情報取得部）
　１７　音声合成部
　１２１　優先度決定部
　１２２　位置決定部
　１２３　音声信号処理部
　１２４　付加情報生成部（検出部）
　１２５　音声信号解析部（検出部）

Claims

　複数の音声信号を取得する音声信号取得部と、
　上記音声信号取得部により取得された各音声信号の優先度を決定する優先度決定部と、
　上記優先度決定部により決定された優先度に応じて、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を決定する位置決定部と、
　上記位置決定部により決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理部と、
　上記音声信号処理部により立体音響処理の施された各音声信号を再生する音声信号再生部と、
　を備えることを特徴とする音声信号再生装置。
　上記位置決定部は、
　上記各仮想出力位置が上記音声信号再生部により再生される各音声信号の示す音声を聴く聴取者から互いに異なる方向に位置するように、上記各仮想出力位置を決定する
　ことを特徴とする請求項１に記載の音声信号再生装置。
　上記優先度決定部は、
　上記音声信号の再生開始時刻に応じて当該音声信号の優先度を決定する
　ことを特徴とする請求項１または２に記載の音声信号再生装置。
　複数の音声信号を取得する音声信号取得部と、
　上記各音声信号の示す音声が仮想的に出力される仮想出力位置を指定する仮想出力位置指定情報を取得する情報取得部と、
　上記情報取得部により取得された仮想出力位置指定情報に従って、上記仮想出力位置を決定する位置決定部と、
　上記位置決定部により決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理部と、
　上記音声信号処理部により立体音響処理の施された各音声信号を再生する音声信号再生部と、
　を備えることを特徴とする音声信号再生装置。
　上記各音声信号の優先度を決定する優先度決定部をさらに備え、
　上記情報取得部は、上記音声信号の示す音声の内容の重要性の度合いを示す通知重要度をさらに取得し、
　上記優先度決定部は、上記通知重要度に応じて上記各音声信号の優先度を決定し、
　上記位置決定部は、上記仮想出力位置指定情報、及び、上記優先度に応じて、上記仮想出力位置を決定する
　ことを特徴とする請求項４に記載の音声信号再生装置。
　上記位置決定部は、上記仮想出力位置指定情報に応じて決定した上記仮想出力位置を、上記優先度に応じて調整する、
　ことを特徴とする請求項５に記載の音声信号再生装置。
　上記位置決定部は、
　上記複数の音声信号のうちの任意の２つの音声信号の仮想出力位置間の距離が所定の距離未満である場合に、当該任意の２つの音声信号のうち上記優先度の低い音声信号の仮想出力位置を、他方の音声信号の仮想出力位置から上記所定の距離以上離れた位置に調整する
　ことを特徴とする請求項６に記載の音声信号再生装置。
　上記音声信号取得部により取得された音声信号または通知信号から所定のキーワードを検出する検出部をさらに備え、
　上記優先度決定部は、上記検出部により検出されたキーワードに応じて上記優先度を設定する
　ことを特徴とする請求項５から７のいずれか一項に記載の音声信号再生装置。
　上記音声信号取得部は、音声信号とは異なる複数の通知信号を取得すると共に、取得した複数の通知信号の各々に対して音声合成処理を施して上記複数の通知信号の各々に対応した音声信号を生成することによって、上記複数の音声信号を取得する
　ことを特徴とする請求項１から８のいずれか一項に記載の音声信号再生装置。
　音声信号再生装置の音声信号再生方法であって、
　複数の音声信号を取得する音声信号取得ステップと、
　上記音声信号取得ステップにおいて取得された各音声信号の優先度を決定する優先度決定ステップと、
　上記優先度決定ステップにおいて決定された優先度に応じて、上記各音声信号の示す音声が仮想的に出力される仮想出力位置を決定する位置決定ステップと、
　上記位置決定ステップにおいて決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理ステップと、
　上記音声信号処理ステップにおいて立体音響処理の施された各音声信号を再生する音声信号再生ステップと、
　を含むことを特徴とする音声信号再生方法。
　音声信号再生装置の音声信号再生方法であって、
　複数の音声信号を取得する音声信号取得ステップと、
　上記各音声信号の示す音声が仮想的に出力される仮想出力位置を指定する仮想出力位置指定情報を取得する情報取得ステップと、
　上記情報取得ステップにおいて取得された仮想出力位置指定情報に従って、上記仮想出力位置を決定する位置決定ステップと、
　上記位置決定ステップにおいて決定された各仮想出力位置に応じて、上記各音声信号に対して立体音響処理を施す音声信号処理ステップと、
　上記音声信号処理ステップにおいて立体音響処理の施された各音声信号を再生する音声信号再生ステップと、
　を含むことを特徴とする音声信号再生方法。
　請求項１から９のいずれか一項に記載の音声信号再生装置としてコンピュータを機能させるためのプログラムであって、コンピュータを前記各部として機能させるためのプログラム。
　請求項１２に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。