JPH0990963A - 音情報提供装置、及び音情報選択方法 - Google Patents

音情報提供装置、及び音情報選択方法

Info

Publication number
JPH0990963A
JPH0990963A JP7241284A JP24128495A JPH0990963A JP H0990963 A JPH0990963 A JP H0990963A JP 7241284 A JP7241284 A JP 7241284A JP 24128495 A JP24128495 A JP 24128495A JP H0990963 A JPH0990963 A JP H0990963A
Authority
JP
Japan
Prior art keywords
sound
user
sound information
virtual
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7241284A
Other languages
English (en)
Other versions
JP3834848B2 (ja
Inventor
Yuichi Yagawa
雄一 矢川
Hiromi Ukai
ひろみ 鵜飼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP24128495A priority Critical patent/JP3834848B2/ja
Publication of JPH0990963A publication Critical patent/JPH0990963A/ja
Application granted granted Critical
Publication of JP3834848B2 publication Critical patent/JP3834848B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】複数の音情報を同時に提供する手段と、利用者
が欲する音情報の選択手段とを提供し、人間とコンピュ
ータ、人間と人間との対話効率を音情報により向上させ
る。 【構成】利用者の位置又は動作の検出手段と、命令やデ
ータの入力手段と、命令やデータの複数の処理手段と、
処理結果を音情報として出力する手段と、利用者位置又
は動作から音情報とその音情報を出力する処理の選択手
段と、命令やデータを選択された処理に送る切り替えス
イッチと、利用者位置又は動作に基づいて各音情報の音
源を仮想音空間に配置する手段と、同じく利用者位置又
は動作に基づいて仮想音空間での利用者位置を設定する
手段と、仮想音空間における音源位置と利用者位置に基
づいて音像を定位し、音情報が音源位置から利用者位置
に向かって聞こえるかのように加工する手段と、音像定
位加工後の音情報をそれぞれ出力する手段とを有する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音を用いて利用者に情
報を提供する装置に係り、特に複数の音情報を同時に利
用者に提供する音情報提供装置、及び利用者が複数の音
情報のなかから欲する情報を選択する音情報選択方法に
関する。
【0002】
【従来の技術】「いつでもどこでも」コンピュータを扱
いたい、他人とコミュニケーションをとりたい、情報に
アクセスしたいとのニーズから、携帯型情報通信システ
ムや車載型情報通信システムなどいわゆるモーバイルコ
ンピューティングへの期待が高まりつつある。特に、電
子手帳やパーソナルディジタルアシスタント(Pers
onal Digital Assistants、以
下PDAという)またはパーソナルインテリジェントコ
ミュニケータ(Personal Intellige
nt Communicator、以下PICという)
と呼ばれる携帯型コンピュータ及び、ページャや、携帯
電話、自動車電話といった携帯型のコミュニケーション
ツールは、世の中に広く受け入れられつつある。
【0003】従来の携帯型情報通信システムは、入力手
段として電子ペンやタッチパネル、出力手段として液晶
ディスプレイ、コミュニケーション手段として無線デー
タ通信装置などから構成されている。主な用途として
は、スケジュール管理や住所録などいわゆるパーソナル
インフォメーションマネージメント(Personal
Information Management、PI
M)機能、情報やサービスの検索・利用、電子メールや
電子会議等が挙げられる。また、エージェント(電子秘
書)と呼ばれる電子的な秘書の概念に相当するプログラ
ムが、情報検索やスケジュール管理など、利用者にとっ
て面倒な仕事を代行する。例えば、利用者が入力したス
ケジュールを時間通りに伝達する。
【0004】これら既存のシステムにおいても、音情報
を積極的に利用したものはない。従来のデスクトップ型
のコンピュータと同様に、効果音など補助的に用いてい
るのみである。以上、最近の携帯型情報通信システムに
ついては、日経エレクトロニクス1995年2月13日
号(no.628)pp73〜97、日経BP社に詳し
い。
【0005】また、既存の車載型情報通信システムは、
入力手段としてリモコンやジョイスティック、出力手段
として液晶ディスプレイ、自動車の位置を計測する自動
車測位装置などから構成されている。目的地まで経路誘
導する自動車ナビゲーション機能が主な用途である。ま
た、将来には無線データ通信装置を内蔵し、道路交通情
報の提供サービスに対応するシステムも開発される。音
情報の利用については、音声認識によるコマンド入力機
能、合成音声による情報出力機能を備えたシステムがあ
る。
【0006】一方、コミュニケーションツールでは、小
型ラジオなどの放送受信装置、携帯電話などの音声通信
装置、携帯型CDプレーヤなどの音再生装置など、携帯
型で音により情報を提供する装置は多い。また、例えば
携帯型ラジオ付きCDプレーヤなどのように、複数のコ
ミュニケーション手段を組み合わせて、一つの装置で複
数の音情報にアクセスできるような装置も登場しつつあ
る。
【0007】
【発明が解決しようとする課題】一般に、PDAなど既
存の携帯型情報通信システムでは、情報出力手段として
液晶ディスプレイを前提としているものが多い。このた
め、小形化は進みにくく、また仮に小形化されたとして
も画面が小さく、そこから得る情報には限りがある。
【0008】省スペース及び携帯性という観点から考え
ると、携帯型情報通信システムでは、音情報による入力
及び出力が有効である。例えば、携帯電話などは小形化
が進み、スーツの内ポケットに入れて持ち運べるぐらい
に小さいものまで登場しつつある。携帯型情報通信シス
テムでも音による入出力を前提にすると、同程度まで小
形化できる可能性がある。
【0009】また、車載型情報通信システムにおいて
も、音による情報出力が望ましい。経路情報を音声で伝
えてくれると、視線を情報表示画面に移す必要もなくな
る。
【0010】しかし、音情報は時系列データであり、時
間軸に依存する度合が視覚情報に比べて高いため、直感
性や一覧性に劣るという問題がある。このため、利用者
が音情報を用いて情報通信システムと対話する場合は、
逐次処理が前提となり、効率が悪い。
【0011】従って、本発明の目的は、携帯型、車載型を
はじめとする各種情報処理装置において、音による情報
の提供を行う装置、あるいは方法を提供し、音情報によ
る人間とコンピュータとの対話及び人間と人間との対話
の効率を向上させることである。
【0012】また、本発明の具体的な目的は、同時に提
供されている複数の音情報から利用者が欲する音情報を
選択する方法、装置を提供することである。
【0013】また、本発明の他の具体的な目的は、複数
の音情報を提供する処理手段に対し、命令、データを入
力する方法、装置を提供することである。
【0014】また、本発明の他の目的は、目が不自由な
人向けの情報提供装置を提供することである。
【0015】
【課題を解決するための手段】上記目的を達成するため
に本発明は、複数の音情報を利用者に提供する装置であ
って、前記複数の音情報を生成する処理手段と、前記複
数の音情報の仮想的な音源位置を音空間に定義する仮想
音空間定義手段と、前記音情報の音像を、前記定義され
た仮想音源位置に定位させる音像定位加工手段と、音像
定位加工された前記複数の音情報を出力する手段と、利
用者指示を検出する利用者指示検出手段と、前記利用者
指示に基づいて、前記仮想音源位置に配置された前記音
情報とその音情報を生成する処理手段を選択する音情報
操作手段とを備えたものである。
【0016】また、前記利用者指示検出手段が検出する
利用者指示は、利用者動作、あるいは利用者音声の少な
くともいずれか一つであることを特徴とするものであ
る。
【0017】また、前記音情報提供装置は、利用者の位
置を測定する位置測定手段を備え、前記音情報は、当該
音情報が関連する事象の位置情報を属性として備え、仮
想音空間定義手段は、前記位置測定手段が測定した利用
者位置と、前記音情報が表す位置に基づいて、前記利用
者位置を基準とした前記音情報の仮想的な音源位置を定
義することを特徴とするものである。
【0018】また、前記利用者指示検出手段は、検出し
た利用者指示から方向を表す要素を抽出し、前記音情報
操作手段は、前記方向を表す要素が示す方向の前記仮想
音源位置に配置された音情報を選択することを特徴とす
るものである。
【0019】また、前記音情報提供装置は、命令やデー
タを入力する手段を備え、前記音情報操作手段は、前記
利用者指示検出手段が検出した利用者指示または、前記
入力された命令またはデータを前記選択された音情報を
生成する処理手段に送ることを特徴とするものである。
【0020】また、前記仮想音空間定義部は、前記音空
間をあらかじめ定めた基準位置を中心に構成し、前記利
用者指示検出手段は、前記抽出した方向を表す要素を補
正して、前記基準位置を中心とした方向に補正すること
を特徴とするものである。
【0021】また、前記音情報を生成する処理手段は、
音情報毎に属性を定義し、前記仮想音空間定義手段は、
あらかじめ音情報の属性毎に仮想的な音空間における音
源位置決定規則を定めておき、提供される音情報の属性
を前記音源位置決定規則に当てはめて音源位置を決める
ことを特徴とするものである。
【0022】また、前記音情報を生成する処理手段は、
指定された処理を行い、処理終了時にその処理結果、ま
たは終了通知を音情報にて出力するものであることを特
徴とするものである。
【0023】また、前記音情報は、属性として重要度ま
たは優先度を備え、前記仮想音空間定義手段は、前記重
要度または優先度が高い音情報を利用者位置の近くに定
義し、前記重要度または優先度が低い音情報を利用者位
置から遠くに定義するように設定するものである。
【0024】また、前記音情報操作手段は、前記利用者
指示に基づき、選択した音情報の音像に対し、前記音像
の移動と、音量の変更と、一時的な出力の停止と、一時
停止の解除と、優先出力と、優先出力からもとの状態へ
の復帰と、音情報の出力停止のいずれかを行なうよう前
記仮想音空間定義手段を制御するものである。
【0025】また、前記音出力手段の出力数は、前記音
像定位加工手段が音像定位加工した音情報の数より少な
い数であって、前記音情報提供装置は、前記音像定位加
工手段が音像定位加工した音情報を、前記音出力手段の
出力数に合成する手段を備えたことを特徴とするもので
ある。
【0026】また、本発明は、複数の音情報を利用者に
提供する装置であって、前記複数の音情報を生成する処
理手段と、前記複数の音情報の仮想的な音源位置を音空
間に定義する仮想音空間定義手段と、前記音情報の音像
を、前記定義された仮想音源位置に定位させる音像定位
加工手段と、音像定位加工された前記複数の音情報を出
力する手段と、利用者位置を検出する利用者位置検出手
段と、前記利用者位置に基づいて、利用者位置近傍の前
記仮想音源位置に配置された前記音情報とその音情報を
生成する処理手段を選択する音情報操作手段とを備えた
ことを特徴とするものである。
【0027】また、本発明は、複数の通信相手と音声通
信する装置であって、前記複数の通信相手と通信するた
めの通信手段と、前記複数の通信相手と自分の仮想的な
位置を音空間に定義する仮想音空間定義手段と、前記通
信手段から出力される前記複数の通信相手と自分の音声
の音像を、前記定義された仮想位置に定位させる音像定
位加工手段と、音像定位加工された前記複数の音声を出
力する手段と、利用者動作を検出する利用者動作検出手
段と、前記利用者動作に基づいて、前記仮想位置に配置
された前記通信相手を選択する音情報操作手段とを備え
たことを特徴とするものである。
【0028】また、本発明は、複数の音情報を利用者に
提供する装置であって、前記複数の音情報を生成する処
理手段と、利用者位置を検出する利用者位置検出手段
と、前記利用者位置に基づいて、前記複数の音情報の仮
想的な音源位置を音空間に定義する仮想音空間定義手段
と、前記音情報の音像を、前記定義された仮想音源位置
に定位させる音像定位加工手段と、音像定位加工された
前記複数の音情報を出力する手段とを備えたことを特徴
とするものである。
【0029】また、本発明は、利用者を乗せ、音情報を
前記利用者に提供する、移動可能な装置であって、前記
音情報を生成する処理手段と、前記移動可能な装置の位
置を測定する装置位置測定手段と、前記装置の位置に基
づいて、前記音空間における利用者位置を設定する仮想
利用者位置設定手段と、前記音情報の仮想的な音源位置
を、前記設定された利用者位置に基づいて、固定された
音空間に定義する仮想音空間定義手段と、前記音情報の
音像を、前記定義された仮想音源位置に定位させる音像
定位加工手段と、前記音像定位加工された前記音情報を
出力する手段とを備えたことを特徴とするものである。
【0030】また、前記音情報提供装置は、利用者指示
を検出し、検出した利用者指示から方向を表す要素を抽
出する利用者指示検出手段と、前記方向を表す要素が示
す方向の前記仮想音源位置に配置された音情報を選択す
る音情報操作手段とを備えたことを特徴とするものであ
る。
【0031】また、本発明は、複数の音情報の仮想的な
音源位置を音空間に定義し、前記音情報の音像を、前記
定義された仮想音源位置に定位させ、前記定義された仮
想音源位置から、前記複数の音情報を出力し、前記仮想
音源を選択する利用者指示に基づいて、前記選択された
仮想音源から出力される音情報を選択することを特徴と
するものである。
【0032】また、本発明は、複数の音情報の仮想的な
音源位置を音空間に定義し、前記音情報の音像を、前記
定義された仮想音源位置に定位させ、前記定義された仮
想音源位置から、前記複数の音情報を出力し、前記音空
間を移動する利用者の位置に基づいて、前記利用者の位
置近傍にある仮想音源から出力される音情報を選択する
ことを特徴とするものである。
【0033】
【作用】一般に、コンピュータと人間との対話の効率を
向上させる一つの方法としては、複数の仕事を同時に行
う並行処理があげられる。既存のコンピュータシステム
では、並行処理を行うための手段として、「マルチウィ
ンドウ」が用意されている。また、利用者が「マルチウ
ィンドウ」ごとに分けられた処理を選択する手段とし
て、マウスなどの「ポインティングデバイス」が用意さ
れている。利用者は「マルチウィンドウ」ごとに処理を
割り当てて、必要に応じてポインティングすることによ
り処理を選択する。利用者は意識するしないにかかわら
ず、平行的に仕事を進めることができ、この結果、人間
とコンピュータとの対話の効率も向上する。音の世界に
も同様の仕組みを導入すれば、対話の効率も上がり、さ
らには、電話や放送など既存のコミュニケーション手段
をそれぞれ「マルチウィンドウ」として組み合わせたシ
ステムも可能になる。
【0034】実世界において、無音という状況はありえ
ない。人間は常に何らかの音を無意識のうちに聞き分け
ており、自分に必要な音情報だけを選択して聞いてい
る。騒がしいカクテルパーティであっても自分の興味あ
る話題が会話にのぼると、たとえ離れたところにいても
自然に耳に入る。音響心理学において、先の人間の特性
はこの現象にちなんでカクテルパーティ効果と呼ばれて
いる。
【0035】コンピュータが作り出す仮想的な音の世界
で絶えず多様な音が聞こえていても、カクテルパーティ
効果により利用者は音情報を取捨選択できる。そこで、
まず音源を仮想的な音の空間に配置することによって音
情報を区別しやすくする。複数の音情報が同時に聞こえ
たとしても、聞こえてくる方向がそれぞれ違うため、利
用者は音情報を識別しやすい。この仮想的な音空間に配
置した音源が「ウィンドウ」に相当する。
【0036】更に、複数の音情報の中から利用者が希望
のものを選択する手段を備える。基本的に、空間内で方
向を示せるものであれば良く、本発明では利用者の位置
または動作により、音情報を選択する。例えば、利用者
がある地点に移動すると、その場所に対応付けられた音
情報が聞こえる。あるいは、音が聞こえてくる方向を指
し示すことにより、音情報を選択する。この利用者の位
置または動作により音情報を選択する手段が「マウス」
に相当する。
【0037】本発明では、仮想的な空間に情報を処理す
る手段を割り当てて、処理結果は音で返す。音が聞こえ
てくる方向によって処理内容を判断できるので、利用者
は処理結果に対してすばやく応答できる。また、電話や
放送など従来のコミュニケーション手段も同じ音空間に
割り付ける。利用者は仮想的な音空間から必要な処理を
次々と選択することによって平行して仕事を進めること
ができ、結果的に人間とコンピュータとの対話及び人間
と人間との対話の効率も向上する。
【0038】
【実施例】以下、図面を参照して本発明の一実施例を説
明する。
【0039】<発明の概要説明>図1は、本発明の特徴
を概念的に表す図である。まず、音源として、利用者1
からの命令をサーバコンピュータまたはローカルなコン
ピュータで代行して処理してその処理結果を合成音声で
出力する電子秘書2と、通信手段を用いて複数の相手と
通信する電子会議3及び4と、ラジオなどの放送または
CDプレーヤなどの音再生5がある。それぞれの出力音
は、あたかも仮想音空間10内のそれぞれ音像6、7、
8、9に実際の音源があるかのように聞こえる。
【0040】音像とは音響的に作られた感覚上の音源の
ことを言い、本実施例では仮想音源と同義に用いる。利
用者1は頭部や手等、身体の一部を用いてそれぞれの音
像すなわち音情報を選択し、音情報に対する各種処理を
実行する。利用者が行う処理には、例えば音像位置の移
動、音量変更、音量最小化、音量最小化解除、一時停
止、一時停止解除、出力優先(他の音源からの出力をす
べて一時停止)、出力優先解除、停止などがある。音情
報の内容、種類に応じて音像を配置できるので、利用者
は出力音が聞こえてくる方向からその内容を容易に把握
できる。また、複数の音情報を同時に聞く場合だけでな
く、必要に応じて他の音源からの出力量を抑えて、一つ
の音情報を聞くなどもできる。
【0041】音像6〜9にはそれぞれ処理手段2〜5が
対応付けられている。つまり、利用者1が仮想音空間1
0内の音像を選択することはすなわち処理手段をも選択
したことになる。よって、利用者1はコマンドや音声な
どのデータを各処理手段に入力することができ、また処
理手段を切り替えることによって平行的に仕事を進める
ことが可能になる。
【0042】<装置構成概略説明>図2は、本発明の一
実施例に係る音情報提供装置の利用イメージと基本構成
を表す。本装置は携帯型であり、その外部構成は本体部
20と、利用者1の現在位置及び手の動作を測定する利
用者位置・動作測定部21と、利用者1の頭の向きを測
定する利用者頭部向き測定部22と、利用者1の音声を
入力するマイク23と、本体部20が生成した仮想音空
間の出力音を利用者1が聞くためのヘッドホン24とか
ら成る。ここで、利用者位置・動作測定部21は腕時計
型で、利用者1がコマンドやデータの一部を入力する手
段もともに兼ね備えている。また、マイク23をヘッド
ホン24に接続せず、利用者位置・動作測定部21に内
蔵し、必要に応じてマイクを口に近づけて音声入力する
構成も考えられる。
【0043】本体部20の内部構成は、利用者位置・動
作測定部21及び利用者頭部向き測定部22で測定され
たデータを解析して利用者動作31及び利用者位置32
を検出する利用者状態検出部30と、利用者の入力音声
をA/D(アナログ・デジタル)変換する音声入力部4
0と、入力音声を認識してコマンドやデータの文字列に
変換する音声認識部41と、本体部20または利用者位
置・動作測定部21に設けられたボタン等からコマンド
及びデータを入力する入力部42と、利用者が選択した
音情報を判断し、その音情報の識別番号と当該音情報を
出力する仮想音源の識別番号とコマンドまたはデータを
メッセージ51としてカプセル化し、そのメッセージ5
1を適切な処理手段に転送するメッセージ転送部50
と、利用者のコマンドを処理する電子秘書60と、利用
者のコマンドをサーバコンピュータ61で処理するため
のデータ通信手段62と、それぞれの処理結果を合成音
声で出力する音声合成部63と、ラジオ等の放送局71
からの電波を受信する放送受信手段70と、CD81等
を再生する音再生手段80と、他の利用者92〜93と
コミュニケーションするための音声通信手段90〜91
と、前記メッセージ51の内容や各音情報の属性103
に従って仮想的な音空間内における利用者位置101ま
たは音源位置102が定義されるよう規則を決める仮想
音空間定義部100と、前記定義した位置に基づいて音
情報を仮想的な音空間に音像定位し加工する仮想音空間
作成部110と、前記作成結果または個別の音情報を一
時的に記憶する音情報一時記憶領域114と、音情報を
D/A(デジタル・アナログ)変換してヘッドホン24
から出力する仮想音空間出力部113とから成る。
【0044】本実施例では、仮想音空間作成部110に
音像定位加工処理111を設けたことにより、仮想音空
間定義部100で設定した仮想利用者位置101または
仮想音源位置102に基づいて、複数の音情報を仮想的
な音空間に音像定位できる点に特徴がある。ここで音像
定位とは、音を音響的に加工し、感覚上の音源である音
像を作り出すことである。この音像定位により、利用者
は本装置が作り出した音像から本当に音情報が聞こえて
くるように感じる。また、仮想音空間定義部100で音
像の位置を調整することにより、複数の音情報がそれぞ
れ違った方向から聞こえてくるといった音響効果を作り
出すことができる。利用者は音情報をその聞こえてくる
方向から明確に区別できるので、複数の音情報の中から
一つを選択して処理することが可能になる。
【0045】次に、本実施例では、利用者位置・動作測
定部21や利用者頭部向き測定部22を設けたことによ
り、利用者が音情報を直感的にそして感覚的に選択でき
る点に特徴がある。具体的には、利用者状態検出部30
で利用者が向いた方向や指し示した方向を検出し、その
方向から聞こえてくる音情報を選択したものと判断す
る。また、ボタンや音声で音情報を選択することもでき
る。この場合、音情報が聞こえてくる方向を音声で指定
したり、または方向が記載されたボタン等を使って選択
する。あるいは、それぞれの音情報に名前等の識別子を
付けておき、その識別子を音声やボタン等で選択する方
法も考えられる。なお、これら利用者の向き、指し示し
た方向、発声、ボタン操作などを総称して利用者指示と
いうことにする。
【0046】さらに、本実施例では、メッセージ転送部
50で利用者が選択した音情報とそれに対する処理をメ
ッセージ51としてカプセル化し、適切な処理手段にそ
のメッセージを転送する点に特徴がある。ここでいう処
理手段には、仮想音空間定義部100、電子秘書60、
放送受信手段70、音再生手段80、音声通信手段90
及び91がある。仮想音空間定義部100は音情報が音
像定位されている仮想的な音源に対する処理を実行す
る。例えば、先に検出された利用者位置32または身振
り手振りなどの利用者動作33から仮想的な音空間にお
ける利用者位置または音源位置を設定する。すなわち、
利用者は同時に聞こえる複数の音情報の中から優先して
聞きたい音情報を選択したり、聞きたくない音情報を消
したり、音情報の聞こえる方向やそれぞれの音量を自由
に変更したりできる。
【0047】また、仮想音空間定義部100以外の処理
手段では、音情報そのものを生成する。利用者が音情報
を選択したということは、その音情報を生成する処理手
段をも選択したことになり、当該処理手段にコマンドま
たはデータを送ることになる。図2の例では、電子秘書
60が選択され、利用者からのコマンドまたはデータが
送られ、その処理結果が音声合成部63で合成音として
仮想音空間作成部110に出力されている。
【0048】<装置外観図の説明>図5、図6は、本体
部20と利用者位置・動作測定部21のそれぞれ装置外
観の一例を示す図である。画面201にはタッチパネル
が重ねられていて、入力用ボタンの数を減らすためにプ
ログラムによって画面201上に表示されたソフトウェ
アボタンをペン202、または、指で選択するという操
作を行う。また、仮想音空間における音像の配置を画面
に表示し、利用者が音像の位置をビジュアルに確認した
り、表示された音像を画面上で選択するという操作も行
う。
【0049】ボタン203は、モード切替や、頻繁に使
うコマンド入力用のソフトウェアボタンまたは機械的な
ボタンである。例えば、電子会議用のコマンドを入力し
たいときは電子会議モードのボタンを選択し、電子秘書
にコマンドを送りたいときは電子秘書モードのボタンを
選択する。つまり、モードは音情報を出力する処理の種
類ごとに用意されている。頻繁に使うコマンドとして
は、例えば音量調節等がある。カードスロット204〜
206には、赤外線通信機、ラジオ受信機やパーソナル
・ハンディフォン・システム(以下、PHSという)通
信機等のカードを差す。利用者が必要に応じて通信手段
を選択できるフレキシブルな構成となっている。
【0050】カードとして、最近普及しつつあるパーソ
ナル・コンピュータ・メモリ・カード・インターナショ
ナル・アソシエーション(Personal Comp
uter Memory Card Internat
ional Association、以下、PCMC
IAという)対応のカードを用いる。また、図5ではス
ロットの数が3個となっているが、特にこの数に限定し
ているわけではない。
【0051】本体部20には、赤外線通信機207と有
線データ通信のためのモデム208が内蔵されている。
利用者は本体部20を持ち運んで利用するため、カバー
209で画面201を保護する。本実施例では、画面2
01を主に入力の手段として用いているが、もちろん処
理結果を音情報として出力するのにあわせて、画面20
1に処理結果をビジュアルに表示してもよい。
【0052】利用者位置・動作測定部21にも画面21
1が備えられている。通常は、時刻を表示しているが、
利用者からの要求に応じて仮想音空間における音像の配
置等を表示する。また、ボタン212は、本体部20で
行えるコマンドのショートカットキーまたは数字等の簡
単なデータ入力もできるようになっているので、利用者
は本体部20をいちいち取り出して操作する必要がな
い。マイク213はヘッドホン24に具備してあるマイ
ク23を利用者が屋外で用いるのに不都合がある場合に
用いる。利用者位置・動作測定部21は腕時計型の形状
なので、バンド214で利用者の腕に固定して用いる。
なお、上記画面201、211は液晶パネルを使用する
のが一般的である。
【0053】<ハードウェア構成の説明>図2の各構成
要素を実現するハードウェア構成について、図3を用い
て説明する。まず、利用者位置・動作測定部21は、利
用者の現在位置を測定するグローバル・ポジショニング
・システム(以下、GPSという)120と、利用者の
動作を測定するジャイロ121から成り、本体部20へ
は赤外線通信機を用いて無線でデータ送信する。GPS
は周回衛星を利用した測位システムであり、最近自動車
用ナビゲーションシステムの自動車測位装置として広く
用いられている。各周回衛星からは衛星の経度、緯度、
高さ、時刻のデータが送信され、これをGPSが受信す
る。そして、到達するまでにかかった時間から各衛星ま
での距離を計算し、GPSの現在位置を得る。測位精度
を上げる工夫もなされており、現状では位置を数十メー
トルの誤差内で特定できる。また、小形化も進み、腕時
計と同程度の大きさのGPS装置も登場するとの予測も
ある。GPSについては、日経エレクトロニクス(日経
BP社)1995年2月13日号(no.628)pp187
〜194などに詳しい。
【0054】ジャイロ121は、角速度センサの一種
で、内蔵の振動子の振動から角速度または回転角を検出
する。利用者の腕の向きの水平方向と垂直方向の回転角
をそれぞれ検出できるよう、二軸ジャイロ(または水平
方向用と垂直方向用の二つのジャイロ)を用いる。当該
ジャイロでは一定時間ごとに回転角を測定し、本体部2
0に送る。本体部20では、当該回転角の変化量から利
用者の手の動きを計算する。実装については、圧電振動
ジャイロ等を用いることで携帯可能な利用者位置・動作
測定部21を開発できる。
【0055】利用者頭部向き測定部22もジャイロ12
2を用いて利用者の頭部の向いている方向を測定する。
ここでも、二軸ジャイロ(または水平方向用と垂直方向
用の二つのジャイロ)を用い、水平方向と垂直方向の頭
部の向きを測定する。また、図2に示すように、本体部
20へは有線でデータを送信している。スピーカ151
は、利用者がヘッドホン24の代わりに用いる。スピー
カ151については後述する。
【0056】次に、本体部20は、図4に記載した各種
プログラムを実行する中央処理装置(以下、CPUとい
う)130と、プログラムやデータを一時保存するメモ
リ131と、プログラムや処理パラメータを記憶してお
く外部記憶装置(以下、ディスクという)132と、利
用者がモード切替、コマンド及びデータを入力するボタ
ン類141(図5、図6のボタン203、ボタン212
に相当する)と、マイクから入力された音声をアナログ
・デジタル変換するA/D変換器140と、出力音をデ
ジタル・アナログ変換するD/A変換器150と、サー
バコンピュータとデータ通信するための赤外線通信機1
60と、ラジオ受信機161と、CDプレーヤ162
と、データ通信または音声通信のためのPHS通信機1
63及び164と、各音情報をアナログ・デジタル変換
するA/D変換器165〜168とから成る。なお、図
示していないが、本体部20と、利用者位置・動作測定
部21には上述の液晶パネルがあり、CPU130から
の指示に従って、表示を行う。
【0057】ボタン類141の例としては、電源のON
/OFFスイッチ、音量調整つまみ、放送局選択用の周
波数調整つまみ、CDプレーヤ制御用ボタン、アルファ
ベットやひらがな等を入力するキャラクタボタン、電話
番号等を入力する数値ボタン等がある。装置を携帯でき
るサイズにおさめるため、本体部20や利用者位置・動
作測定部21に液晶ディスプレイとタッチパネルを備
え、プログラムによって画面に表示されたグラフィカル
・ユーザ・インタフェース(以下、GUIという)のボ
タンやメニュー(以下、ソフトウェアボタンまたは単に
ボタンと呼ぶ)を利用者がペン、指等で選択する構成で
ある。画面201、211、ボタン203、ボタン21
2がボタン類141に相当する。タッチパネルは、感圧
式、電磁誘導式、超音波式、静電誘導式などの方式が使
用可能である。
【0058】また、赤外線通信機160、ラジオ受信機
161、PHS通信機163、164は、カードスロッ
ト204〜206に必要に応じてカードを入れ替えると
いった構成を採用する。以上述べてきたハードウェア構
成要素は、システムバス169で互いに連結されてお
り、データの受け渡しや制御をこのシステムバスを通じ
て行う。
【0059】<ソフトウェア構成の説明>図4は、プロ
グラムとデータ、及びプログラム間の制御とデータの流
れを示すソフトウェア構成図である。また、図中の矩形
のブロックはプログラムを表し、角が丸いブロックはデ
ータを表す。この図から、図2で記載した利用者状態検
出部30、メッセージ転送部50、仮想音空間定義部1
00、仮想音空間作成部110は複数のプログラムとデ
ータから成るソフトウェアモジュールで実現されること
がわかる。また、本実施例では、本体部20を携帯サイ
ズに収めるため、音声認識部41、音声合成部63もソ
フトウェアで実現する。
【0060】なお、これらソフトウェアは、通常ディス
ク132に格納されており、必要に応じてメモリ131
に読み出され、CPU130がそれを実行するものであ
る。もちろん、メモリ131上にこれらソフトウェアが
あらかじめ格納されていてもよい。
【0061】以下、プログラム制御の流れに従って各構
成要素を順次説明する。入力音声データ43は、利用者
がマイク23を用いて入力した音声をアナログ・デジタ
ル変換したものである。音声認識部41では、この入力
音声データ43を認識し、コマンド44またはデータ4
5に変換する。ここで、ディスプレイやキーボード等を
用いず音声情報だけで認識誤りを修正することが困難な
場合は、認識率を向上させるため、利用者は単語毎に区
切って発話するものとする。また、特定話者の単語音声
認識に限定し、認識方式も実用化が進んでいるDPマッ
チングアルゴリズム等を用いる。
【0062】コマンド46とデータ47は、本体部20
または利用者位置・動作測定部21に設けたボタンから
の入力に相当する。先のコマンド44及び46とデータ
45及び47は、それぞれメッセージ転送部50に送ら
れる。入力音声データ43は、他の利用者と音声通信す
る場合にメッセージ転送部50に送られる。利用者状態
検出部30には、利用者動作検出処理33と、利用者位
置検出処理34がある。ある一定時間ごとに利用者動作
と利用者位置を検出し、それぞれ、利用者動作管理テー
ブル35と利用者位置管理テーブル36に記録する。詳
細は後述する。
【0063】メッセージ転送部50では、メッセージ5
1を作成し、適切な処理手段へ転送する。以下、メッセ
ージ51のデータ構造及び処理方法について順に説明す
る。本発明では、並行処理を前提としており、並行して
走るプログラムをプロセスと呼ぶ。電子秘書プログラム
(以下、エージェントという)群64やハードウェア制
御プログラム72などのように、利用者が陽に指定して
起動するプログラムをユーザプロセスと呼び、仮想音空
間の構成を変えるプログラム等、システムが起動・制御
するプログラムをシステムプロセスと呼ぶ。メッセージ
51は利用者が入力したコマンド及びデータを、それら
を渡すべきプロセスと仮想音源の識別子とともにカプセ
ル化したものである。そして、そのデータ構造は、メッ
セージ自身の識別子であるメッセージIDと、仮想音源
の識別子である仮想音源ID56と、プロセスの識別子
であるプロセスID57と、コマンド58と、データ5
9とからなる。
【0064】メッセージ51が作成されると、メッセー
ジ転送処理55では、次にメッセージ内のプロセスID
に相当するプログラムすなわち、仮想音空間定義部10
0と、エージェント群64と、ハードウェア制御プログ
ラム群72のいずれかに当該メッセージを転送する。こ
れらのプログラムは、メモリ上に置かれたイベント駆動
型のプログラムである。つまり、何らかの要求がプログ
ラムに送られると、各プログラムはCPU130をタイ
ムシェアして使いながら、処理を実行する。
【0065】なお、エージェント群64としては図10
に示す種類のものが考えられるが、新たに利用者または
第三者が作成したエージェントをシステムに導入でき
る。この際、エージェントの名称(プロセス名称)やコ
マンドジェスチャ、コマンドボイス、コマンドボタンを
新たに定義しておく。エージェント群64の処理結果
は、文字列として音声合成部63に送られて音声データ
103として出力する。
【0066】ハードウェア制御プログラム群72として
は、PHS通信機163、164を制御して電子会議を
行うための電子会議プログラム、ラジオ受信機161、
CDプレーヤ162、赤外線通信機160を制御するプ
ログラムを用意しておく。処理結果、受信内容、再生内
容は音情報115として出力される。
【0067】仮想音空間定義部100では、仮想的な音
空間における利用者の位置と音源の位置を設定する。こ
の設定では、利用者の位置は固定したままで仮想音源の
位置を変える場合(仮想音源位置設定処理104)と、
あらかじめ仮想音源が設置されている仮想音空間を利用
者が自由に動きまわる場合(仮想利用者位置設定処理1
05)の二種類の利用場面について考える。
【0068】仮想音源位置設定処理104では、図12
に示す仮想音空間管理テーブル106を用いて仮想音源
の位置を定義・管理する。当該テーブルは、仮想音源I
Dごとに、プロセスID、出力状態、仮想音源位置から
なる。プロセスIDは、それぞれの仮想音源に割り当て
てあるプロセスを識別するために用いる。特に、利用者
が仮想音源を選択してコマンドまたはデータを入力する
際に、システムがどのプロセスに対して入力が行われた
かを識別するために用いる。
【0069】また、音情報は視覚情報に比べ、継続性が
ない。そのため、聞き逃した音を再度聞き直すことがで
きるように、音情報一時記憶領域114をメモリ13
1、またはディスク132内に用意しておく。
【0070】<詳細な説明>次に、上述の各構成要素の
更に詳しい構成を説明する。まず、利用者動作検出処理
33の動作について図7、図8を用いて説明する。図7
はメモリ131に設ける利用者動作管理テーブル(以
下、動作管理テーブルという)35の構成を示す図であ
る。この動作管理テーブル35には、検出時刻とその時
刻における手の向きと頭の向きとを記録する。ここで
は、水平方向と垂直方向の基準面からの回転角の組で向
きを表している。
【0071】図8に頭の向きを検出する場合の例を示
す。垂直方向の基準面220は常に利用者1の正面にあ
り、回転角は利用者1が正面から向かって右方向を向い
た場合に正の値をとり、左方向を向いた場合に負の値を
とる。図8(a)では、利用者1の頭部の向きは、水平
方向で−45度となっている。また、水平方向の基準面
221は常に利用者1の耳の位置にあり、回転角は利用
者1が上方向を向いた場合に正の値をとり、下方向を向
いた場合に負の値をとる。図8(b)の例では、利用者
1の頭部の向きは、垂直方向で+20度となっている。
それぞれの回転中心については後述する。
【0072】図7は、図8(a)での利用者頭部の向き
を記録している。すなわち、時刻が18時30分40秒
から42秒までの間に、頭部の向きが水平方向に−45
度だけ変化している。利用者の動作は短時間に変化する
可能性があるため、1秒といった短い単位時間ごとに検
出する。また、テーブル35は、利用者動作の変化を1
0分程度連続して記録できるように容量を決め、メモリ
131に設ける。手の動きについても同様であるが、詳
細は後述する。
【0073】利用者動作検出処理33は、まず、ジャイ
ロ122で測定した頭部の水平方向と垂直方向の回転角
を、バス169を介して得る。そして、ジャイロ122
がとりつけてある位置と基準面との誤差を考慮し、回転
角を補正して動作管理テーブル35に記録する。
【0074】図2に示すように、ジャイロ122を内蔵
する利用者頭部向き測定部22が利用者1の頭部頂点に
配置してある場合は、水平方向の誤差はないが、垂直方
向では利用者の耳の位置とジャイロ122の位置が違う
ため、耳から頭部頂上までの高さ分の誤差補正を行う。
各利用者間で耳から頭部頂上までの高さの個人差は無視
できるほど小さいと考えると、誤差補正処理があらかじ
めジャイロに組み込まれているといった構成でもよい。
【0075】手の向きを検出する場合も上記とほとんど
同じ処理になる。利用者動作検出処理33では、ジャイ
ロ121の位置と基準面との誤差を考慮し、ジャイロ1
21で測定した回転角を補正して動作管理テーブル35
に記録する。垂直方向の基準面220は利用者の正面に
あり、回転角は利用者が正面から向かって右方向に手を
向けた場合に正の値をとり、左方向に向いた場合に負の
値をとる。同じく、水平方向の基準面221は常に利用
者の耳の位置にあり、回転角は利用者が手を上方向に向
けた場合に正の値をとり、下方向に向けた場合に負の値
をとる。手の動きにあわせてジャイロ121の位置が変
わることによって生じる誤差については、利用者動作・
位置測定部21にジャイロの位置を測定する装置を内蔵
するか、または誤差を許容または予測できる範囲での手
の移動しか認めないといった制限を設け、補正を可能に
する。
【0076】以上の説明では、音像を三次元空間に定位
させることを前提としていたが、装置を簡単かつ安価に
するため、音像を水平方向にのみ定位させる実施もあり
える。この場合は、一軸のみ検出するジャイロを一つ用
いる。
【0077】次に、利用者位置検出処理34の動作につ
いて、図9を用いて説明する。図9は、メモリ131に
設ける利用者位置管理テーブル(以下、位置管理テーブ
ルという)36の構成を示す図である。位置管理テーブ
ル36には、利用者位置・動作測定部21で測定した利
用者の現在位置を記録する。図9に示す例では、GPS
120で測定した経度と緯度と高度を記録している。1
8時30分から32分までの間に、利用者は東経140
度20分30秒、北緯40度40分35秒、高度10M
の位置から東へ経度6秒分(約180メートル)移動し
ている。図9の例では、経度、緯度は秒単位までであ
り、高度はメートル単位なので、利用者検出処理の分解
能は水平方向で30メートル程度、また垂直方向では1
メートルとなっているが、他の応用ではさらに分解能を
あげてもよいし、また逆に下げてもよい。
【0078】利用者位置管理テーブル36は、利用者が
連続して移動する時間(例えば10時間程度)を連続し
て記録できるように容量を決め、メモリ131に設け
る。
【0079】<メッセージの説明>次にメッセージ51
について、図を用いて説明する。図10はメッセージ5
1の例を示すものである。この図からわかるように、メ
ッセージが送られるプロセスごとにコマンド58の種類
とデータ59の受け渡し方は違う。まず、メッセージI
D100〜102は仮想音空間定義部100(図10で
はプロセスIDが0)に送られるメッセージの例であ
る。仮想音空間定義部100では受け取ったメッセージ
内の仮想音源IDから処理を施すべき仮想音源を特定
し、同じメッセージ内のコマンドを実行する。この際、
データ59にはコマンドを実行する際の引数が記述され
ている。例えば、メッセージID100では、左方向か
ら聞こえてくる仮想音源を右方向へ移動するといった具
合に解釈する。仮想音源定義部に対するコマンドは、上
述の通りであるが、「強制停止」コマンドでは該当する
仮想音源に割り当ててあるプロセスを強制終了する。
【0080】次に、メッセージID200〜203では
エージェント群64に対するコマンドとデータをカプセ
ル化している。エージェントプログラムの種類には、例
えばPIMエージェント、データベース(以下、DBと
いう)検索エージェント、ニュースウォッチエージェン
ト、位置監視エージェント等がある。PIMエージェン
トは、例えば利用者のスケジュールや住所録等の利用者
個人情報の管理を行う。メッセージID200では7月
1日のスケジュールとして関西出張を入力している。こ
の際、利用者が音声でデータを入力する場合は、日付や
時間等は音声認識する必要があるが、予定は利用者の音
声のままで保存していても構わない。
【0081】メッセージID201ではDB検索エージ
ェントに利用者が現在いる場所の観光名所を探させてい
る。このとき、利用者の現在位置はGPSから得る。ニ
ュースウォッチエージェントは放送されているニュース
を利用者の代わりに常にウォッチし、利用者が指定した
内容を含むニュースのみ取り出して利用者に聞かせる。
このため、利用者はニュースを常に聞いていなくても自
分の興味あるニュースを自動的に入手できる。また、こ
の場合はラジオ放送によるニュースだけでなく、テレビ
放送によるニュースであっても、エージェントによるウ
ォッチは可能で、放送内容から音声を認識し、利用者が
指定した話題に関するキーワードとマッチングさせる。
【0082】メッセージID202では米国に関するニ
ュースを集めてくるようにエージェントに命令してい
る。また、この処理結果は、エージェントが最新のニュ
ースを入手する度に利用者にその旨報告する。このと
き、エージェントは、処理が終わった時点で、終わった
ことをまずアラーム、メッセージにて報告し、利用者か
ら改めて指示があってから結果を報告するようにしても
よい。エージェントからのアナウンスはプロセスが割り
当ててある左方向から常に聞こえてくるので、利用者は
聞こえてくる音声がエージェントからの出力結果である
ことを判断できる。
【0083】位置監視エージェントは、利用者の現在位
置を常に把握し、目的地までの道案内等を行う。もちろ
ん、目的地の位置情報も属性として目的地データの中に
備えていて、その相対位置関係を用いる。メッセージI
D203では東京駅までの道順をナビゲーションするよ
うにエージェントに命令している。この際、現在位置か
ら見た目的地の方向に仮想音源を配置し、利用者が進む
方向を直感的に分からせるといった工夫もできる。位置
監視エージェントが扱う事象としては、道案内の目的地
だけではなく、後述する交通渋滞なども可能である。
【0084】次に、メッセージID300〜302はハ
ードウェア制御プログラム72に送られるメッセージで
ある。メッセージ300と301では電子会議の際の利
用者本人の入力音声がメッセージとしてカプセル化さ
れ、それぞれプロセスID21と22の電子会議プログ
ラムに送られている。電子会議の相手に送るメッセージ
が相手毎に分かれているので、それぞれの相手と秘話通
話もできる。また、メッセージ302ではラジオ制御プ
ログラムに音量を3レベル落とすよう命令している。
【0085】<メッセージ作成処理の説明>次にメッセ
ージ作成処理54について、図を用いて説明する。図1
1は、選択音源判定処理53を含むメッセージ作成処理
54の処理フローを示す図である。流れを説明する前
に、選択音源判定処理53(ステップ232、237、
243)について説明する。選択音源判定処理53で
は、利用者が選択(ポインティング)した仮想音源を判
定し、メッセージ51内の仮想音源ID56を決める。
以下では、本実施例におけるポインティングの方法と選
択音源判定処理を場合分けして説明する。マウスに備え
られているボタンのように、ポインティングデバイスに
は選択を確定する手段が必要である。本実施例の利用者
が選択する仮想音源の確定について説明する。
【0086】まず、利用者の身ぶりのみで選択を確定す
る方法について説明する。この場合、あらかじめ選択を
確定するジェスチャ(以下、ピッキングジェスチャ:P
icking Gestureと呼ぶ)を定義してお
く。例えば、利用者が頭部の向きを変えてうなずくと、
向いた方向にある仮想音源を選択したとみなす。また
は、利用者が腕の向きを変えて腕を軽く振ると、腕を向
けた方向に配置してある仮想音源を選択したとみなす。
この場合、普段の行為と区別するため、2回以上うなず
かないと選択が確定されないなど、通常行うことが希な
ジェスチャにする。
【0087】次に、身ぶりと音声を組み合わせた方法に
ついて説明する。先と同じく、選択を確定する音声(以
下、ピッキングボイス:Picking Voice)
を定義しておく。例えば、「これ」「それ」といった指
示語であったり、「選択」といった行為を表す言葉でも
構わない。利用者が頭や腕の向きを変えた時に、先のピ
ッキングボイスを発声すると、その頭部向きまたは腕の
向きにある仮想音源を選択したとみなす。
【0088】次に、身ぶりと特別なデバイスを組み合わ
せた方法について説明する。このデバイスとしてはあら
かじめ本体部20または利用者動作・位置測定部21に
備え付けてあるボタン203、212等のひとつ(以
下、ピッキングボタン:Picking Button
という)を用いる。利用者が頭や腕の向きを変えた時
に、ピッキングボタンを押すと、その頭部向きまたは腕
の向きにある仮想音源を選択したとみなす。
【0089】また、身ぶりを用いず、すべて音声で行う
方法もある(直接指定という)。例えば、「右方向」
「左前方」といった具合に、仮想音源が配置してある方
向または場所を音声で指定する。あるいは、仮想音源や
プロセスに名前等の識別子を付けておいて、その名前を
直接呼んで選択する。後者の場合は、仮想音源の名前を
指定するのではなく、むしろ「DB検索エージェント」
といった具合にプロセス名を直接指定する場合でも、そ
のプロセスが割り当ててある仮想音源をも選択したとみ
なす。または、仮想音源の位置を画面201または21
1に表示し、その位置をペン等でクリックするといった
仕組みが考えられる。
【0090】同じ方向に複数の仮想音源が配置してある
場合は、利用者が指定する方向からだけでは選択された
仮想音源を同定することが難しい。本実施例では、利用
者がプロセス名で直接指定するか、仮想音源選択後に入
力されるコマンドでシステム側が自動的に識別するか、
または識別できない場合はシステム側から利用者に問い
合わせるといった方法をとる。上記いずれの選択方法に
おいても、選択された仮想音源を利用者に確認させると
いう意味で、仮想音源から出力される音量を大きくした
りして変化させるといったことも有効である。
【0091】次に全体の流れについて説明する。まず、
ステップ230では利用者操作を検出する。利用者が行
う操作には、ジェスチャによる操作と、音声による操作
と、ボタンによる操作の三種類がある。ジェスチャを検
出する場合は、常に利用者動作管理テーブル35(図7
参照)を監視しておき、頭部または手の向きの変化量が
あるしきい値を越えた場合に利用者がジェスチャを入力
したとみなす。また、音声が入力された場合とボタンが
押された場合は、それぞれ音声による操作とボタンによ
る操作とみなす。ステップ230でジェスチャ、音声ま
たはボタンの入力が検知されない場合はなにもせずにメ
ッセージ作成処理54を抜ける(ステップ248)。メ
ッセージ作成処理54はタイマを用いてある一定時間ご
とに起動するようにし、これによって利用者操作検出を
繰り返す。
【0092】ステップ231ではそのジェスチャを解析
し、それがピッキングジェスチャまたはコマンドジェス
チャであるかを判定する。ここで、コマンドジェスチャ
とは利用者がコマンドを入力するためのジェスチャを意
味し、例えば頭部を横方向に振ると選択済み仮想音源の
音出力を一時停止するといった具合に、ジェスチャとコ
マンドの対応をあらかじめ決めておく。そして、ピッキ
ングジェスチャとコマンドジェスチャともに利用者の標
準ジェスチャをあらかじめ登録しておき、入力ジェスチ
ャとのマッチングをとる。利用者は常に同じ動作を忠実
に繰り返すという前提は現実的でなく、特に時間軸のズ
レは大きいと考えられる。そこで、ジェスチャの特異変
化点を符号化してその符号列でマッチングする方法や、
時間軸のズレを吸収するDPマッチングアルゴリズムを
使って標準ジェスチャと入力ジェスチャの変化パターン
を比較する方法を用いる。
【0093】ピッキングジェスチャを検出すると、現在
の頭部向きまたは手の向きにある仮想音源を選択したと
みなし、仮想音源IDをメッセージ内にセットする(ス
テップ232)。
【0094】コマンドジェスチャを検出した場合は、そ
のコマンドがどのプロセスに対するコマンドであるかを
まず識別する(ステップ233)。例えば「移動」、
「一時停止」、「出力優先」等の仮想音源に対するコマ
ンドを検出した場合は、メッセージ転送先のプロセスを
仮想音空間定義部にセットする。それ以外のコマンド
(つまりユーザプロセスに対するコマンド)を検出した
場合は、既にメッセージ内にセットしてある仮想音源I
Dを調べて、その仮想音源に割り当ててあるプロセスを
転送先にセットする。転送先としては、エージェントや
ハードウェア制御プログラムになる。この際、プロセス
IDは、図12に示す仮想音空間管理テーブルから選択
済み仮想音源IDに該当するものを検索する。また、検
出したコマンドが当該プロセスに合致しない場合は、ス
テップ235で利用者に警告を発し、利用者操作検出に
戻るか、または、利用者に確認をうながす。
【0095】ステップ234では、コマンド内容とデー
タをメッセージにセットする。ここで、メッセージが完
成したことになるので、メッセージ転送処理55によっ
て適切なプロセスにメッセージが送られる。
【0096】入力ジェスチャがピッキングジェスチャと
コマンドジェスチャのいずれとも違う場合は何もせずに
メッセージ作成処理を抜け、再度利用者操作検出を繰り
返す(ステップ235)。
【0097】同じく音声が入力された場合は、ステップ
236で入力音声を認識し、それがピッキングボイスま
たはコマンドボイスであるかを判定する。ここで、コマ
ンドボイスとは利用者が音声で入力したコマンドを意味
する。先にも述べたように、音声認識には特定話者の単
語音声認識を用いるので、あらかじめピッキングボイス
とコマンドボイスともに利用者の標準音声を登録してお
き、入力音声とのマッチングをとる。
【0098】ピッキングボイスには、身ぶりや手振りに
よる選択を確定するための「これ」「それ」といった指
示語や「選択」といった行為を表す言葉をあらかじめ設
定しておく。これらピッキングボイスを検出した際は、
その時点における頭部向きまたは手の向きにある仮想音
源を選択したとみなし、仮想音源IDをメッセージ内に
セットする(ステップ237)。
【0099】「DB検索エージェント」といった具合
に、プロセス名を音声で直接指定する場合は、プロセス
名で指定したプロセスIDとそのプロセスが配置してあ
る仮想音源のIDをメッセージ内にセットする(ステッ
プ238)。この場合も、図12に示す仮想音空間管理
テーブルを参照し、直接指定したプロセスに対応する仮
想音源IDを求める。
【0100】コマンドボイスを検出した場合の処理(ス
テップ239及びステップ240)は、コマンドを音声
認識によって識別すること以外は、コマンドジェスチャ
を検出した場合のステップ233とステップ234とほ
とんど同じなので詳細は省く。同じく、検出したコマン
ドが選択済みの仮想音源に割り当ててあるプロセスと矛
盾する場合や入力音声がピッキングボイスとコマンドボ
イスのいずれとも合致しない場合は、ステップ235と
同様に利用者に警告を発し、利用者操作検出に戻る(ス
テップ241)かまたは利用者に確認をうながす。
【0101】ボタンによる入力が検出された場合は、ス
テップ242で利用者が選択したボタンを識別し、それ
がピッキングボタンまたはコマンドボタンのいずれかで
あるかを判定する。ここで、コマンドボタンとは利用者
がボタンで入力したコマンドを意味する。
【0102】ピッキングボタンには、身ぶりや手振りに
よる選択を確定するためのボタンをあらかじめ決めてお
く。このピッキングボタンを検出した際は、その時点に
おける頭部向きまたは手の向きにある仮想音源を選択し
たとみなし、仮想音源IDをメッセージ内にセットする
(ステップ243)。
【0103】プロセス名を表示したボタンを直接指定す
る場合は、プロセス名で指定したプロセスIDとそのプ
ロセスが配置してある仮想音源のIDをメッセージ内に
セットする(ステップ244)。ステップ238と同じ
く、仮想音空間管理テーブルを参照し、直接指定したプ
ロセスに対応する仮想音源IDを求める。
【0104】コマンドボタンを検出した場合の処理(ス
テップ245及びステップ246)は、コマンドをボタ
ン選択/非選択によって識別すること以外は、コマンド
ジェスチャを検出した場合のステップ233とステップ
234とほとんど同じなので詳細は省く。検出したコマ
ンドが選択済みの仮想音源に割り当ててあるプロセスと
矛盾する場合は、利用者に警告を発し、利用者操作検出
に戻るか、または、利用者に確認をうながす。また、そ
の他のボタンが押された場合は、そのボタンに割り当て
てある処理を実行する(ステップ247)。
【0105】次に、仮想音空間定義部100と、その中
の仮想音源位置設定処理104について、図12を用い
て詳しく説明する。図12に示す出力状態は、各仮想音
源からの音出力の状態を表し、通常出力と最小出力と優
先出力と一時停止等の状態をとる。直感的には、仮想音
源からの出力音の音量であらかじめ決められたレベルと
とらえても構わない。つまり、通常出力の場合は、他の
仮想音源からの出力音と同等に扱われ、すべて同程度の
音量レベルで出力される。最小出力では、最小限聞こえ
る程度の音量レベルで音が出力される。優先出力では、
他の仮想音源からの出力音はすべて最小出力状態にな
り、結果的に当該仮想音源からの出力音が優先されるこ
とになる。一時停止状態では、当該仮想音源の出力音量
レベルが0になり、利用者には何も聞こえなくなる。
【0106】仮想音源位置は、感覚上の音源が利用者か
らみてどこに配置されているかを表す。図12中の水平
位置Xと水平位置Yと高さZは、利用者の両耳を結ぶ線
をX軸にとり、両耳間の中心を通り当該X軸と垂直をな
す線をY軸に取った座標上での交点を原点としたときの
それぞれX座標とY座標を表す。同様に、高さZは利用
者の耳の位置からみた高さ方向位置を表す。図12中で
はともにメートル単位で記入してある。このX軸、Y軸
は、前述の水平方向の基準面221に含まれる。さら
に、前述の利用者動作管理テーブル35に記録する回転
角は、このX軸、Y軸の交点(原点)を回転中心とす
る。
【0107】メッセージ作成処理54が作成したメッセ
ージ51を、その内容に従って、メッセージ転送処理5
5が該当するユーザプロセスに送ると、仮想音源位置設
定処理104が当該ユーザプロセスに適当な仮想音源を
割り当てて、さらに当該仮想音源をデフォルトの位置に
配置するように、仮想音源位置管理テーブル106を設
定する。
【0108】いったん仮想音源の位置が決まると、あと
は利用者が自由に配置を換えたり、各仮想音源からの出
力音の音量を調整できる。利用者は先にも述べた各コマ
ンドを入力し、仮想音源の配置や出力音量を調整する。
これらのコマンドは仮想音源IDとともにメッセージと
してカプセル化され、仮想音空間定義部100に送られ
てくる。
【0109】仮想音空間定義部100では、メッセージ
内の仮想音源IDとコマンドをみて仮想音空間管理テー
ブル106を修正する。ここで、「移動」コマンドを受
け取った場合は、該当する仮想音源IDの音源位置をメ
ッセージ内のデータに従って書き換える。また、「音量
最小化」、「音量最小化解除」、「一時停止」、「一時
停止解除」、「出力優先」、「出力優先解除」の各コマ
ンドを受け取った場合は、テーブル内の出力状態を書き
換える。この際、「出力優先」の場合は指定された仮想
音源(または仮想音源群)以外はすべて自動的に最小出
力状態にし、「出力優先解除」とともに元の状態に戻
す。「音量変更」では各音源からの出力音量をアナログ
的に調整する。
【0110】また、人間の聴覚は方向性に比べて距離感
の音像定位は鈍いので、仮想音空間で利用者と仮想音源
間の距離を変化させることは音量を変化させることで対
応する。最後に、「強制停止」コマンドでは、メッセー
ジで指定された仮想音源IDのデータを仮想音空間管理
テーブル106から削除し、同時に当該仮想音源に割り
当ててあったプロセスをメモリ131内から削除する。
【0111】また、システム側で自動的に仮想音源の位
置や出力音量を調整する場合もある。特に、緊急を要す
る情報や利用者があらかじめ命じておいた処理の結果は
システム側で自動的に優先出力する必要がある。このた
めには、図13に示すように、ユーザプロセスが出力す
る音情報に重要度や内容識別子といった音情報属性を付
加できるようにしておき、同時に仮想音空間定義部内の
属性に対する音源位置決めの規則も変更する。例えば、
音声メールを相手利用者に送る場合を想定すると、送り
先に早急に聞いて欲しい内容は重要度を高く設定する。
【0112】仮想音空間定義部では、当該音情報が他の
音情報に優先して出力されるように加工し、受け手側で
は当該音情報が他の音情報に優先して出力される。また
同様に、定義しておくことで、相手側でも即座に聞きた
い内容をあらかじめメールエージェントに伝えておき、
当該メールエージェントは音情報属性内の内容識別子か
ら送られてきたメールの内容を判断し、送り先が設定し
た重要度にかかわらず当該音情報を優先出力する。
【0113】この際、優先出力する前にエージェントか
ら利用者にその旨伝達し、利用者からの許可を待って優
先出力する仕組みにする。なお、他のメールについては
利用者が好きなときにいつでも聞けるものとする。ま
た、ニュースウォッチエージェントが利用者が要求する
内容に合致したニュースを入手した場合も同様にシステ
ム側で優先出力する。
【0114】図12に示すような仮想音空間が定義され
ると、続いて仮想音空間作成部110は、この定義の通
りに各音情報が利用者に聞こえるような仮想音空間を作
成する。具体的には、音情報内の仮想音源ID(図13
参照)をキーとして、仮想音空間管理テーブル106か
ら当該音情報の仮想音空間における状態を検出し、その
状態にあうよう音データを加工する。各音データが加工
されると、それらをヘッドホンまたはスピーカの配置に
あうように合成して出力する。音像定位加工及び合成の
やり方で大きく二種類の構成が考えられ、それぞれ図1
4と図15に構成例を示す。
【0115】図14では、仮想音空間内に定位する音像
の数と位置があらかじめ固定してあり、入力される音情
報の数が、その音像の数と一致またはそれ以下である場
合の構成を表し、音入力250〜251と仮想音空間管
理テーブル252とクロスバースイッチ253と音出力
254〜255からなる。クロスバースイッチ252で
は、仮想音空間内での音像位置に対応するように、音入
力と音出力を対応付ける。
【0116】具体的には、音入力内にどの仮想音源から
出力すべきかを記載しておき、また仮想音空間管理テー
ブル252には各仮想音源がどの音出力に割り付けてあ
るかを記載しておく。クロスバースイッチ253は当該
仮想音空間管理テーブルを通じて音入力と音出力を対応
付ける。例えば、音出力手段としてヘッドホンを用いる
場合を考えると、入力音は必然的に二種類に限られ、ク
ロスバースイッチ253が入力音をヘッドホンの右及び
左の出力に対応付ける。この場合は構成が簡単で、安価
に実施できる。
【0117】図15は、音像の数を音出力手段の数に依
存させない場合の仮想音空間作成部の構成を示すもので
ある。。音入力260〜261から音出力270〜27
1にマッピングするフィルタ264〜267を設け、こ
の結果を各出力手段ごとに設けたミキサで合成する。こ
こで音像の数を可変にできるよう、フィルタやミキサに
はプログラム可能なDSP(Digital Signal Proccesso
r)等を用いる。また、音出力手段がヘッドホンなどの
ように音信号を両耳に直接伝達する場合とスピーカによ
っていったん音響空間を経て利用者に伝達する場合の二
種類について処理方法を考える必要がある。以下それぞ
れについて説明する。
【0118】まず、ヘッドホンを用いる場合には、バイ
ノーラル方式と呼ばれる音像定位方法を用いる。音源を
置いた部屋でダミーヘッドの両耳にマイクロホンを取り
付けて録音したものをヘッドホンを用いて再生すると、
録音した部屋と同じ音場を体験できる。この原理を応用
し、各音源の位置から両耳までの音響的な伝達関数を求
め、各音信号にこの伝達関数を畳み込み、両耳ごとに積
分することにより、仮想音空間を作成する。この伝達関
数は、無響室などにおいて音源を部屋内で移動させ、各
地点でダミーヘッドの両耳に取り付けたマイクロホンか
ら音を録音して測定する。伝達関数には個人差があるの
で、複数の代表的な伝達関数を用意し、利用者にあらか
じめ自分にあった伝達関数を選んでもらってもよい。
【0119】次に、音出力手段がスピーカである場合
は、ヘッドホンを用いる場合に比べて、スピーカから両
耳に至るまでの空間を音信号が伝達する際の影響を新た
に考慮する必要がある。ここで、利用者の位置は固定し
ているとすると、スピーカから利用者の両耳までの伝達
関数を求め、これを先のバイノーラル方式で求めた伝達
関数と組み合わせたフィルタを用いればよい。本方式
は、トランスノーラル方式と呼ばれる。スピーカから見
た利用者の位置は固定していることを前提とするので、
車載型情報通信システム等で本発明を実施する場合に用
いる。また、音出力手段は2個より多ければ、より多く
のスピーカで仮想音空間を作成できるので、安定した音
像定位が得られる。
【0120】図15の音入力260には仮想音源272
が対応している。これは、音情報内の仮想音源IDから
判断する。また、当該仮想音源272の仮想音空間内で
の位置は仮想音空間管理テーブル106からわかる。そ
の音源位置から音出力手段270を通じて利用者の耳に
伝達されるまでの伝達関数がフィルタ264に対応す
る。一方、フィルタ265は音出力手段271を通した
場合の伝達関数であり、フィルタ266と267は音入
力261に対応する仮想音源が置かれた位置から出力手
段270と271を通した場合の伝達関数に相当する。
それぞれ入力された音を伝達関数で畳み込み、これを各
音出力手段に対応して設けられたミキサ268〜269
で合成する。なお、図4中の音像定位加工処理111は
図15中の処理262〜263に対応する。同じく、音
合成処理112はミキサ268〜269での処理に対応
する。
【0121】フィルタ264〜267の伝達係数は、各
仮想音源位置と各出力手段とのマトリックス(図16参
照)としてディスク132中に保存されている。なお、
図16では、簡単のため、仮想音源位置は四種類しか記
載されていないが、もちろん多様な仮想音源位置を設定
することができる。この場合、人間が音像を聞き分ける
能力とシステムによる音像定位の性能とを考慮に入れて
仮想音源位置の分解能を決める。
【0122】<ソフトウェア全体構成の説明>図17
に、これまでに述べたソフトウェア構成図の全体の大ま
かな流れを示す。ステップ283からステップ288は
すでに述べたので、ここではステップ281とステップ
282の前処理と、ステップ289の後処理について述
べる。プログラム起動時には仮想音空間をデフォルトの
状態に設定する(ステップ281)。利用者が前回終了
時の状態で起動したい場合は、その旨設定できるよう
に、ステップ289にて常に終了時の仮想音空間の状態
をディスク132中に保存しておく。また、音情報は視
覚情報と比べて一覧性に劣るので、どのユーザプロセス
が仮想音空間中のどの位置に割り当てられたかを利用者
に知らせる必要がある。ステップ282では、例えば、
各ユーザプロセスごとにプロセス名と現在位置を利用者
にアナウンスすることによって、仮想音空間の初期状態
を知らせる。また、利用者は起動後も任意に仮想音空間
の状態を知ることができる。
【0123】<実施例の利用例>以下、図を用いて上記
実施例における音情報提供装置の利用例を示す。図18
は利用者による音情報の選択及び入力とその結果出力さ
れる音情報との関連を時間軸に従って記載したものであ
る。図19は図18の時刻t1からt2までの仮想音空間2
90の状態を表したものである。ラジオからの出力音は
音像292に、B氏との電子会議からの出力音声は音像
293に、同じくA氏からの出力音声は音像294に、
電子秘書からの合成音声の出力は音像295に配置して
ある。
【0124】まず、時刻t1までは右方向の音情報として
ラジオからの出力が選択されている。時刻t1で電子会議
を行うための呼出音が前方から聞こえ、この前方の音を
利用者が選択することにより電子会議が開始される。選
択方法は前述のいずれでもよい。利用者動作検出処理3
3は、ジャイロ121、122の動作を図7の動作管理
テーブル35に記録し、メッセージ作成処理54が、図
11に示すステップに従って、選択内容を判定してメッ
セージ51を作成し、メッセージ転送処理55がハード
ウェア制御プログラム群72にメッセージを転送する。
【0125】ハードウェア制御プログラム群72はPH
S通信機163、164を介した電子会議相手の声を音
情報115として渡す。この時、会議相手の配置はあら
かじめ仮想音空間定義部100を介して定義してあり、
仮想音空間作成部110によって、A氏の音声が左前方
から聞こえ、B氏の音声が右前方から聞こえる。
【0126】時刻t2で、利用者は電子会議で必要となっ
た情報をデータベースから検索するため、あらかじめ左
方向に配置しておいた電子秘書を起動する。利用者29
1が方向299と方向300の間を向いて、選択動作を
行うと、利用者状態検出部30によってコマンド46が
作成される。コマンド46は、メッセージ転送部50に
よってメッセージ51となり、エージェント群64に渡
される。この結果、エージェント群64のうち、たとえ
ば、DB検索エージェントが起動される。このとき、仮
想音空間作成部110は、電子秘書の音像295が仮想
空間内を利用者291に近づく方向に移動し、電子会議
の音像293と294がともに利用者291から離れる
方向に移動するように、音像を制御する。なお、上述の
ように、仮想音空間で利用者との距離を変化させること
は音量を変化させることで対応する。
【0127】電子秘書(エージェント群64)が起動さ
れると、利用者は、データベース検索命令と検索条件を
入力する。検索内容をマイク23から入力すると、入力
音声データ43は、音声認識部41で認識され、コマン
ド44、データ45が作成される。コマンド44、デー
タ45は、メッセージ転送部50によってメッセージ5
1となり、エージェント群64に渡される。
【0128】エージェント群64がデータベースを検索
している時刻t3から時刻t4の間、利用者は前方の音情報
を選びなおし、電子会議を再開する。図18中の時刻t3
で前方を指し示すと、上述と同様の過程を経て、再度電
子会議が選択される。ここで、利用者が指し示した方向
は298であり、音像293と音像294との中間にあ
たる。これは、A氏及びB氏両者との電子会議を選択し
たことを意味する。
【0129】時刻t4で、検索処理が終わると、エージェ
ント群64は左方向から、音声合成部63で合成した音
声またはアラーム音で知らせる。利用者が電子秘書を再
度選ぶと、検索結果を音声合成部63で音声合成し、音
情報115として出力する。この時、出力内容は同時に
音情報一時記憶領域114に蓄積される。利用者は聞き
逃したり即座に理解できなかった場合に、入力音声デー
タ43、コマンド46を入力することで、何度も繰り返
し聞き直すことができる。
【0130】時刻t5で、利用者は、検索結果についてA
氏のみと話し合うため、左前方の音情報を選択する。選
択は上述のように行う。時刻t5では方向298と方向2
99の丁度真ん中あたりにある音像294を指し示した
ため、メッセージ作成処理33はA氏のみと電子会議を
再開するようメッセージ51を作成し、ハードウェア制
御プログラム群72に転送する。人間の聴覚は左右水平
方向の音源には敏感で、2°〜3°程度の誤差で音源の
場所を言い当てることができる。なお、この時、右前方
からB氏からの音声も聞こえていて構わないが、B氏に
は利用者からの音声は届かないように、ハードウェア制
御プログラム群72はPHS通信機63または164を
制御する。これは電子会議で特定の相手と「ひそひそ話
し」する場合などに適用できる。
【0131】時刻t6では、B氏もまじえて電子会議を再
開し、時刻t7で電子会議を終了する。終了するととも
に、これまで電子会議開始後から一時停止状態だったラ
ジオからの出力が自動的に再開される。
【0132】仮想音空間の状態を図5に示す画面201
または図6に示す画面211に図示して、ボタンで選択
するようにしてもよい。また、利用者操作により、ラジ
オの音像292と電子秘書の音像295を入れ替えるな
ど、音像の位置を変更することも可能である。本実施例
では、GPS(または室内位置検出用の赤外線データ受
信機)が腕時計型の本装置21に内蔵されると述べてき
たが、必ずしもこのような構成である必要はなく、例え
ばGPSが本体部20に内蔵されていても構わない。
【0133】また、利用者の手の動きを測定する手段と
して、ジャイロの代わりにデータグローブを用いる構成
も考えられる。データグローブは、グローブの各指の上
部に光ファイバが通してあり、指を伸ばしたり曲げたり
する際の光の屈折率によって、手の動きと現在の手の形
状を検出する。従ってデータグローブを装着した利用者
の手や指の動きも容易に検出できる。さらには、利用者
の指輪や腕時計に発光体を装着し、それらをはめた手を
ビデオカメラで撮影するといった構成も考えられる。こ
こでは、手の映像を画像処理し、発光体の位置を抽出す
ることによって利用者の手の動きを測定する。
【0134】<他の実施例>つぎに、他の実施例につい
て図を用いて説明する。図20と図21は、本発明の実
施例に係る音情報提供装置の他の利用場面及び装置構成
を表した図である。以下、それぞれ説明する。
【0135】図20は、本発明を車載型情報通信システ
ムで用いた場合の利用例を表す。最近の自動車310で
は、自動車電話313や、CDプレーヤ314や、カー
ラジオ・TV315等が備え付けられたものが多い。さ
らには、自動車ナビゲーションシステムなどのように、
自動車測位装置316も備え付けているものもある。一
般に、これは別々に制御され、スピーカ319〜320
(前述のスピーカ151に対応する)から出力される。
ここで、本発明による音情報提供装置311と、利用者
の音声を入力するマイク312と、利用者の動作を検出
するためのビデオカメラ317及び指輪型の発光体31
8を新たに設置する。
【0136】この実施例では、利用者の現在位置に応じ
た情報を提供する。例えば、高速道路を走りながら音楽
を聞いていて、あるポイントに車が近づくと進行方向か
ら自然に道路渋滞情報が聞こえてくる。提供される情報
にはそれが利用者にとって有効と思われる有効範囲を示
すデータも含まれており、利用者がその場所に近づいて
初めて情報が自然に聞こえてくる。また、その情報に関
連する事象が発生した場所に関するデータも位置属性と
して提供され、聞こえてくる方向は利用者の現在位置か
ら見た情報発生場所の方向と対応付けられている。道路
渋滞情報の場合、渋滞している方向から音情報が聞こえ
ると、利用者は不慣れな場所を運転していても、どこが
渋滞しているかを容易に判断できる。
【0137】これを実現する際は、まず前記GPSなど
の利用者状態検出部30から利用者の現在位置を入手
し、提供される情報に含まれる有効範囲のデータと比較
し、現在位置が有効範囲内にある場合は当該音情報を出
力する。このことにより、先に説明したような利用者の
現在位置に応じた道路交通情報の入手など、今までにな
い新しい効果を得ることができる。
【0138】これを発展させ、利用者が指し示した方向
から提供される情報を出力するなどの応用も考えられ
る。例えば、電車の中吊り広告に音情報の発信器が取り
付けてあり、音情報が放送されている。利用者がその中
吊り広告を指し示したことによって、その中吊り広告が
発信している音情報を選択したことになり、利用者には
指し示した方向から当該音情報が聞こえてくる。
【0139】なお、第1の実施例において、利用者の動
作は秒単位で変化するが、位置の検出では本実施例の最
小単位が30メートルであり、利用者が歩いて移動する
ことを前提とすると利用者位置は急激に変化しない。そ
のため、図7と図9で時刻の分解能を変えていた。しか
し、本実施例において、本装置を車載システムとして実
施する場合は、図9の時刻の分解能はさらに細かくとる
べきである。また、歩行と乗り物による移動が併用され
る場合は、位置の変化量から時刻の分解能を動的に変え
るといった方式をとる。例えば、利用者位置を検出する
時間間隔の上限値を設定して、その範囲内で前時刻から
現時刻までの利用者位置の変化量に反比例させて時間間
隔を決める。
【0140】最後に、図21は本発明による音情報提供
装置を室内で利用する場合の応用例を表す。室内330
の天井には、利用者からのデータを送受信する赤外線デ
ータ送受信機332と、スピーカ334〜335と、利
用者が部屋にいるかどうかを識別するためのビデオカメ
ラ333が備え付けてある。利用者も腕時計型の赤外線
データ送受信機331を内蔵した利用者位置・動作測定
部21を携帯している。前記複数の赤外線データ送信機
332は、たえず送信機の位置と時刻のデータを送信す
る。そして、利用者が身に付けている赤外線データ受信
機331は、前記送信機からのデータを受信して、各送
信機からの距離を計算する。計算した利用者の現在位置
は、常に赤外線データ送受信機332に送信している。
【0141】また、本装置を室内などある決まった領域
で用いる場合は、緯度、経度、高度に相当する何らかの
基準を決めておく必要がある。例えば、基準となる原点
と水平方向のXY軸を適当に決めて、原点から見た利用
者の現在位置をメートル単位で利用者位置管理テーブル
36に記録する。
【0142】サーバコンピュータ61は、利用者の現在
位置を常に把握し、その場所に応じた音情報を出力す
る。例えば、室内のある領域が立入制限区域になってお
り、許可を受けていない利用者がその領域に近づくと、
制限区域の方向から警告メッセージが流れる。利用者は
警告を知るだけでなく、警告メッセージが聞こえる方向
からどこが立入制限区域であるかも判断できる。また、
本応用例では利用者が動きまわることを前提としている
ため、音像定位の方法として、図14による方法を用い
るが、この時スピーカ334〜335はコンピュータ制
御により自由に配置できることが望ましい。図21では
スピーカ334〜335を天井に配置しているが、スピ
ーカを床に配置し自由に移動できる手段を設けた応用例
も考えられる。
【0143】また、本発明は視覚情報を用いずに情報提
供できるという点で、目の不自由な障害者向けの情報提
供装置としても応用できる。その場合は、本体部20と
利用者位置・動作測定部21は、ボタン203、212
がより重要になり、画面201、211に表示されるソ
フトウェアボタンよりは、各キーの形状、キートップの
凹凸に特徴を持たせた機械的なボタンの方が望ましい。
【0144】
【発明の効果】以上述べたように、本発明によれば、複
数の音情報を音像定位し、合成することにより、利用者
は複数の音が同時にそれぞれの方向から聞こえてくるよ
うに感じることができる。
【0145】さらに、利用者は同時に聞こえる複数の音
情報の中から優先して聞きたい音情報を選択したり、聞
きたくない音情報を消したり、音情報の聞こえる方向や
それぞれの音量を自由に変更したりできる。
【0146】さらに、利用者が選択した音情報に割り当
てられた処理に利用者の命令またはデータを送ることが
できる。
【0147】以上により、音情報における「ウィンド
ウ」や「マウス」に相当する概念を提供することができ
る。この結果、利用者は仮想的な音空間を渡り歩くこと
によって平行して仕事を進めることができ、人間とコン
ピュータとの対話及び人間と人間との対話の効率も向上
する。
【図面の簡単な説明】
【図1】本発明の特徴を概念的に表す説明図である。
【図2】本発明の一実施例に係る音情報提供装置の利用
イメージと基本構成を表す説明図である。
【図3】本発明の一実施例に係る音情報提供装置のハー
ドウェア構成を表す説明図である。
【図4】本発明の一実施例に係る音情報提供装置のソフ
トウェア構成を表す説明図である。
【図5】本体部の装置外観を表す説明図である。
【図6】利用者位置・動作測定部の装置外観を表す説明
図である。
【図7】利用者動作管理テーブルの構成を表す説明図で
ある。
【図8】利用者頭部向きを検出する場合の例を表す説明
図である。
【図9】利用者位置管理テーブルの構成を表す説明図で
ある。
【図10】メッセージの例を表す説明図である。
【図11】メッセージ作成処理の処理フローを表す説明
図である。
【図12】仮想音空間管理テーブルの構成を表す説明図
である。
【図13】音情報の構成を表す説明図である。
【図14】仮想音空間作成部の構成例を表す説明図であ
る。
【図15】仮想音空間作成部の別の構成例を表す説明図
である。
【図16】図15における仮想音空間作成部のフィルタ
を管理するテーブルを表す説明図である。
【図17】ソフトウェア構成図の全体の処理フローを表
す説明図である。
【図18】本発明の一実施例に係る音情報提供装置の利
用例を表す説明図である。
【図19】図18の時刻t1からt2までの仮想音空間の状
態を表す説明図である。
【図20】本発明を車載型情報通信システムで用いた場
合の応用例を表す説明図である。
【図21】本発明のよる音情報提供装置を室内で利用す
る場合の応用例を表す説明図である。
【符号の説明】
1…利用者、 2…電子秘書、
3…電子会議、 4…電子会議、
5…放送・音再生、 6〜9…音像、
10…仮想音空間、 20…本体部、
21…利用者位置・動作測定部、 22…利用者頭
部向き測定部、23…マイク、
24…ヘッドホン、30…利用者状態検出部、
31…利用者動作、32…利用者位置、
33…利用者動作検出処理、34…利用者位置
検出処理、 35…利用者動作管理テーブル、
36…利用者位置管理テーブル、 40…音声入力
部、41…音声認識部、 42…入力
部、43…入力音声データ、 44…コマ
ンド、45…データ、 46…コ
マンド、47…データ、 50…
メッセージ転送部、51…メッセージ、
53…選択音源判定処理、54…メッセージ作成処
理、 55…メッセージ転送処理、56…仮想
音源ID、 57…プロセスID、58
…コマンド、 59…データ、60
…電子秘書、 61…サーバ、62
…データ通信手段、 63…音声合成部、
63…エージェント群、 70…放送受信
手段、71…放送局、72…ハードウェア制御プログラ
ム群、80…音再生手段、 81…C
D、90…音声通信手段、 91…音声
通信手段、92…通信相手、 93
…通信相手、100…仮想音空間定義部、
101…仮想利用者位置、102…仮想音源位置、
103…音情報属性、104…仮想音源位
置設定処理、105…仮想利用者位置設定処理、106
…仮想音空間管理テーブル、 110…仮想音空間
作成部、111…音像定位加工処理、 11
2…音合成処理、113…仮想音空間出力部、
114…音情報一時記憶領域、115…音情報、
120…GPS、121…ジャイ
ロ、 122…ジャイロ、130…
CPU、 131…メモリ、13
2…ディスク、 140…A/D変
換器、141…ボタン類、 150
…D/A変換器、151…スピーカ、
160…赤外線通信機、161…ラジオ受信機、
162…CDプレーヤ、163、164
…PHS通信機、 165〜168…A/D変換
器、169…バス、 201…
液晶画面、202…ペン、 2
03…ボタン、204〜206…PCカード用スロッ
ト、207…赤外線通信機、208…ファックスモデ
ム、 209…カバー、211…液晶画面、
212…ボタン、213…マイ
ク、 214…バンド、250〜
251…音入力、252…仮想音空間管理テーブル、
253…クロスバースイッチ、254〜255…音
出力、 260〜261…音入力、264
〜267…フィルタ、 268〜269…ミ
キサ、270〜271…音出力、 272
〜273…仮想音源、291…利用者、
292〜295…音像、296〜300…方
向、 310…自動車、311…音情報
提供装置、 312…マイク、313…自
動車電話、 314…CDプレーヤ、
315…カーラジオ・TV、 316…自動
車測位装置、317…カメラ、
318…発光体、319〜320…スピーカ、
330…室内、331…赤外線データ送受信機(携
帯型)、332…赤外線データ送受信機(据置型)、3
33…カメラ、 334〜335
…スピーカ

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】複数の音情報を利用者に提供する装置であ
    って、 前記複数の音情報を生成する処理手段と、 前記複数の音情報の仮想的な音源位置を音空間に定義す
    る仮想音空間定義手段と、 前記音情報の音像を、前記定義された仮想音源位置に定
    位させる音像定位加工手段と、 音像定位加工された前記複数の音情報を出力する手段
    と、 利用者指示を検出する利用者指示検出手段と、 前記利用者指示に基づいて、前記仮想音源位置に配置さ
    れた前記音情報とその音情報を生成する処理手段を選択
    する音情報操作手段とを備えたことを特徴とする音情報
    提供装置。
  2. 【請求項2】前記利用者指示検出手段が検出する利用者
    指示は、利用者動作、あるいは利用者音声の少なくとも
    いずれか一つであることを特徴とする請求項1記載の音
    情報提供装置。
  3. 【請求項3】前記音情報提供装置は、利用者の位置を測
    定する位置測定手段を備え、 前記音情報は、当該音情報が関連する事象の位置情報を
    属性として備え、 仮想音空間定義手段は、前記位置測定手段が測定した利
    用者位置と、前記音情報が表す位置に基づいて、前記利
    用者位置を基準とした前記音情報の仮想的な音源位置を
    定義することを特徴とする請求項1または2記載の音情
    報提供装置。
  4. 【請求項4】前記利用者指示検出手段は、検出した利用
    者指示から方向を表す要素を抽出し、 前記音情報操作手段は、前記方向を表す要素が示す方向
    の前記仮想音源位置に配置された音情報を選択すること
    を特徴とする請求項1ないし3いずれか一に記載の音情
    報提供装置。
  5. 【請求項5】前記音情報提供装置は、命令やデータを入
    力する手段を備え、 前記音情報操作手段は、前記利用者指示検出手段が検出
    した利用者指示または、前記入力された命令またはデー
    タを前記選択された音情報を生成する処理手段に送るこ
    とを特徴とする請求項1ないし4いずれか一に記載の音
    情報提供装置。
  6. 【請求項6】前記仮想音空間定義部は、前記音空間をあ
    らかじめ定めた基準位置を中心に構成し、 前記利用者指示検出手段は、前記抽出した方向を表す要
    素を補正して、前記基準位置を中心とした方向に補正す
    ることを特徴とする請求項1ないし5いずれか一に記載
    の音情報提供装置。
  7. 【請求項7】前記音情報を生成する処理手段は、音情報
    毎に属性を定義し、 前記仮想音空間定義手段は、あらかじめ音情報の属性毎
    に仮想的な音空間における音源位置決定規則を定めてお
    き、 提供される音情報の属性を前記音源位置決定規則に当て
    はめて音源位置を決めることを特徴とする請求項1ない
    し6いずれか一に記載の音情報提供装置。
  8. 【請求項8】前記音情報を生成する処理手段は、指定さ
    れた処理を行い、処理終了時にその処理結果、または終
    了通知を音情報にて出力するものであることを特徴とす
    る請求項1ないし7いずれか一に記載の音情報提供装
    置。
  9. 【請求項9】前記音情報は、属性として重要度または優
    先度を備え、 前記仮想音空間定義手段は、前記重要度または優先度が
    高い音情報を利用者位置の近くに定義し、前記重要度ま
    たは優先度が低い音情報を利用者位置から遠くに定義す
    るように設定することを特徴とする請求項1ないし8い
    ずれか一に記載の音情報提供装置。
  10. 【請求項10】前記音情報操作手段は、前記利用者指示
    に基づき、選択した音情報の音像に対し、前記音像の移
    動と、音量の変更と、一時的な出力の停止と、一時停止
    の解除と、優先出力と、優先出力からもとの状態への復
    帰と、音情報の出力停止のいずれかを行なうよう前記仮
    想音空間定義手段を制御することを特徴とする請求項1
    ないし9のいずれか一に記載の音情報提供装置。
  11. 【請求項11】前記音出力手段の出力数は、前記音像定
    位加工手段が音像定位加工した音情報の数より少ない数
    であって、 前記音情報提供装置は、前記音像定位加工手段が音像定
    位加工した音情報を、前記音出力手段の出力数に合成す
    る手段を備えたことを特徴とする請求項1ないし10の
    いずれか一に記載の音情報提供装置。
  12. 【請求項12】複数の音情報を利用者に提供する装置で
    あって、 前記複数の音情報を生成する処理手段と、 前記複数の音情報の仮想的な音源位置を音空間に定義す
    る仮想音空間定義手段と、 前記音情報の音像を、前記定義された仮想音源位置に定
    位させる音像定位加工手段と、 音像定位加工された前記複数の音情報を出力する手段
    と、 利用者位置を検出する利用者位置検出手段と、 前記利用者位置に基づいて、利用者位置近傍の前記仮想
    音源位置に配置された前記音情報とその音情報を生成す
    る処理手段を選択する音情報操作手段とを備えたことを
    特徴とする音情報提供装置。
  13. 【請求項13】複数の通信相手と音声通信する装置であ
    って、 前記複数の通信相手と通信するための通信手段と、 前記複数の通信相手と自分の仮想的な位置を音空間に定
    義する仮想音空間定義手段と、 前記通信手段から出力される前記複数の通信相手と自分
    の音声の音像を、前記定義された仮想位置に定位させる
    音像定位加工手段と、 音像定位加工された前記複数の音声を出力する手段と、 利用者動作を検出する利用者動作検出手段と、 前記利用者動作に基づいて、前記仮想位置に配置された
    前記通信相手を選択する音情報操作手段とを備えたこと
    を特徴とする音声通信装置。
  14. 【請求項14】複数の音情報を利用者に提供する装置で
    あって、 前記複数の音情報を生成する処理手段と、 利用者位置を検出する利用者位置検出手段と、 前記利用者位置に基づいて、前記複数の音情報の仮想的
    な音源位置を音空間に定義する仮想音空間定義手段と、 前記音情報の音像を、前記定義された仮想音源位置に定
    位させる音像定位加工手段と、 音像定位加工された前記複数の音情報を出力する手段と
    を備えたことを特徴とする音情報提供装置。
  15. 【請求項15】利用者を乗せ、音情報を前記利用者に提
    供する、移動可能な装置であって、 前記音情報を生成する処理手段と、 前記移動可能な装置の位置を測定する装置位置測定手段
    と、 前記装置の位置に基づいて、前記音空間における利用者
    位置を設定する仮想利用者位置設定手段と、 前記音情報の仮想的な音源位置を、前記設定された利用
    者位置に基づいて、固定された音空間に定義する仮想音
    空間定義手段と、 前記音情報の音像を、前記定義された仮想音源位置に定
    位させる音像定位加工手段と、 前記音像定位加工された前記音情報を出力する手段とを
    備えたことを特徴とする音情報提供装置。
  16. 【請求項16】前記音情報提供装置は、 利用者指示を検出し、検出した利用者指示から方向を表
    す要素を抽出する利用者指示検出手段と、 前記方向を表す要素が示す方向の前記仮想音源位置に配
    置された音情報を選択する音情報操作手段とを備えたこ
    とを特徴とする請求項14または15に記載の音情報提
    供装置。
  17. 【請求項17】複数の音情報の仮想的な音源位置を音空
    間に定義し、 前記音情報の音像を、前記定義された仮想音源位置に定
    位させ、 前記定義された仮想音源位置から、前記複数の音情報を
    出力し、 前記仮想音源を選択する利用者指示に基づいて、前記選
    択された仮想音源から出力される音情報を選択すること
    を特徴とする音情報選択方法。
  18. 【請求項18】複数の音情報の仮想的な音源位置を音空
    間に定義し、 前記音情報の音像を、前記定義された仮想音源位置に定
    位させ、 前記定義された仮想音源位置から、前記複数の音情報を
    出力し、 前記音空間を移動する利用者の位置に基づいて、前記利
    用者の位置近傍にある仮想音源から出力される音情報を
    選択することを特徴とする音情報選択方法。
JP24128495A 1995-09-20 1995-09-20 音情報提供装置、及び音情報選択方法 Expired - Lifetime JP3834848B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24128495A JP3834848B2 (ja) 1995-09-20 1995-09-20 音情報提供装置、及び音情報選択方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24128495A JP3834848B2 (ja) 1995-09-20 1995-09-20 音情報提供装置、及び音情報選択方法

Publications (2)

Publication Number Publication Date
JPH0990963A true JPH0990963A (ja) 1997-04-04
JP3834848B2 JP3834848B2 (ja) 2006-10-18

Family

ID=17071981

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24128495A Expired - Lifetime JP3834848B2 (ja) 1995-09-20 1995-09-20 音情報提供装置、及び音情報選択方法

Country Status (1)

Country Link
JP (1) JP3834848B2 (ja)

Cited By (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11331995A (ja) * 1998-05-08 1999-11-30 Alpine Electronics Inc 音像制御装置
JP2000020888A (ja) * 1998-07-07 2000-01-21 Aqueous Reserch:Kk エージェント装置
WO2000045619A1 (fr) * 1999-01-28 2000-08-03 Sony Corporation Dispositif source sonore virtuelle et appareil acoustique comportant un tel dispositif
JP2002091756A (ja) * 2000-06-15 2002-03-29 Internatl Business Mach Corp <Ibm> 多数の音響情報源を同時に提供するためのシステム及び方法
JP2002095098A (ja) * 2000-09-19 2002-03-29 Matsushita Electric Ind Co Ltd 音響再生装置
JP2003099078A (ja) * 2001-09-20 2003-04-04 Seiko Epson Corp 合成音声再生方法および合成音声再生装置
WO2005098583A1 (ja) * 2004-03-30 2005-10-20 Pioneer Corporation 音情報出力装置、音情報出力方法、および音情報出力プログラム
JP2005311974A (ja) * 2004-04-26 2005-11-04 Yamaha Corp 音像定位端末
WO2006025493A1 (ja) * 2004-09-03 2006-03-09 Matsushita Electric Industrial Co., Ltd. 情報端末
WO2006107074A1 (ja) * 2005-04-05 2006-10-12 Matsushita Electric Industrial Co., Ltd. 携帯端末装置
WO2006137400A1 (ja) * 2005-06-21 2006-12-28 Japan Science And Technology Agency ミキシング装置及び方法並びにプログラム
JP2007006117A (ja) * 2005-06-23 2007-01-11 Pioneer Electronic Corp 報知制御装置、そのシステム、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、移動支援装置
JP2007228336A (ja) * 2006-02-24 2007-09-06 Alpine Electronics Inc 車載用オーディオ/ビデオ装置及びソース選択方法
JP2007243493A (ja) * 2006-03-07 2007-09-20 Sanyo Electric Co Ltd 携帯機器
KR100818660B1 (ko) * 2007-03-22 2008-04-02 광주과학기술원 근거리 모델을 위한 3차원 음향 생성 장치
JP2008092193A (ja) * 2006-09-29 2008-04-17 Japan Science & Technology Agency 音源選択装置
US7386140B2 (en) 2002-10-23 2008-06-10 Matsushita Electric Industrial Co., Ltd. Audio information transforming method, audio information transforming program, and audio information transforming device
JP2008209641A (ja) * 2007-02-26 2008-09-11 Sony Computer Entertainment Inc オーディオ再生装置、情報処理装置およびオーディオ再生方法
JP2008257052A (ja) * 2007-04-06 2008-10-23 Denso Corp 音データ検索支援装置、音データ再生装置、プログラム
JP2009027280A (ja) * 2007-07-17 2009-02-05 Pioneer Electronic Corp 出力制御装置、出力制御方法、出力制御プログラムおよび記録媒体
US7656276B2 (en) 2003-12-24 2010-02-02 Pioneer Corporation Notification control device, its system, its method, its program, recording medium storing the program, and travel support device
WO2011077005A1 (en) * 2009-12-21 2011-06-30 Nokia Corporation Methods, apparatuses and computer program products for facilitating efficient browsing and selection of media content & lowering computational load for processing audio data
KR20120026591A (ko) * 2009-06-03 2012-03-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 라우드스피커 위치들의 추정
JP2012163861A (ja) * 2011-02-08 2012-08-30 Yamaha Corp 信号処理装置
WO2012120810A1 (ja) * 2011-03-08 2012-09-13 パナソニック株式会社 音声制御装置および音声制御方法
JP5074766B2 (ja) * 2004-10-01 2012-11-14 パナソニック株式会社 音響調整装置および音響調整方法
US8335580B2 (en) 2007-03-15 2012-12-18 Sony Computer Entertainment Inc. Audio reproducing apparatus and audio reproducing method, allowing efficient data selection
WO2013105413A1 (ja) * 2012-01-11 2013-07-18 ソニー株式会社 音場制御装置、音場制御方法、プログラム、音場制御システム及びサーバ
JP2013143744A (ja) * 2012-01-12 2013-07-22 Denso Corp 音像提示装置
JP2013207759A (ja) * 2012-03-29 2013-10-07 Fujitsu Ltd 携帯端末、音源位置制御方法および音源位置制御プログラム
JP2014039140A (ja) * 2012-08-15 2014-02-27 Fujitsu Ltd 推定プログラム、推定装置、及び推定方法
JP2015023534A (ja) * 2013-07-23 2015-02-02 富士通株式会社 情報提供装置、情報提供システム、及び情報提供プログラム
JP2015506035A (ja) * 2011-12-19 2015-02-26 クゥアルコム・インコーポレイテッドQualcomm Incorporated ジェスチャ制御音声ユーザインタフェース
JP2015046103A (ja) * 2013-08-29 2015-03-12 シャープ株式会社 対話型インタフェース及び情報処理装置
JP2015515800A (ja) * 2012-03-23 2015-05-28 ドルビー ラボラトリーズ ライセンシング コーポレイション 2dまたは3d会議シーンにおける語り手の配置
CN104735599A (zh) * 2013-12-19 2015-06-24 Gn瑞声达A/S 具有声源的可选择感知空间定位的听力装置
JP2015143987A (ja) * 2014-01-03 2015-08-06 ハーマン インターナショナル インダストリーズ インコーポレイテッド 車載ジェスチャ相互作用空間オーディオシステム
JP2017532920A (ja) * 2014-08-26 2017-11-02 ブラックマジック デザイン ピーティーワイ リミテッドBlackmagic Design Pty Ltd 3次元空間において音像を定位し、制御するための方法及びシステム
JP2019522420A (ja) * 2016-06-21 2019-08-08 ノキア テクノロジーズ オーユー 媒介現実
CN110176231A (zh) * 2018-02-19 2019-08-27 株式会社东芝 音响输出系统、音响输出方法及存储介质
EP4037340A1 (en) * 2021-01-28 2022-08-03 Nokia Technologies Oy Processing of audio data
WO2023176389A1 (ja) * 2022-03-15 2023-09-21 ソニーグループ株式会社 情報処理装置、情報処理方法、及び記録媒体

Cited By (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11331995A (ja) * 1998-05-08 1999-11-30 Alpine Electronics Inc 音像制御装置
JP2000020888A (ja) * 1998-07-07 2000-01-21 Aqueous Reserch:Kk エージェント装置
KR100713666B1 (ko) * 1999-01-28 2007-05-02 소니 가부시끼 가이샤 가상음원장치 및 이것을 이용한 음향장치
WO2000045619A1 (fr) * 1999-01-28 2000-08-03 Sony Corporation Dispositif source sonore virtuelle et appareil acoustique comportant un tel dispositif
US7917236B1 (en) 1999-01-28 2011-03-29 Sony Corporation Virtual sound source device and acoustic device comprising the same
JP2002091756A (ja) * 2000-06-15 2002-03-29 Internatl Business Mach Corp <Ibm> 多数の音響情報源を同時に提供するためのシステム及び方法
JP2002095098A (ja) * 2000-09-19 2002-03-29 Matsushita Electric Ind Co Ltd 音響再生装置
JP4663085B2 (ja) * 2000-09-19 2011-03-30 パナソニック株式会社 音響再生装置
JP2003099078A (ja) * 2001-09-20 2003-04-04 Seiko Epson Corp 合成音声再生方法および合成音声再生装置
US7386140B2 (en) 2002-10-23 2008-06-10 Matsushita Electric Industrial Co., Ltd. Audio information transforming method, audio information transforming program, and audio information transforming device
US7656276B2 (en) 2003-12-24 2010-02-02 Pioneer Corporation Notification control device, its system, its method, its program, recording medium storing the program, and travel support device
WO2005098583A1 (ja) * 2004-03-30 2005-10-20 Pioneer Corporation 音情報出力装置、音情報出力方法、および音情報出力プログラム
JP2005311974A (ja) * 2004-04-26 2005-11-04 Yamaha Corp 音像定位端末
WO2006025493A1 (ja) * 2004-09-03 2006-03-09 Matsushita Electric Industrial Co., Ltd. 情報端末
JP5074766B2 (ja) * 2004-10-01 2012-11-14 パナソニック株式会社 音響調整装置および音響調整方法
WO2006107074A1 (ja) * 2005-04-05 2006-10-12 Matsushita Electric Industrial Co., Ltd. 携帯端末装置
US8023659B2 (en) 2005-06-21 2011-09-20 Japan Science And Technology Agency Mixing system, method and program
WO2006137400A1 (ja) * 2005-06-21 2006-12-28 Japan Science And Technology Agency ミキシング装置及び方法並びにプログラム
JP2007006117A (ja) * 2005-06-23 2007-01-11 Pioneer Electronic Corp 報知制御装置、そのシステム、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、移動支援装置
JP2007228336A (ja) * 2006-02-24 2007-09-06 Alpine Electronics Inc 車載用オーディオ/ビデオ装置及びソース選択方法
JP2007243493A (ja) * 2006-03-07 2007-09-20 Sanyo Electric Co Ltd 携帯機器
JP2008092193A (ja) * 2006-09-29 2008-04-17 Japan Science & Technology Agency 音源選択装置
JP2008209641A (ja) * 2007-02-26 2008-09-11 Sony Computer Entertainment Inc オーディオ再生装置、情報処理装置およびオーディオ再生方法
US8335580B2 (en) 2007-03-15 2012-12-18 Sony Computer Entertainment Inc. Audio reproducing apparatus and audio reproducing method, allowing efficient data selection
KR100818660B1 (ko) * 2007-03-22 2008-04-02 광주과학기술원 근거리 모델을 위한 3차원 음향 생성 장치
JP2008257052A (ja) * 2007-04-06 2008-10-23 Denso Corp 音データ検索支援装置、音データ再生装置、プログラム
JP2009027280A (ja) * 2007-07-17 2009-02-05 Pioneer Electronic Corp 出力制御装置、出力制御方法、出力制御プログラムおよび記録媒体
KR20120026591A (ko) * 2009-06-03 2012-03-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 라우드스피커 위치들의 추정
JP2012529213A (ja) * 2009-06-03 2012-11-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ラウドスピーカの位置の推定
WO2011077005A1 (en) * 2009-12-21 2011-06-30 Nokia Corporation Methods, apparatuses and computer program products for facilitating efficient browsing and selection of media content & lowering computational load for processing audio data
US8380333B2 (en) 2009-12-21 2013-02-19 Nokia Corporation Methods, apparatuses and computer program products for facilitating efficient browsing and selection of media content and lowering computational load for processing audio data
JP2012163861A (ja) * 2011-02-08 2012-08-30 Yamaha Corp 信号処理装置
WO2012120810A1 (ja) * 2011-03-08 2012-09-13 パナソニック株式会社 音声制御装置および音声制御方法
US9563278B2 (en) 2011-12-19 2017-02-07 Qualcomm Incorporated Gesture controlled audio user interface
JP2015506035A (ja) * 2011-12-19 2015-02-26 クゥアルコム・インコーポレイテッドQualcomm Incorporated ジェスチャ制御音声ユーザインタフェース
WO2013105413A1 (ja) * 2012-01-11 2013-07-18 ソニー株式会社 音場制御装置、音場制御方法、プログラム、音場制御システム及びサーバ
US9510126B2 (en) 2012-01-11 2016-11-29 Sony Corporation Sound field control device, sound field control method, program, sound control system and server
JPWO2013105413A1 (ja) * 2012-01-11 2015-05-11 ソニー株式会社 音場制御装置、音場制御方法、プログラム、音場制御システム及びサーバ
JP2013143744A (ja) * 2012-01-12 2013-07-22 Denso Corp 音像提示装置
JP2015515800A (ja) * 2012-03-23 2015-05-28 ドルビー ラボラトリーズ ライセンシング コーポレイション 2dまたは3d会議シーンにおける語り手の配置
US9749473B2 (en) 2012-03-23 2017-08-29 Dolby Laboratories Licensing Corporation Placement of talkers in 2D or 3D conference scene
JP2017060175A (ja) * 2012-03-23 2017-03-23 ドルビー ラボラトリーズ ライセンシング コーポレイション 2dまたは3d会議シーンにおける語り手の配置
JP2013207759A (ja) * 2012-03-29 2013-10-07 Fujitsu Ltd 携帯端末、音源位置制御方法および音源位置制御プログラム
JP2014039140A (ja) * 2012-08-15 2014-02-27 Fujitsu Ltd 推定プログラム、推定装置、及び推定方法
JP2015023534A (ja) * 2013-07-23 2015-02-02 富士通株式会社 情報提供装置、情報提供システム、及び情報提供プログラム
JP2015046103A (ja) * 2013-08-29 2015-03-12 シャープ株式会社 対話型インタフェース及び情報処理装置
CN104735599A (zh) * 2013-12-19 2015-06-24 Gn瑞声达A/S 具有声源的可选择感知空间定位的听力装置
JP2015136100A (ja) * 2013-12-19 2015-07-27 ジーエヌ リザウンド エー/エスGn Resound A/S 選択可能な知覚空間的な音源の位置決めを備える聴覚装置
CN104735599B (zh) * 2013-12-19 2019-03-01 Gn瑞声达A/S 具有声源的可选择感知空间定位的听力装置
US10585486B2 (en) 2014-01-03 2020-03-10 Harman International Industries, Incorporated Gesture interactive wearable spatial audio system
US10126823B2 (en) 2014-01-03 2018-11-13 Harman International Industries, Incorporated In-vehicle gesture interactive spatial audio system
JP2015143987A (ja) * 2014-01-03 2015-08-06 ハーマン インターナショナル インダストリーズ インコーポレイテッド 車載ジェスチャ相互作用空間オーディオシステム
JP2017532920A (ja) * 2014-08-26 2017-11-02 ブラックマジック デザイン ピーティーワイ リミテッドBlackmagic Design Pty Ltd 3次元空間において音像を定位し、制御するための方法及びシステム
US11327575B2 (en) 2014-08-26 2022-05-10 Blackmagic Design Pty Ltd Methods and systems for positioning and controlling sound images in three-dimensional space
JP2021005873A (ja) * 2014-08-26 2021-01-14 ブラックマジック デザイン ピーティーワイ リミテッドBlackmagic Design Pty Ltd 3次元空間において音像を定位し、制御するための方法及びシステム
US10764705B2 (en) 2016-06-21 2020-09-01 Nokia Technologies Oy Perception of sound objects in mediated reality
JP2019522420A (ja) * 2016-06-21 2019-08-08 ノキア テクノロジーズ オーユー 媒介現実
JP2019145944A (ja) * 2018-02-19 2019-08-29 株式会社東芝 音響出力システム、音響出力方法及びプログラム
CN110176231A (zh) * 2018-02-19 2019-08-27 株式会社东芝 音响输出系统、音响输出方法及存储介质
EP4037340A1 (en) * 2021-01-28 2022-08-03 Nokia Technologies Oy Processing of audio data
WO2022161840A1 (en) * 2021-01-28 2022-08-04 Nokia Technologies Oy Processing of audio data
WO2023176389A1 (ja) * 2022-03-15 2023-09-21 ソニーグループ株式会社 情報処理装置、情報処理方法、及び記録媒体

Also Published As

Publication number Publication date
JP3834848B2 (ja) 2006-10-18

Similar Documents

Publication Publication Date Title
JP3834848B2 (ja) 音情報提供装置、及び音情報選択方法
US10915291B2 (en) User-interfaces for audio-augmented-reality
US9508269B2 (en) Remote guidance system
Marmasse et al. Location-aware information delivery with commotion
KR101829855B1 (ko) 컴퓨팅 디바이스 상에서의 음성 액션들
TWI410906B (zh) 使用擴增實境導航路徑之方法及使用該方法之行動終端機
KR101604843B1 (ko) 휴대 단말기 및 그 동작 제어방법
US11343613B2 (en) Prioritizing delivery of location-based personal audio
US20090170532A1 (en) Event-based modes for electronic devices
US11036464B2 (en) Spatialized augmented reality (AR) audio menu
JP2003520497A (ja) 通信システムおよびそのための適切な制御ユニット
CN110442391A (zh) 一种调用服务的方法及装置
CN115357311A (zh) 出行信息分享方法、装置、计算机设备及存储介质
JP7243639B2 (ja) 情報処理装置、情報処理方法及びプログラム
KR101685361B1 (ko) 휴대 단말기 및 그 동작 방법
KR20160019279A (ko) 이동단말기 및 그 제어방법
US11074034B2 (en) Information processing apparatus, information processing method, and program
KR20150089787A (ko) 이동 단말기 및 그것의 제어방법
WO2019207867A1 (ja) 電子機器及び処理システム
KR101727911B1 (ko) 휴대 단말기 및 그 동작 방법
KR101730047B1 (ko) 이동 단말기 및 이동 단말기의 제어 방법
KR101645185B1 (ko) 휴대 단말기 및 그 동작 방법
KR20160089724A (ko) 이동 단말기 및 그 제어 방법
CN117452475A (zh) 震源车、震源车控制方法和存储介质
CN117041879A (zh) 针对盲人的出行方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050705

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050901

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060417

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060704

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060717

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100804

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110804

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120804

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130804

Year of fee payment: 7

EXPY Cancellation because of completion of term