JP2011071875A - 音声通信装置及びプログラム - Google Patents

音声通信装置及びプログラム Download PDF

Info

Publication number
JP2011071875A
JP2011071875A JP2009222664A JP2009222664A JP2011071875A JP 2011071875 A JP2011071875 A JP 2011071875A JP 2009222664 A JP2009222664 A JP 2009222664A JP 2009222664 A JP2009222664 A JP 2009222664A JP 2011071875 A JP2011071875 A JP 2011071875A
Authority
JP
Japan
Prior art keywords
audio
voice
audio device
usb
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009222664A
Other languages
English (en)
Other versions
JP5321390B2 (ja
Inventor
Hiroshi Kuboki
浩 久保木
Shinji Usuha
伸司 薄葉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2009222664A priority Critical patent/JP5321390B2/ja
Priority to CN201010215612.4A priority patent/CN102033731B/zh
Priority to US12/923,138 priority patent/US9098235B2/en
Publication of JP2011071875A publication Critical patent/JP2011071875A/ja
Application granted granted Critical
Publication of JP5321390B2 publication Critical patent/JP5321390B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/162Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

【課題】 高音質を期して外付けした外部オーディオデバイスとの音声データの授受にOSを介在させても音声信号の処理遅延を抑える。
【解決手段】 本発明は、汎用OSを搭載したコンピュータに、音声通信プログラムをインストールしている音声通信装置に関する。外部オーディオデバイスは、スピーカ及びマイクロフォンを有して遠端話者の音声を発音出力すると共に近端話者の音声を捕捉する。音声通信プログラムの一機能として、外部オーディオデバイスが外付けされているとき、対向する音声通信装置と授受する音声データを、汎用OSにおける音声データの処理ルートを介さず、汎用OSを単に通過させて、外部オーディオデバイスと授受する音声データ入出力部が設けられている。
【選択図】 図1

Description

本発明は音声通信装置及びプログラムに関し、例えば、市販のパソコンを電話端末(ソフトフォン)として利用する場合に適用し得るものである。
近年、パソコンにソフトフォン用アプリケーションを搭載し、パソコンを電話端末として使用することもなされるようになってきている。例えば、外部装置を取り付けられるパソコンのコネクタ(例えば、USB(Universal Serial Bus)インタフェースのコネクタ)に、ヘッドセットやハンドセット等のマイクロフォン及びスピーカを有する音声入出力装置を接続させ、この外部音声入出力装置を利用して、オペレータが通話を行う。また例えば、音響信号を取り扱う音響装置を、上述した外部音声入出力装置として用い、高音質の音声通信を楽しむことも行われている。
パソコンと、上記外部音声入出力装置との音声信号の授受は、従来においては、以下の2点の要因により、パソコン上のOS(オペレーティングシステム)に実装されている標準的なオーディオインタフェースを使用して音声の入出力を行っていた。
(1)市販されているパソコンの大半には内蔵サウンドデバイス(アナログ入出力)が搭載されており、OSに対応したドライバがプレインストールされているため、ユーザの多くはこれを用いていた。また、音質を重視する一部のユーザはUSBヘッドセット等の外部音声入出力装置(外部デバイス)を別途使用することもあったが、ドライバ、PnP(プラグ&プレイ)動作を含めOSの標準的な仕組みはそのまま利用していたため、結果として内蔵デバイスと同様のオーディオルートを経由して音声の入出力が行われていた。
(2)音量調整、可聴音生成のためのファイル再生、ミキシング機能等の実現、及び、他のアプリケーションとの共存のために、OSが用意しているAPI(Application Programming Interface)を利用して実現していた。
なお、特許文献1には、電話網とパソコンとの間に介在し、音声信号を処理することにより、ヘッドセット等が接続されているパソコンでの処理を軽減し、処理遅延を抑えることができるアダプタ装置が提案されている。
特開2004−336756号公報
しかし、OSが標準的に実装している音声入出力インタフェース、ドライバを使用する場合、音楽再生等の他のアプリケーションとの共存を前提としているため、汎用性が高い反面、過剰なオーバヘッドとなる可能性のあるソフトウェア処理等を多く経由することとなり、結果として遅延が発生する原因となっていた。これらを改善するために、一部遅延を考慮したインタフェース(例えばASIO(Audio Streaming Input Output))のようなものもあったが、音楽再生・演奏用に特化したものであり、双方向リアルタイム通信に配慮したものではなかった。
また、新しいOSになるほど過剰なオーバヘッドによる遅延傾向が強く、CPUを含めたハードウェア性能が大幅に上がっているにも関わらず、従来以上に大幅に遅延が増大することがあった。
発生する遅延自体も様々であり、同時に起動しているアプリケーションの起動時にバックグラウンドの処理に依存して遅延が急激に増減するような場合には、例えば、エコーキャンセラ等の動作に悪影響を及ぼすことも多かった。
上述のような問題が多々発生するため、音声通信サービスを展開する際の大きな障壁となっており、ソフトフォンの使用範囲は限定的であった。
特許文献1の記載技術は低遅延を意図したものではあるが、専用装置としてのアダプタ装置が必要となり、多くの利用者に適用可能な解決方法とは言い難いものである。
そのため、OSを介在しても音声信号の処理遅延を抑えることができる音声通信装置及びプログラムが望まれている。
かかる課題を解決するため、第1の本発明は、汎用オペレーティングシステムを搭載したコンピュータに、音声通信プログラムをインストールしている音声通信装置において、(1)スピーカ及びマイクロフォンを有して遠端話者の音声を発音出力すると共に近端話者の音声を捕捉する、上記コンピュータに外付け可能な第1のオーディオデバイスと、(2)上記第1のオーディオデバイスが外付けされているとき、対向する音声通信装置と授受する音声データを、上記汎用オペレーティングシステムにおける音声データの処理ルートを介さず、上記汎用オペレーティングシステムを単に通過させて、上記第1のオーディオデバイスと授受する、上記音声通信プログラムの一機能として設けられた第1の音声データ入出力部とを備えることを特徴とする。
第2の本発明は、スピーカ及びマイクロフォンを有して遠端話者の音声を発音出力すると共に近端話者の音声を捕捉する第1のオーディオデバイスが外付けされている、しかも、汎用オペレーティングシステムを搭載したコンピュータにインストールされて音声通信装置を構成させる音声通信プログラムであって、上記コンピュータを、上記第1のオーディオデバイスが外付けされているとき、対向する音声通信装置と授受する音声データを、上記汎用オペレーティングシステムにおける音声データの処理ルートを介さず、上記汎用オペレーティングシステムを単に通過させて、上記第1のオーディオデバイスと授受する第1の音声データ入出力部として機能させることを特徴とする。
本発明の音声通信装置及びプログラムによれば、高音質を期して外付けした外部オーディオデバイスとの音声データの授受にOSを介在させても音声信号の処理遅延を抑えることができるようになる。
第1の実施形態に係る音声通信装置の機能的構成を示すブロック図である。 第2の実施形態に係る音声通信装置の機能的構成を示すブロック図である。
(A)第1の実施形態
以下、本発明による音声通信装置及びプログラムを、市販のパソコンを電話端末(ソフトフォン)として利用する場合に適用した第1の実施形態を、図面を参照しながら詳述する。
(A−1)第1の実施形態の構成
図1は、第1の実施形態に係る音声通信装置の機能的構成を示すブロック図である。
図1において、第1の実施形態に係る音声通信装置1は、主として、パソコン2と、このパソコン2に接続されている専用USBオーディオデバイス3とを備えている。
専用USBオーディオデバイス3は、USBインタフェースを採用した音声(及び音響)の入出力機能を備えたデバイスであり、スピーカ10及びマイクロフォン11を内蔵しているものであっても良く、また、スピーカ10及びマイクロフォン11が外付けのものであっても良い。
専用USBオーディオデバイス3は、今日市販されている一般的なオーディオデバイス(例えば、AC97CODECやHD−Audio等を採用しているオーディオデバイス)に比較すると、パソコン2側との音声データの授受が、音声データであることをOS30が意識しないデータの授受になっている点が機能的には異なっている。専用USBオーディオデバイス3は、例えば、USBメモリとパソコン2とのデータ授受と同様な形態で、パソコン2側と音声データを授受する。
専用USBオーディオデバイス3は、パソコン2との転送を制御、実行するUSBコントローラ12と、マイクロフォン11が捕捉したアナログ音声信号をデジタル音声データに変換すると共に、パソコン2から与えられたデジタル音声データをアナログ音声信号に変換するアナログ/デジタル相互変換部(ADC/DAC)13と、スピーカ10及びマイクロフォン11とのインタフェース部(I/F)14とを有する。USBコントローラ12が、音声データを、OS30が音声データとして意識しない形態で転送するものである。
例えば、後述するように、専用USBオーディオデバイス3として、一般的なUSBオーディオデバイス(例えば、AC97CODECやHD−Audio等を採用しているオーディオデバイス)を利用し、OS30側の認識処理により、専用USBオーディオデバイス3として機能させる。
パソコン2は、電話通信に関係している部分として、VoIP(Voice over IP)エンジン20と、OS30と、USBコントローラ40と、内蔵スピーカ41と、内蔵マイクロフォン42と、内蔵オーディオデバイス43とを有している。VoIPエンジン20及びOS30はソフトウェアでなる部分であるが、この第1の実施形態の説明では、かかるソフトウェアを実行するCPU等をも含めて、VoIPエンジン20、OS30と表記している。
VoIPエンジン20は、主として、パケット組立分解部21と、呼制御部22と、コーデック部23と、音声制御部24と、音声データ入出力部25と、可聴音データ出力部26とを有している。
パケット組立分解部21は、図示しない通信部が受信した電話網からのパケットを分解するものである。パケット組立分解部21は、受信パケットが呼制御パケットであれば、分解して得られた呼制御データを呼制御部22に与え、また、受信パケットが音声パケットであれば、分解して得られた符号化音声データをコーデック部23に与える。パケット組立分解部21は、呼制御部22から与えられた呼制御データや、コーデック部23から与えられた符号化音声データを含むパケットを組み立てて、図示しない通信部から電話網に送信させるものである。
呼制御部22は、発着信時に通話路を確立したり、切断時に通話路を切断したりする等の呼制御を実行するものである。なお、図1では省略しているが、呼制御部22には、キーボードなどが検知した操作信号等がOS30を介して与えられるようになされている。呼制御部22は、そのときの呼制御の段階によって、所定の可聴音(例えばリンギングトーン)の発音出力が必要となった場合には、内部に記憶している可聴音データを取り出し、可聴音データ出力部25に与えるものである。
コーデック部23は、受信した符号化音声データを復号して音声制御部24経由で音声データ入出力部25に与え、音声データ入出力部25から音声制御部24経由で与えられた音声データを符号化し、符号化音声データをパケット組立分解部21に与えるものである。
音声制御部24は、第1の実施形態の場合、音声データがOS30内のオーディオ制御部33を経由しないために、VoIPエンジン20内に設けられたものである。音声制御部24は、音声データに対し、音量調整、ファイル再生・録音、ミキシングなどの処理を施すものである。
音声データ入出力部25は、OS30経由で、専用USBオーディオデバイス3と音声データを授受するものである。この第1の実施形態の場合、上述したように、専用USBオーディオデバイス3との音声データの授受では、専用USBオーディオデバイス3が音声データであることを意図しない形態で授受するものとなっており、音声データ入出力部25は、そのような一般的なデータと同様な授受をできるように、音声データを処理するものである。例えば、音声データ入出力部25と、専用USBオーディオデバイス3のUSBコントローラ12との間では、音声データ(PCM音声データ)が挿入されているUSBパケットの形態で音声データを授受し、OS30に音声データであることを意識させないようにする。
可聴音データ出力部26は、呼制御部22から与えられた可聴音データを、OS30の標準的インタフェースに従う形式でOS30に与えるものである。
USBコントローラ40は、専用USBオーディオデバイス3のUSBコントローラ12に対向し、データのUSB転送を実行するものである。
内蔵スピーカ41及び内蔵マイクロフォン42は、パソコン2が内蔵しているスピーカ、マイクロフォンであり、電話端末として機能しているときには、可聴音の発音動作程度の機能しか担当していない。内蔵オーディオデバイス43は、内蔵マイクロフォン41が捕捉したアナログ音声信号をデジタル音声データに変換すると共に、OS30から与えられたデジタル音声データをアナログ音声信号に変換したり、また、内蔵スピーカ41や内蔵マイクロフォン42との信号を授受したりするものである。
OS30としては、例えば、既存の汎用OS(例えば、WINDOWS(登録商標)、LINUX、マックOS等)を適用することができる。
OS30は、電話端末(ソフトフォン)としての機能から見れば、専用デバイスドライバ31、USBドライバ32、オーディオ制御部33、内蔵デバイスドライバ34を有する。専用デバイスドライバ31及びUSBドライバ32は音声データの授受に介在するものであり、オーディオ制御部33及び内蔵デバイスドライバ34は可聴音の報知に介在するものである。
専用デバイスドライバ31は、専用USBオーディオデバイス3が接続された際に、標準オーディオインタフェースではなく専用インタフェースとしてデータの送受信を実現するものである。専用デバイスドライバ31(及びUSBドライバ32)は、VoIPエンジン20及び専用USBオーディオデバイス3間のデータ(音声データ)の転送をトランスペアレントに実行する。すなわち、なんら処理することなく、単に、VoIPエンジン20及び専用USBオーディオデバイス3間の転送データ(例えば、音声データを挿入したUSBパケット)を通過させる。専用デバイスドライバ31は、例えば、USBオーディオデバイス用ドライバ(Windowsの場合、USBAUDIO.SYS)と同等機能を実現するものであるが、音声処理等の転送以外の処理に対応していないものである。
USBドライバ32は、USBコントローラ40と、専用USBオーディオデバイス3のUSBコントローラ12とのUSB転送を駆動するものである。また、USBドライバ32は、USBコネクタに挿入されたデバイスが専用USBオーディオデバイス3であることを認識するものである。
市販のUSBオーディオデバイスのうち、標準的オーディオデバイスではなく専用デバイス(専用USBオーディオデバイス3)として認識させようとする製品のID情報(例えば、ベンダIDやプロダクトID等)に、予めPnP機能が動作するために必要な、USBドライバ32内のデバイス情報(例えば、Windowsの場合“INFファイル”等)を書き換えておく。専用デバイスドライバ31は、USBコネクタにデバイスが挿入され、USBドライバ32が、挿入されたデバイスのID情報が専用USBオーディオデバイス3のID情報であると認識したときに有効となるものである。
以上の方法を適用すると、汎用のUSBオーディオデバイスに特別な変更、改造等を加えることなく、専用USBオーディオデバイス3として識別、起動させることが可能となる。
オーディオ制御部33は、OS30が有する標準的なオーディオ制御部であり、音量調整、ファイル再生・録音、ミキシングなどの処理を施すものである。
内蔵デバイスドライバ34は、内蔵スピーカ41及び内蔵マイクロフォン42を収容している内蔵オーディオデバイス43を駆動するものである。
(A−2)第1の実施形態の動作
次に、第1の実施形態に係る音声通信装置1の動作を説明する。
当該音声通信装置1が発信側であろうと着信側であろうと、呼を接続しようとするときには、呼制御部22が呼を確立するためのシーケンスを実行する。
この呼制御のいずれかの段階で、可聴音の発音出力が必要となったときには、呼制御部22は該当する可聴音データを可聴音データ出力部26に与える。このとき、可聴音データ出力部26は、音響データであることを表す情報と共に可聴音データをOS30に与える。これにより、OS30では音響データや音声データに対する標準的なインタフェースであるオーディオ制御部33や内蔵デバイスドライバ34が機能して処理し、その後、可聴音データが内蔵オーディオデバイス43に与えられ、アナログ信号に変換されて内蔵スピーカ41から発音出力される。
以上のように、呼制御段階であって、処理遅延がほとんど問題とならない可聴音はOS30の標準インタフェースが利用されて発音出力される。
呼制御部22の呼制御によって対向装置との呼を確立すると、両装置の話者(遠端話者及び近端話者)が通話を行う。
対向装置からの遠端話者の音声情報を含む音声パケットは、パケット組立分解部21に与えられ、分解されて符号化音声データが取り出され、この符号化音声データがコーデック部23によって復号され、音声データが再生される。この音声データは、音声制御部24によって音量調整等の処理が施された後、音声データ入出力部25によって、OS30をそのまま通過する形態(例えばUSBパケット)の転送データに変換されてOS30に与えられる。OS30において、専用デバイスドライバ31及びUSBドライバ32は、このようにして入力された転送データをそのまま通過させ、その後、USBコントローラ40から、専用USBオーディオデバイス3のUSBコントローラ12に与えられる。USBコントローラ12において、転送形態(例えばUSBパケット)が解除されて音声データに戻される。この音声データは、アナログ/デジタル相互変換部13によってアナログ音声信号に変換された後、インタフェース部14を介してスピーカ10に与えられて発音出力される。
一方、近端話者の音声は、マイクロフォン11が捕捉し、インタフェース部14を介してアナログ/デジタル相互変換部13に与えられ、デジタル信号(音声データ)に変換される。USBコントローラ12は、この音声データを、OS30をそのまま通過する形態(例えばUSBパケット)の転送データに変換してパソコン2に与える。パソコン2においては、この転送データをUSBコントローラ40が受けるが、専用USBオーディオデバイス3からの転送データであるので、専用デバイスドライバ31及びUSBドライバ32の制御下で、転送形態を解除することなく、USBドライバ32に与える。この転送データは、USBドライバ32及び専用デバイスドライバ31をそのまま通過して、音声データ入出力部25に与えられる。音声データ入出力部25は、転送データの転送形態(例えばUSBパケット)を解除して音声データに戻して音声制御部24に与える。音声制御部24は、音声データに対して、必要な音声処理を施した後(音声処理がなされない場合を含む)、コーデック部23に与える。音声データは、コーデック部23によって符号化され、さらに、パケット組立分解部21によってパケットに組み立てられ、電話網に送信される。
(A−3)第1の実施形態の効果
以上のように、第1の実施形態によれば、専用の送受信インタフェース(主に論理的なもの)を準備することで、OS標準搭載のオーディオデバイスを使用するメディア処理(例えば、可聴音処理)については汎用インタフェースを使用しつつ、リアルタイム性を要求される音声データのみを専用ルート経由としたので、音声データの送受信時の遅延をOSの音声処理構成を通過させない分、最低限に抑えることができる。また、IP網を介するので、広帯域音声データを送受信することが可能であるが、OSでの音声処理が広帯域対応でなければ高音質を実現できない。しかし、第1の実施形態では、音声データはOSをスルーであるので、外部の専用USBオーディオデバイス3を適用したことと相まって高音質を実現することができる。
すなわち、第1の実施形態によれば、VoIPが前提としている双方向メディアストリームの送受信を、ほぼリアルタイムで高音質で実現することができる。
(B)第2の実施形態
次に、本発明による音声通信装置及びプログラムを、市販のパソコンを電話端末(ソフトフォン)として利用する場合に適用した第2の実施形態を、図面を参照しながら詳述する。
図2は、第1の実施形態に係る音声通信装置の機能的構成を示すブロック図であり、第1の実施形態に係る図1との同一、対応部分には、同一、対応符号を付して示している。
図2において、第2の実施形態に係る音声通信装置1Aを搭載しているパソコン2Aは、複数(図2では2個を示している)のUSBコネクタを有し、これらUSBコネクタには、低遅延USBオーディオデバイス3と標準USBオーディオデバイス4とが接続可能である。図2は、低遅延USBオーディオデバイス3と標準USBオーディオデバイス4とが接続された状態を示している。
低遅延USBオーディオデバイス3は、第1の実施形態の専用USBオーディオデバイスと同一なものであり、ネーミングだけを変更したものである。標準USBオーディオデバイス4は、既存の一般的なUSBオーディオデバイスである。低遅延USBオーディオデバイス3及び標準USBオーディオデバイス4は、OS30Aにおいて、利用される要素が異なるものである。標準USBオーディオデバイス4は、スピーカ50及びマイクロフォン51を収容していると共に、USBコントローラ52と、アナログ/デジタル相互変換部(ADC/DAC)53と、インタフェース部(I/F)54とを有する。
図2では、低遅延USBオーディオデバイス3のUSBコントローラ12は、接続時に、パソコン2のUSBコントローラ40と対向し、標準USBオーディオデバイス4のUSBコントローラ42は、接続時に、パソコン2のUSBコントローラ44と対向している状態を示している。
なお、図2では、内蔵スピーカ41、内蔵マイクロフォン42、内蔵オーディオデバイス43の図示を省略している。
第2の実施形態の場合、OS30Aは、第1の実施形態と同様な専用デバイスドライバ31及びUSBドライバ32に加え、標準USBオーディオデバイス4との音声又は音響データの転送時に機能するオーディオ制御部60、デバイスドライバ61及びUSBドライバ62を有する。ここで、オーディオ制御部60は、第1の実施形態のオーディオ制御部33と同一のものである。OS30Aは、さらに、接続デバイス管理部63を有する。接続デバイス管理部63は、どのUSBコネクタにどのようなUSBデバイスが接続されているかを管理しているものである。
第2の実施形態のVoIPエンジン20Aは、パケット組立分解部21と、呼制御部22と、コーデック部23と、音声制御部24と、低遅延音声データ入出力部25と、標準音声データ入出力部26Aと、使用デバイス決定部27とを有している。
標準音声データ入出力部26Aは、第1の実施形態の可聴音データ出力部26に代えて設けられたものであり、OS30A内のオーディオ制御部60、デバイスドライバ61及びUSBドライバ62でなる処理系との間で、音声データ(可聴音データを含む)を授受するものである。言い換えると、標準USBオーディオデバイス4が接続されているときに有効となるものである。
使用デバイス決定部27は、OS30Aの接続デバイス管理部63の管理情報などに基づき、使用するデバイスを決定するものである。
使用デバイス決定部27は、呼の確立中や切断中の呼制御段階において可聴音の発音出力が必要なときに、標準USBオーディオデバイス4が接続されていれば標準USBオーディオデバイス4を使用するものに決定し、標準USBオーディオデバイス4が接続されていなければ内蔵スピーカ41を使用するものに決定する。
使用デバイス決定部27は、通話段階においては、低遅延USBオーディオデバイス3が接続されていれば(この場合、標準USBオーディオデバイス4が接続されていてもいなくても良い)、音声の入出力デバイスとして低遅延USBオーディオデバイス3を使用するものに決定する。また、使用デバイス決定部27は、通話段階においては、低遅延USBオーディオデバイス3が接続されておらず、標準USBオーディオデバイス4が接続されている場合には、音声の入出力デバイスとして標準USBオーディオデバイス4を使用するものに決定する。さらに、使用デバイス決定部27は、通話段階においては、低遅延USBオーディオデバイス3も標準USBオーディオデバイス4も接続されていない場合には、音声の入出力デバイスとして内蔵スピーカ41及び内蔵マイクロフォン42を使用するものに決定する。
使用デバイス決定部27は、通話音声の入出力デバイスとして低遅延USBオーディオデバイス3を使用する場合には、パケット組立分解部21、コーデック部23、音声制御部24及び低遅延音声データ入出力部25の処理系を有効に機能させ、音声の入出力デバイスとして標準USBオーディオデバイス4を使用する場合には、パケット組立分解部21、コーデック部23及び標準音声データ入出力部26Aの処理系を有効に機能させる。
ここで、標準USBオーディオデバイス4の接続状態において、VoIPエンジン20A以外のオーディオアプリケーション(例えばバックミュージックを流すソフトウェア)70が機能しているときには、標準USBオーディオデバイス4が利用される。この場合において、標準USBオーディオデバイス4が通話音声の入出力デバイスとして利用されていなければ、オーディオアプリケーション70からの音響データ又は音声データが標準USBオーディオデバイス4から発音出力され、一方、標準USBオーディオデバイス4が通話音声の入出力デバイスとして利用されていれば、通話音声データと、オーディオアプリケーション70からの音響データ又は音声データとがオーディオ制御部60によって合成され、標準USBオーディオデバイス4から発音出力される。
使用デバイス決定部27は、例えば、OS30Aとの間で音声データ送受信を行う際に、標準USBオーディオデバイス4への制御は標準音声データ入出力部26A(PCM送受信用API)を使用し、低遅延USBオーディオデバイス3については低遅延音声データ入出力部25(USBデバイス制御用API)を使用するといったように、オープンしている各々のデバイスに合わせてOS30AのAPI(Linuxの場合はシステムコール)を切り替え(若しくは選択)する。
第2の実施形態によれば、通話音声の入出力デバイスとして低遅延USBオーディオデバイス3を使用する場合には、第1の実施形態と同様な効果を奏することができる。
また、第2の実施形態によれば、外部デバイスの接続状態に応じた最適な形で通話音声を送受信することができる。
さらに、第2の実施形態によれば、VoIPエンジン20Aと他のオーディオアプリケーション70とを併用することができる。
(C)他の実施形態
上記第2の実施形態においては、低遅延USBオーディオデバイス3及び標準USBオーディオデバイス4の接続状態に応じて、通話音声の入出力に用いるデバイスを定めるものを示したが、低遅延USBオーディオデバイス3及び標準USBオーディオデバイス4の接続状態に加え、VoIPエンジン20A以外の他のアプリケーション(例えば、VoIPエンジン20Aより上位階層のアプリケーション)の指令に応じて、通話音声の入出力に用いるデバイスを定めるようにしても良い。
また、第2の実施形態の変形例として(第1の実施形態の変形例ともなり得る)、以下のようなものを挙げることができる。VoIPエンジン20Aに使用可能なUSBオーディオデバイスのリストを用意しておき、パソコン2Aに接続されていても、そのリストに掲載されていないUSBオーディオデバイスを接続されていないと取り扱うようにしても良い。
上記各実施形態においては、OSが有するオーディオ制御部を利用しないこと、VoIPエンジンに音声制御部を設けることで補償するものを示したが、他の方法で補償するようにしても良い。例えば、専用(低遅延)USBオーディオデバイス3が音量調整機能を備えている場合には、VoIPエンジンから音量調整指令を専用(低遅延)USBオーディオデバイス3に発行して音量を調整させるようにしても良い。
また、上記各実施形態では、専用(低遅延)USBオーディオデバイス3は標準USBオーディオデバイス4として利用できないものを示したが、専用(低遅延)USBオーディオデバイス3としても標準USBオーディオデバイス4としても利用できるUSBオーディオデバイスを利用するようにしても良い。例えば、1つのUSBオーディオデバイスが複数のID情報を備え、設定用スイッチによって、ユーザがそのUSBオーディオデバイスを専用(低遅延)USBオーディオデバイス3として用いるか標準USBオーディオデバイス4として用いるかを設定できるようにしても良い。
さらに、上記各実施形態では、専用デバイスドライバ31は転送データのトランスペアレントな送受信を行うものであったが、専用(低遅延)USBオーディオデバイス3の装着時に、付加機能を発揮するようなものであっても良い。例えば、専用(低遅延)USBオーディオデバイス3にVoIPエンジン20の制御下で予めユーザ情報などを書き込んで記憶させておき、専用(低遅延)USBオーディオデバイス3の装着時に、記憶されているユーザ情報を取り出してユーザ認証を行うようにしても良い。
上記各実施形態では、近年、最も一般的な汎用PCインタフェースであるUSBを用いたものを示したが、Firewire(IEEE.1394)、Bluetooth、PCカード(PCMCIA、カードBUS)、PCI等の他の汎用インタフェースを適用しても良い。
また、上記各実施形態では、OSを搭載したコンピュータ(情報処理装置)がパソコンであるものを示したが、汎用的なOSを搭載した装置であれば本発明を適用することができる。例えば、一般的なパソコンだけでなく、いわゆるネットブックやモバイルパソコンに本発明を適用することができる。また例えば、マルチメディアインターネットデバイス(MID)やウルトラモバイルPC(UMPC)などに対しても本発明を適用することができる。
1、1A…音声通信装置、2、2A…パソコン、3…専用USBオーディオデバイス(低遅延USBオーディオデバイス)、4…標準USBオーディオデバイス、10、50…スピーカ、11、51…マイクロフォン、12、52…USBコントローラ、13、53…アナログ/デジタル相互変換部(ADC/DAC)、14、54…インタフェース部(I/F)、20…VoIPエンジン、21…パケット組立分解部、22…呼制御部、23…コーデック部、24…音声制御部、25…音声データ入出力部(低遅延音声データ入出力部)、26…可聴音データ出力部、26A…標準音声データ入出力部、27…使用デバイス決定部、30、30A…OS、31…専用デバイスドライバ、32…USBドライバ、33、60…オーディオ制御部、34…内蔵デバイスドライバ、40、44…USBコントローラ、41…内蔵スピーカ、42…内蔵マイクロフォン、43…内蔵オーディオデバイス、61…デバイスドライバ、62…USBドライバ、70…オーディオアプリケーション。

Claims (5)

  1. 汎用オペレーティングシステムを搭載したコンピュータに、音声通信プログラムをインストールしている音声通信装置において、
    スピーカ及びマイクロフォンを有して遠端話者の音声を発音出力すると共に近端話者の音声を捕捉する、上記コンピュータに外付け可能な第1のオーディオデバイスと、
    上記第1のオーディオデバイスが外付けされているとき、対向する音声通信装置と授受する音声データを、上記汎用オペレーティングシステムにおける音声データの処理ルートを介さず、上記汎用オペレーティングシステムを単に通過させて、上記第1のオーディオデバイスと授受する、上記音声通信プログラムの一機能として設けられた第1の音声データ入出力部と
    を備えることを特徴とする音声通信装置。
  2. スピーカ及びマイクロフォンを有して遠端話者の音声を発音出力すると共に近端話者の音声を捕捉する、上記コンピュータに外付け可能な第2のオーディオデバイスと、
    上記第2のオーディオデバイスが外付けされていることを条件とし、対向する音声通信装置と授受する音声データを、上記汎用オペレーティングシステムにおける音声データの処理ルートを介して、上記第2のオーディオデバイスと授受する、上記音声通信プログラムの一機能として設けられた第2の音声データ入出力部と、
    音声データの授受では、上記第1の音声データ入出力部と上記第2の音声データ入出力部との一方を有効とする、上記音声通信プログラムの一機能として設けられた選択部と
    を備えることを特徴とする音声通信装置。
  3. 上記選択部は、上記第1のオーディオデバイスが外付けされているとき、上記第1の音声データ入出力部を有効とし、上記第1のオーディオデバイスが外付けされておらず、上記第2のオーディオデバイスが外付けされているとき、上記第2の音声データ入出力部を有効とすることを特徴とする請求項2に記載の音声通信装置。
  4. 上記選択部は、階層上、上記音声通信プログラムの上位に位置する上位プログラムの指示に応じて、上記第1の音声データ入出力部又は上記第2の音声データ入出力部の一方を有効とすることを特徴とする請求項2に記載の音声通信装置。
  5. スピーカ及びマイクロフォンを有して遠端話者の音声を発音出力すると共に近端話者の音声を捕捉する第1のオーディオデバイスが外付けされている、しかも、汎用オペレーティングシステムを搭載したコンピュータにインストールされて音声通信装置を構成させる音声通信プログラムであって、
    上記コンピュータを、
    上記第1のオーディオデバイスが外付けされているとき、対向する音声通信装置と授受する音声データを、上記汎用オペレーティングシステムにおける音声データの処理ルートを介さず、上記汎用オペレーティングシステムを単に通過させて、上記第1のオーディオデバイスと授受する第1の音声データ入出力部として機能させる
    ことを特徴とする音声通信プログラム。
JP2009222664A 2009-09-28 2009-09-28 音声通信装置及びプログラム Active JP5321390B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009222664A JP5321390B2 (ja) 2009-09-28 2009-09-28 音声通信装置及びプログラム
CN201010215612.4A CN102033731B (zh) 2009-09-28 2010-06-24 语音通信装置及程序
US12/923,138 US9098235B2 (en) 2009-09-28 2010-09-03 Voice communication arrangement for minimizing communication delay caused by audio signal processing in OS

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009222664A JP5321390B2 (ja) 2009-09-28 2009-09-28 音声通信装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2011071875A true JP2011071875A (ja) 2011-04-07
JP5321390B2 JP5321390B2 (ja) 2013-10-23

Family

ID=43780416

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009222664A Active JP5321390B2 (ja) 2009-09-28 2009-09-28 音声通信装置及びプログラム

Country Status (3)

Country Link
US (1) US9098235B2 (ja)
JP (1) JP5321390B2 (ja)
CN (1) CN102033731B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101811220B1 (ko) * 2012-02-16 2018-01-25 삼성전자 주식회사 이동 통신 시스템에서 휴대 단말기의 VoIP 처리 방법 및 장치

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10332523B2 (en) * 2016-11-18 2019-06-25 Google Llc Virtual assistant identification of nearby computing devices

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004274194A (ja) * 2003-03-06 2004-09-30 Toshiba Corp 電子機器及びデータ変換方法
JP2006018553A (ja) * 2004-07-01 2006-01-19 Hitachi Information Technology Co Ltd ネットワーク端末
JP2006166203A (ja) * 2004-12-09 2006-06-22 Oki Electric Ind Co Ltd 通話制御装置及び通話制御方法
JP2006330552A (ja) * 2005-05-30 2006-12-07 Seiko Epson Corp プレゼンテーション補助デバイス
JP2007219711A (ja) * 2006-02-15 2007-08-30 Silex Technology Inc リモートデバイス制御プログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000504892A (ja) * 1996-02-09 2000-04-18 アイ―リンク・ワールドワイド・インコーポレーテッド 音声インターネット伝送システム
JP3708268B2 (ja) * 1997-01-22 2005-10-19 松下電器産業株式会社 インターネットフォンサーバ装置及びインターネットを利用した通話システム
US6118780A (en) * 1997-03-17 2000-09-12 International Business Machines Corporation Communication network and method of operation for real time user selection of voice and/or data paths in the network
US6424647B1 (en) * 1997-08-13 2002-07-23 Mediaring.Com Ltd. Method and apparatus for making a phone call connection over an internet connection
US6337858B1 (en) * 1997-10-10 2002-01-08 Nortel Networks Limited Method and apparatus for originating voice calls from a data network
US6215784B1 (en) * 1997-12-24 2001-04-10 Nortel Networks Limited Method and system for voice call completion using information retrieved from an open application on a computing machine
US6345047B1 (en) * 1998-06-12 2002-02-05 Northern Telecom Limited Computer telephony adapter and method
US6253249B1 (en) * 1998-08-31 2001-06-26 Nortel Networks Limited Method and devices for bridging data and telephone networks
US6621893B2 (en) * 2001-01-30 2003-09-16 Intel Corporation Computer telephony integration adapter
US7567549B2 (en) * 2003-04-30 2009-07-28 Microsoft Corporation Computer telephony integration adapter
JP4774831B2 (ja) * 2005-06-30 2011-09-14 沖電気工業株式会社 音声処理周辺装置及びip電話システム
US20070025338A1 (en) * 2005-07-26 2007-02-01 Smartlink Ltd.. Software-based solutions for telephone network bridging
CN101035170A (zh) * 2006-03-09 2007-09-12 林春云 基于usb接口的语音通信方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004274194A (ja) * 2003-03-06 2004-09-30 Toshiba Corp 電子機器及びデータ変換方法
JP2006018553A (ja) * 2004-07-01 2006-01-19 Hitachi Information Technology Co Ltd ネットワーク端末
JP2006166203A (ja) * 2004-12-09 2006-06-22 Oki Electric Ind Co Ltd 通話制御装置及び通話制御方法
JP2006330552A (ja) * 2005-05-30 2006-12-07 Seiko Epson Corp プレゼンテーション補助デバイス
JP2007219711A (ja) * 2006-02-15 2007-08-30 Silex Technology Inc リモートデバイス制御プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101811220B1 (ko) * 2012-02-16 2018-01-25 삼성전자 주식회사 이동 통신 시스템에서 휴대 단말기의 VoIP 처리 방법 및 장치

Also Published As

Publication number Publication date
US20110075823A1 (en) 2011-03-31
JP5321390B2 (ja) 2013-10-23
US9098235B2 (en) 2015-08-04
CN102033731A (zh) 2011-04-27
CN102033731B (zh) 2015-02-11

Similar Documents

Publication Publication Date Title
US8200479B2 (en) Method and system for asymmetric independent audio rendering
US8867527B2 (en) Speech processing peripheral device and IP telephone system
US20100128888A1 (en) Automatic Audio Processing Mode Control
JP2009089392A (ja) 移動端末をコンピュータの入出力装置とする装置及びそのシステム、並びに方法
US8744524B2 (en) User interface tone echo cancellation
US8504115B2 (en) Automatic sidetone control
JP5321390B2 (ja) 音声通信装置及びプログラム
JP2016046796A (ja) サウンドデータ両方向ミラーリングシステム
JPH09233198A (ja) 全二重音声会議電話のためのソフトウエアベースのブリッジ方法及び装置
US20110235632A1 (en) Method And Apparatus For Performing High-Quality Speech Communication Across Voice Over Internet Protocol (VoIP) Communications Networks
TWI435589B (zh) 網路電話通訊整合系統及方法
CN111225102A (zh) 一种蓝牙音频信号传输方法和装置
KR20000062481A (ko) 컴퓨터의 유니버셜 시리얼버스 포트를 이용한 인터넷전화장치 및 인터넷 전화통화방법
US20100027530A1 (en) Adaptive network phone device and control method thereof
US20070253440A1 (en) Internet communication system and method
US20070121804A1 (en) Phone voice receiving /playing device
KR20040082992A (ko) 캡쳐링 서비스를 통한 오디오 출력에의 접근
TWI784594B (zh) 會議終端及聲音浮水印的嵌入方法
US20140003612A1 (en) Information terminal and computer program product
KR200276694Y1 (ko) 유에스비(usb)접속부를 갖는 무선랜 인터넷전화기.
JP2011199802A (ja) オーディオアダプタ
JP2006311279A (ja) 音声録音装置およびその方法
TWI466105B (zh) 音頻系統及音頻處理方法
KR200392162Y1 (ko) 이동용 저장 장치와 연결 가능한 usb 오디오 장치
CN117854529A (zh) 音频处理方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120515

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121127

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130528

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130528

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130618

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130701

R150 Certificate of patent or registration of utility model

Ref document number: 5321390

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150