JP5489900B2 - 音響データ通信装置 - Google Patents

音響データ通信装置 Download PDF

Info

Publication number
JP5489900B2
JP5489900B2 JP2010168380A JP2010168380A JP5489900B2 JP 5489900 B2 JP5489900 B2 JP 5489900B2 JP 2010168380 A JP2010168380 A JP 2010168380A JP 2010168380 A JP2010168380 A JP 2010168380A JP 5489900 B2 JP5489900 B2 JP 5489900B2
Authority
JP
Japan
Prior art keywords
data
processing
acoustic
processed data
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010168380A
Other languages
English (en)
Other versions
JP2012029224A (ja
Inventor
祐二 小池
和士 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Korg Inc
Original Assignee
Yamaha Corp
Korg Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp, Korg Inc filed Critical Yamaha Corp
Priority to JP2010168380A priority Critical patent/JP5489900B2/ja
Priority to EP20110175165 priority patent/EP2413315B1/en
Priority to US13/190,021 priority patent/US8965755B2/en
Publication of JP2012029224A publication Critical patent/JP2012029224A/ja
Application granted granted Critical
Publication of JP5489900B2 publication Critical patent/JP5489900B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm

Description

本発明は、音響データ通信装置から送信された音響データ(以下「処理前データ」という)の処理で音響処理装置が生成した音響データ(以下「処理済データ」という)を音響データ通信装置にて利用する技術に関する。
音響データ通信装置と通信する音響処理装置(サーバ装置)に効果付与等の各種の音響処理を代行させる技術が従来から提案されている(例えば特許文献1や特許文献2)。音響処理装置は、処理前データに対する音響処理で生成した処理済データを音響データ通信装置に送信する。音響データ通信装置は、音響処理装置から受信した各処理済データを順次に再生する。
特開平10−177380号公報 特開平11−085148号公報
ところで、音響データ通信装置による処理前データの送信から処理済データの受信までの時間は、通信網の通信トラヒックや音響処理装置の処理負荷等の要因に応じて随時に変化する。したがって、音響データ通信装置にて処理済データを再生すべき時点に、その処理済データがまだ音響処理装置から到達していない状況が発生し得る。以上のように処理済データが遅滞した場合には、所期の処理済データが到達するまで再生音が無音となる可能性がある。以上の事情を考慮して、本発明は、処理済データの遅滞に起因した再生音の中断を防止することを目的とする。
以上の課題を解決するために、本発明の音響データ通信装置は、音響データに音響処理を実行する音響処理装置と通信する音響データ通信装置であって、音響処理前の音響データである処理前データの時系列を記憶する第1記憶手段と、第1記憶手段内の各処理前データを音響処理装置に送信する送信手段と、処理前データに対する音響処理で生成された処理済データを音響処理装置から受信する受信手段と、受信手段が受信した処理済データの時系列を記憶する第2記憶手段と、第2記憶手段に記憶された処理済データを順次に指定する手段であって、一の処理済データを指定すべき時点において一の処理済データが第2記憶手段に記憶されていない場合には、第1記憶手段内の処理前データの時系列のうち当該一の処理済データに対応する処理前データを指定する音響データ特定手段と、音響データ特定手段が指定した音響データを再生する再生処理手段とを具備する。
以上の構成においては、一の処理済データを指定すべき時点において当該一の処理済データが第2記憶手段に記憶されていない場合には、当該一の処理済データに対応する処理前データが再生処理手段に指定される。したがって、一の処理済データが遅滞した場合に無音を示す音響データ(ゼロデータ)が再生処理手段に指定されて再生音が無音となる構成と比較すると、処理済データの遅滞に起因した再生音の中断が防止されるという利点がある。
本発明の好適な態様に係る音響データ通信装置は、処理前データの処理を指示する処理指示を順次に発生する指示発生手段を具備し、音響データ特定手段は、処理指示にて指定された処理前データからみて所定の遅延量だけ過去の処理前データに対応する処理済データを指定する。以上の態様においては、処理指示で指定された処理前データからみて基準遅延量だけ過去の処理前データに対応する処理済データを音響データ特定手段が指定するから、基準遅延量の範囲内で処理済データが遅滞した場合には処理済データが再生処理手段に指定される。したがって、過剰な頻度で処理前データが再生処理手段に指定される可能性が低減される。
本発明の好適な態様において、音響データ特定手段は、第1処理済データ(例えば図6の処理済データDB[2])を指定すべき時点において当該第1処理済データが第2記憶手段に記憶され、かつ、当該第1処理済データの直後の第2処理済データ(例えば図6の処理済データDB[3])が第2記憶手段に記憶されていない場合に、第1処理済データと当該第1処理済データに対応する第1処理前データ(例えば図6の処理前データDA[2])とを、第1処理済データの音量が経時的に減少するとともに第1処理前データの音量が経時的に増加するようにクロスフェードした音響データ(例えば図6の音響データDC[2])を生成して再生処理手段に指定する。以上の態様においては、第1処理前データと第1処理済データとのクロスフェードで生成された音響データが、第2処理済データに対応する第2処理前データ(例えば図6の処理前データDA[3])の直前に再生されるから、音響処理後の再生音(第1処理済データの再生音)から音響処理前の再生音(第2処理前データの再生音)に遷移する明確な境界は受聴者に知覚されない。したがって、聴感的に自然な印象の再生音を生成できるという利点がある。
本発明の好適な態様において、音響データ特定手段は、第3処理済データ(例えば図6の処理済データDB[5])を指定すべき時点において当該第3処理済データが第2記憶手段に記憶され、かつ、当該第3処理済データの直前の第4処理済データ(例えば図6の処理済データDB[4])が第2記憶手段に記憶されていない場合に、第3処理済データと当該第3処理済データに対応する第3処理前データ(例えば図6の処理前データDA[5])とを、第3処理済データの音量が経時的に増加するとともに第3処理前データの音量が経時的に減少するようにクロスフェードした音響データ(例えば図6の音響データDC[5])を生成して再生処理手段に指定する。以上の態様においては、第3処理前データと第3処理済データとのクロスフェードで生成された音響データが、第4処理済データに対応する第4処理前データ(例えば図6の処理前データDA[4])の直後に再生されるから、音響処理前の再生音(第4処理前データの再生音)から音響処理後の再生音(第3処理済データの再生音)に遷移する明確な境界は受聴者に知覚されない。したがって、聴感的に自然な印象の再生音を生成できるという利点がある。
以上の各態様に係る音響データ通信装置は、音響データの制御に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラム(ソフトウェア)との協働によっても実現される。本発明のプログラムは、音響処理前の音響データである処理前データの時系列を記憶する第1記憶手段と、音響データに音響処理を実行する音響処理装置に第1記憶手段内の各処理前データを送信する送信手段と、処理前データに対する音響処理で生成された処理済データを音響処理装置から受信する受信手段と、受信手段が受信した処理済データの時系列を記憶する第2記憶手段と、第2記憶手段に記憶された処理済データを順次に指定する手段であって、一の処理済データを指定すべき時点において一の処理済データが第2記憶手段に記憶されていない場合には、第1記憶手段内の処理前データの時系列のうち当該一の処理済データに対応する処理前データを指定する音響データ特定手段と、音響データ特定手段が指定した音響データを再生する再生処理手段としてコンピュータを機能させる。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、通信網を介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。
本発明の第1実施形態に係る音響処理システムのブロック図である。 音響処理装置のブロック図である。 音響データ通信装置のブロック図である。 音響データ特定部の動作のフローチャートである。 音響データ特定部の動作を説明するための模式図である。 第2実施形態における音響データ特定部の動作を説明するための模式図である。 処理前データと処理済データとのクロスフェードの説明図である。 処理前データと処理済データとのクロスフェードの説明図である。 第2実施形態における音響データ特定部の動作のフローチャートである。
<A:第1実施形態>
図1は、本発明の第1実施形態に係る音響処理システム100のブロック図である。図1に示すように、音響処理システム100は、音響データ通信装置10(クライアント装置)と音響処理装置20(サーバ装置)とを含んで構成される通信システムである。音響データ通信装置10と音響処理装置20とは、通信網30(例えばインターネット)を介して相互に通信する。なお、図1では便宜的に1個の音響データ通信装置10のみを図示したが、実際には複数の音響データ通信装置10が通信網30を介して音響処理装置20と並列に通信する。
音響処理システム100で実行される通信の概略を以下に説明する。音響データ通信装置10は、音響(楽音や音声)の時間軸上の波形を表す処理前データDA[n](n=1,2,……)を音響処理装置20に対して順次に送信する。音響処理装置20は、音響データ通信装置10から受信した処理前データDA[n]に音響処理を実行し、音響処理後の処理済データDB[n]を音響データ通信装置10に順次に送信する。音響処理装置20が実行する音響処理としては、処理前データDA[n]が示す音響の周波数特性を変化させる処理(例えば残響音の付与等の効果付与や周波数変換)が例示される。
図2は、音響処理装置20のブロック図である。図2に示すように、音響処理装置20は、通信装置22と制御装置24とを含んで構成される。通信装置22は、音響データ通信装置10から送信された処理前データDA[n]を通信網30から順次に受信し、処理前データDA[n]に対する音響処理後の処理済データDB[n]を通信網30に対して順次に送信する。例えば、複数(例えば20個)の処理前データDA[n]または処理済データDB[n]を含む所定長(例えば約500msの音響に相当するサイズ)のパケットが音響データ通信装置10と音響処理装置20との間で授受される。
制御装置(CPU)24は、通信装置22が受信した処理前データDA[n]に対する音響処理で処理済データDB[n]を順次に生成する。処理前データDA[n]の音響処理は、例えばVST(Virtual Studio Technology)プラグインで実現される(「VST」は登録商標)。制御装置24が生成した処理済データDB[n]が通信装置22から音響データ通信装置10に順次に送信される。
図3は、音響データ通信装置10のブロック図である。音響データ通信装置10は、携帯電話機やパーソナルコンピュータ等の通信端末であり、図3に示すように制御装置12と記憶装置14と通信装置16と放音装置18とを含んで構成される。
記憶装置14は、例えば半導体記録媒体や磁気記録媒体で構成され、制御装置12が実行するプログラムPGMや制御装置12が使用する各種のデータ(例えば処理ファイルF)を記憶する。処理ファイルFは、音響処理装置20による音響処理の対象となるデータファイルである。楽曲の演奏音や歌唱音の時間波形を表す波形データが処理ファイルFとして記憶装置14に格納され、処理ファイルFを分割した複数の波形データの各々が処理前データDA[n]として音響処理装置20に送信される。
記憶装置14には記憶領域14Aと記憶領域14Bとが設定される。記憶領域14Aおよび記憶領域14Bの各々は、FIFO(First-In-First-Out)方式のバッファ領域として利用される。記憶領域14Aには、処理ファイルFを分割した各処理前データDA[n]が順次に記憶され、記憶領域14Bには、音響処理装置20から受信した各処理済データDB[n]が順次に記憶される。
通信装置16は、通信網30を介して音響処理装置20と通信する機器であり、送信部162と受信部164とを含んで構成される。送信部162は、記憶領域14Aに格納された処理前データDA[n]を通信網30に対して順次に送信する。受信部164は、音響処理装置20が送信した処理済データDB[n]を通信網30から順次に受信する。
制御装置(CPU)12は、記憶装置14に記憶されたプログラムPGMの実行で複数の機能(管理制御部40,情報中継部50)を実現する。管理制御部40は、音響データ通信装置10の全体を制御するDAW(Digital Audio Workstation)システムとして機能する。情報中継部50は、例えば管理制御部40をVSTホストとするVSTプラグインの実行で実現され、管理制御部40と音響処理装置20との相互間における音響データD(処理前データDA[n],処理済データDB[n])の授受を中継する。
管理制御部40は、指示発生部42と再生処理部44とを含んで構成される。指示発生部42は、情報中継部50に対する処理指示Pを順次に発生する。処理指示Pは、記憶領域14Aに対する処理前データDA[n]の格納(あるいは音響処理装置20に対する処理前データDA[n]の送信)および処理済データDB[n]の要求の指示であり、例えば、情報中継部50を実現するVSTプラグインに実装されたprocessReplacing関数で規定される。処理指示Pは周期T0で順次に発生する。周期T0は、処理前データDA[n](処理済データDB[n])の1個分に相当する時間に設定される。
再生処理部44は、情報中継部50(後述の音響データ特定部54)が指定する音響データD(処理前データDA[n],処理済データDB[n])を記憶装置14から順次に取得して放音装置18に供給する。放音装置18(例えばスピーカやヘッドホン)は、再生処理部44から供給される音響データDに応じた音波を放射する。なお、記憶装置14から取得した音響データDに対して再生処理部44が所定の処理を実行してから放音装置18に供給する構成も採用され得る。
図3の情報中継部50は、記憶管理部52と音響データ特定部54とを含んで構成される。記憶管理部52は、処理前データDA[n]とその処理前データDA[n]に対する音響処理後の処理済データDB[n]とを相互に対応させて記憶装置14に格納する。具体的には、記憶管理部52は、処理指示Pで指示された処理前データDA[n]を記憶領域14Aに格納するとともに記憶領域14A内の処理前データDA[n]を送信部162から音響処理装置20に順次に送信し、音響処理装置20から受信部164が受信した処理済データDBを記憶領域14Bに順次に格納する。
音響データ特定部54は、再生処理部44による処理(再生)の対象となる音響データD(処理前データDA[n],処理済データDB[n])を順次に特定して再生処理部44に指示する。音響データ特定部54は、指示発生部42による処理指示Pの発生毎に音響データDを順次に特定する。したがって、処理指示Pの発生と同等の周期T0で順次に音響データDが再生処理部44に指示される。音響データ特定部54による音響データDの特定について以下に詳述する。
処理前データDA[n]が音響処理装置20に送信されてから当該処理前データDA[n]に対応する処理済データDB[n]が記憶領域14Bに格納されるまでには相応の時間が必要となる。そこで、音響データ特定部54は、記憶領域14Bに記憶された複数の処理済データDB[n]のうち、処理指示Pで指定された処理前データDA[n]からみて所定の時間長(以下「基準遅延量」という)τだけ過去の処理前データDA[n-τ]に対応する処理済データDB[n-τ]を特定して再生処理部44に指示する。基準遅延量τは、処理前データDA[n]の送信から処理済データDB[n]の受信(記憶領域14Bに対する格納)までに経過する平均的な時間に応じて、処理指示Pの発生の周期T0よりも長い時間長に設定される。
ただし、処理前データDA[n]の送信から処理済データDB[n]の受信までの時間は、通信網30の通信トラヒックや音響処理装置20の処理負荷等の要因に応じて随時に変化する。したがって、処理前データDA[n]の送信から処理済データDBの受信までの遅延が大きい場合には、処理前データDA[n]を指定した処理指示Pの発生の時点において、音響データ特定部54が指定すべき処理済データDB[n-τ]が未だ記憶領域14Bに格納されていない(すなわち処理済データDB[n-τ]が遅滞している)可能性がある。そこで、音響データ特定部54は、処理前データDA[n]の格納を指示する処理指示Pの発生の時点で処理済データDB[n-τ]が記憶領域14Bに格納されていない場合、処理済データDB[n-τ]の代わりに、その処理済データDB[n-τ]に対応する処理前データDA[n-τ]を記憶領域14Aから特定して再生処理部44に指示する。
図4は、音響データ特定部54の処理のフローチャートである。指示発生部42による処理指示Pの発生毎に図4の処理が実行される。また、図5は、処理指示Pで順次に指定される処理前データDA[n]の時系列(最上段)と、記憶領域14Bに格納される処理済データDB[n]の時系列(最下段)と、再生処理部44に指示される音響データDの時系列(中段)との関係を示す説明図である。以下の説明では、基準遅延量τを処理指示Pの周期T0の4個分(処理前データDA[n]や処理済データDB[n]の4個分)に設定した場合が例示されている。
図4の処理を開始すると、音響データ特定部54は、最初の処理指示P(処理前データDA[1]を指示する処理指示P)を指示発生部42が発生した時点t0から基準遅延量τが経過したか否かを判定する(S11)。基準遅延量τが経過していない場合(S11:NO)、音響データ特定部54は、今回の処理指示Pに対する応答として音響データD0を再生処理部44に指示して図4の処理を終了する(S12)。音響データD0は、無音を意味する複数のゼロデータの時系列で構成される。図5に示すように、時点t0から基準遅延量τが経過するまでは音響データD0が再生処理部44に順次に指示されて放音装置18による再生音は無音(音量ゼロ)となる。
時点t0から基準遅延量τが経過すると(S11:YES)、音響データ特定部54は、今回の処理指示Pで指定された処理前データDA[n]からみて基準遅延量τだけ過去の処理前データDA[n-τ]に対応する処理済データDB[n-τ]が記憶領域14Bに格納されているか否かを判定する(S13)。例えば、図5の処理前データDA[5]を指定した処理指示Pが発生した場合、音響データ特定部54は、処理前データDA[1]の音響処理後の処理済データDB[1]が記憶領域14Bに格納されているか否かを判定する。
処理済データDB[n-τ]が記憶領域14Bに格納されている場合(S13:YES)、音響データ特定部54は、その処理済データDB[n-τ]を記憶領域14Bから特定して再生処理部44に指示する(S14)。図5では、処理済データDB[1]および処理済データDB[2]の各々が図4のステップS14にて指定された場合が例示されている。したがって、音響データ通信装置10の利用者は、処理ファイルF内の処理前データDA[1]および処理前データDA[2]に対する音響処理後の再生音を受聴する。処理済データDB[5]以降についても同様である。
他方、処理済データDB[n-τ]が未だ記憶領域14Bに格納されていない場合(S13:NO)、音響データ特定部54は、処理済データDB[n-τ]の代わりに、その処理済データDB[n-τ]に対応する処理前データDA[n-τ]を記憶領域14Aから特定して再生処理部44に指示する(S15)。図5では、処理済データDB[3]および処理済データDB[4]の遅滞の結果として処理前データDA[3]および処理前データDA[4]の各々がステップS15にて再生処理部44に指示された場合が例示されている。したがって、音響データ通信装置10の利用者は、音響処理前の再生音(処理ファイルFの再生音)を受聴する。
以上に説明したように、第1実施形態においては、処理指示Pの発生の時点で処理済データDB[n-τ]が遅滞なく記憶領域14Bに格納されている場合には処理済データDB[n-τ]が再生され、処理済データDB[n-τ]が遅滞している場合にはその処理済データDB[n-τ]に対応する処理前データDA[n-τ]が再生される。したがって、例えば処理済データDB[n-τ]が利用できない場合に音響データD0(ゼロデータ)が再生処理部44に指示されて再生音が無音となる構成と比較すると、処理済データDB[n]の遅滞に起因した再生音の中断を防止できるという利点がある。
<B:第2実施形態>
処理前データDA[n]と処理済データDB[n]とが選択的に再生処理部44に指示される第1実施形態では、処理前データDA[n]と処理済データDB[n]との境界の時点(音響処理後の再生音と音響処理前の再生音との境界)で再生音の音響特性が不連続に変化する。したがって、再生音が聴感的に不自然な印象となる可能性がある。以上の問題を解決するために、第2実施形態では、音響処理前の再生音と音響処理後の再生音との一方から他方に聴感的に連続的に遷移するように処理前データDA[n]と処理済データDB[n]とが混合(クロスフェード)される。なお、以下の各例示において作用や機能が第1実施形態と同等である要素については、以上の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
図6は、第2実施形態の動作の説明図である。第1実施形態(図5)と同様に、処理済データDB[3]および処理済データDB[4]が遅滞した場合が図6では想定されている。したがって、第1実施形態と同様に、処理済データDB[3]の代わりに処理前データDA[3]が再生処理部44に指示され、処理済データDB[4]の代わりに処理前データDA[4]が再生処理部44に指示される。
処理済データDB[2]を遅滞なく取得し、かつ、直後の処理済データDB[3]が遅滞している場合、音響データ特定部54は、図6の音響データDC[2]を生成して再生処理部44に指示する。図7に示すように、音響データDC[2]は、処理前データDA[2]と処理済データDB[2]とのクロスフェードで生成される。すなわち、音響データ特定部54は、終点を含む末尾区間σAにて音量が経時的に増加(フェードイン(FI))するように加工された処理前データDA[2]と、末尾区間σAにて音量が経時的に減少(フェードアウト(FO))するように加工された処理済データDB[2]とを加算することで音響データDC[2]を生成する。
図6に示すように、以上に説明した音響データDC[2]が処理前データDA[3]の直前に再生処理部44に指示される。したがって、放音装置18による再生音は、処理済データDB[2]に対応する音響処理後の音響から、処理前データDA[2]の末尾区間σAと処理前データDA[3]とに対応する音響処理前の再生音に、末尾区間σA内で円滑に遷移する。すなわち、音響処理後の再生音と音響処理前の再生音との明確な境界(例えば第1実施形態における処理済データDB[2]と処理前データDA[3]との境界)は受聴者に知覚されない。なお、図6および図7では、処理前データDA[n]や処理済データDB[n]の途中の時点から終点までの区間を末尾区間σAとして例示したが、処理前データDA[n]や処理済データDB[n]の全体を末尾区間σAとした構成(すなわち処理前データDA[n]と処理済データDB[b]とが全区間にわたってクロスフェードされる構成)も採用され得る。
また、処理済データDB[5]を遅滞なく取得し、かつ、直前の処理済データDB[4]が遅滞していた場合、音響データ特定部54は、図6の音響データDC[5]を生成して再生処理部44に指示する。図8に示すように、音響データDC[5]は、処理前データDA[5]と処理済データDB[5]とのクロスフェードで生成される。すなわち、音響データ特定部54は、始点を含む先頭区間σBにて音量が経時的に減少(フェードアウト)するように加工された処理前データDA[5]と、先頭区間σBにて音量が経時的に増加(フェードイン)するように加工された処理済データDB[5]とを加算することで音響データDC[5]を生成する。
図6に示すように、以上に説明した音響データDC[5]が処理前データDA[4]の直後に再生処理部44に指示される。したがって、放音装置18による再生音は、処理前データDA[4]と処理前データDA[5]の先頭区間σBとに対応する音響処理前の再生音から、処理済データDB[5]に対応する音響処理後の再生音に、先頭区間σB内で円滑に遷移する。すなわち、音響処理前の再生音と音響処理後の再生音との明確な境界(例えば第1実施形態における処理前データDA[4]と処理済データDB[5]との境界)は受聴者に知覚されない。なお、図6および図8では、処理前データDA[n]や処理済データDB[n]の始点から途中の時点までの区間を先頭区間σBとして例示したが、処理前データDA[n]や処理済データDB[n]の全体を先頭区間σBとした構成(すなわち処理前データDA[n]と処理済データDB[b]とが全区間にわたってクロスフェードされる構成)も採用され得る。
音響データ特定部54が実行する処理の詳細を説明する。第2実施形態の音響データ特定部54は、第1実施形態で説明した図4の処理に代えて図9の処理を処理指示Pの発生毎に実行する。図9の処理では、音響データ特定部54の動作モードが、正常モードおよび遅延モードの何れかに設定される。正常モードは、処理済データDB[n]が遅滞なく記憶領域14Bに格納されている場合の動作モードであり、遅延モードは、処理済データDB[n]が遅滞した場合の動作モードである。最初の処理指示Pの発生時に動作モードは正常モードに初期化される。
第1実施形態と同様に、音響データ特定部54は、最初の処理指示Pが発生した時点t0から基準遅延量τが経過するまで音響データD0を再生処理部44に順次に指示する(S21,S22)。基準遅延量τが経過すると(S21:YES)、音響データ特定部54は、動作モードが正常モードであるか否かを判定する(S23)。
動作モードが正常モードである場合(S23:YES)、音響データ特定部54は、今回の処理指示Pで指定された処理前データDA[n]からみて基準遅延量τだけ過去の処理前データDA[n-τ]に対応する処理済データDB[n-τ]が記憶領域14Bに格納されているか否かを判定する(S24)。処理済データDB[n-τ]が格納されている場合(S24:YES)、音響データ特定部54は、処理済データDB[n-τ]の直後の処理済データDB[n-τ+1]が記憶領域14Bに格納されているか否かを判定する(S25)。
処理済データDB[n-τ+1]が未だ記憶領域14Bに格納されていない場合(S25:NO)、音響データ特定部54は、処理前データDA[n-τ]が末尾区間σA内でフェードイン(FI)するとともに処理済データDB[n-τ]が末尾区間σA内でフェードアウト(FO)するように両者をクロスフェードした音響データDC[n-τ]を生成して再生処理部44に指示する(S26)。
例えば、図6の例示において、処理済データDB[2](DB[n-τ])が記憶領域14Bに格納され(S24:YES)、直後の処理済データDB[3](DB[n-τ+1]が記憶領域14Bに格納されていない場合(S25:NO)には、図7に例示したように、処理前データDA[2]と処理済データDB[2]とのクロスフェードで音響データDC[2]が生成される(S26)。音響データDC[n-τ]を生成および指示すると、音響データ特定部54は、動作モードを正常モードから遅延モードに変更して図9の処理を終了する(S27)。
他方、正常モードで処理済データDB[n-τ]および直後の処理済データDB[n-τ+1]の双方が記憶領域14Bに格納されている場合(S24:YES,S25:YES)、音響データ特定部54は、第1実施形態のステップS14と同様に、処理済データDB[n-τ]を再生処理部44に指示して図9の処理を終了する(S28)。
また、正常モードで処理済データDB[n-τ]が記憶領域14Bに格納されていない場合(S24:NO)、音響データ特定部54は、第1実施形態のステップS15と同様に、処理済データDB[n-τ]の代わりに処理前データDA[n-τ]を再生処理部44に指示する(S29)。そして、音響データ特定部54は、動作モードを正常モードから遅延モードに変更したうえで図9の処理を終了する(S30)。
動作モードが遅延モードに設定されている場合(S23:NO)、音響データ特定部54は、ステップS24と同様に、今回の処理指示Pで指定された処理前データDA[n]に対して基準遅延量τだけ過去の処理前データDA[n-τ]に対応する処理済データDB[n-τ]が記憶領域14Bに格納されているか否かを判定する(S31)。
動作モードが遅延モードに設定されているということは、直前の処理済データDB[n-τ-1]が遅滞していたことを意味する。したがって、処理済データDB[n-τ]が記憶領域14Bに格納されている場合(S31:YES)、音響データ特定部54は、処理前データDA[n-τ]が先頭区間σBにてフェードアウト(FO)するとともに処理済データDB[n-τ]が先頭区間σBにてフェードイン(FI)するように両者をクロスフェードした音響データDC[n-τ]を生成して再生処理部44に指示する(S32)。
例えば、図6の例示において、処理済データDB[5](DB[n-τ])が記憶領域14Bに格納され(S31:YES)、直前の処理済データDB[4]が遅滞していた場合(動作モード:遅延モード)には、図8を参照して説明したように、処理前データDA[5]と処理済データDB[5]とのクロスフェードで音響データDC[5]が生成される(S32)。音響データDC[n-τ]を生成および指示すると、音響データ特定部54は、動作モードを遅延モードから正常モードに変更して図9の処理を終了する(S33)。
他方、遅延モードで処理済データDB[n-τ]が記憶領域14Bに格納されていない場合(S31:NO)、音響データ特定部54は、第1実施形態のステップS15と同様に、処理済データDB[n-τ]の代わりに処理前データDA[n-τ]を再生処理部44に指示して図9の処理を終了する(S34)。動作モードは遅延モードに維持される。以上が第2実施形態における音響データ特定部54の動作である。
以上に説明した第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態では、処理前データDA[n]と処理済データDB[n]とをクロスフェードした音響データDC[n](DC[2])が処理前データDA[n+1](DC[3])の直前に再生されるから、音響処理後の再生音から音響処理前の再生音に遷移する明確な境界は受聴者に知覚されない。同様に、処理前データDA[n]と処理済データDB[n]とをクロスフェードした音響データDC[n](DC[5])が処理前データDA[n-1](DC[4])の直後に再生されるから、音響処理前の再生音から音響処理後の再生音に遷移する明確な境界は受聴者に知覚されない。したがって、聴感的に自然な印象の再生音を生成できるという利点がある。
100……音響処理システム、10……音響データ通信装置、12……制御装置、14……記憶装置、14A……記憶領域、14B……記憶領域、16……通信装置、162……送信部、164……受信部、18……放音装置、20……音響処理装置、22……通信装置、24……制御装置、30……通信網、40……管理制御部、42……指示発生部、44……再生処理部、50……情報中継部、52……記憶管理部、54……音響データ特定部。

Claims (4)

  1. 音響データに音響処理を実行する音響処理装置と通信する音響データ通信装置であって、
    前記音響処理前の音響データである処理前データの時系列を記憶する第1記憶手段と、
    前記第1記憶手段内の各処理前データを前記音響処理装置に送信する送信手段と、
    前記処理前データに対する前記音響処理で生成された処理済データを前記音響処理装置から受信する受信手段と、
    前記受信手段が受信した処理済データの時系列を記憶する第2記憶手段と、
    前記第2記憶手段に記憶された処理済データを順次に指定する手段であって、一の処理済データを指定すべき時点において前記一の処理済データが前記第2記憶手段に記憶されていない場合には、前記第1記憶手段内の処理前データの時系列のうち当該一の処理済データに対応する処理前データを指定する音響データ特定手段と、
    前記音響データ特定手段が指定した音響データを再生する再生処理手段と
    を具備する音響データ通信装置。
  2. 処理前データの処理を指示する処理指示を順次に発生する指示発生手段を具備し、
    前記音響データ特定手段は、前記処理指示にて指定された処理前データからみて所定の遅延量だけ過去の処理前データに対応する処理済データを指定する
    請求項1の音響データ通信装置。
  3. 前記音響データ特定手段は、第1処理済データを指定すべき時点において当該第1処理済データが前記第2記憶手段に記憶され、かつ、当該第1処理済データの直後の第2処理済データが前記第2記憶手段に記憶されていない場合に、前記第1処理済データと当該第1処理済データに対応する第1処理前データとを、前記第1処理済データの音量が経時的に減少するとともに前記第1処理前データの音量が経時的に増加するようにクロスフェードした音響データを生成して前記再生処理手段に指定する
    請求項1の音響データ通信装置。
  4. 前記音響データ特定手段は、第3処理済データを指定すべき時点において当該第3処理済データが前記第2記憶手段に記憶され、かつ、当該第3処理済データの直前の第4処理済データが前記第2記憶手段に記憶されていない場合に、前記第3処理済データと当該第3処理済データに対応する第3処理前データとを、前記第3処理済データの音量が経時的に増加するとともに前記第3処理前データの音量が経時的に減少するようにクロスフェードした音響データを生成して前記再生処理手段に指定する
    請求項1から請求項3の何れかの音響データ通信装置。
JP2010168380A 2010-07-27 2010-07-27 音響データ通信装置 Active JP5489900B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010168380A JP5489900B2 (ja) 2010-07-27 2010-07-27 音響データ通信装置
EP20110175165 EP2413315B1 (en) 2010-07-27 2011-07-25 Acoustic data communication device
US13/190,021 US8965755B2 (en) 2010-07-27 2011-07-25 Acoustic data communication device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010168380A JP5489900B2 (ja) 2010-07-27 2010-07-27 音響データ通信装置

Publications (2)

Publication Number Publication Date
JP2012029224A JP2012029224A (ja) 2012-02-09
JP5489900B2 true JP5489900B2 (ja) 2014-05-14

Family

ID=44533896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010168380A Active JP5489900B2 (ja) 2010-07-27 2010-07-27 音響データ通信装置

Country Status (3)

Country Link
US (1) US8965755B2 (ja)
EP (1) EP2413315B1 (ja)
JP (1) JP5489900B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8203224B2 (en) * 2009-08-03 2012-06-19 Schulte David J Power generator
US20190042390A1 (en) * 2017-08-01 2019-02-07 Microsoft Technology Licensing, Llc Focused execution of traced code in a debugger

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3591011B2 (ja) * 1994-11-04 2004-11-17 ソニー株式会社 ディジタル信号処理装置
US5579770A (en) * 1995-05-02 1996-12-03 Acuson Corporation Multiple transmit zone splicing
JP3747584B2 (ja) 1996-10-18 2006-02-22 ヤマハ株式会社 端末装置の機能拡張方法及びホストコンピュータ並びに端末装置
JPH1185148A (ja) * 1997-09-09 1999-03-30 N T T Data:Kk エフェクタ実験サービスシステム
GB0016695D0 (en) * 2000-07-08 2000-08-23 Radioscape Ltd Digital transactions for the delivery of media files
JP2004023191A (ja) * 2002-06-12 2004-01-22 Nippon Telegr & Teleph Corp <Ntt> 信号符号化方法及び信号復号化方法及び信号符号化装置及び信号復号化装置及び信号符号化プログラム及び信号復号化プログラム
GB2392807A (en) * 2002-09-06 2004-03-10 Sony Uk Ltd Processing digital data
JP2006279559A (ja) * 2005-03-29 2006-10-12 Yamaha Corp 送信装置、受信装置およびプログラム
JP5009910B2 (ja) * 2005-07-22 2012-08-29 フランス・テレコム レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法
US20070201656A1 (en) * 2006-02-07 2007-08-30 Nokia Corporation Time-scaling an audio signal
JP5011803B2 (ja) * 2006-04-24 2012-08-29 ソニー株式会社 オーディオ信号伸張圧縮装置及びプログラム
US8311831B2 (en) * 2007-10-01 2012-11-13 Panasonic Corporation Voice emphasizing device and voice emphasizing method
JP2010072364A (ja) * 2008-09-18 2010-04-02 Toshiba Corp オーディオデータ補間装置及びオーディオデータ補間方法
DE102010004364A1 (de) 2009-01-20 2010-07-22 Merck Patent Gmbh Flüssigkristallverbindungen und FK-Medien

Also Published As

Publication number Publication date
EP2413315A1 (en) 2012-02-01
JP2012029224A (ja) 2012-02-09
EP2413315B1 (en) 2015-05-13
US8965755B2 (en) 2015-02-24
US20120026838A1 (en) 2012-02-02

Similar Documents

Publication Publication Date Title
JP4547009B2 (ja) 波面合成レンダリング手段を制御するための装置および方法
JP2004530158A (ja) プレゼンテーションの再生速度の実時間制御
JP2009535988A (ja) データ信号を処理するシステム及び方法
CN109144464A (zh) 一种音频输出的方法、装置及Android设备
CN105282591A (zh) 独立输出流的同步
JP2016004600A (ja) 同期オーディオ再生の方法、装置、およびシステム
JPH11331248A (ja) 送信装置および送信方法、受信装置および受信方法、並びに提供媒体
KR20120063380A (ko) 음질 향상 효과를 가지는 오디오 신호를 생성하는 오디오 장치 및 방법
CN108924610A (zh) 多媒体文件处理方法、装置、介质和计算设备
CN112562638A (zh) 语音预览的方法、装置及电子设备
JP5489900B2 (ja) 音響データ通信装置
US6292454B1 (en) Apparatus and method for implementing a variable-speed audio data playback system
EP3434009A1 (en) Interactive audio metadata handling
JP2015079218A (ja) 音楽再生装置及び音楽再生プログラム
JP2003255935A (ja) 再生切替装置及びプログラム
JP6919261B2 (ja) 音データ処理装置、音データ処理方法及びプログラム
JP2009075280A (ja) コンテンツ再生装置
JP4543586B2 (ja) 音声再生装置及び音声再生方法
US9313244B2 (en) Content reproduction apparatus, content reproduction method, and computer-readable recording medium having content reproduction program recorded thereon
JP6798253B2 (ja) 信号処理方法、および信号処理装置
JP5614554B2 (ja) 音楽再生システム、音楽再生装置、及び音楽再生用プログラム
WO2017221407A1 (ja) 同期設定装置、配信システム、同期設定方法、及びプログラム
JP4254960B2 (ja) 音声データエンコード装置および音声データ再生装置
JP4126246B2 (ja) 演奏データ通信システム
JP2008140434A (ja) ディジタルオーディオ装置及びそのサンプルレート切り替え方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130620

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140225

R150 Certificate of patent or registration of utility model

Ref document number: 5489900

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250