JP7846831B2 - 同期通信のためのオーディオ合成 - Google Patents
同期通信のためのオーディオ合成Info
- Publication number
- JP7846831B2 JP7846831B2 JP2025519615A JP2025519615A JP7846831B2 JP 7846831 B2 JP7846831 B2 JP 7846831B2 JP 2025519615 A JP2025519615 A JP 2025519615A JP 2025519615 A JP2025519615 A JP 2025519615A JP 7846831 B2 JP7846831 B2 JP 7846831B2
- Authority
- JP
- Japan
- Prior art keywords
- audio stream
- audio
- performance
- synthesized
- client device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0008—Associated control or indicating means
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/361—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
- G10H1/368—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems displaying animated or moving pictures synchronized with the music or audio part
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
- G10L13/047—Architecture of speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
- G10L21/055—Time compression or expansion for synchronising with other signals, e.g. video signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Electrophonic Musical Instruments (AREA)
- Telephonic Communication Services (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
本出願は、国際出願であり、内容全体が参照によって本明細書に組み込まれる、SYNTHESIZING AUDIO FOR SYNCHRONOUS COMMUNICATIONと題する、2022年10月4日に出願した米国特許出願第17/959,736号に対して、35U.S.C.§119(e)に基づく優先権の利益を主張するものである。
図1は、同期通信のためのオーディオを合成するための例示的な環境100のブロック図を示す。いくつかの実施形態において、環境100は、ネットワーク105を介して結合されたサーバ101と、クライアントデバイス115a...nとを含む。ユーザ125a...nは、それぞれのクライアントデバイス115a...nに関連付けられ得る。図1および残りの図において、参照番号の後の文字、例えば、「115a」は、その特定の参照番号を有する要素への参照を表す。後に続く文字のないテキスト内の参照番号、例えば、「115」は、その参照番号を有する要素への一般的な参照を表す。いくつかの実施形態において、環境100は、図1に示されていない他のサーバまたはデバイスを含み得る。例えば、サーバ101は、複数のサーバ101であり得る。
図2は、本明細書で説明する1つまたは複数の特徴を実装するために使用され得る例示的なコンピューティングデバイス200のブロック図である。コンピューティングデバイス200は、任意の適切なコンピュータシステム、サーバ、または他の電子デバイスもしくはハードウェアデバイスとすることができる。いくつかの実施形態において、コンピューティングデバイス200は、サーバ101である。いくつかの実施形態において、コンピューティングデバイス200は、クライアントデバイス115である。
図2は、パフォーマンス認識モジュール202と、合成機械学習モジュール204と、混合モジュール206と、後処理モジュール208と、ユーザインターフェースモジュール210とを含む例示的なメタバースエンジン103またはメタバースアプリケーション104を実行するコンピューティングデバイス200を示す。モジュールは、同じメタバースエンジン103またはメタバースアプリケーション104の一部であるように示されているが、当業者は、モジュールが任意のコンピューティングデバイス200によって実装され得ることを認識するであろう。例えば、パフォーマンス認識モジュール202および合成機械学習モジュール204は、クライアントデバイス115の一部であり得るが、混合モジュール206は、クライアントデバイス115の計算要件を軽減するために、サーバ101の一部であり得る。
合成機械学習モジュール204がクライアントデバイス115上に記憶されている実施形態において、マッピング機械学習モデル204は、手動でラベル付けされたオーディオストリームを有するトレーニングデータセットを使用して機械学習モデルをトレーニングすることによって、教師あり学習を実装する。
合成機械学習モジュール204がサーバ101上に記憶された実施形態において、マッピング機械学習モデル204は、ラベル付けされていないオーディオストリームを有するトレーニングデータセットを使用して、教師なし学習を使用してトレーニングされ得る。
図5は、本明細書で説明するいくつかの実施形態による、クライアントデバイス115とサーバ101との間のデータの伝送を示す例示的なフロー図500である。フロー図500は、第1のクライアントデバイス510と、サーバ515と、第2のクライアントデバイス520とを含む。太線は、3つのデバイス間のネットワークデータ伝送を示し、細線は、第1のクライアントデバイス510内のデータ伝送を示す。
101 サーバ
103 メタバースエンジン
104 メタバースアプリケーション
104a メタバースアプリケーション
104b メタバースアプリケーション
105 ネットワーク
115 クライアントデバイス
115a...n クライアントデバイス
125 ユーザ
125a...n ユーザ
199 データベース
200 コンピューティングデバイス
202 パフォーマンス認識モジュール
204 合成機械学習モジュール、機械学習モジュール、マッピング機械学習モデル
206 混合モジュール
208 後処理モジュール
210 ユーザインターフェースモジュール
218 バス
222 信号線
224 信号線
226 信号線
228 信号線
230 信号線
232 信号線
234 信号線
235 プロセッサ
237 メモリ
239 入力/出力(I/O)インターフェース、I/Oインターフェース
241 マイクロホン
243 スピーカ
245 ディスプレイ
247 ストレージデバイス
300 機械学習モデル
305 ボトルネックトランク
310 サブモデルデコーダ
315 オーディオ波形発生器
350 機械学習モデル
355 ベクトル量子化変分オートエンコーダ(VQ-VAE)、VQ-VAE
360 VQ-VAEコードブック
365 事前モデル
370 VQ-VAEデコーダ
400 ユーザインターフェース
405 移動インジケータ
500 フロー図
505 マイクロホン
510 第1のクライアントデバイス
515 サーバ
520 第2のクライアントデバイス
525 スピーカ
600 フロー図
605 タスク検出
610 位相シフト分析器
615 レート分析器
620 サンプラ
635 ディープニューラルネットワーク
Claims (20)
- コンピュータにより実施される方法であって、
第1のクライアントデバイスに関連付けられたパフォーマンスの第1のオーディオストリームを受信するステップと、
前記パフォーマンスの合計時間よりも短い前記パフォーマンスの時間ウィンドウ中に、
前記第1のオーディオストリームのオーディオ特徴に基づいて前記パフォーマンスの将来を予測する合成された第1のオーディオストリームを生成するステップと、
前記合成された第1のオーディオストリームと第2のクライアントデバイスに関連付けられた第2のオーディオストリームとを同期させる結合されたオーディオストリームを形成するために、前記合成された第1のオーディオストリームと前記第2のオーディオストリームとを混合するステップと
を含み、
前記パフォーマンスが完了するまで、前記時間ウィンドウが進められ、前記生成するステップおよび前記混合するステップが繰り返される、方法。 - 前記第1のオーディオストリームの受信に応答して、
前記第1のオーディオストリームに関連付けられた前記パフォーマンスのパフォーマンス識別子を決定するステップと、
前記パフォーマンス識別子に基づいて参照オーディオを受信するステップと
をさらに含む、請求項1に記載の方法。 - 前記合成された第1のオーディオストリームを生成するステップが、前記第1のオーディオストリームと前記参照オーディオとの間の時間オフセットを決定するステップを含み、
前記時間オフセットが、前記第1のオーディオストリームが前記参照オーディオとは異なる開始点を有する場合に発生し、前記合成された第1のオーディオストリームを生成するステップが、前記時間オフセットにさらに基づく、請求項2に記載の方法。 - 前記合成された第1のオーディオストリームを生成するステップが、前記参照オーディオのレートと比較した前記第1のオーディオストリームのレートを決定するステップを含み、
前記合成された第1のオーディオストリームを生成するステップが、前記参照オーディオの前記レートと比較した前記第1のオーディオストリームの前記レートにさらに基づく、請求項2に記載の方法。 - 前記第1のオーディオストリームの前記オーディオ特徴が、ピッチ、レート、位相、またはそれらの組合せのグループから選択される、請求項1に記載の方法。
- 前記第1のオーディオストリームの前記オーディオ特徴が、前記第1のオーディオストリームにおいて検出された1つまたは複数の話者識別子を含む、請求項1に記載の方法。
- 前記第1のオーディオストリームと前記第2のオーディオストリームとの間の時間差がしきい値時間差を超えていることを判定するステップと、
前記パフォーマンスに関するユーザガイダンスと、前記第2のクライアントデバイスに関連付けられたパフォーマに、前記第1のオーディオストリームと前記第2のオーディオストリームとの間の前記時間差を短縮する方法においてパフォーマンスするように促す移動インジケータとを含むユーザインターフェースを表示するためのグラフィカルデータを生成するステップと
をさらに含む、請求項1に記載の方法。 - 前記第2のクライアントデバイスが配置されている環境の音響と一致するように、前記結合されたオーディオストリームを変更するステップをさらに含む、請求項1に記載の方法。
- 前記合成された第1のオーディオストリームを生成するステップが、
前記第1のオーディオストリーム内で前記パフォーマンスの一部がスキップされたことを識別するステップと、
スキップされた前記パフォーマンスの前記一部を修正するために前記第1のオーディオストリームを合成するステップと
を含む、請求項1に記載の方法。 - グラフィカルに表示されるパフォーマのアクションと一致するように、前記結合されたオーディオストリームを同期させるステップをさらに含む、請求項1に記載の方法。
- デバイスであって、
プロセッサと、
前記プロセッサに結合され、命令が記憶されたメモリとを備え、前記命令が、前記プロセッサによって実行されると、前記プロセッサに、
第1のクライアントデバイスに関連付けられたパフォーマンスの第1のオーディオストリームを受信することと、
前記パフォーマンスの合計時間よりも短い前記パフォーマンスの時間ウィンドウ中に、
前記第1のオーディオストリームのオーディオ特徴に基づいて前記パフォーマンスの将来を予測する合成された第1のオーディオストリームを生成することと、
前記合成された第1のオーディオストリームと第2のクライアントデバイスに関連付けられた第2のオーディオストリームとを同期させる結合されたオーディオストリームを形成するために、前記合成された第1のオーディオストリームと前記第2のオーディオストリームとを混合することと
を含む動作を実行させ、
前記パフォーマンスが完了するまで、前記時間ウィンドウが進められ、前記生成することおよび前記混合することが繰り返される、デバイス。 - 前記第1のオーディオストリームの受信に応答して、前記第1のオーディオストリームに関連付けられた前記パフォーマンスのパフォーマンス識別子を決定し、
前記パフォーマンス識別子に基づいて参照オーディオを受信する、請求項11に記載のデバイス。 - 前記合成された第1のオーディオストリームを生成することが、前記第1のオーディオストリームと前記参照オーディオとの間の時間オフセットを決定することを含み、
前記時間オフセットが、前記第1のオーディオストリームが前記参照オーディオとは異なる開始点を有する場合に発生し、前記合成された第1のオーディオストリームを生成することが、前記時間オフセットにさらに基づく、請求項12に記載のデバイス。 - 前記合成された第1のオーディオストリームを生成することが、前記参照オーディオのレートと比較した前記第1のオーディオストリームのレートを決定することを含み、
前記合成された第1のオーディオストリームを生成することが、前記参照オーディオの前記レートと比較した前記第1のオーディオストリームの前記レートにさらに基づく、請求項12に記載のデバイス。 - 前記第1のオーディオストリームの前記オーディオ特徴が、ピッチ、レート、位相、またはそれらの組合せのグループから選択される、請求項11に記載のデバイス。
- 命令が記憶された非一時的コンピュータ可読媒体であって、前記命令は、1つまたは複数のコンピュータによって実行されると、前記1つまたは複数のコンピュータに以下の動作:
第1のクライアントデバイスに関連付けられたパフォーマンスの第1のオーディオストリームを受信することと、
前記パフォーマンスの合計時間よりも短い前記パフォーマンスの時間ウィンドウ中に、
前記第1のオーディオストリームのオーディオ特徴に基づいて前記パフォーマンスの将来を予測する合成された第1のオーディオストリームを生成し、
前記合成された第1のオーディオストリームと第2のクライアントデバイスに関連付けられた第2のオーディオストリームとを同期させる結合されたオーディオストリームを形成するために、前記合成された第1のオーディオストリームと前記第2のオーディオストリームとを混合し、
前記パフォーマンスが完了するまで、前記時間ウィンドウが進められ、前記生成および前記混合が繰り返されることと、
を行わせる、非一時的コンピュータ可読媒体。 - 前記動作は、
前記第1のオーディオストリームの受信に応答して、前記第1のオーディオストリームに関連付けられた前記パフォーマンスのパフォーマンス識別子を決定し、
前記パフォーマンス識別子に基づいて参照オーディオを受信する、
ことをさらに含む、請求項16に記載のコンピュータ可読媒体。 - 前記合成された第1のオーディオストリームを生成することが、前記第1のオーディオストリームと前記参照オーディオとの間の時間オフセットを決定することを含み、
前記時間オフセットが、前記第1のオーディオストリームが前記参照オーディオとは異なる開始点を有する場合に発生し、前記合成された第1のオーディオストリームを生成することが、前記時間オフセットにさらに基づく、請求項17に記載のコンピュータ可読媒体。 - 前記合成された第1のオーディオストリームを生成することが、前記参照オーディオのレートと比較した前記第1のオーディオストリームのレートを決定することを含み、
前記合成された第1のオーディオストリームを生成することが、前記参照オーディオの前記レートと比較した前記第1のオーディオストリームの前記レートにさらに基づく、請求項17に記載のコンピュータ可読媒体。 - 前記第1のオーディオストリームの前記オーディオ特徴が、ピッチ、レート、位相、またはそれらの組合せのグループから選択される、請求項16に記載のコンピュータ可読媒体。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US17/959,736 US12300255B2 (en) | 2022-10-04 | 2022-10-04 | Synthesizing audio for synchronous communication |
| US17/959,736 | 2022-10-04 | ||
| PCT/US2023/034284 WO2024076532A1 (en) | 2022-10-04 | 2023-10-02 | Synthesizing audio for synchronous communication |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2025535711A JP2025535711A (ja) | 2025-10-28 |
| JP7846831B2 true JP7846831B2 (ja) | 2026-04-15 |
Family
ID=90471134
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2025519615A Active JP7846831B2 (ja) | 2022-10-04 | 2023-10-02 | 同期通信のためのオーディオ合成 |
Country Status (6)
| Country | Link |
|---|---|
| US (3) | US12300256B2 (ja) |
| EP (1) | EP4599426A1 (ja) |
| JP (1) | JP7846831B2 (ja) |
| KR (1) | KR20250048809A (ja) |
| CN (1) | CN120077430A (ja) |
| WO (1) | WO2024076532A1 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12300256B2 (en) * | 2022-10-04 | 2025-05-13 | Roblox Corporation | Synthesizing audio for synchronous communication |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003167575A (ja) | 2001-11-30 | 2003-06-13 | Nippon Telegraph & Telephone East Corp | 音・映像同期合成配信方法、演奏者端末用装置、本装置用プログラムおよび本装置用プログラムを記録した記録媒体並びに、サービス提供装置、本装置用プログラムおよび本装置用プログラムを記録した記録媒体 |
| JP2007041320A (ja) | 2005-08-03 | 2007-02-15 | Japan Science & Technology Agency | ネットワークを用いた遠隔多地点合奏システム |
| JP2008089849A (ja) | 2006-09-29 | 2008-04-17 | Yamaha Corp | リモート演奏システム |
| JP2009005012A (ja) | 2007-06-20 | 2009-01-08 | Yamaha Corp | データ配信装置、データ配信方法およびプログラム |
| JP2014150938A (ja) | 2013-02-07 | 2014-08-25 | Nintendo Co Ltd | 音楽ゲームプログラム、ゲーム装置、ゲーム装置の制御方法およびゲームシステム |
| JP2021041081A (ja) | 2019-09-13 | 2021-03-18 | 株式会社スクウェア・エニックス | プログラム、情報処理装置、情報処理システム及び方法 |
| CN112669798A (zh) | 2020-12-15 | 2021-04-16 | 深圳芒果未来教育科技有限公司 | 一种对音乐信号主动跟随的伴奏方法及相关设备 |
Family Cites Families (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3063088B2 (ja) * | 1988-05-30 | 2000-07-12 | 日本電気株式会社 | 音声分析合成装置、音声分析装置及び音声合成装置 |
| US6590944B1 (en) * | 1999-02-24 | 2003-07-08 | Ibiquity Digital Corporation | Audio blend method and apparatus for AM and FM in band on channel digital audio broadcasting |
| TWI228704B (en) * | 2001-03-23 | 2005-03-01 | Yamaha Corp | Music sound synthesis with waveform caching by prediction |
| AU2005330569A1 (en) * | 2005-04-13 | 2006-12-07 | Pixel Instruments, Corp. | Method, system, and program product for measuring audio video synchronization independent of speaker characteristics |
| US7913155B2 (en) * | 2006-02-15 | 2011-03-22 | International Business Machines Corporation | Synchronizing method and system |
| US8433431B1 (en) * | 2008-12-02 | 2013-04-30 | Soundhound, Inc. | Displaying text to end users in coordination with audio playback |
| WO2011140221A1 (en) * | 2010-05-04 | 2011-11-10 | Shazam Entertainment Ltd. | Methods and systems for synchronizing media |
| US20180067641A1 (en) * | 2016-09-01 | 2018-03-08 | PIQPIQ, Inc. | Social networking application for real-time selection and sorting of photo and video content |
| CN206339587U (zh) * | 2016-11-30 | 2017-07-18 | 成都国蓉科技有限公司 | 一种信号波形显示设备 |
| CN109036446B (zh) * | 2017-06-08 | 2022-03-04 | 腾讯科技(深圳)有限公司 | 一种音频数据处理方法以及相关设备 |
| CN108495141B (zh) * | 2018-03-05 | 2021-03-19 | 网宿科技股份有限公司 | 一种音视频的合成方法及系统 |
| US10923139B2 (en) * | 2018-05-02 | 2021-02-16 | Melo Inc. | Systems and methods for processing meeting information obtained from multiple sources |
| KR20230148239A (ko) * | 2021-02-22 | 2023-10-24 | 로브록스 코포레이션 | 신경망을 사용하는 비디오로부터의 로버스트 얼굴 애니메이션 |
| US12141921B2 (en) * | 2022-06-02 | 2024-11-12 | Roblox Corporation | Method and system for generating polygon meshes approximating surfaces using root-finding and iteration for mesh vertex positions |
| US11954802B2 (en) * | 2022-06-02 | 2024-04-09 | Roblox Corporation | Method and system for generating polygon meshes approximating surfaces using iteration for mesh vertex positions |
| US12027177B2 (en) * | 2022-09-08 | 2024-07-02 | Roblox Corporation | Artificial latency for moderating voice communication |
| US12300256B2 (en) * | 2022-10-04 | 2025-05-13 | Roblox Corporation | Synthesizing audio for synchronous communication |
-
2022
- 2022-10-04 US US17/959,937 patent/US12300256B2/en active Active
- 2022-10-04 US US17/959,736 patent/US12300255B2/en active Active
-
2023
- 2023-10-02 WO PCT/US2023/034284 patent/WO2024076532A1/en not_active Ceased
- 2023-10-02 JP JP2025519615A patent/JP7846831B2/ja active Active
- 2023-10-02 KR KR1020257010084A patent/KR20250048809A/ko active Pending
- 2023-10-02 EP EP23875423.8A patent/EP4599426A1/en active Pending
- 2023-10-02 CN CN202380070876.0A patent/CN120077430A/zh active Pending
-
2025
- 2025-04-21 US US19/184,804 patent/US20250246197A1/en active Pending
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003167575A (ja) | 2001-11-30 | 2003-06-13 | Nippon Telegraph & Telephone East Corp | 音・映像同期合成配信方法、演奏者端末用装置、本装置用プログラムおよび本装置用プログラムを記録した記録媒体並びに、サービス提供装置、本装置用プログラムおよび本装置用プログラムを記録した記録媒体 |
| JP2007041320A (ja) | 2005-08-03 | 2007-02-15 | Japan Science & Technology Agency | ネットワークを用いた遠隔多地点合奏システム |
| JP2008089849A (ja) | 2006-09-29 | 2008-04-17 | Yamaha Corp | リモート演奏システム |
| JP2009005012A (ja) | 2007-06-20 | 2009-01-08 | Yamaha Corp | データ配信装置、データ配信方法およびプログラム |
| JP2014150938A (ja) | 2013-02-07 | 2014-08-25 | Nintendo Co Ltd | 音楽ゲームプログラム、ゲーム装置、ゲーム装置の制御方法およびゲームシステム |
| JP2021041081A (ja) | 2019-09-13 | 2021-03-18 | 株式会社スクウェア・エニックス | プログラム、情報処理装置、情報処理システム及び方法 |
| CN112669798A (zh) | 2020-12-15 | 2021-04-16 | 深圳芒果未来教育科技有限公司 | 一种对音乐信号主动跟随的伴奏方法及相关设备 |
Also Published As
| Publication number | Publication date |
|---|---|
| US12300255B2 (en) | 2025-05-13 |
| US20240112689A1 (en) | 2024-04-04 |
| US20240112691A1 (en) | 2024-04-04 |
| EP4599426A1 (en) | 2025-08-13 |
| WO2024076532A1 (en) | 2024-04-11 |
| CN120077430A (zh) | 2025-05-30 |
| JP2025535711A (ja) | 2025-10-28 |
| KR20250048809A (ko) | 2025-04-10 |
| US20250246197A1 (en) | 2025-07-31 |
| US12300256B2 (en) | 2025-05-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| WO2022188734A1 (zh) | 一种语音合成方法、装置以及可读存储介质 | |
| CN113314094A (zh) | 唇形模型的训练方法和装置及语音动画合成方法和装置 | |
| JP6078964B2 (ja) | 音声対話システム及びプログラム | |
| US10015546B1 (en) | System and method for audio visual content creation and publishing within a controlled environment | |
| CN110600013B (zh) | 非平行语料声音转换数据增强模型训练方法及装置 | |
| CN108831437A (zh) | 一种歌声生成方法、装置、终端和存储介质 | |
| US20140128160A1 (en) | Method and system for generating a sound effect in a piece of game software | |
| US10504498B2 (en) | Real-time jamming assistance for groups of musicians | |
| JP2020160319A (ja) | 音声合成装置、方法及びプログラム | |
| CN114783408B (zh) | 一种音频数据处理方法、装置、计算机设备以及介质 | |
| Nakamura et al. | Real-time audio-to-score alignment of music performances containing errors and arbitrary repeats and skips | |
| CN112382274B (zh) | 音频合成方法、装置、设备以及存储介质 | |
| CN116645957B (zh) | 乐曲生成方法、装置、终端、存储介质及程序产品 | |
| CN112035699A (zh) | 音乐合成方法、装置、设备和计算机可读介质 | |
| US20250246197A1 (en) | Synthesizing audio for synchronous communication | |
| CN112382269B (zh) | 音频合成方法、装置、设备以及存储介质 | |
| US12510966B2 (en) | Haptic feedback method, system and related device for matching split-track music to vibration | |
| CN110289010B (zh) | 一种声音采集的方法、装置、设备和计算机存储介质 | |
| CN114822492B (zh) | 语音合成方法及装置、电子设备、计算机可读存储介质 | |
| CN115329124A (zh) | 曲谱数据展示方法、设备及可读存储介质 | |
| CN113470612A (zh) | 一种音乐数据的生成方法、装置、设备以及存储介质 | |
| US20250372067A1 (en) | Music generation with time varying controls | |
| JP7845491B2 (ja) | データ処理方法、プログラムおよびシステム | |
| JP7335316B2 (ja) | プログラム及び情報処理装置 | |
| CN119440457A (zh) | 一种显示设备、音频生成方法及内容展示方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20250403 |
|
| A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20250530 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20251021 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20260120 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20260310 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20260403 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7846831 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |