JP6876924B2 - 送信装置、送信方法、受信装置および受信方法 - Google Patents
送信装置、送信方法、受信装置および受信方法 Download PDFInfo
- Publication number
- JP6876924B2 JP6876924B2 JP2017555084A JP2017555084A JP6876924B2 JP 6876924 B2 JP6876924 B2 JP 6876924B2 JP 2017555084 A JP2017555084 A JP 2017555084A JP 2017555084 A JP2017555084 A JP 2017555084A JP 6876924 B2 JP6876924 B2 JP 6876924B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- information
- stream
- data
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 claims description 66
- 230000005540 biological transmission Effects 0.000 claims description 42
- 238000000034 method Methods 0.000 claims description 28
- 238000003780 insertion Methods 0.000 claims description 17
- 230000037431 insertion Effects 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 claims description 16
- 230000006835 compression Effects 0.000 claims description 11
- 238000007906 compression Methods 0.000 claims description 11
- 238000005516 engineering process Methods 0.000 description 17
- 230000000694 effects Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 11
- 239000000284 extract Substances 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 101150109471 PID2 gene Proteins 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 5
- 101000609957 Homo sapiens PTB-containing, cubilin and LRP1-interacting protein Proteins 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 102100039157 PTB-containing, cubilin and LRP1-interacting protein Human genes 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000009877 rendering Methods 0.000 description 4
- 101100190466 Caenorhabditis elegans pid-3 gene Proteins 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- AWSBQWZZLBPUQH-UHFFFAOYSA-N mdat Chemical compound C1=C2CC(N)CCC2=CC2=C1OCO2 AWSBQWZZLBPUQH-UHFFFAOYSA-N 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 101100041819 Arabidopsis thaliana SCE1 gene Proteins 0.000 description 1
- 101100126625 Caenorhabditis elegans itr-1 gene Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 101100041822 Schizosaccharomyces pombe (strain 972 / ATCC 24843) sce3 gene Proteins 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005401 electroluminescence Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Stereophonic System (AREA)
- Television Systems (AREA)
- Time-Division Multiplex Systems (AREA)
- Telephonic Communication Services (AREA)
Description
オーディオデータにエンコード処理を施し、オーディオ圧縮データを含むオーディオフレームが連続して配置されたオーディオストリームを生成するストリーム生成部と、
所定の音ユニットのオーディオ圧縮データを含む上記オーディオフレームに、該所定の音ユニットのオーディオ圧縮データを含むことを示すタグ情報を挿入する情報挿入部と、
上記タグ情報が挿入されたオーディオストリームを含む所定フォーマットのコンテナストリームを送信する送信部を備える
送信装置にある。
オーディオ圧縮データを含むオーディオフレームが連続して配置されたオーディオストリームを含む所定フォーマットのコンテナストリームを受信する受信部を備え、
所定の音ユニットのオーディオ圧縮データを含む上記オーディオフレームに、該所定の音ユニットのオーディオ圧縮データを含むことを示すタグ情報が含まれており、
上記タグ情報を利用して上記オーディオストリームの処理を行う処理部をさらに備える
受信装置にある。
オーディオ圧縮データを含むオーディオフレームが連続して配置されたオーディオストリームを含む所定フォーマットのコンテナストリームを受信する受信部を備え、
所定の音ユニットのオーディオ圧縮データを含む上記オーディオフレームに、該所定の音ユニットのオーディオ圧縮データを含むことを示すタグ情報が含まれており、
上記コンテナストリームのレイヤおよび/または上記オーディオストリームのレイヤに、上記オーディオストリーム内における上記所定の音ユニットの情報を持つテーブル情報が含まれており、
上記受信されたコンテナストリームのストレージへの書き込みと、上記ストレージからの上記コンテナストリームの読み出しと、上記読み出されたコンテナストリームに含まれるオーディオストリームの処理を制御する制御部をさらに備え
上記制御部は、上記テーブル情報が持つ上記所定の音ユニットの情報に基づいて上記ストレージからの上記コンテナストリームの読み出しを制御する
受信装置にある。
1.実施の形態
2.変形例
[送受信システムの構成例]
図1は、実施の形態としての送受信システム10の構成例を示している。この送受信システム10は、サービス送信機100とサービス受信機200により構成されている。サービス送信機100は、コンテナストリーム(多重化ストリーム)としてのMPEG−2 トランスポートストリーム(以下、単に、「トランスポートストリームTS」と称する)を、放送波あるいはネットのパケットに載せて送信する。
」の8ビットフィールドは、音ユニットの数を示す。音ユニットの数だけ、「speech_id」の8ビットフィールド、「group_id」の8ビットフィールド、「sw_group_id」の8ビットフィールド、「speaker_id」の8ビットフィールド、「sted_type」の2ビットフィールド、「sample_offset」の14ビットフィールドの各フィールドが繰り返し存在する。
図14は、サービス送信機100が備えるストリーム生成部110の構成例を示している。このストリーム生成部110は、制御部111と、ビデオエンコーダ112と、オーディオエンコーダ113と、マルチプレクサ114を有している。
図15は、3Dオーディオの伝送データを1ストリームで送信する場合(図5(a)参照)におけるトランスポートストリームTSの構成例を示している。この構成例では、PID1で識別されるビデオストリームのPESパケット「video PES」が存在すると共に、PID2で識別されるオーディオストリームのPESパケット「audio PES」が存在する。PESパケットは、PESヘッダ(PES_header)とPESペイロード(PES_payload)からなっている。PESヘッダには、DTS,PTSのタイムスタンプが挿入されている。
図17は、サービス受信機200の構成例を示している。このサービス受信機200は、受信部201と、デマルチプレクサ202と、ビデオデコード部203と、映像処理回路204と、パネル駆動回路205と、表示パネル206と、OSD(On Screen Display)部207を有している。また、このサービス受信機200は、オーディオデコード部214と、音声出力回路215と、スピーカシステム216を有している。
図19は、オーディオデコード部214の構成例を示している。オーディオデコード部214は、デコーダ251と、オブジェクトレンダラ252と、ミキサ253と、オーディオデータ切り取り部254と、オーディオデータ&タグバッファ255と、テキスト変換/字幕表示部256を有している。
なお、上述実施の形態においては、コンテナストリーム(多重化ストリーム)がMPEG−2 トランスポートストリーム(トランスポートストリームTS)である例を示した。しかし、本技術は、MP4やそれ以外のフォーマットのコンテナストリームで配信されるシステムにも同様に適用できる。例えば、MPEG−DASHベースのストリーム配信システム、あるいは、MMT(MPEG Media Transport)構造伝送ストリームを扱う送受信システムなどである。
(1)オーディオデータにエンコード処理を施し、オーディオ圧縮データを含むオーディオフレームが連続して配置されたオーディオストリームを生成するストリーム生成部と、
所定の音ユニットのオーディオ圧縮データを含む上記オーディオフレームに、該所定の音ユニットのオーディオ圧縮データを含むことを示すタグ情報を挿入する情報挿入部と、
上記タグ情報が挿入されたオーディオストリームを含む所定フォーマットのコンテナストリームを送信する送信部を備える
送信装置。
(2)上記タグ情報は、
上記所定の音ユニットのオーディオ圧縮データの開始位置を含むか、終了位置を含むか、開始位置および終了位置のいずれも含まないことを示すタイプ情報を有する
前記(1)に記載の送信装置。
(3)上記タグ情報は、
上記タイプ情報が上記開始位置を含むことを示すとき、フレーム先頭から上記開始位置までのサンプル単位のオフセットを示すと共に、上記タイプ情報が上記終了位置を示すとき、フレーム先頭から上記終了位置までのサンプル単位のオフセットを示すオフセット情報を有する
前記(2)に記載の送信装置。
(4)上記タグ情報は、
該タグ情報が挿入されるオーディオフレームの、サービス先頭からのフレーム位置を示すフレームカウント情報を有する
前記(1)から(3)のいずれかに記載の送信装置。
(5)上記所定の音ユニットが複数存在するとき、
上記タグ情報は、
対応する音ユニットを識別するための音ユニット識別情報を有する
前記(1)から(4)のいずれかに記載の送信装置。
(6)上記所定の音ユニットが複数存在し、該複数の音ユニットに複数の発生元の音ユニットが含まれるとき、
上記タグ情報は、
対応する音ユニットの発生元を識別するための発生元識別情報を有する
前記(1)から(5)のいずれかに記載の送信装置。
(7)上記ストリーム生成部は、
複数のグループのオーディオデータにエンコード処理を施し、複数のグループのオーディオ圧縮データを含むオーディオフレームが連続して配置されたオーディオストリームを生成し、
上記タグ情報は、
上記所定の音ユニットのオーディオ圧縮データがどのグループのものであるかを識別するためのグループ識別情報を有する
前記(1)から(6)のいずれかに記載の送信装置。
(8)上記グループ識別情報が示すグループが所定のスイッチグループを構成するグループであるとき、
上記タグ情報は、
上記所定のスイッチグループを識別するためのスイッチグループ識別情報を有する
前記(7)に記載の送信装置。
(9)上記情報挿入部は、
上記コンテナストリームのレイヤおよび/または上記オーディオストリームのレイヤに、上記オーディオストリーム内における上記所定の音ユニットの情報を持つテーブル情報さらに挿入する
前記(1)から(8)のいずれかに記載の送信装置。
(10)上記所定の音ユニットが複数存在するとき、
複数の音ユニットの情報は、それぞれ、
対応する音ユニットを識別するための音ユニット識別情報を有する
前記(9)に記載の送信装置。
(11)上記所定の音ユニットが複数存在し、該複数の音ユニットに複数の発生元の音ユニットが含まれるとき、
複数の音ユニットの情報は、それぞれ、
対応する音ユニットの発生元を識別するための発生元識別情報を有する
前記(9)または(10)に記載の送信装置。
(12)上記所定の音ユニットの情報は、
上記所定の音ユニットのオーディオ圧縮データを含むオーディオフレームの、サービス先頭からのフレーム位置を示すフレームカウント情報を有する
前記(9)から(11)のいずれかに記載の送信装置。
(13)オーディオデータにエンコード処理を施し、オーディオ圧縮データを含むオーディオフレームが連続して配置されたオーディオストリームを生成するストリーム生成ステップと、
所定の音ユニットのオーディオ圧縮データを含む上記オーディオフレームに、該所定の音ユニットのオーディオ圧縮データを含むことを示すタグ情報を挿入する情報挿入ステップと、
送信部により、上記タグ情報が挿入されたオーディオストリームを含む所定フォーマットのコンテナストリームを送信する送信ステップを有する
送信方法。
(14)オーディオ圧縮データを含むオーディオフレームが連続して配置されたオーディオストリームを含む所定フォーマットのコンテナストリームを受信する受信部を備え、
所定の音ユニットのオーディオ圧縮データを含む上記オーディオフレームに、該所定の音ユニットのオーディオ圧縮データを含むことを示すタグ情報が含まれており、
上記タグ情報を利用して上記オーディオストリームの処理を行う処理部をさらに備える
受信装置。
(15)上記処理部は、
上記オーディオストリームの各オーディオフレームに含まれるオーディオ圧縮データにデコード処理を施してオーディオデータを得るデコード部と、
上記タグ情報に基づいて上記デコード部で得られたオーディオデータから上記所定の音ユニットに対応したオーディオデータを切り取ってバッファに保持するデータ切り取り保持部を有する
前記(14)に記載の受信装置。
(16)上記処理部は、
ユーザの操作情報に基づいて、上記バッファから、上記所定の音ユニットに対応したオーディオデータを読み出して出力するデータ出力部をさらに有する
前記(15)に記載の受信装置。
(17)上記処理部は、
上記オーディオストリームの各オーディオフレームに含まれるオーディオ圧縮データにデコード処理を施してオーディオデータを得るデコード部と、
上記タグ情報に基づいて、上記デコード部で得られたオーディオデータから上記所定の音ユニットに対応したオーディオデータを切り取ってテキスト変換を行って字幕データを生成する字幕データ生成部を有する
前記(14)から(16)のいずれかに記載の受信装置。
(18)受信部により、オーディオ圧縮データを含むオーディオフレームが連続して配置されたオーディオストリームを含む措定フォーマットのコンテナストリームを受信する受信ステップを備え、
所定の音ユニットのオーディオ圧縮データを含む上記オーディオフレームに、該所定の音ユニットのオーディオ圧縮データを含むことを示すタグ情報が含まれており、
上記タグ情報を利用して上記オーディオストリームの処理を行う処理ステップをさらに有する
受信方法。
(19)オーディオ圧縮データを含むオーディオフレームが連続して配置されたオーディオストリームを含む所定フォーマットのコンテナストリームを受信する受信部を備え、
所定の音ユニットのオーディオ圧縮データを含む上記オーディオフレームに、該所定の音ユニットのオーディオ圧縮データを含むことを示すタグ情報が含まれており、
上記コンテナストリームのレイヤおよび/または上記オーディオストリームのレイヤに、上記オーディオストリーム内における上記所定の音ユニットの情報を持つテーブル情報が含まれており、
上記受信されたコンテナストリームのストレージへの書き込みと、上記ストレージからの上記コンテナストリームの読み出しと、上記読み出されたコンテナストリームに含まれるオーディオストリームの処理を制御する制御部をさらに備え
上記制御部は、上記テーブル情報が持つ上記所定の音ユニットの情報に基づいて上記ストレージからの上記コンテナストリームの読み出しを制御する
受信装置。
(20)受信部により、オーディオ圧縮データを含むオーディオフレームが連続して配置されたオーディオストリームを含む所定フォーマットのコンテナストリームを受信する受信ステップを有し、
所定の音ユニットのオーディオ圧縮データを含む上記オーディオフレームに、該所定の音ユニットのオーディオ圧縮データを含むことを示すタグ情報が含まれており、
上記コンテナストリームのレイヤおよび/または上記オーディオストリームのレイヤに、上記オーディオストリーム内における上記所定の音ユニットの情報を持つテーブル情報が含まれており、
上記受信されたコンテナストリームのストレージへの書き込みを制御する書き込み制御ステップと、
上記ストレージからの上記コンテナストリームの読み出しを制御する読み出し制御ステップと、
上記読み出されたコンテナストリームに含まれるオーディオストリームの処理を行う処理ステップをさらに有し
上記読み出し制御ステップでは、上記テーブル情報が持つ上記所定の音ユニットの情報に基づいて上記ストレージからの上記コンテナストリームの読み出しを制御する
受信方法。
100・・・サービス送信機
110・・・ストリーム生成部
111・・・制御部
111a・・・CPU
112・・・ビデオエンコーダ
113・・・オーディオエンコーダ
114・・・マルチプレクサ
200・・・サービス受信機
201・・・受信部
202・・・デマルチプレクサ
203・・・ビデオデコード部
204・・・映像処理回路
205・・・パネル駆動回路
206・・・表示パネル
207・・・OSD部
214・・・オーディオデコード部
215・・・音声出力処理回路
216・・・スピーカシステム
221・・・CPU
222・・・フラッシュROM
223・・・DRAM
224・・・内部バス
225・・・リモコン受信部
226・・・リモコン送信機
231・・・ローカルストレージ
232・・・通信インタフェース
241・・・ネット
242・・・オンラインストレージ
251・・・デコーダ
252・・・オブジェクトレンダラ
253・・・ミキサ
254・・・オーディオデータ切り取り部
255・・・オーディオ&タグバッファ
256・・・テキスト変換/字幕表示部
Claims (17)
- オーディオデータにエンコード処理を施し、オーディオ圧縮データを含むオーディオフレームが連続して配置されたオーディオストリームを生成するストリーム生成部と、
所定の音ユニットのオーディオ圧縮データを含む上記オーディオフレームに、該所定の音ユニットのオーディオ圧縮データを含むことを示すタグ情報を挿入する情報挿入部と、
上記タグ情報が挿入されたオーディオストリームを含む所定フォーマットのコンテナストリームを送信する送信部を備え、
上記タグ情報は、
上記所定の音ユニットのオーディオ圧縮データの開始位置を含むか、終了位置を含むか、開始位置および終了位置のいずれも含まないことを示すタイプ情報を有する
送信装置。 - 上記タグ情報は、
上記タイプ情報が上記開始位置を含むことを示すとき、フレーム先頭から上記開始位置までのサンプル単位のオフセットを示すと共に、上記タイプ情報が上記終了位置を示すとき、フレーム先頭から上記終了位置までのサンプル単位のオフセットを示すオフセット情報を有する
請求項1に記載の送信装置。 - 上記タグ情報は、
該タグ情報が挿入されるオーディオフレームの、サービス先頭からのフレーム位置を示すフレームカウント情報を有する
請求項1から2のいずれかに記載の送信装置。 - 上記所定の音ユニットが複数存在するとき、
上記タグ情報は、
対応する音ユニットを識別するための音ユニット識別情報を有する
請求項1から3のいずれかに記載の送信装置。 - 上記所定の音ユニットが複数存在し、該複数の音ユニットに複数の発生元の音ユニットが含まれるとき、
上記タグ情報は、
対応する音ユニットの発生元を識別するための発生元識別情報を有する
請求項1から4のいずれかに記載の送信装置。 - 上記ストリーム生成部は、
複数のグループのオーディオデータにエンコード処理を施し、複数のグループのオーディオ圧縮データを含むオーディオフレームが連続して配置されたオーディオストリームを生成し、
上記タグ情報は、
上記所定の音ユニットのオーディオ圧縮データがどのグループのものであるかを識別するためのグループ識別情報を有する
請求項1から5のいずれかに記載の送信装置。 - 上記グループ識別情報が示すグループが所定のスイッチグループを構成するグループであるとき、
上記タグ情報は、
上記所定のスイッチグループを識別するためのスイッチグループ識別情報を有する
請求項6に記載の送信装置。 - 上記情報挿入部は、
上記コンテナストリームのレイヤおよび/または上記オーディオストリームのレイヤに、上記オーディオストリーム内における上記所定の音ユニットの情報を持つテーブル情報さらに挿入する
請求項1から7のいずれかに記載の送信装置。 - 上記所定の音ユニットが複数存在するとき、
複数の音ユニットの情報は、それぞれ、
対応する音ユニットを識別するための音ユニット識別情報を有する
請求項8に記載の送信装置。 - 上記所定の音ユニットが複数存在し、該複数の音ユニットに複数の発生元の音ユニットが含まれるとき、
複数の音ユニットの情報は、それぞれ、
対応する音ユニットの発生元を識別するための発生元識別情報を有する
請求項8または9に記載の送信装置。 - 上記所定の音ユニットの情報は、
上記所定の音ユニットのオーディオ圧縮データを含むオーディオフレームの、サービス先頭からのフレーム位置を示すフレームカウント情報を有する
請求項8から10のいずれかに記載の送信装置。 - オーディオデータにエンコード処理を施し、オーディオ圧縮データを含むオーディオフレームが連続して配置されたオーディオストリームを生成するストリーム生成ステップと、
所定の音ユニットのオーディオ圧縮データを含む上記オーディオフレームに、該所定の音ユニットのオーディオ圧縮データを含むことを示すタグ情報を挿入する情報挿入ステップと、
送信部により、上記タグ情報が挿入されたオーディオストリームを含む所定フォーマットのコンテナストリームを送信する送信ステップを有し、
上記タグ情報は、
上記所定の音ユニットのオーディオ圧縮データの開始位置を含むか、終了位置を含むか、開始位置および終了位置のいずれも含まないことを示すタイプ情報を有する
送信方法。 - オーディオ圧縮データを含むオーディオフレームが連続して配置されたオーディオストリームを含む所定フォーマットのコンテナストリームを受信する受信部を備え、
所定の音ユニットのオーディオ圧縮データを含む上記オーディオフレームに、該所定の音ユニットのオーディオ圧縮データを含むことを示すタグ情報が含まれており、
上記タグ情報は、上記所定の音ユニットのオーディオ圧縮データの開始位置を含むか、終了位置を含むか、開始位置および終了位置のいずれも含まないことを示すタイプ情報を有し、
上記タグ情報を利用して上記オーディオストリームの処理を行う処理部をさらに備える
受信装置。 - 上記処理部は、
上記オーディオストリームの各オーディオフレームに含まれるオーディオ圧縮データにデコード処理を施してオーディオデータを得るデコード部と、
上記タグ情報に基づいて上記デコード部で得られたオーディオデータから上記所定の音ユニットに対応したオーディオデータを切り取ってバッファに保持するデータ切り取り保持部を有する
請求項13に記載の受信装置。 - 上記処理部は、
ユーザの操作情報に基づいて、上記バッファから、上記所定の音ユニットに対応したオーディオデータを読み出して出力するデータ出力部をさらに有する
請求項14に記載の受信装置。 - 上記処理部は、
上記オーディオストリームの各オーディオフレームに含まれるオーディオ圧縮データにデコード処理を施してオーディオデータを得るデコード部と、
上記タグ情報に基づいて、上記デコード部で得られたオーディオデータから上記所定の音ユニットに対応したオーディオデータを切り取ってテキスト変換を行って字幕データを生成する字幕データ生成部を有する
請求項13から15のいずれかに記載の受信装置。 - 受信部により、オーディオ圧縮データを含むオーディオフレームが連続して配置されたオーディオストリームを含む措定フォーマットのコンテナストリームを受信する受信ステップを備え、
所定の音ユニットのオーディオ圧縮データを含む上記オーディオフレームに、該所定の音ユニットのオーディオ圧縮データを含むことを示すタグ情報が含まれており、
上記タグ情報は、上記所定の音ユニットのオーディオ圧縮データの開始位置を含むか、終了位置を含むか、開始位置および終了位置のいずれも含まないことを示すタイプ情報を有し、
上記タグ情報を利用して上記オーディオストリームの処理を行う処理ステップをさらに有する
受信方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021072712A JP7218772B2 (ja) | 2015-12-08 | 2021-04-22 | 受信装置および受信方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015239751 | 2015-12-08 | ||
JP2015239751 | 2015-12-08 | ||
PCT/JP2016/086280 WO2017099092A1 (ja) | 2015-12-08 | 2016-12-06 | 送信装置、送信方法、受信装置および受信方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021072712A Division JP7218772B2 (ja) | 2015-12-08 | 2021-04-22 | 受信装置および受信方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017099092A1 JPWO2017099092A1 (ja) | 2018-09-27 |
JP6876924B2 true JP6876924B2 (ja) | 2021-05-26 |
Family
ID=59014182
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017555084A Active JP6876924B2 (ja) | 2015-12-08 | 2016-12-06 | 送信装置、送信方法、受信装置および受信方法 |
JP2021072712A Active JP7218772B2 (ja) | 2015-12-08 | 2021-04-22 | 受信装置および受信方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021072712A Active JP7218772B2 (ja) | 2015-12-08 | 2021-04-22 | 受信装置および受信方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10614823B2 (ja) |
EP (2) | EP3389046B1 (ja) |
JP (2) | JP6876924B2 (ja) |
CA (1) | CA3003686C (ja) |
WO (1) | WO2017099092A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021226503A1 (en) | 2020-05-08 | 2021-11-11 | Nuance Communications, Inc. | System and method for data augmentation for multi-microphone signal processing |
CN113595940B (zh) * | 2021-09-28 | 2021-12-14 | 恒生电子股份有限公司 | 分片的发送方法、接收方法和对应装置 |
WO2023248678A1 (ja) * | 2022-06-24 | 2023-12-28 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、及び情報処理システム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001282261A (ja) * | 2000-03-30 | 2001-10-12 | Canon Inc | 音声データ設定装置及び方法、音声データ生成装置及び方法、記録媒体 |
US7724885B2 (en) * | 2005-07-11 | 2010-05-25 | Nokia Corporation | Spatialization arrangement for conference call |
US8582956B1 (en) * | 2007-07-18 | 2013-11-12 | Adobe Systems Incorporated | System and method for previewing multimedia files |
WO2009101703A1 (ja) * | 2008-02-15 | 2009-08-20 | Pioneer Corporation | 楽曲データ分析装置及び楽器種類検出装置、楽曲データ分析方法及び楽器種類検出装置並びに楽曲データ分析用プログラム及び楽器種類検出用プログラム |
JP5266341B2 (ja) * | 2008-03-03 | 2013-08-21 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号処理方法及び装置 |
JP5771618B2 (ja) * | 2009-10-19 | 2015-09-02 | ドルビー・インターナショナル・アーベー | 音声オブジェクトの区分を示すメタデータ時間標識情報 |
US8780978B2 (en) * | 2009-11-04 | 2014-07-15 | Qualcomm Incorporated | Controlling video encoding using audio information |
JP5166470B2 (ja) * | 2010-03-25 | 2013-03-21 | 株式会社東芝 | 音声認識装置、及びコンテンツ再生装置 |
JP2012010311A (ja) | 2010-05-26 | 2012-01-12 | Sony Corp | 送信装置、送信方法、受信装置、受信方法および送受信システム |
JP5798247B2 (ja) | 2011-07-01 | 2015-10-21 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 向上した3dオーディオ作成および表現のためのシステムおよびツール |
KR102071860B1 (ko) * | 2013-01-21 | 2020-01-31 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화 |
GB2524333A (en) * | 2014-03-21 | 2015-09-23 | Nokia Technologies Oy | Audio signal payload |
CN104240738B (zh) * | 2014-08-28 | 2018-05-11 | 杰发科技(合肥)有限公司 | 一种音效设置方法及电子装置 |
-
2016
- 2016-12-06 EP EP16872990.3A patent/EP3389046B1/en active Active
- 2016-12-06 US US15/775,154 patent/US10614823B2/en active Active
- 2016-12-06 WO PCT/JP2016/086280 patent/WO2017099092A1/ja active Application Filing
- 2016-12-06 EP EP21179631.3A patent/EP3913625B1/en active Active
- 2016-12-06 CA CA3003686A patent/CA3003686C/en active Active
- 2016-12-06 JP JP2017555084A patent/JP6876924B2/ja active Active
-
2021
- 2021-04-22 JP JP2021072712A patent/JP7218772B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2021107943A (ja) | 2021-07-29 |
BR112018011019A2 (ja) | 2018-11-21 |
CA3003686C (en) | 2024-02-06 |
EP3913625B1 (en) | 2024-04-10 |
US20180322888A1 (en) | 2018-11-08 |
EP3389046B1 (en) | 2021-06-16 |
CA3003686A1 (en) | 2017-06-15 |
WO2017099092A1 (ja) | 2017-06-15 |
EP3389046A1 (en) | 2018-10-17 |
JPWO2017099092A1 (ja) | 2018-09-27 |
US10614823B2 (en) | 2020-04-07 |
JP7218772B2 (ja) | 2023-02-07 |
EP3913625A1 (en) | 2021-11-24 |
EP3389046A4 (en) | 2018-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6729382B2 (ja) | 送信装置、送信方法、受信装置および受信方法 | |
JP7218772B2 (ja) | 受信装置および受信方法 | |
JP7529013B2 (ja) | 送信装置および送信方法 | |
JP6908168B2 (ja) | 受信装置、受信方法、送信装置および送信方法 | |
JP6904463B2 (ja) | 送信装置および送信方法 | |
JP7310849B2 (ja) | 受信装置および受信方法 | |
JP6841230B2 (ja) | 送信装置、送信方法、受信装置および受信方法 | |
BR112018011019B1 (pt) | Aparelho e método de transmissão, e, aparelho e método de recepção |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191111 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201208 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210202 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210323 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210405 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6876924 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |