JP6559542B2 - Receiving device, receiving method and program - Google Patents

Receiving device, receiving method and program Download PDF

Info

Publication number
JP6559542B2
JP6559542B2 JP2015217947A JP2015217947A JP6559542B2 JP 6559542 B2 JP6559542 B2 JP 6559542B2 JP 2015217947 A JP2015217947 A JP 2015217947A JP 2015217947 A JP2015217947 A JP 2015217947A JP 6559542 B2 JP6559542 B2 JP 6559542B2
Authority
JP
Japan
Prior art keywords
audio
attribute
sound
unit
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015217947A
Other languages
Japanese (ja)
Other versions
JP2017092617A (en
Inventor
高明 野口
高明 野口
徳幸 工藤
徳幸 工藤
隆徳 金野
隆徳 金野
川口 将顧
将顧 川口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2015217947A priority Critical patent/JP6559542B2/en
Publication of JP2017092617A publication Critical patent/JP2017092617A/en
Application granted granted Critical
Publication of JP6559542B2 publication Critical patent/JP6559542B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Circuits Of Receivers In General (AREA)

Description

本発明は、受信装置、受信方法およびプログラム、特にテレビジョン放送システムに関する。   The present invention relates to a receiving apparatus, a receiving method, and a program, and more particularly to a television broadcasting system.

次世代テレビジョン放送サービス、例えば、4K、8K超高解像度テレビジョン放送(UHDTV:Ultra High Definition Television)では、1つの番組に対し、複数の異なった再生方式の音声や、複数の言語の音声を放送するサービスであるサイマル音声放送が予定されている。サイマル音声放送では、番組毎に再生方式、言語などの属性が異なる音声が多重化されるため、テレビジョン受信装置は、その属性に応じて復号(デコード)された音声信号を再生する。   In next-generation television broadcasting services such as 4K and 8K Ultra High Definition Television (UHDTV), audio from multiple different playback formats and audio in multiple languages can be sent to a single program. A simul audio broadcast, which is a broadcasting service, is planned. In the simulcast, since the audio having different attributes such as the reproduction method and language is multiplexed for each program, the television receiving apparatus reproduces the audio signal decoded (decoded) according to the attributes.

他方、デジタルテレビジョン放送において、多チャンネル音声の一部のチャンネルについて、他のチャンネルと独立した音量制御を可能とするダイアログ専用チャンネルを設けることが検討されている。ダイアログ専用チャンネルには、番組の一部の要素としてダイアログ音声が提供される。ダイアログ音声対応の受信装置は、ダイアログ音声が提供されていることを認識し、全チャンネルについての音量調整とは別に操作により指示されたダイアログ専用チャンネルについて音量調整を可能とする。   On the other hand, in digital television broadcasting, it has been studied to provide a dialog dedicated channel that enables volume control independent of other channels for some channels of multi-channel audio. Dialog audio is provided as a part of the program to the dialog dedicated channel. The dialog voice-compatible receiving device recognizes that dialog voice is provided, and enables volume adjustment for the dedicated channel for the dialog designated by the operation separately from the volume adjustment for all channels.

例えば、特許文献1には、ダイアログ音量制御部、主音量制御部及びダイアログ音量制御部ならびに主音量制御部と結合され、ダイアログ音量及び主音量をそれぞれ個別に調節するためのダイアログ音量調節信号及び主音量調節信号を個別に生成するように構成される回路部を含むことを特徴とする装置について記載されている。   For example, Patent Literature 1 is combined with a dialog volume control unit, a main volume control unit, a dialog volume control unit, and a main volume control unit, and a dialog volume adjustment signal and a main volume for individually adjusting the dialog volume and the main volume. An apparatus is described that includes a circuit portion configured to individually generate a volume control signal.

特表2010−515290号公報Special table 2010-515290

多チャンネル音声には、複数のダイアログ専用チャンネルが設定され、個々のダイアログ専用チャンネルに異なる言語や種類の音声が割り当てられることがある。また、ダイアログ専用チャンネルや言語の割り当ては、番組によって異なりうる。そのため、放送チャンネルや番組の切り替えに応じて再生される音声の設定が、必ずしもユーザが意図する音声の設定にならないおそれがある。   In multi-channel audio, a plurality of dialog dedicated channels may be set, and different languages and types of audio may be assigned to the individual dialog dedicated channels. Also, the dialog dedicated channel and language assignment may vary from program to program. For this reason, there is a possibility that the setting of the sound that is reproduced in accordance with the switching of the broadcast channel or program does not necessarily become the sound setting intended by the user.

例えば、図19に示すように、番組の切り替えに伴い音声の編成がar08−1、ar08−2、ar08−3と順に切り替わる場合を仮定する。当初の編成ar08−1のうち英語の第2音声が選択されていても、次の編成ar08−2には日本語の第1音声しか含まれない。そのため、最後の編成ar08−3のうち、直前の編成ar08−2に含まれる第1音声と同一の言語である日本語の第1音声が選択され、英語の第2音声が選択されないことがある。次に、図20に示すように、音声の編成がar09−1、ar09−2、ar09−3と順に切り替わる場合を仮定する。当初、日本語の第1音声が含まれる編成ar−01が編成ar09−2に切り替わると、当初選択された音声と言語が同一である日本語の第1音声が一旦選択される。編成ar09−2のもとで英語の第2音声がユーザの操作により選択された後、当初と同一の編成ar09−3に切り替わると、当初選択された音声と言語が同一である日本語の第1音声が提供される。   For example, as shown in FIG. 19, it is assumed that the audio organization is switched in the order of ar08-1, ar08-2, and ar08-3 as the program is switched. Even if the second English speech is selected in the initial composition ar08-1, only the first Japanese speech is included in the next composition ar08-2. Therefore, in the last composition ar08-3, the first Japanese voice that is the same language as the first voice included in the previous composition ar08-2 may be selected, and the second English voice may not be selected. . Next, as shown in FIG. 20, it is assumed that the audio organization is switched in the order of ar09-1, ar09-2, ar09-3. Initially, when the organization ar-01 including the first Japanese speech is switched to the organization ar09-2, the first Japanese speech having the same language as the originally selected speech is once selected. After the second English voice is selected by the user's operation under the organization ar09-2, when the ar09-3 is switched to the same organization ar09-3 as the original, the second Japanese speech whose language is the same as the originally selected speech One voice is provided.

また、番組において同一の内容について再生方式や言語の異なる音声を並行して提供される(サイマルキャスト)場合でも、ユーザの意図する音声の設定にならない事象が生じることがある。例えば、図21に示すように、当初の編成ar10−1には、第1音声としてサラウンド5.1chの日本語の主音声ならびにステレオ2.0chの日本語の主音声と、第2音声としてサラウンド5.1chの解説音声ならびにステレオ2.0chの英語の音声が含まれる場合を仮定する。編成ar10−1のうち、ユーザの操作によりサラウンド5.1chの解説音声が選択されたとき、編成ar10−2に切り替わると、編成ar10−1において選択された音声と言語が同一であるステレオ2.0chの日本語の音声が選択される。ユーザの操作によりステレオ2.0chの英語の音声が選択されたとき、当初と同一の編成ar10−3に切り替わると、直前に選択された音声とチャンネル数が同一であるステレオ2.0chの日本語の音声が選択されることがある。この場合、当初の編成ar10−1で選択された音声と同一のチャンネル数ならびに内容とならない。また、図22に示す例では、当初の編成ar11−1のうちサラウンド5.1chの日本語の音声が選択されたとき、第1音声としてステレオ2.0chの日本語の音声と第2音声としてステレオ2.0chの英語の音声を含む編成ar11−2に切り替わる場合を仮定する。このとき、直前に選択された音声と言語が同一であるステレオ2.0chの日本語の番組が選択される。その後、ユーザの操作によりステレオ2.0chの英語の音声が選択されたとき、当初と同一の編成である編成ar11−3に切り替わると、チャンネル数が最も多いサラウンド5.1chの日本語の音声が選択される。   In addition, even when audio of different playback methods and languages is provided in parallel for the same content in a program (simultaneous casting), an event may not occur where the audio intended by the user is not set. For example, as shown in FIG. 21, the initial composition ar10-1 has surround 5.1ch Japanese main voice as the first voice and stereo 2.0ch Japanese main voice and surround sound as the second voice. It is assumed that 5.1ch commentary sound and stereo 2.0ch English sound are included. When the explanation sound of surround 5.1ch is selected by the user's operation in the organization ar10-1, when the ar10-2 is switched to the organization ar10-2, the stereo 2 whose language is the same as the speech selected in the organization ar10-1. 0ch Japanese voice is selected. When a stereo 2.0ch English voice is selected by the user's operation, when switching to the same organization ar10-3 as the original, the stereo 2.0ch Japanese whose channel number is the same as the previously selected voice May be selected. In this case, the number of channels and the content are not the same as those of the voice selected in the original organization ar10-1. In the example shown in FIG. 22, when surround 5.1 ch Japanese speech is selected from the initial composition ar 11-1, stereo 2.0 ch Japanese speech and second speech are used as the first speech. It is assumed that the ar 11-2 is switched to the stereo ar11-2 including English audio of stereo 2.0ch. At this time, a stereo 2.0 channel Japanese program having the same language as the sound selected immediately before is selected. After that, when a stereo 2.0 channel English voice is selected by the user's operation, when switching to the ar11-3 knitting which is the same knitting as the original, the surround 5.1ch Japanese voice having the largest number of channels is obtained. Selected.

本発明は上記の点に鑑みてなされたものであり、放送チャンネルや番組の切り替えの直後の音声の設定を、より確実にユーザの意図に沿った設定にすることができる受信装置、受信方法およびプログラムを提供する。   The present invention has been made in view of the above points, and a receiving apparatus, a receiving method, and a method that can more reliably set the sound immediately after switching between broadcast channels and programs according to the user's intention. Provide a program.

本発明は上記の課題を解決するためになされたものであり、本発明の一態様は、受信している番組の構成を示す構成情報を解析して複数の属性の音声を含む音声の編成を解析する構成情報解析部と、記憶部と、前記編成で示される複数の属性の音声のうち操作により選択された音声を示す選択情報を生成し、前記選択情報と選択された前記音声に対応する属性を示す属性情報の組を前記記憶部に記憶し、前記編成が変更されるとき、前記記憶部に記憶された前記選択情報が示す属性のうち最後に選択された属性の音声を、他の属性の音声よりも優先して選択する再生制御部と、前記再生制御部が選択した属性の音声を再生する音声処理部と、を備える受信装置である。 The present invention has been made in order to solve the above-described problems, and one aspect of the present invention analyzes the configuration information indicating the configuration of the program that is being received, and compiles audio that includes audio of multiple attributes. Generates selection information indicating a voice selected by an operation from voices having a plurality of attributes shown in the composition, and analyzes the selected information and the selected voice. A set of attribute information indicating an attribute is stored in the storage unit, and when the composition is changed, the voice of the attribute selected last among the attributes indicated by the selection information stored in the storage unit is A receiving apparatus includes a reproduction control unit that selects a sound with priority over an audio having an attribute, and an audio processing unit that reproduces the audio having the attribute selected by the reproduction control unit.

本発明によれば、放送チャンネルや番組の切り替えの直後の音声の設定を、よりユーザの意図に沿った設定にすることができる。   According to the present invention, it is possible to set the audio immediately after switching between broadcast channels and programs to a setting more in line with the user's intention.

本発明の実施形態に係る放送システムの構成を示すブロック図である。It is a block diagram which shows the structure of the broadcast system which concerns on embodiment of this invention. 本発明の実施形態に係る送信装置が送信する音声データの例を示す図である。It is a figure which shows the example of the audio | voice data which the transmitter which concerns on embodiment of this invention transmits. 本発明の実施形態に係る受信装置における再生対象のアセットの選択例を示す図である。It is a figure which shows the example of selection of the asset of the reproduction | regeneration object in the receiver which concerns on embodiment of this invention. 本発明の実施形態に係る送信装置の構成を示すブロック図である。It is a block diagram which shows the structure of the transmitter which concerns on embodiment of this invention. MPTの例を示す図である。It is a figure which shows the example of MPT. MH−音声コンポーネント記述子の例を示す図である。It is a figure which shows the example of a MH-voice component descriptor. コンポーネント種別の例を示す図である。It is a figure which shows the example of a component classification. 本発明の実施形態に係る受信装置の構成を示すブロック図である。It is a block diagram which shows the structure of the receiver which concerns on embodiment of this invention. 本発明の実施形態に係る音声処理部の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice processing part which concerns on embodiment of this invention. 本発明の実施形態に係る制御部の構成を示すブロック図である。It is a block diagram which shows the structure of the control part which concerns on embodiment of this invention. 本発明の実施形態に係る再生処理を示すフローチャートである。It is a flowchart which shows the reproduction | regeneration processing which concerns on embodiment of this invention. 本発明の実施形態に係る受信装置における音声の選択例を示す図である。It is a figure which shows the example of selection of the audio | voice in the receiver which concerns on embodiment of this invention. 本発明の実施形態に係る受信装置における音声の他の選択例を示す図である。It is a figure which shows the other example of selection of the audio | voice in the receiver which concerns on embodiment of this invention. 本発明の実施形態に係る受信装置における音声の他の選択例を示す図である。It is a figure which shows the other example of selection of the audio | voice in the receiver which concerns on embodiment of this invention. 本発明の実施形態に係る受信装置による音声の他の選択例を示す図である。It is a figure which shows the other example of selection of the audio | voice by the receiver which concerns on embodiment of this invention. 本発明の実施形態に係る受信装置による音声の他の選択例を示す図である。It is a figure which shows the other example of selection of the audio | voice by the receiver which concerns on embodiment of this invention. 本発明の実施形態に係る受信装置による音声の他の選択例を示す図である。It is a figure which shows the other example of selection of the audio | voice by the receiver which concerns on embodiment of this invention. 本発明の実施形態に係る受信装置による音声の他の選択例を示す図である。It is a figure which shows the other example of selection of the audio | voice by the receiver which concerns on embodiment of this invention. 従来の受信装置に係る音声の選択例を示す図である。It is a figure which shows the example of selection of the voice which concerns on the conventional receiver. 従来の受信装置に係る音声の他の選択例を示す図である。It is a figure which shows the other example of selection of the audio | voice which concerns on the conventional receiver. 従来の受信装置に係る音声の他の選択例を示す図である。It is a figure which shows the other example of selection of the audio | voice which concerns on the conventional receiver. 従来の受信装置に係る音声の他の選択例を示す図である。It is a figure which shows the other example of selection of the audio | voice which concerns on the conventional receiver.

本発明の実施形態について、図面を参照しながら説明する。
図1は、本実施形態に係る放送システム1の構成を示すブロック図である。放送システム1は、送信装置10と、受信装置30とを含んで構成される。
Embodiments of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing a configuration of a broadcasting system 1 according to the present embodiment. The broadcast system 1 includes a transmission device 10 and a reception device 30.

送信装置10は、放送番組の番組データを受信装置30に放送伝送路20を介して送信する。番組データは、例えば、音声データと映像データとを含む。送信される音声データは1種類に限らず、並行して複数の属性の音声データを含むことがある。属性には、例えば、再生方式、言語、音声の種類がある。再生方式とは、再生に係る音声のチャンネル数、各チャンネルの音声を再生するためのスピーカの配置を意味する。再生方式は、音声モードと呼ばれることがある。再生方式は、例えば、サラウンド5.1ch、2.0ch、等である。言語は、発話音声もしくは合成音声で表現される言語情報を表すために用いられる言語である。音声の種類とは、番組で提供される音声で表現される内容の区別である。音声の種類には、例えば、番組の主たる内容を表す主音声、従たる内容を表す副音声、主たる内容を解説する解説音声、特定の出演者のせりふや歌唱、などがある。また、同一の種類の音声の種類が、異なる再生方式やチャンネルで並行して提供されることがある。このようなサービスをサイマルキャストと呼ぶ。サイマルキャストは、サイマル放送もしくは単にサイマルと呼ばれることもある。以下の説明では、当該サービス自体、又は当該サービスで提供される音声の一部又は全部をサイマル音声と呼ぶことがある。また、以下の説明では、再生方式(チャンネル数)や、複数のチャンネルのうちダイアログ音声として用いられているチャンネルをチャンネル状態と総称することがある。つまり、チャンネル状態も音声の属性の要素である。送信される音声データの属性やそれらの数は、つまり音声の編成は、番組やその一部の区間に応じて変化することがある。音声データの例については、後述する。なお、送信装置10は、例えば、放送事業者の放送設備を構成する。   The transmission device 10 transmits the program data of the broadcast program to the reception device 30 via the broadcast transmission path 20. The program data includes, for example, audio data and video data. The transmitted audio data is not limited to one type, and may include audio data having a plurality of attributes in parallel. The attributes include, for example, a reproduction method, a language, and a sound type. The reproduction system means the number of audio channels related to reproduction and the arrangement of speakers for reproducing the audio of each channel. The playback method is sometimes called an audio mode. The reproduction method is, for example, surround 5.1 ch, 2.0 ch, or the like. The language is a language used to express linguistic information expressed by spoken speech or synthesized speech. The type of audio is a distinction between contents expressed by audio provided in a program. The types of audio include, for example, a main audio representing the main content of the program, a sub audio indicating the subordinate content, a commentary audio explaining the main content, a dialogue or singing of a specific performer, and the like. Also, the same type of audio may be provided in parallel in different playback methods and channels. Such a service is called simulcast. Simulcast is sometimes called simulcast or simply simul. In the following description, the service itself or a part or all of the voice provided by the service may be referred to as simultaneous voice. Further, in the following description, a playback method (number of channels) and a channel used as dialog sound among a plurality of channels may be collectively referred to as a channel state. That is, the channel state is also an element of audio attributes. The attributes of audio data to be transmitted and the number thereof, that is, the organization of audio, may vary depending on the program and some sections thereof. An example of audio data will be described later. In addition, the transmission apparatus 10 comprises the broadcasting equipment of a broadcast provider, for example.

放送伝送路20は、送信装置10が送信する各種のデータを不特定多数の受信装置30に一方向的かつ一斉に伝送する伝送路である。放送伝送路20は、例えば、放送衛星で中継される所定の周波数帯域の電波(放送波)である。放送伝送路20の一部には、通信回線、例えば、送信装置10から電波を送信するための送信設備までの通信回線が含まれてもよい。なお、本実施形態では、放送伝送路20を放送衛星で中継されるものとしたが、放送伝送路20の形態はこれに限られず、地上波であってもよい。   The broadcast transmission path 20 is a transmission path that transmits various data transmitted by the transmission apparatus 10 to an unspecified number of reception apparatuses 30 unidirectionally and simultaneously. The broadcast transmission path 20 is, for example, a radio wave (broadcast wave) in a predetermined frequency band that is relayed by a broadcast satellite. A part of the broadcast transmission path 20 may include a communication line, for example, a communication line from the transmission device 10 to a transmission facility for transmitting radio waves. In the present embodiment, the broadcast transmission path 20 is relayed by a broadcast satellite, but the form of the broadcast transmission path 20 is not limited to this and may be terrestrial.

受信装置30は、送信装置10から放送伝送路20を介して受信した番組データに基づく番組の映像を表示し、当該番組の音声を再生する。受信装置30は、受信した番組データから1個又は複数の属性の音声データを検出する。また、受信装置30は、番組データに含まれる複数の再生方式のそれぞれを復号する音声処理部(後述)を有し、複数の方式のうち処理可能な方式のいずれかを選択する。受信装置30は、例えば、テレビジョン受信装置、映像記録装置、等、テレビジョン放送を受信することができる機能を有する電子機器である。   The receiving device 30 displays the video of the program based on the program data received from the transmitting device 10 via the broadcast transmission path 20, and reproduces the audio of the program. The receiving device 30 detects audio data having one or more attributes from the received program data. In addition, the receiving device 30 includes an audio processing unit (described later) that decodes each of a plurality of playback methods included in the program data, and selects any one of a plurality of methods that can be processed. The receiving device 30 is an electronic device having a function capable of receiving a television broadcast, such as a television receiving device or a video recording device.

(音声データ)
次に、本実施形態に係る送信装置10が送信する音声データの例について説明する。図2は、本実施形態に係る送信装置10が送信する音声データの例を示す図である。この音声データは、構成要素としてアセットST01−ST06が含まれる。アセットST01、ST02、ST03、ST04、ST05及びST06は、それぞれ番組の再生に用いる制御データにおいてコンポーネントタグ0x10、0x11、0x14、0x15、0x18及び0x19をもって識別される。コンポーネントタグは、個々のアセットを識別するための識別情報である。アセットST01は、サラウンド5.1chの第1音声を表す音声データである。第1音声は、例えば、番組の主音声である。アセットST01には、5.1chのうち3chがダイアログ音声に割り当てられている。ダイアログ音声とは、再生方式として多チャンネルのサラウンド方式が用いられる場合において、解説音声、映画やドラマのせりふ、所定の歌唱などの発話音声のコンテンツを明瞭に受聴することを目的に所定のチャンネルで再生させる音声である。所定のチャンネルとして、例えば、前方中央(C:Center)、前方左(FL:Front Left)、前方右(FR:Front Right)のいずれかが指定されることがある。ダイアログ音声として、一度に複数のチャンネルが割り当てられることがある。個々のチャンネルのダイアログ音声は、主ダイアログ(main)、追加ダイアログ(add1)、追加ダイアログ(add2)などと識別される。主ダイアログは、メインダイアログと呼ばれることもある。図2に示すアセットST01では、日本語、英語、仏語の第1音声が、それぞれ主ダイアログ(main)、追加ダイアログ(add1)、追加ダイアログ(add2)として割り当てられている。
(Voice data)
Next, an example of audio data transmitted by the transmission apparatus 10 according to the present embodiment will be described. FIG. 2 is a diagram illustrating an example of audio data transmitted by the transmission apparatus 10 according to the present embodiment. This audio data includes assets ST01-ST06 as components. Assets ST01, ST02, ST03, ST04, ST05, and ST06 are identified by component tags 0x10, 0x11, 0x14, 0x15, 0x18, and 0x19, respectively, in the control data used for program playback. The component tag is identification information for identifying individual assets. The asset ST01 is sound data representing the first sound of surround 5.1ch. The first sound is, for example, the main sound of the program. In the asset ST01, 3 channels out of 5.1 channels are assigned to the dialog sound. Dialogue audio means that when a multi-channel surround system is used as a playback system, it is a predetermined channel for the purpose of clearly listening to the contents of speech audio such as commentary audio, movie or drama dialogue, and predetermined singing. The sound to be played. As the predetermined channel, for example, one of front center (C: Center), front left (FL: Front Left), and front right (FR: Front Right) may be designated. As a dialog sound, a plurality of channels may be assigned at a time. The dialog sound of each channel is identified as a main dialog (main), an add dialog (add1), an add dialog (add2), and the like. The main dialog is sometimes called a main dialog. In the asset ST01 shown in FIG. 2, first voices in Japanese, English, and French are assigned as a main dialog (main), an add dialog (add1), and an add dialog (add2), respectively.

アセットST02は、サラウンド5.1chの第2音声を表す音声データである。第2音声は、例えば、解説音声である。アセットST02には、日本語、英語、仏語の第2音声が、それぞれ主ダイアログ(main)、追加ダイアログ(add1)、追加ダイアログ(add2)として割り当てられている。
アセットST03は、サラウンド5.1chの第1音声を表す音声データである。アセットST03の音声の主たる言語は、英語である。
アセットST04は、サラウンド5.1chの第1音声を表す音声データである。アセットST04の音声の主たる言語は、仏語である。
アセットST05は、ステレオ2.0chの第1音声を表す音声データである。
アセットST06は、ステレオ2.0chの第2音声を表す音声データである。アセットST05、ST06の音声の主たる言語は、それぞれ日本語である。受信装置30は、これらの音声データのいずれかを選択する。
The asset ST02 is sound data representing the second sound of surround 5.1ch. The second sound is, for example, commentary sound. To the asset ST02, second sounds in Japanese, English, and French are assigned as a main dialog (main), an add dialog (add1), and an add dialog (add2), respectively.
The asset ST03 is sound data representing the first sound of surround 5.1ch. The main language of the sound of the asset ST03 is English.
The asset ST04 is sound data representing the first sound of surround 5.1ch. The main language of the sound of the asset ST04 is French.
The asset ST05 is audio data representing the first audio of stereo 2.0 ch.
Asset ST06 is audio data representing the second audio of stereo 2.0 ch. The main languages of the assets ST05 and ST06 are Japanese. The receiving device 30 selects one of these audio data.

(音声データの選択)
次に、受信装置30において受信した音声データとして、図2に示すアセットST01−ST06が送信される場合を例にして、再生対象のアセットの選択例について説明する。図3は、本実施形態に係る受信装置30における再生対象のアセットの選択例を示す図である。
(Select audio data)
Next, an example of selecting an asset to be reproduced will be described by taking as an example the case where assets ST01 to ST06 shown in FIG. 2 are transmitted as audio data received by the receiving device 30. FIG. 3 is a diagram illustrating an example of selecting an asset to be played in the receiving device 30 according to the present embodiment.

図3(a)は、本実施形態に係る受信装置30が再生方式としてサラウンド5.1chの音声を再生することができ、かつ、ダイアログ音声を選択することができる場合を例にする。受信装置30は、図2に示すアセットST01−ST06の音声データを受信し、そのうち、受信装置30の再生制御部(後述)は、アセットST03、ST04を無視し、アセットST01、ST02、ST05、ST06が再生対象の候補となる。アセットST03、ST04は、日本語以外の副言語である英語、仏語のサラウンド5.1chの第1音声に係るアセットである。 アセットST03、ST04を無視するのは、アセットST01が副言語である英語、仏語のダイアログ音声のチャンネルを含むためである。ダイアログ音声については、後述する。受信装置30の再生制御部は、再生方式ならびに音声の種類として、アセットST01(第1音声5.1)、ST02(第2音声5.1)、ST05(第1音声2.0)及びST06(第2音声2.0)のいずれかを音声切替操作がなされる都度、循環的に切り替える。受信装置30の再生制御部は、アセットST01、ST02のいずれかが選択されている場合には、日本語の音声(main)、英語の音声(add1)及び仏語の音声(add2)のいずれかを言語切替操作がなされる都度、循環的に切り替える。従って、受信装置30は、サラウンド5.1chの音声の再生時において、他の言語のダイアログ音声を再生対象としてアセットの変更や、その変更により音声の種類(第1音声、第2音声の区別)を変更せずに選択することができる。   FIG. 3A illustrates an example in which the receiving apparatus 30 according to the present embodiment can reproduce surround 5.1ch audio as a reproduction method and can select dialog audio. The receiving apparatus 30 receives the audio data of the assets ST01 to ST06 shown in FIG. Is a candidate for playback. Assets ST03 and ST04 are assets related to the first audio of surround 5.1ch in English and French, which are sub-languages other than Japanese. The reason for ignoring the assets ST03 and ST04 is that the asset ST01 includes English and French dialog audio channels as sub-languages. The dialog sound will be described later. The playback control unit of the receiving device 30 sets the asset ST01 (first voice 5.1), ST02 (second voice 5.1), ST05 (first voice 2.0), and ST06 (as a playback method and a voice type). Any one of the second voices 2.0) is switched cyclically every time a voice switching operation is performed. When any of the assets ST01 and ST02 is selected, the playback control unit of the receiving device 30 selects one of Japanese voice (main), English voice (add1), and French voice (add2). Each time a language switching operation is performed, it is switched cyclically. Therefore, the reception device 30 changes the asset for the dialog voice of another language as a reproduction target when reproducing the sound of the surround 5.1ch, and the type of the voice (the distinction between the first voice and the second voice) by the change. Can be selected without changing.

図3(b)は、受信装置30が再生方式としてサラウンド5.1chの音声を再生することができるが、ダイアログ音声を選択できない場合を例にする。受信装置30の再生制御部は、図3(a)に示す例とは異なり、ダイアログ音声として提供される英語、仏語の音声を利用できないため、英語の第1音声に係るST03と仏語の第2音声に係るST04を無視しない。受信装置30の再生制御部は、再生方式ならびに音声の種類として、アセットST01(第1音声5.1)、ST02(第2音声5.1)、ST05(第1音声2.0)及びST06(第2音声2.0)のいずれかを音声切替操作がなされる都度、循環的に切り替える。受信装置30の再生制御部は、アセットST01が選択されている場合には、英語の第1音声に係るアセットST03、及び仏語の第1音声に係るアセットST04のいずれかを言語切替操作がなされる都度、循環的に切り替える。この例では、受信装置30は、サラウンド5.1chの第1音声の再生時において、再生対象の音声に係るアセットを切り替えることにより、再生される音声の言語を切り替える。但し、この例では、より多くのアセットの利用を避けるため、サラウンド5.1chの第2音声として英語、仏語の音声が採用されない。   FIG. 3B illustrates an example in which the receiving apparatus 30 can reproduce surround 5.1ch audio as a reproduction method, but cannot select dialog audio. Unlike the example shown in FIG. 3A, the playback control unit of the receiving device 30 cannot use English and French voices provided as dialog voices, so ST03 related to the first English voice and the second French voice. ST04 related to voice is not ignored. The playback control unit of the receiving device 30 sets the asset ST01 (first voice 5.1), ST02 (second voice 5.1), ST05 (first voice 2.0), and ST06 (as a playback method and a voice type). Any one of the second voices 2.0) is switched cyclically every time a voice switching operation is performed. When the asset ST01 is selected, the playback control unit of the receiving device 30 performs a language switching operation on either the asset ST03 related to the first English sound or the asset ST04 related to the first French sound. Switch cyclically each time. In this example, the receiving apparatus 30 switches the language of the reproduced sound by switching the asset related to the sound to be reproduced when reproducing the first sound of surround 5.1ch. However, in this example, in order to avoid using more assets, English and French voices are not adopted as the second sound of surround 5.1ch.

図3(c)は、受信装置30が再生方式としてサラウンド5.1chの音声の再生も、ダイアログ音声の選択もできない場合を例にする。受信装置30の再生制御部は、自装置において再生可能な再生方式としてステレオ2.0chのアセットST05(第1音声2.0)及びST06(第2音声2.0)のいずれかを音声切替操作がなされる都度、循環的に切り替える。また、図3(c)に示す例では、受信装置30の再生制御部は、英語などの他言語のステレオ音声のアセットを無視する。そのため、受信装置30の再生制御部は、言語切替操作がなされる場合でも、再生対象の音声に係るアセット又はチャンネルの切り替えに応じて言語の切り替えを行わない。   FIG. 3C illustrates an example in which the reception apparatus 30 cannot reproduce surround 5.1ch audio or select dialog audio as a reproduction method. The playback control unit of the receiving device 30 performs a sound switching operation on any of the stereo 2.0ch assets ST05 (first audio 2.0) and ST06 (second audio 2.0) as a playback method that can be played back by the own device. Each time it is made, it is switched cyclically. In the example illustrated in FIG. 3C, the playback control unit of the receiving device 30 ignores stereo audio assets in other languages such as English. Therefore, even when a language switching operation is performed, the playback control unit of the receiving device 30 does not switch the language according to the switching of the asset or channel related to the playback target audio.

(送信装置の構成)
次に、本実施形態に係る送信装置10の構成について説明する。
図4は、本実施形態に係る送信装置10の構成を示すブロック図である。送信装置10は、番組データ取得部11、制御データ取得部12、多重化部13、変調部14及び送信部15を含んで構成される。
(Configuration of transmitter)
Next, the configuration of the transmission device 10 according to the present embodiment will be described.
FIG. 4 is a block diagram illustrating a configuration of the transmission device 10 according to the present embodiment. The transmission device 10 includes a program data acquisition unit 11, a control data acquisition unit 12, a multiplexing unit 13, a modulation unit 14, and a transmission unit 15.

番組データ取得部11は、送信装置10の外部から番組データを取得する。番組データは、放送番組の内容(コンテンツ)を表すデータである。番組データは、例えば、放送番組を構成する映像データ、音声データ、テキストデータなどが含まれる。番組データ取得部11は、取得した番組データを多重化部13に出力する。   The program data acquisition unit 11 acquires program data from the outside of the transmission device 10. Program data is data representing the content (content) of a broadcast program. The program data includes, for example, video data, audio data, text data, etc. constituting a broadcast program. The program data acquisition unit 11 outputs the acquired program data to the multiplexing unit 13.

制御データ取得部12は、送信装置10の外部から制御データを取得する。制御データは、例えば、MMT(MPEG Media Transport)方式におけるMMT−SI(Service Information)である。MMT−SIには、例えば、MPT(MMT Package Table;MMTパッケージテーブル)、MH−EIT(MH−イベント情報テーブル、MH−Event Information Table)が含まれる。MPTは、放送番組の構成要素であるアセット、つまり映像、音声のリストや、それらの提供条件を示す情報を含むテーブルである。言い換えれば、アセットのリストは、その時点で放送される番組における音声データをはじめとする番組データの編成を示す。MH−EITは、その時点から所定期間内に放送もしくは放送予定の番組に関する情報、例えば、番組の名称、放送時間、放送内容の説明などを示す情報を含むテーブルである。そのため、MPTが示す音声の編成は、時間の経過もしくは放送チャンネルの切り替えに伴う番組やその一部の区間であるセグメント(コーナとも呼ばれる)の切り替えに応じて更新される。制御データ取得部12は、取得した制御データを多重化部13に出力する。   The control data acquisition unit 12 acquires control data from the outside of the transmission device 10. The control data is, for example, MMT-SI (Service Information) in the MMT (MPEG Media Transport) system. The MMT-SI includes, for example, MPT (MMT Package Table; MMT package table) and MH-EIT (MH-event information table, MH-Event Information Table). The MPT is a table including a list of assets that are constituent elements of a broadcast program, that is, video and audio, and information indicating the provision conditions thereof. In other words, the asset list indicates the organization of program data including audio data in the program broadcast at that time. The MH-EIT is a table including information on a program that is broadcast or scheduled to be broadcast within a predetermined period from that time, for example, information indicating a program name, a broadcast time, a description of broadcast contents, and the like. Therefore, the audio organization indicated by the MPT is updated in accordance with the switching of a program or a segment (also referred to as a corner) which is a part of a section with the passage of time or switching of a broadcast channel. The control data acquisition unit 12 outputs the acquired control data to the multiplexing unit 13.

多重化部13には、番組データ取得部11から入力された番組データと、制御データ取得部12から入力された制御データを多重化して多重化データを生成する。多重化部13は、生成した多重化データを変調部14に出力する。
変調部14は、多重化部13から入力された多重化データを所定の変調方式(例えば、QPSK:Quadrature Phase−shift Keying)を用いて変調して基底周波数帯域の放送信号を生成し、生成した放送信号を送信部15に出力する。
送信部15は、変調部14から入力された基底周波数帯域の放送信号に基づいて、所定の周波数の搬送波を変調して放送チャンネルの周波数帯域の放送信号を生成し、生成した放送信号を放送波として放射する。これにより、制御データと番組データを多重化した多重化データを搬送する放送信号が放送伝送路20を介して伝送される。
The multiplexing unit 13 multiplexes the program data input from the program data acquisition unit 11 and the control data input from the control data acquisition unit 12 to generate multiplexed data. The multiplexing unit 13 outputs the generated multiplexed data to the modulation unit 14.
The modulation unit 14 modulates the multiplexed data input from the multiplexing unit 13 using a predetermined modulation method (for example, QPSK: Quadrature Phase-shift Keying) to generate a broadcast signal of the base frequency band, and generates The broadcast signal is output to the transmission unit 15.
The transmission unit 15 modulates a carrier wave of a predetermined frequency based on the broadcast signal in the base frequency band input from the modulation unit 14, generates a broadcast signal in the frequency band of the broadcast channel, and transmits the generated broadcast signal to the broadcast wave Radiates as. As a result, a broadcast signal carrying multiplexed data obtained by multiplexing control data and program data is transmitted via the broadcast transmission path 20.

(MPTのデータ構造)
次に、構成情報に含まれるMPTの例について説明する。
図5は、MPTの例を示す図である。本図に示す例では、MPTは、アセット毎にアセットタイプ(asset_type)とアセット記述子領域(asset_descriptors_byte)を含む。アセット記述子領域(asset_descriptors_byte)は、各種の記述子が記述される領域である。アセット記述子領域(asset_descriptors_byte)には、例えば、MH−音声コンポーネント記述子(MH−Audio_Component_Descriptor())が記述される。MH−音声コンポーネント記述子(MH−Audio_Component_Descriptor())は、番組を構成する音声データに関するパラメータが記述される記述子である。アセットタイプ(asset_type)には、アセットの種類を示す符号が記述される。アセットタイプ(asset_type)として、例えば、HEVCで符号化された映像データを示すhcv1、MPEG−4オーディオで符号化された音声データを示すmp4aなどが記述される。
(MPT data structure)
Next, an example of MPT included in the configuration information will be described.
FIG. 5 is a diagram illustrating an example of MPT. In the example shown in the figure, the MPT includes an asset type (asset_type) and an asset descriptor area (asset_descriptors_byte) for each asset. The asset descriptor area (asset_descriptors_byte) is an area in which various descriptors are described. In the asset descriptor area (asset_descriptors_byte), for example, an MH-audio component descriptor (MH-Audio_Component_Descriptor ()) is described. The MH-audio component descriptor (MH-Audio_Component_Descriptor ()) is a descriptor in which parameters relating to audio data constituting the program are described. In the asset type (asset_type), a code indicating the type of asset is described. As the asset type (asset_type), for example, hcv1 indicating video data encoded by HEVC, mp4a indicating audio data encoded by MPEG-4 audio, and the like are described.

(MH−音声コンポーネント記述子のデータ構造)
次に、MH−音声コンポーネント記述子の例について説明する。
図6は、MH−音声コンポーネント記述子の例を示す図である。本図に示す例では、MH−音声コンポーネント記述子(MH−Audio_Component_Descriptor()は、コンポーネントタグ(component_tag)、コンポーネント種別(component_type)、サイマルキャストグループ識別(simulcast_group_tag)、主コンポーネントフラグ(main_component_flag)及び言語コード(ISO_639_language_code)を含む。コンポーネントタグ(component_tag)には、個々の再生方式の音声データのアセット、つまりコンポーネントストリームを識別する番号が記述される。コンポーネント種別(component_type)の最下位5ビットには、再生方式を示す番号が記述される。なお、コンポーネント種別(component_type)の最上位1ビットは、ダイアログ制御情報の有無を表す。以下の説明では、コンポーネントタグに当該音声アセットのアセットIDが記述することで、コンポーネントストリームが識別されるものとする。サイマルキャストグループ識別(simulcast_group_tag)には、1つのサイマルキャストを行う音声データのグループに属する音声データに対して同一の番号が記述される。但し、サイマルキャストを行わない音声データについては、特定の符号‘0xFF’が記述される。従って、サイマル音声を提供する場合には、アセット間で共通であって、‘0xFF’以外の番号がサイマルキャストグループ識別(simulcast_group_tag)に記述される。サイマル音声に係らないアセットについては、0xFF’がサイマルキャストグループ識別(simulcast_group_tag)に記述される。主コンポーネントフラグ(main_component_flag)は、その音声データが主音声であるか否かを示すフラグである。例えば、主音声として、番組の主たる内容を表す第1音声に係る音声データが主音声として指定されることがある。言語コード(ISO_639_language_code)は、そのアセットに係る音声の主たる言語を表す情報である。言語コードとして、“jpn”、“eng”、“fra”、“ger”は、それぞれ、日本語、英語、仏語、独語を示す。
(MH-Data structure of voice component descriptor)
Next, an example of the MH-voice component descriptor will be described.
FIG. 6 is a diagram illustrating an example of the MH-voice component descriptor. In the example shown in the figure, the MH-audio component descriptor (MH-Audio_Component_Descriptor () is a component tag (component_tag), a component type (component_type), a simulcast group identification (simulcast_group_tag), a main component flag (main_gmp_main code) (ISO_639_language_code) is included in the component tag (component_tag), which describes the number of audio data assets of each playback method, that is, the number identifying the component stream.The least significant 5 bits of the component type (component_type) Number indicating the method The most significant 1 bit of the component type (component_type) indicates the presence or absence of dialog control information.In the following description, the component stream is identified by describing the asset ID of the audio asset in the component tag. In the simulcast group identification (simulcast_group_tag), the same number is described for the audio data belonging to the group of audio data to be subjected to one simulcast, except for the audio data not to be simulcast. Therefore, a specific code '0xFF' is described, and therefore, when providing simul sound, a number other than '0xFF' is common among assets and a simulcast group identification (simulcast_group_tag) is used. For assets not related to simulcast, 0xFF 'is described in the simulcast group identification (simulcast_group_tag) The main component flag (main_component_flag) indicates whether or not the audio data is the main audio For example, the audio data related to the first audio representing the main content of the program may be designated as the main audio as the main audio, and the language code (ISO_639_language_code) indicates the main language of the audio related to the asset. As language codes, “jpn”, “eng”, “fra”, and “ger” indicate Japanese, English, French, and German, respectively.

音声データには、ダイアログ音声のチャンネルやその言語情報を示すダイアログ制御情報が追加されることがある。ダイアログ制御情報の有無は、アセット毎のコンポーネント種別(component_type)の最上位1ビットに設定されるフラグで表される。例えば、フラグの値が「1」、「0」は、それぞれ音声データがダイアログ制御情報を含むこと、含まないことを示す。ダイアログ制御情報は、音声データの構成として、例えば、MPEG−4 AAC(Advanced Audio Coding)方式に準拠する音声フォーマットに含まれてもよい。当該フォーマットでは、ダイアログ音声のチャンネル(index mapping for dialogue_src_index)、ダイアログ音声のチャンネル数(num_dialogue_chans)、主ダイアログの言語コード(dialogue_main_lang_code)、追加ダイアログの言語コード(dialogue_additional_lang_code[i])などが、ダイアログ制御情報の要素として指定可能である。追加ダイアログは、ダイアログ音声のチャンネル数が2以上である場合に設けられ、各チャンネルについて言語などの属性が設定される。追加ダイアログは、複数個設定可能である。ダイアログ制御情報が示す個々のダイアログ音声に係る設定は、そのダイアログ音声が属するアセットに対する設定よりも優先される。例えば、5.1chサラウンド音声の言語コードが日本語である場合でも、主ダイアログの言語コードが英語を示す場合には、主ダイアログの言語は英語と判定される。なお、ダイアログ音声のチャンネルは、ダイアログ専用チャンネルと呼ばれることもある。   Dialog control information indicating a dialog audio channel and its language information may be added to the audio data. The presence / absence of dialog control information is represented by a flag set in the most significant 1 bit of the component type (component_type) for each asset. For example, flag values “1” and “0” indicate that the audio data includes or does not include dialog control information, respectively. The dialog control information may be included in an audio format conforming to, for example, an MPEG-4 AAC (Advanced Audio Coding) system as a configuration of audio data. In this format, the dialog audio channel (index mapping for dialog_src_index), the number of dialog audio channels (num_dialogue_chans), the main dialog language code (dialogue_main_lang_code), the additional dialog language code (dialogue_dialog_dialog_control) Can be specified as an element. The additional dialog is provided when the number of channels of the dialog sound is 2 or more, and attributes such as language are set for each channel. Multiple add dialogs can be set. The setting related to each dialog sound indicated by the dialog control information has priority over the setting for the asset to which the dialog sound belongs. For example, even if the language code of the 5.1ch surround sound is Japanese, if the language code of the main dialog indicates English, the language of the main dialog is determined to be English. The dialog audio channel is sometimes called a dialog-dedicated channel.

(再生方式の例)
次に、コンポーネント種別(component_type)に記述される再生方式の例について説明する。
図7は、コンポーネント種別の例を示す図である。本図には、コンポーネントタグの最下位5ビットで表される番号として、‘0x01’、‘0x02’、‘0x03’、‘0x09’、‘0x0C’、‘0x11’が列挙されている。‘0x01’、‘0x02’、‘0x03’、‘0x09’、‘0x0C’、‘0x11’は、再生方式としてそれぞれ1/0モード、1/0+1/0モード、2/0モード、3/2.1モード、5/2.1モード、3/3/3−5/2/3−3/0/0.2モードを示す値である。ここで、…/〜とは、受聴点を基準とした再生用スピーカの配置が、前方に…個(…音声チャンネル)であり、後方に〜個(〜音声チャンネル)であることを意味する。また、小数点以下の数値は、低域の音声を再生するための音声チャンネル数を示す。なお、音声チャンネルは、音声の再生単位であるチャンネルを意味し、放送波の周波数帯域を示す放送チャンネルと区別される。従って、1/0モードは、シングルモノ1.0chを示す。1/0+1/0モードはデュアルモノ1.0ch×2を示す。2/0モードは、ステレオ2.0chを示す。3/2.1モードは、サラウンド5.1chを示す。5/2.1モードは、サラウンド7.1chを示す。なお、3/3/3−5/2/3−3/0/0.2モードは、サラウンド22.2chを示す。3/3/3−5/2/3−3/0/0.2モードの3/3/3とは、スピーカの配置が、受聴点を基準として上層前方、側方、後方に3個ずつであることを示す。5/2/3とは、スピーカの配置が、受聴点を基準として中層前方、側方、後方にそれぞれ5、2、3個であることを示す。3/0/0.2とは、スピーカの配置が、受聴点を基準として下層前方、側方、後方にそれぞれ5、0、2個であることを示す。但し、下層後方の2チャンネルは、いずれも低域の音声を再生するためのチャンネルである。
(Example of playback method)
Next, an example of a playback method described in the component type (component_type) will be described.
FIG. 7 is a diagram illustrating an example of component types. In this figure, “0x01”, “0x02”, “0x03”, “0x09”, “0x0C”, and “0x11” are listed as numbers represented by the least significant 5 bits of the component tag. '0x01', '0x02', '0x03', '0x09', '0x0C', and '0x11' are 1/0 mode, 1/0 + 1/0 mode, 2/0 mode, and 3/2. It is a value indicating 1 mode, 5 / 2.1 mode, 3/3 / 3-5 / 2 / 3-3-0 / 0.2 mode. Here, ... / ~ means that the arrangement of the reproduction speakers based on the listening point is ... (voice channel) in the front and ~ (voice channel) in the rear. The numerical value after the decimal point indicates the number of audio channels for reproducing low-frequency audio. The audio channel means a channel that is a reproduction unit of audio, and is distinguished from a broadcast channel indicating a frequency band of broadcast waves. Therefore, the 1/0 mode indicates a single mono 1.0 channel. The 1/0 + 1/0 mode indicates dual mono 1.0 ch × 2. The 2/0 mode indicates stereo 2.0 ch. The 3 / 2.1 mode indicates surround 5.1ch. The 5 / 2.1 mode indicates surround 7.1ch. The 3/3 / 3-5 / 2 / 3- 3/0 / 0.2 mode indicates surround 22.2ch. 3/3/3/5/2 / 3- 3/0 / 0.2 mode 3/3/3 means that three speakers are placed on the front, side and back of the upper layer with reference to the listening point. Indicates that “5/2/3” indicates that the number of speakers is 5, 2, 3 on the front, side, and rear of the middle layer with respect to the listening point. 3/0 / 0.2 indicates that there are 5, 0, and 2 speaker arrangements on the lower layer front, side, and rear, respectively, based on the listening point. However, the two channels behind the lower layer are channels for reproducing low-frequency sound.

(受信装置の構成)
次に、本実施形態に係る受信装置30の構成について説明する。
図8は、本実施形態に係る受信装置30の構成を示すブロック図である。受信装置30は、受信部311、復号部312、分離部313、音声処理部314、拡声部315、映像復号部316、映像合成部317、表示部318、記憶部322、操作入力部323及び制御部331を含んで構成される。
(Receiver configuration)
Next, the configuration of the receiving device 30 according to this embodiment will be described.
FIG. 8 is a block diagram illustrating a configuration of the receiving device 30 according to the present embodiment. The receiving device 30 includes a receiving unit 311, a decoding unit 312, a separation unit 313, an audio processing unit 314, a loudspeaker 315, a video decoding unit 316, a video synthesis unit 317, a display unit 318, a storage unit 322, an operation input unit 323 and a control. A portion 331 is included.

受信部311は、送信装置10から放送波として放送伝送路20を介して伝送された放送信号を受信する。受信部311は、制御部331から入力された選局信号で指定される放送チャンネルの周波数帯域を特定する。受信部311は、放送波として受信した放送チャンネルの周波数帯域の放送信号をダウンコンバートしてベースバンドの放送信号を生成する。受信部311は、生成した放送信号を復号部312に出力する。
復号部312は、受信部311から入力された放送信号を、送信装置10の変調部14で用いられた変調方式に対応する復調方式を用いて復調することによって、多重化データを生成する。復号部312は、生成した多重化データを分離部313に出力する。
The receiving unit 311 receives a broadcast signal transmitted from the transmitting device 10 as a broadcast wave via the broadcast transmission path 20. The receiving unit 311 specifies the frequency band of the broadcast channel specified by the channel selection signal input from the control unit 331. The receiving unit 311 generates a baseband broadcast signal by down-converting a broadcast signal in the frequency band of the broadcast channel received as a broadcast wave. The receiving unit 311 outputs the generated broadcast signal to the decoding unit 312.
The decoding unit 312 generates multiplexed data by demodulating the broadcast signal input from the reception unit 311 using a demodulation method corresponding to the modulation method used by the modulation unit 14 of the transmission device 10. The decoding unit 312 outputs the generated multiplexed data to the separation unit 313.

分離部313は、復号部312から入力された多重化データから番組データ及び制御データに分離する。分離部313は、制御データから抽出されたMPTを参照して番組データからアセット毎の音声データと映像データを抽出する。分離部313は、抽出したアセット毎の音声データを音声処理部314に出力し、映像データを映像復号部316に出力する。分離部313は、分離した制御データを分離部313に出力する。
なお、分離部313は、MPTのアセット毎の記述子領域に記述されたMH−音声コンポーネント記述子のコンポーネントタグを参照してサラウンド音声のアセットについてダイアログ制御情報の有無を判定する。ダイアログ制御情報があると判定されるとき、分離部313は、そのアセットの音声データからダイアログ制御情報を抽出し、抽出したダイアログ制御情報を制御部331に出力する。
The separation unit 313 separates the multiplexed data input from the decoding unit 312 into program data and control data. The separation unit 313 refers to the MPT extracted from the control data, and extracts audio data and video data for each asset from the program data. The separation unit 313 outputs the extracted audio data for each asset to the audio processing unit 314 and outputs the video data to the video decoding unit 316. The separation unit 313 outputs the separated control data to the separation unit 313.
The separation unit 313 refers to the component tag of the MH-audio component descriptor described in the descriptor area for each asset of the MPT, and determines the presence or absence of dialog control information for the surround sound asset. When it is determined that there is dialog control information, the separation unit 313 extracts the dialog control information from the audio data of the asset, and outputs the extracted dialog control information to the control unit 331.

音声処理部314は、分離部313から入力された音声データを、符号化に用いられた符号化方式(例えば、MPEG−4 オーディオ)と対応する復号方式で復号し、元の音声データに復号する。復号した音声データは、各時刻における音声のレベルを示すデータである。複数のアセットの音声が提供される場合には、音声処理部314に複数のアセットの音声データが入力され、制御部331から音声選択信号が入力されることがある。音声選択信号は、複数のアセットのうち、いずれかのアセットの音声を指示する信号である。また、指示されたアセットがサラウンド音声であって、ダイアログ音声を含む場合には、音声選択信号はダイアログ音声のチャンネルをさらに指示することがある。つまり、アセットとダイアログ音声は、再生が指示される単位となる。以下の説明では、アセットとダイアログ音声のチャンネルを音声単位と総称することがある。   The audio processing unit 314 decodes the audio data input from the separation unit 313 using a decoding method corresponding to the encoding method (for example, MPEG-4 audio) used for encoding, and decodes the original audio data. . The decoded audio data is data indicating the audio level at each time. When audio of a plurality of assets is provided, audio data of a plurality of assets may be input to the audio processing unit 314 and an audio selection signal may be input from the control unit 331. The audio selection signal is a signal that indicates the audio of any one of the plurality of assets. If the instructed asset is surround sound and includes dialog sound, the sound selection signal may further indicate the channel of the dialog sound. That is, the asset and the dialog sound are units for instructing reproduction. In the following description, channels of assets and dialog audio may be collectively referred to as audio units.

音声処理部314は、複数のアセットの音声データが入力されるとき、その複数のアセットの音声データのうち、音声選択信号で有効に指定される音声単位に係る音声データを選択する。音声処理部314は、選択した音声データについて復号する。有効に指定されるとは、例えば、自部が処理能力を有する再生方式のいずれかが指定されることである。音声処理部314は、復号により得られる音声データを拡声部315に出力する。よって、複数のアセットの音声が提供される場合、音声選択信号で指定された音声単位の音声が拡声部315で再生される。なお、複数のアセットの音声データが入力されるとき、音声選択信号が入力されない場合には、音声処理部314は、所定の音声単位について復号により得られる音声データを拡声部315に出力する。   When audio data of a plurality of assets is input, the audio processing unit 314 selects audio data related to an audio unit that is effectively designated by an audio selection signal from the audio data of the plurality of assets. The audio processing unit 314 decodes the selected audio data. For example, “effectively designated” means that one of the reproduction methods that the processing unit has processing capability is designated. The voice processing unit 314 outputs the voice data obtained by decoding to the loudspeaker 315. Therefore, when the sound of a plurality of assets is provided, the sound in the sound unit designated by the sound selection signal is reproduced by the loudspeaker 315. Note that, when audio data of a plurality of assets is input, if an audio selection signal is not input, the audio processing unit 314 outputs audio data obtained by decoding for a predetermined audio unit to the sound amplifying unit 315.

拡声部315は、音声処理部314から入力された音声データに基づく音声を再生する。拡声部315は、例えば、スピーカを含んで構成される。拡声部315は、少なくとも所定のチャンネル数に相当する個数のスピーカを含んで構成される。所定のチャンネル数とは、音声処理部314において音声データを処理可能な再生方式で用いられるチャンネル数(例えば、5.1ch)の最大値に相当する。これにより、拡声部315は、音声処理部314から入力された複数のチャンネルの音声データによる音声を再生することができる。   The loudspeaker 315 reproduces voice based on the voice data input from the voice processor 314. The loudspeaker 315 includes, for example, a speaker. The loudspeaker 315 includes at least a number of speakers corresponding to a predetermined number of channels. The predetermined number of channels corresponds to the maximum value of the number of channels (for example, 5.1ch) used in the reproduction method capable of processing the audio data in the audio processing unit 314. As a result, the loudspeaker 315 can reproduce the sound based on the sound data of the plurality of channels input from the sound processor 314.

映像復号部316は、分離部313から入力された映像データを、符号化に用いられた符号化方式(例えば、HEVC)と対応する復号方式で入力された映像データを復号し、元の映像データを生成する。復号した映像データは、各時刻における映像(フレーム画像)を形成する信号値を示すデータである。映像復号部316は、復号した映像データを映像合成部317に出力する。
映像合成部317は、映像復号部316から入力された映像データと、制御部331から入力された各種の画面データとを合成し、表示用の映像を示す映像データを生成する。画面データには、例えば、ダイアログ音声や多言語の音声の提供開始を通知するための案内画面データ、言語や音声の種類などの設定項目を選択するための設定画面データ、等がある。
表示部318は、映像合成部317から入力された映像データに基づく映像を再生する。従って、表示部318には、受信した映像データに係る映像にGUI画面が重畳して表示される。表示部318は、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)を含んで構成される。
The video decoding unit 316 decodes the video data input from the separation unit 313 using the decoding method corresponding to the encoding method (for example, HEVC) used for encoding, and the original video data Is generated. The decoded video data is data indicating signal values forming a video (frame image) at each time. The video decoding unit 316 outputs the decoded video data to the video synthesis unit 317.
The video synthesizing unit 317 synthesizes the video data input from the video decoding unit 316 and various screen data input from the control unit 331 to generate video data indicating a video for display. The screen data includes, for example, guidance screen data for notifying the start of provision of dialog voices and multilingual voices, setting screen data for selecting setting items such as language and voice type, and the like.
The display unit 318 reproduces a video based on the video data input from the video synthesis unit 317. Therefore, on the display unit 318, the GUI screen is displayed superimposed on the video related to the received video data. The display unit 318 is configured to include, for example, a liquid crystal display (LCD: Liquid Crystal Display).

記憶部322は、各種のデータを記憶する。記憶部322は、記憶媒体、例えば、HDD(Hard−disk Drive)、フラッシュメモリ、ROM(Read−only Memory)、RAM(Random Access Memory)又はそれらの組み合わせを含んで構成される。
操作入力部323は、ユーザによる操作入力に応じた操作信号を取得し、取得した操作信号を制御部331に出力する。操作信号は、例えば、電源のオン/オフを示す信号、放送波のチャネルを示す信号、再生する音声の言語を示す信号などがある。操作入力部323は、例えば、操作ボタン、リモートコントローラ、携帯端末装置等の電子機器から操作信号を受信する入力インタフェース、等である。
The storage unit 322 stores various data. The storage unit 322 includes a storage medium, for example, an HDD (Hard-disk Drive), a flash memory, a ROM (Read-only Memory), a RAM (Random Access Memory), or a combination thereof.
The operation input unit 323 acquires an operation signal corresponding to the operation input by the user, and outputs the acquired operation signal to the control unit 331. The operation signal includes, for example, a signal indicating power on / off, a signal indicating a broadcast wave channel, and a signal indicating the language of audio to be reproduced. The operation input unit 323 is, for example, an input interface that receives an operation signal from an electronic device such as an operation button, a remote controller, or a mobile terminal device.

制御部331は、受信装置30の種々の動作を制御する。例えば、制御部331は、受信している番組の構成を示す構成情報としてMPTを解析して提供されるアセットの編成を解析する。番組において複数のアセットの音声データが提供される場合には、制御部331は、複数の属性の音声を含む音声データの編成を解析する。分離部313からダイアログ制御情報が入力される場合には、制御部331は、音声の編成の解析において、さらにダイアログ制御情報を構成情報の一部として用いる。また、制御部331は、操作入力部323からの操作信号により選択された属性を示す選択情報の履歴を生成し、音声の編成が変更されるとき選択情報が示す音声の属性のうち最後に選択された属性に係る音声単位を、他の属性に係る音声単位よりも優先して選択する。制御部331は、選択した音声単位を示す音声選択信号を生成し、生成した音声選択信号を音声処理部314に出力する。   The control unit 331 controls various operations of the receiving device 30. For example, the control unit 331 analyzes the organization of assets provided by analyzing the MPT as configuration information indicating the configuration of the received program. When audio data of a plurality of assets is provided in a program, the control unit 331 analyzes the organization of audio data including audio with a plurality of attributes. When dialog control information is input from the separation unit 313, the control unit 331 further uses the dialog control information as a part of the configuration information in the analysis of the speech organization. Further, the control unit 331 generates a history of selection information indicating the attribute selected by the operation signal from the operation input unit 323, and finally selects the audio attribute indicated by the selection information when the voice organization is changed. The audio unit related to the attribute is selected with priority over the audio units related to other attributes. The control unit 331 generates a sound selection signal indicating the selected sound unit, and outputs the generated sound selection signal to the sound processing unit 314.

(音声処理部の構成)
次に、本実施形態に係る音声処理部314の構成について説明する。図9は、本実施形態に係る音声処理部314の構成を示すブロック図である。音声処理部314は、各再生方式について復号処理を行う複数の復号処理部3142と、選択部3143とを含んで構成される。
(Configuration of audio processing unit)
Next, the configuration of the audio processing unit 314 according to the present embodiment will be described. FIG. 9 is a block diagram illustrating a configuration of the audio processing unit 314 according to the present embodiment. The audio processing unit 314 includes a plurality of decoding processing units 3142 that perform decoding processing for each reproduction method, and a selection unit 3143.

復号処理部3142は、アセット毎の音声データを、それぞれのアセットについて指定された再生方式で音声データを復号し、復号により得られる音声データを選択部3143に出力する。図9に示す個別の復号処理部3142−1、3142−2、…、等、のそれぞれは、個々のアセットの音声データを復号する。個々のアセットは、MPTを参照して特定される。1つの再生方式について複数のアセットにより、各アセットについてそれぞれ異なる言語または種類の音声データが入力された場合でも、復号処理部3142は、全体としてそれぞれの音声データを並行して復号することができる。   The decoding processing unit 3142 decodes the audio data for each asset by the reproduction method specified for each asset, and outputs the audio data obtained by the decoding to the selection unit 3143. Each of the individual decryption processing units 3142-1, 3142-2,... Shown in FIG. 9 decrypts the audio data of the individual asset. Individual assets are identified with reference to the MPT. Even when audio data of a different language or type is input for each asset by a plurality of assets for one playback method, the decoding processing unit 3142 can decode the audio data as a whole in parallel.

選択部3143は、それぞれの復号処理部3142から入力された音声データから、制御部331から入力された音声選択信号で指示された音声単位の音声データを選択する。音声単位のうち個々のアセットは、MPTを参照して特定され、ダイアログ音声を含むサラウンド音声を構成する個々のダイアログ音声のチャンネルは、ダイアログ制御情報を参照して特定される。選択部3143は、選択した音声データを拡声部315に出力する。   The selection unit 3143 selects audio data in units of audio indicated by the audio selection signal input from the control unit 331 from the audio data input from the respective decoding processing units 3142. Individual assets in the audio unit are specified with reference to the MPT, and channels of the individual dialog sounds constituting the surround sound including the dialog sound are specified with reference to the dialog control information. The selection unit 3143 outputs the selected audio data to the loudspeaker 315.

(制御部の構成)
次に、本実施形態に係る制御部331の構成について説明する。図10は、本実施形態に係る制御部331の構成を示すブロック図である。制御部331は、構成情報解析部332、再生制御部333、表示制御部334及び選局部335を含んで構成される。
(Configuration of control unit)
Next, the configuration of the control unit 331 according to the present embodiment will be described. FIG. 10 is a block diagram illustrating a configuration of the control unit 331 according to the present embodiment. The control unit 331 includes a configuration information analysis unit 332, a reproduction control unit 333, a display control unit 334, and a channel selection unit 335.

構成情報解析部332は、分離部313から入力される制御データから番組の構成を示す構成情報としてMPTを解析し、番組を構成するアセットを特定する。そして、構成情報解析部332は、MPTに共通のサイマルキャスト識別が記述され、種別が音声である複数のアセットが含まれているときサイマル音声が存在すると判定し、含まれていないときサイマル音声が存在しないと判定する。サイマル音声が存在する複数のアセット間では、通例、音声データの属性が異なる。構成情報解析部332は、MPTを参照してアセット毎の音声データの属性を特定する。また、構成情報解析部332は、MPTのアセット毎の記述子領域に記述されたコンポーネント種別に基づいて、ダイアログ制御情報が含まれるアセットの有無を判定する。構成情報解析部332は、ダイアログ制御情報が含まれるアセットをダイアログ音声の音声データを含むアセットと判定する。構成情報解析部332は、分離部313から入力されるダイアログ制御情報のうち、判定したアセットのダイアログ制御情報を取得する。構成情報解析部332は、取得したダイアログ制御情報を参照して、当該アセットに含まれるダイアログ音声のチャンネルと、そのチャンネル毎の音声の属性を特定する。構成情報解析部332は、番組を構成する音声単位と、音声単位毎の音声の属性を示す編成情報を生成する。即ち、編成情報には、ダイアログ音声が設定されているアセットについて、さらにダイアログ音声のチャンネルとチャンネル毎の音声の属性の情報が含まれることがある。構成情報解析部332は、生成した編成情報を再生制御部333と表示制御部334に出力する。   The configuration information analysis unit 332 analyzes the MPT as the configuration information indicating the configuration of the program from the control data input from the separation unit 313, and identifies assets that configure the program. Then, the configuration information analysis unit 332 determines that the simul sound is present when a common simulcast identification is described in the MPT and a plurality of assets whose type is sound is included, and the simul sound is not included when not included. Judge that it does not exist. Generally, the attributes of audio data are different among a plurality of assets in which simul sound exists. The configuration information analysis unit 332 specifies the attribute of the audio data for each asset with reference to the MPT. Further, the configuration information analysis unit 332 determines the presence / absence of an asset including dialog control information based on the component type described in the descriptor area for each asset of the MPT. The configuration information analysis unit 332 determines that an asset including dialog control information is an asset including dialog voice data. The configuration information analysis unit 332 acquires the dialog control information of the determined asset among the dialog control information input from the separation unit 313. The configuration information analysis unit 332 refers to the acquired dialog control information and identifies the dialog audio channel included in the asset and the audio attribute for each channel. The configuration information analysis unit 332 generates organization information indicating the audio units constituting the program and the audio attributes for each audio unit. That is, the organization information may further include information on the channel of the dialog audio and the audio attribute for each channel for the asset for which the dialog audio is set. The configuration information analysis unit 332 outputs the generated composition information to the reproduction control unit 333 and the display control unit 334.

構成情報解析部332は、制御データから放送チャンネル毎の番組の放送時間を示す構成情報としてMH−EITを抽出する。構成情報解析部332は、抽出したMH−EITを再生制御部333に出力する。   The configuration information analysis unit 332 extracts MH-EIT from the control data as configuration information indicating the broadcast time of the program for each broadcast channel. The configuration information analysis unit 332 outputs the extracted MH-EIT to the reproduction control unit 333.

再生制御部333は、構成情報解析部332から入力される編成情報が示す音声単位のいずれかを選択する。再生制御部333は、選択された音声単位を示す音声選択信号を生成する。再生制御部333は、生成した音声選択信号を音声処理部314に出力する。
例えば、再生制御部333は、操作入力部323から入力される操作信号で指示される属性を有する音声の音声単位を選択する場合がある。この場合、再生制御部333は、選択した音声単位を示す音声選択情報を生成し、生成した音声選択情報を音声処理部314に出力する。また、再生制御部333は、音声選択情報と、その音声単位に係る属性を示す属性情報とを対応付けてと記憶部322に順次記憶する。記憶部322に順次記憶された音声選択情報と属性情報の組により選択履歴が形成される。
The reproduction control unit 333 selects one of the audio units indicated by the organization information input from the configuration information analysis unit 332. The reproduction control unit 333 generates a sound selection signal indicating the selected sound unit. The reproduction control unit 333 outputs the generated audio selection signal to the audio processing unit 314.
For example, the playback control unit 333 may select a sound unit of sound having an attribute indicated by an operation signal input from the operation input unit 323. In this case, the reproduction control unit 333 generates audio selection information indicating the selected audio unit, and outputs the generated audio selection information to the audio processing unit 314. In addition, the reproduction control unit 333 sequentially stores the audio selection information and attribute information indicating the attribute relating to the audio unit in the storage unit 322 in association with each other. A selection history is formed by a set of voice selection information and attribute information sequentially stored in the storage unit 322.

再生制御部333は、構成情報解析部332から入力された編成情報に基づいて音声の編成が変更されたか否かを判定する。変更された場合、再生制御部333は、選択履歴から読み出した音声選択情報のうち最後に選択された音声単位を示す音声選択情報に対応する属性情報が示す属性に係る音声単位を、他の属性に係る音声単位よりも優先して選択する。従って、最後に選択された属性を有する音声が、他の音声よりも優先して選択される。選択履歴が形成されていない場合には、再生制御部333は、設定メニューで設定項目として表される属性のうち、操作入力部323からの操作信号で指定された属性を有する音声単位を選択してもよい。ここで、記憶部322には、設定メニューで設定項目として表される属性の情報をメニュー設定情報の一部として予め記憶しておいてもよい。また、メニュー設定情報には、後述する優先設定情報が含まれてもよい。   The reproduction control unit 333 determines whether or not the audio composition has been changed based on the composition information input from the configuration information analysis unit 332. When changed, the reproduction control unit 333 changes the audio unit related to the attribute indicated by the attribute information corresponding to the audio selection information indicating the audio unit selected last from the audio selection information read from the selection history to other attributes. Is selected with priority over the audio unit. Therefore, the voice having the attribute selected last is selected with priority over other voices. When the selection history is not formed, the playback control unit 333 selects a sound unit having an attribute designated by the operation signal from the operation input unit 323 among the attributes represented as setting items in the setting menu. May be. Here, in the storage unit 322, attribute information represented as a setting item in the setting menu may be stored in advance as part of the menu setting information. The menu setting information may include priority setting information described later.

なお、選択履歴も優先設定情報も設定されていない場合には、再生制御部333は、所定の優先順位に従って音声単位を選択してもよい。アセット間の優先順位として、再生方式毎のチャンネル数の降順、言語の順序、音声の種類の順序のいずれか、又は組み合わせが用いられてもよい。その場合、例えば、言語がチャンネル数よりも優先され、チャンネル数が音声の種類よりも優先されてもよい。各アセットにコンポーネントタグの番号が、かかる順位に従って割り当てられる場合には、アセット間の優先順位として、アセット毎に設定されたコンポーネントタグの番号が用いられてもよい。ダイアログ音声の優先順位として、言語の順序、音声の種類の順序、チャンネル(スピーカの配置)の順序のいずれか又は組み合わせが用いられてもよい。その場合、例えば、言語が音声の種類よりも優先され、音声の種類がチャンネルよりも優先されてもよい。再生制御部333は、選択した音声単位を示す音声選択情報を音声処理部314に出力する。   If neither the selection history nor the priority setting information is set, the reproduction control unit 333 may select the audio unit according to a predetermined priority order. As the priority order between assets, any one or a combination of descending order of the number of channels for each playback method, order of languages, order of audio types may be used. In that case, for example, the language may have priority over the number of channels, and the number of channels may have priority over the type of audio. When the component tag number is assigned to each asset according to the order, the component tag number set for each asset may be used as the priority order between assets. As the order of priority of dialog voices, any one or combination of language order, voice type order, and channel (speaker placement) order may be used. In that case, for example, the language may be prioritized over the audio type, and the audio type may be prioritized over the channel. The reproduction control unit 333 outputs audio selection information indicating the selected audio unit to the audio processing unit 314.

再生制御部333は、構成情報解析部332から入力されるMH−EITに基づいて時間経過に応じた番組の変化を検出する。また、再生制御部333は、選局部335から入力される選局信号が示す放送チャンネルの変化に応じて番組の変化を検出する。再生制御部333は、番組の変化を検出するとき記憶部322に記憶した選択履歴を消去してもよい。また、再生制御部333は、選局部335からの選局信号が示す放送チャンネルの変化を検出するとき記憶部322に記憶した選択履歴を消去してもよい。   The playback control unit 333 detects a change in the program over time based on the MH-EIT input from the configuration information analysis unit 332. Further, the reproduction control unit 333 detects a change in the program according to a change in the broadcast channel indicated by the channel selection signal input from the channel selection unit 335. The reproduction control unit 333 may delete the selection history stored in the storage unit 322 when detecting a change in the program. Further, the reproduction control unit 333 may erase the selection history stored in the storage unit 322 when detecting a change in the broadcast channel indicated by the channel selection signal from the channel selection unit 335.

表示制御部334は、受信装置30の機能に係る各種の画面の表示を制御する。例えば、表示制御部334は、構成情報解析部332から入力される編成情報に基づいて、複数の言語に係る音声のアセットの提供が開始されると判定するとき、予め記憶した多言語放送案内画面データを記憶部322から読み出す。多言語放送案内画面データは、番組において複数の言語の音声が提供されることを通知する多言語放送案内画面を表すデータである。表示制御部334は、読み出した多言語放送案内画面データを所定時間(例えば、15秒間)映像合成部317に出力することにより、表示部318に多言語放送案内画面を表示させる。また、表示制御部334は、当該編成情報に基づいて、ダイアログ音声を含むアセットの提供が開始されると判定するとき、予め記憶したダイアログ音声案内画面データを記憶部322から読み出す。ダイアログ音声案内画面データは、番組においてダイアログ音声が提供されることを通知するダイアログ音声案内画面を表すデータである。表示制御部334は、読み出したダイアログ音声案内画面データを所定時間、映像合成部317に出力することにより、表示部318にダイアログ音声案内画面を表示させる。表示制御部334は、初回の動作開始時又は操作入力部323から入力される操作信号が言語や音声の種類などの設定項目の設定を指示する場合、予め記憶した設定画面データを記憶部322から読み出す。表示制御部334は、読み出した設定画面データを映像合成部317に出力することにより、表示部318に設定画面を表示させる。制御部331は、設定画面が表示されているとき、操作入力部323からの操作信号が指示する設定項目を示す設定情報を生成する。制御部331は、生成した設定情報を記憶部322に記憶する。   The display control unit 334 controls display of various screens related to the function of the receiving device 30. For example, when the display control unit 334 determines that provision of audio assets related to a plurality of languages is started based on the composition information input from the configuration information analysis unit 332, a multilingual broadcast guidance screen stored in advance is stored. Data is read from the storage unit 322. The multilingual broadcast guide screen data is data representing a multilingual broadcast guide screen for notifying that a plurality of languages of audio are provided in a program. The display control unit 334 causes the display unit 318 to display the multilingual broadcast guide screen by outputting the read multilingual broadcast guide screen data to the video composition unit 317 for a predetermined time (for example, 15 seconds). Further, when the display control unit 334 determines that provision of an asset including a dialog voice is started based on the composition information, the display control unit 334 reads out the dialog voice guidance screen data stored in advance from the storage unit 322. Dialog voice guidance screen data is data representing a dialog voice guidance screen for notifying that a dialog voice is provided in a program. The display control unit 334 causes the display unit 318 to display the dialog voice guidance screen by outputting the read dialog voice guidance screen data to the video synthesis unit 317 for a predetermined time. The display control unit 334 displays pre-stored setting screen data from the storage unit 322 when the operation is input for the first time or when the operation signal input from the operation input unit 323 instructs setting of setting items such as language and voice type. read out. The display control unit 334 causes the display unit 318 to display the setting screen by outputting the read setting screen data to the video composition unit 317. When the setting screen is displayed, the control unit 331 generates setting information indicating setting items indicated by the operation signal from the operation input unit 323. The control unit 331 stores the generated setting information in the storage unit 322.

選局部335は、操作入力部323から放送チャンネルを示す操作信号を検出する。選局部335は、検出した操作信号で表される放送チャンネルを示す選局信号を生成し、生成した選局信号を再生制御部333と受信部311に出力する。   The channel selection unit 335 detects an operation signal indicating a broadcast channel from the operation input unit 323. The channel selection unit 335 generates a channel selection signal indicating a broadcast channel represented by the detected operation signal, and outputs the generated channel selection signal to the reproduction control unit 333 and the reception unit 311.

(再生処理)
次に、本実施形態に係る再生処理について説明する。図11は、本実施形態に係る再生処理を示すフローチャートである。
(ステップS101)分離部313は、送信装置10から受信した放送信号に基づく多重化データから番組データと制御データに分離する。その後、ステップS102に進む。
(ステップS102)構成情報解析部332は、制御データから番組の構成を示す構成情報から、番組で提供される音声の編成を示す編成情報を取得する。再生制御部333は、音声の編成が変化したか否かを判定する。変化したと判定された場合(ステップS102 YES)、ステップS103に進む。変化していないと判定する場合(ステップS102 NO)、ステップS101に戻る。
(Reproduction processing)
Next, the reproduction process according to the present embodiment will be described. FIG. 11 is a flowchart showing the reproduction processing according to the present embodiment.
(Step S101) The separation unit 313 separates the multiplexed data based on the broadcast signal received from the transmission device 10 into program data and control data. Thereafter, the process proceeds to step S102.
(Step S102) The configuration information analysis unit 332 acquires organization information indicating the organization of audio provided by the program from the configuration information indicating the configuration of the program from the control data. The playback control unit 333 determines whether or not the voice organization has changed. If it is determined that the change has occurred (YES in step S102), the process proceeds to step S103. When it determines with having not changed (step S102 NO), it returns to step S101.

(ステップS103)再生制御部333は、選択履歴において最後に選択された属性(例えば、チャンネル状態、言語など)を有する音声単位を示す音声選択情報が記録されているか否かを判定する。ここで、「選択された」とは、ユーザの操作に応じて生成された操作信号に基づいて定めることを意味する。記録されていると判定された場合(ステップS103 YES)、ステップS103aに進む。記録されていないと判定された場合(ステップS103 NO)、ステップS105に進む。
(ステップS103a)再生制御部333は、記録された音声選択情報が示す音声単位の属性として、同一の属性(つまり、コンポーネント種別と言語)を有する音声単位が、その時点で受信している番組データに存在するか否かを判定する。存在すると判定された場合(ステップS103a YES)、ステップS104に進む。存在しないと判定された場合(ステップS103a NO)、ステップS105に進む。
(Step S103) The reproduction control unit 333 determines whether or not audio selection information indicating an audio unit having an attribute (for example, channel state, language, etc.) selected last in the selection history is recorded. Here, “selected” means to be determined based on an operation signal generated in response to a user operation. If it is determined that it is recorded (YES in step S103), the process proceeds to step S103a. If it is determined that the data has not been recorded (NO in step S103), the process proceeds to step S105.
(Step S103a) The reproduction control unit 333 receives the program data received at that time as the audio unit having the same attribute (that is, component type and language) as the audio unit attribute indicated by the recorded audio selection information. It is determined whether or not it exists. If it is determined that it exists (YES in step S103a), the process proceeds to step S104. If it is determined that it does not exist (NO in step S103a), the process proceeds to step S105.

(ステップS104)再生制御部333は、同一と判定された最後に選択された属性として同一コンポーネント種別と言語を有する音声単位をその時点で受信している番組データから選択する。その後、ステップS110に進む。 (Step S104) The playback control unit 333 selects from the program data received at that time an audio unit having the same component type and language as the last selected attribute determined to be the same. Then, it progresses to step S110.

(ステップS105)再生制御部333は、記憶部322から読み出した優先言語設定情報が示す言語と同一の言語の音声単位が、その時点で受信している番組データに含まれるか否かを判定する。含まれると判定されるとき(ステップS105 YES)、ステップS106に進む。含まれないと判定されるとき(ステップS105 NO)、ステップS109に進む。 (Step S <b> 105) The reproduction control unit 333 determines whether or not the audio unit of the same language as the language indicated by the priority language setting information read from the storage unit 322 is included in the program data received at that time. . When it is determined that it is included (YES in step S105), the process proceeds to step S106. When it is determined that it is not included (NO in step S105), the process proceeds to step S109.

(ステップS106)再生制御部333は、優先言語設定情報が示す言語と同一の言語の音声単位が、直前に選択された音声を再生しているアセットと同じアセットに存在する(もしくは、同じアセットである)か否かを判定する。存在すると判定されるとき(ステップS106 YES)、ステップS107に進む。存在しないと判定されるとき(ステップS106 NO)、ステップS108に進む。 (Step S106) The playback control unit 333 has an audio unit in the same language as the language indicated by the priority language setting information in the same asset as the asset that is playing the audio selected immediately before (or the same asset). It is determined whether or not there is. When it is determined that it exists (YES in step S106), the process proceeds to step S107. When it is determined that it does not exist (NO in step S106), the process proceeds to step S108.

(ステップS107)再生制御部333は、同じアセットに存在する、優先言語設定情報が示す言語と同一の言語の音声単位(もしくは、そのアセット自体)を選択する。その後、ステップS110に進む。
(ステップS108)再生制御部333は、他のアセットに存在する、優先言語設定情報が示す言語と同一の言語の音声単位(もしくは、そのアセット自体)を選択する。その後、ステップS110に進む。
(ステップS109)再生制御部333は、所定の優先順位としてコンポーネントタグ値が小さいアセットほど優先して選択する。コンポーネントタグ値は、例えば、チャンネル数が多い再生方式ほど小さい。同一の再生方式では、例えば、音声の種類が主音声であるアセットの方が、それ以外の音声であるアセットよりもコンポーネントタグ値が小さい。同一のチャンネル数及び音声の種類では、日本語、英語、仏語の順にコンポーネントタグ値が大きくなる。また、選択の対象となる音声単位にダイアログ音声のチャンネルが複数個含まれる場合には、再生制御部333は、所定のチャンネルの順位又はチャンネル毎の音声の種類や言語の順位でダイアログ音声を選択してもよい。サラウンド5.1chの場合、所定のチャンネルの順位は、例えば、前方中央、前方左、前方右、後方左、後方右の順である。言語の順位は、例えば、上述した日本語、英語、仏語の順である。その後、ステップS110に進む。
(Step S107) The playback control unit 333 selects a voice unit (or the asset itself) in the same asset and in the same language as the language indicated by the priority language setting information. Then, it progresses to step S110.
(Step S108) The playback control unit 333 selects a sound unit (or the asset itself) in the same language as the language indicated by the priority language setting information, which exists in another asset. Then, it progresses to step S110.
(Step S109) The playback control unit 333 preferentially selects an asset having a smaller component tag value as a predetermined priority. For example, the component tag value is smaller as the playback method has more channels. In the same playback method, for example, the component tag value of an asset whose audio type is the main audio is smaller than an asset whose audio type is other than that. With the same number of channels and audio types, component tag values increase in the order of Japanese, English, and French. When a plurality of dialog sound channels are included in the sound unit to be selected, the playback control unit 333 selects the dialog sound according to the order of a predetermined channel or the order of sound type or language for each channel. May be. In the case of surround 5.1 ch, the order of predetermined channels is, for example, the order of front center, front left, front right, rear left, and rear right. The order of languages is, for example, the order of Japanese, English, and French described above. Then, it progresses to step S110.

(ステップS110)再生制御部333は、選択した属性に係る音声単位に係る音声データを音声処理部314に出力することにより、選択した属性を有する音声を拡声部315に再生させる。その後、図11に示す処理を終了する。
なお、ステップS108において、他のアセットに存在する音声単位(もしくは、他のアセット自体)が複数個存在する場合には、再生制御部333は、それらの音声単位のいずれかを、ステップS109と同様に所定のアセットならびにチャンネルの優先順位に従って選択してもよい。
また、優先言語設定情報には複数の言語が設定されている場合がある。そのため、ステップS107、S108において、同一の言語の音声単位として複数の音声単位が選択されることがある。その場合には、再生制御部333は、優先言語設定情報に設定されている優先順位が高い言語に係る音声単位ほど優先して選択してもよい。
(Step S110) The reproduction control unit 333 outputs the audio data related to the audio unit related to the selected attribute to the audio processing unit 314, thereby causing the loudspeaker 315 to reproduce the audio having the selected attribute. Then, the process shown in FIG. 11 is complete | finished.
Note that in step S108, when there are a plurality of audio units (or other assets themselves) existing in other assets, the playback control unit 333 selects one of those audio units as in step S109. May be selected according to a predetermined asset and channel priority.
In some cases, a plurality of languages are set in the priority language setting information. Therefore, in steps S107 and S108, a plurality of audio units may be selected as audio units of the same language. In that case, the reproduction control unit 333 may preferentially select a voice unit related to a language having a higher priority set in the priority language setting information.

(音声の選択例)
次に、本実施形態に係る受信装置30による音声の選択例について説明する。以下に説明する選択例では、優先言語情報が示す第1言語が日本語、第2言語が英語、第3言語が仏語、であることを前提とする。また、操作入力部323から入力される操作信号により指示される音声設定は、予め記憶部322に記憶されたメニュー設定情報に含まれる優先言語情報で指示される音声設定よりも優先される。また、選択されていた音声単位が、音声単位の編成の切り替えに応じて失われるとき、再生制御部333は、優先言語情報が示す言語毎の優先順位に従って音声単位を選択する。なお、リモートコントローラの音声切替ボタンの押下に伴って生じた操作信号に基づいて言語が選択された場合、再生制御部333は、その言語の音声に係る音声単位を選択する。また、操作信号で指定される音声の言語に係る音声単位がない場合には、再生制御部333は、優先言語情報が示す優先度(メニューの優先度)に従って選択した言語の音声を含む音声単位を選択する。操作入力部323において音声切替を指示するための音声切替ボタンが未使用である場合においても、再生制御部333は、優先言語情報が示す優先度に従って選択した言語を含む音声単位を選択してもよい。
(Example of audio selection)
Next, an example of audio selection by the receiving device 30 according to the present embodiment will be described. In the selection example described below, it is assumed that the first language indicated by the priority language information is Japanese, the second language is English, and the third language is French. In addition, the voice setting instructed by the operation signal input from the operation input unit 323 has priority over the voice setting instructed by the priority language information included in the menu setting information stored in the storage unit 322 in advance. In addition, when the selected voice unit is lost in accordance with switching of the organization of the voice unit, the reproduction control unit 333 selects the voice unit according to the priority order for each language indicated by the priority language information. When a language is selected based on an operation signal generated when the voice switch button of the remote controller is pressed, the playback control unit 333 selects a voice unit related to the voice of that language. When there is no audio unit related to the language of the audio specified by the operation signal, the playback control unit 333 includes the audio unit including the audio of the language selected according to the priority (menu priority) indicated by the priority language information. Select. Even when the voice switching button for instructing voice switching is not used in the operation input unit 323, the playback control unit 333 may select the voice unit including the language selected according to the priority indicated by the priority language information. Good.

また、その時点で選択されたアセットにおいて、選択した言語の音声に係るチャンネルが含まれない場合には、再生制御部333は、選択した言語と同一の言語の音声を含む他の音声単位を検索する。再生制御部333は、同一の言語の音声単位が複数ある場合には、例えば、コンポーネントタグ値の小さいアセットほど優先して選択し、チャンネル番号が小さいチャンネルほど優先して選択してもよい。また、以下に説明する例では、同一の放送チャンネルで放送されるアセット毎のコンポーネントタグ値は、属性(言語、コンポーネント種別、などのセット)が共通であるアセットについて共通の値が設定される。つまり、同一の放送チャンネルで番組の切り替わりに関わらず、放送されるアセットの属性が同一で場合には、そのコンポーネントタグ値が変化しない。コンポーネントタグ値は、チャンネル数が多いアセットほど大きく、同一のチャンネル数のアセットについては、音声の種類として主音声(第1音声)よりも副音声(第2音声)のアセットのほうが大きくてもよい。ダイアログ音声のチャンネル番号は、例えば、main、add1、add2のそれぞれについて、順に1、2、3と大きくなるように設定されてもよい。これにより、mainがadd1よりも、add1がadd2よりも優先される。   Also, in the asset selected at that time, when the channel related to the audio of the selected language is not included, the playback control unit 333 searches for another audio unit including the audio of the same language as the selected language. To do. When there are a plurality of audio units in the same language, the playback control unit 333 may preferentially select an asset with a smaller component tag value, and preferentially select a channel with a smaller channel number. In the example described below, the component tag value for each asset broadcast on the same broadcast channel is set to a common value for assets having common attributes (a set of language, component type, etc.). That is, regardless of the switching of programs on the same broadcast channel, if the attribute of the asset being broadcast is the same, the component tag value does not change. The component tag value is larger for an asset having a larger number of channels. For an asset having the same number of channels, the sub audio (second audio) asset may be larger than the main audio (first audio) as the audio type. . The channel number of the dialog voice may be set to increase in order of 1, 2, and 3, for each of main, add1, and add2, for example. As a result, “main” is given priority over “add1” over “add1”.

図12は、本実施形態に係る受信装置30による音声の選択例を示す図である。図12に示す例では、番組の切り替えに応じて音声データの編成がar01−1、ar01−2、ar01−3と切り替わる。編成ar01−1、ar−01−2、ar01−3は、いずれも音声の再生方式がサラウンド5.1chであるアセットと、ステレオ2.0chであるアセットを含む。但し、編成ar01−1では日本語、英語及び仏語の音声が提供されるのに対し、編成ar01−2では仏語の音声は提供されなくなる。そして、編成ar01−3では、再度仏語の音声が提供される。仏語の音声は、編成ar01−1、ar01−3のそれぞれにおいて、サラウンド5.1chのダイアログ音声のチャンネル(add2)とステレオ2.0chのアセットで提供される。編成ar01−1において選択されたサラウンド5.1chのダイアログ音声のチャンネル(add2)は、編成ar01−2に切り替わると失われる。このとき、再生制御部333は、優先言語設定情報が示す言語として、操作により最後に選択された日本語の音声のチャンネルが、直前まで選択されていたサラウンド5.1chのアセットに存在すると判定する。再生制御部333は、その日本語の音声のチャンネルとしてダイアログ音声のチャンネル(main)を選択する。その後、編成ar01−3に切り替わるとき、サラウンド5.1chのアセットに仏語のダイアログ音声のチャンネルが再度含まれる。このとき、再生制御部333は、選択履歴に記録された、最後に選択された属性として仏語の音声のチャンネル(add2)を選択する。   FIG. 12 is a diagram illustrating an example of audio selection by the receiving device 30 according to the present embodiment. In the example shown in FIG. 12, the organization of audio data is switched to ar01-1, ar01-2, ar01-3 in accordance with program switching. Each of the formations ar01-1, ar-01-2, and ar01-3 includes an asset whose sound reproduction method is surround 5.1ch and an asset whose stereo is 2.0ch. However, while the organization ar01-1 provides Japanese, English, and French speech, the organization ar01-2 does not provide French speech. And in composition ar01-3, the French voice is provided again. French audio is provided in the channels 5.11 and ar01-3 as surround 5.1ch dialog audio channels (add2) and stereo 2.0ch assets. The surround 5.1ch dialog audio channel (add2) selected in the organization ar01-1 is lost when the organization ar01-2 is switched to. At this time, the playback control unit 333 determines that, as the language indicated by the priority language setting information, the channel of the Japanese audio selected last by the operation exists in the surround 5.1ch asset selected until immediately before. . The playback control unit 333 selects a dialog audio channel (main) as the Japanese audio channel. Thereafter, when switching to the organization ar01-3, the channel of the French dialog voice is included again in the assets of surround 5.1ch. At this time, the playback control unit 333 selects the French audio channel (add2) as the last selected attribute recorded in the selection history.

なお、図12において、符号0x10、0x18、0x19、0x1Aは、それぞれのアセットを示すコンポーネントタグである。図12に示す例では、チャンネル数が多い再生方式に係るアセットほど、コンポーネントタグ値が小さい。また、言語間では、日本語、英語、仏語の順にコンポーネントタグ値が大きくなる。これらのコンポーネントタグ値は、アセットの属性に応じて一律に与えられるので、操作信号や優先設定情報を取得できない場合には、再生制御部333は、コンポーネントタグ値が小さいアセットほど優先してアセットを選択してもよい。
図13は、本実施形態に係る受信装置30による音声の他の選択例を示す図である。図13に示す例では、番組の切り替えに応じて音声データの編成がar02−1、ar02−2、ar02−3と切り替わる。編成ar02−1、ar02−2は、いずれも音声の再生方式がサラウンド5.1chであるアセットと、ステレオ2.0chであるアセットを含む。編成ar02−1において選択されたサラウンド5.1chのダイアログ音声のチャンネル(add1)は、編成ar01−2に切り替わっても維持され、そのまま選択される。但し、編成ar02−3ではサラウンド5.1chであるアセットが失われる。このとき、再生制御部333は、選択履歴に記録された、最後に選択された属性として英語の音声が、提供される音声データのうちステレオ2.0chのアセットに存在すると判定する。再生制御部333は、その英語の音声に係るステレオ2.0chのアセットを選択する。
In FIG. 12, reference numerals 0x10, 0x18, 0x19, and 0x1A are component tags indicating the respective assets. In the example shown in FIG. 12, the component tag value is smaller for an asset related to a playback method having a larger number of channels. In addition, between the languages, the component tag values increase in the order of Japanese, English, and French. Since these component tag values are uniformly given according to the attribute of the asset, when the operation signal and priority setting information cannot be acquired, the playback control unit 333 gives priority to the asset with the smaller component tag value. You may choose.
FIG. 13 is a diagram illustrating another example of selection of audio by the reception device 30 according to the present embodiment. In the example shown in FIG. 13, the organization of the audio data is switched to ar02-1, ar02-2, ar02-3 in accordance with the program switching. Each of the formations ar02-1 and ar02-2 includes an asset whose sound reproduction method is surround 5.1ch and an asset whose stereo is 2.0ch. The surround 5.1ch dialog audio channel (add1) selected in the organization ar02-1 is maintained even if the channel is switched to the organization ar01-2, and is selected as it is. However, in the formation ar02-3, an asset which is surround 5.1ch is lost. At this time, the playback control unit 333 determines that English audio as the last selected attribute recorded in the selection history exists in the stereo 2.0ch asset in the provided audio data. The playback control unit 333 selects a stereo 2.0ch asset related to the English sound.

図14は、本実施形態に係る受信装置30による音声の他の選択例を示す図である。図14に示す例では、番組の切り替えに応じて音声データの編成がar03−1、ar03−2、ar03−3と切り替わる。編成ar03−1、ar03−2は、いずれも音声の再生方式がサラウンド5.1chであるアセットと、ステレオ2.0chであるアセットを含む。編成ar03−1において選択されたサラウンド5.1chのダイアログ音声のチャンネル(add2)は、編成ar03−2に切り替わると失われる。このとき、再生制御部333は、優先言語設定情報が示す第1優先言語として、日本語のダイアログ音声のチャンネルが、直前まで選択されたサラウンド5.1chのアセットに存在すると判定する。再生制御部333は、その日本語の音声に係るダイアログ音声のチャンネル(main)を選択する。編成ar03−3ではサラウンド5.1chであるアセットが失われる。このとき、再生制御部333は、選択履歴に記録された、最後に選択された属性として仏語の音声が、提供される音声データのうちステレオ2.0chのアセットに存在すると判定する。再生制御部333は、その仏語の音声に係るステレオ2.0chのアセットを選択する。   FIG. 14 is a diagram illustrating another example of selection of audio by the reception device 30 according to the present embodiment. In the example shown in FIG. 14, the organization of audio data is switched to ar03-1, ar03-2, ar03-3 in accordance with the switching of programs. The formations ar03-1 and ar03-2 each include an asset whose sound reproduction method is surround 5.1ch and an asset whose stereo is 2.0ch. The surround 5.1ch dialog audio channel (add2) selected in the organization ar03-1 is lost when the organization ar03-2 is switched to. At this time, the playback control unit 333 determines that the channel of the Japanese dialog sound exists as the first priority language indicated by the priority language setting information in the surround 5.1ch asset selected until immediately before. The reproduction control unit 333 selects a dialog audio channel related to the Japanese audio. In composition ar03-3, an asset that is surround 5.1ch is lost. At this time, the playback control unit 333 determines that French sound as the last selected attribute recorded in the selection history exists in the stereo 2.0ch asset of the provided sound data. The playback control unit 333 selects a stereo 2.0ch asset related to the French voice.

図15は、本実施形態に係る受信装置30による音声の他の選択例を示す図である。図15に示す例では、番組の切り替えに応じて音声データの編成がar04−1、ar04−2、ar04−3と切り替わる。編成ar04−1、ar04−2は、いずれも音声の再生方式がステレオ2.0chであるアセットを含む。編成ar04−1において選択された仏語の音声に係るステレオ2.0chのアセットは、編成ar04−2に切り替わると失われる。このとき、再生制御部333は、優先言語設定情報が示す言語として、日本語のダイアログ音声のアセットが、直前まで選択されたアセットと再生方式が共通であるステレオ2.0chのアセットに存在すると判定する。再生制御部333は、その日本語の音声に係るステレオ2.0chのアセットを選択する。編成ar04−3ではサラウンド5.1chのアセットが失われる代わりに、仏語の音声に係るステレオ2.0chのアセットが再度含まれる。このとき、再生制御部333は、選択履歴に記録された、最後に選択された属性として仏語の音声が、提供される音声データのうちステレオ2.0chのアセットに存在すると判定する。再生制御部333は、その仏語の音声に係るステレオ2.0chのアセットを選択する。   FIG. 15 is a diagram illustrating another example of selection of audio by the reception device 30 according to the present embodiment. In the example shown in FIG. 15, the organization of the audio data is switched to ar04-1, ar04-2, ar04-3 in accordance with the program switching. The formations ar04-1 and ar04-2 both include assets whose audio playback method is stereo 2.0ch. The stereo 2.0ch asset related to the French voice selected in the organization ar04-1 is lost when the asset is switched to the organization ar04-2. At this time, the playback control unit 333 determines that, as the language indicated by the priority language setting information, a Japanese dialog sound asset exists in a stereo 2.0ch asset that has the same playback method as the asset selected immediately before. To do. The playback control unit 333 selects a stereo 2.0ch asset related to the Japanese voice. In the composition ar04-3, instead of losing the surround 5.1ch asset, the stereo 2.0ch asset related to the French voice is included again. At this time, the playback control unit 333 determines that French sound as the last selected attribute recorded in the selection history exists in the stereo 2.0ch asset of the provided sound data. The playback control unit 333 selects a stereo 2.0ch asset related to the French voice.

図16は、本実施形態に係る受信装置30による音声の他の選択例を示す図である。図16に示す例では、番組の切り替えに応じて音声データの編成がar05−1、ar05−2、ar05−3と切り替わる。編成ar05−1、ar05−2、ar05−3は、いずれも音声の再生方式がサラウンド5.1chであるアセットが2個と、ステレオ2.0chであるアセットを1個含む。サラウンド5.1chの2個のアセットの一方のアセットについて、音声の種類は第1音声であり、他方のアセットについて、音声の種類は第2音声である。編成ar05−1における第2音声のアセットにおいて選択された仏語のダイアログ音声のチャンネル(add2)は、編成ar05−2に切り替わると失われる。このとき、再生制御部333は、優先言語設定情報が示す言語として、日本語のダイアログ音声のチャンネルが、直前まで選択されたアセットに存在すると判定する。再生制御部333は、その日本語の音声に係るダイアログ音声のチャンネル(main)を選択する。編成ar05−3では、そのアセットにおいて仏語のダイアログ音声のチャンネル(add2)が再度含まれる。このとき、再生制御部333は、選択履歴に記録された、最後に選択された属性として仏語のダイアログ音声のチャンネル(add2)が、提供される音声データのうち直前まで選択されたアセットに存在すると判定する。再生制御部333は、そのアセットにおける仏語のダイアログ音声のチャンネル(add2)を選択する。   FIG. 16 is a diagram illustrating another example of audio selection by the reception device 30 according to the present embodiment. In the example shown in FIG. 16, the organization of audio data is switched to ar05-1, ar05-2, ar05-3 in accordance with program switching. Each of the formations ar05-1, ar05-2, and ar05-3 includes two assets whose sound reproduction method is surround 5.1ch and one asset whose stereo is 2.0ch. For one asset of the two assets of surround 5.1ch, the audio type is the first audio, and for the other asset, the audio type is the second audio. The French dialog audio channel (add2) selected in the second audio asset in organization ar05-1 is lost when switching to organization ar05-2. At this time, the playback control unit 333 determines that the channel of the Japanese dialog sound exists in the selected asset until just before as the language indicated by the priority language setting information. The reproduction control unit 333 selects a dialog audio channel related to the Japanese audio. In composition ar05-3, the channel (add2) of the French dialog voice is included again in the asset. At this time, the reproduction control unit 333 determines that the French dialog voice channel (add2) recorded in the selection history as the last selected attribute exists in the asset selected immediately before the provided voice data. judge. The playback control unit 333 selects a French dialog voice channel (add2) in the asset.

図17は、本実施形態に係る受信装置30による音声の他の選択例を示す図である。図17に示す例では、番組の切り替えに応じて音声データの編成がar06−1、ar06−2、ar06−3と切り替わる。編成ar06−1、ar06−2は、いずれも音声の再生方式がサラウンド5.1chであるアセットが2個と、ステレオ2.0chであるアセットを1個含む。編成ar06−1の再生方式がサラウンド5.1chである第2音声のアセットにおいて選択された仏語のダイアログ音声のチャンネル(add2)は、編成ar06−2に切り替わると失われる。このとき、再生制御部333は、優先言語設定情報が示す最優先の言語として、日本語のダイアログ音声のチャンネルが、直前まで選択されたアセットに存在すると判定する。再生制御部333は、その日本語の音声に係るダイアログ音声のチャンネル(main)を選択する。編成ar06−3に切り替わると、選択されたダイアログ音声のチャンネルを含むアセットが失われる。このとき、再生制御部333は、直前まで選択されたアセットと同一の再生方式であるサラウンド5.1chであって音声の種類が第1音声であるアセットに、選択履歴に記録された、最後に選択された属性として仏語のダイアログ音声のチャンネル(add2)が存在すると判定する。再生制御部333は、そのアセットにおける仏語のダイアログ音声のチャンネル(add2)を選択する。   FIG. 17 is a diagram illustrating another example of selection of audio by the reception device 30 according to the present embodiment. In the example shown in FIG. 17, the organization of audio data is switched to ar06-1, ar06-2, ar06-3 in accordance with the switching of programs. Each of the compositions ar06-1 and ar06-2 includes two assets whose sound reproduction method is surround 5.1ch and one asset whose stereo is 2.0ch. The French dialog audio channel (add2) selected in the second audio asset whose composition ar06-1 is the surround 5.1ch is lost when the ar06-2 is switched to the ar06-2. At this time, the playback control unit 333 determines that the channel of the Japanese dialog sound exists in the selected asset until just before as the highest priority language indicated by the priority language setting information. The reproduction control unit 333 selects a dialog audio channel related to the Japanese audio. When switching to organization ar06-3, the asset containing the channel of the selected dialog audio is lost. At this time, the playback control unit 333 records in the selection history the asset having the same playback method as that of the asset selected up to immediately before in the surround 5.1ch and the audio type being the first audio. It is determined that there is a French dialog voice channel (add2) as the selected attribute. The playback control unit 333 selects a French dialog voice channel (add2) in the asset.

図18は、本実施形態に係る受信装置30による音声の他の選択例を示す図である。図18に示す例では番組の切り替えに応じて音声データの編成がar07−1、ar07−2、ar07−3と切り替わる。編成ar07−1、ar07−2は、図17に示す編成ar06−1、ar06−2と同様である。編成ar07−3は、音声の再生方式がサラウンド5.1chであるアセットと、ステレオ2.0chであるアセットを各1個含む。但し、編成ar07−3のサラウンド5.1chのアセットにおいて、ダイアログ音声のチャンネルには、主たる言語(例えば、日本語)以外の外国語の音声は割り当てられていない。当該アセットのダイアログ音声のチャンネルとして、主音声のチャンネル(main)、解説音声のチャンネル(add1)、その他の解説音声のチャンネル(add2)が含まれる。図18に示す例では、編成ar07−1、ar07−2において、仏語のダイアログ音声のチャンネル(add2)、日本語のダイアログ音声のチャンネル(add1)それぞれ選択される。編成ar07−3に切り替わると、選択されたダイアログ音声のチャンネルを含むアセットが失われる。このとき、再生制御部333は、直前まで選択されたアセットと同一の再生方式であるサラウンド5.1chのうち、残されたアセットとして音声の種類が第1音声であるアセットに、選択履歴に記録された、最後に選択された属性として仏語のダイアログ音声のチャンネルが存在しないと判定する。そして、再生制御部333は、優先言語設定情報が示す言語の音声のアセットも、チャンネルも、その時点で受信している番組に含まれていないと判定する。このとき、再生制御部333は、所定の優先順位として解説音声よりも優先度が高い主音声のチャンネル(main)を選択する。   FIG. 18 is a diagram illustrating another example of selection of audio by the reception device 30 according to the present embodiment. In the example shown in FIG. 18, the organization of the audio data is switched to ar07-1, ar07-2, ar07-3 in accordance with the program switching. The formations ar07-1 and ar07-2 are the same as the formations ar06-1 and ar06-2 shown in FIG. The organization ar07-3 includes an asset whose sound reproduction method is surround 5.1 ch and one asset each of which is stereo 2.0 ch. However, in the surround 5.1ch asset of the organization ar07-3, the voice of the foreign language other than the main language (for example, Japanese) is not assigned to the dialog audio channel. The dialog audio channel of the asset includes a main audio channel (main), an explanation audio channel (add1), and other explanation audio channels (add2). In the example shown in FIG. 18, in the compositions ar07-1 and ar07-2, the French dialog voice channel (add2) and the Japanese dialog voice channel (add1) are selected. When switching to organization ar07-3, the asset containing the channel of the selected dialog audio is lost. At this time, the playback control unit 333 records, in the selection history, an asset whose sound type is the first sound as the remaining asset among the surround 5.1ch that is the same playback method as the asset selected immediately before. It is determined that there is no French dialog voice channel as the last selected attribute. Then, the playback control unit 333 determines that neither the audio asset in the language indicated by the priority language setting information nor the channel is included in the program received at that time. At this time, the reproduction control unit 333 selects a main audio channel having a higher priority than the commentary audio as a predetermined priority.

以上に説明したように、本実施形態に係る受信装置30は、受信している番組の構成を示す構成情報を解析して複数の属性の音声を含む音声の編成を解析する構成情報解析部332を備える。また、受信装置30は、操作により選択された属性を示す選択情報を生成し、編成が変更されるとき選択情報が示す属性のうち最後に選択された属性の音声を、他の属性の音声よりも優先して選択する再生制御部333を備える。また、受信装置30は、再生制御部333が選択した属性の音声を再生する音声処理部314を備える。
この構成により、受信している番組で放送される音声のうち操作により選択された属性の音声が失われ、再度その属性の音声が放送される場合において、その音声が選択される。再度特段の操作が行われない場合でもユーザの意図に沿った属性の音声が優先して選択されることにより、受信装置30のユーザビリティが向上する。
As described above, the receiving device 30 according to the present embodiment analyzes the configuration information indicating the configuration of the received program and analyzes the organization of the audio including the audio with a plurality of attributes. Is provided. In addition, the receiving device 30 generates selection information indicating the attribute selected by the operation, and when the composition is changed, the sound of the attribute selected last among the attributes indicated by the selection information is obtained from the sound of other attributes. Is also provided with a reproduction control unit 333 that preferentially selects. In addition, the receiving device 30 includes an audio processing unit 314 that reproduces audio having the attribute selected by the reproduction control unit 333.
With this configuration, when the audio having the attribute selected by the operation is lost from the audio broadcast in the received program and the audio having the attribute is broadcast again, the audio is selected. Even when the special operation is not performed again, the usability of the receiving device 30 is improved by preferentially selecting the sound having the attribute according to the user's intention.

また、受信している番組において生成された選択情報が示す属性の音声が含まれない場合、再生制御部333は、受信装置30自体の機能に係る属性設定、例えば、優先言語設定情報において指定された属性の音声を選択してもよい。
この構成により、属性設定において優先的に選択すべき属性を予め設定しておくことで、特段の操作が行われない場合でもユーザの意図に沿った属性の音声が優先して選択されることにより、受信装置30のユーザビリティが向上する。
In addition, when the audio having the attribute indicated by the selection information generated in the received program is not included, the playback control unit 333 is specified in the attribute setting related to the function of the receiving device 30 itself, for example, the priority language setting information. You may select the voice of the selected attribute.
With this configuration, attributes that should be preferentially selected in the attribute setting are set in advance, so that even if no special operation is performed, the sound of the attribute according to the user's intention is preferentially selected. The usability of the receiving device 30 is improved.

また、受信している番組において選択情報において指定された属性の音声が含まれない場合、再生制御部333は、音声の属性として音声処理部314が再生可能な再生方式のうちチャンネル数が多い再生方式の音声ほど優先して選択し、その再生方式の音声に複数の言語の音声が含まれるとき、属性として複数の言語の音声のいずれかを所定の優先順位、例えば、コンポーネントタグ値やチャンネル番号に基づいて選択してもよい。
この構成により、受信装置30の機能を発揮するチャンネル数が多い再生方式の音声ほど優先して再生される。また、その再生方式の音声が複数個提供される場合には、複数個の音声のいずれかが、所定の優先順位としてコンポーネントタグ値やチャンネル番号で表される所定の音声の種類や言語の順位に基づいて定められる。
When the received program does not include the audio having the attribute specified in the selection information, the reproduction control unit 333 reproduces the audio having a large number of channels among the reproduction methods that can be reproduced by the audio processing unit 314 as the audio attribute. If the audio of the system is selected with priority, and the audio of the playback system includes audio of multiple languages, one of the audios of multiple languages is selected as the attribute with a predetermined priority, for example, the component tag value or channel number You may choose based on.
With this configuration, a playback system sound with a larger number of channels that perform the function of the receiving device 30 is played back preferentially. In addition, when a plurality of audios of the playback method are provided, one of the plurality of audios is a predetermined audio type or language order represented by a component tag value or a channel number as a predetermined priority. It is determined based on.

また、本実施形態に係る受信装置30において、受信している番組が変更されるとき、または、番組を受信する放送チャンネルが変更されるとき、前記再生制御部333は、操作により選択された属性を示す選択情報を消去してもよい。
この構成により、番組や放送チャンネルの切り替えに伴う音声の編成の変更に応じて、不要になった選択情報が消去される。そのため、不要になった選択情報に基づいてユーザの意図に沿わない属性の音声が優先して選択されることが回避される。
In the receiving device 30 according to the present embodiment, when the received program is changed or when the broadcast channel for receiving the program is changed, the playback control unit 333 selects the attribute selected by the operation. The selection information indicating may be deleted.
With this configuration, selection information that is no longer needed is erased in accordance with a change in audio organization associated with switching between programs and broadcast channels. For this reason, it is avoided that a voice having an attribute that does not conform to the user's intention is preferentially selected based on the selection information that is no longer necessary.

なお、本発明は上述した各実施形態に限定されるものではなく、特許請求の範囲に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的構成を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
また、本発明の各構成要素は、任意に取捨選択することができ、取捨選択した構成を具備する発明も本発明に含まれるものである。
It should be noted that the present invention is not limited to the above-described embodiments, and various modifications are possible within the scope indicated in the claims, and the technical configurations disclosed in different embodiments are appropriately combined. The obtained embodiment is also included in the technical scope of the present invention.
Each component of the present invention can be arbitrarily selected, and an invention having a selected configuration is also included in the present invention.

例えば、受信装置30において、拡声部315、表示部318及び操作入力部323は、必ずしも一体化されていなくてもよく、これらのうちのいずれか又は組み合わせが省略されてもよい。
また、上述では音声の再生方式が主にサラウンド5.1ch又はステレオ2.0chである場合を例にしたがこれには限られない。再生方式は、例えば、サラウンド22.2chであってもよい。また、ダイアログ音声が提供されるアセットが、主に再生方式がサラウンド5.1chのアセットである場合を例にしたが、これには限られない。ダイアログ音声は、チャンネル数が3チャンネル以上であるアセット、例えば、再生方式がサラウンド22.2chであるアセットで提供されてもよい。
For example, in the receiving device 30, the loudspeaker 315, the display unit 318, and the operation input unit 323 do not necessarily have to be integrated, and any one or a combination of these may be omitted.
Further, in the above description, the case where the audio reproduction method is mainly surround 5.1 ch or stereo 2.0 ch is taken as an example, but the present invention is not limited to this. The playback method may be, for example, surround 22.2ch. Moreover, although the case where the asset for which the dialog sound is provided is mainly an asset whose reproduction method is surround 5.1ch is exemplified, it is not limited thereto. The dialog sound may be provided by an asset whose number of channels is three or more, for example, an asset whose playback method is surround 22.2ch.

上述した実施形態では、各種のデータを伝送するための多重化・伝送方式として、主にMPEG−Hで規定されたMMT・TLV(Type Length Value)方式が用いる場合を例にしたが、その他の多重化・伝送方式、例えば、MPEG−2 Systemsで規定された方式が用いられてもよい。MPEG−2 Systemsにおけるエレメンタリストリームは、上述したアセットに相当する。また、伝送に係るデータ形式、暗号化方式、符号化方式も、その多重化・伝送方式で規定された形式または方式が用いられてもよい。   In the above-described embodiment, the case where the MMT / TLV (Type Length Value) method mainly defined in MPEG-H is used as the multiplexing / transmission method for transmitting various data is exemplified. Multiplexing / transmission schemes, for example, schemes defined in MPEG-2 Systems may be used. An elementary stream in MPEG-2 Systems corresponds to the asset described above. In addition, a data format, an encryption method, and an encoding method related to transmission may be the format or method defined by the multiplexing / transmission method.

また、上述した実施形態における送信装置10の一部、受信装置30の一部をコンピュータで実現するようにしてもよい。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、認識データ伝送装置に内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバーやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。   Further, a part of the transmission device 10 and a part of the reception device 30 in the above-described embodiment may be realized by a computer. In that case, the program for realizing the control function may be recorded on a computer-readable recording medium, and the program recorded on the recording medium may be read by the computer system and executed. Here, the “computer system” is a computer system built in the recognition data transmission apparatus, and includes an OS and hardware such as peripheral devices. The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, the “computer-readable recording medium” is a medium that dynamically holds a program for a short time, such as a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line, In this case, a volatile memory inside a computer system that serves as a server or a client may be included that holds a program for a certain period of time. The program may be a program for realizing a part of the functions described above, and may be a program capable of realizing the functions described above in combination with a program already recorded in a computer system.

なお、本発明は次の態様でも実施することができる。
(1)受信している番組の構成を示す構成情報を解析して複数の属性の音声を含む音声の編成を解析する構成情報解析部と、操作により選択された属性を示す選択情報を生成し、前記編成が変更されるとき前記選択情報が示す属性のうち最後に選択された属性の音声を、他の属性の音声よりも優先して選択する再生制御部と、前記再生制御部が選択した属性の音声を再生する音声処理部と、を備える受信装置。
In addition, this invention can be implemented also in the following aspect.
(1) A configuration information analysis unit that analyzes the configuration information indicating the configuration of the received program to analyze the organization of audio including a plurality of attributes of audio, and generates selection information indicating the attribute selected by the operation When the composition is changed, the reproduction control unit that selects the sound of the attribute selected last among the attributes indicated by the selection information in preference to the sound of other attributes, and the reproduction control unit selects And a voice processing unit that plays back the voice of the attribute.

(2)前記番組において前記選択情報が示す属性の音声が含まれない場合、前記再生制御部は、自装置の機能に係る属性設定において指定された属性の音声を選択する(1)の受信装置。 (2) The reception device according to (1), wherein, when the program does not include the sound having the attribute indicated by the selection information, the reproduction control unit selects the sound having the attribute specified in the attribute setting relating to the function of the own device. .

(3)前記番組において前記選択情報において指定された属性の音声が含まれない場合、前記再生制御部は、前記属性として前記音声処理部が再生可能な再生方式のうちチャンネル数が多い再生方式の音声ほど優先して選択し、前記再生方式の音声に複数の言語の音声が含まれるとき、前記属性として前記複数の言語の音声のいずれかを所定の優先順位に基づいて選択する(2)の受信装置。 (3) When the audio of the attribute specified in the selection information is not included in the program, the playback control unit has a playback method with a large number of channels among the playback methods that can be played by the audio processing unit as the attribute. The voice is selected with priority, and when the sound of the reproduction method includes a plurality of languages, one of the plurality of languages is selected as the attribute based on a predetermined priority (2). Receiver device.

(4)前記番組が変更されるとき、または、前記番組を受信する放送チャンネルが変更されるとき、前記再生制御部は、前記選択情報を消去する(1)から(3)のいずれかの受信装置。 (4) When the program is changed or when a broadcast channel for receiving the program is changed, the reproduction control unit deletes the selection information. (1) to (3) apparatus.

(5)受信装置における受信方法であって、受信している番組の構成を示す構成情報を解析して複数の属性の音声を含む音声の編成を解析する構成情報解析過程と、操作により選択された属性を示す選択情報を生成し、前記編成が変更されるとき前記選択情報が示す属性のうち最後に選択された属性の音声を、他の属性の音声よりも優先して選択する再生制御過程と、前記再生制御過程において選択された属性の音声を再生する音声処理過程と、を有する受信方法。 (5) A receiving method in the receiving apparatus, which is selected by a configuration information analysis process of analyzing configuration information indicating a configuration of a received program and analyzing a composition of audio including audio of a plurality of attributes, and an operation. A reproduction control process for generating selection information indicating a selected attribute, and selecting the sound of the attribute selected last among the attributes indicated by the selection information in preference to the sound of other attributes when the composition is changed And a sound processing step of playing back the sound having the attribute selected in the playback control step.

(6)受信装置のコンピュータに、受信している番組の構成を示す構成情報を解析して複数の属性の音声を含む音声の編成を解析する構成情報解析手順、操作により選択された属性を示す選択情報を生成し、前記編成が変更されるとき前記選択情報が示す属性のうち最後に選択された属性の音声を、他の属性の音声よりも優先して選択する再生制御手順、前記再生制御手順において選択された属性の音声を再生する音声処理手順、を実行させるためのプログラム。 (6) The configuration information analysis procedure for analyzing the composition of the audio including a plurality of attributes by analyzing the configuration information indicating the configuration of the received program on the computer of the receiving apparatus, and the attribute selected by the operation A reproduction control procedure for generating selection information and selecting a sound having the attribute selected last among attributes indicated by the selection information when the composition is changed in preference to a sound having another attribute; A program for executing a sound processing procedure for reproducing sound having an attribute selected in the procedure.

1…放送システム、10…送信装置、11…番組データ取得部、12…制御データ取得部、13…多重化部、14…変調部、15…送信部、20…放送伝送路、30…受信装置、311…受信部、312…復号部、313…分離部、314…音声処理部、315…拡声部、316…映像復号部、317…映像合成部、318…表示部、322…記憶部、323…操作入力部、331…制御部、332…構成情報解析部、333…再生制御部、334…表示制御部、335…選局部、3142…復号処理部、3143…選択部   DESCRIPTION OF SYMBOLS 1 ... Broadcast system, 10 ... Transmission apparatus, 11 ... Program data acquisition part, 12 ... Control data acquisition part, 13 ... Multiplexing part, 14 ... Modulation part, 15 ... Transmission part, 20 ... Broadcast transmission path, 30 ... Reception apparatus 311: Reception unit, 312 ... Decoding unit, 313 ... Separation unit, 314 ... Audio processing unit, 315 ... Loudspeaker unit, 316 ... Video decoding unit, 317 ... Video composition unit, 318 ... Display unit, 322 ... Storage unit, 323 ... operation input unit, 331 ... control unit, 332 ... configuration information analysis unit, 333 ... reproduction control unit, 334 ... display control unit, 335 ... channel selection unit, 3142 ... decoding processing unit, 3143 ... selection unit

Claims (6)

受信している番組の構成を示す構成情報を解析して複数の属性の音声を含む音声の編成を解析する構成情報解析部と、
記憶部と、
前記編成で示される複数の属性の音声のうち操作により選択された音声を示す選択情報を生成し、前記選択情報と選択された前記音声に対応する属性を示す属性情報の組を前記記憶部に記憶し、
前記編成が変更されるとき、前記記憶部に記憶された前記選択情報が示す属性のうち最後に選択された属性の音声を、他の属性の音声よりも優先して選択する再生制御部と、
前記再生制御部が選択した属性の音声を再生する音声処理部と、
を備える受信装置。
A configuration information analyzing unit that analyzes the configuration information indicating the configuration of the received program and analyzes the organization of the audio including audio of multiple attributes;
A storage unit;
A selection information indicating a voice selected by an operation among a plurality of voices having the attribute indicated by the organization is generated, and a set of attribute information indicating an attribute corresponding to the selected information and the selected voice is stored in the storage unit. Remember,
When the knitting is changed, the voice last selected attribute of the attribute indicating the selected information stored in the storage unit, a reproduction control unit to select in priority to the voice of the other attributes,
An audio processing unit for reproducing the audio of the attribute selected by the reproduction control unit;
A receiving device.
受信している番組の構成を示す構成情報を解析して複数の属性の音声を含む音声の編成を解析する構成情報解析部と、
操作により選択された属性を示す選択情報を生成し、前記編成が変更されるとき前記選択情報が示す属性のうち最後に選択された属性の音声を、他の属性の音声よりも優先して選択する再生制御部と、
前記再生制御部が選択した属性の音声を再生する音声処理部と、
を備え
前記再生制御部は、前記番組において前記選択情報が示す属性の音声が含まれない場合、
前記属性として前記音声処理部が再生可能な再生方式のうちチャンネル数が多い再生方式の音声ほど優先して選択し、前記再生方式の音声に複数の言語の音声が含まれるとき、前記属性として前記複数の言語の音声のいずれかを所定の優先順位に基づいて選択する
受信装置。
A configuration information analyzing unit that analyzes the configuration information indicating the configuration of the received program and analyzes the organization of the audio including audio of multiple attributes;
Select information indicating the attribute selected by the operation is generated, and when the composition is changed, the sound of the attribute selected last among the attributes indicated by the selection information is selected with priority over the sound of other attributes A playback control unit,
An audio processing unit for reproducing the audio of the attribute selected by the reproduction control unit;
Equipped with a,
When the playback control unit does not include the audio of the attribute indicated by the selection information in the program,
As the attribute, when the sound of the playback method having a larger number of channels is selected with priority among the playback methods that can be played back by the sound processing unit, and the sound of the playback method includes sound of a plurality of languages, the attribute is A receiving apparatus that selects one of a plurality of languages of speech based on a predetermined priority.
受信している番組の構成を示す構成情報を解析して複数の属性の音声を含む音声の編成を解析する構成情報解析部と、
操作により選択された属性を示す選択情報を生成し、前記編成が変更されるとき前記選択情報が示す属性のうち最後に選択された属性の音声を、他の属性の音声よりも優先して選択する再生制御部と、
前記再生制御部が選択した属性の音声を再生する音声処理部と、
を備え
前記再生制御部は、前記番組が変更されるとき、または、前記番組を受信する放送チャンネルが変更されるとき、前記再生制御部は、前記選択情報を消去する
受信装置。
A configuration information analyzing unit that analyzes the configuration information indicating the configuration of the received program and analyzes the organization of the audio including audio of multiple attributes;
Select information indicating the attribute selected by the operation is generated, and when the composition is changed, the sound of the attribute selected last among the attributes indicated by the selection information is selected with priority over the sound of other attributes A playback control unit,
An audio processing unit for reproducing the audio of the attribute selected by the reproduction control unit;
Equipped with a,
The playback control unit is a receiving device in which the playback control unit erases the selection information when the program is changed or when a broadcast channel for receiving the program is changed .
前記番組において前記選択情報が示す属性の音声が含まれない場合、前記再生制御部は、自装置の機能に係る属性設定において指定された属性の音声を選択する請求項1から請求項3のいずれか一項に記載の受信装置。 4. The playback control unit according to any one of claims 1 to 3, wherein when the program does not include sound having the attribute indicated by the selection information, the playback control unit selects sound having the attribute specified in the attribute setting relating to the function of the own device. receiver according to an item or. 受信装置における受信方法であって、
受信している番組の構成を示す構成情報を解析して複数の属性の音声を含む音声の編成を解析する構成情報解析過程と、
前記編成で示される複数の属性の音声のうち操作により選択された音声を示す選択情報を生成し、前記選択情報と選択された前記音声に対応する属性を示す属性情報の組を記憶部に記憶し、
前記編成が変更されるとき、前記記憶部に記憶された前記選択情報が示す属性のうち最後に選択された属性の音声を、他の属性の音声よりも優先して選択する再生制御過程と、
前記再生制御過程において選択された属性の音声を再生する音声処理過程と、
を有する受信方法。
A receiving method in a receiving device,
A configuration information analysis process for analyzing the composition of the received program and analyzing the composition of the sound including the sound of multiple attributes;
Generates selection information indicating a voice selected by an operation from voices having a plurality of attributes shown in the organization, and stores a set of attribute information indicating an attribute corresponding to the selected information and the selected voice in a storage unit And
When the composition is changed, a playback control process of selecting the attribute of the attribute selected last among the attributes indicated by the selection information stored in the storage unit in preference to the sound of other attributes;
An audio processing process for reproducing audio of the attribute selected in the reproduction control process;
Receiving method.
受信装置のコンピュータに、
受信している番組の構成を示す構成情報を解析して複数の属性の音声を含む音声の編成を解析する構成情報解析手順、
前記編成で示される複数の属性の音声のうち操作により選択された音声を示す選択情報を生成し、前記選択情報と選択された前記音声に対応する属性を示す属性情報の組を記憶部に記憶し、前記編成が変更されるとき、前記記憶部に記憶された前記選択情報が示す属性のうち最後に選択された属性の音声を、他の属性の音声よりも優先して選択する再生制御手順、
前記再生制御手順において選択された属性の音声を再生する音声処理手順、
を実行させるためのプログラム。
In the computer of the receiving device,
A configuration information analysis procedure for analyzing the composition of the received program and analyzing the composition of the sound including the sound of multiple attributes;
Generates selection information indicating a voice selected by an operation from voices having a plurality of attributes shown in the organization, and stores a set of attribute information indicating an attribute corresponding to the selected information and the selected voice in a storage unit Then, when the composition is changed, a playback control procedure for selecting the sound of the attribute selected last among the attributes indicated by the selection information stored in the storage unit with priority over the sound of other attributes ,
An audio processing procedure for reproducing audio of the attribute selected in the reproduction control procedure;
A program for running
JP2015217947A 2015-11-05 2015-11-05 Receiving device, receiving method and program Active JP6559542B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015217947A JP6559542B2 (en) 2015-11-05 2015-11-05 Receiving device, receiving method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015217947A JP6559542B2 (en) 2015-11-05 2015-11-05 Receiving device, receiving method and program

Publications (2)

Publication Number Publication Date
JP2017092617A JP2017092617A (en) 2017-05-25
JP6559542B2 true JP6559542B2 (en) 2019-08-14

Family

ID=58771682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015217947A Active JP6559542B2 (en) 2015-11-05 2015-11-05 Receiving device, receiving method and program

Country Status (1)

Country Link
JP (1) JP6559542B2 (en)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2914936B2 (en) * 1997-07-07 1999-07-05 株式会社東芝 Signal recording method and apparatus for multi-language compatible recording medium
JP3395825B2 (en) * 1997-09-19 2003-04-14 船井電機株式会社 Audio multiplex broadcasting receiver
JP3525913B2 (en) * 2001-05-10 2004-05-10 船井電機株式会社 Broadcast receiver having automatic audio selection function
JP3506177B2 (en) * 2001-05-10 2004-03-15 船井電機株式会社 Language switching method and digital broadcast receiver using the method
JP2010187158A (en) * 2009-02-12 2010-08-26 Funai Electric Co Ltd Content processing device
WO2010143224A1 (en) * 2009-06-08 2010-12-16 三菱電機株式会社 Reproduction apparatus
WO2014113071A1 (en) * 2013-01-15 2014-07-24 Viki, Inc. System and method for captioning media

Also Published As

Publication number Publication date
JP2017092617A (en) 2017-05-25

Similar Documents

Publication Publication Date Title
JP7062115B2 (en) Receiver
JP2009094796A (en) Television receiver
JP6137755B2 (en) Receiving device, receiving method and program
JP6559542B2 (en) Receiving device, receiving method and program
JP6309061B2 (en) Broadcast system
JP6137754B2 (en) Receiving device, receiving method and program
JP6279140B1 (en) Receiver
JP6279063B2 (en) Receiving device, receiving method and program
JP6327711B2 (en) Receiving apparatus, broadcasting system, receiving method and program
KR20060131164A (en) Method for playing broadcasting stream stored in digital broadcasting receiver
JP2018142971A (en) Receiving device, receiving method and program
JP6382158B2 (en) Control method of temporary storage
JP2017017740A (en) Broadcasting system
JP6440314B2 (en) Receiving apparatus, receiving method, and program
JP6405493B1 (en) Control method of temporary storage
JP6412289B1 (en) Control method of temporary storage
JP6405492B1 (en) Recording control method
JP6412288B1 (en) Recording control method
JP2006148839A (en) Broadcasting apparatus, receiving apparatus, and digital broadcasting system comprising the same
JP2016116172A (en) Reception device, reception method, program, and transmission device
JP6436573B2 (en) Receiving apparatus, receiving method, and program
JP6508831B2 (en) Receiving device, receiving method, broadcast system and program
JP2016116032A (en) Receiving device, broadcasting system, receiving method, and program
JP6378137B2 (en) Recording control method
JP2007274228A (en) Communication system, information management apparatus, information management method, playback apparatus, information processing method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180920

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190312

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190618

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190717

R150 Certificate of patent or registration of utility model

Ref document number: 6559542

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150