JP2003333572A - Virtual customer forming apparatus and method thereof, virtual customer forming reception apparatus and method thereof, and virtual customer forming program - Google Patents

Virtual customer forming apparatus and method thereof, virtual customer forming reception apparatus and method thereof, and virtual customer forming program

Info

Publication number
JP2003333572A
JP2003333572A JP2002133236A JP2002133236A JP2003333572A JP 2003333572 A JP2003333572 A JP 2003333572A JP 2002133236 A JP2002133236 A JP 2002133236A JP 2002133236 A JP2002133236 A JP 2002133236A JP 2003333572 A JP2003333572 A JP 2003333572A
Authority
JP
Japan
Prior art keywords
viewer
virtual
image
voice
site
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002133236A
Other languages
Japanese (ja)
Inventor
Mitsuo Yamada
光穗 山田
Mikihiro Ueno
幹大 上野
Toshihiro Shimizu
俊宏 清水
Akira Otani
明 大谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2002133236A priority Critical patent/JP2003333572A/en
Publication of JP2003333572A publication Critical patent/JP2003333572A/en
Pending legal-status Critical Current

Links

Abstract

<P>PROBLEM TO BE SOLVED: To provide a virtual customer forming apparatus in which a virtual conference configuration is formed as if many viewers were gathered in a studio to participate in a viewer participating program, so that the program is enriched. <P>SOLUTION: A video compositing apparatus 12 composites a viewer's video image as a virtual customer transmitted from the viewer and received by a receiver 11 with respect to a site video image picked up by a bird's-eye camera 13 and a studio camera 14, a mixer 18 puts together a site sound picked up by a studio microphone 17 with viewer's voice transmitted from the site and received by the receiver 11 to form as virtual customer's voice, and a transmitter 19 transmits the viewer's image and the viewer's voice to the viewer. <P>COPYRIGHT: (C)2004,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、視聴者の視聴者映
像および視聴者音声を、撮影現場の現場映像および現場
音声と合成して視聴者が仮想的に撮影現場に仮想観客と
して参加することができる仮想観客形成装置およびその
方法、仮想観客形成受信装置およびその方法ならびに仮
想観客形成プログラムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention allows a viewer to virtually participate in a shooting site as a virtual audience by synthesizing the viewer video and the viewer audio of the viewer with the site video and the site audio of the shooting site. The present invention relates to a virtual spectator formation device and method, a virtual spectator formation reception device and method, and a virtual spectator formation program.

【0002】[0002]

【従来の技術】従来、視聴者を参加させる視聴者参加型
の番組には、視聴者が撮影場所に出向いて行く場合や、
出演者が出演している番組の撮影場所から電話(テレビ
電話を含む)によって視聴者と話をする場合や、ファク
シミリによる参加の形態をとる場合や、データ放送によ
る参加の形態をとる場合などがある。さらに、視聴者参
加型の番組では、大掛かりな形式として、対象とする視
聴者の家庭に中継クルーを派遣して、スタジオと結んで
参加させる形態をとることにより、視聴者をその番組に
参加させることも行っている。
2. Description of the Related Art Conventionally, in a viewer participation type program in which a viewer participates, when the viewer goes to a shooting place,
There are cases where the performer talks to the viewer by telephone (including videophone) from the shooting location of the program in which the performer appears, when taking the form of participation by facsimile, or when taking the form of participation by data broadcasting. is there. Furthermore, in a viewer participation type program, as a large-scale format, a relay crew is dispatched to the home of the target viewer to connect with the studio so that the viewer can participate in the program. Things are also going on.

【0003】[0003]

【発明が解決しようとする課題】しかし、従来の視聴者
参加型番組では、以下に示すような問題点について解決
が望まれていた。 (1)視聴者が撮影場所に実際に出かけて行くことで、
番組に参加する場合は、撮影場所に行くまでの時間、費
用が大きくかかるため、気軽に誰でも参加するというわ
けには行かなかった
However, in the conventional viewer participation type program, it has been desired to solve the following problems. (1) When the viewer actually goes to the shooting location,
When participating in the program, it took a lot of time and money to go to the shooting location, so it was not possible for anyone to participate casually.

【0004】(2)視聴者が電話による会話やファクシ
ミリによって情報を送ることで番組への参加を行う番組
形態では、相手の表情や姿が認識できないため、臨場感
の再現には限界があった。また、ファクシミリでは、視
聴者がリアルタイムでの反応を得ることができなかっ
た。
(2) In the program form in which the viewer participates in the program by transmitting information by telephone conversation or facsimile, the expression and appearance of the other party cannot be recognized, so that there is a limit to the reproduction of the realistic sensation. . In addition, with the facsimile, the viewer could not obtain a real-time reaction.

【0005】(3)視聴者が、データ放送により番組へ
の参加を行う番組形態では、視聴者からの文字などの情
報を送受信することで番組に参加する形態であるため
に、スタジオの臨場感が再現できないのは勿論のこと、
参加する視聴者の個人のアイデンティティを表わすこと
が困難であった。
(3) In the program form in which the viewer participates in the program by data broadcasting, since the program participates in the program by transmitting / receiving information such as characters from the viewer, the sense of presence in the studio is present. Cannot be reproduced, of course,
It was difficult to represent the individual identities of the participating viewers.

【0006】(4)出演者が視聴者宅に中継クルーと共
に伺うことで、視聴者が参加を行う番組形態では、番組
に参加することができる視聴者の数が生番組では限られ
てしまうことになり、また、中継クルーを派遣すること
は、大掛かりになって費用も時間も大きくかかるという
問題があった。
(4) The number of viewers who can participate in the program is limited in the live program in the program form in which the viewer participates because the performers visit the viewer's house with the relay crew. In addition, dispatching a relay crew is a big problem, and it takes a lot of money and time.

【0007】本発明は、前記の問題点に鑑みて創案され
たものであり、画像処理の技術を有効に利用することに
よって映像・音声効果をあげ、多数の視聴者があたかも
スタジオに集まって参加しているような仮想的な観客を
形成して視聴者参加型番組を充実させる仮想観客形成装
置およびその方法、仮想観客形成受信装置およびその方
法ならびに仮想観客形成プログラムを提供することを課
題とする。
The present invention was devised in view of the above-mentioned problems, and the video and audio effects are enhanced by effectively utilizing the image processing technology, and a large number of viewers gather in a studio to participate. PROBLEM TO BE SOLVED: To provide a virtual audience formation apparatus and method, a virtual audience formation receiving apparatus and method, and a virtual audience formation program for forming a virtual audience like this and enriching viewer participation type programs. .

【0008】[0008]

【課題を解決するための手段】上記課題を解決するた
め、本発明に係る仮想観客形成装置は、撮影現場の現場
映像を撮像する局側撮像手段と、この局側撮像手段から
の現場映像と視聴者側から送信された視聴者の視聴者映
像とを合成して出力する映像合成装置と、前記撮影現場
の現場音声を集音する局側集音手段と、この局側集音手
段からの現場音声と前記視聴者側から送信された視聴者
の視聴者音声を合成して出力する音声合成装置と、を備
える構成とした。
In order to solve the above problems, a virtual spectator forming apparatus according to the present invention includes a station side image pickup means for picking up a spot image of a shooting spot, and a spot image from the station side image pickup means. An image synthesizing device for synthesizing and outputting the viewer video of the viewer transmitted from the viewer side, a station-side sound collecting means for collecting the on-site sound of the shooting site, and a sound collecting means from the station-side sound collecting means. A voice synthesizer for synthesizing and outputting the on-site voice and the viewer voice of the viewer transmitted from the viewer side is configured.

【0009】このように構成されることにより、仮想観
客形成装置は、局側撮像手段によりスタジオなどの撮影
現場の現場映像を撮像すると共に、局側集音手段により
現場音声を集音して、視聴者から送信されてきた視聴者
映像および視聴者音声とをそれぞれ映像合成装置および
音声合成装置により合成して、視聴者映像から仮想観客
映像を生成し、視聴者音声から仮想観客音声を生成して
いる。そして、仮想観客形成装置では、合成した映像お
よび音声の出力として、例えば、視聴者側に局側信号と
して送信するものであっても構わない。もちろん、この
仮想観客形成装置では、映像および音声を送信装置に出
力し、その送信装置が多重した後に局側信号として送信
するものでも構わない。
With such a configuration, the virtual spectator forming apparatus captures the site image of the shooting site such as a studio by the station side image pickup means, and collects the site voice by the station side sound collection means. The viewer video and the viewer audio transmitted from the viewer are synthesized by the video synthesizer and the audio synthesizer, respectively, to generate a virtual spectator video from the viewer video and to generate a virtual spectator sound from the viewer voice. ing. Then, in the virtual spectator formation device, as the output of the combined video and audio, for example, it may be transmitted to the viewer side as a station side signal. Of course, in this virtual spectator formation device, video and audio may be output to the transmission device, and the transmission device may multiplex and transmit as a station side signal.

【0010】また、本発明に係る仮想観客形成装置にお
いて、前記映像合成装置は、前記局側撮像手段からの現
場映像に対して前記視聴者映像を仮想観客として配列し
た仮想観客映像として合成し、前記音声合成装置は前記
局側集音手段からの現場音声に対して前記視聴者音声を
前記仮想観客の仮想観客音声として合成する構成とし
た。このように構成されることにより、仮想観客形成装
置は、視聴者映像を現場映像に合成してその撮影現場に
あたかも視聴者が観客として参加している状態を提供す
ることができる。
Further, in the virtual spectator forming device according to the present invention, the image synthesizing device synthesizes the viewer image with a scene image from the station side image pickup means as a virtual spectator image in which a virtual spectator is arranged. The voice synthesizer is configured to synthesize the viewer voice as a virtual spectator voice of the virtual spectator with respect to the on-site voice from the station side sound collecting means. With such a configuration, the virtual audience formation device can combine the viewer video with the scene video to provide a state in which the viewer is participating as an audience at the shooting site.

【0011】さらに、本発明に係る仮想観客形成装置に
おいて、前記音声合成装置は、前記視聴者音声を前記現
場音声と合成するための通話路と、前記仮想観客音声同
士の相互会話音声とするための通話路とを切換える通話
路切換手段を有する構成とした。このように構成される
ことにより、仮想観客形成装置は、通話路切換手段によ
り視聴者同士が会話を行うことができる通話路に切換え
ることができる。
Further, in the virtual spectator forming device according to the present invention, the voice synthesizing device provides a speech path for synthesizing the viewer voice with the on-site voice, and a mutual conversation voice between the virtual spectator voices. The communication path switching means for switching between the communication path and the communication path is used. With such a configuration, the virtual spectator forming device can switch to the call path in which the viewers can talk with each other by the call path switching means.

【0012】また、本発明に係る仮想観客形成方法は、
局側の撮影現場の現場映像を撮像すると共に、局側の撮
影現場の現場音声を集音するステップと、視聴者側から
送信された視聴者の視聴者映像および視聴者音声からな
る視聴者側信号を受信するステップと、前記視聴者側信
号に含まれる視聴者映像を前記現場映像の仮想観客映像
として合成すると共に、前記視聴者側信号に含まれる視
聴者音声を前記現場音声に仮想観客の仮想観客音声とし
て合成するステップと、を含むこととした。
The virtual audience formation method according to the present invention is
The step of collecting the on-site video of the shooting site of the station side and collecting the on-site audio of the shooting site of the station side, and the viewer side consisting of the viewer video and the viewer audio of the viewer transmitted from the viewer side And a step of receiving a signal, synthesizing a viewer image included in the viewer-side signal as a virtual audience image of the scene image, and adding the viewer sound included in the viewer-side signal to the site audience sound. And a step of synthesizing as a virtual audience voice.

【0013】このように構成されることにより、仮想観
客形成方法では、はじめに局側として例えばスタジオで
行なわれる撮影現場の現場映像をテレビカメラなどの撮
像手段により撮像し、かつ、現場音声を集音マイクなど
の集音手段により集音すると共に、視聴者側から送られ
てくる視聴者映像および視聴者音声とを受信する。なお
視聴者映像および視聴者音声は、あらかじめ選択されて
決められた人数分の視聴者に関するものである。そし
て、現場映像に視聴者映像が仮想観客映像となるように
合成されると共に、現場音声に視聴者音声が仮想観客の
仮想観客音声となるように合成されることになる。
With such a configuration, in the virtual spectator formation method, first, an image pickup means such as a television camera is used to pick up an image of an on-site image of an on-site image taken by a station, for example, in a studio, and the on-site voice is collected. The sound is collected by a sound collecting means such as a microphone, and the viewer image and the viewer sound sent from the viewer side are received. It should be noted that the viewer video and the viewer audio are related to a predetermined number of viewers selected in advance. Then, the viewer video is combined with the scene video so as to be a virtual spectator video, and the viewer sound is combined with the scene sound so as to be a virtual spectator sound of the virtual spectator.

【0014】また、本発明に係る仮想観客形成受信装置
は、視聴者の視聴者映像を撮像する視聴者側撮像手段
と、視聴者の視聴者音声を集音する視聴者側集音手段
と、前記視聴者側撮像手段からの視聴者映像と前記視聴
者側集音手段からの視聴者音声とを視聴者側信号として
局側に送信する送信手段と、前記局側の撮影現場で生成
された現場映像および現場音声に対して、前記視聴者側
信号に含まれる視聴者映像および視聴者音声がそれぞれ
仮想観客映像および仮想観客音声として合成されて生成
された局側信号として受信される視聴者側受信手段とを
備える構成とした。
Further, the virtual audience formation receiving apparatus according to the present invention comprises a viewer side image pickup means for picking up a viewer video of a viewer, and a viewer side sound pickup means for collecting a viewer's voice. Transmitting means for transmitting the viewer image from the viewer-side image pickup means and the viewer sound from the viewer-side sound collecting means to the station side as a viewer-side signal; A viewer side, which is received as a station side signal generated by synthesizing a viewer image and a viewer sound included in the viewer side signal as a virtual audience image and a virtual audience sound with respect to the scene image and the site sound, respectively. And a receiving means.

【0015】このように構成されることにより、仮想観
客形成受信装置は、例えば、インターネットなどの送信
手段を介して、視聴者側撮像手段および視聴者側集音手
段により得られた視聴者映像および視聴者音声を視聴者
側信号として局側に送信する。そして、局側の撮影現場
の現場映像および現場音声に対して、視聴者側信号に含
まれる視聴者映像および視聴者音声が、仮想観客映像お
よび仮想観客音声として合成して生成された局側信号を
受信することで、あらかじめ局側に仮想観客として選択
されていた視聴者は、自分の映像をテレビなどの表示画
面上で認識することができる。
With this configuration, the virtual spectator formation receiver receives the viewer image and the viewer image obtained by the viewer-side image pickup means and the viewer-side sound collection means via the transmission means such as the Internet. The viewer voice is transmitted to the station side as a viewer side signal. A station-side signal generated by synthesizing a viewer-side image and a viewer-sound included in the viewer-side signal as a virtual spectator image and a virtual spectator sound with respect to a scene-side image and a site-sound of a shooting side on the station side. By receiving, the viewer, who has been selected as a virtual audience by the station side in advance, can recognize his / her own video on the display screen of the television or the like.

【0016】さらに、本発明に係る仮想観客形成受信装
置において、前記視聴者音声を前記現場音声に合成して
仮想観客音声となる通話路と、前記仮想観客音声同士の
相互会話音声となる通話路とを切換える局側の通話路切
換手段を操作する切換操作手段を有する構成とした。
Further, in the virtual spectator formation receiving apparatus according to the present invention, a speech path for synthesizing the viewer's voice with the on-site speech to become a virtual audience sound, and a speech path for an interactive speech between the virtual audience sounds. The switching operation means for operating the communication path switching means on the station side for switching between and is used.

【0017】このように構成されることにより、仮想観
客形成受信装置では、通話路切換手段を操作すること
で、局側に設定されている通話路を切換えるための通話
路切換手段を操作して仮想観客として認識できる特定の
視聴者と会話をすることが可能となる。
With such a configuration, in the virtual spectator formation receiving device, by operating the speech path switching means, the speech path switching means for switching the speech path set on the station side is operated. It is possible to have a conversation with a specific viewer who can be recognized as a virtual audience.

【0018】また、本発明に係る仮想観客形成受信方法
は、視聴者の視聴者映像を撮像すると共に、視聴者の視
聴者音声を集音して前記視聴者映像と前記視聴者音声と
を視聴者側信号として局側に送信するステップと、前記
局側の撮影現場の現場映像に前記視聴者映像を仮想観客
として合成された仮想観客映像と、前記撮影現場の現場
音声に前記視聴者音声を仮想観客の音声として合成され
た仮想観客音声とが含まれる局側信号として受信するス
テップと、受信した前記局側信号による映像および音声
を視聴者側の表示装置に表示するステップと、前記視聴
者音声を前記現場音声に合成して仮想観客音声となる通
話路と、前記仮想観客音声同士の相互会話音声となる通
話路とを切換える通話路切換手段を、視聴者側に設置さ
れた切換操作手段により切換え操作するステップとを含
むこととした。
Further, the virtual audience formation receiving method according to the present invention captures the viewer video of the viewer and collects the viewer audio of the viewer to view the viewer video and the viewer audio. Transmitting to the station side as a person-side signal, a virtual audience image in which the viewer image is combined as a virtual audience with the scene image of the shooting site of the station side, and the viewer audio to the site sound of the shooting site. Receiving as a station-side signal including a virtual audience voice synthesized as the voice of the virtual audience; displaying video and audio by the received station-side signal on a display device on the viewer side; A switching operation means installed on the viewer side is provided with call path switching means for switching between a call path which is a virtual spectator voice by synthesizing a voice with the on-site voice and a call path which is a mutual conversation voice between the virtual spectator voices. It was to include a step of further switching operation.

【0019】このように構成されることにより、仮想観
客形成受信方法では、視聴者側で現場映像と視聴者映像
から合成された仮想観客映像と現場音声と視聴者音声か
ら合成された仮想観客音声を受信して表示し、必要に応
じて隣接する仮想観客同士で会話を行うことができる。
With such a configuration, in the virtual spectator formation receiving method, the virtual spectator video synthesized from the scene video and the viewer video on the viewer side, the virtual spectator audio synthesized from the site sound and the viewer voice. Can be received and displayed, and if necessary, conversation can be held between adjacent virtual spectators.

【0020】そして、本発明に係る仮想観客形成プログ
ラムにおいて、視聴者の視聴者映像を局側の撮影現場の
現場映像に合成して仮想観客を実現するためにコンピュ
ータを、局側の撮影現場の現場映像に、前記局側で受信
した視聴者の視聴者映像を仮想観客として合成する映像
合成手段、この映像合成手段に対応して前記撮影現場の
現場音声に、前記局側で受信した視聴者の視聴者音声を
仮想観客の仮想観客音声として合成する音声合成手段、
として実行させるように構成した。
In the virtual spectator formation program according to the present invention, a computer is provided to realize a virtual spectator by synthesizing the viewer video of the viewer with the scene video of the shooting site on the station side. An image synthesizing unit for synthesizing the viewer image of the viewer received by the station side as a virtual audience on the scene image, and the viewer received by the station side on the site sound of the shooting site corresponding to the image synthesizing unit. Voice synthesizing means for synthesizing the viewer's voice as a virtual spectator voice of a virtual spectator,
Configured to run as.

【0021】このように構成されることにより、コンピ
ュータに対して、スタジオ映像と視聴者映像から仮想観
客映像を形成させ、スタジオ音声と視聴者音声から仮想
観客音声を形成させ、これらを視聴者側に送信させるこ
とが可能な仮想観客形成プログラムを実現することがで
きる。
With this configuration, the computer is caused to form a virtual spectator video from the studio video and the viewer's video, and a virtual spectator voice is generated from the studio audio and the viewer's audio. It is possible to realize a virtual audience formation program that can be transmitted to the user.

【0022】[0022]

【発明の実施の形態】以下、本発明に係る仮想観客形成
装置と仮想観客形成受信装置について添付図面を参照に
して詳細に説明する。
BEST MODE FOR CARRYING OUT THE INVENTION A virtual spectator formation device and a virtual spectator formation reception device according to the present invention will be described in detail below with reference to the accompanying drawings.

【0023】本発明のシステム全体構成を、図1に示
す。本発明のシステム全体構成は局側に設置される仮想
観客形成装置1と、視聴者側に設置される仮想観客形成
受信装置2a、2b…2nから構成される。後記するよ
うに仮想観客形成受信装置2a、2b…2nでは、個々
の視聴者の視聴者映像と視聴者音声とが視聴者側信号と
して局側に送られる。局側の仮想観客形成装置1ではこ
れらの個々の視聴者の視聴者映像と視聴者音声とを合成
して仮想観客を作成し、局側のカメラで実際に撮影した
現場映像である出演者像および局側のマイクで実際に集
音したと現場音声である出演者音声と合成して視聴者参
加番組を作り局側信号として視聴者に放送する。
The overall system configuration of the present invention is shown in FIG. The overall system configuration of the present invention includes a virtual audience formation device 1 installed on the station side and virtual audience formation reception devices 2a, 2b ... 2n installed on the viewer side. As will be described later, in the virtual audience formation receiving devices 2a, 2b ... 2n, the viewer video and the viewer audio of each viewer are sent to the station side as viewer side signals. The virtual spectator formation device 1 on the station side synthesizes the viewer video and the viewer audio of these individual viewers to create a virtual spectator, and a performer image that is a scene video actually shot by the camera on the station side. And, when the sound is actually picked up by the microphone on the station side, it is synthesized with the performer voice which is the on-site voice to create a viewer participation program and broadcast it to the viewer as a station side signal.

【0024】本発明の仮想観客形成装置と仮想観客形成
受信装置の一実施の形態を図2および図3に示す。図2
は仮想観客形成装置の構成を示すブロック図である。ま
た、図3は仮想観客形成受信装置の構成を示すブロック
図である。なお、視聴者側において各構成を全体的に示
す場合を、仮想観客形成受信装置2、視聴者撮像手段と
してのテレビカメラ21、視聴者集音手段としてのマイ
ク22、送信手段23、視聴者側受信手段24、表示装
置25、切換操作手段26等とし、個々に示す場合を、
各符号の後に英小文字a,b…nを付して説明する。
An embodiment of the virtual audience formation apparatus and the virtual audience formation reception apparatus of the present invention is shown in FIGS. 2 and 3. Figure 2
FIG. 3 is a block diagram showing a configuration of a virtual audience forming device. FIG. 3 is a block diagram showing the configuration of the virtual audience formation receiving device. It should be noted that, in the case where each component is generally shown on the viewer side, the virtual audience formation receiving device 2, the television camera 21 as the viewer image pickup means, the microphone 22 as the viewer sound collection means, the transmission means 23, the viewer side. The receiving means 24, the display device 25, the switching operation means 26, etc., are shown individually,
An explanation will be given by adding alphabetic letters a, b ... N after each symbol.

【0025】図2に示すように、仮想観客形成装置1
は、視聴者側の仮想観客形成受信装置2からの視聴者信
号を受信する受信装置11と、仮想観客形成受信装置2
からの複数の視聴者映像、スタジオを俯瞰する俯瞰カメ
ラ13の映像、あるいはスタジオ出演者の映像を撮像す
るスタジオカメラ14の映像を合成する映像合成装置1
2と、この映像合成装置12の出力映像、あるいはスタ
ジオカメラ14の映像を選択出力する画像スイッチャー
15と、この画像スイッチャー15を制御する切換え装
置16と、スタジオの音声を集音するスタジオマイク1
7と、仮想観客形成受信装置2からの複数の視聴者音声
と、スタジオマイク17の現場音声と合成するミキサー
18と、画像スイッチャー15の出力とミキサー18の
出力を仮想観客形成受信装置2に送信する送信装置19
とを含んで構成されている。なお、ここでは、俯瞰カメ
ラ13とスタジオカメラ14が局側撮像手段に、スタジ
オマイク17が局側集音手段に、ミキサー18が音声合
成装置に、送信装置19が出力手段に相当する。
As shown in FIG. 2, the virtual audience forming apparatus 1
Is a receiving device 11 that receives a viewer signal from the virtual audience formation receiving device 2 on the viewer side, and a virtual audience formation receiving device 2
An image synthesizing device 1 for synthesizing a plurality of viewer images from the above, an image of the bird's-eye view camera 13 overlooking the studio, or an image of the studio camera 14 capturing the image of the studio performer.
2, an image switcher 15 for selectively outputting the output image of the image synthesizing device 12 or the image of the studio camera 14, a switching device 16 for controlling the image switcher 15, and a studio microphone 1 for collecting studio sound.
7, a plurality of viewer sounds from the virtual spectator formation receiving device 2, a mixer 18 for synthesizing with the on-site sound of the studio microphone 17, an output of the image switcher 15 and an output of the mixer 18 are transmitted to the virtual spectator formation receiving device 2. Transmitting device 19
It is configured to include and. Here, the overhead camera 13 and the studio camera 14 correspond to the station-side image pickup means, the studio microphone 17 corresponds to the station-side sound collection means, the mixer 18 corresponds to the voice synthesizer, and the transmitter 19 corresponds to the output means.

【0026】仮想観客形成装置1の受信装置11は、視
聴者側から視聴者側信号であるデータ通信として送られ
てくる符号化された映像信号と音声信号を受信し復号す
る装置であり、例えば、視聴者側とインターネットを介
して接続されたパソコンやワークステーションなどがそ
の一例である。
The receiving device 11 of the virtual spectator forming device 1 is a device for receiving and decoding the coded video signal and audio signal sent from the viewer side as data communication which is the viewer side signal. An example is a personal computer or workstation connected to the viewer side via the Internet.

【0027】映像合成装置12は、画像と画像とを自然
な感じで合成して1つ画像に組合すことができる装置で
あり、例えば、フォト・レタッチ・ソフトを持ち、画像
処理機能やコンピュータグラフィック機能を持ったパソ
コンやワークステーションなどで実現することができ
る。なお、ここでは、スタジオに設置したブルーバック
に視聴者映像を合成するようにして仮想観客を生成して
いる。
The image synthesizing device 12 is a device which can synthesize images and images in a natural manner and combine them into one image. For example, the image synthesizing device 12 has photo retouching software and has an image processing function and a computer graphic. It can be realized with a personal computer or workstation with functions. In addition, here, a virtual audience is generated by synthesizing a viewer image with a blue background installed in a studio.

【0028】画像スイッチャー15は、複数のカメラ映
像を切換えるためのものであり、放送局などで従来から
用いられているものをそのまま用いることができる。ま
た、ミキサー18についても複数の音声入力について音
量バランスをとって合成することができる従来からある
オーディオミキサーをそのまま用いることができる。
The image switcher 15 is for switching a plurality of camera images, and the one conventionally used in a broadcasting station can be used as it is. Further, as the mixer 18, a conventional audio mixer capable of synthesizing a plurality of audio inputs while balancing the volume can be used as it is.

【0029】なお、ここでは、送信装置19が局側信号
として現場映像と視聴者映像および現場音声と視聴者音
声をすでに多重して送信できるものとして説明している
が、この送信装置19は、局側信号として送信できる装
置に出力するためのものであっても構わない。
Although it has been described here that the transmitting device 19 can already multiplex and transmit the site image and the viewer image and the site sound and the viewer sound as the station side signal, the transmitting device 19 It may be for outputting to a device that can be transmitted as a station side signal.

【0030】仮想観客形成装置1の送信装置19として
は、一般的な画面については、例えば地上波放送や衛星
放送など放送設備を送信装置19として用いて局側信号
を視聴者側に送ることができる。なお、後記する個別受
信者近傍情報抽出装置41(41a〜41n)(図8参
照)からの個別信号を送信する場合は、視聴者別にイン
ターネットなどの個別回線にデータ通信として局側信号
を送ることになるため、パソコンやワークステーション
を送信装置19として用いる必要があり、放送との連携
が必要である。
As for the transmission device 19 of the virtual spectator formation device 1, for a general screen, for example, a broadcasting facility such as terrestrial broadcasting or satellite broadcasting is used as the transmission device 19 to send a station side signal to the viewer side. it can. When transmitting an individual signal from the individual recipient proximity information extraction device 41 (41a to 41n) (see FIG. 8) described below, the station side signal must be sent as data communication to an individual line such as the Internet for each viewer. Therefore, it is necessary to use a personal computer or a workstation as the transmitting device 19, and cooperation with broadcasting is required.

【0031】図3に示すように、仮想観客形成受信装置
2は、視聴者側の映像を撮像するテレビカメラ21と、
視聴者側の音声を集音するマイク22と、テレビカメラ
21からの映像出力とマイク22からの音声出力を仮想
観客形成装置1に送信する送信手段23と、仮想観客形
成装置1からの信号を受信する視聴者側受信手段24
と、この視聴者側受信手段24の出力映像を表示し出力
音声を再生する表示装置25とを含んで構成されてい
る。なお、テレビカメラ21は視聴者側撮像手段に、マ
イク22は視聴者側集音手段に相当する。
As shown in FIG. 3, the virtual audience formation receiving device 2 includes a television camera 21 for picking up an image on the viewer side,
The microphone 22 that collects the audio from the viewer side, the transmission unit 23 that transmits the video output from the television camera 21 and the audio output from the microphone 22 to the virtual spectator formation device 1, and the signal from the virtual spectator formation device 1 Viewer side receiving means 24 for receiving
And a display device 25 for displaying the output video of the viewer-side receiving means 24 and reproducing the output sound. The television camera 21 corresponds to the viewer side image pickup means, and the microphone 22 corresponds to the viewer side sound collection means.

【0032】仮想観客形成受信装置2のテレビカメラ2
1とマイク22は、それぞれ単体の装置でも、携帯型の
ビデオカメラ装置などを用いても良い。また、送信手段
23は視聴者側信号である視聴者映像および視聴者音声
をデータ信号として符号化して送信するもので、インタ
ーネットを介して局側に接続されたパソコンなどがその
一例である。
The television camera 2 of the virtual audience formation receiving device 2
The 1 and the microphone 22 may each be a single device or a portable video camera device or the like. The transmission means 23 encodes and transmits the viewer video and the viewer audio, which are the viewer side signals, as a data signal, and a personal computer or the like connected to the station side via the Internet is one example.

【0033】局側信号を受信する視聴者側受信手段24
と表示装置25には、一般的な画面を受信する場合は通
常のテレビ受信機を用いることができる。個別信号受信
にはインターネットを介して局側に接続されたパソコン
などを用いるものである。
Viewer side receiving means 24 for receiving the station side signal.
As the display device 25, a normal television receiver can be used when receiving a general screen. A personal computer or the like connected to the station side via the Internet is used for individual signal reception.

【0034】次に、図1および図4に沿って視聴者側情
報を合成する過程について説明する。視聴者側の仮想観
客形成受信装置2では各視聴者のテレビの画面の近くに
テレビカメラ21とマイク22がセットされ、視聴者は
番組に参加したいとき、局側に視聴者参加希望の旨を通
信手段などにより伝達する。そして、局側から参加当選
の連絡があった場合に特定の番組に仮想観客として参加
することができる。さらに参加が決定した視聴者は、局
側から知らされた参加人数に対応して自分あるいは家族
(一人の場合は本人のみ)の視聴者画像と視聴者音声を
テレビカメラ21とマイク22により撮影あるいは集音
して送信手段23を介してコード化して局に送信する。
Next, the process of synthesizing the viewer side information will be described with reference to FIGS. 1 and 4. In the virtual audience formation receiver 2 on the viewer side, a TV camera 21 and a microphone 22 are set near the TV screen of each viewer, and when the viewer wants to participate in the program, he / she informs the station side that the viewer wants to participate. It is transmitted by communication means. Then, when the bureau side informs of the participation winning, it is possible to participate in a specific program as a virtual audience. Further, the viewers who have decided to participate take a picture of the viewer image and the viewer's voice of themselves or their family (in the case of one person, only himself) with the TV camera 21 and the microphone 22 in accordance with the number of participants notified from the station side. Sound is collected, coded through the transmission means 23, and transmitted to the station.

【0035】局側の仮想観客形成装置1では、受信装置
11により各視聴者の送信手段23a〜23nから送ら
れてきた情報をデコードして画像と音声に分離させ、各
視聴者画像は映像合成装置12に入力され、各視聴者音
声はミキサー(音声合成装置)18に入力させる。
In the virtual spectator forming device 1 on the station side, the information sent from the transmitting means 23a to 23n of each viewer is decoded by the receiving device 11 to be separated into an image and a sound, and each viewer image is image-synthesized. Each viewer voice input to the device 12 is input to the mixer (voice synthesizer) 18.

【0036】映像合成装置12は、送られてきた視聴者
画像から人物の顔や全・半身画像を背景から抜き出して
スタジオの番組に対応させた観客となるように、現場映
像と合成し、図5に示すように、あたかも観客席を撮像
しているような仮想的な映像である仮想観客映像を生成
する。この映像合成装置12は、視聴者画像をあらかじ
めきめられた順番に整列して配置する構成であっても、
整列する配置場所だけ決めておき、その配置場所に視聴
者画像を配置するような構成にする等、視聴者映像が現
場映像に対して仮想観客となるように合成するものであ
れば良い。この映像合成装置12からの仮想観客映像
は、画像スイッチャー15(図2参照)等に出力され
る。
The video synthesizing device 12 extracts a person's face or whole / half body image from the sent viewer image from the background and synthesizes it with the on-site video so as to be a spectator corresponding to the program in the studio, As shown in FIG. 5, a virtual spectator image, which is a virtual image as if the spectator seat is being imaged, is generated. Even if the video synthesizing device 12 has a configuration in which viewer images are arranged and arranged in a predetermined order,
It suffices that the viewer images are combined with the scene image so as to be a virtual audience, for example, by deciding only the arrangement place to be aligned and arranging the viewer image at the arrangement place. The virtual audience video from the video synthesizer 12 is output to the image switcher 15 (see FIG. 2) and the like.

【0037】図2に示すように、画像スイッチャー15
を制御する切換え装置16は、番組出演者を撮像してい
るカメラ映像の合間に、この仮想的な観客席を切換えて
示し、あたかも、スタジオやホールに実際に見にきた観
客のように放送することができる。この仮想観客映像
は、ホールのように仮想的な1階席、2階席に振り分け
ることもできるし、一部の観客をズームし、観客間やス
テージを撮像しているカメラをパンニングしてその映像
を示すことも可能である。なお、カメラで撮像した顔画
像のかわりに、デフォルメしたイラストや、視聴者が選
んだり、作成したりしたキャラクターを表示することも
可能である。
As shown in FIG. 2, the image switcher 15
A switching device 16 for controlling the virtual audience seats is switched and shown between camera images capturing the program performers, and is broadcast to a studio or a hall as if the audience had actually seen it. be able to. This virtual spectator video can be distributed to virtual 1st floor and 2nd floor seats, like a hall, or by zooming some spectators and panning the cameras that capture images between spectators and the stage. It is also possible to show an image. Note that instead of the face image captured by the camera, it is possible to display a deformed illustration or a character selected or created by the viewer.

【0038】なお、ミキサー18は、本質的には従来か
らあるオーディオミキサーと同じ動作であるが、各視聴
者からの声に残響音を付加するなどして合成し、あたか
も観客席からの大観衆の声や音のように処理したり、ま
た、双方向にやりとりする必要があるときには、任意の
視聴者の音声のみを取り上げたりすることもできる。さ
らに、視聴者の声を、本人しか分からないような音声に
変形させて再生することもできる。
The mixer 18 has essentially the same operation as a conventional audio mixer, but the voices of the respective viewers are combined by adding a reverberation sound, etc., and synthesized, as if from a large audience from the audience seats. Can be processed like voices and sounds, or when only two viewers need to interact with each other, only the audio of any viewer can be picked up. Furthermore, the voice of the viewer can be transformed into a voice that only the user can understand and reproduced.

【0039】前記した実施の形態では、局側は各視聴者
の画像を仮想観客として利用することができるが、視聴
者側では、自分が何時映るかどの様な状態で映るかが分
からない。その分、臨場感が損なわれ、映される側とし
ては不安であるため、以下に示す構成とすることで解消
することが可能となる。
In the above-described embodiment, the station side can use the image of each viewer as a virtual audience, but the viewer side does not know when he / she will appear. To that extent, the sense of realism is impaired and the viewer is anxious, so it is possible to eliminate this by using the configuration shown below.

【0040】図6および図2に示すように、本発明の第
2の実施の形態では、スタジオを俯瞰的に上部から撮像
する俯瞰カメラ13の映像と、スタジオやホールで使用
されているスタジオカメラ(実カメラ)14の画像と、
仮想観客を撮影するためにコンピュータグラフィックな
どで作成した仮想カメラ31の画像とを、映像合成装置
12で合成して、送信装置19を介して視聴者側に送信
する。この時の俯瞰カメラ13の映像の例を図7に示
す。
As shown in FIGS. 6 and 2, in the second embodiment of the present invention, the image of the bird's-eye view camera 13 for taking a bird's-eye view of the studio and the image of the studio camera used in the studio or the hall. (Real camera) 14 images,
The image of the virtual camera 31 created by computer graphics or the like for photographing the virtual audience is synthesized by the video synthesis device 12 and transmitted to the viewer side via the transmission device 19. FIG. 7 shows an example of a video image of the overhead camera 13 at this time.

【0041】図3に示すように、視聴者側ではこのよう
にして送られた映像について視聴者側受信手段24を用
いて復調し、表示装置25で表示する。図7に示す映像
の送受信の方法は、画像信号をそのまま送信しても良い
し、圧縮多重化して送信してもよい。もちろんインター
ネットなどの別回線を用いて送信することもできる。各
視聴者の家庭では、図7に示すような画像から自分たち
が仮想観客のどの辺にいるかを知ることができると共
に、画像での仮想カメラ31の動きからいつ自分が映る
かをあらかじめ予想して撮影映像となるための準備をす
ることができる。
As shown in FIG. 3, on the viewer side, the video sent in this way is demodulated by the viewer side receiving means 24 and displayed on the display device 25. In the method of transmitting and receiving the video shown in FIG. 7, the image signal may be transmitted as it is or may be compressed and multiplexed and transmitted. Of course, it is also possible to transmit using another line such as the Internet. At the home of each viewer, it is possible to know where they are in the virtual spectator from the image shown in FIG. 7, and to predict in advance the time when one will be reflected from the movement of the virtual camera 31 in the image. It is possible to prepare for shooting video.

【0042】次に、図7ないし図8を主に用いて、本発
明の第3実施の形態について説明する。本発明の第3の
実施の形態では、個別受信者近傍情報抽出装置41によ
り仮想観客の特定抽出領域(近傍情報抽出領域)を表示
させるものである。この個別受信者近傍情報抽出装置4
1は、映像合成装置12およびミキサー18の出力か
ら、各個別の視聴者(仮に視聴者(観客A1))とその
視聴者に隣り合った観客(視聴者(観客A2)および視
聴者(観客AN))の声など、その視聴者の近傍の、例
えば図7で近傍情報抽出領域とされている部分の、画像
・音声情報を抽出しており、送信装置19と視聴者側受
信手段24とを経て各個別視聴者宅の表示装置25に表
示させている。
Next, a third embodiment of the present invention will be described mainly using FIGS. 7 to 8. In the third embodiment of the present invention, the specific extraction area (neighbor information extraction area) of the virtual audience is displayed by the individual recipient vicinity information extraction device 41. This individual recipient neighborhood information extraction device 4
From the outputs of the video synthesizing device 12 and the mixer 18, reference numeral 1 denotes each individual viewer (temporary viewer (audience A1)) and a spectator (viewer (audience A2) and viewer (spectator AN) adjacent to the viewer. )), Such as the voice, the image / sound information in the vicinity of the viewer, for example, in the portion that is the vicinity information extraction area in FIG. 7, is extracted, and the transmitter 19 and the viewer-side receiver 24 are connected. After that, it is displayed on the display device 25 of each individual viewer's house.

【0043】個別受信者近傍情報抽出装置41は、視聴
者が中心となるような映像を抽出するために、図8で
は、仮想観客となる視聴者ごとに対応して設置されてい
るが、ある程度の範囲を抽出してその範囲内に写ってい
る視聴者に送信する場合では、視聴者ごとに設置する必
要はない。このようにして、各個別の視聴者は、あたか
も、スタジオやホールで直接見ている時のように、周囲
の観客の様子を見たり、喚声や話し声などの声を聞いた
りすることができる。近傍情報抽出領域の広さはある範
囲内で選択することもできる。
The individual-receiver vicinity information extraction device 41 is installed corresponding to each viewer who is a virtual spectator in FIG. 8 in order to extract a video centering on the viewer, but to some extent. When extracting the range of and transmitting it to the viewers in the range, it is not necessary to install it for each viewer. In this way, each individual viewer can see the surrounding spectators and hear voices such as shouting and speaking, as if they were watching directly in the studio or hall. The size of the neighborhood information extraction area can be selected within a certain range.

【0044】さらに、第4の本発明の形態では、前記し
た第3の実施の形態に加えて、各個別の視聴者(仮想観
客形成受信装置)は、マイク・スピーカ44a〜44n
から構成されるヘッドセットを備えていると共に、局側
の中継装置43a〜43nを介して局側の交換装置(通
話路切換手段)42による通話路の切換え接続を行なう
ための切換操作手段26(図1、図9参照)とを備えて
いる。
Furthermore, in the fourth embodiment of the present invention, in addition to the third embodiment described above, each individual viewer (virtual audience forming receiver) has a microphone / speaker 44a-44n.
And a switching operation means 26 (for switching connection of the communication path by the switching device (communication path switching means) 42 on the station side via the relay devices 43a to 43n on the station side. (See FIGS. 1 and 9).

【0045】交換装置42は、局側に設置され、視聴者
から送られてくる視聴者音声を仮想観客音声として合成
するための通話路と、仮想観客同士が会話することがで
きる相互会話音声となる通話路とを切換えをするための
ものである。また、図8および図9に示すように、切換
操作手段26は、交換装置42の切換え操作を視聴者の
操作により行なうためのものであり、ここではスイッチ
の回転角度により映像上で隣接する仮想観客同士の会話
を可能となるように構成されている。なお、仮想観客同
士の相互会話音声の通話路を選択した場合は、仮想観客
として隣同志や近傍に座った仮想観客同志で、あたかも
劇場で実際に隣の観客と話す場合のように意見の交換や
会話のやり取りを行うことができる。
The exchange device 42 is installed on the station side, and has a communication path for synthesizing the viewer's voice sent from the viewer as a virtual spectator voice, and an interactive conversation voice with which the virtual spectators can talk. It is for switching the communication path. Further, as shown in FIGS. 8 and 9, the switching operation means 26 is for performing the switching operation of the exchange device 42 by the operation of the viewer, and here, the virtual adjacent to each other on the image depending on the rotation angle of the switch. It is designed to allow conversation between the audience. If you select a channel for mutual conversation voice between virtual spectators, you can exchange opinions as if you were actually speaking with the next spectator in the theater, with the same spectators sitting next to each other as virtual spectators or sitting near you. And can exchange conversations.

【0046】すなわち、視聴者は例えば、図9に示すよ
うなパネル面を持つ切換操作手段26のスイッチを持っ
ていて、視聴者A2は自分の声をスタジオに届けるか、
左隣の視聴者ANさんに届けるか、右隣の視聴者A1さ
んに届けるかをスイッチの切換えで選ぶことができる。
That is, the viewer has, for example, a switch of the switching operation means 26 having a panel surface as shown in FIG. 9, and the viewer A2 sends his voice to the studio.
It is possible to select whether to deliver to the viewer AN on the left side or the viewer A1 on the right side by switching the switch.

【0047】切換操作手段26のスイッチの切換えをA
Nにすると、例えば音声信号で、左隣の視聴者ANさん
に対して会話信号が送られる。ANさんが会話に同意し
ANさんのスイッチを右側に倒すと視聴者A2側で左隣
のANさんの声が聞こえ、ANさん側で視聴者A1の話
が聞こえ、会話が可能になる。同様にスイッチの切換え
をA1にすると、A1さんの同意が得られれば右隣のA
1さんとの声が聞こえ、会話することができる。
Switching of the switch of the switching operation means 26 is performed by A
When set to N, a conversation signal is sent to the viewer AN on the left side, for example, as a voice signal. When AN agrees with the conversation and pushes AN's switch to the right, the viewer A2 hears the voice of AN on the left side, and the AN hears the story of the viewer A1. Similarly, if the switch is set to A1, if A1's consent is obtained, A on the right side
I can hear the voice of Mr. 1 and have a conversation.

【0048】この場合、交換装置42は、中継装置43
a〜43nを介して、音声の切換えを行う。それと共
に、交換装置42は、現在の切換え状態の情報を映像合
成装置12に送る。そのため、視聴者A2とANさん、
A1さんの会話が行われている場合は、映像合成装置1
2が、図10に示すような出演者などが映るメインの画
像の一部に視聴者A2等の周辺のモニタ画像を合成し
て、会話を行っている仮想観客同士の映像が付された状
態として視聴者に送ることができるように動作すること
もできる。このとき、複数の仮想観客同士がそれぞれ会
話を行っている場合は、一定の時間で画像スイッチャー
15(図2参照)が、モニタ画像を所定時間の範囲内で
切換えるようにしている。なお、映像合成装置12は、
図示しない各視聴者側の端末装置に対して、ネットワー
クを介して、モニタ画像を出力する出力手段を備えてい
れば、仮想観客同士のモニタ画像について、会話してい
る当事者に対して個々に送信することも可能となる。
In this case, the switching device 42 has the relay device 43.
Voices are switched via a to 43n. At the same time, the exchange device 42 sends the information of the current switching state to the video synthesizing device 12. Therefore, viewer A2 and Mr. AN,
If A1's conversation is taking place, video synthesizer 1
2 is a state in which a video image of a virtual audience having a conversation is attached by synthesizing a peripheral monitor image of the viewer A2 or the like with a part of a main image in which a performer as shown in FIG. 10 appears. It can also work as it can be sent to the viewer. At this time, when a plurality of virtual spectators are having a conversation with each other, the image switcher 15 (see FIG. 2) switches the monitor images within a predetermined time period at a fixed time. The video synthesizer 12
If output means for outputting a monitor image to each viewer-side terminal device (not shown) is provided via the network, the monitor images of the virtual spectators are individually transmitted to the parties having conversation. It is also possible to do.

【0049】以上、本発明の仮想観客形成装置と仮想観
客形成受信装置について説明したが、これらの装置で用
いられる仮想観客形成方法と、このような仮想観客形成
方法をコンピュータに実現させる仮想観客形成プログラ
ムも本発明の対象とするものである。
The virtual spectator forming device and the virtual spectator forming receiving device of the present invention have been described above. The virtual spectator forming method used in these devices and the virtual spectator forming for causing a computer to realize such a virtual spectator forming method. The program is also an object of the present invention.

【0050】[0050]

【発明の効果】以上説明したように、本発明の請求項
1、請求項2、請求項4、請求項8では、局側撮像手段
で撮像したスタジオ映像と視聴者側から送信された視聴
者映像とを映像合成装置で合成し、局側集音手段で集音
したスタジオ音声と視聴者側から送信された視聴者音声
とを音声合成装置で合成して送信することで、仮想観客
の映像と音声を視聴者に送り、視聴者参加型の番組を容
易に実現することができる。また、請求項3に記載の仮
想観客形成装置は、通話路切換手段を有することによ
り、通話路を切り替えて視聴者の音声の用途を広げるこ
とが可能となる。
As described above, according to claim 1, claim 2, claim 4 and claim 8 of the present invention, the studio video imaged by the station side imaging means and the viewer transmitted from the viewer side. By synthesizing the video with a video synthesizing device and synthesizing the studio voice collected by the station side sound collecting means and the viewer's voice transmitted from the viewer side with the voice synthesizing device and transmitting, the image of the virtual audience The voice can be sent to the viewer to easily realize the viewer participation type program. Further, the virtual spectator forming device according to the third aspect has the communication channel switching means, and thus it is possible to switch the communication channels and expand the usage of the audio of the viewer.

【0051】本発明の請求項5、請求項6、請求項7で
は、視聴者映像と視聴者音声を視聴者側信号として局側
に送信し、局側で生成されたスタジオ音声を含むスタジ
オ映像と視聴者側信号とを合成した局側信号を受信する
ことで、仮想観客の映像・音声を得て視聴者参加型の番
組に容易に参加することができる。また、請求項6、請
求項7では、切換操作手段を備えているため、視聴者
は、仮想観客として隣同志や近傍に座った仮想観客同志
で、あたかも劇場で実際に隣の観客と話す場合のように
意見の交換や会話のやり取りを行うことができる。
According to claim 5, claim 6 and claim 7 of the present invention, the studio image including the studio sound generated by the station side by transmitting the viewer image and the viewer sound to the station side as a viewer side signal. By receiving the station-side signal that is a combination of the signal and the viewer-side signal, it is possible to obtain the video / audio of the virtual audience and easily participate in the viewer participation type program. Further, in claim 6 and claim 7, since the switching operation means is provided, when the viewer is a virtual audience who is a neighbor or a virtual audience sitting in the vicinity, as if he / she actually speaks with a neighbor in the theater. You can exchange opinions and exchange conversations as in.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明に係るシステムの全体構成を示す説明図
である。
FIG. 1 is an explanatory diagram showing an overall configuration of a system according to the present invention.

【図2】本発明に係る仮想観客形成装置の構成を示すブ
ロック図である。
FIG. 2 is a block diagram showing a configuration of a virtual spectator formation device according to the present invention.

【図3】本発明に係る仮想観客形成受信装置の構成を示
すブロック図である。
FIG. 3 is a block diagram showing the configuration of a virtual audience formation receiving device according to the present invention.

【図4】本発明に係る視聴者側情報を合成する装置構成
を示すブロック図である。
FIG. 4 is a block diagram showing a device configuration for synthesizing viewer side information according to the present invention.

【図5】本発明に係る映像合成装置により合成された仮
想的な観客席の映像の一例を示す説明図である。
FIG. 5 is an explanatory diagram showing an example of a virtual image of a spectator seat synthesized by the image synthesizing apparatus according to the present invention.

【図6】本発明に係る仮想観客形成装置の第2の実施の
形態を示すブロック図である。
FIG. 6 is a block diagram showing a second embodiment of a virtual spectator forming device according to the present invention.

【図7】図6の実施の形態による俯瞰カメラからの映像
の一例を示す説明図である。
FIG. 7 is an explanatory diagram showing an example of an image from the overhead camera according to the embodiment of FIG.

【図8】本発明の仮想観客形成装置の第3および第4の
実施の形態を示すブロック図である。
FIG. 8 is a block diagram showing third and fourth embodiments of the virtual audience formation device of the present invention.

【図9】本発明の仮想観客形成装置の第4の実施の形態
で視聴者に設けられた切換操作手段のパネル面の一例を
示す正面図である。
FIG. 9 is a front view showing an example of a panel surface of a switching operation means provided to a viewer in the fourth embodiment of the virtual spectator forming device of the present invention.

【図10】本発明の仮想観客形成受信装置での表示画面
の一例を示す正面図である。
FIG. 10 is a front view showing an example of a display screen of the virtual audience formation receiving device of the present invention.

【符号の説明】[Explanation of symbols]

1 仮想観客形成装置 2 仮想観客形成受信装置 11 受信装置 12 映像合成装置 13 俯瞰カメラ(局側撮像手段) 14 スタジオカメラ(局側撮像手段) 15 画像スイッチャー 16 切換え装置(通話路切換手段) 17 スタジオマイク(局側集音手段) 18 ミキサー(音声合成装置) 19 送信装置(出力手段) 21、21a〜21n テレビカメラ(視聴者側撮像
手段) 22、22a〜22n マイク(視聴者側集音手段) 23、23a〜23n 送信手段 24 視聴者側受信手段 25 表示装置 26 切換操作手段 31 仮想カメラ 41、41a〜41n 個別受信者近傍情報抽出装置 42 交換装置 43、43a〜43n 中継装置 44、44a〜44n マイク・スピーカ
1 Virtual Spectator Formation Device 2 Virtual Spectator Formation Reception Device 11 Reception Device 12 Video Compositing Device 13 Overhead Camera (Station Side Imaging Means) 14 Studio Camera (Station Side Imaging Means) 15 Image Switcher 16 Switching Device (Call Path Switching Means) 17 Studio Microphone (station-side sound collecting means) 18 Mixer (speech synthesizer) 19 Transmitter (output means) 21, 21a to 21n Television camera (viewer-side image pickup means) 22, 22a to 22n Microphone (viewer-side sound collecting means) 23, 23a to 23n Transmitting means 24 Viewer side receiving means 25 Display device 26 Switching operation means 31 Virtual camera 41, 41a to 41n Individual receiver proximity information extracting device 42 Exchange device 43, 43a to 43n Relay device 44, 44a to 44n Microphone speaker

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) // H04N 5/262 H04N 5/262 (72)発明者 清水 俊宏 東京都世田谷区砧一丁目10番11号 日本放 送協会 放送技術研究所内 (72)発明者 大谷 明 東京都世田谷区砧一丁目10番11号 日本放 送協会 放送技術研究所内 Fターム(参考) 5C023 AA11 AA13 AA14 CA01 CA04 5C025 BA30 CA02 CA19 DA10 5C064 AA02 AB04 AC04 AC06 AC11 AC12 AC16 BA01 BB10 BC16 BC20 BC23 BD01 BD02 BD08─────────────────────────────────────────────────── ─── Continuation of front page (51) Int.Cl. 7 Identification code FI theme code (reference) // H04N 5/262 H04N 5/262 (72) Inventor Toshihiro Shimizu 1-10-11 Kinuta, Setagaya-ku, Tokyo Japan Broadcasting Corporation Broadcasting Technology Research Institute (72) Inventor Akira Otani 1-10-11 Kinuta, Setagaya-ku, Tokyo F-Term inside Broadcasting Technology Research Institute of Japan Broadcasting Corporation (reference) 5C023 AA11 AA13 AA14 CA01 CA04 5C025 BA30 CA02 CA19 DA10 5C064 AA02 AB04 AC04 AC06 AC11 AC12 AC16 BA01 BB10 BC16 BC20 BC23 BD01 BD02 BD08

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 撮影現場の現場映像を撮像する局側撮像
手段と、この局側撮像手段からの現場映像と視聴者側か
ら送信された視聴者の視聴者映像とを合成して出力する
映像合成装置と、前記撮影現場の現場音声を集音する局
側集音手段と、この局側集音手段からの現場音声と前記
視聴者側から送信された視聴者の視聴者音声を合成して
出力する音声合成装置と、を備えることを特徴とする仮
想観客形成装置。
1. A station-side image pickup means for picking up a scene image of a shooting site, and a picture output by synthesizing a scene image from the station-side image pickup means and a viewer image of a viewer transmitted from a viewer side. A synthesizer, a station-side sound collector that collects the on-site sound of the shooting site, and a site sound from this station-side sound collector and a viewer audio of the viewer transmitted from the viewer side are synthesized. A virtual audience forming apparatus, comprising: a voice synthesizing device for outputting.
【請求項2】 前記映像合成装置は、前記局側撮像手段
からの現場映像に対して前記視聴者映像を仮想観客とし
て配列した仮想観客映像として合成し、前記音声合成装
置は前記局側集音手段からの現場音声に対して前記視聴
者音声を前記仮想観客の仮想観客音声として合成するこ
とを特徴とする請求項1に記載の仮想観客形成装置。
2. The video synthesizing device synthesizes a scene image from the station side image pickup means as a virtual spectator image in which the viewer images are arranged as a virtual spectator, and the voice synthesizing device collects the station side sound. The virtual spectator formation device according to claim 1, wherein the viewer voice is synthesized as a virtual spectator voice of the virtual spectator with respect to the on-site voice from the means.
【請求項3】 前記音声合成装置は、前記視聴者音声を
前記現場音声と合成するための通話路と、前記仮想観客
音声同士の相互会話音声とするための通話路とを切換え
る通話路切換手段を有することを特徴とする請求項2に
記載の仮想観客形成装置。
3. The speech synthesizing device switches a speech lane for synthesizing the viewer's voice with the on-site speech and a speech lane for forming a mutual conversation voice between the virtual audience voices. The virtual spectator formation device according to claim 2, further comprising:
【請求項4】 局側の撮影現場の現場映像を撮像すると
共に、局側の撮影現場の現場音声を集音するステップ
と、視聴者側から送信された視聴者の視聴者映像および
視聴者音声からなる視聴者側信号を受信するステップ
と、前記視聴者側信号に含まれる視聴者映像を前記現場
映像の仮想観客映像として合成すると共に、前記視聴者
側信号に含まれる視聴者音声を前記現場音声に仮想観客
の仮想観客音声として合成するステップと、を含むこと
を特徴とする仮想観客形成方法。
4. A step of capturing an on-site video of the shooting site on the station side and collecting the on-site audio of the shooting site on the station side, and a viewer image and a viewer audio of the viewer transmitted from the viewer side. Receiving a viewer-side signal, the viewer image included in the viewer-side signal is synthesized as a virtual audience image of the scene image, and the viewer audio included in the viewer-side signal is included in the scene. Synthesizing the voice as a virtual spectator voice of the virtual spectator.
【請求項5】 視聴者の視聴者映像を撮像する視聴者側
撮像手段と、視聴者の視聴者音声を集音する視聴者側集
音手段と、前記視聴者側撮像手段からの視聴者映像と前
記視聴者側集音手段からの視聴者音声とを視聴者側信号
として局側に送信する送信手段と、前記局側の撮影現場
で生成された現場映像および現場音声に対して、前記視
聴者側信号に含まれる視聴者映像および視聴者音声がそ
れぞれ仮想観客映像および仮想観客音声として合成され
て生成された局側信号として受信される視聴者側受信手
段とを備えることを特徴とする仮想観客形成受信装置。
5. A viewer side image pickup means for picking up a viewer video image of a viewer, a viewer side sound pickup means for collecting a viewer voice of the viewer, and a viewer video image from the viewer side image pickup means. And a viewer sound from the viewer-side sound collecting means as a viewer-side signal to the station side, and the viewing with respect to the site image and site sound generated at the station-side shooting site. And a viewer-side receiving unit that receives as a station-side signal generated by combining a viewer video and a viewer audio included in the viewer-side signal as a virtual spectator video and a virtual spectator audio, respectively. Audience formation receiver.
【請求項6】 前記視聴者音声を前記現場音声に合成し
て仮想観客音声となる通話路と、前記仮想観客音声同士
の相互会話音声となる通話路とを切換える局側の通話路
切換手段を操作する切換操作手段を有することを特徴と
する請求項5に記載の仮想観客形成受信装置。
6. A call path switching means on the station side for switching between a call path which is a virtual audience voice by synthesizing the viewer voice with the on-site voice and a call path which is a mutual conversation voice between the virtual audience voices. The virtual spectator formation receiving device according to claim 5, further comprising switching operation means for operating.
【請求項7】 視聴者の視聴者映像を撮像すると共に、
視聴者の視聴者音声を集音して前記視聴者映像と前記視
聴者音声とを視聴者側信号として局側に送信するステッ
プと、 前記局側の撮影現場の現場映像に前記視聴者映像を仮想
観客として合成された仮想観客映像と、前記撮影現場の
現場音声に前記視聴者音声を仮想観客の音声として合成
された仮想観客音声とが含まれる局側信号として受信す
るステップと、 受信した前記局側信号による映像および音声を視聴者側
の表示装置に表示するステップと、 前記視聴者音声を前記現場音声に合成して仮想観客音声
となる通話路と、前記仮想観客音声同士の相互会話音声
となる通話路とを切換える通話路切換手段を、視聴者側
に設置された切換操作手段により切換え操作するステッ
プと、 を含むことを特徴とする仮想観客形成受信方法。
7. A viewer image of a viewer is captured, and
Collecting the viewer audio of the viewer and transmitting the viewer video and the viewer audio to the station side as a viewer side signal, and the viewer video in the scene video of the shooting site of the station side. Receiving as a station-side signal including a virtual spectator video synthesized as a virtual spectator, and a virtual spectator voice synthesized with the viewer's voice in the on-site voice of the shooting site as a virtual spectator's voice; A step of displaying video and audio by a station side signal on a display device on the viewer side, a speech path that synthesizes the viewer audio with the on-site audio to become a virtual audience sound, and an interactive speech between the virtual audience sounds A virtual audience formation receiving method, which comprises a step of performing a switching operation of a communication path switching means for switching a communication path to be performed by a switching operation means installed on the viewer side.
【請求項8】 視聴者の視聴者映像を局側の撮影現場の
現場映像に合成して仮想観客を実現するためにコンピュ
ータを、 局側の撮影現場の現場映像に、前記局側で受信した視聴
者の視聴者映像を仮想観客として合成する映像合成手
段、 この映像合成手段に対応して前記撮影現場の現場音声
に、前記局側で受信した視聴者の視聴者音声を仮想観客
の仮想観客音声として合成する音声合成手段、 として実行させることを特徴とする仮想観客形成プログ
ラム。
8. A computer for synthesizing a viewer image of a viewer with a site image of a shooting site on a station side to realize a virtual audience is received on the site image of a shooting site on the station side by the station side. Video synthesizing means for synthesizing the viewer video of the viewer as a virtual spectator, and corresponding to this video synthesizing means, the audio of the viewer received by the station side is added to the on-site audio of the shooting site. A virtual audience formation program characterized by being executed as a voice synthesizing means for synthesizing as a voice.
JP2002133236A 2002-05-08 2002-05-08 Virtual customer forming apparatus and method thereof, virtual customer forming reception apparatus and method thereof, and virtual customer forming program Pending JP2003333572A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002133236A JP2003333572A (en) 2002-05-08 2002-05-08 Virtual customer forming apparatus and method thereof, virtual customer forming reception apparatus and method thereof, and virtual customer forming program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002133236A JP2003333572A (en) 2002-05-08 2002-05-08 Virtual customer forming apparatus and method thereof, virtual customer forming reception apparatus and method thereof, and virtual customer forming program

Publications (1)

Publication Number Publication Date
JP2003333572A true JP2003333572A (en) 2003-11-21

Family

ID=29696338

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002133236A Pending JP2003333572A (en) 2002-05-08 2002-05-08 Virtual customer forming apparatus and method thereof, virtual customer forming reception apparatus and method thereof, and virtual customer forming program

Country Status (1)

Country Link
JP (1) JP2003333572A (en)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006050370A (en) * 2004-08-06 2006-02-16 Sony Corp Information processing apparatus and method, recording medium, and program
JP2007020144A (en) * 2005-07-05 2007-01-25 Era Digital Media Co Ltd Content integration method with format and protocol conversion
JP2007028586A (en) * 2005-07-20 2007-02-01 Era Digital Media Co Ltd Interactive multimedia content production system
JP2007036685A (en) * 2005-07-27 2007-02-08 Nippon Hoso Kyokai <Nhk> Video and audio synthesizing unit, and video viewing system of shared remote experience type
JP2007082182A (en) * 2005-09-14 2007-03-29 Era Digital Media Co Ltd Creating method of interactive multimedia content
JP2010232860A (en) * 2009-03-26 2010-10-14 Sony Corp Information processor, content processing method and program
JP2011526089A (en) * 2008-03-17 2011-09-29 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. View panoramic video image stream
US8432431B2 (en) 2008-06-30 2013-04-30 Hewlett-Packard Development Company, L.P. Compositing video streams
JP2013225905A (en) * 2009-09-04 2013-10-31 Korea Electronics Telecommun Wired and wireless coupled server, broadcasting participation terminal device, and method of providing broadcasting participation service
JP2017529024A (en) * 2014-06-30 2017-09-28 ザ ビデオ コール センター,エルエルシー Video call center
JP2018101965A (en) * 2016-12-21 2018-06-28 株式会社 ディー・エヌ・エー System, method for distributing video, and program for use therein
CN110446092A (en) * 2019-07-25 2019-11-12 天脉聚源(杭州)传媒科技有限公司 Virtual auditorium generation method, system, device and medium for sports tournament
JP2020535879A (en) * 2017-09-29 2020-12-10 ソニー・インタラクティブエンタテインメント エルエルシー Venue mapping for watching virtual reality in esports
CN114173068A (en) * 2021-10-29 2022-03-11 北京中联合超高清协同技术中心有限公司 System for audience and rebroadcasting site remote interaction

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4655190B2 (en) * 2004-08-06 2011-03-23 ソニー株式会社 Information processing apparatus and method, recording medium, and program
JP2006050370A (en) * 2004-08-06 2006-02-16 Sony Corp Information processing apparatus and method, recording medium, and program
JP2007020144A (en) * 2005-07-05 2007-01-25 Era Digital Media Co Ltd Content integration method with format and protocol conversion
JP2007028586A (en) * 2005-07-20 2007-02-01 Era Digital Media Co Ltd Interactive multimedia content production system
JP2007036685A (en) * 2005-07-27 2007-02-08 Nippon Hoso Kyokai <Nhk> Video and audio synthesizing unit, and video viewing system of shared remote experience type
JP4644555B2 (en) * 2005-07-27 2011-03-02 日本放送協会 Video / audio synthesizer and remote experience sharing type video viewing system
JP2007082182A (en) * 2005-09-14 2007-03-29 Era Digital Media Co Ltd Creating method of interactive multimedia content
JP2011526089A (en) * 2008-03-17 2011-09-29 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. View panoramic video image stream
US8432431B2 (en) 2008-06-30 2013-04-30 Hewlett-Packard Development Company, L.P. Compositing video streams
JP2010232860A (en) * 2009-03-26 2010-10-14 Sony Corp Information processor, content processing method and program
US8522160B2 (en) 2009-03-26 2013-08-27 Sony Corporation Information processing device, contents processing method and program
JP2013225905A (en) * 2009-09-04 2013-10-31 Korea Electronics Telecommun Wired and wireless coupled server, broadcasting participation terminal device, and method of providing broadcasting participation service
JP2017529024A (en) * 2014-06-30 2017-09-28 ザ ビデオ コール センター,エルエルシー Video call center
JP2018101965A (en) * 2016-12-21 2018-06-28 株式会社 ディー・エヌ・エー System, method for distributing video, and program for use therein
JP2020535879A (en) * 2017-09-29 2020-12-10 ソニー・インタラクティブエンタテインメント エルエルシー Venue mapping for watching virtual reality in esports
CN110446092A (en) * 2019-07-25 2019-11-12 天脉聚源(杭州)传媒科技有限公司 Virtual auditorium generation method, system, device and medium for sports tournament
CN110446092B (en) * 2019-07-25 2023-06-20 北京拉近众博科技有限公司 Virtual auditorium generation method, system, device and medium for sports game
CN114173068A (en) * 2021-10-29 2022-03-11 北京中联合超高清协同技术中心有限公司 System for audience and rebroadcasting site remote interaction

Similar Documents

Publication Publication Date Title
EP1472871B1 (en) Remote server switching of video streams
US20060009867A1 (en) System and method for communicating audio data signals via an audio communications medium
CN108076307B (en) AR-based video conference system and AR-based video conference method
US7966636B2 (en) Multi-video receiving method and apparatus
JP2003333572A (en) Virtual customer forming apparatus and method thereof, virtual customer forming reception apparatus and method thereof, and virtual customer forming program
JP2007028586A (en) Interactive multimedia content production system
JP2003518840A (en) TV video conferencing system
JP2007082182A (en) Creating method of interactive multimedia content
CN111107301A (en) Video conference platform and communication method based on video conference platform
JP2009239762A (en) Video conference system and video conference method
CN111901537B (en) Broadcast television interactive program production mode based on cloud platform
JP4099958B2 (en) Digital broadcast receiver
US20230188770A1 (en) Interactive broadcasting method and system
KR102242371B1 (en) Live untact studio broadcasting system and its operating method
JP2002165200A (en) Service system for remote game watching
JP4363672B2 (en) Video conference system and method, and communication center
JP3159996U (en) Interactive television broadcasting device
JPS63144664A (en) Image multiplex reproduction method
JP3241225U (en) No audience live distribution system
KR20030013012A (en) Unmanned remote module for internet live broadcasting system and remote control apparatus thereof
CN112003875A (en) Video focus content transmission system and method
JP2591439B2 (en) Video synthesis method for video conference
JP2630041B2 (en) Video conference image display control method
JP2010028299A (en) Conference photographed image processing method, conference device, and the like
JP2000287188A (en) System and unit for inter-multi-point video audio communication

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071024

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080304