JP2015053051A - System and method for switching screen display between multiple views using gesture - Google Patents

System and method for switching screen display between multiple views using gesture Download PDF

Info

Publication number
JP2015053051A
JP2015053051A JP2014179191A JP2014179191A JP2015053051A JP 2015053051 A JP2015053051 A JP 2015053051A JP 2014179191 A JP2014179191 A JP 2014179191A JP 2014179191 A JP2014179191 A JP 2014179191A JP 2015053051 A JP2015053051 A JP 2015053051A
Authority
JP
Japan
Prior art keywords
data
view
mobile device
screen
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014179191A
Other languages
Japanese (ja)
Other versions
JP6497002B2 (en
Inventor
シ シュ
Shu Shi
シ シュ
ダブリュ バラス ジョン
John W Barrus
ダブリュ バラス ジョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US14/019,915 external-priority patent/US9197853B2/en
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2015053051A publication Critical patent/JP2015053051A/en
Application granted granted Critical
Publication of JP6497002B2 publication Critical patent/JP6497002B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a system and a method for switching screen display between a video browsing view and a data browsing view.SOLUTION: The system includes a controller, a view presentation module, a screen detection module, and a view switching module. The controller receives data showing the fact that a participant joins a multiuser communication session. The view presentation module visually presents a video stream on a mobile apparatus associated with the participant. The screen detection module determines whether a detection trigger event occurs. The controller receives a video frame image in response to the occurrence of the detection trigger event. The screen detection module detects a data screen included in the video frame image. The view switching module switches a view being displayed on the mobile apparatus from a video browsing view to a data browsing view in response to a gesture performed by the participant.

Description

<関連出願の相互参照>
本願は、2013年5月20日に出願された、「Method of Switching between Views in Mobile Videoconferencing Using Gestures(ジェスチャを使用してモバイル・ビデオ会議中に複数ビュー間で画面表示を切り換える方法)」と題する、米国出願第61/825,482号の35USC§119(e)の下の優先権を主張し、その全文は、引用により本明細書に組み込まれる。
<Cross-reference of related applications>
This application is entitled “Method of Switching between Views in Mobile Videoconferencing Using Gestures” filed on May 20, 2013, and uses a gesture to switch screen display between multiple views during a mobile video conference. US patent application Ser. No. 61 / 825,482, which claims priority under 35 USC §119 (e), which is incorporated herein by reference in its entirety.

本明細書は、ビデオ閲覧ビューとデータ閲覧ビューとの間を切り換えるためのシステムおよび方法に関する。特に、本明細書は、モバイル・ビデオ会議中においてジェスチャ(身振り手振り)を使用してビデオ閲覧ビューとデータ閲覧ビューとの間において画面表示を切り換えるためのシステムおよび方法に関する。   This document relates to systems and methods for switching between a video browsing view and a data browsing view. In particular, the specification relates to a system and method for switching screen displays between a video viewing view and a data viewing view using gestures during a mobile video conference.

既存のビデオ会議システムは、ビデオ会議セッション中にビデオ・ストリームおよびオーディオ・ストリームと共にデータ・ストリームを収集し、送信する。これは、大半のビジネス・ミーティングでは、ユーザが、互いに相手を見ることだけでなく、文書、プレゼンテーションのスライド、手書きのコメント等といったデータ情報を相互に交換することも見込んでいるからである。これらのデータ・ストリームは通常、コンピュータ画面から直接取り込まれ、特別なコーディング・ツールによって別個に符号化され、遠隔サイトにおいてビデオ・ストリームと並べて画面表示される。   Existing video conferencing systems collect and transmit data streams along with video and audio streams during video conferencing sessions. This is because, in most business meetings, users expect not only to see each other but also to exchange data information such as documents, presentation slides, handwritten comments, and the like. These data streams are typically captured directly from the computer screen, encoded separately by special coding tools, and screened alongside the video stream at the remote site.

モバイル機器の爆発的な増加は、スマートフォン用およびタブレット端末用のアプリケーション等のモバイル・アプリケーションを開発するよう、ビデオ会議サービスのプロバイダをますます駆り立てる。これらのモバイル・アプリケーションは、ユーザがモバイル機器を使用してより一層容易にどこからでもビデオ会議サービスにアクセスできるようにする。   The explosive growth of mobile devices increasingly drives video conferencing service providers to develop mobile applications such as smartphone and tablet terminal applications. These mobile applications allow users to more easily access video conferencing services from anywhere using mobile devices.

しかしながら、ビデオ閲覧ビューとデータ閲覧ビューの両方をモバイル・デバイスで同時に画面表示する際に以下のような問題が生じることがある。モバイル機器は、画面サイズが限られているゆえに、ビデオ閲覧ビューとデータ閲覧ビューの両方を最大解像度で並べて画面表示することは不可能である。現在、一般に使用される方法では、一方の閲覧ビューを最大画面スケールで表示しながら、他方の閲覧ビューについてはサムネイル表示のみを表示するようなユーザ・インターフェースを使用する。この種のユーザ・インターフェースは、ビデオ閲覧ビューとデータ閲覧ビューとを組み合わせる形で同時にに画面表示する。そのようなユーザ・インターフェースは、ユーザ・インターフェースを複数のビュー表示モードに分離することにより一元化されたユーザ体験を提供することができず、2つ以上のデータ・ストリームがある場合にユーザが混乱をきたす可能性がある。   However, when both the video browsing view and the data browsing view are simultaneously displayed on the mobile device, the following problems may occur. Since the mobile device has a limited screen size, it is impossible to display the video browsing view and the data browsing view side by side at the maximum resolution. Currently, commonly used methods use a user interface that displays only one thumbnail view for the other viewing view while displaying one viewing view on a maximum screen scale. This type of user interface simultaneously displays a screen in a combination of a video browsing view and a data browsing view. Such a user interface cannot provide a centralized user experience by separating the user interface into multiple view display modes, and confuses the user when there are two or more data streams. There is a possibility of coming.

本開示は、モバイル機器上でビデオ閲覧ビューとデータ閲覧ビューとの間で画面表示を切り換えるためのシステムおよび方法を含む。本発明に係る一実施形態において、このシステムは、コントローラ、ビュー提示モジュール、画面検出モジュール、およびビュー切り換えモジュールを含む。コントローラは、参加者がマルチユーザ通信セッションに加わることを示すデータを受信する。ビュー提示モジュールは、マルチユーザ通信セッション上のビデオ・ストリームを参加者に関連付けられたモバイル機器上において視覚的に提示する。画面検出モジュールは、検出トリガ・イベントの発生の有無を判定する。コントローラは、検出トリガ・イベントの発生に応答して、ビデオ・ストリームからのビデオ・フレーム画像を受信する。画面検出モジュールは、ビデオ・フレーム画像中の第1のデータ画面を検出する。コントローラは、モバイル機器に向かって実行された第1のジェスチャ(身振り手振り)を表すデータを受信する。ビュー切り換えモジュールは、第1のジェスチャに応答して、モバイル機器において画面表示中のビューをビデオ閲覧ビューからデータ閲覧ビューに切り換える。ビュー提示モジュールが、第1のデータ画面に関連付けられた第1のデータ・ストリームをモバイル機器上において視覚的に提示する。   The present disclosure includes systems and methods for switching screen displays between a video browsing view and a data browsing view on a mobile device. In one embodiment according to the present invention, the system includes a controller, a view presentation module, a screen detection module, and a view switching module. The controller receives data indicating that the participant is participating in a multi-user communication session. The view presentation module visually presents the video stream on the multi-user communication session on the mobile device associated with the participant. The screen detection module determines whether or not a detection trigger event has occurred. The controller receives a video frame image from the video stream in response to the occurrence of the detection trigger event. The screen detection module detects a first data screen in the video frame image. The controller receives data representing a first gesture (gesture gesture) performed toward the mobile device. In response to the first gesture, the view switching module switches a view being displayed on the screen from the video browsing view to the data browsing view in the mobile device. A view presentation module visually presents a first data stream associated with the first data screen on the mobile device.

本発明に係るさらに別の実施形態は、コンピュータで実現される方法として実施され、そのような方法として以下のステップを有する方法が実行される。本実施形態に係る当該方法は、第1の参加者、第2の参加者、および第3の参加者がマルチユーザ通信セッションに加わったことを示すデータを受信する。当該方法は、マルチユーザ通信セッションのビデオ・ストリームを第3の参加者に関連付けられたモバイル機器の上において視覚的に提示する。当該方法は、第1の参加者に関連付けられた第1のデバイスと第2の参加者に関連付けられた第2のデバイスとを送信元として含む第1のビデオ・ストリームからのビデオ・フレーム画像を受信する。当該方法は、ビデオ・フレーム画像中に含まれる第1のデバイスからの第1のデータ画面と第2のデバイスからの第2のデータ画面とを検出する。当該方法は、当該モバイル機器で実行された第1のデータ画面の選択操作を表すデータを受信する。当該方法は、当該データ画面の選択操作に応答して、モバイル機器上において表示中のビューをビデオ閲覧ビューから第1のデータ画面に対応する第1のデータ閲覧ビューへと切り換える。当該方法は、当該モバイル機器の上において第1のデータ・ストリームを視覚的に提示する。   Yet another embodiment according to the present invention is implemented as a computer-implemented method, and a method having the following steps is executed as such a method. The method according to the present embodiment receives data indicating that a first participant, a second participant, and a third participant have joined a multi-user communication session. The method visually presents a video stream of a multi-user communication session on a mobile device associated with a third participant. The method includes a video frame image from a first video stream that includes as a source a first device associated with a first participant and a second device associated with a second participant. Receive. The method detects a first data screen from a first device and a second data screen from a second device included in a video frame image. The method receives data representing a first data screen selection operation performed on the mobile device. In response to the selection operation of the data screen, the method switches the view being displayed on the mobile device from the video browsing view to the first data browsing view corresponding to the first data screen. The method visually presents a first data stream on the mobile device.

本発明を実施するためのその他の実施態様は、上述した実施態様およびその他の革新的な実施態様に関する対応する方法、システム、装置およびコンピュータ・プログラム製品を含む。   Other embodiments for practicing the invention include corresponding methods, systems, apparatuses and computer program products relating to the embodiments described above and other innovative embodiments.

本明細書に添付した図面においては、図中に示される同一の参照番号は、同様の構成要素を参照するために使用され、これは、本発明の実施形態を単に例示するためであり、本発明の技術的範囲を限定することを意図するものではない。   In the drawings appended hereto, the same reference numerals shown in the figures are used to refer to similar components, which are merely for the purpose of illustrating embodiments of the present invention. It is not intended to limit the technical scope of the invention.

ビデオ閲覧ビューとデータ閲覧ビューとの間を切り換えるためのシステムの一実施形態を示す高水準ブロック図。1 is a high-level block diagram illustrating one embodiment of a system for switching between a video browsing view and a data browsing view. ビデオ閲覧ビューとデータ閲覧ビューとの間を切り換えるためのシステムのさらに別の実施形態を示す高水準ブロック図。FIG. 6 is a high-level block diagram illustrating yet another embodiment of a system for switching between a video browsing view and a data browsing view. 参加アプリケーションの一実施形態を示すブロック図。The block diagram which shows one Embodiment of a participating application. データ画面検出を実行するための処理の一実施形態をグラフィック表現により示す図。The figure which shows one Embodiment of the process for performing a data screen detection by a graphical representation. ジェスチャを使用してモバイル機器の上でビデオ閲覧ビューとデータ閲覧ビューとの間を切り換えるための一実施形態をグラフィック表現で示す図。FIG. 4 is a graphical representation of one embodiment for switching between a video browsing view and a data browsing view on a mobile device using a gesture. モバイル機器上におけるビデオ・ビュー・モードを示すグラフィック・ユーザ・インターフェースの一実施形態をグラフィック表現で示す図。FIG. 4 is a graphical representation of one embodiment of a graphical user interface showing a video view mode on a mobile device. モバイル機器上におけるデータ・ビュー・モードを示すグラフィック・ユーザ・インターフェースの一実施形態をグラフィック表現で示す図。FIG. 4 is a graphical representation of one embodiment of a graphical user interface showing a data view mode on a mobile device. モバイル機器上における埋め込み型のデータ・ビュー・モードを示すグラフィック・ユーザ・インターフェースの一実施形態をグラフィック表現で示す図。FIG. 4 is a graphical representation of one embodiment of a graphical user interface showing an embedded data view mode on a mobile device. マルチユーザ通信セッション中にジェスチャを使用してビデオ閲覧ビューとデータ閲覧ビューとの間を切り換えるための方法の一実施形態を示す流れ図。6 is a flow diagram illustrating one embodiment of a method for switching between a video browsing view and a data browsing view using gestures during a multi-user communication session. マルチユーザ通信セッション中にジェスチャを使用してビデオ閲覧ビューとデータ閲覧ビューとの間を切り換えるための方法のさらに別の実施形態を示す流れ図。6 is a flow diagram illustrating yet another embodiment of a method for switching between a video browsing view and a data browsing view using gestures during a multi-user communication session. マルチユーザ通信セッション中にジェスチャを使用してビデオ閲覧ビューとデータ閲覧ビューとの間を切り換えるための方法のさらに別の実施形態を示す流れ図。6 is a flow diagram illustrating yet another embodiment of a method for switching between a video browsing view and a data browsing view using gestures during a multi-user communication session. マルチユーザ通信セッション中にジェスチャを使用してビデオ閲覧ビューとデータ閲覧ビューとの間を切り換えるための方法のさらに別の実施形態を示す流れ図。6 is a flow diagram illustrating yet another embodiment of a method for switching between a video browsing view and a data browsing view using gestures during a multi-user communication session. マルチユーザ通信セッション内において実行される選択操作を使用して2つの異なるデータ閲覧ビューのいずれか一方とビデオ閲覧ビューとの間で表示を切り換えるための方法の一実施形態を示す流れ図。6 is a flow diagram illustrating one embodiment of a method for switching a display between one of two different data viewing views and a video viewing view using a selection operation performed within a multi-user communication session.

本開示において説明されるシステムは、非常に多くの点で特に有利である。第一に、このシステムは、ピンチ・ジェスチャといったジェスチャ(身振り手振り)を使用してビデオ閲覧ビューとデータ閲覧ビューとの間を参加者が切り換えることを可能にし、それにより、モバイル・ビデオ会議のセッションを含むマルチユーザ通信セッション中において一貫したシームレスなユーザ体験を提供することができる。   The system described in this disclosure is particularly advantageous in numerous ways. First, the system allows participants to switch between video browsing and data browsing views using gestures such as pinch gestures, thereby enabling mobile video conferencing sessions. Can provide a consistent and seamless user experience during a multi-user communication session.

第二に、このシステムは、ビデオ・フレーム画像中のデータ画面を自動で検出することができる。このシステムにおいては、データ画面を最大解像度で画面表示するデータ閲覧ビューに切り換える前に、参加者はそのデータ画面をビデオ閲覧ビューで見ることができるので、データ画面に表示されるデータ・ストリームとビデオ閲覧ビューに表示されるビデオ・コンテンツとの間の関係を参加者が理解することがそのデータ画面により可能となる。その結果、本実施形態は、2つ以上のデータ・ストリームが存在する際に参加者が混乱する事態を回避することができる。例えば、会議室内の発表者が、プロジェクタの画面とホワイト・ボードの画面といった2つ以上のデータ画面間を頻繁に移動する場合に、本実施形態に係るシステムは、離れた位置に居る閲覧者の視線がビデオ閲覧ビューと投影画面内のデータ閲覧ビューとの間を行き来することによる混乱を解消し、またはビデオ閲覧ビューとホワイト・ボード上の画面に表示されたデータ閲覧ビューとの間を頻繁に切り換える際に、離れた位置に居る閲覧者の視線がプロジェクタの画面とホワイト・ボード上の画面との間を行き来することによる混乱を解消することができる。   Second, the system can automatically detect the data screen in the video frame image. In this system, before the data screen is switched to the data viewing view that displays the data screen at full resolution, the participant can view the data screen in the video viewing view, so the data stream and video displayed on the data screen are displayed. The data screen allows the participant to understand the relationship between the video content displayed in the browsing view. As a result, this embodiment can avoid a situation in which a participant is confused when there are two or more data streams. For example, when a presenter in a conference room frequently moves between two or more data screens such as a projector screen and a whiteboard screen, the system according to the present embodiment allows a viewer at a distant location to Eliminate confusion caused by gazes moving between the video browsing view and the data browsing view in the projection screen, or frequently between the video browsing view and the data browsing view displayed on the screen on the whiteboard When switching, it is possible to eliminate the confusion caused by the viewer's line of sight at a distant position going back and forth between the screen of the projector and the screen on the whiteboard.

第三に、このシステムは、埋め込み型のデータ・ストリームをサポートし、当該埋め込み型のデータ・ストリームをユーザに提供することができる。例えば、当該システムは、現在のミーティングのデータ・ストリームをデータ・ビュー・モードで視覚提示し得るが、現在のミーティングのデータ・ストリームは、ミーティングの様子を表示するたためのビデオ・クリップである。このビデオ・クリップには、以前のミーティング中に提示されたスライドおよびホワイト・ボードのストローク情報が埋め込まれている。当該システムは、データ・ビュー・モードから埋め込み型のデータ・ビュー・モードに切り換わって、上記のように埋め込まれたスライドおよびホワイト・ボードのストローク情報を最大解像度で現在のミーティングの参加者に提示することができる。当該システムは、これ以外にも非常に多くのその他の技術的利点を有し得る。   Third, the system can support an embedded data stream and provide the embedded data stream to the user. For example, the system may present a current meeting data stream visually in a data view mode, but the current meeting data stream is a video clip for displaying the state of the meeting. This video clip embeds the slide and whiteboard stroke information presented during the previous meeting. The system switches from data view mode to embedded data view mode and presents the slide and whiteboard stroke information embedded as described above to the current meeting participant at maximum resolution. can do. The system can have numerous other technical advantages besides this.

ビデオ閲覧ビューとデータ閲覧ビューとの間で画面表示を切り換えるためのシステムおよび方法が以下に説明される。以下の記述においては、説明の便宜上、本発明の完全な理解を提供するために、非常に多くの特定の詳細内容が述べられる。しかしながら、本発明に係る実施形態がこれらの特定の詳細内容なしに実現され得ることは当業者にとって明らかであろう。その他の例では、本発明に関する説明を曖昧にすることを回避するために構造および装置類がブロック図の形態で示される。例えば、本発明は、スマートフォンのようなモバイル機器および特定のソフトウェアおよびハードウェアに関連して以下の一実施形態において説明される。しかしながら、この説明は、データおよびコマンドを受信することができる任意のタイプのコンピューティング装置およびサービスを提供する任意の周辺デバイスについても同様に当てはまる。   A system and method for switching the screen display between a video browsing view and a data browsing view is described below. In the following description, for the purposes of explanation, numerous specific details are set forth in order to provide a thorough understanding of the present invention. However, it will be apparent to those skilled in the art that embodiments according to the invention may be practiced without these specific details. In other instances, structures and devices are shown in block diagram form in order to avoid obscuring the description of the invention. For example, the present invention is described in one embodiment below in connection with mobile devices such as smartphones and specific software and hardware. However, this description is equally applicable to any type of computing device that can receive data and commands and any peripheral device that provides services.

本明細書における「一実施形態」または「一つの実施形態」についての言及は、その実施形態に関連して説明される特定の特徴、構造、または特性が少なくとも1つの実施形態に含まれることを意味する。本明細書における様々な箇所での「一実施形態において」という句の出現は、必ずしもそれら全てが同一の実施形態に言及しているとは限らない。   References herein to "one embodiment" or "one embodiment" indicate that a particular feature, structure, or characteristic described in connection with that embodiment is included in at least one embodiment. means. The appearances of the phrase “in one embodiment” in various places in the specification are not necessarily all referring to the same embodiment.

本発明に関する以下の詳細な説明の幾つかの部分は、コンピュータ・メモリ内のデータビットに対して実行される演算のアルゴリズムおよび記号表現の観点から提示される。これらのアルゴリズムによる説明および表現は、データ処理技術における当業者が、自身の研究開発成果の実質的内容を、当該技術分野における他の当業者に対して最も効果的に伝達するために使用する説明手段である。本明細書中において、および一般的な意味において、アルゴリズムとは、所望される結果を導くための一連の処理動作ステップから成る自己矛盾のない逐次的な系列であるものと考えられる。上述した処理動作ステップは、物理量の物理的な操作を要求するステップである。必ずとは限らないが通常であれば、これらの物理量は、記憶され、転送され、合成され、比較され、そうでなければ操作されることが可能な電気的な信号または磁気的な信号の形態をとる。主として用語についての一般的な使用法上の理由により、時としてこれらの信号を、ビット、値、要素、記号、文字、項、数、等と呼ぶことが便利であることが証明されている。   Some portions of the following detailed description of the present invention are presented in terms of algorithms and symbolic representations of operations performed on data bits within a computer memory. These algorithmic descriptions and representations are used by those skilled in the data processing arts to most effectively convey the substance of their research and development to others skilled in the art. Means. In this specification and in a general sense, an algorithm is considered to be a self-consistent sequential sequence of a series of processing operation steps to derive a desired result. The processing operation steps described above are steps for requesting physical manipulation of physical quantities. Usually, though not necessarily, these physical quantities are in the form of electrical or magnetic signals that can be stored, transferred, combined, compared, and otherwise manipulated. Take. It has proven convenient at times, principally for reasons of common usage of terms, to refer to these signals as bits, values, elements, symbols, characters, terms, numbers, or the like.

しかしながら、これらの用語および同様の用語の全てが、適切な物理量に関連付けられるべきであることに留意すべきであり、これらの用語および同様の用語の全てが、これらの物理量を呼称するために適用された便利な標示にすぎないことに留意すべきである。以下の議論から明らかであるように、そうではないとの特段の記載がない限り、本明細書中の説明全体を通して、「処理すること」または「コンピュータ処理すること」または「計算すること」または「決定すること」または「画面表示すること」、等といった用語を利用してなされる議論は、コンピュータ・システム(または同種の電子的コンピューティング装置)の動作および処理のことを指して言うものと理解され、そのようなコンピュータ・システムは、当該コンピュータ・システムのレジスタ内およびメモリ内の物理(電子)量として表現されたデータを操作して、当該コンピュータ・システムのメモリ内またはレジスタ内において同様に物理量として表現された他のデータへと変換する、またはその他の同様の情報記憶装置内、または送信/表示のための機器内において同様に物理量として表現された他のデータへと変換する。   However, it should be noted that all of these terms and similar terms should be associated with the appropriate physical quantities, and all of these terms and similar terms apply to refer to these physical quantities. It should be noted that this is just a convenient indication made. As will be apparent from the discussion below, unless otherwise stated, throughout the description herein, “processing” or “computing” or “calculating” or Discussions made using terms such as “determining” or “displaying” etc. refer to the operation and processing of a computer system (or similar electronic computing device). Understandably, such computer systems operate on data expressed as physical (electronic) quantities in the computer system's registers and in memory, and similarly in the computer system's memory or registers. Converting to other data expressed as physical quantities, or in other similar information storage devices, Others into other data represented as physical quantities as well in the device for transmission / display.

本発明はまた、本明細書中において記述された一連の処理動作を実行するための装置に関する。この装置は、要求された目的のために特別に構築されることができ、またはこの装置は、コンピュータ内に記憶されたコンピュータ・プログラムによって選択的に起動されるかまたは再構成される汎用コンピュータを備えることが可能である。そのようなコンピュータ・プログラムは、以下のものだけに限定はされないないが、フロッピー(登録商標)ディスク、光学ディスク、CD−ROM、および磁気ディスクを含む任意のタイプのディスク、読み出し専用メモリ(ROM)、ランダム・アクセス・メモリ(RAM)、EPROM、EEPROM、磁気カードまたは光学カード、不揮発性メモリを有するUSBキーを含むフラッシュ・メモリ、または電子的命令コードを記憶するのに適した任意のタイプの記憶媒体などを含むコンピュータ読み取り可能記憶媒体に記憶されることが可能であり、上述したディスク装置類や記憶装置類の各々は、コンピュータ・システムのバスに結合される。   The present invention also relates to an apparatus for performing the series of processing operations described herein. This device can be specially constructed for the required purpose, or it can be a general purpose computer that is selectively activated or reconfigured by a computer program stored in the computer. It is possible to provide. Such computer programs include, but are not limited to, any type of disk, including but not limited to floppy disk, optical disk, CD-ROM, and magnetic disk, read only memory (ROM). , Random access memory (RAM), EPROM, EEPROM, magnetic or optical card, flash memory including USB key with non-volatile memory, or any type of storage suitable for storing electronic instruction codes Each of the disk devices and storage devices described above can be coupled to a computer system bus.

本発明に係る幾つかの実施形態は、完全にハードウェアによって実装される実施形態、完全にソフトウェアによって実装される実施形態、またはハードウェアとソフトウェアの要素の両方を含む実施形態などの多様な形態をとることができる。好ましい実施形態はソフトウェアで実現され、ソフトウェアは、ファームウェア、常駐ソフトウェア、マイクロコード、等を含むが、これらに限定されない。   Some embodiments of the present invention may be implemented in a variety of forms, such as embodiments that are implemented entirely in hardware, embodiments that are implemented entirely in software, or embodiments that include both hardware and software elements. Can be taken. Preferred embodiments are implemented in software, which includes but is not limited to firmware, resident software, microcode, etc.

さらに、本発明に係る幾つかの実施形態は、コンピュータで使用可能なまたはコンピュータで読み取り可能な媒体からアクセス可能な、コンピュータ・プログラム製品の形態をとることができ、当該コンピュータ・プログラム製品は、コンピュータまたは任意の命令実行システムによって実行されるプログラム・コードまたはそれらの機器と関連して使用するためのプログラム・コードを提供する。本発明を説明する便宜上の目的のため、コンピュータで使用可能なまたはコンピュータで読み取り可能な媒体は、命令実行システム、装置、またはデバイスによって実行される、またはそれらと関連して使用するためのプログラムを含み、記憶し、通信し、伝搬し、または伝送することが可能な任意の装置とすることができる。   Furthermore, some embodiments according to the invention may take the form of a computer program product accessible from a computer usable or computer readable medium, the computer program product comprising: Alternatively, program code executed by any instruction execution system or program code for use in connection with those devices is provided. For convenience in describing the present invention, a computer usable or computer readable medium is a program executed by or used in connection with an instruction execution system, apparatus, or device. It can be any device that can contain, store, communicate, propagate, or transmit.

プログラム・コードを記憶および/または実行するのに適したデータ処理システムは、システム・バスによってメモリ素子に直接的または間接的に結合される少なくとも1つのプロセッサを含むだろう。メモリ素子は、プログラム・コードを実際に実行している間に使用されるローカル・メモリ、大容量記憶装置、およびキャッシュ・メモリを含むことが可能であり、当該キャッシュ・メモリは、プログラム実行中にプログラム・コードが大容量記憶装置内から検索されなくてはならない回数を減じるために当該プログラム・コードの少なくとも一時的な記憶を提供する一時記憶メモリである。入力/出力デバイスすなわちI/Oデバイス(キーボード、ディスプレイ、ポインティングデバイス、等を含むがこれらに限定されない)は、直接的にシステムに結合されるか、または介在するI/Oコントローラを介してシステムに結合されるかのいずれかの方法によって結合され得る。   A data processing system suitable for storing and / or executing program code will include at least one processor coupled directly or indirectly to memory elements through a system bus. The memory elements can include local memory, mass storage, and cache memory that are used during actual execution of program code, and the cache memory can be used during program execution. Temporary storage memory that provides at least temporary storage of the program code to reduce the number of times that the program code must be retrieved from the mass storage device. Input / output devices or I / O devices (including but not limited to keyboards, displays, pointing devices, etc.) can be directly coupled to the system or via an intervening I / O controller to the system. It can be bound by any method of being bound.

当該データ処理システムには、ネットワーク・アダプタがさらにに結合され、それによって、介在するプライベートネットワークまた公衆ネットワークを経由して、当該データ処理システムが、他のデータ処理システムまたはリモート・プリンタまたは記憶デバイスに結合されることを可能にし得る。モデム、ケーブル・モデム、およびイーサネット(登録商標)・カードは、現在利用可能なタイプのネットワーク・アダプタのほんの一部である。   A network adapter is further coupled to the data processing system so that the data processing system can be connected to other data processing systems or remote printers or storage devices via an intervening private or public network. It may be possible to be combined. Modems, cable modems, and Ethernet cards are just a few of the currently available types of network adapters.

最後に、本明細書に提示されるアルゴリズムおよび表示は、任意の特定のコンピュータまたは他の装置と固有に関連するものではない。様々な汎用システムが本明細書における教示に係るプログラムとともに使用されることもできるし、または、より特殊化された装置を構築して要求される方法のステップを実行することが便利であることが当業者にとって理解可能であろう。様々なこれらのシステムのために要求される構造は、以下の説明から明白であろう。加えて、本明細書は、任意の特定のプログラミング言語に関連して説明されるものではない。様々なプログラミング言語が本明細書に説明される様々な実施形態の教示を実装するために使用され得ることが理解されるだろう。   Finally, the algorithms and displays presented herein are not inherently related to any particular computer or other device. Various general purpose systems can be used with the programs according to the teachings herein, or it may be convenient to construct more specialized devices to perform the required method steps. It will be understandable to those skilled in the art. The required structure for a variety of these systems will appear from the description below. In addition, the specification is not described with reference to any particular programming language. It will be appreciated that a variety of programming languages may be used to implement the teachings of the various embodiments described herein.

<システムの概要>
図1Aは、本発明に係る一実施形態に従って、ビデオ閲覧ビューとデータ閲覧ビューとの間で画面表示を切り換えるためのシステム100のブロック図を示す。図示されたシステム100は、ホスト135によってアクセス可能なホスティング・デバイス101と、登録サーバ130と、カメラ103と、表示デバイス107a〜107nと、参加者125a〜125nによってアクセス可能なモバイル機器115a〜115nとを含む。図1Aおよび残りの図面において、参照番号の後に続く文字、例えば「115a」の末尾の「a」は、その参照番号を有する複数の要素の中の特定のインスタンスへの言及を表現する。後続する文字のない本文中の参照番号、例えば「115」は、その参照番号を持つ複数の要素の中の一つ以上の不特定インスタンスへの一般的な言及を表現する。図示された実施形態において、システム100のこれらのエンティティは、ネットワーク105を介して通信可能に結合される。
<System overview>
FIG. 1A shows a block diagram of a system 100 for switching a screen display between a video browsing view and a data browsing view according to one embodiment of the invention. The illustrated system 100 includes a hosting device 101 accessible by a host 135, a registration server 130, a camera 103, display devices 107a-107n, and mobile devices 115a-115n accessible by participants 125a-125n. including. In FIG. 1A and the remaining figures, a letter following a reference number, eg, “a” at the end of “115a”, represents a reference to a particular instance among the elements having that reference number. A reference number in the text without a following character, for example “115”, represents a general reference to one or more unspecified instances in a plurality of elements having that reference number. In the illustrated embodiment, these entities of system 100 are communicatively coupled via network 105.

ネットワーク105は、従来のタイプの有線ネットワークまたは無線ネットワークとすることが可能であり、そのネットワーク・トポロジが、スター型構成、トークンリング型構成、またはその他の構成を含み得る非常に多くの異なる構成を有することができる。さらに、ネットワーク105は、ローカル・エリア・ネットワーク(LAN)、広域ネットワーク(WAN)(例えば、インターネット)、および/または、複数のデバイスが互いに通信し得るように相互接続されたその他のデータ伝送経路を含み得る。本発明に係る幾つかの実施形態において、ネットワーク105は、ピア・ツー・ピア型ネットワークとすることが可能である。ネットワーク105はまた、様々な異なる通信プロトコルによってデータを送信する電気通信ネットワークに結合され得るか、またはそのような電気通信ネットワークを一部として含む。本発明に係る幾つかの実施形態において、ネットワーク105は、データを送信および受信するためのBluetooth(登録商標)通信ネットワークまたはセルラー通信ネットワークを含み、当該セルラー通信ネットワークは、ショート・メッセージング・サービス(SMS)、マルチメディア・メッセージング・サービス(MMS)、ハイパーテキスト・トランスファー・プロトコル(HTTP)、直接的なデータ接続、WAP、eメール、等を介した通信サービス機能を含む。図1Aは、モバイル機器115と、ホスティング・デバイス101と、登録サーバ130とに結合された、1つのネットワーク105を示すが、実際には、1つ以上のネットワーク105がこれらのエンティティに接続されるようにすることが可能である。   The network 105 can be a conventional type of wired or wireless network, and its network topology can have many different configurations that can include a star configuration, a token ring configuration, or other configurations. Can have. In addition, network 105 may include a local area network (LAN), a wide area network (WAN) (eg, the Internet), and / or other data transmission paths interconnected so that multiple devices can communicate with each other. May be included. In some embodiments according to the present invention, the network 105 may be a peer-to-peer network. Network 105 may also be coupled to or include, as part, a telecommunications network that transmits data via a variety of different communication protocols. In some embodiments according to the present invention, the network 105 includes a Bluetooth or cellular communication network for transmitting and receiving data, the cellular communication network comprising a short messaging service (SMS). ), Multimedia messaging service (MMS), hypertext transfer protocol (HTTP), direct data connection, WAP, email, etc. Although FIG. 1A shows one network 105 coupled to mobile device 115, hosting device 101, and registration server 130, in practice one or more networks 105 are connected to these entities. It is possible to do so.

ホスティング環境137は、マルチユーザ通信セッションをホスティングするための環境とすることが可能である。マルチユーザ通信セッションの具体例は、ビデオ会議ミーティングのための通信セッションを含む。幾つかの具体例において、ホスティング環境137は、図1Aにおける破線のボックス内の全てのデバイスがユーザに視認可能な部屋である。例えば、ホスティング環境137は、会議室内に存在する1つ以上の表示デバイス107および1つ以上のカメラ103を含む会議室環境とすることが可能である。表示デバイス107の具体例は、プロジェクタ、電子式ホワイト・ボード、液晶ディスプレイ、および任意のその他の従来型表示デバイスを含むが、これらに限定されない。本発明に係る一実施形態において、カメラ103は、高性能のビデオ会議カメラである。カメラ103の具体例は、高解像度ビデオを取り込む高解像度(HD)ビデオカメラ、機械的に制御され得るパン・チルト・ズーム(PTZ)式カメラ、または、ホスティング環境137内においてマルチ・ビューまたはパノラマ・ビューを提供する一群のカメラのグループを含むが、これらに限定されない。2つの表示デバイス107と1つのカメラ103が図1Aに示されているが、ホスティング環境137は、1つ以上の表示デバイス107と1つ以上のカメラ103を含むことも可能である。   The hosting environment 137 can be an environment for hosting a multi-user communication session. Specific examples of multi-user communication sessions include communication sessions for video conferencing meetings. In some implementations, the hosting environment 137 is a room where all devices in the dashed box in FIG. 1A are visible to the user. For example, the hosting environment 137 may be a conference room environment that includes one or more display devices 107 and one or more cameras 103 present in the conference room. Specific examples of display device 107 include, but are not limited to, projectors, electronic whiteboards, liquid crystal displays, and any other conventional display device. In one embodiment according to the invention, the camera 103 is a high performance video conference camera. Specific examples of the camera 103 include a high-definition (HD) video camera that captures high-resolution video, a pan / tilt / zoom (PTZ) camera that can be mechanically controlled, or a multi-view or panoramic view within the hosting environment 137. This includes but is not limited to a group of cameras that provide a view. Although two display devices 107 and one camera 103 are shown in FIG. 1A, the hosting environment 137 may also include one or more display devices 107 and one or more cameras 103.

ホスティング・デバイス101、表示デバイス107a〜107n、およびカメラ103は、ホスティング環境137内に設置される。ホスティング・デバイス101は、信号線116を介して表示デバイス107aに通信可能に結合され、信号線118を介して表示デバイス107nに通信可能に結合され、信号線114を介してカメラ103に通信可能に結合される。表示デバイス107aは任意付加的に、信号線102を介して登録サーバ130に結合され、表示デバイス107nは任意付加的に、信号線104を介して登録サーバ130に結合され、カメラ103は任意付加的に、信号線112を介して登録サーバ130に結合される。   The hosting device 101, the display devices 107a to 107n, and the camera 103 are installed in the hosting environment 137. The hosting device 101 is communicatively coupled to the display device 107 a via the signal line 116, is communicatively coupled to the display device 107 n via the signal line 118, and is communicable to the camera 103 via the signal line 114. Combined. Display device 107a is optionally coupled to registration server 130 via signal line 102, display device 107n is optionally coupled to registration server 130 via signal line 104, and camera 103 is optional. In addition, it is coupled to the registration server 130 via the signal line 112.

ホスティング・デバイス101は、プロセッサおよびメモリを含むコンピューティング装置とすることが可能であり、信号線131を介してネットワーク105に結合される。例えば、ホスティング・デバイス101は、ハードウェア・サーバである。さらに別の具体例では、ホスティング・デバイス101は、ラップトップ型コンピュータまたはデスクトップ型コンピュータである。ホスティング・デバイス101は、ホスト135(例えば、ミーティングを管理するユーザ)によってアクセスされる。ホスティング・デバイス101は、ホスティング・アプリケーション109と、ホスティング・アプリケーション109によって生成されたプレゼンテーションを記憶するための記憶デバイスとを含む。   Hosting device 101 may be a computing device that includes a processor and memory, and is coupled to network 105 via signal line 131. For example, the hosting device 101 is a hardware server. In yet another embodiment, hosting device 101 is a laptop computer or a desktop computer. Hosting device 101 is accessed by host 135 (eg, a user who manages the meeting). The hosting device 101 includes a hosting application 109 and a storage device for storing presentations generated by the hosting application 109.

ホスティング・アプリケーション109は、マルチユーザ通信セッションをホスティングするためのソフトウェアを含む。例えば、ホスティング・アプリケーション109は、ホスト135が管理し、1人以上の参加者125が1つ以上のモバイル機器115を使用して参加するビデオ会議ミーティングをホスティングする。さらに別の具体例では、ホスティング・アプリケーション109は、プレゼンテーションを行うためのスライドを生成する。   Hosting application 109 includes software for hosting a multi-user communication session. For example, the hosting application 109 hosts a video conference meeting managed by the host 135 and attended by one or more participants 125 using one or more mobile devices 115. In yet another implementation, the hosting application 109 generates a slide for giving a presentation.

本発明に係る一実施形態において、ホスティング・アプリケーション109は、ホスティング環境137内に存在する1つ以上の表示デバイス107上の1つ以上のデータ画面内において、他の参加者125との間で共有されるデータを表示する。参加者125との間で共有されるデータは、テキストに基づいた文書、ウェブページ・コンテンツ、プレゼンテーションのスライド、ビデオ・クリップ、ストロークに基づいた手書きのコメント、および/または他のユーザの注釈、等を含むが、これらに限定されない。ホスティング環境137における1つ以上のデータ画面は、カメラ103を介して視認可能である。例えば、離れた位置に居る他の参加者125と共有されるプレゼンテーションのスライドは、壁に投影され、当該プレゼンテーションのスライドの投影(または、投影の少なくとも所定の部分)は、カメラ103の視野内にある。この場合においては、カメラ103は、当該プレゼンテーションのスライドの投影をビデオ・ストリームの1つ以上のビデオ・フレーム画像中に取り込むことができる。   In one embodiment of the present invention, the hosting application 109 is shared with other participants 125 in one or more data screens on one or more display devices 107 residing in the hosting environment 137. The data to be displayed. Data shared with participants 125 includes text-based documents, web page content, presentation slides, video clips, handwritten comments based on strokes, and / or other user annotations, etc. Including, but not limited to. One or more data screens in the hosting environment 137 are visible via the camera 103. For example, a presentation slide shared with other participants 125 at a distant location is projected onto a wall, and the projection of the presentation slide (or at least a predetermined portion of the projection) is within the field of view of the camera 103. is there. In this case, the camera 103 can capture the projection of the slides of the presentation into one or more video frame images of the video stream.

さらに別の具体例において、会議室内のユーザが電子式ホワイト・ボードにコメントを書く場合、ホスティング・アプリケーション109は、当該電子式ホワイト・ボードがカメラ103から視認可能となるように、カメラ103を制御してその位置を移動させることができる。この場合においては、カメラ103は、当該電子式ホワイト・ボードに示されたコメントをビデオ・ストリーム内の1つ以上のビデオ・フレーム画像中に取り込むことができる。カメラ103は、ホスティング環境137を描写するビデオ・フレーム画像を含むビデオ・ストリームを取り込み、このビデオ・フレーム画像は、表示デバイス107のデータ画面および/またはホスティング・デバイス101のデータ画面の映像を含む。   In yet another embodiment, when a user in the meeting room writes a comment on the electronic whiteboard, the hosting application 109 controls the camera 103 so that the electronic whiteboard is visible from the camera 103. The position can be moved. In this case, the camera 103 can capture the comments shown on the electronic whiteboard in one or more video frame images in the video stream. The camera 103 captures a video stream that includes a video frame image that depicts the hosting environment 137, which includes a data screen of the display device 107 and / or a video of the data screen of the hosting device 101.

本発明に係る一実施形態において、カメラ103は、ホスティング・デバイス101に対してビデオ・ストリームを送信し、それを契機としてホスティング・デバイス101は、登録サーバ130およびモバイル機器115のうちの1つ以上に対してビデオストリームを転送することとなる。本発明に係るさらに別の実施形態では、カメラ103は当該ビデオ・ストリームを登録サーバ130に対して直接送信する、および/または、当該ビデオ・ストリームをモバイル機器115に対してネットワーク105を介して送信する。さらなる別の実施形態では、カメラ103は、検出トリガ・イベントの発生に応答して、カメラ103によって取り込まれた最新のビデオ・フレーム画像を登録サーバ130に対して送信する。検出トリガ・イベントは、図2を参照しながら以下においてより詳細に説明される。   In an embodiment according to the present invention, the camera 103 transmits a video stream to the hosting device 101, and the hosting device 101 is triggered by one or more of the registration server 130 and the mobile device 115. For this, the video stream is transferred. In yet another embodiment of the present invention, the camera 103 transmits the video stream directly to the registration server 130 and / or transmits the video stream to the mobile device 115 via the network 105. To do. In yet another embodiment, the camera 103 transmits the latest video frame image captured by the camera 103 to the registration server 130 in response to the occurrence of the detection trigger event. The detection trigger event is described in more detail below with reference to FIG.

本発明に係る一実施形態において、ホスティング・アプリケーション109または表示デバイス107は、表示デバイス107のデータ画面に表示されたデータ・ストリームの高品質バージョンを取り込む。データ画面に表示されたデータ・ストリームのこの高品質バージョンは、データ画面に関連付けられたデータ・ストリームと呼ばれ、この高品質バージョンは、経時的に表示デバイス107のデータ画面に表示されたコンテンツを描写する一連のデータ画面の映像(例えば、スクリーン・ショット画像)を含む。上記のようなデータ画面のスクリーン・ショット画像は、特定の瞬間時間においてデータ画面上に表示されたコンテンツを描写する。それぞれ異なる瞬間時間においてデータ画面のそれぞれ異なるスクリーン・ショット画像が取り込まれ、データ画面の一連の異なる時点における複数のスクリーン・ショット画像は、データ画面に関連付けられたデータ・ストリームを形成する。幾つかの具体例において、データ画面のスクリーン・ショット画像の各々はまた、データ・ストリーム中に含まれる一つのデータ・フレームとも呼ばれ得る。   In one embodiment according to the present invention, the hosting application 109 or the display device 107 captures a high quality version of the data stream displayed on the data screen of the display device 107. This high quality version of the data stream displayed on the data screen is referred to as the data stream associated with the data screen, and this high quality version displays the content displayed on the data screen of the display device 107 over time. Contains a series of data screen images (eg, screen shot images) to depict. The screen shot image of the data screen as described above depicts the content displayed on the data screen at a specific moment in time. Different screen shot images of the data screen are captured at different instantaneous times, and the plurality of screen shot images at a series of different points in the data screen form a data stream associated with the data screen. In some implementations, each of the screen shot images of the data screen may also be referred to as a data frame included in the data stream.

幾つかの具体例において、ホスティング・アプリケーション109は、スライドのプレゼンテーションを高解像度で表現する一連のスクリーン・ショット画像を、プレゼンテーション用のコンピューティング装置から直接取り込む。幾つかの追加の具体例では、電子式ホワイト・ボードの画面に表示された元のストローク情報を当該電子式ホワイト・ボードが取り込み、続いて、当該電子式ホワイト・ボードが、元のストローク情報を描写するスクリーン・ショット画像をホスティング・アプリケーション109に対して送信する。   In some implementations, the hosting application 109 captures a series of screen shot images representing the slide presentation in high resolution directly from the computing device for presentation. In some additional embodiments, the electronic whiteboard captures the original stroke information displayed on the screen of the electronic whiteboard, and then the electronic whiteboard captures the original stroke information. A screen shot image to be rendered is sent to the hosting application 109.

本発明に係る一実施形態において、ホスティング・アプリケーション109は、データ画面に関連付けられたデータ・ストリームを、モバイル機器115および登録サーバ130のうちの1つ以上に対して送信する。さらに別の実施形態では、1つ以上のデータ画面画像を含むデータストリームをモバイル機器115および登録サーバ130のうちの1つ以上に対して表示デバイス107が直接送信する。例えば、表示デバイス107は、登録サーバ130に最も新しいデータ画面の映像を定期的に送信する。   In one embodiment according to the invention, the hosting application 109 transmits a data stream associated with the data screen to one or more of the mobile device 115 and the registration server 130. In yet another embodiment, display device 107 directly transmits a data stream including one or more data screen images to one or more of mobile device 115 and registration server 130. For example, the display device 107 periodically transmits the video of the newest data screen to the registration server 130.

本発明に係る一実施形態に従うならば、登録サーバ130上において参加アプリケーション123aを動作可能とすることができる。登録サーバ130は、プロセッサおよびメモリを含み、信号線106を介してネットワーク105に結合される。登録サーバ130は、登録された画像を記憶するためのデータベースを含む。登録サーバ130は、表示デバイス107を登録し、カメラ103からミーティングに関するビデオ映像情報のフィードを受信する。当該ビデオ映像情報のフィードは、1つ以上のビデオ・フレーム画像を含む。登録サーバ130は、画像マッチング・アルゴリズムを実行し、それにより、最新のビデオ・フレームと、表示デバイス107またはホスティング・デバイス101に関連付けられたデータ画面の最新のスクリーン・ショット画像との間における対応関係を見出す。マッチングが見出された場合には、マッチングした画像領域がビデオ・フレーム画像内においてハイライト表示され、モバイル機器115上において画面表示される。登録サーバ130は、図2および図3Aを参照しながら以下においてより詳細に説明される。   According to an embodiment of the present invention, the participating application 123a can be operated on the registration server 130. Registration server 130 includes a processor and memory and is coupled to network 105 via signal line 106. The registration server 130 includes a database for storing registered images. The registration server 130 registers the display device 107 and receives a feed of video image information related to the meeting from the camera 103. The video video information feed includes one or more video frame images. The registration server 130 executes an image matching algorithm, whereby the correspondence between the latest video frame and the latest screen shot image of the data screen associated with the display device 107 or hosting device 101. Find out. If a match is found, the matched image region is highlighted in the video frame image and displayed on the screen on the mobile device 115. Registration server 130 is described in more detail below with reference to FIGS. 2 and 3A.

本発明に係るさらに別の実施形態に従うならば、モバイル機器115a内において参加アプリケーション123bが記憶されることが可能であり、参加アプリケーション123bは、信号線108を介してネットワーク105に接続される。モバイル機器115a、115bは、メモリおよびプロセッサを含む装置であって、限られた画面表示スペースを有するコンピューティング装置(例えば、ラップトップ型コンピュータ、タブレット型コンピュータ、携帯電話、スマートフォン、携帯情報端末(PDA)、モバイル型のeメールデバイス、またはネットワーク105にアクセス可能なその他の電子デバイス)である。モバイル機器115は、データを表示し、参加者125からのジェスチャを受信するためのタッチスクリーンを含む。ジェスチャの具体例は、タップ操作、ダブルタップ操作、長押し操作、スクロール操作、パン操作、フリック操作、二本指によるタップ操作、ピンチ・オープン操作、ピンチ・クローズ操作等を含むが、これらに限定されない。   According to yet another embodiment of the present invention, a participating application 123b can be stored in the mobile device 115a, and the participating application 123b is connected to the network 105 via the signal line. The mobile devices 115a and 115b are devices including a memory and a processor, and have a limited screen display space (for example, a laptop computer, a tablet computer, a mobile phone, a smartphone, a personal digital assistant (PDA)). ), A mobile e-mail device, or other electronic device accessible to the network 105). Mobile device 115 includes a touch screen for displaying data and receiving gestures from participant 125. Specific examples of gestures include, but are not limited to, tap operations, double tap operations, long press operations, scroll operations, pan operations, flick operations, two-finger tap operations, pinch / open operations, pinch / close operations, etc. Not.

図示された実施形態において、参加者125aは、モバイル機器115aと対話する。モバイル機器115nは、信号線110を介してネットワーク105と通信可能に結合される。参加者125nは、モバイル機器115nと対話する。参加者125は、ホスティング・デバイス101によってホスティングされたビデオ会議セッションのようなマルチユーザ通信セッションに参加するリモート・ユーザとすることが可能である。図1Aにおけるモバイル機器115a、115nは、具体例として使用されている。図1Aは、2つのモバイル機器115aおよび115nを示しているが、本開示は、1つ以上の任意の個数のモバイル機器115を有するシステム・アーキテクチャにも適用される。   In the illustrated embodiment, participant 125a interacts with mobile device 115a. The mobile device 115n is communicatively coupled to the network 105 via the signal line 110. Participant 125n interacts with mobile device 115n. Participant 125 may be a remote user participating in a multi-user communication session, such as a video conference session hosted by hosting device 101. The mobile devices 115a and 115n in FIG. 1A are used as specific examples. Although FIG. 1A shows two mobile devices 115a and 115n, the present disclosure also applies to a system architecture having any number of mobile devices 115 of one or more.

本発明に係る一実施形態において、参加アプリケーション123は、参加アプリケーション123の一部が、モバイル機器115a、115nにおいてそれぞれ部分的に記憶され、参加アプリケーション123の別の一部が、登録サーバ130において部分的に記憶され得るように分散された形で記憶される。例えば、登録サーバ130が画面検出ステップを実行する一方で、モバイル機器115における参加アプリケーション123bは、ビデオ・ストリームまたはデータ・ストリームを表示するシンクライアント・アプリケーションとしての役割を果たす。モバイル機器115aにおける参加アプリケーション123bは、例えばブラウザで画像をレンダリング処理することにより、ビデオ・ストリームまたはデータ・ストリームを視覚的に提示するよう、ディスプレイ装置に指示する。参加アプリケーション123bは、参加者125からユーザ入力操作(例えば、ジェスチャ)を受信し、ユーザ入力操作の意味を解釈する。例えば、参加アプリケーション123bがビデオ・ストリームを現在表示中であると仮定する。参加アプリケーション123bが参加者125aからユーザ入力操作を受信して画面を非常に大きく拡大したのでユーザ入力操作が閾値を超えると、参加アプリケーション123bは、画面表示の対象となるストリームがホスティング・デバイス101のデータ・ストリームに切り換えられるべきであると決定する。参加アプリケーション123bは、ビデオ・ストリームからデータ・ストリームに切り換えることを示す命令を、登録サーバ130上の参加アプリケーション123aに対して送信する。   In one embodiment according to the present invention, the participating application 123 includes a part of the participating application 123 that is partially stored in the mobile devices 115a and 115n, and another part of the participating application 123 that is partially stored in the registration server 130. Stored in a distributed fashion so that they can be stored automatically. For example, while the registration server 130 performs the screen detection step, the participating application 123b in the mobile device 115 serves as a thin client application that displays a video stream or a data stream. The participating application 123b in the mobile device 115a instructs the display device to visually present the video stream or data stream, for example, by rendering the image in a browser. The participating application 123b receives a user input operation (for example, a gesture) from the participant 125, and interprets the meaning of the user input operation. For example, assume that participating application 123b is currently displaying a video stream. Since the participation application 123b receives the user input operation from the participant 125a and greatly enlarges the screen, when the user input operation exceeds the threshold, the participation application 123b displays the stream to be displayed on the screen of the hosting device 101. Determine that it should be switched to the data stream. The participating application 123b transmits a command indicating switching from the video stream to the data stream to the participating application 123a on the registration server 130.

参加アプリケーション123は、マルチユーザ通信セッションに参加するためのコードおよびルーチンとすることが可能である。本発明に係る一実施形態において、参加アプリケーション123は、フィールド・プログラマブル・ゲート・アレイ(FPGA)または特定用途向け集積回路(ASIC)を含むハードウェアを使用して実現され得る。さらに別の実施形態において、参加アプリケーション123は、ハードウェアおよびソフトウェアの組み合わせを使用して実現され得る。本発明に係る様々な実施形態において、参加アプリケーション123は、デバイスおよびサーバの組み合わせにおいて記憶され、あるいはデバイスまたはサーバのいずれか一方の上に記憶され得る。   Participating application 123 may be code and routines for participating in a multi-user communication session. In one embodiment according to the present invention, the participating application 123 may be implemented using hardware including a field programmable gate array (FPGA) or application specific integrated circuit (ASIC). In yet another embodiment, participating application 123 may be implemented using a combination of hardware and software. In various embodiments according to the present invention, the participating application 123 may be stored in a device and server combination or may be stored on either the device or the server.

図1Bは、ビデオ閲覧ビューとデータ閲覧ビューとの間で画面表示を切り換えるためのシステムのさらに別の実施形態である。この実施形態では、ホスティング・デバイス101が存在しない。代わりに、モバイル機器115が、カメラ103および参加アプリケーション123bを備え得る。モバイル機器115は、信号線136、138をそれぞれ経由して、表示デバイス107a、107nに結合される。   FIG. 1B is yet another embodiment of a system for switching the screen display between a video browsing view and a data browsing view. In this embodiment, there is no hosting device 101. Instead, the mobile device 115 may include the camera 103 and the participating application 123b. Mobile device 115 is coupled to display devices 107a and 107n via signal lines 136 and 138, respectively.

参加者125は、モバイル機器115におけるカメラ103を起動し、カメラ103を表示デバイス107a、107nに向けて表示デバイス107a、107nのコンテンツを取り込むことができる。モバイル機器115は、信号線154を介して登録サーバ130に対して画像を直接送信し得る。例えば、そのような画像は、モバイル機器115からのクエリ(問い合わせ)としての役割を果たし得る。参加アプリケーション123は、取り込まれた画像を使用してビデオ閲覧ビューから画面を検出し、参加者125からジェスチャによる入力操作を受信することに応答してデータ閲覧ビューへと画面表示を切り換える。   The participant 125 can activate the camera 103 in the mobile device 115 and point the camera 103 toward the display devices 107a and 107n to capture the contents of the display devices 107a and 107n. The mobile device 115 can transmit the image directly to the registration server 130 via the signal line 154. For example, such an image may serve as a query from the mobile device 115. The participating application 123 detects the screen from the video browsing view using the captured image, and switches the screen display to the data browsing view in response to receiving an input operation by the gesture from the participant 125.

<参加アプリケーションの実施例>
ここで図2を参照すると、参加アプリケーション123の例がより詳細に示されている。図2は、幾つかの例に係るコンピューティング装置200のブロック図であり、参加アプリケーション123、プロセッサ235、メモリ237、入力/出力デバイス241、通信ユニット239、および記憶デバイス243を含む。コンピューティング装置200のコンポーネントは、バス220によって通信可能に結合される。入力/出力デバイス241は、信号線242を介してバス200に通信可能に結合される。本発明に係る幾つかの実施形態において、コンピューティング装置200は、モバイル機器115および登録サーバ130のいずれか一方とすることが可能である。例えば、一実施形態において、登録サーバ130は、以下に説明されるコンポーネントの幾つかとともに参加アプリケーション123を含むことができ、モバイル機器115は、以下に説明される他のコンポーネントの幾つかを含むことが可能である。
<Examples of participating applications>
Referring now to FIG. 2, an example of a participating application 123 is shown in more detail. FIG. 2 is a block diagram of a computing device 200 according to some examples, including a participating application 123, a processor 235, a memory 237, an input / output device 241, a communication unit 239, and a storage device 243. The components of computing device 200 are communicatively coupled by bus 220. Input / output device 241 is communicatively coupled to bus 200 via signal line 242. In some embodiments according to the invention, the computing device 200 can be either the mobile device 115 or the registration server 130. For example, in one embodiment, registration server 130 can include participating application 123 along with some of the components described below, and mobile device 115 includes some of the other components described below. Is possible.

プロセッサ235は、演算を実行し、表示デバイスに電子表示信号を提供するための、算術論理ユニット、マイクロプロセッサ、汎用コントローラ、または何らかの他のプロセッサ・アレイを含む。プロセッサ235は、他のコンポーネントとの通信のために信号線222を介してバス220に結合される。プロセッサ235は、データ信号を処理し、複合命令セット・コンピュータ(CISC)アーキテクチャ、縮小命令セット・コンピュータ(RISC)アーキテクチャ、または命令セットの組み合わせを実現するアーキテクチャを含む様々なコンピューティング・アーキテクチャを含み得る。図2は単一のプロセッサ235を含むが、複数のプロセッサ235が含まれていても良い。一実施形態においては、上記以外の他のプロセッサ、オペレーティング・システム、センサ機器、ディスプレイ装置、およびその他の物理的構成を採用することもまた可能である。   The processor 235 includes an arithmetic logic unit, microprocessor, general purpose controller, or some other processor array for performing operations and providing electronic display signals to a display device. Processor 235 is coupled to bus 220 via signal line 222 for communication with other components. The processor 235 may process a data signal and include a variety of computing architectures including a complex instruction set computer (CISC) architecture, a reduced instruction set computer (RISC) architecture, or an architecture that implements a combination of instruction sets. . Although FIG. 2 includes a single processor 235, multiple processors 235 may be included. In one embodiment, other processors, operating systems, sensor devices, display devices, and other physical configurations other than those described above may also be employed.

メモリ237は、プロセッサ235によって実行され得る命令および/またはデータを記憶する。メモリ237は、他のコンポーネントとの通信のために信号線224を介してバス220に結合される。命令および/またはデータは、本明細書に説明される技法を実行するためのプログラム・コードを含み得る。メモリ237は、ダイナミックランダム・アクセス・メモリ(DRAM)デバイス、スタティック・ランダム・アクセス・メモリ(SRAM)デバイス、フラッシュ・メモリ、またはその他の何らかのメモリ・デバイスとすることが可能である。幾つかの実施形態において、メモリ237はさらに、ハード・ディスク・ドライブ、フロッピー・ディスク・ドライブ、CD−ROMデバイス、DVD−ROMデバイス、DVD−RAMデバイス、DVD−RWデバイス、フラッシュ・メモリ・デバイス、または、より永続的な形で情報を記憶するための他の何らかの大容量記憶デバイスを含む不揮発性メモリまたは同様の永続的な記憶デバイスおよび媒体を含む。   Memory 237 stores instructions and / or data that may be executed by processor 235. Memory 237 is coupled to bus 220 via signal line 224 for communication with other components. The instructions and / or data may include program code for performing the techniques described herein. The memory 237 may be a dynamic random access memory (DRAM) device, a static random access memory (SRAM) device, flash memory, or some other memory device. In some embodiments, the memory 237 further includes a hard disk drive, a floppy disk drive, a CD-ROM device, a DVD-ROM device, a DVD-RAM device, a DVD-RW device, a flash memory device, Or non-volatile memory or similar permanent storage devices and media including some other mass storage device for storing information in a more permanent form.

通信ユニット239は、参加アプリケーション123がどこに記憶されるかに依存して、ホスティング・デバイス101、モバイル機器115、および登録サーバ130のうちの少なくとも1つとデータを送受信する。通信ユニット239は、信号線226を介してバス220に結合される。幾つかの実施形態において、通信ユニット239は、ネットワーク105または別個の通信チャネルへの直接的な物理接続のための通信ポートを含む。例えば、通信ユニット239は、モバイル機器115との有線通信のためのUSB、SD、CAT−5または同様の通信ポートを含む。幾つかの実施形態において、通信ユニット239は、IEEE802.11、IEEE802.16、BLUETOOTH(登録商標)、または別の適切な無線通信方法を含む、1つ以上の無線通信方法を使用して、モバイル機器115または他の通信チャネルとデータを交換するための無線トランシーバを含む。   The communication unit 239 sends and receives data to and from at least one of the hosting device 101, the mobile device 115, and the registration server 130 depending on where the participating application 123 is stored. Communication unit 239 is coupled to bus 220 via signal line 226. In some embodiments, the communication unit 239 includes a communication port for direct physical connection to the network 105 or a separate communication channel. For example, the communication unit 239 includes a USB, SD, CAT-5 or similar communication port for wired communication with the mobile device 115. In some embodiments, the communication unit 239 may use one or more wireless communication methods, including IEEE 802.11, IEEE 802.16, BLUETOOTH®, or another suitable wireless communication method to It includes a wireless transceiver for exchanging data with device 115 or other communication channel.

幾つかの実施形態において、通信ユニット239は、ショート・メッセージング・サービス(SMS)、マルチメディア・メッセージング・サービス(MMS)、ハイパーテキスト・トランスファー・プロトコル(HTTP)、直接的なデータ接続、WAP、eメール、またはさらに別の適切なタイプの電子的通信サービス機能を介したものを含むセルラー通信ネットワークを経由してデータを送信および受信するためのセルラー通信トランシーバを含む。幾つかの実施形態において、通信ユニット239は、有線通信ポートおよび無線トランシーバを含む。通信ユニット239はまた、ファイルおよび/またはメディア・オブジェクトの配信のために、TCP/IP、HTTP、HTTPS、およびSMTP、等を含む標準的なネットワーク・プロトコルを使用して、ネットワーク105への他の従来的な接続機能を提供する。   In some embodiments, the communication unit 239 includes a short messaging service (SMS), a multimedia messaging service (MMS), a hypertext transfer protocol (HTTP), a direct data connection, WAP, e A cellular communications transceiver for transmitting and receiving data via a cellular communications network, including via mail, or yet another suitable type of electronic communications service function. In some embodiments, the communication unit 239 includes a wired communication port and a wireless transceiver. The communication unit 239 also uses other standard network protocols including TCP / IP, HTTP, HTTPS, SMTP, etc. for the delivery of files and / or media objects to other networks 105. Provides a traditional connection function.

記憶デバイス243は、本明細書中において説明される機能を提供するためのデータを記憶する非一時的なメモリとすることが可能である。記憶デバイス243は、ダイナミック・ランダム・アクセス・メモリ(DRAM)デバイス、スタティック・ランダム・アクセス・メモリ(SRAM)デバイス、フラッシュ・メモリ、またはその他の幾つかの種別のメモリ・デバイスとすることが可能である。幾つかの実施形態において、記憶デバイス243はさらに、ハード・ディスク・ドライブ、フロッピー・ディスク・ドライブ、CD−ROMデバイス、DVD−ROMデバイス、DVD−RAMデバイス、DVD−RWデバイス、フラッシュ・メモリ・デバイス、またはより永続的な形で情報を記憶するための他の何らかの大容量記憶デバイスを含む不揮発性メモリまたは同様の永続的な記憶デバイスおよび媒体を含む。   Storage device 243 may be a non-transitory memory that stores data for providing the functionality described herein. The storage device 243 can be a dynamic random access memory (DRAM) device, a static random access memory (SRAM) device, flash memory, or some other type of memory device. is there. In some embodiments, the storage device 243 further includes a hard disk drive, a floppy disk drive, a CD-ROM device, a DVD-ROM device, a DVD-RAM device, a DVD-RW device, a flash memory device. Or non-volatile memory or similar permanent storage devices and media including any other mass storage device for storing information in a more permanent form.

図示された実施形態において、記憶デバイス243は、信号線228を介してバス220と通信可能に結合される。一実施形態において、記憶デバイス243は、1つ以上のビデオ・フレーム画像を含むビデオ・ストリーム、1つ以上のデータ画面の画像を含むデータ・ストリーム、および1つ以上の検出トリガ・イベント等のうちの1つ以上を記憶する。記憶デバイス243は、本明細書中において説明される機能を提供するためのその他のデータを記憶することが可能である。例えば、記憶デバイス243は、プレゼンテーション、文書、オーディオ・クリップ、ビデオ・クリップ等といった、ビデオ会議用資料のコピーを記憶し得る。   In the illustrated embodiment, the storage device 243 is communicatively coupled to the bus 220 via signal line 228. In one embodiment, the storage device 243 includes a video stream that includes one or more video frame images, a data stream that includes images of one or more data screens, one or more detection trigger events, etc. Remember one or more of Storage device 243 may store other data for providing the functionality described herein. For example, the storage device 243 may store a copy of the video conference material, such as a presentation, document, audio clip, video clip, and the like.

図2において図示された実施形態において、参加アプリケーション123は、コントローラ202、ビュー提示モジュール204、画面検出モジュール206、ビュー切り換えモジュール208およびユーザ・インターフェース・モジュール210に加えてオプションとしてカメラ調節モジュール212を含む。参加アプリケーション123の上述した複数のコンポーネント同士は、バス220を介して通信可能に結合される。当業者は、上述したコンポーネントの一部が、モバイル機器115上に部分的に記憶されることが可能であり、上述したコンポーネントの残りの一部が登録サーバ130上に部分的に記憶されることが可能であることを認識するだろう。例えば、登録サーバ130上に記憶された参加アプリケーション123は、画面検出モジュール206を含むことが可能であり、モバイル機器115上に記憶された参加アプリケーション123は、残りのコンポーネントを含むことが可能である。   In the embodiment illustrated in FIG. 2, the participating application 123 optionally includes a camera adjustment module 212 in addition to the controller 202, view presentation module 204, screen detection module 206, view switching module 208 and user interface module 210. . The plurality of components of the participating application 123 described above are coupled to each other via the bus 220 so as to communicate with each other. Those skilled in the art will appreciate that some of the components described above may be partially stored on the mobile device 115 and the remaining portion of the components described above may be partially stored on the registration server 130. Will recognize that is possible. For example, the participating application 123 stored on the registration server 130 can include the screen detection module 206 and the participating application 123 stored on the mobile device 115 can include the remaining components. .

コントローラ202は、参加アプリケーション123とコンピューティング装置200内の他のコンポーネントとの間の通信を取り扱うためのルーチンを含むソフトウェアとすることが可能である。一実施形態において、コントローラ202は、参加アプリケーション123とコンピューティング措置200内の他のコンポーネントとの間の通信を取り扱うために後述する機能を実現するようプロセッサ235によって実行可能な命令のセットとすることが可能である。さらに別の実施形態において、コントローラ202は、コンピューティング装置200のメモリ237内に記憶されることが可能であり、プロセッサ235によってアクセス可能かつ実行可能であり得る。いずれの実施形態においても、コントローラ202は、信号線230を介して、プロセッサ235とコンピューティング装置200内の他のコンポーネントとの間における協働および通信を実現するように適合し得る。   The controller 202 may be software that includes routines for handling communications between the participating application 123 and other components in the computing device 200. In one embodiment, the controller 202 is a set of instructions that can be executed by the processor 235 to implement the functions described below to handle communication between the participating application 123 and other components in the computing arrangement 200. Is possible. In yet another embodiment, the controller 202 can be stored in the memory 237 of the computing device 200 and can be accessible and executable by the processor 235. In any embodiment, controller 202 may be adapted to provide cooperation and communication between processor 235 and other components in computing device 200 via signal line 230.

一実施形態において、コントローラ202は、通信ユニット239を介して、モバイル機器115、ホスティング・デバイス101、および登録サーバ130のうちの1つ以上とデータを送受信する。例えば、コントローラ202は、通信ユニット239を介して、モバイル機器115上で操作を行う参加者125からユーザ入力操作を受信し、当該ユーザ入力操作をビュー切り換えモジュール208に送信する。別の例では、コントローラ202は、ユーザ・インターフェース・モジュール210から、ユーザ・インターフェースを参加者125に提供するためのグラフィカル・データを受信し、当該グラフィカル・データをモバイル機器115に送信し、それを契機として、モバイル機器115は、当該ユーザ・インターフェースを参加者125に対して視覚的に提示する。   In one embodiment, the controller 202 sends and receives data to and from one or more of the mobile device 115, the hosting device 101, and the registration server 130 via the communication unit 239. For example, the controller 202 receives a user input operation from the participant 125 who performs an operation on the mobile device 115 via the communication unit 239 and transmits the user input operation to the view switching module 208. In another example, the controller 202 receives graphical data from the user interface module 210 to provide a user interface to the participant 125, transmits the graphical data to the mobile device 115, and receives it. As an opportunity, the mobile device 115 visually presents the user interface to the participant 125.

一実施形態において、コントローラ202は、参加アプリケーション123内の他のコンポーネントからデータを受信し、そのデータを記憶デバイス243内に記憶する。例えば、コントローラ202は、画面検出モジュール206から1つ以上の検出トリガ・イベントを表すデータを受信し、そのデータを記憶デバイス243内に記憶する。さらに別の実施形態において、コントローラ202は、記憶デバイス243の中からデータを検索し、そのデータを参加アプリケーション123内の他のコンポーネントに送信する。例えば、コントローラ202は、記憶デバイス243中からデータ・ストリームを検索し、参加者125にデータ・ストリームを視覚提示するためのビュー提示モジュール204に対してそのデータ・ストリームを送信する。   In one embodiment, the controller 202 receives data from other components in the participating application 123 and stores the data in the storage device 243. For example, the controller 202 receives data representing one or more detection trigger events from the screen detection module 206 and stores the data in the storage device 243. In yet another embodiment, the controller 202 retrieves data from the storage device 243 and sends the data to other components in the participating application 123. For example, the controller 202 retrieves the data stream from the storage device 243 and sends the data stream to the view presentation module 204 for visually presenting the data stream to the participant 125.

ビュー提示モジュール204は、モバイル機器115上においてビデオ閲覧ビューまたはデータ閲覧ビューを提示するためのルーチンを含むソフトウェアとすることが可能である。一実施形態において、ビュー提示モジュール204は、モバイル機器115上においてデータ閲覧ビューまたはビデオ閲覧ビューを提示するための後述する機能を実現するようプロセッサ235によって実行可能な命令のセットとすることが可能である。さらに別の実施形態において、ビュー提示モジュール204は、コンピューティング装置200のメモリ237内に記憶されることが可能であり、プロセッサ235によってアクセス可能かつ実行可能であり得る。いずれの実施形態においても、ビュー提示モジュール204は、信号線232を介して、プロセッサ235とコンピューティング装置200内の他のコンポーネントとの間の協働および通信を実現するように適合し得る。   View presentation module 204 may be software that includes routines for presenting a video browsing view or a data browsing view on mobile device 115. In one embodiment, the view presentation module 204 can be a set of instructions that can be executed by the processor 235 to implement the functions described below for presenting a data viewing view or a video viewing view on the mobile device 115. is there. In yet another embodiment, the view presentation module 204 can be stored in the memory 237 of the computing device 200 and can be accessible and executable by the processor 235. In any embodiment, view presentation module 204 may be adapted to provide cooperation and communication between processor 235 and other components within computing device 200 via signal line 232.

ビデオ・ビュー・モードは、マルチユーザ通信セッションに関連付けられたビデオ・データを参加者125に視覚的に提示する。例えば、ビデオ・ビュー・モードは、マルチユーザ通信セッションにおける他の参加者のビデオ・ストリームを、モバイル機器115上において全画面で参加者125に対して視覚的に提示する。別の例において、ビデオ・ビュー・モードは、ビデオ・ストリームをモバイル機器115上において最大解像度で視覚提示する。   Video view mode visually presents video data associated with a multi-user communication session to participant 125. For example, the video view mode visually presents the video streams of other participants in the multi-user communication session to the participant 125 in full screen on the mobile device 115. In another example, the video view mode visually presents the video stream on the mobile device 115 at full resolution.

本発明に係る一実施形態において、ビュー提示モジュール204は、参加者125がマルチユーザ通信セッションに加わることを示すデータを、参加者125に関連付けられたモバイル機器115から受信する。それに応答して、モバイル機器115は、ビデオ・ビュー・モードに遷移する。ビュー提示モジュール204は、カメラ103から直接的にまたはホスティング・デバイス101を介して1つ以上のビデオ・フレーム画像を含むビデオストリームを受信し、そのビデオ・ストリームをモバイル機器115のディスプレイ装置によって参加者125に対して視覚的に提示する。   In one embodiment according to the present invention, the view presentation module 204 receives data from the mobile device 115 associated with the participant 125 that indicates that the participant 125 will participate in the multi-user communication session. In response, the mobile device 115 transitions to the video view mode. The view presentation module 204 receives a video stream including one or more video frame images directly from the camera 103 or via the hosting device 101, and the video stream is received by the display device of the mobile device 115 as a participant. 125 is presented visually.

幾つかの例では、カメラ103と同一のホスティング環境137内にある1つ以上のデータ画面は、ビデオ・ストリーム内の1つ以上のビデオ・フレーム画像の中に取り込まれ、当該1つ以上のビデオ・フレーム画像は、1つ以上のデータ画面を描写するサブ画像を含む。例えば、当該1つ以上のビデオ・フレーム画像は少なくとも、ホスティング・デバイス101のデータ画面の一部、壁に投影された画面の一部、および/または電子式ホワイト・ボードのデータ画面の一部を取り込む。別の例では、1つ以上のビデオ・フレーム画像は、ホスティング・デバイス101の全データ画面、壁に投影された画面全体、および/または電子式ホワイト・ボードのデータ画面全体を取り込む。   In some examples, one or more data screens in the same hosting environment 137 as the camera 103 are captured in one or more video frame images in a video stream, and the one or more video The frame image includes sub-images that depict one or more data screens. For example, the one or more video frame images may include at least a portion of the hosting device 101 data screen, a portion of the screen projected on the wall, and / or a portion of the electronic whiteboard data screen. take in. In another example, the one or more video frame images capture the entire data screen of the hosting device 101, the entire screen projected on the wall, and / or the entire electronic whiteboard data screen.

データ・ビュー・モードは、マルチユーザ通信セッションに関連付けられたデータ・ストリームを参加者125に対して視覚的に提示するモードである。例えば、データ・ビュー・モードは、マルチユーザ通信セッションの継続期間中に視覚提示されているスライドを有するデータ・ストリームを、モバイル機器115上において全画面表示で参加者125に対して視覚的に提示する。別の例では、データ・ビュー・モードは、データ・ストリームをモバイル機器115上において最大解像度で視覚提示する。   Data view mode is a mode in which a data stream associated with a multi-user communication session is visually presented to participant 125. For example, the data view mode visually presents a data stream with slides that are visually presented during the duration of the multi-user communication session to the participant 125 in full screen on the mobile device 115. To do. In another example, the data view mode visually presents the data stream on the mobile device 115 at full resolution.

本発明に係る一実施形態において、ビュー提示モジュール204は、検出されたデータ画面の識別子(ID)に加えて、モバイル機器115において表示中のビューがビデオ閲覧ビューからデータ閲覧ビューに切り換えられるべきであることを示すビュー切り換え信号を、ビュー切り換えモジュール208から受信する。幾つかの実施形態において、ビュー提示モジュール204は、検出されたデータ画面に関連付けられたデータ・ストリームを、そのデータ画面に関連付けられた表示デバイス107から直接的に受信する。他の幾つかの実施形態において、ビュー提示モジュール204は、ホスティング・デバイス101を介してデータ・ストリームを受信する。ビュー切り換え信号を受信することに応答して、ビュー提示モジュール204は、モバイル機器115上においてビデオ・ストリームを視覚的に提示する動作を停止し、モバイル機器115上においてデータ画面に関連付けられたデータ・ストリームを視覚的に提示する動作を開始する。当該技術分野における当業者であれば認識可能なことであるが、本明細書中においてビデオ・ストリームまたはデータ・ストリームの視覚的な提示について説明する記載箇所は、表示のために通信ユニット239を介してモバイル機器115に対して送信されるグラフィカル・データを生成するようにビュー提示モジュール204がユーザ・インターフェース・モジュール210に対して指示する様子を表現することを意図している。   In one embodiment of the present invention, the view presentation module 204 should switch the view being displayed on the mobile device 115 from the video viewing view to the data browsing view in addition to the detected data screen identifier (ID). A view switching signal indicating the presence is received from the view switching module 208. In some embodiments, the view presentation module 204 receives a data stream associated with the detected data screen directly from the display device 107 associated with the data screen. In some other embodiments, view presentation module 204 receives a data stream via hosting device 101. In response to receiving the view switch signal, the view presentation module 204 stops the visual presentation of the video stream on the mobile device 115 and the data associated with the data screen on the mobile device 115. Starts the action of visually presenting the stream. Those skilled in the art will recognize that the description describing the visual presentation of a video stream or data stream in this specification is via the communication unit 239 for display. It is intended to represent how the view presentation module 204 instructs the user interface module 210 to generate graphical data that is transmitted to the mobile device 115.

幾つかの例において、埋め込み型のデータ・ストリームがデータ・ストリーム中に含まれる。ビュー提示モジュール204は、ビュー切り換えモジュール208から、モバイル機器115において表示中のビューをデータ閲覧ビューから埋め込み型のデータ閲覧ビューに切り換えるようビュー提示モジュール204に指示するビュー切り換え信号を受信する。埋め込み型のデータ・ビュー・モードは、埋め込まれたデータ・ストリームを、モバイル機器115上において最大解像度または全画面表示で参加者125に対して視覚的に提示するモードである。ビュー切り換え信号を受信することに応答して、ビュー提示モジュール204は、モバイル機器115上において、データ・ストリームを視覚的に提示する動作を停止し、埋め込まれたデータストリームを視覚的に提示する動作を開始する。埋め込み型のデータ・ストリームは、ビデオ会議ミーティング、プレゼンテーション、ビデオ・クリップ、テキスト文書、プレゼンテーションのスライド、またはデータ・ストリーム中に埋め込まれた他の種別のデータとすることが可能である。   In some examples, an embedded data stream is included in the data stream. The view presentation module 204 receives from the view switching module 208 a view switching signal that instructs the view presentation module 204 to switch the view being displayed on the mobile device 115 from the data browsing view to the embedded data browsing view. The embedded data view mode is a mode in which the embedded data stream is visually presented to the participant 125 on the mobile device 115 at full resolution or full screen display. In response to receiving the view switch signal, the view presentation module 204 stops the operation of visually presenting the data stream on the mobile device 115 and the operation of visually presenting the embedded data stream. To start. The embedded data stream can be a video conference meeting, presentation, video clip, text document, presentation slide, or other type of data embedded in the data stream.

ビュー提示モジュール204は、別のビューを埋め込まれた埋め込み型のデータ閲覧ビューから再び通常のデータ閲覧ビューへと画面表示を切り換えるようビュー提示モジュール204に指示するビュー切り換え信号をビュー切り換えモジュール208から受信する。すると、ビュー提示モジュール204は、埋め込まれたデータ・ストリームを視覚的に提示する動作を停止し、モバイル機器115上において再度データ・ストリームを視覚的に提示する動作を開始する。一実施形態において、ビュー提示モジュール204は、モバイル機器115上において表示中のビューをデータ閲覧ビューからビデオ閲覧ビューに切り換えるようビュー提示モジュール204に指示するビュー切り換え信号をビュー切り換えモジュール208から受信する。当該ビュー切り換え信号に応答して、ビュー提示モジュール204は、モバイル機器115上において、データ・ストリームを視覚的に提示する動作を停止し、ビデオ・ストリームを視覚的に提示する動作を開始する。   The view presentation module 204 receives from the view switching module 208 a view switching signal that instructs the view presentation module 204 to switch the screen display from the embedded data browsing view in which another view is embedded to the normal data browsing view again. To do. The view presentation module 204 then stops the operation of visually presenting the embedded data stream and starts the operation of visually presenting the data stream again on the mobile device 115. In one embodiment, the view presentation module 204 receives a view switching signal from the view switching module 208 that instructs the view presentation module 204 to switch the view being displayed on the mobile device 115 from the data viewing view to the video viewing view. In response to the view switching signal, the view presentation module 204 stops the operation of visually presenting the data stream on the mobile device 115 and starts the operation of visually presenting the video stream.

画面検出モジュール206は、ビデオ・フレーム画像中に含まれるデータ画面の検出を実行するためのルーチンを含むソフトウェアとすることが可能である。一実施形態において、画面検出モジュール206は、ビデオ・フレーム画像中に含まれるデータ画面の検出を実行するために後述する機能を実現するようプロセッサ235によって実行可能な命令のセットとすることが可能である。さらに別の実施形態では、画面検出モジュール206は、コンピューティング装置200のメモリ237内に記憶されることが可能であり、プロセッサ235によってアクセス可能かつ実行可能であり得る。いずれの実施形態においても、画面検出モジュール206は、信号線234を介して、プロセッサ235とコンピューティング装置200内の他のコンポーネントとの間における協働および通信を実現するように適合し得る。   The screen detection module 206 may be software that includes routines for performing detection of data screens contained in the video frame image. In one embodiment, the screen detection module 206 can be a set of instructions that can be executed by the processor 235 to implement the functions described below to perform detection of data screens contained in a video frame image. is there. In yet another embodiment, the screen detection module 206 can be stored in the memory 237 of the computing device 200 and can be accessible and executable by the processor 235. In any embodiment, screen detection module 206 may be adapted to provide cooperation and communication between processor 235 and other components within computing device 200 via signal line 234.

本発明に係る一実施形態において、画面検出モジュール206は、1つ以上の表示デバイス107を登録サーバ130に登録する。例えば、画面検出モジュール206は、表示デバイス107と共に、表示デバイス107に関連付けられたデバイス識別子、ユーザ、等を記録し、登録情報を記憶装置243内に記憶することが可能である。各表示デバイス107は、自身のデータ画面の新たに更新された画像を登録サーバ130に対して定期的に送信する。例えば、各表示デバイス107は、自身の最も新しいスクリーン・ショット画像を登録サーバ130に対して定期的に送信する。幾つかの例では、表示デバイス107は、自身のデータ画面の新たに更新されたスクリーン・ショット画像を、ホスティング・デバイス101を介して登録サーバ130に送信する。   In one embodiment according to the invention, the screen detection module 206 registers one or more display devices 107 with the registration server 130. For example, the screen detection module 206 can record a device identifier, a user, and the like associated with the display device 107 together with the display device 107, and store registration information in the storage device 243. Each display device 107 periodically transmits a newly updated image of its data screen to the registration server 130. For example, each display device 107 periodically transmits its latest screen shot image to the registration server 130. In some examples, the display device 107 sends a newly updated screen shot image of its data screen to the registration server 130 via the hosting device 101.

本発明に係る一実施形態において、画面検出モジュール206は、トリガ・イベントの発生を検出する。例えば、そのようなイベントは、ビデオ・フレーム画像中の1つ以上のデータ画面の検出をトリガする検出トリガ・イベントであり得る。例えば、当該検出トリガ・イベントは、ビデオ・フレーム画像がデータ画面を含んでいるか否かを検出する動作を画面検出モジュール206に実行させる。検出トリガ・イベントの具体例は、カメラ103の動き(例えば、カメラ103のパン操作、ズーム操作またはチルト操作、カメラ103の移動等)、および/または、ビデオ・フレーム画像中の対象物の動き(例えば、壁に投影された画面の映像がビデオ・フレーム画像中に出現した、または電子式ホワイト・ボードが移動した等)を含むが、これらに限定されない。さらに別の例では、トリガ・イベントは、タイマに基づいて発生し得る。   In one embodiment according to the present invention, the screen detection module 206 detects the occurrence of a trigger event. For example, such an event can be a detection trigger event that triggers the detection of one or more data screens in the video frame image. For example, the detection trigger event causes the screen detection module 206 to perform an operation of detecting whether the video frame image includes a data screen. Specific examples of the detection trigger event include movement of the camera 103 (for example, pan operation of the camera 103, zoom operation or tilt operation, movement of the camera 103, etc.) and / or movement of the object in the video frame image ( For example, the image of the screen projected on the wall has appeared in the video frame image, or the electronic whiteboard has moved), but is not limited thereto. In yet another example, the trigger event may occur based on a timer.

検出トリガ・イベントの発生に応答して、画面検出モジュール206は、カメラ103から直接的にまたはホスティング・デバイス101を介して、ビデオ・ストリーム内の最新のビデオ・フレーム画像を受信する。幾つかの例において、画面検出モジュール206は、モバイル機器115またはビデオ・ストリームを提供するビデオ・サーバから、ビデオ・ストリーム内の最新のビデオ・フレーム画像を受信する。画面検出モジュール206は、検出トリガ・イベントの発生に応答して、最新のビデオ・フレーム画像中に含まれるデータ画面の検出を実行する。例えば、画面検出モジュール206は、データ画面の最新のスクリーン・ショット画像と最新のビデオ・フレーム画像とをマッチングすることによって、データ画面が最新のビデオ・フレーム画像中に現れているか否かを判定する。   In response to the occurrence of the detection trigger event, the screen detection module 206 receives the latest video frame image in the video stream, either directly from the camera 103 or via the hosting device 101. In some examples, the screen detection module 206 receives the latest video frame image in the video stream from the mobile device 115 or a video server that provides the video stream. The screen detection module 206 performs detection of the data screen included in the latest video frame image in response to the occurrence of the detection trigger event. For example, the screen detection module 206 determines whether the data screen appears in the latest video frame image by matching the latest screen shot image of the data screen with the latest video frame image. .

幾つかの具体例では、登録サーバ130に登録された各データ画面について、画面検出モジュール206は、データ画面の最新のスクリーン・ショット画像とマッチングするサブ画像が最新のビデオ・フレーム画像中に現れているか否かを判定する。例えば、画面検出モジュール206は、最新のビデオ・フレーム画像がデータ画面を描写するサブ画像を含むか否かを判定する(例えば、画面検出モジュール206は、データ画面が最新のビデオ・フレーム画像によって取り込まれているか否かを判定する)。さらなる具体例では、画面検出モジュール206は、画像マッチング・アルゴリズムを実行して、最新のビデオ・フレーム画像とデータ画面の最新のスクリーン・ショット画像との間の対応関係を見出す。画面検出モジュール206が最新のビデオ・フレーム画像とデータ画面の最新のスクリーン・ショット画像との間におけるマッチングを見出すと、画面検出モジュール206は、モバイル機器115上においてビデオ・フレーム画像中のマッチングした領域をハイライト表示する。例えば、画面検出モジュール206は、モバイル機器115上においてビデオ・フレーム画像中の検出されたデータ画面をハイライト表示する。   In some implementations, for each data screen registered with the registration server 130, the screen detection module 206 causes the sub-image that matches the latest screen shot image of the data screen to appear in the latest video frame image. It is determined whether or not. For example, the screen detection module 206 determines whether the latest video frame image includes a sub-image that depicts the data screen (eg, the screen detection module 206 captures the data screen with the latest video frame image. Determine whether or not In a further embodiment, the screen detection module 206 executes an image matching algorithm to find the correspondence between the latest video frame image and the latest screen shot image of the data screen. When the screen detection module 206 finds a match between the latest video frame image and the latest screen shot image of the data screen, the screen detection module 206 will match the region in the video frame image on the mobile device 115. Is highlighted. For example, the screen detection module 206 highlights the detected data screen in the video frame image on the mobile device 115.

一実施形態において、画面検出モジュール206は、画像マッチング・アルゴリズムをリアルタイムで実行する。画像マッチング・アルゴリズムの具体例としては、スケール不変特徴量変換(SIFT)アルゴリズムなどが含まれる。SIFTアルゴリズムは、最新のビデオ・フレーム画像とデータ画面の最新のスクリーン・ショット画像の両方の特徴点を抽出し、上記両方の画像からの特徴点が、k近傍法(KNN)に基づいてマッチングされ、ランダム・サンプル・コンセンサス(RANSAC)アルゴリズムを使用することによりコンセンサスが見付けられ、ホモグラフィ行列が決定される。画像マッチングのためにSIFT、KNN、およびRANSACをどのように使用するかについての追加の情報は、「Hess,R.,An Open―Source SIFT Library,Proceedings of the International Conference on Multimedia,October 2010,pp.1493―96」を参照することにより理解可能である。当業者は、上記以外の他の画像マッチング・アルゴリズムもまた使用可能であることを認識するだろう。   In one embodiment, the screen detection module 206 executes an image matching algorithm in real time. A specific example of the image matching algorithm includes a scale invariant feature amount conversion (SIFT) algorithm. The SIFT algorithm extracts the feature points of both the latest video frame image and the latest screen shot image of the data screen, and the feature points from both images are matched based on the k-nearest neighbor (KNN) method. Using a random sample consensus (RANSAC) algorithm, a consensus is found and a homography matrix is determined. Additional information on how to use SIFT, KNN, and RANSAC for image matching can be found in "Hess, R., An Open-Source SIFT Library, Proceedings of the International Conference on Multimedia, Octoper, Octopus." 1.493-96 "can be understood. One skilled in the art will recognize that other image matching algorithms other than those described above can also be used.

画像検出モジュール206がビデオ・フレーム画像中に存在する1つ以上のデータ画面を検出すると、画面検出モジュール206は、1つ以上のデータ画面とビデオ・フレーム画像との間における1つ以上のマッチングを含むマッチング結果を生成する。画面検出モジュール206は、1つ以上のマッチングの結果をモバイル機器115に通知し、モバイル機器115と、マッチングした1つのデータ画面を有する各表示デバイス107との間において、直接的な接続を確立する。画面検出モジュール206は、ビデオ・フレーム画像中における1つ以上のマッチングした領域をハイライト表示するが、各々のマッチング領域は、ビデオ・フレーム画像中に取り込まれた1つのデータ画面の位置に対応する。画面検出モジュール206は、ハイライト表示されたマッチング領域をモバイル機器115上において表示する。   When the image detection module 206 detects one or more data screens present in the video frame image, the screen detection module 206 performs one or more matchings between the one or more data screens and the video frame image. Generate matching results that contain. The screen detection module 206 notifies the mobile device 115 of one or more matching results, and establishes a direct connection between the mobile device 115 and each display device 107 having one matched data screen. . The screen detection module 206 highlights one or more matched regions in the video frame image, each matching region corresponding to the position of one data screen captured in the video frame image. . The screen detection module 206 displays the highlighted matching area on the mobile device 115.

本発明に係る別の実施形態では、カメラ103が静的に配置され、ホスティング環境137内の1つ以上のデータ画面を取り込むので、1つ以上のデータ画面の位置は、ビデオ・フレーム画像中において変化しないままである。画面検出モジュール206は、ホスティング環境137における静的な配置設定に基づいて1つ以上のデータ画面の存在を決定することができ、ビデオ・フレーム画像中の1つ以上のデータ画面の位置を事前キャリブレート処理することができる。画面検出モジュール206は、ビデオ・フレーム画像中において事前キャリブレート処理された位置に存在するビデオ・フレーム画像中の1つ以上のデータ画面をハイライト表示する。   In another embodiment according to the present invention, the camera 103 is statically placed and captures one or more data screens within the hosting environment 137 so that the location of the one or more data screens is within the video frame image. It remains unchanged. The screen detection module 206 can determine the presence of one or more data screens based on static placement settings in the hosting environment 137 and pre-calibrate the position of one or more data screens in the video frame image. Can be processed. The screen detection module 206 highlights one or more data screens in the video frame image that are present at pre-calibrated positions in the video frame image.

画面検出モジュール206は、1つ以上の検出されたデータ画面を識別する1つ以上の画面IDと、ビデオ・フレーム画像中の1つ以上のマッチング領域を表すデータとを、ビュー切り換えモジュール208に対して送信する。さらに別の実施形態では、画面検出モジュール206は、1つ以上のデータ画面の事前キャリブレート処理された位置をビュー切り換えモジュール208に対して送信する。さらなる別の実施形態では、画面検出モジュール206は、1つ以上の画面ID、1つ以上のマッチング領域を表すデータ、および/または事前キャリブレート処理された位置を記憶装置243内に記憶する。   The screen detection module 206 sends one or more screen IDs identifying one or more detected data screens and data representing one or more matching regions in the video frame image to the view switching module 208. To send. In yet another embodiment, the screen detection module 206 sends the pre-calibrated positions of one or more data screens to the view switching module 208. In yet another embodiment, the screen detection module 206 stores one or more screen IDs, data representing one or more matching regions, and / or pre-calibrated locations in the storage device 243.

ビュー切り換えモジュール208は、モバイル機器115において表示中のビューをビデオ閲覧ビューとデータ閲覧ビューとの間で切り換えるためのルーチンを含むソフトウェアとすることが可能である。一実施形態において、ビュー切り換えモジュール208は、モバイル機器115において表示中のビューをビデオ閲覧ビューとデータ閲覧ビューとの間で切り換えるために後述する機能を実現するようプロセッサ235によって実行可能な命令のセットとすることが可能である。さらに別の実施形態において、ビュー切り換えモジュール208は、コンピューティング装置200のメモリ237内に記憶されることが可能であり、プロセッサ235によってアクセス可能かつ実行可能であり得る。いずれの実施形態においても、ビュー切り換えモジュール208は、信号線236を介して、プロセッサ235とコンピューティング装置200内の他のコンポーネントとの間における協働および通信を実現するように適合し得る。   The view switching module 208 may be software that includes a routine for switching the view being displayed on the mobile device 115 between a video viewing view and a data viewing view. In one embodiment, the view switching module 208 is a set of instructions that can be executed by the processor 235 to implement the functions described below to switch the view being displayed on the mobile device 115 between a video viewing view and a data viewing view. Is possible. In yet another embodiment, the view switching module 208 can be stored in the memory 237 of the computing device 200 and can be accessible and executable by the processor 235. In any embodiment, view switching module 208 may be adapted to provide cooperation and communication between processor 235 and other components in computing device 200 via signal line 236.

一実施形態において、ビュー切り換えモジュール208は、1つ以上の検出されたデータ画面を識別する1つ以上の画面IDを表すデータに加えて、ビデオ・フレーム画像中の1つ以上の検出されたデータ画面に関連付けられた1つ以上のマッチング領域を表すデータを画面検出モジュール206から受信する。ビデオ・ビュー・モードにおいては、モバイル機器115は、ビデオ・フレーム画像のマッチング領域において1つ以上の検出されたデータ画面がハイライト表示された状態で、ビデオ・ストリームを参加者125に視覚的に提示する。参加者125が、モバイル機器115のタッチスクリーンを使用してデータ画面のハイライト表示されたマッチング領域内でジェスチャ(例えば、ピンチ・オープン・ジェスチャまたはダブル・タップ・ジェスチャ等)を実行すると、ビュー切り換えモジュール208は、参加者のジェスチャを、ビデオ閲覧ビューからデータ閲覧ビューに切り換えるためのコマンドとして解釈する。ビュー切り換えモジュール208は、当該コマンドを表すビュー切り換え信号を生成し、ビュー切り換え信号をビュー提示モジュール204に対して送信し、それを契機として、ビュー提示モジュール204は、データ閲覧ビューを参加者125に対して視覚的に提示する。一実施形態において、ビュー切り換えモジュール208は、ビデオ・フレーム画像中に検出されたデータ画面の一部が、所定の閾値よりも大きい(例えば、データ画面の大部分がビデオ・フレーム画像中に現れている)場合、ジェスチャを、ビデオ閲覧ビューからデータ閲覧ビューへと切り換えるためのコマンドとして解釈する。   In one embodiment, the view switching module 208 includes one or more detected data in the video frame image in addition to data representing one or more screen IDs that identify one or more detected data screens. Data representing one or more matching regions associated with the screen is received from the screen detection module 206. In the video view mode, the mobile device 115 visually transmits the video stream to the participant 125 with one or more detected data screens highlighted in the matching area of the video frame image. Present. When participant 125 performs a gesture (eg, pinch open gesture or double tap gesture, etc.) within the highlighted matching area of the data screen using the touch screen of mobile device 115, the view switches Module 208 interprets the participant's gesture as a command to switch from the video viewing view to the data viewing view. The view switching module 208 generates a view switching signal representing the command, and transmits the view switching signal to the view presentation module 204. In response to this, the view presentation module 204 sends the data browsing view to the participant 125. It is presented visually. In one embodiment, the view switching module 208 is configured such that a portion of the data screen detected in the video frame image is greater than a predetermined threshold (eg, the majority of the data screen appears in the video frame image. The gesture is interpreted as a command for switching from the video viewing view to the data viewing view.

例えば、参加者125がジェスチャを使用してビデオ・フレーム画像中に検出されたデータ画面にズーム・インし得るとするならば、それに応じて、ビデオ・フレーム画像を提示するビデオ閲覧ビューは、モバイル機器115のタッチスクリーン上において拡大表示される(スケール・アップする)。ビデオ・フレーム画像中において上記のようにスケール・アップしたデータ画面のサイズが所定の閾値に到達すると、ビュー切り換えモジュール208は、モバイル機器115において表示中のビューをビデオ閲覧ビューからデータ閲覧ビューへと自動的に切り換え、それを契機として、ビュー提示モジュール204は、検出されたデータ画面に関連付けられたデータ・ストリームをモバイル機器115上において視覚的に提示する。モバイル機器115は、それに応じてビデオ・ビュー・モードからデータ・ビュー・モードへと切り換わる。参加者125は、データ・ストリームへのズーム・イン操作、データ・ストリームのコピー操作、データ・ストリームのドラッグ操作等といった、ジェスチャをさらに実行して、データ・ストリームに対する操作を実行することが可能である。   For example, if participant 125 can use a gesture to zoom in on the data screen detected in the video frame image, the video viewing view presenting the video frame image accordingly is mobile It is enlarged and displayed on the touch screen of the device 115 (scaled up). When the size of the data screen scaled up as described above in the video frame image reaches a predetermined threshold, the view switching module 208 changes the view being displayed on the mobile device 115 from the video browsing view to the data browsing view. With automatic switching, the view presentation module 204 visually presents on the mobile device 115 a data stream associated with the detected data screen. The mobile device 115 switches from the video view mode to the data view mode accordingly. Participant 125 can perform further operations on the data stream by performing further gestures such as zoom-in to the data stream, copy operation of the data stream, drag operation of the data stream, etc. is there.

データ・ビュー・モードにおいて、モバイル機器115は、参加者125に対してデータ・ストリームを視覚的に提示する。モバイル機器115のタッチスクリーンに表示されたデータ・ストリームに対して、参加者125がジェスチャ(例えば、ピンチ・クローズ・ジェスチャ、または終了アイコンをタップ操作すること等)を実行すると、ビュー切り換えモジュール208は、参加者のジェスチャを、データ閲覧ビューから再びビデオ閲覧ビューへと切り換えるためのコマンドとして解釈する。ビュー切り換えモジュール208は、当該コマンドを表すビュー切り換え信号を生成し、当該ビュー切り換え信号をビュー提示モジュール204に対して送信し、それを契機として、ビュー提示モジュール204は、ビデオ閲覧ビューを参加者125に対して視覚的に提示する。再度、画面検出モジュール206は、カメラ103から視認可能な1つ以上のデータ画面がビデオ・フレーム画像中に存在することを検出し、ビデオ・フレーム画像中の1つ以上のデータ画面をハイライト表示する。例えば、参加者125が、ジェスチャを使用してデータ・ストリームからズームアウトし得るとするならば、それに応じて、データ・ストリームを提示するデータ閲覧ビューがモバイル機器115のタッチスクリーン上において縮小表示される(スケール・ダウンする)。上記のようにスケール・ダウンしたデータ・ストリームのサイズが所定の閾値に到達すると、ビュー切り換えモジュール208は、モバイル機器115において表示中のビューをデータ閲覧ビューからビデオ閲覧ビューへと自動的に切り換え、それを契機として、ビュー提示モジュール204は、ビデオ・ストリームをモバイル機器115上において視覚的に提示する。   In the data view mode, the mobile device 115 visually presents the data stream to the participant 125. When the participant 125 performs a gesture (e.g., tapping a pinch close gesture or an exit icon) on the data stream displayed on the touch screen of the mobile device 115, the view switching module 208 is The participant's gesture is interpreted as a command for switching from the data browsing view to the video browsing view again. The view switching module 208 generates a view switching signal representing the command, transmits the view switching signal to the view presentation module 204, and the view presentation module 204 uses the video viewing view as the participant 125. To present visually. Again, the screen detection module 206 detects that one or more data screens visible from the camera 103 are present in the video frame image, and highlights one or more data screens in the video frame image. To do. For example, if participant 125 can zoom out of the data stream using gestures, a data browsing view presenting the data stream is accordingly reduced on the touch screen of mobile device 115. (Scale down). When the size of the data stream scaled down as described above reaches a predetermined threshold, the view switching module 208 automatically switches the view being displayed on the mobile device 115 from the data viewing view to the video viewing view, In response, the view presentation module 204 visually presents the video stream on the mobile device 115.

データ・ビュー・モードにおいては、提示されたデータ・ストリームが埋め込み型のデータ・ストリームを含む場合、参加者125は、埋め込まれたデータ・ストリームに対してジェスチャを使用して操作を実行し得る。ビュー切り換えモジュール208は、ジェスチャを、通常のデータ閲覧ビューから埋め込み型のデータ閲覧ビューへと切り換えるためのコマンドとして解釈する。ビュー切り換えモジュール208は、当該コマンドを表すビュー切り換え信号を生成し、当該ビュー切り換え信号をビュー提示モジュール204に対して送信し、それを契機として、ビュー提示モジュール204は、埋め込まれたデータ・ストリームを参加者125に対して最大解像度で視覚的に提示する。参加者125は、さらに別のジェスチャを実行して、埋め込み型のデータ閲覧ビューを終了し、通常のデータ閲覧ビューに戻ることが可能である。例えば、データ・ストリームが埋め込まれたビデオを含んでいる場合、参加者125は、データ・ビュー・モードにおいて、当該埋め込まれたビデオを表現するアイコンに対するタップ・オープン操作コマンドを発することができ、それを契機として、ビュー提示モジュール204は、当該埋め込まれたビデオをモバイル機器115において全画面表示で視覚的に提示する。当該埋め込まれたビデオを見た後に、参加者125は、埋め込み型のデータ閲覧ビューを終了して通常のデータ閲覧ビューに戻るピンチ・クローズ操作コマンドを発し得る。   In the data view mode, if the presented data stream includes an embedded data stream, the participant 125 can perform operations on the embedded data stream using gestures. The view switching module 208 interprets the gesture as a command for switching from a normal data browsing view to an embedded data browsing view. The view switching module 208 generates a view switching signal representing the command, and transmits the view switching signal to the view presentation module 204. In response, the view presentation module 204 receives the embedded data stream. Visually present to participant 125 at maximum resolution. Participant 125 can perform yet another gesture to exit the embedded data browsing view and return to the normal data browsing view. For example, if the data stream contains an embedded video, the participant 125 can issue a tap open operation command for the icon representing the embedded video in data view mode, As a trigger, the view presentation module 204 visually presents the embedded video on the mobile device 115 in full screen display. After viewing the embedded video, the participant 125 may issue a pinch-close operation command that exits the embedded data browsing view and returns to the normal data browsing view.

ユーザ・インターフェース・モジュール210は、ユーザ・インターフェースを提供するためのグラフィカル・データを生成するためのルーチンを含むソフトウェアとすることが可能である。一実施形態において、ユーザ・インターフェース・モジュール210は、ユーザ・インターフェースを提供するためのグラフィカル・データを生成するために後述する機能を実現するようプロセッサ235によって実行可能な命令のセットとすることが可能である。さらに別の実施形態において、ユーザ・インターフェース・モジュール210は、コンピューティング装置200のメモリ237内に記憶されることが可能であり、プロセッサ235によってアクセス可能かつ実行可能であり得る。いずれの実施形態においても、ユーザ・インターフェース・モジュール210は、信号線238を介して、プロセッサ235とコンピューティング装置200内の他のコンポーネントとの間における協働および通信を実現するように適合し得る。   The user interface module 210 may be software that includes routines for generating graphical data for providing a user interface. In one embodiment, the user interface module 210 may be a set of instructions that can be executed by the processor 235 to implement the functions described below to generate graphical data for providing a user interface. It is. In yet another embodiment, the user interface module 210 can be stored in the memory 237 of the computing device 200 and can be accessible and executable by the processor 235. In any embodiment, user interface module 210 may be adapted to provide cooperation and communication between processor 235 and other components in computing device 200 via signal line 238. .

一実施形態において、ユーザ・インターフェース・モジュール210は、ビュー提示モジュール204から命令を受信して、ホスト135または参加者125等のようなユーザに対してユーザ・インターフェースを提供するためのグラフィカル・データを生成する。ユーザ・インターフェース・モジュール210は、当該グラフィカル・データをホスティング・デバイス101またはモバイル機器115に対して送信し、それを契機として、ホスティング・デバイス101またはモバイル機器115は、ユーザ・インターフェースをユーザに対して視覚的に提示する。例えば、ユーザ・インターフェース・モジュール210は、ビデオ・ストリームまたはデータ・ストリームを描写するユーザ・インターフェースを提供するためのグラフィカル・データを生成する。ユーザ・インターフェース・モジュール210は、当該グラフィカル・データをモバイル機器115に対して送信し、それを契機として、モバイル機器115は、ユーザ・インターフェースを介して参加者125にビデオ・ストリームまたはデータ・ストリームを視覚的に提示する。他の実施形態では、ユーザ・インターフェース・モジュール210は、他のユーザ・インターフェースをユーザに提供するためのグラフィカル・データを生成し得る。   In one embodiment, user interface module 210 receives instructions from view presentation module 204 and provides graphical data for providing a user interface to a user, such as host 135 or participant 125. Generate. The user interface module 210 transmits the graphical data to the hosting device 101 or the mobile device 115, and the hosting device 101 or the mobile device 115 triggers the user interface to the user. Present visually. For example, the user interface module 210 generates graphical data for providing a user interface that depicts a video stream or a data stream. The user interface module 210 transmits the graphical data to the mobile device 115, and the mobile device 115 sends a video stream or data stream to the participant 125 via the user interface. Present visually. In other embodiments, the user interface module 210 may generate graphical data for providing other user interfaces to the user.

オプションとして装備されるカメラ調節モジュール212は、カメラ103を調節するためのルーチンを含むソフトウェアとすることが可能である。一実施形態において、カメラ調節モジュール212は、カメラ103を調節するために以下に説明される機能を提供するようプロセッサ235によって実行可能な命令のセットとすることが可能である。さらに別の実施形態において、カメラ調節モジュール212は、コンピューティング装置200のメモリ237内に記憶されることが可能であり、プロセッサ235によってアクセス可能かつ実行可能であり得る。いずれの実施形態においても、カメラ調節モジュール212は、信号線240を介して、プロセッサ235とコンピューティング装置200内の他のコンポーネントとの間における協働および通信を実行するように適合し得る。   The optional camera adjustment module 212 may be software including routines for adjusting the camera 103. In one embodiment, the camera adjustment module 212 may be a set of instructions that can be executed by the processor 235 to provide the functions described below for adjusting the camera 103. In yet another embodiment, the camera adjustment module 212 can be stored in the memory 237 of the computing device 200 and can be accessible and executable by the processor 235. In any embodiment, camera adjustment module 212 may be adapted to perform cooperation and communication between processor 235 and other components in computing device 200 via signal line 240.

本発明に係る一実施形態において、参加者125は、ジェスチャを使用してカメラ103を操作し得る。例えば、参加者125は、モバイル機器115上に表示されたユーザ・インターフェースを介し、ジェスチャを実行してカメラ103の視野角を変えることができる。カメラ調節モジュール212は、参加者のジェスチャを表すデータを受信し、参加者のジェスチャを、カメラ103のパン操作、チルト操作、ズーム・イン操作、またはズーム・アウト操作などといったカメラ103の調節操作のためのコマンドとして解釈する。カメラ調節モジュール212は、参加者のジェスチャに従ってカメラ103の姿勢や位置を調節する。参加者125は、カメラ103がビデオ・フレーム画像中に1つ以上のデータ画面を取り込むようことができるようにカメラ103の姿勢や位置を調節することにより、1つ以上の表示デバイス107の1つ以上のデータ画面をカメラ103の視野内に保持することができる。   In one embodiment according to the present invention, the participant 125 may operate the camera 103 using a gesture. For example, participant 125 can perform a gesture and change the viewing angle of camera 103 via a user interface displayed on mobile device 115. The camera adjustment module 212 receives data representing the gesture of the participant, and uses the gesture of the participant for the adjustment operation of the camera 103 such as a pan operation, a tilt operation, a zoom-in operation, or a zoom-out operation of the camera 103. As a command for The camera adjustment module 212 adjusts the posture and position of the camera 103 in accordance with the participant's gesture. Participant 125 adjusts the orientation and position of camera 103 so that camera 103 can capture one or more data screens in the video frame image, thereby allowing one of one or more display devices 107 to The above data screen can be held within the field of view of the camera 103.

本明細書中において説明されるシステムの使用例には、第1の当事者(例えば、ホスト135)が、カメラ103と1つ以上のデータ画面とを装備した会議室内におり、第2の当事者(例えば、参加者125)が、スマートフォンまたはタブレット端末といったモバイル機器115を使用して遠隔地からモバイル・ユーザとしてビデオ会議に参加するビデオ会議のシナリオが含まれる。参加者125がビデオ会議に加わった後、参加アプリケーション123は、カメラ103からビデオ・ストリームを受信し、当該ビデオ・ストリームをモバイル機器115のタッチ・スクリーンによって参加者125に対して視覚的に提示する。参加アプリケーション123は、ビデオ・フレーム画像によって取り込まれた1つ以上のデータ画面を検出する。参加者125は、ビデオ・フレーム画像中においてハイライト表示された検出済みのデータ画面に向かってピンチ・オープン・ジェスチャのようなジェスチャを発して、それを契機として、モバイル機器115は、ビデオ閲覧ビューからデータ閲覧ビューに画面表示を切り換える。その後、参加アプリケーション123は、検出済みのデータ画面に関連付けられたデータ・ストリームを最大解像度で参加者125に対して視覚的に提示する。参加者125は、ピンチ・クローズ・ジェスチャのようなさらに別のジェスチャを発してデータ閲覧ビューから再びビデオ閲覧ビューに切り換えることが可能である。   In an example use of the system described herein, a first party (eg, host 135) is in a conference room equipped with a camera 103 and one or more data screens, and a second party ( For example, a video conferencing scenario where a participant 125) participates in a video conference as a mobile user from a remote location using a mobile device 115 such as a smartphone or tablet terminal is included. After participant 125 joins the video conference, participant application 123 receives the video stream from camera 103 and visually presents the video stream to participant 125 via the mobile device 115 touch screen. . Participating application 123 detects one or more data screens captured by the video frame image. Participant 125 issues a gesture such as a pinch-open gesture toward the detected data screen highlighted in the video frame image, and the mobile device 115 receives the video viewing view as a trigger. Switch the screen display from to the data browsing view. The participating application 123 then visually presents the data stream associated with the detected data screen to the participant 125 at maximum resolution. Participant 125 can switch from the data viewing view to the video viewing view again by issuing another gesture, such as a pinch close gesture.

本明細書中において説明されるシステムのさらに別の使用例には、画像に関連する情報を検索するための検索アプリケーションが含まれる。例えば、ユーザは、広告(例えば、自動車ブランドの広告)の画像を取り込み、当該広告に関連する情報を検索するよう検索アプリケーションに指示することが可能である。当該広告の画像は、コマーシャル・ビデオを表示するバナーおよび/またはデータ画面の画像を含み得る。検索アプリケーションは、当該広告の画像中に含まれるデータ画面を検出し、当該データ画面の画像中に表示されたコンテンツとマッチングする製品を識別するよう、画面検出モジュール206に指示することが可能である。検索アプリケーションは、1つ以上のデータベースから、識別された製品に関連する情報を検索し、関連する情報をユーザに提供することができる。本明細書中に説明されるシステムについては、上述した使用例以外のその他の使用例もまた実施可能である。   Yet another example use of the system described herein includes a search application for searching information related to images. For example, the user can capture an image of an advertisement (eg, an automobile brand advertisement) and instruct the search application to search for information related to the advertisement. The advertisement image may include a banner and / or data screen image displaying a commercial video. The search application can instruct the screen detection module 206 to detect a data screen included in the image of the advertisement and identify a product that matches the content displayed in the image of the data screen. . The search application can retrieve information related to the identified product from one or more databases and provide the relevant information to the user. For the systems described herein, other uses other than those described above can also be implemented.

<グラフィック表現>
図3Aは、データ画面検出を実行するための処理の一実施形態をグラフィック表現300として図示している。参加者125がモバイル機器115を使用してマルチユーザ通信セッションに加わった後、カメラ103がモバイル機器115との間においてビデオ・ストリーム接続302を確立する。カメラ103は、ビデオ・ストリーム接続302を介してモバイル機器115に対してビデオ・ストリームを送信し、それを契機として、モバイル機器115は、ビデオ・ビュー・モードにおいて参加者125に対して当該ビデオ・ストリームを視覚的に提示する。表示デバイス107は、登録サーバ130に登録し、表示デバイス107に関連付けられたデータ画面の更新されたスクリーン・ショット画像304を登録サーバ130に定期的に対して送信する。図示された例では、表示デバイス107は、電子式ホワイト・ボードである。一実施形態において、登録サーバ130は、検出トリガ・イベントを検出する。例えば、登録サーバ130は、パン操作またはチルト操作といったカメラ103の動きを検出する。登録サーバ130は、検出トリガ・イベントに応答して、カメラ103から最新のビデオ・フレーム画像306を受信する。幾つかの例では、登録サーバ130は、モバイル機器115から最新のビデオ・フレーム画像306を受信する。
<Graphic representation>
FIG. 3A illustrates one embodiment of a process for performing data screen detection as a graphical representation 300. After participant 125 joins the multi-user communication session using mobile device 115, camera 103 establishes video stream connection 302 with mobile device 115. The camera 103 transmits a video stream to the mobile device 115 via the video stream connection 302, and the mobile device 115 triggers the video stream to the participant 125 in the video view mode. Present the stream visually. The display device 107 registers with the registration server 130 and periodically transmits an updated screen shot image 304 of the data screen associated with the display device 107 to the registration server 130. In the illustrated example, the display device 107 is an electronic whiteboard. In one embodiment, registration server 130 detects a detection trigger event. For example, the registration server 130 detects the movement of the camera 103 such as a pan operation or a tilt operation. The registration server 130 receives the latest video frame image 306 from the camera 103 in response to the detection trigger event. In some examples, registration server 130 receives the latest video frame image 306 from mobile device 115.

登録サーバ130は、画像マッチング方法を使用して、アクティブなデータ画面を動的に検出する。例えば、登録サーバ130は、画像マッチング・アルゴリズムを使用して、最新のビデオ・フレーム画像306と、ホスティング・デバイス101または表示デバイス107のいずれかから受信された最新のスクリーン・ショット画像との間の対応関係を見出す。最新のビデオ・フレーム画像306とデータ画面の最新のスクリーン・ショット画像との間のマッチング結果308が見出されると、登録サーバ130は、マッチング結果308をモバイル機器115に通知し、ビデオ・フレーム画像中の対応するデータ画面をハイライト表示する。例えば、登録サーバ130は、ボックス310を使用してビデオ・フレーム画像中に含まれる電子式ホワイト・ボードのデータ画面をハイライト表示する。データ画面に関連付けられた表示デバイス107は、モバイル機器115との間においてデータ・ストリーム接続312を確立する。表示デバイス107は、データ・ストリーム接続312を介してモバイル機器115に対してデータ・ストリームを送信し得る。   The registration server 130 dynamically detects an active data screen using an image matching method. For example, registration server 130 may use an image matching algorithm between the latest video frame image 306 and the latest screen shot image received from either hosting device 101 or display device 107. Find correspondence. When a matching result 308 between the latest video frame image 306 and the latest screen shot image of the data screen is found, the registration server 130 notifies the mobile device 115 of the matching result 308 and in the video frame image. Highlight the corresponding data screen. For example, the registration server 130 uses the box 310 to highlight the electronic whiteboard data screen included in the video frame image. The display device 107 associated with the data screen establishes a data stream connection 312 with the mobile device 115. Display device 107 may transmit the data stream to mobile device 115 via data stream connection 312.

図3Bは、ジェスチャを使用してモバイル機器115上においてビデオ閲覧ビューとデータ閲覧ビューとの間で画面表示を切り換えるための一実施形態をグラフィック表現319として図示している。参加アプリケーション123は、参加者125からのジェスチャを解釈してシームレスなユーザ体験を達成する。この実施形態において、参加アプリケーション123は、第1のデータ・ストリームと第2のデータ・ストリームとを取り込み、カメラ103から取り込まれたビデオ・ストリームと共にモバイル機器115に対して送信する。第1のデータ・ストリームは、ホスティング・デバイス101(例えば、ラップトップ型PC)からの高品質のスクリーン・ショット画像を含み、第2のデータ・ストリームは、表示デバイス107(例えば、電子式ホワイト・ボード)からのストロークを含む。両方のデータ画面(ラップトップ型PCのデータ画面および電子式ホワイト・ボード上のデータ画面)は、カメラ103から視認可能である。一実施形態において、ホスティング・デバイス101からのスクリーン・ショット画像は、表示デバイス107のデータ画面を描写する埋め込まれた画像を含んでいる。   FIG. 3B illustrates one embodiment for switching the screen display between a video browsing view and a data browsing view on the mobile device 115 using a gesture as a graphical representation 319. Participating application 123 interprets gestures from participant 125 to achieve a seamless user experience. In this embodiment, the participating application 123 captures the first data stream and the second data stream and transmits them to the mobile device 115 together with the video stream captured from the camera 103. The first data stream includes a high quality screen shot image from a hosting device 101 (eg, a laptop PC) and the second data stream is a display device 107 (eg, an electronic white Including strokes from the board). Both data screens (a laptop PC data screen and a data screen on an electronic whiteboard) are visible from the camera 103. In one embodiment, the screen shot image from hosting device 101 includes an embedded image depicting the data screen of display device 107.

最初に、ビデオ閲覧ビューがモバイル機器115上において示され、ビデオ・フレーム画像320を参加者125に視覚的に提示する。例えば、ビデオ・フレーム画像320が、モバイル機器115の最大解像度または全画面で示される。図3Bに示すように、両方のデータ画面(ラップトップ型PCのデータ画面324および電子式ホワイト・ボードのデータ画面322)が、参加者のモバイル機器115上に表示されたビデオ・フレーム画像320の中において視認可能である。参加アプリケーション123は、ビデオ・フレーム画像中のデータ画面の存在をインテリジェントに検出し、参加者125に通知する。例えば、参加アプリケーション123は、ビデオ・フレーム画像320中のデータ画面322および324をハイライト表示する。   Initially, a video viewing view is shown on the mobile device 115 to visually present the video frame image 320 to the participant 125. For example, the video frame image 320 is shown at the maximum resolution or full screen of the mobile device 115. As shown in FIG. 3B, both data screens (laptop PC data screen 324 and electronic whiteboard data screen 322) are displayed in the video frame image 320 displayed on the participant's mobile device 115. Visible inside. The participating application 123 intelligently detects the presence of the data screen in the video frame image and notifies the participant 125 of it. For example, the participating application 123 highlights the data screens 322 and 324 in the video frame image 320.

フェーズ(1)において、参加者125がラップトップ型PCのデータ画面324からさらなる詳細内容を得ようとする場合、彼または彼女は、ビデオ・フレーム画像320中に示されたラップトップ型PCのデータ画面324に向かってジェスチャ330を実行して、ラップトップ型PCのデータ画面324にズーム・インすることが可能である。ジェスチャ330の例は、ピンチ・ジェスチャまたはダブル・タップ・ジェスチャとすることが可能である。ジェスチャ330が実行されたことに応答して、モバイル機器115上におけるビデオ閲覧ビューが拡大表示される(スケール・アップする)。認識されたラップトップ型PCのデータ画面324のサイズが予め設定された閾値に到達すると、モバイル機器115は、ビデオ閲覧ビューからデータ閲覧ビューへと自動的に切り換わる。例えば、モバイル機器115において表示中のビューは、ビデオ・フレーム画像320を最大解像度で視覚提示している状態から、ラップトップ型PCのデータ画面324の高品質なスクリーン・ショット画像326を最大解像度で視覚提示する状態に切り換わる。参加アプリケーション123は、スクリーン・ショット画像326に向かって実行される任意のさらなるピンチ・ジェスチャまたはドラッグ・ジェスチャを、ラップトップ型PCのデータ画面324のスクリーン・ショット画像326に対するユーザ入力操作内容として解釈する。   In phase (1), if the participant 125 wants to obtain further details from the laptop PC data screen 324, he or she will use the laptop PC data shown in the video frame image 320. A gesture 330 can be performed toward the screen 324 to zoom in on the data screen 324 of the laptop PC. Examples of gestures 330 can be pinch gestures or double tap gestures. In response to the gesture 330 being performed, the video viewing view on the mobile device 115 is magnified (scaled up). When the size of the recognized laptop PC data screen 324 reaches a preset threshold, the mobile device 115 automatically switches from the video viewing view to the data viewing view. For example, the view being displayed on the mobile device 115 is a state in which the video frame image 320 is visually presented at the maximum resolution, and the high-quality screen shot image 326 of the data screen 324 of the laptop PC is displayed at the maximum resolution. Switch to the state of visual presentation. Participating application 123 interprets any further pinch or drag gestures performed towards screen shot image 326 as user input operations for screen shot image 326 on laptop PC data screen 324. .

フェーズ(2)において、参加者125がスクリーン・ショット画像326に向かってピンチ・ジェスチャのようなジェスチャ332を実行してデータ閲覧ビューからズーム・アウトし、ズーム・アウト操作による拡大縮小比(スケール比)が予め設定された閾値に到達すると、モバイル機器115は、データ閲覧ビューから再びビデオ閲覧ビューに切り換わる。再度、参加アプリケーション123が、モバイル機器115上においてビデオ・フレーム画像320を最大解像度で視覚的に提示し、ビデオ・フレーム画像320中の視認可能なデータ画面322および324を検出し、マーキングする。   In the phase (2), the participant 125 performs a gesture 332 such as a pinch gesture toward the screen shot image 326 to zoom out from the data browsing view, and a zoom ratio (scale ratio) by the zoom out operation. ) Reaches a preset threshold, the mobile device 115 switches from the data browsing view to the video browsing view again. Again, participating application 123 visually presents video frame image 320 at maximum resolution on mobile device 115 and detects and marks viewable data screens 322 and 324 in video frame image 320.

フェーズ(3)において、参加者125は、ビデオ・フレーム画像320中のハイライト表示されたデータ画面322に向かってドラッグ・ジェスチャのようなジェスチャ334を実行し、それを契機として、モバイル機器115は、閾値量より大きいスケール比でビデオ閲覧ビューを拡大表示し、上述したジェスチャ334が実行されたことを契機として、モバイル機器115は、ビデオ・フレーム画像320を最大解像度で表示している状態から電子式ホワイト・ボードのスクリーン・ショット画像328を最大解像度で示すデータ閲覧ビューを表示する状態に切り換る。フェーズ(4)において、参加者125は、スクリーン・ショット画像328に向かってピンチ・ジェスチャのようなジェスチャ336を実行してデータ閲覧ビューからズーム・アウトし、ズームアウト量が閾値点に達したことによりデータ閲覧ビューから再びビデオ閲覧ビューに切り換えるようにモバイル機器115がトリガされるまで、データ閲覧ビューの画面表示スケールを減じさせる動作をモバイル機器115に実行させる。再度、モバイル機器115は、参加者125に対してビデオフレーム画像320を視覚的に提示する。   In phase (3), the participant 125 executes a gesture 334 such as a drag gesture toward the highlighted data screen 322 in the video frame image 320, and the mobile device 115 is triggered by the gesture 334. The mobile device 115 enlarges and displays the video browsing view with a scale ratio larger than the threshold amount, and the mobile device 115 starts electronically from the state where the video frame image 320 is displayed at the maximum resolution when the above-described gesture 334 is executed. It switches to the state which displays the data browsing view which shows the screen shot image 328 of a formula white board by the maximum resolution. In phase (4), participant 125 performed a gesture 336, such as a pinch gesture, towards screen shot image 328 to zoom out from the data viewing view and that the amount of zoom out has reached the threshold point Until the mobile device 115 is triggered to switch from the data browsing view to the video browsing view again, the mobile device 115 is caused to perform an operation of reducing the screen display scale of the data browsing view. Again, the mobile device 115 visually presents the video frame image 320 to the participant 125.

図4Aは、モバイル機器115上においてビデオ閲覧ビューを示すグラフィック・ユーザ・インターフェースの一実施形態をグラフィック表現400として図示している。当該ユーザ・インターフェースの具体例は、会議室を描写するビデオ・フレーム画像402を示している。ビデオ・フレーム画像402は、ホスト135と、会議室の壁に投影されたホスティング・デバイス101のデータ画面404とを描写する。データ画面404は、埋め込み型のデータ画面406を含む。参加者125がビデオ・フレーム画像402中に取り込まれたデータ画面404に対しジェスチャを実行すると、モバイル機器115は、ビデオ閲覧ビューから図4Bに示すデータ閲覧ビューへと切り換わる。   FIG. 4A illustrates one embodiment of a graphical user interface showing a video viewing view on the mobile device 115 as a graphical representation 400. The example user interface shows a video frame image 402 depicting a conference room. Video frame image 402 depicts host 135 and data screen 404 of hosting device 101 projected onto a conference room wall. The data screen 404 includes an embedded data screen 406. When participant 125 performs a gesture on data screen 404 captured in video frame image 402, mobile device 115 switches from the video viewing view to the data viewing view shown in FIG. 4B.

図4Bは、モバイル機器115上においてでデータ閲覧ビューを示すグラフィック・ユーザ・インターフェースの一実施形態をグラフィック表現420として図示している。この具体例では、データ画面404のスクリーン・ショット画像を含むデータ・ストリームが、モバイル機器115上において視覚的に提示される。データ・ストリームは、埋め込み型のデータ・ストリームを含むマルチユーザ通信セッションである。例えば、データ・ストリームは、埋め込まれたスライドを有する別の会議のビデオ・クリップである。埋め込まれたスライドを視覚提示する埋め込み型のデータ画面406が、データ画面404のスクリーン・ショット画像中に示される。   FIG. 4B illustrates one embodiment of a graphical user interface showing a data browsing view on the mobile device 115 as a graphical representation 420. In this illustrative example, a data stream including a screen shot image of data screen 404 is visually presented on mobile device 115. A data stream is a multi-user communication session that includes an embedded data stream. For example, the data stream is another conference video clip with an embedded slide. An embedded data screen 406 that visually presents the embedded slide is shown in the screen shot image of the data screen 404.

参加者125が図4Aに示すビデオ閲覧ビューから図4Bに示すデータ閲覧ビューに表示を切り換えると、ビデオ・クリップを含むデータ・ストリームが再生を開始する。一実施形態において、参加者125は、データ画面404のスクリーン・ショット画像に対しジェスチャ(例えば、ピンチ・ツー・クローズ・ジェスチャの操作)を実行することによって、図4Bに示すデータ閲覧ビューを終了し、図4Aに示すビデオ閲覧ビューに戻ることができる。一実施形態において、ビデオ・クリップが、埋め込まれたプレゼンテーションのスライドまたは埋め込まれたホワイト・ボードのストローク情報を含む場合、参加者125は、データ閲覧ビューにズームインし続けることが可能である。例えば、参加者125が、埋め込み型のデータ画面406に対しジェスチャを実行すると、モバイル機器115は、データ閲覧ビューから図4Cに示す埋め込み型のデータ閲覧ビューに表示を切り換えて、ビデオ・クリップ中に埋め込まれたスライドを視覚提示することが可能である。   When participant 125 switches display from the video viewing view shown in FIG. 4A to the data browsing view shown in FIG. 4B, the data stream containing the video clip begins to play. In one embodiment, participant 125 exits the data browsing view shown in FIG. 4B by performing a gesture (eg, a pinch-to-close gesture operation) on the screen shot image of data screen 404. Returning to the video viewing view shown in FIG. 4A. In one embodiment, if the video clip includes embedded presentation slide or embedded whiteboard stroke information, participant 125 may continue to zoom in on the data viewing view. For example, when the participant 125 performs a gesture on the embedded data screen 406, the mobile device 115 switches the display from the data browsing view to the embedded data browsing view shown in FIG. It is possible to visually present the embedded slide.

図4Cは、モバイル機器115上において埋め込み型のデータ閲覧ビューを示すグラフィック・ユーザ・インターフェースの一実施形態をグラフィック表現440として図示している。この具体例では、埋め込まれたデータ画面406中に示されたスライドが参加者125に視覚的に提示される。参加者125は、埋め込まれたデータ画面406のスクリーン・ショット画像に対しジェスチャ(例えば、ピンチ・ツー・クローズ・ジェスチャの操作)を実行することによって、埋め込み型のデータ閲覧ビューを終了し、図4Bに示すデータ閲覧ビューに戻ることができる。   FIG. 4C illustrates one embodiment of a graphical user interface showing an embedded data browsing view on the mobile device 115 as a graphical representation 440. In this specific example, the slide shown in the embedded data screen 406 is visually presented to the participant 125. Participant 125 exits the embedded data viewing view by performing a gesture (e.g., pinch-to-close gesture operation) on the screen shot image of embedded data screen 406, and FIG. It is possible to return to the data browsing view shown in FIG.

<本実施形態に係る方法>
図5は、マルチユーザ通信セッション中にジェスチャを使用してビデオ閲覧ビューとデータ閲覧ビューとの間で画面表示を切り換えるための方法500の一実施形態を示す流れ図である。一実施形態において、コントローラ202は、参加者125がマルチユーザ通信セッションに加わったことを示すデータを、参加者125に関連付けられたモバイル機器115から受信する(ステップ502)。ビュー提示モジュール204は、マルチユーザ通信セッション上のビデオ・ストリームをモバイル機器115上において視覚的に提示する(ステップ504)。例えば、ビュー提示モジュール204は、ビデオ・ストリームを画面表示するためのグラフィカル・データを生成するようユーザ・インターフェース・エンジン210に命令する。一実施形態において、画面検出モジュール206は、検出トリガ・イベントの発生の有無を判定する。コントローラ202は、検出トリガ・イベントの発生に応答して、ビデオ・ストリームからのビデオ・フレーム画像を受信する(ステップ506)。例えば、コントローラ202は、カメラ103からビデオ・ストリーム内の最新のビデオ・フレーム画像を受信する。画面検出モジュール206は、ビデオ・フレーム画像中の第1のデータ画面を検出する(ステップ508)。例えば、画面検出モジュール206は、ビデオ・フレーム画像が第1のデータ画面を取り込んでいると決定する。
<Method according to this embodiment>
FIG. 5 is a flow diagram illustrating one embodiment of a method 500 for switching a screen display between a video browsing view and a data browsing view using gestures during a multi-user communication session. In one embodiment, the controller 202 receives data from the mobile device 115 associated with the participant 125 that indicates that the participant 125 has joined the multi-user communication session (step 502). View presentation module 204 visually presents the video stream on the multi-user communication session on mobile device 115 (step 504). For example, the view presentation module 204 instructs the user interface engine 210 to generate graphical data for screen display of the video stream. In one embodiment, the screen detection module 206 determines whether a detection trigger event has occurred. The controller 202 receives a video frame image from the video stream in response to the occurrence of the detection trigger event (step 506). For example, the controller 202 receives the latest video frame image in the video stream from the camera 103. The screen detection module 206 detects the first data screen in the video frame image (step 508). For example, the screen detection module 206 determines that the video frame image is capturing a first data screen.

コントローラ202は、モバイル機器115で実行された第1のジェスチャを表すデータを受信する(ステップ510)。例えば、コントローラ202は、ビデオ・フレーム画像中の第1のデータ画面に向かって参加者が実行したピンチ・ツー・オープン・ジェスチャの操作を表すデータを受信する。ビュー切り換えモジュール208は、第1のジェスチャに応答して、モバイル機器115において表示中のビューをビデオ閲覧ビューからデータ閲覧ビューに切り換える(ステップ512)。ビュー提示モジュール204は、モバイル機器115上において、第1のデータ画面に関連付けられた第1のデータ・ストリームを視覚的に提示する(ステップ514)。一実施形態では、第1のデータ・ストリームは、第1のデータ画面に関連付けられた表示デバイス107によって生成された第1のデータ画面の1つ以上の高解像度スクリーン・ショット画像を含む。   The controller 202 receives data representing a first gesture performed on the mobile device 115 (step 510). For example, the controller 202 receives data representing a pinch-to-open gesture operation performed by the participant toward the first data screen in the video frame image. In response to the first gesture, the view switching module 208 switches the view being displayed on the mobile device 115 from the video viewing view to the data viewing view (step 512). View presentation module 204 visually presents a first data stream associated with the first data screen on mobile device 115 (step 514). In one embodiment, the first data stream includes one or more high resolution screen shot images of the first data screen generated by the display device 107 associated with the first data screen.

図6A〜図6Cは、マルチユーザ通信セッション中にジェスチャを使用してビデオ閲覧ビューとデータ閲覧ビューとの間で画面表示を切り換えるための方法600のさらに別の実施形態を示す流れ図である。図6Aを参照すると、コントローラ202は、参加者125がマルチユーザ通信セッションに加わったことを示すデータを、参加者125に関連付けられたモバイル機器115から受信する(ステップ602)。ビュー提示モジュール204は、モバイル機器115上において、マルチユーザ通信セッションのビデオ・ストリームを視覚的に提示する(ステップ604)。画面検出モジュール206は、登録サーバ130に対して表示デバイス107を登録する(ステップ606)。表示デバイス107は、ホスティング環境137においてマルチユーザ通信セッションのデータ・ストリームを視覚的に提示するためのデータ画面を含む。コントローラ202は、データ画面の画像を表示デバイス107から定期的に受信する(ステップ608)。例えば、コントローラ202は、データ画面のスクリーン・ショット画像を表示デバイス107から定期的に受信する。   6A-6C are a flow diagram illustrating yet another embodiment of a method 600 for switching a screen display between a video browsing view and a data browsing view using gestures during a multi-user communication session. Referring to FIG. 6A, the controller 202 receives data from the mobile device 115 associated with the participant 125 that indicates that the participant 125 has joined the multi-user communication session (step 602). View presentation module 204 visually presents the video stream of the multi-user communication session on mobile device 115 (step 604). The screen detection module 206 registers the display device 107 with the registration server 130 (step 606). Display device 107 includes a data screen for visually presenting a data stream of a multi-user communication session in hosting environment 137. The controller 202 periodically receives the data screen image from the display device 107 (step 608). For example, the controller 202 periodically receives a screen shot image of a data screen from the display device 107.

画面検出モジュール206は、検出トリガ・イベントの発生を検出する(ステップ610)。コントローラ202は、検出トリガ・イベントの発生に応答して、カメラ103から最新のビデオ・フレーム画像を受信する(ステップ612)。画面検出モジュール206は、表示デバイス107から受信されたデータ画面の最新画像を使用して、最新のビデオ・フレーム画像の中からデータ画面を検出する動作を実行する(ステップ614)。   The screen detection module 206 detects the occurrence of a detection trigger event (step 610). In response to the occurrence of the detection trigger event, the controller 202 receives the latest video frame image from the camera 103 (step 612). The screen detection module 206 performs an operation of detecting a data screen from the latest video frame image using the latest image of the data screen received from the display device 107 (step 614).

図6Bを参照すると、画面検出モジュール206は、最新のビデオフレーム画像中において、データ画面の最新画像とマッチングするサブ画像が見付かるか否かを決定する(ステップ616)。そのようなサブ画像が最新のビデオフレーム画像中に見付かった場合、方法600は、ステップ618に進む。そうでなければ、方法600は処理を終了する。図6B中のステップ618を参照すると、画面検出モジュール206は、データ画面の最新画像と最新のビデオ・フレーム画像との間のマッチングを示すマッチング結果を生成し、当該マッチング結果をモバイル機器115に通知する。画面検出モジュール206は、モバイル機器115とデータ画面に関連付けられた表示デバイス107との間においてデータを提供する。例えば、画面検出モジュール206は、デバイス同士の間における直接接続を確立する。一実施形態では、表示デバイス107は、データ画面に関連付けられたデータ・ストリームを、上述した直接接続を介してモバイル機器115に送信することができる。   Referring to FIG. 6B, the screen detection module 206 determines whether a sub-image matching the latest image on the data screen is found in the latest video frame image (step 616). If such a sub-image is found in the latest video frame image, the method 600 proceeds to step 618. Otherwise, method 600 ends the process. Referring to step 618 in FIG. 6B, the screen detection module 206 generates a matching result indicating the matching between the latest image on the data screen and the latest video frame image, and notifies the matching result to the mobile device 115. To do. The screen detection module 206 provides data between the mobile device 115 and the display device 107 associated with the data screen. For example, the screen detection module 206 establishes a direct connection between devices. In one embodiment, the display device 107 can send a data stream associated with the data screen to the mobile device 115 via the direct connection described above.

コントローラ202は、ビデオ・フレーム画像中のデータ画面を描写するサブ画像に対し参加者125によって実行された第1のジェスチャを表すデータを受信する(ステップ622)。コントローラ202は、データ画面に関連付けられたデータ・ストリームを表示デバイス107から受信する(ステップ624)。ビュー切り換えモジュール208は、第1のジェスチャが閾値を上回ることに応答して、モバイル機器115において表示中のビューをビデオ閲覧ビューからデータ閲覧ビューに切り換える(ステップ626)。例えば、ユーザは、表示サイズを拡張したビューを、画面の中央で始動させ、画面全体の幅の半分以上移動させる。ビュー提示モジュール204は、データ画面に関連付けられたデータ・ストリームを、モバイル機器115上において視覚的に提示する(ステップ628)。   Controller 202 receives data representing a first gesture performed by participant 125 on a sub-image depicting a data screen in the video frame image (step 622). Controller 202 receives a data stream associated with the data screen from display device 107 (step 624). The view switching module 208 switches the view being displayed on the mobile device 115 from the video viewing view to the data viewing view in response to the first gesture exceeding the threshold (step 626). For example, the user starts a view with an expanded display size at the center of the screen and moves it by more than half the width of the entire screen. View presentation module 204 visually presents the data stream associated with the data screen on mobile device 115 (step 628).

図6Cを参照すると、コントローラ202は、データ・ストリームに対し参加者125によって実行された第2のジェスチャを表すデータを受信する(ステップ630)。ビュー切り換えモジュール208は、第2のジェスチャが閾値を上回ることに応答して、モバイル機器115において表示中のビューを、データ閲覧ビューから再びビデオ閲覧ビューに切り換える(ステップ632)。ビュー提示モジュール204は、モバイル機器115上においてビデオ・ストリームを視覚的に提示する(ステップ634)。   Referring to FIG. 6C, the controller 202 receives data representing a second gesture performed by the participant 125 on the data stream (step 630). In response to the second gesture exceeding the threshold, the view switching module 208 switches the view being displayed on the mobile device 115 from the data viewing view to the video viewing view again (step 632). View presentation module 204 visually presents the video stream on mobile device 115 (step 634).

図7は、マルチユーザ通信セッション内において実行される選択操作を使用して、2つの異なるデータ閲覧ビューのうちの一方とビデオ閲覧ビューとの間で画面表示を切り換えるための方法700の一実施形態を示す流れ図である。一実施形態において、コントローラ202は、第1の参加者、第2の参加者、および第3の参加者125がマルチユーザ通信セッションに加わったことを示すデータを受信する(ステップ702)。ビュー提示モジュール204は、マルチユーザ通信セッション上のビデオ・ストリームを、第3の参加者125に関連付けられたモバイル機器115上において視覚的に提示する(ステップ704)。例えば、ビュー提示モジュール204は、ビデオ・ストリームを表示するためのグラフィカル・データを生成するよう、ユーザ・インターフェース・エンジン210に命令する。一実施形態において、画面検出モジュール206は、検出トリガ・イベントの発生の有無を判定する。コントローラ202は、第1の参加者に関連付けられた第1のデバイスと第2の参加者に関連付けられた第2のデバイスとが送信元に含まれるビデオ・ストリームからのビデオ・フレーム画像を受信する(ステップ706)。例えば、コントローラ202は、カメラ103からビデオ・ストリームの最新のビデオ・フレーム画像を受信する。画面検出モジュール206は、ビデオ・フレーム画像中の第1のデバイスからの第1のデータ画面と第2のデバイスからの第2のデータ画面とを検出する(ステップ708)。   FIG. 7 illustrates one embodiment of a method 700 for switching a screen display between one of two different data browsing views and a video browsing view using a selection operation performed within a multi-user communication session. It is a flowchart which shows. In one embodiment, the controller 202 receives data indicating that the first participant, the second participant, and the third participant 125 have joined the multi-user communication session (step 702). The view presentation module 204 visually presents the video stream on the multi-user communication session on the mobile device 115 associated with the third participant 125 (step 704). For example, the view presentation module 204 instructs the user interface engine 210 to generate graphical data for displaying the video stream. In one embodiment, the screen detection module 206 determines whether a detection trigger event has occurred. The controller 202 receives a video frame image from a video stream that includes a first device associated with a first participant and a second device associated with a second participant at a source. (Step 706). For example, the controller 202 receives the latest video frame image of the video stream from the camera 103. The screen detection module 206 detects a first data screen from the first device and a second data screen from the second device in the video frame image (step 708).

コントローラ202は、モバイル機器115上で実行された第1のデータ画面の選択操作を表すデータを受信する(ステップ710)。例えば、コントローラ202は、第3の参加者が第1のデータ閲覧ビューを見ることを望んでいることを示す入力操作であって、第1のデバイスの画像の中央において指で押圧する操作を表すデータを受信する。ビュー切り換えモジュール208は、当該選択操作に応答して、モバイル機器115において表示中のビューを、ビデオ閲覧ビューから第1のデータ画面に対応する第1のデータ閲覧ビューに切り換える(ステップ712)。ビュー提示モジュール204は、モバイル機器115上において第1のデータ・ストリームを視覚的に提示する(ステップ714)。   The controller 202 receives data representing the selection operation of the first data screen executed on the mobile device 115 (step 710). For example, the controller 202 represents an input operation indicating that the third participant wants to see the first data browsing view, and represents a pressing operation with a finger in the center of the image of the first device. Receive data. In response to the selection operation, the view switching module 208 switches the view being displayed on the mobile device 115 from the video browsing view to the first data browsing view corresponding to the first data screen (step 712). View presentation module 204 visually presents the first data stream on mobile device 115 (step 714).

本発明に係る実施形態についての上記説明は、本発明を例示し、説明する目的で提示されている。上記説明は、網羅的であること意図しておらず、さらに、本明細書を開示されたとおりの実施形態に限定することを意図しているわけでもない。上述した教示内容を考慮するならば、本発明に係る実施形態に対して、多くの変更および変形を行うことが可能である。本発明に包含される実施形態の範囲は、本明細書において上述した「発明の詳細な説明」によってではなく、むしろ本願の請求項によって規定されることが意図される。当業者によって理解されるように、本発明の実施例は、本発明の技術思想または本質的な特性から逸脱せずに、その他の特定の形態で具体化されることができる。同様に、モジュール、ルーチン、特徴、属性、方法、および他の態様の、特定の名称および区分は、必須でもなければ有意でもなく、説明を実現するメカニズムまたはその特徴は、異なる名称、区分、および/または形式を有することができる。さらに、関連技術における当業者にとって明らかであるように、本明細書のモジュール、ルーチン、特徴、属性、方法、および他の態様は、ソフトウェア、ハードウェア、ファームウェア、またはその3つの任意の組み合わせとして実現されることができる。また、本明細書のコンポーネントの具体例は機能モジュールであるが、ソフトウェアとして実現される場合にあっては、当該コンポーネントは、スタンドアロン型のプログラムとして、より大きいプログラムの一部として、複数の別個のプログラムとして、静的または動的にリンクしたライブラリとして、カーネル・ローダブル・モジュールとして、デバイス・ドライバとして、および/または、コンピュータ・プログラミングの分野における当業者にとって現在または未来において周知のあらゆるいずれかの他の手法によって必然的に実現され得る。さらに、本明細書は、任意の特定のプログラミング言語における、または、任意の特定のオペレーティング・システムまたは環境のための実施形態に限定されるものでは決してない。したがって、本開示は、本明細書に記載された発明の範囲を限定するのではなく例示することを意図し、本開示の技術的範囲は、以下に記載された請求項において規定される。   The foregoing description of the embodiments according to the present invention has been presented for purposes of illustrating and describing the present invention. The above description is not intended to be exhaustive, nor is it intended to limit the specification to the embodiments as disclosed. Many modifications and variations can be made to the embodiments of the present invention in view of the teachings described above. It is intended that the scope of the embodiments encompassed by the present invention be defined not by the “Detailed Description of the Invention” herein above, but rather by the claims of this application. As will be appreciated by those skilled in the art, embodiments of the present invention may be embodied in other specific forms without departing from the spirit or essential characteristics of the invention. Similarly, specific names and categories of modules, routines, features, attributes, methods, and other aspects are neither required nor significant, and the mechanism or feature that implements the description has different names, categories, and Can have a format. Further, as will be apparent to those skilled in the relevant art, the modules, routines, features, attributes, methods, and other aspects herein are implemented as software, hardware, firmware, or any combination of the three. Can be done. In addition, although a specific example of a component in the present specification is a functional module, when implemented as software, the component may be a stand-alone program, a part of a larger program, and a plurality of separate modules. As a program, as a statically or dynamically linked library, as a kernel loadable module, as a device driver, and / or any other known now or in the future to those skilled in the field of computer programming This method can inevitably be realized. In addition, this description is in no way limited to embodiments in any particular programming language or for any particular operating system or environment. Accordingly, this disclosure is intended to illustrate rather than limit the scope of the invention described herein, and the technical scope of this disclosure is defined in the claims set forth below.

Claims (20)

コンピュータによって実現される方法であって、
参加者がマルチユーザ通信セッションに加わったことを示すデータをプロセッサが受信するステップと、
前記マルチユーザ通信セッション上のビデオ・ストリームを前記参加者に関連付けられたモバイル機器上において前記プロセッサが視覚的に提示するステップと、
前記検出トリガ・イベントの発生に応答して、前記ビデオ・ストリームからのビデオ・フレーム画像を前記プロセッサが受信するステップと、
前記ビデオ・フレーム画像中の第1のデータ画面を前記プロセッサが検出するステップと、
前記モバイル機器に向かって前記参加者が実行した第1のジェスチャを表すデータを前記プロセッサが受信するステップと、
前記第1のジェスチャが閾値を上回ることに応答して、前記モバイル機器において表示中のビューをビデオ閲覧ビューからデータ閲覧ビューへと前記プロセッサが切り換えるステップと、
前記第1のデータ画面に関連付けられた第1のデータ・ストリームを前記モバイル機器上において視覚的に提示するステップと
を備える方法。
A computer-implemented method comprising:
The processor receiving data indicating that the participant has joined the multi-user communication session; and
The processor visually presenting a video stream on the multi-user communication session on a mobile device associated with the participant;
The processor receiving a video frame image from the video stream in response to the occurrence of the detection trigger event;
The processor detecting a first data screen in the video frame image;
The processor receiving data representing a first gesture performed by the participant towards the mobile device;
In response to the first gesture exceeding a threshold, the processor switches a view being displayed on the mobile device from a video browsing view to a data browsing view;
Visually presenting on the mobile device a first data stream associated with the first data screen.
前記ビデオ・フレーム画像中の前記第1のデータ画面を検出するステップは、
前記第1のデータ画面に関連付けられた第1の表示デバイスを登録するステップと、
前記第1の表示デバイスから前記第1のデータ画面の第1の画像を受信するステップと、
前記第1のデータ画面の前記第1の画像とマッチングする前記ビデオ・フレーム画像内の第2の画像を検出する検出ステップであって、前記第2の画像は、前記ビデオ・フレーム画像中に取り込まれた前記第1のデータ画面のさらに別の画像である、検出ステップと、
前記第1のデータ画面の前記第1の画像と前記ビデオ・フレーム画像内の前記第2の画像との間における前記マッチングの結果を前記モバイル機器に通知するステップと、
前記モバイル機器と前記第1の表示デバイスとの間においてデータを提供するステップと
を備える、請求項1に記載の方法。
Detecting the first data screen in the video frame image comprises:
Registering a first display device associated with the first data screen;
Receiving a first image of the first data screen from the first display device;
A detecting step of detecting a second image in the video frame image matching the first image of the first data screen, the second image being captured in the video frame image A detection step, which is yet another image of the first data screen displayed;
Notifying the mobile device of the result of the matching between the first image of the first data screen and the second image in the video frame image;
The method of claim 1, comprising providing data between the mobile device and the first display device.
前記検出トリガ・イベントは、カメラの動きと前記ビデオ・フレーム画像中に取り込まれた対象物の動きのいずれか一方に起因するイベントを含む、請求項1に記載の方法。   The method according to claim 1, wherein the detection trigger event includes an event caused by one of a camera movement and an object movement captured in the video frame image. 前記モバイル機器で実行された第2のジェスチャを表すデータを受信するステップと、
前記第2のジェスチャが閾値を上回ることに応答して、前記モバイル機器において表示中の前記ビューをデータ閲覧ビューからビデオ閲覧ビューへと切り換えるステップと、
前記モバイル機器上において前記ビデオ・ストリームを視覚的に提示するステップと
をさらに備える、請求項1に記載の方法。
Receiving data representing a second gesture performed on the mobile device;
Responsive to the second gesture exceeding a threshold value, switching the view being displayed on the mobile device from a data browsing view to a video browsing view;
The method of claim 1, further comprising visually presenting the video stream on the mobile device.
前記ビデオ・フレーム画像中の第2のデータ画面を検出するステップと、
前記モバイル機器に向かって実行された第3のジェスチャを表すデータを受信するステップと、
前記第3のジェスチャが閾値を上回ることに応答して、前記モバイル機器において表示中の前記ビューをビデオ閲覧ビューからデータ閲覧ビューへと切り換えるステップと、
前記第2のデータ画面に関連付けられた第2のデータ・ストリームを前記モバイル機器上において視覚的に提示するステップと
をさらに備える、請求項4に記載の方法。
Detecting a second data screen in the video frame image;
Receiving data representing a third gesture performed toward the mobile device;
In response to the third gesture being above a threshold, switching the view being displayed on the mobile device from a video browsing view to a data browsing view;
5. The method of claim 4, further comprising: visually presenting on the mobile device a second data stream associated with the second data screen.
前記第1のデータ・ストリームは、前記第1のデータ画面内において提示されたコンテンツを含む、請求項1に記載の方法。   The method of claim 1, wherein the first data stream includes content presented within the first data screen. 前記第1のデータ・ストリームは、埋め込み型のデータ・ストリームを含み、
前記モバイル機器に向かって実行された第4のジェスチャを表すデータを受信するステップと、
前記第4のジェスチャに応答して、前記埋め込み型のデータ・ストリームを前記モバイル機器上において視覚的に提示するステップと
をさらに備える、請求項1に記載の方法。
The first data stream comprises an embedded data stream;
Receiving data representing a fourth gesture performed toward the mobile device;
The method of claim 1, further comprising visually presenting the embedded data stream on the mobile device in response to the fourth gesture.
システムであって、
1つ以上のプロセッサと、
メモリに記憶され、前記1つ以上のプロセッサによって実行可能なコントローラであって、参加者がマルチユーザ通信セッションに加わったことを示すデータを受信するように構成され、前記参加者に関連付けられたモバイル機器に向かって前記参加者が実行した第1のジェスチャを表すデータを受信するように構成された、コントローラと、
前記メモリに記憶され、前記1つ以上のプロセッサによって実行可能なビュー提示モジュールであって、前記参加者が前記マルチユーザ通信セッションに加わることに応答して、前記マルチユーザ通信セッションのビデオ・ストリームを前記モバイル機器上において視覚的に提示するように構成され、前記第1のジェスチャに応答して、第1のデータ画面に関連付けられた第1のデータ・ストリームを前記モバイル機器上において視覚的に提示するように構成された、ビュー提示モジュールと
前記メモリに記憶され、前記1つ以上のプロセッサによって実行可能な画面検出モジュールであって、前記検出トリガ・イベントの発生の有無を判定するように構成され、前記ビデオ・フレーム画像中の前記第1のデータ画面を検出するように構成された、画面検出モジュールと、
前記メモリに記憶され、前記1つ以上のプロセッサによって実行可能なビュー切り換えモジュールであって、前記第1のジェスチャが閾値を上回ることに応答して、前記モバイル機器において表示中のビューをビデオ閲覧ビューからデータ閲覧ビューへと切り換えるように構成された、ビュー切り換えモジュールと
を備えるシステム。
A system,
One or more processors;
A controller stored in memory and executable by the one or more processors configured to receive data indicating that a participant has joined a multi-user communication session and associated with the participant A controller configured to receive data representing a first gesture performed by the participant towards the device;
A view presentation module stored in the memory and executable by the one or more processors, wherein a video stream of the multi-user communication session is received in response to the participant joining the multi-user communication session. Visually presenting on the mobile device a first data stream configured to visually present on the mobile device and responsive to the first gesture and associated with a first data screen A view presentation module configured to: a screen detection module stored in the memory and executable by the one or more processors, configured to determine whether the detection trigger event has occurred Configured to detect the first data screen in the video frame image. A screen detection module,
A view switching module stored in the memory and executable by the one or more processors, wherein the view being displayed on the mobile device is a video viewing view in response to the first gesture exceeding a threshold. And a view switching module configured to switch from a data browsing view to a data browsing view.
前記画面検出モジュールは、
前記第1のデータ画面に関連付けられた第1の表示デバイスを登録するステップと、
前記第1の表示デバイスから前記第1のデータ画面の第1の画像を受信するステップと、
前記第1のデータ画面の前記第1の画像とマッチングする前記ビデオ・フレーム画像内の第2の画像を検出する検出ステップであって、前記第2の画像は、前記ビデオ・フレーム画像中に取り込まれた前記第1のデータ画面のさらに別の画像である、検出ステップと、
前記第1のデータ画面の前記第1の画像と前記ビデオ・フレーム画像内の前記第2の画像との間における前記マッチングの結果を前記モバイル機器に通知するステップと、
前記モバイル機器と前記第1の表示デバイスとの間においてデータを提供するステップと
によって、前記ビデオ・フレーム画像中の前記第1のデータ画面を検出するように構成される、請求項8に記載のシステム。
The screen detection module includes:
Registering a first display device associated with the first data screen;
Receiving a first image of the first data screen from the first display device;
A detecting step of detecting a second image in the video frame image matching the first image of the first data screen, the second image being captured in the video frame image A detection step, which is yet another image of the first data screen displayed;
Notifying the mobile device of the result of the matching between the first image of the first data screen and the second image in the video frame image;
9. The method of claim 8, configured to detect the first data screen in the video frame image by providing data between the mobile device and the first display device. system.
前記検出トリガ・イベントは、カメラの動きと前記ビデオ・フレーム画像中に取り込まれた対象物の動きのいずれか一方に起因するイベントを含む、請求項8に記載のシステム。   The system of claim 8, wherein the detection trigger event includes an event caused by either camera movement or object movement captured in the video frame image. 前記コントローラはさらに、前記モバイル機器に向かって実行された第2のジェスチャを表すデータを受信するように構成され、
前記ビュー切り換えモジュールはさらに、前記第2のジェスチャが閾値を上回ることに応答して、前記モバイル機器において表示中の前記ビューをデータ閲覧ビューからビデオ閲覧ビューへと切り換えるように構成され、
前記ビュー提示モジュールはさらに、前記モバイルデバイスで前記ビデオストリームを提示するように構成される、請求項8に記載のシステム。
The controller is further configured to receive data representative of a second gesture performed toward the mobile device;
The view switching module is further configured to switch the view being displayed on the mobile device from a data viewing view to a video viewing view in response to the second gesture exceeding a threshold value;
The system of claim 8, wherein the view presentation module is further configured to present the video stream at the mobile device.
前記画面検出モジュールはさらに、前記ビデオ・フレーム画像中の第2のデータ画面を検出するように構成され、
前記コントローラはさらに、前記モバイル機器に向かって実行された第3のジェスチャを表すデータを受信するように構成され、
前記ビュー切り換えモジュールはさらに、前記第3のジェスチャが閾値を上回ることに応答して、前記モバイル機器において表示中の前記ビューをビデオ閲覧ビューからデータ閲覧ビューへと切り換えるように構成され、
前記ビュー提示モジュールはさらに、前記第2のデータ画面に関連付けられた第2のデータ・ストリームを前記モバイル機器上において視覚的に提示するように構成される、請求項8に記載のシステム。
The screen detection module is further configured to detect a second data screen in the video frame image;
The controller is further configured to receive data representing a third gesture performed toward the mobile device;
The view switching module is further configured to switch the view being displayed on the mobile device from a video browsing view to a data browsing view in response to the third gesture exceeding a threshold;
9. The system of claim 8, wherein the view presentation module is further configured to visually present a second data stream associated with the second data screen on the mobile device.
前記第1のデータ・ストリームは、前記第1のデータ画面内において提示されたコンテンツを含む、請求項8に記載のシステム。   The system of claim 8, wherein the first data stream includes content presented within the first data screen. 前記第1のデータ・ストリームは、埋め込み型のデータ・ストリームを含み、
前記コントローラはさらに、前記モバイル機器に向かって実行された第4のジェスチャを表すデータを受信するように構成され、
前記ビュー提示モジュールはさらに、前記第4のジェスチャに応答して、前記埋め込み型のデータ・ストリームを前記モバイル機器上において視覚的に提示するように構成される、請求項8に記載のシステム。
The first data stream comprises an embedded data stream;
The controller is further configured to receive data representing a fourth gesture performed toward the mobile device;
The system of claim 8, wherein the view presentation module is further configured to visually present the embedded data stream on the mobile device in response to the fourth gesture.
コンピュータで実現される方法であって、
第1の参加者、第2の参加者、および第3の参加者がマルチユーザ通信セッションに加わったことを示すデータをプロセッサが受信するステップと、
マルチユーザ通信セッション上のビデオ・ストリームを、前記第3の参加者に関連付けられたモバイル機器上において前記プロセッサが視覚的に提示するステップと、
前記第1の参加者に関連付けられた第1のデバイスと前記第2の参加者に関連付けられた第2のデバイスとが送信元に含まれる前記第1のビデオ・ストリームからのビデオ・フレーム画像を前記プロセッサが受信するステップと、
前記ビデオ・フレーム画像中の前記第1のデバイスからの第1のデータ画面と前記第2のデバイスからの第2のデータ画面とを前記プロセッサが検出するステップと、
前記モバイル機器上で実行された前記第1のデータ画面の選択操作を表すデータを前記プロセッサが受信するステップと、
前記選択操作がされたことに応答して、前記モバイル機器において表示中のビューをビデオ閲覧ビューから前記第1のデータ画面に対応する第1のデータ閲覧ビューへと切り換えるステップと、
前記モバイル機器上において前記第1のデータ・ストリームを前記プロセッサが視覚的に提示するステップと
を備える方法。
A computer-implemented method,
The processor receiving data indicating that the first participant, the second participant, and the third participant have joined the multi-user communication session;
The processor visually presenting a video stream on a multi-user communication session on a mobile device associated with the third participant;
A video frame image from the first video stream in which a first device associated with the first participant and a second device associated with the second participant are included in a source, Receiving by the processor;
The processor detecting a first data screen from the first device and a second data screen from the second device in the video frame image;
The processor receiving data representing a selection operation of the first data screen performed on the mobile device;
In response to the selection operation being performed, switching a view being displayed on the mobile device from a video browsing view to a first data browsing view corresponding to the first data screen;
The processor visually presenting the first data stream on the mobile device.
前記ビデオ・フレーム画像中の前記第1のデータ画面を検出するステップは、
前記第1のデータ画面に関連付けられた第1の表示デバイスを登録するステップと、
前記第1の表示デバイスから前記第1のデータ画面の第1の画像を受信するステップと、
前記第1のデータ画面の前記第1の画像とマッチングする前記ビデオ・フレーム画像内の第2の画像を検出する検出ステップであって、前記第2の画像は、前記ビデオ・フレーム画像中に取り込まれた前記第1のデータ画面のさらに別の画像である、検出ステップと、
前記第1のデータ画面の前記第1の画像と前記ビデオ・フレーム画像内の前記第2の画像との間における前記マッチングの結果を前記モバイル機器に通知するステップと、
前記モバイル機器と前記第1の表示デバイスとの間においてデータを提供するステップと
を備える、請求項15に記載の方法。
Detecting the first data screen in the video frame image comprises:
Registering a first display device associated with the first data screen;
Receiving a first image of the first data screen from the first display device;
A detecting step of detecting a second image in the video frame image matching the first image of the first data screen, the second image being captured in the video frame image A detection step, which is yet another image of the first data screen displayed;
Notifying the mobile device of the result of the matching between the first image of the first data screen and the second image in the video frame image;
16. The method of claim 15, comprising providing data between the mobile device and the first display device.
前記ビデオ・ストリームを提示するステップは、カメラの動きと前記ビデオ・フレーム画像中に取り込まれた対象物の動きのいずれか一方に起因するイベントを含む検出トリガ・イベントに応答して実行される、請求項15に記載の方法。   Presenting the video stream is performed in response to a detection trigger event that includes an event due to either camera motion or object motion captured in the video frame image. The method of claim 15. 前記モバイル機器に向かって実行された第2のジェスチャを表すデータを受信するステップと、
前記第2のジェスチャが閾値を上回ることに応答して、前記モバイル機器において表示中の前記ビューをデータ閲覧ビューからビデオ閲覧ビューへと切り換えるステップと、
前記モバイル機器上において前記ビデオ・ストリームを視覚的に提示するステップと
をさらに備える、請求項15に記載の方法。
Receiving data representing a second gesture performed toward the mobile device;
Responsive to the second gesture exceeding a threshold value, switching the view being displayed on the mobile device from a data browsing view to a video browsing view;
16. The method of claim 15, further comprising visually presenting the video stream on the mobile device.
前記ビデオ・フレーム画像中の第2のデータ画面を前記プロセッサが検出するステップと、
前記モバイル機器に向かって実行された第3のジェスチャを表すデータを受信するステップと、
前記第3のジェスチャが閾値を上回ることに応答して、前記モバイル機器において表示中の前記ビューをビデオ閲覧ビューからデータ閲覧ビューへと切り換えるステップと、
前記モバイル機器上において前記第2のデータ画面に関連付けられた第2のデータ・ストリームを視覚的に提示するステップと
をさらに備える、請求項18に記載の方法。
The processor detecting a second data screen in the video frame image;
Receiving data representing a third gesture performed toward the mobile device;
In response to the third gesture being above a threshold, switching the view being displayed on the mobile device from a video browsing view to a data browsing view;
19. The method of claim 18, further comprising: visually presenting a second data stream associated with the second data screen on the mobile device.
前記第1のデータ・ストリームは、前記第1のデータ画面内において提示されたコンテンツを含む、請求項15に記載の方法。   The method of claim 15, wherein the first data stream includes content presented within the first data screen.
JP2014179191A 2013-09-06 2014-09-03 System and method for switching screen display between multiple views using gestures Active JP6497002B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/019,915 2013-09-06
US14/019,915 US9197853B2 (en) 2013-05-20 2013-09-06 Switching between views using natural gestures

Publications (2)

Publication Number Publication Date
JP2015053051A true JP2015053051A (en) 2015-03-19
JP6497002B2 JP6497002B2 (en) 2019-04-10

Family

ID=52705323

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014179191A Active JP6497002B2 (en) 2013-09-06 2014-09-03 System and method for switching screen display between multiple views using gestures

Country Status (1)

Country Link
JP (1) JP6497002B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107507475A (en) * 2017-07-27 2017-12-22 北京华文众合科技有限公司 Central control system, interactive teaching system and method

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005051778A (en) * 2003-07-28 2005-02-24 Fuji Xerox Co Ltd Integrated system for providing shared interactive environment, computer data signal, program, system, method for exchanging information in shared interactive environment, and method for annotating live video image
JP2006517366A (en) * 2003-01-23 2006-07-20 インターグラフ ハードウェア テクノロジーズ カンパニー Video content analysis system with scene change detector
JP2012222642A (en) * 2011-04-11 2012-11-12 Sony Corp Data distribution apparatus, data distribution method, and program
US20130083151A1 (en) * 2011-09-30 2013-04-04 Lg Electronics Inc. Electronic device and method for controlling electronic device
JP2013105238A (en) * 2011-11-11 2013-05-30 Sony Corp Information processing device, method and program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006517366A (en) * 2003-01-23 2006-07-20 インターグラフ ハードウェア テクノロジーズ カンパニー Video content analysis system with scene change detector
JP2005051778A (en) * 2003-07-28 2005-02-24 Fuji Xerox Co Ltd Integrated system for providing shared interactive environment, computer data signal, program, system, method for exchanging information in shared interactive environment, and method for annotating live video image
JP2012222642A (en) * 2011-04-11 2012-11-12 Sony Corp Data distribution apparatus, data distribution method, and program
US20130083151A1 (en) * 2011-09-30 2013-04-04 Lg Electronics Inc. Electronic device and method for controlling electronic device
JP2013105238A (en) * 2011-11-11 2013-05-30 Sony Corp Information processing device, method and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107507475A (en) * 2017-07-27 2017-12-22 北京华文众合科技有限公司 Central control system, interactive teaching system and method
CN107507475B (en) * 2017-07-27 2020-06-16 北京华文众合科技有限公司 Central control system, interactive teaching system and method

Also Published As

Publication number Publication date
JP6497002B2 (en) 2019-04-10

Similar Documents

Publication Publication Date Title
US9197853B2 (en) Switching between views using natural gestures
JP6171263B2 (en) Remote conference system and remote conference terminal
JP4645090B2 (en) Method, system and program for exchanging information in a shared interactive environment
US10742932B2 (en) Communication terminal, communication system, moving-image outputting method, and recording medium storing program
US9531999B2 (en) Real-time smart display detection system
JP2017108366A (en) Method of controlling video conference, system, and program
US8934024B2 (en) Efficient, user-friendly system to stream screens inside video using a mobile device
JP2012186805A (en) Automated selection and switching of displayed information
JP2012133586A (en) Display device, screen image transfer method and program
JP4872482B2 (en) Remote support device, remote support system, and remote support method
US20140285437A1 (en) Method of internet browser-based remote user interface virtual mouse cursor positioning
JP6497002B2 (en) System and method for switching screen display between multiple views using gestures
US9519709B2 (en) Determination of an ordered set of separate videos
JP2018060513A (en) Communication terminal, communication system, transmission method, and program
JP2012156726A (en) Information processor, information processing method, and program
JP2021036400A (en) Information processing system, information processing apparatus, information processing method, and program
US11893541B2 (en) Meeting and collaborative canvas with image pointer
WO2023237014A1 (en) Image acquisition method and apparatus for information input page, and device and medium
JP6485352B2 (en) Receiving apparatus, method, computer program
JP6439325B2 (en) Usage management system, fee provision method, and program
JP2024517561A (en) SYSTEM AND METHOD FOR MANAGING DIGITAL RECORDS FOR COLLABORATION - Patent application
TW201437903A (en) Controlling method for remote device and remote controlling system
WO2019155265A1 (en) System for real-time video and still image sharing
JP2021043691A (en) Information processing system, communication terminal, information processing method and program
JP2007318543A (en) Terminal device and photographing device control method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170822

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180903

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190225

R151 Written notification of patent or utility model registration

Ref document number: 6497002

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151