JP4728357B2 - Remote conference management system, remote conference management method, and remote conference operation confirmation program - Google Patents

Remote conference management system, remote conference management method, and remote conference operation confirmation program Download PDF

Info

Publication number
JP4728357B2
JP4728357B2 JP2008005789A JP2008005789A JP4728357B2 JP 4728357 B2 JP4728357 B2 JP 4728357B2 JP 2008005789 A JP2008005789 A JP 2008005789A JP 2008005789 A JP2008005789 A JP 2008005789A JP 4728357 B2 JP4728357 B2 JP 4728357B2
Authority
JP
Japan
Prior art keywords
conference
data
conference terminal
unit
data storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008005789A
Other languages
Japanese (ja)
Other versions
JP2009171120A (en
Inventor
俊夫 笠間
能行 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mizuho Information and Research Institute Inc
Original Assignee
Mizuho Information and Research Institute Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mizuho Information and Research Institute Inc filed Critical Mizuho Information and Research Institute Inc
Priority to JP2008005789A priority Critical patent/JP4728357B2/en
Publication of JP2009171120A publication Critical patent/JP2009171120A/en
Application granted granted Critical
Publication of JP4728357B2 publication Critical patent/JP4728357B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、遠隔地に設置された会議端末同士を、ネットワークを介して接続し、映像や音声を用いて会議を行なうための遠隔会議管理システム、遠隔会議管理方法及び遠隔会議管理プログラムに関する。   The present invention relates to a remote conference management system, a remote conference management method, and a remote conference management program for connecting conference terminals installed at remote locations via a network and performing a conference using video and audio.

今日、企業において異なる事業所間をネットワークで接続して対話を行なうことができるようにした遠隔会議管理システムが利用されている。しかし、このような遠隔会議管理システムでは、会議参加者が本人であることを認証することや、会議参加者が実際に会議に参加していることを証明することが困難であった。   2. Description of the Related Art Today, a teleconference management system is used in which companies can connect different offices via a network and perform a dialogue. However, with such a remote conference management system, it is difficult to authenticate that the conference participant is the person himself / herself and prove that the conference participant is actually participating in the conference.

そこで、会議の信頼性を向上させるための会議システムが検討されている(例えば、特許文献1、2を参照。)。この文献1に記載の会議システムは、認証手段が、会議開催端末から送信された主催者からの生体情報と、識別子情報と、暗証番号との整合性を、利用者データ記憶部に記憶されている認証データを元に確認することで主催者の認証を行なう。また、議事録作成手段が、会議内容記憶部に記録された内容より議事録を作成し、署名受付手段が、送られてきた署名を受け付けて議事録と共に会議内容記憶部に記録する。   Therefore, a conference system for improving the reliability of the conference has been studied (for example, see Patent Documents 1 and 2). In the conference system described in Document 1, the authentication unit stores the consistency between the biometric information from the organizer transmitted from the conference host terminal, the identifier information, and the password, in the user data storage unit. The organizer is authenticated by checking the authentication data. Also, the minutes creation means creates the minutes from the contents recorded in the meeting content storage unit, and the signature reception means accepts the sent signature and records it together with the minutes in the meeting content storage unit.

また、この文献2に記載の会議システムにおいても、正しい主催者であることを参加者端末に示すために用いる認証用情報を主催者端末側で生成し、認証用情報を参加者端末に提供して会議参加の依頼を行なう。そして、主催者端末からの会議参加依頼を待機し、主催者端末からの会議参加依頼に対し、提供された認証用情報を元に、操作者が会議接続の可否を判断し、会議参加のための接続処理を行なう。
特開2002−271498号公報(第1頁) 特開2003−167856号公報(第1頁)
Also, in the conference system described in Document 2, authentication information used to indicate to the participant terminal that the host is correct is generated on the organizer terminal side, and the authentication information is provided to the participant terminal. And request to join the meeting. Then, it waits for a meeting participation request from the organizer terminal, and for the meeting participation request from the organizer terminal, the operator determines whether or not the meeting connection is possible based on the authentication information provided and The connection process is performed.
JP 2002-271498 A (first page) JP 2003-167856 A (first page)

このような遠隔会議管理システムは、より厳格性が求められる場面においても利用される可能性がある。例えば、会社法では、取締役会議事録の記載事項において、「取締役会が開催された日時及び場所(当該場所に存しない取締役、執行役、会計参与、監査役、会計監査人又は株主が取締役会に出席をした場合における当該出席の方法を含む。」(施行規則101条3項1号)が含まれており、テレビ会議方式によって取締役会が実施されることが想定されている。このような会議では、会議開催条件が厳格に求められるが、遠隔地間での会議においては、物理的な出席により達成される様々な知覚に匹敵する確証を出席者全員が確実に取得していると認識することが困難である。具体的には、参加者一人一人について、以下の条件が求められる。   Such a remote conference management system may be used even in situations where more stringency is required. For example, the Companies Act states that the date and place of a board meeting (a director, executive officer, accounting advisor, auditor, accounting auditor or shareholder who does not exist at the board meeting) The method of attendance in the case of attending at the same time is included ”(Enforcement Regulations, Article 101, Paragraph 3, Item 1), and it is assumed that the Board of Directors will be held by the video conference system. Meetings require strict requirements for meeting conditions, but in remote meetings, we recognize that all attendees are surely obtaining confirmations comparable to the various perceptions achieved by physical attendance. Specifically, the following conditions are required for each participant.

・ 各出席者の存在が相互に他の出席者に認められており、その確証を得ることができること。
・ 各出席者の発言が相互に他の出席者に正確かつ完全に聞きとられており、その確証を得ることができること。
・ The existence of each attendee is mutually recognized by other attendees and can be confirmed.
・ Each participant's remarks must be heard accurately and completely by other participants and can be confirmed.

特許文献1、2においては、認証処理を行なうことにより、遠隔会議管理システムの信頼性の向上を図っているが、上述の各出席者における存在や発言の確証は、会議端末やネットワークの確実な動作の上で実現される。従って、これらに不具合等がある場合には、
確実な遠隔会議を実現することができない。
In Patent Documents 1 and 2, the authentication process is performed to improve the reliability of the remote conference management system. However, the existence and remarks of each attendee described above are confirmed by the conference terminal and the network. Realized in operation. Therefore, if any of these are defective,
A reliable remote conference cannot be realized.

本発明は、上述の問題に鑑みてなされたものであり、この目的は、遠隔地に設置された会議端末同士を、ネットワークを介して接続し、映像や音声を用いて確実に会議を行なうための遠隔会議管理システム、遠隔会議管理方法及び遠隔会議動作確認プログラムを提供することにある。   The present invention has been made in view of the above-described problems, and the object of the present invention is to connect conference terminals installed at remote locations via a network and perform a conference reliably using video and audio. A remote conference management system, a remote conference management method, and a remote conference operation confirmation program.

上記問題点を解決するために、請求項1に記載の発明は、隔会議の動作確認を行なう動作確認制御手段と、エコー信号の基準値を記憶した基準値データ記憶手段と、送信データ記憶手段と、入力部とを備えた第1の会議端末と、前記第1の会議端末にネットワークを介して接続されるとともに、入力部と出力部とを備えた第2の会議端末とから構成され
遠隔会議管理システムであって、前記動作確認制御手段が、前記第1の会議端末の入力部を介して取得した第1実況データを前記送信データ記憶手段に記録する記録手段、前記第2の会議端末に対して前記第1実況データを送信する送信手段、前記第2の会議端末の出力部における前記第1実況データの出力が、前記第2の会議端末の入力部において入力され、前記第2の会議端末から送信された第2実況データを、前記ネットワークを介して受信する受信手段、前記第2実況データから、前記送信データ記憶手段に記録された第1実況データのエコー信号を抽出するエコー抽出手段、前記エコー信号の大きさが前記基準値データ記憶手段に記憶された基準値以下である場合には、アラームを出力するアラーム出力手段を備えたことを要旨とする。
In order to solve the above problems, a first aspect of the present invention, the operation confirmation control means for operation check of the far septum conference, and the reference value data storage means for storing a reference value of the echo signal, the transmission data storage Means and a first conference terminal provided with an input unit; and a second conference terminal connected to the first conference terminal via a network and provided with an input unit and an output unit.
And a teleconference management system, the operation confirmation control means, the first conference terminal first commentary recording means for recording the data in the transmission data storage unit acquired via the input unit of the second transmitting means for transmitting the first Commentary data to the conference terminals, an output of the first Commentary data at the output of the second conference terminal is input at the input of the second conference terminal, the first Receiving means for receiving second live data transmitted from the two conference terminals via the network, and extracting an echo signal of the first live data recorded in the transmission data storage means from the second live data. echo extraction means, wherein when the magnitude of the echo signal has been equal to or less than the reference value stored in the reference value data storage means, Abstract, further comprising an alarm output means for outputting an alarm To.

請求項に記載の発明は、請求項1に記載の遠隔会議管理システムにおいて、前記第1の会議端末は、出力部を更に備え、前記動作確認制御手段は、前記第2実況データから前記第1実況データのエコー信号を消去して、前記第1の会議端末の出力部から出力する手段を更に備えたことを要旨とする。 Invention according to claim 2, in the remote conference management system according to claim 1, wherein the first conference terminal may further include the operation confirmation control unit output unit, before Symbol from said second Commentary Statistics The gist of the present invention is that it further comprises means for deleting the echo signal of the first live data and outputting it from the output unit of the first conference terminal.

請求項に記載の発明は、請求項1又は2に記載の遠隔会議管理システムにおいて、前記第1の会議端末は、遠隔会議の実況データを記録する実況データ記憶手段を更に備え、前記動作確認制御手段は、前記エコー信号を消去した第2実況データを前記実況データ記憶手段に記録する手段を更に備えたことを要旨とする。 According to a third aspect of the present invention, in the remote conference management system according to the first or second aspect, the first conference terminal further includes an actual data storage unit that records actual data of the remote conference, and the operation check The gist of the present invention is that the control means further comprises means for recording the second actual data from which the echo signal has been deleted in the actual data storage means.

請求項に記載の発明は、請求項1〜のいずれか1つに記載の遠隔会議管理システムにおいて、前記第1、第2の実況データは音声データを含むことを要旨とする。
請求項に記載の発明は、請求項1〜のいずれか1つに記載の遠隔会議管理システムにおいて、前記第1、第2の実況データは画像データを含むことを要旨とする。
A fourth aspect of the present invention is the remote conference management system according to any one of the first to third aspects, wherein the first and second live data include voice data.
A fifth aspect of the present invention is the teleconference management system according to any one of the first to fourth aspects, wherein the first and second live data include image data.

請求項に記載の発明は、隔会議の動作確認を行なう動作確認制御手段と、エコー信
号の基準値を記憶した基準値データ記憶手段と、送信データ記憶手段と、入力部とを備えた第1の会議端末と、前記第1の会議端末にネットワークを介して接続されるとともに、入力部と出力部とを備えた第2の会議端末とから構成された遠隔会議管理システムを用いて、遠隔会議の管理を行なうための方法であって、前記動作確認制御手段が、前記第1の会議端末の入力部を介して取得した第1実況データを前記送信データ記憶手段に記録する記録段階と、前記第2の会議端末に対して前記第1実況データを送信する送信段階と、前記第2の会議端末の出力部における前記第1実況データの出力が、前記第2の会議端末の入力部において入力され、前記第2の会議端末から送信された第2実況データを、前記ネットワークを介して受信する受信段階と、前記第2実況データから、前記送信データ記憶手段に記録された第1実況データのエコー信号を抽出するエコー抽出段階と、前記エコー信号の大きさが前記基準値データ記憶手段に記憶された基準値以下である場合には、アラームを出力するアラーム出力段階とを実行することを要旨とする。
The invention according to claim 6, comprising an operation confirmation control means for performing an operation check of the far septum conference, and the reference value data storage means for storing a reference value of the echo signal, the transmission data storage unit, an input unit Using a remote conference management system comprising a first conference terminal and a second conference terminal connected to the first conference terminal via a network and having an input unit and an output unit , a method for managing the remote conference, the operation confirmation control means, a recording step of recording the first commentary data acquired through the input portion of the first conference terminal to the transmitting data storage means and the transmission step of transmitting the first Commentary data to the second conference terminal, an output of the first Commentary data at the output of the second conference terminal, the input portion of the second conference terminal Entered in Extracting a second commentary data transmitted from the second conference terminal, a receiving step of receiving via the network, from the second Commentary data, an echo signal of the first commentary data recorded in the transmission data storage unit The gist of the present invention is to execute an echo extraction step of performing an alarm and an alarm output step of outputting an alarm when the magnitude of the echo signal is equal to or smaller than a reference value stored in the reference value data storage means .

請求項に記載の発明は、隔会議の動作確認を行なう動作確認制御手段と、エコー信号の基準値を記憶した基準値データ記憶手段と、送信データ記憶手段と、入力部とを備えた第1の会議端末と、前記第1の会議端末にネットワークを介して接続されるとともに、入力部と出力部とを備えた第2の会議端末とから構成された遠隔会議管理システムを用いて、遠隔会議時の動作確認を行なうためのプログラムであって、前記動作確認制御手段を、前記第1の会議端末の入力部を介して取得した第1実況データを前記送信データ記憶手段に記録する記録手段、前記第2の会議端末に対して前記第1実況データを送信する送信手段、前記第2の会議端末の出力部における前記第1実況データの出力が、前記第2の会議端末の入力部において入力され、前記第2の会議端末から送信された第2実況データを、前記ネットワークを介して受信する受信手段、前記第2実況データから、前記送信データ記憶手段に記録された第1実況データのエコー信号を抽出するエコー抽出手段、前記エコー信号の大きさが前記基準値データ記憶手段に記憶された基準値以下である場合には、アラームを出力するアラーム出力手段として機能させることを要旨とする。 The invention according to claim 7, comprising an operation confirmation control means for performing an operation check of the far septum conference, and the reference value data storage means for storing a reference value of the echo signal, the transmission data storage unit, an input unit Using a remote conference management system comprising a first conference terminal and a second conference terminal connected to the first conference terminal via a network and having an input unit and an output unit , a program for performing an operation check during teleconferencing, the operation confirmation control unit records the first commentary data acquired through the input portion of the first conference terminal to the transmitting data storage means recording means, wherein the relative second conference terminal first commentary transmitting means for transmitting data, the output of the first Commentary data at the output of the second conference terminal is the input of the second conference terminal Input in the department Is the second commentary data transmitted from the second conference terminal, receiving means for receiving via the network, from the second Commentary data, first Commentary echo data stored in the transmission data storage unit The gist is to function as an alarm output means for outputting an alarm when an echo extraction means for extracting a signal and the magnitude of the echo signal is equal to or smaller than a reference value stored in the reference value data storage means .

(作用)
請求項1、又はに記載の発明によれば、動作確認制御手段が、第1の会議端末において取得した第1実況データを送信データ記憶手段に記録し、第2の会議端末に対して第1実況データを送信する。そして、第2の会議端末において取得した第2実況データを受信し、第2実況データから、送信データ記憶手段に記録された第1実況データのエコー信号を抽出する。このエコー信号の大きさが基準値以下である場合には、アラームを出力する。これにより、エコー信号を用いて、第2の会議端末における、第1の会議端末からの実況データの出力状態を確認することができる。そして、問題がある場合にはアラームを出力することにより、確実に会議を実施することができる。
(Function)
According to the invention described in claim 1, 6 or 7 , the operation confirmation control means records the first live data acquired in the first conference terminal in the transmission data storage means, and Send the first live data. Then, the second actual data acquired at the second conference terminal is received, and an echo signal of the first actual data recorded in the transmission data storage means is extracted from the second actual data. When the magnitude of this echo signal is below the reference value, an alarm is output. Thereby, the output state of the actual condition data from the 1st conference terminal in the 2nd conference terminal can be checked using an echo signal. If there is a problem, the alarm can be output so that the conference can be carried out reliably.

請求項に記載の発明によれば、動作確認制御手段は、第1の会議端末において、第2実況データから第1実況データのエコー信号を消去して、第1の会議端末から出力する。これにより、エコー信号が含まれない実況データを用いて会議を実施することができる。 According to the second aspect of the present invention, the operation confirmation control means deletes the echo signal of the first live data from the second live data and outputs it from the first conference terminal in the first conference terminal. Thereby, a meeting can be implemented using the actual condition data which does not contain an echo signal.

請求項に記載の発明によれば、動作確認制御手段は、エコー信号を消去した第2実況データを実況データ記憶手段に記録する。これにより、エコー信号が含まれない実況データを記録することができる。 According to the third aspect of the present invention, the operation confirmation control means records the second live data from which the echo signal has been deleted in the live data storage means. As a result, it is possible to record live data that does not include an echo signal.

請求項に記載の発明によれば、第1、第2の実況データは音声データを含む。これにより、音声の伝達を確認することができる。
請求項に記載の発明によれば、第1、第2の実況データは画像データを含む。これにより、画像の伝達を確認することができる。
According to the fourth aspect of the present invention, the first and second live data include voice data. Thereby, it is possible to confirm the transmission of voice.
According to the fifth aspect of the present invention, the first and second live data include image data. Thereby, transmission of an image can be confirmed.

本発明によれば、遠隔地に設置された会議端末同士を、ネットワークを介して接続し、映像や音声を用いて確実に会議を行なうことができる。   ADVANTAGE OF THE INVENTION According to this invention, the conference terminals installed in the remote place can be connected via a network, and a meeting can be reliably performed using a video and an audio | voice.

以下、本発明を具体化した遠隔会議管理システムの一実施形態を、図1〜図8に従って説明する。本実施形態では、図1に示すように、遠隔地の会議室に設置された複数のTV会議端末(10A,10B)を用いて、遠隔地の参加者により会議を行なう場合に用いる遠隔会議管理システム、遠隔会議管理方法及び遠隔会議動作確認プログラムとして説明する。各TV会議端末(10A,10B)は、ネットワークを介して会議管理サーバ20に相互に接続される。このようなTV会議端末(10A,10B)や会議管理サーバ20には、それぞれ通信先を特定するためのアドレス(例えばIPアドレス)が付与されており、このアドレスを用いて、他のTV会議端末や会議管理サーバ20と通信を行なう。   Hereinafter, an embodiment of a remote conference management system embodying the present invention will be described with reference to FIGS. In this embodiment, as shown in FIG. 1, remote conference management used when a conference is performed by a remote participant using a plurality of TV conference terminals (10A, 10B) installed in a remote conference room. The system, the remote conference management method, and the remote conference operation confirmation program will be described. Each TV conference terminal (10A, 10B) is mutually connected to the conference management server 20 via a network. Such a TV conference terminal (10A, 10B) and the conference management server 20 are each assigned an address (for example, an IP address) for specifying a communication destination, and using this address, another TV conference terminal is provided. And communication with the conference management server 20.

各TV会議端末(10A,10B)は、各利用者が遠隔会議を行なうためのコンピュータ端末である。具体的には、TV会議端末(10A,10B)は、CPU、RAM、ROMから構成された動作確認制御手段としての制御部11、操作部12、入力手段としての入力部13、出力手段としての出力部14を備える。   Each TV conference terminal (10A, 10B) is a computer terminal for each user to conduct a remote conference. Specifically, the TV conference terminal (10A, 10B) includes a control unit 11 as an operation confirmation control unit, an operation unit 12, an input unit 13 as an input unit, and an output unit configured by a CPU, a RAM, and a ROM. An output unit 14 is provided.

操作部12は、利用者の各種操作を受け付ける処理を実行する。この操作部12は、キーボードやポインティングデバイスから構成される。
入力部13は、自端末側の音声データや画像データを取得する処理を実行する。具体的には、マイクや撮像カメラから構成される。
The operation unit 12 executes processing for receiving various user operations. The operation unit 12 includes a keyboard and a pointing device.
The input unit 13 executes a process of acquiring audio data and image data on the terminal side. Specifically, it consists of a microphone and an imaging camera.

出力部14は、相手側の音声データや画像データを出力する処理を実行する。具体的には、スピーカやディスプレイから構成される。
制御部11は、後述するように、入力部13を介して取得した音声データや画像データを会議管理サーバ20や他のTV会議端末(10A,10B)に送信する処理を実行する。更に、他のTV会議端末(10A,10B)から受信した音声データや画像データを、出力部14を介して出力する処理を実行する。
The output unit 14 executes a process of outputting the other party's voice data and image data. Specifically, it consists of a speaker and a display.
As will be described later, the control unit 11 performs a process of transmitting audio data and image data acquired via the input unit 13 to the conference management server 20 and other TV conference terminals (10A, 10B). Furthermore, a process of outputting audio data and image data received from other TV conference terminals (10A, 10B) via the output unit 14 is executed.

また、各TV会議端末(10A,10B)は、一方のTV会議端末(例えば、TV会議端末10A)が送信した音声データや画像データが、相手側のTV会議端末(例えば、TV会議端末10B)に確実に出力されているかどうかを確認する動作確認処理を実行する。TV会議端末(10A,10B)の制御部11は、遠隔会議動作確認プログラムが実行されることにより、相手端末に対してのデータの記録段階、送信段階、相手端末からのデータ受信段階、エコー抽出段階、アラーム出力段階等の各処理を実行する。このため、各TV会議端末(10A,10B)は、図3に示すように、送信データ記憶手段及び実況データ記憶手段としての音声・画像データ記憶部15を備える。そして、各TV会議端末(10A,10B)の制御部11は、音声・画像取得手段11a、記録手段11b、音声・画像転送手段11c、音声・画像取得手段11d、エコー抽出手段11e、アラーム出力手段11f、エコー消去手段11g、記録手段11h、音声・画像出力手段11iとして機能する。   In addition, each of the TV conference terminals (10A, 10B) receives audio data and image data transmitted from one TV conference terminal (for example, the TV conference terminal 10A), and the other party's TV conference terminal (for example, the TV conference terminal 10B). Execute the operation check process to check whether it is output securely. The control unit 11 of the TV conference terminal (10A, 10B) executes the remote conference operation confirmation program, so that the data recording stage, transmission stage, data reception stage from the counterpart terminal, echo extraction to the counterpart terminal are executed. Each process such as a stage and an alarm output stage is executed. Therefore, each TV conference terminal (10A, 10B) includes a voice / image data storage unit 15 as a transmission data storage unit and an actual data storage unit as shown in FIG. The control unit 11 of each TV conference terminal (10A, 10B) includes an audio / image acquisition unit 11a, a recording unit 11b, an audio / image transfer unit 11c, an audio / image acquisition unit 11d, an echo extraction unit 11e, and an alarm output unit. 11f, echo canceling means 11g, recording means 11h, and sound / image output means 11i.

この音声・画像データ記憶部15には、自端末の入力部13を介して取得した音声データや画像データが一時記憶される。
音声・画像取得手段11aは、自端末の入力部13を介して、自端末側の音声データや画像データを取得する処理を実行する。
The voice / image data storage unit 15 temporarily stores voice data and image data acquired via the input unit 13 of the terminal itself.
The sound / image acquisition unit 11a executes a process of acquiring sound data and image data on the own terminal side via the input unit 13 of the own terminal.

記録手段11bは、自端末の入力部13を介して、取得した音声データや画像データを音声・画像データ記憶部15に記録する処理を実行する。
音声・画像転送手段11cは第1実況データを送信する送信手段として機能する。具体的には、自端末の入力部13を介して、取得した音声データや画像データを、ネットワークを介して、相手端末であるTV会議端末(10A,10B)や会議管理サーバ20に送信する処理を実行する。
The recording unit 11 b executes a process of recording the acquired audio data and image data in the audio / image data storage unit 15 via the input unit 13 of the own terminal.
The sound / image transfer means 11c functions as a transmission means for transmitting the first live data. Specifically, the process of transmitting the acquired audio data and image data to the TV conference terminals (10A, 10B) and the conference management server 20 that are the counterpart terminals via the network via the input unit 13 of the own terminal. Execute.

音声・画像取得手段11dは第2実況データを受信する受信手段として機能する。具体的には、ネットワークを介して、相手端末からの音声データや画像データを取得する処理を実行する。   The sound / image acquisition unit 11d functions as a reception unit that receives the second live data. Specifically, processing for acquiring audio data and image data from the counterpart terminal is executed via the network.

エコー抽出手段11eは、自端末から先に送信した送信信号(音声データや画像データ)のエコー信号を、相手端末から取得した音声データや画像データから抽出する処理を実行する。   The echo extraction unit 11e executes a process of extracting an echo signal of a transmission signal (audio data or image data) previously transmitted from the own terminal from the audio data or image data acquired from the counterpart terminal.

アラーム出力手段11fはエコー信号の基準値を記憶した基準値データ記憶手段を備える。そして、アラーム出力手段11fは、送信信号の強度(オリジナル信号レベル)とエコー信号の強度(エコー信号レベル)とを比較し、この比較値が基準値以下の場合にはアラームを出力する処理を実行する。   The alarm output unit 11f includes a reference value data storage unit that stores a reference value of the echo signal. Then, the alarm output means 11f compares the intensity of the transmission signal (original signal level) with the intensity of the echo signal (echo signal level), and executes a process of outputting an alarm if the comparison value is below the reference value. To do.

エコー消去手段11gは、相手端末から取得した音声データや画像データから、自端末から送信した音声データや画像データのエコー信号を消去する処理を実行する。
記録手段11hは、相手端末から取得した音声データや画像データからエコー信号を消去したデータを音声・画像データ記憶部15に記録する処理を実行する。
音声・画像出力手段11iは、エコー信号が消去された音声データや画像データを、出力部14を介して出力する処理を実行する。
The echo erasure unit 11g executes a process of erasing the echo signal of the audio data or image data transmitted from the own terminal from the audio data or image data acquired from the counterpart terminal.
The recording unit 11 h executes a process of recording, in the audio / image data storage unit 15, data obtained by deleting the echo signal from the audio data or image data acquired from the counterpart terminal.
The sound / image output unit 11 i executes a process of outputting the sound data or image data from which the echo signal has been deleted via the output unit 14.

そして、このTV会議端末(10A,10B)は、図1に示すように、ネットワークを介して会議管理サーバ20に接続される。   The TV conference terminals (10A, 10B) are connected to the conference management server 20 via a network as shown in FIG.

この会議管理サーバ20は、TV会議端末(10A,10B)間の遠隔会議を管理するコンピュータシステムである。会議管理サーバ20は、会議管理データ記憶部22、利用者データ記憶部23、実況データ記憶部24、議事録データ記憶部25を備えている。   The conference management server 20 is a computer system that manages a remote conference between the TV conference terminals (10A, 10B). The conference management server 20 includes a conference management data storage unit 22, a user data storage unit 23, a live data storage unit 24, and a minutes data storage unit 25.

会議管理データ記憶部22は会議運営情報記憶手段として機能し、図2(a)に示すように、会議の実施スケジュールについての会議管理レコード220が記録されている。この会議管理レコード220は、参加者が決定されて、会議が設定登録された場合に記録される。この会議管理レコード220は、会議管理識別子、開始予定日時、会議開催条件、利用者識別子、参加フラグに関するデータを記録するためのデータ領域を含んで構成される。   The conference management data storage unit 22 functions as a conference management information storage unit, and as shown in FIG. 2A, a conference management record 220 regarding the conference implementation schedule is recorded. This conference management record 220 is recorded when a participant is determined and a conference is set and registered. The conference management record 220 includes a data area for recording data relating to a conference management identifier, a scheduled start date and time, a conference holding condition, a user identifier, and a participation flag.

会議管理識別子データ領域には、各会議を特定するための識別子に関するデータが記録される。
開始予定日時データ領域には、この会議が開始される予定日時に関するデータが記録される。
In the conference management identifier data area, data relating to an identifier for specifying each conference is recorded.
In the scheduled start date and time data area, data related to the scheduled date and time when this conference is started is recorded.

会議開催条件データ領域には、この会議が成立するための開催条件に関するデータが記録される。本実施形態では、会議が成立するために必要な参加人数(必要数)に関するデータが記録される。   In the meeting holding condition data area, data related to holding conditions for establishing this meeting is recorded. In the present embodiment, data relating to the number of participants (necessary number) necessary for establishing a conference is recorded.

利用者識別子データ領域には、この会議に参加する利用者を特定するための識別子に関するデータが記録される。
参加フラグデータ領域には、この会議に参加した利用者を特定するためのフラグが記録される。
In the user identifier data area, data relating to an identifier for specifying a user who participates in the conference is recorded.
In the participation flag data area, a flag for identifying a user who has participated in the conference is recorded.

利用者データ記憶部23は認証情報記憶手段として機能し、図2(b)に示すように、この会議に参加する利用者を特定するための利用者レコード230が記録されている。この利用者レコード230は、本システムを利用する利用者が登録された場合に記録される。この利用者レコード230は、利用者識別子に対して、事前登録認証データ、認証時刻及び逐次認証データを記録するためのデータ領域を含んで構成される。   The user data storage unit 23 functions as an authentication information storage unit, and as shown in FIG. 2B, a user record 230 for specifying a user participating in the conference is recorded. This user record 230 is recorded when a user who uses this system is registered. The user record 230 includes a data area for recording pre-registration authentication data, authentication time, and sequential authentication data for the user identifier.

利用者識別子データ領域には、このシステムを利用することができる利用者を特定するための識別子に関するデータが記録される。
事前登録認証データ領域には、本人認証を行なうために予め登録された認証データが記
録される。事前登録認証データ領域には、本人の顔画像や音声の特徴量に関するデータが記録される。なお、本実施形態の参加者確認処理においては、顔認証を用いる。
In the user identifier data area, data relating to an identifier for specifying a user who can use this system is recorded.
In the pre-registration authentication data area, authentication data registered in advance for performing personal authentication is recorded. In the pre-registration authentication data area, data relating to the face image of the person and the feature amount of the sound are recorded. In the participant confirmation process of the present embodiment, face authentication is used.

認証時刻データ領域には、後述する継続認証処理により、逐次、認証を行なった日時に関するデータが記録される。
逐次認証データ領域には、継続認証処理により算出した現在の顔画像の特徴量に関するデータが記録される。
In the authentication time data area, data related to the date and time when authentication is performed sequentially by continuous authentication processing described later is recorded.
In the sequential authentication data area, data relating to the feature amount of the current face image calculated by the continuous authentication process is recorded.

実況データ記憶部24には、各TV会議端末(10A,10B)から取得した音声データや画像データが、タイムスタンプとともに時系列に記録される。このタイムスタンプにより、各データが記録された日時を特定することができる。更に、実況データ記憶部24には、音声データや画像データのハッシュ値が記録される。   Audio data and image data acquired from each TV conference terminal (10A, 10B) are recorded in the live data storage unit 24 in time series together with a time stamp. With this time stamp, the date and time when each data was recorded can be specified. Furthermore, the live data storage unit 24 records hash values of audio data and image data.

議事録データ記憶部25には、各TV会議端末(10A,10B)から取得した音声データを用いて生成したテキストデータが、タイムスタンプ及び発言者の利用者識別子に関連付けられて時系列に記録される。   In the minutes data storage unit 25, the text data generated using the voice data acquired from each TV conference terminal (10A, 10B) is recorded in time series in association with the time stamp and the user identifier of the speaker. The

会議管理サーバ20の制御部21は、遠隔会議管理プログラムが実行されることにより、認証処理段階、開始管理段階、継続監視段階等の各処理を実行する。そして、制御部21は、実況データ取得手段21a、実況データ記録手段21b、ハッシュ処理手段21c、会議進行管理手段21d、本人認証手段21e、認証管理手段21f、発言確認手段21g、音声認識手段21h、参加者画像追跡手段21iとして機能する。本実施形態では、会議進行管理手段21dは開始管理手段として機能し、本人認証手段21eは認証処理手段として機能し、認証管理手段21fや参加者画像追跡手段21iが、継続監視手段として機能する。   The control unit 21 of the conference management server 20 executes each process such as an authentication process stage, a start management stage, and a continuous monitoring stage by executing the remote conference management program. Then, the control unit 21 includes a live data acquisition unit 21a, a live data recording unit 21b, a hash processing unit 21c, a conference progress management unit 21d, a person authentication unit 21e, an authentication management unit 21f, a speech confirmation unit 21g, a voice recognition unit 21h, It functions as the participant image tracking means 21i. In this embodiment, the conference progress management unit 21d functions as a start management unit, the person authentication unit 21e functions as an authentication processing unit, and the authentication management unit 21f and the participant image tracking unit 21i function as a continuation monitoring unit.

実況データ取得手段21aは、各TV会議端末(10A,10B)から音声データや画像データを取得する処理を実行する。
実況データ記録手段21bは、各TV会議端末(10A,10B)から取得した音声データや画像データを、逐次、実況データ記憶部24に記録する処理を実行する。
The actual condition data acquisition unit 21a executes processing for acquiring audio data and image data from each TV conference terminal (10A, 10B).
The live data recording unit 21b executes a process of sequentially recording audio data and image data acquired from each TV conference terminal (10A, 10B) in the live data storage unit 24.

ハッシュ処理手段21cは、実況データ記憶部24に格納された音声データや画像データのハッシュ値を算出する処理を実行する。ハッシュ処理手段21cは、ハッシュアルゴリズムを用いて、タイムスタンプとともに、遠隔会議における連続した音声データや画像データのハッシュ値を算出し、実況データ記憶部24に記録する。このハッシュ値を用いることにより、音声データや画像データの改竄の有無の検証を行なうことができる。   The hash processing means 21 c executes a process for calculating the hash value of the audio data and the image data stored in the live data storage unit 24. The hash processing unit 21c calculates a hash value of continuous audio data and image data in the remote conference together with the time stamp using a hash algorithm, and records the hash value in the live data storage unit 24. By using this hash value, it is possible to verify whether audio data or image data has been tampered with.

会議進行管理手段21dは、参加者の参加状況を確認しながら会議の進行を管理する処理を実行する。
本人認証手段21eは、各TV会議端末(10A,10B)から取得した実況データと事前登録認証データとを用いて、参加者の本人認証を行なう。本実施形態では、画像データに含まれる顔画像を用いて本人認証を行なう。
The conference progress management means 21d executes processing for managing the progress of the conference while confirming the participation status of the participants.
The personal authentication means 21e performs the personal authentication of the participants by using the actual data and the pre-registration authentication data acquired from each TV conference terminal (10A, 10B). In the present embodiment, personal authentication is performed using a face image included in the image data.

認証管理手段21fは、通信状態に応じて次回の認証時期を特定する処理を実行する。このため、認証管理手段21fは、継続的に行なわれる認証の時間間隔(認証間隔)を決定するために、認証間隔の初期値をメモリに保持している。更に、認証管理手段21fは、通信速度に対応する認証間隔の補正値(通信状況補正値)や、顔画像の特徴量の一致度に対応する認証間隔の補正値(認証状況補正値)を記録した補正テーブルを保持している。   The authentication management unit 21f executes processing for specifying the next authentication time according to the communication state. For this reason, the authentication management unit 21f retains an initial value of the authentication interval in the memory in order to determine a time interval (authentication interval) for continuous authentication. Further, the authentication management unit 21f records an authentication interval correction value (communication status correction value) corresponding to the communication speed and an authentication interval correction value (authentication status correction value) corresponding to the degree of coincidence of the feature amounts of the face images. Hold the correction table.

発言確認手段21gは、参加者の発言状況を確認する処理を実行する。
音声認識手段21hは、発言者を特定するとともに、音声認識処理により、音声データからテキストデータを生成する処理を実行する。
参加者画像追跡手段21iは、画像解析技術を用いて、本人認証された利用者の画像を追跡する処理を実行する。
The speech confirmation means 21g executes processing for confirming the speech status of the participant.
The voice recognition means 21h specifies a speaker and executes a process of generating text data from voice data by voice recognition processing.
The participant image tracking means 21i executes processing for tracking an image of a user who has been authenticated by using an image analysis technique.

次に、上記システムを利用して実行される処理を、図4〜8を用いて説明する。本実施形態では、二つのTV会議端末(10A,10B)を用いて、遠隔会議を行なう場合を想定する。まず、テレビ会議に利用するTV会議端末(10A,10B)を、ネットワークを介して接続する。この場合、各TV会議端末(10A,10B)は、会議管理サーバ20を中継して相手側のTV会議端末に接続される。そして、各TV会議端末(10A,10B)の制御部11は、ネットワークを介して、会議管理サーバ20や相手側のTV会議端末(10A,10B)との通信を開始する。   Next, processing executed using the above system will be described with reference to FIGS. In the present embodiment, it is assumed that a remote conference is performed using two TV conference terminals (10A, 10B). First, the TV conference terminals (10A, 10B) used for the video conference are connected via the network. In this case, each TV conference terminal (10A, 10B) is relayed through the conference management server 20 and connected to the other TV conference terminal. Then, the control unit 11 of each TV conference terminal (10A, 10B) starts communication with the conference management server 20 and the other party's TV conference terminal (10A, 10B) via the network.

本実施形態では、会議開始時に参加者確認処理を実行し、会議開始後には継続性確認処理を実行する。この継続性確認処理の中では、継続認証処理、画像追跡処理、発言確認処理を実行する。更に、会議開始前から会議終了までの期間には、継続的に動作確認処理を実行する。   In this embodiment, the participant confirmation process is executed at the start of the conference, and the continuity confirmation process is executed after the conference starts. In this continuity confirmation processing, continuation authentication processing, image tracking processing, and speech confirmation processing are executed. Further, the operation check process is continuously executed during the period from the start of the conference to the end of the conference.

(参加者確認処理)
まず、図4を用いて参加者確認処理を説明する。
ここでは、会議管理サーバ20の制御部21は、会議開始依頼の取得処理を実行する(ステップS1−1)。具体的には、会議の主催者は、TV会議端末(例えば、TV会議端末10A)を用いて、会議管理サーバ20にアクセスする。この場合、制御部21の会議進行管理手段21dは、現在の日時を用いて、テレビ会議が可能な会議を会議管理データ記憶部22において特定する。そして、会議進行管理手段21dは、特定した会議を一覧表示させるための画面を生成し、TV会議端末10Aに送信する。
(Participant confirmation process)
First, the participant confirmation process will be described with reference to FIG.
Here, the control unit 21 of the conference management server 20 executes a conference start request acquisition process (step S1-1). Specifically, the conference organizer accesses the conference management server 20 using a TV conference terminal (for example, the TV conference terminal 10A). In this case, the conference progress management unit 21d of the control unit 21 uses the current date and time to specify a conference in which the video conference is possible in the conference management data storage unit 22. Then, the conference progress management unit 21d generates a screen for displaying a list of identified conferences, and transmits the screen to the TV conference terminal 10A.

TV会議端末10Aの出力部14に出力された一覧表示画面を用いて、会議の主催者は開催予定の会議を選択して会議開始希望を入力する。この場合、TV会議端末10Aは、会議管理サーバ20に会議開始依頼を送信する。この会議開始依頼には、TV会議端末10Aにおいて指定された会議の会議識別子に関するデータを含める。これにより、会議進行管理手段21dは、会議開始依頼を取得する。   Using the list display screen output to the output unit 14 of the TV conference terminal 10A, the conference organizer selects a conference to be held and inputs a conference start request. In this case, the TV conference terminal 10 </ b> A transmits a conference start request to the conference management server 20. This conference start request includes data related to the conference identifier of the conference designated by the TV conference terminal 10A. Thereby, the conference progress management means 21d acquires the conference start request.

次に、会議管理サーバ20の制御部21は、遠隔会議の参加者情報の取得処理を実行する(ステップS1−2)。具体的には、制御部21の会議進行管理手段21dは、指定された会議識別子に関連付けられた利用者識別子を、会議管理データ記憶部22から抽出する。そして、会議進行管理手段21dは、本人認証手段21eに対して認証指示を行なう。   Next, the control unit 21 of the conference management server 20 executes a remote conference participant information acquisition process (step S1-2). Specifically, the conference progress management unit 21 d of the control unit 21 extracts the user identifier associated with the designated conference identifier from the conference management data storage unit 22. Then, the conference progress management means 21d issues an authentication instruction to the person authentication means 21e.

そこで、会議管理サーバ20の制御部21は、参加者画像の取得処理を実行する(ステップS1−3)。具体的には、制御部21の本人認証手段21eは、実況データ取得手段21aを介して、各TV会議端末(10A,10B)の入力部13によって撮影された画像データを取得する。そして、本人認証手段21eは、取得した撮影画像の中に含まれるすべての人物について、顔画像の部分のトリミングを行なう。   Therefore, the control unit 21 of the conference management server 20 executes a participant image acquisition process (step S1-3). Specifically, the personal authentication unit 21e of the control unit 21 acquires the image data captured by the input unit 13 of each TV conference terminal (10A, 10B) via the live data acquisition unit 21a. Then, the personal authentication means 21e trims the face image portion for all persons included in the acquired photographed image.

次に、会議管理サーバ20の制御部21は、参加者の認証情報の取得処理を実行する(ステップS1−4)。具体的には、制御部21の本人認証手段21eは、特定した利用者識別子に関連付けられた利用者レコード230を利用者データ記憶部23から抽出する。そして、本人認証手段21eは、利用者レコード230の事前登録認証データを取得する
Next, the control unit 21 of the conference management server 20 executes a process for acquiring participant authentication information (step S1-4). Specifically, the personal authentication means 21 e of the control unit 21 extracts the user record 230 associated with the specified user identifier from the user data storage unit 23. And the personal authentication means 21e acquires the pre-registration authentication data of the user record 230.

そして、会議管理サーバ20の制御部21は、認証処理を実行する(ステップS1−5)。具体的には、制御部21の本人認証手段21eは、各TV会議端末(10A,10B)から取得した顔画像の特徴量を算出する。次に、本人認証手段21eは、算出した特徴量と、利用者データ記憶部23に記録された事前登録認証データの特徴量とを比較して、参加者の認証を行なう。そして、本人認証手段21eは、会議進行管理手段21dに対して、認証結果を通知する。この認証結果には、参加者の利用者識別子に対して、算出した特徴量と、認証可否に関するデータを含める。   And the control part 21 of the meeting management server 20 performs an authentication process (step S1-5). Specifically, the personal authentication means 21e of the control unit 21 calculates the feature amount of the face image acquired from each TV conference terminal (10A, 10B). Next, the personal authentication means 21e compares the calculated feature amount with the feature amount of the pre-registration authentication data recorded in the user data storage unit 23 to authenticate the participant. Then, the personal authentication unit 21e notifies the conference progress management unit 21d of the authentication result. This authentication result includes the calculated feature value and the data relating to whether authentication is possible or not for the user identifier of the participant.

そこで、会議管理サーバ20の制御部21は、会議開催条件を満足しているかどうかの判定処理を実行する(ステップS1−6)。具体的には、制御部21の会議進行管理手段21dは、本人認証手段21eから取得した認証結果に基づいて、認証ができた参加者の人数を算出する。そして、会議管理データ記憶部22に記録されている会議開催条件としての必要数と比較する。   Therefore, the control unit 21 of the conference management server 20 executes a determination process as to whether or not the conference holding condition is satisfied (step S1-6). Specifically, the conference progress management unit 21d of the control unit 21 calculates the number of participants who have been authenticated based on the authentication result acquired from the personal authentication unit 21e. And it compares with the required number as meeting holding conditions currently recorded on the meeting management data storage part 22. FIG.

認証ができた参加者人数が必要数に満たないため、会議開催条件を満足していない場合(ステップS1−6において「NO」の場合)、会議管理サーバ20の制御部21は待機処理を実行する(ステップS1−7)。具体的には、制御部21の会議進行管理手段21dは、必要数に達していないことを各TV会議端末(10A,10B)に通知する。そして、会議進行管理手段21dは、所定時間の待機後に参加者画像の取得処理(ステップS1−3)を繰り返す。   If the number of participants who have been authenticated is less than the required number and the meeting holding conditions are not satisfied (“NO” in step S1-6), the control unit 21 of the meeting management server 20 executes standby processing. (Step S1-7). Specifically, the conference progress management means 21d of the control unit 21 notifies each TV conference terminal (10A, 10B) that the required number has not been reached. Then, the conference progress management unit 21d repeats the participant image acquisition process (step S1-3) after waiting for a predetermined time.

一方、認証ができた人数が必要数に達している場合(ステップS1−6において、「YES」の場合)、会議管理サーバ20の制御部21は、会議参加者の登録処理を実行する(ステップS1−8)。具体的には、制御部21の会議進行管理手段21dは、認証ができた参加者について、会議管理レコード220に参加フラグを記録する。   On the other hand, when the required number of persons has reached the required number (in the case of “YES” in step S1-6), the control unit 21 of the conference management server 20 executes a conference participant registration process (step S1-6). S1-8). Specifically, the conference progress management unit 21d of the control unit 21 records a participation flag in the conference management record 220 for the authenticated participant.

そして、会議管理サーバ20の制御部21は、アクション許可処理を実行する(ステップS1−9)。具体的には、制御部21の会議進行管理手段21dは、各TV会議端末(10A,10B)に対して、会議を開始(アクション)が可能であることを通知する。   And the control part 21 of the meeting management server 20 performs an action permission process (step S1-9). Specifically, the conference progress management means 21d of the control unit 21 notifies each TV conference terminal (10A, 10B) that the conference can be started (action).

(継続性確認処理)
次に、図5を用いて、会議の継続性確認処理について説明する。会議が開始された場合、各TV会議端末(10A,10B)の入力部13において取得された音声データや画像データを、ネットワークを介して、会議管理サーバ20に送信する。この場合、会議管理サーバ20の制御部21は、実況データの記録処理を実行する(ステップS2)。具体的には、制御部21の実況データ取得手段21aは、実況データ記録手段21bを介して、各TV会議端末(10A,10B)から取得した音声データや画像データを実況データ記憶部24に記録する。そして、本実施形態では、継続性確認処理として、継続認証処理(ステップS3−1〜S3−4)や、後述する画像追跡処理(ステップS4)、発言確認処理(ステップS5)を実行する。
(Continuity check processing)
Next, the conference continuity confirmation process will be described with reference to FIG. When the conference is started, the audio data and the image data acquired at the input unit 13 of each TV conference terminal (10A, 10B) are transmitted to the conference management server 20 via the network. In this case, the control unit 21 of the conference management server 20 executes a live data recording process (step S2). Specifically, the live data acquisition unit 21a of the control unit 21 records voice data and image data acquired from each TV conference terminal (10A, 10B) in the live data storage unit 24 via the live data recording unit 21b. To do. In this embodiment, as the continuity confirmation process, a continuation authentication process (steps S3-1 to S3-4), an image tracking process (step S4), and a statement confirmation process (step S5) described later are executed.

(継続認証処理)
ここでは、図5を用いて、継続認証処理を説明する。この継続認証処理は、後述するように、所定のタイミングで定期的に実行される。
(Continuous authentication process)
Here, the continuous authentication process will be described with reference to FIG. As will be described later, this continuous authentication process is periodically executed at a predetermined timing.

まず、会議管理サーバ20の制御部21は、参加者毎に画像検証処理を実行する(ステップS3−1)。ここでは、顔画像の特徴量の変化状況に応じた動き検知と、デフォーカスによる平面検知とを行なう。   First, the control unit 21 of the conference management server 20 executes image verification processing for each participant (step S3-1). Here, motion detection according to the change state of the feature amount of the face image and plane detection by defocusing are performed.

動き検知においては、制御部21の認証管理手段21fは、各TV会議端末(10A,10B)から取得した画像データについて、本人認証手段21eに対して、本人認証処理の実行を指示する。本人認証手段21eは、顔画像から算出した特徴量と、利用者データ記憶部23に記録された事前登録認証データの特徴量とを比較して、参加者の認証を行なう。そして、本人認証手段21eは、認証管理手段21fに対して、認証結果を通知する。   In the motion detection, the authentication management unit 21f of the control unit 21 instructs the personal authentication unit 21e to execute the personal authentication process for the image data acquired from each TV conference terminal (10A, 10B). The personal authentication means 21e compares the feature amount calculated from the face image with the feature amount of the pre-registration authentication data recorded in the user data storage unit 23 to authenticate the participant. Then, the personal authentication means 21e notifies the authentication management means 21f of the authentication result.

ここで、認証管理手段21fは、本人認証手段21eから取得した顔画像の特徴量が、利用者データ記憶部23に記録されている先の本人認証時における顔画像の特徴量に一致するかどうかを検証する。ここで、先の本人認証時において算出した特徴量が、今回の特徴量と一致している場合には、顔画像に動きがないことになる。   Here, the authentication management unit 21f determines whether or not the feature amount of the face image acquired from the user authentication unit 21e matches the feature amount of the face image at the time of the previous user authentication recorded in the user data storage unit 23. To verify. Here, when the feature amount calculated at the time of the previous personal authentication matches the current feature amount, there is no movement in the face image.

一方、平面検知においては、認証管理手段21fは、TV会議端末(10A,10B)の入力部13を用いてフォーカス変更処理を実行する。そして、認証管理手段21fは、取得した画像データにおいて、顔や背景のデフォーカス状況を検証する。全体の画像が一定の割合でデフォーカスされている場合には、平面画像が撮影されていることになる。   On the other hand, in the plane detection, the authentication management unit 21f executes focus change processing using the input unit 13 of the TV conference terminal (10A, 10B). Then, the authentication management unit 21f verifies the defocus status of the face and background in the acquired image data. If the entire image is defocused at a certain rate, a plane image is captured.

このように、認証結果、特徴量の変化状況や平面画像の撮影等の異常を検知した場合には、認証管理手段21fは、相手側のTV会議端末(10A,10B)にアラームを出力する。   As described above, when an abnormality is detected as a result of the authentication, such as a change state of the feature amount or the photographing of the planar image, the authentication management unit 21f outputs an alarm to the TV conference terminal (10A, 10B) on the other side.

次に、会議管理サーバ20の制御部21は、認証情報の記録処理を実行する(ステップS3−2)。具体的には、制御部21の認証管理手段21fは、今回取得した顔画像の特徴量を逐次認証データとして、認証時刻とともに利用者データ記憶部23に記録する。   Next, the control unit 21 of the conference management server 20 executes authentication information recording processing (step S3-2). Specifically, the authentication management unit 21f of the control unit 21 records the feature amount of the face image acquired this time as authentication data in the user data storage unit 23 together with the authentication time.

そして、会議管理サーバ20の制御部21は、次回の認証時期の設定処理を実行する(ステップS3−3)。具体的には、制御部21の認証管理手段21fは、ネットワークにおける通信状態(ここでは通信速度)を取得し、この通信状態における通信状況補正値を、補正テーブルを用いて取得する。更に、認証管理手段21fは、顔画像の特徴量の一致度を用いて、補正テーブルから認証状況補正値を取得する。そして、認証管理手段21fは、両補正値と初期値とを乗算して時間間隔を算出し、この時間間隔を用いて次の認証時期を決定する。   And the control part 21 of the meeting management server 20 performs the setting process of the next authentication time (step S3-3). Specifically, the authentication management unit 21f of the control unit 21 acquires a communication state (communication speed here) in the network, and acquires a communication state correction value in this communication state using a correction table. Further, the authentication management unit 21f acquires an authentication status correction value from the correction table using the degree of coincidence of the feature amounts of the face image. Then, the authentication management unit 21f calculates a time interval by multiplying both the correction value and the initial value, and determines the next authentication time using this time interval.

そして、会議管理サーバ20の制御部21は、次の認証時期まで待機処理を実行する(ステップS3−4)。具体的には、制御部21の認証管理手段21fは、タイマを用いて次の認証時期の到来を待つ。そして、認証時期が到来した場合には、画像検証処理(ステップS3−1)を再実行する。   Then, the control unit 21 of the conference management server 20 executes standby processing until the next authentication time (step S3-4). Specifically, the authentication management means 21f of the control unit 21 uses a timer to wait for the next authentication time. Then, when the authentication time has come, the image verification process (step S3-1) is re-executed.

(画像追跡処理)
次に、図6を用いて、画像追跡処理を実行する。
ここでは、会議管理サーバ20の制御部21は、画像追跡による所在検知処理を実行する(ステップS4−1)。具体的には、制御部21の参加者画像追跡手段21iは、認証管理手段21fにおいて認証された参加者の画像の所在を、各TV会議端末(10A,10B)から取得した画像データにおいて画像解析技術により特定する。これにより、一つの画像に複数の参加者が撮影されている場合にも、各参加者を特定することができる。
(Image tracking process)
Next, an image tracking process is executed using FIG.
Here, the control unit 21 of the conference management server 20 executes location detection processing by image tracking (step S4-1). Specifically, the participant image tracking unit 21i of the control unit 21 performs image analysis on the image data obtained from each TV conference terminal (10A, 10B), where the location of the participant's image authenticated by the authentication management unit 21f is acquired. Identify by technology. Thereby, even when a plurality of participants are photographed in one image, each participant can be specified.

そして、会議管理サーバ20の制御部21は、この顔画像を追従できているかどうかの判定処理を実行する(ステップS4−2)。具体的には、制御部21の参加者画像追跡手段21iは、画像解析技術により特定した顔画像が、TV会議端末(10A,10B)の
入力部13から取得した画像データの撮影範囲内に存在するかどうかを判定する。ここで、顔画像を追従できている場合(ステップS4−2において「YES」の場合)には、画像追跡による所在検知(ステップS4−1)を継続する。
And the control part 21 of the meeting management server 20 performs the determination process whether this face image can be tracked (step S4-2). Specifically, the participant image tracking means 21i of the control unit 21 has the face image specified by the image analysis technique within the imaging range of the image data acquired from the input unit 13 of the TV conference terminal (10A, 10B). Determine whether to do. Here, when the face image can be followed (in the case of “YES” in step S4-2), the location detection (step S4-1) by image tracking is continued.

一方、顔画像を追従できていない場合(ステップS4−2において、「NO」の場合)、会議管理サーバ20の制御部21は、会議開催条件を維持しているかどうかの判定処理を実行する(ステップS4−3)。具体的には、制御部21の参加者画像追跡手段21iは、顔画像を追従できている参加者の人数を算出する。そして、参加者画像追跡手段21iは、会議管理データ記憶部22に記録された必要数と、算出した参加者人数とを比較する。   On the other hand, when the face image cannot be tracked (in the case of “NO” in step S4-2), the control unit 21 of the conference management server 20 executes a determination process as to whether or not the conference holding condition is maintained ( Step S4-3). Specifically, the participant image tracking means 21i of the control unit 21 calculates the number of participants who can follow the face image. Then, the participant image tracking means 21i compares the required number recorded in the conference management data storage unit 22 with the calculated number of participants.

ここで、参加者人数が必要数以上であり、会議開催条件を維持している場合(ステップS4−3において「YES」の場合)、会議管理サーバ20の制御部21は、画像追跡による所在検知(ステップS4−1)を継続する。   Here, when the number of participants is more than the required number and the meeting holding conditions are maintained (in the case of “YES” in step S4-3), the control unit 21 of the meeting management server 20 detects the location by image tracking. (Step S4-1) is continued.

一方、参加者人数が必要数よりも少なくなり、会議開催条件を維持できない場合(ステップS4−3において、「NO」の場合)、会議管理サーバ20の制御部21は、アラーム処理を実行する(ステップS4−4)。具体的には、制御部21の参加者画像追跡手段21iは、各TV会議端末(10A,10B)に対して、会議開催条件を満足できないことを通知する。この場合、主催者は会議を中断する。   On the other hand, when the number of participants is less than the required number and the conference holding conditions cannot be maintained (in the case of “NO” in step S4-3), the control unit 21 of the conference management server 20 executes an alarm process ( Step S4-4). Specifically, the participant image tracking means 21i of the control unit 21 notifies each TV conference terminal (10A, 10B) that the meeting holding condition cannot be satisfied. In this case, the organizer interrupts the meeting.

(発言確認処理)
次に、図7を用いて、発言確認処理を説明する。
ここでは、まず、会議管理サーバ20の制御部21は、参加者による発言を検知したかどうかについて判定処理を実行する(ステップS5−1)。具体的には、制御部21の発言確認手段21gは、参加者の発言を、実況データ記憶部24に逐次記録された音声データから取得する。音声データにおいて参加者の発言が記録されていない場合(ステップS5−1において「NO」の場合)には、発言確認手段21gは待機する。
(Speak confirmation process)
Next, the speech confirmation process will be described with reference to FIG.
Here, first, the control unit 21 of the conference management server 20 executes a determination process as to whether or not a speech by a participant has been detected (step S5-1). Specifically, the utterance confirmation unit 21 g of the control unit 21 acquires the participant's utterances from the voice data sequentially recorded in the live data storage unit 24. When the speech of the participant is not recorded in the voice data (in the case of “NO” in step S5-1), the speech confirmation unit 21g stands by.

一方、音声データにおいて参加者の発言を検知した場合(ステップS5−1において「YES」の場合)、会議管理サーバ20の制御部21は、音声認識処理を実行する(ステップS5−2)。具体的には、制御部21の発言確認手段21gは、音声認識手段21hに対して、参加者の音声データの音声認識処理を指示する。   On the other hand, when the speech of the participant is detected in the voice data (in the case of “YES” in step S5-1), the control unit 21 of the conference management server 20 executes a voice recognition process (step S5-2). Specifically, the speech confirmation unit 21g of the control unit 21 instructs the speech recognition unit 21h to perform speech recognition processing on the participant's speech data.

そして、音声認識手段21hは、利用者データ記憶部23に記録された事前登録認証データの音声特徴量を用いて、音声データの音声認識処理を実行する。この音声認識処理では、発言者の認識と音声データのテキスト化を行なう。そして、音声認識手段21hは、認識結果(テキストデータ)を、タイムスタンプ及び発言者の利用者識別子に関連付けて議事録データ記憶部25に記録する。   Then, the voice recognition unit 21 h performs voice recognition processing of the voice data using the voice feature amount of the pre-registration authentication data recorded in the user data storage unit 23. In this voice recognition process, a speaker is recognized and voice data is converted into text. Then, the voice recognition unit 21h records the recognition result (text data) in the minutes data storage unit 25 in association with the time stamp and the user identifier of the speaker.

次に、会議管理サーバ20の制御部21は、発言時の顔画像の取得処理を実行する(ステップS5−3)。具体的には、制御部21の発言確認手段21gは、発言を検知した時刻と同じタイミングの発言者の画像データを実況データ記憶部24において特定し、顔画像を取得する。   Next, the control unit 21 of the conference management server 20 executes face image acquisition processing at the time of speaking (step S5-3). Specifically, the utterance confirmation unit 21g of the control unit 21 specifies the image data of the utterer at the same timing as the time when the utterance was detected in the actual data storage unit 24, and acquires the face image.

更に、会議管理サーバ20の制御部21は、リップシンクロ確認処理を実行する(ステップS5−4)。具体的には、制御部21の発言確認手段21gは、発言音声と同じタイミングで取得した顔画像において、口元の動きをトリミングする。   Further, the control unit 21 of the conference management server 20 executes a lip sync confirmation process (step S5-4). Specifically, the speech confirmation unit 21g of the control unit 21 trims the movement of the mouth in the face image acquired at the same timing as the speech sound.

そして、発言確認手段21gは、発言と口元の動きとが同期しているかどうかについて
判定処理を実行する(ステップS5−5)。ここで、発言と口元の動きとが同期(リップシンクロ)している場合(ステップS5−5において、「YES」の場合)には、会議管理サーバ20の制御部21は、次の発言を待機する(ステップS5−1)。
Then, the speech confirmation unit 21g performs a determination process as to whether or not the speech and the movement of the mouth are synchronized (step S5-5). Here, when the speech and the movement of the mouth are synchronized (lip sync) (in the case of “YES” in step S5-5), the control unit 21 of the conference management server 20 waits for the next speech. (Step S5-1).

一方、発言と口元の動きとが同期していない場合(ステップS5−5において「NO」の場合)、会議管理サーバ20の制御部21は、アラーム処理を実行する(ステップS5−6)。具体的には、制御部21の発言確認手段21gは、各TV会議端末(10A,10B)に対して、音声と画像とが同期していないことを通知する。   On the other hand, when the remark and the movement of the mouth are not synchronized (in the case of “NO” in step S5-5), the control unit 21 of the conference management server 20 executes an alarm process (step S5-6). Specifically, the speech confirmation unit 21g of the control unit 21 notifies each TV conference terminal (10A, 10B) that the sound and the image are not synchronized.

(動作確認処理)
次に、図8を用いて、動作確認処理について説明する。この処理は、各TV会議端末(10A,10B)において、それぞれ独立に実行される。ここでは、送信元端末(第1の会議端末)であるTV会議端末10Aから、送信先端末(第2の会議端末)であるTV会議端末10Bに対して、音声データや画像データを送信する場合を想定する。
(Operation check process)
Next, the operation confirmation process will be described with reference to FIG. This process is executed independently at each TV conference terminal (10A, 10B). Here, audio data and image data are transmitted from the TV conference terminal 10A, which is the transmission source terminal (first conference terminal), to the TV conference terminal 10B, which is the transmission destination terminal (second conference terminal). Is assumed.

まず、TV会議端末10Aの制御部11は、送信元端末におけるオリジナル音声・画像の取得処理を実行する(ステップS6−1)。具体的には、制御部11の音声・画像取得手段11aは、入力部13を介して、第1実況データとしての音声データや画像データを取得する。   First, the control unit 11 of the TV conference terminal 10A executes an original sound / image acquisition process in the transmission source terminal (step S6-1). Specifically, the voice / image acquisition unit 11 a of the control unit 11 acquires voice data and image data as the first live data via the input unit 13.

次に、TV会議端末10Aの制御部11は、オリジナル音声・画像の記録処理を実行する(ステップS6−2)。具体的には、制御部11の記録手段11bが、音声・画像取得手段11aが取得した音声データや画像データを、音声・画像データ記憶部15に一時記録する。   Next, the control unit 11 of the TV conference terminal 10A executes an original sound / image recording process (step S6-2). Specifically, the recording unit 11 b of the control unit 11 temporarily records the audio data and image data acquired by the audio / image acquisition unit 11 a in the audio / image data storage unit 15.

次に、TV会議端末10Aの制御部11は、送信先端末へのオリジナル音声・画像の転送処理を実行する(ステップS6−3)。具体的には、制御部11の音声・画像転送手段11cは、音声データや画像データを、ネットワークを介して、TV会議端末10Bに送信する。   Next, the control unit 11 of the TV conference terminal 10A executes a process of transferring the original sound / image to the transmission destination terminal (step S6-3). Specifically, the audio / image transfer unit 11c of the control unit 11 transmits audio data and image data to the TV conference terminal 10B via the network.

そして、TV会議端末10Bは、取得した音声データや画像データを、出力部14を介して出力する。この場合、TV会議端末10Bの入力部13は、出力部14から出力された画像や音声を取得する。そして、TV会議端末10Bの制御部11は、エコーキャンセル処理を行なうことなく、TV会議端末10Aに対して、TV会議端末10Bの入力部13において取得した音声データや画像データを送信する。   Then, the TV conference terminal 10 </ b> B outputs the acquired audio data and image data via the output unit 14. In this case, the input unit 13 of the TV conference terminal 10 </ b> B acquires the image and sound output from the output unit 14. Then, the control unit 11 of the TV conference terminal 10B transmits the audio data and the image data acquired by the input unit 13 of the TV conference terminal 10B to the TV conference terminal 10A without performing echo cancellation processing.

そして、TV会議端末10Aの制御部11は、送信先端末からの音声・画像の取得処理を実行する(ステップS6−4)。具体的には、制御部11の音声・画像取得手段11dは、TV会議端末10Bから、ネットワークを介して第2実況データとしての音声データや画像データを取得する。   And the control part 11 of 10 A of video conference terminals performs the acquisition process of the audio | voice and image from a transmission destination terminal (step S6-4). Specifically, the audio / image acquisition unit 11d of the control unit 11 acquires audio data and image data as second live data from the TV conference terminal 10B via the network.

次に、TV会議端末10Aの制御部11は、エコー音声・画像の抽出処理を実行する(ステップS6−5)。具体的には、制御部11のエコー抽出手段11eは、音声・画像データ記憶部15を用いて、TV会議端末10Bから取得した音声データや画像データにおいて、TV会議端末10Aから送信したオリジナル音声データや画像データに対応するエコー音声・画像の信号成分を抽出する。そして、エコー抽出手段11eは、抽出したエコー信号をアラーム出力手段11fに供給する。   Next, the control unit 11 of the TV conference terminal 10A executes an echo sound / image extraction process (step S6-5). Specifically, the echo extraction means 11e of the control unit 11 uses the audio / image data storage unit 15 to transmit the original audio data transmitted from the TV conference terminal 10A in the audio data and image data acquired from the TV conference terminal 10B. And the signal component of the echo sound / image corresponding to the image data. The echo extraction unit 11e supplies the extracted echo signal to the alarm output unit 11f.

次に、TV会議端末10Aの制御部11は、エコー信号のレベルが基準値以上あるかどうかについての判定処理を実行する(ステップS6−6)。具体的には、制御部11のア
ラーム出力手段11fは、エコー抽出手段11eから取得したエコー信号レベルを算出する。更に、アラーム出力手段11fは、音声・画像データ記憶部15を用いて、オリジナル音声・画像の信号レベルを算出する。そして、オリジナル信号レベルとエコー信号レベルとを比較する。ここでは、アラーム出力手段11fは、エコー信号レベルをオリジナル信号レベルで除算した比較値を算出する。
Next, the control unit 11 of the TV conference terminal 10A performs a determination process as to whether or not the level of the echo signal is equal to or higher than a reference value (step S6-6). Specifically, the alarm output unit 11f of the control unit 11 calculates the echo signal level acquired from the echo extraction unit 11e. Further, the alarm output means 11 f uses the audio / image data storage unit 15 to calculate the signal level of the original audio / image. Then, the original signal level is compared with the echo signal level. Here, the alarm output means 11f calculates a comparison value obtained by dividing the echo signal level by the original signal level.

この比較値が基準値以上の場合(ステップS6−6において「YES」の場合)には、TV会議端末10Aの制御部11は、そのまま動作確認処理を継続する。
一方、比較値が基準値に達していない場合(ステップS6−6において「NO」の場合)には、TV会議端末10Aの制御部11は、アラームの出力処理を実行する(ステップS6−7)。具体的には、制御部11のアラーム出力手段11fは、各TV会議端末(10A,10B)に対して、音声データや画像データが送信先端末(ここでは、TV会議端末10B)に適切に届いていないことを通知する。以上の処理は、TV会議端末10Bにおいても、同様に実行される。
If this comparison value is greater than or equal to the reference value (“YES” in step S6-6), the control unit 11 of the TV conference terminal 10A continues the operation confirmation process.
On the other hand, when the comparison value does not reach the reference value (in the case of “NO” in step S6-6), the control unit 11 of the TV conference terminal 10A executes an alarm output process (step S6-7). . Specifically, the alarm output means 11f of the control unit 11 appropriately sends audio data and image data to the destination terminal (here, the TV conference terminal 10B) with respect to each TV conference terminal (10A, 10B). Notify that you have not. The above processing is executed in the same manner in the TV conference terminal 10B.

本実施形態の遠隔会議管理システムによれば、以下のような効果を得ることができる。
・ 本実施形態では、会議管理サーバ20の制御部21は、参加者画像の取得処理(ステップS1−3)、参加者の認証情報の取得処理(ステップS1−4)、認証処理(ステップS1−5)を実行する。そして、会議開催条件を満足しているかどうかの判定処理を実行する(ステップS1−6)。そして、認証ができた人数が必要数に達している場合(ステップS1−6において、「YES」の場合)、会議管理サーバ20の制御部21は、アクション許可処理を実行する(ステップS1−9)。これにより、参加者が会議開催地から離れた遠隔地にいる場合でも、会議開催条件を確認して、厳格に会議を実施することができる。
According to the remote conference management system of this embodiment, the following effects can be obtained.
In the present embodiment, the control unit 21 of the conference management server 20 acquires the participant image acquisition process (step S1-3), the participant authentication information acquisition process (step S1-4), and the authentication process (step S1-). 5) is executed. And the determination process of whether meeting meeting conditions are satisfied is performed (step S1-6). If the number of authenticated persons reaches the required number (in the case of “YES” in step S1-6), the control unit 21 of the conference management server 20 executes an action permission process (step S1-9). ). Thereby, even when the participant is at a remote place away from the meeting place, the meeting holding conditions can be confirmed and the meeting can be performed strictly.

・ 本実施形態では、会議管理サーバ20の制御部21は、画像検証処理を実行する(ステップS3−1)。ここでは、顔画像の特徴量の一致度に応じた動き検知と、デフォーカスによる平面検知とを行なう。特徴量の変化状況や平面画像の撮影等の異常を検知した場合には、認証管理手段21fは、相手側のTV会議端末(10A,10B)にアラームを出力する。これにより、不正な形態での会議参加を抑制することができる。   -In this embodiment, the control part 21 of the meeting management server 20 performs an image verification process (step S3-1). Here, motion detection according to the degree of coincidence of feature quantities of face images and plane detection by defocusing are performed. When an abnormality such as a feature amount change state or planar image shooting is detected, the authentication management unit 21f outputs an alarm to the TV conference terminal (10A, 10B) on the other side. Thereby, participation in the meeting in an unauthorized form can be suppressed.

・ 本実施形態では、会議管理サーバ20の制御部21は、ネットワークにおける通信状態や顔画像の特徴量の一致度を用いて、次回の認証時期の設定処理を実行する(ステップS3−3)。これにより、状況に応じて、認証処理の負荷を軽減しながら、厳格に会議の実施を行なうことができる。すなわち、例えば、通信状態が悪い場合や顔画像の特徴量の一致度が悪い場合には、認証処理の頻度を高くして、不正を検知しやすくすることができる。更に、顔画像の特徴量が完全に一致する場合には写真等を用いての不正の可能性があるが、認証処理の頻度を高くして、この不正を検知しやすくすることができる。   -In this embodiment, the control part 21 of the meeting management server 20 performs the setting process of the next authentication time using the communication state in a network, and the matching degree of the feature-value of a face image (step S3-3). Thereby, according to the situation, the meeting can be strictly performed while reducing the load of the authentication process. That is, for example, when the communication state is bad or the degree of coincidence of the feature amounts of the face images is bad, it is possible to increase the frequency of the authentication process and easily detect fraud. Furthermore, there is a possibility of fraud using a photo or the like when the feature amounts of the face images are completely matched. However, the fraud can be easily detected by increasing the frequency of authentication processing.

・ 本実施形態では、会議管理サーバ20の制御部21は、画像追跡による所在検知処理を実行する(ステップS4−1)。そして、顔画像を追従できていない場合(ステップS4−2において、「NO」の場合)、制御部21は、会議開催条件を維持しているかどうかの判定処理を実行する(ステップS4−3)。参加者人数が必要数よりも少なくなり、会議開催条件を維持できない場合(ステップS4−3において、「NO」の場合)、制御部21は、アラーム処理を実行する(ステップS4−4)。これにより、間歇的に行なわれた本人認証結果を引き継いで、画像解析により、参加者の参加状況を継続的に監視することができる。そして、参加状況に問題がある場合には、会議を中断させることができるので、厳格に会議を運営することができる。   -In this embodiment, the control part 21 of the meeting management server 20 performs the location detection process by image tracking (step S4-1). When the face image cannot be followed (in the case of “NO” in step S4-2), the control unit 21 performs a determination process as to whether or not the meeting holding condition is maintained (step S4-3). . When the number of participants is less than the required number and the meeting holding conditions cannot be maintained (in the case of “NO” in step S4-3), the control unit 21 executes an alarm process (step S4-4). As a result, it is possible to continuously monitor the participation status of the participant by image analysis, taking over the result of the personal authentication performed intermittently. And when there is a problem in the participation situation, the conference can be interrupted, so that the conference can be managed strictly.

・ 本実施形態では、音声データにおいて参加者の発言を検知した場合(ステップS5
−1において「YES」の場合)、会議管理サーバ20の制御部21は、音声認識処理を実行する(ステップS5−2)。これにより、議事録の作成負担を軽減することができる。更に、会議管理サーバ20の制御部21は、発言時の顔画像を取得し(ステップS5−3)、リップシンクロ確認処理を実行する(ステップS5−4)。これにより、音声と画像とを用いて、確実に発言を記録することができる。そして、音声と画像との同期状況に問題がある場合には、会議を中断させることができるので、厳格に会議を運営することができる。
-In this embodiment, when a participant's speech is detected in audio | voice data (step S5)
In the case of “YES” in −1), the control unit 21 of the conference management server 20 executes a voice recognition process (step S5-2). Thereby, the burden of making minutes can be reduced. Furthermore, the control unit 21 of the conference management server 20 acquires a face image at the time of speaking (step S5-3), and executes a lip synchronization confirmation process (step S5-4). As a result, it is possible to reliably record a utterance using sound and an image. If there is a problem in the synchronization status between the sound and the image, the conference can be interrupted, so that the conference can be managed strictly.

・ 本実施形態では、TV会議端末10Aの制御部11は、オリジナル音声・画像の記録処理(ステップS6−2)、送信先端末へのオリジナル音声・画像の転送処理(ステップS6−3)を実行する。そして、TV会議端末10Aの制御部11は、送信先端末からの音声・画像を取得した場合(ステップS6−4)、エコー音声・画像の抽出処理を実行する(ステップS6−5)。ここで、エコー信号レベルをオリジナル信号レベルで除算した比較値が基準値に達していない場合(ステップS6−6において「NO」の場合)には、TV会議端末10Aの制御部11は、アラーム処理を実行する(ステップS6−7)。これにより、エコー信号を用いて、ネットワークの通信状況や相手端末の動作状況を確認して、音声や画像を確実に相手側に供給することができる。   In this embodiment, the control unit 11 of the TV conference terminal 10A executes the original voice / image recording process (step S6-2) and the original voice / image transfer process to the destination terminal (step S6-3). To do. And the control part 11 of 10 A of video conference terminals performs the extraction process of an echo sound and image, when the audio | voice and image from a transmission destination terminal are acquired (step S6-4) (step S6-5). Here, when the comparison value obtained by dividing the echo signal level by the original signal level does not reach the reference value (in the case of “NO” in step S6-6), the control unit 11 of the TV conference terminal 10A performs alarm processing. Is executed (step S6-7). As a result, it is possible to confirm the communication status of the network and the operating status of the counterpart terminal using the echo signal, and to reliably supply voice and images to the counterpart side.

また、上記実施形態は、以下のように変更してもよい。
○ 上記実施形態では、会議開始依頼の取得時に参加者確認処理を実行する。参加者確認処理の実行のタイミングは、これに限定されるものではなく、議決段階に実行するように構成することも可能である。
Moreover, you may change the said embodiment as follows.
In the above embodiment, the participant confirmation process is executed when a meeting start request is acquired. The timing of execution of the participant confirmation process is not limited to this, and it can be configured to be executed at the voting stage.

○ 上記実施形態では、会議開催条件として、会議が成立するための必要数に関するデータが記録される。ここで、会議開催条件として、必須の参加者を設定することも可能である。この場合には、会議管理データ記憶部22に、必須参加者の利用者識別子に関するデータを会議開催条件として記録しておく。そして、ステップS1−6やステップS4−3において、会議開催条件を確認する場合には、この参加者を認証できているかを確認する。   In the above embodiment, data related to the necessary number for establishing a conference is recorded as a conference holding condition. Here, it is possible to set an essential participant as a meeting holding condition. In this case, data relating to the user identifier of the essential participant is recorded in the conference management data storage unit 22 as a conference holding condition. In step S1-6 or step S4-3, when confirming the meeting holding conditions, it is confirmed whether or not the participant has been authenticated.

○ 上記実施形態では、動作確認処理は、各TV会議端末(10A,10B)において、それぞれ独立に実行される。これに代えて、会議管理サーバ20の制御部21が、動作確認処理を実行するように構成することも可能である。この場合には、会議管理サーバ20に音声・画像データ記憶部15を設ける。そして、制御部21を、音声・画像取得手段11a、記録手段11b、音声・画像転送手段11c、音声・画像取得手段11d、エコー抽出手段11e、アラーム出力手段11f、エコー消去手段11g、記録手段11h、音声・画像出力手段11iとして機能させる。この場合には、ネットワークの通信状況に障害がない場合には、会議管理サーバ20において各TV会議端末(10A,10B)の動作状況を確認することができる。従って、各TV会議端末(10A,10B)の処理負担の軽減を図ることができる。   In the above embodiment, the operation check process is executed independently at each TV conference terminal (10A, 10B). Instead of this, the control unit 21 of the conference management server 20 may be configured to execute an operation confirmation process. In this case, the audio / image data storage unit 15 is provided in the conference management server 20. Then, the control unit 21 controls the sound / image acquisition means 11a, the recording means 11b, the sound / image transfer means 11c, the sound / image acquisition means 11d, the echo extraction means 11e, the alarm output means 11f, the echo cancellation means 11g, and the recording means 11h. And function as the sound / image output means 11i. In this case, when there is no failure in the communication status of the network, the conference management server 20 can check the operation status of each TV conference terminal (10A, 10B). Therefore, it is possible to reduce the processing load of each TV conference terminal (10A, 10B).

○ 上記実施形態では、顔画像認証を用いて本人認証を行なったが、本人認証方法はこれに限定されるものではなく、指紋認証や静脈認証等の他のバイオメトリクス認証技術を用いることも可能である。この場合には、各TV会議端末に利用者認証用画像(バイオメトリクス情報)の読取装置を接続し、ネットワークを介して会議管理サーバ20に送信する。会議管理サーバ20においては、顔画像の代わりに各利用者認証用画像を用いて本人認証処理を実行する。   ○ In the above embodiment, personal authentication is performed using face image authentication, but the personal authentication method is not limited to this, and other biometric authentication technologies such as fingerprint authentication and vein authentication can also be used. It is. In this case, a user authentication image (biometrics information) reading device is connected to each TV conference terminal and transmitted to the conference management server 20 via the network. In the conference management server 20, the user authentication process is executed using each user authentication image instead of the face image.

○ 上記実施形態では、動作確認処理において、第1実況データとしての音声データや画像データと、第2実況データとしての音声データや画像データとを用いたが、音声デー
タや画像データのいずれ一方のみを利用することも可能である。
In the above embodiment, in the operation confirmation process, the voice data and image data as the first live data and the voice data and image data as the second live data are used. However, only one of the voice data and the image data is used. It is also possible to use.

本発明の実施形態のシステム概略図。The system schematic of embodiment of this invention. 各データ記憶部に記録されたデータの説明図であって、(a)は会議管理データ記憶部、(b)は利用者データ記憶部。It is explanatory drawing of the data recorded on each data memory | storage part, Comprising: (a) is a meeting management data memory | storage part, (b) is a user data memory | storage part. TV会議端末の機能ブロックの説明図。Explanatory drawing of the functional block of a video conference terminal. 本実施形態の処理手順の説明図。Explanatory drawing of the process sequence of this embodiment. 本実施形態の処理手順の説明図。Explanatory drawing of the process sequence of this embodiment. 本実施形態の処理手順の説明図。Explanatory drawing of the process sequence of this embodiment. 本実施形態の処理手順の説明図。Explanatory drawing of the process sequence of this embodiment. 本実施形態の処理手順の説明図。Explanatory drawing of the process sequence of this embodiment.

符号の説明Explanation of symbols

10A,10B…TV会議端末、11…制御部、11a…音声・画像取得手段、11b…記録手段、11c…音声・画像転送手段、11d…音声・画像取得手段、11e…エコー抽出手段、11f…アラーム出力手段、11g…エコー消去手段、11h…記録手段、11i…音声・画像出力手段、12…操作部、13…入力部、14…出力部、20…会議管理サーバ、21…制御部、21a…実況データ取得手段、21b…実況データ記録手段、21c…ハッシュ処理手段、21d…会議進行管理手段、21e…本人認証手段、21f…認証管理手段、21g…発言確認手段、21h…音声認識手段、21i…参加者画像追跡手段、22…会議管理データ記憶部、23…利用者データ記憶部、24…実況データ記憶部、25…議事録データ記憶部。   10A, 10B ... TV conference terminal, 11 ... control unit, 11a ... sound / image acquisition means, 11b ... recording means, 11c ... sound / image transfer means, 11d ... sound / image acquisition means, 11e ... echo extraction means, 11f ... Alarm output means, 11g ... echo canceling means, 11h ... recording means, 11i ... sound / image output means, 12 ... operation part, 13 ... input part, 14 ... output part, 20 ... conference management server, 21 ... control part, 21a ... Live data acquisition means, 21b ... Live data recording means, 21c ... Hash processing means, 21d ... Conference progress management means, 21e ... Personal authentication means, 21f ... Authentication management means, 21g ... Speech confirmation means, 21h ... Voice recognition means, 21i ... Participant image tracking means, 22 ... Conference management data storage unit, 23 ... User data storage unit, 24 ... Actual data storage unit, 25 ... Minutes data recording Part.

Claims (7)

隔会議の動作確認を行なう動作確認制御手段と、エコー信号の基準値を記憶した基準値データ記憶手段と、送信データ記憶手段と、入力部とを備えた第1の会議端末と、
前記第1の会議端末にネットワークを介して接続されるとともに、入力部と出力部とを備えた第2の会議端末とから構成された遠隔会議管理システムであって、
前記動作確認制御手段が、
前記第1の会議端末の入力部を介して取得した第1実況データを前記送信データ記憶手段に記録する記録手段、
前記第2の会議端末に対して前記第1実況データを送信する送信手段、
前記第2の会議端末の出力部における前記第1実況データの出力が、前記第2の会議端末の入力部において入力され、前記第2の会議端末から送信された第2実況データを、前記ネットワークを介して受信する受信手段、
前記第2実況データから、前記送信データ記憶手段に記録された第1実況データのエコー信号を抽出するエコー抽出手段、
前記エコー信号の大きさが前記基準値データ記憶手段に記憶された基準値以下である場合には、アラームを出力するアラーム出力手段
を備えたことを特徴とする遠隔会議管理システム。
And operation confirming control means for performing an operation check of the far septum conference, and the reference value data storage means for storing a reference value of the echo signal, the transmission data storage unit, a first conference terminal having an input unit,
A remote conference management system configured to be connected to the first conference terminal via a network and configured to include a second conference terminal including an input unit and an output unit ;
The operation confirmation control means is
Recording means for recording the first commentary data acquired through the input portion of the first conference terminal to the transmitting data storage means,
Transmitting means for transmitting the first Commentary data to the second conference terminal,
The output of the first live data at the output unit of the second conference terminal is input at the input unit of the second conference terminal, and the second live data transmitted from the second conference terminal is used as the network. Receiving means for receiving via
An echo extraction means for extracting an echo signal of the first live data recorded in the transmission data storage means from the second live data;
A remote conference management system comprising alarm output means for outputting an alarm when the magnitude of the echo signal is equal to or less than a reference value stored in the reference value data storage means .
前記第1の会議端末は、出力部を更に備え、
前記動作確認制御手段は、前記第2実況データから前記第1実況データのエコー信号を消去して、前記第1の会議端末の出力部から出力する手段を更に備えたことを特徴とする請求項1に記載の遠隔会議管理システム。
The first conference terminal further includes an output unit,
The operation confirmation control means, before Symbol to cancel the echo signal of the first Commentary data from the second Commentary data, and further comprising a means for outputting the output of the first conference terminal according Item 4. The remote conference management system according to Item 1 .
前記第1の会議端末は、遠隔会議の実況データを記録する実況データ記憶手段を更に備え、
前記動作確認制御手段は、前記エコー信号を消去した第2実況データを前記実況データ記憶手段に記録する手段を更に備えたことを特徴とする請求項1又は2に記載の遠隔会議管理システム。
The first conference terminal further comprises a live data storage unit for recording live data of a remote conference,
3. The remote conference management system according to claim 1, wherein the operation confirmation control unit further includes a unit that records the second live state data from which the echo signal is deleted in the live state data storage unit.
前記第1、第2の実況データは音声データを含むことを特徴とする請求項1〜のいず
れか1つに記載の遠隔会議管理システム。
The remote conference management system according to any one of claims 1 to 3 , wherein the first and second live data include voice data.
前記第1、第2の実況データは画像データを含むことを特徴とする請求項1〜のいずれか1つに記載の遠隔会議管理システム。 The remote conference management system according to any one of claims 1 to 4 , wherein the first and second live data include image data. 隔会議の動作確認を行なう動作確認制御手段と、エコー信号の基準値を記憶した基準値データ記憶手段と、送信データ記憶手段と、入力部とを備えた第1の会議端末と、
前記第1の会議端末にネットワークを介して接続されるとともに、入力部と出力部とを備えた第2の会議端末とから構成された遠隔会議管理システムを用いて、遠隔会議の管理を行なうための方法であって、
前記動作確認制御手段が、
前記第1の会議端末の入力部を介して取得した第1実況データを前記送信データ記憶手段に記録する記録段階と、
前記第2の会議端末に対して前記第1実況データを送信する送信段階と、
前記第2の会議端末の出力部における前記第1実況データの出力が、前記第2の会議端末の入力部において入力され、前記第2の会議端末から送信された第2実況データを、前記ネットワークを介して受信する受信段階と、
前記第2実況データから、前記送信データ記憶手段に記録された第1実況データのエコー信号を抽出するエコー抽出段階と、
前記エコー信号の大きさが前記基準値データ記憶手段に記憶された基準値以下である場合には、アラームを出力するアラーム出力段階と
を実行することを特徴とする遠隔会議管理方法。
And operation confirming control means for performing an operation check of the far septum conference, and the reference value data storage means for storing a reference value of the echo signal, the transmission data storage unit, a first conference terminal having an input unit,
In order to manage a remote conference using a remote conference management system that is connected to the first conference terminal via a network and includes a second conference terminal having an input unit and an output unit. The method of
The operation confirmation control means is
A recording step of recording the first commentary data acquired through the input portion of the first conference terminal to the transmitting data storage means,
A transmission step of transmitting the first Commentary data to the second conference terminal,
The output of the first live data at the output unit of the second conference terminal is input at the input unit of the second conference terminal, and the second live data transmitted from the second conference terminal is used as the network. A receiving stage for receiving via
An echo extraction step of extracting an echo signal of the first live data recorded in the transmission data storage means from the second live data;
A remote conference management method, comprising: executing an alarm output step of outputting an alarm when the magnitude of the echo signal is equal to or smaller than a reference value stored in the reference value data storage means .
隔会議の動作確認を行なう動作確認制御手段と、エコー信号の基準値を記憶した基準値データ記憶手段と、送信データ記憶手段と、入力部とを備えた第1の会議端末と、
前記第1の会議端末にネットワークを介して接続されるとともに、入力部と出力部とを備えた第2の会議端末とから構成された遠隔会議管理システムを用いて、遠隔会議時の動作確認を行なうためのプログラムであって、
前記動作確認制御手段を、
前記第1の会議端末の入力部を介して取得した第1実況データを前記送信データ記憶手段に記録する記録手段、
前記第2の会議端末に対して前記第1実況データを送信する送信手段、
前記第2の会議端末の出力部における前記第1実況データの出力が、前記第2の会議端末の入力部において入力され、前記第2の会議端末から送信された第2実況データを、前記ネットワークを介して受信する受信手段、
前記第2実況データから、前記送信データ記憶手段に記録された第1実況データのエコー信号を抽出するエコー抽出手段、
前記エコー信号の大きさが前記基準値データ記憶手段に記憶された基準値以下である場合には、アラームを出力するアラーム出力手段
として機能させることを特徴とする遠隔会議動作確認プログラム。
And operation confirming control means for performing an operation check of the far septum conference, and the reference value data storage means for storing a reference value of the echo signal, the transmission data storage unit, a first conference terminal having an input unit,
Operation confirmation at the time of a remote conference is performed using a remote conference management system that is connected to the first conference terminal via a network and is configured by a second conference terminal having an input unit and an output unit. A program for performing,
The operation check control means;
Recording means for recording the first commentary data acquired through the input portion of the first conference terminal to the transmitting data storage means,
Transmitting means for transmitting the first Commentary data to the second conference terminal,
The output of the first live data at the output unit of the second conference terminal is input at the input unit of the second conference terminal, and the second live data transmitted from the second conference terminal is used as the network. Receiving means for receiving via
An echo extraction means for extracting an echo signal of the first live data recorded in the transmission data storage means from the second live data;
A teleconference operation confirmation program that causes an alarm output unit to output an alarm when the magnitude of the echo signal is equal to or smaller than a reference value stored in the reference value data storage unit .
JP2008005789A 2008-01-15 2008-01-15 Remote conference management system, remote conference management method, and remote conference operation confirmation program Expired - Fee Related JP4728357B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008005789A JP4728357B2 (en) 2008-01-15 2008-01-15 Remote conference management system, remote conference management method, and remote conference operation confirmation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008005789A JP4728357B2 (en) 2008-01-15 2008-01-15 Remote conference management system, remote conference management method, and remote conference operation confirmation program

Publications (2)

Publication Number Publication Date
JP2009171120A JP2009171120A (en) 2009-07-30
JP4728357B2 true JP4728357B2 (en) 2011-07-20

Family

ID=40971836

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008005789A Expired - Fee Related JP4728357B2 (en) 2008-01-15 2008-01-15 Remote conference management system, remote conference management method, and remote conference operation confirmation program

Country Status (1)

Country Link
JP (1) JP4728357B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5094804B2 (en) * 2009-08-31 2012-12-12 シャープ株式会社 Conference relay device and computer program
JP5857443B2 (en) * 2011-05-12 2016-02-10 ソニー株式会社 Content sharing system
JP6484934B2 (en) 2014-06-10 2019-03-20 株式会社リコー COMMUNICATION DEVICE, COMMUNICATION SYSTEM, COMMUNICATION MANAGEMENT SYSTEM, COMMUNICATION CONTROL METHOD, AND PROGRAM

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01109951A (en) * 1987-10-23 1989-04-26 Nec Corp Acoustic echo canceller with external control function
JP2007267218A (en) * 2006-03-29 2007-10-11 Sharp Corp Sound volume monitoring device, communication terminal device, communication system, communication method, echo canceller, and computer-readable program for functioning echo canceller
JP2007274176A (en) * 2006-03-30 2007-10-18 Pioneer Electronic Corp Voice confirming method of voice conference apparatus and voice conference system, and program thereof

Also Published As

Publication number Publication date
JP2009171120A (en) 2009-07-30

Similar Documents

Publication Publication Date Title
US20190190908A1 (en) Systems and methods for automatic meeting management using identity database
EP2055088B1 (en) Interaction based on facial recognition of conference participants
JP4718567B2 (en) Remote conference management system, remote conference management method, and remote conference management program
US8264520B2 (en) Communication system, connection controller, terminal, and control method
WO2020164273A1 (en) Conference management method and related device based on voiceprint recognition
US20100085415A1 (en) Displaying dynamic caller identity during point-to-point and multipoint audio/videoconference
CN109118606B (en) Facial recognition attendance process authentication method
CN110910523B (en) Conference sign-in method, conference room operation terminal and computer storage medium
JP2009188809A (en) Electronic conference system
US11303756B2 (en) System and method for auto-initiating conference calls from a user device
KR100608591B1 (en) Method and apparatus for generating multimedia meeting reports
JP4728357B2 (en) Remote conference management system, remote conference management method, and remote conference operation confirmation program
JP2007241130A (en) System and device using voiceprint recognition
JP2004129071A (en) Two-way communication system
US10504119B2 (en) System and method for executing remote electronic authentication
JP2002251393A (en) Recording device, recording method, program, recording medium and recording/reproducing system
CN113170021A (en) Method and system for remote interaction between at least one user and at least one operator of automatic and manual type
CN113055194B (en) Cloud conference box rapid conference entering method, cloud conference box and readable storage medium
JP2009070166A (en) Electronic conference system
CN112507309A (en) Method, device, equipment and storage medium for court to remotely obtain procurement insurance pending trial materials
CN112035043A (en) Video call processing method and related equipment
US11582274B2 (en) Videoconferencing system
CN212624175U (en) Remote face recognition conference sign-in system
KR20100137331A (en) Multiple authentication system for participating of tele-conference
JP2022080502A (en) Host terminal, electronic meeting system, method for authentication of entry into electronic meeting, and program

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100518

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100707

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110414

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140422

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees