JP2008060864A - Interpretation system with privacy protection function - Google Patents

Interpretation system with privacy protection function Download PDF

Info

Publication number
JP2008060864A
JP2008060864A JP2006234700A JP2006234700A JP2008060864A JP 2008060864 A JP2008060864 A JP 2008060864A JP 2006234700 A JP2006234700 A JP 2006234700A JP 2006234700 A JP2006234700 A JP 2006234700A JP 2008060864 A JP2008060864 A JP 2008060864A
Authority
JP
Japan
Prior art keywords
image
terminal device
interpreter
caller
input unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006234700A
Other languages
Japanese (ja)
Inventor
Kiyoshi Onishi
清 大西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2006234700A priority Critical patent/JP2008060864A/en
Publication of JP2008060864A publication Critical patent/JP2008060864A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide an interpretation system with simple structure by which privacy protection of a caller is sufficiently attained in a system for providing sign language interpretation or foreign language interpretation service by images and sound utilizing a network. <P>SOLUTION: The privacy protection of the caller is attained by combining a means for preventing incorporation of a part of a real image of the caller as an image using a lens filter and an infrared irradiation function, a processing means for performing work processing of the incorporated image by a simple means and a means for storing communication data in a storage device at remote place from locations of a user and an interpreter. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、ネットワークを介して接続された端末装置を利用した手話通訳又は外国語通訳サービスにおいて、通話者のプライバシーを保護するための機能を備えた通訳システムに関する。   The present invention relates to an interpreting system having a function for protecting a caller's privacy in a sign language interpreting or foreign language interpreting service using a terminal device connected via a network.

従来、遠隔地間の通信では大容量のデータを高速で送信することが困難であったため、鮮明な画像の送受信ができず、ろうあ者本人やろうあ者と会話する者に対して、遠隔地から手話サービスを提供することはできなかった。また、遠隔地から外国語通訳サービスを提供するシステムはあったが、画質の悪いテレビ電話等による通訳サービスではなく、電話等による音声での通訳サービスが一般的であった。   Conventionally, it has been difficult to transmit a large amount of data at high speed in communication between remote locations, so clear images cannot be transmitted and received. We were unable to provide sign language services. In addition, there is a system that provides a foreign language interpreting service from a remote location, but it is not an interpreting service using a video phone or the like having a poor image quality, but a voice interpreting service using a telephone or the like is common.

しかし、ネットワークを介した通信技術の発達によって鮮明な画像の送受信が可能になり、テレビ電話等の画像と音声を双方向で送受信できる端末装置を使用したコミュニケーションが行われるようになったことで、最近では、テレビ電話等の端末装置を使用した遠隔地での手話通訳又は外国語通訳を提供するサービスも提案されるようになった。 However, with the development of communication technology over the network, it has become possible to transmit and receive clear images, and communication using a terminal device that can transmit and receive video and audio bidirectionally, such as videophones, has been performed, Recently, a service for providing a sign language interpreter or a foreign language interpreter using a terminal device such as a videophone has been proposed.

ところが、テレビ電話等の端末装置を使用した通訳サービスの提供は、利用者や通訳者の映像がそのまま表示されたり、そのデータがそのまま保管されたりすることから、利用者及び通訳者のプライバシーが十分に保護されないという問題が生じている。   However, the provision of interpreting services using terminal devices such as videophones provides sufficient privacy for users and interpreters because the images of users and interpreters are displayed as they are and the data is stored as they are. The problem of being unprotected is occurring.

そこで、利用者や通訳者のプライバシーを保護するため、通話者の実画像に代えてキャラクタ画像やアニメーション画像等の代理画像を表示するテレビ電話装置や通訳システムが提案されている。
特開2003−37826号公報 特開2003−16475号公報
Therefore, in order to protect the privacy of users and interpreters, videophone devices and interpreting systems that display proxy images such as character images and animation images instead of actual images of callers have been proposed.
JP 2003-37826 A JP 2003-16475 A

しかしながら、通話者の実画像をアニメーション等の代理画像に変換する場合、通話者の実映像が伝送されないため匿名性は高いといえるが、通話者の表情や口の動き、手の動きを十分に表現することは困難である。特に、手話通訳において、口と手の動きは重要であり、これを忠実に代理画像で表現することは困難である。   However, when the caller's real image is converted into a proxy image such as an animation, the caller's real video is not transmitted, so anonymity is high. However, the caller's facial expression, mouth movement, and hand movement are sufficient. It is difficult to express. In particular, in sign language interpretation, the movement of the mouth and hand is important, and it is difficult to faithfully represent this with a proxy image.

また、カメラを通して取り込まれた実映像のデータがシステム内に長く保持されてしまうという問題もある。これは、感情を観察するために常に顔の表情をモニターする必要があり、データ収集と分析が通訳サービス提供時に同時に行われなければならないからである。 In addition, there is a problem that data of actual video captured through the camera is held in the system for a long time. This is because it is necessary to constantly monitor facial expressions in order to observe emotions, and data collection and analysis must be performed simultaneously when providing interpretation services.

さらに、これらの装置及びシステムは大量のデータ処理が必要となり、装置及びシステム構成が複雑化するとともに、スムーズな通信が困難になるという問題がある。 Furthermore, these devices and systems require a large amount of data processing, and there are problems that the device and system configuration becomes complicated and that smooth communication becomes difficult.

本発明は、上記課題に鑑みてなされたものであり、その目的とするところは、ネットワークを介して接続されるテレビ電話等を利用した映像及び音声による通訳システムにおいて、通話者のプライバシーを十分保護しつつも、スムーズで確実な通訳サービスを提供することのできる簡便な通訳システムを提供することである。   The present invention has been made in view of the above problems, and its purpose is to sufficiently protect the privacy of a caller in a video and audio interpretation system using a videophone or the like connected via a network. However, it is to provide a simple interpretation system that can provide a smooth and reliable interpretation service.

上記課題を解決するために、本発明は、映像及び音声により手話通訳又は外国語通訳サービスを提供する通訳システムにおいて、サービス提供を希望する利用者が使用する利用者端末装置と、サービスセンタ内に設置され通訳者が使用する通訳者端末装置とがネットワークを介して接続され、各端末装置が画像データ及び音声データを双方向に送受信することにより通訳サービスを提供する通訳システムであって、該システム内に利用者又は通訳者のプライバシーを保護するプライバシー保護手段を備えたことを特徴とする。   In order to solve the above problems, the present invention provides a user terminal device used by a user who wants to provide a service in an interpreter system that provides sign language interpretation or a foreign language interpretation service using video and audio, and a service center. An interpreter system in which an interpreter terminal device installed and used by an interpreter is connected via a network, and each terminal device provides an interpreting service by bidirectionally transmitting and receiving image data and audio data. It is characterized by having a privacy protection means for protecting the privacy of the user or interpreter.

前記各端末装置は、画像入力部、音声入力部、画像データ及び音声データの送受信装置、画像及び文字情報の表示部、音声出力部から構成され、プライバシー保護手段として画像データを加工処理する画像処理手段又は音声データを加工処理する音声処理手段のうち少なくとも1つの処理手段を備えていることを特徴とする。   Each terminal device includes an image input unit, an audio input unit, an image data and audio data transmission / reception device, an image and character information display unit, and an audio output unit, and performs image processing to process image data as privacy protection means. Or at least one processing means for processing the voice data.

前記プライバシー保護手段として、画像入力部が通話者の実像の一部を画像として取り込まない機能を有していることを特徴とする。これにより、送信データ容量を少なくしてスムーズな通信を可能とすることができる。   As the privacy protection means, the image input unit has a function of not capturing a part of the real image of the caller as an image. Thereby, it is possible to reduce the transmission data capacity and enable smooth communication.

前記通話者の実像の一部を画像として取り込まない機能として、画像入力部が所定範囲に濃淡色や黒色等が施されたフィルタレンズを備えていることを特徴とする。   As a function of not capturing a part of the real image of the caller as an image, the image input unit is provided with a filter lens in which a shaded color or black color is applied within a predetermined range.

前記通話者の実像の一部を画像として取り込まない機能として、画像入力部が赤外線照射機能を備えていることを特徴とする。   As a function of not capturing a part of the real image of the caller as an image, the image input unit has an infrared irradiation function.

プライバシー保護手段として、画像入力部から取得した画像から、通話者の顔と各パーツを検出する顔領域検出手段と、検出された顔領域に基づく基準点を設定する設定手段とを有するとともに、画像取得後即座に基準点から一定範囲もしくは顔のパーツの少なくとも1つを削除する画像処理手段を設けたことを特徴とする。   As privacy protection means, it has a face area detection means for detecting the caller's face and each part from the image acquired from the image input unit, and a setting means for setting a reference point based on the detected face area. Image processing means for deleting at least one of a certain range or facial parts from the reference point immediately after acquisition is provided.

プライバシー保護手段として、請求項6において削除された部分に、予め格納されている第三者の顔の同部分又は同パーツの画像又はCG画像であって、削除された範囲よりサイズの小さい画像を貼り付ける画像処理手段を設けたことを特徴とする。   As a privacy protection means, an image of the same part or part of a third party's face or a CG image stored in advance in the part deleted in claim 6 and having a size smaller than the deleted range is used. An image processing means for pasting is provided.

プライバシー保護手段として、画像入力部から取得された画像に反転等の特殊効果を施す画像処理手段を設け、特殊効果による不鮮明な影像を送受信することを特徴とする。   As privacy protection means, image processing means for applying a special effect such as inversion to the image acquired from the image input unit is provided, and a blurred image due to the special effect is transmitted and received.

プライバシー保護手段として、各端末装置の音声入力部に、取得した音声を加工処理する音声フィルタを設け、通話者の音声を加工処理して送受信することを特徴とする。   As the privacy protection means, a voice filter for processing the acquired voice is provided in the voice input unit of each terminal device, and the voice of the caller is processed and transmitted / received.

プライバシー保護手段として、ネットワークを介して接続された利用者及び通訳者の情報を格納する記憶装置と通訳サービスを管理する管理サーバとを有し、該管理サーバにより、利用者端末装置及び通訳者端末装置がその設置されている地域に応じてそれぞれエリア分けされ、第1エリアに属する利用者端末装置からの送信は、地理的に遠隔地にある第2エリアに属する通訳者端末装置が受信するとともに、利用者及び通訳者の情報や通信データが第1及び第2エリア以外の第3エリアに属する記憶装置に格納されることを特徴とする。   As privacy protection means, it has a storage device for storing information of users and interpreters connected via a network, and a management server for managing interpreting services. By the management server, user terminal devices and interpreter terminals The device is divided into areas according to the area where the device is installed, and the transmission from the user terminal device belonging to the first area is received by the interpreter terminal device belonging to the second area that is geographically remote. The user and interpreter information and communication data are stored in a storage device belonging to a third area other than the first and second areas.

各端末装置は通話者の顔を検出する顔領域検出手段を有し、該顔領域検出手段によって検出された顔領域が予め設定された座標範囲から外れた場合に、画像入力部の設定が初期設定に切り替わり、再度画像取得が行われることを特徴とする。   Each terminal device has a face area detecting means for detecting the face of the caller. When the face area detected by the face area detecting means is out of the preset coordinate range, the setting of the image input unit is initial. It switches to a setting and image acquisition is performed again, It is characterized by the above-mentioned.

通訳者端末装置は、通訳内容を確認したかどうかの信号を送信する確認信号送信手段を備え、利用者端末装置は、前記確認信号に対して内容を理解したかどうかの返答をする返答信号送信手段を備えたことを特徴とする。   The interpreter terminal device includes a confirmation signal transmission means for transmitting a signal indicating whether or not the interpretation content has been confirmed, and the user terminal device transmits a response signal for replying whether or not the content is understood with respect to the confirmation signal. Means are provided.

各端末装置は文字情報入力手段を備え、該文字情報入力手段から文字情報が入力された場合、受信側端末装置の表示部に該文字情報を表示することを特徴とする。   Each terminal device includes character information input means. When character information is input from the character information input means, the character information is displayed on the display unit of the receiving terminal device.

本発明の通訳システムによれば、通話者の実映像をそのまま表示せず、顔の画像の一部や音声を加工処理して送受信することで通話者のプライバシーを保護するとともに、通話者の口や手の動きはそのまま表示することで、映像を十分に活用した通訳サービスを提供することが可能である。   According to the interpreting system of the present invention, the caller's privacy is protected by processing and transmitting and receiving part of the face image and sound without displaying the actual video of the caller as it is and It is possible to provide an interpretation service that makes full use of video by displaying the movements of hands and hands as they are.

また、通話者の実映像は、その一部が不鮮明な状態又は削除された状態で取得されるか、取得後すぐに画像処理されるために、通話者の実映像がシステム内に保管されることはなく、通話者のプライバシーを十分に保護することが可能である。   In addition, the actual video of the caller is stored in the system because part of the video is acquired in a blurred or deleted state, or is processed immediately after acquisition. The privacy of the caller can be sufficiently protected.

また、利用者からの通信は距離的に遠い他エリアの通訳者端末装置が受信するとともに、その利用者及び通訳者の通信情報は、それ以外の第三のエリアに属する記憶装置に蓄積されるために、通話者のプライバシーの保護を十分に図ることが可能である。   In addition, the communication from the user is received by the interpreter terminal device in another area far away, and the communication information of the user and the interpreter is stored in the storage device belonging to the other third area. Therefore, it is possible to sufficiently protect the privacy of the caller.

本発明の通訳システムは、簡易な構成により構築されるため、端末装置及び通訳サービスを安価に提供することができるとともに、画像の加工処理は削除等の簡単なものであるため、通信データが大きくなることはないため、スムーズな双方向コミュニケーション、すなわちスムーズな通訳サービスを提供することが可能である。   Since the interpreting system of the present invention is constructed with a simple configuration, the terminal device and the interpreting service can be provided at low cost, and the image processing is simple such as deletion, so that the communication data is large. Therefore, it is possible to provide smooth bidirectional communication, that is, smooth interpretation service.

図1は、本発明の実施の形態に係る通訳システムの概略を示した図であり、本発明の通訳システムは、少なくとも1台の利用者端末装置2と、少なくとも1つのサービスセンタ3を備え、これらはネットワーク1を介して接続されている。   FIG. 1 is a diagram showing an outline of an interpreting system according to an embodiment of the present invention. The interpreting system of the present invention includes at least one user terminal device 2 and at least one service center 3. These are connected via the network 1.

図2は、各端末装置の構成を示した図である。利用者端末装置2は、通訳サービスの提供を受ける者が使用する端末装置であり、商店や役所の窓口等の通訳が必要とされる場所やろうあ者や外国人の自宅等に設置される。該利用者端末装置2を使用して、ろうあ者又は外国人本人や窓口等でろうあ者又は外国人に対応する者が通訳サービスの提供を受けることができる。   FIG. 2 is a diagram illustrating a configuration of each terminal device. The user terminal device 2 is a terminal device used by a person who is provided with an interpreting service, and is installed at a place where interpretation is required, such as a shop or a public office, or a deaf or foreigner's home. Using the user terminal device 2, a deaf person or a foreigner himself / herself or a person corresponding to a deaf person or a foreigner at a window or the like can be provided with an interpretation service.

利用者端末装置2は、画像入力部11、音声入力部12、表示部13、音声出力部14、画像処理部15、音声処理部16、送受信部17、返答信号送信部18、文字情報入力部19を備えている。画像入力部11は利用者の映像を取り込むカメラ等であり、音声入力部12は利用者の音声を取り込むマイク等である。音声処理部16は取得した通話者の音声を加工処理するものである。表示部13は通訳者端末装置4から送信された画像と文字情報等を表示するものである。返答信号送信部18は通訳者端末装置4から送信された通訳内容を理解したかどうかの確認信号に対して、理解したか否かを返答する返答信号を送信するものである。文字情報入力部19は、例えばキーボードやスキャナー等であり、キーボードで打たれた文字又はスキャナーで読み込まれた書類の画像を取り込むものである。   The user terminal device 2 includes an image input unit 11, a voice input unit 12, a display unit 13, a voice output unit 14, an image processing unit 15, a voice processing unit 16, a transmission / reception unit 17, a response signal transmission unit 18, and a character information input unit. 19 is provided. The image input unit 11 is a camera or the like that captures the user's video, and the audio input unit 12 is a microphone or the like that captures the user's voice. The voice processing unit 16 processes the acquired voice of the caller. The display unit 13 displays the image and character information transmitted from the interpreter terminal device 4. The response signal transmission unit 18 transmits a response signal for returning whether or not the interpretation content transmitted from the interpreter terminal device 4 is understood in response to the confirmation signal indicating whether or not the interpretation content is understood. The character information input unit 19 is, for example, a keyboard, a scanner, or the like, and captures characters that are typed on the keyboard or an image of a document that is read by the scanner.

サービスセンタ3は、サーバ5と、記憶装置6と、複数の通訳者端末装置とを備えている。サービスセンタ3には通訳者が常駐しており、通訳者は通訳者端末装置4を使用して通訳サービスを提供する。サーバ5は、利用者端末装置2からの通信を任意の通訳者端末装置4に接続させるものであり、記憶装置6は、利用者及び通訳者の地域や性別等の各種情報や画像データ及び音声データを含む通信情報を記憶するものである。   The service center 3 includes a server 5, a storage device 6, and a plurality of interpreter terminal devices. An interpreter is resident in the service center 3, and the interpreter uses the interpreter terminal device 4 to provide an interpretation service. The server 5 connects communication from the user terminal device 2 to an arbitrary interpreter terminal device 4, and the storage device 6 stores various information such as the area and sex of the user and the interpreter, image data, and audio. Communication information including data is stored.

通訳者端末装置4は、画像入力部21、音声入力部22、画像出力部23、音声出力部24、画像処理部25、音声処理部26、送受信装置27、確認信号送信部28、文字情報入力部29を備えている。確認信号送信部29は通訳した内容を利用者が理解したかどうかの確認を求める信号を送信するものである。その他は利用者端末装置2と同様の構成である。   The interpreter terminal device 4 includes an image input unit 21, an audio input unit 22, an image output unit 23, an audio output unit 24, an image processing unit 25, an audio processing unit 26, a transmission / reception device 27, a confirmation signal transmission unit 28, and character information input. A portion 29 is provided. The confirmation signal transmission unit 29 transmits a signal for confirming whether or not the user understands the interpreted content. Other configurations are the same as those of the user terminal device 2.

尚、利用者端末装置2には、通訳サービスの提供を受ける旨のサービス要求送信手段を設け、希望する通訳サービスが手話通訳であるか又は外国語通訳であるか、外国語通訳であればいずれの言語であるかを指定してサービス要求を行い、管理サーバ5が、該サービス要求信号に基づいて、通訳可能な通訳者のいる通訳者端末装置4と利用者端末装置2を通信接続して通訳サービスを開始する構成としてもよい。 The user terminal device 2 is provided with a service request transmission means for receiving the provision of an interpreting service. Whether the interpreting service desired is a sign language interpreter, a foreign language interpreter, or a foreign language interpreter. The management server 5 communicates and connects the interpreter terminal device 4 with the interpreter capable of interpreting and the user terminal device 2 based on the service request signal. The interpreting service may be started.

次に、各端末装置の画像処理部15及び25における取得画像の画像処理について説明するが、各端末装置は同様の処理を行うことから、ここでは利用者端末装置2に基づいて説明する。   Next, image processing of the acquired image in the image processing units 15 and 25 of each terminal device will be described. Since each terminal device performs the same processing, description will be made based on the user terminal device 2 here.

図4は取得された画像の処理を示すフローチャートである。まず、通話者の画像は画像入力部11から読み込まれる(ステップ101)。取り込まれた画像からは、顔領域検出手段により顔の領域と顔の各パーツが検出される(ステップ102)。次に検出できたか否かを判断し(ステップ103)、検出できなかった場合にはステップ101に戻り、再度画像取り込みが行われる。検出できた場合は、例えば目の中間点等を基準点として記録する(ステップ104)。次に、該基準点に基づいて画像処理がなされる(ステップ105)。基準点が予め設定された画面上の座標範囲内にある場合には画像データの送信がなされるが、座標範囲内を外れた場合には、画像の送信が中断されてステップ101に戻り、再度画像取得がなされる(ステップ106)。通話中は、以上の処理が繰り返しなされる。 FIG. 4 is a flowchart showing processing of the acquired image. First, the image of the caller is read from the image input unit 11 (step 101). From the captured image, the face area detection unit detects the face area and each part of the face (step 102). Next, it is determined whether or not it has been detected (step 103). If it has not been detected, the process returns to step 101, and image capture is performed again. If it can be detected, for example, the middle point of the eye is recorded as a reference point (step 104). Next, image processing is performed based on the reference point (step 105). If the reference point is within the preset coordinate range on the screen, the image data is transmitted. If the reference point is not within the coordinate range, the image transmission is interrupted and the process returns to step 101 and again. Image acquisition is performed (step 106). The above processing is repeated during a call.

図5は実画像をそのまま取得した場合の表示画面30を示した図であり、図6は上記ステップ105の画像処理後の表示画面30を示した図である。この画像処理は、検出された顔領域と、顔の各パーツ、設定された中心座標に基づいて、顔の一部、例えば目の部分を削除して、削除された白色の削除部分32に、予め格納されている第三者の同部分の画像33を貼り付けるものである。貼り付けられる画像33は削除部分32よりもサイズが小さい画像とすることで、実画像と画像33との間には白色の境界が設けられるため、これを見る者は画像33と顔全体を合成し難く、通話者が誰であるかを判別し難くすることができる。 FIG. 5 is a diagram showing the display screen 30 when the actual image is acquired as it is, and FIG. 6 is a diagram showing the display screen 30 after the image processing in step 105 described above. This image processing deletes a part of the face, for example, the eye part based on the detected face area, each part of the face, and the set center coordinates, and deletes the white deleted part 32. The image 33 of the same part of a third party stored in advance is pasted. Since the image 33 to be pasted is an image having a size smaller than that of the deleted portion 32, a white boundary is provided between the actual image and the image 33. This makes it difficult to determine who the caller is.

図8は画像入力部11に装着するレンズフィルタ31と、この場合に取り込まれる画像を示した図である。レンズフィルタ31は、所定範囲、例えば図に示すように上部分が黒色や濃淡色が施されたものであり、画像処理部に代えて、あるいは画像処理部に加えて画像入力部11にレンズフィルタ31を装着することで、通話者の顔の所定部分、例えば目から上の部分を画像として取り込まないようにすることができる。 FIG. 8 is a diagram showing a lens filter 31 attached to the image input unit 11 and an image captured in this case. The lens filter 31 has a predetermined range, for example, an upper portion that is black or light and shaded as shown in the figure. The lens filter 31 is provided in the image input unit 11 instead of or in addition to the image processing unit. By wearing 31, it is possible to prevent a predetermined portion of the caller's face, for example, a portion above the eyes from being captured as an image.

図9はレンズフィルタ31に代えて、画像入力部11に赤外線照射機能を設けた場合の取得画像を示す図であり、通話者の所定部分に遠赤外線を照射することにより、照射された部分34は白色となるため、実画像として取り込まれない。   FIG. 9 is a diagram showing an acquired image when the image input unit 11 is provided with an infrared irradiation function in place of the lens filter 31. The irradiated portion 34 is obtained by irradiating a predetermined portion of the caller with far infrared rays. Since it becomes white, it is not captured as a real image.

図7は、画像入力部11及び21が、レンズフィルタや赤外線照射機能を備えた場合の画像取得について示すフローチャートである。利用者端末装置2と通訳者端末装置4は同様の処理を行うことから、利用者端末装置2に基づいて説明する。まず、通話者の画像は画像入力部11から読み込まれる(ステップ201)。このとき、レンズフィルタ31又は赤外線の照射により、画像の一部は実画像として取得されない。次に、映像として表示させたく部分が、表示されていない(削除されている)状態で、このときの目の中間点等を基準点として記録する(ステップ202)。該基準点が予め設定された画面上の座標範囲内にある場合には画像データの送信がなされるが、座標範囲内を外れた場合には、画像の送信が中断されてステップ201に戻り、再度画像取得がなされる(ステップ203)。   FIG. 7 is a flowchart showing image acquisition when the image input units 11 and 21 have a lens filter and an infrared irradiation function. Since the user terminal device 2 and the interpreter terminal device 4 perform the same processing, description will be made based on the user terminal device 2. First, the caller's image is read from the image input unit 11 (step 201). At this time, a part of the image is not acquired as a real image by the lens filter 31 or infrared irradiation. Next, in a state where a portion to be displayed as an image is not displayed (deleted), an intermediate point of the eye at this time is recorded as a reference point (step 202). If the reference point is within the preset coordinate range on the screen, image data is transmitted. If the reference point is not within the coordinate range, the image transmission is interrupted and the process returns to step 201. Image acquisition is performed again (step 203).

このように、通話者の顔の一部等の実画像の一部を含まない状態で画像を取り込むことにより、通話者の顔がそのまま端末装置内に保持される心配もなく、また、実画像をそのまま取得した後に画像処理して送信する場合に比べて、画像データ容量が少なくてすむのでスムーズな通信が可能となる。   In this way, by capturing an image without including a part of the real image such as a part of the caller's face, there is no concern that the caller's face is held in the terminal device as it is. Compared with the case where the image data is acquired and processed and transmitted, the image data capacity can be reduced, and smooth communication is possible.

また、レンズフィルタや赤外線照射機能を使用して実像の一部を含まない状態で画像を取り込んだ後、取得画像にエフェクト処理等を行えば、通話者の匿名性をさらに高めることが可能である。   In addition, it is possible to further improve the caller's anonymity by performing an effect process on the acquired image after capturing the image without including a part of the real image using a lens filter or an infrared irradiation function. .

各端末装置はそれぞれ音声処理部16及び26を有し、音声入力部12及び22から入力された通話者の音声を加工処理して送信する構成としてもよく、また、通話者の音声をそのまま送信して相手の端末装置において音声を加工処理して音声出力部13又は23から加工処理された音声を出力する構成としてもよい。 Each terminal device may have a voice processing unit 16 and 26, and may be configured to process and transmit the voice of the caller input from the voice input units 12 and 22, or transmit the caller's voice as it is. And it is good also as a structure which processes the audio | voice in an other party's terminal device, and outputs the audio | voice processed by the audio | voice output part 13 or 23. FIG.

図3は、利用者端末装置2とサービスセンタ3の通信関係と、その通信情報が格納される記録装置との関係を示す図である。利用者端末装置2及び通訳者端末装置4は設置される地域に応じて、エリア1、エリア2・・・のようにそれぞれエリア分けされ、第1エリアに属する利用者端末装置からの送信は、地理的に遠隔地にある第2エリアに属する通訳者端末装置が受信するとともに、利用者及び通訳者の情報や通信データが第1及び第2エリア以外の第3エリアに属する記憶装置に格納される。例えば、エリア1に属する利用者端末装置2から送信があった場合、管理サーバ5による通信管理により、その送信はエリア1とは地理的遠隔地であるエリア3に属するサービスセンタ3内の通訳者端末装置4が受信する。そして、その通信データは、エリア1とエリア2以外のエリア6に属するサービスセンタ3内の記憶装置6に格納される。   FIG. 3 is a diagram showing the communication relationship between the user terminal device 2 and the service center 3 and the relationship between the recording device storing the communication information. The user terminal device 2 and the interpreter terminal device 4 are divided into areas such as area 1, area 2... According to the area where they are installed, and transmission from the user terminal device belonging to the first area is The interpreter terminal device belonging to the second area that is geographically remote is received, and the information and communication data of the user and interpreter are stored in the storage device belonging to the third area other than the first and second areas. The For example, when there is a transmission from the user terminal device 2 belonging to the area 1, the transmission is performed by the management server 5, and the transmission is performed by an interpreter in the service center 3 belonging to the area 3 which is geographically remote from the area 1. The terminal device 4 receives it. The communication data is stored in the storage device 6 in the service center 3 belonging to the area 6 other than the areas 1 and 2.

このように、利用者に対して地理的遠隔地にいる通訳者が通訳を行うことで、利用者と通訳者が同じ地域にならないようにし、さらに、その通信データが別のエリアに格納保持されることで、十分なプライバシーの保護を図ることが可能となる。 In this way, interpreters who are geographically remote from the user interpret the user so that the user and the interpreter are not in the same area, and the communication data is stored and held in another area. This makes it possible to protect the privacy sufficiently.

管理サーバ5による通信管理としては、利用者端末装置2から送信される電話番号情報に基づいて、地理的遠隔地のエリアに属する通訳者端末装置4に接続することが考えられるが、他の情報に基づいて通信管理することも可能である。 As communication management by the management server 5, it is conceivable to connect to the interpreter terminal device 4 belonging to the geographically remote area based on the telephone number information transmitted from the user terminal device 2. It is also possible to manage communication based on

本発明の通訳システムは、上記した種々のプライバシー保護手段を組み合わせることにより、利用者が段階的なプライバシー保護レベルを選択することが可能である。   The interpreting system of the present invention allows the user to select a stepwise privacy protection level by combining the various privacy protection means described above.

本発明の一実施形態の構成を示すブック図である。It is a book figure which shows the structure of one Embodiment of this invention. 本発明に係る各端末装置の構成を示した図である。It is the figure which showed the structure of each terminal device which concerns on this invention. 本発明に係る利用者端末装置とサービスセンタの通信関係及び通信情報が格納される記録装置との関係を示す図である。It is a figure which shows the relationship between the user terminal device which concerns on this invention, the communication relationship of a service center, and the recording device in which communication information is stored. 取得画像の処理を示すフローチャートである。It is a flowchart which shows the process of an acquired image. 実画像をそのまま取得した場合の表示画面を示した図である。It is the figure which showed the display screen at the time of acquiring a real image as it is. 画像処理後の表示画面を示した図である。It is the figure which showed the display screen after image processing. 実画像の一部を含まない状態で画像を取り込むこと場合の画像取得について示すフローチャートであるIt is a flowchart which shows image acquisition in the case of acquiring an image in the state which does not include a part of real image. 本発明に係るレンズフィルタとその表示画面を示した図である。It is the figure which showed the lens filter which concerns on this invention, and its display screen. 本発明に係る赤外線照射機能を設けた場合の取得画像を示す図である。It is a figure which shows the acquired image at the time of providing the infrared irradiation function which concerns on this invention.

符号の説明Explanation of symbols

1 ネットワーク
2 利用者端末装置
3 サービスセンタ
4 通訳者端末装置
5 管理サーバ
6 記憶装置
11、21 画像入力部
12、22 音声入力部
13、23 表示部
14、24 音声出力部
15、25 画像処理部
16、26 音声処理部
17、27 送受信部
18 返答信号送信部
19、29 文字情報入力部
28 確認信号送信部
DESCRIPTION OF SYMBOLS 1 Network 2 User terminal device 3 Service center 4 Interpreter terminal device 5 Management server 6 Storage device 11, 21 Image input part 12, 22 Voice input part 13, 23 Display part 14, 24 Voice output part 15, 25 Image processing part 16, 26 Voice processing unit 17, 27 Transmission / reception unit 18 Response signal transmission unit 19, 29 Character information input unit 28 Confirmation signal transmission unit

Claims (13)

映像及び音声により手話通訳又は外国語通訳サービスを提供する通訳システムにおいて、サービス提供を希望する利用者が使用する利用者端末装置と、サービスセンタ内に設置され通訳者が使用する通訳者端末装置とがネットワークを介して接続され、各端末装置が画像データ及び音声データを双方向に送受信することにより通訳サービスを提供する通訳システムであって、該システム内に利用者又は通訳者のプライバシーをするプライバシー保護手段を備えたことを特徴とする通訳システム。   In an interpretation system for providing sign language interpretation or foreign language interpretation services by video and audio, a user terminal device used by a user who desires service provision, and an interpreter terminal device installed in a service center and used by an interpreter Is an interpreter system in which each terminal device provides an interpreting service by bidirectionally transmitting and receiving image data and audio data, and the privacy of the user or interpreter in the system is provided. Interpretation system characterized by providing protection means. 前記各端末装置は、画像入力部、音声入力部、画像データ及び音声データの送受信装置、画像及び文字情報の表示部、音声出力部から構成され、プライバシー保護手段として画像データを加工処理する画像処理手段又は音声データを加工処理する音声処理手段のうち少なくとも1つの処理手段を備えていることを特徴とする請求項1記載の通訳システム。   Each terminal device includes an image input unit, an audio input unit, an image data and audio data transmission / reception device, an image and character information display unit, and an audio output unit, and performs image processing to process image data as privacy protection means. 2. The interpreting system according to claim 1, further comprising at least one processing means among means or voice processing means for processing voice data. プライバシー保護手段として、画像入力部が、通話者の実像の一部を画像として取り込まない機能を有していることを特徴とする請求項1〜2記載の通訳システム。   The interpreting system according to claim 1 or 2, wherein the image input unit has a function of not taking a part of a real image of a caller as an image as privacy protection means. 請求項3の通話者の実像の一部を画像として取り込まない機能として、画像入力部が所定範囲に濃淡色や黒色等が施されたレンズフィルタを備えていることを特徴とする請求項3記載の通訳システム。   4. The function of not capturing a part of the real image of the caller as claimed in claim 3 as an image, wherein the image input unit includes a lens filter in which a shaded color or black color is applied within a predetermined range. Interpretation system. 請求項3の通話者の実像の一部を画像として取り込まない機能として、画像入力部が赤外線照射機能を備えていることを特徴とする請求項3記載の通訳システム。   4. The interpreting system according to claim 3, wherein the image input unit has an infrared irradiation function as a function of not capturing a part of the real image of the caller of claim 3 as an image. プライバシー保護手段として、画像入力部から取得した画像から、通話者の顔と各パーツを検出する顔領域検出手段と、検出された顔領域に基づく基準点を設定する設定手段とを有するとともに、画像取得後即座に基準点から一定範囲もしくは顔のパーツの少なくとも1つを削除する画像処理手段を設けたことを特徴とする請求項1〜5記載の通訳システム。   As privacy protection means, it has a face area detection means for detecting the caller's face and each part from the image acquired from the image input unit, and a setting means for setting a reference point based on the detected face area. 6. The interpreting system according to claim 1, further comprising image processing means for deleting at least one of a certain range or facial parts from the reference point immediately after acquisition. プライバシー保護手段として、請求項6において削除された部分に、予め格納されている第三者の顔の同部分又は同パーツの画像又はCG画像であって、削除された範囲よりサイズの小さい画像を貼り付ける画像処理手段を設けたことを特徴とする請求項6記載の通訳システム。   As a privacy protection means, an image of the same part or part of a third party's face or a CG image stored in advance in the part deleted in claim 6 and having a size smaller than the deleted range is used. 7. The interpreting system according to claim 6, further comprising image processing means for pasting. プライバシー保護手段として、画像入力部から取得された画像に反転等の特殊効果を施す画像処理手段を設け、特殊効果による不鮮明な影像を送受信することを特徴とする請求項1〜7記載の通訳システム。   8. The interpreting system according to claim 1, wherein image processing means for applying a special effect such as inversion to the image acquired from the image input unit is provided as privacy protection means, and a blurred image due to the special effect is transmitted and received. . プライバシー保護手段として、各端末装置の音声入力部に、取得した音声を加工処理する音声フィルタを設け、通話者の音声を加工処理して送受信することを特徴とする請求項1〜8記載の通訳システム。   9. The interpreter according to claim 1, wherein a voice filter for processing the acquired voice is provided in the voice input unit of each terminal device as privacy protection means, and the voice of the caller is processed and transmitted / received. system. プライバシー保護手段として、請求項1の通訳システムは、ネットワークを介して接続された利用者及び通訳者の情報を格納する記憶装置と通訳サービスを管理する管理サーバとを有し、該管理サーバにより、利用者端末装置及び通訳者端末装置がその設置されている地域に応じてそれぞれエリア分けされ、第1エリアに属する利用者端末装置からの送信は、地理的に遠隔地にある第2エリアに属する通訳者端末装置が受信するとともに、利用者及び通訳者の情報や通信データが第1及び第2エリア以外の第3エリアに属する記憶装置に格納されることを特徴とする請求項1〜9記載の通訳システム。   As a privacy protection means, the interpreting system of claim 1 includes a storage device for storing information of users and interpreters connected via a network, and a management server for managing the interpreting service. The user terminal device and the interpreter terminal device are divided into areas according to the area where the user terminal device and the interpreter terminal device are installed, and transmission from the user terminal device belonging to the first area belongs to the second area that is geographically remote. 10. The interpreter terminal device receives the information and communication data of users and interpreters and is stored in a storage device belonging to a third area other than the first and second areas. Interpretation system. 各端末装置は通話者の顔を検出する顔領域検出手段を有し、該顔領域検出手段によって検出された顔領域が予め設定された座標範囲から外れた場合に、画像入力部の設定が初期設定に切り替わり、再度画像取得が行われることを特徴とする請求項1〜8記載の通訳システム。   Each terminal device has a face area detecting means for detecting the face of the caller. When the face area detected by the face area detecting means is out of the preset coordinate range, the setting of the image input unit is initial. The interpreting system according to claim 1, wherein the image acquisition is performed again after switching to the setting. 通訳者端末装置は、通訳内容を確認したかどうかの信号を送信する確認信号送信手段を備え、利用者端末装置は、前記確認信号に対して内容を理解したかどうかの返答をする返答信号送信手段を備えたことを特徴とする請求項1〜11記載の通訳システム。   The interpreter terminal device includes a confirmation signal transmission means for transmitting a signal indicating whether or not the interpretation content has been confirmed, and the user terminal device transmits a response signal for replying whether or not the content is understood with respect to the confirmation signal. The interpreting system according to claim 1, further comprising means. 各端末装置は文字情報入力手段を備え、該文字情報入力手段から文字情報が入力された場合、受信側端末装置の表示部に該文字情報を表示することを特徴とする請求項1〜12記載の通訳システム。   13. Each terminal device includes character information input means, and when the character information is input from the character information input means, the character information is displayed on the display unit of the receiving terminal device. Interpretation system.
JP2006234700A 2006-08-31 2006-08-31 Interpretation system with privacy protection function Pending JP2008060864A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006234700A JP2008060864A (en) 2006-08-31 2006-08-31 Interpretation system with privacy protection function

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006234700A JP2008060864A (en) 2006-08-31 2006-08-31 Interpretation system with privacy protection function

Publications (1)

Publication Number Publication Date
JP2008060864A true JP2008060864A (en) 2008-03-13

Family

ID=39243122

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006234700A Pending JP2008060864A (en) 2006-08-31 2006-08-31 Interpretation system with privacy protection function

Country Status (1)

Country Link
JP (1) JP2008060864A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090169074A1 (en) * 2008-01-02 2009-07-02 General Electric Company System and method for computer assisted analysis of medical image
JP2020136921A (en) * 2019-02-20 2020-08-31 株式会社オプテージ Video call system and computer program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090169074A1 (en) * 2008-01-02 2009-07-02 General Electric Company System and method for computer assisted analysis of medical image
JP2020136921A (en) * 2019-02-20 2020-08-31 株式会社オプテージ Video call system and computer program

Similar Documents

Publication Publication Date Title
US11315336B2 (en) Method and device for editing virtual scene, and non-transitory computer-readable storage medium
CN107835464B (en) Video call window picture processing method, terminal and computer readable storage medium
WO2019184499A1 (en) Video call method and device, and computer storage medium
US9007420B1 (en) Verifying presence of authorized persons during an electronic visitation
CN103931165A (en) Phone with multi-portal access for display during incoming and outgoing calls
US20130215214A1 (en) System and method for managing avatarsaddressing a remote participant in a video conference
US8855280B1 (en) Communication detail records (CDRs) containing media for communications in controlled-environment facilities
CN110494850A (en) Information processing unit, information processing method and recording medium
CN112261218B (en) Video control method, video control device, electronic device and readable storage medium
US20180144546A1 (en) Method, device and terminal for processing live shows
CA2499127A1 (en) A videophone sign language interpretation assistance device and a sign language interpretation system
CN108108079A (en) A kind of icon display processing method and mobile terminal
KR20170140369A (en) Communication processing method and electronic device
US8937635B2 (en) Device, method and system for real-time screen interaction in video communication
JP2023550971A (en) Video sharing methods, devices, electronic devices and storage media
CN106896917B (en) Method and device for assisting user in experiencing virtual reality and electronic equipment
JP2017184120A (en) Image processing system
JP2008060864A (en) Interpretation system with privacy protection function
CN109981890B (en) Reminding task processing method, terminal and computer readable storage medium
KR100686076B1 (en) Wireless Communication Terminal with Message Transmission According to Feeling of Terminal-User and Method of Message Transmission Using Same
JP2001344355A (en) Remote assistance system for person requiring assistance
JP2007049375A (en) Image processor, camera, communication equipment, and program for realizing image processor
CN102469291A (en) Video call system and method
JP2002259318A (en) Method for displaying picture of person in virtual reality space
CN110717163B (en) Interaction method and terminal equipment