JP2023015166A - 端末機、その動作方法およびコンピュータ読み取り可能な記録媒体 - Google Patents

端末機、その動作方法およびコンピュータ読み取り可能な記録媒体 Download PDF

Info

Publication number
JP2023015166A
JP2023015166A JP2022173296A JP2022173296A JP2023015166A JP 2023015166 A JP2023015166 A JP 2023015166A JP 2022173296 A JP2022173296 A JP 2022173296A JP 2022173296 A JP2022173296 A JP 2022173296A JP 2023015166 A JP2023015166 A JP 2023015166A
Authority
JP
Japan
Prior art keywords
data
terminal
data set
validity
buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022173296A
Other languages
English (en)
Inventor
アン サンギル
Sangil Ahn
リ ヨンジェ
Yongje Lee
ハ ソンジュ
Sungjoo Ha
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hyperconnect LLC
Original Assignee
Hyperconnect LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hyperconnect LLC filed Critical Hyperconnect LLC
Publication of JP2023015166A publication Critical patent/JP2023015166A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06T5/70
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/454Content or additional data filtering, e.g. blocking advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/34Microprocessors

Abstract

【課題】端末機、その動作方法およびコンピュータ読み取り可能な記録媒体が開示される。【解決手段】本発明の一実施形態による端末機の動作方法は、第1端末機と第2端末機との間にビデオ通話セッションを樹立する段階と、前記第1端末機で獲得されたデータを前記第2端末機で受信する段階と、前記第2端末機で、前記第1端末機から受信した前記データをあらかじめ設定された大きさのバッファーに順次に保存する段階と、前記第2端末機で、前記バッファーに保存された前記データに対する有効性検査を行う段階と、前記有効性検査の結果に対応して、前記第2端末機で前記データを処理する段階と、を含む。【選択図】図2

Description

本発明は、端末機、その動作方法およびコンピュータ読み取り可能な記録媒体に関し、より具体的には、ビデオ通話のユーザを不快な環境に露出させない端末機、その動作方法およびコンピュータ読み取り可能な記録媒体に関する。
通信技術が発展し、電子装置が小型化されるに伴い、個人用端末が一般消費者に広く普及されている。特に最近ではスマートフォンまたはスマートタブレットのような携帯用個人端末が広く普及されている。前記端末の大部分は、通信機能を含んでいる。ユーザは、端末を用いてインターネットで検索を行ったり他のユーザとメッセージを交換することができる。
また、小型カメラ技術、小型マイク技術、小型ディスプレイ技術および小型スピーカー技術の発展に伴い、スマートフォンのような大部分の端末には、カメラ、マイク、ディスプレイおよびスピーカーが含まれている。ユーザは、端末を用いて音声を録音したり音声が含まれた動画を撮影することができる。ユーザは、端末に含まれたスピーカーを介して前記録音された音声を確認したりディスプレイを介して前記撮影された動画を確認することができる。
また、ユーザは、端末の通信機能を用いて前記録音された音声または前記撮影された動画を他のユーザと共有することができる。ユーザは、以前に録音された音声または以前に撮影された動画を他のユーザに伝送することができる。また、ユーザは、端末により現在録音されている音声または現在撮影されている動画をリアルタイムで他のユーザに伝送することができる。
また、同時に、前記他のユーザは、自分の端末により現在録音されている音声または現在撮影されている動画をリアルタイムで前記ユーザに伝送することができる。ユーザの端末に含まれたディスプレイは、ユーザの端末により現在撮影されている動画および他のユーザの端末により現在撮影されている動画を同時に表示することができる。また、ユーザの端末に含まれたスピーカーは、ユーザの端末により現在録音されている音声および他のユーザの端末により現在録音されている音声を同時に再生することができる。言い換えれば、ユーザおよび他のユーザは、各自の端末を用いて互いにビデオ通話(video call)をすることができる。
ユーザが相手と互いにビデオ通話をする途中に、ユーザは、相手からの不適切な映像または音の露出にさらされることがある。特に、ユーザが互いに知らない関係にある相手とビデオ通話をする途中に、ユーザが相手からの淫らな映像の露出にさらされる可能性が高いことがある。
ビデオ通話のユーザを有害な環境から保護するために、多様な方法が考案されているが、リアルタイムでデータが送受信される過程で低いレイテンシ(latency)を維持しつつ、有害な要素を確実に遮断する方法が必要である。
本発明は、ビデオ通話のユーザが有害な環境の露出にさらされないようにする端末機、その動作方法およびコンピュータ読み取り可能な記録媒体を提供することを目的とする。
本発明の一実施形態による端末機の動作方法は、第1端末機と第2端末機との間にビデオ通話セッションを樹立する段階と、前記第1端末機で獲得されたデータを前記第2端末機で受信する段階と、前記第2端末機で、前記第1端末機から受信した前記データをあらかじめ設定された大きさのバッファーに順次に保存する段階と、前記第2端末機で、前記バッファーに保存された前記データに対する有効性検査を行う段階と、前記有効性検査の結果に対応して、前記第2端末機で前記データを処理する段階と、を含む。
また、前記方法は、前記第2端末機で、前記データをデコーディング(decoding)する段階をさらに含み、前記デコーディングする段階は、前記有効性検査を行う段階で有効性検査が完了したデータをデコーディングすることができる。または、前記第2端末機で、前記データをデコーディングする段階をさらに含み、前記有効性検査を行う段階は、前記バッファーに保存された前記データをデコーディンする段階を通じてデコーディングされたデータに対して有効性検査を行うことができる。
また、前記有効性検査を行う段階は、前記データに不良な要素が含まれているか否かを判断するための機械学習モデルを用いることができる。
また、前記データを処理する段階は、前記有効性検査の結果、不良な要素を含んでいるデータを再生しないように決定することができる。
また、前記データを処理する段階は、不良な要素を含んでいるデータに対応する時間の間に代替データを再生するように決定することができる。
また、前記データは、映像データ、音声データおよびテキストデータのうち少なくともいずれか1つを含むことができる。
また、前記有効性検査を行う段階は、前記バッファーに保存された第1データセットに対する有効性検査を行う段階と、前記バッファーに保存された第2データセットに対する有効性検査を行う段階と、前記バッファーに保存された第3データセットに対する有効性検査を行う段階と、を含み、前記第1~第3データセットは、前記バッファーに順次に保存されたデータセットでありうる。
また、前記有効性検査を行った結果、前記第1データセットおよび前記第3データセットは、不良な要素を含まず、前記第2データセットは、不良な要素を含むものと判断された場合、前記データを処理する段階は、前記第1データセットおよび前記第3データセットを再生するように決定し、前記第2データセットは再生しないように決定することができる。
また、前記データを処理する段階は、前記第2データセットに含まれた映像データにブラー(blur)またはモザイク処理をし、前記第2データセットに含まれた音声データは、ミュート(mute)処理をし、前記第2データセットに含まれたテキストデータは表示しなくてもよい。
一方、本発明による端末機の動作方法を行うためのフログラムが記録されたコンピュータ読み取り可能な記録媒体が提供され得る。
本発明の一実施形態による端末機は、前記端末機と他の端末機との間にビデオ通話セッションを樹立し、互いにデータを送受信するための通信インターフェースと、前記ビデオ通話セッションを介して前記他の端末機から受信したデータを受信された時間によって順次に保存するデータ保存部と、前記データ保存部に保存された前記データに対する有効性検査を行う有効性検査部と、前記有効性検査の結果に対応して前記データを処理する制御部と、を含む。
また、前記端末機は、前記データをデコーディング(decoding)するデコーダーをさらに含み、前記デコーダーは、前記有効性検査部で有効性検査が完了したデータに対してデコーディングを行うことができる。
また、前記有効性検査部は、前記データに不良な要素が含まれているか否かを判断するための機械学習モデルを用いることができる。
また、前記制御部は、前記有効性検査の結果、不良な要素を含んでいるデータを再生しないように決定することができる。
また、前記制御部は、前記不良な要素を含んでいるデータに対応する時間の間に代替データを再生するように決定することができる。
また、前記データは、映像データ、音声データおよびテキストデータのうち少なくともいずれか1つを含むことができる。
また、前記有効性検査部は、前記データ保存部に保存された第1データセット、第2データセットおよび第3データセットに対する有効性検査を行い、前記第1~第3データセットは、前記データ保存部に順次に保存されたデータセットでありうる。
また、前記有効性検査を行った結果、前記第1データセットおよび前記第3データセットは、不良な要素を含まず、前記第2データセットは、不良な要素を含むものと判断された場合、前記制御部は、前記第1データセットおよび前記第3データセットを再生するように決定し、前記第2データセットは再生しないように決定することができる。
また、前記制御部は、前記第2データセットに含まれた映像データにブラー(blur)またはモザイク処理をし、前記第2データセットに含まれた音声データは、ミュート(mute)処理をし、前記第2データセットに含まれたテキストデータは表示しなくてもよい。
本発明は、ビデオ通話のユーザが有害な環境の露出にさらされないようにする端末機、その動作方法およびコンピュータ読み取り可能な記録媒体を提供することができる。
本発明による端末機が動作する環境を概略的に示す図である。 本発明の一実施形態による端末機の動作方法を概略的に示すフローチャートである。 本発明の一実施形態によってデータがバッファーに保存される動作を概略的に示す図である。 本発明の他の実施形態による端末機の動作方法を概略的に示すフローチャートである。 従来技術による端末機の動作方法を概略的に示す図である。 本発明の一実施形態による端末機の構造を概略的に示す図である。
本発明の利点および特徴、そしてそれらを達成する方法は、添付の図面と共に詳細に後述されている実施形態を参照すると明確になる。しかしながら、本発明は、以下で開示される実施形態に限定されるものではなく、互いに異なる多様な形態で具現され、ただ本実施形態は、本発明の開示が完全になるようにし、本発明の属する技術分野における通常の知識を有する者に発明の範疇を完全に知らせるために提供されるものであり、本発明は、請求項の範疇により定義されるだけである。明細書全般において、同一の参照符号は、同一の構成要素を指す。
たとえ「第1」または「第2」等が多様な構成要素を記述するために使用されていても、このような構成要素は、上記のような用語により制限されない。上記のような用語は、ただ1つの構成要素を他の構成要素と区別するために使用され得る。したがって、以下で言及される第1構成要素は、本発明の技術的思想内で第2構成要素であってもよい。
本明細書において使用された用語は、実施形態を説明するためのものであり、本発明を制限しようとするものではない。本明細書において、単数型は、文言で特に言及しない限り、複数型も含む。明細書において使用される「含む(comprises)」または「含む(comprising)」は、言及された構成要素または段階が1つ以上の他の構成要素または段階の存在または追加を排除しないという意味を内包する。
他の定義がない場合、本明細書において使用されるすべての用語は、本発明の属する技術分野における通常の知識を有する者に共通的に理解され得る意味で解釈され得る。また、一般的に使用される辞書に定義されている用語は、明白に特に定義されていない限り、理想的にまたは過度に解釈されない。
図1は、本発明による端末機が動作する環境を概略的に示す図である。図1を参照すると、第1端末機10および第2端末機20が動作する環境は、サーバー100と、サーバー100と互いに連結された第1端末機10および第2端末機20とを含むことができる。本発明による端末機に関する説明は、図1に示される第1端末機10および第2端末機20に関する説明で代替され得る。説明の便宜のために、図1には、2つの端末機、すなわち第1端末機10および第2端末機20のみを示しているが、2つよりさらに多い数の端末機が含まれ得る。追加され得る端末機について、特に言及される説明を除いて、第1端末機10および第2端末機20に関する説明が適用され得る。
サーバー100は、通信網に連結され得る。サーバー100は、前記通信網を介して外部の他の装置と互いに連結され得る。サーバー100は、互いに連結された他の装置にデータを伝送したり前記他の装置からデータを受信することができる。
サーバー100と連結された通信網は、有線通信網、無線通信網、または複合通信網を含むことができる。通信網は、3G、LTE、またはLTE-A等のような移動通信網を含むことができる。通信網は、ワイファイ(Wi-Fi)、UMTS/GPRS、またはイーサネット(Ethernet)等のような有線または無線通信網を含むことができる。通信網は、磁気セキュア伝送(MST,Magnetic Secure Transmission)、RFID(Radio Frequency Identification)、NFC(Near Field Communication)、ジグビー(ZigBee)、Z-Wave、ブルートゥース(Bluetooth)、低電力ブルートゥース(BLE,Bluetooth Low Energy)、または赤外線通信(IR,InfraRed communication)等のような近距離通信網を含むことができる。通信網は、ローカルエリアネットワーク(LAN,Local Area Network)、メトロポリタンエリアネットワーク(MAN,Metropolitan Area Network)、またはワイドエリアネットワーク(WAN,Wide Area Network)等を含むことができる。
サーバー100は、第1端末機10および第2端末機20のうち少なくとも1つからデータを受信することができる。サーバー100は、第1端末機10および第2端末機20のうち少なくとも1つから受信されたデータを用いて演算を行うことができる。サーバー100は、前記演算結果を第1端末機10および第2端末機20のうち少なくとも1つに伝送することができる。
サーバー100は、第1端末機10および第2端末機20のうち少なくとも1つの端末機から仲介要請を受信することができる。サーバー100は、仲介要請を伝送した端末を選択することができる。例えば、サーバー100は、第1端末機10および第2端末機20を選択することができる。
サーバー100は、前記選択された第1端末機10および第2端末機20の間の通信連結を仲介することができる。例えば、サーバー100は、第1端末機10および第2端末機20の間のビデオ通話接続を仲介したり、テキスト送受信連結を仲介することができる。サーバー100は、第1端末機10に関する連結情報を第2端末機20に伝送することができ、第2端末機20に関する連結情報を第1端末機10に伝送することができる。
第1端末機10に関する連結情報は、例えば、第1端末機10のアイピー(IP)アドレスおよびポート(port)番号を含むことができる。第2端末機20に関する連結情報を受信した第1端末機10は、前記受信された連結情報を用いて第2端末機20への連結を試みることができる。
第1端末機10の第2端末機20への連結試みまたは第2端末機20の第1端末機10への連結試みが成功することによって、第1端末機10および第2端末機20の間のビデオ通話セッションが樹立され得る。前記ビデオ通話セッションを介して第1端末機10は、第2端末機20に映像または音を伝送することができる。第1端末機10は、映像または音をデジタル信号にエンコーディングし、前記エンコーディングされた結果物を第2端末機20に伝送することができる。
また、前記ビデオ通話セッションを介して第1端末機10は、第2端末機20から映像または音を受信することができる。第1端末機10は、デジタル信号にエンコーディングされた映像または音を受信し、前記受信された映像または音をデコーディングすることができる。
前記ビデオ通話セッションを介して第2端末機20は、第1端末機10に映像または音を伝送することができる。また、前記ビデオ通話セッションを介して第2端末機20は、第1端末機10から映像または音を受信することができる。これにより、第1端末機10のユーザおよび第2端末機20のユーザは、互いにビデオ通話をすることができる。
第1端末機10および第2端末機20は、例えば、デスクトップコンピュータ、ラップトップコンピュータ、スマートフォン、スマートタブレット、スマートウォッチ、移動端末、デジタルカメラ、ウェラブルデバイス(wearable device)、または携帯用電子機器等でありうる。第1端末機10および第2端末機20は、プログラムまたはアプリケーションを実行することができる。第1端末機10および第2端末機20それぞれは、互いに同じ種類の装置であってもよく、互いに異なる種類の装置であってもよい。
図2は、本発明の一実施形態による端末機の動作方法を概略的に示すフローチャートである。
図2を参照すると、本発明の一実施形態による端末機の動作方法は、第1端末機と第2端末機との間にビデオ通話セッションを樹立する段階S110と、第2端末機にデータを伝送する段階S120と、受信したデータをバッファーに保存する段階S130と、データ有効性を検査する段階S140と、データを処理する段階S150と、を含む。
段階S110では、2つの端末機、すなわち第1端末機10と第2端末機20との間にビデオ通話セッションを樹立する。前記ビデオ通話セッションは、図1を参照として説明したサーバー100により樹立されたり、第1端末機10および第2端末機20により能動的に樹立され得る。
段階S120では、第1端末機10で獲得されたデータを第2端末機20に伝送する。前記ビデオ通話セッションを介して第1端末機10と第2端末機20は、互いにデータを交換することができる。前記データは、映像、音声、およびテキストのうち少なくともいずれか1つを含むことができる。第1端末機10で生成されたデータが第2端末機20に伝送される場合、第1端末機10で生成されたデータは、エンコーディング(encoding)されて第2端末機20に伝送され、エンコーディングされたデータは、第2端末機20でデコーディング(decoding)され得る。第2端末機20で生成されたデータが第1端末機10に伝送される場合には、第2端末機20でエンコーディングされたデータが第1端末機10でデコーディングされ得る。
段階S130では、第2端末機20で、第1端末機10から受信したデータをあらかじめ設定された大きさのバッファーに順次に保存する。例えば、前記バッファーの大きさがnバイト(bytes)にあらかじめ設定されている場合、第1端末機10から受信されるデータは、第2端末機20のバッファーにnバイト単位で保存され得る。特定の時間区間の間に第1端末機10から10×nバイトのデータが第2端末機20に伝送される場合、前記データは、第1端末機10から伝送される順序によってnバイト単位で前記バッファーに順次に保存され得る。一方、ここで、前記バッファーの大きさは、全体バッファーの大きさを意味することができるが、受信したデータを保存する単位バッファーの大きさを意味することもできる。
一方、前記単位バッファーの大きさは、一定の時間に対応して決定され得る。例えば、前記単位バッファーの大きさは、1msに対応するデータの大きさに決定され得る。この際、前記単位バッファーには、1msに対応するデータが受信された順に全体バッファーに順次に保存され得る。
段階S140では、第2端末機20で、前記バッファーに保存されたデータに対する有効性検査を行う。前記有効性検査は、第1端末機10から受信されたデータが有効(valid)であるか否かを検査することであり、データ自体の有効性と共に、前記データに不良な要素が含まれているか否かを検査することを含む。
例えば、前記データは、映像データ(image data)、音声データ(audio data)、およびテキストデータ(text data)のうち少なくともいずれか1つを含むことができる。段階S140では、前記映像データ、音声データたはテキストデータに不良な要素が含まれているか否かを検査することができる。
一実施形態において、段階S140では、前記データに含まれた映像データが、悪口ジェスチャー、侮辱ジェスチャー、人種差別ジェスチャー、性的コンテンツ、裸体露出(nudity)、性器、性行為、非衛生的コンテンツ、排泄物、排泄行為、反社会的コンテンツ、反倫理的コンテンツ、不法行為、犯罪行為、憎悪犯罪(hate crime)、暴力行為、虐待行為、自害行為、武器、麻薬、反社会的シンボル、嫌悪性(hateful)コンテンツ、威嚇性コンテンツ、恐怖症誘発(phobia-inducing)コンテンツ、または血液のうち少なくとも1つ以上に対応する不良な要素を含んでいるか否かを検査することができる。
また、段階S140では、前記データに含まれた音声データまたはテキストデータが、悪口、脅迫性(intimidatory)発言、嫌悪性発言、反社会的発言、反倫理的発言、性的な発言、犯罪性(criminality)発言または侮辱的な発言のうち少なくともいずれか1つに対応する不良な要素を含んでいるか否かを検査することができる。または、前記データに含まれた音声データが、うめき、あえぐような声(gasping sound)、悲鳴または叫び声のうち少なくとも1つ以上の不良な要素を含んでいるか否かを検査することができる。他の例として、前記データに含まれた音声データが、轟音、銃声、嘔吐の音(vomit sound)、打撃の音(hit sound)、むち打ちの音(whip sound)、刃物の音(knife sound)、スイングの音(swing sound)、刺す音(stab sound)、のこぎりの音(saw sound)、きしみ音(grating sound)、キーキーいう音(creaking sound)、特定の臨界値以上のピッチ(pitch)を有する音、または特定の臨界値以上の大きさ(loudness)を有する音のうち少なくとも1つ以上の不良な要素を含んでいるか否かを検査することができる。
一方、他の実施形態において、段階S140では、前記データに不良な要素が含まれているか否かを判断するための機械学習モデルを用いることができる。前記機械学習モデルは、少なくとも2つ以上のレイヤー(layer)を含むニューラルネットワーク(neural network)でありうる。前記機械学習モデルは、入力レイヤー(input layer)および出力レイヤー(output layer)を含むことができる。前記機械学習モデルは、少なくとも1つ以上の隠れレイヤー(hidden layer)をさらに含むことができる。
前記機械学習モデルは、少なくとも1つ以上の映像、音声またはテキスト、および前記少なくとも1つ以上の映像、音声またはテキストが不良な要素を含むか否かに関する情報を用いて学習(train)された分類モデル(classification model)でありうる。前記機械学習モデルは、任意の映像、音声またはテキストに含まれた少なくとも1つ以上の特徴点を入力値として用いることができる。前記機械学習モデルは、前記少なくとも1つ以上の特徴点が不良な要素に対応するか否かを予測(predict)することができる。
前記機械学習モデルは、ディープラーニング(deep learning)アルゴリズムを用いて学習され得る。前記機械学習モデルは、ディープニューラルネットワーク(Deep Neural Network,DNN)、畳み込みニューラルネットワーク(Convolutional Neural Network、CNN)、回帰型ニューラルネットワーク(Recurrent Neural Network,RNN)、R-CNN(Region-based Convolutional Neural Network)、制限ボルツマンマシン(Restricted Boltzmann Machine,RBM)、ディープビリーフネットワーク(Deep Belief Network,DBN)、またはディープキューネットワーク(Deep Q-Networks)のうち少なくとも1つ以上を含むことができる。
前記機械学習モデルは、畳み込みニューラルネットワーク(Convolutional Neural Network、CNN)でありうる。前記機械学習モデルは、AlexNet、ZFNet、GoogLeNet、VGGNet、ResNet、Inception-ResNet、Inception-v2、Inception-v3、またはInception-v4を含むことができる。
一実施形態によれば、これらの機械学習モデルを用いて受信したデータに不良な要素が含まれているか否かを判断する主体は、サーバー100であってもよく、データを受信した第1端末機10または第2端末機20であってもよい。つまり、受信端末機で機械学習モデルを用いて前記データに不良な要素が含まれているか否かを判断することができる。
一方、本発明の他の実施形態において、段階S140は、前記バッファーに保存された第1データセット(data set)に対する有効性検査を行う段階と、前記バッファーに保存された第2データセットに対する有効性検査を行う段階と、前記バッファーに保存された第3データセットに対する有効性検査を行う段階と、を含むことができ、ここで、前記第1~第3データセットは、前記バッファーに順次に保存されたデータセットでありうる。
したがって、段階S110で前記ビデオ通話セッションが樹立された後に、段階S120~段階S150は、前記単位バッファーに保存されたデータセットに対して繰り返し行われるものと理解することができる。
前記ビデオ通話セッションが樹立されて第1端末機10と第2端末機20との間でデータ伝送がリアルタイムで連続的に起こる場合、前記バッファーに順次的に保存されたデータセットに対して連続的な有効性検査が行われ得る。有効性検査が完了したデータセットは、段階S150に伝達され、当該データセット以後に保存されたデータセットに対する有効性検査が行われ得る。
段階S150では、前記有効性検査結果に対応して前記データを処理する。一実施形態において、段階S150では、段階S140での有効性検査の結果、前記データに不良な要素が含まれていると判断された場合、第2端末機20で当該データを再生しないように決定することができる。
例えば、順次にバッファーに保存されたデータセットを受信された順序によって検査し、不良な要素を含んでいるデータは再生しないように決定することができる。映像データに不良な要素が含まれている場合、当該データは、第2端末機20のディスプレイを介して再生しなくてもよい。音声データに不良な要素が含まれている場合、当該データは、第2端末機20のスピーカーを介して再生しなくてもよい。
n番目に保存されたデータ(第nデータ)に不良な要素が含まれている場合、前記第nデータは再生しなくてもよく、n+1番目に保存されたデータ(第n+1データ)に対する有効性検査が行われ得る。前記第n+1データに不良な要素が含まれていないものと判断される場合、前記第n+1データは、第2端末機20で正常に再生され、n+2番目に保存されたデータ(第n+2データ)に対する有効性検査が行われ得る。前記第n+2データの再生可否は、段階S140での有効性検査の結果によって段階S150で決定され得る。
一方、段階S150では、前記不良な要素を含んでいるデータに対応する時間の間に代替データを再生するように決定することができる。例えば、映像データに不良な要素が含まれている場合には、以前のデータセット(data set)に含まれた映像データを再生したり、前記不良な要素が含まれている映像データをブラー(blur)またはモザイク(mosaic)処理した映像を代替映像として再生するように決定することができる。音声データに不良な要素が含まれている場合には、以前のデータセットに含まれた音声データを再生したり、前記不良な要素が含まれている音声データをミュート(mute)処理することができる。または、テキストデータに不良な要素が含まれている場合には、当該テキストデータを表示しないか、不良な要素が含まれていることを知らせるメッセージを表示するように決定することができる。
図3は、本発明の一実施形態によってデータがバッファーに保存される動作を概略的に示す図である。
図3を参照すると、ビデオ通話セッションを介して連結された相手の端末機から伝送されるデータは、大きさmのバッファーに順次に保存され得る。この際、前記バッファーの大きさmは、あらかじめ決定された大きさのバイト(bytes)に対応したり、あらかじめ決定された時間に対応することができる。
図3で、第n-1データセット(data set n-1)、第nデータセット(data set n)、および第n+1データセット(data set n+1)は、前記相手の端末機から順次に伝送されたものと理解することができる。
前記バッファーに保存された前記第n-1データセット(data set n-1)~前記第n+1データセット(data set n+1)に対して順次に有効性検査が行われ得る。前記有効性検査は、図2を参照して説明した段階S140に対応し、前記有効性検査が完了したデータセットは、段階S150に対応するデータ処理段階を経ることになる。
図3に示されるバッファーが図1および図2を参照して説明した第2端末機20に含まれる構成要素である場合、前記第n-1データセット(data set n-1)~前記第n+1データセット(data set n+1)は、第1端末機10から順次的に伝送されたものと理解することができる。
前記第n-1データセット(data set n-1)~前記第n+1データセット(data set n+1)の大きさは、互いに同じものと理解することができる。または、前記第n-1データセット(data set n-1)~前記第n+1データセット(data set n+1)の再生時間も、互いに同じものと理解することができる。
すなわち、前記第n-1データセット(data set n-1)~前記第n+1データセット(data set n+1)が保存される空間は、前記バッファーに含まれるそれぞれの単位バッファーで定義され得、FIFO(First In First Out)方式で順次的なデータ処理が行われ得る。前記バッファーに保存されたデータ(またはデータセット)に対して順次に有効性検査および前記有効性検査の結果による処理が行われ得る。
図4は、本発明の他の実施形態による端末機の動作方法を概略的に示すフローチャートである。
図4を参照すると、本発明の他の実施形態による端末機の動作方法は、第1端末機と第2端末機との間にビデオ通話セッションを樹立する段階S210と、第2端末機にデータを伝送する段階S220と、受信したデータをバッファーに保存する段階S230と、データ有効性検査を行う段階S240と、データをデコーディング(decoding)する段階S250と、データを処理する段階S260と、を含む。第1端末機と第2端末機との間にビデオ通話セッションを樹立する段階S210と、第2端末機にデータを伝送する段階S220と、受信したデータをバッファーに保存する段階S230と、データ有効性検査を行う段階S240と、データを処理する段階S260では、図2を参照して説明した段階S110~段階S150と実質的に同じ動作が行われるので、重複する内容に限って具体的な説明は省略することとする。
第1端末機10から伝送されるデータは、デジタル(digital)データにエンコーディング(encoding)されて圧縮された形態で第2端末機20に伝送され、段階S250では、エンコーディングされたデータをデコーディング(decoding)する動作が行われる。段階S250では、有効性検査が完了したデータに対してデータデコーディングを行い、前記有効性検査の結果に対応して段階S260でデータ処理が行われる。段階S240で前記有効性検査を通過しないデータ、すなわち不良な要素を含んでいるデータは、段階S250でデコーディングされなくてもよい。
他の実施形態によると、段階S240での有効性検査は、データをデコーディングした後に行うことができる。これによると、第2端末機20に伝送されたエンコーディングされたデータは、デコーディングされた後、有効性検査が行われ得る。そして、有効性検査が完了したデータは、有効性検査の結果に対応して段階S260でデータ処理が行われる。デコーディングされた後、段階S240で前記有効性検査を通過しないデータ、すなわち不良要素を含んでいるデータは、段階S260で再生しないように決定されるか、データに対応する時間の間に代替データを再生するように決定されるなど、ユーザーに不良な要素が遮断されるようにデータ処理が施され得る。
実施形態の第2端末機20は、第1端末機10から受信した映像データセットをバッファーに順次に保存し、保存された順序に応じて各データセットに対する有効性検査を行うことができる。一方、実施形態において、第2端末機20は、受信した映像データセットをデコーディングしてバッファーに順次に保存することもできる。ただし、デコーディング後に直ちに再生可否を決定せず、有効性検査の結果によって再生可否を決定することによって、不適切なデータが再生されることを防止することができる。第2端末機20は、有効性検査の結果によってデータセットに対する再生可否を決定することができる。このように各端末機内で学習モデルを用いて受信したデータセットに対する不適切な要素を検査する有効性検査を行うことによって、サーバーの介入なしにさらに高いユーザ便宜性を提供することができる。
図3のバッファー構造と同様に、段階S250でのデータデコーディングは、前記バッファーに保存された順序によって行われ、1つのデータ(またはデータセット)に対してデコーディングが完了すると、当該データ以後に前記バッファーに保存されたデータ(またはデータセット)に対してデコーディングが行われる。
図5は、従来技術による端末機の動作方法を概略的に示す図である。
図5を参照すると、従来技術による端末機は、受信されたデータに対してデコーディング(decoding)と有効性検査を同時に行う。同じデータに対してデコーディングと有効性検査が同時に行われるので、不良な要素を含んでいるデータが発見されても、デコーディングされたデータが入出力インターフェースに伝達されて、端末機のユーザに表示され得る。したがって、不良な要素を含んでいるデータの再生を中断しても、当該データの一部は、ユーザに露出されるしかない問題を有することになる。
従来技術による端末機は、デコーディングと有効性検査を同時に行うことによって、データ通信に伴う遅延(latency)を低減することができるが、User Healthの観点から好ましくない。
これに対し、本発明の一実施形態による端末機の動作方法によれば、有効性検査を通過しないデータに対してはデコーディングが行われず、前記入出力インターフェースに伝達されても、ユーザには正常に表示され得ない。したがって、ユーザの経験に害を及ぼすおそれがある不良な要素を基本的に遮断する効果を期待することができる。
図6は、本発明の一実施形態による端末機の構造を概略的に示す図である。
図6を参照すると、本発明の一実施形態による端末機30は、通信インターフェース31、データ保存部32、有効性検査部33、および制御部34を含む。図1の第1端末機10および第2端末機20は、図6に示される端末機30と実質的に同じ構成要素を含むことができる。
通信インターフェース31は、端末機30と他の端末機との間にビデオ通話セッションを樹立し、前記他の端末機と互いにデータを送受信することができるようにする。端末機30には、ビデオ通話を実行するアプリケーション(application)が設置されており、これと同じアプリケーションが設置されている他の端末機とビデオ通話を行うことができる。通信インターフェース31は、端末機30からのビデオ通話要請を相手の端末機に伝送したり、相手の端末機からビデオ通話要請を受信することができる。そして、端末機30の情報を相手の端末機に伝送したり相手の端末機の情報を受信することができ、端末機情報を用いてビデオ通話セッションを樹立することができる。
前記ビデオ通話セッションが樹立されると、通信インターフェース31は、端末機30で獲得されたデータを前記他の端末機に伝送することができる。前記データは、映像、音声、およびテキストのうち少なくともいずれか1つを含むことができる。端末機30で生成されたデータが前記他の端末機に伝送される場合、端末機30で生成されたデータは、エンコーディング(encoding)されて前記他の端末機に伝送され、エンコーディングされたデータは、前記他の端末機でデコーディング(decoding)され得る。前記他の端末機で生成されたデータが端末機30に伝送される場合には、前記他の端末機でエンコーディングされたデータが端末機30でデコーディングされ得る。したがって、端末機30は、エンコーディングされたデータをデコーディングするデコーダー(decoder)をさらに含むことができる。そして、前記デコーダーは、有効性検査部33で有効性検査が完了したデータに対してデコーディングを行うことができる。または、前記デコーダーは、デコーディングされたデータを有効性検査部33に伝達してデコーディングされたデータに不良な要素が含まれているか否かを判断するようにすることができる。
データ保存部32は、他の端末機から受信したデータをあらかじめ設定された大きさのバッファーに順次に保存する。例えば、前記バッファーの大きさがnバイトにあらかじめ設定されている場合、前記他の端末機から受信されるデータは、データ保存部32のバッファーにnバイト単位で保存され得る。特定の時間区間の間に前記他の端末機から10×nバイトのデータが端末機30に伝送される場合、前記データは、前記他の端末機から伝送される順序によってnバイト単位で前記バッファーに順次に保存され得る。一方、ここで、前記バッファーの大きさは、全体バッファーの大きさを意味することができるが、受信したデータを保存する単位バッファーの大きさを意味することもできる。
一方、前記単位バッファーの大きさは、一定の時間に対応して決定され得る。例えば、前記単位バッファーの大きさは、1msに対応するデータの大きさに決定され得る。この際、前記単位バッファーには、1msに対応するデータが受信された順に全体バッファーに順次に保存され得る。
有効性検査部33は、データ保存部32に保存されたデータに対する有効性検査を行う。前記有効性検査は、前記他の端末機から受信されたデータが有効(valid)であるか否かを検査することであり、データ自体の有効性と共に、前記データに不良な要素が含まれているか否かを検査することを含む。
例えば、前記データは、映像データ(image data)、音声データ(audio data)、およびテキストデータ(text data)のうち少なくともいずれか1つを含むことができ、有効性検査部33は、前記映像データ、音声データまたはテキストデータに不良な要素が含まれているか否かを検査することができる。
一実施形態において、有効性検査部33は、前記データに含まれた映像データが、悪口ジェスチャー、侮辱ジェスチャー、人種差別ジェスチャー、性的コンテンツ、裸体露出(nudity)、性器、性行為、非衛生的コンテンツ、排泄物、排泄行為、反社会的コンテンツ、反倫理的コンテンツ、不法行為、犯罪行為、憎悪犯罪(hate crime)、暴力行為、虐待行為、自害行為、武器、麻薬、反社会的シンボル、嫌悪性(hateful)コンテンツ、威嚇性コンテンツ、恐怖症誘発(phobia-inducing)コンテンツ、または血液のうち少なくとも1つ以上に対応する不良な要素を含んでいるか否かを検査することができる。
また、有効性検査部33は、前記データに含まれた音声データまたはテキストデータが、悪口、脅迫性(intimidatory)発言、嫌悪性発言、反社会的発言、反倫理的発言、性的な発言、犯罪性(criminality)発言または侮辱的な発言のうち少なくともいずれか1つに対応する不良な要素を含んでいるか否かを検査することができる。または、前記データに含まれた音声データが、うめき、あえぐような声(gasping sound)、悲鳴または叫び声のうち少なくとも1つ以上の不良な要素を含んでいるか否かを検査することができる。他の例として、前記データに含まれた音声データが、轟音、銃声、嘔吐の音(vomit sound)、打撃の音(hit sound)、むち打ちの音(whip sound)、刃物の音(knife sound)、スイングの音(swing sound)、刺す音(stab sound)、のこぎりの音(saw sound)、きしみ音(grating sound)、キーキーいう音(creaking sound)、特定の臨界値以上のピッチ(pitch)を有する音、または特定の臨界値以上の大きさ(loudness)を有する音のうち少なくとも1つ以上の不良な要素を含んでいるか否かを検査することができる。
一方、他の実施形態において、有効性検査部33は、前記データに不良な要素が含まれているか否かを判断するための機械学習モデルを用いることができる。前記機械学習モデルは、少なくとも2つ以上のレイヤー(layer)を含むニューラルネットワーク(neural network)でありうる。前記機械学習モデルは、入力レイヤー(input layer)および出力レイヤー(output layer)を含むことができる。前記機械学習モデルは、少なくとも1つ以上の隠れレイヤー(hidden layer)をさらに含むことができる。
前記機械学習モデルは、少なくとも1つ以上の映像、音声またはテキスト、および前記少なくとも1つ以上の映像、音声またはテキストが不良な要素を含むか否かに関する情報を用いて学習(train)された分類モデル(classification model)でありうる。前記機械学習モデルは、任意の映像、音声またはテキストに含まれた少なくとも1つ以上の特徴点を入力値として用いることができる。前記機械学習モデルは、前記少なくとも1つ以上の特徴点が不良な要素に対応するか否かを予測(predict)することができる。
前記機械学習モデルは、ディープラーニング(deep learning)アルゴリズムを用いて学習され得る。前記機械学習モデルは、ディープニューラルネットワーク(Deep Neural Network,DNN)、畳み込みニューラルネットワーク(Convolutional Neural Network、CNN)、回帰型ニューラルネットワーク(Recurrent Neural Network,RNN)、R-CNN(Region-based Convolutional Neural Network)、制限ボルツマンマシン(Restricted Boltzmann Machine,RBM)、ディープビリーフネットワーク(Deep Belief Network,DBN)、またはディープキューネットワーク(Deep Q-Networks)のうち少なくとも1つ以上を含むことができる。
前記機械学習モデルは、畳み込みニューラルネットワーク(Convolutional Neural Network、CNN)でありうる。前記機械学習モデルは、AlexNet、ZFNet、GoogLeNet、VGGNet、ResNet、Inception-ResNet、Inception-v2、Inception-v3、またはInception-v4を含むことができる。
このように、端末機30が受信したデータを有効性検査部33を介して機械学習することによって、サーバーでなく、端末機30で自体的にデータの不良な要素の包含有無を判断することができる。データを受信する端末機30で有効性検査を行うので、端末機30別に機械学習結果が異なり得、これは、ユーザーカスタマイズ結果を提供するのに有利になり得る。
一方、本発明の他の実施形態において、有効性検査部33は、データ保存部32に保存された第1データセット(data set)~第3データセットに対する有効性検査を行うことができ、この際、前記第1~第3データセットは、データ保存部32に順次に保存されたデータセットを意味する。
したがって、前記ビデオ通話セッションが樹立された後にデータ保存部32に時間的に最初に保存されたデータセットに対して保存された順序によって有効性検査が行われ、その後に保存されたデータセットに対する有効性検査が行われる。
前記ビデオ通話セッションが樹立されて端末機30と前記他の端末機との間でデータ伝送がリアルタイムで連続的に起こる場合、データ保存部32に順次に保存されたデータセットに対して連続的な有効性検査が行われ得る。有効性検査が完了したデータセットは、データ処理過程を経ることになり、当該データセット以後に保存されたデータセットに対する有効性検査が行われ得る。
一実施形態によれば、有効性検査部33は、デコーディングされたデータに対して有効性を検査することができる。例えば、データ保存部32は、他の端末機から受信したエンコーディングされたデータを順次に保存することができ、保存されたデータがデコーダーを介して順次にデコードされて、有効性検査部33で有効性検査が施され得る。または、データ保存部32は、デコーディングされたデータを順次に保存することができ、有効性検査部33は、データ保存部32に順次に保存されたデコーティングされたデータに対して有効性検査を行うこともできる。
制御部34は、前記有効性検査の結果に対応して前記データを処理する。一実施形態において、制御部34は、有効性検査部33における有効性検査の結果、データに不良な要素が含まれていると判断された場合、端末機30で当該データを再生しないように決定することができる。
例えば、順次にデータ保存部32に保存されたデータセットを受信された順序によって検査し、不良な要素を含んでいるデータは再生しないように決定することができる。映像データに不良な要素が含まれている場合、当該データは、端末機30のディスプレイを介して再生しなくてもよい。音声データに不良な要素が含まれている場合、当該データは、端末機30のスピーカーを介して再生しなくてもよい。前記ディスプレイおよびスピーカーは、端末機30に含まれた入出力インターフェース(不図示)を構成することができる。
n番目に保存されたデータ(第nデータ)に不良な要素が含まれている場合、前記第nデータは再生しなくてもよく、n+1番目に保存されたデータ(第n+1データ)に対する有効性検査が行われ得る。前記第n+1データに不良な要素が含まれていないものと判断される場合、前記第n+1データは、端末機30で正常に再生され、n+2番目に保存されたデータ(第n+2データ)に対する有効性検査が行われ得る。前記第n+2データの再生可否は、有効性検査の結果によって制御部34で決定され得る。
一方、制御部34は、前記不良な要素を含んでいるデータに対応する時間の間に代替データを再生するように決定することができる。例えば、映像データに不良な要素が含まれている場合には、以前のデータセット(data set)に含まれた映像データを再生したり前記不良な要素が含まれている映像データをブラー(blur)またはモザイク(mosaic)処理した映像を代替映像として再生するように決定することができる。音声データに不良な要素が含まれている場合には、以前のデータセットに含まれた音声データを再生したり前記不良な要素が含まれている音声データをミュート(mute)処理することができる。または、テキストデータに不良な要素が含まれている場合には、当該テキストデータを表示しないか、不良な要素が含まれていることを知らせるメッセージを表示するように決定することができる。
以上で説明された実施形態は、コンピュータにより実行されるプログラムモジュールのようなコンピュータにより実行可能な命令語を含む記録媒体の形態でも具現され得る。コンピュータ読み取り可能な媒体は、コンピュータによりアクセスされ得る任意の可用媒体であり得、揮発性および非揮発性媒体、分離型および非分離型媒体を全部含むことができる。
また、コンピュータ読み取り可能な媒体は、コンピュータ保存媒体を含むことができる。コンピュータ保存媒体は、コンピュータ読み取り可能な命令語、データ構造、プログラムモジュールまたはその他データのような情報の保存のための任意の方法または技術で具現された揮発性および非揮発性、分離型および非分離型媒体を全部含むことができる。
以上、添付の図面を参照して本発明の実施形態を説明したが、本発明の属する技術分野における通常の知識を有する者は、本発明がその技術的思想や必須の特徴を変更することなく、他の具体的な形態で実施され得ることを理解することができる。したがって、以上で記述した実施形態は、すべての面において例示的なものであり、限定的でないものと理解しなければならない。
100 サーバー
10 第1端末機
20 第2端末機
30 端末機
31 通信インターフェース
32 データ保存部
33 有効性検査部
34 制御部

Claims (20)

  1. 第1端末機と第2端末機との間にビデオ通話セッションを樹立する段階と;
    前記第1端末機で獲得されたデータを前記第2端末機で受信する段階と;
    前記第2端末機で、前記第1端末機から受信した前記データをあらかじめ設定された大きさのバッファーに順次に保存する段階と;
    前記第2端末機で、前記バッファーに保存された前記データに対する有効性検査を行う段階と;
    前記有効性検査の結果に対応して、前記第2端末機で前記データを処理する段階と;を含む端末機の動作方法。
  2. 前記有効性検査を行う段階は、
    前記バッファーに保存された前記データをデコーディングして有効性検査を行う段階を含む、請求項1に記載の端末機の動作方法。
  3. 前記バッファーに順次に保存する段階は、
    前記第1端末機から受信した前記データをデコーディグして前記バッファーに順次に保存する段階を含む、請求項1に記載の端末機の動作方法。
  4. 前記有効性検査を行う段階は、前記データに不良な要素が含まれているか否かを判断するための機械学習モデルを用いる、請求項1に記載の端末機の動作方法。
  5. 前記データを処理する段階は、前記有効性検査の結果、不良な要素を含んでいるデータを再生しないように決定する、請求項1に記載の端末機の動作方法。
  6. 前記データを処理する段階は、不良な要素を含んでいるデータに対応する時間の間に代替データを再生するように決定する、請求項1に記載の端末機の動作方法。
  7. 前記データは、映像データ、音声データおよびテキストデータのうち少なくともいずれか1つを含む、請求項1に記載の端末機の動作方法。
  8. 前記有効性検査を行う段階は、
    前記バッファーに保存された第1データセットに対する有効性検査を行う段階と;
    前記バッファーに保存された第2データセットに対する有効性検査を行う段階と;
    前記バッファーに保存された第3データセットに対する有効性検査を行う段階と;を含み、
    前記第1~第3データセットは、前記バッファーに順次に保存されたデータセットである、請求項1に記載の端末機の動作方法。
  9. 前記有効性検査を行った結果、前記第1データセットおよび前記第3データセットは、不良な要素を含まず、前記第2データセットは、不良な要素を含むものと判断された場合、
    前記データを処理する段階は、前記第1データセットおよび前記第3データセットを再生するように決定し、前記第2データセットは再生しないように決定する、請求項8に記載の端末機の動作方法。
  10. 前記データを処理する段階は、
    前記第2データセットに含まれた映像データにブラー(blur)またはモザイク処理をし、前記第2データセットに含まれた音声データは、ミュート(mute)処理をし、前記第2データセットに含まれたテキストデータは表示しない、請求項9に記載の端末機の動作方法。
  11. 請求項1~10のいずれか1項に記載の方法を行うためのプログラムが記録されたコンピュータ読み取り可能な記録媒体。
  12. 端末機であって、
    前記端末機と他の端末機との間にビデオ通話セッションを樹立し、互いにデータを送受信するための通信インターフェースと;
    前記ビデオ通話セッションを介して前記他の端末機から受信したデータを受信された時間によって順次に保存するデータ保存部と;
    前記データ保存部に保存された前記データに対する有効性検査を行う有効性検査部と;
    前記有効性検査の結果に対応して前記データを処理する制御部と;を含む端末機。
  13. 前記データをデコーディング(decoding)するデコーダー;をさらに含み、
    前記デコーダーは、前記有効性検査部で有効性検査が完了したデータに対してデコーディングを行う、請求項12に記載の端末機。
  14. 前記有効性検査部は、前記データに不良な要素が含まれているか否かを判断するための機械学習モデルを用いる、請求項12に記載の端末機。
  15. 前記制御部は、前記有効性検査の結果、不良な要素を含んでいるデータを再生しないように決定する、請求項12に記載の端末機。
  16. 前記制御部は、前記不良な要素を含んでいるデータに対応する時間の間に代替データを再生するように決定する、請求項15に記載の端末機。
  17. 前記データは、映像データ、音声データおよびテキストデータのうち少なくともいずれか1つを含む、請求項12に記載の端末機。
  18. 前記有効性検査部は、
    前記データ保存部に保存された第1データセット、第2データセットおよび第3データセットに対する有効性検査を行い、
    前記第1~第3データセットは、前記データ保存部に順次に保存されたデータセットである、請求項12に記載の端末機。
  19. 前記有効性検査を行った結果、前記第1データセットおよび前記第3データセットは、不良な要素を含まず、前記第2データセットは、不良な要素を含むものと判断された場合、
    前記制御部は、前記第1データセットおよび前記第3データセットを再生するように決定し、前記第2データセットは再生しないように決定する、請求項18に記載の端末機。
  20. 前記制御部は、
    前記第2データセットに含まれた映像データにブラー(blur)またはモザイク処理をし、前記第2データセットに含まれた音声データは、ミュート(mute)処理をし、前記第2データセットに含まれたテキストデータは表示しない、請求項19に記載の端末機。
JP2022173296A 2020-01-31 2022-10-28 端末機、その動作方法およびコンピュータ読み取り可能な記録媒体 Pending JP2023015166A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2020-0012270 2020-01-31
KR1020200012270A KR102287704B1 (ko) 2020-01-31 2020-01-31 단말기, 그것의 동작 방법 및 컴퓨터 판독 가능한 기록매체
JP2021013354A JP2021125881A (ja) 2020-01-31 2021-01-29 端末機、その動作方法およびコンピュータ読み取り可能な記録媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2021013354A Division JP2021125881A (ja) 2020-01-31 2021-01-29 端末機、その動作方法およびコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2023015166A true JP2023015166A (ja) 2023-01-31

Family

ID=74418219

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021013354A Pending JP2021125881A (ja) 2020-01-31 2021-01-29 端末機、その動作方法およびコンピュータ読み取り可能な記録媒体
JP2022173296A Pending JP2023015166A (ja) 2020-01-31 2022-10-28 端末機、その動作方法およびコンピュータ読み取り可能な記録媒体

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2021013354A Pending JP2021125881A (ja) 2020-01-31 2021-01-29 端末機、その動作方法およびコンピュータ読み取り可能な記録媒体

Country Status (4)

Country Link
US (2) US11496709B2 (ja)
EP (1) EP3860135A1 (ja)
JP (2) JP2021125881A (ja)
KR (1) KR102287704B1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11553157B2 (en) 2016-10-10 2023-01-10 Hyperconnect Inc. Device and method of displaying images
KR101932844B1 (ko) 2017-04-17 2018-12-27 주식회사 하이퍼커넥트 영상 통화 장치, 영상 통화 방법 및 영상 통화 중개 방법
KR102282963B1 (ko) 2019-05-10 2021-07-29 주식회사 하이퍼커넥트 단말기, 서버 및 그것의 동작 방법
KR102293422B1 (ko) 2020-01-31 2021-08-26 주식회사 하이퍼커넥트 단말기 및 그것의 동작 방법
US11622147B2 (en) * 2021-07-22 2023-04-04 Popio Mobile Video Cloud, Llc Blurring digital video streams upon initiating digital video communications

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0690279A (ja) * 1992-09-08 1994-03-29 Fujitsu General Ltd イタズラ電話撃退装置
US20030028875A1 (en) * 2001-05-02 2003-02-06 Koninklijke Philips Electronics N.V. Television access control system
GB0709574D0 (en) 2007-05-18 2007-06-27 Aurix Ltd Speech Screening
US20090041311A1 (en) * 2007-08-09 2009-02-12 Jon Hundley Facial recognition based content blocking system
JP2008159034A (ja) * 2007-11-07 2008-07-10 Fujitsu Ltd サーバおよび音声信号収集配信方法
US20090288131A1 (en) * 2008-05-13 2009-11-19 Porto Technology, Llc Providing advance content alerts to a mobile device during playback of a media item
US8441356B1 (en) 2009-02-16 2013-05-14 Handhold Adaptive, LLC Methods for remote assistance of disabled persons
JP2011082694A (ja) 2009-10-05 2011-04-21 Sharp Corp 通信会議システム及び通信装置
JP2011205243A (ja) 2010-03-24 2011-10-13 Sharp Corp 情報処理装置、会議システム、情報処理方法及びコンピュータプログラム
US8826322B2 (en) * 2010-05-17 2014-09-02 Amazon Technologies, Inc. Selective content presentation engine
CN103238311A (zh) 2011-01-13 2013-08-07 株式会社尼康 电子设备及电子设备的控制程序
JP5771998B2 (ja) 2011-01-13 2015-09-02 株式会社ニコン 電子機器および電子機器の制御プログラム
US20160023116A1 (en) * 2014-07-03 2016-01-28 Spitfire Technologies, Llc Electronically mediated reaction game
JP6492638B2 (ja) 2014-12-25 2019-04-03 セイコーエプソン株式会社 表示装置、及び、表示装置の制御方法
WO2016189350A1 (en) 2015-05-23 2016-12-01 Yogesh Chunilal Rathod Calling to user(s) for real-time sharing, participation, e-commerce, workflow, communication & collaboration in the event of acceptance of call by caller user(s)
WO2017004241A1 (en) * 2015-07-02 2017-01-05 Krush Technologies, Llc Facial gesture recognition and video analysis tool
KR20170059201A (ko) 2015-11-20 2017-05-30 삼성전자주식회사 전자 장치 및 전자 장치의 컨텐츠 출력 방법
US10104025B2 (en) 2016-05-23 2018-10-16 Oath Inc. Virtual chat rooms
KR20180039402A (ko) 2016-10-10 2018-04-18 주식회사 하이퍼커넥트 영상 표시 장치 및 영상 표시 방법
US10349126B2 (en) 2016-12-19 2019-07-09 Samsung Electronics Co., Ltd. Method and apparatus for filtering video
KR101932844B1 (ko) 2017-04-17 2018-12-27 주식회사 하이퍼커넥트 영상 통화 장치, 영상 통화 방법 및 영상 통화 중개 방법
KR101967658B1 (ko) * 2017-05-27 2019-04-29 주식회사 하이퍼커넥트 영상 통화 장치 및 영상 통화 방법
KR102283972B1 (ko) * 2017-07-14 2021-08-02 주식회사 하이퍼커넥트 통신 장치, 서버 및 동작 방법
KR102056806B1 (ko) * 2017-12-15 2019-12-18 주식회사 하이퍼커넥트 영상 통화 서비스를 제공하는 단말과 서버
WO2019217251A1 (en) 2018-05-05 2019-11-14 Tangosquared Llc Novel decency filtration tools and their use in interfacing systems
JP2020010158A (ja) 2018-07-06 2020-01-16 本田技研工業株式会社 周辺画像の提供方法、及び通信端末用プログラム
US10440324B1 (en) * 2018-09-06 2019-10-08 Amazon Technologies, Inc. Altering undesirable communication data for communication sessions
KR102266888B1 (ko) 2018-12-31 2021-06-21 주식회사 하이퍼커넥트 영상 통화 서비스를 제공하는 단말기 및 서버
US20200335089A1 (en) 2019-04-16 2020-10-22 International Business Machines Corporation Protecting chat with artificial intelligence
US20220229488A1 (en) 2019-06-14 2022-07-21 Semiconductor Energy Laboratory Co., Ltd. Data Processing Device Executing Operation Based on User's Emotion
US11330313B2 (en) 2019-08-02 2022-05-10 Dell Products L.P. Crowd rating media content based on micro-expressions of viewers
KR102311603B1 (ko) 2019-10-01 2021-10-13 주식회사 하이퍼커넥트 단말기 및 그것의 동작 방법

Also Published As

Publication number Publication date
JP2021125881A (ja) 2021-08-30
US20230094732A1 (en) 2023-03-30
EP3860135A1 (en) 2021-08-04
US20210243408A1 (en) 2021-08-05
KR102287704B1 (ko) 2021-08-10
US11496709B2 (en) 2022-11-08

Similar Documents

Publication Publication Date Title
JP2023015166A (ja) 端末機、その動作方法およびコンピュータ読み取り可能な記録媒体
US10965907B2 (en) Video communication device, video communication method, and video communication mediating method
US8489696B2 (en) Instant messaging exchange incorporating user-generated multimedia content
US10542090B2 (en) Concurrently uploading multimedia objects and associating metadata with the multimedia objects
US10049543B1 (en) Covert infrared monitoring and recording of images and video in controlled-environment facilities
CN101667188A (zh) 一种在博客上实现音频视频留言和评论的方法和系统
KR102282963B1 (ko) 단말기, 서버 및 그것의 동작 방법
CN111783756A (zh) 文本识别方法及装置、电子设备和存储介质
US10404941B1 (en) Overt and covert capture of images of controlled-environment facility residents using intelligent controlled-environment facility resident communications and/or media devices
CN110931028B (zh) 一种语音处理方法、装置和电子设备
KR20220024339A (ko) 신고 평가 장치 및 그것의 동작 방법
TW202114407A (zh) 圖像重建方法、圖像重建裝置、電子設備和電腦可讀儲存媒體
US10848530B2 (en) Conference system and method for interworking between audio conference and web conference
US20220246133A1 (en) Systems and methods of handling speech audio stream interruptions
CN105306501A (zh) 用于对多媒体数据进行交互式更新的方法和系统
US10893232B1 (en) Controlled-environment facility video communications monitoring system
US9350943B2 (en) Video picker
CN114449341B (zh) 音频处理方法、装置、可读介质及电子设备
US11810588B2 (en) Audio source separation for audio devices
CN115118919A (zh) 音频处理方法、装置、设备、存储介质和程序产品
CN116229938A (zh) 音频播放方法、音频转换方法及装置
KR20160058464A (ko) 음성기반의 동영상메시지 전송시스템 및 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221028

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231221