JP2023506468A - 使用者端末、放送装置、それを含む放送システム、及びその制御方法 - Google Patents
使用者端末、放送装置、それを含む放送システム、及びその制御方法 Download PDFInfo
- Publication number
- JP2023506468A JP2023506468A JP2022535547A JP2022535547A JP2023506468A JP 2023506468 A JP2023506468 A JP 2023506468A JP 2022535547 A JP2022535547 A JP 2022535547A JP 2022535547 A JP2022535547 A JP 2022535547A JP 2023506468 A JP2023506468 A JP 2023506468A
- Authority
- JP
- Japan
- Prior art keywords
- information
- video
- translation
- video call
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000013519 translation Methods 0.000 claims abstract description 94
- 238000004891 communication Methods 0.000 claims abstract description 68
- 230000008569 process Effects 0.000 claims description 23
- 238000000605 extraction Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 13
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 abstract description 13
- 239000000284 extract Substances 0.000 description 10
- 230000006870 function Effects 0.000 description 3
- 230000001771 impaired effect Effects 0.000 description 3
- 208000032041 Hearing impaired Diseases 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 1
- 206010048865 Hypoacusis Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/4788—Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/28—Recognition of hand or arm movements, e.g. recognition of deaf sign language
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B21/00—Teaching, or communicating with, the blind, deaf or mute
- G09B21/009—Teaching or communicating with deaf persons
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/1813—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
- H04L12/1827—Network arrangements for conference optimisation or adaptation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/1813—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
- H04L12/1831—Tracking arrangements for later retrieval, e.g. recording contents, participants activities or behavior, network status
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/04—Real-time or near real-time messaging, e.g. instant messaging [IM]
- H04L51/046—Interoperability with other network applications or services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/07—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
- H04L51/10—Multimedia information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/431—Generation of visual interfaces for content selection or interaction; Content or additional data rendering
- H04N21/4312—Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/005—Language recognition
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- Psychiatry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Social Psychology (AREA)
- Educational Technology (AREA)
- Educational Administration (AREA)
- Business, Economics & Management (AREA)
- Telephonic Communication Services (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Machine Translation (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
抽出部320は、原語情報を特定の人物情報にマッピングして保存してもよい。
図2を参照すると、放送装置300には、放送装置300内の構成要素の全般的な動作を制御する制御部340が設けられてもよい。
上述のように、通訳翻訳動画には、原語情報または翻訳情報のみがマッピングされていてもよく、原語情報及び翻訳情報が一緒にマッピングされていてもよい。
使用者端末100には、通信網を介して、外部機器と各種データをやりとりする端末通信部130が設けられてもよい。
図2を参照すると、使用者端末100には、使用者端末100の全般的な動作を制御する端末制御部140が設けられてもよい。
図7は、一実施形態による放送装置の動作フローチャートを概略的に示す図である。
100 使用者端末
200 視聴者端末
300 放送装置
Claims (10)
- 通信網を介してチャットルームに接続した使用者端末間のビデオ通話を支援する通信部と、
前記通信部から受信されるビデオ通話関連動画ファイルを用いて映像ファイルと音声ファイルを生成し、前記映像ファイルと音声ファイルのうち少なくとも一つを用いて、通話者のそれぞれに関する原語情報を抽出する抽出部と、
前記原語情報を、選択された国の言語により翻訳した翻訳情報を生成する翻訳部と、
前記ビデオ通話関連動画ファイルに、前記原語情報及び翻訳情報のうち少なくとも一つがマッピングされた通訳翻訳動画が、前記チャットルームに接続した使用者端末及び視聴者端末に送信されるように制御する制御部と、を含む
ことを特徴とする放送装置。 - 前記原語情報は、音声原語情報及びテキスト原語情報のうち少なくとも一つを含み、
前記翻訳情報は、音声翻訳情報及びテキスト翻訳情報のうち少なくとも一つを含む
請求項1に記載の放送装置。 - 前記抽出部は、
前記音声ファイルに対して周波数帯域分析プロセスを適用して、通話者のそれぞれに関する音声原語情報を抽出し、
前記抽出した音声原語情報に対して音声認識プロセスを適用してテキスト原語情報を生成する
請求項1に記載の放送装置。 - 前記抽出部は、
前記映像ファイルに対して映像処理プロセスを適用して手話パターンを検出し、前記検出した手話パターンに基づき、テキスト原語情報を抽出する
請求項1に記載の放送装置。 - 通信網を介してビデオ通話サービスを支援する端末通信部と、
ビデオ通話関連動画ファイルに原語情報及び翻訳情報のうち少なくとも一つがマッピングされた通訳翻訳動画を提供し、少なくとも一つのビデオ通話関連設定命令と、少なくとも一つの翻訳関連設定命令との入力が可能なアイコンを提供するように構成されたユーザーインターフェースがディスプレイ上に表示されるように制御する端末制御部と、を含む
ことを特徴とする使用者端末。 - 前記少なくとも一つのビデオ通話関連設定命令は、
ビデオ通話者の発言権を設定可能な発言権設定命令、ビデオ通話者数設定命令、視聴者数設定命令、及びテキスト送信命令のうち少なくとも一つを含む
請求項5に記載の使用者端末。 - 前記端末制御部は、
前記発言権設定命令の入力可否により、前記通訳翻訳動画の提供方法が変更されるか、または発言権を持った通話者に関する情報が含まれたポップアップメッセージを提供するように構成されたユーザーインターフェースがディスプレイ上に表示されるように制御する
請求項6に記載の使用者端末。 - ビデオ通話関連動画ファイルを受信するステップと、
前記ビデオ通話関連動画ファイルから生成した映像ファイルと音声ファイルのうち少なくとも一つを用いて、通話者のそれぞれに関する原語情報を抽出するステップと、
前記原語情報を、選択された国の言語により翻訳した翻訳情報を生成するステップと、
前記ビデオ通話関連動画ファイルに、前記原語情報及び翻訳情報のうち少なくとも一つがマッピングされた通訳翻訳動画を、チャットウィンドウに接続中の端末に送信されるように制御するステップと、を含む
ことを特徴とする放送装置の制御方法。 - 前記抽出するステップは、
前記音声ファイルに対して周波数帯域分析プロセスを適用して、通話者のそれぞれに関する音声原語情報を抽出するステップと、
前記抽出した音声原語情報に対して音声認識プロセスを適用してテキスト原語情報を生成するステップと、を含む
請求項8に記載の放送装置の制御方法。 - 前記抽出するステップは、
前記映像ファイルに対して映像処理プロセスを適用して手話パターンを検出し、前記検出した手話パターンに基づき、テキスト原語情報を抽出するステップを含む
請求項8に記載の放送装置の制御方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2019-0162503 | 2019-12-09 | ||
KR1020190162503A KR102178174B1 (ko) | 2019-12-09 | 2019-12-09 | 사용자 단말, 방송 장치, 이를 포함하는 방송 시스템 및 그 제어방법 |
PCT/KR2020/017734 WO2021118180A1 (ko) | 2019-12-09 | 2020-12-07 | 사용자 단말, 방송 장치, 이를 포함하는 방송 시스템 및 그 제어방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023506468A true JP2023506468A (ja) | 2023-02-16 |
JP7467636B2 JP7467636B2 (ja) | 2024-04-15 |
Family
ID=73398663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022535547A Active JP7467636B2 (ja) | 2019-12-09 | 2020-12-07 | 使用者端末、放送装置、それを含む放送システム、及びその制御方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230274101A1 (ja) |
JP (1) | JP7467636B2 (ja) |
KR (1) | KR102178174B1 (ja) |
CN (1) | CN115066907A (ja) |
WO (1) | WO2021118180A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102178174B1 (ko) * | 2019-12-09 | 2020-11-12 | 김경철 | 사용자 단말, 방송 장치, 이를 포함하는 방송 시스템 및 그 제어방법 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008160232A (ja) * | 2006-12-21 | 2008-07-10 | Funai Electric Co Ltd | 映像音声再生装置 |
US20090303199A1 (en) * | 2008-05-26 | 2009-12-10 | Lg Electronics, Inc. | Mobile terminal using proximity sensor and method of controlling the mobile terminal |
KR20100026701A (ko) * | 2008-09-01 | 2010-03-10 | 한국산업기술대학교산학협력단 | 수화 번역기 및 그 방법 |
JP2011209731A (ja) * | 2010-03-30 | 2011-10-20 | Polycom Inc | ビデオ会議に翻訳を追加するための方法及びシステム |
JP2016091057A (ja) * | 2014-10-29 | 2016-05-23 | 京セラ株式会社 | 電子機器 |
JP2022535531A (ja) * | 2019-06-14 | 2022-08-09 | ザ プロクター アンド ギャンブル カンパニー | 揮発性組成物カートリッジの交換の検出 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4100243B2 (ja) * | 2003-05-06 | 2008-06-11 | 日本電気株式会社 | 映像情報を用いた音声認識装置及び方法 |
CN101452705A (zh) * | 2007-12-07 | 2009-06-10 | 希姆通信息技术(上海)有限公司 | 语音文字转换、手语文字转换的方法和装置 |
KR101442112B1 (ko) * | 2008-05-26 | 2014-09-18 | 엘지전자 주식회사 | 근접센서를 이용하여 동작 제어가 가능한 휴대 단말기 및그 제어방법 |
KR101015234B1 (ko) * | 2008-10-23 | 2011-02-18 | 엔에이치엔(주) | 웹 상의 멀티미디어 컨텐츠에 포함되는 특정 언어를 다른 언어로 번역하여 제공하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 |
CN102984496B (zh) * | 2012-12-21 | 2015-08-19 | 华为技术有限公司 | 视频会议中的视音频信息的处理方法、装置及系统 |
KR102108500B1 (ko) * | 2013-02-22 | 2020-05-08 | 삼성전자 주식회사 | 번역 기반 통신 서비스 지원 방법 및 시스템과, 이를 지원하는 단말기 |
KR20150057591A (ko) * | 2013-11-20 | 2015-05-28 | 주식회사 디오텍 | 동영상파일에 대한 자막데이터 생성방법 및 장치 |
US9614969B2 (en) * | 2014-05-27 | 2017-04-04 | Microsoft Technology Licensing, Llc | In-call translation |
CN109286725B (zh) * | 2018-10-15 | 2021-10-19 | 华为技术有限公司 | 翻译方法及终端 |
CN109960813A (zh) * | 2019-03-18 | 2019-07-02 | 维沃移动通信有限公司 | 一种翻译方法、移动终端及计算机可读存储介质 |
KR102178174B1 (ko) * | 2019-12-09 | 2020-11-12 | 김경철 | 사용자 단말, 방송 장치, 이를 포함하는 방송 시스템 및 그 제어방법 |
-
2019
- 2019-12-09 KR KR1020190162503A patent/KR102178174B1/ko active IP Right Grant
-
2020
- 2020-12-07 US US17/784,022 patent/US20230274101A1/en active Pending
- 2020-12-07 WO PCT/KR2020/017734 patent/WO2021118180A1/ko active Application Filing
- 2020-12-07 CN CN202080096255.6A patent/CN115066907A/zh active Pending
- 2020-12-07 JP JP2022535547A patent/JP7467636B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008160232A (ja) * | 2006-12-21 | 2008-07-10 | Funai Electric Co Ltd | 映像音声再生装置 |
US20090303199A1 (en) * | 2008-05-26 | 2009-12-10 | Lg Electronics, Inc. | Mobile terminal using proximity sensor and method of controlling the mobile terminal |
KR20100026701A (ko) * | 2008-09-01 | 2010-03-10 | 한국산업기술대학교산학협력단 | 수화 번역기 및 그 방법 |
JP2011209731A (ja) * | 2010-03-30 | 2011-10-20 | Polycom Inc | ビデオ会議に翻訳を追加するための方法及びシステム |
JP2016091057A (ja) * | 2014-10-29 | 2016-05-23 | 京セラ株式会社 | 電子機器 |
JP2022535531A (ja) * | 2019-06-14 | 2022-08-09 | ザ プロクター アンド ギャンブル カンパニー | 揮発性組成物カートリッジの交換の検出 |
Also Published As
Publication number | Publication date |
---|---|
WO2021118180A1 (ko) | 2021-06-17 |
CN115066907A (zh) | 2022-09-16 |
KR102178174B1 (ko) | 2020-11-12 |
JP7467636B2 (ja) | 2024-04-15 |
US20230274101A1 (en) | 2023-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7467635B2 (ja) | 使用者端末、ビデオ通話装置、ビデオ通話システム、及びその制御方法 | |
US11114091B2 (en) | Method and system for processing audio communications over a network | |
CN106462573B (zh) | 通话中翻译 | |
US11056116B2 (en) | Low latency nearby group translation | |
US11715386B1 (en) | Queuing for a video conference session | |
JP7467636B2 (ja) | 使用者端末、放送装置、それを含む放送システム、及びその制御方法 | |
KR20130015472A (ko) | 디스플레이장치, 그 제어방법 및 서버 | |
US9374465B1 (en) | Multi-channel and multi-modal language interpretation system utilizing a gated or non-gated configuration | |
JP2023506469A (ja) | 使用者端末、及びその制御方法 | |
KR102170902B1 (ko) | 실시간 다자 통역 무선 이어셋 및 이를 이용한 송수신 방법 | |
US20240154833A1 (en) | Meeting inputs | |
JP2023046590A (ja) | 表示方法、表示装置、及び、表示システム | |
KR102117993B1 (ko) | 중개 통화 서비스 제공 방법 및 장치 | |
JP2005151002A (ja) | 遠隔会議システム | |
KR101778548B1 (ko) | 청각장애인을 위한 음성인식 및 보청지원이 가능한 회의 관리 방법 및 시스템 | |
JP2020119043A (ja) | 音声翻訳システムおよび音声翻訳方法 | |
US10613827B2 (en) | Configuration for simulating a video remote interpretation session | |
EP3975553A1 (en) | System and method for visual and auditory communication using cloud communication | |
KR20220038969A (ko) | 수어 통역시스템 및 서비스 방법 | |
JP2024044920A (ja) | 情報処理装置、情報処理システム、プログラム、及び情報処理方法 | |
US20200193980A1 (en) | Configuration for remote multi-channel language interpretation performed via imagery and corresponding audio at a display-based device | |
JP2024082435A (ja) | 会議制御システム、会議制御方法及びコンピュータープログラム | |
Leib | Five Technologies Deaf and Hard of Hearing Persons Use to Communicate |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220624 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230613 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230913 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240403 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7467636 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |