JPWO2018020828A1 - 翻訳装置および翻訳システム - Google Patents
翻訳装置および翻訳システム Download PDFInfo
- Publication number
- JPWO2018020828A1 JPWO2018020828A1 JP2018529396A JP2018529396A JPWO2018020828A1 JP WO2018020828 A1 JPWO2018020828 A1 JP WO2018020828A1 JP 2018529396 A JP2018529396 A JP 2018529396A JP 2018529396 A JP2018529396 A JP 2018529396A JP WO2018020828 A1 JPWO2018020828 A1 JP WO2018020828A1
- Authority
- JP
- Japan
- Prior art keywords
- translation
- unit
- input
- voice
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013519 translation Methods 0.000 title claims abstract description 473
- 238000012545 processing Methods 0.000 claims description 39
- 230000001360 synchronised effect Effects 0.000 claims description 15
- 230000008054 signal transmission Effects 0.000 claims description 13
- 238000000034 method Methods 0.000 description 60
- 230000008569 process Effects 0.000 description 54
- 238000010586 diagram Methods 0.000 description 29
- 238000004891 communication Methods 0.000 description 14
- 230000004048 modification Effects 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 230000004044 response Effects 0.000 description 6
- 230000010365 information processing Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0487—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
- G06F3/0488—Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
Abstract
Description
1.構成
本実施形態に係る翻訳システムの構成を、図1,2を参照して説明する。図1は、実施形態1に係る翻訳システムを示すブロック図である。図2は、翻訳システムにおける翻訳装置のハードウェア構成を例示する図である。
以下、本実施形態に係る翻訳システムおよび翻訳装置の動作について説明する。
本実施形態に係る翻訳システム20の動作の概要について、図3A〜図3Dを参照して説明する。図3A〜図3Dは、翻訳システム20における翻訳装置1の動作を説明するための図である。
本実施形態に係る翻訳システム20の動作を、図4,5を参照して説明する。図4は、本実施形態に係る翻訳システム20の動作を示すシーケンス図である。図5は、本実施形態に係る翻訳装置1の動作を説明するためのタイミングチャートである。
図4のステップS1における翻訳装置1の入力処理について、図5〜7を参照して説明する。図6は、翻訳装置1の入力処理(図4のS1)を示すフローチャートである。図7は、翻訳装置1における履歴データベースD1を説明するための図である。
図4のステップS3における翻訳装置1の再生処理について、図8を参照して説明する。図8は、翻訳装置1の再生処理(図4のS3)を示すフローチャートである。
以上のように、本実施形態において、翻訳装置1は、操作入力部11と、音声入力部12と、翻訳情報取得部16と、情報出力部の一例である音声出力部17と、実行部の一例である表示部13と、制御部14とを備える。操作入力部11には、ユーザ操作が入力される。音声入力部12には、音声が入力される。翻訳情報取得部16は、音声入力部12に入力された音声の翻訳結果を取得する。音声出力部17は、翻訳結果を出力する。表示部13は、ユーザ操作に応じた出力動作として、表示動作を実行する。制御部14は、表示部13による動作を制御する。制御部14は、音声出力部17による翻訳結果の出力に同期して、翻訳結果に対応する音声の入力中に操作入力部11に入力されたユーザ操作の操作内容に基づく動作を表示部13に実行させる。
以下、図11を用いて、実施形態2を説明する。実施形態1では、実行部として表示部13を備える翻訳装置1を説明した。実施形態2では、実行部として外部機器を制御する制御信号送信部を備える翻訳装置1A及び翻訳システム20Aを説明する。
以下、図12を用いて、実施形態3を説明する。実施形態3では、実施形態2における翻訳システム20Aにおいて、機器4の動作状態に応じて翻訳動作を制限する機能を有する翻訳装置1Bを説明する。
以上のように、本出願において開示する技術の例示として、実施形態1〜3を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置換、付加、省略などを行った実施の形態にも適用可能である。また、上記各実施形態で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。そこで、以下、他の実施形態を例示する。
11 操作入力部
12 音声入力部
13 表示部
14 制御部
15 記憶部
16 翻訳情報取得部
17 音声出力部
18 制御信号送信部
19 完了信号受信部
2 翻訳サーバ
20,20A,20B 翻訳システム
4 機器
Claims (12)
- ユーザ操作が入力される操作入力部と、
音声が入力される音声入力部と、
前記音声入力部に入力された音声の翻訳結果を取得する翻訳情報取得部と、
前記翻訳結果を出力する情報出力部と、
実行部と、
前記情報出力部による前記翻訳結果の出力に同期して、前記翻訳結果に対応する音声の入力中に前記操作入力部に入力されたユーザ操作の操作内容に基づく動作を前記実行部に実行させる制御部とを備える
翻訳装置。 - 前記情報出力部は、前記翻訳結果を音声として出力する
請求項1に記載の翻訳装置。 - 前記情報出力部は、前記翻訳結果をテキスト情報として出力する
請求項1に記載の翻訳装置。 - 前記制御部は、前記翻訳結果が出力される期間と前記動作が実行される期間とが同期するように、前記動作を設定する
請求項1〜3のいずれか1項に記載の翻訳装置。 - 前記翻訳結果の出力に同期した前記動作は、前記ユーザ操作が為されることを表現する第1動作を含む
請求項1〜4のいずれか1項に記載の翻訳装置。 - 前記制御部は、ユーザ操作の前記操作入力部への入力に同期して、前記ユーザ操作の操作内容に基づく第2動作を前記実行部に実行させる
請求項1〜5のいずれか1項に記載の翻訳装置。 - 前記翻訳結果の出力に同期した前記動作は、前記ユーザ操作の前記操作入力部への入力に同期した前記第2動作を再現する動作を含む
請求項6に記載の翻訳装置。 - 前記音声入力部に入力された音声を示す音声情報と、前記音声の入力中に前記操作入力部に入力されたユーザ操作とを関連付けて記録する記憶部をさらに備え、
前記制御部は、前記記憶部に記録された前記音声情報および前記ユーザ操作を参照し、前記音声情報が示す音声の前記翻訳結果の出力に同期して、前記ユーザ操作の操作内容に基づく動作を前記実行部に実行させる
請求項1〜7のいずれか1項に記載の翻訳装置。 - 前記実行部は、情報を表示する表示部を含み、
前記制御部は、前記翻訳結果の出力に同期して、前記ユーザ操作の操作内容に応じた情報を前記表示部に表示させる
請求項1〜8のいずれか1項に記載の翻訳装置。 - 前記実行部は、外部機器に信号を送信する信号送信部を含み、
前記制御部は、前記翻訳結果の出力に同期して、前記外部機器へ、前記外部機器の動作を制御する制御信号を、前記信号送信部に送信させる
請求項1〜9のいずれか1項に記載の翻訳装置。 - 前記外部機器から信号を受信する信号受信部をさらに備え、
前記制御部は、前記制御信号を送信してから、前記信号受信部を介して前記外部機器から前記制御信号が制御する前記動作の完了を示す信号を受信するまで、前記音声入力部における音声の入力を制限する
請求項10に記載の翻訳装置。 - 請求項1〜11のいずれか1項に記載の翻訳装置と、
前記音声入力部に入力された音声を示す音声情報を前記翻訳装置から受信し、前記音声情報の翻訳処理を行う翻訳サーバと
を備える翻訳システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016148859 | 2016-07-28 | ||
JP2016148859 | 2016-07-28 | ||
PCT/JP2017/020457 WO2018020828A1 (ja) | 2016-07-28 | 2017-06-01 | 翻訳装置および翻訳システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018020828A1 true JPWO2018020828A1 (ja) | 2018-11-22 |
JP6624476B2 JP6624476B2 (ja) | 2019-12-25 |
Family
ID=61015923
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018529396A Active JP6624476B2 (ja) | 2016-07-28 | 2017-06-01 | 翻訳装置および翻訳システム |
Country Status (6)
Country | Link |
---|---|
US (1) | US20190026266A1 (ja) |
EP (1) | EP3493048A4 (ja) |
JP (1) | JP6624476B2 (ja) |
KR (1) | KR20190034494A (ja) |
CN (1) | CN109074239A (ja) |
WO (1) | WO2018020828A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10089305B1 (en) * | 2017-07-12 | 2018-10-02 | Global Tel*Link Corporation | Bidirectional call translation in controlled environment |
US10558763B2 (en) * | 2017-08-03 | 2020-02-11 | Electronics And Telecommunications Research Institute | Automatic translation system, device, and method |
JP2020009100A (ja) * | 2018-07-06 | 2020-01-16 | 富士ゼロックス株式会社 | 情報処理装置、端末装置、情報処理システム、及びプログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2664679B2 (ja) | 1987-05-30 | 1997-10-15 | 株式会社東芝 | 通信システム |
JPH09153069A (ja) * | 1995-09-29 | 1997-06-10 | Toshiba Corp | 情報収集装置、情報収集再生装置およびパトロール端末装置 |
JP2993872B2 (ja) * | 1995-10-16 | 1999-12-27 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | マルチモーダル情報統合解析装置 |
JP4416643B2 (ja) * | 2004-06-29 | 2010-02-17 | キヤノン株式会社 | マルチモーダル入力方法 |
US7492367B2 (en) * | 2005-03-10 | 2009-02-17 | Motus Corporation | Apparatus, system and method for interpreting and reproducing physical motion |
US7643985B2 (en) * | 2005-06-27 | 2010-01-05 | Microsoft Corporation | Context-sensitive communication and translation methods for enhanced interactions and understanding among speakers of different languages |
US7991607B2 (en) * | 2005-06-27 | 2011-08-02 | Microsoft Corporation | Translation and capture architecture for output of conversational utterances |
JP4398966B2 (ja) * | 2006-09-26 | 2010-01-13 | 株式会社東芝 | 機械翻訳を行う装置、システム、方法およびプログラム |
JP5121252B2 (ja) * | 2007-02-26 | 2013-01-16 | 株式会社東芝 | 原言語による音声を目的言語に翻訳する装置、方法およびプログラム |
US8515749B2 (en) * | 2009-05-20 | 2013-08-20 | Raytheon Bbn Technologies Corp. | Speech-to-speech translation |
CN101620595A (zh) * | 2009-08-11 | 2010-01-06 | 上海合合信息科技发展有限公司 | 电子设备的文本翻译方法及系统 |
US20110112821A1 (en) * | 2009-11-11 | 2011-05-12 | Andrea Basso | Method and apparatus for multimodal content translation |
CN103534751B (zh) * | 2013-05-27 | 2016-05-18 | 华为技术有限公司 | 语音同步方法及装置 |
JP2015060332A (ja) * | 2013-09-18 | 2015-03-30 | 株式会社東芝 | 音声翻訳装置、音声翻訳方法およびプログラム |
WO2016134331A1 (en) * | 2015-02-19 | 2016-08-25 | Tertl Studos Llc | Systems and methods for variably paced real-time translation between the written and spoken forms of a word |
JP2017084090A (ja) * | 2015-10-28 | 2017-05-18 | シャープ株式会社 | 接客システム |
-
2017
- 2017-06-01 EP EP17833838.0A patent/EP3493048A4/en not_active Withdrawn
- 2017-06-01 JP JP2018529396A patent/JP6624476B2/ja active Active
- 2017-06-01 CN CN201780023818.7A patent/CN109074239A/zh active Pending
- 2017-06-01 WO PCT/JP2017/020457 patent/WO2018020828A1/ja unknown
- 2017-06-01 KR KR1020187031406A patent/KR20190034494A/ko unknown
-
2018
- 2018-09-27 US US16/144,380 patent/US20190026266A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP6624476B2 (ja) | 2019-12-25 |
KR20190034494A (ko) | 2019-04-02 |
WO2018020828A1 (ja) | 2018-02-01 |
EP3493048A1 (en) | 2019-06-05 |
EP3493048A4 (en) | 2019-07-03 |
US20190026266A1 (en) | 2019-01-24 |
CN109074239A (zh) | 2018-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11158102B2 (en) | Method and apparatus for processing information | |
US9280539B2 (en) | System and method for translating speech, and non-transitory computer readable medium thereof | |
JP2021009701A (ja) | インターフェイススマートインタラクティブ制御方法、装置、システム及びプログラム | |
KR102193029B1 (ko) | 디스플레이 장치 및 그의 화상 통화 수행 방법 | |
WO2016119370A1 (zh) | 一种实现录音的方法、装置和移动终端 | |
JP7283384B2 (ja) | 情報処理端末、情報処理装置、および情報処理方法 | |
KR20140146965A (ko) | 디스플레이 장치, 서버를 포함하는 변환 시스템 및 디스플레이 장치의 제어 방법 | |
JP7467635B2 (ja) | 使用者端末、ビデオ通話装置、ビデオ通話システム、及びその制御方法 | |
WO2018186416A1 (ja) | 翻訳処理方法、翻訳処理プログラム、及び、記録媒体 | |
JP6624476B2 (ja) | 翻訳装置および翻訳システム | |
KR20220109373A (ko) | 발화 영상 제공 방법 | |
JP2015106203A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP2018005011A (ja) | プレゼンテーション支援装置、プレゼンテーション支援システム、プレゼンテーション支援方法及びプレゼンテーション支援プログラム | |
JP6832503B2 (ja) | 情報提示方法、情報提示プログラム及び情報提示システム | |
US9870197B2 (en) | Input information support apparatus, method for supporting input information, and computer-readable recording medium | |
WO2019150708A1 (ja) | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム | |
JP2011086123A (ja) | 情報処理装置、会議システム、情報処理方法及びコンピュータプログラム | |
JP7519441B2 (ja) | 使用者端末、及びその制御方法 | |
Panek et al. | Challenges in adopting speech control for assistive robots | |
JP2020119043A (ja) | 音声翻訳システムおよび音声翻訳方法 | |
KR102546532B1 (ko) | 발화 영상 제공 방법 및 이를 수행하기 위한 컴퓨팅 장치 | |
KR102509106B1 (ko) | 발화 영상 제공 방법 및 이를 수행하기 위한 컴퓨팅 장치 | |
JP2015038525A (ja) | 音声認識装置及び音声認識方法 | |
US20240098183A1 (en) | Marking method on image combined with sound signal, terminal apparatus, and server | |
KR20220053863A (ko) | 사용자 데이터텍스트에 기반하여 영상을 생성하는 방법 및 그를 위한 전자 장치 및 텍스트에 기반하여 영상을 생성하는 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180510 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190806 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191002 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191113 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6624476 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |