JP5967569B2 - 音声処理システム - Google Patents
音声処理システム Download PDFInfo
- Publication number
- JP5967569B2 JP5967569B2 JP2012153941A JP2012153941A JP5967569B2 JP 5967569 B2 JP5967569 B2 JP 5967569B2 JP 2012153941 A JP2012153941 A JP 2012153941A JP 2012153941 A JP2012153941 A JP 2012153941A JP 5967569 B2 JP5967569 B2 JP 5967569B2
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- speech
- translation
- text
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims description 92
- 238000013519 translation Methods 0.000 claims description 214
- 238000011156 evaluation Methods 0.000 claims description 5
- 230000005236 sound signal Effects 0.000 claims description 3
- 239000013598 vector Substances 0.000 description 35
- 238000000034 method Methods 0.000 description 28
- 230000008569 process Effects 0.000 description 26
- 230000015572 biosynthetic process Effects 0.000 description 18
- 238000003786 synthesis reaction Methods 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000001133 acceleration Effects 0.000 description 5
- 230000004931 aggregating effect Effects 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000003825 pressing Methods 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005389 magnetism Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0482—Interaction with lists of selectable items, e.g. menus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
Description
〈構成〉
─全体構成─
図1を参照して、この発明に係る音声翻訳システム100は、インターネット102に接続された、音声翻訳サービスを行なうサーバ106と、インターネット102に接続可能で、音声翻訳サービスを利用するためのアプリケーションがインストールされた携帯型端末104とを含む。
図2を参照して、携帯型端末104の音声翻訳サービスを利用するためのアプリケーション画面130は、大きく分けて6つの領域に分割されている。すなわち、音声翻訳サービスの対象となっている言語の対(ソース言語とターゲット言語)を表示するための言語表示領域140と、ソース言語の音声で入力された文の音声認識結果、又はテキスト入力結果を表示するための入力テキスト表示領域150と、音声認識された文を自動翻訳した結果のテキストが表示される翻訳結果表示領域170、翻訳結果を元の言語に逆翻訳した文を表示する逆翻訳領域160、次の発話候補としてリコメンドされる発話候補のリスト(発話候補リコメンドリスト)が表示される発話候補リコメンド領域190、及び音声翻訳システムの利用状況を表示するステータス領域180である。
図3を参照して、音声翻訳システム100を用いた音声翻訳の際の、携帯型端末104とサーバ106との間の典型的な通信シーケンスを説明する。最初に、携帯型端末104において音声入力200を行ない、その音声と、音声翻訳の言語の組合せ等の情報と、センサの集合から得られた環境情報とを含む音声認識リクエスト202を生成する。音声認識リクエスト202は携帯型端末104からサーバ106に送信される。サーバ106は、この音声認識リクエストを受信すると音声認識処理220を行ない、音声認識結果のテキスト(本実施の形態では音声認識処理220は統計的音声認識処理を行なうものであり、認識に伴うスコアが最も高い仮説を1つだけ)を出力する。このテキストは自動翻訳処理222に入力として与えられる。自動翻訳処理222は、入力されたソース言語の文をターゲット言語に自動翻訳し、ターゲット言語の文を生成する。このターゲット言語の文は音声合成処理224に与えられる。音声合成処理224は与えられたターゲット言語の文から音声を合成する。
図4を参照して、携帯型端末104は、所定のプログラムを実行して携帯型端末104の各部を制御することにより、種々の機能を実現するためのプロセッサ250と、プロセッサ250が実行するプログラム、及びそのプログラムの実行に必要なデータを記憶し、プロセッサ250の作業領域としても機能するメモリ252と、プロセッサ250と後述する各種センサ等との間のインターフェイス254とを含む。以下に説明する構成要素は、いずれも、インターフェイス254を介してプロセッサ250と通信可能である。
図6を参照して、サーバ106は以下のような機能的な構成を持つ。なお、サーバ106はハードウェアとしては大容量の外部記憶装置を持つコンピュータと、そのコンピュータ上で実行される音声翻訳サーバプログラムとにより実現される。
─概要─
この音声翻訳システム100は以下のように動作する。サーバ106は、動作フェーズとして2つを持つ。第1はモデル生成部108による発話連接モデル226及び発話候補記憶部228の学習であり、第2は、学習が終了した発話連接モデル226及び発話候補記憶部228を用いた音声翻訳サービスの実行である。以下、最初に学習フェーズにおけるサーバ106の動作を、次に音声翻訳サービスのフェーズにおける携帯型端末104とサーバ106の動作とについて説明する。
発話連接モデル226及び発話候補記憶部228に記憶される各発話の翻訳及び音声認識スコアの学習を予め行なっておく必要がある。そのためにまず、処理の対象となる全ての言語について、別々に文を集めコーパス510を言語ごとに作成する。コーパス510内の各文については、予め形態素解析等が行なわれ、DAタグの付与等が行なわれていれば好ましいが、必要に応じ、入力部512を用いてそうした処理を行なう。
携帯型端末104等には、図2に示すような音声翻訳アプリケーションを予め配布しておくことが必要である。本実施の形態では、携帯型端末104が接続可能なサーバ106は、音声翻訳アプリケーションにより固定されているものとする。もちろん、サーバ106が複数個あるなら、ユーザがそれらの中から所望のものを選択するようにしてもよい。
104 携帯型端末
106 サーバ
108 モデル生成部
130 アプリケーション画面
140 言語表示領域
150 入力テキスト表示領域
160 逆翻訳領域
180 ステータス領域
190 発話候補リコメンド領域
192 発話候補リコメンドリスト
220 音声認識処理
222 自動翻訳処理
224 音声合成処理
226 発話連接モデル
228 発話候補記憶部
230 発話候補リスト作成処理
232 送信処理部
418 音声認識エンジン
422 自動翻訳エンジン
424 音声合成処理部
426 発話確率算出部
428 発話候補リコメンドリスト作成部
Claims (6)
- 発話を表す音声信号と、当該発話がなされた環境を表す所定の環境情報とを含む発話情報の入力を受けるための発話入力手段と、
前記発話入力手段が受けた発話情報内の音声信号に対して音声認識を行ない、認識結果をテキストとして出力するための音声認識手段と、
前記音声認識手段が出力したテキストに対して所定のデータ処理を実行するデータ処理手段と、
発話のテキストと、前記所定の環境情報とを受けると、所定の発話集合の中の発話について、前記テキストにより表される発話の後に連接して発話される確率が算出可能なように統計的に学習済の発話連接モデルを記憶するための発話連接モデル記憶手段と、
前記所定の発話集合内の発話と、当該発話集合内の発話の各々について、前記データ処理手段で処理したときの、データ処理の信頼度を記憶するための発話記憶手段と、
前記発話入力手段が受けた発話情報に対する前記音声認識手段の認識結果と、当該発話情報に含まれる環境情報とを用い、前記発話連接モデル記憶手段に記憶された前記発話連接モデルを用いて前記所定の集合内の各発話に対して算出される確率と、前記発話記憶手段に記憶された、前記所定の集合内の各発話に対する前記データ処理の信頼度とを所定の形式で組み合わせた評価スコアに基づいて、前記音声認識手段が認識した発話を行なったユーザにリコメンドする発話の候補を前記複数の発話の集合内でスコア付けし、当該スコアに基づいて発話候補をユーザにリコメンドするための発話候補リコメンド手段とを含む、音声処理システム。 - 請求項1に記載の音声処理システムであって、前記データ処理手段は、ある発話を受けて前記音声認識手段の出力する認識結果を受け、当該認識結果を前記ある発話の言語と異なる他の言語に自動翻訳しテキストとして出力するための自動翻訳手段を含み、前記信頼度は、当該自動翻訳手段による翻訳結果が前記ある発話に対する前記他の言語の翻訳である尤度である、音声処理システム。
- 請求項2に記載の音声処理システムであって、前記データ処理手段はさらに、前記自動翻訳手段が出力する前記他の言語のテキストに基づき、前記他の言語の音声信号を合成するための音声合成手段を含む、音声処理システム。
- 請求項1から請求項3のいずれかに記載の音声処理システムであって、前記発話候補リコメンド手段は、前記発話連接モデルを用いて前記所定の集合内の各発話に対して算出される確率と、前記発話記憶手段に記憶された、前記所定の集合内の各発話に対する信頼度との線形和による評価に基づいて、前記音声認識手段が音声認識した発話に後続する発話の候補を前記複数の発話の集合内で推定するための手段を含み、
前記線形和における前記信頼度と前記確率との係数はいずれも正である、音声処理システム。 - 請求項1から請求項4のいずれかに記載の音声処理システムであって、さらに、前記発話候補リコメンド手段によりリコメンドされた発話候補をユーザに対して提示するための発話候補提示手段を含む、音声処理システム。
- 請求項1から請求項5のいずれかに記載の音声処理システムであって、発話を表すテキストと、前記所定の環境情報とを含む発話テキスト情報の入力を受け、当該発話テキスト情報内のテキストを前記音声認識手段の出力に代えて前記発話候補リコメンド手段及び前記データ処理手段に与えるための発話テキスト情報入力手段をさらに含む、音声処理システム。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012153941A JP5967569B2 (ja) | 2012-07-09 | 2012-07-09 | 音声処理システム |
PCT/JP2013/068007 WO2014010450A1 (ja) | 2012-07-09 | 2013-07-01 | 音声処理システム及び端末装置 |
DE201311003444 DE112013003444T5 (de) | 2012-07-09 | 2013-07-01 | Sprachverarbeitungssystem und Endgerät |
CN201380036292.8A CN104488027B (zh) | 2012-07-09 | 2013-07-01 | 声音处理系统 |
GB1500132.4A GB2518318A (en) | 2012-07-09 | 2013-07-01 | Speech processing system and terminal device |
US14/406,015 US9824687B2 (en) | 2012-07-09 | 2013-07-01 | System and terminal for presenting recommended utterance candidates |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012153941A JP5967569B2 (ja) | 2012-07-09 | 2012-07-09 | 音声処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014016475A JP2014016475A (ja) | 2014-01-30 |
JP5967569B2 true JP5967569B2 (ja) | 2016-08-10 |
Family
ID=49915914
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012153941A Expired - Fee Related JP5967569B2 (ja) | 2012-07-09 | 2012-07-09 | 音声処理システム |
Country Status (6)
Country | Link |
---|---|
US (1) | US9824687B2 (ja) |
JP (1) | JP5967569B2 (ja) |
CN (1) | CN104488027B (ja) |
DE (1) | DE112013003444T5 (ja) |
GB (1) | GB2518318A (ja) |
WO (1) | WO2014010450A1 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9640173B2 (en) * | 2013-09-10 | 2017-05-02 | At&T Intellectual Property I, L.P. | System and method for intelligent language switching in automated text-to-speech systems |
US20160164813A1 (en) * | 2014-12-04 | 2016-06-09 | Intel Corporation | Conversation agent |
KR102324074B1 (ko) * | 2015-04-08 | 2021-11-09 | 삼성전자주식회사 | 사운드 출력 제어 방법 및 전자 장치 |
JP2017199363A (ja) * | 2016-04-21 | 2017-11-02 | 国立研究開発法人情報通信研究機構 | 機械翻訳装置及び機械翻訳のためのコンピュータプログラム |
US20170308526A1 (en) * | 2016-04-21 | 2017-10-26 | National Institute Of Information And Communications Technology | Compcuter Implemented machine translation apparatus and machine translation method |
KR102565274B1 (ko) | 2016-07-07 | 2023-08-09 | 삼성전자주식회사 | 자동 통역 방법 및 장치, 및 기계 번역 방법 및 장치 |
WO2018008227A1 (ja) * | 2016-07-08 | 2018-01-11 | パナソニックIpマネジメント株式会社 | 翻訳装置および翻訳方法 |
JP6342972B2 (ja) * | 2016-11-15 | 2018-06-13 | 株式会社日立情報通信エンジニアリング | コミュニケーションシステム及びそのコミュニケーション方法 |
US10431216B1 (en) * | 2016-12-29 | 2019-10-01 | Amazon Technologies, Inc. | Enhanced graphical user interface for voice communications |
US11582174B1 (en) | 2017-02-24 | 2023-02-14 | Amazon Technologies, Inc. | Messaging content data storage |
US10547729B2 (en) | 2017-03-27 | 2020-01-28 | Samsung Electronics Co., Ltd. | Electronic device and method of executing function of electronic device |
US11900072B1 (en) * | 2017-07-18 | 2024-02-13 | Amazon Technologies, Inc. | Quick lookup for speech translation |
CN107507615A (zh) * | 2017-08-29 | 2017-12-22 | 百度在线网络技术(北京)有限公司 | 界面智能交互控制方法、装置、系统及存储介质 |
KR102411124B1 (ko) * | 2017-10-27 | 2022-06-21 | 삼성전자주식회사 | 전자 장치 및 전자 장치에서 외부 장치를 이용한 태스크 수행 방법 |
CN109840062B (zh) * | 2017-11-28 | 2022-10-28 | 株式会社东芝 | 输入辅助装置以及记录介质 |
JP2019106054A (ja) * | 2017-12-13 | 2019-06-27 | 株式会社東芝 | 対話システム |
CN108364653B (zh) * | 2018-02-12 | 2021-08-13 | 王磊 | 语音数据处理方法及处理装置 |
JP7163035B2 (ja) * | 2018-02-19 | 2022-10-31 | 株式会社東芝 | 音響出力システム、音響出力方法及びプログラム |
JP6916130B2 (ja) * | 2018-03-02 | 2021-08-11 | 株式会社日立製作所 | 話者推定方法および話者推定装置 |
US10930278B2 (en) * | 2018-04-09 | 2021-02-23 | Google Llc | Trigger sound detection in ambient audio to provide related functionality on a user interface |
US10929098B2 (en) * | 2018-08-17 | 2021-02-23 | The Toronto-Dominion Bank | Methods and systems for conducting a session over audible and visual interfaces |
US11481189B2 (en) | 2018-08-17 | 2022-10-25 | The Toronto-Dominion Bank | Methods and systems for transferring a session between audible and visual interfaces |
EP3862908A1 (en) * | 2018-12-14 | 2021-08-11 | Google LLC | Voice-based interface for a networked system |
JP2020144274A (ja) * | 2019-03-07 | 2020-09-10 | 本田技研工業株式会社 | エージェント装置、エージェント装置の制御方法、およびプログラム |
US11061638B2 (en) | 2019-09-17 | 2021-07-13 | The Toronto-Dominion Bank | Dynamically determining an interface for presenting information to a user |
CN111368559A (zh) * | 2020-02-28 | 2020-07-03 | 北京字节跳动网络技术有限公司 | 语音翻译方法、装置、电子设备及存储介质 |
CN111401323A (zh) * | 2020-04-20 | 2020-07-10 | Oppo广东移动通信有限公司 | 文字翻译方法、装置、存储介质及电子设备 |
CN112084318B (zh) * | 2020-09-25 | 2024-02-20 | 支付宝(杭州)信息技术有限公司 | 一种对话辅助方法、系统及装置 |
CN115394288B (zh) * | 2022-10-28 | 2023-01-24 | 成都爱维译科技有限公司 | 民航多语种无线电陆空通话的语种识别方法及系统 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4156080B2 (ja) * | 1998-06-30 | 2008-09-24 | 株式会社デンソー | 要求推定装置 |
JP4135307B2 (ja) | 2000-10-17 | 2008-08-20 | 株式会社日立製作所 | 音声通訳サービス方法および音声通訳サーバ |
US7398209B2 (en) * | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
JP3991914B2 (ja) * | 2003-05-08 | 2007-10-17 | 日産自動車株式会社 | 移動体用音声認識装置 |
WO2006040971A1 (ja) * | 2004-10-08 | 2006-04-20 | Matsushita Electric Industrial Co., Ltd. | 対話支援装置 |
US9214001B2 (en) * | 2007-02-13 | 2015-12-15 | Aspect Software Inc. | Automatic contact center agent assistant |
US8620662B2 (en) * | 2007-11-20 | 2013-12-31 | Apple Inc. | Context-aware unit selection |
WO2011036769A1 (ja) * | 2009-09-25 | 2011-03-31 | 株式会社東芝 | 翻訳装置、及びプログラム |
JP5397198B2 (ja) | 2009-12-08 | 2014-01-22 | 日本電気株式会社 | 話題推薦装置、話題推薦装方法およびプログラム |
-
2012
- 2012-07-09 JP JP2012153941A patent/JP5967569B2/ja not_active Expired - Fee Related
-
2013
- 2013-07-01 DE DE201311003444 patent/DE112013003444T5/de not_active Withdrawn
- 2013-07-01 CN CN201380036292.8A patent/CN104488027B/zh not_active Expired - Fee Related
- 2013-07-01 WO PCT/JP2013/068007 patent/WO2014010450A1/ja active Application Filing
- 2013-07-01 GB GB1500132.4A patent/GB2518318A/en not_active Withdrawn
- 2013-07-01 US US14/406,015 patent/US9824687B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
GB2518318A (en) | 2015-03-18 |
JP2014016475A (ja) | 2014-01-30 |
US20170148436A1 (en) | 2017-05-25 |
CN104488027A (zh) | 2015-04-01 |
CN104488027B (zh) | 2018-03-30 |
DE112013003444T5 (de) | 2015-04-16 |
US9824687B2 (en) | 2017-11-21 |
WO2014010450A1 (ja) | 2014-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5967569B2 (ja) | 音声処理システム | |
US20200410174A1 (en) | Translating Languages | |
JP6588637B2 (ja) | 個別化されたエンティティ発音の学習 | |
CN112262430B (zh) | 自动确定经由自动助理界面接收到的口头话语的语音识别的语言 | |
CN103035240B (zh) | 用于使用上下文信息的语音识别修复的方法和系统 | |
US8560326B2 (en) | Voice prompts for use in speech-to-speech translation system | |
KR102108500B1 (ko) | 번역 기반 통신 서비스 지원 방법 및 시스템과, 이를 지원하는 단말기 | |
KR101683943B1 (ko) | 음성번역 시스템, 제1 단말장치, 음성인식 서버장치, 번역 서버장치, 및 음성합성 서버장치 | |
KR101211796B1 (ko) | 외국어 학습 장치 및 그 제공 방법 | |
US9053096B2 (en) | Language translation based on speaker-related information | |
CN110998720A (zh) | 话音数据处理方法及支持该方法的电子设备 | |
WO2019111346A1 (ja) | 双方向音声翻訳システム、双方向音声翻訳方法及びプログラム | |
JP6150268B2 (ja) | 単語登録装置及びそのためのコンピュータプログラム | |
CN105989840A (zh) | 自然语言语音服务环境中的混合处理的系统及方法 | |
KR20190043329A (ko) | 음성 신호 번역 방법 및 그에 따른 전자 장치 | |
CN112840396A (zh) | 用于处理用户话语的电子装置及其控制方法 | |
JP6832503B2 (ja) | 情報提示方法、情報提示プログラム及び情報提示システム | |
US20170221481A1 (en) | Data structure, interactive voice response device, and electronic device | |
CN111556999A (zh) | 通过即时提供实质性回答以提供自然语言对话的方法、计算机装置及计算机可读存储介质 | |
JP2021144170A (ja) | 情報処理方法及び情報処理装置 | |
JP7132206B2 (ja) | 案内システム、案内システムの制御方法、およびプログラム | |
CN117809641A (zh) | 一种终端设备及基于查询文本改写的语音交互方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150430 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160113 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160216 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160411 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20160411 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20160506 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160627 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5967569 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |