JP2012073369A - 音声翻訳システム、音声翻訳装置、音声翻訳方法、およびプログラム - Google Patents
音声翻訳システム、音声翻訳装置、音声翻訳方法、およびプログラム Download PDFInfo
- Publication number
- JP2012073369A JP2012073369A JP2010217559A JP2010217559A JP2012073369A JP 2012073369 A JP2012073369 A JP 2012073369A JP 2010217559 A JP2010217559 A JP 2010217559A JP 2010217559 A JP2010217559 A JP 2010217559A JP 2012073369 A JP2012073369 A JP 2012073369A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- unit
- similar
- speech
- phoneme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013519 translation Methods 0.000 title claims abstract description 186
- 238000000034 method Methods 0.000 title claims description 48
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 87
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 87
- 230000005540 biological transmission Effects 0.000 claims description 50
- 230000004044 response Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 description 21
- 230000006870 function Effects 0.000 description 17
- 238000007726 management method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】音素列と文字列とを有する2以上の固有表現情報を格納し得る固有表現情報格納部と、音声を受け付ける音声受付部と、音声受付部が受け付けた音声を音声認識し、音素列を取得する音声認識部と、音声認識部が取得した音素列に類似する音素列を、固有表現情報格納部から取得する類似音素列取得部と、類似音素列取得部が取得した音素列に対応する文字列である類似文字列を取得する類似文字列取得部と、類似文字列取得部が取得した類似文字列を翻訳し、翻訳結果を取得する機械翻訳部と、機械翻訳部が取得した翻訳結果を音声合成し、音声合成結果を取得する音声合成部と、音声合成結果を用いて音声出力する合成音声出力部とを具備する音声翻訳装置により、音声認識結果に誤りがある場合でも、良好な翻訳結果を得ることができる。
【選択図】図2
Description
(実施の形態1)
端末装置11は、音声受付部111、音声関連情報取得部112、音声関連情報送信部113、候補文字列受信部114、候補文字列出力部115、指示受付部116、候補文字列特定情報送信部117、音声合成結果受信部118、および合成音声出力部119を具備する。
次に、音声翻訳システム1の動作について説明する。まず、端末装置11の動作について、図3のフローチャートを用いて説明する。
(実施の形態2)
次に、音声翻訳装置2の動作について、図9のフローチャートを用いて説明する。図9のフローチャートにおいて、図3または図4のフローチャートと同一のステップの説明を省略する。なお、図9のフローチャートは、図3または図4のフローチャートと同様のステップにより構成されるので、説明を省略する。また、図9のフローチャートにおいて、電源オフや処理終了の割り込みにより処理は終了する。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。
2 音声翻訳装置
11 端末装置
12 サーバ装置
111 音声受付部
112 音声関連情報取得部
113 音声関連情報送信部
114 候補文字列受信部
115、202 候補文字列出力部
116 指示受付部
117 候補文字列特定情報送信部
118 音声合成結果受信部
119、204 合成音声出力部
120 固有表現情報格納部
121 音声関連情報受信部
122、201 音声認識部
123 類似音素列取得部
124 類似文字列取得部
125 候補文字列送信部
126 候補文字列特定情報受信部
127、203 機械翻訳部
128 音声合成部
129 音声合成結果送信部
130 制御部
Claims (10)
- 端末装置とサーバ装置とを具備する音声翻訳システムであって、
前記端末装置は、
音声を受け付ける音声受付部と、
前記音声受付部が受け付けた音声、または前記音声受付部が受け付けた音声に関する1以上の特徴量である音声関連情報を取得する音声関連情報取得部と、
前記音声関連情報を前記サーバ装置に送信する音声関連情報送信部と、
前記サーバ装置から音声合成結果を受信する音声合成結果受信部と、
前記音声合成結果を用いて音声出力する合成音声出力部とを具備し、
前記サーバ装置は、
音素列と文字列とを有する2以上の固有表現情報を格納し得る固有表現情報格納部と、
前記音声関連情報を受信する音声関連情報受信部と、
前記音声関連情報を用いて、音声認識し、音素列を取得する音声認識部と、
前記音声認識部が取得した音素列に類似する音素列を、前記固有表現情報格納部から取得する類似音素列取得部と、
前記類似音素列取得部が取得した音素列に対応する文字列である類似文字列を、前記固有表現情報格納部から取得する類似文字列取得部と、
前記類似文字列取得部が取得した類似文字列を翻訳し、翻訳結果を取得する機械翻訳部と、
前記機械翻訳部が取得した翻訳結果を音声合成し、音声合成結果を取得する音声合成部と、
前記音声合成結果を前記端末装置に送信する音声合成結果送信部とを具備する音声翻訳システム。 - 前記音声認識部は、
前記音声関連情報を用いて、音声認識し、1以上の音素列および音声認識結果である1以上の文字列である1以上の音声認識文字列を取得し、
前記類似音素列取得部は、
前記音声認識部が取得した音素列に類似する1以上の音素列を、前記固有表現情報格納部から取得し、
前記類似文字列取得部は、
前記類似音素列取得部が取得した1以上の音素列に対応する1以上の類似文字列を取得し、
前記音声認識部が取得した1以上の音声認識文字列および前記類似文字列取得部が取得した1以上の類似文字列である2以上の候補文字列を、前記端末装置に送信する候補文字列送信部と、
前記2以上の候補文字列の送信に対応して、一の候補文字列を特定する情報である候補文字列特定情報を、前記端末装置から受信する候補文字列特定情報受信部とをさらに具備し、
前記機械翻訳部は、
前記候補文字列特定情報に対応する音声認識文字列または類似文字列を翻訳し、翻訳結果を取得し、
前記端末装置は、
前記サーバ装置から、2以上の候補文字列を受信する候補文字列受信部と、
前記候補文字列受信部が受信した2以上の候補文字列を出力する候補文字列出力部と、
前記候補文字列出力部が出力した2以上の候補文字列の中から、一の候補文字列の指示を受け付ける指示受付部と、
前記指示受付部が受け付けた指示に対応する候補文字列を特定する候補文字列特定情報を、前記サーバ装置に送信する候補文字列特定情報送信部とをさらに具備する請求項1記載の音声翻訳システム。 - 前記類似音素列取得部は、
前記音声認識部が取得した音素列に類似する2以上の音素列を、前記固有表現情報格納部から取得し、
前記類似文字列取得部は、
前記類似音素列取得部が取得した2以上の音素列に対応する2以上の文字列である2以上の類似文字列を取得し、
前記類似文字列取得部が取得した2以上の類似文字列である2以上の候補文字列を、前記端末装置に送信する候補文字列送信部と、
前記2以上の候補文字列の送信に対応して、一の候補文字列を特定する情報である候補文字列特定情報を、前記端末装置から受信する候補文字列特定情報受信部とをさらに具備し、
前記機械翻訳部は、
前記候補文字列特定情報に対応する類似文字列を翻訳し、翻訳結果を取得し、
前記端末装置は、
前記サーバ装置から、2以上の候補文字列を受信する候補文字列受信部と、
前記候補文字列受信部が受信した2以上の候補文字列を出力する候補文字列出力部と、
前記候補文字列出力部が出力した2以上の候補文字列の中から、一の候補文字列の指示を受け付ける指示受付部と、
前記指示受付部が受け付けた指示に対応する候補文字列を特定する候補文字列特定情報を、前記サーバ装置に送信する候補文字列特定情報送信部とをさらに具備する請求項1記載の音声翻訳システム。 - 前記サーバ装置は、
前記音声認識部が取得した文字列と前記類似文字列取得部が取得した1以上の各類似文字列とを比較し、前記音声認識部が取得した文字列と一致する文字列が、前記類似文字列取得部が取得した1以上の類似文字列の中に存在するか否かを判断する制御部をさらに具備し、
前記候補文字列送信部は、
前記候補文字列を送信しない請求項2または請求項3記載の音声翻訳システム。 - 音素列と文字列とを有する2以上の固有表現情報を格納し得る固有表現情報格納部と、
音声を受け付ける音声受付部と、
前記音声受付部が受け付けた音声を音声認識し、音素列を取得する音声認識部と、
前記音声認識部が取得した音素列に類似する音素列を、前記固有表現情報格納部から取得する類似音素列取得部と、
前記類似音素列取得部が取得した音素列に対応する文字列である類似文字列を取得する類似文字列取得部と、
前記類似文字列取得部が取得した類似文字列を翻訳し、翻訳結果を取得する機械翻訳部と、
前記機械翻訳部が取得した翻訳結果を音声合成し、音声合成結果を取得する音声合成部と、
前記音声合成結果を用いて音声出力する合成音声出力部とを具備する音声翻訳装置。 - 前記音声認識部は、
前記音声関連情報を用いて、音声認識し、1以上の音素列および音声認識結果である1以上の文字列である1以上の音声認識文字列を取得し、
前記類似音素列取得部は、
前記音声認識部が取得した音素列に類似する1以上の音素列を、前記固有表現情報格納部から取得し、
前記類似文字列取得部は、
前記類似音素列取得部が取得した1以上の音素列に対応する1以上の文字列である1以上の類似文字列を取得し、
前記音声認識部が取得した1以上の音声認識文字列および前記類似文字列取得部が取得した1以上の類似文字列である2以上の候補文字列を出力する候補文字列出力部と、
前記候補文字列出力部が出力した2以上の候補文字列の中から、一の候補文字列の指示を受け付ける指示受付部とをさらに具備し、
前記機械翻訳部は、
前記指示受付部が受け付けた指示に対応する候補文字列を特定する候補文字列特定情報に対応する音声認識文字列または類似文字列を翻訳し、翻訳結果を取得する請求項5記載の音声翻訳装置。 - 前記類似音素列取得部は、
前記音声認識部が取得した音素列に類似する2以上の音素列を、前記固有表現情報格納部から取得し、
前記類似文字列取得部は、
前記類似音素列取得部が取得した2以上の音素列に対応する2以上の類似文字列を取得し、
前記類似文字列取得部が取得した2以上の類似文字列である2以上の候補文字列を出力する候補文字列出力部と、
前記候補文字列出力部が出力した2以上の候補文字列の中から、一の候補文字列の指示を受け付ける指示受付部とをさらに具備し、
前記機械翻訳部は、
前記指示受付部が受け付けた指示に対応する候補文字列を特定する候補文字列特定情報に対応する音声認識文字列または類似文字列を翻訳し、翻訳結果を取得する請求項5記載の音声翻訳装置。 - 前記音声認識部が取得した文字列と前記類似文字列取得部が取得した1以上の各類似文字列とを比較し、前記音声認識部が取得した文字列と一致する文字列が、前記類似文字列取得部が取得した1以上の類似文字列の中に存在するか否かを判断する制御部をさらに具備し、
前記候補文字列出力部は、
前記候補文字列を出力しない請求項6または請求項7記載の音声翻訳装置。 - 記憶媒体に、
音素列と文字列とを有する2以上の固有表現情報を格納しており、
音声受付部、音声認識部、類似音素列取得部、文字列取得部、機械翻訳部、音声合成部、および合成音声出力部により実現される音声翻訳方法であって、
前記音声受付部が、音声を受け付ける音声受付ステップと、
前記音声認識部が、前記音声受付ステップで受け付けられた音声を音声認識し、音素列を取得する音声認識ステップと、
前記類似音素列取得部が、前記音声認識ステップで取得された音素列に類似する音素列を、前記記憶媒体から取得する類似音素列取得ステップと、
前記文字列取得部が、前記類似音素列取得ステップで取得された音素列に対応する文字列を取得する文字列取得ステップと、
前記機械翻訳部が、前記文字列取得ステップで取得された文字列を翻訳し、翻訳結果を取得する機械翻訳ステップと、
前記音声合成部が、前記機械翻訳ステップで取得された翻訳結果を音声合成し、音声合成結果を取得する音声合成ステップと、
前記合成音声出力部が、前記音声合成結果を用いて音声出力する合成音声出力ステップとを具備する音声翻訳方法。 - 記憶媒体に、
音素列と文字列とを有する2以上の固有表現情報を格納しており、
コンピュータを、
音声を受け付ける音声受付部と、
前記音声受付部が受け付けた音声を音声認識し、音素列を取得する音声認識部と、
前記音声認識部が取得した音素列に類似する音素列を、前記記憶媒体から取得する類似音素列取得部と、
前記類似音素列取得部が取得した音素列に対応する文字列を取得する文字列取得部と、
前記文字列取得部が取得した文字列を翻訳し、翻訳結果を取得する機械翻訳部と、
前記機械翻訳部が取得した翻訳結果を音声合成する音声合成部と、
前記音声合成結果を用いて音声出力する合成音声出力部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010217559A JP5704686B2 (ja) | 2010-09-28 | 2010-09-28 | 音声翻訳システム、音声翻訳装置、音声翻訳方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010217559A JP5704686B2 (ja) | 2010-09-28 | 2010-09-28 | 音声翻訳システム、音声翻訳装置、音声翻訳方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012073369A true JP2012073369A (ja) | 2012-04-12 |
JP5704686B2 JP5704686B2 (ja) | 2015-04-22 |
Family
ID=46169614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010217559A Active JP5704686B2 (ja) | 2010-09-28 | 2010-09-28 | 音声翻訳システム、音声翻訳装置、音声翻訳方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5704686B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015052743A (ja) * | 2013-09-09 | 2015-03-19 | Necパーソナルコンピュータ株式会社 | 情報処理装置、情報処理装置の制御方法、及びプログラム |
JP2015052745A (ja) * | 2013-09-09 | 2015-03-19 | Necパーソナルコンピュータ株式会社 | 情報処理装置、制御方法、及びプログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006031385A (ja) * | 2004-07-15 | 2006-02-02 | Nec Corp | 音声入力による検索システムと方法並びにプログラム |
JP2007094086A (ja) * | 2005-09-29 | 2007-04-12 | Toshiba Corp | 入力装置、入力方法および入力プログラム |
JP2008076865A (ja) * | 2006-09-22 | 2008-04-03 | Toshiba Corp | 機械翻訳装置、機械翻訳方法および機械翻訳プログラム |
JP2008083376A (ja) * | 2006-09-27 | 2008-04-10 | Toshiba Corp | 音声翻訳装置、音声翻訳方法、音声翻訳プログラムおよび端末装置 |
JP2008243080A (ja) * | 2007-03-28 | 2008-10-09 | Toshiba Corp | 音声を翻訳する装置、方法およびプログラム |
US20090177461A1 (en) * | 2008-01-09 | 2009-07-09 | Fluential, Inc. | Mobile Speech-to-Speech Interpretation System |
-
2010
- 2010-09-28 JP JP2010217559A patent/JP5704686B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006031385A (ja) * | 2004-07-15 | 2006-02-02 | Nec Corp | 音声入力による検索システムと方法並びにプログラム |
JP2007094086A (ja) * | 2005-09-29 | 2007-04-12 | Toshiba Corp | 入力装置、入力方法および入力プログラム |
JP2008076865A (ja) * | 2006-09-22 | 2008-04-03 | Toshiba Corp | 機械翻訳装置、機械翻訳方法および機械翻訳プログラム |
JP2008083376A (ja) * | 2006-09-27 | 2008-04-10 | Toshiba Corp | 音声翻訳装置、音声翻訳方法、音声翻訳プログラムおよび端末装置 |
JP2008243080A (ja) * | 2007-03-28 | 2008-10-09 | Toshiba Corp | 音声を翻訳する装置、方法およびプログラム |
US20090177461A1 (en) * | 2008-01-09 | 2009-07-09 | Fluential, Inc. | Mobile Speech-to-Speech Interpretation System |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015052743A (ja) * | 2013-09-09 | 2015-03-19 | Necパーソナルコンピュータ株式会社 | 情報処理装置、情報処理装置の制御方法、及びプログラム |
JP2015052745A (ja) * | 2013-09-09 | 2015-03-19 | Necパーソナルコンピュータ株式会社 | 情報処理装置、制御方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5704686B2 (ja) | 2015-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5598998B2 (ja) | 音声翻訳システム、第一端末装置、音声認識サーバ装置、翻訳サーバ装置、および音声合成サーバ装置 | |
US7552045B2 (en) | Method, apparatus and computer program product for providing flexible text based language identification | |
US20080126093A1 (en) | Method, Apparatus and Computer Program Product for Providing a Language Based Interactive Multimedia System | |
US8954335B2 (en) | Speech translation system, control device, and control method | |
JP6327848B2 (ja) | コミュニケーション支援装置、コミュニケーション支援方法およびプログラム | |
JP5706384B2 (ja) | 音声認識装置、音声認識システム、音声認識方法および音声認識プログラム | |
KR20090130028A (ko) | 분산 음성 검색을 위한 방법 및 장치 | |
US8131550B2 (en) | Method, apparatus and computer program product for providing improved voice conversion | |
GB2557714A (en) | Determining phonetic relationships | |
JP6150268B2 (ja) | 単語登録装置及びそのためのコンピュータプログラム | |
KR20090111825A (ko) | 언어 독립적인 음성 인덱싱 및 검색 방법 및 장치 | |
US20120166176A1 (en) | Speech translation system, dictionary server, and program | |
KR20080040960A (ko) | 대응 문형 패턴 기반 자동통역 방법 및 장치 | |
JPWO2016147342A1 (ja) | 情報提供システム | |
JP2018045001A (ja) | 音声認識システム、情報処理装置、プログラム、音声認識方法 | |
CN112580335A (zh) | 多音字消歧方法及装置 | |
US7181397B2 (en) | Speech dialog method and system | |
JP5704686B2 (ja) | 音声翻訳システム、音声翻訳装置、音声翻訳方法、およびプログラム | |
CN112614482A (zh) | 移动端外语翻译方法、系统及存储介质 | |
US20200243092A1 (en) | Information processing device, information processing system, and computer program product | |
CN114586021B (zh) | 信息输出装置、信息输出方法以及记录介质 | |
CN117059076A (zh) | 方言语音识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130808 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140623 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140701 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140801 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150220 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5704686 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |