JP2019174784A - 音声翻訳装置、音声翻訳方法及びそのプログラム - Google Patents
音声翻訳装置、音声翻訳方法及びそのプログラム Download PDFInfo
- Publication number
- JP2019174784A JP2019174784A JP2018216723A JP2018216723A JP2019174784A JP 2019174784 A JP2019174784 A JP 2019174784A JP 2018216723 A JP2018216723 A JP 2018216723A JP 2018216723 A JP2018216723 A JP 2018216723A JP 2019174784 A JP2019174784 A JP 2019174784A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- output
- beamformer
- display
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Machine Translation (AREA)
Abstract
Description
《概要》
図1は、実施の形態1における音声翻訳装置10の外観の一例を示す図である。図2は、実施の形態1における音声翻訳装置10の使用場面の一例を示す図である。
図5は、実施の形態1における音声翻訳装置10の構成の一例を示す図である。
マイクロホンアレイ部20は、音声信号を取得する。より具体的には、マイクロホンアレイ部20は、互いに離間して配置された2以上のマイクロホンユニットから構成され、音声を収音し、収音した音声から電気信号に変換した音声信号を取得する。マイクロホンアレイ部20は、取得した音声信号をビームフォーマ部11に出力する。なお、マイクロホンアレイ部20は、アダプタとして構成されてもよい。この場合、マイクロホンアレイ部20は音声翻訳装置10に装着されることで機能する。
ビームフォーマ部11は、マイクロホンアレイ部20で取得した音声信号を信号処理することにより、予め決められた方向に收音の指向性を制御すなわち予め決められた方向にビームを形成する。ここで、例えば図3に示されるように、ビームフォーマ部11は、マイクロホンアレイ部20で取得した音声信号を信号処理することにより、収音方向61を第1話者51に向ける、または、収音方向62を第2話者52に向ける。収音方向61及び収音方向62は、形成されたビームの方向であり、互いに異なる方向である。
方向指定部12は、ユーザにより操作されることにより、ビームフォーマ部11の収音の指向性の制御方法と認識部14に認識させる言語とを指定する。方向指定部12は、指定した制御方法すなわち指定内容を表示決定部13に通知する。
表示決定部13は、ユーザの操作による方向指定部12への指定と、ビームフォーマ部11が形成したビームにより収音した音声信号(発話を示す音声信号)の大きさとに基づいて、ユーザの誤操作の有無を判定する。表示決定部13は、ユーザの誤操作が有ると判定した場合、正しい操作方法など誤操作を解消する発話方法を決定し、ディスプレイ部16に出力する。
認識部14は、方向指定部12により、ビームフォーマ部11の出力を認識させる言語が指定される。そして、認識部14は、指定された言語でビームフォーマ部11の出力を認識する。
翻訳部15は、認識部14が認識した言語に応じて、認識部14が認識した内容を翻訳する。そして、翻訳部15は、翻訳した内容をディスプレイ部16に出力する。例えば、翻訳部15は、認識部14が認識した言語が日本語であれば、認識部14が認識した内容を英語に翻訳する。一方、翻訳部15は、認識部14が認識した言語が英語であれば、認識部14が認識した内容を日本語に翻訳する。
ディスプレイ部16は、表示決定部13の判定結果に応じて、第1翻訳部151の出力もしくは第2翻訳部152の出力、または、表示決定部13で決定された内容をディスプレイ30に表示する。
以上のように、本実施の形態の音声翻訳装置10によれば、ユーザが誤操作したかを判定し、ユーザに適切な発話方法を通知することができる。つまり、ユーザの誤操作を判定した場合、ユーザに当該誤操作を解消させるための行動を通知することができる。ユーザが誤操作した場合、ユーザの誤操作により正しい音声認識等が困難となる可能性が高いことから、誤操作を解消させることで、音声翻訳装置10は、正しく音声認識できるようになり正しく翻訳できるようになる。
実施の形態1では、ユーザの誤操作により正しい音声認識等が困難となる可能性が高いことから、ユーザの誤操作が発生した場合、ユーザに誤操作を解消させるための行動を促す発話方法を通知した。実施の形態2では、騒音等により音声認識が困難である場合に、ユーザに当該困難を解消させるための行動を促す発話方法を通知することについて説明する。以下では、実施の形態1と異なるところを中心に説明する。
S/N比計算部17は、ビームフォーマ部11が形成するビームにより収音した音声信号を用いて、SN比(Signal to Noise ratio)を計算する。本実施の形態では、S/N比計算部17は、方向指定部12により指定された一方の出力をSN比における信号成分とし、方向指定部12により指定されなかった他方の出力を雑音成分としてSN比を計算する。
表示決定部13Aは、S/N比計算部17により計算されたSN比に基づいて、ユーザが行った発話の音声認識が困難であるかを判定する。そして、表示決定部13Aは、音声認識が困難であると判定した場合、ユーザに当該困難を解消させるための行動を促す発話方法を決定しディスプレイ部16Aに出力する。
ディスプレイ部16Aは、表示決定部13Aの判定結果に応じて、第1翻訳部151の出力もしくは第2翻訳部152の出力、または、表示決定部13Aで決定された発話方法をディスプレイ30に表示する。
以上のように構成される音声翻訳装置10Aが行う動作処理について説明する。
以上のように、本実施の形態の音声翻訳装置10Aによれば、SN比を用いて、正しく音声認識できる見込みがあるかを判定し、正しい音声認識が困難な場合は、ユーザに適切な発話方法を通知することができる。つまり、音声翻訳装置10Aは、騒音等により音声認識が困難であることを判定し、ユーザに当該困難を解消させるための行動を通知することができる。これにより、音声翻訳装置10Aは、正しく音声認識できるようになり正しく翻訳できるようになる。
次に、変形例1について説明する。以下では、実施の形態2と異なるところを中心に説明する。
表示決定部13Bは、S/N比計算部17により計算されたSN比に基づいて、ユーザが行った発話の音声認識が困難であるかを判定する。表示決定部13Bは、音声認識が困難であると判定した場合、ユーザに当該困難を解消させるための行動を促す発話方法を決定し、ディスプレイ部16Aに出力する。
以上のように、本変形例の音声翻訳装置10Bによれば、SN比を用いて、正しく音声認識できる見込みがあるかを判定し、正しい音声認識が困難な場合は、ユーザに当該困難を解消させる行動として、マイクロホンアレイ部20に近づいて発話することを通知する。これとともに、本実施の形態の音声翻訳装置10Bは、マイクロホンアレイ部20で取得した音声信号をそのまま用いて認識処理及び翻訳処理を行うことで、発話者の発話の音声認識性能を改善する。発話者がマイクロホンアレイ部20に近づいた状態で発話する場合、ビームを形成するのに適した距離よりも短い位置から発話されたときには、所望の音声が正しく得られず変形し、何も処理しない場合よりも音声認識性能が低下する場合があるためである。
実施の形態2及びその変形例1では、騒音等により音声認識が困難である場合、ユーザに、当該困難を解消させるための行動を促す発話方法について説明したが、これに限らない。騒音等の環境下であっても音声認識が困難とならないような行動を、ユーザの発話時にユーザに促す表示を行ってもよい。以下、音声認識が困難とならないような行動を、ユーザの発話時に促す表示の例について変形例2として説明する。
以上のように、本変形例の音声翻訳装置10A及び10Bによれば、音声認識が困難とならないような行動を、ユーザの発話時にユーザに促すことができる。より具体的には、本変形例によれば、適切な音量のレベル、SN比のレベル、または、信号音量及び雑音音量のレベルで発話できているかをユーザが確認しながら発話できる。よって、音声の認識処理に適した音量のレベル、SN比のレベル、または、信号音量及び雑音音量のレベルでの発話をユーザに促すことができるので、音声の認識性能をより改善することができる。
変形例1では、SN比を用いて、音声認識が困難であるかを判定していたが、これに限らない。以下では、変形例1と異なるところを中心に説明する。
騒音特性計算部18は、ビームフォーマ部11が形成するビームにより収音して得た音声信号を用いて、騒音特性を計算する。本変形例では、騒音特性計算部18は、マイクロホンアレイ部20が取得した音声信号、または、方向指定部12により指定された一方の出力を用いて、騒音特性を計算する。
表示決定部13Cは、さらに、騒音特性計算部18により計算された騒音特性を用いて、方向指定部12により指定された一方の出力が認識困難かを判定する。表示決定部13Cは、騒音特性を用いて、音声認識が困難であると判定した場合、ユーザに当該困難を解消させるための行動を促す発話方法を決定しディスプレイ部16Aに出力する。
以上のように、本変形例の音声翻訳装置10Cによれば、少なくとも騒音特性計算部18が計算する騒音特性を用いて、騒音により音声認識が困難であるかをより精度よく判定することができる。つまり、音声の認識が困難かどうかの判定精度を向上することができる。
次に、変形例4について説明する。以下では、変形例3と異なるところを中心に説明する。
音声判定部19は、ビームフォーマ部11が形成するビームにより収音して得た音声信号が音声を示すか音声以外の非音声を示すかを判定することで、当該音声信号の音声区間を判定する。本変形例では、音声判定部19は、方向指定部12で指定された一方の出力の音声区間を判定する。
S/N比計算部17Dは、ビームフォーマ部11が形成するビームにより収音した音声信号のうち音声判定部19により判定された音声区間の音声信号を用いて、SN比を計算する。本変形例では、S/N比計算部17は、方向指定部12により指定された一方の出力のうち、音声判定部19により判定された音声区間の出力をSN比における信号成分とし、指定された当該一方の出力のうち音声判定部19により判定された非音声区間を雑音成分としてSN比を計算する。
騒音特性計算部18Dは、ビームフォーマ部11が形成するビームにより収音して得た音声信号のうち、音声判定部19により判定された非音声区間の出力を用いて、騒音特性を計算する。本変形例では、騒音特性計算部18Dは、方向指定部12により指定された一方の出力のうち音声判定部19により判定された非音声区間の出力を用いて、騒音特性を計算する。
表示決定部13Dは、音声判定部19により判定された音声区間を用いて、方向指定部12により指定された一方の出力が認識困難かを判定する。本変形例では、表示決定部13Dは、騒音特性計算部18Dにより計算された騒音特性を用いて、方向指定部12により指定された一方の出力が認識困難かを判定する。表示決定部13Dは、騒音特性を用いて、音声認識が困難であると判定した場合、ユーザに当該困難を解消させるための行動を促す発話方法を決定しディスプレイ部16Aに出力する。
以上のように、本変形例の音声翻訳装置10Dによれば、SN比及び騒音特性の計算の精度を向上することができるので、音声認識が困難であるかの判定をより精度よく行うことができる。さらに、本変形例の音声翻訳装置10Dによれば、ユーザが誤操作したかの判定をより精度よく行うことができる。
11 ビームフォーマ部
12 方向指定部
13、13A、13B、13C、13D 表示決定部
14 認識部
15 翻訳部
16、16A、16B、16C、16D ディスプレイ部
17、17D S/N比計算部
18、18D 騒音特性計算部
19 音声判定部
20 マイクロホンアレイ部
30 ディスプレイ
31、31a、32、32a ボタン
34、35、37 メッセージ
36、36a、36b、36c、36d、36e、36f レベルメータ
51 第1話者
52 第2話者
61、61a、62、62a 収音方向
111 第1ビームフォーマ部
112 第2ビームフォーマ部
141 第1認識部
142 第2認識部
151 第1翻訳部
152 第2翻訳部
Claims (15)
- マイクロホンアレイ部で取得した音声信号を信号処理することにより、第1方向に収音の指向性を制御した音声信号である第1ビームフォーマ出力を計算する第1ビームフォーマ部と、
前記マイクロホンアレイ部で取得した音声信号を信号処理することにより、前記第1方向とは異なる第2方向に収音の指向性を制御した音声信号である第2ビームフォーマ出力を計算する第2ビームフォーマ部と、
ユーザの操作により、第1ビームフォーマ部の出力及び第2ビームフォーマ部の出力のうちの一方の出力が指定される方向指定部と、
前記方向指定部により指定された前記一方の出力が、前記第1ビームフォーマ部により形成された第1ビームである場合、前記第1ビームフォーマ出力に対して第1言語で認識処理を行うことにより、前記第1ビームフォーマ出力の内容を第1言語による第1内容として認識する第1認識部と、
前記第1認識部が認識した前記第1内容を第2言語に翻訳する第1翻訳部と、
前記方向指定部により指定された前記一方の出力が、前記第2ビームフォーマ部により形成された第2ビームである場合、前記第2ビームフォーマ出力に対して第2言語で認識処理を行うことにより、前記第2ビームフォーマ出力の内容を、前記第2言語による第2内容として認識する第2認識部と、
前記第2認識部が認識した前記第2内容を前記第1言語に翻訳する第2翻訳部と、
前記方向指定部により指定された前記一方の出力をSN比(Signal to Noise ratio)における信号成分とし、前記方向指定部により指定されなかった他方の出力を雑音成分としてSN比を計算するSN比計算部と、
前記SN比計算部により計算された前記SN比を用いて、前記方向指定部により指定された前記一方の出力の認識が困難かを判定し、前記困難であると判定した場合、前記困難を解消する発話方法であって前記ユーザに通知するための発話方法を決定する表示決定部と、
前記第1翻訳部の出力もしくは前記第2翻訳部の出力、または、前記表示決定部で決定された前記発話方法をディスプレイに表示するディスプレイ部と、を備える、
音声翻訳装置。 - 前記表示決定部は、
前記SN比が閾値未満である場合、前記認識が困難と判定し、前記発話方法として、前記SN比を前記閾値以上にする行動内容を決定する、
請求項1に記載の音声翻訳装置。 - 前記表示決定部は、
前記SN比が閾値未満であり、かつ、前記発話方法として、前記マイクロホンアレイ部へ近づいて発話する旨を示す内容を決定した場合、前記方向指定部により指定された前記一方の出力に対応する前記第1認識部または前記第2認識部の入力を、前記一方の出力から前記マイクロホンアレイ部の出力に切り替えて、前記マイクロホンアレイ部が取得した音声信号を指定された前記一方の出力に対応する前記第1認識部または前記第2認識部に入力させる、
請求項2に記載の音声翻訳装置。 - 前記表示決定部は、さらに、
前記方向指定部により指定された前記一方の出力の音量を計算し、計算した前記音量を前記ディスプレイに表示することを決定し、
前記ディスプレイ部は、さらに、前記音量のレベルを示すレベルメータを前記ディスプレイに表示する、
請求項1〜3のいずれか1項に記載の音声翻訳装置。 - 前記表示決定部は、さらに、
前記SN比計算部により計算された前記SN比を、前記ディスプレイに表示することを決定し、
前記ディスプレイ部は、さらに、前記SN比のレベルを示すレベルメータを前記ディスプレイに表示する、
請求項1〜3のいずれか1項に記載の音声翻訳装置。 - 前記表示決定部は、さらに、
前記第1ビームフォーマ部の出力、及び、前記第2ビームフォーマ部の出力のうち、前記方向指定部により指定された前記一方の出力の音量を信号音量として計算し、前記マイクロホンアレイ部で取得した音声信号の音量を雑音音量として計算し、計算した前記信号音量及び前記雑音音量を前記ディスプレイに表示することを決定し、
前記ディスプレイ部は、さらに、前記信号音量及び前記雑音音量のレベルを示すレベルメータを前記ディスプレイに表示する、
請求項1〜3のいずれか1項に記載の音声翻訳装置。 - 前記ディスプレイ部は、前記レベルメータのレベルを下限の閾値から上限の閾値までの範囲で変化させて、前記ディスプレイに表示する、
請求項4〜6のいずれか1項に記載の音声翻訳装置。 - 前記ディスプレイ部は、
前記レベルメータの色を前記レベルの大きさに応じて異ならせて表示する、
請求項4〜7のいずれか1項に記載の音声翻訳装置。 - 前記ディスプレイ部は、さらに、
前記レベルの大きさに応じた通知を、前記ディスプレイに表示する、
請求項4〜8のいずれか1項に記載の音声翻訳装置。 - 前記マイクロホンアレイ部が取得した音声信号、または、前記方向指定部により指定された前記一方の出力を用いて、騒音特性を計算する騒音特性計算部を備え、
前記表示決定部は、さらに、前記騒音特性計算部により計算された前記騒音特性を用いて、前記一方の出力が認識困難かを判定する、
請求項1〜7のいずれか1項に記載の音声翻訳装置。 - さらに、前記方向指定部で指定された前記一方の出力の音声区間を判定する音声判定部を備え、
前記表示決定部は、さらに、前記音声判定部により判定された前記音声区間を用いて、前記一方の出力が認識困難かを判定する、
請求項1〜8のいずれか1項に記載の音声翻訳装置。 - 前記表示決定部は、さらに、前記音声判定部により判定された前記音声区間を用いて、前記ユーザの操作が誤っていたかを判定する、
請求項11に記載の音声翻訳装置。 - マイクロホンアレイ部で取得した音声信号を信号処理することにより、第1方向に収音の指向性を制御した音声信号である第1ビームフォーマ出力を計算する第1ビームフォーマ部と、
前記マイクロホンアレイ部で取得した音声信号を信号処理することにより、前記第1方向とは異なる第2方向に収音の指向性を制御した音声信号である第2ビームフォーマ出力を計算する第2ビームフォーマ部と、
ユーザの操作により、第1ビームフォーマ部の出力及び第2ビームフォーマ部の出力のうちの一方の出力が指定される方向指定部と、
前記方向指定部により指定された前記一方の出力が、前記第1ビームフォーマ部により形成された第1ビームである場合、前記第1ビームフォーマ出力に対して第1言語で認識処理を行うことにより、前記第1ビームフォーマ出力の内容を第1言語による第1内容として認識する第1認識部と、
前記第1認識部が認識した前記第1内容を第2言語に翻訳する第1翻訳部と、
前記方向指定部により指定された前記一方の出力が、前記第2ビームフォーマ部により形成された第2ビームである場合、前記第2ビームフォーマ出力に対して第2言語で認識処理を行うことにより、前記第2ビームフォーマ出力の内容を、前記第2言語による第2内容として認識する第2認識部と、
前記第2認識部が認識した前記第2内容を前記第1言語に翻訳する第2翻訳部と、
前記方向指定部への指定内容と、第1ビームフォーマ部の出力の大きさと、第2ビームフォーマ部の出力の大きさとから、前記ユーザの誤操作の有無を判定し、前記ユーザの誤操作が有ると判定した場合、前記誤操作を解消する発話方法であって前記ユーザに通知するための発話方法を決定する表示決定部と、
前記表示決定部の判定結果に応じて、前記第1翻訳部の出力もしくは前記第2翻訳部の出力、または、前記表示決定部で決定された内容をディスプレイに表示するディスプレイ部と、を備える、
音声翻訳装置。 - マイクロホンアレイ部で取得した音声信号を信号処理することにより、第1方向に収音の指向性を制御した音声信号である第1ビームフォーマ出力を計算する第1ビームフォーマステップと、
前記マイクロホンアレイ部で取得した音声信号処理することにより、前記第1方向とは異なる第2方向に収音の指向性を制御した音声信号である第2ビームフォーマ出力を計算する第2ビームフォーマステップと、
ユーザの操作により、前記第1ビームフォーマステップにおける出力及び前記第2ビームフォーマステップにおける出力のうちの一方の出力が指定される方向指定ステップと、
前記方向指定ステップにおいて指定された前記一方の出力が、前記第1ビームフォーマステップにおいて形成された第1ビームである場合、前記第1ビームフォーマ出力に対して第1言語で認識処理を行うことにより、前記第1ビームフォーマ出力の内容を第1言語による第1内容として認識する第1認識ステップと、
前記第1認識ステップにおいて認識された前記第1内容を第2言語に翻訳する第1翻訳ステップと、
前記方向指定ステップにおいて指定された前記一方の出力が、前記第2ビームフォーマステップにおいて形成された第2ビームである場合、前記第2ビームフォーマ出力に対して第2言語で認識処理を行うことにより、前記第2ビームフォーマ出力の内容を、前記第2言語による第2内容として認識する第2認識ステップと、
前記第2認識ステップにおいて認識した前記第2内容を前記第1言語に翻訳する第2翻訳ステップと、
前記方向指定ステップにおいて指定された前記一方の出力をSN比(Signal to Noise ratio)における信号成分とし、前記方向指定ステップにおいて指定されなかった他方の出力を雑音成分としてSN比を計算するSN比計算ステップと、
前記SN比計算ステップにおいて計算された前記SN比を用いて、前記方向指定ステップにおいて指定された前記一方の出力の認識が困難かを判定し、前記困難であると判定した場合、前記困難を解消する発話方法であって前記ユーザに通知するための発話方法を決定する表示決定ステップと、
前記第1翻訳ステップにおける出力または前記第2翻訳ステップにおける出力と、前記表示決定ステップにおいて決定された前記内容とをディスプレイに表示するディスプレイステップと、を含む、
音声翻訳方法。 - マイクロホンアレイ部で取得した音声信号を信号処理することにより、第1方向に収音の指向性を制御した音声信号である第1ビームフォーマ出力を計算する第1ビームフォーマステップと、
前記マイクロホンアレイ部で取得した音声信号処理することにより、前記第1方向とは異なる第2方向に収音の指向性を制御した音声信号である第2ビームフォーマ出力を計算する第2ビームフォーマステップと、
ユーザの操作により、前記第1ビームフォーマステップにおける出力及び前記第2ビームフォーマステップにおける出力のうちの一方の出力が指定される方向指定ステップと、
前記方向指定ステップにおいて指定された前記一方の出力が、前記第1ビームフォーマステップにおいて形成された第1ビームである場合、前記第1ビームフォーマ出力に対して第1言語で認識処理を行うことにより、前記第1ビームフォーマ出力の内容を第1言語による第1内容として認識する第1認識ステップと、
前記第1認識ステップにおいて認識された前記第1内容を第2言語に翻訳する第1翻訳ステップと、
前記方向指定ステップにおいて指定された前記一方の出力が、前記第2ビームフォーマステップにおいて形成された第2ビームである場合、前記第2ビームフォーマ出力に対して第2言語で認識処理を行うことにより、前記第2ビームフォーマ出力の内容を、前記第2言語による第2内容として認識する第2認識ステップと、
前記第2認識ステップにおいて認識した前記第2内容を前記第1言語に翻訳する第2翻訳ステップと、
前記方向指定ステップにおいて指定された前記一方の出力をSN比(Signal to Noise ratio)における信号成分とし、前記方向指定ステップにおいて指定されなかった他方の出力を雑音成分としてSN比を計算するSN比計算ステップと、
前記SN比計算ステップにおいて計算された前記SN比を用いて、前記方向指定ステップにおいて指定された前記一方の出力の認識が困難かを判定し、前記困難であると判定した場合、前記困難を解消する発話方法であって前記ユーザに通知するための発話方法を決定する表示決定ステップと、
前記第1翻訳ステップにおける出力または前記第2翻訳ステップにおける出力と、前記表示決定ステップにおいて決定された前記発話方法とをディスプレイに表示するディスプレイステップと、をコンピュータに実行させる、
プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/363,407 US11238852B2 (en) | 2018-03-29 | 2019-03-25 | Speech translation device, speech translation method, and recording medium therefor |
CN201910231608.8A CN110335589B (zh) | 2018-03-29 | 2019-03-26 | 语音翻译装置、语音翻译方法及记录介质 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862649917P | 2018-03-29 | 2018-03-29 | |
US62/649,917 | 2018-03-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019174784A true JP2019174784A (ja) | 2019-10-10 |
JP7223561B2 JP7223561B2 (ja) | 2023-02-16 |
Family
ID=68166886
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018216723A Active JP7223561B2 (ja) | 2018-03-29 | 2018-11-19 | 音声翻訳装置、音声翻訳方法及びそのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7223561B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022171300A (ja) * | 2021-04-30 | 2022-11-11 | グリー株式会社 | コンピュータプログラム、方法及びサーバ装置 |
WO2024053476A1 (ja) * | 2022-09-05 | 2024-03-14 | ダイキン工業株式会社 | システム、支援方法、サーバ装置及び通信プログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002073061A (ja) * | 2000-09-05 | 2002-03-12 | Matsushita Electric Ind Co Ltd | 音声認識装置及びその方法 |
JP2012093641A (ja) * | 2010-10-28 | 2012-05-17 | Toshiba Corp | 携帯型電子機器 |
US20140188455A1 (en) * | 2012-12-29 | 2014-07-03 | Nicholas M. Manuselis | System and method for dual screen language translation |
JP2014186713A (ja) * | 2013-02-21 | 2014-10-02 | Panasonic Corp | 会話システムおよびその会話処理方法 |
JP2016126022A (ja) * | 2014-12-26 | 2016-07-11 | アイシン精機株式会社 | 音声処理装置 |
WO2017168936A1 (ja) * | 2016-03-31 | 2017-10-05 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
-
2018
- 2018-11-19 JP JP2018216723A patent/JP7223561B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002073061A (ja) * | 2000-09-05 | 2002-03-12 | Matsushita Electric Ind Co Ltd | 音声認識装置及びその方法 |
JP2012093641A (ja) * | 2010-10-28 | 2012-05-17 | Toshiba Corp | 携帯型電子機器 |
US20140188455A1 (en) * | 2012-12-29 | 2014-07-03 | Nicholas M. Manuselis | System and method for dual screen language translation |
JP2014186713A (ja) * | 2013-02-21 | 2014-10-02 | Panasonic Corp | 会話システムおよびその会話処理方法 |
JP2016126022A (ja) * | 2014-12-26 | 2016-07-11 | アイシン精機株式会社 | 音声処理装置 |
WO2017168936A1 (ja) * | 2016-03-31 | 2017-10-05 | ソニー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022171300A (ja) * | 2021-04-30 | 2022-11-11 | グリー株式会社 | コンピュータプログラム、方法及びサーバ装置 |
WO2024053476A1 (ja) * | 2022-09-05 | 2024-03-14 | ダイキン工業株式会社 | システム、支援方法、サーバ装置及び通信プログラム |
JP7482459B2 (ja) | 2022-09-05 | 2024-05-14 | ダイキン工業株式会社 | システム、支援方法、サーバ装置及び通信プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7223561B2 (ja) | 2023-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3614377B1 (en) | Object recognition method, computer device and computer readable storage medium | |
EP2911149B1 (en) | Determination of an operational directive based at least in part on a spatial audio property | |
US7684985B2 (en) | Techniques for disambiguating speech input using multimodal interfaces | |
US9293134B1 (en) | Source-specific speech interactions | |
US11238852B2 (en) | Speech translation device, speech translation method, and recording medium therefor | |
US9494683B1 (en) | Audio-based gesture detection | |
KR20150093482A (ko) | 화자 분할 기반 다자간 자동 통번역 운용 시스템 및 방법과 이를 지원하는 장치 | |
JP2017117371A (ja) | 制御方法、制御装置およびプログラム | |
KR20160014297A (ko) | 전자 장치 및 이의 제어 방법 | |
CN109360549B (zh) | 一种数据处理方法、穿戴设备和用于数据处理的装置 | |
EP3540565A1 (en) | Control method for translation device, translation device, and program | |
US11076219B2 (en) | Automated control of noise reduction or noise masking | |
CN107945806B (zh) | 基于声音特征的用户识别方法及装置 | |
US11182567B2 (en) | Speech translation apparatus, speech translation method, and recording medium storing the speech translation method | |
JP7223561B2 (ja) | 音声翻訳装置、音声翻訳方法及びそのプログラム | |
WO2017166495A1 (zh) | 一种语音信号处理方法及装置 | |
CN110335589B (zh) | 语音翻译装置、语音翻译方法及记录介质 | |
JP2006251061A (ja) | 音声対話装置および音声対話方法 | |
KR102000282B1 (ko) | 청각 기능 보조용 대화 지원 장치 | |
JP7171402B2 (ja) | 音声翻訳装置、音声翻訳方法及びそのプログラム | |
JP6260138B2 (ja) | コミュニケーション処理装置、コミュニケーション処理方法、及び、コミュニケーション処理プログラム | |
JP2018022086A (ja) | サーバ装置、制御システム、方法、情報処理端末、および制御プログラム | |
JP2020024310A (ja) | 音声処理システム及び音声処理方法 | |
KR102114102B1 (ko) | 뉴럴 네트워크를 통한 음성 증폭 시스템 | |
JP7429107B2 (ja) | 音声翻訳装置、音声翻訳方法及びそのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210601 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220308 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220509 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220809 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221004 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230206 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7223561 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |