JP6916664B2 - 音声認識方法、携帯端末、および、プログラム - Google Patents
音声認識方法、携帯端末、および、プログラム Download PDFInfo
- Publication number
- JP6916664B2 JP6916664B2 JP2017100139A JP2017100139A JP6916664B2 JP 6916664 B2 JP6916664 B2 JP 6916664B2 JP 2017100139 A JP2017100139 A JP 2017100139A JP 2017100139 A JP2017100139 A JP 2017100139A JP 6916664 B2 JP6916664 B2 JP 6916664B2
- Authority
- JP
- Japan
- Prior art keywords
- language
- determination
- voice
- mobile terminal
- translation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
本発明者は、「背景技術」の欄において記載した、音声認識方法に関し、以下の問題が生じることを見出した。
以下、図1〜図6を用いて、実施の形態1を説明する。
図1は、実施の形態1に係る翻訳システムの概略図である。
携帯端末100のハードウェア構成について図2を用いて説明する。
Disk Drive)などである。なお、コンピュータ101で用いられる制御プログラムは、後述する翻訳方法に係る演算を行うプログラムを含む。
次に、サーバ200のハードウェア構成について図3を用いて説明する。
次に、図1を参照して通信ネットワークの構成について説明する。
次に、翻訳システム1の機能構成について図4を用いて説明する。
次に、翻訳システム1の動作について、図5および図6を用いて説明する。
本実施の形態に係る音声認識方法によれば、第1の言語でない場合、第2の言語に翻訳しないので、例えば、不特定多数の人が集まっている場所であっても、ユーザが発話した以外の音声を認識することを低減できる。特に、翻訳が必要な状況下においては、ユーザは、ユーザの母国語が周囲に通じない状況であるため、周囲の人々はユーザの母国語とは異なる種類の言語を話していることがほとんどであると考えられる。このような場合において、例えば、ユーザの母国語を第1の言語に設定しておけば、不特定多数の人が周囲にいるような、ユーザ以外の人が発話した音声を誤検出しやすい状況であっても、第1の言語のみを翻訳するため、誤検出を低減できる。
次に、図7および図8を用いて、実施の形態2を説明する。
図7は、実施の形態2に係る翻訳システムの機能構成の一例を示すブロック図である。
実施の形態2に係る翻訳システム1aの動作は、実施の形態1に係る翻訳システム1の動作と比較して、携帯端末100aにおいて行われる翻訳処理が異なる。このため、携帯端末100aにおいて行われる翻訳処理について説明する。
本実施の形態に係る音声認識方法によれば、さらに、携帯端末100aの位置を検出し、第1の判定では、さらに、言語の種類が、検出した位置の地域における公用語である場合、言語の種類が第1の言語と異なる言語であると判定する。
上記実施の形態2のように、携帯端末100aが位置情報を取得する場合、位置情報に応じて動的に第2の言語を設定してもよい。
次に、図9および図10を用いて、実施の形態3を説明する。
図9は、実施の形態3に係る翻訳システムの機能構成の一例を示すブロック図である。
実施の形態3に係る翻訳システム1bの動作は、実施の形態2に係る翻訳システム1の動作と比較して、携帯端末100bにおいて行われる翻訳処理が異なる。このため、携帯端末100bにおいて行われる翻訳処理について説明する。
本実施の形態における音声認識方法によれば、さらに、携帯端末100bの位置を検出し、所定のアプリケーションから出力された通知情報を取得し、検出した位置、および、取得した通知情報を用いて、携帯端末100bのユーザが翻訳の必要性がある場所に位置し、かつ、当該必要性がある状態であるか否かを判定する第3の判定を行い、第3の判定の結果、ユーザが、翻訳の必要性がある場所に位置し、かつ、当該必要性がある状態である場合、第1の判定および翻訳処理を行い、ユーザが、翻訳の必要性がある場所に位置しない、または、当該必要性がある状態でない場合、第1の判定および翻訳処理を行わない。このため、誤検出しやすい状況下である場合に、誤検出を低減できる。このため、処理量を削減できる。
次に、図11および図12を用いて、実施の形態4を説明する。
図11は、実施の形態4に係る翻訳システムの機能構成の一例を示すブロック図である。
実施の形態4に係る翻訳システム1cの動作は、実施の形態1に係る翻訳システム1の動作と比較して、携帯端末100cにおいて行われる翻訳処理が異なる。このため、携帯端末100cにおいて行われる翻訳処理について説明する。
本実施の形態に係る音声認識方法によれば、さらに、携帯端末100cの加速度を検出し、検出した加速度を用いて、携帯端末100cのユーザが所定の速さ以上で移動しているか否かを判定する第4の判定を行い、第4の判定の結果、ユーザが、所定の速さ以上で移動している場合、第1の判定および翻訳処理を行わず、所定の速さ以上で移動していない場合、第1の判定および翻訳処理を行う。所定の速さ以上で移動している場合、風切り音、摩擦音、振動音などの雑音を拾いやすくなるため、この場合に、第1の判定および翻訳処理を行わないことで、誤った翻訳を行うことを低減できる。
次に、図13および図14を用いて、実施の形態5を説明する。
図13は、実施の形態5に係る翻訳システムの機能構成の一例を示すブロック図である。
実施の形態5に係る翻訳システム1dの動作は、実施の形態4に係る翻訳システム1cの動作と比較して、携帯端末100dにおいて行われる翻訳処理が異なる。このため、携帯端末100dにおいて行われる翻訳処理について説明する。
本実施の形態に係る音声認識方法によれば、さらに、携帯端末100dの周囲の騒音レベルを計測し、計測した騒音レベルが所定の騒音レベルより大きいか否かを判定する第5の判定を行い、第5の判定の結果、騒音レベルが所定の騒音レベルより大きい場合、第1の判定および翻訳処理を行わず、騒音レベルが所定の騒音レベル以下の場合、第1の判定および翻訳処理を行う。騒音を検出している場合、第1の判定および翻訳処理を行わないことで、誤った翻訳を行うことを低減できる。
次に、図15および図16を用いて、実施の形態6を説明する。
図15は、実施の形態6に係る携帯端末の機能構成の一例を示すブロック図である。
図16は、実施の形態6に係る携帯端末における音声認識方法の一例を示すフローチャートである。
100、100a〜100e 携帯端末
101 コンピュータ
102 マイク
103 入力IF
104 GPSモジュール
105 加速度センサ
106 スピーカ
107 ディスプレイ
108 通信IF
111、111d 音声取得部
112、112a〜112e 処理部
113、113e 記憶部
114 提示部
115 通信部
116 入力部
117 位置取得部
118 加速度取得部
121、121a〜121d 判定部
122 翻訳部
123 登録部
124 取得部
125 認識部
200 サーバ
201 コンピュータ
202 通信IF
211 通信部
212 認識部
213 記憶部
300 通信ネットワーク
Claims (11)
- 携帯端末が取得した音声情報を認識し、当該音声情報が示す音声の言語とは異なる言語に翻訳する音声認識方法であって、
前記音声情報を取得し、
取得した前記音声情報が示す音声の言語の種類を認識し、
前記携帯端末の位置を検出し、
認識した前記言語の種類が予め登録されている第1の言語であるか否かを判定する第1の判定を行い、
前記第1の判定の結果、前記言語の種類が前記第1の言語である場合、前記音声の言語を前記第1の言語とは異なる第2の言語に翻訳する翻訳処理を行い、
前記第1の判定では、さらに、前記言語の種類が、検出した前記位置の地域における公用語である場合、前記言語の種類が前記第1の言語と異なる言語であると判定する
音声認識方法。 - さらに、
ユーザによる前記第1の言語の登録を受け付け、
前記第1の判定では、受け付けた前記登録に基づく前記第1の言語を用いる
請求項1に記載の音声認識方法。 - さらに、
検出した前記位置が、前記第1の言語を公用語とする第1の地域とは異なる第2の地域であるか否かを判定する第2の判定を行い、
前記第2の判定の結果、前記位置が前記第2の地域である場合、当該第2の地域における公用語を前記第2の言語として設定する
請求項1に記載の音声認識方法。 - 携帯端末が取得した音声情報を認識し、当該音声情報が示す音声の言語とは異なる言語に翻訳する音声認識方法であって、
前記音声情報を取得し、
取得した前記音声情報が示す音声の言語の種類を認識し、
前記携帯端末の位置を検出し、
認識した前記言語の種類が予め登録されている第1の言語であるか否かを判定する第1の判定を行い、
前記第1の判定の結果、前記言語の種類が前記第1の言語である場合、前記音声の言語を前記第1の言語とは異なる第2の言語に翻訳する翻訳処理を行い、
所定のアプリケーションから出力された通知情報を取得し、
検出した位置、および、取得した前記通知情報を用いて、前記携帯端末のユーザが翻訳の必要性がある場所に位置し、かつ、当該必要性がある状態であるか否かを判定する第3の判定を行い、
前記第3の判定の結果、前記ユーザが、前記翻訳の必要性がある場所に位置し、かつ、当該必要性がある状態である場合、前記第1の判定および前記翻訳処理を行う
音声認識方法。 - 前記翻訳の必要性がある場所とは、空港、ホテル、レストラン、店舗、駅のいずれかである
請求項4に記載の音声認識方法。 - 前記翻訳の必要性がある状態とは、空港において飛行機にチェックインした状態、ホテルにおいてチェックインした状態、レストランや店舗において商品のクーポンがチェックされた状態、駅において改札を通過した状態のいずれかである
請求項4に記載の音声認識方法。 - さらに、
前記携帯端末の加速度を検出し、
検出した前記加速度を用いて、前記携帯端末のユーザが所定の速さ以上で移動しているか否かを判定する第4の判定を行い、
前記第4の判定の結果、前記ユーザが、前記所定の速さ以上で移動していない場合、前記第1の判定および前記翻訳処理を行う
請求項1から6のいずれか1項に記載の音声認識方法。 - さらに、
前記携帯端末の周囲の騒音レベルを計測し、
計測した前記騒音レベルが所定の騒音レベルより大きいか否かを判定する第5の判定を行い、
前記第5の判定の結果、前記騒音レベルが前記所定の騒音レベル以下の場合、前記第1の判定および前記翻訳処理を行う
請求項1から7のいずれか1項に記載の音声認識方法。 - マイクと、プロセッサと、メモリとを備える携帯端末であって、
前記プロセッサは、
前記マイクによって収集された音から、音声を示す音声情報を抽出し、
抽出した前記音声情報が示す音声の言語の種類を認識し、
前記携帯端末の位置を検出し、
認識した前記言語の種類が前記メモリに予め登録されている第1の言語であるか否かを判定する第1の判定を行い、
前記第1の判定の結果、前記言語の種類が前記第1の言語である場合、前記音声の言語を前記第1の言語とは異なる第2の言語に翻訳する翻訳処理を行い、
前記第1の判定では、さらに、前記言語の種類が、検出した前記位置の地域における公用語である場合、前記言語の種類が前記第1の言語と異なる言語であると判定する
携帯端末。 - マイクと、プロセッサと、メモリとを備える携帯端末であって、
前記プロセッサは、
前記マイクによって収集された音から、音声を示す音声情報を取得し、
取得した前記音声情報が示す音声の言語の種類を認識し、
前記携帯端末の位置を検出し、
認識した前記言語の種類が予め登録されている第1の言語であるか否かを判定する第1の判定を行い、
前記第1の判定の結果、前記言語の種類が前記第1の言語である場合、前記音声の言語を前記第1の言語とは異なる第2の言語に翻訳する翻訳処理を行い、
所定のアプリケーションから出力された通知情報を取得し、
検出した位置、および、取得した前記通知情報を用いて、前記携帯端末のユーザが翻訳の必要性がある場所に位置し、かつ、当該必要性がある状態であるか否かを判定する第3の判定を行い、
前記第3の判定の結果、前記ユーザが、前記翻訳の必要性がある場所に位置し、かつ、当該必要性がある状態である場合、前記第1の判定および前記翻訳処理を行う
携帯端末。 - 請求項1から8のいずれか1項に記載の音声認識方法をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/713,088 US10331795B2 (en) | 2016-09-28 | 2017-09-22 | Method for recognizing speech sound, mobile terminal, and recording medium |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016190232 | 2016-09-28 | ||
JP2016190232 | 2016-09-28 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018060165A JP2018060165A (ja) | 2018-04-12 |
JP6916664B2 true JP6916664B2 (ja) | 2021-08-11 |
Family
ID=61908907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017100139A Active JP6916664B2 (ja) | 2016-09-28 | 2017-05-19 | 音声認識方法、携帯端末、および、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6916664B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109344411A (zh) * | 2018-09-19 | 2019-02-15 | 深圳市合言信息科技有限公司 | 一种自动侦听式同声传译的翻译方法 |
CN113160827A (zh) * | 2021-04-07 | 2021-07-23 | 深圳鱼亮科技有限公司 | 一种基于多语言模型的语音转写系统及方法 |
CN117524193B (zh) * | 2024-01-08 | 2024-03-29 | 浙江同花顺智能科技有限公司 | 中英混合语音识别系统训练方法、装置、设备及介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000172291A (ja) * | 1998-12-02 | 2000-06-23 | Sony Corp | 音声認識装置 |
US7272377B2 (en) * | 2002-02-07 | 2007-09-18 | At&T Corp. | System and method of ubiquitous language translation for wireless devices |
JP2004037953A (ja) * | 2002-07-04 | 2004-02-05 | Equos Research Co Ltd | 車載装置、データ作成装置、及びデータ作成プログラム |
JP2010128766A (ja) * | 2008-11-27 | 2010-06-10 | Canon Inc | 情報処理装置、情報処理方法、プログラム及び記憶媒体 |
-
2017
- 2017-05-19 JP JP2017100139A patent/JP6916664B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018060165A (ja) | 2018-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105869640B (zh) | 识别针对当前页面中的实体的语音控制指令的方法和装置 | |
JP5968578B2 (ja) | ユーザインターフェースシステム、ユーザインターフェース制御装置、ユーザインターフェース制御方法およびユーザインターフェース制御プログラム | |
JP5653392B2 (ja) | 音声翻訳装置、方法およびプログラム | |
US20150179173A1 (en) | Communication support apparatus, communication support method, and computer program product | |
US9484034B2 (en) | Voice conversation support apparatus, voice conversation support method, and computer readable medium | |
US20090222257A1 (en) | Speech translation apparatus and computer program product | |
JP6916664B2 (ja) | 音声認識方法、携帯端末、および、プログラム | |
US10331795B2 (en) | Method for recognizing speech sound, mobile terminal, and recording medium | |
KR20100126796A (ko) | 컨텍스트에 기초한 음성 인식 문법 선택 | |
EP3866160A1 (en) | Electronic device and control method thereof | |
US20140365215A1 (en) | Method for providing service based on multimodal input and electronic device thereof | |
US10002610B2 (en) | Presentation supporting device, presentation supporting method, and computer-readable recording medium | |
US9304787B2 (en) | Language preference selection for a user interface using non-language elements | |
CN107632982B (zh) | 语音控制外语翻译设备用的方法和装置 | |
CN107112007B (zh) | 语音识别装置及语音识别方法 | |
US20180288109A1 (en) | Conference support system, conference support method, program for conference support apparatus, and program for terminal | |
US10540968B2 (en) | Information processing device and method of information processing | |
US10496365B2 (en) | Electronic device, control method, and non-transitory storage medium | |
JP5434731B2 (ja) | 音声認識システム及び自動検索システム | |
US20120253804A1 (en) | Voice processor and voice processing method | |
CN104318923B (zh) | 一种语音处理方法、装置及终端 | |
KR20180134337A (ko) | 정보 처리 장치, 정보 처리 방법 및 프로그램 | |
WO2019098036A1 (ja) | 情報処理装置、情報処理端末、および情報処理方法 | |
EP3035207A1 (en) | Speech translation device | |
JP6351440B2 (ja) | 音声認識装置及びコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191202 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201109 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201117 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210629 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210716 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6916664 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |