JP2009237439A - 携帯端末の音声認識装置、音声認識方法、音声認識プログラム - Google Patents
携帯端末の音声認識装置、音声認識方法、音声認識プログラム Download PDFInfo
- Publication number
- JP2009237439A JP2009237439A JP2008085926A JP2008085926A JP2009237439A JP 2009237439 A JP2009237439 A JP 2009237439A JP 2008085926 A JP2008085926 A JP 2008085926A JP 2008085926 A JP2008085926 A JP 2008085926A JP 2009237439 A JP2009237439 A JP 2009237439A
- Authority
- JP
- Japan
- Prior art keywords
- speech recognition
- recognition
- network
- function
- built
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】携帯端末1に、組込型音声認識機能が実装される。組込型音声認識機能の音響モデルデータベース51や辞書データベース52では、小語彙の辞書及び数種類の音響モデルに限定される。ネットワーク網4にはネットワーク型音声認識機能が設けられる。ネットワーク型音声認識機能では、音響モデルデータベース61には、多数の音響モデルが蓄積され、辞書データベース62には、大語彙の辞書が蓄積される。組込型音声認識機能とネットワーク型音声認識機能とでは性質が異なっていることに着目し、組込型音声認識機能とネットワーク型音声認識機能との双方を効果的に使用して、使い勝手が向上し、全体としての性能の向上を図る。
【選択図】図4
Description
本発明によれば、組込型音声認識機能による認識結果と、ネットワーク型音声認識機能による認識結果とを用いて音声認識を行うことで、音声認識の使い勝手を向上させ、認識精度を向上させることができる。
図1において、1は携帯端末、2は基地局である。携帯端末1は、基地局2を介して、公衆電話回線網(PSTN:Public
Switched Telephone Network)3及びネットワーク網4に接続可能とされている。ネットワーク網4は、IP(Internet
Protocol)ネットワーク網であり、例えばWAP(Wireless
Application Protocol)によりインターネット閲覧サービスを可能としている。
Positioning System)機能等を備えた携帯端末となっている。また、この携帯端末1では、組込型音声認識機能やその他の音声認識機能(分散型音声認識のクライアント機能など)が備えられている。また、この例では、携帯端末1は折り畳み自在の構造となっており、図2(A)は、携帯端末1の内側となる部分の各部の配置を示し、図2(B)は、外側となる各部の配置を示すものである。
Processing Unit)等からなり、携帯端末の全体の動作の制御を行っている。
Coupled Device)等のイメージセンサからなる撮像部38とが含まれる。カメラ部18に対して、イメージセンサの撮像信号を処理する映像信号処理部39が設けられる。
本実施形態は、先ず、携帯端末1の組込型音声認識機能により音声認識を行い、認識結果が良好ならその認識結果を採用し、認識結果が良好でなければ、音声認識サーバ6に接続して、ネットワーク型音声認識機能で音声認識を行うようにしたものである。
Markov Model)が用いられている。言語モデルとは、音素の並び方に関する制約を表したものである。各単語の組み合わせについて、ある単語の組み合わせが起こる確率(言語尤度)と、その単語の組み合わせのもと観測された特徴ベクトルが得られるであろう確率(音響尤度)とが求められ、これが最大となるような単語の組み合わせが認識結果とされる。
この例は、携帯端末1の組込型音声認識機能と、音声認識サーバ6によるネットワーク型音声認識機能とを同時並列的に行い、認識結果の良い方を用いるようにしたものである。
2:基地局
3:電話回線網
4:ネットワーク網
5:コンテンツサーバ
6:音声認識サーバ
21:主制御部
50:音声認識のプログラム
51:音響モデルデータベース
52:辞書データベース
61:音響モデルデータベース
62:辞書データベース
Claims (7)
- 機器内部に設けられた組込型音声認識機能と、
ネットワーク上に設けられた音声認識サーバによるネットワーク型音声認識機能と、
前記組込型音声認識機能による認識結果と、前記ネットワーク型音声認識機能による認識結果とを用いて音声認識を行う制御手段と、
を備えることを特徴とする携帯端末の音声認識装置。 - 前記制御手段は、前記組込型音声認識機能による認識結果が良好でない場合に、前記ネットワーク型音声認識機能を用いることを特徴とする請求項1に記載の携帯端末の音声認識装置。
- 前記制御手段は、前記組込型音声認識機能と前記ネットワーク型音声認識機能と並列に認識処理を行い、認識結果が良好な方を用いることを特徴とする請求項1に記載の携帯端末の音声認識装置。
- 組込型音声認識機能による音声認識を行い、
前記組込型音声認識機能による音声認識結果が良好かどうかを判定し、
前記組込型音声認識機能による認識結果がでない場合に、ネットワーク型音声認識機能を用いて音声認識を行うことを特徴とする携帯端末の音声認識方法。 - 組込型音声認識機能とネットワーク型音声認識機能と並列に認識処理を行い、
前記組込型音声認識機能による認識結果とネットワーク型音声認識機能による認識結果とを比較し、認識結果が良好な方を認識結果として採用する
ことを特徴とする携帯端末の音声認識方法。 - コンピュータに、
組込型音声認識機能による音声認識を行うステップと、
前記組込型音声認識機能による音声認識結果が良好かどうかを判定するステップと、
前記組込型音声認識機能による認識結果がでない場合に、ネットワーク型音声認識機能を用いて音声認識を行うステップと、
を実行させるための携帯端末の音声認識プログラム。 - コンピュータに、
組込型音声認識機能とネットワーク型音声認識機能と並列に認識処理を行うステップと、
前記組込型音声認識機能による認識結果とネットワーク型音声認識機能による認識結果とを比較するステップと、
認識結果が良好な方を認識結果として採用するステップと、
を実行させるための携帯端末の音声認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008085926A JP5283947B2 (ja) | 2008-03-28 | 2008-03-28 | 携帯端末の音声認識装置、音声認識方法、音声認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008085926A JP5283947B2 (ja) | 2008-03-28 | 2008-03-28 | 携帯端末の音声認識装置、音声認識方法、音声認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009237439A true JP2009237439A (ja) | 2009-10-15 |
JP5283947B2 JP5283947B2 (ja) | 2013-09-04 |
Family
ID=41251415
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008085926A Expired - Fee Related JP5283947B2 (ja) | 2008-03-28 | 2008-03-28 | 携帯端末の音声認識装置、音声認識方法、音声認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5283947B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013064777A (ja) * | 2011-09-15 | 2013-04-11 | Ntt Docomo Inc | 端末装置、音声認識プログラム、音声認識方法および音声認識システム |
JP2013534741A (ja) * | 2010-06-02 | 2013-09-05 | ナクソス ファイナンス エスエー | 画像記録再生装置、及び画像記録再生方法 |
WO2014003329A1 (en) * | 2012-06-28 | 2014-01-03 | Lg Electronics Inc. | Mobile terminal and method for recognizing voice thereof |
JP2014134791A (ja) * | 2012-12-31 | 2014-07-24 | Samsung Electronics Co Ltd | ディスプレイ装置及び制御方法 |
WO2014129033A1 (ja) * | 2013-02-25 | 2014-08-28 | 三菱電機株式会社 | 音声認識システムおよび音声認識装置 |
US9263032B2 (en) | 2013-10-24 | 2016-02-16 | Honeywell International Inc. | Voice-responsive building management system |
US9626964B2 (en) | 2013-11-27 | 2017-04-18 | Sharp Kabushiki Kaisha | Voice recognition terminal, server, method of controlling server, voice recognition system, non-transitory storage medium storing program for controlling voice recognition terminal, and non-transitory storage medium storing program for controlling server |
KR102026479B1 (ko) * | 2019-03-06 | 2019-09-30 | 주식회사 다이얼로그디자인에이전시 | 병렬처리 플랫폼 기반 인공지능 음성인식 서비스 제공 시스템 |
EP3690876A1 (de) * | 2019-01-30 | 2020-08-05 | Siemens Healthcare GmbH | System zur durchführung einer magnetresonanztomographie und verfahren zur steuerung eines mr scanners |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003295893A (ja) * | 2002-04-01 | 2003-10-15 | Omron Corp | 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2004012653A (ja) * | 2002-06-05 | 2004-01-15 | Matsushita Electric Ind Co Ltd | 音声認識システム、音声認識クライアント、音声認識サーバ、音声認識クライアントプログラムおよび音声認識サーバプログラム |
JP2006003696A (ja) * | 2004-06-18 | 2006-01-05 | Toyota Motor Corp | 音声認識装置、音声認識方法、及び音声認識プログラム |
-
2008
- 2008-03-28 JP JP2008085926A patent/JP5283947B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003295893A (ja) * | 2002-04-01 | 2003-10-15 | Omron Corp | 音声認識システム、装置、音声認識方法、音声認識プログラム及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2004012653A (ja) * | 2002-06-05 | 2004-01-15 | Matsushita Electric Ind Co Ltd | 音声認識システム、音声認識クライアント、音声認識サーバ、音声認識クライアントプログラムおよび音声認識サーバプログラム |
JP2006003696A (ja) * | 2004-06-18 | 2006-01-05 | Toyota Motor Corp | 音声認識装置、音声認識方法、及び音声認識プログラム |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013534741A (ja) * | 2010-06-02 | 2013-09-05 | ナクソス ファイナンス エスエー | 画像記録再生装置、及び画像記録再生方法 |
JP2013064777A (ja) * | 2011-09-15 | 2013-04-11 | Ntt Docomo Inc | 端末装置、音声認識プログラム、音声認識方法および音声認識システム |
US9147395B2 (en) | 2012-06-28 | 2015-09-29 | Lg Electronics Inc. | Mobile terminal and method for recognizing voice thereof |
JP2014010456A (ja) * | 2012-06-28 | 2014-01-20 | Lg Electronics Inc | 移動端末機及びその音声認識方法 |
WO2014003329A1 (en) * | 2012-06-28 | 2014-01-03 | Lg Electronics Inc. | Mobile terminal and method for recognizing voice thereof |
JP2014134791A (ja) * | 2012-12-31 | 2014-07-24 | Samsung Electronics Co Ltd | ディスプレイ装置及び制御方法 |
WO2014129033A1 (ja) * | 2013-02-25 | 2014-08-28 | 三菱電機株式会社 | 音声認識システムおよび音声認識装置 |
CN105027198A (zh) * | 2013-02-25 | 2015-11-04 | 三菱电机株式会社 | 语音识别系统以及语音识别装置 |
JP5921756B2 (ja) * | 2013-02-25 | 2016-05-24 | 三菱電機株式会社 | 音声認識システムおよび音声認識装置 |
US9761228B2 (en) | 2013-02-25 | 2017-09-12 | Mitsubishi Electric Corporation | Voice recognition system and voice recognition device |
US9263032B2 (en) | 2013-10-24 | 2016-02-16 | Honeywell International Inc. | Voice-responsive building management system |
US9626964B2 (en) | 2013-11-27 | 2017-04-18 | Sharp Kabushiki Kaisha | Voice recognition terminal, server, method of controlling server, voice recognition system, non-transitory storage medium storing program for controlling voice recognition terminal, and non-transitory storage medium storing program for controlling server |
EP3690876A1 (de) * | 2019-01-30 | 2020-08-05 | Siemens Healthcare GmbH | System zur durchführung einer magnetresonanztomographie und verfahren zur steuerung eines mr scanners |
US11417329B2 (en) | 2019-01-30 | 2022-08-16 | Siemens Healthcare Gmbh | System for performing a magnetic resonance tomography and method for controlling an MR scanner |
KR102026479B1 (ko) * | 2019-03-06 | 2019-09-30 | 주식회사 다이얼로그디자인에이전시 | 병렬처리 플랫폼 기반 인공지능 음성인식 서비스 제공 시스템 |
Also Published As
Publication number | Publication date |
---|---|
JP5283947B2 (ja) | 2013-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5283947B2 (ja) | 携帯端末の音声認識装置、音声認識方法、音声認識プログラム | |
US10079014B2 (en) | Name recognition system | |
CN108197572B (zh) | 一种唇语识别方法和移动终端 | |
EP2210214B1 (en) | Automatic identifying | |
US9148741B2 (en) | Action generation based on voice data | |
KR101696555B1 (ko) | 영상 또는 지리 정보에서 음성 인식을 통한 텍스트 위치 탐색 시스템 및 그 방법 | |
CN107205097B (zh) | 移动终端查找方法、装置以及计算机可读存储介质 | |
JP2013047809A (ja) | 移動通信装置の音声語彙を自動的に拡張するための方法及び装置 | |
US20070233482A1 (en) | Method for providing an electronic dictionary in wireless terminal and wireless terminal implementing the same | |
US8374872B2 (en) | Dynamic update of grammar for interactive voice response | |
US20060190260A1 (en) | Selecting an order of elements for a speech synthesis | |
CN106550132A (zh) | 一种移动终端及其控制方法 | |
JP2007018166A (ja) | 情報検索装置、情報検索システム、情報検索方法及び情報検索プログラム | |
JP2007516655A (ja) | キャッシュ機能を有する分散音声認識システムおよび方法 | |
US20090275316A1 (en) | Minimal Distraction Capture of Spoken Contact Information | |
JP2011205238A (ja) | 通信端末及び情報検索方法 | |
CN110502126B (zh) | 输入方法及电子设备 | |
US8750840B2 (en) | Directory assistance information via executable script | |
JP2007199908A (ja) | 顔文字入力装置 | |
CN113726952B (zh) | 通话过程中的同声传译方法及装置、电子设备、存储介质 | |
JP4814753B2 (ja) | データ情報と音声情報とを結びつけるための方法及びシステム | |
KR100703383B1 (ko) | 휴대용 단말기의 전자사전서비스 방법 | |
KR20070060617A (ko) | 카메라가 장착된 휴대 단말기에서의 기능 실행 방법 및 그장치 | |
KR20070029440A (ko) | 휴대단말기를 이용한 정보 검색 방법 | |
JP2009244432A (ja) | 携帯端末の音声認識装置、方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100729 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130514 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130529 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5283947 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |