JP2012168349A - 音声認識システムおよびこれを用いた検索システム - Google Patents
音声認識システムおよびこれを用いた検索システム Download PDFInfo
- Publication number
- JP2012168349A JP2012168349A JP2011029301A JP2011029301A JP2012168349A JP 2012168349 A JP2012168349 A JP 2012168349A JP 2011029301 A JP2011029301 A JP 2011029301A JP 2011029301 A JP2011029301 A JP 2011029301A JP 2012168349 A JP2012168349 A JP 2012168349A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- speech
- voice
- search
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】車載装置100は、話者が発声した音声を保存する音声保存バッファ112と、認識辞書116を用いて、音声保存バッファ112に保存された音声に対して音声認識処理を行う音声認識部114とを備える。施設検索サーバ150は、認識辞書116と異なる認識辞書162を用いて、音声保存バッファ112に保存された音声に対して音声認識処理を行う音声認識部160とを備える。車載装置100に備わった優先度調整部122は、2つの音声認識部114、160の認識結果に基づいて、音声保存バッファ112に保存された音声に対応する認識候補を決定する。
【選択図】図1
Description
図1は、第1の実施形態の施設検索システムの構成を示す図である。本実施形態の施設検索システムは、車載装置100と施設検索サーバ150とを備えている。車載装置100は車両に搭載されている。また、施設検索サーバ150は、車両外部に設けられており、車載装置100と無線回線を介して接続されている。具体的には、車載装置100は、携帯電話機および基地局を介してインターネット経由で施設検索サーバ150に接続される場合の他、無線LAN用の通信装置およびアクセスポイントを介してインターネット経由で施設検索サーバ150に接続される場合などが考えられる。
次に、第2の実施形態の施設検索システムについて説明する。本実施形態の施設検索システムでは、車載装置側で入力音声に対して音声認識処理を行うが、その認識結果が誤りであった場合に、施設検索サーバ側に同じ入力音声についての音声認識処理を依頼する。
次に、第3の実施形態の施設検索システムについて説明する。本実施形態の施設検索システムでは、施設検索サーバ側の音声認識処理によって得られた認識候補が正しいことが確かめられ後に、この認識候補に対応して第1の実施形態と同様の動的な認識辞書を作成して車載装置側で音声認識処理を行う。
次に、第4の実施形態の施設検索システムについて説明する。本実施形態の施設検索システムでは、車載装置と施設検索サーバの両方において、入力音声に対する音声認識処理およびその認識結果を用いた施設検索処理を並行して行い、結果が先に得られる車載装置側の検索結果を先に表示し、結果が後から得られる施設検索サーバ側の検索結果については必要に応じて表示するようにした。
150 施設検索サーバ
110 マイクロホン
112 音声保存バッファ
114、160 音声認識部
116、162 認識辞書
118 辞書生成部
120 認識結果保存バッファ
122 優先度調整部
124 操作部
126 認識結果表示処理部
128 表示装置
130 検索結果保存バッファ
132 検索結果表示処理部
134、168 通信部
164 施設検索部
166 施設DB(データベース)
Claims (15)
- 話者が発声した音声を保存する音声保存手段と、
第1の認識辞書を用いて、前記音声保存手段に保存された音声に対して音声認識処理を行う第1の音声認識手段と、
前記第1の認識辞書と異なる第2の認識辞書を用いて、前記音声保存手段に保存された音声に対して音声認識処理を行う第2の音声認識手段と、
前記第1および第2の音声認識手段の認識結果に基づいて、前記音声保存手段に保存された音声に対応する認識候補を決定する認識結果決定手段と、
を備えることを特徴とする音声認識システム。 - 請求項1において、
前記第1の音声認識手段による音声認識処理の処理時間は、前記第2の音声認識処理手段による音声認識処理の処理時間よりも短く、
前記第2の音声認識手段による音声認識処理の認識精度は、前記第1の音声認識処理手段による音声認識処理の認識精度よりも高いことを特徴とする音声認識システム。 - 請求項1または2において、
前記第1および第2の音声認識手段による音声認識処理は、互いに異なる音響モデルおよび照合アルゴリズムを用いて行われることを特徴とする音声認識システム。 - 請求項1〜3のいずれかにおいて、
前記音声保存手段、前記第1の音声認識手段、前記認識結果決定手段は、車両に設けられており、
前記第2の音声認識手段は、ネットワークを介して接続された車両外部のサーバに設けられていることを特徴とする音声認識システム。 - 請求項4において、
前記第2の音声認識手段による音声認識処理によって複数の認識候補に絞られたときに、これら複数の認識候補に対応する前記第1の認識辞書を作成する辞書作成手段をさらに備え、
前記認識結果決定手段は、前記辞書作成手段によって作成された前記第1の認識辞書を用いた前記第1の音声認識手段の認識結果を用いて、前記音声保存手段に保存された音声に対応する認識候補を決定することを特徴とする音声認識システム。 - 請求項5において、
前記認識結果決定手段は、前記第2の音声認識手段による音声認識処理によって1つの認識候補に絞られたときに、この認識候補を、前記音声保存手段に保存された音声に対応する認識候補として決定することを特徴とする音声認識システム。 - 請求項5または6において、
前記辞書作成手段は、前記複数の認識候補のそれぞれに対応する読みを書記素−音素変換により生成し、この読みを音声波形に変換することにより、前記第1の認識辞書を作成することを特徴とする音声認識システム。 - 請求項5〜7のいずれかに記載の前記サーバは、複数のコンテンツに関する情報が格納されたコンテンツデータベースと、前記認識結果決定手段によって決定された認識候補を検索キーワードとして前記複数のコンテンツの中から一つあるいは複数のコンテンツに関する情報を検索するコンテンツ検索手段とを備えることを特徴とする検索システム。
- 請求項4において、
前記認識結果決定手段は、前記第1の音声認識手段による認識結果が誤りであった場合に、前記第2の音声認識手段による音声認識処理を依頼することを特徴とする音声認識システム。 - 請求項9において、
前記第1の音声認識手段による認識結果を利用者に通知する通知手段と、
前記通知手段による通知に応じて、認識結果が誤りであった場合にその旨を利用者が指示する操作手段と、
をさらに備えることを特徴とする音声認識システム。 - 請求項9または10に記載の前記サーバは、複数のコンテンツに関する情報が格納されたコンテンツデータベースと、前記認識結果決定手段によって決定された認識候補を検索キーワードとして前記複数のコンテンツの中から一つあるいは複数のコンテンツに関する情報を検索するコンテンツ検索手段とを備えることを特徴とする検索システム。
- 請求項4において、
過去に前記第2の音声認識手段による音声認識処理によって抽出された認識候補であって、正しいことが確かめられた認識候補に対応する前記第1の認識辞書を作成する辞書作成手段をさらに備え、
前記認識結果決定手段は、前記辞書作成手段によって作成された前記第1の認識辞書を用いた前記第1の音声認識手段の認識結果を用いて、前記音声保存手段に保存された音声に対応する認識候補を決定することを特徴とする音声認識システム。 - 請求項12において、
前記辞書作成手段は、前記複数の認識候補のそれぞれに対応する読みを書記素−音素変換により生成し、この読みを音声波形に変換することにより、前記第1の認識辞書を作成することを特徴とする音声認識システム。 - 請求項12または13に記載の前記認識結果決定手段は、前記音声保存手段に保存された音声に対応する認識候補とともにこの認識候補に対応する文字情報を決定し、
前記サーバは、複数のコンテンツに関する情報が格納されたコンテンツデータベースと、前記認識結果決定手段によって決定された前記文字情報を検索キーワードとして前記複数のコンテンツの中から一つあるいは複数のコンテンツに関する情報を検索するコンテンツ検索手段とを備えることを特徴とする検索システム。 - 請求項4に記載の前記車両には、複数のコンテンツに関する情報が格納された第1のコンテンツデータベースと、前記第1の音声認識手段による音声認識処理によって得られた認識結果を検索キーワードとしてコンテンツに関する情報を検索する第1のコンテンツ検索手段と、前記第1のコンテンツ検索手段による検索結果としてのコンテンツに関する情報を表示する表示手段とが設けられており、
前記サーバには、複数のコンテンツに関する情報が格納された第2のコンテンツデータベースと、前記第2の音声認識手段による音声認識処理によって得られた認識結果を検索キーワードとしてコンテンツに関する情報を検索する第2のコンテンツ検索手段とが備わっており、
前記第2のコンテンツ検索手段による検索結果としてのコンテンツに関する情報が得られるまでは、前記表示手段に前記第1のコンテンツ検索手段による検索結果としてのコンテンツに関する情報が表示され、前記第2のコンテンツ検索手段による検索結果としてのコンテンツに関する情報が得られた後はこのコンテンツに関する情報が前記表示手段に表示されることを特徴とする検索システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011029301A JP5606951B2 (ja) | 2011-02-15 | 2011-02-15 | 音声認識システムおよびこれを用いた検索システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011029301A JP5606951B2 (ja) | 2011-02-15 | 2011-02-15 | 音声認識システムおよびこれを用いた検索システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012168349A true JP2012168349A (ja) | 2012-09-06 |
JP5606951B2 JP5606951B2 (ja) | 2014-10-15 |
Family
ID=46972567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011029301A Active JP5606951B2 (ja) | 2011-02-15 | 2011-02-15 | 音声認識システムおよびこれを用いた検索システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5606951B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014071449A (ja) * | 2012-09-28 | 2014-04-21 | Samsung Electronics Co Ltd | 電子装置、サーバー及びその制御方法 |
JP2014182307A (ja) * | 2013-03-19 | 2014-09-29 | Sharp Corp | 音声認識システム、および発話システム |
JP2014191030A (ja) * | 2013-03-26 | 2014-10-06 | Fuji Soft Inc | 音声認識端末およびコンピュータ端末を用いる音声認識方法 |
JP2015146055A (ja) * | 2015-05-21 | 2015-08-13 | シャープ株式会社 | 音声認識システム、および音声処理装置 |
JP2017007652A (ja) * | 2015-06-08 | 2017-01-12 | ロベルト・ボッシュ・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツングRobert Bosch Gmbh | 言語制御のための文脈を認識する方法、言語制御のための言語制御信号を決定する方法、および方法を実施するための装置 |
CN109524002A (zh) * | 2018-12-28 | 2019-03-26 | 江苏惠通集团有限责任公司 | 智能语音识别方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004325688A (ja) * | 2003-04-23 | 2004-11-18 | Toyota Motor Corp | 音声認識システム |
JP2005037662A (ja) * | 2003-07-14 | 2005-02-10 | Denso Corp | 音声対話システム |
JP2007041089A (ja) * | 2005-08-01 | 2007-02-15 | Hitachi Ltd | 情報端末および音声認識プログラム |
JP2009265307A (ja) * | 2008-04-24 | 2009-11-12 | Toyota Motor Corp | 音声認識装置及びこれを用いる車両システム |
JP2010224301A (ja) * | 2009-03-24 | 2010-10-07 | Denso Corp | 音声認識システム |
-
2011
- 2011-02-15 JP JP2011029301A patent/JP5606951B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004325688A (ja) * | 2003-04-23 | 2004-11-18 | Toyota Motor Corp | 音声認識システム |
JP2005037662A (ja) * | 2003-07-14 | 2005-02-10 | Denso Corp | 音声対話システム |
JP2007041089A (ja) * | 2005-08-01 | 2007-02-15 | Hitachi Ltd | 情報端末および音声認識プログラム |
JP2009265307A (ja) * | 2008-04-24 | 2009-11-12 | Toyota Motor Corp | 音声認識装置及びこれを用いる車両システム |
JP2010224301A (ja) * | 2009-03-24 | 2010-10-07 | Denso Corp | 音声認識システム |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014071449A (ja) * | 2012-09-28 | 2014-04-21 | Samsung Electronics Co Ltd | 電子装置、サーバー及びその制御方法 |
US9582245B2 (en) | 2012-09-28 | 2017-02-28 | Samsung Electronics Co., Ltd. | Electronic device, server and control method thereof |
US10120645B2 (en) | 2012-09-28 | 2018-11-06 | Samsung Electronics Co., Ltd. | Electronic device, server and control method thereof |
US11086596B2 (en) | 2012-09-28 | 2021-08-10 | Samsung Electronics Co., Ltd. | Electronic device, server and control method thereof |
JP2014182307A (ja) * | 2013-03-19 | 2014-09-29 | Sharp Corp | 音声認識システム、および発話システム |
JP2014191030A (ja) * | 2013-03-26 | 2014-10-06 | Fuji Soft Inc | 音声認識端末およびコンピュータ端末を用いる音声認識方法 |
JP2015146055A (ja) * | 2015-05-21 | 2015-08-13 | シャープ株式会社 | 音声認識システム、および音声処理装置 |
JP2017007652A (ja) * | 2015-06-08 | 2017-01-12 | ロベルト・ボッシュ・ゲゼルシャフト・ミト・ベシュレンクテル・ハフツングRobert Bosch Gmbh | 言語制御のための文脈を認識する方法、言語制御のための言語制御信号を決定する方法、および方法を実施するための装置 |
CN109524002A (zh) * | 2018-12-28 | 2019-03-26 | 江苏惠通集团有限责任公司 | 智能语音识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5606951B2 (ja) | 2014-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107039038B (zh) | 学习个性化实体发音 | |
US9905228B2 (en) | System and method of performing automatic speech recognition using local private data | |
US9239829B2 (en) | Speech recognition device | |
KR101670150B1 (ko) | 이름 발음을 위한 시스템 및 방법 | |
JP5334178B2 (ja) | 音声認識装置およびデータ更新方法 | |
US8019604B2 (en) | Method and apparatus for uniterm discovery and voice-to-voice search on mobile device | |
US9177545B2 (en) | Recognition dictionary creating device, voice recognition device, and voice synthesizer | |
US20080130699A1 (en) | Content selection using speech recognition | |
US20180074661A1 (en) | Preferred emoji identification and generation | |
JP5606951B2 (ja) | 音声認識システムおよびこれを用いた検索システム | |
US9997155B2 (en) | Adapting a speech system to user pronunciation | |
EP3736807A1 (en) | Apparatus for media entity pronunciation using deep learning | |
EP2747077A1 (en) | Voice recognition system, recognition dictionary logging system, and audio model identifier series generation device | |
WO2008065488A1 (en) | Method, apparatus and computer program product for providing a language based interactive multimedia system | |
JP2014106927A (ja) | 情報処理システム | |
JP2013088477A (ja) | 音声認識システム | |
WO2016136207A1 (ja) | 音声対話装置、音声対話システム、音声対話装置の制御方法、および、プログラム | |
JP2018040904A (ja) | 音声認識装置および音声認識方法 | |
KR20140123369A (ko) | 음성인식 질의응답 시스템 및 그것의 운용방법 | |
JP5335165B2 (ja) | 発音情報生成装置、車載情報装置およびデータベース生成方法 | |
CN107885720B (zh) | 关键词生成装置以及关键词生成方法 | |
CN112820294B (zh) | 语音识别方法、装置、存储介质及电子设备 | |
JP2009282835A (ja) | 音声検索装置及びその方法 | |
JP2011180416A (ja) | 音声合成装置、音声合成方法およびカーナビゲーションシステム | |
WO2016136208A1 (ja) | 音声対話装置、音声対話システム、および、音声対話装置の制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130821 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140318 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140401 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140526 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140617 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140801 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140826 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140827 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5606951 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |