JP5942559B2 - 音声認識装置 - Google Patents
音声認識装置 Download PDFInfo
- Publication number
- JP5942559B2 JP5942559B2 JP2012093014A JP2012093014A JP5942559B2 JP 5942559 B2 JP5942559 B2 JP 5942559B2 JP 2012093014 A JP2012093014 A JP 2012093014A JP 2012093014 A JP2012093014 A JP 2012093014A JP 5942559 B2 JP5942559 B2 JP 5942559B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- dictionary
- name
- dictionary data
- creation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013500 data storage Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 11
- 238000000034 method Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Navigation (AREA)
Description
車両に搭載可能な装置に限らず、例えば自宅等の建物内に設置される装置であっても良く、即ち、車両とは関係ない状況で使用される装置であっても良い。
デバイスとしては、USBメモリに限らず、例えば楽曲再生端末等の他の機器であっても良い。デバイスが楽曲再生端末である場合には、音声認識装置と楽曲再生端末とが両者の間でBluetooth(登録商標)通信を行うことで、音声認識装置が楽曲再生端末から楽曲情報を取得するようにしても良い。
最新の辞書データの作成中に過去の辞書データを用いて音声認識を行った場合に、その認識結果を出力する際に、その音声結果が過去の辞書データを用いて音声認識を行ったことによる旨を報知するようにしても良い。
楽曲を再生する機能が音声認識装置とは別の装置に設けられている構成でも良い。
Claims (14)
- 複数の名称データを含むテキスト情報をデバイス(7)から取得するテキスト情報取得手段(4)と、
前記テキスト情報取得手段(4)により取得されたテキスト情報に含まれる複数の名称データに基づく辞書データを名称の種別毎に作成する辞書データ作成手段(9)と、
前記辞書データ作成手段(9)により作成された辞書データを辞書データ保存手段(15、16)に保存させる辞書データ保存制御手段(10)と、
辞書データの辞書登録を名称の種別毎に行う辞書登録手段(11)と、
前記辞書登録手段(11)により辞書登録が行われた辞書データを用いて音声認識を行う音声認識手段(12)と、
前記辞書データ保存手段(15、16)に保存されている辞書データのバックアップデータを作成するバックアップデータ作成手段(13)と、を備え、
前記辞書データ作成手段(9)は、名称データに基づく辞書データの作成を名称の種別毎に開始し、
前記辞書登録手段(11)は、今回のテキスト情報を取得するデバイス(7)と同じデバイス(7)から前回に取得したテキスト情報に対応するバックアップデータが前記バックアップデータ作成手段(13)により作成されている状態では、バックアップデータとして作成されている辞書データの辞書登録を名称の種別毎に行っておき、前記辞書データ作成手段により一の名称データに基づく辞書データの作成が名称の種別毎に完了される毎に、その作成が完了された一の名称データに基づく辞書データの辞書登録を名称の種別毎に行うことを特徴とする音声認識装置。 - 請求項1に記載した音声認識装置において、
前記辞書データ作成手段(9)は、複数の名称データに基づく辞書データの作成を、前記音声認識手段(12)が過去に音声認識を行った際に辞書データとして用いて頻度が多い順序にしたがって開始することを特徴とする音声認識装置。 - 請求項1に記載した音声認識装置において、
前記辞書データ作成手段(9)は、複数の名称データに基づく辞書データの作成を、その辞書データを作成する対象の件数が少ない順序にしたがって開始することを特徴とする音声認識装置。 - 請求項1から3の何れか一項に記載した音声認識装置において、
前記辞書データ作成手段(9)は、一の名称データが前回の接続時から変更されている場合に、一の名称データに基づく辞書データの作成を開始し、一の名称データが前回の接続時から変更されていない場合に、一の名称データに基づく辞書データの作成を行わないことを特徴とする音声認識装置。 - 請求項1から4の何れか一項に記載した音声認識装置において、
名称と言い換え語データとを対応付ける対応付け手段(8)を備え、
前記辞書データ作成手段(9)は、全ての名称データに基づく辞書データの作成を完了した後に、前記対応付け手段(8)により名称に対応付けられた言い換え語データに基づく辞書データの作成を開始し、
前記辞書登録手段(11)は、前記辞書データ作成手段(9)により言い換え語データに基づく辞書データの作成が完了されることで、その作成が完了された言い換え語データに基づく辞書データの辞書登録を行うことを特徴とする音声認識装置。 - 請求項5に記載した音声認識装置において、
前記辞書データ作成手段(9)は、前記対応付け手段(8)により複数の名称に複数の言い換え語データが対応付けられた場合には、その複数の言い換え語データに基づく辞書データの作成を名称の種別毎に開始し、
前記辞書登録手段(11)は、前記辞書データ作成手段(9)により一の言い換え語データに基づく辞書データの作成が完了される毎に、その作成が完了された一の言い換え語データに基づく辞書データの辞書登録を行うことを特徴とする音声認識装置。 - 請求項5又は6に記載した音声認識装置において、
前記辞書データ作成手段(9)は、複数の言い換え語データに基づく辞書データの作成を、前記音声認識手段(12)が過去に音声認識を行った際に辞書データとして用いて頻度が多い順序にしたがって開始することを特徴とする音声認識装置。 - 請求項5又は6に記載した音声認識装置において、
前記辞書データ作成手段(9)は、複数の言い換え語データに基づく辞書データの作成を、その辞書データを作成する対象の件数が少ない順序にしたがって開始することを特徴とする音声認識装置。 - 請求項5から8の何れか一項に記載した音声認識装置において、
前記辞書データ作成手段(9)は、一の言い換え語データが前回の接続時から変更されている場合に、一の言い換え語データに基づく辞書データの作成を開始し、一の言い換え語データが前回の接続時から変更されていない場合に、一の言い換え語データに基づく辞書データの作成を行わないことを特徴とする音声認識装置。 - 請求項1から9の何れか一項に記載した音声認識装置において、
前記バックアップデータ作成手段(13)によりバックアップデータが作成されている状態であって前記辞書データ作成手段(9)による辞書データの作成中や前記辞書登録手段(11)による辞書登録中の期間に、前記音声認識手段(12)がバックアップデータを用いて音声認識可能である旨を報知手段(18)により報知する報知制御手段(14)を備えたことを特徴とする音声認識装置。 - 請求項10に記載した音声認識装置において、
前記報知制御手段(14)は、名称データや言い換え語データに基づく辞書データの作成が完了された後に、前記音声認識手段(12)が当該辞書データを用いて音声認識可能である旨を前記報知手段(18)により報知することを特徴とする音声認識装置。 - 請求項1から11の何れか一項に記載した音声認識装置において、
前記バックアップデータ作成手段(13)によりバックアップデータが作成されていない状態であって前記辞書データ作成手段(9)による辞書データの作成中の期間に、名称データや言い換え語データに基づく辞書データの作成が完了された後に、前記音声認識手段(12)が当該辞書データを用いて音声認識可能である旨を報知手段(18)により報知する報知制御手段(14)を備えたことを特徴とする音声認識装置。 - 請求項11又は12に記載した音声認識装置において、
前記報知制御手段(14)は、名称データや言い換え語データに基づく辞書データの作成が完了された直後のタイミングで、前記音声認識手段(12)が当該辞書データを用いて音声認識可能である旨を報知手段(18)により報知することを特徴とする音声認識装置。 - 請求項1から13の何れか一項に記載した音声認識装置において、
前記テキスト情報取得手段(4)は、少なくともアーティスト名、アルバム名、タイトル名、プレイリスト名の名称データを含む楽曲情報をテキスト情報として取得することを特徴とする音声認識装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012093014A JP5942559B2 (ja) | 2012-04-16 | 2012-04-16 | 音声認識装置 |
CN201380020070.7A CN104246872B (zh) | 2012-04-16 | 2013-01-29 | 声音识别装置 |
PCT/JP2013/000458 WO2013157174A1 (ja) | 2012-04-16 | 2013-01-29 | 音声認識装置 |
US14/384,400 US9704479B2 (en) | 2012-04-16 | 2013-01-29 | Speech recognition device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012093014A JP5942559B2 (ja) | 2012-04-16 | 2012-04-16 | 音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013222033A JP2013222033A (ja) | 2013-10-28 |
JP5942559B2 true JP5942559B2 (ja) | 2016-06-29 |
Family
ID=49383149
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012093014A Expired - Fee Related JP5942559B2 (ja) | 2012-04-16 | 2012-04-16 | 音声認識装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US9704479B2 (ja) |
JP (1) | JP5942559B2 (ja) |
CN (1) | CN104246872B (ja) |
WO (1) | WO2013157174A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014050981A1 (ja) * | 2012-09-27 | 2014-04-03 | 日本電気株式会社 | テキスト情報監視用辞書作成装置、テキスト情報監視用辞書作成方法、及び、テキスト情報監視用辞書作成プログラム |
WO2015178715A1 (en) * | 2014-05-23 | 2015-11-26 | Samsung Electronics Co., Ltd. | System and method of providing voice-message call service |
US11036926B2 (en) | 2018-05-21 | 2021-06-15 | Samsung Electronics Co., Ltd. | Generating annotated natural language phrases |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6304523B1 (en) | 1999-01-05 | 2001-10-16 | Openglobe, Inc. | Playback device having text display and communication with remote database of titles |
US20020048224A1 (en) | 1999-01-05 | 2002-04-25 | Dygert Timothy W. | Playback device having text display and communication with remote database of titles |
JP3911178B2 (ja) | 2002-03-19 | 2007-05-09 | シャープ株式会社 | 音声認識辞書作成装置および音声認識辞書作成方法、音声認識装置、携帯端末器、音声認識システム、音声認識辞書作成プログラム、並びに、プログラム記録媒体 |
US7584102B2 (en) * | 2002-11-15 | 2009-09-01 | Scansoft, Inc. | Language model for use in speech recognition |
US7437296B2 (en) | 2003-03-13 | 2008-10-14 | Matsushita Electric Industrial Co., Ltd. | Speech recognition dictionary creation apparatus and information search apparatus |
JPWO2007138875A1 (ja) * | 2006-05-31 | 2009-10-01 | 日本電気株式会社 | 音声認識用単語辞書・言語モデル作成システム、方法、プログラムおよび音声認識システム |
JP2008058409A (ja) * | 2006-08-29 | 2008-03-13 | Aisin Aw Co Ltd | 音声認識方法及び音声認識装置 |
JP4867622B2 (ja) * | 2006-11-29 | 2012-02-01 | 日産自動車株式会社 | 音声認識装置、および音声認識方法 |
CN101558443B (zh) * | 2006-12-15 | 2012-01-04 | 三菱电机株式会社 | 声音识别装置 |
US8639214B1 (en) * | 2007-10-26 | 2014-01-28 | Iwao Fujisaki | Communication device |
JPWO2010018796A1 (ja) * | 2008-08-11 | 2012-01-26 | 旭化成株式会社 | 例外語辞書作成装置、例外語辞書作成方法及びそのプログラム、並びに、音声認識装置及び音声認識方法 |
JP5465926B2 (ja) | 2009-05-22 | 2014-04-09 | アルパイン株式会社 | 音声認識辞書作成装置及び音声認識辞書作成方法 |
JP2011039202A (ja) * | 2009-08-07 | 2011-02-24 | Aisin Aw Co Ltd | 車載情報処理装置 |
JP5693834B2 (ja) * | 2009-09-17 | 2015-04-01 | アルパイン株式会社 | 音声認識装置及び音声認識方法 |
JP2011095498A (ja) * | 2009-10-29 | 2011-05-12 | Aisin Aw Co Ltd | 車載情報処理装置及び車載情報処理方法 |
JP2011150169A (ja) * | 2010-01-22 | 2011-08-04 | Alpine Electronics Inc | 音声認識装置 |
DE112010005168B4 (de) * | 2010-01-22 | 2018-12-13 | Mitsubishi Electric Corporation | Erkennungswörterbuch-Erzeugungsvorrichtung, Spracherkennungsvorrichtung und Stimmensynthesizer |
US20110238412A1 (en) * | 2010-03-26 | 2011-09-29 | Antoine Ezzat | Method for Constructing Pronunciation Dictionaries |
US20120239399A1 (en) * | 2010-03-30 | 2012-09-20 | Michihiro Yamazaki | Voice recognition device |
-
2012
- 2012-04-16 JP JP2012093014A patent/JP5942559B2/ja not_active Expired - Fee Related
-
2013
- 2013-01-29 CN CN201380020070.7A patent/CN104246872B/zh not_active Expired - Fee Related
- 2013-01-29 WO PCT/JP2013/000458 patent/WO2013157174A1/ja active Application Filing
- 2013-01-29 US US14/384,400 patent/US9704479B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
WO2013157174A1 (ja) | 2013-10-24 |
JP2013222033A (ja) | 2013-10-28 |
US9704479B2 (en) | 2017-07-11 |
US20150100317A1 (en) | 2015-04-09 |
CN104246872A (zh) | 2014-12-24 |
CN104246872B (zh) | 2017-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9105267B2 (en) | Speech recognition apparatus | |
US9269351B2 (en) | Voice recognition device | |
JP2010224236A (ja) | 音声出力装置 | |
JP5942559B2 (ja) | 音声認識装置 | |
JP5275349B2 (ja) | 情報処理装置、情報作成装置、情報処理方法、情報作成方法、情報処理プログラム、情報作成プログラム、および記録媒体 | |
JP6896335B2 (ja) | 音声認識装置および音声認識方法 | |
JP5606951B2 (ja) | 音声認識システムおよびこれを用いた検索システム | |
JP5927969B2 (ja) | 音声認識システム | |
JP2007199979A (ja) | 地図表示装置およびナビゲーション装置 | |
JP2000122685A (ja) | ナビゲーションシステム | |
JP5446540B2 (ja) | 情報検索装置、制御方法及びプログラム | |
JP5500647B2 (ja) | 動的音声認識辞書の生成方法及びその生成装置 | |
JP2015129672A (ja) | 施設検索装置および方法 | |
JP5522679B2 (ja) | 検索装置 | |
JPH11325946A (ja) | 車載用ナビゲーション装置 | |
JP5533576B2 (ja) | 情報作成装置、情報作成方法及びプログラム | |
JP2005031260A (ja) | 情報処理方法及び装置 | |
WO2018100705A1 (ja) | 音声認識装置及び音声認識方法 | |
JP2017125941A (ja) | 情報処理装置及び情報処理方法並びに前記情報処理装置での処理をコンピュータにて実行させるプログラム | |
EP3062494B1 (en) | Electronic device and telephone number matching determination method | |
JP5895878B2 (ja) | 入力支援システム、方法およびプログラム | |
JP2018156278A (ja) | 情報表示装置 | |
JP2020183985A (ja) | 音声認識システム | |
JP2005265477A (ja) | 車載ナビゲーションシステム | |
JP2019124559A (ja) | 表示制御装置、表示制御方法及び表示制御プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141022 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151006 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160426 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160509 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5942559 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |