JP2010271562A - 音声認識辞書作成装置及び音声認識辞書作成方法 - Google Patents
音声認識辞書作成装置及び音声認識辞書作成方法 Download PDFInfo
- Publication number
- JP2010271562A JP2010271562A JP2009123866A JP2009123866A JP2010271562A JP 2010271562 A JP2010271562 A JP 2010271562A JP 2009123866 A JP2009123866 A JP 2009123866A JP 2009123866 A JP2009123866 A JP 2009123866A JP 2010271562 A JP2010271562 A JP 2010271562A
- Authority
- JP
- Japan
- Prior art keywords
- speech recognition
- recognition dictionary
- content
- text
- updated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000010586 diagram Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000010365 information processing Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0635—Training updating or merging of old and new templates; Mean values; Weighting
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Abstract
【解決手段】音声認識辞書作成装置は、外部機器又は媒体から音声認識の対象となるテキストを入力する入力手段と、テキストが所定の項目のファイル毎に格納される記憶手段と、テキストを解析して読みデータを生成する読みデータ生成手段と、所定の項目のファイル毎にテキストの読みデータが格納されたコンテンツ辞書により構成される音声認識辞書と、入力手段を介して入力されたテキストを記憶手段に格納する制御手段と、を有する。制御手段は、記憶手段に格納したテキストを含む所定の項目のファイルが更新されたとき、前記コンテンツ辞書の総数を検出し、総数が所定の制限値未満のときに更新された所定の項目ごとにコンテンツ辞書を作成して音声認識辞書を更新する。
【選択図】図5
Description
200…情報処理装置、
1…入力部、
2…記憶部、
4…情報抽出部、
5…TTSエンジン、
5a…テキスト解析部、
5b…読みデータ生成部、
6…制御部、
7…音声認識辞書生成部、
8…音声認識辞書、
9…音声認識エンジン、
11…音声認識制御部。
Claims (18)
- 外部機器又は媒体から音声認識の対象となるテキストを入力する入力手段と、
前記テキストが所定の項目のファイル毎に格納される記憶手段と、
テキストを解析して読みデータを生成する読みデータ生成手段と、
前記所定の項目のファイル毎に前記テキストの読みデータが格納されたコンテンツ辞書により構成される音声認識辞書と、
前記入力手段を介して入力された前記テキストを前記記憶手段に格納する制御手段と、
を有し、
前記制御手段は、前記記憶手段に格納した前記テキストを含む所定の項目のファイルが更新されたとき、前記コンテンツ辞書の総数を検出し、当該総数が所定の制限値未満のときに前記更新された前記所定の項目ごとに前記コンテンツ辞書を作成して前記音声認識辞書を更新することを特徴とする音声認識辞書作成装置。 - 前記制御手段は、前記コンテンツ辞書の総数が所定の制限値以上のとき、前記外部機器又は媒体に応じたコンテンツ辞書を前記音声認識辞書から削除し、新たに当該外部機器又は媒体に応じたすべての音声認識の対象となるテキストを各コンテンツ毎に前記記憶手段から抽出して、前記コンテンツ辞書を作成して、前記音声認識辞書を更新することを特徴とする請求項1に記載の音声認識辞書作成装置。
- 前記制御手段は、前記外部機器又は媒体が接続され、前記テキストが前記記憶手段の所定の項目のファイルに格納されたとき、前記所定の項目のファイルが更新されたと判定することを特徴とする請求項1に記載の音声認識辞書作成装置。
- 前記所定の項目は、前記媒体がCDのとき、楽曲情報であって、タイトル名、アーティスト名、アルバム名、作曲者名、ジャンルであることを特徴とする請求項3に記載の音声認識辞書作成装置。
- 前記制御手段は、前記音声認識の対象となるテキストのうち、同一名称のテキストは統合して一つのテキストとして前記コンテンツ辞書を作成することを特徴とする請求項2に記載の音声認識辞書作成装置。
- 前記外部機器は、デジタルオーディオ機器又は携帯電話機であり、前記媒体は、CD又はDVDであることを特徴とする請求項3に記載の音声認識辞書作成装置。
- 前記制御手段は、前記媒体がCDのとき、前記所定の項目のうちアーティスト名に対して前記記憶手段に格納されている楽曲情報に一致するアーティスト名が存在しないとき、又は、前記コンテンツのうち作曲者名に対して前記記憶手段に格納されている楽曲情報に一致する作曲者名がないときに、情報が更新されたと判定することを特徴とする請求項6に記載の音声認識辞書作成装置。
- 前記制御手段は、前記媒体がCDのとき、前記所定の項目のうちアルバム名に対して前記記憶手段に格納されている楽曲情報に一致するアルバム名がないとき、又は、一致するアルバム名とTOC情報が異なるとき、情報が更新されたと判定することを特徴とする請求項6に記載の音声認識辞書作成装置。
- 記憶手段に格納された音声認識の対象となるテキストが含まれる所定の項目のファイルの情報が更新されたか否かを判定するステップと、
外部機器又は媒体から取得した音声認識の対象となるテキストが格納された前記所定の項目のファイルの情報が更新されたとき、
前記所定の項目のファイル毎に前記テキストの読みデータが格納されたコンテンツ辞書の総数を検出するステップと、
前記コンテンツ辞書の総数と所定の制限値とを比較するステップと、
前記総数が所定の制限値未満のとき、前記更新された前記所定の項目ごとに前記外部機器又は媒体に応じた音声認識の対象となるテキストを各コンテンツ毎に前記記憶手段から抽出するステップと、
前記テキストを変換して読みデータを取得するステップと、
前記読みデータを登録して音声認識辞書を更新するステップと、
を有することを特徴とする音声認識辞書作成方法。 - 前記コンテンツ辞書の総数と所定の制限値とを比較するステップの後に、
前記総数が所定の制限値以上のとき、前記外部機器又は媒体に応じたコンテンツ辞書を前記音声認識辞書から削除するステップと、
新たに当該外部機器又は媒体に応じたすべての音声認識の対象となるテキストを各コンテンツ毎に前記記憶手段から抽出するステップと、
前記テキストを変換して読みデータを取得するステップと、
前記読みデータを登録して音声認識辞書を更新するステップと、
を有することを特徴とする請求項9に記載の音声認識辞書作成方法。 - 前記所定の項目のファイルの情報が更新されたか否かを判定するステップは、
前記外部機器又は媒体が接続されて、前記テキストが前記記憶手段の所定の項目のファイルに格納されたか否かを判定するステップであることを特徴とする請求項9に記載の音声認識辞書作成方法。 - 前記所定の項目は、前記媒体がCDのとき、楽曲情報であって、タイトル名、アーティスト名、アルバム名、作曲者名、ジャンルであることを特徴とする請求項11に記載の音声認識辞書作成方法。
- 前記読みデータを取得するステップは、
前記音声認識の対象となるテキストのうち同一名称のテキストを検出するステップと、
前記同一名称のテキストを統合して一つのテキストとするステップと、
を含むことを特徴とする請求項10に記載の音声認識辞書作成方法。 - 前記外部機器は、デジタルオーディオ機器又は携帯電話機であり、前記媒体は、CD又はDVDであることを特徴とする請求項11に記載の音声認識辞書作成方法。
- 前記媒体がCDのとき、
前記所定の項目のファイルの情報が更新されたか否かを判定するステップは、
前記所定の項目のうちアーティスト名を抽出するステップと、
前記記憶手段に当該アーティスト名が含まれているか否かを判定するステップと、
一致するアーティスト名がないとき、情報が更新されたと判定するステップと、
を含むことを特徴とする請求項14に記載の音声認識辞書作成方法。 - 前記媒体がCDのとき、
前記所定の項目のファイルの情報が更新されたか否かを判定するステップは、
前記所定の項目のうち作曲者名を抽出するステップと、
前記記憶手段に当該作曲者名が含まれているか否かを判定するステップと、
一致する作曲者名がないとき、情報が更新された判定するステップと、
を含むことを特徴とする請求項14に記載の音声認識辞書作成方法。 - 前記媒体がCDのとき、
前記所定の項目のファイルの情報が更新されたか否かを判定するステップは、
前記所定の項目のうちアルバム名を抽出するステップと、
前記記憶手段に当該アルバム名が含まれているか否かを判定するステップと、
一致するアルバム名がないとき、情報が更新されたと判定するステップと、
を含むことを特徴とする請求項14に記載の音声認識辞書作成方法。 - 前記媒体がCDのとき、
前記所定の項目のファイルの情報が更新されたか否かを判定するステップは、
前記所定の項目のうちアルバム名を抽出するステップと、
前記記憶手段に格納されているアルバム名とTOC情報が異なるとき、情報が更新されたと判定するステップと、
を含むことを特徴とする請求項14に記載の音声認識辞書作成方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009123866A JP5465926B2 (ja) | 2009-05-22 | 2009-05-22 | 音声認識辞書作成装置及び音声認識辞書作成方法 |
US12/707,966 US8706484B2 (en) | 2009-05-22 | 2010-02-18 | Voice recognition dictionary generation apparatus and voice recognition dictionary generation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009123866A JP5465926B2 (ja) | 2009-05-22 | 2009-05-22 | 音声認識辞書作成装置及び音声認識辞書作成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010271562A true JP2010271562A (ja) | 2010-12-02 |
JP5465926B2 JP5465926B2 (ja) | 2014-04-09 |
Family
ID=43125165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009123866A Active JP5465926B2 (ja) | 2009-05-22 | 2009-05-22 | 音声認識辞書作成装置及び音声認識辞書作成方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8706484B2 (ja) |
JP (1) | JP5465926B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013102954A1 (ja) * | 2012-01-06 | 2013-07-11 | パナソニック株式会社 | 放送受信装置および音声辞書構築処理方法 |
JP2013167739A (ja) * | 2012-02-15 | 2013-08-29 | Denso Corp | 音声認識システム |
WO2013157174A1 (ja) * | 2012-04-16 | 2013-10-24 | 株式会社デンソー | 音声認識装置 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110114797A (ko) * | 2010-04-14 | 2011-10-20 | 한국전자통신연구원 | 음성을 이용한 모바일 검색 장치 및 방법 |
KR20140060040A (ko) * | 2012-11-09 | 2014-05-19 | 삼성전자주식회사 | 디스플레이장치, 음성취득장치 및 그 음성인식방법 |
US10628567B2 (en) * | 2016-09-05 | 2020-04-21 | International Business Machines Corporation | User authentication using prompted text |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1124685A (ja) * | 1997-07-02 | 1999-01-29 | Ricoh Co Ltd | カラオケ装置 |
JPH11232159A (ja) * | 1998-02-13 | 1999-08-27 | The Japan Reserch Institute Ltd | ファイル管理方法およびファイル管理のためのプログラムを記憶した媒体 |
JP2000035797A (ja) * | 1998-07-17 | 2000-02-02 | Nec Corp | 音声認識装置 |
JP2001014332A (ja) * | 1999-06-30 | 2001-01-19 | Denso Corp | 情報サービスシステム |
JP2002251235A (ja) * | 2001-02-23 | 2002-09-06 | Fujitsu Ltd | 利用者インタフェースシステム |
JP2003157257A (ja) * | 2001-11-22 | 2003-05-30 | Oki Electric Ind Co Ltd | 辞書装置及び自然言語処理システム |
JP2003241789A (ja) * | 2002-02-21 | 2003-08-29 | Alpine Electronics Inc | 音声認識辞書作成装置および方法 |
JP2006012257A (ja) * | 2004-06-24 | 2006-01-12 | Fujitsu Ten Ltd | 楽曲選択装置、楽曲選択システム、及び楽曲選択方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6505160B1 (en) * | 1995-07-27 | 2003-01-07 | Digimarc Corporation | Connected audio and other media objects |
US6953886B1 (en) * | 1998-06-17 | 2005-10-11 | Looney Productions, Llc | Media organizer and entertainment center |
JP2001309257A (ja) | 2000-04-26 | 2001-11-02 | Sanyo Electric Co Ltd | デジタルテレビ放送受信機 |
JP2002221980A (ja) * | 2001-01-25 | 2002-08-09 | Oki Electric Ind Co Ltd | テキスト音声変換装置 |
JP2004053979A (ja) | 2002-07-22 | 2004-02-19 | Alpine Electronics Inc | 音声認識辞書の作成方法及び音声認識辞書作成システム |
US7437296B2 (en) * | 2003-03-13 | 2008-10-14 | Matsushita Electric Industrial Co., Ltd. | Speech recognition dictionary creation apparatus and information search apparatus |
JP2004309795A (ja) * | 2003-04-07 | 2004-11-04 | Mitsubishi Electric Corp | 音楽提供システム |
JP3892410B2 (ja) * | 2003-04-21 | 2007-03-14 | パイオニア株式会社 | 音楽データ選曲装置、音楽データ選曲方法、並びに、音楽データの選曲プログラムおよびそれを記録した情報記録媒体 |
US20050193092A1 (en) * | 2003-12-19 | 2005-09-01 | General Motors Corporation | Method and system for controlling an in-vehicle CD player |
JP4236630B2 (ja) * | 2004-11-30 | 2009-03-11 | 三洋電機株式会社 | コンテンツデータ記録媒体 |
EP1693830B1 (en) * | 2005-02-21 | 2017-12-20 | Harman Becker Automotive Systems GmbH | Voice-controlled data system |
US20080126092A1 (en) * | 2005-02-28 | 2008-05-29 | Pioneer Corporation | Dictionary Data Generation Apparatus And Electronic Apparatus |
CN101326571B (zh) * | 2005-12-07 | 2012-05-23 | 三菱电机株式会社 | 声音识别装置 |
US7610298B2 (en) * | 2006-02-01 | 2009-10-27 | Microsoft Corporation | Difference-based database upgrade |
JP4769223B2 (ja) | 2007-04-26 | 2011-09-07 | 旭化成株式会社 | テキスト発音記号変換辞書作成装置、認識語彙辞書作成装置、及び音声認識装置 |
-
2009
- 2009-05-22 JP JP2009123866A patent/JP5465926B2/ja active Active
-
2010
- 2010-02-18 US US12/707,966 patent/US8706484B2/en active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1124685A (ja) * | 1997-07-02 | 1999-01-29 | Ricoh Co Ltd | カラオケ装置 |
JPH11232159A (ja) * | 1998-02-13 | 1999-08-27 | The Japan Reserch Institute Ltd | ファイル管理方法およびファイル管理のためのプログラムを記憶した媒体 |
JP2000035797A (ja) * | 1998-07-17 | 2000-02-02 | Nec Corp | 音声認識装置 |
JP2001014332A (ja) * | 1999-06-30 | 2001-01-19 | Denso Corp | 情報サービスシステム |
JP2002251235A (ja) * | 2001-02-23 | 2002-09-06 | Fujitsu Ltd | 利用者インタフェースシステム |
JP2003157257A (ja) * | 2001-11-22 | 2003-05-30 | Oki Electric Ind Co Ltd | 辞書装置及び自然言語処理システム |
JP2003241789A (ja) * | 2002-02-21 | 2003-08-29 | Alpine Electronics Inc | 音声認識辞書作成装置および方法 |
JP2006012257A (ja) * | 2004-06-24 | 2006-01-12 | Fujitsu Ten Ltd | 楽曲選択装置、楽曲選択システム、及び楽曲選択方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013102954A1 (ja) * | 2012-01-06 | 2013-07-11 | パナソニック株式会社 | 放送受信装置および音声辞書構築処理方法 |
JP2013167739A (ja) * | 2012-02-15 | 2013-08-29 | Denso Corp | 音声認識システム |
WO2013157174A1 (ja) * | 2012-04-16 | 2013-10-24 | 株式会社デンソー | 音声認識装置 |
JP2013222033A (ja) * | 2012-04-16 | 2013-10-28 | Denso Corp | 音声認識装置 |
Also Published As
Publication number | Publication date |
---|---|
US20100299143A1 (en) | 2010-11-25 |
US8706484B2 (en) | 2014-04-22 |
JP5465926B2 (ja) | 2014-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9153233B2 (en) | Voice-controlled selection of media files utilizing phonetic data | |
US8719028B2 (en) | Information processing apparatus and text-to-speech method | |
US8712776B2 (en) | Systems and methods for selective text to speech synthesis | |
US8666727B2 (en) | Voice-controlled data system | |
KR20080000203A (ko) | 음성인식을 이용한 음악 파일 검색 방법 | |
CN102549652B (zh) | 信息检索装置 | |
US20090076821A1 (en) | Method and apparatus to control operation of a playback device | |
JP2011033874A (ja) | 多言語音声認識装置及び多言語音声認識辞書作成方法 | |
JP5465926B2 (ja) | 音声認識辞書作成装置及び音声認識辞書作成方法 | |
KR20070087399A (ko) | 부분 검색어 추출을 통한 미디어 파일 검색 방법 및 장치 | |
CN103123644A (zh) | 声音数据检索系统及用于该系统的程序 | |
RU2008128440A (ru) | Способ и устройство для доступа к цифровому файлу из набора цифровых файлов | |
JP2004265376A (ja) | メモリに格納されたデータベースから録音物を選択する方法及び装置 | |
JP4697432B2 (ja) | 音楽再生装置、音楽再生方法及び音楽再生用プログラム | |
JP5693834B2 (ja) | 音声認識装置及び音声認識方法 | |
WO2004102423A1 (en) | Interactive system for building and sharing databank | |
JP5431817B2 (ja) | 楽曲データベース更新装置及び楽曲データベース更新方法 | |
JP2009204872A (ja) | 音声認識用辞書生成システム | |
JP2004294577A (ja) | 文字情報音声変換方法 | |
JP2006313467A (ja) | コンテンツ検索装置及びコンテンツ検索方法 | |
US20110077756A1 (en) | Method for identifying and playing back an audio recording | |
JP2011150169A (ja) | 音声認識装置 | |
JP6726583B2 (ja) | 情報処理装置、情報処理システム、情報処理方法、及びプログラム | |
JP2010156925A (ja) | 情報処理装置及び音声認識辞書生成方法 | |
JP2005084422A (ja) | 音声認識検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120321 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130510 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130905 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130917 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131031 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140123 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5465926 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |