JP2010156925A - 情報処理装置及び音声認識辞書生成方法 - Google Patents
情報処理装置及び音声認識辞書生成方法 Download PDFInfo
- Publication number
- JP2010156925A JP2010156925A JP2009000296A JP2009000296A JP2010156925A JP 2010156925 A JP2010156925 A JP 2010156925A JP 2009000296 A JP2009000296 A JP 2009000296A JP 2009000296 A JP2009000296 A JP 2009000296A JP 2010156925 A JP2010156925 A JP 2010156925A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- recognition dictionary
- speech recognition
- music information
- music
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【解決手段】音声認識用辞書を生成する機能を備えた情報処理装置において、記憶手段に格納されている楽曲情報の種別を判定するステップ(S12)と、楽曲情報の種別に応じて、前記記憶手段に格納されている前記楽曲情報の文字列に対して音声認識辞書用の文字列に変換する変換規則を選択するステップと、選択された変換規則に従って、楽曲情報を音声認識辞書用の文字列に変換するステップ(S16〜S19)と、変換された文字列を音声データに変換して読みデータを取得するステップ(S20)と、読みデータを前記楽曲情報と関連付けて音声認識用辞書に登録するステップと、を有する。
【選択図】図5
Description
1…制御部、
1a…オーディオ制御部、
1b…音声認識/TTS制御部、
4…音声認識エンジン、
6…TTSエンジン(音声読み上げ手段)、
7…音声再生部、
10…記憶部(記憶手段)、
10a…音響モデル、
10b…音声認識辞書、
10c…音声認識辞書生成用変換規則、
10d…TTSデータ。
Claims (16)
- 再生用の楽曲データを格納した機器と通信可能に接続される情報処理装置であって、
テキストを音声データに変換して出力する機能を有した音声読み上げ手段と、
前記楽曲データに付随した楽曲情報の文字列に対して音声認識辞書用の文字列に変換する変換規則が格納された記憶手段と、
前記楽曲データを格納した機器から楽曲データに付随した楽曲情報を取得して前記記憶手段に格納する制御手段とを有し、
前記制御手段は、前記記憶手段に格納した楽曲情報の文字列を当該楽曲情報の種別に応じた前記変換規則に従って音声認識辞書用の文字列に変換し、当該変換された文字列を前記音声読み上げ手段に入力して読みデータを取得して、当該読みデータと楽曲情報とを関連付けて音声認識用の辞書に登録することを特徴とする情報処理装置。 - 前記制御手段は、前記楽曲情報の文字列に所定のトークンが含まれているときは当該所定のトークン毎に文字列を分割し、当該分割された文字列毎に前記変換規則を適用することを特徴とする請求項1に記載の情報処理装置。
- 前記制御手段は、前記変換規則に従って、前記楽曲情報がアーティスト名又はクラシックの作曲者名のとき、スペースを区切り文字として前記楽曲情報の文字列を分割した各文字列及び元の文字列から予め定められた予約語を削除した文字列を生成し、元の文字列とともに音声認識辞書用の文字列とすることを特徴とする請求項2に記載の情報処理装置。
- 前記制御手段は、前記変換規則に従って、前記楽曲情報がアルバム名又は楽曲名のとき、当該アルバム名又は楽曲名の文字列を音声認識辞書用の文字列とすることを特徴とする請求項3に記載の情報処理装置。
- 前記制御手段は、前記楽曲情報を基に生成した音声認識辞書用の文字列から音声再生不可能な記号文字を音声再生可能な記号文字に変換するか、又は削除することを特徴とする請求項4に記載の情報処置装置。
- 前記楽曲情報の文字列を分割する前記所定のトークンは、前記楽曲情報がクラシックの作曲者名のときは、“、”、“:”、“/”、“&”のいずれかであり、前記楽曲情報がアーティスト名のときは、“、”又は“:”であることを特徴とする請求項2に記載の情報処理装置。
- 前記予約語は、前記楽曲情報がクラシックの作曲者名のときは、“The”,“Van”,“Von”,“De”,“La”,“non”,“of”,“da”,“di”,及び“a”から“z”までのアルファベット1文字のいずれかであり、前記楽曲情報がアーティスト名のときは、“The”であることを特徴とする請求項3に記載の情報処理装置。
- 前記制御手段は、前記音声再生不可能な記号文字のうち、“#”は文字列“number”に変換し、“&”は文字列“and”に変換し、“@”は文字列“at”に変換することを特徴とする請求項5に記載の情報処理装置。
- 記憶手段に格納されている楽曲情報の種別を判定するステップと、
楽曲情報の種別に応じて、前記記憶手段に格納されている前記楽曲情報の文字列に対して音声認識辞書用の文字列に変換する変換規則を選択するステップと、
選択された変換規則に従って、楽曲情報を音声認識辞書用の文字列に変換するステップと、
変換された文字列を音声データに変換して読みデータを取得するステップと、
読みデータを前記楽曲情報と関連付けて音声認識用辞書に登録するステップと、
を有することを特徴とする音声認識辞書生成方法。 - 前記変換規則を選択するステップの前に、
前記楽曲情報の文字列を所定のトークン毎に分割するステップを有することを特徴とする請求項9に記載の音声認識辞書生成方法。 - 前記音声認識辞書用の文字列に変換するステップは、
前記楽曲情報がアーティスト名又はクラッシックの作曲者名のときにスペースを区切り文字として前記楽曲情報の文字列を分割するステップと、
当該分割された各文字列及び元の文字列毎に予め定められた予約語を削除した文字列に変換するステップと、
当該変換された文字列及び元の文字列を音声認識辞書用の文字列とするステップと、
を含むことを特徴とする請求項10に記載の音声認識辞書生成方法。 - 前記音声認識辞書用の文字列に変換するステップは、
前記楽曲情報がアルバム名又は楽曲名のとき、当該アルバム名又は楽曲名の文字列を音声認識辞書用の文字列とするステップであることを特徴とする請求項11に記載の音声認識辞書生成方法。 - 前記読みデータを取得するステップの前に、
前記楽曲情報を基に生成した音声認識辞書用の文字列から音声再生不可能な記号文字を検出するステップと、
当該記号文字を音声再生可能な記号文字に変換するか又は削除するステップと、
を含むことを特徴とする請求項11に記載の音声認識辞書作成方法。 - 前記楽曲情報の文字列を分割する前記所定のトークンは、前記楽曲情報がクラシックの作曲者名のときは、“、”、“:”、“/”、“&”のいずれかであり、前記楽曲情報がアーティスト名のときは、“、”又は“:”であることを特徴とする請求項10に記載の音声認識辞書生成方法。
- 前記予約語は、前記楽曲情報がクラシックの作曲者名のときは、“The”,“Van”,“Von”,“De”,“La”,“non”,“of”,“da”,“di”,及び“a”から“z”までのアルファベット1文字のいずれかであり、前記楽曲情報がアーティスト名であるときは、“The”であることを特徴とする請求項11に記載の音声認識辞書生成方法。
- 前記音声再生可能な記号文字に変換するか又は削除するステップにおいて、前記音声再生不可能な記号文字のうち、“#”は文字列“number”に変換し、“&”は文字列“and”に変換し、“@”は文字列“at”に変換することを特徴とする請求項13に記載の音声認識辞書生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009000296A JP2010156925A (ja) | 2009-01-05 | 2009-01-05 | 情報処理装置及び音声認識辞書生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009000296A JP2010156925A (ja) | 2009-01-05 | 2009-01-05 | 情報処理装置及び音声認識辞書生成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010156925A true JP2010156925A (ja) | 2010-07-15 |
Family
ID=42574882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009000296A Pending JP2010156925A (ja) | 2009-01-05 | 2009-01-05 | 情報処理装置及び音声認識辞書生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010156925A (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005043654A (ja) * | 2003-07-22 | 2005-02-17 | Denso Corp | 楽曲情報配信システム |
JP2008046260A (ja) * | 2006-08-11 | 2008-02-28 | Nissan Motor Co Ltd | 音声認識装置 |
-
2009
- 2009-01-05 JP JP2009000296A patent/JP2010156925A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005043654A (ja) * | 2003-07-22 | 2005-02-17 | Denso Corp | 楽曲情報配信システム |
JP2008046260A (ja) * | 2006-08-11 | 2008-02-28 | Nissan Motor Co Ltd | 音声認識装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8719028B2 (en) | Information processing apparatus and text-to-speech method | |
US10789290B2 (en) | Audio data processing method and apparatus, and computer storage medium | |
US8396714B2 (en) | Systems and methods for concatenation of words in text to speech synthesis | |
US8712776B2 (en) | Systems and methods for selective text to speech synthesis | |
US8583418B2 (en) | Systems and methods of detecting language and natural language strings for text to speech synthesis | |
US8355919B2 (en) | Systems and methods for text normalization for text to speech synthesis | |
US8352272B2 (en) | Systems and methods for text to speech synthesis | |
US8352268B2 (en) | Systems and methods for selective rate of speech and speech preferences for text to speech synthesis | |
JP2011033874A (ja) | 多言語音声認識装置及び多言語音声認識辞書作成方法 | |
US20100082327A1 (en) | Systems and methods for mapping phonemes for text to speech synthesis | |
US20100082328A1 (en) | Systems and methods for speech preprocessing in text to speech synthesis | |
US9761219B2 (en) | System and method for distributed text-to-speech synthesis and intelligibility | |
JP6806662B2 (ja) | 音声合成システム、統計モデル生成装置、音声合成装置、音声合成方法 | |
JP5465926B2 (ja) | 音声認識辞書作成装置及び音声認識辞書作成方法 | |
JP5693834B2 (ja) | 音声認識装置及び音声認識方法 | |
JP4697432B2 (ja) | 音楽再生装置、音楽再生方法及び音楽再生用プログラム | |
Demenko et al. | JURISDIC: Polish Speech Database for Taking Dictation of Legal Texts. | |
JP2004294577A (ja) | 文字情報音声変換方法 | |
JP2010156925A (ja) | 情報処理装置及び音声認識辞書生成方法 | |
JP5431817B2 (ja) | 楽曲データベース更新装置及び楽曲データベース更新方法 | |
JP2008139438A (ja) | 音声処理装置、端末装置、音声情報管理装置、および、プログラム | |
KR20220050342A (ko) | 음성 합성 서비스를 제공하는 장치, 단말기 및 방법 | |
JP4356334B2 (ja) | 音声データ提供システムならびに音声データ作成装置 | |
TW202115713A (zh) | 資訊處理裝置、記錄媒體、程式產品以及資訊處理方法 | |
JP2013195685A (ja) | 言語モデル作成プログラム、言語モデル作成装置及び音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110915 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121106 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130305 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130502 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130812 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130902 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20131115 |