JP2018160137A - 音声データ検索装置、音声データ検索方法及び音声データ検索プログラム - Google Patents
音声データ検索装置、音声データ検索方法及び音声データ検索プログラム Download PDFInfo
- Publication number
- JP2018160137A JP2018160137A JP2017057494A JP2017057494A JP2018160137A JP 2018160137 A JP2018160137 A JP 2018160137A JP 2017057494 A JP2017057494 A JP 2017057494A JP 2017057494 A JP2017057494 A JP 2017057494A JP 2018160137 A JP2018160137 A JP 2018160137A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- pronunciation pattern
- pronunciation
- search
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
また、音声付きの動画データを対象として、入力音声から抽出した発話内容に対応するフレーム部分を検索することにより、限られた時間において関連する映像を効率よく視聴することができる技術も知られている(特許文献2参照)。
このため、英語音声付きの動画などを利用して、ある特定の英語フレーズを繰り返し聞くことにより、その英語フレーズにおけるリズムや抑揚やリエゾン等を学習することが行われている。
本発明は、上記事情に鑑みてなされたものであり、学習対象となる発音に類似する音声データを容易に検索して再生などを行なわせることができる音声データ検索装置を提供することを目的とする。
本発明の音声データ検索装置は、音声データを有する情報を記憶している情報記憶部と、連続した複数の単語からなるフレーズに特有の発音パターンを指定する指定部と、音声データから、前記フレーズに特有の発音パターンを認識する音声認識部と、前記情報記憶部に記憶された前記情報を前記音声認識部に認識させることにより、前記情報の中から前記指定部で指定された発音パターンと類似する発音パターンを有する音声部分を検索する検索部と、を有することを特徴とする。
本発明の音声データ検索方法は、音声データを有する情報を記憶する情報記憶ステップと、連続した複数の単語からなるフレーズに特有の発音パターンを指定する指定ステップと、音声データから、前記フレーズに特有の発音パターンを認識する音声認識ステップと、情報記憶部に記憶された前記情報を音声認識部に認識させることにより、前記情報の中から指定部で指定された発音パターンと類似する発音パターンを有する音声部分を検索する検索ステップと、を有することを特徴とする。
本発明の音声データ検索プログラムは、コンピュータを、音声データを有する情報を記憶している情報記憶手段、連続した複数の単語からなるフレーズに特有の発音パターンを指定する指定手段、音声データから、前記フレーズに特有の発音パターンを認識する音声認識手段、情報記憶部に記憶された前記情報を音声認識部に認識させることにより、前記情報の中から指定部で指定された発音パターンと類似する発音パターンを有する音声部分を検索する検索手段、として機能させることを特徴とする。
以下、図面を参照して本発明を実施するための形態(以下、実施形態)について詳細に説明する。なお、実施形態の説明の全体を通して同じ要素には同じ番号を付している。
音声データ検索装置10は、学習対象となる言語フレーズを指定し、この言語フレーズの発音に類似する発音を有する音声データを、記憶している情報から検索して再生するものである。以下の説明においては、音声データ検索装置10として、電子辞書を用いた場合について説明する。
また、情報記憶部23は、複数の言語フレーズのそれぞれに特有の発音パターンを記憶する発音パターン記憶部(不図示)を備える。
さらに、CPU21には、指定された言語フレーズから発音パターンを認識する音声認識部25、発音パターンを音声・動画記憶部23aに記憶されている音声情報において検索する検索部26が接続されている。
また、音声認識部25は、単語辞書を用いて音声データから複数の単語を認識するとともに、基準となる発音との差異を特定し、特定した差異を認識した複数の単語からなる言語フレーズに特有の発音パターンとして認識する。
検索部26は、情報記憶部23に記憶された情報を音声認識部25に認識させるとともに、認識された発音パターンと指定部22で指定された発音パターンとが設定した類似度以上の類似度となる発音パターンを有する音声部分を検索する。
また、タッチパネル22は、情報記憶部23に記憶された情報内の音声部分が指定されると、指定された音声部分に対応する言語フレーズ及び発音パターンを音声認識部25により認識し、認識された発音パターンを検索部26による検索の対象として指定する。
さらに、タッチパネル22は、情報記憶部23に記憶された情報内の音声部分が指定されると、指定された音声部分に対応する言語フレーズ及び発音パターンを音声認識部25により認識し、認識された言語フレーズを表示して検索対象部分をユーザに選択させ、選択された検索対象部分に対応する発音パターンを検索部26による検索の対象として指定する。
次いで、単語辞書から、特定した各単語に対応する標準の音声波形を取得する(ステップSB3)。これにより、図4(C)に示すような標準的な音声波形を得る。
なお、上記の処理においては、検索対象となる変化パターンを指定する場合に、ユーザが再生タイミングを指定した後、この再生タイミングに対応する音声部分から抽出した言語フレーズを表示してユーザに選択させ、選択された部分の変化パターンを検索対象として指定するようにしたが、ユーザが検索対象となる変化パターンを有する言語フレーズを直接入力したり、検索対象となる変化パターンをデータベース内から直接選択するようにしてもよい。
このため、学習対象となる言語フレーズの発音に類似する発音を有する言語フレーズを動画から容易に検索して再生でき、学習効率を向上させることができる。
<請求項1>
音声データを有する情報を記憶している情報記憶部と、
連続した複数の単語からなるフレーズに特有の発音パターンを指定する指定部と、
音声データから、前記フレーズに特有の発音パターンを認識する音声認識部と、
前記情報記憶部に記憶された前記情報を前記音声認識部に認識させることにより、前記情報の中から前記指定部で指定された発音パターンと類似する発音パターンを有する音声部分を検索する検索部と、を有する
ことを特徴とする音声データ検索装置。
<請求項2>
前記音声認識部は、音声データから、フレーズを認識するとともに、前記認識したフレーズに特有の発音パターンを認識し、
前記検索部は、前記情報記憶部に記憶された前記情報を前記音声認識部に認識させるとともに、認識された発音パターンと前記指定部で指定された発音パターンとが設定した類似度以上の類似度となる発音パターンを有する音声部分を検索する
ことを特徴とする請求項1に記載の音声データ検索装置。
<請求項3>
前記情報において前記検索部により検索された音声部分を再生する再生部を有する
ことを特徴とする請求項1又は請求項2に記載の音声データ検索装置。
<請求項4>
前記情報記憶部は、各単語の基準となる発音の情報を含む単語辞書を記憶し、
前記音声認識部は、前記単語辞書を用いて音声データから複数の単語を認識するとともに、基準となる発音との差異を特定し、特定した差異を前記認識した複数の単語からなる言語フレーズに特有の発音パターンとして認識する
ことを特徴とする請求項1から請求項3のいずれか1項に記載の音声データ検索装置。
<請求項5>
複数の言語フレーズのそれぞれに特有の発音パターンを記憶する発音パターン記憶部を備え、
前記指定部は、指定された言語フレーズに対応する発音パターンを前記発音パターン記憶部から検索し、検索された発音パターンを前記検索部による検索の対象として指定する
ことを特徴とする請求項1から請求項4のいずれか1項に記載の音声データ検索装置。
<請求項6>
前記指定部は、前記情報記憶部に記憶された前記情報内の音声部分が指定されると、指定された音声部分に対応する言語フレーズ及び発音パターンを前記音声認識部により認識し、認識された発音パターンを前記検索部による検索の対象として指定する
ことを特徴とする請求項1から請求項5のいずれか1項に記載の音声データ検索装置。
<請求項7>
前記指定部は、前記情報記憶部に記憶された前記情報内の音声部分が指定されると、指定された音声部分に対応する言語フレーズ及び発音パターンを前記音声認識部により認識し、認識された言語フレーズを表示して検索対象部分をユーザに選択させ、選択された検索対象部分に対応する発音パターンを前記検索部による検索の対象として指定する
ことを特徴とする請求項1から請求項6のいずれか1項に記載の音声データ検索装置。
<請求項8>
前記情報が、音声付き動画データである
ことを特徴とする請求項1から請求項7のいずれか1項に記載の音声データ検索装置。
<請求項9>
前記指定部が、前記再生部による前記情報の再生中にユーザが任意のフレーム部分を指定したときに指定された前記フレーム部分の言語フレーズを指定する
ことを特徴とする請求項1から請求項8のいずれか1項に記載の音声データ検索装置。
<請求項10>
前記音声認識部が認識する発音パターンが、リズム、抑揚、単語の連結部分の音変化のうちの少なくとも一つである
ことを特徴とする請求項1から請求項9のいずれか1項に記載の音声データ検索装置。
<請求項11>
前記音声認識部が、入力された言語フレーズの発音パターンを前記単語辞書に収容されている標準的な発音パターンと比較して変化パターンを抽出し、この変化パターンを蓄積する
ことを特徴とする請求項1から請求項10のいずれか1項に記載の音声データ検索装置。
<請求項12>
前記検索部が、蓄積された前記変化パターンと一致する発音パターンを検索する
ことを特徴とする請求項1から請求項11のいずれか1項に記載の音声データ検索装置。
<請求項13>
音声データを有する情報を記憶する情報記憶ステップと、
連続した複数の単語からなるフレーズに特有の発音パターンを指定する指定ステップと、
音声データから、前記フレーズに特有の発音パターンを認識する音声認識ステップと、
情報記憶部に記憶された前記情報を音声認識部に認識させることにより、前記情報の中から指定部で指定された発音パターンと類似する発音パターンを有する音声部分を検索する検索ステップと、を有する
ことを特徴とする音声データ検索方法。
<請求項14>
コンピュータを、
音声データを有する情報を記憶している情報記憶手段、
連続した複数の単語からなるフレーズに特有の発音パターンを指定する指定手段、
音声データから、前記フレーズに特有の発音パターンを認識する音声認識手段、
情報記憶部に記憶された前記情報を音声認識部に認識させることにより、前記情報の中から指定部で指定された発音パターンと類似する発音パターンを有する音声部分を検索する検索手段、として機能させる
ことを特徴とする音声データ検索プログラム。
22 タッチパネル(指定部)
23 情報記憶部
24 再生部
25 音声認識部
26 検索部
Claims (14)
- 音声データを有する情報を記憶している情報記憶部と、
連続した複数の単語からなるフレーズに特有の発音パターンを指定する指定部と、
音声データから、前記フレーズに特有の発音パターンを認識する音声認識部と、
前記情報記憶部に記憶された前記情報を前記音声認識部に認識させることにより、前記情報の中から前記指定部で指定された発音パターンと類似する発音パターンを有する音声部分を検索する検索部と、を有する
ことを特徴とする音声データ検索装置。 - 前記音声認識部は、音声データから、フレーズを認識するとともに、前記認識したフレーズに特有の発音パターンを認識し、
前記検索部は、前記情報記憶部に記憶された前記情報を前記音声認識部に認識させるとともに、認識された発音パターンと前記指定部で指定された発音パターンとが設定した類似度以上の類似度となる発音パターンを有する音声部分を検索する
ことを特徴とする請求項1に記載の音声データ検索装置。 - 前記情報において前記検索部により検索された音声部分を再生する再生部を有する
ことを特徴とする請求項1又は請求項2に記載の音声データ検索装置。 - 前記情報記憶部は、各単語の基準となる発音の情報を含む単語辞書を記憶し、
前記音声認識部は、前記単語辞書を用いて音声データから複数の単語を認識するとともに、基準となる発音との差異を特定し、特定した差異を前記認識した複数の単語からなる言語フレーズに特有の発音パターンとして認識する
ことを特徴とする請求項1から請求項3のいずれか1項に記載の音声データ検索装置。 - 複数の言語フレーズのそれぞれに特有の発音パターンを記憶する発音パターン記憶部を備え、
前記指定部は、指定された言語フレーズに対応する発音パターンを前記発音パターン記憶部から検索し、検索された発音パターンを前記検索部による検索の対象として指定する
ことを特徴とする請求項1から請求項4のいずれか1項に記載の音声データ検索装置。 - 前記指定部は、前記情報記憶部に記憶された前記情報内の音声部分が指定されると、指定された音声部分に対応する言語フレーズ及び発音パターンを前記音声認識部により認識し、認識された発音パターンを前記検索部による検索の対象として指定する
ことを特徴とする請求項1から請求項5のいずれか1項に記載の音声データ検索装置。 - 前記指定部は、前記情報記憶部に記憶された前記情報内の音声部分が指定されると、指定された音声部分に対応する言語フレーズ及び発音パターンを前記音声認識部により認識し、認識された言語フレーズを表示して検索対象部分をユーザに選択させ、選択された検索対象部分に対応する発音パターンを前記検索部による検索の対象として指定する
ことを特徴とする請求項1から請求項6のいずれか1項に記載の音声データ検索装置。 - 前記情報が、音声付き動画データである
ことを特徴とする請求項1から請求項7のいずれか1項に記載の音声データ検索装置。 - 前記指定部が、前記再生部による前記情報の再生中にユーザが任意のフレーム部分を指定したときに指定された前記フレーム部分の言語フレーズを指定する
ことを特徴とする請求項1から請求項8のいずれか1項に記載の音声データ検索装置。 - 前記音声認識部が認識する発音パターンが、リズム、抑揚、単語の連結部分の音変化のうちの少なくとも一つである
ことを特徴とする請求項1から請求項9のいずれか1項に記載の音声データ検索装置。 - 前記音声認識部が、入力された言語フレーズの発音パターンを前記単語辞書に収容されている標準的な発音パターンと比較して変化パターンを抽出し、この変化パターンを蓄積する
ことを特徴とする請求項1から請求項10のいずれか1項に記載の音声データ検索装置。 - 前記検索部が、蓄積された前記変化パターンと一致する発音パターンを検索する
ことを特徴とする請求項1から請求項11のいずれか1項に記載の音声データ検索装置。 - 音声データを有する情報を記憶する情報記憶ステップと、
連続した複数の単語からなるフレーズに特有の発音パターンを指定する指定ステップと、
音声データから、前記フレーズに特有の発音パターンを認識する音声認識ステップと、
情報記憶部に記憶された前記情報を音声認識部に認識させることにより、前記情報の中から指定部で指定された発音パターンと類似する発音パターンを有する音声部分を検索する検索ステップと、を有する
ことを特徴とする音声データ検索方法。 - コンピュータを、
音声データを有する情報を記憶している情報記憶手段、
連続した複数の単語からなるフレーズに特有の発音パターンを指定する指定手段、
音声データから、前記フレーズに特有の発音パターンを認識する音声認識手段、
情報記憶部に記憶された前記情報を音声認識部に認識させることにより、前記情報の中から指定部で指定された発音パターンと類似する発音パターンを有する音声部分を検索する検索手段、として機能させる
ことを特徴とする音声データ検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017057494A JP6900723B2 (ja) | 2017-03-23 | 2017-03-23 | 音声データ検索装置、音声データ検索方法及び音声データ検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017057494A JP6900723B2 (ja) | 2017-03-23 | 2017-03-23 | 音声データ検索装置、音声データ検索方法及び音声データ検索プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018160137A true JP2018160137A (ja) | 2018-10-11 |
JP2018160137A5 JP2018160137A5 (ja) | 2020-03-26 |
JP6900723B2 JP6900723B2 (ja) | 2021-07-07 |
Family
ID=63795054
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017057494A Active JP6900723B2 (ja) | 2017-03-23 | 2017-03-23 | 音声データ検索装置、音声データ検索方法及び音声データ検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6900723B2 (ja) |
-
2017
- 2017-03-23 JP JP2017057494A patent/JP6900723B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP6900723B2 (ja) | 2021-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI543150B (zh) | 用於提供聲音串流擴充筆記摘錄之方法、電腦可讀取儲存裝置及系統 | |
JP5193473B2 (ja) | オーディオファイルをスピーチ駆動の選択するシステムおよび方法 | |
US9236045B2 (en) | Methods and apparatus for proofing of a text input | |
Ran et al. | Artificial intelligence speech recognition model for correcting spoken English teaching | |
US20130090921A1 (en) | Pronunciation learning from user correction | |
JP4729902B2 (ja) | 音声対話システム | |
US20090138266A1 (en) | Apparatus, method, and computer program product for recognizing speech | |
US8688725B2 (en) | Search apparatus, search method, and program | |
JP2008134475A (ja) | 入力された音声のアクセントを認識する技術 | |
JPWO2009078256A1 (ja) | 発音変動規則抽出装置、発音変動規則抽出方法、および発音変動規則抽出用プログラム | |
JP2008216756A (ja) | 語句として新たに認識するべき文字列等を取得する技術 | |
JP2016118999A (ja) | 音声検索装置、音声検索方法及びプログラム | |
KR101905827B1 (ko) | 연속어 음성 인식 장치 및 방법 | |
US11176943B2 (en) | Voice recognition device, voice recognition method, and computer program product | |
JP5739899B2 (ja) | 車載オーディオ装置における語彙辞書の再編集 | |
JP2007171724A (ja) | 辞書作成装置および辞書作成プログラム | |
JPWO2016103652A1 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
JP6022138B2 (ja) | 情報提供システム | |
JP6900723B2 (ja) | 音声データ検索装置、音声データ検索方法及び音声データ検索プログラム | |
JP5196114B2 (ja) | 音声認識装置およびプログラム | |
JP2009271117A (ja) | 音声検索装置および音声検索方法 | |
Lukeš et al. | Pronunciation variants and ASR of colloquial speech: A case study on Czech | |
JP5722295B2 (ja) | 音響モデル生成方法と音声合成方法とそれらの装置とプログラム | |
TWI269191B (en) | Method of synchronizing speech waveform playback and text display | |
KR102274275B1 (ko) | 음성파일이 연동된 텍스트 링크 생성 어플리케이션 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200212 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200212 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210126 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210323 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210518 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210531 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6900723 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |