JP2007041302A - 音声再生装置および音声再生処理プログラム - Google Patents
音声再生装置および音声再生処理プログラム Download PDFInfo
- Publication number
- JP2007041302A JP2007041302A JP2005225527A JP2005225527A JP2007041302A JP 2007041302 A JP2007041302 A JP 2007041302A JP 2005225527 A JP2005225527 A JP 2005225527A JP 2005225527 A JP2005225527 A JP 2005225527A JP 2007041302 A JP2007041302 A JP 2007041302A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- reproduction
- character string
- output
- control means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】例えばインターネットN上のWebサイトからユーザ指定に応じてダウンロードされたMP3ファイルをデコードして出力再生する際に、このデコードされた再生音声データ(PCM音声データDPCM)を音声認識してテキスト化し、ピリオド「.」などがある一文の区切り位置を検出して再生一時停止させる。そして、この再生一時停止された再生音声の一文に対応してユーザがリピートし発声すると、マイク18から入力されたユーザ音声データ(Us)も音声認識してテキスト化し、ピリオド「.」などが認識された一文の区切り位置を検出して直ちに前記再生音声データの次の一文の再生を再開させる。
【選択図】図1
Description
図1は、本発明の実施形態に係る音声再生装置10の電子回路の構成を示すブロック図である。
図5は、前記音声再生装置10による第2実施形態の音声出力処理を示すフローチャートである。
11 …CPU
12 …ROM
13 …RAM
13a…音声認識テキストメモリ
14 …メモリカード(外部記録媒体)
15 …カードスロット
16 …通信部
17 …キー入力部
18 …マイク
19 …A/D変換部
20 …MP3デコーダ
21 …PCMバッファ
22 …D/A変換部
23 …アンプ
24 …スピーカ
25 …表示部
30 …Webサーバ
40 …ユーザPC
M …録音音声圧縮データ(MP3)
Us…ユーザ音声
SP…再生音声
DPCM…再生音声(PCM音声)データ
P1,P2…スタート・ストップ・ポーズ制御信号
Claims (7)
- 音声データを記憶する音声データ記憶手段と、
この音声データ記憶手段により記憶された音声データを再生する音声再生手段と、
指定対象となる音声を認識することにより、その音声に対応する単語及び区切り記号を含む一連の文字列を出力する認識文字列出力手段と、
前記音声データ記憶手段により記憶された音声データを、前記音声再生手段により再生する際に、当該再生される音声を認識対象に指定することにより、前記認識文字列出力手段により、その音声に対応する一連の文字列を出力させるように制御する再生音声認識制御手段と、
この再生音声認識制御手段の制御により、前記認識文字列出力手段により一連の文字列が出力されていく際に、当該出力文字列中に区切り記号が検知された時点で、音声データの再生を一時停止させる再生停止制御手段と、
この再生停止制御手段の制御により前記音声データの再生が一時停止された後に、ユーザ音声を入力するユーザ音声入力手段と、
このユーザ音声入力手段により入力された音声を認識対象に指定することにより前記認識文字列出力手段により、その音声に対応する一連の文字列を出力させるように制御する入力音声認識制御手段と、
この入力音声認識制御手段の制御により、前記認識文字列出力手段により一連の文字列が出力されていく際に、当該出力文字列中に区切り記号が検知された時点で、前記音声再生手段により前記音声データ記憶手段により記憶された音声データの再生を再開させる再生再開制御手段と、
を備えたことを特徴とする音声再生装置。 - 複数種類の音声データの中から再生すべき音声データを指定する再生音声指定手段と、
この再生音声指定手段により指定された音声データを順次ダウンロードして取得するデータダウンロード手段と、
このデータダウンロード手段によりダウンロードされて取得される音声データを再生する音声再生手段と、
指定対象となる音声を認識することにより、その音声に対応する単語及び区切り記号を含む一連の文字列を認識して出力する認識文字列出力手段と、
前記音声再生手段により順次ダウンロードされて取得された音声データを再生する際に、当該再生される音声を認識対象に指定することにより、前記認識文字列出力手段により、その音声に対応する一連の文字列を出力させるように制御する再生音声認識制御手段と、
この再生音声認識制御手段の制御により、前記認識文字列出力手段により一連の文字列が出力されていく際に、当該出力文字列中に区切り記号が検知された時点で、音声データの再生を一時停止させる再生停止制御手段と、
この再生停止制御手段の制御により前記音声データの再生が一時停止された後に、ユーザ音声を入力するユーザ音声入力手段と、
このユーザ音声入力手段により入力された音声を認識対象に指定することにより前記認識文字列出力手段により、その音声に対応する一連の文字列を出力させるように制御する入力音声認識制御手段と、
この入力音声認識制御手段の制御により、前記認識文字列出力手段により一連の文字列が出力されていく際に、当該出力文字列中に区切り記号が検知された時点で、前記音声再生手段により前記ダウンロードされて取得される音声データの再生を再開させる再生再開制御手段と、
を備えたことを特徴とする音声再生装置。 - さらに、
前記音声再生手段により順次ダウンロードされて取得された音声データを再生する際に、前記再生音声認識制御手段の制御により、前記認識文字列出力手段により出力された再生音声に対応する一連の文字列を記憶する再生音声文字列記憶手段と、
前記再生停止制御手段の制御により前記音声データの再生が一時停止された後に、前記入力音声認識制御手段の制御により、前記認識文字列出力手段により出力された入力音声に対応する一連の文字列と、前記再生音声文字列記憶手段により記憶された再生音声に対応する一連の文字列とを比較する再生音声文字列/入力音声文字列比較手段と、
この再生音声文字列/入力音声文字列比較手段により比較された再生音声の文字列と入力音声の文字列とが不一致である場合には、前記音声再生手段により前記再生停止制御手段の制御によって前記音声データの再生が一時停止されたところまでの当該音声データを繰り返し再生させる繰り返し再生制御手段と、
を備えたことを特徴とする請求項1または請求項2に記載の音声再生装置。 - さらに、
再生音声文字列/入力音声文字列比較手段により比較された再生音声の文字列と入力音声の文字列とが不一致である場合には、再生音声と入力音声との不一致を報知する音声不一致報知手段を備えたことを特徴とする請求項3に記載の音声再生装置。 - 音声再生機器のコンピュータを制御するための音声再生処理プログラムであって、
前記コンピュータを、
音声データをメモリに記憶させる音声データ記憶制御手段、
この音声データ記憶制御手段の制御によりメモリに記憶された音声データを再生させる音声再生制御手段、
指定対象となる音声を認識することにより、その音声に対応する単語及び区切り記号を含む一連の文字列を出力する認識文字列出力手段、
前記音声データ記憶制御手段によりメモリに記憶された音声データを、前記音声再生制御手段により再生させる際に、当該再生される音声を認識対象に指定することにより、前記認識文字列出力手段により、その音声に対応する一連の文字列を出力させるように制御する再生音声認識制御手段、
この再生音声認識制御手段の制御により、前記認識文字列出力手段により一連の文字列が出力されていく際に、当該出力文字列中に区切り記号が検知された時点で、音声データの再生を一時停止させる再生停止制御手段、
この再生停止制御手段の制御により前記音声データの再生が一時停止された後に、ユーザ音声を入力するユーザ音声入力手段、
このユーザ音声入力手段により入力された音声を認識対象に指定することにより前記認識文字列出力手段により、その音声に対応する一連の文字列を出力させるように制御する入力音声認識制御手段、
この入力音声認識制御手段の制御により、前記認識文字列出力手段により一連の文字列が出力されていく際に、当該出力文字列中に区切り記号が検知された時点で、前記音声再生制御手段の制御により前記音声データ記憶制御手段によりメモリに記憶された音声データの再生を再開させる再生再開制御手段、
として機能させるようにしたコンピュータ読み込み可能な音声再生処理プログラム。 - 音声再生機器のコンピュータを制御するための音声再生処理プログラムであって、
前記コンピュータを、
ユーザ操作に応じて複数種類の音声データの中から再生すべき音声データを指定する再生音声指定手段、
この再生音声指定手段により指定された音声データを順次ダウンロードして取得するデータダウンロード手段、
このデータダウンロード手段によりダウンロードされて取得される音声データを再生させる音声再生制御手段、
指定対象となる音声を認識することにより、その音声に対応する単語及び区切り記号を含む一連の文字列を認識して出力する認識文字列出力手段、
前記音声再生制御手段の制御により順次ダウンロードされて取得された音声データを再生する際に、当該再生される音声を認識対象に指定することにより、前記認識文字列出力手段により、その音声に対応する一連の文字列を出力させるように制御する再生音声認識制御手段、
この再生音声認識制御手段の制御により、前記認識文字列出力手段により一連の文字列が出力されていく際に、当該出力文字列中に区切り記号が検知された時点で、音声データの再生を一時停止させる再生停止制御手段、
この再生停止制御手段の制御により前記音声データの再生が一時停止された後に、ユーザ音声を入力するユーザ音声入力手段、
このユーザ音声入力手段により入力された音声を認識対象に指定することにより前記認識文字列出力手段により、その音声に対応する一連の文字列を出力させるように制御する入力音声認識制御手段、
この入力音声認識制御手段の制御により、前記認識文字列出力手段により一連の文字列が出力されていく際に、当該出力文字列中に区切り記号が検知された時点で、前記音声再生制御手段の制御により前記ダウンロードされて取得される音声データの再生を再開させる再生再開制御手段、
として機能させるようにしたコンピュータ読み込み可能な音声再生処理プログラム。 - 前記コンピュータをさらに、
前記音声再生制御手段の制御により順次ダウンロードされて取得された音声データを再生する際に、前記再生音声認識制御手段の制御により、前記認識文字列出力手段により出力された再生音声に対応する一連の文字列をメモリに記憶させる再生音声文字列記憶制御手段、
前記再生停止制御手段の制御により前記音声データの再生が一時停止された後に、前記入力音声認識制御手段の制御により、前記認識文字列出力手段により出力された入力音声に対応する一連の文字列と、前記再生音声文字列記憶制御手段の制御により記憶された再生音声に対応する一連の文字列とを比較する再生音声文字列/入力音声文字列比較手段、
この再生音声文字列/入力音声文字列比較手段により比較された再生音声の文字列と入力音声の文字列とが不一致である場合には、前記音声再生制御手段の制御により前記音声データの再生が一時停止されたところまでの当該音声データを繰り返し再生させる繰り返し再生制御手段、
として機能させるようにした請求項5または請求項6に記載の音声再生処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005225527A JP4622728B2 (ja) | 2005-08-03 | 2005-08-03 | 音声再生装置および音声再生処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005225527A JP4622728B2 (ja) | 2005-08-03 | 2005-08-03 | 音声再生装置および音声再生処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007041302A true JP2007041302A (ja) | 2007-02-15 |
JP4622728B2 JP4622728B2 (ja) | 2011-02-02 |
Family
ID=37799341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005225527A Active JP4622728B2 (ja) | 2005-08-03 | 2005-08-03 | 音声再生装置および音声再生処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4622728B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010072057A (ja) * | 2008-09-16 | 2010-04-02 | Winbond Electron Corp | 音声の録音と再生方法及び該方法を用いる電子辞書 |
JP5911630B1 (ja) * | 2015-08-12 | 2016-04-27 | コトバンク株式会社 | 言語学習システム、言語学習方法、プログラム及びコンピュータ記憶媒体 |
JP2016525765A (ja) * | 2014-06-06 | 2016-08-25 | シャオミ・インコーポレイテッド | マルチメディア再生方法、装置、プログラム、及び記録媒体 |
JP6006449B1 (ja) * | 2016-03-29 | 2016-10-12 | コトバンク株式会社 | 言語学習システム、言語学習方法、プログラム及びコンピュータ記憶媒体 |
CN108986784A (zh) * | 2017-06-05 | 2018-12-11 | 卡西欧计算机株式会社 | 语音输出控制装置及语音输出控制方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS616731A (ja) * | 1984-06-21 | 1986-01-13 | Fujitsu Ltd | 発声訓練装置 |
JP2003230094A (ja) * | 2002-02-06 | 2003-08-15 | Nec Corp | チャプター作成装置及びデータ再生装置及びその方法並びにプログラム |
JP2003288098A (ja) * | 2002-03-28 | 2003-10-10 | Toshiba Corp | ディクテーション装置、方法及びプログラム |
JP2003307997A (ja) * | 2002-04-15 | 2003-10-31 | Sony Corp | 語学教育システム、音声データ処理装置、音声データ処理方法、音声データ処理プログラム、及び記憶媒体 |
JP2004061788A (ja) * | 2002-07-29 | 2004-02-26 | Infinitekku:Kk | ネットワークシステム |
JP2004302171A (ja) * | 2003-03-31 | 2004-10-28 | Ffc Ltd | 語学学習装置,語学学習用プログラムおよび語学学習用記録媒体 |
-
2005
- 2005-08-03 JP JP2005225527A patent/JP4622728B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS616731A (ja) * | 1984-06-21 | 1986-01-13 | Fujitsu Ltd | 発声訓練装置 |
JP2003230094A (ja) * | 2002-02-06 | 2003-08-15 | Nec Corp | チャプター作成装置及びデータ再生装置及びその方法並びにプログラム |
JP2003288098A (ja) * | 2002-03-28 | 2003-10-10 | Toshiba Corp | ディクテーション装置、方法及びプログラム |
JP2003307997A (ja) * | 2002-04-15 | 2003-10-31 | Sony Corp | 語学教育システム、音声データ処理装置、音声データ処理方法、音声データ処理プログラム、及び記憶媒体 |
JP2004061788A (ja) * | 2002-07-29 | 2004-02-26 | Infinitekku:Kk | ネットワークシステム |
JP2004302171A (ja) * | 2003-03-31 | 2004-10-28 | Ffc Ltd | 語学学習装置,語学学習用プログラムおよび語学学習用記録媒体 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010072057A (ja) * | 2008-09-16 | 2010-04-02 | Winbond Electron Corp | 音声の録音と再生方法及び該方法を用いる電子辞書 |
JP2016525765A (ja) * | 2014-06-06 | 2016-08-25 | シャオミ・インコーポレイテッド | マルチメディア再生方法、装置、プログラム、及び記録媒体 |
US9589596B2 (en) | 2014-06-06 | 2017-03-07 | Xiaomi Inc. | Method and device of playing multimedia and medium |
US9786326B2 (en) | 2014-06-06 | 2017-10-10 | Xiaomi Inc. | Method and device of playing multimedia and medium |
EP2953133B1 (en) * | 2014-06-06 | 2019-08-07 | Xiaomi Inc. | Method and device of playing multimedia |
JP5911630B1 (ja) * | 2015-08-12 | 2016-04-27 | コトバンク株式会社 | 言語学習システム、言語学習方法、プログラム及びコンピュータ記憶媒体 |
JP6006449B1 (ja) * | 2016-03-29 | 2016-10-12 | コトバンク株式会社 | 言語学習システム、言語学習方法、プログラム及びコンピュータ記憶媒体 |
CN108986784A (zh) * | 2017-06-05 | 2018-12-11 | 卡西欧计算机株式会社 | 语音输出控制装置及语音输出控制方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4622728B2 (ja) | 2011-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4558308B2 (ja) | 音声認識システム、データ処理装置、そのデータ処理方法及びプログラム | |
US6421643B1 (en) | Method and apparatus for directing an audio file to a speech recognition program that does not accept such files | |
WO2007132690A1 (ja) | 音声データ要約再生装置、音声データ要約再生方法および音声データ要約再生用プログラム | |
JP5787780B2 (ja) | 書き起こし支援システムおよび書き起こし支援方法 | |
JP2013200423A (ja) | 音声対話支援装置、方法、およびプログラム | |
JP2016157225A (ja) | 音声検索装置、音声検索方法及びプログラム | |
JP4622728B2 (ja) | 音声再生装置および音声再生処理プログラム | |
JP2013025299A (ja) | 書き起こし支援システムおよび書き起こし支援方法 | |
JP2004266576A (ja) | メディアデータ記憶装置、およびメディアデータ記憶処理プログラム | |
KR101877559B1 (ko) | 모바일 단말기를 이용한 언어 자가학습 서비스 제공방법, 이를 실행하는 모바일 단말기 및 이를 실행하기 위한 애플리케이션을 저장하는 기록매체 | |
JP5083155B2 (ja) | 辞書機能を備えた電子装置およびプログラム | |
JP2011233047A (ja) | 電子書籍装置、電子書籍再生方法、及び電子書籍再生プログラム | |
KR100357241B1 (ko) | 디지털 오디오 플레이어에서의 반복재생구간 설정제어방법 및 이것을 이용한 파일재생장치 및 저장매체 | |
JP2000089789A (ja) | 音声認識装置及び記録媒体 | |
JP4970392B2 (ja) | 音声の録音と再生方法及び該方法を用いる電子辞書 | |
JP2010107926A (ja) | 語学ヒアリング能力およびシャドーイング能力を向上させる学習教材及びその作成方法 | |
JP2005077678A (ja) | テキスト音声同期装置およびテキスト音声同期処理プログラム | |
JP6387044B2 (ja) | テキスト処理装置、テキスト処理方法およびテキスト処理プログラム | |
JP2001331092A (ja) | 語学学習システム | |
JPH0728384A (ja) | 語学練習機 | |
JP6646172B1 (ja) | 多言語コンテンツの教育用再生方法、そのためのデータ構造及びプログラム | |
KR102274275B1 (ko) | 음성파일이 연동된 텍스트 링크 생성 어플리케이션 및 방법 | |
JP2007248750A (ja) | 音声再生装置 | |
JP2005107617A (ja) | 音声データ検索装置。 | |
JP6810527B2 (ja) | 再生制御装置、再生制御システム、並びに再生制御方法、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080509 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100906 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101005 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101018 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4622728 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131112 Year of fee payment: 3 |