JP5058198B2 - 音声データ再生装置及び音声データ再生方法 - Google Patents
音声データ再生装置及び音声データ再生方法 Download PDFInfo
- Publication number
- JP5058198B2 JP5058198B2 JP2009078702A JP2009078702A JP5058198B2 JP 5058198 B2 JP5058198 B2 JP 5058198B2 JP 2009078702 A JP2009078702 A JP 2009078702A JP 2009078702 A JP2009078702 A JP 2009078702A JP 5058198 B2 JP5058198 B2 JP 5058198B2
- Authority
- JP
- Japan
- Prior art keywords
- speed
- upper limit
- speech
- limit value
- playback
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Telephone Function (AREA)
Description
前記入力音声の話速に対する前記出力音声の話速の比率を示す再生速度の上限値を可変とし、前記上限値を設定する可変上限値設定手段と、
前記可変上限値設定手段によって設定された前記上限値以下の再生速度で前記倍速再生を行う倍速再生手段と、
前記倍速再生の現在の再生速度を変更する現在速度変更手段とを、
有し、
前記現在速度変更手段が、入力インタフェースからのユーザによる操作入力に従って前記現在の再生速度を変更するように構成されており、
前記ユーザによる操作入力に従って前記現在の再生速度が前記上限値を超える値に変更された場合には、前記可変上限値設定手段が、前記上限値を超えて変更された前記現在の再生速度の値が前記上限値に反映されるように前記上限値の変更を行うように構成されている音声データ再生装置が提供される。
この構成により、通常よりも速い速度での再生(発話時の速度よりも速い速度による再生、あるいは、入力音声の話速が速くなるよう話速変換を行った再生)の際に、ユーザが音声を聞き取ることができ、かつ聴き取り不可能な速度に上昇することを防止できる。その結果、聴覚集中による視覚集中の阻害を制御可能とし、ユーザが同時に行っている別の行動に対する集中力を低下させないようにすることが可能となる。また、本発明に係る通常よりも速い速度での再生システムに、柔軟性を与えることを可能とし、個々人の聴覚能力とユーザ状況による聴覚集中の許容量に応じた上限値をリアルタイムに決定することも可能となる。また、この構成により、様々な状況に応じて、通常よりも速い速度での再生に係る再生速度の変更を行えるようになり、ユーザが、通常よりも速い速度での再生に係る再生速度を変更することが可能となり、ユーザによって変更された再生速度が上限値に反映されるようになる。
この構成により、倍速再生機構は等倍速(1.0倍速)よりも速い速度で開始することが可能となる。
この方法により、ドライバが聞き取ることができる倍速再生効率の良い初期速度(1.3倍速)で倍速再生が開始できるようになる。
この構成により、ユーザが自分で上限値の設定を行うことが可能となる。
この構成により、個々のドライバに適した上限値が設定できるようになる。
この構成により、音声に含まれる会話の話速と上限値との関係を設定することが可能となる。
前記倍速再生を行う前記入力音声の話速を算定する話速算定手段と、
前記入力音声の話速に対する前記出力音声の話速の比率を示す再生速度に関して、前記話速算定手段で算定された前記入力音声の話速に基づいて、前記倍速再生の現在の再生速度を自動的に変更する現在速度変更手段と、
前記再生速度の上限値を可変とし、前記上限値を設定する可変上限値設定手段とを有し、
前記現在速度変更手段が、前記入力音声の話速に加えて、前記上限値に基づいて前記倍速再生の前記現在の再生速度を変更するよう構成されており、
前記可変上限値設定手段が、前記入力音声の話速に関連付けられている前記上限値を設定するよう構成されている音声データ再生装置が提供される。
この構成により、音声に含まれる会話の話速を考慮して、通常よりも速い速度での再生に係る再生速度が変更されるようになる。また、この構成により、音声に含まれる会話の話速に加え、設定されている上限値も考慮して、通常よりも速い速度での再生に係る再生速度が変更されるようになり、音声に含まれる会話の話速と上限値との関係を設定することが可能となる。
前記音拍幅解析部が、前記入力音声に関して、単位時間当たりに含まれる音拍幅に基づいて前記入力音声の話速を算定するよう構成されており、
前記可変上限値設定手段が、前記音拍幅と前記上限値との関係を示す情報を参照して、前記音拍幅解析部で解析された前記音拍幅に対応する前記上限値を設定するよう構成されている音声データ再生装置が提供される。
前記入力音声の話速に対する前記出力音声の話速の比率を示す再生速度の上限値を可変とし、前記上限値を設定する可変上限値設定ステップと、
前記可変上限値設定ステップで設定された前記上限値以下の再生速度で前記倍速再生を行う倍速再生ステップと、
前記倍速再生の現在の再生速度を変更する現在速度変更ステップとを、
有し、
前記現在速度変更ステップにおいて、入力インタフェースからのユーザによる操作入力に従って前記現在の再生速度を変更し、
前記ユーザによる操作入力に従って前記現在の再生速度が前記上限値を超える値に変更された場合には、前記可変上限値設定ステップにおいて、前記上限値を超えて変更された前記現在の再生速度の値が前記上限値に反映されるように前記上限値の変更を行う音声データ再生方法が提供される。
この方法により、通常よりも速い速度での再生の際に、ユーザが音声を聞き取ることができ、かつ聴き取り不可能な速度に上昇することを防止できる。その結果、聴覚集中による視覚集中の阻害を制御可能とし、ユーザが同時に行っている別の行動に対する集中力を低下させないようにすることが可能となる。また、本発明に係る通常よりも速い速度での再生システムに、柔軟性を与えることを可能とし、個々人の聴覚能力とユーザ状況による聴覚集中の許容量に応じた上限値をリアルタイムに決定することも可能となる。また、この構成により、様々な状況に応じて、通常よりも速い速度での再生に係る再生速度の変更を行えるようになり、ユーザが、通常よりも速い速度での再生に係る再生速度を変更することが可能となり、ユーザによって変更された再生速度が上限値に反映されるようになる。
この方法により、倍速再生機構は等倍速(1.0倍速)よりも速い速度で開始することが可能となる。
この方法により、ドライバが聞き取ることができる倍速再生効率の良い初期速度(1.3倍速)で倍速再生が開始できるようになる。
この方法により、ユーザが自分で上限値の設定を行うことが可能となる。
この方法により、個々のドライバに適した上限値が設定できるようになる。
この方法により、音声に含まれる会話の話速と上限値との関係を設定することが可能となる。
前記倍速再生を行う前記入力音声の話速を算定する話速算定ステップと、
前記入力音声の話速に対する前記出力音声の話速の比率を示す再生速度に関して、前記話速算定ステップで算定された前記入力音声の話速に基づいて、前記倍速再生の現在の再生速度を変更する現在速度変更ステップと、
前記再生速度の上限値を可変とし、前記上限値を設定する可変上限値設定ステップとを有し、
前記現在速度変更ステップにおいて、前記入力音声の話速に加えて、前記上限値に基づいて前記倍速再生の前記現在の再生速度を変更し、
前記可変上限値設定手段において、前記入力音声の話速に関連付けられている前記上限値を設定する音声データ再生方法が提供される。
この方法により、音声に含まれる会話の話速を考慮して、通常よりも速い速度での再生に係る再生速度が変更されるようになる。また、この方法により、音声に含まれる会話の話速に加え、設定されている上限値も考慮して、通常よりも速い速度での再生に係る再生速度が変更されるようになり、音声に含まれる会話の話速と上限値との関係を設定することが可能となる。
前記音拍幅解析ステップにおいて、前記入力音声に関して、単位時間当たりに含まれる音拍幅に基づいて前記入力音声の話速を算定し、
前記可変上限値設定ステップにおいて、前記音拍幅と前記上限値との関係を示す情報を参照して、前記音拍幅解析部で解析された前記音拍幅に対応する前記上限値を設定する音声データ再生方法が提供される。
倍速再生時に、ユーザ自身がその倍速再生の再生速度を変更できるようにしてもよい。ユーザは、例えば、GUI(Graphics User Interface)やその他の操作スイッチ)、音声入力(音声認識システムによる解析)などを始めとして、様々な入力インタフェースから再生速度の変更を行うことが可能である。なお、再生速度の変更入力に意識が傾くことによってユーザが同時に行っている別の行動に対する集中力が阻害されてしまうことが望ましくない場合には、別の行動が行われている最中かどうか(例えば、ユーザが運転中かどうか)を判断し、その判断結果に応じてユーザによる再生速度の変更を禁止したり、特定の入力インタフェース(例えば、操作スイッチや音声入力)経由でしか再生速度の変更が行えないようにしたりすることも可能である。
また、倍速再生時に、ユーザが操作を行わなくても自動的に再生速度の変動が行われるようにしてもよい。この場合には、実用速度範囲内で倍速再生の再生速度が変動されるようにすることが望ましく、これによって、ユーザが聞き取ることができる(さらには、聞き取りやすい)再生速度による倍速再生が実現される。
121 音声データキャッシュ
123 音声処理部
125 音声再生出力部
1231 再生・停止制御部
1232 倍速再生機構部
1233 自動変速制御部
1234 音拍幅解析部
1235 実用速度上限値学習部
1236 上限値決定部
1237 基本値決定部
1238 変速指示部
1239 初期テスト実施部
1240 リアルタイム学習部
Claims (16)
- 出力音声の話速が入力音声の話速に対して速くなるよう変換する倍速再生を行う音声データ再生装置であって、
前記入力音声の話速に対する前記出力音声の話速の比率を示す再生速度の上限値を可変とし、前記上限値を設定する可変上限値設定手段と、
前記可変上限値設定手段によって設定された前記上限値以下の再生速度で前記倍速再生を行う倍速再生手段と、
前記倍速再生の現在の再生速度を変更する現在速度変更手段とを、
有し、
前記現在速度変更手段が、入力インタフェースからのユーザによる操作入力に従って前記現在の再生速度を変更するように構成されており、
前記ユーザによる操作入力に従って前記現在の再生速度が前記上限値を超える値に変更された場合には、前記可変上限値設定手段が、前記上限値を超えて変更された前記現在の再生速度の値が前記上限値に反映されるように前記上限値の変更を行うように構成されている音声データ再生装置。 - 前記上限値以下の基本値を設定する基本値設定手段を有し、前記倍速再生手段が前記基本値を初期速度として前記倍速再生を開始するように構成されている請求項1に記載の音声データ再生装置。
- 前記基本値のデフォルトの値を前記入力音声の話速の1.3倍速とする請求項2に記載の音声データ再生装置。
- 前記可変上限値設定手段が、入力インタフェースからのユーザによる操作入力に従って前記上限値を変更するように構成されている請求項2に記載の音声データ再生装置。
- 個々のユーザに適した前記上限値を決定するための上限値決定テストを実施する上限値決定テスト手段を有し、前記可変上限値設定手段が、前記上限値決定テスト手段による前記上限値決定テストの結果に基づいて前記上限値の変更を行うように構成されている請求項1に記載の音声データ再生装置。
- 前記入力音声の話速と前記上限値とが関連付けられている請求項1から5のいずれか1つに記載の音声データ再生装置。
- 出力音声の話速が入力音声の話速に対して速くなるよう変換する倍速再生を行う音声データ再生装置であって、
前記倍速再生を行う前記入力音声の話速を算定する話速算定手段と、
前記入力音声の話速に対する前記出力音声の話速の比率を示す再生速度に関して、前記話速算定手段で算定された前記入力音声の話速に基づいて、前記倍速再生の現在の再生速度を自動的に変更する現在速度変更手段と、
前記再生速度の上限値を可変とし、前記上限値を設定する可変上限値設定手段とを有し、
前記現在速度変更手段が、前記入力音声の話速に加えて、前記上限値に基づいて前記倍速再生の前記現在の再生速度を変更するよう構成されており、
前記可変上限値設定手段が、前記入力音声の話速に関連付けられている前記上限値を設定するよう構成されている音声データ再生装置。 - 前記話速算定手段が、前記入力音声に含まれる音拍幅を解析する音拍幅解析部を有し、
前記音拍幅解析部が、前記入力音声に関して、単位時間当たりに含まれる音拍幅に基づいて前記入力音声の話速を算定するよう構成されており、
前記可変上限値設定手段が、前記音拍幅と前記上限値との関係を示す情報を参照して、前記音拍幅解析部で解析された前記音拍幅に対応する前記上限値を設定するよう構成されている請求項7に記載の音声データ再生装置。 - 出力音声の話速が入力音声の話速に対して速くなるよう変換する倍速再生を行う音声データ再生方法であって、
前記入力音声の話速に対する前記出力音声の話速の比率を示す再生速度の上限値を可変とし、前記上限値を設定する可変上限値設定ステップと、
前記可変上限値設定ステップで設定された前記上限値以下の再生速度で前記倍速再生を行う倍速再生ステップと、
前記倍速再生の現在の再生速度を変更する現在速度変更ステップとを、
有し、
前記現在速度変更ステップにおいて、入力インタフェースからのユーザによる操作入力に従って前記現在の再生速度を変更し、
前記ユーザによる操作入力に従って前記現在の再生速度が前記上限値を超える値に変更された場合には、前記可変上限値設定ステップにおいて、前記上限値を超えて変更された前記現在の再生速度の値が前記上限値に反映されるように前記上限値の変更を行う音声データ再生方法。 - 前記上限値以下の基本値を設定する基本値設定ステップを有し、前記倍速再生ステップにおいて、前記基本値を初期速度として前記倍速再生を開始する請求項9に記載の音声データ再生方法。
- 前記基本値のデフォルトの値を前記入力音声の話速の1.3倍速とする請求項10に記載の音声データ再生方法。
- 前記可変上限値設定ステップにおいて、入力インタフェースからのユーザによる操作入力に従って前記上限値を変更する請求項10に記載の音声データ再生方法。
- 個々のユーザに適した前記上限値を決定するための上限値決定テストを実施する上限値決定テストステップを有し、前記可変上限値設定ステップにおいて、前記上限値決定テストステップにおける前記上限値決定テストの結果に基づいて前記上限値の変更を行う請求項9に記載の音声データ再生方法。
- 前記入力音声の話速と前記上限値とが関連付けられている請求項9から13のいずれか1つに記載の音声データ再生方法。
- 出力音声の話速が入力音声の話速に対して速くなるよう変換する倍速再生を行う音声データ再生方法であって、
前記倍速再生を行う前記入力音声の話速を算定する話速算定ステップと、
前記入力音声の話速に対する前記出力音声の話速の比率を示す再生速度に関して、前記話速算定ステップで算定された前記入力音声の話速に基づいて、前記倍速再生の現在の再生速度を変更する現在速度変更ステップと、
前記再生速度の上限値を可変とし、前記上限値を設定する可変上限値設定ステップとを有し、
前記現在速度変更ステップにおいて、前記入力音声の話速に加えて、前記上限値に基づいて前記倍速再生の前記現在の再生速度を変更し、
前記可変上限値設定手段において、前記入力音声の話速に関連付けられている前記上限値を設定する音声データ再生方法。 - 前記話速算定ステップが、前記入力音声に含まれる音拍幅を解析する音拍幅解析ステップを有し、
前記音拍幅解析ステップにおいて、前記入力音声に関して、単位時間当たりに含まれる音拍幅に基づいて前記入力音声の話速を算定し、
前記可変上限値設定ステップにおいて、前記音拍幅と前記上限値との関係を示す情報を参照して、前記音拍幅解析部で解析された前記音拍幅に対応する前記上限値を設定する請求項15に記載の音声データ再生方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009078702A JP5058198B2 (ja) | 2009-03-27 | 2009-03-27 | 音声データ再生装置及び音声データ再生方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009078702A JP5058198B2 (ja) | 2009-03-27 | 2009-03-27 | 音声データ再生装置及び音声データ再生方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010230992A JP2010230992A (ja) | 2010-10-14 |
JP5058198B2 true JP5058198B2 (ja) | 2012-10-24 |
Family
ID=43046861
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009078702A Expired - Fee Related JP5058198B2 (ja) | 2009-03-27 | 2009-03-27 | 音声データ再生装置及び音声データ再生方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5058198B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7396029B2 (ja) * | 2019-12-23 | 2023-12-12 | ティアック株式会社 | 録音再生装置 |
CN111627412B (zh) * | 2020-05-06 | 2023-05-05 | Oppo(重庆)智能科技有限公司 | 音频变速方法、装置、电子设备和计算机可读存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006154531A (ja) * | 2004-11-30 | 2006-06-15 | Matsushita Electric Ind Co Ltd | 音声速度変換装置、音声速度変換方法、および音声速度変換プログラム |
JP2006258699A (ja) * | 2005-03-18 | 2006-09-28 | Aisin Aw Co Ltd | 車載システム |
JP2008009221A (ja) * | 2006-06-30 | 2008-01-17 | Casio Comput Co Ltd | 音声再生制御装置及び音声再生制御プログラム |
JP2009004859A (ja) * | 2007-06-19 | 2009-01-08 | Mizuho Information & Research Institute Inc | テレホンサービス処理システム、テレホンサービス処理プログラム及びテレホンサービス処理方法 |
-
2009
- 2009-03-27 JP JP2009078702A patent/JP5058198B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010230992A (ja) | 2010-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Arons | Techniques, perception, and applications of time-compressed speech | |
JP5593244B2 (ja) | 話速変換倍率決定装置、話速変換装置、プログラム、及び記録媒体 | |
WO2017006766A1 (ja) | 音声対話方法および音声対話装置 | |
US9336823B2 (en) | Playing audio in trick-modes | |
JP5058198B2 (ja) | 音声データ再生装置及び音声データ再生方法 | |
JPH10260694A (ja) | 話速変換装置、話速変換方法及び記録媒体 | |
US20230066854A1 (en) | Computer implemented method, device and computer program product for setting a playback speed of media content comprising audio | |
JP4965371B2 (ja) | 音声再生装置 | |
JP6343895B2 (ja) | 音声制御装置、音声制御方法およびプログラム | |
JP2009075280A (ja) | コンテンツ再生装置 | |
JP2020067531A (ja) | プログラム、情報処理方法、及び情報処理装置 | |
JP5412204B2 (ja) | 適応的な話速変換装置及びプログラム | |
JP3373933B2 (ja) | 話速変換装置 | |
JP2006317768A (ja) | 話速変換装置、及びこの話速変換装置を制御する話速変換プログラム | |
JP2004252085A (ja) | 音声変換システム及び音声変換プログラム | |
JP5451134B2 (ja) | 通信処理装置 | |
JP2017106989A (ja) | 音声対話装置およびプログラム | |
JP2005266571A (ja) | 変速再生方法及び装置、並びにプログラム | |
JP4580297B2 (ja) | 音声再生装置、音声録音再生装置、およびそれらの方法、記録媒体、集積回路 | |
JP6323491B2 (ja) | 音声合成装置および音声合成方法 | |
CN109947385A (zh) | 动态调音方法、装置、可穿戴设备和存储介质 | |
Gallo et al. | Prioritizing signals for selective real-time audio processing | |
JP4275055B2 (ja) | 音質調整装置、放送受信機、プログラム、及び記録媒体 | |
JP4815494B2 (ja) | 刻限通知装置、刻限通知方法、ならびに、プログラム | |
JP2007256815A (ja) | 音声再生装置、音声再生方法、音声再生プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120319 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120710 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120731 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150810 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5058198 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150810 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |