JP2009092907A - 音声再生プログラム及び音声再生装置 - Google Patents
音声再生プログラム及び音声再生装置 Download PDFInfo
- Publication number
- JP2009092907A JP2009092907A JP2007263002A JP2007263002A JP2009092907A JP 2009092907 A JP2009092907 A JP 2009092907A JP 2007263002 A JP2007263002 A JP 2007263002A JP 2007263002 A JP2007263002 A JP 2007263002A JP 2009092907 A JP2009092907 A JP 2009092907A
- Authority
- JP
- Japan
- Prior art keywords
- rank
- speed
- edited
- audio
- voice data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Management Or Editing Of Information On Record Carriers (AREA)
Abstract
【解決手段】区切り点設定手段1dは、音声データ記憶手段1aから音声データを読み出し、区切り点を設定して区間音声データを抽出する。音声データ編集手段1eは、1音声当たりに付加される音声設定されているランクに基づいて算出される無音部を区間音声データに付加する編集を行って編集音声データ記憶手段1bに格納する。編集が終了した編集済音声データは、音声再生制御手段1fによって再生される。ランク調整手段1gは、聞き直し時間を含む編集済音声データが再生された時間と、編集済音声データの音声数とに基づいて作業者の処理速度を算出し、設定ランクを動的に調整する。
【選択図】図1
Description
図1は、実施の形態に適用される発明の概念図である。
本発明にかかる音声再生装置1は、音声データを記録する音声データ記憶手段1a、編集済音声データを記録する編集音声データ記憶手段1b、及びランク情報を記憶するランク情報記憶手段1cの記憶手段と、音声データの区切り点を設定する区切り点設定手段1d、音声データの再生速度を調整する編集を行う音声データ編集手段1e、音声を再生する音声再生制御手段1f、及びランクを調整するランク調整手段1gの処理手段と、を有し、作業者の処理速度に合わせて音声データの再生速度を調整することができる。
音声データ記憶手段1aには、再生対象の音声が電子的な音声データに変換されて記憶されている。音声データは、自装置が録音したものであっても、他装置が録音したものであってもよい。
作業者の処理速度 = 再生された音声数/再生時間 ・・・(1)
によって算出する。なお、式(1)で用いる「再生された音声数」は、再生対象の編集済音声データそのものに含まれる音声数とする。すなわち、聞き直しが行われると、編集済音声データが何度か再生されるので実際に再生される音声数は増加するが、「再生された音声数」としてカウントされるのは、編集済音声データを1回再生したときの音声数になる。したがって、中断も聞き直しも指示されないとき、処理速度の値が最も大きくなり(この状態を処理速度が速いとする)、中断や聞き直しが指示されるごとに値は小さくなる(この状態を処理速度が遅いとする)。ランク調整手段1gでは、算出された処理速度に基づいて、設定されているランクを評価し、作業者に適した値となるように調整を行う。たとえば、処理速度が速いときは、設定ランクを上げ(設定ランクをより再生速度の速いランクに更新する)、処理速度が著しく遅いときは、設定ランクを下げる(設定ランクをより再生速度の遅いランクにする)ように調整を行う。
再生対象の音声データは、音声データ記憶手段1aに記憶されている。また、ランク情報記憶手段1cには、初期化処理で設定された設定ランクが記憶されている。
ここで、音声再生装置のハードウェア構成について説明する。図2は、本実施の形態の音声再生装置のハードウェア構成例を示すブロック図である。
音声再生装置10は、音声データDB(データベース)111、編集音声データバッファ112、ランク情報記憶部113、及びテキストデータDB114の記憶手段と、区切り点設定部120、音声データ編集部130、音声再生制御部140、打鍵速度計測部150、ランク調整部160、及びテキスト変換部170の処理手段と、を有する。
必要無音時間 = 打鍵に必要な時間 − 発声に必要な時間 ・・・(2)
によって算出することができる。ここで、打鍵に必要な時間は、1音声当たりの平均打鍵時間×発声数で算出できる。同様に、発声に必要な時間は、1音声当たりの平均発声時間×発声数で算出できる。ランクに対応付けられる1音声当たりの無音時間は、1音声当たりの必要無音時間になる。なお、打鍵に必要な時間は、母音、子音による打鍵キー数の違いや、漢字カナ変換のための変換キー操作の有無などによってキー操作数に若干差異が生じるが、ある程度の間隔では平均化されるため、一様に処理することができる。
音声データDB111に格納される音声データは、話者の音声を録音した電子的な音声データである。音声がそのまま録音された音声データであり、長時間に渡る無音時間が含まれている場合もある。
ランクテーブル310は、ランク311と、1発声音当たりの追加無音時間(秒)312とが対応付けられている。ランクの値が小さいほど、付加される無音時間が短くなり、音声の再生速度が速くなる。したがって、打鍵の速い人向きの設定である。ランクの値が大きくなるにつれて、付加される無音時間が長くなる。
初期化ランク設定処理では、ランク初期最適値321、初期打鍵速度322、及びランク調整情報323の各ランク情報を参照して処理が行われる。
途中ランク更新処理では、作業途中ランク情報330に格納されるランク情報331と、打鍵速度情報332とを参照して処理が行われる。
図7は、音声再生装置における処理手順を示したフローチャートである。
[ステップS01] 処理が開始されると、まず、ランクテーブル310が読み出される。以降の処理では、読み出したランクテーブル310に基づいてランクの調整と、音声データに付加する無音時間の調整が行われる。
処理の開始前までには、音声データDB111に、対象の音声データが格納される。図の例では、音声データ「おはようございます ほんじつはとうしゃのしょうひんを・・・」401が格納されている。なお、語と語の間のスペースは、話者の音声が途切れた無音時間を表す。
この場合の開始時刻は、10:05:30で、有音部の9秒(9文字分)と、無音部の3秒(3文字分)との合計12秒が経過した10:05:42に再生が終了している。打鍵速度計測部15では、再生時間(ここでは、12秒)を打鍵時間と見なし、打鍵速度を算出する。パターン1の打鍵速度は、
音声数(9文字)/再生時間(12秒)=0.75(文字/秒)
になる。
音声数(9文字)/再生時間(11秒)=0.82(文字/秒)
になる。
音声数(9文字)/再生時間(47秒)=0.19(文字/秒)
になる。
[ステップS109] ランクの引き下げが必要で、かつ、現在の仮ランクが最小でないときは、ランク調整情報323のランク引き下げ情報に登録されている仮ランクmを1段階下げ、仮ランクに設定する。そして、さらに1段階小さいランクを計測ランクに設定し、処理を終了する。これにより、新たに設定された仮ランクm−1を中心として、打鍵速度が得られ、仮ランクm−1の評価を行うことができるようになる。
[ステップS112] ランクの引き上げが必要で、かつ、現在のランクが最大でないときは、ランク調整情報323のランク引き上げ情報に登録されている仮ランクnを1段階上げ、仮ランクに設定する。そして、さらに1段階上のランクを計測ランクに設定し、処理を終了する。これにより、新たに設定された仮ランクn−1を中心として、打鍵速度が得られ、仮ランクn−1の評価を行うことができるようになる。
しかし、作業者の状態は同じではないので、作業途中でランクを調整する必要がある。
[ステップS203] 比較の結果、前回打鍵速度の方が、前々回打鍵速度より大きいかどうかを判定する。大きいときは、処理をステップS204へ進め、大きくないときは処理をステップS205へ進める。
次に、第2の実施の形態のランク調整処理について説明する。第1の実施の形態では、初期ランク設定処理を標準のランクから最適ランクを調べるとしたが、第2の実施の形態では、最小のランクから最適ランクを調べる。また、第1の実施の形態では、1回の処理で打鍵速度を求めていたが、第2の実施の形態では、同一ランクについて複数回分の打鍵速度を算出する。ここでは、同一ランクで5回測定を行うとする。
[ステップS306] 測定された打鍵速度が基準の範囲内であるかどうかを判定する。打鍵速度は、再生音声データの違いなどによって、多少差が出る。しかし、5回計測を行って、そのうち所定の基準を超えて遅い打鍵速度が検出されたときは、打鍵速度が生成速度に追いつかず、聞き直しなどの操作がされたと判断される。すべて基準内であれば、処理をステップS307へ進め、基準を超えるものがあれば、処理をステップS308へ進める。
[ステップS403] 比較の結果、前回打鍵速度の方が、前々回打鍵速度より大きいかどうかを判定する。大きいときは、処理をステップS404へ進め、大きくないときは処理をステップS405へ進める。
[ステップS410] 前回打鍵速度と前々回打鍵速度との差が大きいときは、作業者の打鍵速度が再生速度に追いつかず、聞き直しなどの操作が行われたと判断されるので、再生速度を下げるようにランク調整を行う。
以上の処理手順が実行されることにより、聞き直し操作などが行われたときのみ、ランクを上げて再生速度を遅くすることができるようになる。再生速度が速いほど、作業効率は向上し、作業時間が短縮される。したがって、作業効率の向上のためには、聞き直しなどの操作が行われない限り、その速度が維持されることが望ましい。そこで、第3の実施の形態では、ランクの引き上げを聞き直し操作などが行われたきに限定する。
[ステップS505] 比較の結果、前回打鍵速度の方が、前々回打鍵速度より大きいかどうかを判定する。大きいときは、処理をステップS506へ進め、大きくないときは処理をステップS507へ進める。
[ステップS512] 前回打鍵速度と前々回打鍵速度との差が大きいときは、作業者の打鍵速度が再生速度に追いつかず、聞き直しなどの操作が行われたと判断されるので、再生速度を下げるようにランク調整を行う。
[ステップS513] カウンタをカウントアップし、処理を終了する。
コンピュータを、
前記音声データの有音部分を検出して区切り点を設定し、前記区切り点で区切られる区間音声データを抽出する区切り点設定手段、
1音声当たりに付加される無音時間に対応付けられるとともに、再生された音声を聞いて作業を行う作業者の処理速度に応じて値が設定されるランクが記憶されるランク情報記憶手段から現在設定されている設定ランクを読み出し、前記区間音声データに、前記設定ランクに基づいて算出される無音部を付加して再生速度を調整する編集を施し、編集音声データ記憶手段に格納する音声データ編集手段、
前記編集音声データ記憶手段から編集が終了した編集済音声データを読み出して再生するとともに、聞き直しを含む再生指示が外部より入力されたときは、前記再生指示に従って前記編集済音声データの再生を制御する音声再生制御手段、
前記音声再生制御手段によって前記編集済音声データが再生された時間を計測した再生時間と、前記編集済音声データの音声数とに基づいて前記作業者の処理速度を算出し、前記作業者の処理速度に応じて前記設定ランクを調整するランク調整手段、
として機能させることを特徴とする音声再生プログラム。
処理が開始されたときに前記作業者の処理速度を計測し、計測結果に基づいて処理開始時点で最適な前記設定ランクを決定する初期ランク設定手段と、
作業途中の任意のタイミングで前記作業者の処理速度を評価し、前記作業者の処理速度が同程度を維持、または、速くなっていることが検出されたときは、前記再生速度を速め、前記作業者の処理速度が遅くなっているときは、前記再生速度を遅くするように前記設定ランクを調整する途中ランク更新手段と、
を有することを特徴とする付記1記載の音声再生プログラム。
1音声当たりに付加される無音時間に対応付けられるとともに、再生された音声を聞いて作業を行う作業者の処理速度に応じて値が設定されるランクが記憶されるランク情報記憶手段と、
編集が施された編集済音声データが記憶される編集音声データ記憶手段と、
前記記録媒体に記録された前記音声データの有音部分を検出して区切り点を設定し、前記区切り点で区切られる区間音声データを抽出する区切り点設定手段と、
前記ランク情報記憶手段から現在設定されている設定ランクを読み出し、前記区間音声データに、前記設定ランクに基づいて算出される無音部を付加して再生速度を調整する編集を施し、編集音声データ記憶手段に格納する音声データ編集手段と、
前記編集音声データ記憶手段から編集が終了した前記編集済音声データを読み出して再生するとともに、聞き直しを含む再生指示が外部より入力されたときは、前記再生指示に従って前記編集済音声データの再生を制御する音声再生制御手段と、
前記音声再生制御手段によって前記編集済音声データが再生された時間を計測した再生時間と、前記編集済音声データの音声数とに基づいて前記作業者の処理速度を算出し、前記作業者の処理速度に応じて前記設定ランクを調整するランク調整手段と、
を有することを特徴とする音声再生装置。
区切り点設定手段が、前記音声データの有音部分を検出して区切り点を設定し、前記区切り点で区切られる区間音声データを抽出するステップと、
音声データ編集手段が、1音声当たりに付加される無音時間に対応付けられるとともに、再生された音声を聞いて作業を行う作業者の処理速度に応じて値が設定されるランクが記憶されるランク情報記憶手段から、現在設定されている設定ランクを読み出し、前記設定ランクに基づいて前記区間音声データに付加する無音部を算出して付加する編集を施して編集音声データ記憶手段に格納するステップと、
音声再生制御手段が、前記編集音声データ記憶手段から編集が終了した編集済音声データを読み出して再生するとともに、聞き直しを含む再生指示が外部より入力されたときは、前記再生指示に従って前記編集済音声データの再生を制御するステップと、
ランク調整手段が、前記音声再生制御手段によって前記編集済音声データが再生された時間を計測した再生時間と、前記編集済音声データの音声数とに基づいて前記作業者の処理速度を算出し、前記作業者の処理速度に応じて前記設定ランクを調整するステップと、
を有することを特徴とする音声再生方法。
1a 音声データ記憶手段
1b 編集音声データ記憶手段
1c ランク情報記憶手段
1d 区切り点設定手段
1e 音声データ編集手段
1f 音声再生制御手段
1g ランク調整手段
Claims (4)
- 記録媒体に記録された音声データの再生処理のための音声再生プログラムにおいて、
コンピュータを、
前記音声データの有音部分を検出して区切り点を設定し、前記区切り点で区切られる区間音声データを抽出する区切り点設定手段、
1音声当たりに付加される無音時間に対応付けられるとともに、再生された音声を聞いて作業を行う作業者の処理速度に応じて値が設定されるランクが記憶されるランク情報記憶手段から現在設定されている設定ランクを読み出し、前記区間音声データに、前記設定ランクに基づいて算出される無音部を付加して再生速度を調整する編集を施し、編集音声データ記憶手段に格納する音声データ編集手段、
前記編集音声データ記憶手段から編集が終了した編集済音声データを読み出して再生するとともに、聞き直しを含む再生指示が外部より入力されたときは、前記再生指示に従って前記編集済音声データの再生を制御する音声再生制御手段、
前記音声再生制御手段によって前記編集済音声データが再生された時間を計測した再生時間と、前記編集済音声データの音声数とに基づいて前記作業者の処理速度を算出し、前記作業者の処理速度に応じて前記設定ランクを調整するランク調整手段、
として機能させることを特徴とする音声再生プログラム。 - 前記ランク調整手段は、
処理が開始されたときに前記作業者の処理速度を計測し、計測結果に基づいて処理開始時点で最適な前記設定ランクを決定する初期ランク設定手段と、
作業途中の任意のタイミングで前記作業者の処理速度を評価し、前記作業者の処理速度が同程度を維持、または、速くなっていることが検出されたときは、前記再生速度を速め、前記作業者の処理速度が遅くなっているときは、前記再生速度を遅くするように前記設定ランクを調整する途中ランク更新手段と、
を有することを特徴とする請求項1記載の音声再生プログラム。 - 前記区切り点設定手段は、次回処理対象の前記区間音声データの次の区間よりも後に再生される区間の前記音声データを先読みし、無音部分が含まれるときはこれを削除し、有音部分のみを抽出する、ことを特徴とする請求項1記載の音声再生プログラム。
- 記録媒体に記録された音声データに基づいて音声を再生する音声再生装置において、
1音声当たりに付加される無音時間に対応付けられるとともに、再生された音声を聞いて作業を行う作業者の処理速度に応じて値が設定されるランクが記憶されるランク情報記憶手段と、
編集が施された編集済音声データが記憶される編集音声データ記憶手段と、
前記記録媒体に記録された前記音声データの有音部分を検出して区切り点を設定し、前記区切り点で区切られる区間音声データを抽出する区切り点設定手段と、
前記ランク情報記憶手段から現在設定されている設定ランクを読み出し、前記区間音声データに、前記設定ランクに基づいて算出される無音部を付加して再生速度を調整する編集を施し、編集音声データ記憶手段に格納する音声データ編集手段と、
前記編集音声データ記憶手段から編集が終了した前記編集済音声データを読み出して再生するとともに、聞き直しを含む再生指示が外部より入力されたときは、前記再生指示に従って前記編集済音声データの再生を制御する音声再生制御手段と、
前記音声再生制御手段によって前記編集済音声データが再生された時間を計測した再生時間と、前記編集済音声データの音声数とに基づいて前記作業者の処理速度を算出し、前記作業者の処理速度に応じて前記設定ランクを調整するランク調整手段と、
を有することを特徴とする音声再生装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007263002A JP4973431B2 (ja) | 2007-10-09 | 2007-10-09 | 音声再生プログラム及び音声再生装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007263002A JP4973431B2 (ja) | 2007-10-09 | 2007-10-09 | 音声再生プログラム及び音声再生装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009092907A true JP2009092907A (ja) | 2009-04-30 |
JP4973431B2 JP4973431B2 (ja) | 2012-07-11 |
Family
ID=40664964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007263002A Active JP4973431B2 (ja) | 2007-10-09 | 2007-10-09 | 音声再生プログラム及び音声再生装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4973431B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019512144A (ja) * | 2016-02-10 | 2019-05-09 | ガラク、ジャスティンGARAK, Justin | 限定対話機能を用いたリアルタイムのコンテンツ編集 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01142927A (ja) * | 1987-11-30 | 1989-06-05 | Matsushita Electric Ind Co Ltd | 文章作成装置 |
JP2004212799A (ja) * | 2003-01-07 | 2004-07-29 | Telecommunication Advancement Organization Of Japan | 書起し支援装置 |
JP2007256815A (ja) * | 2006-03-24 | 2007-10-04 | Casio Comput Co Ltd | 音声再生装置、音声再生方法、音声再生プログラム |
-
2007
- 2007-10-09 JP JP2007263002A patent/JP4973431B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01142927A (ja) * | 1987-11-30 | 1989-06-05 | Matsushita Electric Ind Co Ltd | 文章作成装置 |
JP2004212799A (ja) * | 2003-01-07 | 2004-07-29 | Telecommunication Advancement Organization Of Japan | 書起し支援装置 |
JP2007256815A (ja) * | 2006-03-24 | 2007-10-04 | Casio Comput Co Ltd | 音声再生装置、音声再生方法、音声再生プログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019512144A (ja) * | 2016-02-10 | 2019-05-09 | ガラク、ジャスティンGARAK, Justin | 限定対話機能を用いたリアルタイムのコンテンツ編集 |
Also Published As
Publication number | Publication date |
---|---|
JP4973431B2 (ja) | 2012-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6078964B2 (ja) | 音声対話システム及びプログラム | |
JP2007206317A (ja) | オーサリング方法、オーサリング装置およびプログラム | |
US7742920B2 (en) | Variable voice rate apparatus and variable voice rate method | |
JP2002007014A (ja) | 情報処理装置及び該情報処理装置を備えた楽器 | |
JP5638479B2 (ja) | 書き起こし支援システムおよび書き起こし支援方法 | |
JP2003177784A (ja) | 音響変節点抽出装置及びその方法、音響再生装置及びその方法、音響再生システム、音響配信システム、情報提供装置、音響信号編集装置、音響変節点抽出方法プログラム記録媒体、音響再生方法プログラム記録媒体、音響信号編集方法プログラム記録媒体、音響変節点抽出方法プログラム、音響再生方法プログラム、音響信号編集方法プログラム | |
JP2013025299A (ja) | 書き起こし支援システムおよび書き起こし支援方法 | |
JP4324089B2 (ja) | 音声再生プログラムおよびその記録媒体、音声再生装置ならびに音声再生方法 | |
JP5404726B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP4973431B2 (ja) | 音声再生プログラム及び音声再生装置 | |
CN104376840A (zh) | 取样装置以及取样方法 | |
JP2005044409A (ja) | 情報再生装置、情報再生方法および情報再生プログラム | |
JP3846300B2 (ja) | 録音原稿作成装置および方法 | |
JP5223843B2 (ja) | 情報処理装置およびプログラム | |
JP2008175851A (ja) | 録音時間算出装置、発音練習装置および録音時間算出方法、発音練習処理方法、ならびにそのプログラム、電子辞書 | |
KR100357241B1 (ko) | 디지털 오디오 플레이어에서의 반복재생구간 설정제어방법 및 이것을 이용한 파일재생장치 및 저장매체 | |
JP2006276560A (ja) | 音楽再生装置および音楽再生方法 | |
JP5375869B2 (ja) | 楽曲再生装置、楽曲再生方法及びプログラム | |
JP2006259474A (ja) | カラオケ装置 | |
JP4313724B2 (ja) | 音声再生速度調節方法、音声再生速度調節プログラム、およびこれを格納した記録媒体 | |
JP6587772B1 (ja) | 端末装置、音声再生方法、ならびに、プログラム | |
JP4862772B2 (ja) | 採点機能を有するカラオケ装置 | |
JP7207322B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP2007256815A (ja) | 音声再生装置、音声再生方法、音声再生プログラム | |
JP2005274790A (ja) | 音楽再生装置、音楽再生方法、音楽再生プログラム、及び電子アルバム装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100616 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120313 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120326 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4973431 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150420 Year of fee payment: 3 |