JP2007212967A - 話速変換装置 - Google Patents

話速変換装置 Download PDF

Info

Publication number
JP2007212967A
JP2007212967A JP2006035495A JP2006035495A JP2007212967A JP 2007212967 A JP2007212967 A JP 2007212967A JP 2006035495 A JP2006035495 A JP 2006035495A JP 2006035495 A JP2006035495 A JP 2006035495A JP 2007212967 A JP2007212967 A JP 2007212967A
Authority
JP
Japan
Prior art keywords
speed
speech speed
speech
voiced
voice data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006035495A
Other languages
English (en)
Inventor
Yoshimasa Isozaki
善政 磯崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2006035495A priority Critical patent/JP2007212967A/ja
Publication of JP2007212967A publication Critical patent/JP2007212967A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

【課題】話し手の言葉を遅延させることができ、しかも、相互の会話における不自然さを最小限とすることができる話速変換装置を提供する。
【解決手段】Writeコントローラ4は音声データをリングバッファ5へ順次記録する。有声/無声判定部6は、リングバッファ5の音声データが有声部分であるか、無声部分であるかを判定し、結果を時間決定部7へ出力する。時間決定部7は、有声/無声の判定結果を話速変換制御部8へ出力すると共に、有声が継続する継続時間を基に所定の方法により話速変換時間を算出して話速変換制御部8へ出力する。話速変換制御部8は、有声部分の前半において、話速変換時間に基づく遅い読み出し速度を、後半部分において速い読み出し速度をReadコントローラ9に指示する。Readコントローラ9は話速変換制御部8の指示に応じた速度でリングバッファ5の音声データを読み出し、D/A変換部10へ出力する。
【選択図】図1

Description

本発明は、携帯電話機等の通話装置に用いて好適な話速変換装置に関する。
周知のように、高齢者になると聴覚機能が低下し、次第に早口の言葉が聞き取りにくくなる。このようなことを考慮し、話の先頭部分の話速を遅くする補聴器(特許文献1)や話速変換機能が付加された電話機(特許文献2)が開発されている。
特開平9−312899号公報 特開平11−331320号公報
ところで、電話機に話速を遅くする話速変換装置を取り付けると、話し手の言葉が聞き手の電話機において遅延されるため、聞き手による相槌が遅れ、通常の会話と違う時間のすき間ができ、相互のやりとりが不自然になってしまう問題がある。
本発明は上記事情を考慮してなされたもので、その目的は、話し手の言葉を遅延させることができ、しかも、相互の会話における不自然さを最小限とすることができる話速変換装置を提供することにある。
この発明は上記の課題を解決するためになされたもので、請求項1に記載の発明は、音声データを入力する音声データ入力手段と、前記音声データ入力手段が入力した音声データが無声部分であるか有声部分であるかを判定する判定手段と、前記音声データの有声部分の話速を所定時間遅くし、その後、入力した音声データの話速より速くする話速変換手段とを具備することを特徴とする話速変換装置である。
請求項2に記載の発明は、請求項1に記載の話速変換装置において、前記話速変換手段は、予め決められた時間、話速を遅くし、その後、入力した音声データの話速より速くすることを特徴とする。
請求項3に記載の発明は、請求項1に記載の話速変換装置において、複数の有声経過時間を計測し計測結果に基づいて話速変換時間を決定する決定手段を有し、前記話速変換手段は、前記話速変換時間の間、話速を遅くし、その後、入力した音声データの話速より速くすることを特徴とする。
請求項4に記載の発明は、請求項2または請求項3に記載の話速変換装置において、前記話速変換手段は、話速を速くした後、音声の遅延が無くなった時点で音声速度変換を停止することを特徴とする。
請求項5に記載の発明は、請求項1〜請求項4のいずれかの項に記載の話速変換装置において、前記話速変換手段は、話速を速くする際に緩やかに速度を変化させることを特徴とする。
この発明によれば、話し手の言葉を遅延させることができ、しかも、相互の会話における不自然さを最小限とすることができる効果がある。
以下、図面を参照し、この発明の実施の形態について説明する。図1はこの発明の一実施の形態による話速変換装置の構成を示すブロック図であり、この図に示す装置は携帯電話機に組み込むことを目的としたものである。
図において、符号1は通信部であり、アンテナ2において受信した信号を復調して圧縮音声データとし、デコード部3へ出力する。デコード部3は圧縮音声データを伸長して音声データとし、Writeコントローラ4へ出力する。Writeコントローラ4は音声データをサンプリング周期で歩進するポインタが示す書き込みアドレスに従ってリングバッファ5へ順次記録する。有声/無声判定部6は、リングバッファ5の音声データが有声部分であるか、無声部分であるかを周知の方法、例えば音声データのレベルにより判定し、結果を時間決定部7へ出力する。時間決定部7は、有声/無声の判定結果を話速変換制御部8へ出力すると共に、有声が継続する継続時間を基に所定の方法により話速変換時間(例えば、有声の複数の継続時間の平均の1/2)を算出して話速変換制御部8へ出力する。
話速変換制御部8は、有声/無声の判定結果および話速変換時間に基づいてReadコントローラ9の読み出しの歩進速度を指示する。Readコントローラ9は話速変換制御部8の出力に対応する速度でリングバッファ5の音声データを読み出し、D/A変換部10へ出力する。D/A変換部10はReadコントローラ9によって読み出された音声データをアナログ信号に変換し、スピーカ11へ出力する。操作部12は話速切り替えを手動によって行う場合の切り替え指示を入力したり、制御方法の設定変更を入力する際に用いられる。
次に、上述した話速変換制御部8の動作を図2、図3に示すフローチャートを参照して説明する。
まず、時間決定部7から話速変換時間の算出結果が出力されているか否かをチェックする(ステップS1)。そして、出力されていない場合は、変数tを初期設定値(例えば、2秒)とし(ステップS2a)、また、出力されている場合はその時間を変数tに設定する(ステップS2b)。次に、時間決定部7から有声を示す信号が出力されたか否かをチェックし(ステップS3)、出力されていなければ再びステップS1へ戻り、上記の動作を繰り返す。
そして、時間決定部7から有声を示す信号が出力されると、内部のタイマーをスタートさせ(ステップS4)、次いで、予め設定されている「遅」の速度データをReadコントローラ9へ出力する。これにより、Readコントローラ9が低速によるリングバッファ5の読み取りを開始する(ステップS5)。ここで、「遅」の速度データとは、例えば話速を30%低下させることを指示するデータである。次に、時間決定部7の出力に基づいて読み取り中の音声データが無音になったか否かを判断する(ステップS6)。そして、無音になっていない場合は、次に時間tが経過したか否かをタイマーによってチェックし(ステップS7)、時間tが経過していない場合はステップS5へ戻り、以後、ステップS5、S6、S7を繰り返す。
そして、時間tが経過すると、次に、予め設定されている「速」の速度データをReadコントローラ9へ出力する。これにより、Readコントローラ9が高速によるリングバッファ5の読み取りを開始する(ステップS8)。ここで、「速」の速度データとは、例えば話速を30%上昇させることを指示するデータである。次に、時間決定部7の出力に基づいて読み取り中の音声データが無音になったか否かを判断する(ステップS9)。そして、無音になっていない場合は、次に、図3のステップS10へ進み、Readコントローラ9による音声データの読み取りがWriteコントローラ4による音声データの書き込みに追いついたか否かを判断する。そして、追いついていない場合は、ステップS8へ戻り、以後、ステップS8、S9、S10を繰り返す。
そして、追いついた時は、次に、予め設定されている「標準」の速度データをReadコントローラ9へ出力する。これにより、Readコントローラ9が標準速度によるリングバッファ5の読み取りを開始する(ステップS11)。ここで、「標準」の速度データとは、話速を受信された速度と同一とすることを指示するデータである。次に、時間決定部7の出力に基づいて読み取り中の音声データが無音になったか否かを判断する(ステップS12)。そして、無音になっていない場合はステップS11へ戻り、以後、ステップS11、S12を繰り返す。そして、無音になった場合はステップS1へ戻る。
このように、図1に示す話速変換装置は、まず、時間tだけ、話速を遅くして聞き取り易くし、その後、話速を早くして遅れた分を取り戻し、取り戻しができた時点以後、話速を受信と同一の速度とする。図4に示すように、再生音声は、リングバッファ5の読み取り速度を−30%とするとオリジナルの音声より大幅に遅れ、一方、+30%速くするとオリジナルの音声よりかなり速く終了する。前半を30%遅くし、後半を30%速くするとオリジナルの音声と同じタイミングで再生音声が終了する。
なお、時間tが経過する前に相手の話が終わってしまった場合は(ステップS6の判断が「YES」)、ステップS1へ戻る。また、書き込みに追いつく前に相手の話が終わってしまった場合も(ステップS9の判断が「YES」)、ステップS1へ戻る。
次に、時間決定部7は、有声の経過時間を毎回計測し、予め決められた回数(例えば5回)計測した時点で、計測した時間の平均値を計算し、次いで、平均値の1/2を話速変換時間として話速変換制御部8へ出力する。次に、第2番目の有声経過時間から第6番目の有声経過時間の平均を計算し、その1/2を話速変換制御部8へ出力し、次に、第3番目の有声経過時間から第7番目の有声経過時間の平均を計算し、その1/2を話速変換制御部8へ出力し、以下、この動作を繰り返す。これにより、有声経過時間を計測・学習しながらダイナミックに時間tを決めることができる。
なお、Readコントローラ9による読み取り速度の制御を手動にしてもよい。この場合、聞き手が、最初、操作部12から「遅」の速度を指示し、話速変換制御部8がその指示を受け、「遅」の速度をReadコントローラ9へ指示する。次に、聞き手がしゃべりはじめの言葉の意味が分かった時点で、操作部12によって「速」の速度を指示し、これを受けて話速変換制御部8が「速」の速度をReadコントローラ9へ指示する。
また、聞き取りが遅れた場合に相手の次のしゃべりと重ならないようにするため、「あーえーボタン」を設け、聞き手がそのボタンを押した時、音声合成による「あーえー」等のつなぎの音声が相手方へ送信されるようにしてもよい。そうすることにより、聞き手がまだ相手のしゃべりを全て聞き終わっていない時に、相手がしゃべり出すことを防止することができる。また、この「あーえーボタン」に代わり、相手のしゃべりが途切れても、なおかつReadコントローラ9が読み取りを続けている場合に、「あーえー」等の音声を自動で相手方へ送信するようにしてもよい。
また、Readコントローラ9において、リングバッファ5の読み取り速度を「遅」の速度から「速」の速度に変える際に、急激に速度が変わることで聞き取りにくくならないように、図4に示す「遅」と「速」の変更点近傍の変化カーブを2次曲線等の緩やかなカーブにするのが好ましい。
この発明は、携帯電話機等の相互通話装置に用いられ、特に、高齢者用の通話装置に用いて好適である。
この発明の一実施形態による話速変換装置の構成を示すブロック図である。 同実施形態の動作を説明するためのフローチャートである。 同実施形態の動作を説明するためのフローチャートであり、図2に続くフローチャートである。 同実施形態の動作を説明するための折線グラフである。
符号の説明
1…通信部、2…アンテナ、3…デコード部、4…Writeコントローラ、5…リングバッファ、6…有声/無声判定部、7…時間決定部、8…話速変換制御部、9…Readコントローラ、10…D/A変換部、11…スピーカ、12…操作部。

Claims (5)

  1. 音声データを入力する音声データ入力手段と、
    前記音声データ入力手段が入力した音声データが無声部分であるか有声部分であるかを判定する判定手段と、
    前記音声データの有声部分の話速を所定時間遅くし、その後、入力した音声データの話速より速くする話速変換手段と、
    を具備することを特徴とする話速変換装置。
  2. 前記話速変換手段は、予め決められた時間、話速を遅くし、その後、入力した音声データの話速より速くすることを特徴とする請求項1に記載の話速変換装置。
  3. 複数の有声経過時間を計測し計測結果に基づいて話速変換時間を決定する決定手段を有し、
    前記話速変換手段は、前記話速変換時間の間、話速を遅くし、その後、入力した音声データの話速より速くすることを特徴とする請求項1に記載の話速変換装置。
  4. 前記話速変換手段は、話速を速くした後、音声の遅延が無くなった時点で音声速度変換を停止することを特徴とする請求項2または請求項3に記載の話速変換装置。
  5. 前記話速変換手段は、話速を速くする際に緩やかに速度を変化させることを特徴とする請求項1〜請求項4のいずれかの項に記載の話速変換装置。
JP2006035495A 2006-02-13 2006-02-13 話速変換装置 Pending JP2007212967A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006035495A JP2007212967A (ja) 2006-02-13 2006-02-13 話速変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006035495A JP2007212967A (ja) 2006-02-13 2006-02-13 話速変換装置

Publications (1)

Publication Number Publication Date
JP2007212967A true JP2007212967A (ja) 2007-08-23

Family

ID=38491427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006035495A Pending JP2007212967A (ja) 2006-02-13 2006-02-13 話速変換装置

Country Status (1)

Country Link
JP (1) JP2007212967A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014086832A (ja) * 2012-10-23 2014-05-12 Nippon Telegr & Teleph Corp <Ntt> 会議支援装置、その方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014086832A (ja) * 2012-10-23 2014-05-12 Nippon Telegr & Teleph Corp <Ntt> 会議支援装置、その方法及びプログラム

Similar Documents

Publication Publication Date Title
JP4630876B2 (ja) 話速変換方法及び話速変換装置
JP6931819B2 (ja) 音声処理装置、音声処理方法及び音声処理プログラム
WO2013182118A1 (zh) 一种语音数据的传输方法及装置
US6999922B2 (en) Synchronization and overlap method and system for single buffer speech compression and expansion
JP2586827B2 (ja) 受信装置
JP2010062663A (ja) 音声信号処理装置、音声信号処理方法、及び、通信端末
JP6695069B2 (ja) 電話装置
JP3553828B2 (ja) 音声蓄積再生方法および音声蓄積再生装置
JP4983417B2 (ja) 会話速度変換機能を備えた電話装置及び会話速度変換方法
US8340972B2 (en) Psychoacoustic method and system to impose a preferred talking rate through auditory feedback rate adjustment
JPH09198089A (ja) 再生速度変換装置
JP2007212967A (ja) 話速変換装置
JP2009021923A (ja) 音声通信装置
JP2001184100A (ja) 話速変換装置
JP3961616B2 (ja) 話速変換方法および話速変換機能付補聴器
JP4127155B2 (ja) 聴覚補助装置
JP4381108B2 (ja) 話速変換装置における時報処理装置
JPWO2011027437A1 (ja) 音声再生装置および音声再生方法
JP4134844B2 (ja) 聴覚補助装置
JP5321687B2 (ja) 音声通話装置
JP2010204564A (ja) 通信装置
CN113628638A (zh) 音频处理方法、装置、设备及存储介质
KR100542976B1 (ko) 음성신호의 발성변환처리에 의한 소프트사운드 헤드폰장치
KR100533217B1 (ko) 음성신호의 발성변환용 신호처리에 의한 친절 헤드폰장치
JPH0698398A (ja) 音声の無音区間検出伸長装置及び音声の無音区間検出伸長方法