JP5977528B2 - 話速変換装置、話速変換方法及びプログラム - Google Patents
話速変換装置、話速変換方法及びプログラム Download PDFInfo
- Publication number
- JP5977528B2 JP5977528B2 JP2012018711A JP2012018711A JP5977528B2 JP 5977528 B2 JP5977528 B2 JP 5977528B2 JP 2012018711 A JP2012018711 A JP 2012018711A JP 2012018711 A JP2012018711 A JP 2012018711A JP 5977528 B2 JP5977528 B2 JP 5977528B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- buffer
- silence
- silent
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Telephone Function (AREA)
Description
入力音声データのサンプリング単位毎に音声信号のパワーが所定の閾値を超える有音区間と、当該閾値以下を無音区間とを判定する無音判定部と、
前記有音区間について、前記入力音声データを伸張又はそのまま出力バッファに出力する話速変換部と、
前記話速変換部により、前記入力音声データが伸張されたことによる増加分のデータ量を判定する増加分判定部と、
前記入力音声データから単位データを読み出し、当該単位データが無音データの場合に、前記増加分のデータ量以内の前記無音データは無音バッファに出力し、前記増加分のデータ量以上の前記無音データは前記出力バッファに出力する制御を行うバッファ制御部と、
を備え、
前記バッファ制御部は、
前記無音判定部により、前記無音区間から前記有音区間が判定された場合には、前記判定された位置から保護区間分の前記無音データを遡って前記無音バッファから読み出し、前記出力バッファに出力する制御を行うことを特徴とする。
前記バッファ制御部は、前記無音判定部により、前記有音区間から前記無音区間が判定された場合には、前記無音データと判定された分が連続して保護区間分検出されたときには、保護区間分の前記無音データを前記無音バッファから読み出して前記出力バッファに出力する制御を行うことを特徴とする。
前記バッファ制御部は、前記話速変換部により音声データを伸張していない場合には、前記無音データは、出力バッファに出力することを特徴とする。
前記無音バッファは、リングバッファを構成していることを特徴とする。
入力音声データのサンプリング単位毎に音声信号のパワーが所定の閾値を超える有音区間と、当該閾値以下を無音区間とを判定する無音判定ステップと、
前記有音区間について、前記入力音声データを伸張又はそのまま出力バッファに出力する話速変換ステップと、
前記話速変換ステップにより、前記入力音声データが伸張されたことによる増加分のデータ量を判定する増加分判定ステップと、
前記入力音声データから単位データを読み出し、当該単位データが無音データの場合に、前記増加分のデータ量以内の前記無音データは無音バッファに出力し、前記増加分のデータ量以上の前記無音データは前記出力バッファに出力する制御を行うバッファ制御ステップと、
を有し、
前記バッファ制御ステップは、
前記無音判定ステップにより、前記無音区間から前記有音区間が判定された場合には、前記判定された位置から保護区間分の前記無音データを遡って前記無音バッファから読み出し、前記出力バッファに出力する制御を行うことを特徴とする。
コンピュータに、
入力音声データのサンプリング単位毎に音声信号のパワーが所定の閾値を超える有音区間と、当該閾値以下を無音区間とを判定する無音判定機能と、
前記有音区間について、前記入力音声データを伸張又はそのまま出力バッファに出力する話速変換機能と、
前記話速変換機能により、前記入力音声データが伸張されたことによる増加分のデータ量を判定する増加分判定機能と、
前記入力音声データから単位データを読み出し、当該単位データが無音データの場合に、前記増加分のデータ量以内の前記無音データは無音バッファに出力し、前記増加分のデータ量以上の前記無音データは前記出力バッファに出力する制御を行うバッファ制御機能と、
を有し、
前記バッファ制御機能は、
前記無音判定機能により、前記無音区間から前記有音区間が判定された場合には、前記判定された位置から保護区間分の前記無音データを遡って前記無音バッファから読み出し、前記出力バッファに出力する制御を行う、
ことを実現させることを特徴とする。
まず、話速変換装置1の機能構成から説明する。図1に示すように、話速変換装置1は、バッファ制御部10と、無音判定部20と、話速変換部30と、無音バッファ40と、出力バッファ50とを含んで構成されている。また、図1において、実線はデータの流れを示しており、点線は制御信号の流れを示している。
続いて、本実施形態における話速変換装置1における話速変換の動作について、図を用いて概要を説明する。
続いて、話速変換装置1において実行される話速変換処理の流れについて図を用いて説明する。
上述した話速変換装置について、図面を用いて実施例について説明する。
第1実施例は、無音データが無音バッファの領域分以下の場合、例えば領域が0.4秒分確保されている場合に、無音データが0.4秒未満となる場合について説明する。なお、この領域は図5の領域t20の領域となる。また、本実施例における無音バッファ40の様子を図9に模式的に示し、以下図6〜図8の処理の流れを用いて説明する。
続いて第2実施例について説明する。第2実施例は、話速変換部30での増加データ量が、出力バッファ50の記憶容量分以下(例えば、1秒分未満)であり、無音データが「無音バッファ40の記憶容量+話速変換部30での増加データ量」未満の場合について説明する。なお、この領域は図5のt24の領域となる。また、本実施例における無音バッファ40の遷移を図10、図11に模式的に示し、以下図6〜図8の処理の流れを用いて説明する。
続いて第3実施例について説明する。第3実施例は、話速変換部30での増加データ量が、出力バッファ50の記憶容量分以下(例えば、1秒分未満)であり、無音データが「無音バッファ40の記憶容量+話速変換部30での増加データ量」以上の場合について説明する。なお、この領域は図5のt22の領域となる。また、第2実施例において説明した(1)〜(5)までの処理の流れ(図10の無音バッファ40の状態)については同じであるため、その後の状態から説明する。なお、本実施例における無音バッファ40の遷移を図12に模式的に示し、以下図6〜図8の処理の流れを用いて説明する。
続いて、本発明の話速変換処理を他の装置に適用した場合について説明する。例えば、本明細書においては、携帯電話装置に適用した場合について説明する。図13に示すように、携帯電話装置1000及び携帯電話装置2000は、基地局装置3000に無線を解して接続されている。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も特許請求の範囲に含まれる。
10 バッファ制御部
20 無音判定部
30 話速変換部
40 無音バッファ
42 第1無音バッファ
44 第2無音バッファ
50 出力バッファ
1000、2000 携帯電話装置
3000 基地局装置
Claims (5)
- 入力音声データのサンプリング単位毎に音声信号のパワーが所定の閾値を超える有音区間と、当該閾値以下を無音区間とを判定する無音判定部と、
前記有音区間について、前記入力音声データを伸張又はそのまま出力バッファに出力する話速変換部と、
前記話速変換部により、前記入力音声データが伸張されたことによる増加分のデータ量を判定する増加分判定部と、
前記入力音声データから単位データを読み出し、当該単位データが無音データの場合に、前記増加分のデータ量以内の前記無音データは無音バッファに出力し、前記増加分のデータ量以上の前記無音データは前記出力バッファに出力する制御を行うバッファ制御部と、
を備え、
前記バッファ制御部は、
前記無音判定部により、前記無音区間から前記有音区間が判定された場合には、前記判定された位置から保護区間分の前記無音データを遡って前記無音バッファから読み出し、前記出力バッファに出力する制御を行うことを特徴とする話速変換装置。 - 前記バッファ制御部は、前記無音判定部により、前記有音区間から前記無音区間が判定された場合には、前記無音データと判定された分が連続して保護区間分検出されたときには、保護区間分の前記無音データを前記無音バッファから読み出して前記出力バッファに出力する制御を行うことを特徴とする請求項1に記載の話速変換装置。
- 前記無音バッファは、リングバッファを構成していることを特徴とする請求項1又は2に記載の話速変換装置。
- 入力音声データのサンプリング単位毎に音声信号のパワーが所定の閾値を超える有音区間と、当該閾値以下を無音区間とを判定する無音判定ステップと、
前記有音区間について、前記入力音声データを伸張又はそのまま出力バッファに出力する話速変換ステップと、
前記話速変換ステップにより、前記入力音声データが伸張されたことによる増加分のデータ量を判定する増加分判定ステップと、
前記入力音声データから単位データを読み出し、当該単位データが無音データの場合に、前記増加分のデータ量以内の前記無音データは無音バッファに出力し、前記増加分のデータ量以上の前記無音データは前記出力バッファに出力する制御を行うバッファ制御ステップと、
を有し、
前記バッファ制御ステップは、
前記無音判定ステップにより、前記無音区間から前記有音区間が判定された場合には、前記判定された位置から保護区間分の前記無音データを遡って前記無音バッファから読み出し、前記出力バッファに出力する制御を行うことを特徴とする話速変換方法。 - コンピュータに、
入力音声データのサンプリング単位毎に音声信号のパワーが所定の閾値を超える有音区間と、当該閾値以下を無音区間とを判定する無音判定機能と、
前記有音区間について、前記入力音声データを伸張又はそのまま出力バッファに出力する話速変換機能と、
前記話速変換機能により、前記入力音声データが伸張されたことによる増加分のデータ量を判定する増加分判定機能と、
前記入力音声データから単位データを読み出し、当該単位データが無音データの場合に、前記増加分のデータ量以内の前記無音データは無音バッファに出力し、前記増加分のデータ量以上の前記無音データは前記出力バッファに出力する制御を行うバッファ制御機能と、
を有し、
前記バッファ制御機能は、
前記無音判定機能により、前記無音区間から前記有音区間が判定された場合には、前記判定された位置から保護区間分の前記無音データを遡って前記無音バッファから読み出し、前記出力バッファに出力する制御を行う、
ことを実現させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012018711A JP5977528B2 (ja) | 2012-01-31 | 2012-01-31 | 話速変換装置、話速変換方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012018711A JP5977528B2 (ja) | 2012-01-31 | 2012-01-31 | 話速変換装置、話速変換方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013156552A JP2013156552A (ja) | 2013-08-15 |
JP5977528B2 true JP5977528B2 (ja) | 2016-08-24 |
Family
ID=49051753
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012018711A Expired - Fee Related JP5977528B2 (ja) | 2012-01-31 | 2012-01-31 | 話速変換装置、話速変換方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5977528B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107135452B (zh) * | 2017-05-31 | 2020-11-20 | 北京小米移动软件有限公司 | 助听器适配方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH033199A (ja) * | 1989-05-31 | 1991-01-09 | Mitsubishi Electric Corp | 半導体メモリ録音装置 |
JPH07254922A (ja) * | 1994-03-15 | 1995-10-03 | Matsushita Electric Ind Co Ltd | 音声蓄積装置 |
JPH08328586A (ja) * | 1995-05-29 | 1996-12-13 | Matsushita Electric Ind Co Ltd | 音声時間軸変換装置 |
JP4630876B2 (ja) * | 2005-01-18 | 2011-02-09 | 富士通株式会社 | 話速変換方法及び話速変換装置 |
JP2006208482A (ja) * | 2005-01-25 | 2006-08-10 | Sony Corp | 会議の活性化を支援する装置,方法,プログラム及び記録媒体 |
JP4117301B2 (ja) * | 2005-03-08 | 2008-07-16 | 株式会社エイビット | 音声データ補間装置と音声データ補間方法 |
-
2012
- 2012-01-31 JP JP2012018711A patent/JP5977528B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013156552A (ja) | 2013-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9208766B2 (en) | Computer program product for adaptive audio signal shaping for improved playback in a noisy environment | |
KR101608671B1 (ko) | 휴대 단말기의 프로세서 간 데이터 통신 방법 및 장치 | |
JP4630876B2 (ja) | 話速変換方法及び話速変換装置 | |
CN109144463B (zh) | 传输控制方法、装置以及电子设备 | |
US9704497B2 (en) | Method and system of audio power reduction and thermal mitigation using psychoacoustic techniques | |
US20160080537A1 (en) | Modifying sound output in personal communication device | |
WO2017059678A1 (zh) | 实时语音通话中的实时语音接收设备及降低延迟的方法 | |
JP5977528B2 (ja) | 話速変換装置、話速変換方法及びプログラム | |
WO2018076265A1 (zh) | 一种通话音频节点的调节方法及终端设备 | |
JP2008147939A (ja) | 携帯端末 | |
TWI545891B (zh) | 防止在擴音器中電氣和機械飽和之波形整型系統 | |
JPWO2008142874A1 (ja) | 音声符号化及び再生装置 | |
US20200265856A1 (en) | Speech-to-text conversion based on quality metric | |
US8457955B2 (en) | Voice reproduction with playback time delay and speed based on background noise and speech characteristics | |
JPWO2007049696A1 (ja) | 電話端末および信号処理方法 | |
JP4959935B2 (ja) | 復号装置 | |
CN106293607B (zh) | 自动切换音频输出模式的方法及系统 | |
TW201931353A (zh) | 音訊處理方法、裝置及非暫時性電腦可讀媒體 | |
KR20170100500A (ko) | 신호 처리 장치 및 신호 처리 방법, 및 프로그램 | |
WO2005104125A1 (ja) | 記録再生装置、同時記録再生制御方法、および同時記録再生制御プログラム | |
KR101098763B1 (ko) | 잡음 제거 방법 및 시스템 | |
GB2559858A (en) | Audio processing apparatus and method of controlling same | |
JP4529859B2 (ja) | 音声再生装置 | |
JP2008084382A (ja) | 圧縮データ再生方法 | |
TWI825034B (zh) | 用於重新取樣音頻訊號的方法、設備及電腦可讀媒體 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140918 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150714 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150904 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160122 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160628 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160722 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5977528 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |