JP2007312186A - 通話音声録音再生装置及び通話音声録音再生方法 - Google Patents

通話音声録音再生装置及び通話音声録音再生方法 Download PDF

Info

Publication number
JP2007312186A
JP2007312186A JP2006140147A JP2006140147A JP2007312186A JP 2007312186 A JP2007312186 A JP 2007312186A JP 2006140147 A JP2006140147 A JP 2006140147A JP 2006140147 A JP2006140147 A JP 2006140147A JP 2007312186 A JP2007312186 A JP 2007312186A
Authority
JP
Japan
Prior art keywords
voice
code
speech
recording
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006140147A
Other languages
English (en)
Inventor
Mayumi Nagasaki
真由美 長崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2006140147A priority Critical patent/JP2007312186A/ja
Publication of JP2007312186A publication Critical patent/JP2007312186A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

【課題】送信音声と受信音声とで保存すべき方を適切に選択して保存することでメモリ量を削減する。更に、保存時の符号化処理/復号化処理の内部状態も保存し、再生時にはこの保存内容により音声復号化部の内部状態を更新することにより、録音時に音声が送信側/受信側で頻繁に切り替わっていても再生時に異音が生ずることがない。
【解決手段】録音時には、送信音声符号と受信音声符号の音声レベルをレベル判定部132で比較し大きい方を音声符号保存部151に保存するように録音再生制御部131は各スイッチを制御する。更に、その時の音声符号化部112あるいは音声復号化部122の内部状態及び送信側音声/受信側音声の区別を示す情報を内部状態保存部152に保存する。再生時には、内部状態保存部152から読み出した情報に基づき音声復号化部122の内部状態を更新して、音声符号保存部151から読み出した音声符号の復号化を行う。
【選択図】 図1

Description

本発明は、通話音声録音再生装置及び通話音声録音再生方法に関する。
例えば、電話機等に用いられる従来の通話音声録音再生装置について、図6乃至図8を参照して説明する。図6には、従来の通話音声録音再生装置の構成が示されている。
図6において、従来の通話音声録音再生装置は、入力処理部511と、音声符号化部512と、送信処理部513と、受信処理部523と、音声復号化部522と、出力処理部521と、録音再生制御部531と、スイッチ541、542、543、544と、送信符号保存部551と、受信符号保存部552とで構成されている。
次に、図6の通話音声録音再生装置の動作を図7及び図8のフローチャートを使用して説明する。まず、通話音声を録音する動作について、図7により説明する。
通話音声を録音する場合、録音再生制御部531は、スイッチ541及び542をオンにする(ステップB1)。その後、音声符号化部512から入力する音声符号が、スイッチ541を経由して、送信符号保存部551に出力され、送信符号保存部551に保存される(ステップB2)。また、受信処理部523から入力する音声符号が、スイッチ542を経由して、受信符号保存部552に出力され、受信符号保存部552に保存される(ステップB3)。その後、通話音声録音再生装置は、録音動作が終了かどうかを判定し(ステップB4)、録音動作が終了でない場合は、再度ステップB2からステップB3までの動作を繰り返す。
次に、録音した通話音声を再生する動作について、図8により説明する。通話音声を再生する場合、録音再生制御部531は、まず、スイッチ544を送信符号保存部551側に切り替える(ステップB11)。その後、音声復号化部522は、送信符号保存部551に保存されている音声符号をスイッチ544経由で入力し、音声復号化処理を実行する(ステップB12)。次に、録音再生制御部531は、スイッチ544を受信符号保存部552側に切り替える(ステップB13)。その後、音声復号化部522は、受信符号保存部552に保存されている音声符号をスイッチ544経由で入力し、音声復号化処理を実行する(ステップB14)。尚、ステップB11及びB12で実行される送信符号の復号化処理と、ステップB13及びB14で実行される受信符号の復号化処理との順序は入れ替わっていても構わない。
次に、音声復号化部522は、ステップB12で復号化された復号化後の音声信号と、ステップB14で復号化された復号化後の音声信号とを加算し、出力処理部521に出力する(ステップB15)。その後、通話音声録音再生装置は、例えば、通話音声録音再生装置のユーザが装置の再生停止ボタンを押下したか否か、等の情報により、再生動作が終了かどうかを判定し(ステップB16)、再生動作が終了でない場合は、再度ステップB11からステップB15までの動作を繰り返す。
下記特許文献1には、ディジタル電話等での会話内容の録音再生を行う録音再生装置が開示されている。又、下記特許文献2には、ディジタル携帯電話装置等に使用出来る符号化データ伝送装置が開示されている。
特開平8−289002号公報(第4−7頁、図1) 特開2002−164796号公報(第4−6頁、図1)
しかしながら、図6乃至図8に示した従来の通話音声録音再生装置においては次のような課題がある。即ち、音声符号化部512から入力する音声符号及び受信処理部523から入力する音声符号の両方の音声符号を、常に無条件に保存しているため、音声符号を保存するために膨大なメモリ量が必要となるということである。
このメモリ量に関し、送信音声と受信音声の両方を同時に録音する場合に音声符号を保存するためのメモリ量を削減する手段として次のようなことが考えられる。例えば、音声符号化部512に入力されるディジタル音声信号(即ち、送信音声)と、音声復号化部522が出力するディジタル音声信号(即ち、受信音声)とを加算し、加算後のディジタル音声信号を符号化してメモリに保存することである。しかしながらこの場合は、音声符号化部512とは別の音声符号化部と加算部とが更に必要となり、メモリ以外のハードウェア容量が増加してしまう。
又、送信音声と受信音声の両方を同時に録音する場合に音声符号を保存するためのメモリ量を削減する手段として、例えば、送信符号と受信符号のいずれか一方の音声符号を選択して保存するという手段が考えられる。しかしながら、この場合、送信符号と受信符号が混在した音声符号に対して、復号化処理をそのまま実行すると、送信符号と受信符号が切り替わる時点で、入力音声符号と音声復号化部の内部状態との間に不整合が発生し、音声復号化処理が適切に実行されず、復号化後の音声に異音が生じるなどの課題がある。
上記特許文献1においては、受信音声と送信音声の音声レベルを比較し、どちらか一方の音声をメモリに保存している。しかしながら、上述のような音声の切り替え点に対する対策がなされていない。
又、上記特許文献2においては、蓄積された音声符号化データと受信音声符号化データとの切り替え時に音声復号処理部の内部状態情報を初期化することで、蓄積音声/受信音声切り替え時の異音発生を少なくしている。しかしながら、この構成では、あくまで音声復号処理部の初期化に留まり、大きな異音は発生しないが異音発生を完全に抑制することは出来ない。特許文献2の構成では、受信端末ユーザの意志でキー入力により蓄積済み音声と受信音声とを切り替えており、その切り替えは頻繁には発生しない。しかしながら、本発明のように、送信音声と受信音声とを切り替えて録音/再生する構成では、その切り替えはユーザの操作によるものではないので、頻繁に発生し得る。したがって、そのような頻繁な切り替え発生時にも異音発生を可能な限り抑制する工夫が必要である。
本発明の目的は、上述した従来の課題をを解決する通話音声録音再生装置及び通話音声録音再生方法を提供することにある。
本発明の第1の通話音声録音再生装置は、送信音声及び受信音声を録音、再生する通話音声録音再生装置において、録音時には、送信音声符号と受信音声符号の音声レベルを比較しレベルの大きい方を音声符号保存部に保存すると共に、保存した方の音声符号を処理する音声符号化部あるいは音声復号化部の内部状態及び送信側音声/受信側音声の区別を示す情報を内部状態保存部に保存し、再生時には、前記内部状態保存部から読み出した前記情報に基づき前記音声復号化部の内部状態を更新して、前記音声符号保存部から読み出した音声符号の復号化を行う、ことを特徴とする。
本発明の第2の通話音声録音再生装置は、送信音声及び受信音声を録音、再生する通話音声録音再生装置において、送信すべき音声を符号化する音声符号化部と、受信音声符号を復号化する音声復号化部と、送信音声符号と受信音声符号の音声レベルを比較しレベルの大きい方を判定するレベル判定部と、音声符号を保存する音声符号保存部と、前記音声符号化部の符号化処理及び前記音声復号化部の復号化処理の内部状態を示す内部状態情報及び送信音声符号と受信音声符号のどちらを録音したかを示す録音方向情報を保存する内部状態保存部と、録音再生制御手段とを備え、前記録音再生制御手段は、録音時には、前記レベル判定部の判定結果に基づいて、前記送信音声符号と前記受信音声符号とで前記レベルの大きい方を前記音声符号保存部に保存させると共に、保存された音声符号に対応する前記音声符号化部あるいは前記音声復号化部における前記内部状態情報と前記録音方向情報とを前記内部状態保存部に保存させ、再生時には、前記音声符号保存部に保存された再生すべき音声符号を読み出して前記音声復号化部に供給させると共に、前記内部状態保存部に保存された前記再生すべき音声符号に対応した前記内部状態情報と前記録音方向情報とを読み出して前記音声復号化部に供給させ、前記音声復号化部は、再生時に、復号する音声符号に対応する前記録音方向情報に変化があった時には、前記内部状態保存部から読み出した前記内部状態情報により前記音声復号化部の内部状態を更新して、前記音声符号保存部から読み出した音声符号の復号化を行なう、ことを特徴とする。
又、本発明の通話音声録音再生装置において、前記録音再生制御手段が、録音再生制御部と、この録音再生制御部の制御により切り替えられる切り替えスイッチとを備え、前記録音再生制御部は、録音時には、前記レベル判定部の判定結果に基づいて前記切り替えスイッチを制御して、前記送信音声符号と前記受信音声符号とで常に前記レベルの大きい方に切り替えて前記音声符号保存部に保存させると共に、保存された音声符号に対応する前記音声符号化部あるいは前記音声復号化部における前記内部状態情報と前記録音方向情報とを前記内部状態保存部に保存させ、再生時には、前記切り替えスイッチを制御して、前記音声符号保存部に保存された再生すべき音声符号を読み出して前記音声復号化部に供給させると共に、前記内部状態保存部に保存された前記再生すべき音声符号に対応した前記内部状態情報と前記録音方向情報とを読み出して前記音声復号化部に供給させる、ようにしても良い。
本発明の第3の通話音声録音再生装置は、送信音声及び受信音声を録音、再生する通話音声録音再生装置において、録音時には、送信音声と受信音声の有音/無音の区別を判定し有音判定の方の音声符号を音声符号保存部に保存すると共に、保存した方の音声符号を処理する音声符号化部あるいは音声復号化部の内部状態及び送信側音声/受信側音声の区別を示す情報を内部状態保存部に保存し、再生時には、前記内部状態保存部から読み出した前記情報に基づき前記音声復号化部の内部状態を更新して、前記音声符号保存部から読み出した音声符号の復号化を行う、ことを特徴とする。
本発明の第4の通話音声録音再生装置は、送信音声及び受信音声を録音、再生する通話音声録音再生装置において、送信すべき音声を符号化する音声符号化部と、受信音声符号を復号化する音声復号化部と、送信音声と受信音声の有音/無音の区別を判定する有音無音判定部と、音声符号を保存する音声符号保存部と、前記音声符号化部の符号化処理及び前記音声復号化部の復号化処理の内部状態を示す内部状態情報及び送信音声符号と受信音声符号のどちらを録音したかを示す録音方向情報を保存する内部状態保存部と、録音再生制御手段とを備え、前記録音再生制御手段は、録音時には、前記有音無音判定部の判定結果に基づいて、前記送信音声符号と前記受信音声符号とで有音判定の方を前記音声符号保存部に保存させると共に、保存された音声符号に対応する前記音声符号化部あるいは前記音声復号化部における前記内部状態情報と前記録音方向情報とを前記内部状態保存部に保存させ、再生時には、前記音声符号保存部に保存された再生すべき音声符号を読み出して前記音声復号化部に供給させると共に、前記内部状態保存部に保存された前記再生すべき音声符号に対応した前記内部状態情報と前記録音方向情報とを読み出して前記音声復号化部に供給させ、前記音声復号化部は、再生時に、復号する音声符号に対応する前記録音方向情報に変化があった時には、前記内部状態保存部から読み出した前記内部状態情報により前記音声復号化部の内部状態を更新して、前記音声符号保存部から読み出した音声符号の復号化を行なう、ことを特徴とする。
又、本発明の通話音声録音再生装置において、前記録音再生制御手段が、録音再生制御部と、この録音再生制御部の制御により切り替えられる切り替えスイッチとを備え、前記録音再生制御部は、録音時には、前記有音無音判定部の判定結果に基づいて前記切り替えスイッチを制御して、前記送信音声符号と前記受信音声符号とで常に有音判定の方に切り替えて前記音声符号保存部に保存させると共に、保存された音声符号に対応する前記音声符号化部あるいは前記音声復号化部における前記内部状態情報と前記録音方向情報とを前記内部状態保存部に保存させ、再生時には、前記切り替えスイッチを制御して、前記音声符号保存部に保存された再生すべき音声符号を読み出して前記音声復号化部に供給させると共に、前記内部状態保存部に保存された前記再生すべき音声符号に対応した前記内部状態情報と前記録音方向情報とを読み出して前記音声復号化部に供給させる、ようにしても良い。
本発明の第1の通話音声録音再生方法は、送信音声及び受信音声を録音、再生する通話音声録音再生方法において、録音時には、送信音声符号と受信音声符号の音声レベルを比較しレベルの大きい方を音声符号保存部に保存すると共に、保存した方の音声符号を処理する音声符号化部あるいは音声復号化部の内部状態及び送信側音声/受信側音声の区別を示す情報を内部状態保存部に保存し、再生時には、前記内部状態保存部から読み出した前記情報に基づき前記音声復号化部の内部状態を更新して、前記音声符号保存部から読み出した音声符号の復号化を行う、ことを特徴とする。
本発明の第2の通話音声録音再生方法は、送信音声及び受信音声を録音、再生する通話音声録音再生方法において、録音時には、送信音声と受信音声の有音/無音の区別を判定し有音判定の方の音声符号を音声符号保存部に保存すると共に、保存した方の音声符号を処理する音声符号化部あるいは音声復号化部の内部状態及び送信側音声/受信側音声の区別を示す情報を内部状態保存部に保存し、再生時には、前記内部状態保存部から読み出した前記情報に基づき前記音声復号化部の内部状態を更新して、前記音声符号保存部から読み出した音声符号の復号化を行う、ことを特徴とする。
本発明によれば、送信音声と受信音声との比較結果に基づいて、保存すべき方の音声符号を適切に選択することにより通話音声を保存するメモリ量を削減し、かつ、保存した音声符号の符号化処理/復号化処理の内部状態も保存し、再生時にはこの保存した内部状態により音声復号化部を更新することにより、録音時に音声が送信側/受信側で頻繁に切り替わっていても再生時に異音が生ずることがない。その理由は、この更新により、再生用に読み出された音声符号と、音声復号化部の持つ内部状態との間に生じる不整合が解消されるからである。
次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。図1を参照すると、本発明の一実施形態の通話音声録音再生装置は、入力処理部111と、音声符号化部112と、送信処理部113と、出力処理部121と、音声復号化部122と、受信処理部123と、録音再生制御部131と、レベル判定部132と、スイッチ141、142、143、144、145と、音声符号保存部151と、内部状態保存部152とを備えている。尚、録音再生制御部131と、これにより制御されるスイッチ141−145とで録音再生制御手段を構成する。
入力処理部111は、図示しないマイクからアナログ音声信号を入力し、A/D(アナログ/ディジタル)変換処理を行い、ディジタル音声信号を音声符号化部112に出力する。
音声符号化部112は、入力処理部111からディジタル音声信号を入力し、高能率音声符号化処理を行い、音声符号をレベル判定部132、スイッチ141及び142に出力する。又、音声符号化部112は、高能率音声符号化処理の内部状態に関する情報をスイッチ144に出力する。ここで言う内部状態とは、具体的には、高能率音声符号化処理の中で実行する部分的再生処理のフィルタ状態などを指す。又、音声符号化部112は、録音方向を表す情報をスイッチ144に出力する。ここで言う録音方向とは、具体的には、録音の対象となる音声符号が送信方向の音声符号、又は、受信方向の音声符号、のいずれの音声符号であるかを表す情報である。この場合、すなわち、音声符号化部112から出力される場合の録音方向は、「送信方向の音声符号」という情報になる。
スイッチ142は、録音再生制御部131により制御され、音声符号化部112から入力する音声符号、又は、音声符号保存部151から入力する音声符号のいずれかを選択し、送信処理部113に出力する。
送信処理部113は、スイッチ142から音声符号を入力し、送信用処理(誤り訂正符号化処理等)を行い、送信データを、通話の相手である対向側の通話音声装置に対して送信する。
受信処理部123は、通話の相手である対向側の通話音声装置から受信データを受信し、受信用処理(誤り訂正復号化処理等)を行い、音声符号をレベル判定部132、スイッチ141及び143に出力する。
スイッチ143は、録音再生制御部131により制御され、受信処理部123から入力する音声符号、または、音声符号保存部151から入力する音声符号のいずれかを選択し、音声復号化部122に出力する。
音声復号化部122は、スイッチ143から音声符号を入力し、高能率音声復号化処理を行い、ディジタル音声信号を出力処理部121に出力する。又、音声復号化部122は、高能率音声復号化処理の内部状態に関する情報をスイッチ144に出力する。ここで言う内部状態とは、具体的には、音声復号化処理の中で実行する再生処理のフィルタ状態などを指す。又、音声復号化部122は、録音方向を表す情報をスイッチ144に出力する。ここで言う録音方向とは、具体的には、録音の対象となる音声符号が送信方向の音声符号、又は、受信方向の音声符号、のいずれの音声符号であるかを表す情報である。この場合、即ち、音声復号化部122から出力される場合の録音方向は、「受信方向の音声符号」という情報になる。
出力処理部121は、音声復号化部122からディジタル音声信号を入力し、D/A(ディジタル/アナログ)変換処理を行い、アナログ音声信号を図示しないスピーカに出力する。
レベル判定部132は、音声符号化部112及び受信処理部123からそれぞれ音声符号を入力し、それぞれの音声符号に含まれている音声のレベル符号を比較し、送信音声と受信音声のどちらの音声のレベルが大きいかを判定し、判定結果を録音再生制御部131に出力する。
録音再生制御部131は、通話音声を録音する時には、レベル判定部132より入力した判定結果に基づき、スイッチ141及び144を制御する。又、通話音声を再生する時には、スイッチ142、143及び145を制御する。
スイッチ141は、録音再生制御部131により制御され、音声符号化部112から入力する音声符号、又は、受信処理部123から入力する音声符号のいずれかを選択し、音声符号保存部151に出力する。
スイッチ144は、録音再生制御部131により制御され、音声符号化部112から入力した高能率音声符号化処理の内部状態及び録音方向の情報、又は、音声復号化部122から入力した高能率音声復号化処理の内部状態及び録音方向の情報のいずれかを選択し、内部状態保存部152に出力する。
スイッチ145は、録音再生制御部131により制御され、内部状態保存部152に保存されている内部状態及び録音方向の情報を音声復号化部122に出力する。
音声符号保存部151は、スイッチ141からの音声符号を入力し、これを保存する。
内部状態保存部152は、スイッチ144から内部状態及び録音方向の情報を入力し、これを保存する。
次に、本発明を実施するための最良の形態の動作について図面を参照して説明する。図2及び図3に示すフローチャートを使用して、図1の通話音声録音再生装置の動作を説明する。
まず、通話音声を録音する動作について、図2を参照して説明する。レベル判定部132は、音声符号化部112からの音声符号を入力する(ステップA1)。又、レベル判定部132は、受信処理部123からの音声符号を入力する(ステップA2)。尚、ステップA1とステップA2の実行順序は入れ替わっても構わない。
次に、レベル判定部132は、音声符号化部112から入力する音声符号に含まれている音声のレベル符号と、受信処理部123から入力する音声符号に含まれている音声のレベル符号とを比較し、送信音声と受信音声のうち、どちらの音声のレベルが大きいかを判定する(ステップA3)。ここで、音声のレベル符号とは、音声符号に含まれる符号の一種であり、符号化前の音声信号のレベルの大小に対応する符号である。例えば、3GPP(3rd Generation Partnership Project) AMR(Adaptive Multi−Rate)符号化方式における、GAIN符号がこの音声のレベル符号に相当する。
例えば、音声符号化部112から入力する音声符号に含まれている音声のレベル符号に対応する音声のレベルが、受信処理部123から入力する音声符号に含まれている音声のレベル符号に対応する音声のレベルよりも大きい場合は、「送信音声のレベルが受信音声のレベルよりも大きい」と判定する。又、受信処理部123から入力する音声符号に含まれている音声のレベル符号に対応する音声のレベルが、音声符号化部112から入力する音声符号に含まれている音声のレベル符号に対応する音声のレベルよりも大きい場合は、「受信音声のレベルが送信音声のレベルよりも大きい」と判定する。
次に、レベル判定部132は、ステップA3で判定した判定結果を録音再生制御部131に出力する(ステップA4)。録音再生制御部131は、レベル判定部132から入力した判定結果に基づき、スイッチ141及び144の切り替えを制御する(ステップA5)。
具体的には、「送信音声のレベルが受信音声のレベルよりも大きい」という判定結果を入力した場合は、スイッチ141を音声符号化部112側に切り替え、音声符号化部112から入力する音声符号を音声符号保存部151に出力する動作を可能にする。又、スイッチ144を音声符号化部112側に切り替え、音声符号化部112から入力する高能率音声符号化処理の内部状態及び録音方向の情報を内部状態保存部152に出力する動作を可能にする。
一方、「受信音声のレベルが送信音声のレベルよりも大きい」という判定結果を入力した場合は、スイッチ141を受信処理部123側に切り替え、受信処理部123から入力する音声符号を音声符号保存部151に出力する動作を可能にする。又、スイッチ144を音声復号化部122側に切り替え、音声復号化部122から入力する高能率音声復号化処理の内部状態及び録音方向の情報を内部状態保存部152に出力する動作を可能にする。
その後、音声符号化部112から入力する音声符号、または、受信処理部123から入力する音声符号のいずれかの音声符号が、スイッチ141を経由して、音声符号保存部151に出力され、音声符号保存部151に保存される(ステップA6)。
又、音声符号化部112から入力する高能率音声符号化処理の内部状態及び録音方向、又は、音声復号化部122から入力する高能率音声復号化処理の内部状態及び録音方向のいずれかの内部状態及び録音方向の情報が、スイッチ144を経由して、内部状態保存部152に出力され、それが内部状態保存部152に保存される(ステップA7)。
その後、通話音声録音再生装置は、例えば、ユーザが装置の録音停止ボタン(図示せず)を押下したか否か、等の情報により、録音動作が終了かどうかを判定し(ステップA8)、録音動作が終了でない場合は、再度ステップA1からステップA7までの動作を繰り返す。
次に、録音した通話音声を再生する動作について、図3を参照して説明する。録音再生制御部131は、再生動作を行うために、スイッチ143を音声符号保存部151側に切り替える(ステップA11)。又、録音再生制御部131は、再生動作を行うために、スイッチ145をオンにし、内部状態保存部152から出力される内部状態及び録音方向の情報を音声復号化部122に入力する動作を可能にする(ステップA12)。
次に、音声復号化部122は、音声符号保存部151に保存されている音声符号を、スイッチ143を経由して入力する(ステップA13)。又、音声復号化部122は、内部状態保存部152に保存されている録音方向の情報をスイッチ145経由で入力し、録音方向が送信方向または受信方向のいずれの方向であるかを確認する(ステップA14)。
ここで、音声復号化部122は、録音方向に変化があったかどうかを確認する。「録音方向に変化があった」とは、内部状態保存部152から入力した録音方向が送信方向から受信方向に切り替わった場合、又は、受信方向から送信方向に切り替わった場合のいずれかの場合を指す(ステップA15)。ステップA15において、録音方向に変化があった場合、音声復号化部122は、内部状態保存部152に保存されている内部状態の情報をスイッチ145を経由して入力し、音声復号化部122内の高能率音声復号化処理の内部状態にコピーし、内部状態を更新する(ステップA16)。その後、音声復号化部122は、ステップA13で入力した音声符号に対して復号化処理を実行する(ステップA17)。
ここで、ステップA15からステップA17の動作について補足説明する。例えば、音声復号化部122が音声符号保存部151から入力する録音符号が、ずっと連続して送信符号である状態を例に挙げる。この状態は、音声符号を録音する際に、送信方向の音声符号と受信方向の音声符号のうち、送信方向の音声符号が連続して選択され、音声符号保存部151に保存された、ということを表している。
この場合、録音符号を再生する時に、音声復号化部122は送信方向の音声符号に対して連続して復号化処理を行うことになる。送信方向の音声符号に対して連続して復号化処理を行うと、高能率音声復号化処理の内部状態、例えば、高能率音声復号化処理の中に存在する合成フィルタのフィルタ状態などが、送信方向の音声符号により更新され続けている状態になっている。
ここで、ある時点から、音声復号化部122が音声符号保存部151から入力する録音符号が受信符号に切り替わったとする。この時点で、音声復号化部122に入力される音声符号は受信方向の音声符号に切り替わるが、高能率音声復号化処理の内部状態、例えば、高能率音声復号化処理の中に存在する合成フィルタのフィルタ状態などは、送信方向の音声符号により更新され続けていた状態になっている。即ち、音声復号化部122に入力される音声符号(受信方向の音声符号)と、音声復号化部122の持つ内部状態(送信方向の音声符号により更新され続けていた状態)との間に不整合が生じる。この不整合は、復号化後の音声に異音が生じるなど、復号化音声の品質劣化の可能性を伴う。
そこで、音声復号化部122は、この録音方向の切り替わりが発生した時点で、内部状態保存部152に保存していた内部状態を入力し、入力した内部状態を、音声復号化部122の持つ内部状態、例えば、高能率音声復号化処理の中に存在する合成フィルタのフィルタ状態にコピーする。それにより、音声復号化部122の持つ内部状態を、切り替わり後の音声符号、即ち、この場合は、受信方向の音声符号に適した状態に更新してから、切り替わり後の音声符号、即ち、受信符号の音声復号化処理を行う。このように、音声復号化部122に入力される音声符号と、音声復号化部122の持つ内部状態との間に生じる不整合を解消することにより、復号化後の音声に異音が生じるなどの、復号化音声の品質劣化の可能性を抑制する。
その後、通話音声録音再生装置は、例えば、ユーザが装置の再生停止ボタン(図示せず)を押下したか否か、等の情報により、再生動作が終了かどうかを判定し(ステップA18)、再生動作が終了でない場合は、再度ステップA13からステップA17までの動作を繰り返す。
次に、本発明の他の実施形態について説明する。その基本的構成は上記の構成と共通しているが、保存すべき音声符号を選択するための判定処理について更に工夫が施されている。図4は、本発明の他の実施形態による通話音声録音再生装置を示すブロック図であり、図1と対応する部分には同一番号を付して重複する説明は省略する。
図4と図1とを比較すると、送信処理部113(図1)が送信処理部114(図4)に、受信処理部123(図1)が受信処理部124(図4)に、レベル判定部132(図1)が有音無音判定部133(図4)に、各々置き換わっている点が異なる。更に、図4では、有音検出部115が追加されている。
送信処理部114は、図1の送信処理部113と比較して、送信用処理を行う対象とする入力信号が追加されている点が異なっている。送信処理部114は、スイッチ142から音声符号を入力し、有音検出部115から有音無音情報を入力し、音声符号及び有音無音情報に対して送信用処理(誤り訂正符号化処理等)を行い、送信データを対向側の通話音声装置に対して送信する。
受信処理部124は、図1の受信処理部123と比較して、受信用処理を行った後の出力信号の出力先が追加されている点が異なっている。受信処理部124は、対向側の通話音声装置から受信データを受信し、受信用処理(誤り訂正復号化処理等)を行い、音声符号をスイッチ141及び143に出力すると共に、有音か無音かを示す有音無音情報を有音無音判定部133に出力する。
有音無音判定部133は、図1のレベル判定部132と比較して、音声符号の選択方法が異なっている。有音無音判定部133は、有音検出部115及び受信処理部124からそれぞれ有音無音情報を入力し、それぞれの有音無音情報を比較し、送信音声と受信音声のうち、どちらの音声が有音であるかを判定し、判定結果を録音再生制御部131に出力する。
有音検出部115は、入力処理部111からディジタル音声信号を入力し、有音検出処理を行い、有音無音判定結果を有音無音情報として有音無音判定部133及び送信処理部114に出力する。
図5は、本発明の他の実施形態による通話音声録音再生装置の録音動作を示すフローチャートであり、図2と対応する部分には同一ステップ番号を付して重複する説明は省略する。
図5において、本実施形態による録音動作は、図2におけるステップA1、A2、A3及びA4で示される処理が、各々ステップA21、A22、A23及びA24に置き換わっている点で異なる。
図5において、有音無音判定部133は、有音検出部115からの有音無音情報を入力する(ステップA21)。又、有音無音判定部133は、受信処理部124からの有音無音情報を入力する(ステップA22)。尚、ステップA21とステップA22の実行順序は入れ替わっても構わない。
次に、有音無音判定部133は、有音検出部115から入力する有音無音情報と、受信処理部124から入力する有音無音情報とを比較し、送信音声と受信音声のうち、どちらの音声が有音であるかを判定する(ステップA23)。具体的には、有音検出部115から入力する有音無音情報が「有音」であり、かつ、受信処理部124から入力する有音無音情報が「無音」である場合は、「送信音声が有音」と判定する。又、有音検出部115から入力する有音無音情報が「無音」であり、かつ、受信処理部124から入力する有音無音情報が「有音」である場合は、「受信音声が有音」と判定する。
尚、有音検出部115から入力する有音無音情報、及び、受信処理部124から入力する有音無音情報が、いずれも「有音」であった場合、または、有音検出部115から入力する有音無音情報、及び、受信処理部124から入力する有音無音情報が、いずれも「無音」であった場合は、予め定めた任意の適切な判定処理を行う。例えば、直前の判定結果と同一の判定結果を下す、という方法が考えられる。
次に、有音無音判定部133は、ステップA23で判定した判定結果を録音再生制御部131に出力する(ステップA24)。以降の処理(ステップA5−A8)は、図2と同じである。又、図4の本発明の他の実施形態の再生動作(フローチャート)は図3と同一で良い。
このように、本発明の他の実施形態では、単純に音声のレベルだけではなく、音声が有音か無音かという情報により、保存すべき音声符号/内部状態/録音方向を選択しているため、保存する音声符号/内部状態/録音方向をより精密に選択することができるという効果が得られる。
尚、本発明は上述の実施形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲で種々変形して実施することが出来る。
本発明の一実施形態の構成を示す機能ブロック図である。 本発明の一実施形態における録音動作を説明するフローチャートである。 本発明の一実施形態における再生動作を説明するフローチャートである。 本発明の他の実施形態の構成を示す機能ブロック図である。 本発明の他の実施形態における録音動作を説明するフローチャートである。 従来の通話音声録音再生装置の一例を示す機能ブロック図である。 従来の通話音声録音再生装置の録音動作を説明するフローチャートである。 従来の通話音声録音再生装置の再生動作を説明するフローチャートである。
符号の説明
111 入力処理部
112 音声符号化部
113 送信処理部
114 送信処理部
115 有音検出部
121 出力処理部
122 音声復号化部
123 受信処理部
124 受信処理部
131 録音再生制御部
132 レベル判定部
133 有音無音判定部
141 スイッチ
142 スイッチ
143 スイッチ
144 スイッチ
145 スイッチ
151 音声符号保存部
152 内部状態保存部

Claims (8)

  1. 送信音声及び受信音声を録音、再生する通話音声録音再生装置において、
    録音時には、送信音声符号と受信音声符号の音声レベルを比較しレベルの大きい方を音声符号保存部に保存すると共に、保存した方の音声符号を処理する音声符号化部あるいは音声復号化部の内部状態及び送信側音声/受信側音声の区別を示す情報を内部状態保存部に保存し、
    再生時には、前記内部状態保存部から読み出した前記情報に基づき前記音声復号化部の内部状態を更新して、前記音声符号保存部から読み出した音声符号の復号化を行う、
    ことを特徴とする通話音声録音再生装置。
  2. 送信音声及び受信音声を録音、再生する通話音声録音再生装置において、
    送信すべき音声を符号化する音声符号化部と、
    受信音声符号を復号化する音声復号化部と、
    送信音声符号と受信音声符号の音声レベルを比較しレベルの大きい方を判定するレベル判定部と、
    音声符号を保存する音声符号保存部と、
    前記音声符号化部の符号化処理及び前記音声復号化部の復号化処理の内部状態を示す内部状態情報及び送信音声符号と受信音声符号のどちらを録音したかを示す録音方向情報を保存する内部状態保存部と、
    録音再生制御手段とを備え、
    前記録音再生制御手段は、
    録音時には、前記レベル判定部の判定結果に基づいて、前記送信音声符号と前記受信音声符号とで前記レベルの大きい方を前記音声符号保存部に保存させると共に、保存された音声符号に対応する前記音声符号化部あるいは前記音声復号化部における前記内部状態情報と前記録音方向情報とを前記内部状態保存部に保存させ、
    再生時には、前記音声符号保存部に保存された再生すべき音声符号を読み出して前記音声復号化部に供給させると共に、前記内部状態保存部に保存された前記再生すべき音声符号に対応した前記内部状態情報と前記録音方向情報とを読み出して前記音声復号化部に供給させ、
    前記音声復号化部は、
    再生時に、復号する音声符号に対応する前記録音方向情報に変化があった時には、前記内部状態保存部から読み出した前記内部状態情報により前記音声復号化部の内部状態を更新して、前記音声符号保存部から読み出した音声符号の復号化を行なう、
    ことを特徴とする通話音声録音再生装置。
  3. 前記録音再生制御手段が、録音再生制御部と、この録音再生制御部の制御により切り替えられる切り替えスイッチとを備え、
    前記録音再生制御部は、
    録音時には、前記レベル判定部の判定結果に基づいて前記切り替えスイッチを制御して、前記送信音声符号と前記受信音声符号とで常に前記レベルの大きい方に切り替えて前記音声符号保存部に保存させると共に、保存された音声符号に対応する前記音声符号化部あるいは前記音声復号化部における前記内部状態情報と前記録音方向情報とを前記内部状態保存部に保存させ、
    再生時には、前記切り替えスイッチを制御して、前記音声符号保存部に保存された再生すべき音声符号を読み出して前記音声復号化部に供給させると共に、前記内部状態保存部に保存された前記再生すべき音声符号に対応した前記内部状態情報と前記録音方向情報とを読み出して前記音声復号化部に供給させる、
    ことを特徴とする請求項2記載の通話音声録音再生装置。
  4. 送信音声及び受信音声を録音、再生する通話音声録音再生装置において、
    録音時には、送信音声と受信音声の有音/無音の区別を判定し有音判定の方の音声符号を音声符号保存部に保存すると共に、保存した方の音声符号を処理する音声符号化部あるいは音声復号化部の内部状態及び送信側音声/受信側音声の区別を示す情報を内部状態保存部に保存し、
    再生時には、前記内部状態保存部から読み出した前記情報に基づき前記音声復号化部の内部状態を更新して、前記音声符号保存部から読み出した音声符号の復号化を行う、
    ことを特徴とする通話音声録音再生装置。
  5. 送信音声及び受信音声を録音、再生する通話音声録音再生装置において、
    送信すべき音声を符号化する音声符号化部と、
    受信音声符号を復号化する音声復号化部と、
    送信音声と受信音声の有音/無音の区別を判定する有音無音判定部と、
    音声符号を保存する音声符号保存部と、
    前記音声符号化部の符号化処理及び前記音声復号化部の復号化処理の内部状態を示す内部状態情報及び送信音声符号と受信音声符号のどちらを録音したかを示す録音方向情報を保存する内部状態保存部と、
    録音再生制御手段とを備え、
    前記録音再生制御手段は、
    録音時には、前記有音無音判定部の判定結果に基づいて、前記送信音声符号と前記受信音声符号とで有音判定の方を前記音声符号保存部に保存させると共に、保存された音声符号に対応する前記音声符号化部あるいは前記音声復号化部における前記内部状態情報と前記録音方向情報とを前記内部状態保存部に保存させ、
    再生時には、前記音声符号保存部に保存された再生すべき音声符号を読み出して前記音声復号化部に供給させると共に、前記内部状態保存部に保存された前記再生すべき音声符号に対応した前記内部状態情報と前記録音方向情報とを読み出して前記音声復号化部に供給させ、
    前記音声復号化部は、
    再生時に、復号する音声符号に対応する前記録音方向情報に変化があった時には、前記内部状態保存部から読み出した前記内部状態情報により前記音声復号化部の内部状態を更新して、前記音声符号保存部から読み出した音声符号の復号化を行なう、
    ことを特徴とする通話音声録音再生装置。
  6. 前記録音再生制御手段が、録音再生制御部と、この録音再生制御部の制御により切り替えられる切り替えスイッチとを備え、
    前記録音再生制御部は、
    録音時には、前記有音無音判定部の判定結果に基づいて前記切り替えスイッチを制御して、前記送信音声符号と前記受信音声符号とで常に有音判定の方に切り替えて前記音声符号保存部に保存させると共に、保存された音声符号に対応する前記音声符号化部あるいは前記音声復号化部における前記内部状態情報と前記録音方向情報とを前記内部状態保存部に保存させ、
    再生時には、前記切り替えスイッチを制御して、前記音声符号保存部に保存された再生すべき音声符号を読み出して前記音声復号化部に供給させると共に、前記内部状態保存部に保存された前記再生すべき音声符号に対応した前記内部状態情報と前記録音方向情報とを読み出して前記音声復号化部に供給させる、
    ことを特徴とする請求項5記載の通話音声録音再生装置。
  7. 送信音声及び受信音声を録音、再生する通話音声録音再生方法において、
    録音時には、送信音声符号と受信音声符号の音声レベルを比較しレベルの大きい方を音声符号保存部に保存すると共に、保存した方の音声符号を処理する音声符号化部あるいは音声復号化部の内部状態及び送信側音声/受信側音声の区別を示す情報を内部状態保存部に保存し、
    再生時には、前記内部状態保存部から読み出した前記情報に基づき前記音声復号化部の内部状態を更新して、前記音声符号保存部から読み出した音声符号の復号化を行う、
    ことを特徴とする通話音声録音再生方法。
  8. 送信音声及び受信音声を録音、再生する通話音声録音再生方法において、
    録音時には、送信音声と受信音声の有音/無音の区別を判定し有音判定の方の音声符号を音声符号保存部に保存すると共に、保存した方の音声符号を処理する音声符号化部あるいは音声復号化部の内部状態及び送信側音声/受信側音声の区別を示す情報を内部状態保存部に保存し、
    再生時には、前記内部状態保存部から読み出した前記情報に基づき前記音声復号化部の内部状態を更新して、前記音声符号保存部から読み出した音声符号の復号化を行う、
    ことを特徴とする通話音声録音再生方法。
JP2006140147A 2006-05-19 2006-05-19 通話音声録音再生装置及び通話音声録音再生方法 Pending JP2007312186A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006140147A JP2007312186A (ja) 2006-05-19 2006-05-19 通話音声録音再生装置及び通話音声録音再生方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006140147A JP2007312186A (ja) 2006-05-19 2006-05-19 通話音声録音再生装置及び通話音声録音再生方法

Publications (1)

Publication Number Publication Date
JP2007312186A true JP2007312186A (ja) 2007-11-29

Family

ID=38844613

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006140147A Pending JP2007312186A (ja) 2006-05-19 2006-05-19 通話音声録音再生装置及び通話音声録音再生方法

Country Status (1)

Country Link
JP (1) JP2007312186A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009107211A1 (ja) * 2008-02-28 2009-09-03 富士通株式会社 音声データの質問発話部抽出処理プログラム,方法および装置,ならびに音声データの質問発話部を用いた顧客問い合わせ傾向推定処理プログラム,方法および装置
WO2009130785A1 (ja) * 2008-04-25 2009-10-29 富士通株式会社 問題解決時間推定処理プログラム,処理装置および処理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06164479A (ja) * 1992-11-26 1994-06-10 Kyocera Corp 携帯電話装置
JPH08289002A (ja) * 1995-04-18 1996-11-01 Matsushita Electric Ind Co Ltd 録音再生装置及び録音再生方法
JPH10116097A (ja) * 1996-10-11 1998-05-06 Olympus Optical Co Ltd 音声再生装置
JPH10222199A (ja) * 1996-12-20 1998-08-21 Nokia Mobile Phones Ltd デジタル信号を記憶要素に記録する方法及びシステム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06164479A (ja) * 1992-11-26 1994-06-10 Kyocera Corp 携帯電話装置
JPH08289002A (ja) * 1995-04-18 1996-11-01 Matsushita Electric Ind Co Ltd 録音再生装置及び録音再生方法
JPH10116097A (ja) * 1996-10-11 1998-05-06 Olympus Optical Co Ltd 音声再生装置
JPH10222199A (ja) * 1996-12-20 1998-08-21 Nokia Mobile Phones Ltd デジタル信号を記憶要素に記録する方法及びシステム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009107211A1 (ja) * 2008-02-28 2009-09-03 富士通株式会社 音声データの質問発話部抽出処理プログラム,方法および装置,ならびに音声データの質問発話部を用いた顧客問い合わせ傾向推定処理プログラム,方法および装置
JP5099211B2 (ja) * 2008-02-28 2012-12-19 富士通株式会社 音声データの質問発話部抽出処理プログラム,方法および装置,ならびに音声データの質問発話部を用いた顧客問い合わせ傾向推定処理プログラム,方法および装置
WO2009130785A1 (ja) * 2008-04-25 2009-10-29 富士通株式会社 問題解決時間推定処理プログラム,処理装置および処理方法
JP5099218B2 (ja) * 2008-04-25 2012-12-19 富士通株式会社 問題解決時間推定処理プログラム,処理装置および処理方法

Similar Documents

Publication Publication Date Title
JPH02288520A (ja) 背景音再生機能付き音声符号復号方式
EP3553777B1 (en) Low-complexity packet loss concealment for transcoded audio signals
US7443978B2 (en) Method and apparatus for audio coding with noise suppression
US7047186B2 (en) Voice decoder, voice decoding method and program for decoding voice signals
JP2007312186A (ja) 通話音声録音再生装置及び通話音声録音再生方法
JP2904083B2 (ja) 音声符号化切替えシステム
JP3649854B2 (ja) 音声符号化装置
US20070248315A1 (en) Reproducing Device and Reproducing Method
JP2004120432A (ja) 移動通信端末
JP4470122B2 (ja) 音声符号化装置、音声復号化装置、音声符号化プログラムおよび音声復号化プログラム
JPH10326100A (ja) 音声録音方法及び音声再生方法及び音声録音再生装置
JPH11243341A (ja) 音声符号化復号化方法
JP3079894B2 (ja) 音声復号化装置
JP2008076847A (ja) 復号器及び信号処理システム
JPH1022936A (ja) 補間装置
JPH11220553A (ja) ディジタル携帯用電話機
JPH07334197A (ja) 音声符号化装置
JP2007184861A (ja) オーディオ再生装置
JP2003162299A (ja) 音声再生回路、デコード回路、音声再生装置及び音声再生方法
JPH06161497A (ja) 音声復号化器並びに音声符号化器
JP3222226B2 (ja) 復号装置
JP5263712B2 (ja) データ送受信装置、データ送受信方法及びデータ送受信プログラム
JP2011013620A (ja) 音声編集方法及び装置
JP2007114471A (ja) 通話音声録音装置及びプログラム
JP2007033993A (ja) 音声補間装置、音声補間方法、ならびに、プログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080613

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090414

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20090512

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100216

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100615