JP2016119588A - 音声情報修正システム、音声情報修正方法、及び音声情報修正プログラム - Google Patents

音声情報修正システム、音声情報修正方法、及び音声情報修正プログラム Download PDF

Info

Publication number
JP2016119588A
JP2016119588A JP2014258603A JP2014258603A JP2016119588A JP 2016119588 A JP2016119588 A JP 2016119588A JP 2014258603 A JP2014258603 A JP 2014258603A JP 2014258603 A JP2014258603 A JP 2014258603A JP 2016119588 A JP2016119588 A JP 2016119588A
Authority
JP
Japan
Prior art keywords
voice information
audio information
capacity
storage means
buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014258603A
Other languages
English (en)
Inventor
寛和 石田
Hirokazu Ishida
寛和 石田
一成 林
Kazunari Hayashi
一成 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisin AW Co Ltd
Toyota Motor Corp
Original Assignee
Aisin AW Co Ltd
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisin AW Co Ltd, Toyota Motor Corp filed Critical Aisin AW Co Ltd
Priority to JP2014258603A priority Critical patent/JP2016119588A/ja
Priority to US15/525,842 priority patent/US20170330595A1/en
Priority to EP15873030.9A priority patent/EP3240263B1/en
Priority to CN201580066728.7A priority patent/CN107112021A/zh
Priority to PCT/JP2015/085743 priority patent/WO2016104462A1/ja
Publication of JP2016119588A publication Critical patent/JP2016119588A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/30Flow control; Congestion control in combination with information about buffer occupancy at either end or at transit nodes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Telephone Function (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

【課題】バッファの如き格納手段の溢れ又は枯渇を防止して音声情報の連続性の維持を図る事が可能な、音声情報修正システム、音声情報修正方法、及び音声情報修正プログラムを提供すること。【解決手段】音声情報修正システムは、携帯端末10から送信された連続的な音声情報を格納するバッファ8aと、バッファ8aに格納された音声情報のうち、基準時間長さ連続する無音部分が存在するか否かを判定する無音部分判定部7dと、無音部分判定部7dにて無音部分が存在すると判定された場合、無音部分をバッファ8aから削除し、又は無音部分の前後に連続的に他の無音部分を追加してバッファ8aに格納することにより、音声情報を修正する音声情報修正部7eと、を備える。【選択図】図1

Description

本発明は、音声情報修正システム、音声情報修正方法、及び音声情報修正プログラムに関する。
従来、携帯電話等の携帯端末に記録された音声情報(例えば、音楽情報)を、車載装置のスピーカから出力して車内の複数人で聞くことが出来るシステムが要望されていた。そこで、携帯端末と車載装置とを(Bluetooth(登録商標))等の近距離無線通信にて接続し、携帯端末で音声情報をエンコードして送信し、このエンコードされた音声情報を車載装置で受信してデコードしてバッファに格納し、バッファに格納された音声情報を再生し、再生後の音声情報をバッファから破棄することにより、車載装置にて音声情報を再生可能としたシステムが提案されている(例えば、特許文献1参照)。
特開2013−236346号公報
ここで、上記の特許文献1は、エンコードする機器とデコードする機器とが異なるため、双方の処理時間に僅かな時間のずれが生じてしまう事があった。このことにより、音楽再生時に、音声情報をバッファに格納する速度に音声情報をバッファから破棄する速度が追い付かず、バッファに格納された音声情報の総量がバッファの総容量に達した結果、それ以上の音声情報を格納できなくなった状態(以下、バッファ溢れ)となってしまったり、音声情報をバッファから破棄する速度に音声情報をバッファに格納する速度が追い付かず、バッファに音声情報が格納されていない状態(以下、バッファ枯渇)となってしまったりする事があった。そして、このようなバッファ枯渇やバッファ溢れが生じると、バッファに格納される音声情報の連続性が維持できず、音声情報の連続再生が出来ない可能性があった。したがって、バッファの如き格納手段の溢れ又は枯渇を防止して、音声情報の連続性の維持を図る事が可能なシステムが要望されていた。
本発明は、上記に鑑みてなされたものであって、バッファの如き格納手段の溢れ又は枯渇を防止して音声情報の連続性の維持を図る事が可能な、音声情報修正システム、音声情報修正方法、及び音声情報修正プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明に係る音声情報修正システムは、送信手段から送信された連続的な音声情報を格納する格納手段と、前記格納手段に格納された前記音声情報のうち、基準時間長さ連続する無音部分が存在するか否かを判定する無音部分判定手段と、前記無音部分判定手段にて前記無音部分が存在すると判定された場合、前記無音部分を前記格納手段から削除し、又は前記無音部分の前後に連続的に他の無音部分を追加して前記格納手段に格納することにより、前記音声情報を修正する音声情報修正手段と、を備える。
また、本発明に係る音声情報修正方法は、送信手段から送信された連続的な音声情報を格納する格納手段に格納された前記音声情報のうち、基準時間長さ連続する無音部分が存在するか否かを判定する無音部分判定工程と、
前記無音部分判定工程にて前記無音部分が存在すると判定された場合、前記無音部分を前記格納手段から削除し、又は前記無音部分の前後に連続的に他の無音部分を追加して前記格納手段に格納することにより、前記音声情報を修正する音声情報修正工程と、を含む。
また、本発明に係る音声情報修正プログラムは、送信手段から送信された連続的な音声情報を格納する格納手段に格納された前記音声情報のうち、基準時間長さ連続する無音部分が存在するか否かを判定する無音部分判定工程と、前記無音部分判定工程にて前記無音部分が存在すると判定された場合、前記無音部分を前記格納手段から削除し、又は前記無音部分の前後に連続的に他の無音部分を追加して前記格納手段に格納することにより、前記音声情報を修正する音声情報修正工程と、をコンピュータに実行させる。
本発明に係る音声情報修正システム、音声情報修正方法、及び音声情報修正プログラムによれば、無音部分を格納手段から削除し、又は無音部分の前後に連続的に他の無音部分を追加することにより音声情報を修正するので、音声情報を格納する格納手段の溢れ又は枯渇を防止して音声情報の連続性の維持を図る事が可能となる。
さらに、音声情報の削除又は追加を行う対象を無音部分に限定する事で、有音部分が途切れてしまったり、有音部分に無音部分が埋め込まれてしまったりといった事態を防止でき、音声品質の劣化を防止する事が可能となる。
本発明の実施の形態に係る音声情報修正システムを例示するブロック図である。 デコード処理のフローチャートである。 再生制御処理の第1のフローチャートである。 再生制御処理の第2のフローチャートである。 再生制御処理の第3のフローチャートである。 バッファに格納された音声情報の容量の推移を示すグラフである。
以下、本発明に係る音声情報修正システム、音声情報修正方法、及び音声情報修正プログラムの実施の形態について図面を参照しつつ詳細に説明する。ただし、実施の形態によって本発明が限定されるものではない。
〔実施の形態の基本的概念〕
まず、実施の形態の基本的概念を説明する。この実施の形態は、概略的に、送信手段から送信された音声情報を修正する音声情報修正システムに関する。ここで、この音声情報修正システムが適用される対象は任意で、本実施の形態では、車載装置に適用するものとして説明するが、例えば、スマートフォンや携帯用ナビゲーション装置を含む任意の装置に適用する事も可能である。また、「送信手段」とは、音声情報を送信する事が可能な限り任意の装置に適用する事ができ、本実施の形態では、スマートフォン等の携帯端末であるものとして説明するが、例えば、音楽再生専用の機器等であっても構わない。
〔実施の形態の具体的内容〕
次に、実施の形態の具体的内容について説明する。
(構成)
本実施の形態では、車載用ナビゲーション装置(以下、車載装置)に音声情報修正プログラムをインストールすることにより、車載装置が音声情報修正システムとして機能する場合について説明する。なお、この他にも、上述したようなスマートフォンや携帯用ナビゲーション装置を含む任意の装置に音声情報修正プログラムをインストールすることによって音声情報修正システムを構成してもよい。また、音声情報修正システムにおける車載装置としての機能については、公知の車載装置と同様の構成により得ることができるので、その説明は省略することとし、以下では、特に音声情報を修正する機能を達成するための構成について説明する。なお、以下ではこの音声情報修正システムを搭載した車両(車載装置を操作するユーザが搭乗する車両)を単に「車両」と称して説明する。なお、「車両」には、自動四輪車、自動二輪車、及び自転車が含まれるが、以下では、車両が自動四輪車である場合について説明する。
ここで、図1は、本実施の形態に係る音声情報修正システムを例示するブロック図である。以下では、車載装置1、及び車載装置1と通信可能な携帯端末10の構成について順次説明する。
(構成−車載装置)
最初に、車載装置1の構成を説明する。図1に示すように、車載装置1は、概略的に、スピーカ2、タッチパネル3、ディスプレイ4、現在位置取得部5、通信部6、制御部7、及びデータ記録部8を備えている。
(構成−車載装置−スピーカ)
スピーカ2は、制御部7の制御に基づいて情報を音声にて出力する音声出力手段であり、特に、データ記録部8に格納された音声情報を再生する音声再生手段である。このスピーカ2から出力される音声の具体的な態様は任意であり、必要に応じて生成された合成音声や、予め録音された音声を出力することができる。
(構成−車載装置−タッチパネル)
タッチパネル3は、ユーザの指等で押圧されることにより、当該ユーザから各種手動入力を受け付けるものである。このタッチパネル3は、透明又は半透明状に形成され、ディスプレイ4の前面において当該ディスプレイ4の表示面と重畳するように設けられている。このタッチパネル3としては、例えば、抵抗膜方式や静電容量方式等による操作位置検出手段を備えた公知のタッチパネルを使用することができる。
(構成−車載装置−ディスプレイ)
ディスプレイ4は、車載装置1における各種の画像を表示する表示手段であり、特に、データ記録部8の公知の地図データベース(図示省略)に格納された地図情報に基づいて地図を表示する表示手段である。このディスプレイ4の具体的な構成は任意であり、公知の液晶ディスプレイや有機ELディスプレイの如きフラットパネルディスプレイを使用することができる。
(構成−車載装置−現在位置取得部)
現在位置取得部5は、車両の現在位置を取得する現在位置取得手段である。例えば、現在位置取得部5は、GPS、地磁気センサ、距離センサ、又はジャイロセンサ(いずれも図示省略)の少なくとも一つにより検出した現在の車載装置1の位置(座標)及び方位等を、公知の方法にて取得する。
(構成−車載装置−通信部)
通信部6は、センター装置(図示省略)や携帯端末10との間でネットワークを介した通信を行う通信手段である。この通信手段の具体的な種類や構成は任意であるが、例えば、公知の移動体無線通信手段や、FM多重放送やビーコンを介した公知のVICS(登録商標)システム用の無線通信手段を用いても良い。なお、本実施の形態においては、携帯端末10との通信を行う公知のBluetoothを利用した通信手段であって、携帯端末10から送信された連続的な音声情報を通信にて受信する通信手段として構成される。
(構成−車載装置−制御部)
制御部7は、車載装置1を制御する制御手段であり、具体的には、CPU、当該CPU上で解釈実行される各種のプログラム(OSなどの基本制御プログラムや、OS上で起動され特定機能を実現するアプリケーションプログラムを含む)、及びプログラムや各種のデータを格納するためのRAMの如き内部メモリを備えて構成されるコンピュータである。特に、本実施の形態に係る音声情報修正プログラムは、任意の記録媒体又はネットワークを介して車載装置1にインストールされることで、制御部7の各部を実質的に構成する。
この制御部7は、機能概念的に、デコード部7a、音声再生部7b、及び再生制御部7cを備えて構成されている。デコード部7aは、車載装置1の通信部6にて受信した音声情報をデコードするデコード手段である。音声再生部7bは、データ記録部8の後述するバッファ8aに格納された音声情報の再生を開始する再生手段である。再生制御部7cは、音声情報の再生に関する制御を行う再生制御手段であって、無音部分判定部7dと、音声情報修正部7eとを備えて構成されている。無音部分判定部7dは、データ記録部8の後述するバッファ8aに格納された音声情報のうち、基準時間長さ連続する無音部分が存在するか否かを判定する無音部分判定手段である。ここで、「無音部分」とは、音声情報に含まれる音声部分のうち無音(音量レベルがゼロ)の部分である。ただし、この無音部分としては、完全な無音に限らず、人の聴覚で認識できない程度の音量を有する部分を含めても良い。また、「基準時間」とは、音声情報のうち、当該基準時間長さの音声部分が削除又は追加されたとしても人が違和感を覚える事の無い程度の極めて短い時間であって、例えば、本実施の形態では基準時間を10ミリ秒として説明する。また、音声情報修正部7eは、無音部分判定部7dにて無音部分が存在すると判定された場合、無音部分をバッファ8aから削除し、又は無音部分の前後に連続的に他の無音部分を追加してバッファ8aに格納することにより、音声情報を修正する音声情報修正手段である。なお、これら制御部7の各部により行われる具体的な処理については後述する。
(構成−車載装置−データ記録部)
データ記録部8は、車載装置1の動作に必要なプログラム及び各種のデータを記録する記録手段であり、例えば、外部記録装置としてのハードディスク(図示省略)を用いて構成されている。ただし、ハードディスクに代えてあるいはハードディスクと共に、磁気ディスクの如き磁気的記録媒体、又はDVDやブルーレイディスクの如き光学的記録媒体を含む、その他の任意の記録媒体を用いることができる。ここで、このデータ記録部8は、バッファ8aを備えている。
バッファ8aは、携帯端末10から送信された連続的な音声情報を格納する格納手段である。具体的には、携帯端末10から音声情報が送信されると、音声情報が連続的な信号として次々に当該バッファ8aに格納されて蓄積していく。そして、バッファ8aに蓄積された信号は、信号の先頭から次々に音声再生部7bにて再生されていき、再生に使用された信号は破棄されていく。このように、バッファ8aでは音声情報の蓄積、再生、及び破棄が略同時進行で繰り返されていく。なお、このようなバッファ8aに音声情報を蓄積し、再生した音声情報を破棄する処理については公知であるため、詳細な説明を省略する。
ここで、バッファ8aは、概念的に、複数段(本実施の形態では、信号の先頭側から順に1段から20段までの計20段)に区分されており、各バッファ8aはそれぞれ同一の容量(例えば、6KByte)の情報を格納する区分である。すなわち、バッファ8a全体としては、最大で120KByte(6KByte×20段)の容量の情報を格納可能に構成されている。
(構成−携帯端末)
次に携帯端末10の構成について説明する。この携帯端末10は、音声情報を車載装置1に対して送信するための送信手段である。ここで、図1に示すように携帯端末10は概略的に、タッチパネル11、ディスプレイ12、通信部13、制御部14、及びデータ記録部15を備えている。
(構成−携帯端末−タッチパネル)
タッチパネル11は、ユーザの指等で押圧されることにより、当該ユーザから各種手動入力を受け付けるものである。このタッチパネル11は、透明又は半透明状に形成され、ディスプレイ12の前面において当該ディスプレイ12の表示面と重畳するように設けられている。このタッチパネル11としては、例えば、抵抗膜方式や静電容量方式等による操作位置検出手段を備えた公知のタッチパネルを使用することができる。
(構成−携帯端末−ディスプレイ)
ディスプレイ12は、携帯端末10における各種の画像を表示する表示手段であり、特に、携帯端末10のデータ記録部15の後述する音声DB15aに格納された音声情報に基づいて音声情報のリストを表示する表示手段である。このディスプレイ12の具体的な構成は任意であり、公知の液晶ディスプレイや有機ELディスプレイの如きフラットパネルディスプレイを使用することができる。
(構成−携帯端末−通信部)
通信部13は、車載装置1との間でネットワークを介した通信を行う通信手段である。この通信手段の具体的な種類や構成は任意であるが、例えば、公知の移動体無線通信手段や、FM多重放送やビーコンを介した公知のVICSシステム用の無線通信手段を用いても良いが、本実施の形態においては少なくとも車載装置1との通信を行う公知のBluetoothを利用した通信手段として構成される。
(構成−携帯端末−制御部)
制御部14は、携帯端末10を制御する制御手段であり、具体的には、CPU、当該CPU上で解釈実行される各種のプログラム(OSなどの基本制御プログラムや、OS上で起動され特定機能を実現するアプリケーションプログラムを含む)、及びプログラムや各種のデータを格納するためのRAMの如き内部メモリを備えて構成されるコンピュータである。
この制御部14は、機能概念的に、エンコード部14aを備えて構成されている。エンコード部14aは、データ記録部15の後述する音声DB15aに格納されている音声情報をエンコードするエンコード手段である。なお、制御部14により行われる具体的な処理については後述する。
(構成−携帯端末−データ記録部)
データ記録部15は、携帯端末10の動作に必要なプログラム及び各種のデータを記録する記録手段であり、例えば、外部記録装置としてのハードディスク(図示省略)を用いて構成されている。ただし、ハードディスクに代えてあるいはハードディスクと共に、磁気ディスクの如き磁気的記録媒体、又はDVDやブルーレイディスクの如き光学的記録媒体を含む、その他の任意の記録媒体を用いることができる。このデータ記録部15は、音声データベース15a(以降、データベースを「DB」と表記する)を備えている。
音声DB15aは、音声情報を格納する音声情報格納手段である。この音声DB15aには、任意の記録媒体又はネットワークを介して音声情報(例えば、音楽等)が取りこまれており、リスト化されて格納されている。なお、この音声DB15aに格納された音声情報は、携帯端末10のタッチパネル11を操作して再生する事で、携帯端末10のスピーカ(図示省略)から聴取する事ができる。
(処理)
次に、このように構成される音声情報修正システムによって実行される処理について説明する。
(処理−デコード処理)
まずは、デコード処理について説明する。このデコード処理は、概略的には、携帯端末10から送信された音声情報をデコードしてバッファ8aに格納するための処理である。なお、このデコード処理を実行するタイミングは任意であり、例えば、本実施の形態では車載装置1の電源がオンになった際に自動的に実行されるものとして説明する。
図2は、デコード処理のフローチャートである。まず、SA1において車載装置1の制御部7は、車載装置1と携帯端末10とが通信可能か否かの判定を行う。この通信可能か否かの判定を行う具体的な方法は任意であるが、例えば、車載装置1の通信部6と携帯端末10の通信部13とのBluetooth接続が確立されているか否かに基づいて判定しても良い。
具体的には、車載装置1が起動されている状態においては、車載装置1は、Bluetoothによる探索信号をブロードキャストしている。そして、ユーザが携帯端末10を保有した状態において車両に搭乗することにより、ユーザの携帯端末10が車載装置1の近距離無線通信範囲(通常、車載装置1から10m以内の範囲)に存在することとなり、ユーザの携帯端末10は車載装置1からの探索信号を受信し、車載装置1に対して近距離無線通信による接続確立のための接続確立信号を送信する。
そして、当該接続確立信号を受信した車載装置1は、携帯端末10に対してPINコード要求信号を送信し、当該PINコード要求信号を受信した携帯端末10は、当該ユーザの携帯端末10のディスプレイ12にPINコード入力画面を表示して、PINコードの入力を促す。そして、ユーザがPINコードを入力することによって、携帯端末10はPINコード信号を送信し、車載装置1が当該PINコードを受信すると、当該PINコードと車載装置1に予め記録されたPINコードとを照合し、一致した場合、携帯端末10とのBluetooth接続を確立する。なお、一度このように車載装置1と形態端末とのBluetooth接続が確立された場合、2回目以降は上記のようなPINコードの入力を省略し、携帯端末10が車載装置1の近距離無線通信範囲に位置した場合に、携帯端末10とのBluetooth接続を確立するものとしても良い。制御部7は、このようにして携帯端末10の通信部13と車載装置1の通信部6とのBluetooth接続が確立されているか否かを判定する。
そして、通信可能でない場合(SA1、No)、車載装置1の制御部7は、SA1を繰り返すことにより、通信可能となるまで待機する。そして、通信可能である場合(SA1、Yes)、SA2へ移行する。
SA2において車載装置1の制御部7は、携帯端末10から音声情報を取得したか否かを判定する。例えば、ユーザが携帯端末10のタッチパネル11を操作し、ディスプレイ12に表示された音声再生アイコンを押圧した場合、携帯端末10のエンコード部14aは音声DB15aに格納された音声情報をエンコードし、エンコードされた音声情報が、携帯端末10の通信部13を介して車載装置1に送信される。そして、車載装置1の制御部7は、車載装置1の通信部6を介してこのエンコードされた音声情報を受信した場合に、音声情報を取得したものと判定する。
そして、音声情報を取得していない場合(SA2、No)、車載装置1の制御部7は、SA2を繰り返すことにより、音声情報を取得するまで待機する。そして、音声情報を取得した場合(SA2、Yes)、SA3へ移行する。
SA3においてデコード部7aは、携帯端末10から取得した音声情報をデコードする。なお、このようなデコードを行う具体的な方法については公知の方法を採用する事ができるため、詳細な説明を省略する。
次に、SA4においてデコード部7aは、SA3にてデコードした音声情報をバッファ8aに格納する。このバッファ8aへの音声情報の格納と、後述するSA7で開始される音声情報の再生は、FIFO(First In, First Out)により行われる。特に、本実施の形態では、上述したように、バッファ8aが複数段(本実施の形態では、信号の先頭側から順に1段から20段までの計20段)に区分されており、先頭の区分(1段)から最後の区分(20段)に至る順に音声情報を格納する。
次に、SA5において車載装置1の制御部7は、携帯端末10から音声再生の停止を要求する停止信号を取得したか否かを判定する。具体的には、まず、ユーザが携帯端末10のタッチパネル11を操作し、ディスプレイ12に表示された再生停止アイコンを押圧した場合、携帯端末10の制御部14は停止信号を生成し、生成された停止信号が携帯端末10の通信部13を介して車載装置1に送信される。そして、車載装置1の制御部7は、車載装置1の通信部6を介してこの停止信号を受信している場合に、停止信号を取得したものと判定する。
そして、停止信号を取得した場合(SA5、Yes)、車載装置1の制御部7は、ユーザが音声情報の再生を望まないものとし、デコード処理を終了する。一方、停止信号を取得していない場合(SA5、No)、SA6へ移行する。
SA6において再生制御部7cは、バッファ8aに目標容量の音声情報が格納されているか否かを判定する。ここで、「目標容量」とは、バッファ8aに格納された音声情報を修正するための修正処理の終了判定(後述するSB4、SB9、SB14、SB19の判定)において参照される容量であり、さらに本実施の形態においては、音声情報の再生開始の基準となる容量である。この「目標容量」の具体的な設定方法は任意であるが、バッファ8aの枯渇及び溢れの両方から最も遠い容量とすることが好ましく、より具体的には、バッファ8a全体の容量に対する半分の容量とすることが好ましい。このため、本実施の形態では、目標容量=バッファ8a全体の容量である20段の半分の容量=10段分の容量としている。
そして、未だ10段分の音声情報が格納されていないと判定した場合(SA6、No)、バッファ8aに10段分の音声情報が格納されるまで、再度SA3において音声情報のデコード、SA4においてバッファ8aへの格納、SA5において停止信号取得の有無の判定、及びSA6において10段分の音声情報が格納されているか否かの判定の処理を繰り返し行う。一方、再生制御部7cは、バッファ8aに10段分の音声情報が格納されていると判定した場合(SA6、Yes)、SA7に移行する。
SA7において音声再生部7bは、再生処理を開始する。なお、再生処理についての具体的な説明については後述する。このように、本実施の形態においては、バッファ8aに10段分の容量の音声情報がバッファ8aに格納されてから音声の再生を行う再生処理が開始されるので、全体の容量に対する半分の容量の音声情報が格納された状態、即ち、バッファ8aの枯渇及び溢れの両方から最も遠い状態から再生処理を行う事ができ、バッファ8aの枯渇及び溢れが発生してしまう可能性を低減する事が出来る。
次に、SA8において再生制御部7cは、再生制御処理を開始する。なお、再生制御処理についての具体的な説明については後述する。
次に、SA9においてデコード部7aは、携帯端末10から取得した音声情報をデコードする。なお、このデコードの具体的な方法については、SA3と同様に公知であるため、説明を省略する。
次に、SA10においてデコード部7aは、SA9にてデコードした音声情報をバッファ8aに格納する。なお、この音声情報の格納の具体的な方法については、SA4と同様に公知であるため、説明を省略する。
次に、SA11において車載装置1の制御部7は、携帯端末10から音声再生の停止を要求する停止信号を取得したか否かを判定する。なお、この判定の具体的な方法については、SA5と同様であるため、説明を省略する。そして、停止信号を取得していないと判定した場合(SA11、No)、ユーザが未だ音声情報の再生を望んでいるものとし、再度SA9において音声情報のデコード、SA10においてバッファ8aへの格納、SA11において停止信号取得の判定の処理を繰り返し行う。一方、車載装置1の制御部7は、停止信号を取得した場合(SA11、Yes)、ユーザが音声情報の再生を望まないものとし、デコード処理を終了する。
(再生処理)
次に、SA7において音声再生部7bで開始される再生処理について説明する。再生処理は、デコード処理のSA3及びSA10においてバッファ8aに格納された音声情報を再生する処理である。具体的には、音声再生部7bは、バッファ8aに格納された音声情報をスピーカ2から再生し、再生した音声情報については破棄(消去)する。このように音声情報の再生と破棄とを繰り返し行う事により、バッファ8aに連続的に格納された音声情報を再生していく。なお、このような再生処理については公知の方法で行う事が可能であるので、詳細な説明を省略する。
(再生制御処理)
次に、SA8において再生制御部7cで開始される再生制御処理について説明する。図3は、再生制御処理の第1のフローチャート、図4は、再生制御処理の第2のフローチャート、図5は、再生制御処理の第3のフローチャートである。この再生制御処理は、概略的に、音声情報の再生時に、バッファ8aにおいてバッファ溢れやバッファ枯渇が発生する可能性を低減するための処理である。このために、当該音声情報修正システムは、再生制御処理を実行することにより、バッファ8aに格納された音声情報の容量が目標容量に近づくように、音声情報の修正を行う。この再生制御処理は、SA8において開始された後、SA11において停止信号を取得したものと判定されるまで(SA11,Yes)、繰り返して実行される。
まず、図3のSB1において再生制御部7cは、バッファ8aを参照し、バッファ8aに格納された音声情報の容量が、第2上限値以上となったか否かを判定する。なお、この第2上限値とは、バッファ溢れが生じる可能性が極めて高い状態であると判定するための指標となる値であって、後述する第1上限値(16段分の容量)よりも大きいことを条件として設定される値であり、本実施の形態では18段分の容量に設定しているものとするが、これに限らず、当該条件を満たす限りにおいて任意の容量(例えば、17段分から19段分の容量)に設定する事ができる。そして再生制御部7cは、第2上限値(18段分の容量)以上となっていないと判定した場合(SB1、No)、バッファ溢れの可能性が極めて高い状態ではないものとし、SB5へ移行する。一方、再生制御部7cは、第2上限値(18段分の容量)以上となっていると判定した場合(SB1、Yes)、バッファ溢れの可能性が極めて高い状態であるものとし、図4のSB2へ移行する。
SB2において、再生制御部7cは、計時を開始してから所定時間が経過したか否かを判定する。具体的には、車載装置1はタイマーの如き図示しない計時手段を備えており、SB2において再生制御部7cはまず、この計時手段にて計時を開始し、その後に所定時間が経過するまで待機し(SB2、No)、所定時間が経過した場合(SB2、Yes)、SB3へ移行する。ここで、「所定時間」とは、後述するSB3において音声部分を繰り返し削除する際の時間間隔を決定するための時間である。この所定時間としては任意の時間を設定して良いが、所定時間を短くし過ぎると、SB3において頻繁に10ミリ秒の音声部分が削除される事となり、音声を聴取する者が違和感を覚えてしまう可能性がある反面、所定時間を長くし過ぎると、SB3において10ミリ秒の音声部分を削除してバッファ溢れを防止する機能が低下してしまうため、これらのバランスを取った時間に設定する事が好ましい。なお、本実施の形態では、所定時間を1秒に設定しているものとする。
次に、SB3において音声情報修正部7eは、バッファ8aに格納された音声情報のうち基準時間長さの音声部分を削除する。ここで、「基準時間長さ」は、ユーザが音声情報を聴取した際に違和感を覚える事の無い程度の極めて短い時間である限り任意の時間を設定して良く、本実施の形態においては10ミリ秒であるものとするが、これに限られない。なお、削除する音声部分は格納された音声情報のうちどの部分であっても構わず、本実施の形態では音声情報の先頭の部分を削除するものとするが、例えば、音声情報の末尾の部分や中間の部分であっても構わない。
次に、SB4において再生制御部7cは、バッファ8aを参照し、バッファ8aに格納された音声情報の容量が、目標容量まで減少したか否かを判定する。この目標容量としては、本実施の形態においては上述したように10段分の容量を設定しているものとする。そして、再生制御部7cは、バッファ8aに格納された音声情報の容量が、目標容量(10段分の容量)まで減少していないと判定した場合(SB4、No)、即ち11段分から20段分の音声情報が格納されていると判定した場合、未だバッファ溢れの可能性が極めて高い状態であるものとし、再度SB2に移行する。以降同様に、SB2〜SB4を繰り返すことで、バッファ8aに格納された音声情報の容量が目標容量(10段分の容量)に到達するまでは、所定時間(1秒)間隔で基準時間長さ(10ミリ秒)の音声部分を削除する。このため、バッファ溢れの可能性が極めて高い状態からの回避を図る事が可能となる。一方、再生制御部7cは、バッファ8aに格納された音声情報の容量が、目標容量(10段分の容量)まで減少したと判定した場合(SB4、Yes)、SB3にて音声部分を削除したことによって、バッファ溢れの可能性が極めて高い状態から回避出来たものとし、図3に戻り、再生制御処理を終了する(この図3においては図示の便宜上「終了」と表記しているが、再生制御処理は、上述したように、SA11において停止信号を取得したものと判定されるまで(SA11,Yes)、繰り返して実行される。以下同様)。このように、バッファ8aに格納された音声情報の容量が目標容量(10段分の容量)に達したら、削除を自動的に終了するので、不要な削除を防止する事が可能となる。また、目標容量をバッファ8aの全体の容量(20段分の容量)に対する半分の容量(10段分の容量)としたので、バッファ8aの溢れ及び枯渇が最も発生し難い中間の容量を目標とする事ができ、バッファ8aの溢れや枯渇を防止して音声情報の連続性の維持を図る事が可能となる。
また、図3のSB5において再生制御部7cは、バッファ8aを参照し、バッファ8aに格納された音声情報の容量が、第1上限値以上となったか否かを判定する。なお、この第1上限値とは、バッファ溢れが生じる可能性がある程度高い状態であると判定するための指標となる値であって、目標容量(10段分の容量)よりも大きいことを条件として設定される値であり、本実施の形態では16段分の容量に設定しているものとするが、これに限らず、当該条件を満たす限りにおいて任意の容量(例えば、11段分から17段分の容量)に設定する事ができる。そして再生制御部7cは、第1上限値(16段分)以上となっていないと判定した場合(SB5、No)、バッファ溢れの可能性がある程度高い状態ではないものとし、SB10へ移行する。一方、再生制御部7cは、第1上限値(16段分)以上となっていると判定した場合(SB5、Yes)、バッファ溢れの可能性がある程度高い状態であるものとし、図4のSB6へ移行する。
SB6において無音部分判定部7dは、バッファ8aを参照し、バッファ8aに格納された音声情報に基準時間長さ(10ミリ秒)の無音部分が存在するか否かを判定する。なお、当該判定の具体的な方法については公知であり、詳細な説明を省略する。そして、無音部分判定部7dは、無音部分が存在すると判定した場合(SB6、Yes)、SB7へ移行し、無音部分が存在しないと判定した場合(SB6、No)、SB8へ移行する。
SB7において音声情報修正部7eは、バッファ8aに格納された基準時間長さ(10ミリ秒)の無音部分を削除する。このように削除する音声部分を無音部分に限定する事で、無音部分を減縮又は増長でき、音声品質の劣化を抑制する事が可能となると共に、バッファ8aの溢れ又は枯渇を防止して音声情報の連続性の維持を図る事が可能となる。すなわち、無音部分の一部を削除することで音声情報の一部が飛んでしまう事には変わりないが、音の有る音声部分を削除する場合と比べて音声が飛んだ事を分かり難くする事が可能となる。
次に、SB8において再生制御部7cは、バッファ8aを参照し、バッファ8aに格納された音声情報の容量が、第2上限値(18段分の容量)以上となったか否かを判定する。そして再生制御部7cは、第2上限値(18段分の容量)以上となっていると判定した場合(SB8、Yes)、バッファ溢れの可能性が極めて高い状態であるものとし、SB2へ移行する。すなわち、音声情報の容量が第2上限値(18段分の容量)に達したにも関わらず音声情報に無音部分が存在しないような場合には、SB6及びSB7の処理では音声情報の容量を減少させる事ができず、音声情報が第2上限値(18段分の容量)以上に達してしまう可能性がある。このため、このような場合には、バッファ溢れの可能性が極めて高い状態の処理(SB2、SB3)に移行して、無音部分の有無に関わらず音声部分を削除する事で、バッファ溢れの防止を図る。一方、再生制御部7cは、第2上限値(18段分の容量)以上となっていないと判定した場合(SB8、No)、バッファ溢れの可能性が極めて高い状態ではないものとし、SB9へ移行する。
SB9において再生制御部7cは、バッファ8aを参照し、バッファ8aに格納された音声情報の容量が、目標容量(10段分の容量)まで減少したか否かを判定する。そして、再生制御部7cは、目標容量(10段分の容量)まで減少していないと判定した場合(SB9、No)、即ち第2上限値(18段分の容量)未満ではあるが目標容量(10段分の容量)を超える音声情報が格納されていると判定した場合、未だバッファ溢れの可能性がある程度高い状態であるものとし、再度SB6に移行する。以降同様に、SB6〜SB9を繰り返すことで、バッファ8aに格納された音声情報の容量が目標容量(10段分の容量)に到達するまでは、無音部分を削除する事が出来るので、バッファ溢れの可能性がある程度高い状態からの回避を図る事が可能となる。一方、再生制御部7cは、目標容量(10段分の容量)まで減少していると判定した場合(SB9、Yes)、SB7にて基準時間長さ(10ミリ秒)の無音部分を削除したことによって、バッファ溢れの可能性がある程度高い状態から回避出来たものとし、図3に戻り、再生制御処理を終了する。
また、図3のSB10において再生制御部7cは、バッファ8aを参照し、バッファ8aに格納された音声情報の容量が、第2下限値以下となったか否かを判定する。なお、この第2下限値とは、バッファ枯渇が生じる可能性が極めて高い状態であると判定するための指標となる値であって、後述する第1下限値(5段分の容量)よりも小さいことを条件として設定される値であり、本実施の形態では3段分の容量に設定しているものとするが、これに限らず、当該条件を満たす限りにおいて任意の容量(例えば、1段分から4段分の容量)に設定する事ができる。そして再生制御部7cは、第2下限値(3段分)以下となっていないと判定した場合(SB10、No)、バッファ枯渇の可能性が極めて高い状態ではないものとし、SB15へ移行する。一方、再生制御部7cは、第2下限値(3段分)以下となったと判定した場合(SB10、Yes)、バッファ枯渇の可能性が極めて高い状態であるものとし、図5のSB11へ移行する。
SB11において、再生制御部7cは、計時を開始してから所定時間(1秒)が経過したか否かを判定する。具体的には、車載装置1はタイマーの如き図示しない計時手段を備えており、SB11において再生制御部7cはまず、この計時手段にて計時を開始し、その後に所定時間(1秒)が経過するまで待機し(SB11、No)、所定時間(1秒)が経過した場合(SB11、Yes)、SB12へ移行する。
次に、SB12において音声情報修正部7eは、バッファ8aに格納された音声情報のうち基準時間長さ(10ミリ秒分)の音声部分をコピーする。ここで、この「基準時間長さ」は、ユーザが音声情報を聴取した際に違和感を覚える事の無い程度の極めて短い時間である限り任意の時間を設定して良く、本実施の形態においては10ミリ秒であるものとするが、これに限られない。なお、コピーする音声部分は格納された音声情報のうちどの部分であっても構わず、本実施の形態では音声情報の先頭の部分をコピーするものとするが、例えば、音声情報の末尾の部分や中間の部分であっても構わない。
次に、SB13において音声情報修正部7eは、コピーした音声部分を、当該コピーされた音声部分の前後に追加して格納する。なお、追加する部分は音声部分の前後に限らず他の部分でも構わないが、当該前後の部分に追加する事で、同様の音が繰り返されるため、音声品質の劣化を防止する上では好ましい。
次に、SB14において再生制御部7cは、バッファ8aを参照し、バッファ8aに格納された音声情報の容量が、目標容量(10段分の容量)まで増加したか否かを判定する。そして、再生制御部7cは、バッファ8aに格納された音声情報の容量が、目標容量(10段分の容量)まで増加していないと判定した場合(SB14、No)、即ち目標容量(10段分の容量)未満の音声情報しか格納されていないと判定した場合、未だバッファ枯渇の可能性が極めて高い状態であるものとし、再度SB11に移行する。以降同様に、SB11〜SB14を繰り返すことで、バッファ8aに格納された音声情報の容量が目標容量(10段分の容量)に到達するまでは、所定時間(1秒)間隔で基準時間長さ(10ミリ秒分)の音声部分を追加する事が出来るので、バッファ枯渇の可能性が極めて高い状態からの回避を図る事が可能となる。一方、再生制御部7cは、バッファ8aに格納された音声情報の容量が、目標容量(10段分の容量)まで減少したと判定した場合(SB14、Yes)、SB13にて音声部分を追加したことによって、バッファ枯渇の可能性が極めて高い状態から回避出来たものとし、図3に戻り、再生制御処理を終了する。このように、バッファ8aに格納された音声情報の容量が目標容量(10段分の容量)に達したら、追加を自動的に終了するので、不要な追加を防止する事が可能となる。
また、図3のSB15において再生制御部7cは、バッファ8aを参照し、バッファ8aに格納された音声情報の容量が、第1下限値(5段分の容量)以下となったか否かを判定する。なお、この第1下限値とは、バッファ枯渇が生じる可能性がある程度高い状態であると判定するための指標となる値であって、目標容量(10段分の容量)より小さいことを条件として設定される値であり、本実施の形態では5段分の容量に設定しているものとするが、これに限らず、当該条件を満たす限りにおいて任意の容量(例えば、9段分から4段分の容量)に設定する事ができる。そして再生制御部7cは、第1下限値(5段分の容量)以下となってないと判定した場合(SB15、No)、バッファ枯渇の可能性がある程度高い状態ではないものとし、再生制御処理を終了する。一方、再生制御部7cは、第1下限値(5段分の容量)以下となっていると判定した場合(SB15、Yes)、バッファ枯渇の可能性がある程度高い状態であるものとし、図5のSB16へ移行する。
SB16において無音部分判定部7dは、バッファ8aを参照し、バッファ8aに格納された音声情報に基準時間長さ(10ミリ秒)の無音部分が存在するか否かを判定する。そして、無音部分判定部7dは、無音部分が存在すると判定した場合(SB16、Yes)、SB17へ移行し、無音部分が存在しないと判定した場合(SB16、No)、SB18へ移行する。
SB17において、音声情報修正部7eは、バッファ8aに格納された基準時間長さ(10ミリ秒)の無音部分の前後に新たに基準時間長さの無音部分を追加する。このように無音部分を追加する場所を、音声情報に含まれている無音部分の前後に限定する事で、音声品質の劣化を抑制しつつ、バッファ枯渇の可能性を低減する事が出来る。すなわち、無音部分を追加することで音声情報の一部が間延びしてしまう事には変わりないが、音の有る音声部分の前後に無音部分を追加する場合と比べて、「ボツ」音のようなノイズによる音声品質の劣化を抑制することができ、また、音声が間延びした事を分かり難くする事が可能となる。
次に、SB18において再生制御部7cは、バッファ8aを参照し、バッファ8aに格納された音声情報の容量が、第2下限値(3段分の容量)以下となったか否かを判定する。そして再生制御部7cは、第2下限値(3段分の容量)以下となっていると判定した場合(SB18、Yes)、バッファ枯渇の可能性が極めて高い状態であるものとし、SB11へ移行する。すなわち、音声情報の容量が5段分に達したにも関わらず音声情報に無音部分が存在しないような場合には、SB16及びSB17の処理では音声情報の容量を増大させる事ができず、音声情報が第2下限値(3段分の容量)以下に達してしまう可能性がある。しかし、そのような場合には、バッファ枯渇の可能性が極めて高い状態の処理(SB11〜SB14の処理)に移行して、無音部分の有無に関わらず音声部分を追加する事で、バッファ枯渇の防止を図る事が可能となる。一方、再生制御部7cは、第2下限値(3段分の容量)以下となっていないと判定した場合(SB18、No)、バッファ枯渇の可能性が極めて高い状態ではないものとし、SB19へ移行する。
次に、SB19において再生制御部7cは、バッファ8aを参照し、バッファ8aに格納された音声情報の容量が、目標容量(10段分の容量)まで増加したか否かを判定する。そして、再生制御部7cは、目標容量(10段分の容量)まで増加していないと判定した場合(SB19、No)、即ち第2下限値(3段分の容量)を超えているが目標容量(10段分の容量)未満の音声情報しか格納されていないと判定した場合、未だバッファ枯渇の可能性がある程度高い状態であるものとし、再度SB16に移行する。以降同様に、SB16〜SB19を繰り返すことで、バッファ8aに格納された音声情報の容量が目標容量(10段分の容量)に到達するまでは、無音部分を追加する事が出来るので、バッファ枯渇の可能性がある程度高い状態からの回避を図る事が可能となる。なお、同じ個所に無音部分を追加し続けると、無音部分が大きく間延びしてしまう可能性があるので、一度無音部分を追加した部分の前後には無音部分を追加しないようにする事がより好ましい。一方、再生制御部7cは、目標容量(10段分の容量)まで増加していると判定した場合(SB19、Yes)、SB13にて音声部分を追加したことによって、バッファ枯渇の可能性が極めて高い状態から回避出来たものとし、図3に戻り、再生制御処理を終了する。
続いて、上記のような再生処理及び再生制御処理が行われた場合の、バッファ8aに格納された音声情報の容量の推移の一例を説明する。図6は、バッファ8aに格納された音声情報の容量の推移を示すグラフである。図6において横軸は時間を示しており、縦軸はバッファ8aに格納された音声情報の容量をバッファ8aの段数で示している。この図6に示すように、音声情報を再生してバッファ8aから破棄するスピードが、音声情報をバッファ8aに格納するスピードに追い付いていない場合においても、音声情報の容量が第1上限値(16段分の容量)以上となった際には、容量が目標容量(10段分の容量)に減少するまで無音部分の削除が行われ、バッファ溢れやバッファ枯渇から最も遠い状態を維持する事が可能となる。なお、図示は省略するが、音声情報の容量が第2上限値(18段分の容量)以上、第1下限値(5段分の容量)以下、第2下限値(3段分の容量)以下となった場合にも、同様に無音部分又は音声部分の削除や追加が行われ、音声情報の容量が目標容量(10段分の容量)に近づくように音声情報が修正される。これにて、再生制御処理の説明を終了する。
〔実施の形態に対する変形例〕
以上、本発明に係る実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した本発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。
(解決しようとする課題や発明の効果について)
まず、発明が解決しようとする課題や発明の効果は、上述の内容に限定されるものではなく、発明の実施環境や構成の細部に応じて異なる可能性があり、上述した課題の一部のみを解決したり、上述した効果の一部のみを奏することがある。例えば、音声品質の劣化を抑制する事が可能となると共に、音声情報を格納する格納手段の溢れ又は枯渇を防止して音声情報の連続性の維持を図る事ができない場合であっても、従来と異なる技術により音声情報の修正を行うことが出来ている場合には、本願発明の課題が解決されている。
(分散や統合について)
また、上述した各電気的構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散や統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散又は統合して構成できる。例えば、データ記録部8を複数の記録装置により分散して構成してもよい。
(形状、数値、構造、時系列について)
実施の形態や図面において例示した構成要素に関して、形状、数値、又は複数の構成要素の構造若しくは時系列の相互関係については、本発明の技術的思想の範囲内において、任意に改変及び改良することができる。
(目標容量について)
本実施の形態では、図2に示すデコード処理において再生制御処理を開始するための条件である目標容量と、図3、図4、図5に示す再生制御処理において音声情報を削除又は追加する際の目標容量とを、相互に同一の容量(10段分の容量)としたが、これらは相互に異なる容量であっても構わない。
(所定時間について)
本実施の形態では、図4のSB2における所定時間と、図5のSB11における所定時間とを、同一の時間(1秒)としたが、これらは相互に異なる時間であっても構わない。
(基準時間について)
本実施の形態では、図4のSB3における基準時間と、図4のSB7における基準時間と、図5のSB12における基準時間と、図5のSB17における基準時間とを、相互に同一の時間(10ミリ秒)としたが、これらは相互に異なる時間であっても構わない。
(再生制御処理について)
本実施の形態では、図3及び図4に示す再生制御処理において、バッファ8aに格納された音声情報の容量が18段以上となった場合(SB1、Yes)、目標容量(10段分)に減少するまで(SB4、Yes)、SB2、SB3、SB4の処理を繰り返し実行するものとして説明したが、これに限られない。具体的には、目標容量(10段)に減少する前にSB2、SB3、SB4の処理の繰り返しを解除しても良く、例えば、バッファ8aに格納された音声情報の容量が第1上限値と第2上限値の間の容量となった場合には、バッファ溢れの可能性が極めて高い状態は回避できたが未だバッファ溢れの可能性がある程度高いものとし、SB6に移行しても良い。
また、本実施の形態では、図3及び図5に示す再生制御処理において、バッファ8aに格納された音声情報の容量が3段分以下となった場合(SB15、Yes)、目標容量(10段分)に増加するまで(SB14、Yes)、SB11、SB12、SB13、SB14の処理を繰り返し実行するものとして説明したが、これに限られない。具体的には、目標容量(10段)に増加する前にSB11、SB12、SB13、SB14の処理の繰り返しを解除しても良く、例えば、バッファ8aに格納された音声情報の容量が第1下限値と第2下限値の間の容量となった場合には、バッファ枯渇の可能性が極めて高い状態は回避できたが未だバッファ枯渇の可能性がある程度高いものとし、SB16に移行しても良い。
(通信について)
本実施の形態では、エンコード部14aを備える携帯端末10と、デコード部7aを備える車載装置1との間で通信を行うものとしたが、これに限らず、例えば、音声情報の通信を行うあらゆる装置に当該音声情報修正システムを適用できる。例えば、エンコードやデコードを伴う事無く音声情報の送受信が可能な通信であっても適用する事ができる。
〔実施の形態の特徴と効果の一部〕
最後に、これまでに説明した実施の形態の特徴と効果の一部を、以下に例示する。ただし、実施の形態の特徴と効果は、以下の内容に限定されず、以下の特徴の一部のみを具備することによって以下の効果の一部のみを奏する場合や、以下の特徴以外の他の特徴を具備することによって以下の効果以外の他の効果を奏する場合がある。
実施の形態の1つの側面1に係る音声情報修正システムは、送信手段から送信された連続的な音声情報を格納する格納手段と、前記格納手段に格納された前記音声情報のうち、基準時間長さ連続する無音部分が存在するか否かを判定する無音部分判定手段と、前記無音部分判定手段にて前記無音部分が存在すると判定された場合、前記無音部分を前記格納手段から削除し、又は前記無音部分の前後に連続的に他の無音部分を追加して前記格納手段に格納することにより、前記音声情報を修正する音声情報修正手段と、を備える。
上記側面1に係る音声情報修正システムによれば、無音部分を格納手段から削除し、又は無音部分の前後に連続的に他の無音部分を追加することにより音声情報を修正するので、無音部分を減縮又は増長でき、音声品質の劣化を抑制する事が可能となると共に、音声情報を格納する格納手段の溢れ又は枯渇を防止して音声情報の連続性の維持を図る事が可能となる。
実施の形態の他の側面2に係る音声情報修正システムは、上記側面1に係る音声情報修正システムにおいて、前記音声情報修正手段は、前記格納手段に格納された前記音声情報の容量が、目標容量より大きい第1上限値以上となった場合、前記無音部分を前記格納手段から削除し、前記格納手段に格納された前記音声情報の容量が、前記目標容量より小さい第1下限値以下となった場合、前記無音部分の前後に連続的に他の無音部分を追加して前記格納手段に格納する。
上記側面2に係る音声情報修正システムによれば、格納手段に格納された音声情報の容量が第1上限値以上となった場合に無音部分の削除を行い、格納手段に格納された音声情報の容量が第1下限値以下となった場合に無音部分の追加を行うので、音声情報を格納する格納手段の溢れや枯渇が生じる可能性がある程度高い場合に、無音部分を減縮又は増長でき、音声品質の劣化を抑制する事が可能となると共に、音声情報を格納する格納手段の溢れ又は枯渇を防止して音声情報の連続性の維持を図る事が可能となる。
実施の形態の他の側面3に係る音声情報修正システムは、上記側面2に係る音声情報修正システムにおいて、前記音声情報修正手段は、前記格納手段に格納された前記音声情報の容量が、前記第1上限値よりも大きい第2上限値以上となった場合、前記音声情報における所定長さの音声部分を前記格納手段から削除し、前記格納手段に格納された前記音声情報の容量が、前記第1下限値よりも小さい第2下限値以下となった場合、前記音声情報における所定長さの音声部分を追加して前記格納手段に格納する。
上記側面3に係る音声情報修正システムによれば、格納手段に格納された音声情報の容量が第2上限値以上となった場合に音声部分の削除を行い、格納手段に格納された音声情報の容量が第2下限値以下となった場合に音声部分の追加を行うので、音声情報を格納する格納手段の溢れや枯渇が生じる可能性が極めて高い場合に、音声品質の劣化の抑制よりも、音声情報を格納する格納手段の溢れと枯渇の防止を優先して行う事ができ、音声情報の連続性の維持を図る事が可能となる。
実施の形態の他の側面4に係る音声情報修正システムは、上記側面2又は上記側面3に係る音声情報修正システムにおいて、前記音声情報修正手段は、前記格納手段に格納された音声情報の容量が前記目標容量となった場合、前記無音部分の削除若しくは追加、又は前記音声部分の削除若しくは追加を停止する。
上記側面4に係る音声情報修正システムによれば、格納手段に格納された音声情報の容量が目標容量に達したら、削除又は追加を自動的に終了するので、不要な削除又は追加を削減する事が可能となる。
実施の形態の他の側面5に係る音声情報修正システムは、上記側面2から上記側面4のいずれかの側面に係る音声情報修正システムにおいて、前記目標容量は、前記格納手段の全体の容量に対する半分の容量である、
上記側面5に係る音声情報修正システムによれば、目標容量を格納手段の全体の容量に対する半分の容量としたので、音声情報を格納する格納手段の溢れ及び枯渇が最も発生し難い中間の容量を目標とする事ができ、音声情報を格納する格納手段の溢れや枯渇を防止して音声情報の連続性の維持を図る事が可能となる。
実施の形態の他の側面6に係る音声情報修正システムは、上記側面1から上記側面5のいずれかの側面に係る音声情報修正システムにおいて、前記格納手段の全体の容量に対する半分の容量の前記音声情報が格納された場合、前記格納手段に格納された前記音声情報の再生を開始する再生手段を備える。
上記側面6に係る音声情報修正システムによれば、格納手段に全体の半分の容量の音声情報が格納された場合、再生を開始するので、音声情報を格納する格納手段の溢れ及び枯渇が最も発生し難い中間の容量が格納された状態から再生でき、音声情報を格納する格納手段の溢れや枯渇を防止して音声情報の連続性の維持を図る事が可能となる。
実施の形態の他の側面7に係る音声情報修正システムは、上記側面1から上記側面6のいずれかの側面に係る音声情報修正システムにおいて、前記送信手段に設けられたエンコード手段にてエンコードされて送信された連続的な音声情報を、通信にて受信する通信手段と、前記通信手段にて受信した前記音声情報をデコードするデコード手段と、を備える。
上記側面7に係る音声情報修正システムによれば、エンコード手段にてエンコードされて送信手段から送信された音声情報を、デコード手段にてデコードするので、エンコード手段とデコード手段が異なる装置に設けられていることで、エンコード手段とデコード手段との処理時間のずれが生じ、このことにより音声情報を格納する格納手段の溢れや枯渇の可能性がある場合であっても、無音部分を減縮又は増長でき、音声品質の劣化を抑制する事が可能となると共に、音声情報を格納する格納手段の溢れ又は枯渇を防止して音声情報の連続性の維持を図る事が可能となる。
1 車載装置
2 スピーカ
3 タッチパネル
4 ディスプレイ
5 現在位置取得部
6 通信部
7 制御部
7a デコード部
7b 音声再生部
7c 再生制御部
7d 無音部分判定部
7e 音声情報修正部
8 データ記録部
8a バッファ
10 携帯端末
11 タッチパネル
12 ディスプレイ
13 通信部
14 制御部
14a エンコード部
15 データ記録部
15a 音声DB

Claims (9)

  1. 送信手段から送信された連続的な音声情報を格納する格納手段と、
    前記格納手段に格納された前記音声情報のうち、基準時間長さ連続する無音部分が存在するか否かを判定する無音部分判定手段と、
    前記無音部分判定手段にて前記無音部分が存在すると判定された場合、前記無音部分を前記格納手段から削除し、又は前記無音部分の前後に連続的に他の無音部分を追加して前記格納手段に格納することにより、前記音声情報を修正する音声情報修正手段と、を備える、
    音声情報修正システム。
  2. 前記音声情報修正手段は、前記格納手段に格納された前記音声情報の容量が、目標容量より大きい第1上限値以上となった場合、前記無音部分を前記格納手段から削除し、前記格納手段に格納された前記音声情報の容量が、前記目標容量より小さい第1下限値以下となった場合、前記無音部分の前後に連続的に他の無音部分を追加して前記格納手段に格納する、
    請求項1に記載の音声情報修正システム。
  3. 前記音声情報修正手段は、前記格納手段に格納された前記音声情報の容量が、前記第1上限値よりも大きい第2上限値以上となった場合、前記音声情報における所定長さの音声部分を前記格納手段から削除し、前記格納手段に格納された前記音声情報の容量が、前記第1下限値よりも小さい第2下限値以下となった場合、前記音声情報における所定長さの音声部分を追加して前記格納手段に格納する、
    請求項2に記載の音声情報修正システム。
  4. 前記音声情報修正手段は、前記格納手段に格納された音声情報の容量が前記目標容量となった場合、前記無音部分の削除若しくは追加、又は前記音声部分の削除若しくは追加を停止する、
    請求項2又は3に音声情報修正システム。
  5. 前記目標容量は、前記格納手段の全体の容量に対する半分の容量である、
    請求項2から4のいずれか一項に記載の音声情報修正システム。
  6. 前記格納手段の全体の容量に対する半分の容量の前記音声情報が格納された場合、前記格納手段に格納された前記音声情報の再生を開始する再生手段を備える、
    請求項1から5のいずれか一項に記載の音声情報修正システム。
  7. 前記送信手段に設けられたエンコード手段にてエンコードされて送信された連続的な音声情報を、通信にて受信する通信手段と、
    前記通信手段にて受信した前記音声情報をデコードするデコード手段と、を備える、
    請求項1から6のいずれか一項に記載の音声情報修正システム。
  8. 送信手段から送信された連続的な音声情報を格納する格納手段に格納された前記音声情報のうち、基準時間長さ連続する無音部分が存在するか否かを判定する無音部分判定工程と、
    前記無音部分判定工程にて前記無音部分が存在すると判定された場合、前記無音部分を前記格納手段から削除し、又は前記無音部分の前後に連続的に他の無音部分を追加して前記格納手段に格納することにより、前記音声情報を修正する音声情報修正工程と、を含む、
    音声情報修正方法。
  9. 送信手段から送信された連続的な音声情報を格納する格納手段に格納された前記音声情報のうち、基準時間長さ連続する無音部分が存在するか否かを判定する無音部分判定工程と、
    前記無音部分判定工程にて前記無音部分が存在すると判定された場合、前記無音部分を前記格納手段から削除し、又は前記無音部分の前後に連続的に他の無音部分を追加して前記格納手段に格納することにより、前記音声情報を修正する音声情報修正工程と、
    をコンピュータに実行させるための音声情報修正プログラム。
JP2014258603A 2014-12-22 2014-12-22 音声情報修正システム、音声情報修正方法、及び音声情報修正プログラム Pending JP2016119588A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2014258603A JP2016119588A (ja) 2014-12-22 2014-12-22 音声情報修正システム、音声情報修正方法、及び音声情報修正プログラム
US15/525,842 US20170330595A1 (en) 2014-12-22 2015-12-22 Audio information correction system, audio information correction method, and audio information correction program
EP15873030.9A EP3240263B1 (en) 2014-12-22 2015-12-22 Voice information correction system and voice information correction method
CN201580066728.7A CN107112021A (zh) 2014-12-22 2015-12-22 声音信息校正系统、声音信息校正方法及声音信息校正程序
PCT/JP2015/085743 WO2016104462A1 (ja) 2014-12-22 2015-12-22 音声情報修正システム、音声情報修正方法、及び音声情報修正プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014258603A JP2016119588A (ja) 2014-12-22 2014-12-22 音声情報修正システム、音声情報修正方法、及び音声情報修正プログラム

Publications (1)

Publication Number Publication Date
JP2016119588A true JP2016119588A (ja) 2016-06-30

Family

ID=56150480

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014258603A Pending JP2016119588A (ja) 2014-12-22 2014-12-22 音声情報修正システム、音声情報修正方法、及び音声情報修正プログラム

Country Status (5)

Country Link
US (1) US20170330595A1 (ja)
EP (1) EP3240263B1 (ja)
JP (1) JP2016119588A (ja)
CN (1) CN107112021A (ja)
WO (1) WO2016104462A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11417327B2 (en) 2018-11-28 2022-08-16 Samsung Electronics Co., Ltd. Electronic device and control method thereof

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180068069A (ko) * 2016-12-13 2018-06-21 삼성전자주식회사 전자 장치 및 이의 제어 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007235221A (ja) * 2006-02-27 2007-09-13 Fujitsu Ltd 揺らぎ吸収バッファ装置
JP2009543140A (ja) * 2006-07-06 2009-12-03 クゥアルコム・インコーポレイテッド オーディオ復号のためのクロック補償技術
JP2014150413A (ja) * 2013-02-01 2014-08-21 Oki Electric Ind Co Ltd 音声受信再生装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6088412A (en) * 1997-07-14 2000-07-11 Vlsi Technology, Inc. Elastic buffer to interface digital systems
US6658027B1 (en) * 1999-08-16 2003-12-02 Nortel Networks Limited Jitter buffer management
CN1211781C (zh) * 2000-08-09 2005-07-20 汤姆森许可公司 音频速度变换的方法和系统
JP2007215092A (ja) * 2006-02-13 2007-08-23 Sanyo Electric Co Ltd 音声データ処理装置
TWI305101B (en) * 2006-03-10 2009-01-01 Ind Tech Res Inst Method and apparatus for dynamically adjusting playout delay
CN101175104B (zh) * 2006-10-31 2010-04-21 华为技术有限公司 一种抖动缓存装置和抖动缓存管理方法
US20080267224A1 (en) * 2007-04-24 2008-10-30 Rohit Kapoor Method and apparatus for modifying playback timing of talkspurts within a sentence without affecting intelligibility

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007235221A (ja) * 2006-02-27 2007-09-13 Fujitsu Ltd 揺らぎ吸収バッファ装置
JP2009543140A (ja) * 2006-07-06 2009-12-03 クゥアルコム・インコーポレイテッド オーディオ復号のためのクロック補償技術
JP2014150413A (ja) * 2013-02-01 2014-08-21 Oki Electric Ind Co Ltd 音声受信再生装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11417327B2 (en) 2018-11-28 2022-08-16 Samsung Electronics Co., Ltd. Electronic device and control method thereof

Also Published As

Publication number Publication date
WO2016104462A1 (ja) 2016-06-30
US20170330595A1 (en) 2017-11-16
CN107112021A (zh) 2017-08-29
EP3240263A4 (en) 2017-11-22
EP3240263A1 (en) 2017-11-01
EP3240263B1 (en) 2019-05-15

Similar Documents

Publication Publication Date Title
JP5928048B2 (ja) 情報処理装置、情報処理方法、情報処理プログラムおよび端末装置
JP4921814B2 (ja) 車載機器、ナビゲーション装置及びこれらの制御方法
JP6344911B2 (ja) コンテンツ出力システム、及びコンテンツ出力方法
WO2017161742A1 (zh) 一种多媒体控制方法及装置
JPWO2013180280A1 (ja) 車載情報システム、情報端末、アプリケーション実行方法
JP2018040574A (ja) コンテンツ利用支援装置、コンテンツ利用支援方法及びコンテンツ利用支援プログラム
WO2016104462A1 (ja) 音声情報修正システム、音声情報修正方法、及び音声情報修正プログラム
US9230529B2 (en) Music reproducing apparatus
JP2019158933A (ja) 音声再生機器、制御装置および制御方法
US8983366B2 (en) Methods and systems for media system use
JP6226020B2 (ja) 車載装置、情報処理方法および情報処理システム
JP2015148831A (ja) 車載情報システム、情報端末、アプリケーション実行方法
JP4399865B2 (ja) 録画番組再生装置、録画番組再生方法および録画番組再生プログラム
JP5626794B2 (ja) 車載機器システム及び該車載機器システムを構成する車載機器及び携帯端末
JP2013250132A (ja) 車載装置、車載情報システム
JP4004920B2 (ja) 情報出力装置、情報出力方法、情報出力用プログラム並びに情報記録媒体
JP7119939B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP2005311518A (ja) 移動体用音楽再生装置
KR102316655B1 (ko) 차량 멀티미디어 시스템의 오디오 출력 장치 및 그 제어방법
JP2005260829A (ja) 移動式情報端末装置及びその制御方法
JP6509077B2 (ja) 情報処理装置
JP2019126037A (ja) 携帯端末装置、携帯端末装置の制御方法およびプログラム
JP2016143233A (ja) 表示制御装置
JP2015089073A (ja) 情報表示システムおよび車載装置
JP2014165567A (ja) 情報記憶管理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180626

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180823

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190129