JP2009210868A - 音声処理装置、及び音声処理方法等 - Google Patents

音声処理装置、及び音声処理方法等 Download PDF

Info

Publication number
JP2009210868A
JP2009210868A JP2008054594A JP2008054594A JP2009210868A JP 2009210868 A JP2009210868 A JP 2009210868A JP 2008054594 A JP2008054594 A JP 2008054594A JP 2008054594 A JP2008054594 A JP 2008054594A JP 2009210868 A JP2009210868 A JP 2009210868A
Authority
JP
Japan
Prior art keywords
language
frequency characteristic
voice information
speech
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008054594A
Other languages
English (en)
Inventor
Fumiyuki Maeda
史行 前田
Kai Takasu
甲斐 高須
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Electronic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Electronic Corp filed Critical Pioneer Electronic Corp
Priority to JP2008054594A priority Critical patent/JP2009210868A/ja
Publication of JP2009210868A publication Critical patent/JP2009210868A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】出力された音声の聞き取り易さを言語毎に向上させることが可能な音声処理装置、及び音声処理方法等を提供する。
【解決手段】本願は、音声情報を予め記憶しておく音声情報記憶手段と、複数の言語のうちから一の言語を選択する言語選択手段と、前記選択された言語に対応する音声情報を前記音声情報記憶手段から読み出す音声情報読出手段と、前記読み出された音声情報の周波数特性を、前記選択された言語に応じた周波数特性になるように調整する周波数特性調整手段と、前記周波数特性が調整された音声情報を外部に出力する音声出力手段と、を備える。
【選択図】図1

Description

本願は、外部に出力すべき音声情報の周波数特性を調整する音声処理装置等の技術分野に関する。
従来から、例えば車両に搭載されたナビゲーション装置では、運転者により設定された目的地までの経路案内等を、ガイド音声により行うことが可能となっている。また、ナビゲーション装置の他にも、ユーザによる操作のサポートを、ガイド音声により行う装置が種々知られている。
ところが、このようなガイド音声は、周囲の環境によって聞き取りにくくなるという問題があった。このような問題に鑑み、特許文献1には、ガイド音声が発せられる周囲の環境によってガイド音声の音量や音質等を自動的に変更することにより、当該ガイド音声を聞き取り易くすることができる技術が開示されている。
特開平09−330089号公報
ところで、上述したようなガイド音声を出力可能な装置は、様々な国で使用されるが、その際、当該ガイド音声は、その使用国の言語(母国語)で出力されるように設定される。
しかしながら、従来の技術では、ガイド音声の周波数特性を固定していたため、言語によっては聞き取りにくくなる(例えば子音重視の高周波数帯言語のこもり等)という問題があった。
そこで、本願は、このような問題の解消を課題の一つとし、出力された音声の聞き取り易さを言語毎に向上させることが可能な音声処理装置、及び音声処理方法等を提供することを目的する。
上記課題を解決するため、請求項1に記載の音声処理装置の発明は、音声情報を予め記憶しておく音声情報記憶手段と、複数の言語のうちから一の言語を選択する言語選択手段と、前記選択された言語に対応する音声情報を前記音声情報記憶手段から読み出す音声情報読出手段と、前記読み出された音声情報の周波数特性を、前記選択された言語に応じた周波数特性になるように調整する周波数特性調整手段と、前記周波数特性が調整された音声情報を外部に出力する音声出力手段と、を備えることを特徴とする。
請求項8に記載の音声処理方法の発明は、音声情報を記憶する工程と、複数の言語のうちから一の言語を選択する工程と、前記選択された言語に対応する音声情報を読み出す工程と、前記読み出された音声情報の周波数特性を、前記選択された言語に応じた周波数特性になるように調整する工程と、前記周波数特性が調整された音声情報を外部に出力する工程と、を備えることを特徴とする。
請求項9に記載の音声処理プログラムの発明は、コンピュータを、音声情報を予め記憶しておく音声情報記憶手段、複数の言語のうちから一の言語を選択する言語選択手段、前記選択された言語に対応する音声情報を前記音声情報記憶手段から読み出す音声情報読出手段、前記読み出された音声情報の周波数特性を、前記選択された言語に応じた周波数特性になるように調整する周波数特性調整手段、及び、前記周波数特性が調整された音声情報を外部に出力する音声出力手段として機能させることを特徴とする。
以下、本願の最良の実施形態を添付図面に基づいて説明する。なお、以下に説明する実施の形態は、車両に搭載された車載装置に対して本願の音声処理装置等を適用した場合の実施形態である。かかる車載装置としては、例えば、AV(Audio Visual)装置、ナビゲーション装置等が挙げられる。
先ず、図1を参照し、本実施形態に係る車載装置の構成及び機能について説明する。
図1は、本実施形態に係る車載装置の概要構成例を示す図である。なお、図1の例では、本願に関係する構成部分のみを示しており、本願と直接関係のない構成部分については図示を省略している。
図1に示すように、車載装置1は、操作部11(ユーザ指定言語受付手段の一例)、GPS受信部12(位置測位手段の一例)、音声認識部13(音声言語認識手段の一例)、言語選択設定部14(言語選択手段の一例)、制御部15、音声発生部16(音声情報記憶手段及び音声情報読出手段の一例)、周波数特性調整部17(周波数特性調整手段の一例)、及び音声出力部18(音声出力手段の一例)等を備えて構成されている。
操作部11は、ユーザにより指定された言語を受け付け、当該言語を示す情報を言語選択設定部14に出力する。なお、かかる言語の指定は、例えば、予め用意された複数の言語(例えば、日本語、英語、イタリア語、ドイツ語、ロシア語、米語、フランス語等)を示す情報が表示された選択画面を通じて行われる。
GPS(Global Positioning System)受信部12は、衛星軌道上に配置され地球を周回するGPS衛星から出力される航法電波を、アンテナ(図示せず)を介して受信し、受信した信号に基づいて現在位置(経度及び緯度)を測位し、その現在位置を示す情報を言語選択設定部14に出力する。
音声認識部13は、ユーザが発話した音声をマイク(図示せず)を介して入力しその言語を認識し、認識した言語を示す情報を言語選択設定部14に出力する。なお、入力した音声の言語の認識方法は、公知の技術を適用できる。
言語選択設定部14は、例えばユーザからの言語設定開始指示を受けたときに、予め用意された複数の言語のうちから一の言語を選択設定し、当該選択設定された言語を示す情報を制御部15に出力する。
ここで、言語選択設定部14により選択される言語は、音声認識部13により認識された言語、GPS受信部12により測位された現在位置に応じた言語、及び操作部11により受け付けられた言語の何れかの言語(何れを採用するかは事前の設定による)とすることができる。GPS受信部12により測位された現在位置による場合、言語選択設定部14は、位置情報(経度及び緯度情報)と言語との対応付けテーブル(例えば、フランス領土内の経度及び緯度情報に対してはフランス語が対応付けられている。なお、かかる対応付けテーブルは、例えば不揮発性メモリに予め記憶される)を参照して、GPS受信部12からの現在位置を示す情報に対応する言語を選択することになる。なお、言語は、上記以外の方法で選択されるように構成しても良く、例えば、ディスク(DVD、BD)再生装置において設定された言語が選択されるように構成しても良い。
制御部15は、車載装置1全体を統括制御するようになっており、例えば音声発生部16に対して音声情報再生指令や音声情報切替指令(上記選択言語を示す情報を含む)を与えたり、周波数特性調整部17に対して周波数特性切替指令(上記選択言語を示す情報を含む)を与えるようになっている。
音声発生部16は、言語の異なる複数の音声情報(例えば、日本語で話され録音された音声情報、英語で話され録音された音声情報等)を予め記憶しておく記憶部を備えており、制御部15からの音声情報切替指令を受けたときに、当該音声情報切替指令により示される選択言語に対応する音声情報を選択するようになっており、制御部15からの音声情報再生指令を受けたときに、選択された音声情報を記憶部から読み出し、周波数特性調整部17に出力するようになっている。
ここで、各音声情報は、音声ファイルに格納されるようになっており、この内容としては、例えばナビゲーション機能に係る目的地までの経路案内のためのガイド音声や、ユーザによる操作のサポートのためのガイド音声等が挙げられる。
周波数特性調整部17は、制御部15からの周波数特性切替指令を受けたときに、周波数特性切替指令により示される選択言語に応じた最適な周波数特性に切替えるようになっており、音声発生部16により読み出され出力された音声情報の周波数特性を、上記選択言語に応じた最適な周波数特性になるように調整しつつ音声出力部18に出力するようになっている。
図2は、言語に応じた最適な周波数特性の一例を示す図である。図2に示すように、各国の言語の声域には、夫々固有の優生な周波数帯があり、これは一般的に「パスバンド」と呼ばれている。例えば選択言語が日本語である場合には、125Hzから1500Hzまでの周波数帯域以外の周波数成分をカットするように周波数特性が調整される。
周波数特性調整部17は、ハードウェアで構成されても良いしソフトウェアで構成されても良い。例えば、周波数特性調整部17は、図3に示すようなハードウェアで構成された周波数特性回路を有するように構成することができる。図3(A)に示す周波数特性回路は、制御部15からの周波数特性切替指令(制御信号)を受けたときに、当該周波数特性回路に含まれる特性の異なる複数のフィルタ1,2・・・nのうちから、スイッチSWを切替えることにより、選択言語に応じたフィルタを選択し当該選択したフィルタに音声情報を通すことで当該音声情報の周波数特性を最適に調整する。一方、図3(B)に示す周波数特性回路は、制御部15からの周波数特性切替指令(制御信号)に応じて、スイッチSWを切替えることにより、選択言語に応じた最適なパラメータに調整する。かかる周波数特性回路はソフトウェアで構成することもでき、この場合には、例えばイコライザ(EQ)切り替えの要領で実行されたプログラムにより選択言語に応じた最適なパラメータに調整する。
音声出力部18は、周波数特性調整部17からの周波数特性が調整された音声情報をスピーカを通じて外部に音波として出力する。例えば、音声出力部18は、アンプや外部出力端子等から構成される。
次に、図4を参照して、車載装置1の制御部15における周波数特性切替処理について説明する。
図4は、本実施形態に係る周波数特性切替処理を示すフローチャートである。なお、図4に示す処理は、例えば、ユーザから周波数特性切替指示を受けた場合に開始される。
図4の処理が開始されると、制御部15は、言語選択設定部14からの言語出力待機状態となり(ステップS1)、例えばユーザの言語指定により言語選択設定部14にて選択された言語を示す情報を入力する(ステップS2)。続いて、制御部15は、音声発生部16に対して音声情報切替指令(上記選択言語を示す情報を含む)を与える(ステップS3)。これにより、音声発生部16では当該音声情報切替指令により示される選択言語に対応する音声情報が再生可能状態に選択(セット)される。続いて、制御部15は、周波数特性調整部17に対して周波数特性切替指令(上記選択言語を示す情報を含む)を与える(ステップS4)。これにより、周波数特性調整部17では、周波数特性切替指令により示される選択言語に応じた最適な周波数特性に切替えられる。
こうして周波数特性切替処理がなされた後、例えばナビゲーション機能に係るアプリケーションプログラムが制御部15により実行され、当該プログラムにおいて規定された例えばガイド音声出力タイミングが到来すると、制御部15から音声発生部16に対して音声情報再生指令が与えられる。これにより、音声発生部16は、上記選択された音声情報を記憶部から読み出して周波数特性調整部17に出力し、周波数特性調整部17は、音声発生部16から出力された音声情報の周波数特性を選択言語に応じた最適な周波数特性になるように調整しつつ音声出力部18に出力する。こうして、当該音声が最終的にスピーカから外部に出力されることになる。
以上説明したように、上記実施形態によれば、複数の言語のうちから一の言語を選択し、選択された言語に対応する音声情報を読み出し、当該読み出された音声情報の周波数特性を上記選択された言語に応じた周波数特性になるように調整して外部に出力するように構成したので、言語毎に最適な周波数特性が得られ、上記音声情報に係る音声の聞き取り易さを言語毎に向上させることができる。
なお、上記実施形態においては、音声発生部16において言語の異なる複数の音声情報を予め記憶しておくように構成したが、車載装置1が使用される国で使用される言語の音声情報のみを記憶する(例えば、その他の言語の音声情報は記憶しておかない)ように構成しても良い。
また、本願の言語選択手段、音声情報読出手段、及び周波数特性調整手段は、例えばDSPにより実行されるプログラムの一機能として実現するように構成しても良い。
本実施形態に係る車載システムの概要構成例を示す図である。 言語に応じた最適な周波数特性の一例を示す図である。 周波数特性回路の一例を示す図である。 本実施形態に係る周波数特性切替処理を示すフローチャートである。
符号の説明
1 車載装置
11 操作部
12 GPS受信部
13 音声認識部
14 言語選択設定部
15 制御部
16 音声発生部
17 周波数特性調整部
18 音声出力部

Claims (10)

  1. 音声情報を予め記憶しておく音声情報記憶手段と、
    複数の言語のうちから一の言語を選択する言語選択手段と、
    前記選択された言語に対応する音声情報を前記音声情報記憶手段から読み出す音声情報読出手段と、
    前記読み出された音声情報の周波数特性を、前記選択された言語に応じた周波数特性になるように調整する周波数特性調整手段と、
    前記周波数特性が調整された音声情報を外部に出力する音声出力手段と、
    を備えることを特徴とする音声処理装置。
  2. 請求項1に記載の音声処理装置において、
    前記音声処理手段は、前記読み出された音声情報の周波数特性を調整する周波数特性回路を有し、当該周波数特性回路のパラメータを、前記選択された言語に応じたパラメータに調整することを特徴とする音声処理装置。
  3. 請求項1に記載の音声処理装置において、
    前記音声処理手段は、前記読み出された音声情報の周波数特性を調整する周波数特性回路を有し、当該周波数特性回路に含まれる特性の異なる複数のフィルタのうちから、前記選択された言語に応じたフィルタを選択し当該選択したフィルタに前記音声情報を通すことを特徴とする音声処理装置。
  4. 請求項1乃至3の何れか一項に記載の音声処理装置において、
    現在位置を測位する位置測位手段を備え、
    前記言語選択手段は、前記位置測位手段により測位された位置に応じた言語を選択することを特徴とする音声処理装置。
  5. 請求項1乃至3の何れか一項に記載の音声処理装置において、
    ユーザが発話した音声を入力しその言語を認識する音声言語認識手段を備え、
    前記言語選択手段は、前記音声言語認識手段により認識された言語を選択することを特徴とする音声処理装置。
  6. 請求項1乃至3の何れか一項に記載の音声処理装置において、
    ユーザにより指定された言語を受け付けるユーザ指定言語受付手段を備え、
    前記言語選択手段は、前記ユーザ指定言語受付手段により受け付けられた言語を選択することを特徴とする音声処理装置。
  7. 請求項1乃至6の何れか一項に記載の音声処理装置において、
    前記音声情報記憶手段には、言語の異なる複数の音声情報が記憶されていることを特徴とする音声処理装置。
  8. 音声情報を記憶する工程と、
    複数の言語のうちから一の言語を選択する工程と、
    前記選択された言語に対応する音声情報を読み出す工程と、
    前記読み出された音声情報の周波数特性を、前記選択された言語に応じた周波数特性になるように調整する工程と、
    前記周波数特性が調整された音声情報を外部に出力する工程と、
    を備えることを特徴とする音声処理方法。
  9. コンピュータを、
    音声情報を予め記憶しておく音声情報記憶手段、
    複数の言語のうちから一の言語を選択する言語選択手段、
    前記選択された言語に対応する音声情報を前記音声情報記憶手段から読み出す音声情報読出手段、
    前記読み出された音声情報の周波数特性を、前記選択された言語に応じた周波数特性になるように調整する周波数特性調整手段、及び、
    前記周波数特性が調整された音声情報を外部に出力する音声出力手段として機能させることを特徴とする音声処理プログラム。
  10. 請求項9に記載の音声処理プログラムがコンピュータ読み取り可能に記録されていることを特徴とする記録媒体。
JP2008054594A 2008-03-05 2008-03-05 音声処理装置、及び音声処理方法等 Withdrawn JP2009210868A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008054594A JP2009210868A (ja) 2008-03-05 2008-03-05 音声処理装置、及び音声処理方法等

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008054594A JP2009210868A (ja) 2008-03-05 2008-03-05 音声処理装置、及び音声処理方法等

Publications (1)

Publication Number Publication Date
JP2009210868A true JP2009210868A (ja) 2009-09-17

Family

ID=41184082

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008054594A Withdrawn JP2009210868A (ja) 2008-03-05 2008-03-05 音声処理装置、及び音声処理方法等

Country Status (1)

Country Link
JP (1) JP2009210868A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014035718A1 (en) * 2012-08-30 2014-03-06 Google Inc. Techniques for selecting languages for automatic speech recognition
WO2017029428A1 (en) * 2015-08-17 2017-02-23 Audiobalance Excellence Oy Method and apparatus for improving learning
US11398220B2 (en) 2017-03-17 2022-07-26 Yamaha Corporation Speech processing device, teleconferencing device, speech processing system, and speech processing method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014035718A1 (en) * 2012-08-30 2014-03-06 Google Inc. Techniques for selecting languages for automatic speech recognition
CN104756184A (zh) * 2012-08-30 2015-07-01 谷歌公司 选择用于自动话音识别的语言的技术
WO2017029428A1 (en) * 2015-08-17 2017-02-23 Audiobalance Excellence Oy Method and apparatus for improving learning
US11398220B2 (en) 2017-03-17 2022-07-26 Yamaha Corporation Speech processing device, teleconferencing device, speech processing system, and speech processing method

Similar Documents

Publication Publication Date Title
US8781836B2 (en) Hearing assistance system for providing consistent human speech
JP2005242134A (ja) カーオーディオシステム
JP2008042390A (ja) 車内会話支援システム
JP4513610B2 (ja) 車載装置及び車載装置の制御方法
JP2007286136A (ja) 車載用音声認識装置及び音声認識方法
JP2009010992A (ja) 音声信号処理装置、音声信号処理方法、プログラム
JP2006270741A (ja) 車載音響処理装置、および、ナビゲーション装置
JP2009210868A (ja) 音声処理装置、及び音声処理方法等
WO2011121955A1 (ja) オーディオ装置
JP4271550B2 (ja) オーディオシステム、オーディオ装置及び音声信号出力処理方法
JP6741387B2 (ja) 音声出力装置
JP2001184100A (ja) 話速変換装置
JP3715469B2 (ja) 音声操作装置
JP2011180416A (ja) 音声合成装置、音声合成方法およびカーナビゲーションシステム
JP2009289385A (ja) デジタルオーディオ信号処理装置、及び方法
JP4754853B2 (ja) 音量制御装置
JP4494117B2 (ja) 運転支援システムおよびナビゲーション装置
US20060206338A1 (en) Device and method for providing contents
JP4018060B2 (ja) ナビゲーション装置
JP2010103756A (ja) 音声出力装置および音声出力方法
JPH11325943A (ja) ナビゲーションシステム
JP2000305596A (ja) 音声認識装置及びナビゲーション装置
JP2007094751A (ja) エージェントシステム、情報提供装置、及び端末装置
JP4381108B2 (ja) 話速変換装置における時報処理装置
JP3838193B2 (ja) 文章読み上げ装置、同装置のためのプログラム及び記録媒体

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20110510