JP2010156738A

JP2010156738A - 音量調節装置、音量調節方法、音量調節プログラムおよび音量調節プログラムを格納した記録媒体

Info

Publication number: JP2010156738A
Application number: JP2008333569A
Authority: JP
Inventors: Hideo Watabe; 秀雄渡部; Yuichi Tamura; 雄一田村; 雅美 ▲高▼橋; Masami Takahashi; Hideaki Furukawa; 秀暁布留川
Original assignee: Pioneer Electronic Corp
Current assignee: Pioneer Corp
Priority date: 2008-12-26
Filing date: 2008-12-26
Publication date: 2010-07-15

Abstract

【課題】会話内容に応じて音声を調節することができる音量調節装置、音量調節方法、音量調節プログラムおよび音量調節プログラムを格納した記録媒体を提供する。
【解決手段】音量調節装置１において、外部環境音声抽出部４で抽出した会話情報と、ソース音声抽出部５で抽出したソース音声情報と、から相関性判別部６で一定時間内の頻度などの閾値に基づいて双方の相関を判別して、相関がある場合は音量を維持または上げ、相関がない場合は音量を下げるように音量制御部７で変化量を決定し、その決定に応じた音量に音量調節部８が調節する。
【選択図】図１

Description

本発明は、オーディオやラジオなどのソース音声の音量を調節する音量調節装置、音量調節方法、音量調節プログラムおよび音量調節プログラムを格納した記録媒体に関する。

従来から使用者の周囲の音の状況に応じて適切な音量調節を行う音量調節装置は様々な形態が提案されている。

例えば、特許文献１に記載の音量制御装置では、音声パターン認識部がマイクロフォンで検出された音声に、音声パターンを記憶する記憶部に記憶された音声パターンを確認したとき、音量制御部が音量調節部に対して音量の調節を指令している。

このようにすることで、特定の音声パターンに応じて出力音声の音量を調節することができるため、例えば、音楽再生装置等の音響機器で音楽等を聴いているリスナーが、他者から話し掛けられたような場合などに、自動的に音響機器の音量を下げ、それによって、リスナーは他者からの話し掛けを聞き取りやすくすることができる。
特開２００４−１３０８４号公報

しかしながら、特許文献１に記載された音声制御装置では、例えば、複数人でオーディオ再生音やラジオなどのソース音声について会話しているような音量が下がって欲しくない状況でも、記憶部に記憶した音声パターンが検出されると音量が下がってしまう可能性があるという問題がある。

また、記憶部に記憶された音声パターンとの一致で音声を下げているので、その記憶する音声パターンが適切でないと、音量を下げることができないという問題もある。

そこで、本発明は、会話内容に応じて音声を調節することができる音量調節装置、音量調節方法、音量調節プログラムおよび音量調節プログラムを格納した記録媒体を提供することを課題とする。

上記課題を解決するために、請求項１に記載の音量調節装置は、入力されるソース音声の音量を調節する音量調節手段を備えた音量調節装置において、前記ソース音声の信号に関するソース音声情報を抽出するソース音声抽出手段と、外部から集音した音声から会話情報を抽出する外部音声抽出手段と、前記ソース音声抽出手段が抽出した前記ソース音声情報および前記外部音声抽出手段が抽出した前記会話情報から双方の相関を判別する相関性判別手段と、前記相関性判別手段が判別した結果に基づいて、前記音量調節手段の音量を変化させる音量制御手段と、を備えたことを特徴としている。

請求項８に記載の音量調節方法は、入力されるソース音声の音量を調節する音量調節方法において、前記ソース音声の信号に関するソース音声情報を抽出し、外部から集音した音声から会話情報を抽出し、抽出した前記ソース音声情報および前記会話情報から双方の相関を判別して、その判別した結果に基づいて、前記音量を変化させることを特徴としている。

請求項９に記載の音量調節プログラムは、入力されるソース音声の音量を調節する音量調節手段としてコンピュータに機能させる音量調節プログラムにおいて、前記ソース音声の信号に関するソース音声情報を抽出するソース音声抽出手段と、外部から集音した音声から会話情報を抽出する外部音声抽出手段と、前記ソース音声抽出手段が抽出した前記ソース音声情報および前記外部音声抽出手段が抽出した前記会話情報から双方の相関を判別する相関性判別手段と、前記相関性判別手段が判別した結果に基づいて、前記音量調節手段の音量を変化させる音量制御手段と、して前記コンピュータを機能させることを特徴としている。

以下、本発明の一実施形態にかかる音量調節装置を説明する。本発明の一実施形態にかかる音量調節装置は、ソース音声抽出部が抽出したソース音声情報および外部音声抽出手段が抽出した会話情報から相関性判別手段が双方の相関を判別し、相関性判別手段が判別した結果に基づいて、音量制御手段が音量調節手段の音量を変化させているので、ソース音声と会話内容との相関に応じた適切な音量に変化させることができる。また、会話内容と相関を見るのが予め記憶したパターンではなくソース音声からリアルタイムに抽出される情報であるので、音量変化の判定漏れを少なくすることができる。

また、相関性判別手段は、予め定められた相関に関する閾値よりも相関が高い場合は相関があると判別し、閾値よりも相関が低い場合は相関がないと判別し、音量制御手段は、相関性判別手段が相関があると判別した際には音量を維持または上げるように変化させ、相関性判別手段が相関がないと判別した際には音量を下げるように変化させるようにしてもよい。このようにすることにより、相関がある場合は、当該ソース音声に関連する会話をしていると判別することができるので音量維持または上げることができ、相関がない場合は会話の妨げにならないように音量を下げることができる。

また、ソース音声抽出手段が、ソース音声情報としてソース音声の信号を音声認識して該ソース音声内の単語を抽出し、外部音声抽出手段が、会話情報として外部から集音した音声を音声認識して会話内の単語を抽出してもよい。このようにすることにより、音声認識した単語同士のマッチングにより会話とソース音声との相関を判別することができる。

また、ソース音声抽出手段が、ソース音声情報としてソース音声に関するメタデータを取得し、外部音声抽出手段が、会話情報として外部から集音した音声を音声認識して会話内の単語を抽出してもよい。このようにすることにより、ソース音声信号などに含まれたり、他の経路から取得することができるメタデータ内の曲名やアーティスト名或いは番組内容などと、会話部分の単語とのマッチングにより会話とソース音声との相関を判別することができる。

また、ソース音声抽出手段は、ソース音声情報としてソース音声の種別を示す情報を抽出し、相関性判別手段が、外部音声抽出手段が抽出した会話情報から指示語とソース音声の種別を示す用語との組み合わせが検出された場合に相関があると判別してもよい。このようにすることにより、「この曲」、「このニュース」などの指示語とソース音声の種別を示す用語との組み合わせが検出された場合に、相関があると判別することができ、より広い範囲で会話とソース音声との相関を判別することができる。

また、ソース音声抽出手段が、ソース音声情報としてソース音声の信号波形を抽出し、外部音声抽出手段が、会話情報として外部から集音した音声から会話を示す波形を抽出してもよい。このようにすることにより、楽曲の音程などをマッチングすることができ、より会話とソース音声との相関の判別が可能となる。

また、相関性判別手段が、相関がないと判別した際に、外部音声抽出手段が抽出した会話情報の重要度をさらに判別し、音量制御手段が、相関性判別手段が判別した重要度に基づいて、音量の下げ幅を決定してもよい。このようにすることにより、重要な会話の場合は音量の下げ幅を大きくして会話を妨げないようにすることができる。

また、本発明の一実施形態にかかる音量調節方法は、抽出したソース音声情報および会話情報から双方の相関を判別し、その判別した結果に基づいて、音量を変化させているので、ソース音声と会話内容との相関に応じた適切な音量に変化させることができる。また、会話内容と相関を見るのが予め記憶したパターンではなくソース音声からリアルタイムに抽出される情報であるので、音量変化の判定漏れを少なくすることができる。

また、本発明の一実施形態にかかる音量調節プログラムは、ソース音声抽出部が抽出したソース音声情報および外部音声抽出手段が抽出した会話情報から相関性判別手段が双方の相関を判別し、相関性判別手段が判別した結果に基づいて、音量制御手段が音量調節手段の音量を変化させているので、ソース音声と会話内容との相関に応じた適切な音量に変化させることができる。また、会話内容と相関を見るのが予め記憶したパターンではなくソース音声からリアルタイムに抽出される情報であるので、音量変化の判定漏れを少なくすることができる。

また、上述した音量調節プログラムをコンピュータ読み取り可能な記録媒体に格納してもよい。このようにすることにより、音量調節プログラムを機器に組み込む以外に単体でも流通させることができ、バージョンアップ等も容易に行える。

本発明の一実施例にかかる音量調節装置１を図１および図２を参照して説明する。音量調節装置１は、図１に示すようにマイク２と、反転合成部３と、外部環境音声抽出部４と、ソース音声抽出部５と、相関性判別部６と、音量制御部７と、音量調節部８と、入力端子９と、出力端子１０と、を備えている。

マイク２は、会話などの外部環境音声とスピーカ等から放音されたオーディオやラジオなどのソース音声を集音して電気信号に変換し反転合成部３へ出力する。

反転合成部３は、入力端子９から入力されたソース音声信号の位相を反転させた信号と、マイク２が集音した外部環境音声およびソース音声の信号と、を合成することで、ソース音声部分を相殺して、会話などの外部環境音声のみとして外部環境音声抽出部４へ出力する。なお、ソース音声部分の相殺の際には、ソース音声信号が再生された時点から、入力端子９に入力される時点までの時間と、ソース音声信号がスピーカにて放音された音をマイク２が集音して反転合成部３に出力する時点までの時間との時間差や、スピーカの出力レベルやマイクの集音レベルに基づくレベル差を考慮して合成が行われる。

外部音声抽出手段としての外部環境音声抽出部４は、反転合成部３から入力された外部環境音声から会話情報を随時抽出して一時保存する。会話情報としては、例えば外部環境音声を周知の音声認識することにより得られる会話内の単語や、入力された外部環境音声（会話音声）の波形自体などが挙げられる。

ソース音声抽出手段としてのソース音声抽出部５は、オーディオ、ラジオ等のソース音声信号から、ソース音声情報を随時抽出して一時保存する。ソース音声情報としては、例えばニュース等の音声や音楽の歌詞等を周知の音声認識することにより得られる単語や、音楽の場合にソースに含まれるメタデータ内のアーティスト名や楽曲名や、ソース音声が音楽、ニュース、映画等のいずれであるかを示すソース音声の種別に関する情報、さらには、入力されたソース音声信号の波形自体などが挙げられる。なお、メタデータは例えば図示しないインターネット等の他の経路から抽出するようにしてもよい。

相関性判別手段としての相関性判別部６は、外部環境音声抽出部４およびソース音声抽出部５が抽出し一時保存した会話情報やソース音声情報から互いの相関を後述する方法により判別し、判別結果を音量制御部７へ出力する。

音量制御手段としての音量制御部７は、相関性判別部６での判別結果に基づいて音量をどのように変化させるか（上げるか、維持するか、下げるか）と、変化量を決定し、その決定に基づいて音量調節部８へ音量を変化させるよう制御する。

音量調節部８は、音量制御部７の制御に基づいて入力端子９から入力されるソース音声信号の音量を変化させて出力端子１０から出力する。

次に、相関性判別部６における外部環境音声抽出部４で抽出された会話情報とソース音声抽出部５で抽出されたソース音声情報との相関を判別する方法について図２のフローチャートを参照して説明する。

まず、ステップＳ１において会話情報とソース音声情報との相関を判別して相関ありと判別された場合はステップＳ２に進み、相関なしと判別された場合はステップＳ７に進む。相関の判別方法としては以下の方法のうちいずれかまたは複数の組み合わせによって判別する。

第１の方法としては、外部環境音抽出部４に保存された外部環境音を音声認識することによって得られた会話内の単語と、ソース音声抽出部５に保存されたソース音声を音声認識することによって得られた音楽の歌詞やニュースなどに含まれる単語と、を照合し、相関に関する閾値として一定時間単位（例えば５秒）での一致が一定の割合（例えば５０％）以上の場合は相関ありとして判別し、一定時間単位での一致が一定の割合未満の場合は相関なしとして判別する。すなわち、ソース音声抽出手段が、ソース音声情報としてソース音声の信号を音声認識して該ソース音声内の単語を抽出し、外部音声抽出手段が、会話情報として外部から集音した音声を音声認識して会話内の単語を抽出して、それらの相関を判別している。

第２の方法としては、外部環境音抽出部４に保存された外部環境音を音声認識することによって得られた会話内の単語と、ソース音声抽出部５に保存されたソース音声に含まれるメタデータから抽出したアーティスト名や楽曲名と、を照合し、相関に関する閾値として一定時間単位（例えば５秒）で一定回数（例えば１回）以上一致した場合は相関ありとして判別し、一定時間単位での一致が一定回数未満の場合は相関なしとして判別する。なお、メタデータは放送番組であれば番組タイトルや番組内容なども含まれ、また、メタデータはソース音声信号に含まれなく別経路（例えばインターネット等）から取得してもよい。すなわち、ソース音声抽出手段が、ソース音声情報としてソース音声に関するメタデータを取得し、外部音声抽出手段が、会話情報として外部から集音した音声を音声認識して会話内の単語を抽出して、それらの相関を判別している。

第３の方法としては、外部環境音抽出部４に保存された外部環境音を音声認識することによって得られた会話内の単語から、「この曲」「この歌手」「このニュース」といった指示語とソース音声の種別を示す特定キーワードとの組み合わせを検索し、ソース音声抽出部５に保存されたメタデータからどのような種別のソース音声かを判別して、相関に関する閾値として指示語と特定キーワードが一定の頻度以上（例えば１０秒間で２回以上）検出した場合に相関ありと判別する。例えば、メタデータからソース音声が音楽であることが判別された場合は「曲」「歌手」などが特定キーワードとなり、会話内の単語からは「この曲」「この歌手」という言葉を検索する。すなわち、相関性判別手段が、外部音声抽出手段が抽出した会話情報から指示語とソース音声の種別を示す用語との組み合わせが検出された場合に相関があると判別している。

第４の方法としては、外部環境音抽出部４に保存された外部環境音声の波形と、ソース音声抽出部５に保存されたソース音声の波形と、を照合し、相関に関する閾値として一定時間単位（例えば５秒）での一致が一定の割合（例えば５０％）以上の場合は相関ありとして判別し、一定時間単位での一致が一定の割合未満の場合は相関なしとして判別する。つまり、単語ではなく楽曲であれば音程などの一致を検出している。すなわち、ソース音声抽出手段が、ソース音声情報としてソース音声の信号波形を抽出し、外部音声抽出手段が、会話情報として外部から集音した音声から会話を示す波形を抽出して、それらの相関を判別している。

以上の４つの方法は、いずれか１つのみで相関を判別してもよいし、複数を組み合わせてその複数のうちいずれか１つの方法が相関ありと判別した場合はステップＳ１として相関ありと判別するようにしてもよい。

次に、ステップＳ２において、相関性判別部６内に設けられたカウンタをインクリメント（＋１）してステップＳ３に進む。

次に、ステップＳ３において、カウンタ値が予め定められた値ｎよりも大きいか否か判断し、大きい場合（Ｙｅｓの場合）はステップＳ５に進み、ｎ以下の場合（Ｎｏの場合）はステップＳ４に進む。

次に、ステップＳ４において、音量を維持してステップＳ１に戻る。つまり、本フローチャートでは外部環境音声（会話内容）とソース音声とが相関ありと判定され、相関ありと判定された回数がｎ回以下である場合は音量を維持させている。

ステップＳ５においては、本フローチャートによってすでに音量を上げているか否か判断し、すでに上げている場合（Ｙｅｓの場合）はステップＳ４に進み、まだ上げていない場合（Ｎｏの場合）はステップＳ６に進む。

次に、ステップＳ６において、音量を上げてステップＳ１に戻る。音量の上げ幅は例えば３０％とする。つまり、本フローチャートでは相関ありとｎ回より多く判定されて、本フローチャートによってまだ音量を上げていない場合は音量を上げている。これは相関ありと何度も判定される場合は、そのソース音声をより明瞭に聞こえるようにしたほうがよいとの考えからである。但し、際限無く音量が上がってしまうのを回避するために本フローチャートによって音量を上げるのは一度のみに限定している。また、音量の上限値を予め定めておき、その上限値までは音量を上げることができるようにしてもよい。

一方、ステップＳ７においては、カウンタをクリアしてステップＳ８に進む。これはステップＳ１で相関なしと判別されたので、相関ありと判別された回数をカウントしているカウンタはクリアする。

次に、ステップＳ８において、会話重要度を判定してステップＳ９に進む。本ステップでは、外部環境音声抽出部４が抽出した会話内の単語や外部環境音声の波形から会話の重要度を判定する。具体的には、音圧レベル（口調など）や予め登録した重要であることを示すキーワード（例えば、日付、人物名、金額など）などを検出することによって判定する。

この判定は、例えば、重要キーワードが検出されない場合は音量を３０％下げる、重要キーワードが検出された場合は５０％下げる、重要キーワードが検出された場合でさらにその音圧レベルがある閾値を超えた場合はさらに１０％下げる、重要キーワードが検出された場合で、さらに一定の頻度以上（例えば１０秒間で２回以上）で重要キーワードを検出した場合はさらに１０％下げる、などとする。この場合も音量の下限値を設定しその下限値以下にはならないようにしてもよい。すなわち、相関性判別手段が、相関がないと判別した際に、外部音声抽出手段が抽出した会話情報の重要度をさらに判別し、音量制御手段が、相関性判別手段が判別した重要度に基づいて、音量の下げ幅を決定している。

次に、ステップＳ９において、ステップＳ８で判定された重要度に応じた下げ幅で音量を下げてステップＳ１に戻る。つまり、本フローチャートでは相関なしと判定された場合は、重要度を判定し、その重要度に応じた下げ幅で音量を下げている。重要度に応じた下げ幅は重要度が上がるほど下げ幅を大きくしている。

本実施例によれば、音量調節装置１において、外部環境音声抽出部４で抽出した会話情報と、ソース音声抽出部５で抽出したソース音声情報と、から相関性判別部６で一定時間内の頻度などの閾値に基づいて双方の相関を判別して、相関がある場合は音量を維持または上げ、相関がない場合は音量を下げるように音量制御部７で変化量を決定し、その決定に応じた音量に音量調節部８が調節するので、ソース音声と会話内容との相関に応じて、相関がある場合は、当該ソース音声に関連する会話をしていると判別することができるので音量を維持または上げて、相関がない場合は会話の妨げにならないように音量を下げるといったことにより適切な音量に変化させることができる。また、会話内容と相関を見るのが予め記憶したパターンではなくソース音声から抽出される情報であるので、音量変化の判定漏れを少なくすることができる。

また、外部環境音声抽出部４が会話内容を音声認識して単語を抽出し、ソース音声抽出部５がソース音声信号を音声認識して単語を抽出しているので、双方が抽出した単語のマッチングをとることで、相関を判別することができる。

また、外部環境音声抽出部４が会話内容を音声認識して単語を抽出し、ソース音声抽出部５が、ソース音声に関するメタデータを取得しているので、ソース音声信号などに含まれたり他の経路から取得することができるメタデータに含まれる曲名やアーティスト名などと、会話部分の単語とのマッチングにより相関を判別することができる。

また、相関性判別部６が、外部環境音声抽出部４が抽出した単語から指示語とソース音声の種別を示す単語との組み合わせが検出された場合に相関があると判別しているので、「この曲」などの指示語とソース音声の種別を示す単語との組み合わせが検出された場合に、相関があると判別することができ、より広い範囲で相関を判別することができる。

また、外部環境音声抽出部４が、外部から集音した音声信号の波形を抽出し、ソース音声抽出部５が、ソース音声信号の波形を抽出しているので、楽曲の音程などによるマッチングによる相関の判別が可能となる。そのため、例えば鼻歌などで歌詞を歌っていない場合でも相関があるとの判別が可能となる。

また、相関性判別部６が、相関がないと判別した際に、外部環境音声抽出部４が抽出した会話部分の情報の重要度をさらに判別し、音量制御部７が、相関性判別部６が判別した重要度に基づいて、音量の下げ幅を決定してもよい。このようにすることにより、重要な会話の場合は音量の下げ幅を大きくして会話を妨げないようにすることができる。

なお、上述した実施例では、音量を上げると判別されるのは、相関ありとｎ回より多く判別される場合であるが、例えば、ソース音声抽出部５がメタデータを取得してそのメタデータから楽曲名やアーティスト名が取得された際にはソース音声が音楽であると識別し、その後相関性があると判別された場合は、ユーザ等が歌っていると判断して音量を上げるように制御してもよい。あるいは、相関を判別した際に一致する単語などの一致率の高さに基づいて音量を上げるか維持するかを判定してもよい。

なお、上述した実施例で挙げた相関を判断する際の閾値（５秒間に５０％以上や１０秒間で２回以上）や音量の上げ幅下げ幅は一例であり、適宜設定すればよい。また、この閾値や上げ幅下げ幅はユーザ等が任意に変更できるようにしてもよい。

また、上述した実施例では、音量調節装置１として構成したが、ＣＰＵとメモリを備えたコンピュータで実行するプログラムに各部の機能を実装することで音量調節プログラムとして構成することもできる。

前述した実施例によれば、以下の音量調節装置１および音量調節方法および音量調節プログラムが得られる。

（付記１）入力されるソース音声の音量を調節する音量調節部８を備えた音量調節装置１において、
ソース音声の信号に関するソース音声情報を抽出するソース音声抽出部５と、
外部から集音した音声から会話情報を抽出する外部環境音声抽出部４と、
ソース音声抽出部５が抽出したソース音声情報および外部環境音声抽出部４が抽出した会話情報から双方の相関を判別する相関性判別部６と、
相関性判別部６が判別した結果に基づいて、音量調節部８の音量を変化させる音量制御部７と、
を備えたことを特徴とする音量調節装置１。

この音量調節装置１によれば、ソース音声と会話内容との相関に応じた適切な音量に変化させることができる。また、会話内容と相関を見るのが予め記憶したパターンではなくソース音声に関する情報やソース音声信号自体であるので、音量変化の判定漏れを少なくすることができる。

（付記２）入力されるソース音声の音量を調節する音量調節方法において、
ソース音声の信号に関するソース音声情報を抽出し、外部から集音した音声から会話情報を抽出し、抽出したソース音声情報および会話情報から双方の相関を判別して、その判別した結果に基づいて、音量を変化させることを特徴とする音量調節方法。

この音量調節方法によれば、ソース音声と会話内容との相関に応じた適切な音量に変化させることができる。また、会話内容と相関を見るのが予め記憶したパターンではなくソース音声に関する情報やソース音声信号自体であるので、音量変化の判定漏れを少なくすることができる。

（付記３）入力されるソース音声の音量を調節する音量調節部８としてコンピュータに機能させる音量調節プログラムにおいて、
ソース音声の信号に関するソース音声情報を抽出するソース音声抽出部５と、
外部から集音した音声から会話情報を抽出する外部環境音声抽出部４と、
ソース音声抽出部５が抽出したソース音声情報および外部音声抽出手部４が抽出した会話情報から双方の相関を判別する相関性判別部６と、
相関性判別部６が判別した結果に基づいて、音量調節部８の音量を変化させる音量制御部７と、
して前記コンピュータを機能させることを特徴とする音量調節プログラム。

この音量調節プログラムによれば、ソース音声と会話内容との相関に応じた適切な音量に変化させることができる。また、会話内容と相関を見るのが予め記憶したパターンではなくソース音声に関する情報やソース音声信号自体であるので、音量変化の判定漏れを少なくすることができる。

なお、前述した実施例は本発明の代表的な形態を示したに過ぎず、本発明は、実施例に限定されるものではない。すなわち、本発明の骨子を逸脱しない範囲で種々変形して実施することができる。

本発明の一実施例にかかる音量調節装置のブロック図である。図１に示された音量調節装置のソース音声と会話内容との相関判別動作を示したフローチャートである。

符号の説明

１音量調節装置
４外部環境音声抽出部（外部音声抽出手段）
５ソース音声抽出部（ソース音声抽出手段）
６相関性判別部（相関性判別手段）
７音量制御部（音量制御手段）
８音量調節部（音量調節手段）

Claims

入力されるソース音声の音量を調節する音量調節手段を備えた音量調節装置において、
前記ソース音声の信号に関するソース音声情報を抽出するソース音声抽出手段と、
外部から集音した音声から会話情報を抽出する外部音声抽出手段と、
前記ソース音声抽出手段が抽出した前記ソース音声情報および前記外部音声抽出手段が抽出した前記会話情報から双方の相関を判別する相関性判別手段と、
前記相関性判別手段が判別した結果に基づいて、前記音量調節手段の音量を変化させる音量制御手段と、
を備えたことを特徴とする音量調節装置。
前記相関性判別手段は、予め定められた相関に関する閾値よりも相関が高い場合は相関があると判別し、前記閾値よりも相関が低い場合は相関がないと判別し、
前記音量制御手段は、前記相関性判別手段が相関があると判別した際には前記音量を維持または上げるように変化させ、前記相関性判別手段が相関がないと判別した際には前記音量を下げるように変化させる
ことを特徴とする請求項１に記載の音量調節装置。
前記ソース音声抽出手段が、前記ソース音声情報として前記ソース音声の信号を音声認識して該ソース音声内の単語を抽出し、
前記外部音声抽出手段が、前記会話情報として外部から集音した音声を音声認識して会話内の単語を抽出する
ことを特徴とする請求項１または２に記載の音量調節装置。
前記ソース音声抽出手段が、前記ソース音声情報として前記ソース音声に関するメタデータを取得し、
前記外部音声抽出手段が、前記会話情報として外部から集音した音声を音声認識して会話内の単語を抽出する
ことを特徴とする請求項１乃至３のうちいずれか一項に記載の音量調節装置。
前記ソース音声抽出手段は、前記ソース音声情報として前記ソース音声の種別を示す情報を抽出し、
前記相関性判別手段が、前記外部音声抽出手段が抽出した前記会話情報から指示語と前記ソース音声の種別を示す用語との組み合わせが検出された場合に相関があると判別することを特徴とする請求項１乃至４のうちいずれか一項に記載の音量調節装置。
前記ソース音声抽出手段が、前記ソース音声情報として前記ソース音声の信号波形を抽出し
前記外部音声抽出手段が、前記会話情報として外部から集音した音声から会話を示す波形を抽出する
ことを特徴とする請求項１乃至５のうちいずれか一項に記載の音量調節装置。
前記相関性判別手段が、相関がないと判別した際に、前記外部音声抽出手段が抽出した前記会話情報の重要度をさらに判別し、
前記音量制御手段が、前記相関性判別手段が判別した前記重要度に基づいて、前記音量の下げ幅を決定する
ことを特徴とする請求項１乃至６のうちいずれか一項に記載の音量調節装置。
入力されるソース音声の音量を調節する音量調節方法において、
前記ソース音声の信号に関するソース音声情報を抽出し、外部から集音した音声から会話情報を抽出し、抽出した前記ソース音声情報および前記会話情報から双方の相関を判別して、その判別した結果に基づいて、前記音量を変化させることを特徴とする音量調節方法。
入力されるソース音声の音量を調節する音量調節手段としてコンピュータに機能させる音量調節プログラムにおいて、
前記ソース音声の信号に関するソース音声情報を抽出するソース音声抽出手段と、
外部から集音した音声から会話情報を抽出する外部音声抽出手段と、
前記ソース音声抽出手段が抽出した前記ソース音声情報および前記外部音声抽出手段が抽出した前記会話情報から双方の相関を判別する相関性判別手段と、
前記相関性判別手段が判別した結果に基づいて、前記音量調節手段の音量を変化させる音量制御手段と、
して前記コンピュータを機能させることを特徴とする音量調節プログラム。
請求項９に記載の音量調節プログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。