WO2012043597A1

WO2012043597A1 - マスカ音出力装置及びマスカ音出力方法

Info

Publication number: WO2012043597A1
Application number: PCT/JP2011/072131
Authority: WO
Inventors: 宏明古賀; 小林　詠子
Original assignee: ヤマハ株式会社
Priority date: 2010-09-28
Filing date: 2011-09-27
Publication date: 2012-04-05
Also published as: CN103109317B; JP2012095262A; CN103109317A; JP5849411B2; US20130170662A1; US9286880B2

Abstract

　マスカ音出力装置は、収音された音に係る収音信号を入力する入力手段と、前記収音信号の音響特徴量を抽出する抽出手段と、マスカ音の出力開始の指示を受け付ける指示受付手段と、前記指示受付手段が前記出力開始の指示を受け付けた場合に、前記抽出手段が抽出した音響特徴量に対応するマスカ音を出力する出力手段と、を備える。

Description

マスカ音出力装置及びマスカ音出力方法

　本発明は、音をマスクするマスカ音を出力するマスカ音出力装置及びそのマスカ音出力方法に関する。

　仕事場などにおいて快適な環境空間を形成するために、聴取者が不快と感じる音を収音し、その音に近い音響特性（周波数特性など）を持つ別の音を出力することで、不快音を聞こえ難くするといったマスキング技術が知られている。例えば、特許文献１には、収音した聴取者の周囲の音の周波数成分を解析して、周囲の音と混じり合うことで別の音となる音を生成し、この音を出力する技術が開示されている。この特許文献１により、不快音を低減せずに、聴取者に不快音とは別の耳触りのよい音を聞かせることができ、聴取者に快適な環境空間を提供することができる。

日本国特開２００９－１１８０６２号公報

　しかしながら、特許文献１では、聴取者の周囲の全ての音をマスクしているため、聴取者が不快と感じない音又は必要とする音までもがマスクされる。このため、不必要な処理が行われ、また、聴取者が必要な情報を聞き逃すといった問題がある。

　そこで、本発明の目的は、マスクする音又はタイミングを選択することができるマスカ音出力装置及びそのマスカ音出力方法を提供することにある。

　上記目的を達成するために、本発明によれば、マスカ音出力装置であって、収音された音に係る収音信号を入力する入力手段と、前記収音信号の音響特徴量を抽出する抽出手段と、マスカ音の出力開始の指示を受け付ける指示受付手段と、前記指示受付手段が前記出力開始の指示を受け付けた場合に、前記抽出手段が抽出した音響特徴量に対応するマスカ音を出力する出力手段と、を備えるマスカ音出力装置を提供する。

　好適には、前記音響特徴量とマスカ音との対応付けを示した対応付けテーブルと、前記抽出手段が抽出した音響特徴量で前記対応付けテーブルを参照し、前記抽出手段が抽出した音響特徴量に対応するマスカ音を選択するマスカ音選択手段と、をさらに備え、前記出力手段は、前記マスカ音選択手段が選択したマスカ音を出力する。

　好適には、前記音響特徴量には複数のマスカ音が対応付けられており、前記マスカ音選択手段は、前記対応付けテーブルで前記音響特徴量に対応付けられた複数のマスカ音から、所定の条件に従ってマスカ音を選択する。

　好適には、マスカ音に係る音データを記憶するマスカ音データ記憶手段をさらに備え、前記マスカ音選択手段は、前記指示受付手段が前記出力開始の指示を受け付け、かつ前記抽出手段が抽出した音響特徴量が前記対応付けテーブルに記憶されていないと判定した場合に、前記抽出手段が抽出した音響特徴量と前記マスカ音データ記憶手段に記憶されているマスカ音に係る音データの音響特徴量とを比較し、前記抽出手段が抽出した音響特徴量と類似する音響特徴量を持つ音データを前記マスカ音データ記憶手段から読み出して、前記出力手段が前記音データに対応するマスカ音を出力する。

　好適には、前記マスカ音選択手段は、前記抽出手段が抽出した音響特徴量と前記マスカ音データ記憶手段から読み出したマスカ音に係る音データとを、新たに対応づけて前記対応付けテーブルに記憶する請求項４に記載のマスカ音出力装置。

　好適には、汎用マスカ音に係る音データを記憶する汎用マスカ音記憶手段をさらに備え、前記抽出手段が抽出した音響特徴量に合わせて、前記汎用マスカ音記憶手段に記憶されている汎用マスカ音に係る音データを加工して、マスク対象の音声を撹乱する撹乱音を生成する撹乱音生成手段を備え、前記出力手段が出力するマスカ音は、前記撹乱音生成手段が生成した撹乱音を含む。

　好適には、前記抽出手段が抽出した音響特徴量に合わせて、前記収音信号を加工して、マスク対象の音声を撹乱する撹乱音を生成する撹乱音生成手段をさらに備え、前記出力手段が出力するマスカ音は、前記撹乱音生成手段が生成した撹乱音を含む。

　好適には、前記マスカ音は、連続的な音及び断続的な音が合成された音を含む。

　好適には、前記マスカ音に含まれる連続的な音及び断続的な音の組み合わせ態様は、当該マスカ音を出力する時間に応じて変更される。

　好適には、前記マスカ音選択手段は、前記抽出手段が抽出した音響特徴量が、前記対応付テーブルに格納されている音響特徴量と一致又は類似する場合には、前記一致又は類似する音響特徴量に対応するマスカ音を選択し、前記出力手段は、前記マスカ音選択手段が選択したマスカ音を自動的に出力する。

　また、本発明によれば、収音された音に係る収音信号を入力する入力ステップと、前記収音信号の音響特徴量を抽出する抽出ステップと、マスカ音の出力開始の指示を受け付ける指示受付ステップと、前記指示受付ステップで前記出力開始の指示を受け付けた場合に、前記抽出ステップで抽出した音響特徴量に対応するマスカ音を出力する出力ステップと、を備えるマスカ音出力方法を提供する。

　好適には、前記マスカ音出力方法は、前記音響特徴量とマスカ音との対応付けを示した対応付けテーブルを参照し、前記抽出ステップで抽出した音響特徴量に対応するマスカ音を選択するマスカ音選択ステップをさらに備え、前記出力ステップで、前記マスカ音選択手段で選択したマスカ音を出力する。

　好適には、前記音響特徴量には複数のマスカ音が対応付けられており、前記マスカ音選択ステップでは、前記対応付けテーブルで前記音響特徴量に対応付けられた複数のマスカ音から、所定の条件に従ってマスカ音を選択する。

　好適には、マスカ音に係る音データを記憶するマスカ音データ記憶手段を備え、前記マスカ音選択ステップでは、前記指示受付ステップで前記出力開始の指示を受け付け、かつ前記抽出ステップで抽出した音響特徴量が前記対応付けテーブルに記憶されていないと判定した場合に、前記抽出ステップで抽出した音響特徴量と前記マスカ音データ記憶手段に記憶されているマスカ音に係る音データの音響特徴量とを比較し、前記抽出ステップで抽出した音響特徴量と類似する音響特徴量を持つ音データを前記マスカ音データ記憶手段から読み出して前記出力ステップで前記音データに対応するマスカ音を出力する。

　好適には、前記マスカ音選択ステップでは、前記抽出ステップで抽出した音響特徴量と前記マスカ音データ記憶手段から読み出したマスカ音に係る音データとを、新たに対応づけて前記対応付けテーブルに記憶する。

　好適には、汎用マスカ音に係る音データを記憶する汎用マスカ音記憶手段を備え、前記マスカ音出力方法は、前記抽出ステップで抽出した音響特徴量に合わせて、前記汎用マスカ音記憶手段に記憶されている汎用マスカ音に係る音データを加工して、マスク対象の音声を撹乱する撹乱音を生成する撹乱音生成ステップをさらに備え、前記出力ステップで出力するマスカ音は、前記撹乱音生成手段が生成した撹乱音を含む。

　好適には、前記抽出ステップで抽出した音響特徴量に合わせて、前記収音信号を加工して、マスク対象の音声を撹乱する撹乱音を生成する撹乱音生成ステップをさらに備え、前記出力ステップで出力するマスカ音は、前記撹乱音生成手段が生成した撹乱音を含む。

　好適には、前記マスカ音選択ステップでは、前記抽出ステップで抽出した音響特徴量が、前記対応付テーブルに格納されている音響特徴量と一致又は類似する場合には、前記一致又は類似する音響特徴量に対応するマスカ音を選択し、前記出力ステップでは、前記マスカ音選択ステップで選択したマスカ音を自動的に出力する。

　本発明によれば、マスクする音を選択することで、必要な音がマスクされることで必要な情報を聞き逃したり、不必要なマスカ音の生成処理を行ったりすることを回避することができる。

実施形態に係るマスカ音出力装置の構成を模式的に示すブロック図である。マスカ音出力装置の信号処理部及び記憶部の構成を模式的に示すブロック図である。マスカ音選択テーブルを模式的に示す図である。記憶された音データを加工する場合における、信号処理部が有する機能を模式的に示すブロック図である。収音信号を周波数軸で改変する場合に、信号処理部が有する機能を模式的に示すブロック図である。マスカ音出力装置で実行される処理の手順を示すフローチャートである。自動でマスカ音の出力を開始する場合に、マスカ音出力装置で実行される処理の手順を示すフローチャートである。

　以下、本発明に係るマスカ音出力装置の好適な実施形態について図面を参照して説明する。本実施形態に係るマスカ音出力装置は、ユーザ（聴取者）がスイッチをオンにするなどの操作を行った際に、マイクロフォンで収音した音を解析し、解析結果に応じた適切なマスカ音を出力する。すなわち、本実施形態では、聴取者がマスクしたい音又はタイミングを選択することで、聞きたくない音声（空調機器の騒音又は室外の騒音などを含む）がマスクされた快適な環境空間を形成することができる。なお、以下では、話者の音声を聞きたくない聴取者をマスカ音出力装置のユーザとして説明するが、自身の会話の内容を聴取者に聞かれたくない話者がマスカ音出力装置のユーザであってもよい。

　図１は、本実施形態に係るマスカ音出力装置の構成を模式的に示すブロック図である。マスカ音出力装置１は、制御部２、記憶部３、操作部４、音声入力部５、信号処理部６及び音声出力部７を備えている。制御部２は、例えばＣＰＵ（Central Processing Unit）であって、マスカ音出力装置１の動作を制御する。記憶部３は、ＲＯＭ（Read Only Memory）又はＲＡＭ（Random Access Memory）等であって、制御部２及び信号処理部６などにより読み出される必要なプログラム又はデータなどを記憶する。操作部４は、ユーザの操作を受け付ける。操作部４は、例えばマスカ音出力装置１の電源スイッチ、及びユーザが不快と感じたときにマスカ音の出力の開始を指示するスイッチなどである。

　音声入力部５は、図示しないＡ／Ｄコンバータを有しており、マイクロフォン５Ａが接続されている。音声入力部５は、マイクロフォン５Ａから入力された収音信号をＡ／ＤコンバータでＡ／Ｄ変換し、信号処理部６へ出力する。なお、マイクロフォン５Ａが収音する音声には、話者の音声、空調機器の騒音又は室外の騒音などを含む。

　信号処理部６は、例えばＤＳＰ（Digital Signal Processor）からなり、収音信号に対して信号処理を行い、音響特徴量を抽出する。音響特徴量とは、音の特徴を示す物理量であり、例えばスペクトル（各周波数のレベル）や、スペクトル包絡のピークの周波数（基本周波数、フォルマント等）を表す。図２は、制御部２、信号処理部６及び記憶部３の構成を模式的に示すブロック図である。信号処理部６は、ＦＦＴ（Fast Fourier Transform）６１および特徴量抽出部６２を備える。制御部２は、マスカ音選択部２１を備える。ＦＦＴ６１は、音声入力部５からの収音信号に対してフーリエ変換を行い、時間領域の信号を周波数領域の信号に変換する。

　特徴量抽出部６２は、ＦＦＴ６１によりフーリエ変換された収音信号の特徴量（スペクトル）を抽出する。具体的には、特徴量抽出部６２は、周波数毎に信号強度を算出し、算出した信号強度が閾値以上のスペクトルを抽出し、音響特徴量（以下、単に特徴量とも言う。）を抽出する。特徴量は、音の特徴を表す物理量であり、スペクトルそのもの（各周波数のレベル）や、スペクトル包絡の各ピークの周波数を表すもの（各ピークの中心周波数とレベル）等である。なお、特徴量抽出部６２は、信号強度が閾値未満のスペクトルを不要成分と判定し、そのスペクトルを「０」としてもよい。閾値は、騒音など様々な音を含む入力音から、少なくとも聴取者が知覚可能なレベルに対応する値である。閾値は、予め設定されていてもよいし、操作部４から入力されてもよい。

　マスカ音選択部２１は、特徴量抽出部６２が抽出した特徴量に対応するマスカ音に係る音声データ（以下、マスカ音データという）を記憶部３から選択し、音声出力部７へ出力する。記憶部３は、マスカ音記憶部３１及びマスカ音選択テーブル３２を備えている。マスカ音記憶部３１は、複数の時間軸波形のマスカ音データを記憶している。マスカ音データは、予め（例えば工場出荷時から）マスカ音記憶部３１に記憶しておいてもよいし、都度、ネットワーク等を経由して外部から取得し、マスカ音記憶部３１に記憶してもよい。マスカ音選択テーブル３２は、収音信号の特徴量と、マスカ音記憶部３１に記憶されたマスカ音データとを対応付けるデータテーブルである。

　図３は、マスカ音選択テーブル３２を模式的に示す図である。マスカ音選択テーブル３２は、特徴量欄、時間帯欄及びマスカ音欄を有し、各欄の情報をそれぞれ対応付けている。特徴量欄には、特徴量抽出部６２で抽出された収音信号の特徴量が格納される。マスカ音欄には、特徴量欄に格納された特徴量に対応するマスカ音が格納される。具体的には、マスカ音欄は、攪乱音欄、背景音欄及び演出音欄からなり、各欄には、各データが記憶されているマスカ音記憶部３１のアドレスが格納される。時間帯欄には、対応するマスカ音の出力に適した時間帯が格納される。
　攪乱音欄には、マスキング効果の主となる攪乱音が記憶されている。攪乱音は、例えば、話者の音声が加工されて生成された内容が理解できない会話音（語彙的に何ら意味をなさない音）である。マスカ音データは、少なくともこの攪乱音を含んでいる。背景音欄には、定常的（連続的）な背景音が記憶されている。背景音は、例えばＢＧＭ、川のせせらぎ、木々のざわめきなどの音である。演出音欄には、ピアノ音やチャイム音、鐘の音等の非定常的（断続的）に発生する演出性の高い音（演出音）が記憶されている。なお、背景音は、繰り返し再生出力される。演出音は、ランダムに、または、繰り返し再生出力される背景音の繰り返し開始時に出力される。また、演出音は、出力される時間がデータテーブルにより決められていてもよい。撹乱音は、語彙的に意味をなさないものであるため、違和感を覚える場合がある。そこで、背景音により暗騒音レベルを上げ、上記の撹乱音のような音を目立たなくすることで撹乱音による聴感上の違和感を低減する。また、演出音により、聴取者の注意を引き、聴覚心理的に撹乱音の違和感を目立たなくする。

　図３に示す特徴量Ａに対応付けられたマスカ音データは、攪乱音Ａに、ＢＧＭの背景音、及びピアノ音やチャイム音などの演出音が合成されている。ＢＧＭは、スローテンポの静かな曲、又はアップテンポの曲などであり、マスカ音の出力時間帯に適した音が、攪乱音Ａに合成される。例えば、図３に示すように、朝の１０時から１２時の時間帯には、スローテンポのＢＧＭ１が、午後の１４時から１５時の時間帯（昼過ぎ）には、アップテンポのＢＧＭ２等が、攪乱音Ａに合成される。また、マスカ音の出力時間帯に適した演出音として、例えば朝にはチャイム音、昼過ぎにはピアノ音が攪乱音Ａに合成される。また、特徴量Ｂには、攪乱音Ｂ（例えば、話者の音声）に、川の音としての背景音、及び鐘の音としての演出音が合成されたマスカ音データが対応付けられている。

　マスカ音選択部２１は、マスカ音選択テーブル３２から選択したマスカ音に係るアドレスを参照し、マスカ音記憶部３１からマスカ音データを取得する。例えば、マスカ音選択部２１は、特徴量抽出部６２が抽出した特徴量と、特徴量欄に格納される特徴量とのマッチング（相互相関による比較等）を行い、一致する又は略一致すると判断できる程度類似する特徴量を検索する。検索した結果、例えば特徴量抽出部６２が抽出した特徴量が特徴量Ａに略一致し、現在時刻が１１時のとき、マスカ音選択部２１は、マスカ音選択テーブル３２を参照して、特徴量Ａ及び現在時刻（１１時）に対応するマスカ音「攪乱音Ａ＋ＢＧＭ１＋チャイム音」を選択する。現在時刻がテーブル内の時間帯欄に該当しない場合、例えば現在時刻が１６時である場合、マスカ音選択部２１は、テーブル内のうち、時間帯欄が空白であるマスカ音「攪乱音Ａ＋木々のざわめき音」を選択する。これにより、マスカ音選択部２１が選択したマスカ音が出力されると、攪乱音によって、対象の音を攪乱して聞こえ難く（内容を理解できなく）しつつ、背景音や演出音などによって、攪乱する際に生じる不快感を聴取者に与えないようにできる。なお、一つの特徴量に複数のマスカ音が対応している場合、ユーザが手動で操作部４から希望するマスカ音を選択できるようにしてもよい。

　図３に示すマスカ音選択テーブル３２は、マスカ音選択部２１により各情報が登録される。具体的には、ユーザにより操作部４からマスカ音の出力開始操作が行われた場合に、マスカ音選択部２１は、特徴量抽出部６２が抽出した特徴量がマスカ音選択テーブル３２に格納されているか否かを判定する。特徴量抽出部６２が抽出した特徴量がマスカ音選択テーブル３２に格納されていないと判定した場合、マスカ音選択部２１は、その特徴量に適したマスカ音データをマスカ音記憶部３１から選択する。例えば、マスカ音選択部２１は、特徴量抽出部６２が抽出した特徴量と、マスカ音記憶部３１に記憶されるマスカ音データのうち、複数のマスカ音データの特徴量との相互相関をそれぞれ算出し、最も相関が高いマスカ音データを選択する。あるいは、マスカ音選択部２１は、相関の高いものから順に複数のマスカ音データを選択してもよい。このとき、マスカ音記憶部３１に記憶されているマスカ音データは時間軸波形であるため、マスカ音選択部２１が各マスカ音データを信号処理部６に入力し、信号処理部６が都度、周波数領域の信号に変換して特徴量を抽出してもよいが、マスカ音記憶部３１が記憶するマスカ音データに、マスカ音データの特徴量を示す情報（例えば、スペクトルのピーク値など）をヘッダとして付加するようにしてもよい。この場合、マスカ音選択部２１は、特徴量抽出部６２が抽出した特徴量と、マスカ音記憶部３１に記憶される各マスカ音データのヘッダ（特徴量を示す情報）との相関を求めるだけで済み、マスカ音選択部２１が行うマスカ音記憶部３１からのマスカ音データの選択処理を短縮することができる。

　マスカ音選択部２１は、以上のようにして特徴量抽出部６２が抽出した特徴量と相関が高い特徴量を有するマスカ音データを選択し、選択したマスカ音データが記憶されたアドレスと抽出した特徴量とを対応付けて、マスカ音選択テーブル３２に新たに格納（登録）する。このとき、時間帯欄には、マスカ音選択テーブル３２に特徴量等を格納した時間や季節が格納されてもよいし、選択されたマスカ音データに予め設定された時間帯や季節が格納されてもよい。また、一つの特徴量に対して複数のマスカ音データが選択された場合、ユーザが操作部４から各マスカ音データの出力させる時間帯や季節を設定できるようにしてもよい。

　また、特徴量抽出部６２が抽出した特徴量に最適なマスカ音データ（相関の高いマスカ音データ）がマスカ音記憶部３１に記憶されていない場合、マスカ音選択部２１は、外部装置から相関の高いマスカ音データを取得できるようにしてもよい。外部装置は、例えば、マスカ音出力装置と接続するパーソナルコンピュータであってもよいし、ネットワークを経由して接続されるサーバ装置であってもよい。

　このように、一度マスカ音選択テーブル３２に特徴量を格納（登録）しておけば、以降同じ特徴量の音声を収音した場合に、マスカ音選択部２１は、抽出した特徴量に適したマスカ音データを自動的に選択できる。仮に、抽出した特徴量をマスカ音選択テーブル３２に登録しない場合、マスカ音選択部２１は、抽出した特徴量に適したマスカ音データをマスカ音記憶部３１から選択する処理（複数のマスカ音データとの相互相関算出等）を、マスカ音を出力する都度、行う必要があり、その処理に時間を要する。これに対し、マスカ音選択テーブル３２に登録しておけば、対応するマスカ音データを読み出すだけでよいため、マスカ音が出力されるまでの時間を短縮でき、話者の音声がマスクされた快適な環境空間をより早く形成することができる。また、一つの特徴量に複数のマスカ音データを対応付け、ランダムに変化させることで、同じ音声を収音した場合であっても、常に同じマスカ音が出力されることがないため、カクテルパーティ効果を抑え、常に適切にマスクすることができる。さらに、朝、昼、晩などの時間帯毎に適したマスカ音データを対応付けることを可能とすることで、より快適な環境空間を形成することができる。

　なお、信号処理部６は、記憶部３に記憶された音データを取得し、その音データを加工するようにしてもよい。図４は、記憶された音データを加工する場合における、制御部２および信号処理部６が有する機能を模式的に示すブロック図である。図４に示す信号処理部６は、図２に示した信号処理部６の構成に加えて、マスカ音加工部６４を備えている。記憶部３には、汎用マスカ音（例えば、男女複数人の音声で内容が理解できないもの）データを記憶する汎用マスカ音記憶部３３、背景音データ（ＢＧＭなど）を記憶する背景音記憶部３４、及び演出音データ（断続的に発生するメロディ等）を記憶する演出音記憶部３５をそれぞれ記憶されている。

　図４に示すように、マスカ音選択部２１は、汎用マスカ音記憶部３３から汎用マスカ音データを取得し、マスカ音加工部６４に出力する。マスカ音加工部６４は、入力したマスカ音データを周波数領域の信号に変換し、マスカ音選択部２１から入力される収音信号の特徴量に合わせて、マスカ音データの周波数特性を加工する。例えば、汎用マスカ音のフォルマントを、収音信号のフォルマントと一致させる。そして、加工したマスカ音データを時間領域の信号に変換し、マスカ音選択部２１に出力する。これにより、特に収音信号が話者の音声である場合、出力する汎用マスカ音を、話者の音声の特徴により近づける。そして、マスカ音選択部２１は、背景音記憶部３４及び演出音記憶部３５から、ＢＧＭやピアノ音などを任意に、又はユーザの指示により選択し、加工した汎用マスカ音データに合成し、音声出力部７へ出力する。これにより、話者の音声を、話者の音声に近い汎用マスカ音で攪乱しつつ、背景音や演出音などによって、マスクする際に生じる不快感を聴取者に与えないようにできる。この場合においても、一度抽出した収音信号の特徴量と記憶部３から取得した各データとを対応付け、図３のようなテーブルに記憶するようにしてもよい。これにより、以降、背景音や演出音の選択処理を指示する必要がなくなる。

　また、本実施形態において、信号処理部６は、収音信号を加工してマスカ音データに含めて出力してもよい。この場合、信号処理部６は、収音信号を時間軸上、又は周波数軸上で改変し、内容が理解できない音声に変換する。図５は、収音信号を周波数軸で改変する場合に、制御部２および信号処理部６が有する機能を模式的に示すブロック図である。信号処理部６は、図２に示した信号処理部６の構成に加えて、マスカ音加工部６５、ＩＦＦＴ（Inverse FFT）６６を備えている。マスカ音加工部６５は、特徴量抽出部６２が抽出した特徴量のうち、例えば、収音信号からフォルマント周波数を抽出し、高次フォルマントを反転等して音韻を崩し、攪乱音とする。ＩＦＦＴ６６は、マスカ音加工部６５が加工した周波数領域の信号を時間軸領域の信号に変換する。制御部２のマスカ音選択部２１は、記憶部３の背景音記憶部３４及び演出音記憶部３５に記憶されている背景音や演出音などを、時間帯や季節、又はユーザの指示に従って取得する。そして、制御部２は、ＩＦＦＴ６６により時間軸領域の信号に変換された撹乱音と、マスカ音選択部が取得した背景音及び演出音を合成して、音声出力部７へ出力する。これにより、マスカ音出力装置のユーザを聴取者とした場合、聞きたくない話者の会話の内容を意味のない音声に変換することができ、さらに背景音及び演出音によりマスクする際に生じる不快感を聴取者に与えないようにできるため、聴取者にとって快適な環境空間を形成することができる。この場合においても、図４で説明したように、一度抽出した収音信号の特徴量と記憶部３から取得した各データとを対応付け、図３のようなテーブルに記憶するようにしてもよい。

　また、図５に示す構成の場合、マスカ音出力装置１は、音声入力部５からの収音信号に対してエコーを除去するエコーキャンセル部８を備えている。図５のマスカ音出力装置１は、スピーカ７Ａからマスカ音が出力された場合、マイクロフォン５Ａがそのマスカ音の回り込み成分を収音することで、収音信号にエコーが含まれる。このため、エコーキャンセル部８は、適応フィルタを備え、音声出力部７からマスカ音（時間領域の信号）を入力してフィルタ処理することにより、スピーカ７Ａから出力されたマスカ音がマイクロフォン５Ａへ回り込む成分の擬似信号である擬似回帰音信号を生成し、収音信号から擬似回帰音信号を差し引くことで、エコーを除去する。これにより、後段の信号処理部６は、収音信号からマイクロフォン５Ａに回り込んだマスカ音を除去でき、話者の音声を正確に抽出できる。なお、このエコーキャンセル部８は、図１及び図２に示す構成でも、音声入力部５の後段に設けられていてもよい。

　なお、図２、図４および図５の例では、信号処理部６が特徴量を抽出したり、音データを加工したりする例を示したが、制御部２が記憶部３に格納されるプログラムを実行することで、これらの信号処理部６の機能を実現するようにしてもよい。

　音声出力部７は、図示しないＤ／Ａコンバータ及びアンプを有し、スピーカ７Ａが接続されている。音声出力部７は、信号処理部６で決定されたマスカ音データに係る信号を、Ｄ／ＡコンバータでＤ／Ａ変換し、アンプで振幅（ボリューム）を最適な値に調整した後、スピーカ７Ａからマスカ音として出力する。

　次に、マスカ音出力装置１における動作について説明する。図６は、マスカ音出力装置１で実行される処理の手順を示すフローチャートである。図６に示す処理は、制御部２および信号処理部６で実行される。

　制御部２（または信号処理部６）は、音声入力部５から、有音と判定できる程度のレベルの収音信号が入力されたか否かを判定する（Ｓ１）。収音信号が入力されていない場合（Ｓ１：ＮＯ）、図６の動作を終了する。収音信号が入力された場合（Ｓ１：ＹＥＳ）、信号処理部６は、ＦＦＴ６１でフーリエ変換を行った後、収音信号の特徴量を抽出する（Ｓ２）。次に、制御部２は、操作部４からマスカ音の出力開始指示を受け付けたか否かを判定する（Ｓ３）。出力開始指示を受け付けていない場合（Ｓ３：ＮＯ）、図６に示す処理を終了する。

　開始指示を受け付けた場合（Ｓ３：ＹＥＳ）、制御部２は、マスカ音選択テーブル３２からＳ２で抽出した特徴量を検索する（Ｓ４）。制御部２は、Ｓ２で抽出した特徴量がマスカ音選択テーブル３２に格納されているか否かを判定する（Ｓ５）。特徴量がマスカ音選択テーブル３２に格納されていない場合（Ｓ５：ＮＯ）、すなわち、これまでにマスク対象としていない音声をマスクする場合、制御部２は、抽出した特徴量に適したマスカ音データをマスカ音記憶部３１から選択する（Ｓ６）。制御部２は、抽出した特徴量に最も類似するマスカ音データを選択するようにしてもよいし、複数のマスカ音データを選択するようにしてもよい。また、制御部２は、ユーザが選択したマスカ音データを選択するようにしてもよい。

　制御部２は、抽出した特徴量及び選択したマスカ音データが記憶されたアドレスを、マスカ音選択テーブル３２に格納して、マスカ音選択テーブル３２を更新する（Ｓ７）。次に、制御部２は、抽出した特徴量に対応するマスカ音データをマスカ音記憶部３１から取得する（Ｓ８）。具体的には、制御部２は、マスカ音選択テーブル３２を参照して、抽出した特徴量に対応するマスカ音を選択し、選択したマスカ音のマスカ音データが記憶されたアドレスを取得し、そのアドレスに記憶されているデータ（マスカ音データ）を取得する。制御部２は、取得したマスカ音データを音声出力部７へ出力し（Ｓ９）、スピーカ７Ａからマスカ音として出力する。

　一方、Ｓ５において、Ｓ２で抽出した特徴量がマスカ音選択テーブル３２に格納されている場合（Ｓ５：ＹＥＳ）、すなわち、これまでにマスク対象としている音声をマスクする場合、制御部２は、Ｓ２で抽出した特徴量に対応するマスカ音データを、マスカ音記憶部３１から取得する（Ｓ８）。この場合、マスカ音選択テーブル３２が更新されることはない。その後、制御部２は、取得したマスカ音データを音声出力部７へ出力し（Ｓ９）、スピーカ７Ａからマスカ音として出力する。

　なお、図６のＳ３において、制御部２は、ユーザの開始指示によって、マスカ音の出力を手動で開始しているが、Ｓ２で抽出した特徴量がマスカ音選択テーブル３２に格納されている特徴量と一致する場合には、自動でマスカ音を出力するようにしてもよい。図７は、自動でマスカ音の出力を開始する場合に、マスカ音出力装置１で実行される処理の手順を示すフローチャートである。

　制御部２は、音声入力部５から、有音と判定できる程度のレベルの収音信号が入力されたか否かを判定する（Ｓ１１）。収音信号が入力されていない場合（Ｓ１１：ＮＯ）、図７に示す動作を終了する。収音信号が入力された場合（Ｓ１１：ＹＥＳ）、制御部２は、自動でマスカ音の出力を開始するよう設定されているか否かを判定する（Ｓ１２）。自動でマスカ音の出力を開始するか否かは、ユーザが操作部４から選択できるように構成されることが好ましい。自動でマスカ音の出力を開始するよう設定されていない場合（Ｓ１２：ＮＯ）、図７に示す動作を終了する。自動でマスカ音の出力を開始するよう設定されている場合（Ｓ１２：ＹＥＳ）、信号処理部６が収音信号の特徴量を抽出する（Ｓ１３）。

　次に、制御部２は、信号処理部６が抽出した特徴量でマスカ音選択テーブル３２を検索し、マスカ音選択テーブル３２に抽出した特徴量が格納されているか否か（抽出した特徴量と一致する特徴量がマスカ音選択テーブル３２に格納されているか否か）を判定する（Ｓ１４）。特徴量が格納されていない場合（Ｓ１４：ＮＯ）、図７に示す動作を終了する。格納されている場合（Ｓ１４：ＹＥＳ）、制御部２は、Ｓ１３で抽出した特徴量に対応するマスカ音データを、マスカ音記憶部３１から取得する（Ｓ１５）。制御部２は、取得したマスカ音データを音声出力部７へ出力し（Ｓ１６）、スピーカ７Ａからマスカ音として出力し、本処理を終了する。このように、マスカ音出力装置１は、ユーザからマスカ音の出力開始指示を受け付けない場合であっても、既にマスカ音選択テーブル３２に登録されている特徴量を持つ音声がマイクロフォン５Ａから入力されると、自動でマスカ音の出力を開始することができる。

　なお、図７のＳ１４において、特徴量がマスカ音選択テーブル３２に格納されていない場合には、処理を終了しているが、図６のＳ６及びＳ７と同様に、抽出した特徴量に適したマスカ音データをマスカ音記憶部３１から選択し、抽出した特徴量及び選択したマスカ音データが記憶されたアドレスを、マスカ音選択テーブル３２に格納して、マスカ音選択テーブル３２を更新するようにしてもよい。また、図７の処理中に、ユーザの開始指示が行われた場合、図７に示す処理を中止し、図６に示すＳ４以降の処理を行い、マスカ音を出力すればよい。

　以上説明したように、本実施形態では、聴取者のマスカ音の出力開始指示を受け付けた場合に、収音した音のマスカ音を出力する。すなわち、聴取者がマスクしたい音又はタイミングを選択することができる。その結果、ユーザによって不快と感じる音は異なるが、各ユーザが不快と感じる音だけをマスクすることができ、各ユーザに最適な環境空間を実現することができる。また、全ての音がマスクされることで、聴取者が必要な情報を聞き逃したりするおそれを回避できる。さらに、マスクの必要のない音に対してマスカ音を生成するといった不必要な処理を軽減できる。また、時間に応じて出力するマスカ音を変更できるため、より快適な環境空間を聴取者に提供することができる。

　以上、好適な実施形態について説明したが、マスカ音出力装置１の具体的構成などは、適宜設計変更可能であり、上述の実施形態に記載された作用及び効果は、本発明から生じる最も好適な作用及び効果を列挙したに過ぎず、本発明による作用及び効果は、上述の実施形態に記載されたものに限定されるものではない。

　例えば、上述の実施形態では、時間毎に出力するマスカ音を対応付けているが、季節毎に出力すべきマスカ音を対応付けるようにしてもよい。上述の実施形態では、操作部４からのマスカ音の出力開始指示を受け付けていない場合であっても、自動でマスカ音を出力する構成としているが、マスカ音の出力開始指示を受け付けていない場合には、マスカ音を出力しない構成としてもよい。この場合、無駄な処理を軽減させるために、特徴量抽出部６２は、マスカ音の出力開始指示を受け付けた場合にのみ特徴量を抽出するようにしてもよい。

　上述の実施形態において、マスカ音出力装置１は、自身が記憶したマスカ音データを取得する構成としているが、外部に記憶されたマスカ音データを取得する構成であってもよい。例えば、マスカ音出力装置１は、パーソナルコンピュータに接続可能とし、パーソナルコンピュータに記憶されたマスカ音データを取得し、記憶部３に蓄積記憶する構成であってもよい。また、マスカ音出力装置１は、マイクロフォン５Ａ及びスピーカ７Ａを一体的に備えずに、汎用のマイクロフォン及びスピーカが接続可能な構成としてもよい。さらに、マスカ音出力装置１は、マスカ音を発生させる専用装置としているが、携帯電話機、ＰＤＡ（Personal Digital Assistant）又はパーソナルコンピュータなどであってもよい。

　以下、本発明の概要を詳述する。
　本発明に係るマスカ音出力装置は、入力手段、抽出手段、指示受付手段、および出力手段を備えている。入力手段は、収音された音に係る収音信号を入力する。抽出手段は、収音信号の音響特徴量を抽出する。音響特徴量とは、音の特徴を示す物理量であり、例えばスペクトル（各周波数のレベル）や、スペクトル包絡のピークの周波数（基本周波数、フォルマント等）を表す。指示受付手段は、マスカ音の出力開始の指示を受け付ける。出力手段は、指示受付手段が前記出力開始の指示を受け付けた場合に、前記抽出手段が抽出した音響特徴量に対応するマスカ音を出力する。

　この構成では、収音信号から、該収音信号に係る音響特徴量を抽出し、ユーザによるマスカ音の出力開始指示又は自動設定によりマスカ音の出力開始指示が行われた場合、抽出した音響特徴量に対応するマスカ音を出力する。これにより、例えばユーザが聞きたくない音が聞こえたときにマスカ音の出力開始指示の操作を行うことで、聞きたくない音だけをマスクすることができる。その結果、ユーザは、マスクしたい音を選択することで、マスクの必要のない音がマスクされることを回避でき、必要な情報を聞き逃すといった問題を回避できる。また、マスクをする必要のない音に対してマスカ音を生成するといった不必要な処理を軽減できる。

　また、本発明に係るマスカ音出力装置は、音響特徴量とマスカ音との対応付けを示した対応付けテーブルと、抽出手段が抽出した音響特徴量で前記対応付けテーブルを参照し、音響特徴量に対応するマスカ音を選択するマスカ音選択手段と、を備えた態様も可能である。この場合、出力手段は、前記マスカ音選択手段が選択したマスカ音を出力する。

　この構成では、収音された音に係る音響特徴量と、出力すべきマスカ音との対応付けを示したテーブルを参照することで、収音した音に対応するマスカ音が自動的に出力されることになる。

　また、音響特徴量には複数のマスカ音が対応付けられ、マスカ音選択手段は、前記対応付けテーブルで対応付けられた複数のマスカ音から、所定の条件に従ってマスカ音を選択する態様も可能である。

　この構成では、例えば、朝の時間帯には、朝に適した爽快な音、夜の時間帯には、夜に適したユッタリとした音とするなど、同じ音をマスクする場合であっても、条件に応じて異なるマスカ音を出力する。したがって、ユーザの使用状況に応じた適切なマスカ音が出力されることになる。

　また、本発明に係るマスカ音出力装置は、マスカ音に係る音データを記憶するマスカ音データ記憶手段を備えた態様も可能である。この場合、マスカ音選択手段は、前記指示受付手段が前記出力開始の指示を受け付け、かつ前記抽出手段が抽出した音響特徴量が前記対応付けテーブルに記載されていないと判定した場合に、前記抽出手段が抽出した音響特徴量と前記マスカ音データ記憶手段に記憶されているマスカ音に係る音データの音響特徴量とを比較し、音響特徴量に対応するマスカ音に係るデータを前記マスカ音データ記憶手段から読み出して前記出力手段に出力する。

　この構成では、マスカ音に係る音データをマスカ音データ記憶手段に記憶しておくことで、収音した音に対応するマスカ音が存在しなかった場合でも、抽出した音響特徴量に適したマスカ音（例えば類似する音響特徴量を有するもの）を自動的に出力することができる。

　なお、マスカ音選択手段は、抽出手段が抽出した音響特徴量と読み出したマスカ音に係る音データとを、新たに対応づけて対応付けテーブルに記録することが好ましい。

　これにより、以降に同じ音響特徴量を有するマスカ音を収音した際に、以前に出力したマスカ音と同じものを自動的に出力させることができる。

　さらに、マスカ音出力装置は、汎用マスカ音に係る音データを記憶する汎用マスカ音記憶手段をさらに備え、前記抽出手段が抽出した音響特徴量に合わせて、前記汎用マスカ音記憶手段に記憶されている汎用マスカ音に係る音データを加工して、マスク対象の音声を撹乱する撹乱音を生成する撹乱音生成手段を備え、前記出力手段が出力するマスカ音は、前記撹乱音生成手段が生成した撹乱音が含まれていることが好ましい。

　この構成では、汎用マスカ音記憶手段に記憶している汎用マスカ音を、収音信号の音響特徴量に合わせて加工し、撹乱音を生成する。汎用マスカ音は、例えば男女複数人の音声で内容が理解できない（語彙的に何ら意味をなさない）ものである。撹乱音は、この汎用マスカ音の特徴量を収音した音声の特徴量に近づけたものである。撹乱音は、汎用マスカ音と同様に語彙的に何ら意味をなさない音であり、かつ、マスク対象の音に近い音質（声質）や音高を有することになるため、高いマスキング効果を得ることができる。

　また、マスカ音出力装置は、抽出手段が抽出した音響特徴量に合わせて、収音信号を加工して、マスク対象の音声を撹乱する撹乱音を生成する態様も可能である。この場合、出力手段が出力するマスカ音は、前記撹乱音生成手段が生成した撹乱音が含まれていることになる。

　この構成では、収音した音声を加工して撹乱音を生成する。例えば、収音信号の周波数特性を改変し、音韻を崩したものが撹乱音となる。この場合、実際のマスク対象の音とほぼ同じ音質（声質）や音高を有した撹乱音となるため、より高いマスキング効果を得ることができる。

　なお、上記本発明におけるマスカ音は、連続的な音及び断続的な音を合成させたものが含まれていることが好ましい。

　連続的な音は、上記のような撹乱音や、例えば、川のせせらぎ音や木々のざわめき音等の背景音（定常的な自然音）等が含まれる。撹乱音は、上述のように、音韻を崩したものであるため、違和感を覚える場合がある。そこで、背景音により暗騒音レベル(background noise level)を上げ、上記の撹乱音のような音を目立たなくすることで撹乱音の違和感を低減する。また、断続的な音は、例えば、断続的に発生するメロディ音等の演出性の高い音（演出音）である。この演出音により、聴取者の注意を引き、聴覚心理的に撹乱音の違和感を目立たなくする。

　また、マスカ音に含まれる連続的な音及び断続的な音の組み合わせ態様は、当該マスカ音を出力する時に応じて変更されることが好ましい。

　マスカ音を出力する時間又は時期（季節）などに応じて、マスカ音の組み合わせ態様を変更すると、より快適なマスカ音の出力が可能となる。例えば、朝の時間帯には、鳥の鳴き声が含まれた背景音を出力して目覚めを良くし、夜の時間帯には、演出音を消してリラックスできるようにする、等である。

本発明は、２０１０年９月２８日出願の日本特許出願（特願２０１０－２１６２８３）及び２０１１年３月１６日出願の日本特許出願（特願２０１１－０５７３６５）に基づくものであり、それらの内容はここに参照として取り込まれる。

　本発明のマスカ音出力装置及びマスカ音出力方法によれば、ユーザが聞きたくない音が聞こえたときにマスカ音の出力開始指示の操作を行うことで、聞きたくない音だけをマスクすることができる。その結果、ユーザは、マスクしたい音を選択することで、マスクの必要のない音がマスクされることを回避でき、必要な情報を聞き逃すといった問題を回避できる。また、マスクをする必要のない音に対してマスカ音を生成するといった不必要な処理を軽減できる。

１　マスカ音出力装置
２　制御部
３　記憶部（マスカ音記憶手段）
４　操作部（指示受付手段）
５　音声入力部（収音手段）
６　信号処理部
７　音声出力部（出力手段）
３１　マスカ音記憶部
３２　マスカ音選択テーブル
６２　特徴量抽出部（抽出手段）
６３　マスカ音選択部（マスカ音選択手段）

Claims

　収音された音に係る収音信号を入力する入力手段と、
　前記収音信号の音響特徴量を抽出する抽出手段と、
　マスカ音の出力開始の指示を受け付ける指示受付手段と、
　前記指示受付手段が前記出力開始の指示を受け付けた場合に、前記抽出手段が抽出した音響特徴量に対応するマスカ音を出力する出力手段と、
を備えるマスカ音出力装置。
　前記音響特徴量とマスカ音との対応付けを示した対応付けテーブルと、
　前記抽出手段が抽出した音響特徴量で前記対応付けテーブルを参照し、前記抽出手段が抽出した音響特徴量に対応するマスカ音を選択するマスカ音選択手段と、
をさらに備え、
　前記出力手段は、前記マスカ音選択手段が選択したマスカ音を出力する請求項１に記載のマスカ音出力装置。
　前記音響特徴量には複数のマスカ音が対応付けられており、
　前記マスカ音選択手段は、前記対応付けテーブルで前記音響特徴量に対応付けられた複数のマスカ音から、所定の条件に従ってマスカ音を選択する請求項２に記載のマスカ音出力装置。
　マスカ音に係る音データを記憶するマスカ音データ記憶手段をさらに備え、
　前記マスカ音選択手段は、前記指示受付手段が前記出力開始の指示を受け付け、かつ前記抽出手段が抽出した音響特徴量が前記対応付けテーブルに記憶されていないと判定した場合に、前記抽出手段が抽出した音響特徴量と前記マスカ音データ記憶手段に記憶されているマスカ音に係る音データの音響特徴量とを比較し、前記抽出手段が抽出した音響特徴量と類似する音響特徴量を持つ音データを前記マスカ音データ記憶手段から読み出して、前記出力手段が前記音データに対応するマスカ音を出力する請求項２又は３に記載のマスカ音出力装置。
　前記マスカ音選択手段は、前記抽出手段が抽出した音響特徴量と前記マスカ音データ記憶手段から読み出したマスカ音に係る音データとを、新たに対応づけて前記対応付けテーブルに記憶する請求項４に記載のマスカ音出力装置。
　汎用マスカ音に係る音データを記憶する汎用マスカ音記憶手段をさらに備え、
　前記抽出手段が抽出した音響特徴量に合わせて、前記汎用マスカ音記憶手段に記憶されている汎用マスカ音に係る音データを加工して、マスク対象の音声を撹乱する撹乱音を生成する撹乱音生成手段を備え、
　前記出力手段が出力するマスカ音は、前記撹乱音生成手段が生成した撹乱音を含む請求項１から５の何れか一つに記載のマスカ音出力装置。
　前記抽出手段が抽出した音響特徴量に合わせて、前記収音信号を加工して、マスク対象の音声を撹乱する撹乱音を生成する撹乱音生成手段をさらに備え、
　前記出力手段が出力するマスカ音は、前記撹乱音生成手段が生成した撹乱音を含む請求項１から５の何れか一つに記載のマスカ音出力装置。
　前記マスカ音は、連続的な音及び断続的な音が合成された音を含む請求項１から７の何れか一つに記載のマスカ音出力装置。
　前記マスカ音に含まれる連続的な音及び断続的な音の組み合わせ態様は、当該マスカ音を出力する時間に応じて変更される請求項８に記載のマスカ音出力装置。
　前記マスカ音選択手段は、前記抽出手段が抽出した音響特徴量が、前記対応付テーブルに格納されている音響特徴量と一致又は類似する場合には、前記一致又は類似する音響特徴量に対応するマスカ音を選択し、
　前記出力手段は、前記マスカ音選択手段が選択したマスカ音を自動的に出力する請求項２から９の何れか一つに記載のマスカ音出力装置。
　収音された音に係る収音信号を入力する入力ステップと、
　前記収音信号の音響特徴量を抽出する抽出ステップと、
　マスカ音の出力開始の指示を受け付ける指示受付ステップと、
　前記指示受付ステップで前記出力開始の指示を受け付けた場合に、前記抽出ステップで抽出した音響特徴量に対応するマスカ音を出力する出力ステップと、
を備えるマスカ音出力方法。
　前記音響特徴量とマスカ音との対応付けを示した対応付けテーブルを参照し、前記抽出ステップで抽出した音響特徴量に対応するマスカ音を選択するマスカ音選択ステップをさらに備え、
　前記出力ステップで、前記マスカ音選択手段で選択したマスカ音を出力する請求項１１に記載のマスカ音出力方法。
　前記音響特徴量には複数のマスカ音が対応付けられており、
　前記マスカ音選択ステップでは、前記対応付けテーブルで前記音響特徴量に対応付けられた複数のマスカ音から、所定の条件に従ってマスカ音を選択する請求項１２に記載のマスカ音出力方法。
　マスカ音に係る音データを記憶するマスカ音データ記憶手段を備え、
　前記マスカ音選択ステップでは、前記指示受付ステップで前記出力開始の指示を受け付け、かつ前記抽出ステップで抽出した音響特徴量が前記対応付けテーブルに記憶されていないと判定した場合に、前記抽出ステップで抽出した音響特徴量と前記マスカ音データ記憶手段に記憶されているマスカ音に係る音データの音響特徴量とを比較し、前記抽出ステップで抽出した音響特徴量と類似する音響特徴量を持つ音データを前記マスカ音データ記憶手段から読み出して前記出力ステップで前記音データに対応するマスカ音を出力する請求項１２又は１３に記載のマスカ音出力方法。
　前記マスカ音選択ステップでは、前記抽出ステップで抽出した音響特徴量と前記マスカ音データ記憶手段から読み出したマスカ音に係る音データとを、新たに対応づけて前記対応付けテーブルに記憶する請求項１４に記載のマスカ音出力方法。
　汎用マスカ音に係る音データを記憶する汎用マスカ音記憶手段を備え、
　前記マスカ音出力方法は、前記抽出ステップで抽出した音響特徴量に合わせて、前記汎用マスカ音記憶手段に記憶されている汎用マスカ音に係る音データを加工して、マスク対象の音声を撹乱する撹乱音を生成する撹乱音生成ステップをさらに備え、
　前記出力ステップで出力するマスカ音は、前記撹乱音生成手段が生成した撹乱音を含む請求項１１から１５の何れか一つに記載のマスカ音出力方法。
　前記抽出ステップで抽出した音響特徴量に合わせて、前記収音信号を加工して、マスク対象の音声を撹乱する撹乱音を生成する撹乱音生成ステップをさらに備え、
　前記出力ステップで出力するマスカ音は、前記撹乱音生成手段が生成した撹乱音を含む請求項１１から１５の何れか一つに記載のマスカ音出力方法。
　前記マスカ音は、連続的な音及び断続的な音が合成された音を含む請求項１１から１７の何れか一つに記載のマスカ音出力方法。
　前記マスカ音に含まれる連続的な音及び断続的な音の組み合わせ態様は、当該マスカ音を出力する時間に応じて変更される請求項１８に記載のマスカ音出力方法。
　前記マスカ音選択ステップでは、前記抽出ステップで抽出した音響特徴量が、前記対応付テーブルに格納されている音響特徴量と一致又は類似する場合には、前記一致又は類似する音響特徴量に対応するマスカ音を選択し、
　前記出力ステップでは、前記マスカ音選択ステップで選択したマスカ音を自動的に出力する請求項１２から１９の何れか一つに記載のマスカ音出力方法。