JP2018181122A - 電子機器及び異常検知プログラム - Google Patents

電子機器及び異常検知プログラム Download PDF

Info

Publication number
JP2018181122A
JP2018181122A JP2017082344A JP2017082344A JP2018181122A JP 2018181122 A JP2018181122 A JP 2018181122A JP 2017082344 A JP2017082344 A JP 2017082344A JP 2017082344 A JP2017082344 A JP 2017082344A JP 2018181122 A JP2018181122 A JP 2018181122A
Authority
JP
Japan
Prior art keywords
sound
microphone
viewing
signal
broadcast
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017082344A
Other languages
English (en)
Inventor
遠藤 香緒里
Kaori Endo
香緒里 遠藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2017082344A priority Critical patent/JP2018181122A/ja
Publication of JP2018181122A publication Critical patent/JP2018181122A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Emergency Alarm Devices (AREA)
  • Alarm Systems (AREA)

Abstract

【課題】視聴音の識別精度を向上させること。【解決手段】見守り端末10は、複数のチャンネルごとに取得される放送音の信号における無音区間と、マイクから取得される信号における無音区間との類似度に基づいて、放送音が視聴音としてマイクに回り込むチャンネルを識別する視聴音識別部と、視聴音識別部により識別されたチャンネルの放送音に基づいて、マイクから取得される信号から視聴音を抑圧する抑圧部と、視聴音の抑圧後の前記マイクの信号から異常音を検知する異常検知部と、を有する。【選択図】図2

Description

本発明は、電子機器及び異常検知プログラムに関する。
IoT(Internet of Things)を活用して居住者、例えば高齢者や要介護者を見守るソリューションが注目されている。例えば、居住者宅に設置された見守り端末のマイクから入力される信号から異常音、例えば「咳」などを検知することにより、居住者の異常を関係者に通知するリモートケアサービスが提供されることがある。
特開2016−163071号公報
ところで、マイクからの入力信号から異常音を検出する場合、テレビやラジオの視聴音が妨げとなる場合がある。この視聴音を抑圧するために、一例として、放送音の信号とマイクからの入力信号との相関から入力信号に含まれる視聴音がいずれのチャンネルであるかを識別する技術を援用することが考えられる。
しかしながら、放送音の信号とマイクからの入力信号との間で単純に相関をとるだけでは、視聴音の識別精度に自ずから限界がある。
1つの側面では、本発明は、視聴音の識別精度を向上させることができる電子機器及び異常検知プログラムを提供することを目的とする。
一態様では、電子機器は、複数のチャンネルごとに取得される放送音の信号における無音区間と、マイクから取得される信号における無音区間との類似度に基づいて、前記放送音が視聴音として前記マイクに回り込むチャンネルを識別する視聴音識別部と、前記視聴音識別部により識別されたチャンネルの放送音に基づいて、前記マイクから取得される信号から前記視聴音を抑圧する抑圧部と、前記視聴音の抑圧後の前記マイクの信号から異常音を検知する異常検知部と、を有する。
視聴音の識別精度を向上させることができる。
図1は、実施例1に係るリモートケアシステムの構成例を示す図である。 図2は、実施例1に係る見守り端末の機能的構成の一例を示すブロック図である。 図3は、異常検知処理の手順を示すフローチャートである。 図4は、放送受信処理の手順を示すフローチャートである。 図5は、視聴音識別処理の手順を示すフローチャートである。 図6は、類似度算出処理の手順を示すフローチャートである。 図7は、無音パターン算出処理の手順を示すフローチャートである。 図8は、抑圧制御処理の手順を示すフローチャートである。 図9は、第1の抑圧処理の手順を示すフローチャートである。 図10は、回り込み音の遅延量の一例を示す図である。 図11は、回り込み音の遅延算出処理の手順を示すフローチャートである。 図12は、特定パターンの一例を示す図である。 図13は、視聴音の到来方向と視聴音の音源から各マイクまでの距離差との関係を示す図である。 図14は、実施例1及び実施例2に係る異常検知プログラムを実行するコンピュータのハードウェア構成例を示す図である。
以下に添付図面を参照して本願に係る電子機器及び異常検知プログラムについて説明する。なお、この実施例は開示の技術を限定するものではない。そして、各実施例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
[システム構成]
図1は、実施例1に係るリモートケアシステムの構成例を示す図である。図1に示すリモートケアシステム1は、居住者宅3に設置された見守り端末10のマイクから入力される信号から居住者3Aの異常音を検知する異常検知処理を通じて、居住者3Aの異常の有無を関係者端末30に通知するリモートケアサービスを実現するものである。
このように居住者3Aの異常音を検知する場合、放送受信装置20から出力されるテレビやラジオなどの放送音が視聴音としてマイクの入力信号で観測されることにより、異常音の検知の妨げとなる。
このことから、リモートケアサービスの一環として、リモートケアシステム1は、マイクの入力信号に含まれる視聴音を抑圧するために、放送音固有の特徴を用いる視聴音識別処理を実現する。すなわち、テレビやラジオ等の放送では、本編及びコマーシャルの切り替り時、あるいは番組間の切り替り時に無音が挿入される。このような放送音固有の特徴を用いて、放送音の信号とマイクの信号との比較時に両者の無音パターンが一致するか否かにより、マイクの信号に含まれる視聴音のチャンネルを識別して視聴音を抑圧する。これにより、テレビやラジオ等の視聴音にロバストな異常音の検知を実現できる。
図1に示すように、リモートケアシステム1には、見守り端末10と、関係者端末30とが含まれる。図1には、見守り端末10および関係者端末30を1つずつ例示したが、任意の数の見守り端末10および関係者端末30がリモートケアシステム1に収容されることとしてもかまわない。
これら見守り端末10及び関係者端末30の間は、ネットワークNWを介して接続される。このネットワークNWは、有線または無線を問わず、任意の通信網により構築することができる。さらに、ネットワークNWの一部には、有線または無線の通信網が混在してもよい。例えば、関係者端末30が無線通信装置として実装される場合、ネットワークNWには、無線通信装置を収容するセルに対応する最寄りの基地局やアクセスポイント等の中継装置が含まれる。
見守り端末10は、居住者3A、例えば高齢者や要介護者を見守るソリューションを実現する端末装置である。ここで言う「居住者」には、あくまで一例として、高齢者や要介護者などが含まれる。なお、見守り端末10は、電子機器の一例である。
一実施形態として、見守り端末10は、居住者宅3に設置される。例えば、見守り端末10は、音を電気信号に変換するマイクロフォン、いわゆるマイクを有する。以下では、マクロフォンのことをその略称である「マイク」と記載する。このマイクを用いて、見守り端末10は、マイクから入力される信号から居住者3Aの異常音、例えば「咳」などを検知する。例えば、見守り端末10は、異常音が検知された場合、予め登録された連絡先に指定された関係者端末30に居住者3Aの異常を通知することができる。このように居住者3Aの異常を通知する場合、異常音が検知されたからといって直ちに通知を行わずともよく、異常音の検知結果に任意の統計処理を行って統計値が条件を満たす場合に始めて異常を通知することとしてもかまわない。例えば、異常音の検知頻度、例えば1分間あたりの咳の回数が所定の閾値、例えば10回以上となる場合に居住者3Aの異常を通知したり、異常音が累積して検知された回数が所定の閾値、例えば30回以上となる場合に居住者3Aの異常を通知したりすることができる。
関係者端末30は、居住者3Aの関係者により使用される端末装置である。ここで言う「関係者」には、あくまで例示として、居住者の家族や親戚の他、上記のリモートケアサービスの運用に携わるコールセンタの担当者やコールセンタに駐在する医療従事者などが含まれてもかまわない。
一実施形態として、関係者端末30には、スマートフォン、携帯電話機やPHS(Personal Handyphone System)などの移動体通信端末のみならず、タブレット端末やスレート端末などを採用することができる。このようにハンドヘルド型の携帯端末装置に限定されず、関係者端末30には、ヘッドマウントディスプレイ、スマートグラスやスマートウォッチなどのウェアラブルデバイスの他、あらゆるIoTデバイスを採用することができる。なお、ここでは、あくまで携帯端末装置の例を挙げたが、関係者端末30は、据置き型の情報処理装置、例えばパーソナルコンピュータ等であってもかまわない。
[見守り端末10の機能的構成]
図2は、実施例1に係る見守り端末10の機能的構成の一例を示すブロック図である。図2に示すように、見守り端末10は、第1のマイク11Aと、第2のマイク11Bと、放送受信部12と、視聴音識別部13と、選択部14と、第1の抑圧部15Aと、第2の抑圧部15Bと、異常検知部16とを有する。
図2に示す視聴音識別部13、選択部14、第1の抑圧部15A、第2の抑圧部15B及び異常検知部16などの機能部は、MPU(Micro Processing Unit)やCPU(Central Processing Unit)などのハードウェアプロセッサにより仮想的に実現される。すなわち、プロセッサがRAM(Random Access Memory)等のメモリ上に上記の音声検出処理を実行する異常検知プログラムをプロセスとして展開することにより、上記の機能部が仮想的に実現される。ここでは、プロセッサの一例として、CPUやMPUを例示したが、汎用型および特化型を問わず、任意のプロセッサにより上記の機能部が実現されることとしてもかまわない。この他、上記の機能部は、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などのハードワイヤードロジックによって実現されることとしてもかまわない。
また、図2に示す機能部は、あくまで例示であり、見守り端末10の機能的構成が図2に示す例以外の機能的構成を有することを妨げない。すなわち、見守り端末10は、上記の機能部以外の他の機能部を有することとしてもかまわない。例えば、見守り端末10は、図2では図示が省略されているが、ネットワークNWに接続する通信インタフェースなどを有することができる。この他、上記のリモートケアサービスでは、異常検知のみならず、人の動きや温湿度などを複合して安否の確認を行うこともできるので、人感センサや温湿度センサなどをさらに有することもできる。また、上記のリモートケアサービスでは、コールセンタとの間で通話を行う通話機能をさらに有することもできる。
また、図2に示す機能部に対する信号やデータの入出力の関係を表す実線が例示されているが、これはデータの入出力の関係は、少なくとも一方から他方へデータが伝送されることが示されており、必ずしも双方向にデータの授受が行われずともかまわない。
第1のマイク11A及び第2のマイク11Bは、いずれも音声を電気信号に変換する装置である。第1のマイク11A及び第2のマイク11Bは、マイクアレイとして実装される。第1のマイク11A及び第2のマイク11Bは、放送音等の音波が到来する方向を識別するために、所定の距離dを隔てて配置される。以下では、第1のマイク11Aから入力される信号のことを「第1マイク信号」と記載すると共に、第2のマイク11Bから入力される信号のことを「第2マイク信号」と記載する場合がある。
放送受信部12は、テレビやラジオなどの放送波を受信する処理部である。例えば、放送受信部12は、アンテナを介して受信される放送波から放送音の信号を復調するチューナー等により実装することができる。この放送受信部12が受信する放送音のチャンネルは、視聴音識別部13により指示される。
視聴音識別部13は、第1マイク信号に含まれる視聴音のチャンネルを識別する処理部である。この視聴音の識別の詳細は後述するが、放送音の信号と第1マイク信号との間でテレビやラジオ等の放送における本編及びコマーシャルの切り替り時または番組間の切り替り時に現れる無音パターンが一致するか否かにより、第1マイク信号に含まれる視聴音のチャンネルが識別される。ここでは、あくまで一例として、第1マイク信号に含まれる視聴音のチャンネルを識別する場合を例示するが、第2マイク信号に含まれる視聴音のチャンネルを識別することとしてもかまわない。
選択部14は、第1の抑圧部15A及び第2の抑圧部15Bのうちいずれの処理部に視聴音の抑圧を実行させるかを選択する処理部である。例えば、選択部14は、視聴音識別部13により視聴音のチャンネルが識別できるか否かにより、第1の抑圧部15Aまたは第2の抑圧部15Bを選択する。
第1の抑圧部15A及び第2の抑圧部15Bは、いずれも第1マイク信号に含まれる視聴音を抑圧する処理部である。このうち、第1の抑圧部15Aは、第1のマイク11Aに対する視聴音の伝達特性に基づいて放送受信装置20により出力された放送音が第1のマイク11Aへ回り込んだ視聴音、いわゆる回り込み音を抑圧する。また、第2の抑圧部15Bは、第1マイク信号及び第2マイク信号を用いて視聴音の到来方向の成分を抑圧する。
異常検知部16は、視聴音の抑圧後の第1マイク信号から異常音を検知する処理部である。例えば、異常検知部16は、視聴音の抑圧後の第1マイク信号から咳の特徴量を算出する。続いて、異常検知部16は、咳の特徴量が所定の閾値よりも大きいか否かを判定する。このとき、咳の特徴量が所定の閾値よりも大きい場合、第1マイク信号に咳の音が含まれると判断される。この場合、異常検知部16は、居住者3Aの異常を関係者端末30へ通知することができる。
[異常検知処理]
図3は、異常検知処理の手順を示すフローチャートである。この処理は、一例として、第1のマイク11A及び第2のマイク11Bから第1マイク信号及び第2マイク信号が入力された場合に開始される。
図3に示すように、第1のマイク11Aから第1マイク信号が入力されると共に、第2のマイク11Bから第2マイク信号が入力される(ステップS101)。すると、見守り端末10は、ステップS101で入力された第1マイク信号に含まれる視聴音を抑圧する(ステップS102)。
その後、異常検知部16は、ステップS102で視聴音が抑圧された第1マイク信号を分析することにより咳の特徴量を算出する(ステップS103)。このとき、咳の特徴量が所定の閾値よりも大きい場合、すなわち咳の特徴量>閾値である場合(ステップS104Yes)、居住者3Aの異常を関係者端末30へ通知する(ステップS105)。なお、咳の特徴量が所定の閾値未満である場合、すなわち咳の特徴量≦閾値である場合(ステップS104No)、ステップS105はスキップされる。
その後、第1マイク信号および第2マイク信号の入力が終了するまで(ステップS106No)、上記のステップS101からステップS105までの処理を繰り返し実行する。なお、第1マイク信号および第2マイク信号の入力が終了すると(ステップS106Yes)、処理を終了する。
[放送受信処理]
図4は、放送受信処理の手順を示すフローチャートである。この処理は、放送受信部12により実行される処理である。図4に示すように、図示しないアンテナを介して放送波を受信すると(ステップS201)、放送受信部12は、ステップS201で受信された放送波を視聴音識別部13に指示されたチャンネルの放送音の信号へ変換する(ステップS202)。
そして、放送受信部12は、ステップS202で変換された放送音の信号を視聴音識別部13へ出力する(ステップS203)。その後、視聴音識別部13からチャンネルの切り替え指示を受け付けた場合(ステップS204Yes)、放送受信部12は、放送波から復調する放送音のチャンネルを切替え(ステップS205)、ステップS201の処理へ移行する。
なお、視聴音識別部13からチャンネルの切り替え指示を受け付けていない場合(ステップS204No)、ステップS205の処理をスキップし、ステップS201の処理へ移行する。
[視聴音識別処理]
図5は、視聴音識別処理の手順を示すフローチャートである。この処理は、視聴音識別部13により実行される処理である。図5に示すように、第1のマイク11Aから入力される第1マイク信号が取得されるのと並行して、放送受信部12により出力される放送音の信号が取得される(ステップS301及びステップS302)。このように取得される信号の時間長は、フレーム単位であってもかまわないが、視聴音のチャンネルを識別できる程度の時間長、例えば3秒間などのサブフレーム単位とすることができる。なお、ステップS301及びステップS302の処理は、並行して実行することもできれば、順不同で実行することもできる。
続いて、視聴音識別部13は、ステップS301で取得された第1マイク信号と、ステップS302で取得された放送音の信号との間で類似度を算出する「類似度算出処理」を実行する(ステップS303)。
ここで、ステップS303で算出された類似度が所定の閾値以上である場合(ステップS304Yes)、ステップS302で取得された放送音が第1マイク信号に含まれる可能性が高いと推定できる。この場合、視聴音識別部13は、ステップS302で取得された放送音のチャンネルを視聴音のチャンネルの識別結果として選択部14へ出力し(ステップS305)、処理を終了する。
一方、ステップS303で算出された類似度が所定の閾値以上でない場合(ステップS304No)、ステップS302で取得された放送音が視聴音として第1マイク信号で観測されないと判断できる。この場合、視聴音識別部13は、全てのチャンネルで類似度が算出されたか否かを判定する(ステップS306)。
そして、全てのチャンネルで類似度が算出されていない場合(ステップS306No)、放送受信部12により放送音が受信されるチャンネルを類似度が未算出であるチャンネルに切り替えるように放送受信部12へ指示し(ステップS307)、ステップS301の処理へ移行する。
一方、全てのチャンネルで類似度が算出された場合(ステップS306Yes)、全ての放送音が視聴音として第1マイク信号で観測されないと判断できる。この場合、視聴音識別部13は、視聴音のチャンネルの識別結果として「該当チャンネルなし」を選択部14へ出力し(ステップS308)、処理を終了する。
[類似度算出処理]
図6は、類似度算出処理の手順を示すフローチャートである。この処理は、図5に示すステップS303の処理に対応する。図6に示すように、視聴音識別部13は、第1マイク信号のサブフレームから無音パターンを算出する「第1の無音パターン算出処理」を実行するのと並行して、放送音の信号のサブフレームから無音パターンを算出する「第2の無音パターン算出処理」を実行する(ステップS401及びステップS402)。ここで言う「無音パターン」とは、第1マイク信号または放送音の信号で観測される無音区間のパターンを指す。なお、ステップS401及びステップS402の処理は、並行して実行することもできれば、順不同で実行することもできる。
[類似度算出処理のサブフロー]
ここで、図7を用いて、無音パターン算出処理の詳細について説明する。図7は、無音パターン算出処理の手順を示すフローチャートである。この処理は、図6に示すステップS401及びステップS402の処理に対応する。なお、無音パターンを算出する手順は、第1マイク信号または放送音の信号のいずれの無音パターンを算出する場合でも同一であるので、ここでは、あくまで一側面として、第1マイク信号の無音パターンが算出される例を示すこととする。
図7に示すように、視聴音識別部13は、第1マイク信号のサブフレームに含まれるフレームを取得する(ステップS501)。続いて、視聴音識別部13は、ステップS501で取得されたフレームのパワーを算出する(ステップS502)。
このフレームパワーは、一例として、下記の式(1)にしたがって算出することができる。下記の式(1)における「a」は、フレームに含まれる信号値のうちn番目の信号値を指す。また、下記の式(1)における「N」は、フレームを構成する信号値の総数を指す。
Figure 2018181122
そして、視聴音識別部13は、ステップS502で算出されたフレームパワーが所定の閾値よりも大きいか否かを判定する(ステップS503)。このとき、フレームパワーが閾値よりも大きい場合(ステップS503Yes)、視聴音識別部13は、ステップS501で取得されたフレームのパワーに「1」を設定する(ステップS504)。一方、フレームパワーが閾値未満である場合(ステップS503No)、視聴音識別部13は、ステップS501で取得されたフレームのパワーに「0」を設定する(ステップS505)。
その後、第1マイク信号のサブフレームに含まれる全てのフレームが取得されるまで(ステップS506No)、上記のステップS501から上記のステップS505までの処理を繰り返し実行する。そして、第1マイク信号のサブフレームに含まれる全てのフレームが取得された場合(ステップS506Yes)、視聴音識別部13は、第1マイク信号のサブフレームに含まれるフレームごとに当該フレームのパワーが「1」または「0」に2値化された無音パターン信号を算出し(ステップS507)、処理を終了する。
なお、ここでは、あくまで一側面として、第1マイク信号から無音パターン信号を算出する場合を例示したが、放送音の信号から無音パターン信号を算出する場合も同様の処理が実行される。以下では、両者を区別する観点から、第1マイク信号から算出された無音パターン信号のことを「マイク入力の無音パターン信号」と記載する一方で、放送音の信号から算出された無音パターン信号のことを「放送音の無音パターン信号」と記載する場合がある。
[類似度算出処理のメインフローへの復帰]
図6のステップS402の処理が実行された後の説明に戻り、視聴音識別部13は、ステップS401で算出されたマイク入力の無音パターン信号と、ステップS402で算出された放送音の無音パターン信号との間で相関係数を算出する(ステップS403)。
すなわち、放送音の無音パターン信号に対し、マイク入力の無音パターン信号をフレーム単位でスライドさせながら、放送音の無音パターン信号に対するマイク入力の無音パターン信号のスライド幅ごとに2つの無音パターン信号の相関係数を算出する。
この相関係数は、一例として、下記の式(2)にしたがって算出することができる。下記の式(2)における「corr(j)」は、マイク入力の無音パターン信号と放送音の無音パターン信号の相関係数を指し、さらに、当該相関係数は、放送音の無音パターン信号に対し、jサンプル分に対応するフレーム数にわたってマイク入力の無音パターン信号がスライドされた場合の相関係数を表す。また、下記の式(2)における「mi+j」は、マイク入力の無音パターン信号のi+j番目のサンプルを指す。また、また、下記の式(2)における「bi」は、放送音の無音パターン信号のi番目のサンプルを指す。
Figure 2018181122
その上で、視聴音識別部13は、ステップS403で放送音の無音パターン信号に対するマイク入力の無音パターン信号のスライド幅ごとに算出された相関係数のうち最大値となる相関係数max(corr(j))を抽出する(ステップS404)。このようにステップS404で抽出された最大値の相関係数max(corr(j))を類似度として導出し(ステップS405)、処理を終了する。
なお、図5〜図7に示す処理では、マイク入力の無音パターン信号および放送音の無音パターン信号の間でスライド幅ごとに算出される相関係数のうち最大の相関係数を類似度として算出し、この類似度が所定の閾値以上であるか否かにより、放送音が視聴音として第1マイク信号で観測されるか否かを判定する場合を例示したが、マイク入力の無音パターン信号および放送音の無音パターン信号の比較方法はこれに限定されない。
例えば、マイク入力の無音パターン信号および放送音の無音パターン信号の間で無音区間を形成するフレーム数を比較することもできる。すなわち、マイク入力の無音パターン信号の無音区間のうちフレーム数が最大である第1の最大無音区間のフレーム数と、放送音の無音パターン信号の無音区間のうちフレーム数が最大である第2の最大無音区間のフレーム数とが同数であるか否かを判定する。これら両者が同数である場合、放送音が視聴音として第1マイク信号で観測されると判断することができる。さらに、加重要件を設定することもできる。例えば、第1の最大無音区間のフレーム数および第2の最大無音区間のフレーム数が同数である場合、第1の最大無音区間に先行する所定のフレーム数における2値の配列パターンおよび第1の最大無音区間に後続する所定のフレーム数における2値の配列パターンと、第2の最大無音区間に先行する所定のフレーム数における2値の配列パターンおよび第2の最大無音区間に後続する所定のフレーム数における2値の配列パターンとが一致する場合に始めて放送音が視聴音として第1マイク信号で観測されると判断することもできる。
[抑圧制御処理]
図8は、抑圧制御処理の手順を示すフローチャートである。この処理は、選択部14、第1の抑圧部15A及び第2の抑圧部15Bにより実行される処理である。図8に示すように、視聴音識別部13により視聴音のチャンネルが識別できた場合(ステップS601Yes)、選択部14は、第1の抑圧部15Aおよび第2の抑圧部15Bのうち第1の抑圧部15Aを選択する。
このように第1の抑圧部15Aが選択された場合、第1のマイク11Aに対する視聴音の伝達特性に基づいて放送受信装置20により出力された放送音が第1のマイク11Aへ回り込んだ視聴音、いわゆる回り込み音を抑圧する「第1の抑圧処理」が実行される(ステップS602)。
[抑圧制御処理のサブフロー]
ここで、上記の第1の抑圧処理の詳細について説明する。図9は、第1の抑圧処理の手順を示すフローチャートである。この処理は、図8に示すステップS602の処理に対応する。図9に示すように、第1の抑圧部15Aは、第1マイク信号のサブフレームおよび放送音の信号のサブフレームを取得する(ステップS701)。
続いて、第1の抑圧部15Aは、放送受信部12が受信する放送音を放送受信装置20が出力する放送音のリファレンスとし、放送音が出力されるタイミングに対する回り込み音の遅延を算出する「回り込み音の遅延算出処理」を実行する(ステップS702)。
図10は、回り込み音の遅延量の一例を示す図である。図10の上段には、放送受信部12により受信される放送音の信号のサブフレームに含まれるフレームパワーの時間波形が示されている。これから判別できる通り、放送における本編及びコマーシャルの切り替り時または番組間の切り替り時に挿入される無音が放送音の信号のサブフレームに含まれる場合、切り替り前および切り替り後には、放送音が観測される一方で、切り替り中には、放送音が観測されず、フレームパワーがゼロである無音区間が継続する。
一方で、図10の下段には、第1マイク信号のサブフレームに含まれるフレームパワーの時間波形が示されている。これから判別できる通り、放送における本編及びコマーシャルの切り替り時または番組間の切り替り時に挿入される無音が第1マイク信号のサブフレームに含まれる場合であっても、切り替り前および切り替り後と比較すればフレームパワーが小さいものの、切り替り中にもマイク音が観測される。これは、一側面として、放送受信装置20から出力された放送音の反射音などが遅延して第1のマイク11Aに到来することなどに起因する。
さらに、図10の上段に示すフレームパワーの時間波形と、図10の下段に示すフレームパワーの時間波形とを比較すると、放送音に比べて第1のマイク11Aへの回り込み音が遅延することもわかる。これは、一側面として、放送受信装置20が放送音を出力してから放送音やその反射音が第1のマイク11Aに回り込むまでに時間差が生じることに起因する。このような放送音に対する回り込み音の遅延量がステップS702で算出される。
[第1の抑圧処理のサブフロー]
この回り込み音の遅延算出の詳細について説明する。図11は、回り込み音の遅延算出処理の手順を示すフローチャートである。この処理は、図9に示すステップ702の処理に対応する。
図11に示すように、第1の抑圧部15Aは、第1マイク信号のサブフレームから無音パターンを算出するのと並行して、放送音の信号のサブフレームから無音パターンを算出する(ステップS801及びステップS802)。これらの無音パターンは、一例として、図7に示すフローチャートと同様の手順にしたがって算出することができる。なお、ステップS801及びステップS802の処理は、並行して実行することもできれば、順不同で実行することもできる。
続いて、第1の抑圧部15Aは、ステップS802で算出された放送音の無音パターン信号が特定パターンと一致するか否かを判定する(ステップS803)。図12は、特定パターンの一例を示す図である。図12に示す格子は、フレームを指し、さらに、格子の中に記載された数字は、フレームパワーの閾値判定により付与された2値、すなわち「1」または「0」のいずれかを指す。図12に示す特定パターンは、放送音の無音パターン信号との間でフレームごとに当該フレームに付与された値が照合される。そして、放送音の無音パターン信号および特定パターンの間で全てのフレームの値が同一である場合、放送音の無音パターン信号が特定パターンと一致すると判定される。
ここで、放送音の無音パターン信号が特定パターンと一致する場合(ステップS803Yes)、放送音のサブフレームには、放送における本編及びコマーシャルの切り替り、あるいは番組間の切り替りに対応する場面が含まれていると判断できる。
この場合、第1の抑圧部15Aは、放送音の信号に関するフレームパワーの時間波形および第1マイク信号に関するフレームパワーの時間波形の相関を取ることにより、回り込み音の遅延フレーム数を算出する(ステップS804)。なお、放送音の無音パターン信号が特定パターンと一致しない場合(ステップS803No)、ステップS804はスキップされる。
例えば、第1の抑圧部15Aは、放送音の信号に関するフレームパワーの時間波形に対し、第1マイク信号に関するフレームパワーの時間波形をフレーム単位でスライドさせながら、放送音の信号に関するフレームパワーの時間波形に対する第1マイク信号に関するフレームパワーの時間波形のスライド幅ごとに2つの時間波形の相関係数を算出する。このような相関係数は、上記の式(2)にしたがって算出することができる。
この場合、上記の式(2)における「corr(j)」は、第1マイク信号に関するフレームパワーの時間波形と放送音の信号に関するフレームパワーの時間波形の相関係数を指し、さらに、当該相関係数は、放送音の信号に関するフレームパワーの時間波形に対し、jサンプル分に対応するフレーム数にわたって第1マイク信号に関するフレームパワーの時間波形がスライドされた場合の相関係数に対応する。また、上記の式(2)における「mi+j」は、第1マイク信号のフレームパワーのうちi+j番目のサンプルのフレームパワーに対応する。また、上記の式(2)における「bi」は、放送音の信号のフレームパワーのうちi番目のサンプルのフレームパワーに対応する。
その上で、第1の抑圧部15Aは、最大値の相関係数max(corr(j))が観測されるスライド幅jを抽出する。このように抽出されたスライド幅jが回り込み音の遅延フレーム数Mとして算出される。
[第1の抑圧処理のメインフローへの復帰]
図9のステップS703の説明に戻り、第1の抑圧部15Aは、第1のマイク11Aに対する視聴音の伝達特性を更新する(ステップS703)。
例えば、第1の抑圧部15Aは、現フレーム、すなわち最新のフレームから遅延フレーム数Mを遡ったMフレーム前の放送音のフレームパワーを周波数領域へ変換する。この周波数領域への変換には、あくまで一例として、フーリエ変換や高速フーリエ変換などを適用することができる。このような周波数領域への変換を通じて、Mフレーム前の放送音のスペクトルが得られる。これと並行して、第1の抑圧部15Aは、最新のフレームのマイク入力音のフレームパワーを周波数領域へ変換する。これにより、現フレームのマイク入力音のスペクトルが得られる。
これらMフレーム前の放送音のスペクトル及び現フレームのマイク入力のスペクトルに基づいて、第1の抑圧部15Aは、回り込み音の伝達特性を更新する。例えば、下記の式(3)にしたがって現フレームにおける伝達特性の実部を算出すると共に、下記の式(4)にしたがって現フレームにおける伝達特性の虚部を算出する。
Hcur_im(t,k)=(Mre(t,k)Sre(t,k)+Mim(t,k)Sim(t,k))/(Sre(t,k)2+Sim(t,k)2)・・・(3)
Hcur_re(t,k)=(Mim(t,k)Sre(t,k)-Mre(t,k)Sim(t,k))/(Sre(t,k)2+Sim(t,k)2)・・・(4)
ここで、上記の式(3)及び上記の式(4)における「Sre(t,k)」は、Mフレーム前の放送音のスペクトルの実部を指し、また、「Sim(t,k)」は、Mフレーム前の放送音のスペクトルの虚部を指す。また、上記の式(3)及び上記の式(4)における「Mre(t,k)」は、現フレームにおけるマイク入力音のスペクトルの実部を指し、また、「Mim(t,k)」は、現フレームにおけるマイク入力音のスペクトルの虚部を指す。また、「k」は、周波数のインデックスを指す。
これら式(3)及び(4)により算出された現フレームにおける伝達特性の実部及び虚部を下記の式(5)及び下記の式(6)へさらに代入することにより、第1の抑圧部15Aは、第1のマイク11Aに対する視聴音の伝達特性を更新する。なお、下記の式(5)における「H_re(t,k)」は、第1のマイク11Aに対する視聴音の伝達特性の実部の更新結果を指し、また、下記の式(6)における「H_im(t,k)」は、第1のマイク11Aに対する視聴音の伝達特性の虚部の更新結果を指す。また、下記の式(5)における「H_re(t-1,k)」は、1フレーム前の伝達特性の実部の更新結果を指し、また、下記の式(6)における「H_im(t-1,k)」は、1フレーム前の伝達特性の虚部の更新結果を指す。また、下記の式(5)及び下記の式(6)における「α」は、伝達特性の更新係数を指し、例えば、0.99が用いられる。
H_re(t,k)=(1-α)Hcur_re(t,k)+αH_re(t-1,k)・・・(5)
H_im(t,k)=(1-α)Hcur_im(t,k)+αH_im(t-1,k)・・・(6)
このように伝達特性が更新された後、第1の抑圧部15Aは、更新後の伝達特性にしたがってMフレーム前の放送音のスペクトルから第1のマイク11Aへの回り込み音を推定する(ステップS704)。例えば、第1の抑圧部15Aは、下記の式(7)及び下記の式(8)にしたがって回り込み音のスペクトルの実部および虚部を推定できる。なお、下記の式(7)における「D_re(t,k)」は、回り込み音のスペクトルの実部を指す。また、下記の式(8)における「D_im(t,k)」は、回り込み音のスペクトルの虚部を指す。
D_re(t,k)=S_re(t,k)H_re(t,k)-S_im(t,k)H_im(t,k)・・・(7)
D_im(t,k)=S_im(t,k)H_re(t,k)+S_re(t,k)H_im(t,k)・・・(8)
その後、第1の抑圧部15Aは、一例として、回り込み音のスペクトルから定まる抑圧係数を現フレームにおけるマイク入力音のスペクトルに乗じることにより、第1マイク信号に含まれる回り込み音を抑圧し(ステップS705)、抑圧後の第1マイク信号を異常検知部16へ出力し(ステップS706)、処理を終了する。
例えば、第1の抑圧部15Aは、下記の式(9)にしたがって抑圧係数を算出する。下記の式(9)における「Sup(t,k)」は、現フレームおよびk番目のインデックスの周波数の抑圧係数を指し、例えば、0から1までの値が導出される。
Sup(t,k)=(D_re(t,k)*D_re(t,k)+D_im(t,k)*D_im(t,k))
/(M_re(t,k)*M_re(t,k)+M_im(t,k)*M_im(t,k))・・・(9)
そして、第1の抑圧部15Aは、下記の式(10)及び下記の式(11)にしたがって抑圧係数により回り込み音が抑圧されたマイク入力音のスペクトルの実部および虚部を算出する。下記の式(10)における「Ore(t,k)」は、回り込み音が抑圧されたマイク入力音のスペクトルの実部を指す。また、下記の式(11)における「Oim(t,k)」は、回り込み音が抑圧されたマイク入力音のスペクトルの虚部を指す。
Ore(t,k)=Sup(t,k)*M_re(t,k)・・・(10)
Oim(t,k)=Sup(t,k)*M_im(t,k)・・・(11)
その上で、第1の抑圧部15Aは、回り込み音が抑圧されたマイク入力音のスペクトルを時間領域へ変換する。この時間領域への変換には、あくまで一例として、逆フーリエ変換や逆高速フーリエ変換などを適用できる。このような時間領域への変換を通じて、回り込み音の抑圧後の第1マイク信号の時間波形を得ることができる。
[抑圧制御処理のメインフローへの復帰]
図8のステップS601の分岐の説明に戻り、視聴音識別部13により視聴音のチャンネルが識別できなかった場合(ステップS601No)、選択部14は、第1マイク信号のサブフレームのパワーを算出する(ステップS603)。このサブフレームのパワーを算出する場合にも、上記の式(1)にしたがってサブフレームのパワーを算出することができる。この場合、上記の式(1)においてフレームと記載の部分をサブフレームに置き換えることにより、サブフレームのパワーを算出できる。
そして、第1マイク信号のサブフレームのパワーが所定の閾値未満である場合(ステップS604No)、録画などのように、リアルタイムで放送中の番組以外が視聴されている可能性が低いと判断できる。この場合、選択部14は、第1の抑圧部15Aおよび第2の抑圧部15Bのいずれも選択しない。よって、第1マイク信号には、視聴音の抑圧が実施されず、第1マイク信号がそのまま異常検知部16へ出力される(ステップS605)。
一方、第1マイク信号のサブフレームのパワーが所定の閾値以上である場合(ステップS604Yes)、録画などのように、リアルタイムで放送中の番組以外が視聴されている可能性が高いと判断できる。この場合、選択部14は、第1の抑圧部15Aおよび第2の抑圧部15Bのうち第2の抑圧部15Bを選択する。
このように第2の抑圧部15Bが選択された場合、第2の抑圧部15Bは、第1のマイク11A及び第2のマイク11Bに視聴音が到来する時間差、いわゆる位相差に基づいて、視聴音の到来方向を算出する(ステップS606)。
ここで、第1のマイク11A及び第2のマイク11Bに視聴音が到来する時間差tは、第1マイク信号および第2マイク信号の相関を取ることにより、最大値の相関係数が算出されるスライド幅を時間差tとして算出することができる。
図13は、視聴音の到来方向と視聴音の音源から各マイクまでの距離差との関係を示す図である。図13に示すように、第1のマイク11A及び第2のマイク11Bを結ぶ直線と直交する方向を0度として視聴音の到来方向θを表すとき、視聴音の音源から第1マイク信号までの距離と、視聴音の音源から第1マイク信号までの距離との距離差は、d×sinθで表すことができる。このため、視聴音の到来方向θは、下記の式(12)により導出することができる。
θ=sin−1(tc/d)・・・(12)
その後、第2の抑圧部15Bは、第1マイク信号に対し、第2マイク信号を時間差tにわたって進める方向でスライドさせた上で、第1マイク信号から時間差tの分進める方向にスライドさせた第2マイク信号を減算することにより、第1マイク信号に含まれる視聴音を抑圧する第2の抑圧処理を実行し(ステップS607)、処理を終了する。
なお、ここでは、第1マイク信号から第2マイク信号を減算することにより視聴音を抑圧する例を説明したが、他の方法により視聴音を抑圧することとしてもかまわない。例えば、視聴音の到来方向θに第1のマイク11A及び第2のマイク11Bの死角を向けて抑圧した処理音を出力することとしてもかまわない。また、ステップS703で更新された第1のマイク11Aに対する視聴音の伝達特性から視聴音の到来方向θを算出して保存しておくこともできる。これにより、第2の抑圧処理を行う場合に当該視聴音の到来方向θを用いることとしてもかまわない。
[効果の一側面]
上述してきたように、本実施例に係る見守り端末10は、放送音固有の特徴を用いて、放送音の信号とマイクの信号との比較時に両者の無音パターンが一致するか否かにより、マイクの信号に含まれる視聴音のチャンネルを識別して視聴音を抑圧する。したがって、本実施例に係る見守り端末10によれば、視聴音の識別精度を向上させることができる。
さて、これまで開示の装置に関する実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。そこで、以下では、本発明に含まれる他の実施例を説明する。
[分散および統合]
また、図示した各装置の各構成要素は、必ずしも物理的に図示の如く構成されておらずともよい。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、視聴音識別部13、選択部14、第1の抑圧部15A、第2の抑圧部15Bおよび異常検知部16の一部または全部を見守り端末10の外部装置としてネットワーク経由で接続するようにしてもよい。また、視聴音識別部13、選択部14、第1の抑圧部15A、第2の抑圧部15Bおよび異常検知部16の一部または全部を別の装置がそれぞれ有し、ネットワーク接続されて協働することで、上記の見守り端末10の機能を実現するようにしてもよい。
[異常検知プログラム]
また、上記の実施例で説明した各種の処理は、予め用意されたプログラムをパーソナルコンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。そこで、以下では、図14を用いて、上記の実施例と同様の機能を有する異常検知プログラムを実行するコンピュータの一例について説明する。
図14は、実施例1及び実施例2に係る異常検知プログラムを実行するコンピュータのハードウェア構成例を示す図である。図14に示すように、コンピュータ100は、第1のマイク110aと、第2のマイク110bと、チューナー110cと、ディスプレイ120と、通信部130とを有する。さらに、このコンピュータ100は、CPU150と、ROM160と、HDD170と、RAM180とを有する。これら110〜180の各部はバス140を介して接続される。
HDD170には、図14に示すように、上記の実施例1で示した視聴音識別部13、選択部14、第1の抑圧部15A、第2の抑圧部15Bおよび異常検知部16と同様の機能を発揮する異常検知プログラム170aが記憶される。この異常検知プログラム170aは、図2に示した視聴音識別部13、選択部14、第1の抑圧部15A、第2の抑圧部15Bおよび異常検知部16の各構成要素と同様、統合又は分離してもかまわない。すなわち、HDD170には、必ずしも上記の実施例1で示した全てのデータが格納されずともよく、処理に用いるデータがHDD170に格納されればよい。
このような環境の下、CPU150は、HDD170から異常検知プログラム170aを読み出した上でRAM180へ展開する。この結果、異常検知プログラム170aは、図14に示すように、異常検知プロセス180aとして機能する。この異常検知プロセス180aは、RAM180が有する記憶領域のうち異常検知プロセス180aに割り当てられた領域にHDD170から読み出した各種データを展開し、この展開した各種データを用いて各種の処理を実行する。例えば、異常検知プロセス180aが実行する処理の一例として、図3〜図9や図11に示す処理などが含まれる。なお、CPU150では、必ずしも上記の実施例1で示した全ての処理部が動作せずともよく、実行対象とする処理に対応する処理部が仮想的に実現されればよい。
なお、上記の異常検知プログラム170aは、必ずしも最初からHDD170やROM160に記憶されておらずともかまわない。例えば、コンピュータ100に挿入されるフレキシブルディスク、いわゆるFD、CD−ROM、DVDディスク、光磁気ディスク、ICカードなどの「可搬用の物理媒体」に異常検知プログラム170aを記憶させる。そして、コンピュータ100がこれらの可搬用の物理媒体から異常検知プログラム170aを取得して実行するようにしてもよい。また、公衆回線、インターネット、LAN、WANなどを介してコンピュータ100に接続される他のコンピュータまたはサーバ装置などに異常検知プログラム170aを記憶させておき、コンピュータ100がこれらから異常検知プログラム170aを取得して実行するようにしてもよい。
1 リモートケアシステム
3 居住者宅
3A 居住者
10 見守り端末
11A 第1のマイク
11B 第2のマイク
12 放送受信部
13 視聴音識別部
14 選択部
15A 第1の抑圧部
15B 第2の抑圧部
16 異常検知部
20 放送受信装置
30 関係者端末

Claims (4)

  1. 複数のチャンネルごとに取得される放送音の信号における無音区間と、マイクから取得される信号における無音区間との類似度に基づいて、前記放送音が視聴音として前記マイクに回り込むチャンネルを識別する視聴音識別部と、
    前記視聴音識別部により識別されたチャンネルの放送音に基づいて、前記マイクから取得される信号から前記視聴音を抑圧する抑圧部と、
    前記視聴音の抑圧後の前記マイクの信号から異常音を検知する異常検知部と、
    を有することを特徴とする電子機器。
  2. 前記抑圧部は、前記マイクに対する前記視聴音の伝達特性に基づいて、前記視聴音識別部により識別されたチャンネルの放送音が前記マイクへ回り込む前記視聴音を推定することにより、前記マイクから取得される信号から前記視聴音を抑圧することを特徴とする請求項1に記載の電子機器。
  3. 前記視聴音識別部は、前記類似度として相関係数を算出することを特徴とする請求項1または2に記載の電子機器。
  4. 複数のチャンネルごとに取得される放送音の信号における無音区間と、マイクから取得される信号における無音区間との類似度に基づいて、前記放送音が視聴音として前記マイクに回り込むチャンネルを識別し、
    識別されたチャンネルの放送音に基づいて、前記マイクから取得される信号から前記視聴音を抑圧し、
    前記視聴音の抑圧後の前記マイクの信号から異常音を検知する、
    処理をコンピュータに実行させることを特徴とする異常検知プログラム。
JP2017082344A 2017-04-18 2017-04-18 電子機器及び異常検知プログラム Pending JP2018181122A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017082344A JP2018181122A (ja) 2017-04-18 2017-04-18 電子機器及び異常検知プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017082344A JP2018181122A (ja) 2017-04-18 2017-04-18 電子機器及び異常検知プログラム

Publications (1)

Publication Number Publication Date
JP2018181122A true JP2018181122A (ja) 2018-11-15

Family

ID=64276875

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017082344A Pending JP2018181122A (ja) 2017-04-18 2017-04-18 電子機器及び異常検知プログラム

Country Status (1)

Country Link
JP (1) JP2018181122A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022149749A (ja) * 2021-03-25 2022-10-07 カシオ計算機株式会社 情報処理方法、情報処理システムおよびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022149749A (ja) * 2021-03-25 2022-10-07 カシオ計算機株式会社 情報処理方法、情報処理システムおよびプログラム
JP7322916B2 (ja) 2021-03-25 2023-08-08 カシオ計算機株式会社 情報処理方法、情報処理システムおよびプログラム

Similar Documents

Publication Publication Date Title
KR102114766B1 (ko) 에코 지연을 추적하는 방법 및 장치
US10348939B2 (en) Detection of the presence of television signals embedded in noise using cyclostationary toolbox
EP2285178B1 (en) Cognitive wireless system, cognitive wireless device, and wireless signal detection method
CN103141067B (zh) 频带识别方法、装置
US10359502B2 (en) Radio wave intensity distribution assessment apparatus, radio wave quality distribution assessment apparatus, radio wave intensity distribution assessment method and radio wave quality distribution assessment method
KR20090008412A (ko) 신호 검출 방법, 무선 수신기, 이동 단말기 및 컴퓨터 프로그램 배포 매체
EP2710841B1 (en) Distributed blind source separation
US10984812B2 (en) Audio signal discriminator and coder
JP2007248110A (ja) 電波監視装置及び方法
US20140315590A1 (en) Information processing apparatus, wireless communication apparatus, and information processing method
JP2018181122A (ja) 電子機器及び異常検知プログラム
CN102869091B (zh) 一种确定定位参考信号到达时间的方法及装置
JP5483506B2 (ja) 情報分類システム
CN111081269A (zh) 通话过程中的噪声检测方法及系统
CN110265061B (zh) 对通话语音进行实时翻译的方法及设备
WO2017147852A1 (en) Base station selection in ultra dense network handover scenarios
CN108495365B (zh) 基于窄带物联网时延估计的终端定位方法
US20210144556A1 (en) Networking behavior detector and networking behavior detection method thereof for indoor space
KR101347885B1 (ko) 무선 인지 장치 및 무선 인지 방법
JP2010288081A (ja) 移動端末、通信システムおよび通信方法
JP6221405B2 (ja) 移動体端末、速度推定方法、速度推定プログラム
CN114500198B (zh) 干扰消除方法、装置、电子设备及存储介质
CN110881200B (zh) 一种基于非正交多址的信号传输方法、系统及电子设备
Suratman et al. Locally optimum detection in heavy-tailed noise for spectrum sensing in cognitive radio
JP6430278B2 (ja) 信号検出判定システム、無線通信システム、信号検出判定方法、及びコンピュータプログラム