JP2017050649A - 映像音声再生装置、映像音声再生方法、及びプログラム - Google Patents

映像音声再生装置、映像音声再生方法、及びプログラム Download PDF

Info

Publication number
JP2017050649A
JP2017050649A JP2015171263A JP2015171263A JP2017050649A JP 2017050649 A JP2017050649 A JP 2017050649A JP 2015171263 A JP2015171263 A JP 2015171263A JP 2015171263 A JP2015171263 A JP 2015171263A JP 2017050649 A JP2017050649 A JP 2017050649A
Authority
JP
Japan
Prior art keywords
video
unit
group
arrival
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015171263A
Other languages
English (en)
Other versions
JP6507946B2 (ja
Inventor
猛 大谷
Takeshi Otani
猛 大谷
福岡 俊之
Toshiyuki Fukuoka
俊之 福岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015171263A priority Critical patent/JP6507946B2/ja
Priority to US15/237,075 priority patent/US9812153B2/en
Publication of JP2017050649A publication Critical patent/JP2017050649A/ja
Application granted granted Critical
Publication of JP6507946B2 publication Critical patent/JP6507946B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/57Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for processing of video signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/93Regeneration of the television signal or of selected parts thereof
    • H04N5/9305Regeneration of the television signal or of selected parts thereof involving the mixing of the reproduced video signal with a non-recorded signal, e.g. a text signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8211Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being a sound signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/02Casings; Cabinets ; Supports therefor; Mountings therein
    • H04R1/028Casings; Cabinets ; Supports therefor; Mountings therein associated with devices performing functions other than acoustics, e.g. electric candles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/326Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Studio Devices (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

【課題】再生中の映像の撮像範囲内における複数箇所から到来する音の確認作業の効率化を可能にする。【解決手段】映像音声再生装置7Aは、グループ設定部703と、再生部707と、を備える。グループ設定部703は、撮像装置2の撮像範囲内の複数箇所のそれぞれを到来方向とする複数の音響信号を取得し、到来方向が隣接する音響信号同士の特徴量の類似度に基づいて、特徴量の類似度が高い音響信号の到来方向を1つのグループにするグループ化を行う。再生部707は、撮像装置の撮像範囲内におけるグループの位置を示す情報を撮像装置2で撮像した映像に付加して再生する。【選択図】図2

Description

本発明は、映像音声再生装置、映像音声再生方法、及びプログラムに関する。
撮像装置で撮像した映像及び収音装置で収音した音声を再生する映像音声再生装置に関する技術として、再生中の映像における注目領域からの音声を選択的に再生する技術が知られている(例えば、特許文献1を参照)。
また、目的音の方向を推定する技術として、複数の音響信号の相関行列と雑音信号の相関行列とに基づいて算出した空間スペクトルを用いて音源の方向を推定する技術が知られている(例えば、特許文献2を参照)。
また、特定の種類の音源の方向を推定する技術として、音響特徴量と対応付けた音源の種類の尤度に基づいて音響信号の音源の種類を同定し、同定した種類の音源の音響信号について音源方向を推定する技術が知られている(例えば、特許文献3を参照)。
更に、映像を再生するホスト装置とは別に設けた信号処理装置により音声信号の音像定位処理等を行うことで、ホスト装置のCentral Processing Unit(CPU)の負担を軽くする技術が知られている(例えば、特許文献4を参照)。
特開2011−071685号公報 特開2014−056181号公報 特開2012−042465号公報 特開2003−244797号公報
工場のような動力設備等の各種設備を配した施設では、設備の異常を早期に発見することが重要である。そのため、工場等の保守点検業務では、設備の異常音を早期に検出し、異常音の発生源を早期に特定することが重要になっている。
また、工場の保守点検業務は、近年、情報通信技術(ICT:Information and Communication Technology)を用いた業務の効率化、例えばタブレット型コンピュータ等の携帯型端末を活用した業務の効率化が進められている。情報通信技術を用いた業務の効率化では、上述した特許文献1の技術を用いることで、撮像装置で撮像した映像の再生中に映像(画面)内で選択した箇所(注目領域)と対応する方向から到来する音を選択的に再生することができる。
しかしながら、上述の技術では、画面内における複数箇所の音を再生する場合、一箇所毎に選択し再生する必要がある。そのため、保守点検業務において撮像範囲内の複数箇所で異常音の有無を確認する場合、確認作業に手間がかかる。
1つの側面において、本発明は、再生中の映像の撮像範囲内における複数箇所から到来する音の確認作業の効率化を可能にすることを目的とする。
1つの態様の映像音声再生装置は、グループ設定部と、再生部と、を備える。グループ設定部は、撮像装置の撮像範囲内の複数箇所のそれぞれを到来方向とする複数の音響信号を取得し、到来方向が隣接する音響信号同士の特徴量の類似度に基づいて、前記特徴量の類似度が高い音響信号の到来方向を1つのグループにするグループ化を行う。再生部は、撮像装置の撮像範囲内におけるグループの位置を示す情報を撮像装置で撮像した映像に付加して再生する。
上述の態様によれば、再生中の映像の撮像範囲内における複数箇所から到来する音の確認作業の効率化が可能になる。
第1の実施形態に係る点検システムの構成例を示す図である。 第1の実施形態に係る点検システムで用いる点検用端末の機能的構成を示すブロック図である。 点検用端末の表示装置に表示される映像の例を示す図である。 センサ位置情報の例を示す図である。 第1の実施形態に係る映像音声再生装置が行う再生処理の内容を示すフローチャートである。 第1の実施形態に係る再生処理におけるグループ検出処理の内容を示すフローチャートである。 第1の実施形態に係る再生処理における状態判別処理の内容を示すフローチャートである。 第1の実施形態に係る再生処理の処理結果の一例を示す図である。 第1の実施形態に係る再生処理における映像音声出力処理の内容を示すフローチャートである。 第2の実施形態に係る点検システムの構成例を示す図である。 第2の実施形態に係る点検システムで用いる点検用端末の機能的構成を示すブロック図である。 到来音生成部で生成する到来音の到来方向の設定方法を説明する図である。 第2の実施形態に係る映像音声再生装置が行う再生処理の内容を示すフローチャートである。 第2の実施形態に係る再生処理におけるグループ検出処理の内容を示すフローチャートである。 第2の実施形態に係る再生処理における状態判別処理の内容を示すフローチャートである。 第3の実施形態に係る監視システムの構成例を示す図である。 第3の実施形態に係る監視システムで用いる映像音声再生装置の機能的構成を示すブロック図である。 第3の実施形態に係る監視システムで用いる制御装置の機能的構成を示すブロック図である。 第3の実施形態に係る映像音声再生装置が行う再生処理の内容を示すフローチャートである。 第3の実施形態に係る制御装置が映像音声再生装置と協働して行う処理の内容を示すフローチャートである。 コンピュータのハードウェア構成を示す図である。
[第1の実施形態]
図1は、第1の実施形態に係る点検システムの構成例を示す図である。
図1に示すように、本実施形態に係る点検システム1Aは、撮像装置2と、複数のセンサ3(301,302,310)と、中継器4と、点検用端末5と、を備える。
撮像装置2は、点検対象の設備6(601,602)の映像を撮像する装置である。
複数のセンサ3は、それぞれ、音響信号を収音する収音装置(マイクロフォン)を含むセンサである。本実施形態では、センサ3として、音響信号を収音する収音装置及び振動を検出する振動センサを含む複合センサを用いる。センサ3は、点検対象の設備において音が発生する箇所(例えば動力部や可動部等)の近傍に設置する。以下、センサ3を複合センサともいう。
中継器4は、撮像装置2で撮像した映像、及び各複合センサ3の出力信号(音響信号及び振動信号)を取得し、点検用端末5に転送する装置である。点検用端末5は、中継器4を介して取得した映像及び音響信号を再生する装置である。中継器4と点検用端末5とは、例えば、Institute of Electrical and Electronic Engineers(IEEE)で標準化されている無線通信規格に従った無線通信により通信可能に接続される。
図2は、第1の実施形態に係る点検システムで用いる点検用端末の機能的構成を示すブロック図である。
本実施形態に係る点検用端末5は、図2に示すように、映像音声再生装置7Aと、表示装置8と、スピーカ9と、入力装置10と、を備える。
映像音声再生装置7Aは、通信部701と、相関値算出部702と、グループ設定部703と、音響特徴量算出部704と、振動特徴量算出部705と、状態判別部706と、再生部707と、記憶部708と、入力受付部709と、を備える。
通信部701は、中継器4の通信部401との間で無線通信を行い、撮像装置2で撮像した映像、及び各複合センサ301,302,310の出力信号(音響信号及び振動信号)、並びにセンサ位置情報を取得する。センサ位置情報は、例えば、中継器4の記憶部402に格納されている。通信部701は、取得した映像を再生部707に出力する。また、通信部701は、取得した音響信号を相関値算出部702及び音響特徴量算出部704に出力する。また、通信部701は、取得した振動信号を振動特徴量算出部705に出力する。更に、通信部701は、センサ位置情報を相関値算出部702に出力するとともに、記憶部708に記憶させる。
相関値算出部702は、入力された音響信号及びセンサ位置情報に基づいて、隣接関係にある収音装置(複合センサ3)から取得した音響信号同士の相関値を算出する。グループ設定部703は、算出した音響信号同士の相関値と予め定めた相関閾値とを比較して、音響信号同士の相関の有無を判定する。また、グループ設定部703は、音響信号同士の相関の有無の判定結果に基づいて、相関のある音響信号の到来方向の組を1つのグループに設定するグループ化を行う。グループ設定部703は、設定したグループに関する情報を再生部707に出力する。
音響特徴量算出部704は、入力された音響信号を分析して所定の音響特徴量を算出する。振動特徴量算出部705は、入力された振動信号を分析して振動特徴量を算出する。状態判別部706は、算出した音響特徴量及び振動特徴量に基づいて、各複合センサの出力信号が正常時の信号であるか否かを判別する。状態判別部706は、判別結果を再生部707に出力する。
再生部707は、状態判別部706の判別結果に基づき、正常ではない音響信号又は振動信号を出力した複合センサ3がある場合には、映像上(表示装置の画面上)における当該複合センサの設置位置を示す情報を映像とともに表示装置8に出力する。また、正常ではない音響信号又は振動信号を出力した複合センサがある場合、再生部707は、グループ設定部703で設定したグループのうち、正常ではない信号を出力した複合センサを含むグループを示す情報を映像とともに表示装置8に出力する。なお、全ての複合センサにおける音響信号及び振動信号が正常である場合、再生部707は、入力された映像のみを表示装置8に出力する。
更に、再生部707は、オペレータが入力装置10を操作して指定した映像上の点と対応する方向から到来する音響信号を選択してスピーカ9に出力する。オペレータが入力装置10を操作すると、操作内容に応じた入力信号が入力装置10から映像音声再生装置7Aの入力受付部709に入力される。入力受付部709は、入力信号が音響信号の再生に関する信号である場合、入力信号を再生部707に出力する。
図3Aは、点検用端末の表示装置に表示される映像の例を示す図である。図3Bは、センサ位置情報の例を示す図である。
点検用端末5の表示装置8には、撮像装置2で撮像した映像が表示される。図1に示した点検システム1Aの場合、図3Aに示すように、表示装置8には2台の設備601,602を配した領域の映像が表示される。表示装置8に表示される設備601,602には、収音装置を含む複合センサ3が取り付けられている。1台の設備に取り付けられる複合センサ3の数は、設備602のように1個である場合もあるし、設備601のように複数個の場合もある。設備601は、第1の部位601A、第2の部位601B、及び第3の部位601Cを有し、例えば、第1の部位601Aにおいて所定の処理を行った工作物が、第3の部位601Cを通して第2の部位601Bに搬送されるようになっている。設備601の第1の部位601Aには、3個の複合センサ(収音装置301A〜303A)が取り付けられている。又、第2の部位601B及び第3の部位601Cには、それぞれ1個の複合センサ(収音装置304A,305A)が取り付けられている。
本実施形態におけるセンサ位置情報は、例えば、図3Bに示すように、映像上(表示装置の画面上)における複合センサの位置を示す二次元の座標値と、複合センサが設置された設備を識別する識別子(センサID)とを含む。複合センサの位置を示す座標値は、映像を撮像する撮像装置と設備との位置関係、撮像装置の光軸の方向及び視野角(撮像範囲)、並びに設備内における複合センサの位置から算出することができる。
図4は、第1の実施形態に係る映像音声再生装置が行う再生処理の内容を示すフローチャートである。
本実施形態の点検システムでは、例えば、オペレータが点検用端末5の入力装置10を操作し点検用端末5と中継器4とが通信可能に接続されると、点検用端末5の映像音声再生装置7Aが図4に示したような再生処理を行う。
映像音声再生装置7Aは、まず、映像信号、音響信号、及び振動信号の取得を開始するとともに、センサ位置情報を取得する(ステップS100)。ステップS100の処理は、通信部701が行う。
次に、映像音声再生装置7Aは、グループ検出処理(ステップS101)及び状態判別処理(ステップS102)を行う。ステップS101のグループ検出処理は、相関値算出部702及びグループ設定部703が行う。相関値算出部702は、各複合センサからの音響信号とセンサ位置情報とに基づいて、隣接する複合センサ(収音装置)の音響信号同士の相関値を算出する。グループ設定部703は、相関値算出部702で算出した音響信号同士の相関値が所定の相関閾値よりも高いか否かを判定し、音響信号同士の相関(類似度)が高い複合センサを1つのグループに設定するグループ化を行う。
一方、ステップS102の状態判別処理は、音響特徴量算出部704、振動特徴量算出部705、及び状態判別部706が行う。音響特徴量算出部704は、各複合センサからの音響信号における特徴量を算出する。振動特徴量算出部705は、各複合センサからの振動信号における特徴量を算出する。状態判別部706は、複合センサ毎に、音響信号の特徴量及び振動信号の特徴量に基づいて音響信号が正常であるか否かを判別する。なお、本実施形態では、状態判別部706は、各複合センサについての判別結果を状態フラグの値で示し、正常である場合の状態フラグの値を0、正常ではない場合(異常がある場合)の状態フラグの値を1とする。
グループ検出処理及び状態判別処理を終えると、映像音声再生装置7Aは、次に、状態フラグが1の音響信号を含むグループがあるか否かを判別する(ステップS103)。ステップS103の判定は、再生部707が行う。状態フラグが1の音響信号を含むグループがある場合(ステップS103;Yes)、再生部707は、映像上(画面上)に、状態フラグが1の音響信号を含むグループを示す情報を付加する(ステップS104)。その後、再生部707は、音響信号の再生を指示する信号が入力されたか否かをチェックする(ステップS105)。一方、状態フラグが1の音響信号を含むグループがない場合(ステップS103;No)、再生部707は、ステップS104の処理をスキップし、ステップS105のチェックを行う。
ステップS105において音響信号の再生を指示する信号が入力されていないと判定した場合(ステップS105;No)、再生部707は、映像信号のみを再生して表示装置8に出力する(ステップS106)。一方、ステップS105において音響信号の再生を指示する信号が入力されたと判定した場合(ステップS105;Yes)、再生部707は、映像音声出力処理(ステップS107)を行う。ステップS107において、再生部707は、入力された信号に従って音響信号を選択し、映像信号を表示装置8に出力するとともに、選択した音響信号をスピーカ9に出力する。
再生部707が映像信号、又は映像信号及び音響信号を出力すると、映像音声再生装置7Aは、次に、ステップS101〜S107の処理を続けるか否かを判断する(ステップS108)。処理を続ける場合(ステップS108;Yes)、映像音声再生装置7Aは、次の処理単位期間の音響信号についてのステップS101〜S107の処理を行う。一方、処理を終了する場合(ステップS108;No)、図4のフローチャートでは省略しているが、映像音声再生装置7Aは、映像信号、音響信号、及び振動信号の取得を終了し、再生処理を終了する。
図5は、第1の実施形態に係る再生処理におけるグループ検出処理の内容を示すフローチャートである。
図4に示したフローチャートのグループ検出処理(ステップS101)は、上記のように相関値算出部702及びグループ設定部703が行う。相関値算出部702及びグループ設定部703は、グループ検出処理として、図5に示したような処理を行う。
まず、相関値算出部702が、映像の画面内における収音装置の位置を特定する(ステップS101A)。相関値算出部702は、センサ位置情報に基づいて、複合センサの収音装置の位置を特定する。
相関値算出部702は、次に、隣接する収音装置の音響信号同士の相関値を算出する(ステップS101B)。相関値算出部702は、センサ位置情報に基づいて、同一設備内において隣接する収音装置の組についての音響信号同士の相関値を順次算出する。音響信号同士の相関値は、例えば、各収音装置が収音した音響信号のパワーを算出し、隣接する収音装置の組についてのパワー同士の時間領域での相関値を算出して求める。時間領域での相関値は、例えば、2つの時間領域の音響信号についての類似度又は相互相関係数の算出に用いる既知の関数のいずれかにより算出する。全ての収音装置の組についての相関値を算出すると、相関値算出部702は、算出した相関値と収音装置の組とを対応付けてグループ設定部703に出力する。
グループ設定部703は、入力された相関値のそれぞれを予め定めた相関閾値と比較し、音響信号同士の相関が高い収音装置の組があるか否かを判定する(ステップS101C)。音響信号同士の相関が高い収音装置の組がある場合(ステップS101C;Yes)、グループ設定部703は、相関が高い収音装置の組を1つのグループに設定するグループ化を行う(ステップS101D)。ステップS101Dにおいて、グループ設定部703は、1組の収音装置のうち一方の収音装置が既に1つのグループに含まれる場合、他方の収音装置を当該グループに追加する。一方、音響信号同士の相関が高い収音装置の組がない場合(ステップS101C;No)、グループ設定部703は、ステップS101Dの処理をスキップする。
グループ設定部703がステップS101C,S101Dの処理を終え、処理結果を再生部707に出力すると、現在の処理単位期間の音響信号についてのグループ検出処理が終了する。
図6は、第1の実施形態に係る再生処理における状態判別処理の内容を示すフローチャートである。
図4に示したフローチャートの状態判別処理(ステップS102)は、上記のように音響特徴量算出部704、振動特徴量算出部705、及び状態判別部706が行う。音響特徴量算出部704、振動特徴量算出部705、及び状態判別部706は、状態判別処理として、図6に示したような処理を行う。
まず、音響特徴量算出部704が各音響信号の音響特徴量を算出し(ステップS102A)、振動特徴量算出部705が各振動信号の振動特徴量を算出する(ステップS102B)。音響特徴量算出部704は、算出した音響特徴量を状態判別部706に出力する。又、振動特徴量算出部705は、算出した振動特徴量を状態判別部706に出力する。
ここで、音響特徴量は、現在の処理対象期間における音響信号を特徴付けることができ、かつ設備が正常に動作しているときと異常が生じたときとを判別することが可能な特徴量であればよい。同様に、振動特徴量は、現在の処理対象期間における振動信号を特徴付けることができ、かつ設備が正常に動作しているときと異常が生じたときとを判別することが可能な特徴量であればよい。
音響特徴量及び振動特徴量が入力されると、状態判別部706は、ステップS102C〜S102Fの処理を行う。状態判別部706は、まず、状態未判定の音響信号を1つ選択する(ステップS102C)。
次に、状態判別部706は、選択した音響信号についての音響特徴量及び振動特徴量が正常な範囲であるか否かを判定する(ステップS102D)。ステップS102Dにおいて、状態判別部706は、選択した音響信号の音響特徴量及び振動特徴量と、予め用意した正常時の音響特徴量及び振動特徴量とを比較し、選択した音響特徴量及び振動特徴量が正常な範囲内であるか否かを判定する。
選択した音響信号の音響特徴量及び振動特徴量が正常な範囲内である場合(ステップS102D;Yes)、状態判別部706は、選択した音響信号についての状態フラグを「0」にする(ステップS102E)。一方、選択した音響信号の音響特徴量又は振動特徴量が正常な範囲から外れた場合(ステップS102D;No)、状態判別部706は、選択した音響信号についての状態フラグを「1」にする(ステップS102F)。
ステップS102E又はS102Fで状態フラグの値を設定すると、状態判別部706は、次に、状態未設定の音響信号があるか否かをチェックする(ステップS102G)。状態未設定の音響信号がある場合(ステップS102G;Yes)、状態判別部706は、状態未設定の音響信号についてステップS102C〜S102Fの処理を行う。そして、全ての音響信号に対してステップS102C〜S102Fの処理が行われると(ステップS102G;No)、状態判別部706は、判別結果を再生部707に出力し、現在の処理単位期間の音響信号についての状態判定処理を終了する。
グループ検出処理及び状態判別処理を行った後、映像音声再生装置1Aでは、再生部707が上述したステップS103〜S107を行う。
図7は、第1の実施形態に係る再生処理の処理結果の一例を示す図である。なお、図7には、図3に示した映像に対して上記の再生処理を行った場合の処理結果を示している。
点検用端末5の表示装置8には、撮像装置2で撮像した映像として、二つの設備601,602が映っている。二つの設備601,602のうち一方の設備601は、第1の部位601A、第2の部位601B、及び第3の部位601Cを有する。この設備601は、例えば、第1の部位601Aにおいて所定の処理を行った工作物が、第3の部位601Cを通して第2の部位601Bに搬送されるようになっている。設備601の第1の部位601Aには、3個の複合センサが取り付けられている。又、第2の部位601B及び第3の部位601Cには、それぞれ1個の複合センサ(収音装置304A,305A)が取り付けられている。
また、二つの設備601,602のうち他方の設備602は、設備601に比べて小型であり、例えば1個の複合センサ(収音装置)が取り付けられている。
この二つの設備601,602の映像の再生中に異常がない場合、ステップS102において全ての音響信号についての状態フラグが「0」になる。そのため、映像音声再生装置1Aは、図4に示したステップS104の処理をスキップする。このとき、音響信号の再生を指示する情報の入力がなければ(ステップS105;No)、再生部707は、撮像装置2が撮像した映像のみを表示装置8に出力する。よって、二つの設備601,602に異常がなく、かつ音響信号の再生を指示する情報の入力がない場合、点検用端末5の表示装置8の画面には、図3に示したように、撮像装置2が撮像した映像がそのまま表示される。
これに対し、例えば、図7に示したように、設備601の第1の部位601Aから第2の部位601Bへと工作物を搬送する搬送路(第3の部位601C)の点Pで異常音が生じた場合、搬送路近傍の収音装置303A〜305Aが異常音を収音する。そのため、まず、グループ検出処理において、3個の複合センサ(収音装置303A〜305A)が1つのグループに設定される。また、収音装置303A〜305Aが異常音を収音した場合、状態判別処理において、各収音装置が収音した音響信号についての状態フラグが「1」に設定される。そのため、映像音声再生装置7Aでは、再生部707が、図4に示したステップS104の処理を行う。すなわち、再生部707は、センサ位置情報に基づいて、例えば、撮像装置2が撮像した映像に異常音を収音した収音装置303A〜305Aを包含する枠線Lを重ねた映像信号を表示装置8に出力する。よって、収音装置303A〜305Aが異常音を収音した場合、点検用端末5の表示装置8には、図7に示したように、撮像範囲内の異常音を収音した領域を示す枠線Lが表示される。これにより、点検用端末5のオペレータは、設備601の第1の部位601Aから第2の部位601Bへと工作物を搬送する搬送路(第3の部位601C)で異常音が発生していることを容易に把握することが可能になる。また、音響信号同士の相関が高い複数の複合センサ(収音装置)を1つのグループにしているので、表示装置8に表示された枠線L内の各箇所からは同種の異常音が収音されている。そのため、表示装置8の画面に枠線内のいずれか1点を選択して音響信号を再生するだけで、異常音がどのような音であり、撮像範囲内のどの領域で検出されたかを容易に把握することが可能になる。例えば、点検用端末5が、表示装置8と重ねて配置したタッチパネルを入力装置10として用いることが可能な装置である場合、点検用端末5のオペレータが指やスタイラス等で画面の枠線内の1箇所に触れるだけで、当該領域の異常音を聞くことができる。よって、撮像範囲内における異常音の発生の有無及び異常音の発生源を特定する際の音(音響信号)の確認作業を少ない手間で行うことができ、設備の保守点検業務を効率よく行うことができる。
なお、本実施形態に係る再生処理では、異常音の発生箇所を示す枠線内だけでなく、画面上における枠線の外側に位置する複合センサの設置箇所及びその近傍を選択した場合にも、選択した箇所における音を確認することができる。
図8は、第1の実施形態に係る再生処理における映像音声出力処理の内容を示すフローチャートである。
図4に示したフローチャートにおける映像音声出力処理(ステップS107)は、上記のように再生部707が行う。再生部707は、映像音声出力処理として、図8に示したような処理を行う。
まず、再生部707は、入力情報から映像上(表示装置の画面上)における選択位置の視線方向を特定する(ステップS107A)。次に、再生部707は、撮像装置の向き、視線方向、及びセンサ位置情報に基づいて、選択位置から最も近い位置に設置された複合センサを特定し、再生する音響信号を決定する(ステップS107B)。その後、再生部707は、ステップS107Bで決定した音響信号の再生音をスピーカ9に出力するとともに、映像を表示装置8に出力する(ステップS107C)。
以上のように、本実施形態によれば、撮像装置2が撮像した映像内に異常音を収音(検出)した箇所が存在する場合に、異常音の発生箇所を示す情報を映像に付加して表示することで、異常音の発生箇所を容易に把握することができる。
また、本実施形態の再生処理では、撮像範囲内の複数箇所において収音した音響信号について、隣接する箇所の音響信号同士の相関が高い場合にその箇所をグループ化する。そして、グループ内に異常音の発生箇所が存在する場合、そのグループに含まれる領域を示す枠線L等の情報を映像に重ねて表示させる。そのため、映像における1つの枠線Lで囲まれた領域では同じ種類の異常音が収音(検出)されたことを容易に把握できる。しかも、映像における1つの枠線で囲まれた領域内の1箇所を選択して音響信号を再生するだけで、当該領域内でどのような異常音が発生しているかを確認することができる。よって、本実施形態によれば、撮像装置2の撮像範囲内における異常音の有無の確認及び異常音の発生箇所の特定等を少ない手間で行うことができる。
なお、本実施形態に係る点検用端末5は、映像音声再生装置7A、表示装置8、スピーカ9、及び入力装置10を備えた一体型の装置に限定されない。点検用端末5は、例えば、映像音声再生装置7Aとは別に用意した表示装置8、スピーカ9、及び入力装置10を伝送ケーブルで映像音声再生装置7Aに接続した構成であってもよい。
また、点検用端末5を用いて点検作業を行う場合、中継器4と映像音声再生装置7Aとは、上記の無線通信による接続に限らず、伝送ケーブルで接続してもよい。
更に、本実施形態では音響特徴量及び振動特徴量に基づいて音響信号の状態の判別(正常か異常かの判別)をしているが、音響信号の状態の判別は、これに限らず、音響特徴量のみに基づいて行ってもよい。また、音響信号の状態は、音響特徴量と、監視対象の設備において正常時と異常時とで値が異なる物理量(例えば、温度等)とを組み合わせて判別してもよい。
[第2の実施形態]
図9は、第2の実施形態に係る点検システムの構成例を示す図である。
図9に示すように、本実施形態に係る点検システム1Bは、撮像装置2と、マイクアレイ11と、中継器4と、点検用端末5と、を備える。
撮像装置2は、点検対象の設備6(601,602)の映像を撮像する装置である。
マイクアレイ11は、複数の収音装置(マイクロフォン)をアレイ状に配した装置であり、図9に示した例では、5個の収音装置1101〜1105を一列に所定の間隔で配してある。このマイクアレイ11は、図9に示したように、撮像装置2の近傍に、撮像範囲(設備6)から到来する音を収音する向きで設置してある。
中継器4は、撮像装置2で撮像した映像、及びマイクアレイ11(収音装置1101〜1105)が出力した音響信号を取得し、点検用端末5に転送する装置である。点検用端末5は、中継器4を介して取得した映像及び音響信号を再生する装置である。中継器4と点検用端末5とは、例えば、所定の無線通信規格に従った無線通信により通信可能に接続される。
図10は、第2の実施形態に係る点検システムで用いる点検用端末の機能的構成を示すブロック図である。
本実施形態に係る点検用端末5は、図10に示すように、映像音声再生装置7Bと、表示装置8と、スピーカ9と、入力装置10と、を備える。
映像音声再生装置7Bは、通信部721と、到来音生成部722と、変換部723と、相関値算出部724と、グループ生成部725と、を備える。また、映像音声再生装置7Bは、パワー算出部726と、特徴量算出部727と、状態判別部728と、再生部729と、記憶部730と、入力受付部731と、を備える。
通信部721は、中継器4との間で無線通信を行い、撮像装置2が撮像した映像、及びマイクアレイ11が出力した複数の音響信号を取得する。通信部721は、取得した映像を再生部729に出力する。また、通信部721は、取得した音響信号を到来音生成部722に出力する。
到来音生成部722は、マイクアレイ11から取得した複数の音響信号に基づき、取得した映像内における複数箇所のそれぞれからマイクアレイ11(撮像装置2)に到来する音響信号を生成する。到来音生成部722は、生成した音響信号(到来音)を変換部723に出力する。
変換部723は、到来音生成部722で生成した音響信号(到来音)を、時間領域の信号から周波数領域の信号に変換する。変換部723は、変換後の周波数領域の音響信号を相関値算出部724、パワー算出部726、及び特徴量算出部727に出力する。
相関値算出部724は、入力された複数の音響信号を用い、到来方向が隣接関係にある音響信号同士の相関値を算出する。グループ設定部725は、算出した音響信号同士の相関値と予め定めた相関閾値とを比較して、音響信号同士の相関の有無を判定する。また、グループ設定部725は、音響信号同士の相関の有無の判定結果に基づいて、相関のある音響信号の到来方向の組を1つのグループに設定するグループ化を行う。グループ設定部725は、設定したグループに関する情報を再生部729に出力する。
パワー算出部726は、入力された複数の音響信号のパワーを算出する。パワー算出部726は、算出した各音響信号のパワーを再生部729に出力する。
特徴量算出部727は、入力された複数の音響信号を分析して所定の音響特徴量を算出する。特徴量算出部727は、算出した音響特徴量を状態判別部726に出力する。
状態判別部726は、特徴量算出部727で算出した音響特徴量と、記憶部730に記憶させた正常時の音響特徴量とを比較し、各到来方向からの音響信号(到来音)が正常であるか否かを判別する。状態判別部728は、判別結果を再生部729に出力する。
再生部729は、状態判別部728の判別結果及び各音響信号のパワーに基づき、正常ではないと判別され、かつパワーが所定の閾値以上の音響信号がある場合には、映像上における異常な音響信号の発生源を示す情報を、映像とともに表示装置8に出力する。また、正常ではないと判別された音響信号がある場合、再生部729は、グループ設定部725で設定したグループのうち異常がある到来方向を含むグループを示す情報を映像とともに表示装置に出力する。なお、正常ではないと判別された音響信号がない場合、再生部729は、入力された映像のみを表示装置8に出力する。
更に、再生部729は、オペレータが入力装置10を操作して指定した映像上の点と対応する方向から到来する音響信号を選択してスピーカに出力する。オペレータが入力装置10を操作すると、操作内容に応じた入力信号が入力装置10から映像音声再生装置7Bの入力受付部731に入力される。入力受付部731は、入力信号が音響信号の再生に関する信号である場合、入力信号を再生部に出力する。
図11は、到来音生成部で生成する到来音の到来方向の設定方法を説明する図である。
図10に示した映像音声再生装置7Bにおける到来音生成部722は、上記のように、映像内における複数箇所のそれぞれからマイクアレイ11(撮像装置)に到来する音を生成する。この際、到来音生成部722では、例えば、図11に示すように映像内に設定した二次元格子の各格子点Qと対応する箇所から到来する音を生成する。なお、格子点Qの間隔は適宜設定すればよく、例えば、点検対象領域(撮像範囲内)に存在する設備の種類や配置に応じて適切な値に設定する。
映像上に設定した各格子点Qと対応する位置からの到来音は、既知の生成方法により生成することができる。格子点Qからの到来音は、映像上における格子点Qの位置(到来方向)に対応した伝達特性を、マイクアレイ11で収音した複数の音響信号に畳み込むことで生成することができる。到来方向は、撮像装置2のカメラ座標系における光軸の方向と、格子点Qを通る視線方向とに基づいて算出することができる。
図12は、第2の実施形態に係る映像音声再生装置が行う再生処理の内容を示すフローチャートである。
本実施形態の点検システム1Bでは、例えば、オペレータが点検用端末5の入力装置10を操作し点検用端末5と中継器4とが通信可能に接続されると、点検用端末5の映像音声再生装置7Bが図12に示したような再生処理を行う。
映像音声再生装置7Bは、まず、映像信号及び音響信号の取得を開始する(ステップS200)。ステップS200の処理は、通信部721が行う。通信部721は、取得した映像信号を再生部729に出力するとともに、取得した音響信号を到来音生成部722に出力する。
次に、映像音声再生装置7Bは、撮像範囲内の複数の到来方向からの到来音を生成する(ステップS201)。ステップS201の処理は、到来音生成部722が行う。到来音生成部722は、図11を参照して説明したように、映像上に設定した各格子点の位置と対応する方向を到来方向とし、到来方向に対応した伝達特性を複数の音響信号に畳み込むことで到来音を生成する。到来音生成部722は、生成した到来音を到来方向と対応付けて変換部723に出力する。
次に、映像音声再生装置7Bは、生成した複数の到来音を時間領域の信号から周波数領域の信号に変換し、到来方向毎のパワースペクトルを算出する(ステップS202)。ステップS202の処理は、変換部723が行う。変換部723は、複数の到来音のそれぞれに対し高速フーリエ変換(Fast Fourier Transform;FFT)を行い、各到来音を周波数領域の信号に変換する。変換部723は、算出したパワースペクトルを相関値算出部724、パワー算出部726、及び特徴量算出部727に出力する。
次に、映像音声信号再生装置7Bは、グループ検出処理(ステップS203)、パワー算出処理(ステップS204)、及び状態判別処理(ステップS205)を行う。なお、ステップS203、S204、S205の処理は、図12に示した順序に限らず、他の順序で行ってもよいし、並列に行ってもよい。
ステップS203のグループ検出処理は、相関値算出部724及びグループ設定部725が行う。相関値算出部724は、到来方向毎のパワースペクトルに基づいて、到来方向が隣接関係にあるパワースペクトル同士の相関値を算出する。ここで、隣接関係にある到来方向は、例えば、図11に示した複数の格子点のうち画面上下方向又は画面左右方向で隣接する2つの格子点に対応する2つの到来方向とする。相関値算出部724は、相関値として、例えば、周波数領域のパワースペクトルについての相互相関係数を算出する。相関値算出部724は、算出した相関値を到来方向(格子点)の組と対応付けてグループ設定部725に出力する。
グループ設定部725は、入力された相関値のそれぞれを予め定めた相関閾値と比較し、音響信号同士の相関が高い到来方向の組がある場合、相関が高い到来方向の組を1つのグループに設定する。ここで、1組の到来方向のうち一方の到来方向が既に1つのグループに含まれる場合、グループ設定部725は、他方の到来方向を当該グループに追加する。グループ設定部725は、相関が高い到来方向のグループの設定を終えると、設定したグループに関する情報を再生部729に出力する。
ステップS204のパワー算出処理は、パワー算出部726が行う。パワー算出部726は、到来方向毎のパワースペクトルを用いて到来方向毎の到来音のパワーを算出する。パワー算出部726は、算出した到来方向毎のパワーを再生部729に出力する。
ステップS205の状態判別処理は、特徴量算出部727及び状態判別部728が行う。特徴量算出部727は、各到来方向のパワースペクトルの特徴量を算出し、算出した特徴量を状態判別部728に出力する。状態判別部728は、到来方向毎に、算出したパワースペクトルの特徴量と、予め用意した正常時のパワースペクトルの特徴量とを比較して到来音が正常であるか否かを判別する。状態判別部728は、記憶部730から正常時のパワースペクトルの特徴量を読み出す。状態判別処理では、第1の実施形態の状態判別処理と同様、正常である到来音(パワースペクトル)は状態フラグを「0」とし、正常ではない到来音(パワースペクトル)は状態フラグを「1」とする。状態判別部728は、パワースペクトルの状態を示す状態フラグを再生部729に出力する。
グループ検出処理、パワー算出処理、及び状態判別処理を終えると、映像音声再生装置7Bは、次に、異常な到来音を含むグループがあるか否かを判定する(ステップS206)。ステップS206の判定は、再生部729が行う。再生部729は、状態フラグが1の到来音を含み、かつパワーが所定の閾値以上であるグループがある場合、当該グループを異常な到来音を含むグループと判定する。異常な到来音を含むグループがある場合(ステップS206;Yes)、再生部729は、映像上(画面上)に、該当するグループに含まれる到来音の到来方向を示す情報を付加する(ステップS207)。その後、再生部729は、音響信号の再生を指示する信号が入力されたか否かをチェックする(ステップS208)。一方、異常な到来音を含むグループがない場合(ステップS206;No)、再生部729は、ステップS207の処理をスキップし、ステップS208のチェックを行う。
ステップS208において音響信号の再生を指示する信号が入力されていないと判定した場合(ステップS208;No)、再生部729は、映像信号のみを再生して表示装置8に出力する(ステップS210)。一方、ステップS208において音響信号の再生を指示する信号が入力されたと判定した場合(ステップS208;Yes)、再生部729は、映像音声出力処理(ステップS210)を行う。ステップS210において、再生部729は、入力された信号で指定された到来方向の音響信号を選択し、映像信号を表示装置8に出力するとともに、選択した音響信号をスピーカ9に出力する。
再生部729が映像信号、又は映像信号及び音響信号を出力すると、映像音声再生装置7Bは、次に、ステップS201〜S210の処理を続けるか否かを判断する(ステップS211)。処理を続ける場合(ステップS211;Yes)、映像音声再生装置7Bは、次の処理単位期間の音響信号についてのステップS201〜S210の処理を行う。一方、処理を終了する場合(ステップS211;No)、図12のフローチャートでは省略しているが、映像音声再生装置7Bは、映像信号、及び音響信号の取得を終了し、再生処理を終了する。
図13は、第2の実施形態に係る再生処理におけるグループ検出処理の内容を示すフローチャートである。
図12に示したフローチャートのグループ検出処理(ステップS203)は、上記のように相関値算出部724及びグループ設定部725が行う。相関値算出部724及びグループ設定部725は、グループ検出処理として、図13に示したような処理を行う。
まず、相関値算出部724が、隣接関係にある2つの到来方向から到来する到来音の相関値を算出する(ステップS203A)。ステップS203Aにおいて、相関値算出部724は、映像内に設定された複数の到来方向の中から2つの到来方向を選択し、当該2つの到来方向から到来する到来音の相関値を算出する処理を、選択し得る全ての到来方向の組み合わせに対して行う。相関値算出部724は、算出した相関値を到来方向の組と対応付けてグループ設定部725に出力する。
次に、グループ設定部725が、相関値算出部724で算出した相関値と予め定めた相関閾値とを比較し、到来音の相関が高い到来方向の組があるか否かを判定する(ステップS203B)。到来音の相関が高い到来方向の組がある場合(ステップS203B;Yes)、グループ設定部725は、相関が高い到来方向の組を1つのグループにグループ化する(ステップS203C)。ステップS203Cにおいて、グループ設定部725は、1組の到来方向のうち一方の到来方向が既に1つのグループに含まれる場合、他方の到来方向を当該グループに追加する。一方、到来音の相関が高い到来方向の組がない場合(ステップS203B;No)、グループ設定部725は、ステップS203Cの処理をスキップする。
グループ設定部725がステップS203B,S203Cの処理を終え、処理結果を再生部729に出力すると、現在の処理単位期間の音響信号についてのグループ検出処理が終了する。
図14は、第2の実施形態に係る再生処理における状態判別処理の内容を示すフローチャートである。
図12に示したフローチャートの状態判別処理(ステップS205)は、上記のように特徴量算出部727、及び状態判別部728が行う。特徴量算出部727、及び状態判別部728は、状態判別処理として、図14に示したような処理を行う。
まず、特徴量算出部727が周波数領域の信号に変換された到来音の音響特徴量を算出する(ステップS205A)。特徴量算出部727は、算出した音響特徴量を状態判別部728に出力する。ここで、音響特徴量は、現在の処理対象期間における到来音を特徴付けることができ、かつ設備が正常に動作しているときと異常が生じたときとを判別することが可能な特徴量であればよい。
特徴量算出部727で算出した音響特徴量が入力されると、状態判別部728は、ステップS205B〜S205Fの処理を行う。状態判別部728は、まず、記憶部730から正常時の音響特徴量を読み出す(ステップS205B)。次に、状態判別部728は、状態未判定の到来音を1つ選択して音響特徴量を正常時の音響特徴量と比較し(ステップS205C)、選択した到来音の音響特徴量が正常な範囲内であるか否かを判定する(ステップS205D)。ステップS205C,S205Dにおいて、状態判別部728は、例えば、選択した音響特徴量と、正常時の音響特徴量との差分を求め、その差分が正常状態の許容範囲内であるか否かを判定する。
選択した音響特徴量が正常な範囲内である場合(ステップS205D;Yes)、状態判別部728は、選択した到来音の音響特徴量についての状態フラグを「0」にする(ステップS205E)。一方、選択した音響特徴量が正常な範囲から外れた場合(ステップS205D;No)、状態判別部728は、選択した到来音の音響特徴量についての状態フラグを「1」にする(ステップS205F)。
ステップS205E又はS205Fで状態フラグの値を設定すると、状態判別部728は、状態未設定の到来音があるか否かをチェックする(ステップS205G)。状態未設定の音響信号がある場合(ステップS205G;Yes)、状態判別部728は、状態未設定の到来音についてステップS205C〜S205Fの処理を行う。そして、全ての到来音に対してステップS205C〜S205Fの処理が行われると(ステップS205G;No)、状態判別部728は、判別結果を再生部729に出力し、現在の処理単位期間の到来音についての状態判定処理を終了する。
上記のグループ検出処理及び状態判別処理、並びにパワー算出処理を行った後、映像音声再生装置7Bでは、再生部729が上述したステップS206〜S210を行う。ステップS206〜S210の処理は、それぞれ、第1の実施形態で説明したステップS103〜S107と同様の処理でよい。
以上のように、本実施形態では、マイクアレイ11で収音した複数の音響信号を用い、映像上に設定した格子点と対応する位置から到来する音(到来音)を生成する。そして、到来方向が隣接関係にある到来音同士の相関が高い場合、当該到来方向を1つのグループにする。また、1つのグループに含まれる到来方向からの到来音に異常があると判別した場合、映像上における当該グループの領域を示す情報を映像に付加して表示する。そのため、映像内における異常音の発生箇所を容易に把握することができる。
また、1つのグループに含まれる複数の到来方向からの到来音は、周波数領域に変換した音響信号における音響特徴量の相関が高い。そのため、映像において異常音の発生箇所を示す1つの枠線で囲まれた領域では同じ種類の異常音が収音(検出)されたことを容易に把握できる。しかも、映像における1つの枠線で囲まれた領域内の1箇所を選択して音響信号を再生するだけで、当該領域内でどのような異常音が発生しているかを確認することができる。よって、本実施形態によれば、撮像装置2の撮像範囲内における異常音の有無の確認及び異常音の発生箇所の特定等を少ない手間で行うことができる。
更に、本実施形態では、映像上に設定した二次元の格子点と対応する位置を到来方向とし、各到来方向から到来する音が正常であるか否かを判定するので、第1の実施形態に比べてより細かく異常音の発生の有無を調べることができる。
なお、上記のグループ検出処理(ステップS203)についての説明では、相関値算出部724において周波数領域の信号に変換した到来音のパワースペクトル同士の相関値を算出する例を挙げた。しかしながら、相関値算出部724は、これに限らず、例えば、周波数領域の信号に変換した到来音のパワースペクトルの時間変化量を算出し、時間変化量同士の相関値を算出してもよい。
[第3の実施形態]
図15は、第3の実施形態に係る監視システムの構成例を示す図である。
図15に示すように、本実施形態に係る監視システム1Cは、複数の監視エリア12A〜12Cの監視を一括して行うことが可能なシステムである。複数の監視エリア12A〜12Cには、それぞれ、撮像装置2A〜2C及びマイクアレイ11A〜11Cが設置されている。各監視エリア12A〜12Cの撮像装置が撮像した映像及びマイクアレイが収音した音響信号は、それぞれ、インターネット等の通信網13を介して映像音声再生装置7Cに送信される。
映像音声再生装置7Cは、第2の実施形態で説明した再生処理、或いは類似した処理を行い、到来音に異常がある場合には映像上において異常音が発生している箇所を示す情報を生成する。映像音声再生装置7Cは、取得した映像及び音響信号、並びに異常音が発生している箇所を示す情報を監視設備14に転送する。
監視設備14は、取得した映像及び音響信号、並びに異常音が発生している箇所を示す情報を表示装置8に表示させて各監視エリア12A〜12Cの監視を行う施設に設置された設備である。監視設備14には、表示装置8と、スピーカ9と、入力装置10と、制御装置15とが含まれる。
図16Aは、第3の実施形態に係る監視システムで用いる映像音声再生装置の機能的構成を示すブロック図である。図16Bは、第3の実施形態に係る監視システムで用いる制御装置の機能的構成を示すブロック図である。
図16Aに示すように、本実施形態に係る映像音声再生装置7Cは、通信部741と、到来音生成部742と、変換部743と、相関値算出部744と、グループ設定部745と、SNR算出部746と、表示位置算出部747と、を備える。また、映像音声再生装置7Cは、状態判別部748と、表示位置決定部749と、第1の記憶部750と、第2の記憶部751と、到来音送信部752と、映像送信部753と、を更に備える。
通信部741は、通信網13を介して他の通信装置と通信を行い、撮像装置2(2A〜2C)が撮像した映像、及びマイクアレイ11(11A〜11C)が出力した複数の音響信号を取得する。通信部741は、取得した映像及び音響信号を第1の記憶部750に記憶させる。
到来音生成部742は、第1の記憶部750から複数の音響信号を読み出し、取得した映像内における複数箇所のそれぞれからマイクアレイ11に到来する音響信号を生成する。到来音生成部742は、生成した音響信号(到来音)を変換部743に出力する。
変換部743は、到来音生成部742で生成した音響信号(到来音)を、時間領域の信号から周波数領域の信号に変換する。変換部743は、変換後の音響信号を相関値算出部744、及びSNR算出部746に出力する。
相関値算出部744は、入力された複数の音響信号を用い、到来方向が隣接関係にある音響信号同士の相関値を算出する。相関値算出部744は、算出した相関値をグループ設定部745に出力する。
グループ設定部745は、算出した音響信号同士の相関値と予め定めた相関閾値とを比較して音響信号同士の相関の有無を判定し、音響信号同士の相関の高い隣接した到来方向を1つのグループに設定するグループ化を行う。グループ設定部745は、設定したグループに関する情報を表示位置算出部747に出力する。
SNR算出部746は、入力された複数の音響信号(到来音)を用い、各到来音の信号対ノイズ比(SNR)を算出する。SNR算出部は、算出した各到来音のSNRを表示位置算出部747に出力する。
表示位置算出部747は、グループ化された到来方向の情報及び各到来音のSNRに基づいて、到来方向のグループを示す情報を映像に重ねて表示する際の表示位置を算出する。本実施形態では、表示位置算出部747は、到来方向のグループのうち、各到来音のSNRに基づいて算出されるSNRが所定の閾値以上であるグループのみを表示候補とし、当該表示候補の表示位置を算出する。表示位置算出部747は、算出した表示位置を状態判別部748及び表示位置決定部749に出力するとともに、第2の記憶部751に記憶させる。
状態判別部748は、到来方向のグループについて、表示位置算出部747で算出した表示位置と、第2の記憶部751に記憶された過去の表示位置とを比較し、表示位置から到来する音の状態が正常時の状態と同じであるか否かを判別する。状態判別部748は、判別結果を表示位置決定部749に出力する。
表示位置決定部749は、状態判別部748の判別結果に基づいて、表示位置算出部747で算出した到来方向のグループの表示位置のうち、音の状態が正常ではないと判定されたグループの表示位置を映像に重ねて表示する情報の表示位置に決定する。表示位置決定部749は、決定した表示位置を制御装置15に送信する。
到来音送信部752は、変換部743で時間領域の音響信号を変換して得た周波数領域の到来音を制御装置15に送信する。到来音送信部752は、例えば、監視設備14のオペレータが入力装置10を操作して指定した映像上の点と対応する方向から到来する音響信号を選択してスピーカ9に出力する。オペレータが入力装置10を操作すると、操作内容に応じた入力信号が制御装置15を介して映像音声再生装置7Cに入力される。
映像送信部753は、第1の記憶部750に記憶させた撮像装置2からの映像信号を制御装置15に送信する。
一方、監視設備14の制御装置15は、図16Bに示すように、再生部1501と、制御部1502と、を備える。再生部1501は、映像処理部1501Aと、音声処理部1501Bと、を含む。
映像処理部1501Aは、映像音声再生装置7Cの映像送信部753が送信した映像信号を取得し、表示装置8で表示可能なデータ形式に変換して表示装置8に出力する。
音声処理部1501Bは、映像音声再生装置7Cの到来音送信部752が送信した音響信号を取得し、スピーカ9から出力可能なデータ形式、すなわち周波数領域の信号から時間領域の信号に変換してスピーカ9に出力する。
制御部1502は、映像音声再生装置7Cの表示位置決定部749で決定した表示位置を取得した場合、映像処理部1501Aが映像信号を処理する際に、取得した表示位置に異常音が発生している領域を示す枠線等の情報を映像信号に付加させる。また、制御部1502は、オペレータが入力装置10を操作して映像における異常音が発生している領域内の点を選択した場合、選択位置を映像音声再生装置7Cの到来音送信部752に送信する。映像音声再生装置7Cの到来音送信部752は、制御装置15からの選択位置を示す信号を受信すると、到来音生成部742で生成した到来音から選択位置を到来方向とする到来音を抽出して制御装置15の音声処理部1501Bに送信する。
図17Aは、第3の実施形態に係る映像音声再生装置が行う再生処理の内容を示すフローチャートである。
本実施形態の監視システム1Cにおける映像音声再生装置7Cは、例えば、監視設備14のオペレータが入力装置10を操作して入力した再生処理の開始命令を受信すると、図17Aに示したような処理を行う。なお、図17Aのフローチャートは、1つの監視エリアに配置した撮像装置及びマイクアレイから取得した映像及び複数の音響信号に対する一連の処理を示している。すなわち、映像音声再生装置7Cは、監視エリア毎に図17Aに示した処理を行う。
映像音声再生装置7Cは、まず、映像信号及び音響信号の取得を開始する(ステップS300)。ステップS300の処理は、通信部741が行う。通信部741は、取得した映像信号及び音響信号を、監視エリア毎に識別可能な状態で第1の記憶部750に記憶させる。
次に、映像音声再生装置7Cは、撮像範囲内の複数の到来方向からの到来音を生成する(ステップS301)。ステップS301の処理は、到来音生成部742が行う。到来音生成部742は、図11を参照して説明したように、映像上に設定した各格子点Qの位置と対応する方向を到来方向とし、到来方向に対応した伝達特性を複数の音響信号に畳み込むことで到来音を生成する。到来音生成部742は、生成した到来音を到来方向と対応付けて変換部743に出力する。
次に、映像音声再生装置7Cは、生成した複数の到来音を時間領域の信号から周波数領域の信号に変換し、到来方向毎のパワースペクトルを算出する(ステップS302)。ステップS302の処理は、変換部743が行う。変換部743は、複数の到来音のそれぞれに対し高速フーリエ変換を行い、各到来音を周波数領域の信号に変換する。変換部743は、算出したパワースペクトルを相関値算出部744、及びSNR算出部746に出力する。
次に、映像音声信号再生装置7Cは、グループ検出処理(ステップS303)、及び各信号のSNRを算出する処理(ステップS304)を行う。なお、ステップS303、S304の処理は、図17に示した順序に限らず、逆の順序で行ってもよいし、並列に行ってもよい。
ステップS303のグループ検出処理は、相関値算出部744及びグループ設定部745が行う。相関値算出部744は、到来方向毎のパワースペクトルに基づいて、到来方向が隣接関係にあるパワースペクトル同士の相関値を算出する。相関値算出部744は、相関値として、例えば、周波数領域のパワースペクトルについての相互相関係数を算出する。相関値算出部744は、算出した相関値を到来方向(格子点)の組と対応付けてグループ設定部745に出力する。
グループ設定部745は、入力された相関値のそれぞれを予め定めた相関閾値と比較し、音響信号同士の相関が高い到来方向の組がある場合、相関が高い到来方向の組を1つのグループに設定する。ここで、1組の到来方向のうち一方の到来方向が既に1つのグループに含まれる場合、グループ設定部745は、他方の到来方向を当該グループに追加する。グループ設定部745は、相関が高い到来方向のグループを設定すると、設定したグループに関する情報を表示位置算出部747に出力する。
ステップS304のSNRを算出する処理は、SNR算出部746が行う。SNR算出部746は、各到来方向の到来音についてのSNR(信号対ノイズ比)を算出する。SNR算出部746は、算出した各到来音のSNRを表示位置算出部747に出力する。
ステップS303,S304の処理を終えると、映像音声再生装置7Cは、次に、SNRに基づいて表示位置を算出する(ステップS305)。ステップS305は、表示位置算出部747が行う。表示位置算出部747は、例えば、各到来音のSNRに基づいて到来方向のグループのそれぞれにおけるSNRを算出した後、到来方向のグループのうち算出したSNRが所定の閾値よりも大きいグループを映像に重ねて表示する場合の表示位置を算出する。表示位置算出部747は、算出した表示位置を到来方向のグループと対応付けて状態判別部748及び表示位置決定部749に出力するとともに、第2の記憶部751に記憶させる。
表示位置を算出する処理を終えると、映像音声再生装置7Cは、次に、状態判別処理(ステップS306)を行う。ステップS306の状態判別処理は、状態判別部748が行う。状態判別部748は、算出した表示位置と過去の表示位置とを比較し、表示位置の変化が正常時の変化の範囲内であるか否かを判別する。状態判別部748は、判別結果を表示位置決定部749に出力する。
ステップS306の処理を終えると、次に、表示位置決定部749が、入力された判別結果に基づいて、表示位置の変化が正常な範囲内であるか否かをチェックする(ステップS307)。表示位置の変化が正常な範囲内ではない場合(ステップS307;No)、表示位置決定部749は、異常な到来音を含む到来方向のグループの表示位置を決定し、決定した表示位置を制御装置に出力する(ステップS308)。その後、映像音声再生装置7Cは、映像信号を制御装置15に送信する(ステップS309)。ステップS309の送信処理は、映像送信部753が行う。なお、ステップS309の送信処理は、ステップS308の後に限らず、任意のタイミングで行うことができる。
一方、表示位置の変化が正常な範囲内である場合(ステップS307;Yes)、異常な到来音(異常音)を含むグループがないため、表示位置決定部749は、ステップS308の処理をスキップする。その後、映像音声再生装置7Cは、映像信号を制御装置15に送信する(ステップS309)。
ステップS309の送信処理の後、映像音声再生装置7Cは、ステップS301〜S309の処理を続けるか否かを判断する(ステップS310)。処理を続ける場合(ステップS310;Yes)、映像音声再生装置7Cは、次の処理単位期間の音響信号についてのステップS301〜S309の処理を行う。一方、処理を終了する場合(ステップS311;No)、映像音声再生装置7Cは、再生処理を終了する。
図17Bは、第3の実施形態に係る制御装置が映像音声再生装置と協働して行う処理の内容を示すフローチャートである。
表示装置8に表示された映像に異常音の発生領域を示す情報が含まれている場合、監視設備14のオペレータは、入力装置10を操作することで異常音を再生することができる。オペレータが入力装置10を操作して異常音の発生領域内の任意の位置を選択すると、制御装置15は、図17Bに示したような処理を行う。
制御装置15は、まず、入力装置10からの選択位置を示す信号を受け付け、当該選択位置の信号を映像音声再生装置7Cに送信する(ステップS320)。ステップS320の処理は、制御部1502が行う。制御部1502が送信した選択位置を示す信号は、映像音声再生装置7Cの到来音送信部752が受信する。到来音送信部752は、選択位置を示す信号を受信すると、当該選択位置と対応する到来方向からの到来音を抽出して制御装置15に送信する。
制御装置15は、選択位置と対応する到来方向からの到来音を受信すると、音声処理部1501Bにおいて受信した到来音を周波数領域の信号から時間領域の信号に変換する(ステップS321)。音声処理部1501Bは、時間領域の信号に変換した到来音をスピーカ9に出力する(ステップS322)。
以上のように、本実施形態では、通信網13を介して映像音声再生装置7Cと接続された撮像装置2(2A〜2C)及びマイクアレイ11(11A〜11C)から取得した映像及び音響信号を用いて、映像内における異常音の発生の有無を判別する。そのため、例えば、図15に示したように、1組の映像音声再生装置7C及び監視設備14で複数の監視エリアにおける異常音の発生を監視することができる。
また、本実施形態では、第1及び第2の実施形態とは異なり、相関が高い到来方向のグループを表示する際の表示位置や到来音のSNRに基づいて異常音が発生しているか否かを判別する。異常音が発生した場合、発生源に近い位置では音が大きくなったり平常時とは異なる音になったりする。そのため、異常音が発生した場合、発生源に近い位置では相関が高い到来方向のグループを示す領域の位置や形状に変化が生じやすい。また、表示位置に大きな変化が生じたときに、SNRが所定の閾値以上である場合にのみ異常音が発生していると判断することで、監視対象の設備の動作音とは異なる雑音による表示位置の変化を異常音の発生によるものと誤判断することを防ぐことができる。
なお、上記の第1〜第3の実施形態で説明した再生処理は一例に過ぎず、必要に応じて処理の一部を変更してもよい。例えば、到来音生成部では、撮像装置が撮像した映像を分析して映像上の各物体までの距離を推定し、推定した距離と到来方向に基づいて、複数の音響信号に到来方向及び距離に応じた伝達特性を畳み込んで到来音を生成することも可能である。
また、隣接関係にある到来方向の到来音同士の相関は、時間領域のパワーの相関や周波数領域のパワースペクトルの相関に限らず、周波数領域のパワースペクトルの時間変化量の相関を用いることも可能である。
また、上記の映像音声再生装置7A〜7Cは、例えば、コンピュータと、コンピュータに上記の画像処理を実行させるプログラムとにより実現可能である。以下、映像音声再生装置7A〜7Cとして動作させることが可能なコンピュータについて、図18を参照して説明する。
図18は、コンピュータのハードウェア構成を示す図である。
図18に示すように、コンピュータ20は、プロセッサ2001と、主記憶装置2002と、補助記憶装置2003と、入力装置2004と、表示装置2005と、通信装置2006と、インタフェース装置2007と、記憶媒体駆動装置2008と、を備える。コンピュータ20におけるこれらの要素2001〜2008は、バス2010により相互に接続されており、要素間でのデータの受け渡しが可能になっている。
プロセッサ2001は、Central Processing Unit(CPU)等の演算処理装置であり、オペレーティングシステムを含む各種のプログラムを実行することによりコンピュータ20の全体の動作を制御する。
主記憶装置2002は、Read Only Memory(ROM)及びRandom Access Memory(RAM)を含む。ROMには、例えばコンピュータ20の起動時にプロセッサ2001が読み出す所定の基本制御プログラム等が予め記録されている。また、RAMは、プロセッサ2001が各種のプログラムを実行する際に、必要に応じて作業用記憶領域として使用する。
補助記憶装置2003は、Hard Disk Drive(HDD)やSolid State Drive(SSD)等の主記憶装置2002に比べて大容量の記憶装置である。補助記憶装置2003には、プロセッサ2001によって実行される各種のプログラムや各種のデータ等を記憶させる。補助記憶装置2003に記憶させるプログラムとしては、例えば、図4〜図6に示した処理、図12〜図14に示した処理、或いは図17Aに示した処理をコンピュータ20に実行させるプログラムが挙げられる。また、補助記憶装置2003に記憶させるデータとしては、例えば、撮像装置2から取得した映像信号や収音装置から取得した音響信号等が挙げられる。
入力装置2004は、例えばキーボード装置やマウス装置であり、コンピュータ20のオペレータにより操作されると、その操作内容に対応付けられている入力情報をプロセッサ2001に送信する。また、入力装置2004は、例えば、表示装置2005の表示面に重ねて配置されたタッチパネル装置を用いることも可能である。
表示装置2005は、例えば液晶ディスプレイ装置である。液晶ディスプレイ装置は、プロセッサ2001等から送信される表示データに従って各種のテキスト、映像等を表示する。
通信装置2006は、所定の通信規格に従ってコンピュータ20を他の通信機器と通信可能に接続する装置である。通信装置2006は、例えば、近距離又は中距離の無線通信によりコンピュータ20と中継器4とを接続する装置でもよいし、有線又は無線通信によりコンピュータ20をインターネット等の通信網13に接続する装置でもよい。
インタフェース装置2007は、例えば、スピーカ9や他の電子機器をコンピュータ20に接続するための入出力装置である。
記憶媒体駆動装置2008は、図示しない可搬型記憶媒体に記録されているプログラムやデータの読み出し、補助記憶装置2003に記憶されたデータ等の可搬型記憶媒体への書き込みを行う装置である。可搬型記憶媒体としては、例えば、USB規格のコネクタが備えられているフラッシュメモリが利用可能である。また、可搬型記憶媒体としては、Compact Disk(CD)、Digital Versatile Disc(DVD)、Blu-ray Disc(Blu-rayは登録商標)等の光ディスクも利用可能である。
このコンピュータ20は、プロセッサ2001が補助記憶装置2003から上述した処理を含むプログラムを読み出し、主記憶装置2002、補助記憶装置2003等と協働して収音装置から取得した音響信号についての再生処理を実行する。なお、プロセッサ2001は、再生処理における演算処理の一部を、図示していないDigital Signal Processor(DSP)等の他の演算処理装置に実行させてもよい。
なお、映像音声再生装置7A〜7Cとして用いるコンピュータ20は、図18に示した全ての構成要素を含む必要はなく、用途や条件に応じて一部の構成要素を省略することも可能である。また、コンピュータ20は、種々のプログラムを実行することにより複数の機能を実現する汎用型のものに限らず、第1〜第3の実施形態で説明したような処理に特化した専用の情報処理装置でもよい。
以上記載した各実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
撮像装置の撮像範囲内の複数箇所のそれぞれを到来方向とする複数の音響信号を取得し、到来方向が隣接関係にある音響信号同士の特徴量の類似度に基づいて、前記特徴量の類似度が高い音響信号の到来方向を1つのグループに設定するグループ化を行うグループ設定部と、
前記撮像装置の撮像範囲内における前記グループの位置を示す情報を前記撮像装置で撮像した映像に付加して再生する再生部と、
を備えることを特徴とする映像音声再生装置。
(付記2)
前記グループ設定部は、前記複数の音響信号のうち、音圧が所定の値よりも大きい音響信号を抽出し、抽出した前記音響信号及び当該音声信号との前記特徴量の類似度が高い他の音響信号の1つのグループにする、
ことを特徴とする付記1に記載の映像音声再生装置。
(付記3)
前記再生部は、前記グループに含まれる音響信号の到来方向と対応した前記映像内の領域を示す図形を生成し、生成した前記図形を前記撮像装置で撮像した映像に重ねて再生する、
ことを特徴とする付記1に記載の映像音声再生装置。
(付記4)
当該映像音声再生装置は、前記再生中の映像内の点を選択する入力操作を受け付ける入力受付部、を更に備え、
前記再生部は、前記入力受付部を介して選択された前記映像内の点と対応する前記撮像装置の視線方向を到来方向とする音響信号を再生する、
ことを特徴とする付記1に記載の映像音声再生装置。
(付記5)
当該映像音声再生装置は、
前記撮像装置の撮像範囲と収音装置との位置関係に基づいて、前記収音装置で収音した音響信号から前記撮像装置で撮像した映像内に設定した複数箇所のそれぞれを到来方向とする音響信号を生成する到来音生成部、
を更に備えることを特徴とする付記1に記載の映像音声再生装置。
(付記6)
当該映像音声再生装置は、アレイ状に配置された複数の収音装置を備えたマイクアレイ装置で収音した複数の音響信号を取得し、
前記到来音生成部は、前記複数の音響信号に到来方向に応じた伝達特性を付加して前記到来音を生成する、
ことを特徴とする付記5に記載の音声映像再生装置。
(付記7)
前記到来音生成部は、前記撮像装置で撮像した映像内の各物体について当該撮像装置から物体までの距離を推定し、前記各物体の方向と推定した前記距離とに基づいて、前記複数の音響信号に前記到来方向と前記距離に応じた伝達特性を付加して前記到来音を生成する、
ことを特徴とする付記5に記載の音声映像再生装置。
(付記8)
当該映像音声再生装置は、前記到来方向毎に前記音響信号のパワーを算出するパワー算出部、を更に備え、
前記再生部は、前記グループ設定部で設定したグループのうち前記パワー算出部で算出したパワーが予め設定した閾値以上である音響信号の到来方向を含むグループの位置を示す情報のみを、前記撮像装置で撮像した映像に付加して再生する、
ことを特徴とする付記1に記載の音声映像再生装置。
(付記9)
当該映像音声再生装置は、前記到来方向毎に前記音響信号の信号対ノイズ比を算出するSNR算出部、を更に備え、
前記再生部は、前記グループ設定部で設定したグループのうち前記SNR算出部で算出した信号対ノイズ比が予め設定した閾値以上である音響信号の到来方向を含むグループの位置を示す情報のみを、前記撮像装置で撮像した映像に付加して再生する、
ことを特徴とする付記1に記載の音声映像再生装置。
(付記10)
当該映像音声再生装置は、前記到来方向毎に時間領域の音響信号のパワーを算出し、到来方向が隣接関係にある音響信号のパワー同士の相互相関係数を算出する相関値算出部、を更に備え、
前記グループ設定部は、前記特徴量の類似度として、前記相関値算出部で算出した前記相互相関係数を用いる、
ことを特徴とする付記1に記載の映像音声再生装置。
(付記11)
当該映像音声再生装置は、前記到来方向毎に前記音響信号を周波数分析して算出したパワースペクトルを用い、到来方向が隣接関係にある音響信号のパワースペクトル同士の相互相関係数を算出する相関値算出部、を更に備え、
前記グループ設定部は、前記特徴量の類似度として、前記相関値算出部で算出した前記相互相関係数を用いる、
ことを特徴とする付記1に記載の映像音声再生装置。
(付記12)
当該映像音声再生装置は、前記到来方向毎に前記音響信号を周波数分析してパワースペクトルの時間変化量を算出し、到来方向が隣接関係にある音響信号のパワースペクトルの時間変化量同士の相互相関係数を算出する相関値算出部、を更に備え、
前記グループ設定部は、前記特徴量の類似度として、前記相関値算出部で算出した前記相互相関係数を用いる、
ことを特徴とする付記1に記載の映像音声再生装置。
(付記13)
当該映像音声再生装置は、前記到来方向毎に前記音響信号について予め定めた特徴量を算出する特徴量算出部と、算出した特徴量を正常状態の音響特徴量と比較して前記特徴量の算出に用いた音響信号が正常であるか否かを判別する状態判別部と、を更に備え、
前記再生部は、前記グループ設定部で設定したグループのうち前記状態判別部で正常ではないと判別された音響信号の到来方向を含むグループの位置を示す情報のみを、前記撮像装置で撮像した映像に付加して再生する、
ことを特徴とする付記1に記載の映像音声再生装置。
(付記14)
当該映像音声再生装置は、撮像装置の撮像範囲内の複数箇所における振動の特徴量を算出する振動特徴量算出部を、更に備え、
前記状態判別部は、算出した前記音響信号の特徴量と正常状態の音響特徴量との比較結果、及び算出した前記振動の特徴量と正常状態の振動特徴量との比較結果に基づいて、前記特徴量の算出に用いた音響信号が正常であるか否かを判別する、
ことを特徴とする付記13に記載の映像音声再生装置。
(付記15)
当該映像音声再生装置は、前記グループ設定部で設定したグループを前記映像に重ねて表示する場合の表示位置を算出する表示位置算出部と、前記映像に付加した前記グループの位置を示す情報の表示位置を記憶する記憶部と、算出した表示位置を記憶部に記憶させた表示位置と比較して前記表示位置の算出に用いたグループの音響信号が正常であるか否かを判別する状態判別部と、を更に備え、
前記再生部は、前記グループ設定部で設定したグループのうち前記状態判別部で正常ではないと判別された音響信号の到来方向を含むグループの位置を示す情報のみを、前記撮像装置で撮像した映像に付加して再生する、
ことを特徴とする付記1に記載の映像音声再生装置。
(付記16)
コンピュータが、
撮像装置の撮像範囲内の複数箇所のそれぞれを到来方向とする複数の音響信号を取得し、
到来方向が隣接関係にある音響信号同士の特徴量の類似度に基づいて、前記特徴量の類似度が高い音響信号の到来方向を1つのグループに設定するグループ化を行い、
前記撮像装置の撮像範囲内における前記グループの位置を示す情報を前記撮像装置で撮像した映像に付加して再生する、
処理を実行することを特徴とする映像音声再生方法。
(付記17)
前記コンピュータが、
前記到来方向毎に前記音響信号の特徴量を正常時の特徴量と比較して前記音響信号が正常であるか否かを判別する処理、を更に実行し、
前記グループの位置を示す情報を前記撮像装置で撮像した映像に付加して再生する際に、正常ではないと判別された音響信号を含むグループの位置を示す情報のみを前記映像に付加して再生する、
ことを特徴とする付記16に記載の映像音声再生方法。
(付記18)
前記コンピュータが、
前記再生中の映像内の点を選択する入力操作を受け付けた場合に、選択された前記映像内の点と対応する前記撮像装置の視線方向を到来方向とする音響信号を再生する処理、を更に実行する
ことを特徴とする付記16に記載の映像音声再生方法。
(付記19)
撮像装置の撮像範囲内の複数箇所のそれぞれを到来方向とする複数の音響信号を取得し、
到来方向が隣接関係にある音響信号同士の特徴量の類似度に基づいて、前記特徴量の類似度が高い音響信号の到来方向を1つのグループに設定するグループ化を行い、
前記撮像装置の撮像範囲内における前記グループの位置を示す情報を前記撮像装置で撮像した映像に付加して再生する、
処理をコンピュータに実行させるためのプログラム。
(付記20)
前記到来方向毎に前記音響信号の特徴量を正常時の特徴量と比較して前記音響信号が正常であるか否かを判別する処理、を前記コンピュータに更に実行させ、
前記グループの位置を示す情報を前記撮像装置で撮像した映像に付加して再生する際に、正常ではないと判別された音響信号を含むグループの位置を示す情報のみを前記映像に付加して再生させる、
ことを特徴とする付記19に記載のプログラム。
(付記21)
前記再生中の映像内の点を選択する入力操作を受け付けた場合に、選択された前記映像内の点と対応する前記撮像装置の視線方向を到来方向とする音響信号を再生する処理、を前記コンピュータに更に実行させる、
ことを特徴とする付記19に記載のプログラム。
1A,1B 点検システム
1C 監視システム
2 撮像装置
3 センサ
4 中継器
5 点検用端末
6 設備
7A,7B,7C 映像音声再生装置
701,721,741 通信部
702,724,744 相関値算出部
703,725,745 グループ設定部
704 音響特徴量算出部
705 振動特徴量算出部
706,728,748 状態判別部
707,729 再生部
708 記憶部
709,731 入力受付部
722,742 到来音生成部
723,743 変換部
726 パワー算出部
727 特徴量算出部
746 SNR算出部
747 表示位置算出部
749 表示位置決定部
752 到来音送信部
753 映像送信部
8 表示装置
9 スピーカ
10 入力装置
11 マイクアレイ
15 制御装置
20 コンピュータ
2001 プロセッサ
2002 主記憶装置
2003 補助記憶装置
2004 入力装置
2005 表示装置
2006 通信装置
2007 インタフェース装置
2008 記憶媒体駆動装置
2010 バス

Claims (10)

  1. 撮像装置の撮像範囲内の複数箇所のそれぞれを到来方向とする複数の音響信号を取得し、到来方向が隣接関係にある音響信号同士の特徴量の類似度に基づいて、前記特徴量の類似度が高い音響信号の到来方向を1つのグループに設定するグループ化を行うグループ設定部と、
    前記撮像装置の撮像範囲内における前記グループの位置を示す情報を前記撮像装置で撮像した映像に付加して再生する再生部と、
    を備えることを特徴とする映像音声再生装置。
  2. 前記グループ設定部は、前記複数の音響信号のうち、音圧が所定の値よりも大きい音響信号を抽出し、抽出した前記音響信号及び当該音声信号との前記特徴量の類似度が高い他の音響信号の1つのグループにする、
    ことを特徴とする請求項1に記載の映像音声再生装置。
  3. 前記再生部は、前記グループに含まれる音響信号の到来方向と対応した前記映像内の領域を示す図形を生成し、生成した前記図形を前記撮像装置で撮像した映像に重ねて再生する、
    ことを特徴とする請求項1に記載の映像音声再生装置。
  4. 当該映像音声再生装置は、前記再生中の映像内の点を選択する入力操作を受け付ける入力受付部、を更に備え、
    前記再生部は、前記入力受付部を介して選択された前記映像内の点と対応する前記撮像装置の視線方向を到来方向とする音響信号を再生する、
    ことを特徴とする請求項1に記載の映像音声再生装置。
  5. 当該映像音声再生装置は、
    前記撮像装置の撮像範囲と収音装置との位置関係に基づいて、前記収音装置で収音した音響信号から前記撮像装置で撮像した映像内に設定した複数箇所のそれぞれを到来方向とする音響信号を生成する到来音生成部、
    を更に備えることを特徴とする請求項1に記載の映像音声再生装置。
  6. 当該映像音声再生装置は、前記到来方向毎に時間領域の音響信号のパワーを算出し、到来方向が隣接関係にある音響信号のパワー同士の相互相関係数を算出する相関値算出部、を更に備え、
    前記グループ設定部は、前記特徴量の類似度として、前記相関値算出部で算出した前記相互相関係数を用いる、
    ことを特徴とする請求項1に記載の映像音声再生装置。
  7. 当該映像音声再生装置は、前記到来方向毎に前記音響信号を周波数分析して算出したパワースペクトルを用い、到来方向が隣接関係にある音響信号のパワースペクトル同士の相互相関係数を算出する相関値算出部、を更に備え、
    前記グループ設定部は、前記特徴量の類似度として、前記相関値算出部で算出した前記相互相関係数を用いる、
    ことを特徴とする請求項1に記載の映像音声再生装置。
  8. 当該映像音声再生装置は、前記到来方向毎に前記音響信号について予め定めた特徴量を算出する特徴量算出部と、算出した特徴量を正常状態の音響特徴量と比較して前記特徴量の算出に用いた音響信号が正常であるか否かを判別する状態判別部と、を更に備え、
    前記再生部は、前記グループ設定部で設定したグループのうち前記状態判別部で正常ではないと判別された音響信号の到来方向を含むグループの位置を示す情報のみを、前記撮像装置で撮像した映像に付加して再生する、
    ことを特徴とする請求項1に記載の映像音声再生装置。
  9. コンピュータが、
    撮像装置の撮像範囲内の複数箇所のそれぞれを到来方向とする複数の音響信号を取得し、
    到来方向が隣接関係にある音響信号同士の特徴量の類似度に基づいて、前記特徴量の類似度が高い音響信号の到来方向を1つのグループに設定するグループ化を行い、
    前記撮像装置の撮像範囲内における前記グループの位置を示す情報を前記撮像装置で撮像した映像に付加して再生する、
    処理を実行することを特徴とする映像音声再生方法。
  10. 撮像装置の撮像範囲内の複数箇所のそれぞれを到来方向とする複数の音響信号を取得し、
    到来方向が隣接関係にある音響信号同士の特徴量の類似度に基づいて、前記特徴量の類似度が高い音響信号の到来方向を1つのグループに設定するグループ化を行い、
    前記撮像装置の撮像範囲内における前記グループの位置を示す情報を前記撮像装置で撮像した映像に付加して再生する、
    処理をコンピュータに実行させるためのプログラム。
JP2015171263A 2015-08-31 2015-08-31 映像音声再生装置、映像音声再生方法、及びプログラム Active JP6507946B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015171263A JP6507946B2 (ja) 2015-08-31 2015-08-31 映像音声再生装置、映像音声再生方法、及びプログラム
US15/237,075 US9812153B2 (en) 2015-08-31 2016-08-15 Image and audio reproduction device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015171263A JP6507946B2 (ja) 2015-08-31 2015-08-31 映像音声再生装置、映像音声再生方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2017050649A true JP2017050649A (ja) 2017-03-09
JP6507946B2 JP6507946B2 (ja) 2019-05-08

Family

ID=58096052

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015171263A Active JP6507946B2 (ja) 2015-08-31 2015-08-31 映像音声再生装置、映像音声再生方法、及びプログラム

Country Status (2)

Country Link
US (1) US9812153B2 (ja)
JP (1) JP6507946B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10015592B2 (en) * 2016-05-20 2018-07-03 Ricoh Company, Ltd. Acoustic signal processing apparatus, method of processing acoustic signal, and storage medium
US10825469B2 (en) * 2017-07-19 2020-11-03 Insoundz Ltd. System and method for voice activity detection and generation of characteristics respective thereof
US11507759B2 (en) * 2019-03-25 2022-11-22 Panasonic Holdings Corporation Speech translation device, speech translation method, and recording medium
IT201900016328A1 (it) * 2019-09-13 2021-03-13 Elenos S R L Metodo per la misurazione e la visualizzazione del rapporto segnale/rumore audio
CN113267330B (zh) * 2021-05-14 2023-03-14 国网重庆市电力公司电力科学研究院 一种基于声学成像的gis设备机械故障检测系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010091282A (ja) * 2008-10-03 2010-04-22 Nissan Motor Co Ltd 音源探査装置および音源探査方法
JP2010206419A (ja) * 2009-03-02 2010-09-16 Kumagai Gumi Co Ltd 音源の推定方法とその装置
JP2012129873A (ja) * 2010-12-16 2012-07-05 Chubu Electric Power Co Inc 指定領域からの伝播音の再生方法とその装置
JP2013015468A (ja) * 2011-07-06 2013-01-24 Hitachi Engineering & Services Co Ltd 異音診断装置および異音診断方法
JP2014137323A (ja) * 2013-01-18 2014-07-28 Hitachi Power Solutions Co Ltd 異常診断装置およびこれを用いた異常診断方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003244797A (ja) 2002-02-19 2003-08-29 Sony Corp 信号処理装置
JP5618043B2 (ja) 2009-09-25 2014-11-05 日本電気株式会社 映像音響処理システム、映像音響処理方法及びプログラム
JP5702685B2 (ja) 2010-08-17 2015-04-15 本田技研工業株式会社 音源方向推定装置及び音源方向推定方法
JP5952692B2 (ja) 2012-09-13 2016-07-13 本田技研工業株式会社 音源方向推定装置、音響処理システム、音源方向推定方法、及び音源方向推定プログラム
JP6413741B2 (ja) * 2014-12-16 2018-10-31 日本電気株式会社 振動発生源推定装置、方法およびプログラム
US9368110B1 (en) * 2015-07-07 2016-06-14 Mitsubishi Electric Research Laboratories, Inc. Method for distinguishing components of an acoustic signal

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010091282A (ja) * 2008-10-03 2010-04-22 Nissan Motor Co Ltd 音源探査装置および音源探査方法
JP2010206419A (ja) * 2009-03-02 2010-09-16 Kumagai Gumi Co Ltd 音源の推定方法とその装置
JP2012129873A (ja) * 2010-12-16 2012-07-05 Chubu Electric Power Co Inc 指定領域からの伝播音の再生方法とその装置
JP2013015468A (ja) * 2011-07-06 2013-01-24 Hitachi Engineering & Services Co Ltd 異音診断装置および異音診断方法
JP2014137323A (ja) * 2013-01-18 2014-07-28 Hitachi Power Solutions Co Ltd 異常診断装置およびこれを用いた異常診断方法

Also Published As

Publication number Publication date
US20170061990A1 (en) 2017-03-02
JP6507946B2 (ja) 2019-05-08
US9812153B2 (en) 2017-11-07

Similar Documents

Publication Publication Date Title
JP6507946B2 (ja) 映像音声再生装置、映像音声再生方法、及びプログラム
JP5452158B2 (ja) 音響監視システム、及び音声集音システム
JP6135880B2 (ja) 音声処理方法、音声処理システム、及び記憶媒体
US20090198495A1 (en) Voice situation data creating device, voice situation visualizing device, voice situation data editing device, voice data reproducing device, and voice communication system
JP5192414B2 (ja) 音声情報表示システム
JP2019536070A (ja) ユーザ測位方法、情報プッシュ方法、及び関係する装置
CN107863106B (zh) 语音识别控制方法及装置
JP6827379B2 (ja) 電力機器の保守支援装置、システムおよびプログラム
CN111918196B (zh) 一种音频采集器录音异常的诊断方法、装置、设备及存储介质
WO2017110111A1 (ja) 端末装置、診断システム、診断方法およびプログラム
JPWO2011036815A1 (ja) モニタリング装置
JP6878187B2 (ja) システム及び方法
CN111698529B (zh) 直播监控方法、装置、设备以及计算机可读存储介质
WO2015151130A1 (ja) 音声処理装置、音声処理システム、及び音声処理方法
JP2019144093A (ja) 音響信号処理装置、及び音響信号処理プログラム
JP7107036B2 (ja) スピーカの位置判定方法、スピーカの位置判定システム、音響装置及びプログラム
JPWO2019160070A1 (ja) 異常音検知装置および異常音検知方法
JP6994922B2 (ja) 会話認識記録システム
JP2013125304A (ja) 並列映像解析装置、並列映像解析方法及び並列映像解析プログラム
JP7025303B2 (ja) 音響システム
JPH0829209A (ja) 操作性評価システム
JP7000926B2 (ja) スピーカの接続状態判定システム、音響装置及びスピーカの接続状態判定方法
KR100886345B1 (ko) 디지털 비디오 레코더 및 이의 동작 방법 및 이를 이용하는영상관제시스템
WO2019183894A1 (zh) 一种设备间的数据迁移的方法和设备
JP2021081354A (ja) 音響特性測定システム、音響特性測定方法、および音響特性測定プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180514

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190305

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190318

R150 Certificate of patent or registration of utility model

Ref document number: 6507946

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150