TWI838587B - 音源定位裝置、音源定位方法及記錄媒體 - Google Patents
音源定位裝置、音源定位方法及記錄媒體 Download PDFInfo
- Publication number
- TWI838587B TWI838587B TW109136102A TW109136102A TWI838587B TW I838587 B TWI838587 B TW I838587B TW 109136102 A TW109136102 A TW 109136102A TW 109136102 A TW109136102 A TW 109136102A TW I838587 B TWI838587 B TW I838587B
- Authority
- TW
- Taiwan
- Prior art keywords
- sound source
- information
- sound
- microphone array
- source localization
- Prior art date
Links
- 230000004807 localization Effects 0.000 title claims abstract description 146
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000004364 calculation method Methods 0.000 claims abstract description 56
- 239000006185 dispersion Substances 0.000 claims abstract description 16
- 238000003491 array Methods 0.000 claims description 13
- 238000007476 Maximum Likelihood Methods 0.000 claims description 5
- 230000003111 delayed effect Effects 0.000 claims description 5
- SAZUGELZHZOXHB-UHFFFAOYSA-N acecarbromal Chemical compound CCC(Br)(CC)C(=O)NC(=O)NC(C)=O SAZUGELZHZOXHB-UHFFFAOYSA-N 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 21
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000001133 acceleration Effects 0.000 description 4
- 101100268668 Caenorhabditis elegans acc-2 gene Proteins 0.000 description 3
- 101100012902 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) FIG2 gene Proteins 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 101001121408 Homo sapiens L-amino-acid oxidase Proteins 0.000 description 1
- 101000827703 Homo sapiens Polyphosphoinositide phosphatase Proteins 0.000 description 1
- 102100026388 L-amino-acid oxidase Human genes 0.000 description 1
- 102100023591 Polyphosphoinositide phosphatase Human genes 0.000 description 1
- 101100373202 Rattus norvegicus Cx3cl1 gene Proteins 0.000 description 1
- 101100233916 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) KAR5 gene Proteins 0.000 description 1
- 229910000831 Steel Inorganic materials 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
Abstract
音源定位裝置(100)係具有:取得部(120),其係取得表示升降機的梯廂(503)所移動的升降路內的聲音的聲音資料、用以定位梯廂(503)的位置的資訊、表示麥克風陣列(200)的位置與方向的麥克風陣列資訊(112)、及音源定位資訊(113);算出部(10),其係根據聲音資料與預先決定的方法,算出複數機率密度,且算出複數機率密度之中的最大值的倒數或根據複數機率密度的分散值的倒數亦即第1倒數;梯廂位置定位部(160),其係根據用以定位梯廂(503)的位置的資訊,定位梯廂(503)的位置;及音源定位部(170),其係根據第1臨限值與第1倒數的關係、麥克風陣列資訊(112)、梯廂(503)的位置、及音源定位資訊(113),定位音源。
Description
本揭示係關於音源定位裝置、音源定位方法、及記錄有音源定位程式的記錄媒體。
已知有麥克風。對麥克風係輸入聲音。在此,提案出一種推定聲音的到來方向的技術(參照專利文獻1)。專利文獻1的音源位置推定裝置係推定聲音的到來方向。
〔專利文獻1〕日本特開2010-213091號公報
但是,在升降機的升降路,聲音大多作反射。在聲音大多作反射的環境中,係難以定位音源。
本揭示之目的在輕易定位音源。
提供本揭示之一態樣之音源定位裝置。音源定位裝置係具有:取得部,其係取得表示升降機的梯廂所移動的升降路內的聲音的聲音資料、用以定位前述梯廂的位置的資訊、表示被輸入前述聲音的麥克風陣列的位置與前述
麥克風陣列的方向的麥克風陣列資訊、及用以定位前述聲音的音源的資訊亦即音源定位資訊;算出部,其係根據前述聲音資料與預先決定的方法,算出分別表示複數音源方向候補的機率密度的複數機率密度,且算出前述複數機率密度之中的最大值的倒數或根據前述複數機率密度的分散值的倒數亦即第1倒數;梯廂位置定位部,其係根據用以定位前述梯廂的位置的資訊,定位前述梯廂的位置;及音源定位部,其係根據預先設定的第1臨限值與前述第1倒數的關係、前述麥克風陣列資訊、前述梯廂的位置、及前述音源定位資訊,定位前述音源。
藉由本揭示,可輕易定位音源。
10,10a:算出部
100,100a,100b:音源定位裝置
101:處理器
102:揮發性記憶裝置
103:非揮發性記憶裝置
104:通訊裝置
110,100a,110b:記憶部
111:升降路佈局
112,112b:麥克風陣列資訊
113,113a,113b:音源定位資訊
120,120a,120b:取得部
130:得分算出部
140,140a:精度算出部
150,150a:障礙物判定部
160:梯廂位置定位部
170,170a,170b:音源定位部
180:輸出部
191:模式定位部
192:同步處理部
200,201:麥克風陣列
300:輸出裝置
400:驅動裝置
501:壁面
502:梯廂導軌
503:梯廂
504:上導靴
505:下導靴
506:配重導軌
507:配重
508:配重上導靴
509:配重下導靴
〔圖1〕係顯示實施形態1的音源定位系統之例的圖。
〔圖2〕係顯示實施形態1的麥克風陣列被設置在梯廂之上時的具體例的圖。
〔圖3〕係顯示實施形態1的音源定位裝置所具有的功能區塊的圖。
〔圖4〕係顯示實施形態1的音源定位資訊之例的圖。
〔圖5〕係顯示實施形態1的聲音的收錄流程的流程圖。
〔圖6〕係顯示實施形態1的音源定位裝置所執行的處理之例的流程圖。
〔圖7〕係顯示實施形態2的音源定位裝置所具有的功能區塊的圖。
〔圖8〕係顯示實施形態2的音源定位資訊之例的圖。
〔圖9〕係實施形態2的升降路的水平剖面圖之例。
〔圖10〕係顯示實施形態2的各方向的得分之例的圖。
〔圖11〕(A)、(B)係實施形態2的複數模式之例的圖。
〔圖12〕係顯示實施形態3的音源定位裝置所具有的功能區塊的圖。
〔圖13〕係顯示實施形態3的音源定位資訊之例的圖。
以下一邊參照圖示,一邊說明實施形態。以下實施形態僅為例子,可在本揭示之範圍內作各種變更。
圖1係顯示實施形態1的音源定位系統之例的圖。音源定位系統係包含:音源定位裝置100、麥克風陣列200、輸出裝置300、及驅動裝置400。
音源定位裝置100係執行音源定位方法的裝置。例如,音源定位裝置100係升降機所配備的裝置。
麥克風陣列200係包含複數麥克風。在麥克風陣列200中,由複數麥克風的各個被輸出的聲音資料在完全同步的狀態下被輸出。此外,麥克風陣列200亦可裝載振動感測器、影像感測器、加速度感測器、角加速度感測器、或GPS(Global Positioning System,全球定位系統)感測器等。其中,該等感測器亦可設置在麥克風陣列200的附近。
例如,輸出裝置300係顯示器。例如,顯示器係LCD(Liquid Crystal Display,液晶顯示器)。此外,輸出裝置300亦可為揚聲器。
驅動裝置400係用以使音源定位裝置100移動的裝置。例如,驅動裝置400係馬達及滾輪。此外,若使用者在升降機設置音源定位裝置100,音源定位系統並不包含驅動裝置400。
接著,說明音源定位裝置100所具有的硬體。
音源定位裝置100係具有:處理器101、揮發性記憶裝置102、非揮發性記憶裝置103、及通訊裝置104。
處理器101係控制音源定位裝置100全體。例如,處理器101係CPU
(Central Processing Unit,中央處理單元)、GPU(Graphics Processing Unit,圖形處理單元)、FPGA(Field Programmable Gate Array,現場可程式閘陣列)等。處理器101亦可為多處理器。音源定位裝置100亦可具有處理電路,來替代處理器101。處理電路亦可為單一電路或複合電路。
揮發性記憶裝置102係音源定位裝置100的主記憶裝置。例如,揮發性記憶裝置102係RAM(Random Access Memory,隨機存取記憶體)。非揮發性記憶裝置103係音源定位裝置100的輔助記憶裝置。例如,非揮發性記憶裝置103係ROM(Read Only Memory,唯讀記憶體)、HDD(Hard Disk Drive,硬碟驅動機)或SSD(Solid State Drive,固體狀態驅動機)。揮發性記憶裝置102與非揮發性記憶裝置103係記憶各種資料及程式。
例如,通訊裝置104係有線LAN(Local Area Network,區域網路)轉接器、無線LAN轉接器、或Bluetooth(註冊商標)轉接器。其中,通訊裝置104亦可稱為通訊介面。通訊裝置104係與外部裝置進行通訊。
麥克風陣列200係設置在升降機的升降路。例如,麥克風陣列200係被設置在梯廂之上、梯廂之下、配重之上、或配重之下。其中,若麥克風陣列200被設置在梯廂之上,麥克風陣列200係與梯廂連動。在此,梯廂亦可稱為升降機梯廂。升降路亦可稱為升降機升降路。
此外,麥克風陣列200亦可設置在機坑(pit)部分、捲揚機附近、或不因升降機的升降運轉而變動位置的場所。麥克風陣列200亦可被固定在升降路。此外,使用者所持有的麥克風陣列200亦可藉由使用者而被設置在升降路。在此例示在梯廂之上設置麥克風陣列200的情形。
圖2係顯示實施形態1的麥克風陣列被設置在梯廂之上時的具體例的圖。圖2係顯示壁面501、梯廂導軌502、梯廂503、梯廂上導靴504、梯廂下導靴505、配重導軌506、配重507、配重上導靴508、及配重下導靴509。
壁面501係混凝土的壁面。梯廂導軌502係用以使梯廂503上下移動的軌條。梯廂上導靴504及梯廂下導靴505係梯廂導軌502與梯廂503的接合部。
配重導軌506係用以使配重507上下移動的軌條。配重上導靴508與配重下導靴509係配重導軌506與配重507的接合部。
接著,說明音源定位裝置100所具有的功能。
圖3係顯示實施形態1的音源定位裝置所具有的功能區塊的圖。音源定位裝置100係具有:記憶部110、取得部120、得分算出部130、精度算出部140、障礙物判定部150、梯廂位置定位部160、音源定位部170、及輸出部180。此外,取得部120及得分算出部130係包含在算出部10。
記憶部110亦可實現為揮發性記憶裝置102或非揮發性記憶裝置103所確保的記憶區域。
取得部120、得分算出部130、精度算出部140、障礙物判定部150、梯廂位置定位部160、音源定位部170、及輸出部180的部分或全部亦可藉由處理器101或處理電路來實現。此外,取得部120、得分算出部130、精度算出部140、障礙物判定部150、梯廂位置定位部160、音源定位部170、及輸出部180的部分或全部亦可實現為處理器101所執行的程式的模組。例如,處理器101所執行的程式亦稱為音源定位程式。例如,音源定位程式係被記錄在記錄媒體。
記憶部110係記憶升降路佈局111、麥克風陣列資訊112、及音源定位資訊113。
升降路佈局111係表示升降路的佈局的資訊。例如,升降路佈局111係表示壁面501、梯廂導軌502、梯廂503、配重導軌506、配重507、捲揚機、滑車、及各樓層的乘場側的門。例如,該等資訊係以座標表示。
麥克風陣列資訊112係表示設置麥克風陣列200的位置與麥克風陣列200的方向。例如,麥克風陣列資訊112係表示麥克風陣列200被設置在梯廂
503之上、及麥克風陣列200的正面與乘場側的方向相同。其中,乘場側的方向係指門打開的方向。
麥克風陣列資訊112亦可藉由使用者操作音源定位裝置100而作成。麥克風陣列資訊112亦可根據由被裝載在麥克風陣列200的影像感測器、或GPS感測器所得的資訊而作成。若麥克風陣列200裝載有信標,麥克風陣列資訊112亦可據藉由使用信標而得的資訊而作成。此外,麥克風陣列資訊112亦可如下所示作成。麥克風陣列200係裝載氣壓感測器。不同的氣壓感測器被設置在升降路的最下部。麥克風陣列資訊112係根據2個氣壓感測器的值的比較結果而作成。
音源定位資訊113係用以定位聲音的音源的資訊。在此,例示音源定位資訊113。
圖4係顯示實施形態1的音源定位資訊之例的圖。音源定位資訊113係儲存在記憶部110。音源定位資訊113係預先作成。音源定位資訊113係具有:No.、關係、麥克風陣列位置、麥克風陣列的方向、梯廂位置、障礙物、及音源的項目。例如,在No.的項目係登錄識別碼。此外,例如,在障礙物的項目係登錄表示是否存在障礙物的資訊。
關於音源定位資訊113的使用方法,容後說明。其中,被登錄在音源定位資訊113的資訊係若升降路佈局111被變更即變更。
返回至圖3,說明取得部120。
取得部120係取得聲音資料。例如,取得部120係由麥克風陣列200取得聲音資料。此外,例如,取得部120係由記錄有該聲音資料的記錄媒體,取得該聲音資料。若取得部120由記錄媒體取得該聲音資料,音源定位裝置100亦可考慮為PC(Personal Computer,個人電腦)。
其中,聲音資料係指表示升降機的梯廂503所移動的升降路內的
聲音的資料。此外,聲音資料係複數通道的聲音資料。
取得部120係取得升降路佈局111、麥克風陣列資訊112、及音源定位資訊113。例如,取得部120係由記憶部110取得升降路佈局111、麥克風陣列資訊112、及音源定位資訊113。在此,升降路佈局111、麥克風陣列資訊112、及音源定位資訊113亦可儲存在可與音源定位裝置100相連接的外部裝置。例如,外部裝置係伺服器。若在外部裝置儲存有升降路佈局111、麥克風陣列資訊112、及音源定位資訊113,取得部120係由外部裝置取得升降路佈局111、麥克風陣列資訊112、及音源定位資訊113。
取得部120係取得用以定位梯廂503的位置的資訊。其中,用以定位梯廂503的位置的資訊係使用者輸入至音源定位裝置100的資訊、或音源定位裝置100由麥克風陣列200等機器所接收到的資訊。關於用以定位梯廂503的位置的資訊,容後說明。
使用得分算出部130、及精度算出部140,說明算出部10的功能。
得分算出部130係根據聲音資料與預先決定的方法,算出分別表示複數音源方向候補的得分的複數得分。例如,預先決定的方法係指波束成形、延遲總和法、最大概似(Maximum Likelihood)法、最小分散(Minimum Variance)法、MUSIC(MUltiple Signal Classification)法、root-MUSIC法、最小模值法、或學習完畢模型。此外,預先決定的方法係指以下所示之得分的算出處理。在此,音源方向候補係有僅表現為方向的情形。
詳細說明得分的算出處理。得分算出部130係以預先設定的水平方向的分解能,算出每個水平角的得分。例如,若水平方向的分解能為10度,且360度為對象的範圍時,得分算出部130係算出36方向的得分。如上所示,得分算出部130係算出複數方向的各個的得分。在此,得分係以機率密度表示。接著,以各方向的得分合計後的值亦即合計值成為1.0的方式,各方向的得分以小數表
示。此外,得分係表示在對應得分的方向存在音源的機率。
此外,得分算出部130係可使用波束成形、延遲總和法、最大概似法、最小分散法、MUSIC法、root-MUSIC法、最小模值法、或學習完畢模型,算出各方向的訊號位準。得分算出部130係若算出各方向的訊號位準,使用式(1)或式(2),算出各方向的得分。其中,xi係表示各方向的訊號位準。yi係表示各方向的得分。N係表示方向數。此外,yi係成為1(=Σyi)。
精度算出部140係算出音源方向的分散值Var。分散值Var亦可為各方向的得分之中的最大值。此外,精度算出部140亦可根據各方面的得分,來算出分散值Var。詳言之,精度算出部140係以得分為最高的方向的yi為基準,來算出分散值Var。精度算出部140係若算出分散值Var,使用式(3),算出分散值Var。其中,di係表示水平角。例如,d0係表示0度。此外,例如,d35係表示350度。函數Diff(di,dj)係表示水平角di與水平角dj的差。此外,yi為最大值之時的方向係設為dMAX。
其中,例如,函數Diff(d10,d20)係10。函數Diff(d10,d350)係20。水平角係0度或360度。因此,精度算出部140係考慮周繞而算出角度的差。
接著,精度算出部140係將分散值Var的倒數算出作為精度Acc。詳言之,精度算出部140係使用式(4),算出精度Acc。
〔數式4〕Acc=1/Var…(4)
如上所示,所算出的精度Acc係各方向的得分之中的最大值的倒數、或根據各方向的得分的分散值Var的倒數。其中,精度Acc亦稱為第1倒數。
此外,精度Acc亦可表現如下。精度Acc係在各方向的得分之中,最大的得分的方向的標準偏差的倒數。
障礙物判定部150係使用精度Acc與2個臨限值,判定在音源與麥克風陣列200之間是否存在障礙物。2個臨限值係指Acc1與Acc2。Acc1與Acc2係預先設定的值。Acc1與Acc2係儲存在記憶部110。其中,Acc2係大於Acc1(亦即Acc1<Acc2)。此外,例如,該障礙物係指梯廂503、或配重507。
若“Acc<Acc1”,障礙物判定部150係判定為精度低的狀態。精度低的狀態係指由音源所發出的聲音在壁面501等作反射及擴散,因此無法定位音源方向的狀態。障礙物判定部150係判定音源存在於比麥克風陣列200更為遠方。此係基於由遠方發出的聲音在壁面501作反射,該聲音以麥克風陣列200的全方向以大致相同程度的訊號位準到達,而且該聲音以隨機的相位差到達麥克風陣列200之故。
若為“Acc<Acc1”,障礙物判定部150係判定在音源與麥克風陣列200之間不存在障礙物。此外,若為“Acc<Acc1”,障礙物判定部150亦可藉由使用者的設定,判定為存在障礙物。
若為“Acc1≦Acc<Acc2”,障礙物判定部150係判定為精度為一定程度高的狀態。精度為一定程度高的狀態係指在由音源所發出的聲音因障礙物而以一定程度受到限制的狀態下,被輸入至麥克風陣列200的狀態。例如,障礙物判定部150係取得藉由後述之梯廂位置定位部160所被定位出的梯廂503的位置與配重507的位置、升降路佈局111、及麥克風陣列資訊112。障礙物判定部150
係若梯廂503的位置為升降路的上部,判定在音源與麥克風陣列200之間存在梯廂503作為障礙物。
若為“Acc1≦Acc<Acc2”,障礙物判定部150係判定在音源與麥克風陣列200之間存在障礙物。
若為“Acc2≦Acc”,障礙物判定部150係判定為精度高的狀態。精度高的狀態係指音源與麥克風陣列200之間的距離短的狀態。若為“Acc2≦Acc”,障礙物判定部150係判定在音源與麥克風陣列200之間不存在障礙物。
梯廂位置定位部160係根據用以定位梯廂503的位置的資訊,定位梯廂503的垂直方向的位置。在此,例如,用以定位梯廂503的位置的資訊係表示梯廂503的速度及梯廂503的移動時間。在此,例如,預先設定梯廂503的初期位置。梯廂位置定位部160係根據梯廂503由初期位置所移動的時間(亦即,梯廂503的移動時間)、與梯廂503的速度,來定位梯廂503的位置。此外,例如,用以定位梯廂503的位置的資訊係表示由加速度感測器所得的資訊及梯廂503的移動時間。梯廂位置定位部160亦可根據由加速度感測器所得的資訊與該時間,來定位梯廂503的位置。此外,例如,用以定位梯廂503的位置的資訊係WiFi(註冊商標)的存取點的電波強度、Bluetooth的信標的電波強度、或由影像感測器所得的資訊。梯廂位置定位部160亦可根據WiFi的存取點的電波強度、Bluetooth的信標的電波強度、或由影像感測器所得的資訊,來定位梯廂503的位置。梯廂位置定位部160亦可使用習知技術,來定位梯廂503的位置。
此外,梯廂位置定位部160係定位配重507的位置。在此,梯廂503與配重507係以鋼索相連。因此,若定位出梯廂503的位置,係定位配重507的大概位置。但是,梯廂503與配重507的位置關係係依梯廂個體而異。因此,使用升降路佈局111。因此,梯廂位置定位部160係若定位配重507的位置,根據梯廂503的位置與升降路佈局111,來定位配重507的位置。
音源定位部170係使用音源定位資訊113來定位音源。在此,說明音源定位資訊113的使用方法。音源定位部170係在精度算出部140所算出的精度Acc與臨限值Acc1與臨限值Acc2的關係、麥克風陣列資訊112所示之麥克風陣列200的位置與方向、藉由梯廂位置定位部160所被定位出之梯廂503的位置、及藉由障礙物判定部150所為之判定的結果,由音源定位資訊113之中檢索相一致的記錄。所被檢索到的記錄的音源的項目所登錄的資訊為音源。例如,若所被檢索到的記錄為No.1的記錄,音源定位部170係定位存在於比梯廂503為更上的機器為音源。其中,例如,該機器係配重507、導靴、捲揚機等。如上所示,音源定位資訊113係精度Acc與臨限值Acc1與臨限值Acc2的關係、麥克風陣列200的位置與方向、梯廂503的位置、及表示是否存在障礙物的資訊。接著,音源定位部170係可使用音源定位資訊113,來定位音源。
在此,音源定位資訊113亦可不具有障礙物的項目。若音源定位資訊113不具有障礙物的項目,音源定位部170係在精度算出部140所算出的精度Acc與臨限值Acc1與臨限值Acc2的關係、麥克風陣列資訊112所示之麥克風陣列200的位置與方向、及藉由梯廂位置定位部160所被定位出的梯廂503的位置,由音源定位資訊113之中檢索相一致的記錄。
此外,音源定位資訊113的No.1、No.4、及No.5的關係的項目所示之臨限值Acc1或臨限值Acc2亦可稱為第1臨限值。音源定位資訊113的No.2、及No.3的關係的項目所示之臨限值Acc1亦可稱為第1臨限值。音源定位資訊113的No.2、及No.3的關係的項目所示之臨限值Acc2亦可稱為第2臨限值。音源定位資訊113的No.4、及No.5的關係的項目所示之臨限值Acc2亦可稱為第2臨限值。
此外,音源定位資訊113亦可表示精度Acc與臨限值Acc1的關係、及精度Acc與臨限值Acc2的關係。亦即,音源定位資訊113亦可不包含No.2與No.3的記錄。
其中,若被檢索到的記錄為No.4或No.5的記錄,音源定位部170係定位音源方向所存在的機器為音源。此時,音源定位部170係將與得分算出部130所算出的各方向的得分之中的最大值相對應的方向設為音源方向。音源定位部170係根據麥克風陣列資訊112所示之麥克風陣列200的位置與音源方向與升降路佈局111,由升降路佈局111之中定位音源。
輸出部180係將表示音源的資訊輸出至輸出裝置300。例如,若輸出裝置300為顯示器,輸出部180係將表示音源的資訊輸出至顯示器。藉此,顯示器係顯示表示音源的資訊。此外,例如,若輸出裝置300為揚聲器,輸出部180係將表示音源的資訊輸出至揚聲器。藉此,揚聲器係以聲音輸出表示音源的資訊。
接著,使用流程圖,說明一連串流程。首先,例如,使用者係在升降路設置麥克風陣列200。使用者係將設置麥克風陣列200的位置與麥克風陣列200的方向輸入至音源定位裝置100。藉此,音源定位裝置100係作成麥克風陣列資訊112。接著,聲音的收錄準備即完成。使用流程圖,說明聲音的收錄。
圖5係顯示實施形態1的聲音的收錄流程的流程圖。
(步驟S11)麥克風陣列200係開始收錄。
(步驟S12)梯廂503係在升降路移動。詳言之,梯廂503係上升或下降。
在麥克風陣列200係被輸入升降路內的聲音。
(步驟S13)麥克風陣列200係結束收錄。
接著,使用流程圖,說明音源定位裝置100所執行的處理。
圖6係顯示實施形態1的音源定位裝置所執行的處理之例的流程圖。
(步驟S21)取得部120係取得麥克風陣列200所收錄到的聲音的聲音資料等。
(步驟S22)得分算出部130係使用音源資料,算出複數方向的各個的得分。
(步驟S23)精度算出部140係使用複數音源方向候補的各個的得分,算出分散值Var。
(步驟S24)精度算出部140係使用分散值Var,算出精度Acc。
(步驟S25)梯廂位置定位部160係使用用以定位梯廂503的位置的資訊,來定位梯廂503的位置。
(步驟S26)障礙物判定部150係使用精度Acc與臨限值Acc1與臨限值Acc2,判定障礙物的存在。
(步驟S27)音源定位部170係使用音源定位資訊113,來定位音源。
(步驟S28)輸出部180係將表示音源的資訊輸出至輸出裝置300。
藉由實施形態1,音源定位裝置100係可使用表示升降路內的聲音的聲音資料,來定位音源。此外,音源定位裝置100係不執行複雜的處理,而使用音源定位資訊113來定位音源。因此,音源定位裝置100係可輕易定位音源。
接著,說明實施形態2。在實施形態2中,主要說明與實施形態1相異的事項。接著,在實施形態2中,係省略與實施形態1共通的事項的說明。在實施形態2的說明中,係參照圖1~3。
在實施形態1中,係使用2個臨限值(亦即臨限值Acc1與臨限值Acc2),判定出障礙物的存在。在實施形態2中,係說明使用1個臨限值(亦即臨限值Acc2),判定障礙物的存在的情形。
圖7係顯示實施形態2的音源定位裝置所具有的功能區塊的圖。與圖3所示之構成相同的圖7的構成係標註與圖3所示之符號相同的符號。
音源定位裝置100a係具有:記憶部110a、取得部120a、精度算出部140a、障礙物判定部150a、音源定位部170a、及模式定位部191。得分算出部130與精度算出部140a係包含在算出部10a。
記憶部110a係記憶音源定位資訊113a。在此,例示音源定位資訊113a。
圖8係顯示實施形態2的音源定位資訊之例的圖。音源定位資訊113a係在音源定位資訊113追加模式的項目的資訊。關於模式,容後說明。
此外,音源定位資訊113a的關係的項目所登錄的資訊與音源定位資訊113的關係的項目所登錄的資訊不同。在此,音源定位資訊113a的關係的項目所登錄的臨限值Acc2亦稱為第1臨限值。
返回圖7,說明音源定位裝置100a。
得分算出部130係算出各方向的得分。精度算出部140a係判定比各方向的得分的平均為更高的得分存在一定區間的方向是否存在於複數方向之中。使用圖9及圖10,說明該判定。
圖9係實施形態2的升降路的水平剖面圖之例。圖9係顯示麥克風陣列200、梯廂導軌502、配重導軌506、及配重507。此外,圖9係顯示麥克風陣列200的正面方向。
圖10係顯示實施形態2的各方向的得分之例的圖。圖10係顯示根據表示在圖9的狀態下被收錄到的聲音的聲音資料所被算出的各方向的得分。實線係表示各方向的得分。虛線係表示各方向的得分的平均。
例如,在圖10中,比各方向的得分的平均為更高的得分存在一定區間的方向係背面。若比各方向的得分的平均為更高的得分存在一定區間的方向存在於複數方向之中,精度算出部140a係將各方面的得分傳送至障礙物判定部150a。
若為“Acc<Acc2”,障礙物判定部150a係判定在音源與麥克風陣列200之間存在障礙物。此外,模式定位部191係比較得分算出部130所算出的各方向的得分、與複數得分的複數模式。該複數得分亦稱為複數第1機率密度。在此,例示複數模式。
圖11(A)、(B)係顯示實施形態2的複數模式之例的圖。圖11(A)係設為模式1。圖11(B)係設為模式2。在圖11中係顯示2個模式。模式數亦可為3個以上。其中,例如,複數模式係被儲存在記憶部110。
取得部120a係取得表示複數模式的資訊。
模式定位部191係由複數模式之中,定位適合於得分算出部130所算出的各方向的得分的模式。例如,模式定位部191係在模式1、2之中,判定得分算出部130所算出的各方向的得分適合哪個模式。此外,模式定位部191亦可使用均方誤差,判定得分算出部130所算出的各方向的得分適合哪個模式。
若為“Acc2≦Acc”,障礙物判定部150a係判定在音源與麥克風陣列200之間不存在障礙物。此外,若為“Acc2≦Acc”,模式定位部191並不執行上述複數模式的適合處理。
音源定位部170a係在精度算出部140所算出的精度Acc與臨限值Acc2的關係、模式定位部191所定位出的模式、麥克風陣列資訊112所示之麥克風陣列200的位置與方向、藉由梯廂位置定位部160所被定位出的梯廂503的位置、及藉由障礙物判定部150a所為之障礙物的判定結果,由音源定位資訊113a之中檢索相一致的記錄。所被檢索到的記錄的音源的項目所登錄的資訊為音源。如上所示,音源定位部170a係可使用音源定位資訊113a,來定位音源。
在實施形態2中,並未使用Acc1。因此,使用者未進行設定Acc1的作業即可。因此藉由實施形態2,減輕使用者的負擔。
接著,說明實施形態3。在實施形態3中,主要說明與實施形態1相異的事項。接著,在實施形態3中,係省略與實施形態1共通的事項的說明。在實施形態3的說明中,係參照圖1~6。
在實施形態1、2中,係說明使用1個麥克風陣列的情形。在實施形態3中,
係說明使用複數麥克風陣列的情形。
圖12係顯示實施形態3的音源定位裝置所具有的功能區塊的圖。音源定位裝置100b係與麥克風陣列200、201相連接。例如,麥克風陣列200係設置在梯廂503之上。麥克風陣列201係設置在配重507之上。在圖12中係例示2個麥克風陣列。麥克風陣列數亦可為3個以上。此外,收錄聲音時,在麥克風陣列200、201係被輸入同步訊號。亦即,在步驟S11之時,在麥克風陣列200、201係被輸入同步訊號。
音源定位裝置100b係具有:記憶部110b、取得部120b、及同步處理部192。與圖3所示之構成相同的圖12的構成係標註與圖3所示之符號相同的符號。記憶部110b係記憶:麥克風陣列資訊112b、及音源定位資訊113b。
麥克風陣列資訊112b係表示麥克風陣列200、201的位置與麥克風陣列200、201的方向。接著,例示音源定位資訊113b。
圖13係顯示實施形態3的音源定位資訊之例的圖。在音源定位資訊113b係以麥克風陣列數,追加關係、麥克風陣列位置、麥克風陣列的方向、梯廂位置、障礙物的項目。
圖13係顯示對應麥克風陣列1的關係等的項目。其中,麥克風陣列1係麥克風陣列200。此外,圖13係顯示對應麥克風陣列2的關係等的項目。其中,麥克風陣列2係麥克風陣列201。
簡單說明音源定位資訊113b的使用方法。音源定位裝置100b係根據表示被輸入至麥克風陣列200的聲音的聲音資料,由麥克風陣列1之欄位之中檢索相對應之行。音源定位裝置100b係根據表示被輸入至麥克風陣列201的聲音的聲音資料,由麥克風陣列2之欄位之中檢索相對應之行。2行相一致的記錄的音源的項目所登錄的資訊為音源。如上所示,音源定位裝置100b係定位音源。
取得部120b係取得表示被輸入至麥克風陣列200的聲音的聲音資
料、與表示被輸入至麥克風陣列201的聲音的聲音資料。
此外,取得部120b係取得用以定位梯廂503的位置的資訊、麥克風陣列資訊112b、及音源定位資訊113b。
同步處理部192係以該同步訊號為基準,使表示被輸入至麥克風陣列200的聲音的聲音資料、與表示被輸入至麥克風陣列201的聲音的聲音資料同步。
算出部10、障礙物判定部150、及梯廂位置定位部160係針對複數聲音資料的各個,執行與實施形態1相同的處理。例如,算出部10係根據表示被輸入至麥克風陣列200的聲音的聲音資料、與表示被輸入至麥克風陣列201的聲音的聲音資料,算出與2個聲音資料的各個相對應的精度Acc。
音源定位部170b係根據與2個聲音資料的各個相對應的精度Acc與臨限值Acc1與臨限值Acc2的關係、麥克風陣列資訊112b、藉由梯廂位置定位部160被定位出的梯廂503的位置、藉由障礙物判定部150所為之判定的結果、及音源定位資訊113b,來定位音源。
此外,音源定位資訊113b亦可不具有障礙物的項目。若音源定位資訊113b不具有障礙物的項目,音源定位部170b係未使用藉由障礙物判定部150所為之判定的結果,來定位音源。
藉由實施形態3,音源定位裝置100b係使用由複數麥克風陣列被輸出的聲音資料來定位音源,因此可定位更為正確的音源。
以上說明的各實施形態中的特徵係可彼此適當組合。
10:算出部
100:音源定位裝置
110:記憶部
111:升降路佈局
112:麥克風陣列資訊
113:音源定位資訊
120:取得部
130:得分算出部
140:精度算出部
150:障礙物判定部
160:梯廂位置定位部
170:音源定位部
180:輸出部
Claims (11)
- 一種音源定位裝置,其係具有:取得部,其係取得表示升降機的梯廂所移動的升降路內的聲音的聲音資料、用以定位前述梯廂的位置的資訊、表示被輸入前述聲音的麥克風陣列的位置與前述麥克風陣列的方向的麥克風陣列資訊、及用以定位前述聲音的音源的資訊亦即音源定位資訊;算出部,其係根據前述聲音資料與預先決定的方法,算出分別表示複數音源方向候補的機率密度的複數機率密度,且算出前述複數機率密度之中的最大值的倒數或根據前述複數機率密度的分散值的倒數亦即第1倒數,其中,前述預先決定的方法係指波束成形、延遲總和法、最大概似(Maximum Likelihood)法、最小分散(Minimum Variance)法、MUSIC(Multiple Signal Classification)法、root-MUSIC法、最小模值法、或學習完畢模型;梯廂位置定位部,其係根據用以定位前述梯廂的位置的資訊,定位前述梯廂的位置;及音源定位部,其係根據預先設定的第1臨限值與前述第1倒數的關係、前述麥克風陣列資訊、前述梯廂的位置、及前述音源定位資訊,定位前述音源。
- 如請求項1之音源定位裝置,其中另外具有:障礙物判定部,其係根據前述第1臨限值與前述第1倒數的關係,判定在前述音源與前述麥克風陣列之間是否存在障礙物,前述音源定位部係根據前述第1臨限值與前述第1倒數的關係、前述麥克風陣列資訊、前述梯廂的位置、前述判定的結果、及前述音源定位資訊,定位前述音源。
- 如請求項1或請求項2之音源定位裝置,其中另外具有:模式定位部, 前述取得部係取得表示複數第1機率密度的複數模式的資訊,前述模式定位部係若比前述複數機率密度的平均為較高的機率密度存在一定區間的音源方向候補存在於前述複數音源方向候補之中,而且前述第1倒數小於前述第1臨限值時,由前述複數模式之中,定位適合前述複數機率密度的模式,前述音源定位部係根據前述第1臨限值與前述第1倒數的關係、所定位出的模式、前述麥克風陣列資訊、前述梯廂的位置、及前述音源定位資訊,定位前述音源。
- 如請求項1之音源定位裝置,其中前述音源定位部係根據前述第1臨限值與預先設定的第2臨限值與前述第1倒數的關係、前述麥克風陣列資訊、前述梯廂的位置、及前述音源定位資訊,定位前述音源,前述第2臨限值係大於前述第1臨限值。
- 如請求項4之音源定位裝置,其中另外具有:障礙物判定部,其係根據前述第1臨限值與前述第2臨限值與前述第1倒數的關係,判定在前述音源與前述麥克風陣列之間是否存在障礙物,前述音源定位部係根據前述第1臨限值與前述第2臨限值與前述第1倒數的關係、前述麥克風陣列資訊、前述梯廂的位置、前述判定的結果、及前述音源定位資訊,定位前述音源。
- 如請求項1之音源定位裝置,其中另外具有:同步處理部,前述取得部係取得由被輸入前述聲音的複數麥克風陣列所被輸出的複數聲音資料、用以定位前述梯廂的位置的資訊、表示前述複數麥克風陣列的位置與前述複數麥克風陣列的方向的前述麥克風陣列資訊、及前述音源定位資訊,前述同步處理部係使前述複數聲音資料同步,前述算出部係根據前述複數聲音資料,算出與前述複數聲音資料的各個相對應的前述第1倒數, 前述音源定位部係根據與前述複數聲音資料的各個相對應的前述第1倒數與前述第1臨限值的關係、前述麥克風陣列資訊、前述梯廂的位置、及前述音源定位資訊,定位前述音源。
- 如請求項6之音源定位裝置,其中前述音源定位部係根據與前述複數聲音資料的各個相對應的前述第1倒數與前述第1臨限值與預先設定的第2臨限值的關係、前述麥克風陣列資訊、前述梯廂的位置、及前述音源定位資訊,定位前述音源,前述第2臨限值係大於前述第1臨限值。
- 如請求項1或請求項2之音源定位裝置,其中用以定位前述梯廂的位置的資訊係表示前述梯廂的速度及前述梯廂的移動時間,前述梯廂位置定位部係根據前述梯廂的速度及前述梯廂的移動時間,定位前述梯廂的位置。
- 如請求項1或請求項2之音源定位裝置,其中另外具有:輸出表示前述音源的資訊的輸出部。
- 一種音源定位方法,其係由音源定位裝置取得表示升降機的梯廂所移動的升降路內的聲音的聲音資料、用以定位前述梯廂的位置的資訊、表示被輸入前述聲音的麥克風陣列的位置與前述麥克風陣列的方向的麥克風陣列資訊、及用以定位前述聲音的音源的資訊亦即音源定位資訊,根據前述聲音資料與預先決定的方法,算出分別表示複數音源方向候補的機率密度的複數機率密度,其中,前述預先決定的方法係指波束成形、延遲總和法、最大概似(Maximum Likelihood)法、最小分散(Minimum Variance)法、MUSIC(Multiple Signal Classification)法、root-MUSIC法、最小模值法、或學習完畢模型,算出前述複數機率密度之中的最大值的倒數或根據前述複數機率密度的分 散值的倒數亦即第1倒數,根據用以定位前述梯廂的位置的資訊,定位前述梯廂的位置,根據預先設定的第1臨限值與前述第1倒數的關係、前述麥克風陣列資訊、前述梯廂的位置、及前述音源定位資訊,定位前述音源。
- 一種記錄媒體,其係記錄有使音源定位裝置執行以下處理的音源定位程式,其係:取得表示升降機的梯廂所移動的升降路內的聲音的聲音資料、用以定位前述梯廂的位置的資訊、表示被輸入前述聲音的麥克風陣列的位置與前述麥克風陣列的方向的麥克風陣列資訊、及用以定位前述聲音的音源的資訊亦即音源定位資訊,根據前述聲音資料與預先決定的方法,算出分別表示複數音源方向候補的機率密度的複數機率密度,其中,前述預先決定的方法係指波束成形、延遲總和法、最大概似(Maximum Likelihood)法、最小分散(Minimum Variance)法、MUSIC(Multiple Signal Classification)法、root-MUSIC法、最小模值法、或學習完畢模型,算出前述複數機率密度之中的最大值的倒數或根據前述複數機率密度的分散值的倒數亦即第1倒數,根據用以定位前述梯廂的位置的資訊,定位前述梯廂的位置,根據預先設定的第1臨限值與前述第1倒數的關係、前述麥克風陣列資訊、前述梯廂的位置、及前述音源定位資訊,定位前述音源。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/018774 WO2021229628A1 (ja) | 2020-05-11 | 2020-05-11 | 音源特定装置、音源特定方法、及び音源特定プログラム |
WOPCT/JP2020/018774 | 2020-05-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202143218A TW202143218A (zh) | 2021-11-16 |
TWI838587B true TWI838587B (zh) | 2024-04-11 |
Family
ID=
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180257908A1 (en) | 2015-09-28 | 2018-09-13 | Inventio Ag | Elevator arrangement adapted for determining positions of fixtures at various floors based on sound measurements |
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180257908A1 (en) | 2015-09-28 | 2018-09-13 | Inventio Ag | Elevator arrangement adapted for determining positions of fixtures at various floors based on sound measurements |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021072710A1 (zh) | 移动物体的点云融合方法、系统及计算机存储介质 | |
US20120129546A1 (en) | Path progression matching for indoor positioning systems | |
WO2018221455A1 (ja) | 更新装置、制御方法、プログラム及び記憶媒体 | |
EP3631755A1 (en) | Method and apparatus for representing environmental elements, system, and vehicle/robot | |
US20140214427A1 (en) | Landmark based positioning with verbal input | |
WO2018221454A1 (ja) | 地図作成装置、制御方法、プログラム及び記憶媒体 | |
CN103858497A (zh) | 用于提供基于位置的信息的方法和设备 | |
WO2019237319A1 (en) | Incremental segmentation of point cloud | |
US20200264005A1 (en) | Electronic apparatus and controlling method thereof | |
KR102516002B1 (ko) | 조사로봇기반 실내 공간 측위·매핑 방법 및 장치 | |
TWI838587B (zh) | 音源定位裝置、音源定位方法及記錄媒體 | |
JP2012208782A (ja) | 移動予測装置、ロボット制御装置、移動予測プログラムおよび移動予測方法 | |
US10620303B2 (en) | Distance measurement device, distance measurement system and distance measurement method | |
KR20200049390A (ko) | 라이다의 멀티 레이어 데이터를 클러스터링하는 방법 및 이를 이용한 컴퓨팅 장치 | |
JP7204998B2 (ja) | 音源特定装置、音源特定方法、及び音源特定プログラム | |
JP2010152787A (ja) | 環境地図生成プログラム、環境地図生成方法及び移動ロボット | |
KR20220023014A (ko) | 센서 출력 신뢰도 조정 장치 및 그의 센서 출력 신뢰도 조정 방법 | |
JP5078669B2 (ja) | 目標検出装置、目標検出方法及び目標検出プログラム | |
JP5157779B2 (ja) | 緊急地震速報装置、緊急地震速報方法、および緊急地震速報プログラム | |
WO2021024685A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP5462597B2 (ja) | 物体測定システム及びその方法 | |
US20220282987A1 (en) | Information processing system, information processing device, and information processing method | |
WO2022118367A1 (ja) | 音源方向推定装置、プログラム及び音源方向推定方法 | |
US20210402594A1 (en) | Parameter adjustment device, parameter adjustment method, and program | |
JP3156784B2 (ja) | 音響探信儀調定諸元最適化装置 |