TWI736304B - 移動與活動行為識別方法及電腦可讀媒介 - Google Patents

移動與活動行為識別方法及電腦可讀媒介 Download PDF

Info

Publication number
TWI736304B
TWI736304B TW109118458A TW109118458A TWI736304B TW I736304 B TWI736304 B TW I736304B TW 109118458 A TW109118458 A TW 109118458A TW 109118458 A TW109118458 A TW 109118458A TW I736304 B TWI736304 B TW I736304B
Authority
TW
Taiwan
Prior art keywords
trajectory
base station
staying
segment
record
Prior art date
Application number
TW109118458A
Other languages
English (en)
Other versions
TW202147895A (zh
Inventor
呂栢頤
丁鼎軒
Original Assignee
中華電信股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中華電信股份有限公司 filed Critical 中華電信股份有限公司
Priority to TW109118458A priority Critical patent/TWI736304B/zh
Application granted granted Critical
Publication of TWI736304B publication Critical patent/TWI736304B/zh
Publication of TW202147895A publication Critical patent/TW202147895A/zh

Links

Images

Landscapes

  • Position Fixing By Use Of Radio Waves (AREA)
  • Navigation (AREA)

Abstract

本發明係提供一種移動與活動行為識別方法,係整合行動裝置之GPS定位紀錄、基地台連網紀錄及公眾WiFi熱點連網紀錄等數據以對用戶之移動與活動行為進行分析,故能更精準分析用戶之移動與停留軌跡,並且藉由將用戶之軌跡段與活動序列資料整合並以視覺化方式呈現,故能清楚地呈現用戶之移動與活動之情境。本發明復提供一種電腦可讀媒介,係用於執行本發明之移動與活動行為識別方法。

Description

移動與活動行為識別方法及電腦可讀媒介
本發明係關於移動通信技術,尤其是關於識別用戶移動與活動行為之方法及電腦可讀媒介。
隨著行動通訊服務的普及,用戶(即,持有行動裝置之用戶)的通話、上網與活動等行為皆可以被收集。舉例來說,用戶在使用行動裝置期間與核心網路基地台(Base Station,BS)、公眾Wi-Fi熱點(Hotspot)間的連線資訊或行動裝置發出的全球衛星定位(GPS)訊號皆可被識別為用戶的移動軌跡且能輕易取得。因此,在用戶對網路的使用需求愈加依賴的趨勢下,獲得大量的用戶移動軌跡資料也愈加簡單,並進一步引發新的商業模式或服務,例如提供旅遊行程推薦或廣告行銷投放等適地性應用。
現行高精準度的定位技術中包括利用通信網路中三個以上的基地台與行動裝置之間傳播的無線電訊號進行三點定位、或是利用全球衛星定位系統(GPS)進行定位。然而,上述之定位方法並無考慮用戶移動前後之關聯性或用戶從事之活動與移動間的關聯,因此不能明確描繪用戶之移動與活動的真實情境(context),亦不能有效協助現行各類適地性應用(例如,電信公司提供之適地性 應用)深入了解用戶之移動與活動行為的資訊。舉例來說,當定位到某用戶位在靠近台北世貿中心的經緯度(121.5623,25.0340)處時,單就定位資訊無法使適地性應用有效判斷此用戶是在此經緯度處參加活動或是即將前往鼎泰豐101店用餐。
因此,如何明確分析用戶之移動與活動關聯之真實情境,以協助適地性應用深入了解用戶之移動性與活動行為,係本技術領域之重要課題之一。
為解決上述之問題,本發明提供一種移動與活動行為識別方法,包括:正規化圖資以建立地標資料庫及道路資料庫;執行多源軌跡點數據分段以標記行動裝置之軌跡段,其中,該軌跡段係紀錄有停留或移動之狀態資訊;以及根據各該軌跡段與該地標資料庫及該道路資料庫的圖資產製移動及活動行為輪廓資料表。
如前述之移動與活動行為識別方法,其中,該執行多源軌跡點數據分段定位以標記行動裝置之軌跡段之步驟係包括:以空間聚合及時間平滑方式標記該行動裝置與基地台連網之紀錄為基地台軌跡段,其中,該基地台軌跡段係紀錄有停留或移動之初始狀態資訊;以迴歸決策樹基於該基地台軌跡段之該初始狀態資訊與一般成人步行速率,標記該行動裝置之GPS定位紀錄為GPS定位軌跡段;將該些基地台軌跡段及GPS定位軌跡段依時間順序排序;根據該基地台軌跡段之該初始狀態資訊推估時間鄰近之該GPS定位軌跡段之停留或移動狀態;合併該些基地台軌跡段及該GPS定位軌跡段中,時間相鄰且該初始狀態資訊及該停留或移動狀態為相同者,以形成該行動裝置之該紀錄有停留與移動之該狀態資訊之該軌跡段;以及計算各該軌跡段中狀態資訊為停留者之停留位置中心、停留範圍及停留時間範圍。
如前述之移動與活動行為識別方法,其中,該根據該基地台軌跡段之該初始狀態資訊推估時間鄰近之該GPS定位軌跡段之停留或移動狀態之步驟係包括:根據該基地台軌跡段之該初始狀態資訊為停留者之定位分布計算中心點及標準差;標記時間相鄰該基地台軌跡段之該初始狀態資訊為停留者之該GPS定位軌跡段中,中心位置相距該中心點小於該標準差者之該停留或移動狀態為停留狀態;以及,標記該GPS定位軌跡段中剩餘未標記者之該停留或移動狀態為移動狀態。
如前述之移動與活動行為識別方法,其中,該計算各該軌跡段中狀態資訊為停留者之停留位置中心、停留範圍及停留時間範圍之步驟係包括:提取各該軌跡段中狀態資訊為停留者中對應之該行動裝置之GPS定位紀錄、該行動裝置與基地台連網之紀錄及該行動裝置與公眾WiFi熱點連網之紀錄;以及將該行動裝置之GPS定位紀錄、該行動裝置與基地台連網之紀錄及該行動裝置與公眾WiFi熱點連網之紀錄以加權平均計算為各該停留中心位置、各該停留範圍及各該停留時間範圍,其中,該加權平均計算係根據該行動裝置之GPS定位紀錄、該行動裝置與基地台連網之紀錄及該行動裝置與公眾WiFi熱點連網之紀錄的定位精準度使用對應之加權平均值。
如前述之移動與活動行為識別方法,其中,該根據各該軌跡段與該地標資料庫及該道路資料庫的圖資產製移動及活動行為輪廓資料表之步驟係包括:查找該地標資料庫以提取對應各該軌跡段中狀態資訊為停留者之地標;查找該道路資料庫以提取對應各該軌跡段中狀態資訊為移動者對應之道路;以及將各該地標及各該道路結合該行動裝置之活動序列紀錄以產製為該移動及活動行為輪廓資料表。
如前述之移動與活動行為識別方法,其中,該活動序列紀錄包括該行動裝置通話與上網之紀錄,並且其中,該查找該地標資料庫以提取對應各該 軌跡段中狀態資訊為停留者之地標之步驟復包括:解析該活動序列紀錄以獲得符合各該軌跡段中狀態資訊為停留者之停留範圍之候選地標;提取各該軌跡段中狀態資訊為停留者所記錄連網之基地台及公眾WiFi熱點並根據該地標資料庫轉換為候選地標;以及將該些候選地標中最接近各該軌跡段中狀態資訊為停留者之停留位置中心者辨識為該地標。
如前述之移動與活動行為識別方法,其中,該提取各該軌跡段中狀態資訊為停留者所記錄連網之基地台及公眾WiFi熱點並根據該地標資料庫轉換為候選地標之步驟係包括:以貝氏決策模型比較該基地台及該公眾WiFi熱點之屬性資料與該地標資料庫紀錄之地標之屬性資料的相似度,進而將該基地台及該公眾WiFi熱點轉換為該地標。
如前述之移動與活動行為識別方法,其中,該地標資料庫係包括以地標之經緯度雜湊計算之空間索引,並且其中,該道路資料庫係包括以道路之第一筆經緯度雜湊計算之空間索引。
如前述之移動與活動行為識別方法,復包括:將該移動及活動行為輪廓資料表轉換為地圖上之視覺化資料。
本發明復提供一種電腦可讀媒介,應用於計算裝置或電腦中,係儲存有指令,以執行上述之移動與活動行為識別方法。
綜上所述,本發明之移動與活動行為識別方法及電腦可讀媒介係整合行動裝置之GPS定位紀錄、基地台連網紀錄及公眾WiFi熱點連網紀錄等數據,以對用戶之移動與停留軌跡進行分析,藉由將用戶之軌跡段與活動序列資料整合,獲得更精準用戶之移動與活動行為輪廓資料表,並將結果整合以視覺化方式呈現,故能清楚地呈現用戶之移動與活動之情境。
S10~S50:步驟
S201~S202:步驟
S301~S304:步驟
S401~S404:步驟
圖1係本發明之移動與活動行為識別方法的步驟流程圖;
圖2係本發明之移動與活動行為識別方法的實施例示意圖;
圖3係本發明之移動與活動行為識別方法的實施例示意圖;
圖4係本發明之移動與活動行為識別方法的實施例示意圖;
圖5係本發明之移動與活動行為識別方法的實施例示意圖;
圖6係本發明之移動與活動行為識別方法的實施例示意圖;
圖7係本發明之移動與活動行為識別方法的階段步驟流程圖;
圖8係本發明之移動與活動行為識別方法的實施例示意圖;
圖9係本發明之移動與活動行為識別方法的實施例示意圖;
圖10係本發明之移動與活動行為識別方法的實施例示意圖;
圖11係本發明之移動與活動行為識別方法的實施例示意圖;
圖12係本發明之移動與活動行為識別方法的實施例示意圖;
圖13係本發明之移動與活動行為識別方法的實施例示意圖;
圖14係本發明之移動與活動行為識別方法的實施例示意圖;
圖15係本發明之移動與活動行為識別方法的階段步驟流程圖;
圖16係本發明之移動與活動行為識別方法的實施例示意圖;
圖17係本發明之移動與活動行為識別方法的實施例示意圖;
圖18係本發明之移動與活動行為識別方法的實施例示意圖;
圖19係本發明之移動與活動行為識別方法的實施例示意圖;
圖20係本發明之移動與活動行為識別方法的實施例示意圖;
圖21係本發明之移動與活動行為識別方法的實施例示意圖;
圖22係本發明之移動與活動行為識別方法的實施例示意圖;
圖23係本發明之移動與活動行為識別方法的階段步驟流程圖;
圖24係本發明之移動與活動行為識別方法的實施例示意圖;
圖25係本發明之移動與活動行為識別方法的實施例示意圖;
圖26係本發明之移動與活動行為識別方法的實施例示意圖;
圖27係本發明之移動與活動行為識別方法的實施例示意圖;以及
圖28係本發明之移動與活動行為識別方法的實施例示意圖。
以下藉由特定的實施例說明本案之實施方式,熟習此項技藝之人士可由本文所揭示之內容輕易地瞭解本案之其他優點及功效。本說明書所附圖式所繪示之結構、比例、大小等均僅用於配合說明書所揭示之內容,以供熟悉此技藝之人士之瞭解與閱讀,非用於限定本案可實施之限定條件,故任何修飾、改變或調整,在不影響本案所能產生之功效及所能達成之目的下,均應仍落在本案所揭示之技術內容得能涵蓋之範圍內。
圖1係揭示本發明之移動與活動行為識別方法的主要步驟。其中,步驟S10至S50之詳細流程係可結合圖2至圖28及以下描述進一步了解。此外,本發明還揭示一種電腦可讀媒介,係應用於具有處理器(例如,CPU、GPU等)及/或記憶體的計算裝置或電腦中,且儲存有指令,並可利用此計算裝置或電腦透過處理器及/或記憶體執行此電腦可讀媒介,以於執行此電腦可讀媒介時執行上述之各步驟。
首先在步驟S10處,本發明之移動與活動行為識別方法首先蒐集一用戶(本實施例之用戶user_id假設為8404)在某一時間段(本實施例以一天為例)內之軌跡點與活動序列資料。其中,軌跡點資料包括用戶之行動裝置與基地台(如圖2之基地台軌跡點紀錄所示,且用戶連網之基地台係以「CELL_ID」區分)及公眾WiFi熱點(如圖3之公眾WiFi熱點軌跡點紀錄所示,且用戶連網之公眾WiFi熱點係以「Hotspot_ID」區分)連網紀錄及GPS定位紀錄(如圖4之GPS定位軌跡點紀錄所示,係用戶於各時間點所定位之經度(Longitude)及緯度(Latitude)資料)等資訊。並且其中,活動序列資料包括用戶之通話紀錄(Voice Call Detail Record,係如圖5之通話序列紀錄所示,包括用戶去電與來電號碼及號碼相關之標籤(Label)等資料)及上網紀錄(如圖6之4G DPI上網紀錄所示,係包括用戶連網之網域(host)、目的IP(Destination IP)及網站服務類型(Type)等資料)。
然而,本發明之步驟S10亦可用於蒐集其他可進行定位之軌跡點資料,而活動序列記錄亦可包含用戶使用應用程式服務或藍芽服務等活動資訊,並不限於上述。此外,為便於區分各用戶之資料,上述之軌跡點資料及活動序列紀錄皆可標記有共同鍵值(key),例如圖2至圖6中表示用戶身分之使用者鍵值「user_id」及時間戳鍵值「時間」等。
本發明之移動與活動行為識別方法的步驟S20係可與步驟S10同步執行或在步驟S10之前完成。在此須了解的是,由於現行各類地圖資訊(例如,Google Map、Open Street Map等地圖)中,座標及/或地標名稱之定義方式可能不同、並且電信公司管轄之基地台CELL_ID及/或公眾WiFi熱點Hotspot_ID對應之座標或地標名稱亦可能與各類地圖資訊之定義方式不同(例如,Google地圖上的某地標名稱可能與電信公司自用地圖上記載之地標名稱可能不同),因此,步驟S20主 要用以將各類地圖中的地標名稱、基地台名稱、公眾WiFi熱點名稱及經緯度表示格式等圖資正規化,並建立可加速未來資料庫查詢與計算速度之空間索引。步驟S20之詳細步驟流程又如圖7所示。
在圖7之步驟S201處,本發明之移動與活動行為識別方法係蒐集並正規化各類地理資訊系統(GIS)地圖中的圖資。如圖8之地標屬性資料表所示,各類地標係以「POI_ID」為主鍵進行區分,並分別標記其地標名稱、經緯度、地址、電話、網址及類型等資料。步驟S201還會整理GIS地圖之各類道路並予以標記,如圖9之道路屬性資料表所示,各類道路係以「Street_ID」作為主鍵進行區分,並分別標記其道路名稱、經緯度及道路類型(包括鐵路、高鐵、捷運等類型)等資料。
在上述之圖8及圖9中,各類地標及道路之經緯度係用已知文字法(WKT)表示,然而,本發明在執行圖資之正規化時,也可採用其他經緯度的表示法,並不限於上述。
步驟S201還會依據上述圖8及圖9之內容建立空間索引以形成地標資料庫與道路資料庫。在本實施例中可採用雜湊方式(例如,Geohash),對各類地標及道路之經緯度建立空間索引,以加速後續查詢圖資之速度並減少記憶體占用之暫存空間。此時,圖9之各類道路係以經緯度之第一筆資料作為建立索引之參考值。建立完成之地標資料庫及/或道路資料庫係如圖10所示,其中,雖然僅示意地標相關之空間索引,但可推知同樣位於台北市中正區(及其鄰近地區)的各類地標及/或道路之空間索引皆會被歸類在開頭為「wsqq」的索引值(即,Geohash值)下。
圖7之步驟S202係於完成空間索引之建立後執行電信公司之基地台與公眾WiFi熱點對於地標的映射。此時,可以先蒐集並整理電信公司管轄之基 地台(例如,以CELL_ID區分)與公眾WiFi熱點(例如,以Hotspot_ID區分)之屬性資料(例如,由電信公司自用之地圖取得)。如圖11及圖12之所示,基地台屬性資料表及公眾WiFi熱點屬性資料表係各自記載有CELL_ID或Hotspot_ID及對應之名稱、經緯度及地址等屬性資料。
接著,同步驟S201中對地標及道路之屬性資料的處理方式,步驟S202亦藉由Geohash方式產生基地台及公眾WiFi熱點之經緯度的空間索引。接著,步驟S202以概率紀錄連結(Probabilistic Record Linkage)方法將基地台屬性資料表及公眾WiFi熱點屬性資料表與地標屬性資料表整合為便於地標-基地台及/或公眾WiFi熱點相互轉換之ID對照表(如圖14所示)。
概率紀錄連結方法可視為整合不同資料集的分類問題,在本實施例中係以貝氏決策模型解決此分類問題。此處所述貝氏決策模型主要用於比較基地台屬性資料表(以
Figure 109118458-A0101-12-0009-5
表示)及公眾WiFi熱點屬性資料表(以
Figure 109118458-A0101-12-0009-3
表示)之內容相較於地標屬性資料表(以
Figure 109118458-A0101-12-0009-4
表示)內容的相似度,以產生一POI_ID對於CELL_ID及Hotspot_ID之ID對照表(如圖14所示),其詳細流程係如以下進一步所詳述的。
以進行基地台屬性資料表(以
Figure 109118458-A0101-12-0009-6
表示)與地標屬性資料表(以
Figure 109118458-A0101-12-0009-2
表示)之相似度比較為例,首先定義地標-基地台的配對關係為
Figure 109118458-A0101-12-0009-1
。其中,當此配對被判斷為相同時(例如,某核心網路基地台與某地標位於同樣的座標或區域)可表示為M ab ={(a,b)|a=b},相反地,當此配對被判斷為不相同時則可表示為U ab ={(a,b)|ab}。
在產生ID對照表時,可先定義比較函數γ以量化配對(a,b),並投影至實數座標空間(以
Figure 109118458-A0101-12-0009-7
表示,其係具有地標之名稱、經緯度、地址及Geohash值 等資訊)中(例如,
Figure 109118458-A0101-12-0010-8
i
Figure 109118458-A0101-12-0010-44
(0,1)),進而計算貝氏定理-條件機率 l(γ)(例如,
Figure 109118458-A0101-12-0010-9
,P(γ|M)=m(γ),P(γ|U)=u(γ))以觀察比較函數γ與l(γ)之相似程度。最後,決定比對門檻值T μ T λ ,以機率概似函數(例如,
Figure 109118458-A0101-12-0010-10
,其示意圖係如圖13所示)最小化錯誤率,進而將此配對(a,b)歸類為相同(即,M ab )或不相同(即,U ab )。
相似地,公眾WiFi熱點屬性資料表(以
Figure 109118458-A0101-12-0010-45
表示)與地標屬性資料表(以
Figure 109118458-A0101-12-0010-46
表示)之相似度比較亦可以上述之方式進行,以得到地標-公眾WiFi熱點的配對關係(a,c)、相同之配對M ac 及不同之配對U ac 。最後,步驟S202將前述計算之相同配對M ab 及M ac 進行聯集(即,M ab ∪ M ac )以產生地標(即,POI_ID)對應基地台與公眾WiFi熱點(即,CELL_ID與Hotspot_ID)之ID對照表(如圖14所示)。
到此,即完成步驟S20之各類地圖之圖資的正規化,其結果係包括標記有空間索引值之地標資料庫及道路資料庫(如圖10所示),以及地標對應基地台與公眾WiFi熱點的ID對照表(如圖14所示)。
現請回到圖1之步驟S30,其係接續於步驟S10之後,以將用戶之軌跡點計算為軌跡段,其詳細流程係如圖15之步驟流程圖所示。
首先在步驟S301處,為避免用戶與基地台連網之乒乓效應造成軌跡點數據雜亂以及用戶未與基地台連網而造成資料流失(例如,行動裝置關機或進入無訊號範圍等情況)等問題,係採用空間聚合與時間平滑方式結合統計與機率估計,以獲取某用戶相對於基地台涵蓋範圍更精準之位置中心,進而辨識此用戶之「停留」或「移動」基地台軌跡段。舉例來說,如圖16及圖17所示,關於某 用戶(其user_id例如為8404)與基地台連網之原始群集資料(例如,可由圖2之基地台軌跡點紀錄取得)中10:00至10:30及11:00至11:30時間段的「候選停留」基地台軌跡段經空間聚合與時間平滑方法及統計與機率估計方法運算後係辨識為此用戶10:00至11:30之「候選停留」基地台軌跡段(亦即,判斷此用戶之行動裝置在無狀態的10:30至11:00時間段可能在基地台涵蓋範圍內呈關機狀態或無法上網)。更進一步地,圖16所辨識之各基地台軌跡段(包括「候選移動」及「候選停留」軌跡段)係可以圖17之序列紀錄輸出,例如,基地台軌跡點係分配為基地台停留或移動軌跡段,並分別標示有用戶於各時間點(time)連網之基地台CELL_ID(x t )、所屬軌跡段編號(TS t)及軌跡段之狀態(y t )等資料。
接續於步驟S302,標記GPS定位軌跡段主要藉由迴歸決策樹(Regression Tree)進行GPS定位軌跡點(如圖4之GPS定位軌跡點紀錄)之分段,係如圖18及以下所詳述的。其中,GPS定位軌跡點分段之演算法係以步驟S301之結果作為基礎,找出最接近基地台軌跡段結果的分段條件,以期GPS定位軌跡段分段結果與基地台軌跡段愈接近愈好。
在進行GPS定位軌跡點之分段時,首先以一次迭代將一組GPS定位軌跡點時間軸分為左右二段分段並計算最佳分段點,其公式係表示為
Figure 109118458-A0101-12-0011-11
其中,s表示最佳的分段時間,c 表示當前軌跡段之中心經緯度,d s (‧,‧)表示經緯度空間之距離,並且R 表示分段。
接著,將上述計算結果與基地台軌跡段進行比較,如果當次迭代之R left R right 分段被某段基地台軌跡段完全涵蓋(如圖18之Iter Final區段的縱向 虛線所示),或是c left c right 的距離小於382.5公尺(即,5分鐘內一般成人步行速率),則停止分段(意即,找到一GPS定位軌跡段)。若無上述情況則繼續將此分段分割為子分段。步驟S302係重複執行迭代之流程直到不須再分割GPS定位軌跡點之分段為止。
在步驟S303中,初步將標記好軌跡段之GPS定位軌跡點(此時尚未辨識其停留或移動狀態)與基地台軌跡點數據合併並依時間順序重新排序軌跡段編號。如圖19之實施態樣所示,有連續關係之GPS定位軌跡點或基地台軌跡點係各自併為同一軌跡段,並依時間順序排列以標記全新的軌跡段編號。
由於上述做法中仍有未標記狀態之GPS定位軌跡段(即,狀態為「N/A」的GPS定位軌跡段),故步驟S303還會進一步補充並修正此些未標記之軌跡段狀態。首先挑出已有初步標記狀態之各基地台軌跡段,接著推估具有相同狀態且相鄰之GPS定位軌跡段之停留移動狀態。此時,如圖20之實施態樣所示,從各「停留」之基地台軌跡段為中心進行判定,首先以「停留」之基地台軌跡段的定位分布計算其中心點與標準差,並比較此「停留」基地台軌跡段時間前後最鄰近之GPS定位軌跡段,接著計算最鄰近之GPS定位軌跡段中心點與此「停留」基地台軌跡段中心點之距離,如距離小於標準差,則判定此GPS定位軌跡段與「停留」基地台軌跡段來自相同停留地區,遂合併為相同之「停留」的軌跡段。若是標準差超過之情形(即,此GPS定位軌跡段非來自與「停留」基地台軌跡段相同之停留地區),則不將此GPS定位軌跡段合併至基地台停留軌跡段,因而在最後,剩餘未合併之軌跡段(亦及,已標記好「停留」之軌跡段之間未標記或合併的基地台軌跡段及/或GPS定位軌跡段)可視為在「移動」狀態之軌跡段,故可分別合併做為「移動」的軌跡段。
接續於步驟S304處,係更精準地估計狀態為「停留」之軌跡段的停留位置中心、停留範圍及時間範圍。在此步驟中,由於公眾WiFi熱點一般係最精準之定位方式,然而亦提供最少之連網紀錄,故僅於步驟S304將用戶之公眾WiFi熱點軌跡點(例如,圖3之公眾WiFi熱點軌跡點紀錄)一同與先前整理之基地台軌跡點及GPS定位軌跡點加入計算以提升精準度。首先,針對「停留」的軌跡段將其涵蓋之GPS定位軌跡點(X 1 ,Y 1)、基地台軌跡點(X 2 ,Y 2)及公眾WiFi熱點軌跡點(X 3,Y 3)等數據對齊,接著分別計算GPS定位軌跡點、基地台軌跡點及公眾WiFi熱點軌跡點之平均,再以加權平均方式計算軌跡段之停留位置中心點,進而計算各GPS定位軌跡點、基地台軌跡點及公眾WiFi熱點軌跡點與停留位置中心點的標準差以表示軌跡段之停留範圍。步驟S304之運算方法係如以下演算法及圖21所示。
如圖21所示,18:30至19:00軌跡段中的GPS定位軌跡點、基地台軌跡點及公眾WiFi熱點軌跡點分別被分配加權平均值α 1α 2α 3,並以下揭演算法運算此軌跡段之停留位置中心點及範圍:
Figure 109118458-A0101-12-0013-12
其中,N i 表示資料源i的出現次數,(
Figure 109118458-A0101-12-0013-13
,
Figure 109118458-A0101-12-0013-14
)表示資料源i之第j筆資料,而K表示在此軌跡段出現的資料總數。
在本實施例中,由於一般WiFi定位係最精準之定位方式,故此處分配給公眾WiFi熱點軌跡點之加權平均值α 3將為最大,例如,α 1=0.19、α 2=0.09及α 3=0.72。並且,本實施例中狀態為停留之軌跡段經上述運算後之停留位置中心、停留範圍及時間範圍係可以圖22表示方法呈現。
到此,步驟S30係藉由整合GPS定位軌跡點、基地台軌跡點及公眾WiFi熱點軌跡點以形成軌跡段,故解決了GPS在某些場域無法定位、基地台因連網之乒乓效應而定位不準確及公眾WiFi熱點連網紀錄不足而無法定位等問題。
現回到圖1之步驟S40,係主要根據步驟S30產出之軌跡段產製用戶的移動及活動行為輪廓,其主要包括圖23所示之步驟S401至S404。
在步驟S401處,先解析用戶之活動序列資料(如步驟S10所蒐集者)以產生一候選地標表,包括解析圖5之通話序列紀錄及/或圖6之上網活動序列紀錄以分析可能與之關聯的候選地標(包括用戶之通話或瀏覽網頁關聯之商家資訊或地點等),並儲存為如圖24所示的候選地標列表。
接續於步驟S402處,係執行狀態為「停留」的軌跡段對地標的對應。在此步驟中,根據步驟S30辨識之狀態為「停留」的軌跡段之涵蓋範圍自圖24之候選地標列表中篩選相符之候選地標,以及依據軌跡段中用戶與基地台或公眾WiFi熱點連線之紀錄查找圖14之ID對照表,以找出基地台(CELL-ID)或公眾WiFi熱點(Hotspot_ID)可能對應的候選地標,此時若找出之候選地標未滿20個的情況,則進一步根據步驟S20正規化之地標資料庫找尋最接近軌跡段停留位置中心且符合停留範圍的候選地標。藉此方式,可以整理出如圖25所示在「停留」的軌跡段中用戶最可能停留的地標,其中,對於各「停留」的軌跡段可依序列出最可能的停留地標(即,最靠近軌跡段之停留位置中心之地標)以及其他可能為停留地標的十大候選地標(例如,以相對停留位置中心的距離排序)。
接續於步驟S403處,係執行狀態為「移動」的軌跡段對道路的對應。此步驟係根據「移動」的軌跡段及其前後之「停留」軌跡段之資料查詢步驟S20正規化之地標資料庫及道路資料庫,進而以地圖比對(map matching)方式推測 此「移動」的軌跡段的移動路徑及移動方式。如圖26之實施態樣所示,步驟S403係推測出用戶之「移動」軌跡段相關之交通類型、經過之地標及道路等資訊。
接續於步驟S404處,進一步將用戶之活動序列資料(包括圖5及圖6之內容)對應至各軌跡段,以清楚描述用戶之移動及停留過程以及期間的活動行為,並輸出一用戶之移動及活動行為輪廓資料表(如圖27所示之實施態樣)。
最後於圖1之步驟S50處,可將到步驟S40為止完成之移動及活動行為輪廓資料表在地圖上視覺化呈現。如圖28所示,本實施例係使用Google Map,先將移動及活動行為輪廓資料表轉換為GeoJSON格式,並採用Google Map API將移動及活動行為輪廓資料表套疊在地圖圖層上,以視覺化方式呈現用戶之移動與活動行為。以此方式,即可更精準的將用戶之移動與活動行為應用於適地性服務中。
綜上所述,本發明之移動與活動行為識別方法及電腦可讀媒介係整合行動裝置之GPS定位、基地台及公眾WiFi熱點連網等數據以對用戶之移動與活動行為進行分析,故能更精準分析用戶之移動與停留軌跡,並且藉由將用戶之軌跡段與活動序列資料整合並以時間序列及視覺化方式呈現,故能清楚地呈現用戶之移動與活動之情境。
上述實施形態僅例示性說明本發明之原理、特點及其功效,並非用以限制本發明之可實施範疇,任何熟習此項技藝之人士均可在不違背本發明之精神及範疇下,對上述實施形態進行修飾與改變。任何運用本發明所揭示內容而完成之等效改變及修飾,均仍應為申請專利範圍所涵蓋。因此,本發明之權利保護範圍,應如申請專利範圍所列。
S10~S50:步驟

Claims (9)

  1. 一種移動與活動行為識別方法,包括:正規化圖資以建立地標資料庫及道路資料庫;執行多源軌跡點數據分段定位以標記行動裝置之軌跡段,其中,該軌跡段係紀錄有停留或移動之狀態資訊;以及根據各該軌跡段與該地標資料庫及該道路資料庫的圖資產製移動及活動行為輪廓資料表,其中,該執行多源軌跡點數據分段定位以標記行動裝置之軌跡段之步驟係包括:以空間聚合及時間平滑方式標記該行動裝置與基地台連網之紀錄為基地台軌跡段,其中,該基地台軌跡段係紀錄有停留或移動之初始狀態資訊;以迴歸決策樹基於該基地台軌跡段之該初始狀態資訊與一般成人步行速率,標記該行動裝置之GPS定位紀錄為GPS定位軌跡段;將該基地台軌跡段及該GPS定位軌跡段依時間順序排序;根據該基地台軌跡段之該初始狀態資訊推估時間相鄰之該GPS定位軌跡段之停留或移動狀態;合併該基地台軌跡段及該GPS定位軌跡段中,時間相鄰且該初始狀態資訊及該停留或移動狀態為相同者,以形成該行動裝置之該紀錄有停留與移動之該狀態資訊之該軌跡段;以及計算各該軌跡段中狀態資訊為停留者之停留位置中心、停留範圍及停留時間範圍。
  2. 如請求項1所述之移動與活動行為識別方法,其中,該根據該基地台軌跡段之該初始狀態資訊推估時間鄰近之該GPS定位軌跡段之停留或移動狀態之步驟係包括: 根據該基地台軌跡段之該初始狀態資訊為停留者之定位分布計算中心點及標準差;標記時間相鄰該基地台軌跡段之該初始狀態資訊為停留者之該GPS定位軌跡段中,中心位置相距該中心點小於該標準差者之該停留或移動狀態為停留狀態;以及,標記該GPS定位軌跡段中剩餘未標記者之該停留或移動狀態為移動狀態。
  3. 如請求項1所述之移動與活動行為識別方法,其中,該計算各該軌跡段中狀態資訊為停留者之停留位置中心、停留範圍及停留時間範圍之步驟係包括:提取各該軌跡段中狀態資訊為停留者中對應之該行動裝置之GPS定位紀錄、該行動裝置與各該基地台連網之紀錄及該行動裝置與公眾WiFi熱點連網之紀錄;以及將該行動裝置之GPS定位紀錄、該行動裝置與各該基地台連網之紀錄及該行動裝置與各該公眾WiFi熱點連網之紀錄以加權平均計算為各該停留中心位置、各該停留範圍及各該停留時間範圍,其中,該加權平均計算係根據該行動裝置之定位紀錄、該行動裝置與各該基地台連網之紀錄及該行動裝置與各該公眾WiFi熱點連網之紀錄的定位精準度使用對應之加權平均值。
  4. 如請求項1所述之移動與活動行為識別方法,其中,該根據各該軌跡段與該地標資料庫及該道路資料庫的圖資產製移動及活動行為輪廓資料表之步驟係包括:查找該地標資料庫以提取對應各該軌跡段中狀態資訊為停留者之地標; 查找該道路資料庫以提取對應各該軌跡段中狀態資訊為移動者對應之道路;以及將各該地標及各該道路結合該行動裝置之活動序列紀錄以產製為該移動及活動行為輪廓資料表。
  5. 如請求項4所述之移動與活動行為識別方法,其中,該活動序列紀錄包括該行動裝置通話與上網之紀錄,並且其中,該查找該地標資料庫以提取對應各該軌跡段中狀態資訊為停留者之地標之步驟復包括:解析該活動序列紀錄以獲得符合各該軌跡段中狀態資訊為停留者之停留範圍之候選地標;提取各該軌跡段中狀態資訊為停留者所記錄連網之各該基地台及公眾WiFi熱點並根據該地標資料庫轉換為候選地標;以及將該些候選地標中最接近各該軌跡段中狀態資訊為停留者之停留位置中心者辨識為該地標。
  6. 如請求項5所述之移動與活動行為識別方法,其中,該提取各該軌跡段中狀態資訊為停留者所記錄連網之各該基地台及公眾WiFi熱點並根據該地標資料庫轉換為候選地標之步驟係包括:以貝氏決策模型比較該基地台及該公眾WiFi熱點之屬性資料與該地標資料庫紀錄之地標之屬性資料的相似度,進而將該基地台及該公眾WiFi熱點轉換為該地標資料庫紀錄之地標。
  7. 如請求項1所述之移動與活動行為識別方法,其中,該地標資料庫係包括以地標之經緯度雜湊計算之空間索引,並且其中,該道路資料庫係包括以道路之第一筆經緯度雜湊計算之空間索引。
  8. 如請求項1所述之移動與活動行為識別方法,復包括:將該移動及活動行為輪廓資料表轉換為地圖上之視覺化資料。
  9. 一種電腦可讀媒介,應用於計算裝置或電腦中,係儲存有指令,以執行如請求項1至8所述之移動與活動行為識別方法。
TW109118458A 2020-06-02 2020-06-02 移動與活動行為識別方法及電腦可讀媒介 TWI736304B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW109118458A TWI736304B (zh) 2020-06-02 2020-06-02 移動與活動行為識別方法及電腦可讀媒介

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW109118458A TWI736304B (zh) 2020-06-02 2020-06-02 移動與活動行為識別方法及電腦可讀媒介

Publications (2)

Publication Number Publication Date
TWI736304B true TWI736304B (zh) 2021-08-11
TW202147895A TW202147895A (zh) 2021-12-16

Family

ID=78283141

Family Applications (1)

Application Number Title Priority Date Filing Date
TW109118458A TWI736304B (zh) 2020-06-02 2020-06-02 移動與活動行為識別方法及電腦可讀媒介

Country Status (1)

Country Link
TW (1) TWI736304B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI813339B (zh) * 2022-06-15 2023-08-21 中光電智能雲服股份有限公司 基於電信數據推測廣告版位地點之系統及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1787029A (zh) * 2004-12-10 2006-06-14 私立逢甲大学 一种移动载具跟踪管理系统
CN106101999A (zh) * 2016-05-27 2016-11-09 广州杰赛科技股份有限公司 一种用户轨迹的识别方法及装置
CN106951903A (zh) * 2016-10-31 2017-07-14 浙江大学 一种人群移动规律的可视化方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1787029A (zh) * 2004-12-10 2006-06-14 私立逢甲大学 一种移动载具跟踪管理系统
CN106101999A (zh) * 2016-05-27 2016-11-09 广州杰赛科技股份有限公司 一种用户轨迹的识别方法及装置
CN106951903A (zh) * 2016-10-31 2017-07-14 浙江大学 一种人群移动规律的可视化方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI813339B (zh) * 2022-06-15 2023-08-21 中光電智能雲服股份有限公司 基於電信數據推測廣告版位地點之系統及方法

Also Published As

Publication number Publication date
TW202147895A (zh) 2021-12-16

Similar Documents

Publication Publication Date Title
US11762818B2 (en) Apparatus, systems, and methods for analyzing movements of target entities
Koukoletsos et al. Assessing data completeness of VGI through an automated matching procedure for linear data
US10546323B2 (en) Determining locations of interest based on user visits
CN102521973B (zh) 一种手机切换定位的道路匹配方法
CN106931974B (zh) 基于移动终端gps定位数据记录计算个人通勤距离的方法
CN110472066A (zh) 一种城市地理语义知识图谱的构建方法
JP5390840B2 (ja) 情報分析装置
Liu et al. Recognizing urban functional zones by a hierarchical fusion method considering landscape features and human activities
CN105701123A (zh) 人车关系的识别方法及装置
CN106448173B (zh) 一种基于手机数据的长距离出行交通方式划分方法
CN107016042B (zh) 一种基于用户位置日志的地址信息校验系统
WO2022022654A1 (zh) 一种生成室内地图的方法和装置
Bonnetain et al. Can we map-match individual cellular network signaling trajectories in urban environments? Data-driven study
TWI736304B (zh) 移動與活動行為識別方法及電腦可讀媒介
CN113079463A (zh) 一种基于手机信令数据的旅游景点游客出行活动识别方法
Moradi et al. Exploring five indicators for the quality of OpenStreetMap road networks: A case study of Québec, Canada
Tiwari et al. Mining popular places in a geo-spatial region based on GPS data using semantic information
CN111105124B (zh) 一种基于距离约束的多地标影响力的计算方法
CN116129643B (zh) 一种公交车出行特征识别方法、装置、设备及介质
Xi et al. Improved dynamic time warping algorithm for bus route trajectory curve fitting
He et al. Poi alias discovery in delivery addresses using user locations
Meng et al. Towards the inference of travel purpose with heterogeneous urban data
Liu et al. Mining method based on semantic trajectory frequent pattern
Hua Geographic Distribution of Urban Retail and its Spatial Relationship with Subway Network: A Case Study of Retail POI Data in Shanghai
CN117493981B (zh) 游客分类方法、装置及电子设备