TWI842973B - 一種物件間相似性的確定方法及裝置 - Google Patents
一種物件間相似性的確定方法及裝置 Download PDFInfo
- Publication number
- TWI842973B TWI842973B TW110100218A TW110100218A TWI842973B TW I842973 B TWI842973 B TW I842973B TW 110100218 A TW110100218 A TW 110100218A TW 110100218 A TW110100218 A TW 110100218A TW I842973 B TWI842973 B TW I842973B
- Authority
- TW
- Taiwan
- Prior art keywords
- attribute
- association
- dimension
- fused
- network
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000011156 evaluation Methods 0.000 claims abstract description 202
- 239000013598 vector Substances 0.000 claims description 22
- 238000005295 random walk Methods 0.000 claims description 17
- 230000004927 fusion Effects 0.000 claims description 16
- 230000002123 temporal effect Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 9
- 230000006399 behavior Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000008520 organization Effects 0.000 description 3
- 101100233916 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) KAR5 gene Proteins 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 101001121408 Homo sapiens L-amino-acid oxidase Proteins 0.000 description 1
- 102100026388 L-amino-acid oxidase Human genes 0.000 description 1
- 101100012902 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) FIG2 gene Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- MLYYVTUWGNIJIB-BXKDBHETSA-N cefazolin Chemical compound S1C(C)=NN=C1SCC1=C(C(O)=O)N2C(=O)[C@@H](NC(=O)CN3N=NN=C3)[C@H]2SC1 MLYYVTUWGNIJIB-BXKDBHETSA-N 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Images
Abstract
本發明公開了一種物件間相似性的確定方法及裝置,其中方法為:針對多個屬性組中任一屬性組的至少一個維度屬性,針對評估物件的該至少一個維度屬性,生成多個評估物件在該至少一個維度屬性下的屬性關聯網路;針對任意兩個屬性關聯網路,將該兩個屬性關聯網路進行融合,得到融合關聯網路;對每個融合關聯網路的節點隨機遍歷,得到該融合關聯網路的多個節點序列;根據該多個節點序列,確定該多個評估物件中任意兩個評估物件在該融合關聯網路下的相似度。
Description
本發明屬於相似性分析領域,尤其關於一種物件間相似性的確定方法及裝置。
機構在日常運轉的過程中,會涉及各種各樣的物件。然而,不同物件可能有不同的特性,舉例來說,對於不同區域,機構適合開展業務的類型、方式等可能都不盡相同。為了提升機構決策的效率,這就需要對不同物件的特性做考察,對不同物件有針對性地做合理的決策。
如果能通過一個物件在決策下的表現,能夠推知在另一相似物件的表現,這無疑可以很好地指導另一評估物件的決策。因此,如何判斷評估物件間的相似性,對於機構決策來說很有研究價值。然而,目前還沒有對不同物件的相似性進行評估的方法,這是一個亟待解決的問題。
本發明提供一種物件間相似性的確定方法及裝置,解決了現有技術中沒有對不同物件的相似性進行評估的方法的問題。
第一方面,本發明提供一種物件間相似性的確定方法,包括:針對多個屬性組中任一屬性組的至少一個維度屬性,針對評估物件的該至少一個
維度屬性,生成多個評估物件在該至少一個維度屬性下的屬性關聯網路;其中,每個評估物件在該屬性關聯網路中均有唯一映射的節點;該屬性關聯網路中各節點間的邊資訊表徵了在該至少一個維度屬性下評估物件之間的關聯程度;針對任意兩個屬性關聯網路,將該兩個屬性關聯網路進行融合,得到融合關聯網路;每個評估物件在該融合關聯網路中均有唯一映射的節點;該融合關聯網路中各節點間的邊資訊表徵了評估物件之間的綜合關聯程度;對每個融合關聯網路的節點隨機遍歷,得到該融合關聯網路的多個節點序列;根據該多個節點序列,確定該多個評估物件中任意兩個評估物件在該融合關聯網路下的相似度。
上述方法中,生成了多個評估物件在該至少一個維度屬性下的屬性關聯網路,在該屬性關聯網路中表徵了該多個評估物件之間的關聯程度,再通過將該兩個屬性關聯網路進行融合,得到融合關聯網路,從而充分表徵多個評估物件之間針對區域特徵的綜合關聯程度,並進一步對該融合關聯網路的節點隨機遍歷,得到該融合關聯網路的多個節點序列,從而確定該多個評估物件中任意兩個評估物件在該融合關聯網路下的相似度,從而提供了一種確定物件間相似性的方法。
可選的,該針對評估物件的至少一個維度屬性,生成多個評估物件在該至少一個維度屬性下的屬性關聯網路,包括:針對該多個評估物件中任意兩個評估物件,根據該兩個評估物件在該維度屬性下的屬性值,確定該兩個評估物件在該屬性關聯網路中對應兩節點之間的邊資訊;根據該多個評估物件在該屬性關聯網路中對應各節點之間的邊資訊,生成該多個評估物件針對該維度屬性的屬性關聯網路。
上述方法中,根據該兩個評估物件在該維度屬性下的屬性值,進一步確定該兩個評估物件在該屬性關聯網路中對應兩節點之間的邊資訊,生成屬性關聯網路,從而提供了一種在相同的該維度屬性下的屬性值情況下生成屬性關聯網路的方法,從而增加了生成該多個評估物件針對該維度屬性的屬性關聯網路的靈活性。
可選的,該評估物件為區域;該維度屬性包括區域中使用者的時序位置屬性;該區域中使用者的時序位置屬性下的屬性值包括:使用者標識;該根據該兩個評估物件在該維度屬性下的屬性值,確定該兩個評估物件在該屬性關聯網路中對應兩節點之間的邊資訊,包括:根據該兩個區域中的使用者標識,確定該兩個區域的邊資訊。
上述方法中,當該評估物件為區域時,由於時序位置屬性能夠表徵區域在時序上的關聯性,因此,根據該兩個區域中的使用者標識,更精確地確定該兩個區域的邊資訊的方法。
可選的,該至少一個維度屬性包括第一類屬性維度和第二類屬性維度;該第一類屬性維度和該第二類屬性維度為預設關聯的屬性維度;該針對評估物件的至少一個維度屬性,生成多個評估物件在該至少一個維度屬性下的屬性關聯網路,包括:針對該多個評估物件中的第一評估物件和第二評估物件,根據該第一評估物件在該第一類屬性維度的屬性值與該第二評估物件在該第二類屬性維度的屬性值,確定該兩個評估物件在該屬性關聯網路中對應兩節點之間的邊資訊,或者,根據該第一評估物件在該第二類屬性維度的屬性值與該第二評估物件在該第一類屬性維度的屬性值,確定該兩個評估物件在該屬性關聯網路中對應兩節點之間的邊資訊;根據該多個評估物件在該屬性關聯網路中對應各
節點之間的邊資訊,生成該多個評估物件針對該第一類屬性維度和該第二類屬性維度的屬性關聯網路。
上述方式下,由於該第一類屬性維度和該第二類屬性維度為預設關聯的屬性維度,可以通過第一評估物件和第二評估物件不同類別屬性維度的屬性值,確定該屬性關聯網路中對應兩節點之間的邊資訊,進而生成屬性關聯網路,從而提供了一種針對不同類別屬性維度的屬性關聯網路生成方法。
可選的,該對每個融合關聯網路的節點隨機遍歷,得到多個節點序列,包括:根據該融合關聯網路中各節點間的邊資訊,確定該融合關聯網路中各節點間的隨機遊走概率;基於該融合關聯網路中各節點間的隨機遊走概率,對該融合關聯網路的節點隨機遍歷,得到該多個節點序列。
上述方式下,根據該融合關聯網路中各節點間的邊資訊,確定各節點間的隨機遊走概率,從而在考慮各節點間的隨機遊走概率的基礎上,對該融合關聯網路的節點隨機遍歷,更精確地得到該多個節點序列。
可選的,該屬性關聯網路中各節點間的邊資訊為各節點間的屬性關聯權重值;該融合關聯網路中各節點間的邊資訊為各節點間的綜合關聯權重值;該將該兩個屬性關聯網路進行融合,得到融合關聯網路,包括:針對該融合關聯網路中任意兩個節點,根據該兩個節點在該兩個屬性關聯網路中的屬性關聯權重值以及加權係數,確定該兩個節點在該融合關聯網路中的綜合關聯權重值;基於該融合關聯網路中各節點間的綜合關聯權重值,生成該多個評估物件的特徵關聯網路。
上述方式下,該屬性關聯網路中各節點間的邊資訊為各節點間的屬性關聯權重值,綜合考慮了該兩個節點在該兩個屬性關聯網路中的屬性關聯
權重值以及加權係數,並基於該融合關聯網路中各節點間的綜合關聯權重值,生成該多個評估物件的特徵關聯網路,更準確地生成該多個評估物件的特徵關聯網路。
可選的,該根據該多個節點序列,確定該多個評估物件中任意兩個評估物件的相似度,包括:將該多個節點序列輸入預設詞向量的相關模型,生成該融合關聯網路的嵌入向量;根據該融合關聯網路的嵌入向量,確定該多個評估物件中任意兩個評估物件的相似度。
上述方式下,生成該融合關聯網路的嵌入向量後,可以根據該融合關聯網路的嵌入向量,確定該多個評估物件中任意兩個評估物件的相似度,由於嵌入向量能更充分、細化地表徵該融合關聯網路,從而可以更精確地確定該多個評估物件中任意兩個評估物件的相似度。
第二方面,本發明提供一種物件間相似性的確定裝置,包括:生成模組,用於針對多個屬性組中任一屬性組的至少一個維度屬性,針對評估物件的該至少一個維度屬性,生成多個評估物件在該至少一個維度屬性下的屬性關聯網路;其中,每個評估物件在該屬性關聯網路中均有唯一映射的節點;該屬性關聯網路中各節點間的邊資訊表徵了在該至少一個維度屬性下評估物件之間的關聯程度;融合模組,用於針對任意兩個屬性關聯網路,將該兩個屬性關聯網路進行融合,得到融合關聯網路;每個評估物件在該融合關聯網路中均有唯一映射的節點;該融合關聯網路中各節點間的邊資訊表徵了評估物件之間的綜合關聯程度;處理模組,用於對每個融合關聯網路的節點隨機遍歷,得到該融合關聯網路的多個節點序列;根據該多個節點序列,確定該多個評估物件中任意兩個評估物件在該融合關聯網路下的相似度。
可選的,該生成模組具體用於:針對該多個評估物件中任意兩個評估物件,根據該兩個評估物件在該維度屬性下的屬性值,確定該兩個評估物件在該屬性關聯網路中對應兩節點之間的邊資訊;根據該多個評估物件在該屬性關聯網路中對應各節點之間的邊資訊,生成該多個評估物件針對該維度屬性的屬性關聯網路。
可選的,該評估物件為區域;該維度屬性包括區域中使用者的時序位置屬性;該區域中使用者的時序位置屬性下的屬性值包括:使用者標識;該生成模組具體用於:根據該兩個區域中的使用者標識,確定該兩個區域的邊資訊。
可選的,該至少一個維度屬性包括第一類屬性維度和第二類屬性維度;該第一類屬性維度和該第二類屬性維度為預設關聯的屬性維度;該生成模組具體用於:針對該多個評估物件中的第一評估物件和第二評估物件,根據該第一評估物件在該第一類屬性維度的屬性值與該第二評估物件在該第二類屬性維度的屬性值,確定該兩個評估物件在該屬性關聯網路中對應兩節點之間的邊資訊,或者,根據該第一評估物件在該第二類屬性維度的屬性值與該第二評估物件在該第一類屬性維度的屬性值,確定該兩個評估物件在該屬性關聯網路中對應兩節點之間的邊資訊;根據該多個評估物件在該屬性關聯網路中對應各節點之間的邊資訊,生成該多個評估物件針對該第一類屬性維度和該第二類屬性維度的屬性關聯網路。
可選的,該處理模組具體用於:根據該融合關聯網路中各節點間的邊資訊,確定該融合關聯網路中各節點間的隨機遊走概率;基於該融合關聯網
路中各節點間的隨機遊走概率,對該融合關聯網路的節點隨機遍歷,得到該多個節點序列。
可選的,該屬性關聯網路中各節點間的邊資訊為各節點間的屬性關聯權重值;該融合關聯網路中各節點間的邊資訊為各節點間的綜合關聯權重值;該融合模組具體用於:針對該融合關聯網路中任意兩個節點,根據該兩個節點在該兩個屬性關聯網路中的屬性關聯權重值以及加權係數,確定該兩個節點在該融合關聯網路中的綜合關聯權重值;基於該融合關聯網路中各節點間的綜合關聯權重值,生成該多個評估物件的特徵關聯網路。
可選的,該融合模組具體用於:將該多個節點序列輸入預設詞向量的相關模型,生成該融合關聯網路的嵌入向量;根據該融合關聯網路的嵌入向量,確定該多個評估物件中任意兩個評估物件的相似度。
上述第二方面及第二方面各個可選裝置的有益效果,可以參考上述第一方面及第一方面各個可選方法的有益效果,這裡不再贅述。
第三方面,本發明提供一種電腦設備,包括程式或指令,當該程式或指令被執行時,用以執行上述第一方面及第一方面各個可選的方法。
第四方面,本發明提供一種存儲介質,包括程式或指令,當該程式或指令被執行時,用以執行上述第一方面及第一方面各個可選的方法。
101-104:步驟
301:生成模組
302:融合模組
303:處理模組
圖1為本發明實施例提供的一種物件間相似性的確定方法的步驟流程示意圖;
圖2為本發明實施例提供的一種物件間相似性的確定方法的具體步驟流程示意圖;圖3為本發明實施例提供的一種物件間相似性的確定裝置的結構示意圖。
為利 貴審查委員了解本發明之技術特徵、內容與優點及其所能達到之功效,茲將本發明配合附圖及附件,並以實施例之表達形式詳細說明如下,而其中所使用之圖式,其主旨僅為示意及輔助說明書之用,未必為本發明實施後之真實比例與精準配置,故不應就所附之圖式的比例與配置關係解讀、侷限本發明於實際實施上的申請範圍,合先敘明。
在本發明的描述中,需要理解的是,術語「中心」、「橫向」、「上」、「下」、「左」、「右」、「頂」、「底」、「內」、「外」等指示的方位或位置關係為基於圖式所示的方位或位置關係,僅是為了便於描述本發明和簡化描述,而不是指示或暗示所指的裝置或元件必須具有特定的方位、以特定的方位構造和操作,因此不能理解為對本發明的限制。
機構在日常運轉的過程中,會涉及各種各樣的物件。如果能通過一個物件在決策下的表現,可以推知在另一相似物件的表現,這無疑可以很好地指導另一評估物件的決策。因此,如何判斷評估物件間的相似性,對於機構決策來說很有研究價值。然而,目前還沒有對不同物件的相似性進行評估的方法,這是一個亟待解決的問題。為此,如圖1所示,本發明提供一種物件間相似性的確定方法。
步驟101:針對多個屬性組中任一屬性組的至少一個維度屬性,針對評估物件的該至少一個維度屬性,生成多個評估物件在該至少一個維度屬性下的屬性關聯網路。
步驟102:針對任意兩個屬性關聯網路,將該兩個屬性關聯網路進行融合,得到融合關聯網路。
步驟103:對每個融合關聯網路的節點隨機遍歷,得到該融合關聯網路的多個節點序列。
步驟104:根據該多個節點序列,確定該多個評估物件中任意兩個評估物件在該融合關聯網路下的相似度。
步驟101-步驟104中,每個評估物件在該屬性關聯網路中均有唯一映射的節點;該屬性關聯網路中各節點間的邊資訊表徵了在該至少一個維度屬性下評估物件之間的關聯程度。其中,每個評估物件在該融合關聯網路中均有唯一映射的節點;該融合關聯網路中各節點間的邊資訊表徵了評估物件之間的綜合關聯程度。需要說明的是,評估物件可以有多種情況,如區域,還可以為機構,此方法不僅可以用於區域之間的相似性評估,同時也可以應用於推薦系統之間的相似性評估。屬性關聯網路可以包括使用者行為的屬性關聯網路以及非使用者行為的屬性關聯網路,當包括使用者行為的屬性關聯網路以及非使用者行為的屬性關聯網路時,該融合關聯網路中各節點間邊資訊表徵了在使用者行為的影響下評估物件之間的綜合關聯程度。
一種可選實施方式中,步驟101具體可以為:步驟(1-1):針對該多個評估物件中任意兩個評估物件,根據該兩個評估物件在該維度屬性下的屬性值,確定該兩個評估物件在該屬性關聯網路中對應兩節點之間的邊資訊。
需要說明的是,該維度屬性可以包括一個或多個維度屬性。
舉例來說,區域A和區域B內在商戶數量維度屬性、設定業務的使用者數量維度屬性的屬性值,如區域A的商戶數量及區域A中設定業務的使用者數量,以及區域B的商戶數量及區域B中設定業務的使用者數量。
步驟(1-2):根據該多個評估物件在該屬性關聯網路中對應各節點之間的邊資訊,生成該多個評估物件針對該維度屬性的屬性關聯網路。
舉例來說,步驟(1-2)中兩個評估物件的邊資訊具體表現形式可以為關聯權重值。
一種可選實施方式中,該評估物件為區域;該維度屬性包括區域中使用者的時序位置屬性;該區域中使用者的時序位置屬性下的屬性值包括:使用者標識;步驟(1-2)具體可以為:根據該兩個區域中的使用者標識,確定該兩個區域的邊資訊。
具體來說,可以根據該兩個區域中具有相同使用者標識的使用者個數,確定該兩個區域的邊資訊。
需要說明的是,上述實施方式中,除了該兩個區域中的使用者標識外,還可以根據該兩個區域中具有相同使用者標識的使用者在兩個區域的逗留時差確定該兩個區域的邊資訊。
另一種可選實施方式中,該至少一個維度屬性包括第一類屬性維度和第二類屬性維度;該第一類屬性維度和該第二類屬性維度為預設關聯的屬性維度;步驟101具體可以為:
步驟(2-1):針對該多個評估物件中的第一評估物件和第二評估物件,根據該第一評估物件在該第一類屬性維度的屬性值與該第二評估物件在該第二類屬性維度的屬性值,確定該兩個評估物件在該屬性關聯網路中對應兩節點之間的邊資訊,或者,根據該第一評估物件在該第二類屬性維度的屬性值與該第二評估物件在
該第一類屬性維度的屬性值,確定該兩個評估物件在該屬性關聯網路中對應兩節點之間的邊資訊。
舉例來說,當評估物件為區域時,步驟(2-1)中的該第一類屬性維度為區域中設定業務商戶的比例,該第二類屬性維度為區域中設定業務中使用者的比例,那麼可以根據第一區域中設定業務商戶的比例與第二區域中設定業務使用者的比例,確定該第一區域和第二區域在該屬性關聯網路中對應兩節點之間的邊資訊,或者,可以根據第一區域中設定業務使用者的比例與第二區域中設定業務商戶的比例,確定該第一區域和第二區域在該屬性關聯網路中對應兩節點之間的邊資訊。
步驟(2-2):根據該多個評估物件在該屬性關聯網路中對應各節點之間的邊資訊,生成該多個評估物件針對該第一類屬性維度和該第二類屬性維度的屬性關聯網路。
一種可選實施方式中,該屬性關聯網路中各節點間的邊資訊為各節點間的屬性關聯權重值;該融合關聯網路中各節點間的邊資訊為各節點間的綜合關聯權重值;步驟102具體可以為:針對該融合關聯網路中任意兩個節點,根據該兩個節點在該兩個屬性關聯網路中的屬性關聯權重值以及加權係數,確定該兩個節點在該融合關聯網路中的綜合關聯權重值;基於該融合關聯網路中各節點間的綜合關聯權重值,生成該多個評估物件的特徵關聯網路。
舉例來說,兩個屬性關聯網路可以為任一使用者行為的屬性關聯網路以及任一非使用者行為的屬性關聯網路,使用者行為的屬性關聯網路的屬性關聯權重值為第一權重值,加權系數值為第一加權係數,非使用者行為的屬性關聯網路的屬性關聯權重值為第二權重值,加權系數值為第二加權係數。上面僅舉出了任意兩個屬性關聯網路在該融合關聯網路中的綜合關聯權重值的例子,
而實際上可以更多個屬性關聯網路一起融合,進一步地,第一權重值、第二權重值也可以有多個。舉例來說,綜合關聯權重值可以按照以下方式計算:W綜合=W1-1.a1-1+W1-2.a1-2+W1-3.a1-3+…+W2-1.a2-1+W2-2.a2-2+W2-3.a2-3+…;其中,W1-x表示第一權重值,W2-x表示第二權重值,a1-x表示第一加權係數,a2-x表示第二權重值。
一種可選實施方式中,步驟103具體可以為:
步驟(3-1):根據該融合關聯網路中各節點間的邊資訊,確定該融合關聯網路中各節點間的隨機遊走概率。
需要說明的是,上述步驟(3-1)中,兩個節點間的邊可以為兩條有向邊,如節點A到節點B的邊,節點B到節點A的邊。邊資訊可以為兩個有向邊的權重值。其中,一個節點遊走到另一節點的隨機遊走概率,可以按照權重值的比例來確定。舉例來說,節點A與節點B、C和D之間有邊,節點A到節點B、C和D權重值對應為3,4,5,則節點A到節點B的隨機遊走概率為1/4,節點A到節點C的隨機遊走概率為1/3,節點A到節點C的隨機遊走概率為5/12。
步驟(3-2):基於該融合關聯網路中各節點間的隨機遊走概率,對該融合關聯網路的節點隨機遍歷,得到該多個節點序列。
需要說明的是,每個融合關聯網路都可以進行多次遍歷,得到多個節點序列,如融合關聯網路的節點序列為ABCDE、ABCEF、ACEF、ABEC。可以通過統計節點序列的情況來確定兩個評估物件在該融合關聯網路下的相似度,如兩個節點連續的序列占總序列的比例越多,相似性越高。
一種可選實施方式中,步驟104具體可以為:
將該多個節點序列輸入預設詞向量的相關模型,生成該融合關聯網路的嵌入向量;根據該融合關聯網路的嵌入向量,確定該多個評估物件中任意兩個評估物件的相似度。
下面綜合本發明步驟101-步驟104的描述,進一步舉例詳細描述本發明提供的一種物件間相似性的確定方法。具體來說,以評估物件是區域為例,該過程概括為:通過空間資料處理方法,將地理位置切分為不同的區域。通過使用者的全球定位系統(Global Positioning System,GPS)時空資料、區域特徵屬性資料,構建多個屬性關聯網路,利用概率隨機遊走的方法生成節點序列,最後通過詞向量模型(如Skip-Gram)方式獲取區域節點的多個嵌入向量,計算區域之間的相似性。從而挖掘出與當前拓展好的區域相似的其他未拓展的區域。該方法充分考慮區域之間的關聯緊密度,區域屬性畫像特徵的相似性等,來挖掘與當前區域從網路結構上、屬性資訊上更為相似的區域。具體步驟可以為:(1)通過使用者的GPS時空遷移資料,形成區域之間的時空關聯網路G gps ;(2)抽取區域的畫像特徵,構建區域的特徵集V(v 1 ,v 2 ,v 3 ,......,v n ),如區域的使用者年齡分佈、區域的商戶分佈、區域的使用者消費力水準等。將具有相似屬性的區域之間,建立一條邊,從而構建區域之間的屬性關聯網路G v1,G v2,G vn ;(3)通過屬性關聯網路的融合,形成融合關聯網路,利用概率遊走的方式生成區域節點序列;(4)通過Skip-Gram模型,生成區域的多個嵌入向量,及不同融合網路下區域節點間的相似度;(5)通過加權平均方法綜合評定區域間的相似度。
更具體地,如圖2所示,以使用者行為的屬性關聯網路和非使用者行為的屬性關聯網路為例,步驟101-步驟104的過程如下:
(1)使用者行為的屬性關聯網路生成:
使用者在應用(APP)的使用過程中,會產生一些GPS位置資料。將使用者在某一時刻t 1的位置記為G t1,下一時刻使用者的位置記為G t2,依次類推。位置G t1與G t2之間,通過使用者的行為關係,構成了兩點之間的一條邊。同理,不同的區域之間可以通過多個使用者位置資料構建成一個基於使用者行為的屬性關聯網路。區域與區域之間連接的強度由生成該條邊的使用者個數以及時間差決定。因此,該區域使用者行為關係網絡是一個帶權重的有向關聯網路。
(2)非使用者行為的屬性關聯網路:
對於沒有使用者GPS覆蓋的區域,無法加入到使用者行為的屬性關聯網路中來,這些區域也是一個高潛力的拓展區域。基於此,可以設計基於區域的畫像特徵,來非使用者行為的屬性關聯網路。
非使用者行為的屬性關聯網路如下。將區域的特徵畫像進行分類,包括區域人流密度、區域商戶行業分佈、區域使用者年齡分佈、區域使用者消費力水準,區域使用者的消費偏好等,可以增加更多的區域畫像資訊。計算區域間不同特徵的相似度,將具有相似特徵的區域建立一條邊。比如區域A和區域B內的商戶基本都為餐飲商戶,那麼以商戶類型分佈這個特徵進行關聯網路生成是,區域A與區域B之間可以建立一條邊。如果區域C和區域D裡面的使用者年齡集中在(25-40)之間,那麼以使用者年齡分佈這個特徵進行關聯網路生成時,區域C和區域D之間可以建立一條邊,其他同理。
通過不同的非使用者屬性的劃分,可以生成多個非使用者行為的屬性關聯網路。
融合關聯網路生成:
通過將使用者行為的屬性關聯網路與非使用者行為的屬性關聯網路進行融合,可以生成多個融合關聯網路。
區域節點相似度計算:
對不同的融合關聯網路,通過前述方式,計算不同的融合關聯網路下區域節點的嵌入向量,並獲取不同的融合關聯網路下節點間的相似度。
如圖3所示,本發明提供一種物件間相似性的確定裝置,包括:生成模組301,用於針對多個屬性組中任一屬性組的至少一個維度屬性,針對評估物件的該至少一個維度屬性,生成多個評估物件在該至少一個維度屬性下的屬性關聯網路;其中,每個評估物件在該屬性關聯網路中均有唯一映射的節點;該屬性關聯網路中各節點間的邊資訊表徵了在該至少一個維度屬性下評估物件之間的關聯程度;融合模組302,用於針對任意兩個屬性關聯網路,將該兩個屬性關聯網路進行融合,得到融合關聯網路;每個評估物件在該融合關聯網路中均有唯一映射的節點;該融合關聯網路中各節點間的邊資訊表徵了評估物件之間的綜合關聯程度;處理模組303,用於對每個融合關聯網路的節點隨機遍歷,得到該融合關聯網路的多個節點序列;根據該多個節點序列,確定該多個評估物件中任意兩個評估物件在該融合關聯網路下的相似度。
可選的,該生成模組301具體用於:針對該多個評估物件中任意兩個評估物件,根據該兩個評估物件在該維度屬性下的屬性值,確定該兩個評估物件在該屬性關聯網路中對應兩節點之間的邊資訊;根據該多個評估物件在該屬性關聯網路中對應各節點之間的邊資訊,生成該多個評估物件針對該維度屬性的屬性關聯網路。
可選的,該評估物件為區域;該維度屬性包括區域中使用者的時序位置屬性;該區域中使用者的時序位置屬性下的屬性值包括:使用者標識;該生成模組301具體用於:根據該兩個區域中的使用者標識,確定該兩個區域的邊資訊。
可選的,該至少一個維度屬性包括第一類屬性維度和第二類屬性維度;該第一類屬性維度和該第二類屬性維度為預設關聯的屬性維度;該生成模組301具體用於:針對該多個評估物件中的第一評估物件和第二評估物件,根據該第一評估物件在該第一類屬性維度的屬性值與該第二評估物件在該第二類屬性維度的屬性值,確定該兩個評估物件在該屬性關聯網路中對應兩節點之間的邊資訊,或者,根據該第一評估物件在該第二類屬性維度的屬性值與該第二評估物件在該第一類屬性維度的屬性值,確定該兩個評估物件在該屬性關聯網路中對應兩節點之間的邊資訊;根據該多個評估物件在該屬性關聯網路中對應各節點之間的邊資訊,生成該多個評估物件針對該第一類屬性維度和該第二類屬性維度的屬性關聯網路。
可選的,該處理模組303具體用於:根據該融合關聯網路中各節點間的邊資訊,確定該融合關聯網路中各節點間的隨機遊走概率;基於該融合關聯網路中各節點間的隨機遊走概率,對該融合關聯網路的節點隨機遍歷,得到該多個節點序列。
可選的,該屬性關聯網路中各節點間的邊資訊為各節點間的屬性關聯權重值;該融合關聯網路中各節點間的邊資訊為各節點間的綜合關聯權重值;該融合模組302具體用於:針對該融合關聯網路中任意兩個節點,根據該兩個節點在該兩個屬性關聯網路中的屬性關聯權重值以及加權係數,確定該兩個節點在該融合關聯網路中的綜合關聯權重值;基於該融合關聯網路中各節點間的綜合關聯權重值,生成該多個評估物件的特徵關聯網路。
可選的,該融合模組302具體用於:將該多個節點序列輸入預設詞向量的相關模型,生成該融合關聯網路的嵌入向量;根據該融合關聯網路的嵌入向量,確定該多個評估物件中任意兩個評估物件的相似度。
本發明實施例提供一種電腦設備,包括程式或指令,當所述程式或指令被執行時,用以執行本發明實施例提供的一種物件間相似性的確定方法及任一可選方法。
本發明實施例提供一種電腦可讀存儲介質,包括程式或指令,當所述程式或指令被執行時,用以執行本發明實施例提供的一種物件間相似性的確定方法及任一可選方法。
最後應說明的是:本領域內的具通常知識者應明白,本發明的實施例可提供為方法、系統、或電腦程式產品。因此,本發明可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體方面的實施例的形式。而且,本發明可採用在一個或多個其中包含有電腦可用程式碼的電腦可用存儲介質(包括但不限於磁碟記憶體、光學記憶體等)上實施的電腦程式產品的形式。
本發明是參照根據本發明的方法、設備(系統)、和電腦程式產品的流程圖和/或方框圖來描述的。應理解可由電腦程式指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些電腦程式指令到通用電腦、專用電腦、嵌入式處理機或其他可程式設計資料處理設備的處理器以產生一個機器,使得通過電腦或其他可程式設計資料處理設備的處理器執行的指令產生用於實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些電腦程式指令也可存儲在能引導電腦或其他可程式設計資料處理設備以特定方式工作的電腦可讀記憶體中,使得存儲在所述電腦可讀記憶體中的指令產生包括指令裝置的製造品,所述指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
以上僅為本發明之較佳實施例,並非用來限定本發明之實施範圍,如果不脫離本發明之精神和範圍,對本發明進行修改或者等同替換,均應涵蓋在本發明申請專利範圍的保護範圍當中。
101-104:步驟
Claims (9)
- 一種物件間相似性的確定方法,包括:針對多個屬性組中任一屬性組的至少一個維度屬性,針對多個評估物件中任意兩個評估物件,根據該兩個評估物件在該至少一個維度屬性下的屬性值,確定該兩個評估物件之間的邊資訊;根據該多個評估物件之間的邊資訊,生成該多個評估物件針對該至少一個維度屬性的屬性關聯網路;其中,針對任一維度屬性的屬性關聯網路,每個評估物件在該維度屬性的屬性關聯網路中均有唯一映射的節點;該維度屬性的屬性關聯網路中各節點間的邊資訊表徵了在該維度屬性下評估物件之間的關聯程度;該評估物件為區域;至少一個維度屬性包括區域中使用者的時序位置屬性;該區域中使用者的時序位置屬性下的屬性值包括:使用者標識;針對任意兩個維度屬性的屬性關聯網路,將該兩個維度屬性的屬性關聯網路進行融合,得到融合關聯網路;每個評估物件在該融合關聯網路中均有唯一映射的節點;該融合關聯網路中各節點間的邊資訊表徵了評估物件之間的綜合關聯程度;對每個融合關聯網路的節點隨機遍歷,得到該融合關聯網路的多個節點序列;根據該多個節點序列,確定該多個評估物件中任意兩個評估物件在該融合關聯網路下的相似度。
- 如申請專利範圍第1項所述之物件間相似性的確定方法,根據該 兩個評估物件在該至少一個維度屬性下的屬性值,確定該兩個評估物件之間的邊資訊,包括:根據該兩個區域中的使用者標識,確定該兩個區域的邊資訊。
- 如申請專利範圍第1項所述之物件間相似性的確定方法,該至少一個維度屬性包括第一類屬性維度和第二類屬性維度;該第一類屬性維度和該第二類屬性維度為預設關聯的屬性維度;根據該兩個評估物件在該至少一個維度屬性下的屬性值,確定該兩個評估物件之間的邊資訊;根據該多個評估物件之間的邊資訊,生成該多個評估物件針對該至少一個維度屬性的屬性關聯網路,包括:針對該多個評估物件中的第一評估物件和第二評估物件,根據該第一評估物件在該第一類屬性維度的屬性值與該第二評估物件在該第二類屬性維度的屬性值,確定該兩個評估物件針對該第一類屬性維度和該第二類屬性維度的邊資訊,或者,根據該第一評估物件在該第二類屬性維度的屬性值與該第二評估物件在該第一類屬性維度的屬性值,確定該兩個評估物件針對該第一類屬性維度和該第二類屬性維度的邊資訊;根據該多個評估物件針對該第一類屬性維度和該第二類屬性維度的邊資訊,生成該多個評估物件針對該第一類屬性維度和該第二類屬性維度的屬性關聯網路。
- 如申請專利範圍第1至3項中任一項所述之物件間相似性的確定方法,該對每個融合關聯網路的節點隨機遍歷,得到多個節點序列,包括: 根據該融合關聯網路中各節點間的邊資訊,確定該融合關聯網路中各節點間的隨機遊走概率;基於該融合關聯網路中各節點間的隨機遊走概率,對該融合關聯網路的節點隨機遍歷,得到該多個節點序列。
- 如申請專利範圍第1至3項中任一項所述之物件間相似性的確定方法,該屬性關聯網路中各節點間的邊資訊為各節點間的屬性關聯權重值;該融合關聯網路中各節點間的邊資訊為各節點間的綜合關聯權重值;該將該兩個屬性關聯網路進行融合,得到融合關聯網路,包括:針對該融合關聯網路中任意兩個節點,根據該兩個節點在該兩個屬性關聯網路中的屬性關聯權重值以及加權係數,確定該兩個節點在該融合關聯網路中的綜合關聯權重值;基於該融合關聯網路中各節點間的綜合關聯權重值,生成該多個評估物件的特徵關聯網路。
- 如申請專利範圍第1至3項中任一項所述之物件間相似性的確定方法,該根據該多個節點序列,確定該多個評估物件中任意兩個評估物件的相似度,包括:將該多個節點序列輸入預設詞向量的相關模型,生成該融合關聯網路的嵌入向量;根據該融合關聯網路的嵌入向量,確定該多個評估物件中任意兩個評估物件的相似度。
- 一種物件間相似性的確定裝置,包括: 生成模組,用於針對多個屬性組中任一屬性組的至少一個維度屬性,針對多個評估物件中任意兩個評估物件,根據該兩個評估物件在該至少一個維度屬性下的屬性值,確定該兩個評估物件之間的邊資訊;根據該多個評估物件之間的邊資訊,生成該多個評估物件針對該至少一個維度屬性的屬性關聯網路;其中,針對任一維度屬性的屬性關聯網路,每個評估物件在該維度屬性的屬性關聯網路中均有唯一映射的節點;該維度屬性的屬性關聯網路中各節點間的邊資訊表徵了在該維度屬性下評估物件之間的關聯程度;該評估物件為區域;至少一個維度屬性包括區域中使用者的時序位置屬性;該區域中使用者的時序位置屬性下的屬性值包括:使用者標識;融合模組,用於針對任意兩個維度屬性的屬性關聯網路,將該兩個維度屬性的屬性關聯網路進行融合,得到融合關聯網路;每個評估物件在該融合關聯網路中均有唯一映射的節點;該融合關聯網路中各節點間的邊資訊表徵了評估物件之間的綜合關聯程度;處理模組,用於對每個融合關聯網路的節點隨機遍歷,得到該融合關聯網路的多個節點序列;根據該多個節點序列,確定該多個評估物件中任意兩個評估物件在該融合關聯網路下的相似度。
- 一種電腦設備,包括程式或指令,當該程式或指令被執行時,如申請專利範圍第1至6項中任一項所述之物件間相似性的確定方法被執行。
- 一種電腦可讀存儲介質,包括程式或指令,當該程式或指令被執 行時,如申請專利範圍第1至6項中任一項所述之物件間相似性的確定方法被執行。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010896318.8A CN112016836B (zh) | 2020-08-31 | 2020-08-31 | 一种对象间相似性的确定方法及装置 |
CN202010896318.8 | 2020-08-31 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202211052A TW202211052A (zh) | 2022-03-16 |
TWI842973B true TWI842973B (zh) | 2024-05-21 |
Family
ID=
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9917739B2 (en) | 2012-02-20 | 2018-03-13 | Aptima, Inc. | Systems and methods for network pattern matching |
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9917739B2 (en) | 2012-02-20 | 2018-03-13 | Aptima, Inc. | Systems and methods for network pattern matching |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Richter et al. | Object class segmentation of massive 3D point clouds of urban areas using point cloud topology | |
TWI525460B (zh) | 電子計算裝置、其個人化資訊推薦方法及其電腦程式產品 | |
Shen et al. | Spatial-proximity optimization for rapid task group deployment | |
WO2022041600A1 (zh) | 一种对象间相似性的确定方法及装置 | |
Lee et al. | Spatio-temporal provenance: Identifying location information from unstructured text | |
Belyakov et al. | Model Of Intellectual Visualization Of Geoinformation Service. | |
TWI842973B (zh) | 一種物件間相似性的確定方法及裝置 | |
Ding et al. | Route planning in a new tourist recommender system: A fireworks algorithm based approach | |
Peska et al. | Upcomp-a php component for recommendation based on user behaviour | |
JP5186959B2 (ja) | 社会ネットワーク構造モデルを導出する電子計算機及びプログラム | |
WO2020135420A1 (zh) | 对用户进行分类的方法和装置 | |
Moreno et al. | SMOT+: Extending the SMOT algorithm for discovering stops in nested sites | |
CN114186689B (zh) | 用于知识图谱中的路径发现的方法、系统、装置和介质 | |
Santoso et al. | M-guide: hybrid recommender system tourism in east-timor | |
Moradi et al. | A novel approach to support majority voting in spatial group MCDM using density induced OWA operator for seismic vulnerability assessment | |
Tulashvili et al. | The optimal tour problem in smart tourism recommender systems | |
Chen et al. | Mining location-based service data for feature construction in retail store recommendation | |
CN114820137A (zh) | 产品推荐方法、装置、处理器及电子设备 | |
Wang et al. | Pedestrian activity schedule models: review and promises | |
Kumari et al. | Travel recommendation system using geotagged photos | |
Wu et al. | Clustering in geo-social networks | |
Dubey et al. | Multi-view hypergraph convolution network for semantic annotation in lbsns | |
Bembenik et al. | Discovering collocation rules and spatial association rules in spatial data with extended objects using Delaunay diagrams | |
Zaman et al. | Evaluation of TSP for Emergency Routing | |
Cheng | Quality assessment of model-oriented generalization |