TWI607331B - 資料分析方法與裝置 - Google Patents

資料分析方法與裝置 Download PDF

Info

Publication number
TWI607331B
TWI607331B TW104131381A TW104131381A TWI607331B TW I607331 B TWI607331 B TW I607331B TW 104131381 A TW104131381 A TW 104131381A TW 104131381 A TW104131381 A TW 104131381A TW I607331 B TWI607331 B TW I607331B
Authority
TW
Taiwan
Prior art keywords
data
query
amount
features
range
Prior art date
Application number
TW104131381A
Other languages
English (en)
Other versions
TW201712579A (zh
Inventor
黃信騫
陳弘軒
崔文
Original Assignee
財團法人工業技術研究院
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 財團法人工業技術研究院 filed Critical 財團法人工業技術研究院
Priority to TW104131381A priority Critical patent/TWI607331B/zh
Priority to CN201510683234.5A priority patent/CN106547807B/zh
Priority to US14/957,595 priority patent/US11086881B2/en
Publication of TW201712579A publication Critical patent/TW201712579A/zh
Application granted granted Critical
Publication of TWI607331B publication Critical patent/TWI607331B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP

Description

資料分析方法與裝置
本揭露是有關於一種資料分析方法與裝置。
隨著資訊技術的發展,發展出雲端運算、電子商務等各種產業。這些產業通常必須面對巨量資料的分析。業者經常需要對巨量資料進行資料感知器(data sensor)的發掘。資料感知器是影響某一事件的幾個主要因素。然而,分析巨量資料是一項相當大的挑戰。系統必須窮舉各種特徵,並取出相當多的資料來進行分析。這種方式相當沒有效率,且造成系統很大的負擔。
本揭露係有關於一種資料分析方法與裝置。
根據本揭露之第一方面,提出一種資料分析方法。資料分析方法包括以下步驟。整合一資料庫中針對一事件之多筆查詢指令,以獲得被查詢之數個特徵。各個特徵被以一限制範圍 進行查詢。於各個特徵之各個限制範圍下,資料庫被查詢出數筆查詢資料。判斷此些查詢資料之一資料量是否高於一預定數量範圍或低於預定數量範圍。若資料量高於預定數量範圍,則根據此些特徵,降低此些查詢資料之資料量。若資料量低於預定數量範圍,則根據此些特徵,增加此些查詢資料之資料量。依據此些查詢資料,分析此些特徵與事件的一相關性。
根據本揭露之第二方面,提出一種資料分析系統。資料分析系統包括一資料庫、一使用者介面、一運算單元及一分析單元。使用者介面用以接收數個使用者針對一事件之多筆查詢指令。運算單元連接於資料庫及使用者介面。運算單元用以整合此些查詢指令,以獲得被查詢之數個特徵。各個特徵被以一限制範圍進行查詢。於各個特徵之各個限制範圍下,資料庫被查詢出數筆查詢資料。若資料量高於一預定數量範圍,則運算單元根據此些特徵,降低此些查詢資料之資料量。若資料量低於預定數量範圍,則運算單元根據此些特徵,增加此些查詢資料之資料量。分析單元連接於資料庫及運算單元。分析單元用以依據此些查詢資料,分析此些特徵與事件的一相關性。
為了對本揭露之上述及其他方面有更佳的瞭解,下文特舉較佳實施例,並配合所附圖式,作詳細說明如下:
100‧‧‧資料分析系統
110‧‧‧資料庫
120‧‧‧使用者介面
130‧‧‧運算單元
140‧‧‧分析單元
N1、N1’、N2、N3、N4、N10‧‧‧特徵
Ra1、Ra2、Rb1、Rb2、Rb3、Rc4、R1’、R1”‧‧‧限制範圍
S110、S120、S130、S140、S150‧‧‧流程步驟
第1圖繪示資料分析系統之示意圖。
第2圖繪示資料分析方法的流程圖。
第3圖繪示多筆資料之示意圖。
第4A~4C圖繪示查詢影響某一特徵之因素的三筆查詢指令之示意圖。
第5圖繪示第4A~4C圖之數筆查詢指令之整合示意圖。
第6圖繪示降低查詢資料之資料量之一示意圖。
第7圖繪示降低查詢資料之資料量之另一示意圖。
第8圖繪示降低查詢資料之資料量之另一示意圖。
第9圖繪示增加查詢資料之資料量之一示意圖。
第10圖繪示增加查詢資料之資料量之另一示意圖。
請參照第1圖,其繪示資料分析系統100之示意圖。資料分析系統100用以對巨量資料進行分析,以發掘出與某一事件(event)相關之資料感知器(data sensor)。資料感知器是影響某一事件的幾個主要因素。舉例來說,在晶圓製造過程中,影響製程良率的因素相當繁雜。為了找出影響製程良率的因素,會在機台上設置一些感知器,例如是溫度感知器、壓力感知器等等。藉由分析這些感知器的數值,可以找出哪些感知器與製程良率相關,藉此作為機台設定的依據。類比上述概念,在其他應用上,資料分析系統100可以從學生的各項資料中,進行資料感知器的發掘,以分析出影響數學成績的主要因素為何。資料感知器即為 分析出的主要因素。或者,電子商務之營收遽增時,可以從各項營業資料中,進行資料感知器的發掘,以分析出造成營收遽增的主要因素為何。
資料分析系統100包括一資料庫110、一使用者介面120、一運算單元130及一分析單元140。資料庫110用以儲存各種資料,例如是一記憶體、一硬碟、一雲端儲存裝置、一記憶卡或一光碟片。使用者介面120用以提供使用者輸入各項資訊,例如是一鍵盤或一觸控螢幕。運算單元130連接於資料庫110及使用者介面120,運算單元130用以進行各種資料運算程序或判斷程序。分析單元140連接於資料庫110及運算單元130,分析單元140用以進行各種分析程序或判斷程序。運算單元130及分析單元140例如分別是一積體電路、一韌體電路、一電路板、或儲存數組程式碼之記錄媒體。運算單元130與分析單元140可以是獨立的兩個物件、或者可以是整合的一個物件。
在資料量龐大時,資料感知器的發掘顯得相當的困難,以下搭配一流程圖詳細說明資料分析系統100如何在龐大資料量下進行資料感知器的發掘。
請參照第2圖,其繪示資料分析方法的流程圖。在一實施例中,資料庫110已儲存巨量的多筆資料。使用者介面120用以提供使用者針對一事件輸入查詢指令,以瞭解影響此事件的因素。舉例來說,請參照第3圖,其繪示多筆資料之示意圖。各筆資料記錄特徵N1~N10之內容。除了以表格的呈現方式以外, 在另一實施例中,此些資料可以樹狀圖、雷達圖等方式呈現。舉例來說,某一使用者查詢造成電子商務之營收遽增的主要因素時,可以輸入「商品價格」、「購買地點」等特徵,且限定「商品價格」之限制範圍為「大於1000元」、「購買地點」之限制範圍為「台北市」,來進行觀察。另一使用者查詢造成營收遽增之主要因素時,可以輸入「天氣」、「平面廣告金額」等特徵,且限定「天氣」之限制範圍為「雨天」、「平面廣告金額」之限制範圍為「大於30萬元」,來進行觀察。多個查詢指令可以由不同使用者輸入;或者,多個查詢指令可以由同一使用者輸入。此些查詢指令儲存亦於資料庫110中。
在步驟S110中,運算單元130整合資料庫120中針對一事件之多筆查詢指令,以獲得被查詢之數個特徵。舉例來說,請參照第4A~4C圖,其繪示欲查詢影響特徵N10之因素的三筆查詢指令之示意圖。如第4A圖所示,第一個查詢指令對特徵N1及特徵N2分別以限制範圍Ra1及限制範圍Ra2進行查詢。如第4B圖所示,第二個查詢指令對特徵N1、特徵N2及特徵N3分別以限制範圍Rb1、限制範圍Rb2及限制範圍Rb3進行查詢。如第4C圖所示,第三個查詢指令對特徵N4以限制範圍Rc4進行查詢。
請參照第5圖,其繪示第4A~4C圖之數筆查詢指令之整合示意圖。運算單元130整合第4A~4C圖之三筆查詢指令後,得到被查詢的特徵N1、特徵N2、特徵N3、特徵N4。特 徵N1具有限制範圍R1,特徵N2具有限制範圍R2,特徵N3具有限制範圍R3,特徵N4具有限制範圍R4。在一實施例中,整合之方式可以是將所有查詢指令查詢過的特徵進行聯集,以選取出所有曾經查詢過的至少一次特徵。或者,在另一實施例中,整合之方式可以是將所有查詢過的特徵進行交集,以選取出被所有查詢指令均查詢過的特徵。此外,第一筆查詢指令及第二筆查詢指令均有特徵N1,特徵N1之限制範圍R1可以是限制範圍Ra1及特徵Rb1之聯集。在另一實施例中,特徵N1之限制範圍R1可以是限制範圍Ra1及特徵Rb1之交集。在第5圖之實施例中,係採用聯集之方式來整合出特徵N1、N2、N3、N4,並以聯集之方式整合出限制範圍R1、R2、R3、R4。於各個特徵N1、N2、N3、N4之各個限制範圍R1、R2、R3、R4下,資料庫120被查詢出數筆查詢資料。
在步驟S120中,運算單元130判斷此些查詢資料之一資料量是否高於一預定數量範圍或低於此預定數量範圍。若資料量高於此預定數量範圍,則進入步驟S130之資料收縮程序(data shrink procedure);若資料量低於此預定數量範圍,則進入步驟S140之資料擴大程序(data expand procedure);若資料量落入此預定數量範圍,則進入步驟S150。預定數量範圍係根據資料分析系統100之運算能力而定,而不超過運算能力的上限。舉例來說,預定數量範圍例如是1~2萬筆。
在步驟S130中,根據特徵,降低查詢資料之資料 量。步驟S130可以採取多種作法,以下分別一一說明。
在一實施例中,運算單元130可以依據特徵於查詢指令之使用次數,剔除部分之特徵,以降低資料量。舉例來說,請參照第6圖,其繪示降低查詢資料之資料量之一示意圖。於第5圖中,被查詢的特徵N1、N2、N3、N4有四個。其中於第一~第三個查詢指令中,特徵N1、N2使用2次,特徵N3使用1次,特徵N4使用1次。故可以剔除使用此數較低的特徵N3、特徵N4,而保留特徵N1、特徵N2。如此一來,僅留下滿足特徵N1之限制範圍R1或特徵N2之限制範圍R2之查詢資料,使其資料量能夠有效降低。
在另一實施例中,運算單元130可以縮小限制範圍,以降低資料量。舉例來說,請參照第7圖,其繪示降低查詢資料之資料量之另一示意圖。運算單元130可以將特徵N1之限制範圍R1縮小為限制範圍R1’,例如是將「大於30萬元」縮小為「大於50萬元」。如此一來,查詢資料之資料量能夠有效降低。
在另一實施例中,運算單元130可以抽樣此些查詢資料,以降低資料量。舉例來說,請參照第8圖,其繪示降低查詢資料之資料量之另一示意圖。當資料量為預定數量範圍之平均值的3/2倍時,則可以2/3的比率進行抽樣。抽樣之方式例如是對滿足特徵N1之限制範圍R1之數筆資料中,抽取2/3的資料,其餘1/3予以捨棄。對滿足特徵N2之限制範圍R2之數筆資料中, 抽取2/3的資料,其餘1/3予以捨棄。對滿足特徵N3之限制範圍R3之數筆資料中,抽取2/3的資料,其餘1/3予以捨棄。對滿足特徵N4之限制範圍R4之數筆資料中,抽取2/3的資料,其餘1/3予以捨棄。第8圖中,打勾者為保留的資料。如此一來,資料量可縮減為原來的2/3,而落於預定數量範圍內。
步驟S130之資料收縮程序(data shrink procedure)完成後,則回至步驟S120重新進行判斷。
在步驟S140中,運算單元130根據特徵,增加查詢資料之資料量。步驟S130可以採取多種作法,以下分別一一說明。
在一實施例中,運算單元130可以提升特徵之層級,以增加資料量。舉例來說,請參照第9圖,其繪示增加查詢資料之資料量之一示意圖。特徵N1例如是「平面廣告金額」,特徵N1之限制範圍R1例如是「大於30萬元」。運算單元130可以將特徵N1之層級提升至特徵N1’,例如是「各種廣告金額」。如此一來,包含電視廣告金額大於30萬元的資料也會加入。使得查詢資料之資料量能夠有效增加。
在另一實施例中,運算單元130可以放大限制範圍,以增加資料量。舉例來說,請參照第10圖,其繪示降低查詢資料之資料量之另一示意圖。運算單元130可以將特徵N1之限制範圍R1放大為限制範圍R1”,例如是將「大於30萬元」放大為「大於10萬元」。如此一來,查詢資料之資料量能夠有效 增加。
步驟S140之資料擴大程序(data expand procedure)完成後,則回至步驟S120重新進行判斷。
在步驟150中,分析單元140依據查詢資料,分析特徵與事件的一相關性。分析單元140可以採用自我調整增強(Adaptive boosting)演算法、最小絕對壓縮挑選法(LASSO)、逐步迴歸法(Stepwise Regression)等機器學習方法來分析特徵與事件的相關性,並獲得相關於事件之資料感知器(data sensor)。
因應巨量資料時代的來臨,上述各種實施例可以透過數個查詢指令的整合,快速發掘可能為資料感知器的特徵,有效降巨量資料的分析複雜度。並且,透過資料收縮程序(data shrink procedure),有效避免資料過於龐大而無法負荷的情況。再者,透過資料擴大程序(data expand procedure),可以獲得足夠的資料量,以提升發掘資料感知器之精準度。
綜上所述,雖然本揭露已以較佳實施例揭露如上,然其並非用以限定本揭露。本揭露所屬技術領域中具有通常知識者,在不脫離本揭露之精神和範圍內,當可作各種之更動與潤飾。因此,本揭露之保護範圍當視後附之申請專利範圍所界定者為準。
S110、S120、S130、S140、S150‧‧‧流程步驟

Claims (16)

  1. 一種資料分析方法,包括:整合一資料庫中針對一事件之多筆查詢指令,以獲得被查詢之複數個特徵,各該特徵以一限制範圍進行查詢,於各該特徵之各該限制範圍下,該資料庫被查詢出複數筆查詢資料;判斷該些查詢資料之一資料量是否高於一預定數量範圍或低於該預定數量範圍;若該資料量高於該預定數量範圍,則根據該些特徵,降低該些查詢資料之該資料量;若該資料量低於該預定數量範圍,則根據該些特徵,增加該些查詢資料之該資料量;以及依據該些查詢資料,分析該些特徵與該事件的一相關性。
  2. 如申請專利範圍第1項所述之資料分析方法,其中降低該些查詢資料之該資料量之步驟包括:依據該些特徵於該些查詢指令之使用次數,剔除部分之該些特徵。
  3. 如申請專利範圍第1項所述之資料分析方法,其中降低該些查詢資料之該資料量之步驟包括:縮小部分之該些限制範圍。
  4. 如申請專利範圍第1項所述之資料分析方法,其中降低該些查詢資料之該資料量之步驟包括:抽樣該些查詢資料。
  5. 如申請專利範圍第1項所述之資料分析方法,其中增加該些查詢資料之該資料量之步驟包括:提升部分該些特徵之層級。
  6. 如申請專利範圍第1項所述之資料分析方法,其中增加該些查詢資料之該資料量之步驟包括:放大部分該些限制範圍。
  7. 如申請專利範圍第1項所述之資料分析方法,其中該些查詢指令由至少二使用者輸入。
  8. 如申請專利範圍第1項所述之資料分析方法,其中該些查詢指令之其中之二由同一使用者輸入。
  9. 一種資料分析系統,包括:一資料庫;一使用者介面,用以接收複數個使用者針對一事件之多筆查詢指令;一運算單元,連接於該資料庫及該使用者介面,該運算單元用以整合該些查詢指令,以獲得被查詢之複數個特徵,各該特徵以一限制範圍進行查詢,於各該特徵之各該限制範圍下,該資料庫被查詢出複數筆查詢資料;若該資料量高於一預定數量範圍,則該運算單元根據該些特徵,降低該些查詢資料之該資料量;若該資料量低於該預定數量範圍,則該運算單元根據該些特徵,增加該些查詢資料之該資料量;以及一分析單元,連接於該資料庫及該運算單元,該分析單元用 以依據該些查詢資料,分析該些與該事件的一相關性。
  10. 如申請專利範圍第9項所述之資料分析系統,其中該運算單元係依據該些特徵於該些查詢指令之使用次數,剔除部分之該些特徵,以降低該些查詢資料之該資料量。
  11. 如申請專利範圍第9項所述之資料分析系統,其中該運算單元係縮小部分該些限制範圍,以降低該些查詢資料之該資料量。
  12. 如申請專利範圍第9項所述之資料分析系統,其中該運算單元係抽樣該些查詢資料,以降低該些查詢資料之該資料量。
  13. 如申請專利範圍第9項所述之資料分析系統,其中該運算單元係提升部分該些特徵之層級,以增加該些查詢資料之該資料量。
  14. 如申請專利範圍第9項所述之資料分析系統,其中該運算單元係放大部分該些限制範圍,以增加該些查詢資料之該資料量。
  15. 如申請專利範圍第9項所述之資料分析系統,其中該些查詢指令由至少二使用者輸入。
  16. 如申請專利範圍第9項所述之資料分析系統,其中該些查詢指令之其中之二由同一使用者輸入。
TW104131381A 2015-09-23 2015-09-23 資料分析方法與裝置 TWI607331B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW104131381A TWI607331B (zh) 2015-09-23 2015-09-23 資料分析方法與裝置
CN201510683234.5A CN106547807B (zh) 2015-09-23 2015-10-20 数据分析方法与装置
US14/957,595 US11086881B2 (en) 2015-09-23 2015-12-02 Method and device for analyzing data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW104131381A TWI607331B (zh) 2015-09-23 2015-09-23 資料分析方法與裝置

Publications (2)

Publication Number Publication Date
TW201712579A TW201712579A (zh) 2017-04-01
TWI607331B true TWI607331B (zh) 2017-12-01

Family

ID=58282486

Family Applications (1)

Application Number Title Priority Date Filing Date
TW104131381A TWI607331B (zh) 2015-09-23 2015-09-23 資料分析方法與裝置

Country Status (3)

Country Link
US (1) US11086881B2 (zh)
CN (1) CN106547807B (zh)
TW (1) TWI607331B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11645605B2 (en) * 2019-08-22 2023-05-09 Sap Se Contextual IoT with blockchain
CN114357875B (zh) * 2021-12-27 2022-09-02 广州龙数科技有限公司 基于机器学习的智能数据处理系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWM491908U (zh) * 2014-08-21 2014-12-11 shu-zhen Lin 整合式房屋物件配對系統
TW201516718A (zh) * 2013-10-29 2015-05-01 Chunghwa Telecom Co Ltd 調整大量資料檢索結果的方法

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5832482A (en) 1997-02-20 1998-11-03 International Business Machines Corporation Method for mining causality rules with applications to electronic commerce
WO2002008948A2 (en) * 2000-07-24 2002-01-31 Vivcom, Inc. System and method for indexing, searching, identifying, and editing portions of electronic multimedia files
US6931612B1 (en) * 2002-05-15 2005-08-16 Lsi Logic Corporation Design and optimization methods for integrated circuits
US7836051B1 (en) 2003-10-13 2010-11-16 Amazon Technologies, Inc. Predictive analysis of browse activity data of users of a database access system in which items are arranged in a hierarchy
US8200687B2 (en) 2005-06-20 2012-06-12 Ebay Inc. System to generate related search queries
US20140156628A1 (en) 2005-10-26 2014-06-05 Cortica Ltd. System and method for determination of causality based on big data analysis
CN101118618A (zh) * 2006-08-02 2008-02-06 力晶半导体股份有限公司 工程数据分析数据库的查询系统与方法
US7904355B1 (en) 2007-02-20 2011-03-08 Vendavo, Inc. Systems and methods for a revenue causality analyzer
CN101441645B (zh) * 2007-11-23 2016-09-28 财团法人工业技术研究院 技术数据分析的系统与方法
US8412598B2 (en) 2008-02-06 2013-04-02 John Early Systems and methods for a causality analyzer
US8762364B2 (en) 2008-03-18 2014-06-24 Yahoo! Inc. Personalizing sponsored search advertising layout using user behavior history
KR101045955B1 (ko) 2008-11-14 2011-07-04 한국과학기술정보연구원 문맥의 의미적 연관관계 추출 방법 및 그 장치와 그 프로그램 소스를 저장한 기록 매체
CN101751400A (zh) * 2008-12-09 2010-06-23 财团法人工业技术研究院 技术数据分析的系统与方法以及专利分析的系统
US8655821B2 (en) 2009-02-04 2014-02-18 Konstantinos (Constantin) F. Aliferis Local causal and Markov blanket induction method for causal discovery and feature selection from data
US8392443B1 (en) * 2009-03-17 2013-03-05 Google Inc. Refining search queries
JP5514220B2 (ja) * 2009-09-29 2014-06-04 株式会社東芝 検索装置、及びシステム
CN101814085A (zh) * 2010-02-04 2010-08-25 林培光 基于wdb特征和用户查询请求的web数据库选择方法
JP2012008659A (ja) 2010-06-22 2012-01-12 Sony Corp データ処理装置、データ処理方法、およびプログラム
US20130117272A1 (en) 2011-11-03 2013-05-09 Microsoft Corporation Systems and methods for handling attributes and intervals of big data
WO2013099002A1 (ja) * 2011-12-28 2013-07-04 楽天株式会社 検索装置、検索方法、検索プログラム及び記録媒体
TWI472936B (zh) 2012-05-11 2015-02-11 Univ Nat Taiwan 人物照片搜尋系統
US20140006338A1 (en) 2012-06-29 2014-01-02 Applied Materials, Inc. Big data analytics system
CN103577429A (zh) * 2012-07-25 2014-02-12 阿里巴巴集团控股有限公司 数据分析、数据查询方法及装置
KR20140021934A (ko) * 2012-08-13 2014-02-21 양용철 외국인 관광객을 위한 인터넷 데이터 전용 스마트 폰의 임대 수익사업의 사업모델
CN103678402B (zh) * 2012-09-21 2018-10-16 厦门雅迅网络股份有限公司 一种海量数据下数据实时统计的方法
US20140214883A1 (en) * 2013-01-29 2014-07-31 Google Inc. Keyword trending data
CN103116649B (zh) * 2013-02-28 2016-09-14 用友网络科技股份有限公司 数据分析系统和数据分析方法
US9720940B2 (en) 2013-03-15 2017-08-01 Konstantinos (Constantin) F. Aliferis Data analysis computer system and method for parallelized and modularized analysis of big data
US20140289174A1 (en) 2013-03-15 2014-09-25 Alexander Statnikov Data Analysis Computer System and Method For Causal Discovery with Experimentation Optimization
CN104517020B (zh) 2013-09-30 2017-10-20 日电(中国)有限公司 用于因果效应分析的特征提取方法和装置
CN104750681B (zh) * 2013-12-25 2018-02-23 中国移动通信集团辽宁有限公司 一种海量数据的处理方法及装置
CN104090901B (zh) * 2013-12-31 2017-06-13 腾讯数码(天津)有限公司 一种对数据进行处理的方法、装置及服务器
KR20150096005A (ko) * 2014-02-13 2015-08-24 주식회사 더존다스 Gui 레이아웃 편집 시스템 및 그 제공방법
US10068008B2 (en) * 2014-08-28 2018-09-04 Microsoft Technologies Licensing, LLC Spelling correction of email queries
CN104794003B (zh) * 2015-02-04 2019-06-04 汉鼎宇佑互联网股份有限公司 一种整合实时和非实时模式的大数据分析系统
CN104679884B (zh) * 2015-03-16 2018-04-10 北京奇虎科技有限公司 数据库的数据分析方法、装置以及系统
CN104834730B (zh) * 2015-05-15 2018-06-01 北京京东尚科信息技术有限公司 数据分析系统和方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201516718A (zh) * 2013-10-29 2015-05-01 Chunghwa Telecom Co Ltd 調整大量資料檢索結果的方法
TWM491908U (zh) * 2014-08-21 2014-12-11 shu-zhen Lin 整合式房屋物件配對系統

Also Published As

Publication number Publication date
US20170083583A1 (en) 2017-03-23
US11086881B2 (en) 2021-08-10
TW201712579A (zh) 2017-04-01
CN106547807A (zh) 2017-03-29
CN106547807B (zh) 2021-01-22

Similar Documents

Publication Publication Date Title
CN112771536B (zh) 增强现实数字内容搜索和尺寸确定技术
US9892187B2 (en) Data analysis method, data analysis device, and storage medium storing processing program for same
TWI718643B (zh) 異常群體識別方法及裝置
CN104321802B (zh) 图像分析装置、图像分析系统、图像分析方法
US8898145B2 (en) Query optimization techniques for business intelligence systems
US20160217158A1 (en) Image search method, image search system, and information recording medium
US20170337449A1 (en) Program, system, and method for determining similarity of objects
US20200097483A1 (en) Novel olap pre-calculation model and method for generating pre-calculation result
Chebbi et al. Big data: Concepts, challenges and applications
US20150074130A1 (en) Method and system for reducing data dimensionality
US10579589B2 (en) Data filtering
Cui et al. Anomaly detection in hyperspectral imagery based on low-rank and sparse decomposition
Singh et al. Quaternion generalized Chebyshev-Fourier and pseudo-Jacobi-Fourier moments for color object recognition
CN111241123A (zh) 视图数据查询方法、装置、服务器及存储介质
CN110717806A (zh) 产品信息推送方法、装置、设备及存储介质
TWI607331B (zh) 資料分析方法與裝置
WO2017203672A1 (ja) アイテム推奨方法、アイテム推奨プログラムおよびアイテム推奨装置
JPWO2019123703A1 (ja) データ分析支援装置、データ分析支援方法およびデータ分析支援プログラム
CN114463587A (zh) 一种异常数据检测方法、装置、设备及存储介质
US20160026613A1 (en) Processing image to identify object for insertion into document
JP2007018349A (ja) システム、検出方法およびプログラム
JP7015320B2 (ja) データ分析支援装置、データ分析支援方法およびデータ分析支援プログラム
CN112329409A (zh) 一种单元格颜色转换方法、装置及电子设备
US10372694B2 (en) Structured information differentiation in naming
CN113761213A (zh) 一种基于知识图谱的数据查询系统、方法及终端设备