TW202133005A - 在線資料採集的方法及系統 - Google Patents
在線資料採集的方法及系統 Download PDFInfo
- Publication number
- TW202133005A TW202133005A TW109141472A TW109141472A TW202133005A TW 202133005 A TW202133005 A TW 202133005A TW 109141472 A TW109141472 A TW 109141472A TW 109141472 A TW109141472 A TW 109141472A TW 202133005 A TW202133005 A TW 202133005A
- Authority
- TW
- Taiwan
- Prior art keywords
- data
- online
- data collection
- module
- terminal
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Human Computer Interaction (AREA)
- Entrepreneurship & Innovation (AREA)
- Multimedia (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本說明書實施例公開了一種在線資料採集的方法和系統。所述方法包括:採集端根據預設規則在線生成第一資料採集模組,並將所述第一資料採集模組發送給複數個第一目標終端;所述複數個第一目標終端在線接收到所述第一資料採集模組後在第一預設時間內在線反饋複數個第一資料,並將反饋的所述複數個第一資料在線返回給所述採集端;所述採集端基於接收到的所述複數個第一資料進行在線分析。本申請案提供的方法保證了調查研究的即時性,使得對調查研究結果的分析沒有滯後性。
Description
本申請案關於網路技術領域,特別關於一種在線資料採集的方法及系統。
調查研究是指透過各種調查方式系統客觀地收集資訊並研究分析,對各產業未來的發展趨勢予以預測,爲投資或發展方向的決策做準備。
相關技術中,調查研究分爲質性調查研究和量化調查研究,對於質性調查研究,主要透過召集全國各地符合配額要求的使用者(例如,20個使用者)在同一時間同一地點進行深入的訪談,然而,該質性調查研究方式成本高、資料分析效率低。
因此,如何實現質性調查研究的低成本以及高效的資料分析成爲目前亟需解決的技術問題。
本申請案實施例之一提供一種在線資料採集的方法。所述在線資料採集方法包括:採集端根據預設規則在線生成第一資料採集模組,並將所述第一資料採集模組發送給複數個第一目標終端;所述複數個第一目標終端在線接收到所述第一資料採集模組後在第一預設時間內在線反饋複數個第一資料,並將反饋的所述複數個第一資料在線返回給所述採集端;所述採集端基於接收到的所述複數個第一資料進行在線分析。
在一些實施例中,確定所述複數個第一目標終端包括:在線向複數個目標終端發送招募資訊,所述複數個目標終端對所述招募資訊給出複數個反饋資訊;所述採集端根據預設的篩選規則對所述反饋資訊進行篩選,將篩選的反饋資訊對應的目標終端作爲所述複數個第一目標終端。
在一些實施例中,所述在線資料採集方法還包括:所述複數個第一目標終端將反饋的所述複數個第一資料在線返回給所述採集端之後,所述採集端根據所述複數個第一資料或/和所述預設規則在線生成第二資料採集模組,並將所述第二資料採集模組在線發送給所述複數個第一目標終端;所述複數個第一目標終端在線接收到所述第二資料採集模組後在第二預設時間內在線反饋複數個第二資料;所述採集端基於接收到的所述複數個第二資料進行在線分析;重複前述步驟直至資料採集完成。
在一些實施例中,所述在線資料採集方法還包括:所述採集端根據所述第一資料採集模組或/和所述第二資料採集模組的相關資訊,對所述複數個第一資料或/和所述複數個第二資料進行在線分析。
在一些實施例中,所述相關資訊包括類別或/和重要性。
在一些實施例中,所述採集端根據所述第一資料採集模組或/和所述第二資料採集模組的相關資訊,對所述複數個第一資料或/和所述複數個第二資料進行在線分析包括:當所述相關資訊中的類型爲開放題目時,所述採集端將所述複數個第一目標終端針對所述開放題目給出的所述複數個第一資料或/和所述複數個第二資料輸入至文本識別模型,得到識別結果。
在一些實施例中,所述識別結果包括觀點提取結果和/或觀點聚類結果。
在一些實施例中,所述文本識別模型爲文本分類模型和/或非監督學習聚類模型。
在一些實施例中,所述文本分類模型的訓練過程如下:獲得至少一個開放題目的至少一個應答資訊文本;標記所述至少一個應答資訊文本的標籤,所述標籤表示所述至少一個應答資訊中每一個的觀點;將攜帶標籤應答資訊文本輸入初始文本分類模型進行訓練,得到訓練好的文本分類模型。
在一些實施例中,所述採集端根據所述第一資料採集模組或/和所述第二資料採集模組的相關資訊,對所述複數個第一資料或/和所述複數個第二資料進行在線分析包括:當所述相關資訊中的類型爲選擇題、判斷題、點選題或圖片熱區題目時,所述採集端將統計所述複數個第一目標終端針對所述選擇題、所述判斷題、所述點選題或所述圖片熱區題目給出的所述複數個第一資料或/和所述複數個第二資料中的不同選項被選中的數量或/和不同選項的佔比。
在一些實施例中,所述採集端根據所述第一資料採集模組或/和所述第二資料採集模組的相關資訊,對所述複數個第一資料或/和所述複數個第二資料進行在線分析包括:當所述相關資訊中的類型爲排序題目時,所述採集端將統計所述複數個第一目標終端針對所述排序題目給出的所述複數個第一資料或/和所述複數個第二資料中的每個選項的排序結果。
在一些實施例中,所述複數個第一目標終端爲超過20個回答調查研究題目的受訪者所用終端。
本說明書實施例的另一個方面提供一種在線資料採集的系統。所述在線資料採集系統包括:主持人模組,用於採集端根據預設規則在線生成第一資料採集模組,並將所述第一資料採集模組發送給複數個第一目標終端;受訪者模組,用於所述複數個第一目標終端在線接收到所述第一資料採集模組後在第一預設時間內在線反饋複數個第一資料,並將反饋的所述複數個第一資料在線返回給所述採集端;分析模組,用於所述採集端基於接收到的所述複數個第一資料進行在線分析。
本說明書實施例的另一個方面提供一種在線資料採集裝置。所述在線資料採集裝置包括處理器,所述處理器用於執行如上所述的在線資料採集方法。
本說明書實施例的另一個方面提供一種電腦可讀儲存媒介。所述儲存媒介儲存電腦指令,當電腦讀取儲存媒介中的電腦指令後,電腦執行如上所述的在線資料採集方法。
爲了更清楚地說明本申請案實施例的技術方案,下面將對實施例描述中所需要使用的圖式作簡單的介紹。顯而易見地,下面描述中的圖式僅僅是本申請案的一些示例或實施例,對於本發明所屬技術領域中具有通常知識者而言,在不付出創造性勞動的前提下,還可以根據這些圖式將本申請案應用於其它類似情景。除非從語言環境中顯而易見或另做說明,圖中相同標號代表相同結構或操作。
應當理解,本文使用的「系統」、「裝置」、「單元」和/或「模組」是用於區分不同級別的不同組件、元件、部件、部分或裝配的一種方法。然而,如果其他詞語可實現相同的目的,則可透過其他表達來替換所述詞語。
如本申請案和申請專利範圍中所示,除非上下文明確提示例外情形,「一」、「一個」、「一種」和/或「該」等詞並非特指單數,也可包括複數。一般說來,術語「包括」與「包含」僅提示包括已明確標識的步驟和元素,而這些步驟和元素不構成一個排它性的羅列,方法或者設備也可能包含其它的步驟或元素。
本申請案中使用了流程圖用來說明根據本申請案的實施例的系統所執行的操作。應當理解的是,前面或後面操作不一定按照順序來精確地執行。相反,可以按照倒序或同時處理各個步驟。同時,也可以將其他操作添加到這些過程中,或從這些過程移除某一步或數步操作。
圖1是根據本說明書的一些實施例所示的示例性在線資料採集系統100的應用場景示意圖。
在線資料採集系統100可以實現一對多的在線調查研究,以及根據目標終端的反饋資訊進行即時在線分析。例如,在線資料採集系統100可以用於調查問卷領域,具體地,可以將一個調查研究題目發送給複數個應答者,以實現一對多的在線調查研究,還可以接收應答者在規定答題時間內回答的內容,並對回答內容進行在線分析,從而實現對資料的即時分析,避免資料分析的滯後性。在線資料採集系統100可以是用於網路服務的線上服務平臺。例如,透過在線資料採集系統100可以用於線上的問卷調查平臺。在線資料採集系統100可以包含伺服器110、網路120、目標終端130、資料庫140以及採集端150。伺服器110可包含處理設備112。
在一些實施例中,伺服器110可以用於處理與線上資料採集相關的資訊和/或資料。例如,伺服器110可以對第一目標終端反饋的第一資料進行分析。伺服器110可以是獨立的伺服器或者伺服器組。該伺服器組可以是集中式的或者分布式的(如:伺服器110可以是分布系統)。在一些實施例中,該伺服器110可以是區域的或者遠端的。例如,伺服器110可透過網路120存取儲存於目標終端130、資料庫140中的資訊和/或資料。在一些實施例中,伺服器110可直接與目標終端130、資料庫140連接以存取儲存於其中的資訊和/或資料。在一些實施例中,伺服器110可在雲端平臺上執行。例如,該雲端平臺可包括私有雲端、公共雲端、混合雲端、社區雲端、分散式雲端、內部雲端等中的一種或其任意組合。
在一些實施例中,伺服器110可包含處理設備112。該處理設備112可處理與資料採集模組相關的資料和/或資訊以執行一個或複數個本申請案中描述的功能。例如處理設備112可以接收目標終端130反饋的第一資料,確定第二資料採集模組。在一些實施例中,處理設備112可包含一個或複數個子處理設備(例如,單晶片處理設備或多核多晶片處理設備)。僅僅作爲範例,處理設備112可包含中央處理器(CPU)、專用積體電路(ASIC)、專用指令處理器(ASIP)、圖形處理器(GPU)、物理處理器(PPU)、數位信號處理器(DSP)、現場可編程閘陣列(FPGA)、可編輯邏輯電路(PLD)、控制器、微控制器單元、精簡指令集電腦(RISC)、微處理器等或以上任意組合。
網路120可促進資料和/或資訊的交換,資料和/或資訊可以包括目標終端130反饋的複數個文本。在一些實施例中,在線資料採集系統100中的一個或複數個組件(例如,伺服器110、目標終端130、資料庫140、採集端150)可透過網路120發送資料和/或資訊給在線資料採集系統100中的其他組件。在一些實施例中,網路120可是任意類型的有線或無線網路。例如,網路120可包括纜線網路、有線網路、光纖網路、電信網路、內部網路、網際網路、區域網路(LAN)、廣域網路(WAN)、無線區域網路(WLAN)、都會區域網路(MAN)、公共電話交換網路(PSTN)、藍牙網路、ZigBee網路、近場通訊(NFC)網路等或以上任意組合。在一些實施例中,網路120可包括一個或複數個網路進出點。例如,網路120可包含有線或無線網路進出點,如基站和/或網際網路交換點120-1、120-2、…,透過這些進出點,在線資料採集系統100的一個或複數個組件可連接到網路120上以交換資料和/或資訊。
目標終端130可以是指使用者(例如,調查問卷的被調查對象等)用於反饋第一資料或第二資料(如調查問卷的一個或複數個回答)的設備的終端,可包括手機130-1、平板電腦130-2、筆記型電腦130-3等中的一種或其任意組合。在一些實施例中,目標終端130可包括具有輸入功能的裝置,以輸入調查研究題目的答案。在一些實施例中,目標終端130可以將反饋的資料發送到伺服器110。
資料庫140是用於爲系統100提供其他資訊的來源。資料庫140可以用於爲系統100提供與服務相關的資訊,例如,在線答題的人數、使用者在線答題的時長、使用者輸入的文字字數等。又例如,資料庫140還可以包括在線答題的使用者資訊、歷史回答等,該使用者資訊可以包括使用者的姓名、使用者的年齡、使用者的職位等。資料庫140可以在單個中央伺服器、透過通訊鏈路連接的複數個伺服器或複數個個人設備中實現。資料庫140可以由複數個個人設備和雲端伺服器生成。在一些實施例中,資料庫140可儲存從目標終端130反饋的資料,例如,被調查者對於調查研究題目的回答。在一些實施例中,資料庫140可儲存供伺服器110執行或使用的資訊和/或指令,以執行本申請案中描述的示例性方法。在一些實施例中,資料庫140可包括大容量記憶體、可移動記憶體、揮發性讀寫記憶體(例如,隨機存取記憶體RAM)、唯讀記憶體(ROM)等或以上任意組合。在一些實施例中,資料庫140可在雲端平臺上實現。例如,該雲端平臺可包括私有雲端、公共雲端、混合雲端、社區雲端、分散式雲端、內部雲端等或以上任意組合。
在一些實施例中,資料庫140可與網路120連接以與系統100的一個或複數個組件(例如,伺服器110、目標終端130、採集端150等)通訊。在線資料採集系統100的一個或複數個組件可透過網路120存取儲存於資料庫140中的資料或指令,例如,對於有關員工敬業度調查、員工滿意度調查、客戶滿意度調查的開放問卷調查的回答等。在一些實施例中,資料庫140可直接與在線資料採集系統100中的一個或複數個組件(如,伺服器110、目標終端130、採集端150)連接或通訊。在一些實施例中,資料庫140可以是伺服器110的一部分。
在一些實施例中,採集端150可以是用於採集資料的設備的終端,例如,可以是用於生成調查研究題目的終端設備。採集端150可以包括手機150-1、平板電腦150-2、筆記型電腦150-3等中的一種或其任意組合。
圖2是根據本說明書的一些實施例所示的示例性在線資料採集系統200的模組圖。如圖2所示,該在線資料採集系統200包括:主持人模組210、受訪者模組220以及分析模組230。
主持人模組210可以用於採集端根據預設規則在線生成第一資料採集模組,並將所述第一資料採集模組發送給複數個第一目標終端。在一些實施例中,主持人模組210可以用於採集端根據調查研究題目提綱在線生成調查研究題目,並將調查研究題目發送給複數個受訪者所使用的終端。在一些實施例中,調查研究題目提綱可以用於確定具體問哪些題目。在一些實施例中,所述複數個第一目標終端爲超過20個回答調查研究題目的受訪者所用終端。
在一些實施例中,所述複數個第一目標終端將反饋的所述複數個第一資料在線返回給所述採集端之後,主持人模組210可以用於所述採集端根據所述複數個第一資料或/和所述預設規則在線生成第二資料採集模組,並將所述第二資料採集模組在線發送給所述複數個第一目標終端。例如,複數個受訪者在預定時間內對主持人模組210生成的調查研究題目進行回答之後,主持人模組210可以根據調查研究題目大綱再生成新的題目發送給這些受訪者。又例如,複數個受訪者在預定時間內對主持人模組210生成的調查研究題目進行回答之後,主持人模組210可以根據這些受訪者對調查研究題目的回答情况,針對不同的受訪者生成新的調查研究題目,然後發送給不同的受訪者。比如,受訪者A會對調查研究題目「你對我們的產品滿意嗎」回答爲滿意,受訪者B回答爲不滿意,則可以生成新的調查研究題目「你在哪些方面不滿意」並發給受訪者A。
受訪者模組220可以用於所述複數個第一目標終端在線接收到所述第一資料採集模組後在第一預設時間內在線反饋複數個第一資料,並將反饋的所述複數個第一資料在線返回給所述採集端。在一些實施例中,受訪者模組220可以用於實現複數個第一目標終端接收第一資料採集模組中的調查研究題目,並在第一預設時間內完成對調查研究題目的回答,得到回答生成的第一資料。
在一些實施例中,受訪者模組220可以用於所述複數個第一目標終端在線接收到所述第二資料採集模組後在第二預設時間內在線反饋複數個第二資料。
分析模組230可以用於所述採集端基於接收到的所述複數個第一資料進行在線分析。
在一些實施例中,分析模組230可以用於所述採集端基於接收到的所述複數個第二資料進行在線分析。
在一些實施例中,分析模組230可以用於所述採集端根據所述第一資料採集模組或/和第二資料採集模組的相關資訊,對所述複數個第一資料或/和所述複數個第二資料進行在線分析。其中,相關資訊包括類別或/和重要性。
在一些實施例中,當所述相關資訊中的類型爲開放題目時,分析模組230可以用於所述採集端將所述複數個第一目標終端針對所述開放題目給出的所述複數個第一資料或/和所述複數個第二資料輸入至文本識別模型,得到識別結果。其中,識別結果包括觀點提取結果和/或觀點聚類結果。文本識別模型爲文本分類模型和/或非監督學習聚類模型。
在一些實施例中,當所述相關資訊中的類型爲選擇題、判斷題、點選題或圖片熱區題目時,分析模組230可以用於所述採集端統計所述複數個第一目標終端針對所述選擇題目、所述判斷題目、所述點選題目或所述圖片熱區題目給出的所述複數個第一資料或/和所述複數個第二資料中的不同選項被選中的數量或/和不同選項的佔比。
在一些實施例中,當所述相關資訊中的類型爲排序題目時,分析模組230可以用於所述採集端統計所述複數個第一目標終端針對所述排序題目給出的所述複數個第一資料或/和所述複數個第二資料中的每個選項的排序結果。
在一些實施例中,在線資料採集系統200還可以包括訓練模組,該模組用於對所述文本分類模型的訓練。具體地,訓練模組獲得至少一個開放題目的至少一個應答資訊文本;標記所述至少一個應答資訊文本的標籤,所述標籤表示所述至少一個應答資訊中每一個的觀點;將攜帶標籤應答資訊文本輸入初始文本分類模型進行訓練,得到訓練好的文本分類模型。
圖3是根據本申請案一些實施例所示的在線資料採集方法300的示例性流程圖。如圖3所述,該在線資料採集方法300包括:
步驟302,採集端根據預設規則在線生成第一資料採集模組,並將所述第一資料採集模組發送給複數個第一目標終端。具體地,該步驟可以透過主持人模組210執行。
採集端可以具備複數個功能。在一些實施例中,採集端可以根據應用場景的不同,具備相應的功能。例如,採集端可以應用於在線調查研究的場景,相應地,採集端可以具備編輯調查研究題目的功能。
在一些實施例中,可以根據預設規則在線生成第一資料採集模組。第一資料採集模組是指攜帶有需要使用者(例如,第一目標終端對應的使用者)進行反饋的資料的模組,其中,資料可以是任何資料。在一些實施例中,資料可以包括調查研究題目等。
在一些實施例中,預設規則可以是與第一資料採集模組攜帶的資料相匹配的規則,例如,第一資料採集模組攜帶的資料爲調查研究題目,則預設規則可以是調查研究題目提綱。在一些實施例中,調查研究題目提綱可以是需要向第一目標終端提問的題目要點提綱,即,根據調查研究題目提綱可以進一步確定具體的調查研究題目。例如,對於滿意度調查,調查研究題目提綱可以是「1、詢問是否滿意;2、對於滿意的人,問最滿意什麼地方;3、對於不滿意的人則問爲什麼不滿意;4、不滿意的人回答了不滿意的原因之後,問建議改進的方向」。針對該示例,可以生成含有「請問您今天對我們的服務滿意嗎」調查研究題目的第一資料採集模組。
在一些實施例中,調查研究題目提綱還可以是複數個具體的調查研究題目組成的內容提綱,例如,調查研究題目提綱可以是1、請問您的性別是?2、請問您的實際年齡是多少?3、請問您聽過/見過哪些消費級基因檢測公司呢?
在一些實施例中,編題者可以透過調查研究題目提綱在採集端在線編輯調查研究題目,以生成第一資料採集模組。
在一些實施例中,調查研究題目的類型可以是任何類型,例如,詞語點選題、圖片熱區題以及排序題等,其中,詞語點選題是用於第一目標終端回答該題中的熱點詞語,熱點詞語爲採集端設置的任何詞語;圖片熱區題是用於第一目標終端回答該題中的熱點區域,熱點區域爲採集端設置的圖片中的任何區域;排序題是用於第一目標終端回答該題中的排列順序。
在一些實施例中,目標終端可以是指接收資料採集模組並在線對資料採集模組做出即時反饋的終端,也可以是對資料採集模組做出即時反饋的受訪者使用的終端設備。例如,目標終端可以是對調查研究題目進行即時回答的受訪者使用的終端設備。其中終端設備可以是行動手機、筆記型電腦等。具體地,目標終端接收到資料採集模組中的調查研究題目之後,受訪者(又稱被調查研究者)可以透過該終端在線對調查研究題目進行即時回答。
在一些實施例中,可以由一個採集端根據調查研究題目提綱在線生成第一調查研究題目,並將第一調查研究題目發送給複數個第一目標終端。在一些實施例中,所述複數個第一目標終端可以爲超過20個回答調查研究題目的受訪者所用終端,例如,複數個目標終端可以爲一百個、一千個以及一萬個受訪者所使用的終端。
步驟304,所述複數個第一目標終端在線接收到所述第一資料採集模組後在第一預設時間內在線反饋複數個第一資料,並將反饋的所述複數個第一資料在線返回給所述採集端。具體地,該步驟可以透過受訪者模組220執行。
第一預設時間是指複數個第一目標終端回答第一調查研究題目的規定答題時間,第一預設時間可以根據實際需求靈活設置,在一些實施例中,第一預設時間可以根據第一調查研究題目的題型進行設置,例如,選擇題答題時間爲5分鐘,開放題答題時間爲30分鐘等。
步驟302和步驟304的整個過程是在線即時進行的,具體地,採集端生成第一調查研究題目以及複數個第一目標終端反饋複數個第一資料的過程是在線即時進行的,即,採集端生成了第一調查研究題目之後立即發送給複數個第一目標終端進行即時回答。
在一些實施例中,複數個第一目標終端同時針對第一調查研究題目反饋第一資料,具體地,複數個受訪者可以在與其對應的第一目標終端上透過手動輸入或語音輸入等方式反饋(即回答)第一調查研究題目。
步驟306,所述採集端基於接收到的所述複數個第一資料進行在線分析。具體地,該步驟可以透過分析模組230執行。
在一些實施例中,採集端可以是具備編輯調查研究題目功能的編題終端,也可以是具備即時觀察整個調查研究過程的觀察終端,其中,觀察終端可以是編題終端上的編題者邀請的觀察者所使用的終端,具體地,編題者可以透過向觀察者的電子信箱發送邀請鏈接,以邀請觀察者觀察整個調查研究過程,觀察者可以透過點擊邀請鏈接,以接受編題者的邀請。
在一些實施例中,編題終端和/或觀察終端中可以基於接收到的複數個第一資料進行在線即時分析。關於對資料進行在線即時分析的更多細節已在本說明書的其他位置說明,此處不再贅述。
透過以上描述,採集端可以將第一資料採集模組發送給複數個第一目標終端,即,可以將一個調查研究題目發送給複數個受訪者進行答題,實現一對多的在線調查研究,節約調查研究成本,且複數個第一目標終端在線接收到所述第一資料採集模組後在第一預設時間內在線反饋複數個第一資料,即複數個第一目標終端在相同的答題時間內回答調查研究題目,保證了調查研究的即時性,使得採集端接收到第一資料的時間近似同步,進一步使得後續資料分析沒有滯後性,提高了資料分析的效率,縮短了資料分析的時間。
受訪者在對調查研究題目回答之前,可以對受訪者進行篩選確定。第一目標終端可以是指目標終端對第一資料採集模組反饋之前透過特定方式確定的終端。例如,第一目標終端可以是調查研究前透過某種篩選方式確定的受訪者使用的終端。
在一些實施例中,可以透過發送招募資訊,並基於目標終端對招募資訊的反饋確定第一目標終端。具體地,在線向複數個終端發送招募資訊,所述複數個終端對所述招募資訊給出複數個反饋資訊;採集端根據預設的篩選規則對所述反饋資訊進行篩選,將篩選的反饋資訊對應的終端作爲所述第一目標終端。其中,招募資訊可以是任何資訊,例如,招募資訊可以是招募問卷,此時,預設的篩選規則可以是篩選招募問卷的反饋資訊的規則,預設的篩選規則可以根據實際需求靈活設置,例如,招募問卷中可以設置年齡選項、性別選項、職業選項等調查研究題目,若預設的篩選規則是年齡在25~27的女性投資人,則可以將填寫了年齡在25~27之間、職業爲投資的女性使用者作爲第一目標使用者,將第一目標使用者使用終端作爲第一目標終端。透過對反饋資訊進行篩選,可以篩選出符合要求的受訪者參加調查研究,增加調查研究的準確度。
在一些實施例中,篩選出的複數個第一終端所對應的受訪者還可以透過掃描識別碼(例如,二維碼、條形碼等)進入在線群組(例如,微信群、QQ群等),以便於在線群組中的管理員對受訪者進行管理以及解答群組內受訪者的疑惑,以確保群組內的受訪者能順利參加調查研究。在一些實施例中,識別碼可以設置在招募問卷內。
圖4是根據本申請案一些實施例所示的在線資料採集方法400的另一示例性流程圖。如圖4所述,該在線資料採集方法400包括:
步驟402,所述複數個第一目標終端將反饋的所述複數個第一資料在線返回給所述採集端之後,所述採集端根據所述複數個第一資料或/和所述預設規則在線生成第二資料採集模組,並將所述第二資料採集模組在線發送給所述複數個第一目標終端。具體地,該步驟402可以由主持人模組210執行。
在一些實施例中,所述採集端可以根據複數個第一目標終端對第一調查研究題目回答的複數個第一資料生成第二調查研究題目,並將所述第二調查研究題目在線發送給第一目標終端。
在一些實施例中,第二調查研究題目可以根據受訪者對第一調查研究題目回答的情况(即第一資料),生成相應調查研究題目,並將相應的調查研究題目發送給對應的第一目標終端。具體地,根據第一類回答生成調查研究題目A,第二類回答生成調查研究題目B,以此類推……然後將調查研究題目A發送至給出第一類回答的第一目標終端,將調查研究題目B發送至給出第二類回答的第一目標終端,以此類推……例如,第一調查研究題目爲「你爲什麼喜歡這個產品」,第一目標終端分別爲受訪者A和受訪者B所使用的終端,若受訪者A回答的第一資料爲:因爲我覺得這個產品顔色鮮豔,受訪者B回答的第一資料爲:因爲我喜歡這個產品的功效。採集端可以根據受訪者A的第一資料生成第二調查研究題目:請問顔色鮮豔具體體現在哪裡呢?並將該第二調查研究題目發送給受訪者A所使用的終端,也可以根據受訪者B的第一資料生成第二調查研究題目:請問您具體喜歡這個產品的什麼功效呢?並將該第二調查研究題目發送給受訪者B所使用的終端。
在一些實施例中,採集端可以將基於第一資料生成的相應的第二調查研究題目同時在線發送給對應的第一目標終端。仍採用上述示例,則採集端可以將「請問顔色鮮豔具體體現在哪裡呢」和「請問您具體喜歡這個產品的什麼功效呢」同時分別發送給受訪者A和受訪者B。
根據以上描述,透過第一目標終端對第一調查研究題目回答的複數個第一資料生成至少一個第二調查研究題目,並將至少一個第二調查研究題目在線發送給第一目標終端,即,可以透過第一目標終端對第一調查研究題目的回答確定不同的第二調查研究題目,並將不同的第二調查研究題目有針對性地發送給對應的第一目標終端,實現對受訪者的多層級追問,從而實現了深度調查研究,提高了調查研究的精準度。
在一些實施例中,採集端還可以根據預設規則在線生成第二資料採集模組,並將所述第二資料採集模組在線發送給複數個第一目標終端。預設規則可以是調查研究題目提綱。在一些實施例中,第二調查研究題目可以根據調查研究提綱生成,即,按照提綱的要求生成第二調查研究題目,並發送給回答第一調查研究題目的第一目標終端。在一些實施例中,第二資料採集模組可以與第一資料採集模組相同,也可以與第一資料採集模組不相同。以上述調查研究題目提綱爲複數個具體的調查研究題目組成的內容提綱爲例,調查研究題目提綱爲「1、請問您的性別是?2、請問您的實際年齡是多少?3、請問您聽過/見過哪些消費級基因檢測公司呢?」,若第一調查研究題目爲第1題,則第二調查研究題目可以繼續爲第1題,也可以爲第2題和第3題中的任意一題。
步驟404,所述複數個第一目標終端在線接收到所述第二資料採集模組後在第二預設時間內在線反饋複數個第二資料。具體地,該步驟404可以由受訪者模組220執行。
在一些實施例中,第二預設時間可以與第一預設時間相同,也可以不相同。第二預設時間是指複數個第一目標終端回答第二調查研究題目的規定答題時間,第二預設時間可以根據實際需求靈活設置,在一些實施例中,第二預設時間可以根據第二調查研究題目的題型進行設置,例如,選擇題答題時間爲5分鐘,開放題答題時間爲30分鐘等。
在一些實施例中,第二資料可以是第一目標終端所對應的受訪者對第二調查研究題目的回答內容,仍以上述第二調查研究題目爲「請問顔色鮮豔具體體現在哪裡呢?」爲例,若第一目標終端所對應的受訪者回答「我覺得該產品的顔色色彩明亮,且顔色種類多」,則該回答爲第二資料。
在一些實施例中,複數個第一目標終端同時針對第二調查研究題目反饋第二資料,具體地,複數個受訪者可以在與其對應的第一目標終端上透過手動輸入或語音輸入等方式反饋(即回答)第二調查研究題目。
步驟406,所述採集端基於接收到的所述複數個第二資料進行在線分析。具體地,該步驟406可以由分析模組230執行。
在一些實施例中,編題終端和/或觀察終端中可以基於接收到的複數個第二資料進行在線即時分析。具體地,編題終端和觀察終端已在上述內容中進行陳述,故,在此不再贅述。
步驟408,重複前述步驟直至資料採集完成。
在一些實施例中,資料採集完成可以表示根據調查研究題目提綱生成的全部調查研究題目均獲得反饋資訊,例如,根據該調查研究題目提綱可以生成五個調查研究題目,若這五個調查研究題目均被目標終端反饋,則認爲資料採集完成。
在一些實施例中,還可以根據對所述複數個第一資料或/和所述複數個第二資料進行在線即時分析,以實現幫助使用者根據調查研究分析結果進行決策的目的。
在一些實施例中,採集端根據所述第一資料採集模組或/和所述第二資料採集模組的相關資訊,對所述複數個第一資料或/和所述複數個第二資料進行在線分析。在一些實施例中,採集端可以透過第一資料採集模組或/和第二資料採集模組所攜帶的標識獲取其相關資訊,其中,所述相關資訊包括類別或/和重要性。對應地,可以採用類別標識獲取類別資訊,採用重要性標識獲取重要性資訊。在一些實施例中,類別可以表示題目的類別。例如,可以包括選擇題、判斷題、點選題、圖片熱區題、排序題以及開放題目等。重要性可以是資料的重要性,例如,可以表徵該調查研究題目的重要程度,例如,非常重要、一般重要、不重要等。對於題目的重要性可以是調查研究者根據不同情况確定的。例如,某飯店需要對用餐者的用餐情况進行調查研究,特別地,希望知道用餐者對推出的新菜的反饋,在調查研究題目中,關於新菜的相關題目的重要性等級最高。
在一些實施例中,相關資訊中的類型可以爲開放題目,此時,所述採集端將所述複數個第一目標終端針對所述開放題目給出的所述複數個第一資料或/和所述複數個第二資料輸入至文本識別模型,得到識別結果。識別結果可以包括觀點提取結果和/或觀點聚類結果。具體地,可以將受訪者對開放題目的回答(例如,第一資料或/第二資料)輸入文本分類模型中,確定該回答的觀點,例如,滿意、不滿意等。在一些實施例中,可以對所述觀點提取結果基於聚類演算法或非監督聚類模型進行聚類。例如,可以根據觀點提取結果計算語義相似度,從而根據語義相似度對所述觀點提取結果進行聚類集合,以得到觀點聚類結果。在一些實施例中,可以將所述觀點提取結果輸入至語義相似度模型,以得到語義相似度。在一些實施例中,語義相似度模型可以採用監督式的神經網路匹配模型SimNet。
在一些實施例中,文本識別模型可以是用於進行觀點提取的文本分類模型,在一些實施例中,文本識別模型可以是基於深度學習的文本分類模型,例如TextCNN+softmax模型,其中TextCNN具有自動提取文本特徵的功能,softmax用於文本分類,需要對softmax進行訓練,使得訓練後的softmax具有類別預測和觀點提取的功能。
在一些實施例中,文本識別模型也可以是貝葉斯、支持向量機(Support Vector Machine,SVM)、xgboost(eXtreme Gradient Boosting)等分類器。在此種實施方式中,首先需要採用TF-IDF(Term Frequency–Inverse Document Frequency,詞頻-逆向文件頻率)或統計詞頻等方式提取特徵,然後對上述分類器進行訓練,使得訓練後的上述分類器具有觀點提取的功能。
在一些實施例中,文本識別模型也可以是非監督學習聚類模型,其中非監督學習聚類模型的演算法可以採用K-means演算法、層次聚類演算法等。
在一些實施例中,相關資訊中的類型可以爲選擇題、判斷題、點選題或圖片熱區題目,此時,所述採集端統計所述複數個第一目標終端針對所述選擇題目、所述判斷題目、所述點選題目或所述圖片熱區題目給出的所述複數個第一資料或/和所述複數個第二資料中的不同選項被選中的數量或/和不同選項的佔比。
在一些實施例中,佔比可以是指第一資料或/第二資料中的不同選項被選中的數量與參與該題回答的目標終端的總數量的比值。以對第一資料的分析爲例,若第一資料對應的調查研究題目爲多選題,反饋第一資料的第一目標終端的數量爲100個,該多選題具備A BCD四個選項,第一資料中不同選項的選中情况如下:A-90人,B-50人,C-80人,D-80人,則該佔比爲A選項-90/100,B選項-50/100,C選項-80/100,D選項-80/100。
在一些實施例中,佔比還可以是指第一資料或/和第二資料中不同選項被選中的數量與第一資料或/和第二資料對應的調查研究題目中所有選項的被選中的總數量的比值。繼續以上述示例說明,第一資料對應的調查研究題目所具備的選項分別被選中的總數量爲90+50+80+80=300,則該佔比爲A選項-90/300,B選項-50/300,C選項-80/300,D選項-80/300。
在一些實施例中,相關資訊中的類型可以爲排序題目,此時,所述採集端統計所述複數個第一目標終端針對所述排序題目給出的所述複數個第一資料或/和所述複數個第二資料中的每個選項的排序結果。以第一目標終端對第一調查研究題目反饋第一資料,參與回答的複數個第一目標終端的數量爲20人爲例,若第一調查研究題目爲「請您說明在某APP上購買該產品的5個主要原因,並對這5個主要原因進行排序」,採集端統計的複數個第一資料分別爲:「促銷力度大、該產品是我需要的、該產品是值得信賴和購買的」,且統計出將「促銷力度大」排在第一位的第一目標終端有13位,將「該產品是我需要的」排在第二位的第一目標終端有6位,將「該產品是值得信賴和購買的」排在第三位的第一目標終端有1位,則該排序題目的排序結果爲「1、促銷力度大;2、該產品是我需要的;3、該產品是值得信賴和購買的」。
在一些實施例中,統計可以是人工統計,也可以是透過演算法統計,例如,哈希表統計。
圖5是根據本說明書的一些實施例所示的文本分類模型的訓練方法500的示例性流程圖。如圖5所述,該訓練方法500包括:
步驟502,獲得至少一個開放題目的至少一個應答資訊文本。具體地,該步驟502可以透過訓練模組執行。
在一些實施例中,可以透過資料庫獲取歷史調查研究中的開放題目的歷史應答資訊,並將該歷史應答資訊作爲應答資訊文本,也可以透過爬取網路資料的語料獲取應答資訊文本。
步驟504,標記所述至少一個應答資訊文本的標籤,所述標籤表示所述至少一個應答資訊中每一個的觀點。具體地,該步驟504可以透過訓練模組執行。
在一些實施例中,標記所述至少一個應答資訊文本的標籤的過程可以由人工完成,即人工判斷該應答資訊文本的觀點,進而對該應答資訊文本進行標記,使得該應答資訊文本攜帶標籤。在一些實施例中,還可以透過正則對應答資訊文本進行觀點提取,使得該應答資訊文本攜帶觀點標籤。
步驟506,將攜帶標籤應答資訊文本輸入初始文本分類模型進行訓練,得到訓練好的文本分類模型。具體地,該步驟506可以透過訓練模組執行。
在一些實施例中,初始文本識別模型可以是用於進行觀點提取的文本分類模型,在一些實施例中,初始文本識別模型可以是基於深度學習的文本分類模型,例如TextCNN+softmax模型,其中TextCNN具有自動提取文本特徵的功能,softmax用於文本分類,需要對softmax進行訓練,使得訓練後的softmax具有類別預測和觀點提取的功能。在一些實施例中,文本識別模型也可以是非監督學習聚類模型,其中非監督學習聚類模型的演算法可以採用K-means演算法、層次聚類演算法等。在一些實施例中,可以將經過固定的M輪訓練後的初始文本識別模型(例如,經過1000輪訓練),作爲訓練好的文本識別模型,在一些實施例中,還可以在經過連續多輪訓練後的初始文本識別模型的損失函數反映出該模型已經可以準確地預測出應答資訊文本的觀點和/或觀點類別的情况下,結束訓練,將該輪訓練的初始文本識別模型作爲訓練好的文本識別模型。
本說明書實施例可能帶來的有益效果包括但不限於:(1)本說明書中的實施例透過採集端可以將一個調查研究題目發送給複數個受訪者進行答題,實現一對多的在線調查研究,節約調查研究成本;(2)複數個第一目標終端在預設時間內同時反饋複數個第一資料或/和第二資料,保證了調查研究的即時性,使得採集端接收到複數個第一資料或/和第二資料的時間同步,進一步使得後續對第一資料或/和第二資料的分析沒有滯後性;(3)可以根據相關資訊對第一資料或/和第二資料進行分析,實現開放題目的觀點提取或/和觀點聚類,對開放題目的分析更加全面徹底,提高了調查研究的精準度,更好地幫助客戶進行相應的決策。需要說明的是,不同實施例可能產生的有益效果不同,在不同的實施例裡,可能產生的有益效果可以是以上任意一種或幾種的組合,也可以是其他任何可能獲得的有益效果。
上文已對基本概念做了描述,顯然,對於本領域技術人員來說,上述詳細披露僅僅作爲示例,而並不構成對本說明書的限定。雖然此處並沒有明確說明,本領域技術人員可能會對本說明書進行各種修改、改進和修正。該類修改、改進和修正在本說明書中被建議,所以該類修改、改進、修正仍屬於本說明書示範實施例的精神和範圍。
同時,本說明書使用了特定詞語來描述本說明書的實施例。如「一個實施例」、「一實施例」、和/或「一些實施例」意指與本說明書至少一個實施例相關的某一特徵、結構或特點。因此,應强調並注意的是,本說明書中在不同位置兩次或多次提及的「一實施例」或「一個實施例」或「一個替代性實施例」並不一定是指同一實施例。此外,本說明書的一個或複數個實施例中的某些特徵、結構或特點可以進行適當的組合。
此外,本領域技術人員可以理解,本說明書的各方面可以透過若干具有可專利性的種類或情况進行說明和描述,包括任何新的和有用的工序、機器、產品或物質的組合,或對它們的任何新的和有用的改進。相應地,本說明書的各個方面可以完全由硬體執行、可以完全由軟體(包括韌體、常駐軟體、微碼等)執行、也可以由硬體和軟體組合執行。以上硬體或軟體均可被稱爲「資料塊」、「模組」、「引擎」、「單元」、「組件」或「系統」。此外,本說明書的各方面可能表現爲位於一個或複數個電腦可讀媒介中的電腦產品,該產品包括電腦可讀程式編碼。
電腦儲存媒介可能包含一個內含有電腦程式編碼的傳播資料信號,例如在基頻上或作爲載波的一部分。該傳播信號可能有多種表現形式,包括電磁形式、光形式等,或合適的組合形式。電腦儲存媒介可以是除電腦可讀儲存媒介之外的任何電腦可讀媒介,該媒介可以透過連接至一個指令執行系統、裝置或設備以實現通訊、傳播或傳輸供使用的程式。位於電腦儲存媒介上的程式編碼可以透過任何合適的媒介進行傳播,包括無線電、電纜、光纖電纜、RF、或類似媒介,或任何上述媒介的組合。
本說明書各部分操作所需的電腦程式編碼可以用任意一種或多種程式語言編寫,包括物件導向編程語言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常規程式化編程語言如C語言、Visual Basic、Fortran2003、Perl、COBOL2002、PHP、ABAP,動態編程語言如Python、Ruby和Groovy,或其他編程語言等。該程式編碼可以完全在使用者電腦上運行、或作爲獨立的軟體包在使用者電腦上運行、或部分在使用者電腦上運行部分在遠端電腦運行、或完全在遠端電腦或處理設備上運行。在後種情况下,遠端電腦可以透過任何網路形式與使用者電腦連接,比如區域網路(LAN)或廣域網路(WAN),或連接至外部電腦(例如透過網際網路),或在雲端計算環境中,或作爲服務使用如軟體即服務(SaaS)。
此外,除非請求項中明確說明,本說明書所述處理元素和序列的順序、數字字母的使用、或其他名稱的使用,並非用於限定本說明書流程和方法的順序。儘管上述披露中透過各種示例討論了一些目前認爲有用的發明實施例,但應當理解的是,該類細節僅具有說明的目的,附加的請求項並不僅限於披露的實施例,相反,請求項旨在覆蓋所有符合本說明書實施例實質和範圍的修正和等價組合。例如,雖然以上所描述的系統組件可以透過硬體設備實現,但是也可以只透過軟體的解決方案得以實現,如在現有的處理設備或行動設備上安裝所描述的系統。
同理,應當注意的是,爲了簡化本說明書披露的表述,從而幫助對一個或複數個發明實施例的理解,前文對本說明書實施例的描述中,有時會將多種特徵歸併至一個實施例、圖式或對其的描述中。但是,這種披露方法並不意味著本說明書對象所需要的特徵比請求項中提及的特徵多。實際上,實施例的特徵要少於上述披露的單個實施例的全部特徵。
一些實施例中使用了描述成分、屬性數量的數字,應當理解的是,此類用於實施例描述的數字,在一些示例中使用了修飾詞「大約」、「近似」或「大體上」來修飾。除非另外說明,「大約」、「近似」或「大體上」表明所述數字允許有±20%的變化。相應地,在一些實施例中,說明書和請求項中使用的數值參數均爲近似值,該近似值根據個別實施例所需特點可以發生改變。在一些實施例中,數值參數應考慮規定的有效數位並採用一般位數保留的方法。儘管本說明書一些實施例中用於確認其範圍廣度的數值域和參數爲近似值,在具體實施例中,此類數值的設定在可行範圍內盡可能精確。
針對本說明書引用的每個專利、專利申請案、專利申請公開物和其他材料,如文章、書籍、說明書、出版物、文獻等,特此將其全部內容併入本說明書作爲參考。與本說明書內容不一致或產生衝突的申請歷史文件除外,對本說明書請求項最廣範圍有限制的文件(當前或之後附加於本說明書中的)也除外。需要說明的是,如果本說明書附屬材料中的描述、定義、和/或術語的使用與本說明書所述內容有不一致或衝突的地方,以本說明書的描述、定義和/或術語的使用爲準。
最後,應當理解的是,本說明書中所述實施例僅用以說明本說明書實施例的原則。其他的變形也可能屬於本說明書的範圍。因此,作爲示例而非限制,本說明書實施例的替代配置可視爲與本說明書的教導一致。相應地,本說明書的實施例不僅限於本說明書明確介紹和描述的實施例。
100:在線資料採集系統
110:伺服器
112:處理設備
120:網路
120-1:網際網路交換點
120-2:網際網路交換點
130:目標終端
130-1:手機
130-2:平板電腦
130-3:筆記型電腦
140:資料庫
150:採集端
150-1:手機
150-2:平板電腦
150-3:筆記型電腦
200:在線資料採集系統
210:主持人模組
220:受訪者模組
230:分析模組
300:在線資料採集方法
302:步驟
304:步驟
306:步驟
400:在線資料採集方法
402:步驟
404:步驟
406:步驟
408:步驟
500:訓練方法
502:步驟
504:步驟
506:步驟
本申請案將以示例性實施例的方式進一步說明,這些示例性實施例將透過圖式進行詳細描述。這些實施例並非限制性的,在這些實施例中,相同的編號表示相同的結構,其中:
圖1是根據本申請案一些實施例所示的示例性在線資料採集系統的應用場景示意圖;
圖2是根據本申請案一些實施例所示的示例性在線資料採集系統的模組圖;
圖3是根據本申請案一些實施例所示的在線資料採集方法300的示例性流程圖;
圖4是根據本申請案一些實施例所示的在線資料採集方法400的另一示例性流程圖;
圖5是根據本申請案一些實施例所示的文本分類模型的訓練方法500的示例性流程圖。
無
300:在線資料採集方法
302:步驟
304:步驟
306:步驟
Claims (14)
- 一種在線資料採集的方法,其特徵在於,包括: 採集端根據預設規則在線生成第一資料採集模組,並將所述第一資料採集模組發送給複數個第一目標終端;所述預設規則包括調查研究題目提綱;所述第一資料採集模組攜帶有第一調查研究題目; 所述複數個第一目標終端在線接收到所述第一資料採集模組後在第一預設時間內在線反饋複數個第一資料,並將反饋的所述複數個第一資料在線返回給所述採集端; 所述採集端基於接收到的所述複數個第一資料進行在線分析; 所述方法還包括: 所述複數個第一目標終端將反饋的所述複數個第一資料在線返回給所述採集端之後,所述採集端根據所述複數個第一資料或/和所述預設規則在線生成第二資料採集模組,並將所述第二資料採集模組在線發送給所述複數個第一目標終端;所述第二資料採集模組攜帶有第二調查研究題目; 所述複數個第一目標終端在線接收到所述第二資料採集模組後在第二預設時間內在線反饋複數個第二資料; 所述採集端基於接收到的所述複數個第二資料進行在線分析; 重複前述步驟直至資料採集完成;所述資料採集完成表示根據所述調查研究題目提綱生成的全部調查研究題目均獲得反饋資訊。
- 如請求項1所述的方法,其中,確定所述複數個第一目標終端包括: 在線向複數個目標終端發送招募資訊,所述複數個目標終端對所述招募資訊給出複數個反饋資訊; 所述採集端根據預設的篩選規則對所述反饋資訊進行篩選,將篩選的反饋資訊對應的目標終端作爲所述複數個第一目標終端。
- 如請求項1所述的方法,其中,所述採集端根據所述第一資料採集模組或/和所述第二資料採集模組的相關資訊,對所述複數個第一資料或/和所述複數個第二資料進行在線分析。
- 如請求項3所述的方法,其中,所述相關資訊包括類別或/和重要性。
- 如請求項3所述的方法,其中,所述採集端根據所述第一資料採集模組或/和所述第二資料採集模組的相關資訊,對所述複數個第一資料或/和所述複數個第二資料進行在線分析包括: 當所述相關資訊中的類型爲開放題目時,所述採集端將所述複數個第一目標終端針對所述開放題目給出的所述複數個第一資料或/和所述複數個第二資料輸入至文本識別模型,得到識別結果。
- 如請求項5所述的方法,其中,所述識別結果包括觀點提取結果和/或觀點聚類結果。
- 如請求項5所述的方法,其中,所述文本識別模型爲文本分類模型和/或非監督學習聚類模型。
- 如請求項7所述的方法,其中,所述文本分類模型的訓練過程如下: 獲得至少一個開放題目的至少一個應答資訊文本; 標記所述至少一個應答資訊文本的標籤,所述標籤表示所述至少一個應答資訊中每一個的觀點; 將攜帶標籤應答資訊文本輸入初始文本分類模型進行訓練,得到訓練好的文本分類模型。
- 如請求項3所述的方法,其中,所述採集端根據所述第一資料採集模組或/和所述第二資料採集模組的相關資訊,對所述複數個第一資料或/和所述複數個第二資料進行在線分析包括: 當所述相關資訊中的類型爲選擇題、判斷題、點選題或圖片熱區題目時,所述採集端將統計所述複數個第一目標終端針對所述選擇題、所述判斷題、所述點選題或所述圖片熱區題目給出的所述複數個第一資料或/和所述複數個第二資料中的不同選項被選中的數量或/和不同選項的佔比。
- 如請求項3所述的方法,其中,所述採集端根據所述第一資料採集模組或/和所述第二資料採集模組的相關資訊,對所述複數個第一資料或/和所述複數個第二資料進行在線分析包括: 當所述相關資訊中的類型爲排序題目時,所述採集端將統計所述複數個第一目標終端針對所述排序題目給出的所述複數個第一資料或/和所述複數個第二資料中的每個選項的排序結果。
- 如請求項1所述的方法,其中,所述複數個第一目標終端爲超過20個回答調查研究題目的受訪者所用終端。
- 一種在線資料採集的系統,其特徵在於,包括: 主持人模組,用於採集端根據預設規則在線生成第一資料採集模組,並將所述第一資料採集模組發送給複數個第一目標終端;所述預設規則包括調查研究題目提綱;所述第一資料採集模組攜帶有第一調查研究題目; 受訪者模組,用於所述複數個第一目標終端在線接收到所述第一資料採集模組後在第一預設時間內在線反饋複數個第一資料,並將反饋的所述複數個第一資料在線返回給所述採集端; 分析模組,用於所述採集端基於接收到的所述複數個第一資料進行在線分析; 所述主持人模組還用於:所述採集端根據所述複數個第一資料或/和所述預設規則在線生成第二資料採集模組,並將所述第二資料採集模組在線發送給所述複數個第一目標終端;所述第二資料採集模組攜帶有第二調查研究題目; 所述受訪者模組還用於:所述複數個第一目標終端在線接收到所述第二資料採集模組後在第二預設時間內在線反饋複數個第二資料; 所述分析模組還用於:所述採集端基於接收到的所述複數個第二資料進行在線分析; 重複前述步驟直至資料採集完成。
- 一種在線資料採集裝置,包括處理器,其特徵在於,所述處理器用於執行如請求項1~11中任一項所述的方法。
- 一種電腦可讀儲存媒介,所述儲存媒介儲存電腦指令,當電腦讀取儲存媒介中的電腦指令後,電腦執行如請求項1~11中任一項所述的方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911179269.X | 2019-11-27 | ||
CN201911179269.XA CN110837551B (zh) | 2019-11-27 | 2019-11-27 | 一种在线数据采集的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW202133005A true TW202133005A (zh) | 2021-09-01 |
TWI799760B TWI799760B (zh) | 2023-04-21 |
Family
ID=69577429
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW109141472A TWI799760B (zh) | 2019-11-27 | 2020-11-26 | 在線資料採集的方法、裝置、電腦可讀儲存媒介及系統 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11886479B2 (zh) |
EP (1) | EP3933741A4 (zh) |
CN (1) | CN110837551B (zh) |
TW (1) | TWI799760B (zh) |
WO (1) | WO2021104385A1 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110837551B (zh) | 2019-11-27 | 2022-06-28 | 广州快决测信息科技有限公司 | 一种在线数据采集的方法及系统 |
WO2021175301A1 (zh) * | 2020-03-05 | 2021-09-10 | 广州快决测信息科技有限公司 | 一种自动生成数据判断结果的方法和系统 |
CN111382336B (zh) * | 2020-03-05 | 2021-01-15 | 广州快决测信息科技有限公司 | 一种数据采集方法和系统 |
WO2021175302A1 (zh) * | 2020-03-05 | 2021-09-10 | 广州快决测信息科技有限公司 | 一种数据采集方法和系统 |
CN111292010B (zh) * | 2020-03-05 | 2021-07-09 | 广州快决测信息科技有限公司 | 一种定向进行数据采集的方法及系统 |
CN111367973B (zh) * | 2020-03-05 | 2021-03-09 | 广州快决测信息科技有限公司 | 一种自动生成数据判断结果的方法和系统 |
CN112086176B (zh) * | 2020-07-29 | 2024-07-16 | 重庆市人口和计划生育科学技术研究院 | 用于精子库的数据采集分析与反馈系统 |
CN113988070B (zh) * | 2021-10-09 | 2023-05-05 | 广州快决测信息科技有限公司 | 调研问题生成方法、装置、计算机设备和存储介质 |
CN115688196B (zh) * | 2022-12-26 | 2023-07-18 | 萨科(深圳)科技有限公司 | 一种基于互联网平台订单大数据的在线数据处理方法 |
CN117748745B (zh) * | 2024-02-19 | 2024-05-10 | 国网浙江省电力有限公司宁波供电公司 | 一种优化增强配电网可靠性的方法及系统 |
CN118338159B (zh) * | 2024-06-13 | 2024-08-23 | 广州大一互联网络科技有限公司 | 基于智能仪表的数据采集方法及系统 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100371662B1 (ko) * | 2000-08-23 | 2003-03-28 | 김정욱 | 인터넷을 이용한 실시간 설문조사방법 |
US20030229533A1 (en) * | 2002-06-06 | 2003-12-11 | Mack Mary E. | System and method for creating compiled marketing research data over a computer network |
AU2003263908A1 (en) * | 2002-08-19 | 2004-03-03 | Macrosolve, Inc. | System and method for data management |
US20040143478A1 (en) * | 2003-01-18 | 2004-07-22 | Ward Andrew David | Method and process for capuring, storing, processing and displaying customer satisfaction information |
US20080288276A1 (en) * | 2007-05-18 | 2008-11-20 | Xenosurvey, Inc. | Method, Process and System for Survey Data Acquisition and Analysis |
CN101315680B (zh) | 2007-05-31 | 2011-03-16 | 中国科学院自动化研究所 | 基于自动调查问卷的群体意见定性分析工具及实现方法 |
US20100332287A1 (en) * | 2009-06-24 | 2010-12-30 | International Business Machines Corporation | System and method for real-time prediction of customer satisfaction |
CN102034188A (zh) * | 2009-09-27 | 2011-04-27 | 北京闻言科技有限公司 | 一种在手机客户端实现在线调查的技术 |
CN102903022A (zh) * | 2012-08-29 | 2013-01-30 | 昆山市万丰制衣有限责任公司 | 基于大样本的实时在线抽测系统及方法 |
US20200219151A1 (en) * | 2013-03-15 | 2020-07-09 | Alex Beltrani | Mobile systems and methods for customer feedback |
US10430815B1 (en) * | 2013-10-14 | 2019-10-01 | Lucid Holdings, LLC | System and method for optimizing the use of mobile devices to complete online surveys |
US10332505B2 (en) * | 2017-03-09 | 2019-06-25 | Capital One Services, Llc | Systems and methods for providing automated natural language dialogue with customers |
US11531998B2 (en) * | 2017-08-30 | 2022-12-20 | Qualtrics, Llc | Providing a conversational digital survey by generating digital survey questions based on digital survey responses |
CN108428152A (zh) * | 2018-03-12 | 2018-08-21 | 平安科技(深圳)有限公司 | 调查问卷生成方法、服务器及计算机可读存储介质 |
CN108763199A (zh) * | 2018-05-14 | 2018-11-06 | 浙江口碑网络技术有限公司 | 文本反馈信息的排查方法及装置 |
CN109461037B (zh) * | 2018-12-17 | 2022-10-28 | 北京百度网讯科技有限公司 | 评论观点聚类方法、装置和终端 |
CN110348006A (zh) * | 2019-06-11 | 2019-10-18 | 平安科技(深圳)有限公司 | 问题信息的生成方法、装置、计算机设备及其存储介质 |
CN110837551B (zh) * | 2019-11-27 | 2022-06-28 | 广州快决测信息科技有限公司 | 一种在线数据采集的方法及系统 |
-
2019
- 2019-11-27 CN CN201911179269.XA patent/CN110837551B/zh active Active
-
2020
- 2020-11-26 TW TW109141472A patent/TWI799760B/zh active
- 2020-11-26 US US17/606,787 patent/US11886479B2/en active Active
- 2020-11-26 WO PCT/CN2020/131852 patent/WO2021104385A1/zh unknown
- 2020-11-26 EP EP20892765.7A patent/EP3933741A4/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN110837551A (zh) | 2020-02-25 |
WO2021104385A1 (zh) | 2021-06-03 |
TWI799760B (zh) | 2023-04-21 |
US20220237218A1 (en) | 2022-07-28 |
CN110837551B (zh) | 2022-06-28 |
EP3933741A1 (en) | 2022-01-05 |
US11886479B2 (en) | 2024-01-30 |
EP3933741A4 (en) | 2022-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021104385A1 (zh) | 一种在线数据采集的方法及系统 | |
Clausen et al. | Intensity of innovation in public sector organizations: The role of push and pull factors | |
Demircioglu et al. | Conditions for complex innovations: evidence from public organizations | |
CN111160992A (zh) | 一种基于用户画像体系的营销系统 | |
US20110196802A1 (en) | Method and apparatus for hiring using social networks | |
US10764440B2 (en) | System and method of real-time wiki knowledge resources | |
Cao et al. | Customer demand prediction of service-oriented manufacturing incorporating customer satisfaction | |
US20140067472A1 (en) | System and Method For Segmenting A Customer Base | |
WO2021175302A1 (zh) | 一种数据采集方法和系统 | |
US20170323316A1 (en) | Method for Documenting a Customer's Journey Using an Online Survey Platform | |
Hicks et al. | Network analysis to evaluate the impact of research funding on research community consolidation | |
CN116910561A (zh) | 数据集构建的方法和服务器 | |
Jacobson et al. | Using crowdsourcing to code open-ended responses: A mixed methods approach | |
KR101574541B1 (ko) | Si 이미지 반응 조사 시스템 및 그 조사 방법 | |
CN110427620B (zh) | 基于社群系统的服务质量优化管理系统 | |
CN111985900B (zh) | 信息处理方法及装置 | |
Siew et al. | An interactive mobile learning application using machine learning framework in a flexible manufacturing environment | |
Murray et al. | Information System Users Satisfactions: Assessing the Success of TechnologyOne at the Central Bank of Belize | |
Mahalle et al. | Data Acquisition and Preparation | |
Pereira et al. | How artificial intelligence can improve digital marketing | |
Cardona et al. | Project management of production line automation: A comparative analysis of project management in Brazil and Colombia | |
Kuehl et al. | " Needs from Tweets": Towards Deriving Customer Needs From Micro Blog Data | |
Cusumano et al. | Intelligent building contract tendering-potential and exploration | |
Anhalt-Depies et al. | Use of latent profile analysis to characterise patterns of participation in crowdsourcing | |
Yan et al. | Three cobblers worth the mastermind? The potential of ensemble in crowdsourced classification problems |