TWM546531U - 文字探勘衡量系統 - Google Patents

文字探勘衡量系統 Download PDF

Info

Publication number
TWM546531U
TWM546531U TW106206656U TW106206656U TWM546531U TW M546531 U TWM546531 U TW M546531U TW 106206656 U TW106206656 U TW 106206656U TW 106206656 U TW106206656 U TW 106206656U TW M546531 U TWM546531 U TW M546531U
Authority
TW
Taiwan
Prior art keywords
data
measurement system
text
data set
weighting
Prior art date
Application number
TW106206656U
Other languages
English (en)
Inventor
曹修源
蘇辛詞
Original Assignee
曹修源
蘇辛詞
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 曹修源, 蘇辛詞 filed Critical 曹修源
Priority to TW106206656U priority Critical patent/TWM546531U/zh
Publication of TWM546531U publication Critical patent/TWM546531U/zh

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

文字探勘衡量系統
本案涉及一種文字探勘衡量系統,尤其是涉及一種網路文字探勘衡量系統。
目前傳統市場調查公司無法針對企業廣告執行即刻監測之效益。根據統計,正常情況下一個廣告週期2個月內預計有3至4則廣告,1則廣告2周內就會影響消費者對於廣告內容之觀感與態度,然而等待傳統市場調查經由廣告撥放時期等待、發放問卷、回收問卷以及統計分析等作業完成評估後,廣告週期早已過去,只能事後評估結果,無法即時性的理解廣告內容對於消費者意見之影響。
隨網路口碑、網路媒體引領市場風潮,對於網路社群大數據的研究分析也被視為消費者意見的來源,然而廣告過往大多以造訪網站人數/停留時間做為評估依據,近期大多轉變為以觀看數量作為目標設定,然而該些評估依據及方法仍有上述問題。
為了解決前述的缺失,雖有業者研發出如各式網路評價自動分析系統,然而該分析系統僅是對於各網路評價內容給予各個文字上的加權分值,再綜合計算所有分值得到一概略結果,對於該些文字在該網路評價中是否具有意見代表性,或是對於屬於不同構面意見的內容並無法判斷,如此所得之評估結果並未能真實呈現消費者之觀感與態度。
鑒於習知的文字探勘衡量系統仍存有許多需要改善之處;本案申請人係經細心研究後,發展出本案,期使網路文字探勘衡量系統可更為完善、準確,且更易於操作並達到貼近市場真實狀態與反應之效果。
本創作係透過建置多構面的文字資料集合以具體分析網路文字中的特定文字在該文句中所代表意思之分值,透過特徵文字與加權文字的分類系統,區隔不同文字係屬於目標表示或是觀感態度表示,以達到提高調查結果效度並真實反映消費者意見之效果,達到即時反應消費者意見之目的。
就一方而言,本發明提出一種文字探勘衡量系統,包含:一第一資料集合,其具有待對比之一至少一資料元件;一第二資料集合,包含一至少一特定主題集合之一特定主題子集合,以及一加權元件,其中該特定主題子集合包含對應於該第一資料集合內容之一特徵元件;以及一分析伺服器,資訊連接於該第一資料集合以及該第二資料集合,執行該第一資料集合與該第二資料集合之一比對步驟,根據該特徵元件以及該加權元件所對應到該至少一資料元件之結果進行一加權操作,得到有關該至少一資料元件於該至少一特定主題集合及/或該特定主題子集合內容之一衡量參考值。
根據上述構想,其中該至少一資料元件包含一自動化系統所得之結果。
根據上述構想,其中該自動化系統更包含一分割系統,資訊連接於該至少一資料元件,區分該至少一資料元件為一至少一區塊,得到該至少一區塊之目標詞。
根據上述構想,其中該至少一特定主題集合及/或該特定主題子集合具有其對應之該加權元件。
根據上述構想,其進一步包含一第三資料集合,其中該第三資料集合包含該加權操作之結果以及有關該至少一特定主題集合及/或該特定主題子集合內容之該衡量參考值。
根據上述構想,其中該第二資料集合係為預設或可由一使用者透過一使用介面設定該特定主題集合、該特定主題子集合、該特徵元件及/或該加權元件。
根據上述構想,其中該加權元件之衡量參考值範圍介於-5至+5之間。
根據上述構想,其中該特徵元件係選自由學術期刊、論文、問卷、市調報告、訪談以及機器學習演算法所得到的關鍵字。
本案得藉由以下圖式與實施方式說明而更易於讓在此領域具通常知識者瞭解本案的精神。
本案將可透過以下的實施例說明讓所屬技術領域具通常知識者瞭解發明人創作之精神,並可據以完成。然本案的實施例並非可由以下實施例而限制其實施型態。
請參閱圖1,其為文字探勘衡量系統1的一實施例示意圖。如圖所示,在本實施例中,文字探勘衡量系統1包含自動化系統110、第二資料集合120、分析伺服器130以及使用介面140;在一實施例中,自動化系統110包含探勘程式113及/或分割系統114,其可為爬蟲程式及/或斷詞系統,蒐集各大社群網路平台包括Facebook、Youtube、PTT、推特等文字資料,取得待比對之第一資料集合111;其中第二資料集合120包含特定主題的多階層文字資料集合121、特定主題的構面子集合122以及用於比對的特徵文字元件123以及加權文字元件124;其中分析伺服器130資訊連接於待比對資料集合111以及第二資料集合120,比對該等資料集合內容,並依據特徵文字元件123以及加權文字元件124所對應到待比對資料文句內容112的結果進行加權操作,給予待比對資料文句內容112中的目標詞-5至+5分的加權值,得到待比對資料有關特定主題或特定主題的不同構面的衡量參考值。
在另一實施例中,分割系統114資訊連接於至少一待比對資料文句內容112,區分待比對資料文句內容112成複數個區塊,得到複數個區塊中的目標詞。
在一實施例中,特徵文字元件123係選自各國期刊及論文證實之文字元件(例如Aaker 1997年品牌個性42特徵字元)及該文字元件之各國翻譯語言,或各國期刊及論文對於受測者所提供之相關字詞進行量化(問卷)與質化(專家訪談)後所得文字元件。
在一實施例中,特定主題的多階層文字資料集合121包含特定主題的構面子集合122;在一實施例中,第二資料集合120包含中英語文字。
在一實施例中,第二資料集合120包含語言字典資料庫、俚語資料庫以及自建語言資料庫。
在一實施例中,分析伺服器130可運用機器學習演算法來給予加權值。
在另一實施例中,特定主題的多階層文字資料集合121為預設或可由使用者透過使用介面140設定或建置特定主題的多階層文字資料集合121及其構面子集合122、特徵文字元件123或加權文字元件124。
請參閱圖2,其為本案文字探勘衡量系統2的另一實施例示意圖。如圖所示,在一實施例中,第二資料集合220包含特定主題集合221以及特定主題集合221所對應的加權文字元件223;特定主題集合221包含特定主題的構面子集合222以及特定主題的構面子集合222所對應的加權文字元件224。
在一實施例中,特徵文字元件225係依據不同文化、不同產業下的不同構面建置;在一實施例中,使用者可以自行建置特徵文字元件225。
在另一實施例中,文字探勘衡量系統進一步包含分析伺服器230執行對比之結果資料集合240,其中包含加權操作之結果以及有關待比對資料文句內容212於特定主題或其不同構面之衡量參考值。
請參閱圖3,其為本案特定主題集合的構面子集合的一實施例示意圖。如圖所示,在一實施例中,特定主題集合可再細分為數個構面子集合,像是行銷手法效益的構面項目,如Action、Awareness、Desire、Excited、Happy等,各個構面項目下有其相應的特徵文字元件。
請參閱圖4,其為本案特定主題的構面子集合的另一實施例示意圖。構面子集合及特徵文字元件係經過三步驟建立,包含透過期刊論文問卷萃取關鍵字、焦點訪談各特定主題所得相關關鍵字,以及機器學習演算法所得到的關鍵字或網路流行用語。
請參閱圖5,其為本案加權元件的加權值表示一實施例示意圖。如圖所示,不同加權元件分別代表不同加權值。
在一實施例中,給予待比對資料文句內容中的目標詞-5至+5分的加權值,其極性可比例換算細分成如李克特量表(Likert Scale)般之區間。
請參閱圖6,其為本案待比對資料文句內容的衡量參考值表示一實施例示意圖。在一實施例中,衡量參考值可表現出待比對資料文句內容於特定主題或特定主題的不同構面分值。
以上所提僅是本案的較佳實施例樣態,並不是用於限定本案的實施範圍;任何在此領域具有通常知識者,在不脫離本案的精神與範圍下所作的諸般變化與修飾,都不脫如附申請專利範圍所欲保護者。
1‧‧‧文字探勘衡量系統
2‧‧‧文字探勘衡量系統
110‧‧‧自動化系統
111‧‧‧待比對資料集合
112‧‧‧待比對資料文句內容
113‧‧‧探勘程式
114‧‧‧分割系統
120‧‧‧文字資料庫
121‧‧‧特定主題的文字資料集合
122‧‧‧特定主題的構面子集合
123‧‧‧特徵文字元件
124‧‧‧加權文字元件
130‧‧‧分析伺服器
140‧‧‧使用介面
210‧‧‧自動化系統
211‧‧‧待比對資料集合
212‧‧‧待比對資料文句內容
220‧‧‧文字資料庫
221‧‧‧特定主題的文字資料集合
222‧‧‧特定主題的構面子集合
223‧‧‧加權文字元件
224‧‧‧加權文字元件
225‧‧‧特徵文字元件
230‧‧‧分析伺服器
240‧‧‧對比結果資料集合
圖1為本案文字探勘衡量系統的一實施例示意圖。
圖2為本案文字探勘衡量系統的另一實施例示意圖。
圖3為本案特定主題的構面子集合的一實施例示意圖。
圖4為本案特定主題的構面子集合的另一實施例示意圖。
圖5為本案加權元件的加權值表示一實施例示意圖。
圖6為本案待比對資料文句內容所得之衡量參考值表示一實施例示意圖。
1‧‧‧文字探勘衡量系統
110‧‧‧自動化系統
111‧‧‧待比對資料集合
112‧‧‧待比對資料文句內容
113‧‧‧探勘程式
114‧‧‧分割系統
120‧‧‧文字資料庫
121‧‧‧特定主題的文字資料集合
122‧‧‧特定主題的構面子集合
123‧‧‧特徵文字元件
124‧‧‧加權文字元件
130‧‧‧分析伺服器
140‧‧‧使用介面

Claims (8)

  1. 一種文字探勘衡量系統,包含: 一第一資料集合,其具有待對比之一至少一資料元件; 一第二資料集合,包含一至少一特定主題集合之一特定主題子集合,以及一加權元件,其中該特定主題子集合包含對應於該第一資料集合內容之一特徵元件;以及 一分析伺服器,資訊連接於該第一資料集合以及該第二資料集合,執行該第一資料集合與該第二資料集合之一比對步驟,根據該特徵元件以及該加權元件所對應到該至少一資料元件之結果進行一加權操作,得到有關該至少一資料元件於該至少一特定主題集合及/或該特定主題子集合內容之一衡量參考值。
  2. 如申請專利範圍第1項所述之文字探勘衡量系統,其中該至少一資料元件包含一自動化系統所得之結果。
  3. 如申請專利範圍第2項所述之文字探勘衡量系統,其中該自動化系統更包含一分割系統,資訊連接於該至少一資料元件,區分該至少一資料元件為一至少一區塊,得到該至少一區塊之目標詞。
  4. 如申請專利範圍第1項所述之文字探勘衡量系統,其中該至少一特定主題集合及/或該特定主題子集合具有其對應之該加權元件。
  5. 如申請專利範圍第1項所述之文字探勘衡量系統,其進一步包含一第三資料集合,其中該第三資料集合包含該加權操作之結果以及有關該至少一特定主題集合及/或該特定主題子集合內容之該衡量參考值。
  6. 如申請專利範圍第1項所述之文字探勘衡量系統,其中該第二資料集合係為預設或可由一使用者透過一使用介面設定該特定主題集合、該特定主題子集合、該特徵元件及/或該加權元件。
  7. 如申請專利範圍第1項所述之文字探勘衡量系統,其中該加權元件之衡量參考值範圍介於-5至+5之間。
  8. 如申請專利範圍第1項所述之文字探勘衡量系統,其中該特徵元件係選自由學術期刊、論文、問卷、市調報告、訪談以及機器學習演算法所得到的關鍵字。
TW106206656U 2017-05-10 2017-05-10 文字探勘衡量系統 TWM546531U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW106206656U TWM546531U (zh) 2017-05-10 2017-05-10 文字探勘衡量系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW106206656U TWM546531U (zh) 2017-05-10 2017-05-10 文字探勘衡量系統

Publications (1)

Publication Number Publication Date
TWM546531U true TWM546531U (zh) 2017-08-01

Family

ID=60187338

Family Applications (1)

Application Number Title Priority Date Filing Date
TW106206656U TWM546531U (zh) 2017-05-10 2017-05-10 文字探勘衡量系統

Country Status (1)

Country Link
TW (1) TWM546531U (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI695277B (zh) * 2018-06-29 2020-06-01 國立臺灣師範大學 自動化網站資料蒐集方法
TWI751022B (zh) * 2021-02-09 2021-12-21 阿物科技股份有限公司 有價字詞判斷及再分類之方法及其系統
TWI752822B (zh) * 2021-02-09 2022-01-11 阿物科技股份有限公司 有價字詞萃取及形成有價字詞網之方法及其系統

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI695277B (zh) * 2018-06-29 2020-06-01 國立臺灣師範大學 自動化網站資料蒐集方法
TWI751022B (zh) * 2021-02-09 2021-12-21 阿物科技股份有限公司 有價字詞判斷及再分類之方法及其系統
TWI752822B (zh) * 2021-02-09 2022-01-11 阿物科技股份有限公司 有價字詞萃取及形成有價字詞網之方法及其系統

Similar Documents

Publication Publication Date Title
Liu et al. Assessing product competitive advantages from the perspective of customers by mining user-generated content on social media
Liu et al. Visual listening in: Extracting brand image portrayed on social media
Liu et al. A semantic approach for estimating consumer content preferences from online search queries
Pantano et al. Making sense of consumers’ tweets: Sentiment outcomes for fast fashion retailers through Big Data analytics
Siering et al. What drives the helpfulness of online product reviews? From stars to facts and emotions
Savin et al. Topic-based classification and identification of global trends for startup companies
Kim et al. Opinion-mining methodology for social media analytics
González-Padilla et al. Managing entrepreneurs’ behavior personalities in digital environments: A review
Kar et al. Finding opinion strength using fuzzy logic on web reviews
Chen et al. Exploring determinants of attraction and helpfulness of online product review: A consumer behaviour perspective
Huang Excess loyalty in online retailing
US20220084095A1 (en) System and method for quality assessment of product description
Zhang et al. Using neutral sentiment reviews to improve customer requirement identification and product design strategies
TWM546531U (zh) 文字探勘衡量系統
Qu et al. Review helpfulness assessment based on convolutional neural network
Upreti et al. Online content match-making in B2B markets: Application of neural content modeling
Anoop Artificial intelligence and marketing
Ranjbaran Investigation of Factors affecting in customer fundraising with emphasis on role of social marketing mass media in Saderat bank of Iran
Ahuja et al. Corporate blogs as tools for consumer segmentation-using cluster analysis for consumer profiling
Wang et al. Image or text: Which one is more Influential? A deep-learning approach for visual and textual data analysis in the digital economy
Shao et al. A data-driven model to construct the influential factors of online product satisfaction
Sardar et al. Recommender system for journal articles using opinion mining and semantics
Hauser et al. Artificial Intelligence and user-generated data are transforming how firms come to understand customer needs
US20240062264A1 (en) Ai- backed e-commerce for all the top rated products on a single platform
Powell et al. Applying analytics to artist provided text to model prices of fine art