TWI742450B - 企劃書的自動化產生系統及其方法 - Google Patents

企劃書的自動化產生系統及其方法 Download PDF

Info

Publication number
TWI742450B
TWI742450B TW108137289A TW108137289A TWI742450B TW I742450 B TWI742450 B TW I742450B TW 108137289 A TW108137289 A TW 108137289A TW 108137289 A TW108137289 A TW 108137289A TW I742450 B TWI742450 B TW I742450B
Authority
TW
Taiwan
Prior art keywords
topic
categories
plan
processing device
category
Prior art date
Application number
TW108137289A
Other languages
English (en)
Other versions
TW202117612A (zh
Inventor
左聰文
林錦陽
王恩慈
Original Assignee
財團法人工業技術研究院
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 財團法人工業技術研究院 filed Critical 財團法人工業技術研究院
Priority to TW108137289A priority Critical patent/TWI742450B/zh
Priority to CN201911130513.3A priority patent/CN112667884B/zh
Priority to US16/723,042 priority patent/US11481555B2/en
Publication of TW202117612A publication Critical patent/TW202117612A/zh
Application granted granted Critical
Publication of TWI742450B publication Critical patent/TWI742450B/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/156Query results presentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Library & Information Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一種企劃書的自動化產生方法,包括:從具有類別的文字檔擷取關鍵詞,並判斷關鍵詞是否為話題,從對應於話題之多個文字檔擷取地名,依據話題之網路聲量而決定是否保留話題,依據地名篩選評論網站之多個評論檔並計算話題出現於其中之第一比例而決定是否保留話題,產生以地名及話題作為推薦列的企劃書。

Description

企劃書的自動化產生系統及其方法
本發明涉及網路文章的分析,以及於從網路文章中取得熱門話題並據以產生企劃書的系統及其方法。
基於從眾效應,人們容易因為最近流行的主題而前往該主題相關地點探訪。例如:前往美食評鑑得獎的餐廳用餐、前往稀有虛擬寶物出現的地點抓寶。
因此,行銷人員經常在網路上觀察近期熱門話題,再自行判斷這些話題能否帶動某地區的人流量。舉例來說,旅行社提出以「宜蘭童玩節」、「台北馬拉松」、「苗栗桐花祭」…等地區性主題旅遊企劃書,以此吸引民眾參加。然而,並不是每個熱門話題都能推動地方旅遊,甚至某些話題變得熱門後,反而會降低民眾前往話題所在地旅遊的意願。另一方面,固定週期的活動每次舉辦的地點未必相同,例如,音樂祭、元宵燈會、神明遶境…等。從上述可知,目前尚缺乏一種判斷熱門主題能否提升特定地點的人潮的自動化機制,也缺少一種搜尋哪些地點的人流量可被熱門主題提升的自動化機制。
有鑑於此,本發明提出一種企劃書產生系統及其方法,藉此讓特定領域(例如:旅遊業)的行銷人員得以從繁雜的網路資訊中取得真正能提升來 客量的話題,並根據此話題自動產生一企劃書。進一步地,本發明提出一種過濾掉與特定領域無關聯的話題,以達到有效的地點推薦。
依據本發明一實施例敘述的一種企劃書產生方法,包括:取得多個文字檔,每一文字檔屬於多個類別其中一者;從文字檔擷取關鍵詞,並計算關鍵詞之話題係數以判斷關鍵詞是否為話題;從文字檔中對應於話題之多個文字檔擷取地名,並以話題及地名作為一配對;在產生配對之後,依據話題之網路聲量而決定是否保留話題;在依據話題之網路聲量而決定保留話題之後,依據地名篩選評論網站之多個評論檔;依據評論檔中被篩選的多個評論檔計算話題出現於被篩選的評論檔之第一比例,並依據第一比例而決定是否保留話題;以及在依據第一比例而決定保留話題之後,產生企劃書,企劃書包括推薦列,推薦列包括地名及話題。
依據本發明一實施例敘述的一種企劃書產生系統,包括:通訊裝置,非暫時性機器可讀儲存裝置以及一或多個處理裝置。通訊裝置從第一伺服器取得多個文字檔,從第二伺服器取得多個評論檔,及從第三伺服器取得一詞彙之網路聲量。非暫時性機器可讀儲存裝置儲存多個指令。一或多個處理裝置電性連接通訊裝置及非暫時性機器可讀儲存裝置。處理裝置執行指令並引發多個自動化操作,這些自動化操作包括:從文字檔擷取關鍵詞,並計算關鍵詞之話題係數以判斷關鍵詞是否為一話題;從文字檔中對應於話題之多個文字檔擷取一地名,並以話題及地名作為一配對;在產生配對之後,以話題作為詞彙,並依據話題之網路聲量而決定是否保留話題;在依據話題之網路聲量而決定保留話題之後,依據地名篩選評論檔;依據評論檔中被篩選的多個評論檔計算話題出現於被篩選的評論檔之第一比例,並依據第一比例而決定是否保留話題;以及在依據第 一比例而決定保留話題之後,產生企劃書,企劃書包括推薦列,推薦列包括地名及話題。
綜上所述,本發明提出的企劃書產生系統及其方法,適用於在特定領域搜索可帶動人流量的話題以及地點。就旅遊而言,本發明可自動化式挖掘做為大眾旅遊動機的話題,並以該話題密切關聯的景點為核心,推薦多個區域性高網路聲量的旅遊景點,最終形成一份旅遊景點企劃書的草案供企劃人員參考。
以上之關於本揭露內容之說明及以下之實施方式之說明係用以示範與解釋本發明之精神與原理,並且提供本發明之專利申請範圍更進一步之解釋。
10:企劃書產生系統
1:通訊裝置
3:非暫時性機器可讀儲存裝置
5:處理裝置
N:網路
V1:第一伺服器
V2:第二伺服器
V3:第三伺服器
S21~S47 S61~S69:步驟
圖1係依據本發明一實施例的企劃書產生系統所繪示的方塊架構圖。
圖2係依據本發明一實施例的企劃書產生方法所繪示的流程圖。
圖3係依據本發明第二實施例的企劃書產生方法所繪示調整外部類別權重值的流程圖。
以下在實施方式中詳細敘述本發明之詳細特徵以及特點,其內容足以使任何熟習相關技藝者了解本發明之技術內容並據以實施,且根據本說明書所揭露之內容、申請專利範圍及圖式,任何熟習相關技藝者可輕易地理解本發明相關之構想及特點。以下之實施例係進一步詳細說明本 發明之觀點,但非以任何觀點限制本發明之範疇。
本發明基於如下概念被提出:一個地點的網路聲量(internet volume)與一個地點的人流量成正比。本發明適用於多種特定領域,後文主要以「旅遊」此一特定領域為例進行說明,惟本發明並不以此為限。
圖1繪示本發明一實施例的企劃書推薦系統的方塊架構圖。如圖1所示,所述的企劃書產生系統10,包括:通訊裝置1、非暫時性機器可讀儲存裝置3以及處理裝置5。處理裝置5電性連接通訊裝置1及非暫時性機器可讀儲存裝置3。
通訊裝置1通訊連接至網際網路N,藉此從第一伺服器V1取得多個文字檔,從第二伺服器V2取得多個評論檔,從第三伺服器V3取得一詞彙之一網路聲量。上述三個伺服器V1、V2、V3例如是網頁伺服器(web server)。實務上,第一伺服器V1例如呈現一新聞網站或一電子佈告欄,其提供多個已分類的文章。第二伺服器提供的網站具有多個評論檔的,例如旅遊網誌網站、美食評論網站,其中的文章歸屬於一特定領域。第三伺服器呈現一網際網路搜尋網站,例如是Google。
非暫時性機器可讀儲存裝置3,例如記憶體或硬碟,可儲存多個指令及文字資料。本發明不限制非暫時性機器可讀裝置3的硬體類型。
處理裝置5可執行非暫時性機器可讀儲存裝置3儲存的多個指令,藉此引發多個自動化操作,包括處理裝置5的自動化操作及通訊裝置1的自動化操作。需注意的是,圖1所繪示的處理裝置僅為範例而非用以限制本發明一實施例的企劃書推薦系統10中的處理裝置5的數量。關於處理裝置5引發的多個自動化操作,下文配合圖2進一步說明之。
請參考圖2,其係繪示本發明一實施例的企劃書產生方法。本方法適用於前述的企劃書產生系統10。
請參考步驟S21,取得多個文字檔。每個文字檔屬於多個類別其中一者。詳言之,通訊裝置10從新聞網站或入口網站取得多個外部類別底下的文章,以及這些外部類別的標題,例如「娛樂」、「運動」、「美食」、「政治」。採用ETL(Extract-Transform-Load)的方式,通訊裝置1將網頁上的文章轉換為純文字檔案,例如為CSV檔,並存放在非暫時性機器可讀儲存裝置3。
於第一實施例中,雖然每個文字檔屬於多個外部類別其中一者,然而這些文字檔是按照多個內部類別分別儲存。內部類別與外部類別具有一對應關係,其範例如下表。
Figure 108137289-A0305-02-0007-7
於第一實施例中,處理裝置5依據外部類別與內部類別之對應關係,指定每一文字檔為多個內部類別其中一者。例如將從P論壇中外部類別為「電影」的文章歸類為「娛樂」的內部類別。
於第二實施例中,這些文字檔直接按照外部類別分別被儲存。
請參考步驟S23,擷取關鍵詞並產生話題。詳言之,處理裝 置5從多個文字檔擷取一(或多個)關鍵詞,計算此關鍵詞之話題係數,並依據話題係數是否超過一閾值而決定此話題可否作為一話題。實務上,處理裝置5採用如tf-idf(term frequency/inverse document frequency)或text rank的技術從文字檔擷取關鍵詞。話題係數係關鍵詞出現在所有文章的比例。一種計算話題係數的方式可為:假設共取得100個文字檔,且預設的閾值為0.7,則若有超過70個的文字檔的內容中具有「寶可夢(Pokemon)」此一關鍵詞,「寶可夢」即可作為一話題。
請參考步驟S25,產生「話題-地名」之配對。詳言之,處理裝置5從那些內容包含話題的文字檔中尋找並記錄地名,然後將話題與這些地名組成一配對,例如為:「寶可夢-南寮」、「寶可夢-新竹」。
請參考步驟27,過濾無正向關聯的話題。本步驟S27係為了進一步篩選與旅遊具有正向關聯的「話題-地名」之配對。以下分為三個實施例敘述處理裝置5在步驟S27的具體實現方式,惟本發明並不以此為限。
於步驟S27的第一實施例中,處理裝置5取得包括多個正向類別的類別清單,這些正向類別屬於內部類別的子集合。例如,內部類別有50個,正向類別為這50個內部類別中與旅遊具有較高關聯性的35個類別。然後,處理裝置5計算內容包含話題的文字檔在每個內部類別的分佈,依據正向類別的分佈比例之總和計算出話題的正向係數,並依據話題的正向係數是否超過一閾值而決定是否保留此話題。例如:內容包含「寶可夢」的所有文字檔在內部類別的分佈為:「娛樂」類別70%、「運動」類別15%、「美食」類別5%及「其他」類別10%。假設正向類別為「娛 樂」及「美食」,正向係數之閾值為70%。由於70%+5%>70%,代表「寶可夢」此一話題與旅遊的正向關聯度足夠高,因此話題可以被保留。
上述第一實施例的正向係數計算係基於「每個內部類別對於旅遊的正向程度」皆相等的假設。實務上,每個內部類別更各自具有一權重,且正向係數的公式為:正向類別的分佈比例與權重值的乘積和。
於步驟S27的第二實施例中,處理裝置5取得包括多個正向類別的類別清單,這些正向類別屬於外部類別的子集合。每一外部類別具有一權重值,外部類別的權重值係基於過去資料的反饋而自動調整。正向係數為話題對應於這些正向類別之多個分佈比例值及多個外部類別之權重值的乘積和。
請參考圖3,其繪示本發明第二實施例的外部類別的權重值的調整步驟。以下配合簡化的範例說明圖3的每個步驟。
請參考步驟S61,設置外部類別的初始權重值。例如,將「手機遊戲」、「運動」、「政治」等三個外部類別的權重值初始化為1/3。
請參考步驟S63,取得多個歷史文字檔及歷史配對。每一歷史文字檔屬於多個外部類別其中一者。所述的歷史文字檔係先前執行本發明一實施例的企劃書產生方法時所取得的文字檔。處理裝置5基於一滑動時間窗(sliding time window)從按照時間排序的歷史文字檔中取得一部分的歷史文字檔以及對應這些歷史文字檔的歷史配對。所述的歷史配對係先前執行步驟S25所產生的配對,其包含話題及地名。
請參考步驟S65,取得歷史配對在外部類別之分佈比例。詳言之,處理裝置5計算那些內容包含歷史配對的歷史文字檔在每個外部類 別的分佈比例,例如:「寶可夢-南寮」此一歷史配對的分佈比例在「手機遊戲」為70%、在「運動」為20%、在「政治」為10%。
請參考步驟S67,指定歷史配對的標籤值。本步驟S67例如透過問卷調查的形式,由使用者自行判斷歷史配對中的話題是否與旅遊具有正相關。標籤值係反映歷史配對之正向關聯度。例如,若使用者認為「寶可夢-南寮」此一歷史配對與旅遊具有正相關,則將標籤值設定為1,否則將標籤設定為0。所述的標籤值亦可選用1、0.5、0三種值以表示與旅遊的高、中、低相關程度。本發明對標籤值的數值型態與其代表含意不予限制。
請參考步驟S69,依據標籤值更新權重值。例如,對於「寶可夢-南寮」此一歷史配對,進行每個外部類別的權重值更新如下所示:mobile-gamew=(1+0.7)/(3+1)
exercisew=(1+0.2)/(3+1)
politicsw=(1+0.1)/(3+1)
其中,mobile-gamew為「手機遊戲」此一外部類別的權重值,exercisew為「運動」此一外部類別的權重值,politicsw為「政治」此一外部類別的權重值。
承前例,更舉另一例說明步驟S69的另一種權重值更新的情況:假設在步驟S63中取得另一個歷史配對為「登革熱-高雄」;在步驟S65中,「登革熱-高雄」此歷史配對在「手機遊戲」為0%、在「運動」為0%、在「政治」為100%;在步驟S67中,使用者認為此一歷史配對與旅遊不具正相關,因此將其標籤值設為0;因此在步驟S69中,對於「登革熱-高雄」此一歷史配對,進行每個外部類別的權重值更新如下所示: mobile-gamew=(1+0.7-0)/(3+1+1)
exercisew=(1+0.2-0)/(3+1+1)
politicsw=(1+0.1-1)/(3+1+1)
依此類推,步驟S63~S69可依據不同的歷史配對被循環執行多次。最後將更新完成的多個外部類別權重值予以標準化,控制權重值介於0到1之間。例如,若計算得到的權重值為負值,則修正為0。
按照圖3的流程進行更新的外部類別的權重值可被用來計算話題的正向係數。例如,假設外部類別「手機遊戲」更新後的權重值為0.87,外部類別「運動」更新後的權重值為1,外部類別「政治」更新後的權重值為0;並且考慮「寶可夢-南寮」此一歷史配對的分佈比例在「手機遊戲」為70%、在「運動」為20%、在「政治」為10%;則處理裝置5計算「寶可夢-南寮」此一歷史配對的正向係數如下所示:0.7*0.87+0.2*1+0.1*0=0.809
承上所述,於圖2的步驟S25中,可設定處理裝置5只保留正向係數為一閾值(例如:0.7)以下的話題,藉此獲得與旅遊具有高度正相關的「話題-地名」之配對。此外,本第二實施例亦可節省處理裝置5另外將外部類別的文字檔重新分類為內部分類的時間。
於步驟S27的第三實施例中,處理裝置5取得包括多個正向類別的一類別清單,其中一個正向類別底下具有一或多個從屬正向類別。換言之,正向類別與從屬正向類別具有多階層(multi-level)的關係。例如,正向類別為「戶外活動」,從屬正向類別為「爬山」、「馬拉松」。類別清單中的正向類別及從屬正向類別皆屬於內部(或外部)類別之子集合。處 理裝置5檢查話題所對應到的類別是否匹配到一從屬正向類別及具有此從屬正向類別之正向類別而決定是否保留該話題。例如,「稜線縱走」此一話題可匹配「戶外活動」此一正向類別及其底下的「爬山」此一從屬正向類別,因此處理裝置5保留此話題。若一話題不具有上述多階層的匹配關係,則將該話題視為正向關聯度不足,因此處理裝置5不保留該話題。
需注意的是,本發明其他實施例允許在步驟S25產生配對之後直接執行步驟S41以提升整體處理速度。然而,加入步驟S27可有效過濾與旅遊無正向關聯的話題以提升企劃書的品質。實務上,可根據需求決定是否執行步驟S27,本發明對此不予限制。
請參考步驟S41,依據網路聲量判斷是否保留話題。依據該話題之一網路聲量而決定是否保留該話題。詳言之,處理裝置5透過通訊裝置1從第三伺服器V3查詢網路聲量,例如Google搜尋趨勢(Google trends)、QSearch,並且只保留網路聲量大於一閾值的話題,或只保留網路聲量具有一正向成長趨勢(逐漸增加、突然增加)的話題,或保留網路聲量大於一閾值且具有正向成長趨勢的話題。舉例來說,處理裝置5取得的話題如下方表格所示:
Figure 108137289-A0305-02-0012-2
對於那些在步驟S41保留的話題,處理裝置5進一步分析這些「熱門」話題是否有助於帶動特定地點的觀光,所述的特定地點包括 配對中的地名(後文稱為「核心地名」)所代表的地點以及關聯核心地名的其他地名(後文稱為「週邊地名)所代表的地點。請參考步驟S43,依據評論檔判斷是否保留話題。詳言之,處理裝置5首先確認要用來篩選評論檔的核心地名及週邊地名。然後處理裝置5透過通訊裝置5依據這些地名篩選一評論網站之多個評論檔。評論網站例如為國際性旅遊評論網站,「貓途鷹(TripAdvisor)」;評論檔之來源為網站中的旅遊網誌或旅遊文章。具體來說,處理裝置5基於核心地名及一地理拓撲取得週邊地名,所述週邊地名關聯於配對的核心地名。週邊地名對應地點可以是核心地名對應地點之一行政區,或者週邊地名對應地點與核心地名對應地點兩者之間的地理距離小於一閾值。假設配對的核心地名是台北市,處理裝置5基於地理拓撲取得的週邊地名可包括:信義區、萬華區(屬於台北市轄區)以及板橋區、平溪區(位於台北市鄰近的地區)等。承前例,處理裝置5取得的核心地名及週邊地名例如下方表格所示:
Figure 108137289-A0305-02-0013-4
在確認用來篩選的核心地名及週邊地名之後,依據被篩選的多個評論檔,處理裝置5從中計算話題出現於被篩選的評論檔的第一比例,並依據第一比例而決定是否保留此話題。例如,若以「南寮」篩選的多個旅遊網誌中,有80%以上的文章內容皆提到「寶可夢」,則代表「寶可夢-南寮」此配對確實可因為「寶可夢」此一話題的網路聲量上漲,而吸引人 潮前往南寮旅遊。
請參考步驟S45,擷取企劃關鍵詞及摘要句。詳言之,處理裝置5從依據核心地名或週邊地名篩選的評論檔中擷取企劃關鍵詞及關聯於企劃關鍵詞之摘要句。擷取企劃關鍵詞的方式如同步驟S23,其差別在於前者從不限定特定領域的多個類別的文字檔中進行擷取,後者從限定特定領域(旅遊)的評論檔中進行擷取。換言之,所述的企劃關鍵詞係在旅遊評論檔中關聯於話題的另一關鍵詞。所述摘要句係關聯於企劃關鍵詞的上下文。承前例,處理裝置5取得的企劃關鍵詞如下方表格所示:
Figure 108137289-A0305-02-0014-5
請參考步驟S47,產生企劃書。詳言之,在步驟S45擷取企劃關鍵詞之後,處理裝置5進一步計算企劃關鍵詞對應於內部(或外部)類別之多個第二比例,依據這些第二比例的最大值選擇對應的一個內部(或外部)類別,並產生一企劃書。企劃書之文本包含多個推薦列。每個推薦列包括核心地名(或週邊地名)、對應此核心地名(或週邊地名)的話題、企劃關鍵詞、被選擇的類別以及摘要句。企劃書的範例如下表所示:
Figure 108137289-A0305-02-0014-6
綜上所述,本發明提出的企劃書產生系統及其方法,適用於在特 定領域搜索可帶動人流量的話題以及地點。就旅遊而言,本發明可自動化式挖掘做為大眾旅遊動機的話題,並以該話題密切關聯的景點為核心,推薦多個區域性高網路聲量的旅遊景點,最終形成一份旅遊景點企劃書的草案供企劃人員參考。
雖然本發明以前述之實施例揭露如上,然其並非用以限定本發明。在不脫離本發明之精神和範圍內,所為之更動與潤飾,均屬本發明之專利保護範圍。關於本發明所界定之保護範圍請參考所附之申請專利範圍。
S21~S47:步驟

Claims (22)

  1. 一種企劃書的自動化產生方法,包括:以一通訊裝置從一第一伺服器取得多個文字檔,每一該些文字檔屬於多個類別其中一者;其中,該通訊裝置從該第一伺服器自動化取得多個網頁文章,再轉換該些文章為該些文字檔;以通訊連接該通訊裝置之一處理裝置採用tf-idf或text rank的技術從該些文字檔擷取一關鍵詞,並計算該關鍵詞之一話題係數以判斷該關鍵詞是否為一話題;以該處理裝置從該些文字檔中對應於該話題之多個文字檔擷取一地名,並以該話題及該地名作為一配對;在產生該配對之後,以該處理裝置依據該話題之一網路聲量而決定是否保留該話題,其中該網路聲量係該通訊裝置從一第三伺服器取得;在依據該話題之該網路聲量而決定保留該話題之後,以該處理裝置依據該地名篩選一評論網站之多個評論檔,其中該些評論檔係該通訊裝置從一第二伺服器取得;以該處理裝置依據該些評論檔中被篩選的多個評論檔計算該話題出現於被篩選的該些評論檔之一第一比例,並依據該第一比例而決定是否保留該話題;以及在依據該第一比例而決定保留該話題之後,以該處理裝置產生一企劃書,該企劃書包括一推薦列,該推薦列包括該地名及該話題。
  2. 如請求項1所述企劃書的自動化產生方法,在產生該配對之後且在以該處理裝置依據該話題之該網路聲量而決定保留該話題之前,更包括:以該處理裝置取得包括多個正向類別的一類別清單,該些正向類別屬於該些類別之子集合;對於該配對之該話題,以該處理裝置計算該話題在該些正向類別之一正向係數;以及以該處理裝置依據該正向係數是否超過一閾值而決定是否保留該話題。
  3. 如請求項1所述企劃書的自動化產生方法,在產生該配對之後且在以該處理裝置依據該話題之該網路聲量而決定保留該話題之前,更包括:以該處理裝置取得包括多個正向類別的一類別清單,該些正向類別之一者具有一從屬正向類別,該些正向類別及該從屬正向類別屬於該些類別之子集合;以該處理裝置依據該配對之該話題對應之該些類別其中二者是否係該從屬正向類別及具有該從屬正向類別之該正向類別而決定是否保留該話題。
  4. 如請求項2所述企劃書的自動化產生方法,其中每一該些類別具有一類別權重值,該正向係數關聯於該關鍵詞對應於該些正向類別之多個比例及該些類別權重值。
  5. 如請求項4所述企劃書的自動化產生方法,其中在以該通訊裝置從該第一伺服器取得該些文字檔之前,更包括: 以該處理裝置取得多個歷史文字檔,每一該些歷史文字檔屬於該些類別其中一者;以該處理裝置設置一初始權重值至每一該些類別;以該處理裝置基於一滑動時間窗從該些歷史文字檔中取得一歷史配對,並計算該歷史配對在該些類別之一分佈比例;以該處理裝置指定一標籤值至該歷史配對;以及以該處理裝置依據該標籤值更新該些初始權重值,並以更新後之該些初始權重值作為該些類別權重值。
  6. 如請求項1所述企劃書的自動化產生方法,其中每一該些文字檔具有多個外部類別其中一者,在以該處理裝置從該些文字檔擷取該關鍵詞之前更包括:以該處理裝置依據該些外部類別與該些類別之一對應關係,指定每一該些文字檔為該些類別其中一者。
  7. 如請求項1所述企劃書的自動化產生方法,其中該話題係數為該些文字檔中具有該關鍵詞之多個文字檔與該些文字檔之一第二比例。
  8. 如請求項1所述企劃書的自動化產生方法,其中該地名係一核心地名,在以該處理裝置篩選該些評論檔之前,更包括:以該通訊裝置基於一地理拓撲取得關聯於該核心地名之週邊地名;以及以該處理裝置依據該週邊地名篩選該評論網站之該評論檔。
  9. 如請求項8所述的企劃書的自動化產生方法,其中該週邊地名係該核心地名之一轄區,或該週邊地名與該核心地名之一地理距離小於一閾值。
  10. 如請求項1所述企劃書的自動化產生方法,其中以該處理裝置依據該話題之該網路聲量而決定是否保留該話題係以該處理裝置判斷該網路聲量是否大於一閾值或該網路聲量是否具有一成長趨勢。
  11. 如請求項1所述企劃書的自動化產生方法,其中擷取該關鍵詞係採用tf-idf(term frequency/inverse document frequency)或text rank。
  12. 如請求項1所述企劃書的自動化產生方法,在依據該第一比例而決定保留該話題之後,更包括:以該處理裝置從被篩選的該些評論檔中擷取一企劃關鍵詞及關聯於該企劃關鍵詞之一摘要句;以及以該處理裝置計算該企劃關鍵詞對應於該些類別之多個第二比例,並依據該些第二比例選擇該些類別之一者;其中該推薦列更包括:該企劃關鍵詞、被選擇的該類別以及該摘要句。
  13. 一種企劃書的自動化產生系統,包括:一通訊裝置,用於從一第一伺服器取得多個文字檔,從一第二伺服器取得多個評論檔,及從一第三伺服器取得一詞彙之一網路聲量,其中,該通訊裝置從該第一伺服器自動化取得多個網頁文章,再轉換該些文章為該些文字檔;一非暫時性機器可讀儲存裝置,用於儲存多個指令;以及一或多個處理裝置,電性連接該通訊裝置及該非暫時性機器可讀儲存裝置,該一或多個處理裝置用於執行該些指令並引發多個自動化操作,該些自動化操作包括: 該處理裝置採用tf-idf或text rank的技術以從該些文字檔擷取一關鍵詞,並計算該關鍵詞之一話題係數以判斷該關鍵詞是否為一話題;從該些文字檔中對應於該話題之多個文字檔擷取一地名,並以該話題及該地名作為一配對;在產生該配對之後,以該話題作為該詞彙,並依據該話題之該網路聲量而決定是否保留該話題;在依據該話題之該網路聲量而決定保留該話題之後,依據該地名篩選該些評論檔;依據該些評論檔中被篩選的多個評論檔計算該話題出現於被篩選的該些評論檔之一第一比例,並依據該第一比例而決定是否保留該話題;以及在依據該第一比例而決定保留該話題之後,產生一企劃書,該企劃書包括一推薦列,該推薦列包括該地名及該話題。
  14. 如請求項13所述企劃書的自動化產生系統,其中該些自動化操作更包括:在產生該配對之後且在依據該話題之該網路聲量而決定保留該話題之前,取得包括多個正向類別的一類別清單,該些正向類別屬於該些類別之子集合;對於該配對之該話題,計算該話題在該些正向類別之一正向係數;以及依據該正向係數是否超過一閾值而決定是否保留該話題。
  15. 如請求項13所述企劃書的自動化產生系統,其中該些自動化操作更包括: 在產生該配對之後且在依據該話題之該網路聲量而決定保留該話題之前,取得包括多個正向類別的一類別清單,該些正向類別之一者具有一從屬正向類別,該些正向類別及該從屬正向類別屬於該些類別之子集合;以及依據該配對之該話題對應之該些類別其中二者是否係該從屬正向類別及具有該從屬正向類別之該正向類別而決定是否保留該話題。
  16. 如請求項14所述企劃書的自動化產生系統,其中每一該些類別具有一類別權重值,該正向係數關聯於該關鍵詞對應於該些正向類別之多個比例及該些類別權重值。
  17. 如請求項16所述企劃書的自動化產生系統,其中該些自動化操作更包括:在取得該些文字檔之前,取得多個歷史文字檔,每一該些歷史文字檔屬於該些類別其中一者;設置一初始權重值至每一該些類別;基於一滑動時間窗從該些歷史文字檔中取得一歷史配對,並計算該歷史配對在該些類別之一分佈比例;指定一標籤值至該歷史配對;以及依據該標籤值更新該些初始權重值,並以更新後之該些初始權重值作為該些類別權重值。
  18. 如請求項13所述企劃書的自動化產生系統,其中每一該些文字檔具有多個外部類別其中一者,該些自動化操作更包括:在從該些 文字檔擷取該關鍵詞之前,依據該些外部類別與該些類別之一對應關係,指定每一該些文字檔為該些類別其中一者。
  19. 如請求項13所述企劃書的自動化產生系統,其中該話題係數為該些文字檔中具有該關鍵詞之多個文字檔與該些文字檔之一第三比例。
  20. 如請求項13所述企劃書的自動化產生系統,其中該地名係一核心地名,該些自動化操作更包括:在篩選該些評論檔之前,基於一地理拓撲取得關聯於該核心地名之週邊地名;以及依據該週邊地名篩選該評論網站之該評論檔。
  21. 如請求項13所述企劃書的自動化產生系統,其中該週邊地名係該核心地名之一轄區,或該週邊地名與該核心地名之一地理距離小於一閾值。
  22. 如請求項13所述企劃書的自動化產生系統,在依據該第一比例而決定保留該話題之後,更包括:從被篩選的該些評論檔中擷取一企劃關鍵詞及關聯於該企劃關鍵詞之一摘要句;以及計算該企劃關鍵詞對應於該些類別之多個第二比例,並依據該些第二比例選擇該些類別之一者;其中該推薦列更包括:該企劃關鍵詞、被選擇的該類別以及該摘要句。
TW108137289A 2019-10-16 2019-10-16 企劃書的自動化產生系統及其方法 TWI742450B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW108137289A TWI742450B (zh) 2019-10-16 2019-10-16 企劃書的自動化產生系統及其方法
CN201911130513.3A CN112667884B (zh) 2019-10-16 2019-11-18 企划书产生系统及其方法
US16/723,042 US11481555B2 (en) 2019-10-16 2019-12-20 Project generating system and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW108137289A TWI742450B (zh) 2019-10-16 2019-10-16 企劃書的自動化產生系統及其方法

Publications (2)

Publication Number Publication Date
TW202117612A TW202117612A (zh) 2021-05-01
TWI742450B true TWI742450B (zh) 2021-10-11

Family

ID=75400478

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108137289A TWI742450B (zh) 2019-10-16 2019-10-16 企劃書的自動化產生系統及其方法

Country Status (3)

Country Link
US (1) US11481555B2 (zh)
CN (1) CN112667884B (zh)
TW (1) TWI742450B (zh)

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6842737B1 (en) 2000-07-19 2005-01-11 Ijet Travel Intelligence, Inc. Travel information method and associated system
US7664740B2 (en) * 2006-06-26 2010-02-16 Microsoft Corporation Automatically displaying keywords and other supplemental information
US20080222119A1 (en) 2007-03-08 2008-09-11 Microsoft Corporation Detecting a user's location, local intent and travel intent from search queries
US7774348B2 (en) * 2007-03-28 2010-08-10 Yahoo, Inc. System for providing geographically relevant content to a search query with local intent
JP2010101838A (ja) * 2008-10-27 2010-05-06 Nomura Research Institute Ltd ナビゲーション装置
US20100198655A1 (en) 2009-02-04 2010-08-05 Google Inc. Advertising triggers based on internet trends
KR20110070057A (ko) 2009-12-18 2011-06-24 한국전자통신연구원 자연어 기반 여행 추천 장치 및 방법
US8543520B2 (en) * 2011-03-09 2013-09-24 Telenav, Inc. Navigation system with single pass clustering based template generation mechanism and method of operation thereof
US9262766B2 (en) * 2011-08-31 2016-02-16 Vibrant Media, Inc. Systems and methods for contextualizing services for inline mobile banner advertising
US8849829B2 (en) * 2011-12-06 2014-09-30 Google Inc. Trending search magazines
US10068006B1 (en) * 2011-12-09 2018-09-04 Amazon Technologies, Inc. Generating trend-based item recommendations
US20130166565A1 (en) * 2011-12-23 2013-06-27 Kevin LEPSOE Interest based social network system
US20140032708A1 (en) * 2012-07-24 2014-01-30 Oren Eli Zamir Providing online content
JP5431552B1 (ja) * 2012-09-04 2014-03-05 ヤフー株式会社 情報処理装置、情報処理方法及びコンピュータプログラム
CN102937960B (zh) * 2012-09-06 2015-06-17 北京邮电大学 突发事件热点话题的识别与评估装置
US10678815B2 (en) * 2012-10-02 2020-06-09 Banjo, Inc. Dynamic event detection system and method
US9652525B2 (en) * 2012-10-02 2017-05-16 Banjo, Inc. Dynamic event detection system and method
US9239876B2 (en) * 2012-12-03 2016-01-19 Adobe Systems Incorporated Automatic document classification via content analysis at storage time
US20140214883A1 (en) 2013-01-29 2014-07-31 Google Inc. Keyword trending data
US20140279003A1 (en) * 2013-03-14 2014-09-18 Bank Of America Corporation Enhancement of user affinity experience based on messaging related to a geographic area
US20150074131A1 (en) * 2013-09-09 2015-03-12 Mobitv, Inc. Leveraging social trends to identify relevant content
US9618343B2 (en) * 2013-12-12 2017-04-11 Microsoft Technology Licensing, Llc Predicted travel intent
KR20150083673A (ko) * 2014-01-10 2015-07-20 주식회사 다비오 여행 플랜 서비스 제공 방법 및 장치
US20150262069A1 (en) 2014-03-11 2015-09-17 Delvv, Inc. Automatic topic and interest based content recommendation system for mobile devices
JP6059683B2 (ja) * 2014-05-28 2017-01-11 日本電信電話株式会社 ローカル話題語抽出装置、ローカル話題語抽出方法及びローカル話題語抽出プログラム
CN104216954B (zh) * 2014-08-20 2017-07-14 北京邮电大学 突发事件话题状态的预测装置及预测方法
CN104516961A (zh) * 2014-12-18 2015-04-15 北京牡丹电子集团有限责任公司数字电视技术中心 一种基于地域的话题挖掘及话题走势分析方法及系统
JP6373767B2 (ja) * 2015-01-26 2018-08-15 Kddi株式会社 話題語ランキング装置、話題語ランキング方法、およびプログラム
US10798193B2 (en) * 2015-06-03 2020-10-06 Oath Inc. System and method for automatic storyline construction based on determined breaking news
CN106933789B (zh) * 2015-12-30 2023-06-20 阿里巴巴集团控股有限公司 旅游攻略生成方法和生成系统
CN106446179B (zh) * 2016-09-28 2019-07-30 东软集团股份有限公司 热点话题的生成方法及装置
US20180114136A1 (en) * 2016-10-21 2018-04-26 Accenture Global Solutions Limited Trend identification using multiple data sources and machine learning techniques
CN106776569A (zh) * 2016-12-26 2017-05-31 电子科技大学 海量文本中旅游热点及其特征抽取方法及系统
US10473476B2 (en) * 2016-12-31 2019-11-12 Uber Technologies, Inc. Vehicle routing guidance to an authoritative location for a point of interest
CN107220386B (zh) * 2017-06-29 2020-10-02 北京百度网讯科技有限公司 信息推送方法和装置
CN107526800B (zh) * 2017-08-20 2019-03-26 平安科技(深圳)有限公司 信息推荐的装置、方法及计算机可读存储介质
CN107644089B (zh) * 2017-09-26 2020-08-04 武大吉奥信息技术有限公司 一种基于网络媒体的热门事件提取方法
CN107679226B (zh) 2017-10-23 2019-03-05 中国科学院重庆绿色智能技术研究院 基于主题的旅游本体构建方法
US20190340554A1 (en) * 2018-05-07 2019-11-07 Microsoft Technology Licensing, Llc Engagement levels and roles in projects
CN109934220B (zh) * 2019-02-22 2022-06-14 上海联影智能医疗科技有限公司 一种影像兴趣点的展示方法、装置及终端
CN109492168B (zh) 2018-11-13 2022-04-15 钟栎娜 一种基于旅游照片的可视化旅游兴趣推荐信息生成方法
US11163875B1 (en) * 2019-03-22 2021-11-02 Ca, Inc. Discovery of computer system incidents to be remediated based on correlation between support interaction data and computer system telemetry data
CN110083645A (zh) 2019-05-06 2019-08-02 浙江核新同花顺网络信息股份有限公司 一种报告生成的系统和方法

Also Published As

Publication number Publication date
CN112667884B (zh) 2023-11-28
CN112667884A (zh) 2021-04-16
TW202117612A (zh) 2021-05-01
US11481555B2 (en) 2022-10-25
US20210117620A1 (en) 2021-04-22

Similar Documents

Publication Publication Date Title
US10430425B2 (en) Generating suggested queries based on social graph information
US10331748B2 (en) Dynamically generating recommendations based on social graph information
US10169472B2 (en) Coefficients attribution for different objects based on natural language processing
US10839029B2 (en) Personalization of web search results using term, category, and link-based user profiles
US8326861B1 (en) Personalized term importance evaluation in queries
CN105320719B (zh) 一种基于项目标签和图形关系的众筹网站项目推荐方法
US20130024431A1 (en) Event database for event search and ticket retrieval
CN105068661A (zh) 基于人工智能的人机交互方法和系统
IL236810A (en) Built-in search questions based on social graph information
CN103049440A (zh) 一种相关文章的推荐处理方法和处理系统
US20140229487A1 (en) System and method for user preference augmentation through social network inner-circle knowledge discovery
CN106776528A (zh) 一种信息处理方法及装置
Sheth et al. Semantic filtering for social data
Deveaud et al. On the importance of venue-dependent features for learning to rank contextual suggestions
TWI742450B (zh) 企劃書的自動化產生系統及其方法
CN103440342B (zh) 基于网页类型的信息推送方法和装置
Seaver Computing Taste: The Making of Algorithmic Music Recommendation
Milligan Exploring web archives in the age of abundance: a social history case study of GeoCities
JP2009070210A (ja) カテゴリ別ランキング作成装置
WO2021095728A1 (ja) コンテンツ制御装置、コンテンツ制御システム、コンテンツ制御方法、及びコンテンツ制御プログラム
Päätalo How Kainuu can improve its online tourism marketing for international visitors: Customer acquisition through SEO
TW202001595A (zh) 輿情查詢系統及方法
Fukazawa et al. Location based video navigation using task extracted from the web
Menezes Interactive Focused Crawler: Setup, Monitoring and Control through User Feedback. M. Tech. Project Second Stage Report