TW201915790A - 關注點文案的生成 - Google Patents

關注點文案的生成 Download PDF

Info

Publication number
TW201915790A
TW201915790A TW107110542A TW107110542A TW201915790A TW 201915790 A TW201915790 A TW 201915790A TW 107110542 A TW107110542 A TW 107110542A TW 107110542 A TW107110542 A TW 107110542A TW 201915790 A TW201915790 A TW 201915790A
Authority
TW
Taiwan
Prior art keywords
interest
point
poi information
poi
copy
Prior art date
Application number
TW107110542A
Other languages
English (en)
Other versions
TWI754033B (zh
Inventor
張華
丁長林
陳紅生
Original Assignee
大陸商北京三快在線科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 大陸商北京三快在線科技有限公司 filed Critical 大陸商北京三快在線科技有限公司
Publication of TW201915790A publication Critical patent/TW201915790A/zh
Application granted granted Critical
Publication of TWI754033B publication Critical patent/TWI754033B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3611Destination input or retrieval using character input or menus, e.g. menus of POIs
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3614Destination input or retrieval through interaction with a road map, e.g. selecting a POI icon on a road map
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3667Display of a road map
    • G01C21/3673Labelling using text of road map data items, e.g. road names, POI names
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3679Retrieval, searching and output of POI information, e.g. hotels, restaurants, shops, filling stations, parking facilities
    • G01C21/3682Retrieval, searching and output of POI information, e.g. hotels, restaurants, shops, filling stations, parking facilities output of POI information on a road map
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Automation & Control Theory (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Human Computer Interaction (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申請提供了一種關注點POI(Point of Interest,POI)文案生成方法和裝置。根據所述方法的一個示例,在獲取待用於生成文案的關注點POI資訊後,可對所述關注點POI資訊進行主題傾向預測,以確定所述關注點POI資訊的主題詞,並根據所述主題詞生成所述關注點POI資訊所屬關注點POI的文案。

Description

關注點文案的生成
本申請涉及關注點文案的生成
生成並展示關注點(Point of Interest,POI)文案以傳遞關注點POI的關鍵資訊,是提高使用者點擊率和購買率的有效手段,在產品展示或交易平臺中具有廣泛應用。然而,人工編寫關注點POI文案不僅成本高,並隨著關注點POI數量的增多,即時性也會比較差。此外,從關注點POI的相關描述資訊中自動抽取關注點POI文案可提高文案的抽取效率,但是由於只能從關注點POI的相關描述資訊中抽取相關描述文本,得到的文案對關注點POI的表達準確性可能不高。
本申請實施例提供一種關注點POI文案生成方法,以至少在一定程度上克服上述一個或者多個問題。
第一方面,本申請實施例提供了一種關注點POI文案生成方法,包括:獲取關注點POI資訊;對所述關注點POI資訊進行主題傾向預測,確定所述關注點POI資訊的主題詞;基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案。
第二方面,本申請實施例提供了一種關注點POI文案生成裝置,包括:關注點POI資訊獲取模組,用於獲取關注點POI資訊;主題詞確定模組,用於對所述關注點POI資訊進行主題傾向預測,以確定所述關注點POI資訊的主題詞;文案生成模組,用於基於所述主題詞生成所述關注點POI資訊所屬POI的文案。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请实施例所述的關注點POI文案生成方法。
第四方面,本申請實施例提供了一種電腦可讀存儲介質,其上存儲有電腦程式,該程式被處理器執行時實現本申請實施例所述的POI文案生成方法的步驟。
本申請實施例公開的關注點POI文案生成方法和裝置,在獲取關注點POI資訊後,可對所述關注點POI資訊進行主題傾向預測以確定所述關注點POI資訊的主題詞,並基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案,可有效提高所得到的文案對關注點POI的表達能力及表達準確性。通過對所述關注點POI資訊進行主題傾向預測並將預測到的主題詞作為待生成文案的輸入文本,可有效縮小待用於生成文案的輸入文本的資料範圍,並使得待用於生成文案的輸入文本更具備針對性,從而可有效提高所生成的文案的準確性和表達能力。此外,通過自動提取主題詞,可有效提高生成文案的效率。
A‧‧‧源序列
B‧‧‧目標序列
310‧‧‧文本處理通道
320‧‧‧圖片處理通道
410‧‧‧POI資訊獲取模組
311、321‧‧‧卷積層和
330‧‧‧全連接層
100、110、120、210、230‧‧‧步驟
430‧‧‧文案生成模組
440‧‧‧使用者定制主題詞確定模組
4201‧‧‧局部特徵提取單元
4202‧‧‧綜合特徵確定單元
4203‧‧‧主題詞確定單元
420‧‧‧主題詞確定模組
312、322‧‧‧池化層
為了更清楚地說明本申請實施例的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動性的前提下,還可以根據這些附圖獲得其他的附圖。
第1圖是本申請一實施例的關注點POI文案生成方法流程圖。
第2圖是本申請另一實施例的關注點POI文案生成方法流程圖。
第3圖是本申請一實施例的深度卷積神經網路模型的結構示意圖。
第4圖是本申請一實施例的關注點POI文案生成裝置的結構示意圖。
第5圖是本申請另一實施例的關注點POI文案生成裝置的結構示意圖。
第6圖是本申請又一實施例的關注點POI文案生成裝置的結構示意圖。
下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本申請一部分實施例,而不是全部的實施例。基於本申請中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬於本申請保護的範圍。
本申請公開的一種關注點POI文案生成方法,如第1圖所示, 所述方法可包括步驟100至步驟120。
步驟100,獲取POI資訊。
關注點POI(Point of Interest,關注點)在不同的平臺被賦予了不同的實際含義,例如可以為旅遊景點、一道菜、一個產品等。關注點POI資訊可包括多種形式,例如圖片形式、文本形式。不同形式的關注點POI資訊可展示關注點POI不同維度的資訊。例如,圖片形式的關注點POI資訊可以用於展示關注點POI的圖片,如首圖;文本形式的關注點POI資訊可以用於展示關注點POI的名稱、描述、評論等資訊。
關注點POI資訊是用於生成文案的來源資料。以生成一道菜的文案為例,所獲取的用於生成文案的來源資料可以包括這道菜的圖片、名稱、味道和食材的描述、使用者評論等資訊。
步驟110,對所述關注點POI資訊進行主題傾向預測,確定所述關注點POI資訊的主題詞。
可以首先通過詞袋模型將文本類型的關注點POI資訊標識為實數向量,以提取文本形式的關注點POI資訊的特徵,再通過特徵提取方法提取圖片形式的關注點POI資訊的特徵;然後,可將不同形式的關注點POI資訊的特徵進行融合,得到關注點POI資訊的綜合特徵表示;最後,再利用預先訓練的神經網路模型,如SVM分類模型,確定與所得到的關注點POI資訊的綜合特徵對應主題詞作為該關注點POI的主題詞。
本申請實施例中,可預先訓練神經網路模型,然後將關注點POI資訊,如首圖、名稱、評論、描述等中的任意一項或多項輸入所述神經網路模型,以由所述神經網路模型對所述關注點POI資訊進行特徵提取和確定主題詞,從而完成主題傾向預測並輸出所述關注點POI資訊的主題詞。
步驟120,基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案。
可以採用類似機器翻譯的方法來基於所述主題詞生成所述關注點POI資訊的文案。可通過深度學習方法預先訓練深度神經網路模型,如基於編碼-解碼的深度神經網路模型。所述基於編碼-解碼的深度神經網路模型可用於將深度卷積神經網路模型輸出的主題詞作為輸入,生成與輸入至所述深度卷 積神經網路模型的關注點POI資訊對應的文案。
可採用基於編碼-解碼的神經網路模型,例如基於注意力機制的seq2seq(sequence to sequence,seq2seq)深度神經網路模型。在進行模型訓練時,可將可能出現的主題詞序列作為輸入,然後將對應的文案作為輸出,以訓練seq2seq深度神經網路模型。例如,訓練基於編碼-解碼的深度神經網路模型的訓練資料的格式可以為[input:主題詞序列;output:文案]。其中,主題詞可為文本。
seq2seq深度神經網路模型在機器翻譯、自然語言處理領域取得了很大的進步。基於貝葉斯條件概率公式,seq2seq由一個編碼器和一個解碼器構成,編碼器可將源序列A編碼成一個固定長度的特徵向量,這個向量作為輸入被傳送到解碼器得到目標序列B。其中,所使用的注意力機制主要分為兩種,一種是由Bahdanau提出的加法注意力機制,另外一種是由Luong提出的乘法注意力機制。基於注意力機制的seq2seq模型的特點包括:編碼端使用雙向的迴圈神經網路(或其變體)對輸入序列進行編碼表示,能夠很好地對整個上下文進行建模表示;引入注意力機制,使得目標序列中的詞和輸入序列中詞的對齊資訊可以被很好地利用。由於模型的時序依賴特點(即後續的輸出會跟之前的所有輸入相關),模型的學習可採用隨時間序的反向傳播演算法。訓練seq2seq深度神經網路模型的具體實施方式可參見本領域技術人員熟知的相關技術,此處不再贅述。
在確定了關注點POI資訊的主題詞之後,可將所述主題詞拼接成文本序列輸入至基於編碼-解碼的深度神經網路模型,以由所述基於編碼-解碼的深度神經網路模型輸出對應的文案。
本發明實施例公開的關注點POI文案生成方法,在獲取待用於生成文案的關注點POI資訊後,通過對所述關注點POI資訊進行主題傾向預測以確定所述關注點POI資訊的主題詞、並基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案,可有效提高所得到的文案對關注點POI的表達能力和表達準確性。此外,通過對所述關注點POI資訊進行主題傾向預測來得到主題詞,並將主題詞作為待用於生成文案的輸入文本,可有效縮小待用於生成文案的輸入文本的資料範圍,並提高所生成的文案的準確性以及表達能力。並且,通過自動提取主題詞也可有效提高生成文案的效率。
如第2圖所示,本申請的另一具體實施例中公開的關注點POI文案生成方法可包括步驟200至步驟230。
步驟200,獲取待用於生成文案的關注點POI資訊。
獲取待用於生成文案的關注點POI資訊的具體實施方式可參見以上,此處不再贅述。
在獲取待用於生成文案的關注點POI資訊之後,可對所述關注點POI資訊進行主題傾向預測,以確定所述關注點POI資訊的主題詞。然後,可基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案。可採用不同的神經網路模型分別進行主題詞提取和文案生成。例如,對所述關注點POI資訊進行主題傾向預測,以確定所述關注點POI資訊的主題詞,可包括:通過第一神經網路模型對所述關注點POI資訊進行主題傾向預測,以確定所述關注點POI資訊的主題詞。基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案,可包括:通過第二神經網路模型,基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案。
步驟210,通過第一神經網路模型對所述POI資訊進行主題傾向預測,以確定所述關注點POI資訊的主題詞。
本申請實施例中,首先,可訓練第一神經網路模型。
假設要同時判定一個關注點POI的兩個主題,如:是否全天營業、是否環境優美,那麼對於任何一個主題來說,都是一個判斷是與否的二分類問題。以“是否全天營業”為例,要麼全天,要麼非全天。如果需要確定關於POI的多個主題時,就需要解決多個二分類問題。因此,為了把多個二分類問題放在一個模型中同時進行解決,以同時預測一個關注點POI的不同主題,可能需要採用能夠解決多目標分類問題的多目標分類模型。本申請實施例中,用於進行主題傾向預測的第一神經網路模型可為基於深度卷積神經網路的多目標分類模型。
可將關注點POI資訊作為輸入,將所述關注點POI資訊對應的主題詞序列作為輸出,並基於所述輸入和輸出構成的訓練資料訓練基於卷積神經網路的多目標分類模型。訓練資料的格式可以為[input:圖片,文本序列;output:主題詞序列]。其中,關注點POI資訊可包括圖片和文本序列。利用訓 練資料訓練深度卷積神經網路模型時,可以使用反向傳播演算法。
所述深度卷積神經網路模型可包括至少一個資料處理通道,如文本處理通道或圖片處理通道。如第3圖所示,所述資料處理通道可包括文本處理通道310和圖片處理通道320。每個資料處理通道是一個獨立的卷積模組,用於處理不同形式的關注點POI資訊。例如:文本處理通道310用於處理文本形式的關注點POI資訊,如名稱、描述、評論等關注點POI資訊;圖片處理通道320用於處理圖片形式的關注點POI資訊,如關注點POI的首圖。兩個資料處理通道可分別進行訓練,例如:利用輸入的圖片部分訓練圖片處理通道320,利用輸入的文本序列部分訓練文本處理通道310。可以參照本領域技術人員熟知的深度卷積神經網路模型訓練方法來訓練深度卷積神經網路模型,此處不再贅述。
在提取某個關注點POI的文案時,可將該關注點POI的關注點POI資訊,如首圖、名稱、評論、描述等中的任意一項或多項作為所述深度卷積神經網路模型的輸入,例如組織成[input:圖片,文本序列]的格式輸入至所述深度卷積神經網路模型,由所述深度卷積神經網路模型對所述關注點POI資訊進行主題傾向預測,並輸出所述關注點POI資訊對應的至少一個主題詞。
通過第一神經網路模型對所述關注點POI資訊進行主題傾向預測,以確定所述關注點POI資訊的主題詞,可包括:分別確定不同形式的關注點POI資訊的特徵;將所述不同形式的關注點POI資訊的特徵進行融合,以確定所述關注點POI資訊的綜合特徵;通過所述第一神經網路模型將所述綜合特徵映射成所述關注點POI資訊的主題詞。所述不同形式的關注點POI資訊可包括:文本形式的關注點POI資訊和/或圖片形式的關注點POI資訊。
例如,可通過深度卷積神經網路模型(即第一神經網路模型)中的各資料處理通道對相應形式的關注點POI資訊進行主題傾向預測,分別提取每種形式的關注點POI資訊的特徵。以輸入一道菜品的關注點POI資訊包括菜品的圖片、名稱、描述為例,深度卷積神經網路模型可將菜品的圖片分配至圖片處理通道進行處理,將菜品的名稱、描述文本分配至文本處理通道進行處理。
圖片處理通道可以採用二維卷積和最大池化(Maximum Pooling)交替堆疊的網路結構,例如採用vgg16卷積神經網路以及ImageNet資 料集預訓練的模型。圖片處理通道對輸入的菜品圖片進行處理後,可得到一個實數向量V1以表示輸入的菜品圖片的特徵,即圖片形式的POI資訊的特徵。在卷積神經網路中,卷積層的作用是提取一個局部區域的特徵,每一個濾波器相當於一個特徵提取器。當需要提取多種特徵時,可以同時使用多個濾波器(也可稱為卷積核)。由每一個特徵提取器提取得到的輸出,即向量、矩陣、張量等,可稱為一個特徵映射。而且,同一個濾波器在整個輸入資料上可採用同一套權重,這是卷積層的另外一個重要特性“權值共用”。該特性可以顯著減少模型中連接的個數。卷積層雖然可以顯著減少連接的個數,但是經過卷積操作後得到的每一個特徵映射的神經元個數並沒有顯著減少。這樣,如果後面接一個分類器,分類器的輸入維數依然很高,很容易出現過擬合。為了解決這個問題,本申請的深度卷積神經網路模型在卷積層之後再加上一個池化(Pooling)操作,也就是子採樣(Subsampling),以構成一個子採樣層。子採樣層可以大大降低特徵的維數,從而可避免過擬合。
文本處理通道可以採用一層一維卷積加一層最大池化(Maximum Pooling)的網路結構,對輸入的菜品名稱、描述文本進行處理後,將得到另一個實數向量V2以表示輸入的菜品名稱、描述文本的特徵,即文本形式的POI資訊的特徵。
然後,可將每種形式的關注點POI資訊的特徵進行融合,以確定所述關注點POI資訊的綜合特徵。以圖片處理通道得到的圖片特徵V1為一個三維特徵向量[1,2,3]、文本處理通道得到的文本特徵V2為一個二維特徵向量[4,5]為例,將圖片形式的關注點POI資訊的特徵[1,2,3]和文本形式的POI資訊的特徵[4,5]進行融合,可拼接出所述關注點POI資訊的綜合特徵[1,2,3,4,5]。
最後,通過深度卷積神經網路模型的全連接層將所述綜合特徵映射成所述POI資訊的主題詞。如第3圖所示,所述深度卷積神經網路模型在卷積層311、321和池化層312、322之後還有全連接層330。所述深度卷積神經網路模型可包括基於深度卷積神經網路的多目標分類器。全連接層(fully connected layers,FC)在卷積神經網路中起到“分類器”的作用。卷積層、池化層的操作是將原始資料映射到隱層特徵空間,而全連接層則可將隱層特徵空間的“分散式特徵”映射到樣本標記空間,即輸出空間。
全連接層330可根據輸入的關注點POI資訊的綜合特徵預測出 關注點POI資訊的主題詞清單。由於全連接層實現的是一個多目標分類器,所以該層的每一個節點都是一個獨立的二分類器,可以採用sigmoid進行啟動,且不同節點之間相互獨立。相應地,整個網路最終的損失函數可以使用基於sigmoid的交叉熵。在此基礎上,可使用反向傳播演算法來學習整個網路。全連接層可將根據POI資訊的綜合特徵預測出關注點POI資訊對應的主題詞清單。例如,根據特徵[1,2,3,4,5]預測出所述菜品的關注點POI資訊的主題詞清單。
每一個關注點POI資訊可以對應多個主題詞,多個主題詞可以以主題詞序列的形式輸出。
步驟220,通過第二神經網路模型,基於所述主題詞生成所述POI資訊所屬POI的文案。
其中,所述第二神經網路模型可以為基於編碼-解碼的深度神經網路模型。
基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案可參見上述,此處不再贅述。
可選的,如第2圖所示,在通過第二神經網路模型,基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案的步驟220之前,所述方法還可包括:步驟230,確定使用者定制的主題詞。
可以通過對使用者資訊進行分析後,提取與用戶的興趣或偏好等相關的主題詞作為用戶定制的主題詞。或者,根據實際需要人為描述主題的詞語作為使用者定制的主題詞。
當系統輸入了使用者定制的主題詞時,基於所述主題詞生成所述POI資訊所屬關注點POI的文案,可包括:基於根據所述關注點POI資訊進行預測得到的主題詞和所述用戶定制的主題詞,生成所述關注點POI資訊所屬關注點POI的文案。換言之,可將通過第一神經網路模型模型預測的主題詞和使用者定制的主題詞同時輸入至第二神經網路模型,以生成所述關注點POI資訊所屬關注點POI的文案。例如,假設通過深度卷積神經網路模型對所述關注點POI資訊進行主題傾向預測所確定的主題詞為“環境乾淨,口味偏辣”,而用戶定制的主題詞為“口味偏辣”,則可把通過深度卷積神經網路模型對所述關注點POI資訊進行主題傾向預測所確定的主題詞和用戶定制的主題詞結合,得到“環 境乾淨,口味偏辣”和“口味偏辣”作為基於編碼-解碼的深度神經網路模型的輸入,以用於生成文案。這樣,口味部分主題就會得到強化,最終的文案也會更符合用戶偏好。
本申請實施例公開的關注點POI文案生成方法,在獲取關注點POI資訊後,可通過第一神經網路模型對所述關注點POI資訊進行主題傾向預測以確定所述關注點POI資訊的主題詞,並結合用戶定制的主題詞生成所述關注點POI資訊所屬的關注點POI的文案,可有效提高所得到的文案對關注點POI的表達能力和表達準確性。
進一步的,通過根據使用者的需求靈活補充主題詞,可使得待用於生成文案的主題詞更符合用戶偏好,從而可以進一步提升關注點POI的點擊率。通過在深度卷積神經網路模型中設置多個資料處理通道,每個資料處理通道對應一個獨立的卷積模組,可以處理多種形式的關注點POI資訊,從而可進一步提升了生成的文案的準確性和表達能力。
每一個關注點POI的主題詞序列可直接作為編碼-解碼神經網路的輸入,以主導最終文案的生成,也可為所生成的文案提供直觀的來源解釋。此外,當需要對基於編碼-解碼的深度神經網路模型最終輸出文案的風格進行遷移時,只需重新訓練一個基於編碼-解碼神經網路模型即可。這使得文案風格遷移變得簡單,且多風格間可視需要靈活切換。
如第4圖所示,本申請一實施例中公開的關注點POI文案生成裝置,可包括:POI資訊獲取模組410,用於獲取關注點POI資訊;主題詞確定模組420,用於對所述關注點POI資訊進行主題傾向預測,確定所述關注點POI資訊的主題詞;文案生成模組430,用於基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案。
其中,所述主題詞確定模組420可進一步用於:通過第一神經網路模型對所述關注點POI資訊進行主題傾向預測,以確定所述關注點POI資訊的主題詞。所述第一神經網路模型可為深度卷積神經網路模型,例如基於深度卷積神經網路的多目標分類器。此外,所述第一神經網路模型可包括多個資料處理通道,如文本處理通道和/或圖片處理通道。所述文本處理通道可採用一層一維卷積加一層最大池化的網路結構。所述圖片處理通道可採用二維卷積和最大池化交替堆疊的網路結構。
所述文案生成模組430可進一步用於:通過第二神經網路模型,基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案。其中,所述第二神經網路模型可為基於編碼-解碼的深度神經網路模型。
如第5圖所示,所述主題詞確定模組420可包括:局部特徵提取單元4201,用於分別確定不同形式的關注點POI資訊的特徵;綜合特徵確定單元4202,用於將所述不同形式的關注點POI資訊的特徵進行融合,確定所述關注點POI資訊的綜合特徵;以及主題詞確定單元4203,用於通過所述第一神經網路模型將所述綜合特徵映射成所述關注點POI資訊的主題詞。其中,所述不同形式的關注點POI資訊可包括:文本形式的關注點POI資訊和/或圖片形式的關注點POI資訊。
本申請實施例公開的關注點POI文案生成裝置,在獲取關注點POI資訊後,通過對所述關注點POI資訊進行主題傾向預測以確定所述關注點POI資訊的主題詞,並基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案,可有效提高所得到的文案對關注點POI的表達能力及準確性。通過對所述關注點POI資訊進行主題傾向預測以得到主題詞,並將主題詞作為待用於生成文案的輸入文本,可有效縮小待用於生成文案的輸入文本的資料範圍,並使得待用於生成文案的輸入文本更具備針對性,從而可進一步提高所生成的文案的準確性和表達能力。此外,通過自動提取主題詞也可有效提高生成文案的效率。
通過在深度卷積神經網路模型中設置多個資料處理通道,每個資料處理通道對應一個獨立的卷積模組,可以處理多種形式的關注點POI資訊,從而可進一步提升所生成的文案的準確性和表達能力。
所預測出的每一個關注點POI的主題詞序列可直接作為編碼-解碼神經網路的輸入,以主導最終文案的生成,也可為所生成的文案提供直觀的來源解釋。並且,當需要對基於編碼-解碼的深度神經網路模型最終輸出文案的風格進行遷移時,只需重新訓練一個基於編碼-解碼的深度神經網路模型即可,從而可使得文案風格遷移變得簡單,且多風格間可視需要靈活切換。
如第6圖所示,基於第5圖所示的關注點POI文案生成裝置,本申請另一實施例中公開的關注點POI文案生成裝置還可包括:使用者定制主題詞確定模組440,用於確定使用者定制的主題詞。在這種情況下,所述文案生 成模組430可進一步用於:基於所述主題詞確定模組420確定的主題詞和所述使用者定制主題詞確定模組440確定的主題詞,生成所述POI資訊所屬關注點POI的文案。
本申請實施例公開的關注點POI文案生成裝置,通過允許根據使用者的需求靈活補充主題詞,可使得待用於生成文案的主題詞更符合用戶偏好,從而可以進一步提升關注點POI的點擊率。
相應的,本申請還公開了一種電子設備,包括記憶體、處理器及存儲在所述記憶體上並可在處理器上運行的電腦程式。其中,通過所述處理器執行所述電腦程式,可實現如上所述的關注點POI文案生成方法。所述電子設備可以為移動終端、智慧型電話、導航儀、個人數位助理、平板電腦等。
本申請還公開了一種電腦可讀存儲介質,其上存儲有電腦程式。其中,該程式被處理器執行時,可實現如上所述的關注點POI文案生成方法的步驟。
本說明書中的各個實施例均採用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。對於裝置實施例而言,由於其與方法實施例基本相似,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。
以上對本申請提供的一種關注點POI文案生成方法及裝置進行了詳細介紹,本文中應用了具體個例對本申請的原理及實施方式進行了闡述,以上實施例的說明只是用於幫助理解本申請的方法及其核心思想;同時,對於本領域的一般技術人員,依據本申請的思想,在具體實施方式及應用範圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本申請的限制。
通過以上的實施方式的描述,本領域的技術人員可以清楚地瞭解到各實施方式可借助軟體加必需的通用硬體平臺的方式來實現,當然也可以通過硬體實現。基於這樣的理解,上述技術方案本質上或者說對現有技術做出貢獻的部分可以以軟體產品的形式體現出來,該電腦軟體產品可以存儲在電腦可讀存儲介質中,如ROM/RAM、磁碟、光碟等,包括若干指令用以使得一台電腦設備(可以是個人電腦,伺服器,或者網路設備等)執行各個實施例或者實施例的某些部分所述的方法。

Claims (11)

  1. 一種關注點POI文案生成方法,包括:獲取POI資訊;對所述關注點POI資訊進行主題傾向預測,確定所述關注點POI資訊的主題詞;基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案。
  2. 如申請專利範圍第1項所述的方法,其特徵在於,對所述關注點POI資訊進行主題傾向預測,確定所述關注點POI資訊的主題詞,包括:通過第一神經網路模型對所述關注點POI資訊進行主題傾向預測,確定所述關注點POI資訊的主題詞;基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案,包括:通過第二神經網路模型,基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案。
  3. 如申請專利範圍第2項所述的方法,其特徵在於,通過所述第一神經網路模型對所述關注點POI資訊進行主題傾向預測,確定所述關注點POI資訊的主題詞,包括:分別確定不同形式的所述關注點POI資訊的特徵;將不同形式的所述關注點POI資訊的特徵進行融合,確定所述關注點POI資訊的綜合特徵;通過所述第一神經網路模型將所述綜合特徵映射成所述關注點POI資訊的主題詞。
  4. 如申請專利範圍第3項所述的方法,其特徵在於,不同形式的所述關注點POI資訊包括以下任意一個或多個:文本形式的關注點POI資訊;圖片形式的關注點POI資訊。
  5. 如申請專利範圍第第1項至第4項任一項所述的方法,其特徵在於,還包括:確定用戶定制的主題詞。
  6. 如申請專利範圍第5項所述的方法,其特徵在於,基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案,包括:基於根據所述關注點POI資訊進行預測得到的主題詞和所述用戶定制的主題詞,生成所述關注點POI資訊所屬關注點POI的文案。
  7. 一種關注點POI文案生成裝置,包括:關注點POI資訊獲取模組,用於獲取關注點POI資訊;主題詞確定模組,用於對所述關注點POI資訊進行主題傾向預測,以確定所述關注點POI資訊的主題詞;文案生成模組,用於基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案。
  8. 如申請專利範圍第7項所述的裝置,其特徵在於,所述主題詞確定模組被配置為:通過第一神經網路模型對所述關注點POI資訊進行主題傾向預測,以確定所述關注點POI資訊的主題詞;所述文案生成模組被配置為:通過第二神經網路模型,基於所述主題詞生成所述關注點POI資訊所屬關注點POI的文案。
  9. 如申請專利範圍第6項或第7項所述的裝置,其特徵在於,還包括使用者定制主題詞確定模組,所述使用者定制主題詞確定模組被配置為確定使用者定制的主題詞;所述文案生成模組被配置為基於所述主題詞確定模組確定的主題詞和所述使用者定制主題詞確定模組確定的主題詞,生成所述關注點POI資訊所屬關注點POI的文案。
  10. 一種電子設備,包括記憶體、處理器及存儲在所述記憶體上並可在處理器上運行的電腦程式,其特徵在於,所述處理器執行所述電腦程式時實現申請專利範圍第1項至第6項任一項所述的關注點POI文案生成方法。
  11. 一種電腦可讀存儲介質,其上存儲有電腦程式,其特徵在於,該程式被處理器執行時實現申請專利範圍第1項至第5項任一項所述的關注點POI文案生成方法的步驟。
TW107110542A 2017-09-21 2018-03-27 關注點文案的生成 TWI754033B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
??201710862104.7 2017-09-21
CN201710862104.7 2017-09-21
CN201710862104.7A CN107861938B (zh) 2017-09-21 2017-09-21 一种poi文案生成方法及装置,电子设备

Publications (2)

Publication Number Publication Date
TW201915790A true TW201915790A (zh) 2019-04-16
TWI754033B TWI754033B (zh) 2022-02-01

Family

ID=61699565

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107110542A TWI754033B (zh) 2017-09-21 2018-03-27 關注點文案的生成

Country Status (8)

Country Link
US (1) US20200132491A1 (zh)
EP (1) EP3623957A4 (zh)
JP (1) JP6961727B2 (zh)
KR (1) KR20200007900A (zh)
CN (1) CN107861938B (zh)
CA (1) CA3069365A1 (zh)
TW (1) TWI754033B (zh)
WO (1) WO2019056628A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI739124B (zh) * 2019-04-26 2021-09-11 長佳智能股份有限公司 在被監督狀態下提供類神經網路訓練模型之雲端交易系統及其方法

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108615036B (zh) * 2018-05-09 2021-10-01 中国科学技术大学 一种基于卷积注意力网络的自然场景文本识别方法
CN108932335B (zh) * 2018-07-10 2022-01-07 北京京东尚科信息技术有限公司 一种生成文案的方法和装置
CN109508449A (zh) * 2018-08-07 2019-03-22 上海奇邑文化传播有限公司 一种宣传片文案在线生成系统及其生成方法
CN109117485B (zh) * 2018-09-06 2023-08-08 北京汇钧科技有限公司 祝福语文本生成方法和装置、计算机可读存储介质
CN109544201A (zh) * 2018-10-11 2019-03-29 北京奇虎科技有限公司 一种广告文案的生成方法、装置及电子设备
CN109447706B (zh) * 2018-10-25 2022-06-21 深圳前海微众银行股份有限公司 广告文案生成方法、装置、设备以及可读存储介质
CN110162799B (zh) * 2018-11-28 2023-08-04 腾讯科技(深圳)有限公司 模型训练方法、机器翻译方法以及相关装置和设备
US11210477B2 (en) * 2019-05-09 2021-12-28 Adobe Inc. Systems and methods for transferring stylistic expression in machine translation of sequence data
CN110321537B (zh) * 2019-06-11 2023-04-07 创新先进技术有限公司 一种文案生成方法和装置
US10970598B1 (en) * 2020-05-13 2021-04-06 StradVision, Inc. Learning method and learning device for training an object detection network by using attention maps and testing method and testing device using the same
CN111581926B (zh) * 2020-05-15 2023-09-01 抖音视界有限公司 文案生成方法、装置、设备和计算机可读存储介质
CN111915608B (zh) * 2020-09-11 2023-08-15 北京百度网讯科技有限公司 建筑物提取方法、装置、设备和存储介质
CN112015439B (zh) * 2020-09-21 2024-01-12 北京百度网讯科技有限公司 用户app兴趣的嵌入方法、装置、设备以及存储介质
CN113254633B (zh) * 2021-05-10 2024-05-03 中国民生银行股份有限公司 消息文案生成方法和装置
CN113688230A (zh) * 2021-07-21 2021-11-23 武汉众智数字技术有限公司 一种文本摘要生成的方法及系统
CN114051273B (zh) * 2021-11-08 2023-10-13 南京大学 一种基于深度学习的大规模网络动态自适应路径规划方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102142003B (zh) * 2010-07-30 2013-04-24 华为软件技术有限公司 兴趣点信息提供方法及装置
US9165206B2 (en) * 2011-12-12 2015-10-20 Google Inc. Updating point of interest data based on an image
US20140074610A1 (en) * 2012-09-13 2014-03-13 Qualcomm Incorporated Generating a point of interest profile based on third-party social comments
JP6177030B2 (ja) * 2013-07-04 2017-08-09 クラリオン株式会社 Poi情報提供システム、poi情報提供装置、poi情報提供方法、及びプログラム
CN104572645B (zh) * 2013-10-11 2020-07-10 阿里巴巴(中国)有限公司 兴趣点数据关联方法及装置
KR101556743B1 (ko) * 2014-04-07 2015-10-02 주식회사 케이티 웹 수집에 기반한 관심 정보 생성 장치 및 그 방법
CN104537027B (zh) * 2014-12-19 2019-05-10 百度在线网络技术(北京)有限公司 信息推荐方法及装置
KR101682590B1 (ko) * 2015-04-16 2016-12-05 (주)포스트미디어 사용자 맞춤형 여행계획 생성방법, 이를 수행하는 사용자 맞춤형 여행계획 생성 서버 및 이를 저장하는 기록매체
CN104899339A (zh) * 2015-07-01 2015-09-09 北京奇虎科技有限公司 对poi信息进行分类的方法和装置
CN105224660A (zh) * 2015-09-30 2016-01-06 北京奇虎科技有限公司 一种地图兴趣点poi数据的处理方法和装置
CN105930314B (zh) * 2016-04-14 2019-02-05 清华大学 基于编码-解码深度神经网络的文本摘要生成系统及方法
CN106096605B (zh) * 2016-06-02 2019-03-19 史方 一种基于深度学习的图像模糊区域检测方法及装置
CN106503255B (zh) * 2016-11-15 2020-05-12 科大讯飞股份有限公司 基于描述文本自动生成文章的方法及系统
CN106776540A (zh) * 2016-11-23 2017-05-31 清华大学 一种自由化文本生成方法
CN106919646B (zh) * 2017-01-18 2020-06-09 南京云思创智信息科技有限公司 中文文本摘要生成系统及方法
CN106980683B (zh) * 2017-03-30 2021-02-12 中国科学技术大学苏州研究院 基于深度学习的博客文本摘要生成方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI739124B (zh) * 2019-04-26 2021-09-11 長佳智能股份有限公司 在被監督狀態下提供類神經網路訓練模型之雲端交易系統及其方法

Also Published As

Publication number Publication date
TWI754033B (zh) 2022-02-01
EP3623957A4 (en) 2020-04-22
EP3623957A1 (en) 2020-03-18
CA3069365A1 (en) 2019-03-28
CN107861938B (zh) 2020-09-25
CN107861938A (zh) 2018-03-30
US20200132491A1 (en) 2020-04-30
KR20200007900A (ko) 2020-01-22
WO2019056628A1 (zh) 2019-03-28
JP6961727B2 (ja) 2021-11-05
JP2020523699A (ja) 2020-08-06

Similar Documents

Publication Publication Date Title
TW201915790A (zh) 關注點文案的生成
CN110121706B (zh) 提供会话中的响应
WO2023280064A1 (zh) 一种基于云边协同的音视频辅助触觉信号重建方法
JP2023535709A (ja) 言語表現モデルシステム、事前訓練方法、装置、機器及び媒体
CN113704388A (zh) 多任务预训练模型的训练方法、装置、电子设备和介质
CN115618098B (zh) 基于知识增强与空洞卷积的冷链物流推荐方法及装置
CN115114395A (zh) 内容检索及模型训练方法、装置、电子设备和存储介质
Zhao et al. Multi-task learning with graph attention networks for multi-domain task-oriented dialogue systems
CN116975615A (zh) 基于视频多模态信息的任务预测方法和装置
CN116933051A (zh) 一种用于模态缺失场景的多模态情感识别方法及系统
CN117173497B (zh) 一种图像生成方法、装置、电子设备及存储介质
CN113590976A (zh) 一种空间自适应图卷积网络的推荐方法
CN117390267A (zh) 基于知识图谱的个性化多任务增强推荐模型
CN117251586A (zh) 多媒体资源推荐方法、装置及存储介质
CN116628345A (zh) 一种内容推荐方法、装置、电子设备和存储介质
CN116955591A (zh) 用于内容推荐的推荐语生成方法、相关装置和介质
CN116977701A (zh) 视频分类模型训练的方法、视频分类的方法和装置
CN113988201B (zh) 一种基于神经网络的多模态情感分类方法
US20230111633A1 (en) Lead conversion using conversational virtual avatar
CN110969187B (zh) 一种图谱迁移的语义分析方法
Newnham Machine Learning with Core ML: An iOS developer's guide to implementing machine learning in mobile apps
Zhang et al. Hybrid structural graph attention network for POI recommendation
Zhu Flattening of New Media Design Based on Deep Reinforcement Learning
Tong et al. ReverseGAN: An intelligent reverse generative adversarial networks system for complex image captioning generation
WO2024061073A1 (zh) 一种多媒体信息的生成方法及装置、计算机可读存储介质

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees