TW201523423A - 使用頁鏈以合倂文章的頁面 - Google Patents

使用頁鏈以合倂文章的頁面 Download PDF

Info

Publication number
TW201523423A
TW201523423A TW103129010A TW103129010A TW201523423A TW 201523423 A TW201523423 A TW 201523423A TW 103129010 A TW103129010 A TW 103129010A TW 103129010 A TW103129010 A TW 103129010A TW 201523423 A TW201523423 A TW 201523423A
Authority
TW
Taiwan
Prior art keywords
page
article
link
chain
address
Prior art date
Application number
TW103129010A
Other languages
English (en)
Inventor
zhi-cheng Dou
Rui-Hua Song
Guang-Ping Gao
Qian Zhang
Ming Liu
Raman Narayanan
Shelley Summer Gu
Yanti Aruswati Gouw
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of TW201523423A publication Critical patent/TW201523423A/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/134Hyperlinking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

內容應用程式使用頁鏈以合併文章的頁面。內容應用程式擷取文章之初始頁面。擷取散佈至多個頁面之文章(諸如,網路文章)以進行分析。在初始頁面內偵測文章之隨後頁面之頁鏈。該頁鏈係基於權重計分排序之候選中的首選。使用頁鏈擷取隨後頁面且將該隨後頁面附加至初始頁面中以形成文章匯總。呈現該文章匯總以供消費。

Description

使用頁鏈以合併文章的頁面
本發明係關於使用頁鏈以合併文章的頁面。
人經由使用者介面與電腦應用程式互動。雖然音訊、觸覺及類似形式之使用者介面係可用的,但經由顯示裝置之可視使用者介面係使用者介面之最常見形式。隨著用於計算裝置之更快速且更小之電子器件之發展,更小大小之裝置(諸如,手持式電腦、智慧型電話、平板裝置及類似裝置)已變得常見。此等裝置執行範圍自通訊應用程式至複雜分析工具之多種應用程式。諸多此等應用程式經由顯示器顯現視覺效果且使使用者能夠提供與該等應用程式之操作關聯之輸入。
最近,具有有限顯示器大小之裝置已成功地滲透客戶市場。在一些情況下,諸如平板之有限目的裝置已替代多目標裝置(諸如,膝上型電腦)以供在媒體消費中使用。朝有限目的裝置轉變之另一消費者消費模式包括散佈至多個頁面中之文章之消費。呈現者將文章散佈至多個頁面以效仿紙 質作品且產生額外廣告收入。此等文章為使用者提供熟悉格式。另外,所添加之特徵結構(諸如,修改字型屬性)與傳統媒體源(諸如,紙質作品)相比改進使用者互動性。然而,呈現文章之應用程式不能重新組合文章之內容以匹配呈現文件之裝置之顯示器大小限制。顯示器大小限制可由於顯示文章之小部分且迫使使用者不停地翻捲以到達所要內容而給使用者帶來不便。涉及多個使用者動作之大範圍翻捲動作可抑制消費流且在消費文章時削弱使用者體驗。
提供此【發明內容】以用簡化形式介紹一系列概念,將在下文之【實施方式】中進一步描述該等概念。此【發明內容】不意欲專門識別所主張標的之關鍵特徵結構或基本特徵結構,且亦不意欲協助決定所主張標的之範疇。
實施例係關於使用頁鏈以合併文章的頁面。根據一些實施例,一內容應用程式可擷取文章之初始頁面。文章可係遍佈於多個網頁之網路文章。應用程式可偵測初始頁面內用於文章之隨後頁面之頁鏈。頁鏈可係基於超文字標示語言(HTML)的超鏈接,以提供隨後頁面之位址。
接下來,可使用該頁鏈擷取隨後頁面。可經由儲存於頁鏈內之位址存取隨後頁面。另外,可將隨後頁面及初始頁面附加成文章匯總。可呈現該文章匯總以供消費。
在閱讀以下詳細描述及觀察關聯圖式之後將明白此等及其他特徵結構及優點。應理解,以上之一般性描述及以下之詳細描述係解釋性的且不限制如所主張之態樣。
100‧‧‧圖
102‧‧‧雲代管平臺
104‧‧‧裝置
110‧‧‧使用者
112‧‧‧初始頁面
200‧‧‧圖
202‧‧‧裝置
204‧‧‧初始頁面
206‧‧‧前一頁面控制
208‧‧‧超鏈接
210‧‧‧下一頁面控制
300‧‧‧圖
302‧‧‧裝置
304‧‧‧隨後頁面
306‧‧‧前一頁面控制
308‧‧‧超鏈接
310‧‧‧下一頁面控制
400‧‧‧圖
402‧‧‧裝置
404‧‧‧文章匯總
510‧‧‧網路
511‧‧‧客戶端裝置/膝上型計算機
512‧‧‧客戶端裝置/平板裝置
513‧‧‧客戶端裝置/智慧型電話
514‧‧‧伺服器
516‧‧‧伺服器
518‧‧‧資料庫伺服器
519‧‧‧資料儲存器
600‧‧‧計算裝置
602‧‧‧處理單元
604‧‧‧系統記憶體
605‧‧‧作業系統
606‧‧‧程式模組
608‧‧‧虛線
609‧‧‧可移除式儲存器
610‧‧‧不可移除式儲存器
612‧‧‧輸入裝置
614‧‧‧輸出裝置
616‧‧‧通訊連接
618‧‧‧其他裝置
622‧‧‧內容應用程式
624‧‧‧合併演算法
700‧‧‧程序
710‧‧‧操作
720‧‧‧操作
730‧‧‧操作
740‧‧‧操作
750‧‧‧操作
第1圖圖示根據一些實施例之使用頁鏈以合併文章的頁面之示例性概念圖;第2圖圖示根據實施例偵測文章之初始頁面內之頁鏈之實例;第3圖圖示根據實施例偵測文章之隨後頁面內之頁鏈之實例;第4圖圖示根據實施例合併文章之初始頁面與隨後頁面之實例;第5圖係其中可實施根據實施例之系統之網路環境;第6圖係其中可實施實施例之示例性計算操作環境之方塊圖;及第7圖圖示根據實施例用於使用頁鏈以合併文章的頁面之程序之邏輯流程圖。
如上文簡要地描述,可使用頁鏈以合併文章的頁面。內容應用程式可擷取文章之初始頁面且偵測初始頁面內文章之隨後頁面之鏈接。可使用鏈接擷取隨後頁面且可將初始頁面及隨後頁面附加成文章匯總。可呈現該文章匯總以供消費。
在以下之詳細描述中,參照形成詳細描述之一部分之附圖,且在該附圖中經由說明方式圖示特定實施例或實例。在不背離本揭示案之精神或範疇之情況下可組合此等態 樣,可利用其他態樣且可做出結構性改變。因而以下之詳細描述不被視為具有限制意義,且本揭示案之範疇由隨附申請專利範圍及其等效物來界定。
儘管將在結合在計算裝置上之作業系統上執行之應用程式來執行之程式模組之一般性上下文中描述實施例,但熟習此項技術者將認識到亦可結合其他程式模組實施態樣。
一般而言,程式模組包括執行特定任務或實施特定 抽象資料類型之常式、程式、組件、資料結構及其他類型之結構。此外,熟習此項技術者將瞭解,實施例可經由其他電腦系統配置(包括手持式裝置、多處理器系統、基於微處理器或可程式化消費電子產品、微型電腦、大型電腦及類似計算裝置)實踐。實施例亦可在分散式計算環境中實踐,在該分散式計算環境中由經由通訊網路鏈接之遠端處理裝置執行任務。在分散式計算環境中,程式模組可位於本端及遠端記憶體儲存裝置中。
實施例可實施為電腦實施之程序(方法)、計算系統或為製品(諸如,電腦程式產品或電腦可讀取媒體)。電腦程式產品可係可由電腦系統讀取且編碼包含用於致使電腦或計算系統執行一或更多個示例性程序之指令之電腦程式之電腦儲存媒體。電腦可讀取儲存媒體係電腦可讀取記憶體裝置。舉例而言,可經由揮發性電腦記憶體、非揮發性記憶體、硬碟機、快閃驅動器、軟磁碟或壓縮磁碟及類似媒體中的一或多個來實施電腦可讀取儲存媒體。
貫穿此說明書中,術語「平臺」可係用於使用頁鏈 以合併文章的頁面之軟體及硬體組件之組合。平臺之實例包括(但不限於)經由複數個伺服器執行之代管服務、在單個計算裝置上執行之應用程式及類似系統。術語「伺服器」泛指通常在網路環境中執行一或更多個軟體程式之計算裝置。然而,伺服器亦可實施為在一或更多個計算裝置上執行之虛擬伺服器(軟體程式),該虛擬伺服器被看作網路上之伺服器。下文提供有關此等技術及示例性操作之更多細節。
第1圖圖示根據一些實施例之使用頁鏈以合併文章的頁面之示例性概念圖。在圖100中圖示之組件及環境是出於說明目的。實施例可在使用多種計算裝置及系統、硬體及軟體之各種本端、網路、基於雲及類似計算環境中實施。
裝置104可由於使用者110之動作經由內容應用程式顯示文章之初始頁面112。該文章可散佈至可經由稱為頁鏈之控制存取之多個頁面。該文章可經由標準化格式(諸如,超文字標示語言(HTML))呈現為網頁。頁鏈可包括超鏈接或頁面控制。回應於啟動,可執行與頁面控制關聯之操作以顯示隨後頁面。另外,頁鏈可包括隨後頁面之位址。
裝置104可與外部資源(諸如,雲代管平臺102)通訊以呈現初始頁面112。在示例性情境中,裝置104可自外部資源擷取初始頁面112及隨後頁面。雲代管平臺102可包括遠端資源,諸如資料儲存器及內容伺服器。初始頁面112可係散佈至多個頁面中之文章的一部分。可分析初始頁面112以判定與隨後頁面關聯之頁鏈。
實施例不局限於裝置104(諸如,平板)中之實施。 根據實施例之內容應用程式可係在能夠顯示應用程式之任何裝置中執行之本端應用程式。或者,內容應用程式可係在經由客戶端使用者介面(諸如,網頁瀏覽器)顯示應用程式內容的同時可在伺服器中執行之代管應用程式(諸如,網路服務)。除支持觸摸之裝置104之外,亦可經由其他輸入機構(諸如,光學手勢捕獲、陀螺儀輸入裝置、滑鼠、鍵盤、眼睛追蹤輸入及基於類似軟體及/或硬體之技術)完成與初始頁面112之互動。
第2圖圖示根據實施例偵測文章之初始頁面內之頁鏈之實例。圖200顯示裝置202(諸如,平板)內之內容應用程式。內容應用程式可顯示包括至隨後頁面之頁鏈的文章之初始頁面。
內容應用程式可分析初始頁面204以偵測初始頁面204內之頁鏈。可使用標準化格式(諸如,HTML)將初始頁面204格式化。內容應用程式可解析初始頁面204之HTML源以判定候選頁鏈清單。可在超鏈接或頁面控制中找尋頁鏈。可自所偵測到的頁鏈(包括前一頁面控制206、超鏈接208及下一頁面控制210)產生候選頁鏈清單。可自每一候選頁鏈擷取位址。可偵測具有包括統一資源定位器(URL)格式化位址之標準化格式之位址。與候選頁鏈關聯之位址中之一或更多者可與隨後頁面關聯。
根據一些實施例,內容應用程式可自候選清單移除不匹配頁鏈。應用程式可藉由找尋關於代管文章之一資源外部之一資源之頁鏈中之位址來判定不匹配頁鏈。實例可包括 具有一外部網站之URL位址之頁鏈。
內容應用程式亦可評價頁鏈之位址之大小以與預定大小臨限值比較。回應於判定頁鏈之位址超過預定大小臨限值,可決定關聯頁鏈係不匹配頁鏈。另外,判定具有初始頁面204之位址之頁鏈係不匹配頁鏈。此外,判定具有隱藏元素之任何頁鏈係不匹配頁鏈。隱藏元素之實例可包括HTML指令,諸如「display:none」、「display:hidden」及類似物。
根據其他實施例,內容應用程式可解析來自頁鏈之頁面識別碼(PageId)。PageId可係編號,諸如頁面編號。或者,PageId可涵蓋頁面編號。回應於判定具有編號之頁鏈的PageId係初始頁面204之PageId之一增量,內容應用程式可判定與隨後頁面關聯之頁鏈。
根據其他實施例,內容應用程式可將候選頁鏈集中在一起。具有匹配位址之多個頁鏈可被看作關於文章之多個頁面之一者。此外,可將權重演算法應用於每一候選頁鏈以分配與隨後頁面關聯之權重計分。可基於權重計分來將每一候選頁鏈排序。可判定具有高於其他候選頁鏈之權重計分之候選頁鏈與隨後頁面關聯。可選擇權重計分最高之候選頁鏈作為關於隨後頁面之頁鏈。權重計分最高之候選頁鏈可用於擷取隨後頁面。可將隨後頁面附加至初始頁面204以形成用於呈現之文章匯總。
第3圖圖示根據實施例偵測文章之隨後頁面內之頁鏈之實例。圖300顯示裝置302,該裝置302經由內容應用程式顯示隨後頁面。
根據一些實施例,隨後頁面可係與由內容應用程式顯示之文章之初始頁面關聯之下一頁面或前一頁面。內容應用程式可提供前一頁面控制306及下一頁面控制310以執行與後續之隨後頁面關聯之操作。回應於前一頁面控制306之啟動,應用程式可顯示初始頁面。或者,應用程式可回應於下一頁面控制310或超鏈接308之啟動而顯示後續之隨後頁面。前一頁面控制306、超鏈接308及下一頁面控制310可包括關於與該頁面控制或該超鏈接關聯之文章之頁面之位址(諸如,URL位址)。
內容應用程式可將權重演算法應用於候選頁鏈。權重演算法可具有兩個步驟。第一步驟可涉及判定該位址內之隨後頁面術語(包括「下一」、「下一頁面」及類似者)。可為包括隨後頁面術語之頁鏈指派與缺乏該術語之其他頁鏈相比增加的權重計分。第二步驟可包括針對PageId方面分析頁鏈。可為包括PageId之頁鏈計與缺乏PageId之其他頁鏈相比高的權重計分。
可將基於隨後頁面術語之權重計分與基於PageId之權重計分相加以判定頁鏈之總權重計分。可基於各別總權重計分將每一候選頁鏈排序。在經排序清單之頂端位置處之候選頁鏈可被選作用於與呈現於裝置302上之隨後頁面304關聯之後續之隨後頁面之頁鏈。
第4圖圖示根據實施例合併文章之初始頁面與隨後頁面之一實例。圖400顯示呈現文章匯總之裝置402。
內容應用程式可擷取初始頁面204及隨後頁面304 且將其內容附加以形成文章匯總404。內容應用程式可過濾初始頁面204及隨後頁面304以在附加初始頁面204及隨後頁面304之前移除非核心元素(包括廣告、圖形、影像、導航控制及類似者)。內容應用程式可經由涵蓋頁面之主體片段之主體標籤來判定初始頁面204及隨後頁面304之主體片段。可使用標準化格式(諸如,HTML)將主體片段格式化。
可將隨後頁面304之主體片段之文字附加至初始頁面204之主體片段之文字以形成文章匯總404。可由內容應用程式將文章匯總404呈現於裝置402上。可提供滾動條以導航文章匯總。另外,可改變文章匯總之字體屬性以使文章匯總適合於裝置402之螢幕大小內。或者,可在無任何修改或過濾之情況下將初始頁面204附加至隨後頁面304。可藉由內容應用程式將所得之文章匯總顯示於裝置402上。
圖示第2圖至第4圖中之具有特定組件、資料類型及配置之示例性情境及圖解。實施例不局限於根據此等示例性配置之系統。可以用在應用程式及使用者介面中使用較少或額外組件之配置來實施使用頁鏈以合併文章的頁面。此外,可以與使用本文描述之原則之其他值類似之方式來實施在第2圖至第4圖中圖示之示例性圖解及組件及其子組件。
第5圖係其中可實施根據實施例之系統之網路環境。可由一或更多個伺服器514或單個伺服器(例如,網頁伺服器)516來提供本端及遠端資源(諸如,代管服務)。應用程式可在個別計算裝置(諸如,智慧型電話513、平板裝置512或膝上型電腦511(「客戶端裝置」))上執行且擷取意 欲經由一或更多個網路510顯示之文章之頁面。
如上文所論述,可使用頁鏈以合併文章的頁面。內容應用程式可擷取文章之初始頁面且在初始頁面內偵測文章之隨後頁面之頁鏈。可使用該頁鏈擷取隨後頁面。可將初始頁面及隨後頁面附加成文章匯總以用於呈現。如先前所論述,客戶端裝置511-513可使得能夠存取在一或更多個遠端伺服器(例如,伺服器514之一者)上執行之應用程式。一或更多個伺服器可直接自一或更多個資料儲存器519或經由資料庫伺服器518自該一或更多個資料儲存器519擷取有關資料或將該有關資料直接儲存至或將該有關資料經由資料庫伺服器518儲存至該一或更多個資料儲存器519。
一或更多個網路510可包含伺服器、客戶端、網際網路服務提供者及通訊媒體之任何拓撲。根據實施例之系統可具有靜態或動態拓撲。一或更多個網路510可包括安全網路(諸如,企業網路)、不安全網路(諸如,無線開放網路)或網際網路。一或更多個網路510亦可協調經由其他網路(諸如,公眾交換電話網路(PSTN)或蜂巢式網路)之通訊。此外,一或更多個網路510可包括短程無線網路,諸如藍芽或類似者。一或更多個網路510在本文描述之節點之間提供通訊。藉由舉例而非限制之方式,一或更多個網路510可包括無線媒體,諸如聲學、RF、紅外及其他無線媒體。
計算裝置、應用程式、資料資源及資料分配系統之諸多其他配置可用於使用頁鏈以合併文章的頁面。此外,在第5圖中論述之網路環境僅出於說明目的。實施例不局限於 示例性應用程式、模組或程序。
第6圖及相關論述意欲提供對其中可實施實施例之適合的計算環境之一般性簡要描述。參照第6圖,圖示根據實施例之應用程式之示例性計算操作環境(諸如計算裝置600)之方塊圖。在基本配置中,計算裝置600可包括至少一個處理單元602及系統記憶體604。計算裝置600亦可包括在執行程式中協作之複數個處理單元。取決於計算裝置之精確配置及類型,系統記憶體604可係揮發性的(諸如,RAM)、非揮發性的(諸如,ROM、快閃記憶體等)或兩者之某一組合。系統記憶體604通常包括適於控制平臺之操作之作業系統605,諸如購自美國華盛頓州雷德蒙德市微軟公司的WINDOWS®及WINDOWS PHONE®作業系統。系統記憶體604亦可包括一或更多個軟體應用程式,諸如程式模組606、內容應用程式622及合併演算法624。
內容應用程式622可擷取文章之初始頁面。內容應用程式622可在初始頁面內偵測文章之隨後頁面之頁鏈。內容應用程式可使用頁鏈擷取隨後頁面且合併演算法624可附加初始頁面及隨後頁面以形成文章匯總。內容應用程式622可就近地在裝置600之螢幕中呈現文章匯總。在第6圖中藉由虛線608內之彼等組件圖示此基本配置。
計算裝置600可具有額外特徵結構或功能。舉例而言,計算裝置600亦可包括額外資料儲存裝置(可移除式及/或不可移除式),諸如(舉例而言)磁碟、光碟或磁帶。在第6圖中藉由可移除式儲存器609及不可移除式儲存器610 圖示此等額外儲存器。電腦可讀取儲存媒體可包括以用於儲存資訊(諸如,電腦可讀取指令、資料結構、程式模組或其他資料)之任何方法或技術實施之揮發性及非揮發性、可移除式及不可移除式媒體。電腦可讀取儲存媒體係電腦可讀取記憶體裝置。系統記憶體604、可移除式儲存器609及不可移除式儲存器610係電腦可讀取儲存媒體之全部實例。電腦可讀取儲存媒體包括(但不限於)RAM、ROM、EEPROM、快閃記憶體或其他記憶體技術、CD-ROM、數位化通用光碟(DVD)或其他光學儲存器、磁帶盒、磁帶、磁碟儲存器或其他磁性儲存裝置,或可用於儲存所要資訊且可由計算裝置600存取之任何其他媒體。任何此類電腦可讀取儲存媒體可係計算裝置600的一部分。計算裝置600亦可具有一或更多個輸入裝置612,諸如鍵盤、滑鼠、筆、聲音輸入裝置、觸摸輸入裝置及類似輸入裝置。亦可包括一或更多個輸出裝置614,諸如顯示器、揚聲器、列印機及其他類型之輸出裝置。此等裝置在此項技術中係熟知的且在本文中不需長篇論述。
計算裝置600亦可含有允許裝置(諸如)經由分散式計算環境、衛星鏈路、蜂巢式鏈路及類似機構中之無線網路與其他裝置618通訊之通訊連接616。其他裝置618可包括執行通訊應用程式之一或更多個電腦裝置、儲存伺服器及類似裝置。一或更多個通訊連接616係通訊媒體之一個實例。通訊媒體可包括在其中之電腦可讀取指令、資料結構、程式模組或經調變資料信號(諸如,載波或其他傳送機構)中之其他資料且包括任何資訊傳遞媒體。術語「經調變資料信號」 意指具有其特徵集合中之一或更多者或以關於在信號中編碼資訊之方式改變之信號。藉由舉例而非限制之方式,通訊媒體包括有線媒體(諸如,有線網路或直接有線連接),以及無線媒體(諸如,聲學、RF、紅外及其他無線媒體)。
示例性實施例亦包括方法。可以任何數目個方式(包括在此文件中描述之結構)實施此等方法。一種此類方法係藉由在此文件中描述之類型之裝置的機器操作。
另一可選方式係針對與執行一些操作之一或更多個操作員協力執行之方法之個別操作中之一或更多者。此等操作員不必互相同地協作,而是每一操作員可僅藉由執行程式之一部分之機器。
第7圖圖示根據實施例使用頁鏈以合併文章的頁面之程序之邏輯流程圖。在一些實例中,程序700可藉由內容應用程式實施。
程序700可開始於其中內容應用程式可擷取文章之第一頁面之操作710。文章可係標準化格式(諸如,HTML)且可散佈至多個頁面。在操作720處,可在第一頁面內偵測文章之第二頁面之頁鏈。頁鏈可包括超鏈接或頁面控制。超鏈接及頁面控制可包括關於第二頁面之位置之位址元素。
接下來,在操作730處,可使用頁鏈擷取第二頁面。可使用頁面之位置查詢資源以找尋第二頁面。可回應於定位第二頁面之肯定判定來擷取第二頁面。另外,在操作740處,可將第一頁面及第二頁面附加成文章匯總。內容應用程式可自包括廣告、註解、導航控制及類似者之文章匯總移除非核 心元素。在操作750處,呈現文章匯總。
可在包括通訊模組、記憶體及處理器之計算裝置中實施一些實施例,其中處理器結合儲存在記憶體中之指令執行如上所述之方法或類似者。其他實施例可實施為具有儲存於其上之用於執行如上所述之方法或類似者之指令之電腦可讀取儲存媒體。
包括在程序700中之操作是出於說明目的。根據實施例之使用頁鏈以合併文章的頁面可藉由具有較少或額外步驟之類似程序以及使用本文描述之原則之不同操作次序實施。
以上說明、實例及資料提供實施例之成分之製造及使用之完整描述。儘管已經以特定於結構性特徵結構及/或方法論行為之語言描述了標的,但應瞭解,在隨附申請專利範圍中定義之標的不必限於如上所述之特定特徵結構或行為。更確切而言,如上所述之該等特定特徵結構及行為揭示為實施申請專利範圍及實施例之示例性形式。
400‧‧‧圖
402‧‧‧裝置
404‧‧‧文章匯總

Claims (20)

  1. 一種在一計算裝置上執行之用於使用頁鏈以合併文章的頁面之方法,該方法包含以下步驟:擷取一文章之一第一頁面;在該第一頁面內偵測該文章之一第二頁面之一頁鏈;使用該頁鏈擷取該第二頁面;將該第一頁面與該第二頁面附加成一文章匯總;及顯示該文章匯總。
  2. 如請求項1所述之方法,其進一步包含以下步驟:在以下之至少一者中找尋該頁鏈:一超鏈接及一頁面控制。
  3. 如請求項1所述之方法,其進一步包含以下步驟:從自該第一頁面擷取之一候選頁鏈清單判定該頁鏈;及從來自該等候選頁鏈之一第一鏈接擷取一位址。
  4. 如請求項3所述之方法,其進一步包含以下步驟:判定該位址係指向一外部資源;及自該清單移除該第一鏈接。
  5. 如請求項3所述之方法,其進一步包含以下步驟:藉由比較該位址之一大小與一預定大小臨限值來評估該位址之該大小;及 回應於判定該位址之該大小超過該預定大小臨限值,自該清單移除該第一鏈接。
  6. 如請求項3所述之方法,其進一步包含以下步驟:判定該位址包括一隱藏元素;及自該清單移除該第一鏈接。
  7. 如請求項3所述之方法,其進一步包含以下步驟:判定該第一頁面內之一第一頁面識別碼(PageId);及解析來自該第一PageId之對應於該第一頁面之一頁面編號之一第一編號。
  8. 如請求項7所述之方法,其進一步包含以下步驟:偵測該第一鏈接中之一第二PageId;解析來自該第二PageId之對應於另一頁面編號之一第二編號;判定該第二編號係該第一編號之一增量;及指派該第一鏈接作為該頁鏈。
  9. 如請求項3所述之方法,其進一步包含以下步驟:偵測具有包括一統一資源定位器(URL)格式化位址之標準化格式之該位址。
  10. 如請求項3所述之方法,其進一步包含以下步驟: 判定該位址係指向與該第一鏈接關聯之另一頁面之一位置。
  11. 如請求項10所述之方法,其進一步包含以下步驟:自該等候選頁鏈擷取一第二鏈接之另一位址;判定該位址與另一位址匹配;及將該第一鏈接與該第二鏈接在該清單中集合在一起。
  12. 一種用於使用頁鏈以合併文章的頁面之計算裝置,該計算裝置包含:一記憶體,其經配置以儲存指令;及一處理器,其耦合至該記憶體,該處理器結合儲存在該記憶體中之指令執行一內容應用程式,其中該應用程式經配置以:擷取一文章之一第一頁面;在以下之至少一者中偵測該第一頁面內之該文章之一第二頁面之一頁鏈:一超鏈接及一頁面控制;使用該頁鏈擷取該第二頁面;將該第一頁面與該第二頁面附加成一文章匯總;及顯示該文章匯總。
  13. 如請求項12所述之計算裝置,其中該應用程式進一步經配置以:從自該第一頁面擷取之一候選頁鏈清單判定該頁鏈;及 將一權重計分應用於自該等候選頁鏈之一第一鏈接。
  14. 如請求項13所述之計算裝置,其中該應用程式進一步經配置以:自該第一鏈接擷取一位址;判定該位址內之一隨後頁面術語包括以下之至少一者:「下一」及「下一頁面」;及將比指派給來自該等候選頁鏈之缺乏一隨後頁面術語之一第二鏈接之一權重計分高之另一權重計分指派給該第一鏈接。
  15. 如請求項13所述之計算裝置,其中該應用程式進一步經配置以:針對一頁面識別碼(PageId)方面來分析該第一鏈接;及將比指派給來自該等候選頁鏈之缺乏一PageId之一第二鏈接之一權重計分高之另一權重計分指派給該第一鏈接。
  16. 如請求項15所述之計算裝置,其中該應用程式進一步經配置以:將該第一鏈接與該第二鏈接之該等權重計分相加以計算一總權重計分;及基於指派給該第一鏈接之該權重計分及該總權重計分,將該清單內之該第一鏈接排序。
  17. 如請求項16所述之計算裝置,其中該應用程式進一步經配置以:指派來自該清單之一頂端候選頁鏈作為該頁鏈。
  18. 一種具有儲存在其上之用於使用頁鏈以合併文章的頁面之指令之電腦可讀取記憶體裝置,該等指令包含:擷取一文章之一第一頁面;在以下之至少一者中偵測該第一頁面內之該文章之一第二頁面之一頁鏈:一超鏈接及一頁面控制;從自該第一頁面擷取之一候選頁鏈清單判定該頁鏈;將一權重計分應用於該等候選頁鏈中之每一者以將該清單內之該等候選頁鏈排序;將來自該清單之一頂端候選頁鏈指派作為該頁鏈;使用該頁鏈擷取該第二頁面;將該第一頁面與該第二頁面附加成一文章匯總;及顯示該文章匯總。
  19. 如請求項18所述之電腦可讀取記憶體裝置,其中該等指令進一步包含:自該第一頁面擷取一標題;自所顯現之頁面擷取用於該第一頁面之一第一主要內容;基於一檢索命令擷取用於一下一頁面之一第二主要內容,該第二主要內容不同於該第一主要內容;及 附加該標題、該第一主要內容及該第二主要內容以形成該文章匯總。
  20. 如請求項18所述之電腦可讀取記憶體裝置,其中該等指令進一步包含:在附加該第一頁面與該第二頁面之前過濾該第一頁面及該第二頁面以移除包括以下之至少一者之非核心元素:一廣告、一圖形、一影像及一導航控制。
TW103129010A 2013-09-27 2014-08-22 使用頁鏈以合倂文章的頁面 TW201523423A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US14/040,544 US20150095751A1 (en) 2013-09-27 2013-09-27 Employing page links to merge pages of articles

Publications (1)

Publication Number Publication Date
TW201523423A true TW201523423A (zh) 2015-06-16

Family

ID=51690460

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103129010A TW201523423A (zh) 2013-09-27 2014-08-22 使用頁鏈以合倂文章的頁面

Country Status (4)

Country Link
US (1) US20150095751A1 (zh)
AR (1) AR099272A1 (zh)
TW (1) TW201523423A (zh)
WO (1) WO2015047964A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160140086A1 (en) * 2014-11-19 2016-05-19 Kobo Incorporated System and method for content repagination providing a page continuity indicium while e-reading

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5930777A (en) * 1997-04-15 1999-07-27 Barber; Timothy P. Method of charging for pay-per-access information over a network
US6016494A (en) * 1997-11-21 2000-01-18 International Business Machines Corporation Expanding web documents by merging with linked documents
US7171439B2 (en) * 2002-06-14 2007-01-30 Integrated Device Technology, Inc. Use of hashed content addressable memory (CAM) to accelerate content-aware searches
US20040237037A1 (en) * 2003-03-21 2004-11-25 Xerox Corporation Determination of member pages for a hyperlinked document with recursive page-level link analysis
US20050071310A1 (en) * 2003-09-30 2005-03-31 Nadav Eiron System, method, and computer program product for identifying multi-page documents in hypertext collections
US8392823B1 (en) * 2003-12-04 2013-03-05 Google Inc. Systems and methods for detecting hidden text and hidden links
US8204897B1 (en) * 2008-09-09 2012-06-19 Google Inc. Interactive search querying
JP5469244B2 (ja) * 2009-06-30 2014-04-16 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. 選択的なコンテンツ抽出
US8468143B1 (en) * 2010-04-07 2013-06-18 Google Inc. System and method for directing questions to consultants through profile matching

Also Published As

Publication number Publication date
US20150095751A1 (en) 2015-04-02
WO2015047964A1 (en) 2015-04-02
AR099272A1 (es) 2016-07-13

Similar Documents

Publication Publication Date Title
US10762277B2 (en) Optimization schemes for controlling user interfaces through gesture or touch
US8234370B2 (en) Determining web analytics information
RU2662632C2 (ru) Представление документов фиксированного формата в формате с измененной компоновкой
US9311283B2 (en) System for clipping webpages by traversing a dom, and highlighting a minimum number of words
CN110245069B (zh) 页面版本的测试方法和装置、页面的展示方法和装置
EP2932403A2 (en) Appending content with annotation
KR20160125401A (ko) 인라인 및 콘텍스트 인식 쿼리 박스 제공 기법
WO2019089630A1 (en) Providing reporting and analysis for campaign-driven messages and websites
US20150058710A1 (en) Navigating fixed format document in e-reader application
US10210001B2 (en) Automatic execution of objects in a user interface
WO2014093915A2 (en) Content and object metadata based search in e-reader environment
WO2016018682A1 (en) Processing image to identify object for insertion into document
TW201523421A (zh) 決定用於擷取的文章之圖像
TW201523423A (zh) 使用頁鏈以合倂文章的頁面
AU2015231829A1 (en) Asset collection service through capture of content
CN112787880A (zh) 回放数据获取与流量回放方法、设备及存储介质
CN116737747A (zh) 呈现信息的方法和装置
GB2569867A (en) Providing reporting and analysis for campaign-driven messages and websites
US20160139783A1 (en) Detecting sidebar in document
US20170180279A1 (en) Providing interest based navigation of communications