CN106469176A - 一种用于提取文本摘要的方法与设备 - Google Patents

一种用于提取文本摘要的方法与设备 Download PDF

Info

Publication number
CN106469176A
CN106469176A CN201510515872.6A CN201510515872A CN106469176A CN 106469176 A CN106469176 A CN 106469176A CN 201510515872 A CN201510515872 A CN 201510515872A CN 106469176 A CN106469176 A CN 106469176A
Authority
CN
China
Prior art keywords
urtext
text
target
described target
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510515872.6A
Other languages
English (en)
Other versions
CN106469176B (zh
Inventor
张敬相
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510515872.6A priority Critical patent/CN106469176B/zh
Priority to PCT/CN2015/096931 priority patent/WO2017028407A1/zh
Publication of CN106469176A publication Critical patent/CN106469176A/zh
Application granted granted Critical
Publication of CN106469176B publication Critical patent/CN106469176B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明的目的是提供一种用于提取文本摘要的方法与设备。具体地,获取用户关于目标原始文本的阅读操作信息;根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本;根据所述关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。与现有技术相比,本发明通过根据用户关于目标原始文本的关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要,从而使得本发明提取的文本摘要更能突出原始文献的重点,提高了文本摘要的准确度和有效性,相应地,也提升了用户的阅读浏览体验。

Description

一种用于提取文本摘要的方法与设备
技术领域
本发明涉及自动文本摘要技术领域,尤其涉及一种用于提取文本摘要的技术。
背景技术
文摘以简明扼要且语义连贯的语言,确切、准确地记述原始文献的中心内容,极大地节省了人们的阅读时间。现有技术中常常利用计算机,通过诸如将文本作为句子的线性序列、将句子视为词的线性序列等方法,自动地从原始文献中提取文摘,而该等方法对于文本语法、语义及句法的分析及自动摘要常常是基于全文内容或章节相关的段落内容而进行的,并不能很好地突出原始文献的重点。
发明内容
本发明的一个目的是提供一种用于提取文本摘要的方法与设备。
根据本发明的一个方面,提供了一种用于提取文本摘要的方法,其中,该方法包括:
获取用户关于目标原始文本的阅读操作信息;
根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本;
根据所述关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。
根据本发明的另一方面,还提供了一种用于提取文本摘要的摘要提取设备,其中,该摘要提取设备包括:
用于获取用户关于目标原始文本的阅读操作信息的装置;
用于根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本的装置;
用于根据所述关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要的装置。
与现有技术相比,本发明的一个实施例通过根据用户关于目标原始文本的关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要,从而使得本发明提取的文本摘要更能突出原始文献的重点,提高了文本摘要的准确度和有效性,相应地,也提升了用户的阅读浏览体验。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的一种用于提取文本摘要的摘要提取设备的设备示意图;
图2示出根据本发明另一个方面的一种用于提取文本摘要的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的一种用于提取文本摘要的摘要提取设备1的设备示意图,其中,摘要提取设备1包括用于获取用户关于目标原始文本的阅读操作信息的装置(以下简称“操作获取装置11”);用于根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本的装置(以下简称“关注文本确定装置12”);用于根据所述关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要的装置(以下简称“摘要提取装置13”)。
具体地,操作获取装置11获取用户关于目标原始文本的阅读操作信息;关注文本确定装置12根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本;摘要提取装置13根据所述关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。
在此,摘要提取设备1包括但不限于网络设备、用户设备或网络设备与用户设备通过网络相集成所构成的设备。在此,所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现;或者由用户设备实现。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在此,所述用户设备可以是任何一种可与用户通过键盘、鼠标、触摸板、触摸屏、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、智能手机、PDA、可穿戴设备、掌上电脑PPC或平板电脑等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。本领域技术人员应能理解上述摘要提取设备1仅为举例,其他现有的或今后可能出现的网络设备或用户设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,网络设备及用户设备均包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。
具体地,操作获取装置11通过调用用户设备自身提供的应用程序接口(API),或者,通过文库等阅读APP提供的应用程序接口(API),获取用户关于目标原始文本的阅读操作信息。
在此,所述目标原始文本可以是文章、文献、新闻、小说等任何体裁的以文字为主要描述手段而独立成篇的内容。
在此,所述阅读操作信息是指用户在阅读所述目标原始文本过程中表现或执行的阅读相关操作信息,诸如设置阅读模式、更改阅读模式、停留页面、段落内容收藏等。优选地,所述阅读操作信息包括但不限于以下至少任一项:
-所述用户阅读所述目标原始文本过程中执行的停留操作;
-所述用户阅读所述目标原始文本过程中执行的收藏相关操作;
-所述用户阅读所述目标原始文本过程中的阅读模式信息;
-所述用户阅读所述目标原始文本过程中的阅读速度。
在此,所述收藏相关操作包括但不限于如复制、收藏、分享等操作。在具体实施例中,若用户在阅读文档过程中执行了收藏相关操作,说明用户对收藏的内容部分关注度较高,在一定程度上也说明了用户收藏的内容部分是文档的重要内容。
在此,所述阅读模式信息包括但不限于:1)浏览模式,即以快于正常阅读速度的、每次翻多页;2)阅读模式,即以正常阅读速度的、每次翻一页;3)关键词搜索模式,该模式下用户可通过套索(Lasso)触摸操作以对应选中内容为关键词进行搜索,该搜索可以是转至搜索引擎进行搜索,也可以是在用户正在阅读的文章中进行搜索。在此,所述套索触摸操作的“套索”的功能,是指用户通过与触摸输入装置接触的手指在网页上的任何一个或多个单词的周围画一个圈,或者任何预定义的其它圈中操作,即可对选定内容进行搜索;其中,所述套索触摸操作包括但不限于画圈操作、括弧操作,本领域技术人员应能理解上述套索触摸操作仅为举例,其他现有的或今后可能出现的套索触摸操作如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。例如,用户正在阅读《人间词话》中在词的境界部分有关“可堪孤馆闭春寒,杜鹃声里斜阳暮”的评述,其可搜索秦观《踏沙行》的词句解析。
本领域技术人员应能理解上述目标原始文本和阅读操作信息仅为举例,其他现有的或今后可能出现的目标原始文本或阅读操作信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
例如,假设用户A通过其ipad2在文库APP中正阅读文章《LTE物理下行控制信道盲检过程研究》,且阅读至其中关于“搜索空间”部分的描述时,用户A通过滑动显示出“搜索空间”部分相应段落的内容后,停留的时间超过预定时间阈值后才进行滑动以继续阅读,则操作获取装置11可通过文库等阅读APP提供的应用程序接口(API),获取到用户A在阅读目标原始文本《LTE物理下行控制信道盲检过程研究》过程中执行的停留操作。
再如,假设用户A在阅读至文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,将当前阅读模式由浏览模式修改为关键词搜索模式,并执行了在其ipad2的触摸屏上执行了用一个手指在词语“CCE”周围画一个圈的触摸操作,则操作获取装置11可通过文库等阅读APP提供的应用程序接口(API),获取到用户A在阅读目标原始文本《LTE物理下行控制信道盲检过程研究》过程中执行的阅读模式更改操作以及搜索操作。
本领域技术人员应能理解上述获取用户关于目标原始文本的阅读操作信息的方式仅为举例,其他现有的或今后可能出现的获取用户关于目标原始文本的阅读操作信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,关注文本确定装置12根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本。
在此,所述关注文本是指用户对所述目标原始文本中关注、感兴趣的段落、词语,其也体现了所述目标原始文本中的重要内容。在具体实施例中,用户在阅读文档中的其关注的内容部分时,通常具有与阅读其他内容部分不一样的表现,如停留时间较长、阅读速度放慢、进行收藏等操作。
在此,关注文本确定装置12确定所述关注文本的方式包括但不限于以下至少任一项:
1)若所述用户阅读操作信息包括所述用户阅读所述目标原始文本过程中的停留操作,则关注文本确定装置12可根据所述用户执行所述停留操作所对应的段落的停留时间,将停留时间大于预定时间阈值的段落作为所述关注文本。
例如,对于用户A,其在阅读至文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,在“搜索空间”部分相应段落如该文章的第[5-7]段停留的时间大于预定时间阈值,则关注文本确定装置12可将文章《LTE物理下行控制信道盲检过程研究》中的第[5-7]段作为所述关注文本。
2)若所述用户阅读所述目标原始文本过程中由所述浏览模式变换为所述关键词搜索模式,则关注文本确定装置12可将所述目标原始文本中在所述关键词搜索模式下被浏览的段落作为所述关注文本。
例如,对于用户A,其在阅读至文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,将当前阅读模式由浏览模式修改为关键词搜索模式,在关键词搜索模式下阅读的“搜索空间”部分对应的段落为该文章的第[5-10]段,则关注文本确定装置12可将文章《LTE物理下行控制信道盲检过程研究》中的第[5-10]段作为所述关注文本。
3)若所述阅读操作信息包括所述用户阅读所述目标原始文本过程中执行的收藏相关操作,则关注文本确定装置12可将所述用户执行所述收藏相关操作所对应的段落,作为所述关注文本。
例如,对于用户A,其在阅读文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,在“搜索空间”部分相应段落如该文章的第[5-7]段中的每一段均执行了收藏操作,则关注文本确定装置12可将文章《LTE物理下行控制信道盲检过程研究》中的第[5-7]段作为所述关注文本。
4)若所述阅读操作信息包括所述用户阅读所述目标原始文本过程中的阅读速度,则关注文本确定装置12可将所述目标原始文本中所述用户以低于预定阅读速度阈值的阅读速度浏览的段落作为所述关注文本。
例如,对于用户A,其在阅读文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,用户A通过滑动操作显示出“搜索空间”部分相应段落的内容如该文章的第[5]段后,停留了20min,才进行滑动以继续阅读该文章的第[6]段,假设该文章第[5]段共有文字400字,则说明用A阅读第[5]段的阅读速度为20字/min,其低于预定阅读速度阈值如500字/min,则关注文本确定装置12可将文章《LTE物理下行控制信道盲检过程研究》中的第[5]段作为所述关注文本。
本领域技术人员应能理解上述确定所述关注文本的方式仅为举例,其他现有的或今后可能出现的确定所述关注文本的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在此,本领域技术人员应当理解,本发明在根据所述阅读操作信息确定所述关注文本时,可根据前述所述阅读操作信息中的任意一项或多项的组合来确定所述关注文本。例如,对于用户A,其在阅读文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,假设“搜索空间”部分的全部内容为该文章的第[5-12]段,用户A阅读第[5]段的阅读速度低于预定阅读速度阈值如500字/min,其在阅读该文章的第[7]段时执行了收藏操作,则关注文本确定装置12可将文章《LTE物理下行控制信道盲检过程研究》中的第[5]段和第[7]段均作为所述关注文本;再如,对于用户A,其在阅读文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,其在阅读该文章的第[7]段时执行了收藏操作,而其在关键词搜索模式下阅读的“搜索空间”部分对应的段落为该文章的第[5-10]段,则关注文本确定装置12可将文章《LTE物理下行控制信道盲检过程研究》中的第[5-10]段作为所述关注文本。
在此,需要说明的是,本发明还可获取多个用户关于目标原始文本的阅读操作信息,进而可得到每一用户关于所述目标原始文本的关注文本,从而本发明可根据每一用户的所述关注文本,确定所述多个用户关于所述目标原始文本的公共关注文本,以作为最终的关注文本,可进一步提高文本摘要的准确度和有效性,也进一步提升了用户的阅读浏览体验。
接着,摘要提取装置13根据所述关注文本,结合所述目标原始文本的内容信息,通过诸如将文本作为句子的线性序列、将句子视为词的线性序列等方法,提取所述目标原始文本的文本摘要。
例如,假设文章《LTE物理下行控制信道盲检过程研究》通过现有技术中的自动文本摘要方法,也即基于全文内容或章节相关的段落内容而得到的文本摘要为“LTE物理下行控制信道为整个系统上下行阐述分配各种资源,对系统起着非常关键的调度作用。基于PDCCH信道发送与接收流程,根据PDCCH信道结构,详细分析了信道的调度 过程,为终端PDCCH信道接收制定了一种详细的盲检方法,为LTE系统的实际实现提供了理论依据”,而摘要提取装置13根据关注文本确定装置12确定的所述关注文本,如“搜索空间”部分对应的第[5-10]段,结合所述目标原始文本的内容信息,通过诸如将文本作为句子的线性序列、将句子视为词的线性序列等方法,提取得到文章《LTE物理下行控制信道盲检过程研究》的文本摘要为“LTE物理下行控制信道为整个系统上下行阐述分配各种资源,对系统起着非常关键的调度作用。基于PDCCH信道发送与接收流程,根据PDCCH信道结构,详细分析了信道的调度过程、专用搜索空间和公共搜索空间,为终端PDCCH信道接收制定了一种详细的盲检方法,为LTE系统的实际实现提供了理论依据”。
在此,本发明提取的文本摘要不同于现有技术中得到文本摘要,相对于现有技术,本发明提取的文本摘要更能突出原始文献的重点,提高了文本摘要的准确度和有效性,相应地,也提升了用户的阅读浏览体验。
摘要提取设备1的各装置之间是持续不断工作的。具体地,操作获取装置11持续获取用户关于目标原始文本的阅读操作信息;关注文本确定装置12持续根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本;摘要提取装置13持续根据所述关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。在此,本领域技术人员应当理解所述“持续”是指摘要提取设备1的各个装置之间分别不断地进行阅读操作信息的获取、关注文本的确定与文本摘要提取,直至摘要提取设备1在较长时间内停止获取阅读操作信息。
优选地,若所述用户阅读所述目标原始文本过程中的停留时间大于预定阈值的段落为多个,或者,若所述目标原始文本中在所述关键词搜索模式下被浏览的段落为多个,其中,摘要提取设备1还包括:用于根据多个所述段落之间的内容关联度,从所述多个段落中确定优选关注文本的装置(以下简称“优选确定装置”,未示出),其中,摘要提取装置13根据所述优选关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。
例如,对于文章《LTE物理下行控制信道盲检过程研究》,用户A在阅读该文章过程中停留时间大于预定阈值的段落为该文章的第[5-7]段,假设第[5-6]段的内容分别为专用搜索空间和公共搜索空间,而第[7]段的内容为盲检过程,则第[7]段的内容与第[5-6]段的内容之间的关联度比较小,则优选确定装置可确定第[5-6]段作为优选关注文本。
接着,摘要提取装置13根据所述优选关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。在此,摘要提取装置13根据所述优选关注文本,结合所述目标原始文本的内容信息,提取所述文本摘要的方式与前述摘要提取装置13根据所述关注文本,结合所述目标原始文本的内容信息,提取所述文本摘要的方式相同或基本相同,为简明起见,故在此不再赘述,并以引用的方式包含与此。
在此,本发明通过根据优选关注文本,结合所述目标原始文本的内容信息,来提取文本摘要,使得本发明提取的文本摘要更一步突出原始文献的重点,提高文本摘要的准确度和有效性,提升用户的阅读浏览体验。
优选地,所述阅读操作信息还包括所述用户关于所述目标原始文本的历史阅读记录,其中,关注文本确定装置12根据所述历史阅读记录,确定所述关注文本。
优选地,所述历史阅读记录包括以下至少任一项:
-所述用户关于所述目标原始文本中段落的历史阅读频率信息;
-所述用户关于所述目标原始文本中段落的历史阅读平均时长。
例如,对于文章《LTE物理下行控制信道盲检过程研究》,假设用户A关于该文章的历史阅读记录中,经常阅读该文章中的第[5-6]段的内容,则关注文本确定装置12根据该历史阅读记录,确定所述关注文本为该文章的第[5-6]段。
再如,对于用户A,假设其关于文章《LTE物理下行控制信道盲检过程研究》的历史阅读记录中,对第[6]段的历史阅读平均时长超过预定阈值,则关注文本确定装置12根据该历史阅读记录,确定所述关注文本为该文章的第[6]段。
图2示出根据本发明另一个方面的一种用于提取文本摘要的方法流程图。
其中,该方法包括步骤S1、步骤S2和步骤S3。具体地,在步骤S1中,摘要提取设备1获取用户关于目标原始文本的阅读操作信息;在步骤S2中,摘要提取设备1根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本;在步骤S3中,摘要提取设备1根据所述关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。
在此,摘要提取设备1包括但不限于网络设备、用户设备或网络设备与用户设备通过网络相集成所构成的设备。在此,所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现;或者由用户设备实现。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。在此,所述用户设备可以是任何一种可与用户通过键盘、鼠标、触摸板、触摸屏、或手写设备等方式进行人机交互的电子产品,例如计算机、手机、智能手机、PDA、可穿戴设备、掌上电脑PPC或平板电脑等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc网络)等。本领域技术人员应能理解上述摘要提取设备1仅为举例,其他现有的或今后可能出现的网络设备或用户设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。在此,网络设备及用户设备均包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程门阵列(FPGA)、数字处理器(DSP)、嵌入式设备等。
具体地,在步骤S1中,摘要提取设备1通过调用用户设备自身提供的应用程序接口(API),或者,通过文库等阅读APP提供的应用程序接口(API),获取用户关于目标原始文本的阅读操作信息。
在此,所述目标原始文本可以是文章、文献、新闻、小说等任何体裁的以文字为主要描述手段而独立成篇的内容。
在此,所述阅读操作信息是指用户在阅读所述目标原始文本过程中表现或执行的阅读相关操作信息,诸如设置阅读模式、更改阅读模式、停留页面、段落内容收藏等。优选地,所述阅读操作信息包括但不限于以下至少任一项:
-所述用户阅读所述目标原始文本过程中执行的停留操作;
-所述用户阅读所述目标原始文本过程中执行的收藏相关操作;
-所述用户阅读所述目标原始文本过程中的阅读模式信息;
-所述用户阅读所述目标原始文本过程中的阅读速度。
在此,所述收藏相关操作包括但不限于如复制、收藏、分享等操作。在具体实施例中,若用户在阅读文档过程中执行了收藏相关操作,说明用户对收藏的内容部分关注度较高,在一定程度上也说明了用户收藏的内容部分是文档的重要内容。
在此,所述阅读模式信息包括但不限于:1)浏览模式,即以快于正常阅读速度的、每次翻多页;2)阅读模式,即以正常阅读速度的、每次翻一页;3)关键词搜索模式,该模式下用户可通过套索(Lasso)触摸操作以对应选中内容为关键词进行搜索,该搜索可以是转至搜索引擎进行搜索,也可以是在用户正在阅读的文章中进行搜索。在此,所述套索触摸操作的“套索”的功能,是指用户通过与触摸输入装置接触的手指在网页上的任何一个或多个单词的周围画一个圈,或者任何预定义的其它圈中操作,即可对选定内容进行搜索;其中,所述套索触摸操作包括但不限于画圈操作、括弧操作,本领域技术人员应能理解上述套索触摸操作仅为举例,其他现有的或今后可能出现的套索触摸操作如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。例如,用户正在阅读《人间词话》中在词的境界部分有关“可堪孤馆闭春寒,杜鹃声里斜阳暮”的评述,其可搜索秦观《踏沙行》的词句解析。
本领域技术人员应能理解上述目标原始文本和阅读操作信息仅为举例,其他现有的或今后可能出现的目标原始文本或阅读操作信息如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
例如,假设用户A通过其ipad2在文库APP中正阅读文章《LTE物理下行控制信道盲检过程研究》,且阅读至其中关于“搜索空间”部分的描述时,用户A通过滑动显示出“搜索空间”部分相应段落的内容后,停留的时间超过预定时间阈值后才进行滑动以继续阅读,则在步骤S1中,摘要提取设备1可通过文库等阅读APP提供的应用程序接口(API),获取到用户A在阅读目标原始文本《LTE物理下行控制信道盲检过程研究》过程中执行的停留操作。
再如,假设用户A在阅读至文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,将当前阅读模式由浏览模式修改为关键词搜索模式,并执行了在其ipad2的触摸屏上执行了用一个手指在词语“CCE”周围画一个圈的触摸操作,则在步骤S1中,摘要提取设备1可通过文库等阅读APP提供的应用程序接口(API),获取到用户A在阅读目标原始文本《LTE物理下行控制信道盲检过程研究》过程中执行的阅读模式更改操作以及搜索操作。
本领域技术人员应能理解上述获取用户关于目标原始文本的阅读操作信息的方式仅为举例,其他现有的或今后可能出现的获取用户关于目标原始文本的阅读操作信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S2中,摘要提取设备1根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本。
在此,所述关注文本是指用户对所述目标原始文本中关注、感兴趣的段落、词语,其也体现了所述目标原始文本中的重要内容。在具体实施例中,用户在阅读文档中的其关注的内容部分时,通常具有与阅读其他内容部分不一样的表现,如停留时间较长、阅读速度放慢、进行收藏等操作。
在此,在步骤S2中,摘要提取设备1确定所述关注文本的方式包括但不限于以下至少任一项:
1)若所述用户阅读操作信息包括所述用户阅读所述目标原始文本过程中的停留操作,则在步骤S2中,摘要提取设备1可根据所述用户执行所述停留操作所对应的段落的停留时间,将停留时间大于预定时间阈值的段落作为所述关注文本。
例如,对于用户A,其在阅读至文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,在“搜索空间”部分相应段落如该文章的第[5-7]段停留的时间大于预定时间阈值,则在步骤S2中,摘要提取设备1可将文章《LTE物理下行控制信道盲检过程研究》中的第[5-7]段作为所述关注文本。
2)若所述用户阅读所述目标原始文本过程中由所述浏览模式变换为所述关键词搜索模式,则在步骤S2中,摘要提取设备1可将所述目标原始文本中在所述关键词搜索模式下被浏览的段落作为所述关注文本。
例如,对于用户A,其在阅读至文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,将当前阅读模式由浏览模式修改为关键词搜索模式,在关键词搜索模式下阅读的“搜索空间”部分对应的段落为该文章的第[5-10]段,则在步骤S2中,摘要提取设备1可将文章《LTE物理下行控制信道盲检过程研究》中的第[5-10]段作为所述关注文本。
3)若所述阅读操作信息包括所述用户阅读所述目标原始文本过程中执行的收藏相关操作,则在步骤S2中,摘要提取设备1可将所述用户执行所述收藏相关操作所对应的段落,作为所述关注文本。
例如,对于用户A,其在阅读文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,在“搜索空间”部分相应段落如该文章的第[5-7]段中的每一段均执行了收藏操作,则在步骤S2中,摘要提取设备1可将文章《LTE物理下行控制信道盲检过程研究》中的第[5-7]段作为所述关注文本。
4)若所述阅读操作信息包括所述用户阅读所述目标原始文本过程中的阅读速度,则在步骤S2中,摘要提取设备1可将所述目标原始文本中所述用户以低于预定阅读速度阈值的阅读速度浏览的段落作为所述关注文本。
例如,对于用户A,其在阅读文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,用户A通过滑动操作显示出“搜索空间”部分相应段落的内容如该文章的第[5]段后,停留了20min,才进行滑动以继续阅读该文章的第[6]段,假设该文章第[5]段共有文字400字,则说明用A阅读第[5]段的阅读速度为20字/min,其低于预定阅读速度阈值如500字/min,则在步骤S2中,摘要提取设备1可将文章《LTE物理下行控制信道盲检过程研究》中的第[5]段作为所述关注文本。
本领域技术人员应能理解上述确定所述关注文本的方式仅为举例,其他现有的或今后可能出现的确定所述关注文本的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在此,本领域技术人员应当理解,本发明在根据所述阅读操作信息确定所述关注文本时,可根据前述所述阅读操作信息中的任意一项或多项的组合来确定所述关注文本。例如,对于用户A,其在阅读文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,假设“搜索空间”部分的全部内容为该文章的第[5-12]段,用户A阅读第[5]段的阅读速度低于预定阅读速度阈值如500字/min,其在阅读该文章的第[7]段时执行了收藏操作,则在步骤S2中,摘要提取设备1可将文章《LTE物理下行控制信道盲检过程研究》中的第[5]段和第[7]段均作为所述关注文本;再如,对于用户A,其在阅读文章《LTE物理下行控制信道盲检过程研究》中关于“搜索空间”部分的描述时,其在阅读该文章的第[7]段时执行了收藏操作,而其在关键词搜索模式下阅读的“搜索空间”部分对应的段落为该文章的第[5-10]段,则在步骤S2中,摘要提取设备1可将文章《LTE物理下行控制信道盲检过程研究》中的第[5-10]段作为所述关注文本。
在此,需要说明的是,本发明还可获取多个用户关于目标原始文本的阅读操作信息,进而可得到每一用户关于所述目标原始文本的关注文本,从而本发明可根据每一用户的所述关注文本,确定所述多个用户关于所述目标原始文本的公共关注文本,以作为最终的关注文本,可进一步提高文本摘要的准确度和有效性,也进一步提升了用户的阅读浏览体验。
接着,在步骤S3中,摘要提取设备1根据所述关注文本,结合所述目标原始文本的内容信息,通过诸如将文本作为句子的线性序列、将句子视为词的线性序列等方法,提取所述目标原始文本的文本摘要。
例如,假设文章《LTE物理下行控制信道盲检过程研究》通过现有技术中的自动文本摘要方法,也即基于全文内容或章节相关的段落内容而得到的文本摘要为“LTE物理下行控制信道为整个系统上下行阐述分配各种资源,对系统起着非常关键的调度作用。基于PDCCH信道发送与接收流程,根据PDCCH信道结构,详细分析了信道的调度 过程,为终端PDCCH信道接收制定了一种详细的盲检方法,为LTE系统的实际实现提供了理论依据”,而在步骤S3中,摘要提取设备1根据在步骤S2中,摘要提取设备1确定的所述关注文本,如“搜索空间”部分对应的第[5-10]段,结合所述目标原始文本的内容信息,通过诸如将文本作为句子的线性序列、将句子视为词的线性序列等方法,提取得到文章《LTE物理下行控制信道盲检过程研究》的文本摘要为“LTE物理下行控制信道为整个系统上下行阐述分配各种资源,对系统起着非常关键的调度作用。基于PDCCH信道发送与接收流程,根据PDCCH信道结构,详细分析了信道的调度过程、专用搜索空间 和公共搜索空间,为终端PDCCH信道接收制定了一种详细的盲检方法,为LTE系统的实际实现提供了理论依据”。
在此,本发明提取的文本摘要不同于现有技术中得到文本摘要,相对于现有技术,本发明提取的文本摘要更能突出原始文献的重点,提高了文本摘要的准确度和有效性,相应地,也提升了用户的阅读浏览体验。
摘要提取设备1的各步骤之间是持续不断工作的。具体地,在步骤S1中,摘要提取设备1持续获取用户关于目标原始文本的阅读操作信息;在步骤S2中,摘要提取设备1持续根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本;在步骤S3中,摘要提取设备1持续根据所述关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。在此,本领域技术人员应当理解所述“持续”是指摘要提取设备1的各个步骤之间分别不断地进行阅读操作信息的获取、关注文本的确定与文本摘要提取,直至摘要提取设备1在较长时间内停止获取阅读操作信息。
优选地,若所述用户阅读所述目标原始文本过程中的停留时间大于预定阈值的段落为多个,或者,若所述目标原始文本中在所述关键词搜索模式下被浏览的段落为多个,其中,摘要提取设备1还包括步骤S4(未示出)。具体地,在步骤S4中,摘要提取设备1根据多个所述段落之间的内容关联度,从所述多个段落中确定优选关注文本,其中,在步骤S3中,摘要提取设备1根据所述优选关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。
例如,对于文章《LTE物理下行控制信道盲检过程研究》,用户A在阅读该文章过程中停留时间大于预定阈值的段落为该文章的第[5-7]段,假设第[5-6]段的内容分别为专用搜索空间和公共搜索空间,而第[7]段的内容为盲检过程,则第[7]段的内容与第[5-6]段的内容之间的关联度比较小,则优选确定装置可确定第[5-6]段作为优选关注文本。
接着,在步骤S3中,摘要提取设备1根据所述优选关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。在此,在步骤S3中,摘要提取设备1根据所述优选关注文本,结合所述目标原始文本的内容信息,提取所述文本摘要的方式与前述在步骤S3中,摘要提取设备1根据所述关注文本,结合所述目标原始文本的内容信息,提取所述文本摘要的方式相同或基本相同,为简明起见,故在此不再赘述,并以引用的方式包含与此。
在此,本发明通过根据优选关注文本,结合所述目标原始文本的内容信息,来提取文本摘要,使得本发明提取的文本摘要更一步突出原始文献的重点,提高文本摘要的准确度和有效性,提升用户的阅读浏览体验。
优选地,所述阅读操作信息还包括所述用户关于所述目标原始文本的历史阅读记录,其中,在步骤S2中,摘要提取设备1根据所述历史阅读记录,确定所述关注文本。
优选地,所述历史阅读记录包括以下至少任一项:
-所述用户关于所述目标原始文本中段落的历史阅读频率信息;
-所述用户关于所述目标原始文本中段落的历史阅读平均时长。
例如,对于文章《LTE物理下行控制信道盲检过程研究》,假设用户A关于该文章的历史阅读记录中,经常阅读该文章中的第[5-6]段的内容,则在步骤S2中,摘要提取设备1根据该历史阅读记录,确定所述关注文本为该文章的第[5-6]段。
再如,对于用户A,假设其关于文章《LTE物理下行控制信道盲检过程研究》的历史阅读记录中,对第[6]段的历史阅读平均时长超过预定阈值,则在步骤S2中,摘要提取设备1根据该历史阅读记录,确定所述关注文本为该文章的第[6]段。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (14)

1.一种用于提取文本摘要的方法,其中,该方法包括:
获取用户关于目标原始文本的阅读操作信息;
根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本;
根据所述关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。
2.根据权利要求1所述的方法,其中,所述阅读操作信息包括以下至少任一项:
-所述用户阅读所述目标原始文本过程中执行的停留操作;
-所述用户阅读所述目标原始文本过程中执行的收藏相关操作;
-所述用户阅读所述目标原始文本过程中的阅读模式信息;
-所述用户阅读所述目标原始文本过程中的阅读速度。
3.根据权利要求2所述的方法,其中,所述用户阅读操作信息包括所述用户阅读所述目标原始文本过程中的停留操作;
其中,确定所述用户关于所述目标原始文本的关注文本包括:
-根据所述用户执行所述停留操作所对应的段落的停留时间,将停留时间大于预定时间阈值的段落作为所述关注文本。
4.根据权利要求2所述的方法,其中,所述阅读模式信息包括浏览模式和关键词搜索模式;
其中,确定所述用户关于所述目标原始文本的关注文本包括:
-若所述用户阅读所述目标原始文本过程中由所述浏览模式变换为所述关键词搜索模式,将所述目标原始文本中在所述关键词搜索模式下被浏览的段落作为所述关注文本。
5.根据权利要求3或4所述的方法,其中,若所述停留时间大于预定阈值的段落为多个,或者,若所述目标原始文本中在所述关键词搜索模式下被浏览的段落为多个,其中,该方法还包括:
根据多个所述段落之间的内容关联度,从所述多个段落中确定优选关注文本;
其中,提取所述目标原始文本的文本摘要包括:
-根据所述优选关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。
6.根据权利要求1或2所述的方法,其中,所述阅读操作信息还包括所述用户关于所述目标原始文本的历史阅读记录;
其中,确定所述用户关于所述目标原始文本的关注文本包括:
-根据所述历史阅读记录,确定所述关注文本。
7.根据权利要求6所述的方法,其中,所述历史阅读记录包括以下至少任一项:
-所述用户关于所述目标原始文本中段落的历史阅读频率信息;
-所述用户关于所述目标原始文本中段落的历史阅读平均时长。
8.一种用于提取文本摘要的摘要提取设备,其中,该摘要提取设备包括:
用于获取用户关于目标原始文本的阅读操作信息的装置;
用于根据所述阅读操作信息,确定所述用户关于所述目标原始文本的关注文本的装置;
用于根据所述关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要的装置。
9.根据权利要求8所述的摘要提取设备,其中,所述阅读操作信息包括以下至少任一项:
-所述用户阅读所述目标原始文本过程中执行的停留操作;
-所述用户阅读所述目标原始文本过程中执行的收藏相关操作;
-所述用户阅读所述目标原始文本过程中的阅读模式信息;
-所述用户阅读所述目标原始文本过程中的阅读速度。
10.根据权利要求9所述的摘要提取设备,其中,所述用户阅读操作信息包括所述用户阅读所述目标原始文本过程中的停留操作;
其中,确定所述用户关于所述目标原始文本的关注文本的装置用于:
-根据所述用户执行所述停留操作所对应的段落的停留时间,将停留时间大于预定时间阈值的段落作为所述关注文本。
11.根据权利要求9所述的摘要提取设备,其中,所述阅读模式信息包括浏览模式和关键词搜索模式;
其中,确定所述用户关于所述目标原始文本的关注文本的装置用于:
-若所述用户阅读所述目标原始文本过程中由所述浏览模式变换为所述关键词搜索模式,将所述目标原始文本中在所述关键词搜索模式下被浏览的段落作为所述关注文本。
12.根据权利要求10或11所述的摘要提取设备,其中,若所述停留时间大于预定阈值的段落为多个,或者,若所述目标原始文本中在所述关键词搜索模式下被浏览的段落为多个,其中,该摘要提取设备还包括:
用于根据多个所述段落之间的内容关联度,从所述多个段落中确定优选关注文本的装置;
其中,提取所述目标原始文本的文本摘要的装置用于:
-根据所述优选关注文本,结合所述目标原始文本的内容信息,提取所述目标原始文本的文本摘要。
13.根据权利要求8或9所述的摘要提取设备,其中,所述阅读操作信息还包括所述用户关于所述目标原始文本的历史阅读记录;
其中,确定所述用户关于所述目标原始文本的关注文本的装置用于:
-根据所述历史阅读记录,确定所述关注文本。
14.根据权利要求13所述的摘要提取设备,其中,所述历史阅读记录包括以下至少任一项:
-所述用户关于所述目标原始文本中段落的历史阅读频率信息;
-所述用户关于所述目标原始文本中段落的历史阅读平均时长。
CN201510515872.6A 2015-08-20 2015-08-20 一种用于提取文本摘要的方法与设备 Active CN106469176B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510515872.6A CN106469176B (zh) 2015-08-20 2015-08-20 一种用于提取文本摘要的方法与设备
PCT/CN2015/096931 WO2017028407A1 (zh) 2015-08-20 2015-12-10 一种用于提取文本摘要的方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510515872.6A CN106469176B (zh) 2015-08-20 2015-08-20 一种用于提取文本摘要的方法与设备

Publications (2)

Publication Number Publication Date
CN106469176A true CN106469176A (zh) 2017-03-01
CN106469176B CN106469176B (zh) 2019-08-16

Family

ID=58051555

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510515872.6A Active CN106469176B (zh) 2015-08-20 2015-08-20 一种用于提取文本摘要的方法与设备

Country Status (2)

Country Link
CN (1) CN106469176B (zh)
WO (1) WO2017028407A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109190109A (zh) * 2018-07-26 2019-01-11 中国科学院自动化研究所 融合用户信息生成评论摘要的方法及装置
CN110085066A (zh) * 2019-04-17 2019-08-02 北京小米移动软件有限公司 展示阅读信息的方法、装置及电子设备
CN114115670A (zh) * 2021-07-30 2022-03-01 荣耀终端有限公司 提醒生成文本摘要的方法、生成文本摘要的方法及装置
CN114722194A (zh) * 2022-03-15 2022-07-08 电子科技大学 一种基于摘要生成算法的突发事件时间序列自动构建方法
CN115248803A (zh) * 2022-09-22 2022-10-28 天津联想协同科技有限公司 适用于网盘文件的收藏方法、装置、网盘及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108520014A (zh) * 2018-03-21 2018-09-11 广东欧珀移动通信有限公司 信息分享方法、装置、移动终端和计算机可读介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254014A (zh) * 2011-07-21 2011-11-23 华中科技大学 一种网页特征自适应的信息抽取方法
CN103793481A (zh) * 2014-01-16 2014-05-14 中国科学院软件研究所 基于用户兴趣挖掘的微博词云生成方法及访问支持系统
CN103838792A (zh) * 2012-11-27 2014-06-04 大连灵动科技发展有限公司 一种网页主题确定的方法
CN103885935A (zh) * 2014-03-12 2014-06-25 浙江大学 基于图书阅读行为的图书章节摘要生成方法
CN104090929A (zh) * 2014-06-23 2014-10-08 吕志雪 一种个性化图片推荐方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1145899C (zh) * 2000-09-07 2004-04-14 国际商业机器公司 为文字文档自动生成摘要的方法
CN1609845A (zh) * 2003-10-22 2005-04-27 国际商业机器公司 用于改善由机器自动生成的摘要的可读性的方法和装置
CN101004737A (zh) * 2007-01-24 2007-07-25 贵阳易特软件有限公司 基于关键词的个性化文档处理系统
CN101567004B (zh) * 2009-02-06 2012-05-30 浙江大学 基于眼球跟踪的英文文本自动摘要方法
CN104503958B (zh) * 2014-11-19 2017-09-26 百度在线网络技术(北京)有限公司 文档摘要的生成方法及装置
CN104636465B (zh) * 2015-02-10 2018-11-16 百度在线网络技术(北京)有限公司 网页摘要生成方法、展示方法及相应装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254014A (zh) * 2011-07-21 2011-11-23 华中科技大学 一种网页特征自适应的信息抽取方法
CN103838792A (zh) * 2012-11-27 2014-06-04 大连灵动科技发展有限公司 一种网页主题确定的方法
CN103793481A (zh) * 2014-01-16 2014-05-14 中国科学院软件研究所 基于用户兴趣挖掘的微博词云生成方法及访问支持系统
CN103885935A (zh) * 2014-03-12 2014-06-25 浙江大学 基于图书阅读行为的图书章节摘要生成方法
CN104090929A (zh) * 2014-06-23 2014-10-08 吕志雪 一种个性化图片推荐方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐晓丹: "中文Web文档自动摘要系统的研究", 《中国优秀博硕士学位论文全文数据库 (硕士) 信息科技辑》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109190109A (zh) * 2018-07-26 2019-01-11 中国科学院自动化研究所 融合用户信息生成评论摘要的方法及装置
CN109190109B (zh) * 2018-07-26 2020-09-29 中国科学院自动化研究所 融合用户信息生成评论摘要的方法及装置
CN110085066A (zh) * 2019-04-17 2019-08-02 北京小米移动软件有限公司 展示阅读信息的方法、装置及电子设备
CN110085066B (zh) * 2019-04-17 2021-12-21 北京小米移动软件有限公司 展示阅读信息的方法、装置及电子设备
CN114115670A (zh) * 2021-07-30 2022-03-01 荣耀终端有限公司 提醒生成文本摘要的方法、生成文本摘要的方法及装置
CN114722194A (zh) * 2022-03-15 2022-07-08 电子科技大学 一种基于摘要生成算法的突发事件时间序列自动构建方法
CN114722194B (zh) * 2022-03-15 2023-05-09 电子科技大学 一种基于摘要生成算法的突发事件时间序列自动构建方法
CN115248803A (zh) * 2022-09-22 2022-10-28 天津联想协同科技有限公司 适用于网盘文件的收藏方法、装置、网盘及存储介质
CN115248803B (zh) * 2022-09-22 2023-02-17 天津联想协同科技有限公司 适用于网盘文件的收藏方法、装置、网盘及存储介质

Also Published As

Publication number Publication date
WO2017028407A1 (zh) 2017-02-23
CN106469176B (zh) 2019-08-16

Similar Documents

Publication Publication Date Title
CN106469176A (zh) 一种用于提取文本摘要的方法与设备
CN107784092A (zh) 一种推荐热词的方法、服务器及计算机可读介质
JP2005085285A5 (zh)
US9449027B2 (en) Apparatus and method for representing and manipulating metadata
CN103309852A (zh) 一种基于统计和规则的特定领域的合成词发现方法
CN104090904B (zh) 一种用于提供目标搜索结果的方法与设备
CN111143547B (zh) 一种基于知识图谱的大数据显示方法
CN103744887B (zh) 一种用于人物搜索的方法、装置和计算机设备
CN110134792A (zh) 文本识别方法、装置、电子设备以及存储介质
CN105488206B (zh) 一种基于众包的安卓应用演化推荐方法
Urman et al. Auditing source diversity bias in video search results using virtual agents
JP2010515998A5 (zh)
Fischer et al. The impact of mobile computing on individuals, organizations, and society-synthesis of existing literature and directions for future research
Liu et al. ICTNET at Temporal Summarization Track TREC 2013.
Brenner et al. MediaEval 2013: Social Event Detection, Retrieval and Classification in Collaborative Photo Collections.
CN103838786A (zh) 一种Web数据自动采集的方法
US20160124946A1 (en) Managing a set of data
CN113449077B (zh) 新闻热度计算方法、设备及存储介质
Zhang et al. ICTIR Subtopic Mining System at NTCIR-9 INTENT Task.
Liu et al. Clustering web pages to facilitate revisitation on mobile devices
US20130262430A1 (en) Dominant image determination for search results
CN103995690A (zh) 一种基于gpu的并行时间序列挖掘方法
WO2017091120A1 (en) A system and a method for ontology based browsing
JP2012104051A (ja) 文書インデックス作成装置
Li et al. Extraction of informative blocks from Web pages based on VIPS

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant