CN115600556A - 一种文档的目录信息推荐方法及系统 - Google Patents

一种文档的目录信息推荐方法及系统 Download PDF

Info

Publication number
CN115600556A
CN115600556A CN202211608732.XA CN202211608732A CN115600556A CN 115600556 A CN115600556 A CN 115600556A CN 202211608732 A CN202211608732 A CN 202211608732A CN 115600556 A CN115600556 A CN 115600556A
Authority
CN
China
Prior art keywords
document
user
local
directory
portrait
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211608732.XA
Other languages
English (en)
Other versions
CN115600556B (zh
Inventor
李锦洲
李思伟
池沐霖
张旭君
蓝建敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Excellence Information Technology Co ltd
Original Assignee
Excellence Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Excellence Information Technology Co ltd filed Critical Excellence Information Technology Co ltd
Priority to CN202211608732.XA priority Critical patent/CN115600556B/zh
Publication of CN115600556A publication Critical patent/CN115600556A/zh
Application granted granted Critical
Publication of CN115600556B publication Critical patent/CN115600556B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/137Hierarchical processing, e.g. outlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0483Interaction with page-structured environments, e.g. book metaphor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种文档的目录信息推荐方法及系统,本发明技术方案通过用户当前行为判断用户的查找文档意图,建立临时用户画像,利用预设规则来确定用户需要提取的本地文档;从而对提取的本地文档进行解析得到目录信息推荐给用户,解决了现有技术在使用终端过程中无法根据用户的使用行为而推荐更具体、更准确的本地文档目录信息的技术问题,实现了在使用终端过程中根据用户的使用行为推荐更具体、更准确的本地文档目录信息。

Description

一种文档的目录信息推荐方法及系统
技术领域
本发明涉及信息大数据处理领域,尤其涉及一种文档的目录信息推荐方法及系统。
背景技术
随着人工智能技术的发展,关于咨询推荐方面的技术已经愈发成熟;但是人们向往智能化、热衷解放双手的需求越来越大,如何在人们工作和生活中提供更多的便利,成为了目前社会的一个技术趋势。
人们在使用电脑的时候,常常会遇到一些场景:用户浏览一个网页或者撰写一个文案时,需要查询一下相关文档的内容细节。或者,用户在对于一些工作表格进行审核时,需要查询对应的资料细节作为参考。而这些需要查询的文档/资料往往是以本地储存的形式被保存在电脑中,而用户则需要凭借记忆在本地电脑中找到这个文档,或在电脑文件夹中搜索其文档名称。首先要精准地找到这些文件已经比较困难了,再加上本地文档在制作或保存的时候并没有进行目录分解,也没有像线上的规范文件一样可以准确地识别到每一个目录,所以很难针对本地文档的内容细节智能化地向用户推荐目录信息。但随着智能化时代的到来,以及居家办公的模式,电脑化、智能化地使用电脑已经成为一种大趋势,在未来有本地文档目录信息推荐的需求将呈指数增长。
因此,如何解决使用终端过程中无法根据用户的使用行为而推荐更具体、更准确的本地文档目录信息的技术问题,是目前亟需解决的一个难题。
发明内容
本发明提供了一种文档的目录信息推荐方法及系统,可以在使用终端过程中根据用户的使用行为推荐更具体、更准确的本地文档目录信息。
为了解决上述技术问题,本发明实施例提供了一种文档的目录信息推荐方法,应用于本地终端,包括:
获取用户在本地终端上的实时使用记录,提取所述实时使用记录中的用户当前行为,根据所述用户当前行为判断用户是否具有查找文档意图;
当确定用户具有查找文档意图时,根据所述实时使用记录建立临时用户画像;
根据预先建立的画像文档规则,确定所述临时用户画像所需的本地文档;其中,所述画像文档规则设置有临时用户画像和对应的本地文档相关联;
对所述本地文档进行解析,根据不同的主题内容将所述本地文档划分为多项目录项,生成所述本地文档所对应的目录信息;
根据所述本地文档的储存位置和每项目录项在所述本地文档中的页面位置,生成跳转链接,并分别将所述跳转链接与所述目录信息下对应的各项目录项相关联;
将所述目录信息显示在用户的操作界面上,响应于用户对所述目录信息上选择的目录项,根据选择的目录项确定相关联的跳转链接,控制当前操作界面跳转到对应的本地文档中的页面位置。
作为优选方案,所述获取用户在本地终端上的实时使用记录,提取所述实时使用记录中的用户当前行为,根据所述用户当前行为判断用户是否具有查找文档意图的步骤中,具体包括:
对所述实时使用记录进行提取,得到当前用户在本地终端上运行的软件类型、文件类型和操作内容;
计算所述软件类型在用户的历史使用记录中发生查找文档的概率,作为第一概率值;
计算所述文件类型在用户的历史使用记录中发生查找文档的概率,作为第二概率值;
根据所述操作内容,确定用户在当前运行的文件中所在的操作环节,并判断所述操作环节是否已经完结,当确定未完结时,计算所述操作环节在用户的历史使用记录中发生查找文档的概率,作为第三概率值;
根据所述第一概率值、第二概率值和第三概率值,计算出当前用户的查找文档意图值,当所述查找文档意图值超过预设意图值时,确定用户具有查找文档意图。
作为优选方案,所述查找文档意图值的计算公式为:
Figure DEST_PATH_IMAGE002AAAA
其中,
Figure 287994DEST_PATH_IMAGE003
为查找文档意图值,
Figure 436079DEST_PATH_IMAGE004
为第一概率值,
Figure 257404DEST_PATH_IMAGE005
为第二概率值,
Figure 403215DEST_PATH_IMAGE006
为第三概率值;
Figure 309991DEST_PATH_IMAGE007
Figure 950182DEST_PATH_IMAGE008
Figure 422751DEST_PATH_IMAGE009
均为常数,且
Figure 5042DEST_PATH_IMAGE010
其中,
Figure DEST_PATH_IMAGE012A
Figure DEST_PATH_IMAGE014A
Figure DEST_PATH_IMAGE016A
其中,
Figure 523748DEST_PATH_IMAGE017
为历史时间内用户使用该软件类型发生查找文档的次数,
Figure 951319DEST_PATH_IMAGE018
为历史时间 内用户使用该文件类型发生查找文档的次数,
Figure 495039DEST_PATH_IMAGE019
为历史时间内用户执行该操作环节发生 查找文档的次数;
Figure 44969DEST_PATH_IMAGE020
为历史时间内用户发生查找文档的总次数,
Figure 395179DEST_PATH_IMAGE021
为历史时间。
作为优选方案,所述根据所述实时使用记录建立临时用户画像的步骤中,具体包括:
判断所述操作环节在用户的历史使用记录中是否发生过查找文档,当确定发生过查找文档时,提取查找文档的主题内容,并根据所述主题内容、查找文档和操作环节建立临时用户画像;
当确定所述操作环节在用户的历史使用记录中没有发生过查找文档时,判断所述文件类型在用户的历史使用记录中是否发生过查找文档,当确定所述文件类型在用户的历史使用记录中发生过查找文档时,提取查找文档的主题内容,并根据所述主题内容、查找文档和文件类型建立临时用户画像;
当确定所述文件类型在用户的历史使用记录中没有发生过查找文档时,判断所述软件类型在用户的历史使用记录中是否发生过查找文档,当确定所述软件类型在用户的历史使用记录中发生过查找文档时,提取查找文档的主题内容,并根据所述主题内容、查找文档和软件类型建立临时用户画像。
作为优选方案,所述画像文档规则的建立步骤,具体包括:
建立圆心坐标模型,分别将本地终端上的每个本地文档设置在对应的圆心上,由圆心等距向外依次生成多层圆环;
根据用户的历史使用记录,确定临时用户画像由操作环节、文件类型或软件类型建立,并根据对应的概率值,确定所述临时用户画像中构建的查找文档,并计算所述临时用户画像与所在圆心的距离,将所述临时用户画像设置在所述距离对应的圆环上;
根据所述临时用户画像分别在不同圆心坐标模型上的圆环位置,确定与所述临时用户画像距离最近的圆心,将距离最近的圆心所对应的本地文档作为所述临时用户画像所需查找的文档。
作为优选方案,所述临时用户画像与所在圆心的距离的计算公式为:
Figure DEST_PATH_IMAGE023A
Figure DEST_PATH_IMAGE025A
Figure DEST_PATH_IMAGE027A
其中,
Figure 16653DEST_PATH_IMAGE028
为临时用户画像由软件类型建立时,所述临时用户画像与所在圆心的距 离;
Figure 463815DEST_PATH_IMAGE029
为临时用户画像由文件类型建立时,所述临时用户画像与所在圆心的距离;
Figure 122330DEST_PATH_IMAGE030
为临 时用户画像由操作环节建立时,所述临时用户画像与所在圆心的距离;
Figure 287732DEST_PATH_IMAGE031
Figure 807837DEST_PATH_IMAGE032
Figure 109505DEST_PATH_IMAGE033
均为常数, 且
Figure 204500DEST_PATH_IMAGE034
作为优选方案,所述对所述本地文档进行解析,根据不同的主题内容将所述本地文档划分为多项目录项,生成所述本地文档所对应的目录信息的步骤中,具体包括:
将所述临时用户画像中构建的主题内容定义为目标内容,根据所述目标内容在本地终端中对每个本地文档进行遍历查询后提取本地文档中的目录信息;
当确定对本地文档中的目录信息进行提取成功时,对提取到的目录信息进行划分成多项目录项;
当确定对本地文档中的目录信息进行提取失败时,根据本地文档中的章节和段落对本地文档进行划分为多个版块,通过语义识别技术分别对每个版块的主题内容进行提取,生成多项目录项;
根据所述目标内容对所述多项目录项按相关度依次排列。
作为优选方案,所述通过语义识别技术分别对每个版块的主题内容进行提取的步骤中,具体包括:
对每个版块的字词进行分割,根据每个字词出现的频率,确定该版块对应的关键词,作为第一关键词集合;
根据所述实时使用记录中的用户当前行为,确定用户执行的当前操作内容,并对当前操作内容中出现的字词进行分割,确定出现次数最多的若干个关键词,作为第二关键词集合;
将同时出现在所述第一关键词集合和所述第二关键词集合中的关键词进行提取,并确定提取的关键词在当前操作内容中出现的次数,选择次数最多的关键词作为该版块的最终关键词,生成对应的主题内容。
作为优选方案,所述根据所述本地文档的储存位置和每项目录项在所述本地文档中的页面位置,生成跳转链接,并分别将所述跳转链接与所述目录信息下对应的各项目录项相关联的步骤中,具体包括:
提取所述本地文档的储存位置,将所述储存位置作为第一链接;
根据每项目录项在所述本地文档中的页面位置,分别生成对应的页面跳转链接,将所述页面跳转链接封装在所述第一链接的跳转尾部,生成跳转链接;
在所述目录信息下对应的各项目录项进行标引对应的跳转链接,以使用户点击任一项目录项后,控制当前操作界面进入对应的跳转链接。
相应地,本发明另一实施例还提供了一种文档的目录信息推荐系统,应用于本地终端,包括:意图判断模块、用户画像模块、规则确定模块、文档解析模块、链接跳转模块和信息显示模块,各模块具体用于:
所述意图判断模块,用于获取用户在本地终端上的实时使用记录,提取所述实时使用记录中的用户当前行为,根据所述用户当前行为判断用户是否具有查找文档意图;
所述用户画像模块,用于当确定用户具有查找文档意图时,根据所述实时使用记录建立临时用户画像;
所述规则确定模块,用于根据预先建立的画像文档规则,确定所述临时用户画像所需的本地文档;其中,所述画像文档规则设置有临时用户画像和对应的本地文档相关联;
所述文档解析模块,用于对所述本地文档进行解析,根据不同的主题内容将所述本地文档划分为多项目录项,生成所述本地文档所对应的目录信息;
所述链接跳转模块,用于根据所述本地文档的储存位置和每项目录项在所述本地文档中的页面位置,生成跳转链接,并分别将所述跳转链接与所述目录信息下对应的各项目录项相关联;
所述信息显示模块,用于将所述目录信息显示在用户的操作界面上,响应于用户对所述目录信息上选择的目录项,根据选择的目录项确定相关联的跳转链接,控制当前操作界面跳转到对应的本地文档中的页面位置。
作为优选方案,所述意图判断模块具体用于:对所述实时使用记录进行提取,得到当前用户在本地终端上运行的软件类型、文件类型和操作内容;计算所述软件类型在用户的历史使用记录中发生查找文档的概率,作为第一概率值;计算所述文件类型在用户的历史使用记录中发生查找文档的概率,作为第二概率值;根据所述操作内容,确定用户在当前运行的文件中所在的操作环节,并判断所述操作环节是否已经完结,当确定未完结时,计算所述操作环节在用户的历史使用记录中发生查找文档的概率,作为第三概率值;根据所述第一概率值、第二概率值和第三概率值,计算出当前用户的查找文档意图值,当所述查找文档意图值超过预设意图值时,确定用户具有查找文档意图。
作为优选方案,所述查找文档意图值的计算公式为:
Figure DEST_PATH_IMAGE002_5A
其中,
Figure 263723DEST_PATH_IMAGE003
为查找文档意图值,
Figure 351634DEST_PATH_IMAGE004
为第一概率值,
Figure 711071DEST_PATH_IMAGE005
为第二概率值,
Figure 773705DEST_PATH_IMAGE006
为第三概率值;
Figure 851382DEST_PATH_IMAGE007
Figure 962558DEST_PATH_IMAGE008
Figure 238818DEST_PATH_IMAGE009
均为常数,且
Figure 429278DEST_PATH_IMAGE010
其中,
Figure DEST_PATH_IMAGE012AA
Figure DEST_PATH_IMAGE014AA
Figure DEST_PATH_IMAGE016AA
其中,
Figure 853306DEST_PATH_IMAGE017
为历史时间内用户使用该软件类型发生查找文档的次数,
Figure 830489DEST_PATH_IMAGE018
为历史时间 内用户使用该文件类型发生查找文档的次数,
Figure 164519DEST_PATH_IMAGE019
为历史时间内用户执行该操作环节发生 查找文档的次数;
Figure 772218DEST_PATH_IMAGE020
为历史时间内用户发生查找文档的总次数,
Figure 355646DEST_PATH_IMAGE021
为历史时间。
作为优选方案,所述用户画像模块具体用于:判断所述操作环节在用户的历史使用记录中是否发生过查找文档,当确定发生过查找文档时,提取查找文档的主题内容,并根据所述主题内容、查找文档和操作环节建立临时用户画像;当确定所述操作环节在用户的历史使用记录中没有发生过查找文档时,判断所述文件类型在用户的历史使用记录中是否发生过查找文档,当确定所述文件类型在用户的历史使用记录中发生过查找文档时,提取查找文档的主题内容,并根据所述主题内容、查找文档和文件类型建立临时用户画像;当确定所述文件类型在用户的历史使用记录中没有发生过查找文档时,判断所述软件类型在用户的历史使用记录中是否发生过查找文档,当确定所述软件类型在用户的历史使用记录中发生过查找文档时,提取查找文档的主题内容,并根据所述主题内容、查找文档和软件类型建立临时用户画像。
作为优选方案,所述画像文档规则的建立步骤,具体包括:
建立圆心坐标模型,分别将本地终端上的每个本地文档设置在对应的圆心上,由圆心等距向外依次生成多层圆环;
根据用户的历史使用记录,确定临时用户画像由操作环节、文件类型或软件类型建立,并根据对应的概率值,确定所述临时用户画像中构建的查找文档,并计算所述临时用户画像与所在圆心的距离,将所述临时用户画像设置在所述距离对应的圆环上;
根据所述临时用户画像分别在不同圆心坐标模型上的圆环位置,确定与所述临时用户画像距离最近的圆心,将距离最近的圆心所对应的本地文档作为所述临时用户画像所需查找的文档。
作为优选方案,所述临时用户画像与所在圆心的距离的计算公式为:
Figure DEST_PATH_IMAGE023AA
Figure DEST_PATH_IMAGE025AA
Figure DEST_PATH_IMAGE027AA
其中,
Figure 949569DEST_PATH_IMAGE028
为临时用户画像由软件类型建立时,所述临时用户画像与所在圆心的距 离;
Figure 200422DEST_PATH_IMAGE029
为临时用户画像由文件类型建立时,所述临时用户画像与所在圆心的距离;
Figure 713443DEST_PATH_IMAGE030
为临 时用户画像由操作环节建立时,所述临时用户画像与所在圆心的距离;
Figure 784167DEST_PATH_IMAGE031
Figure 306415DEST_PATH_IMAGE032
Figure 349458DEST_PATH_IMAGE033
均为常数, 且
Figure 95697DEST_PATH_IMAGE034
作为优选方案,所述文档解析模块具体用于:将所述临时用户画像中构建的主题内容定义为目标内容,根据所述目标内容在本地终端中对每个本地文档进行遍历查询后提取本地文档中的目录信息;当确定对本地文档中的目录信息进行提取成功时,对提取到的目录信息进行划分成多项目录项;当确定对本地文档中的目录信息进行提取失败时,根据本地文档中的章节和段落对本地文档进行划分为多个版块,通过语义识别技术分别对每个版块的主题内容进行提取,生成多项目录项;根据所述目标内容对所述多项目录项按相关度依次排列。
作为优选方案,所述文档解析模块用于通过语义识别技术分别对每个版块的主题内容进行提取的步骤中,具体包括:对每个版块的字词进行分割,根据每个字词出现的频率,确定该版块对应的关键词,作为第一关键词集合;根据所述实时使用记录中的用户当前行为,确定用户执行的当前操作内容,并对当前操作内容中出现的字词进行分割,确定出现次数最多的若干个关键词,作为第二关键词集合;将同时出现在所述第一关键词集合和所述第二关键词集合中的关键词进行提取,并确定提取的关键词在当前操作内容中出现的次数,选择次数最多的关键词作为该版块的最终关键词,生成对应的主题内容。
作为优选方案,所述链接跳转模块具体用于:提取所述本地文档的储存位置,将所述储存位置作为第一链接;根据每项目录项在所述本地文档中的页面位置,分别生成对应的页面跳转链接,将所述页面跳转链接封装在所述第一链接的跳转尾部,生成跳转链接;在所述目录信息下对应的各项目录项进行标引对应的跳转链接,以使用户点击任一项目录项后,控制当前操作界面进入对应的跳转链接。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行如上述任一项所述的文档的目录信息推荐方法。
本发明实施例还提供了一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现如上述任一项所述的文档的目录信息推荐方法。
相比于现有技术,本发明实施例具有如下有益效果:
本发明技术方案通过用户当前行为判断用户的查找文档意图,建立临时用户画像,利用预设规则来确定用户需要提取的本地文档;从而对提取的本地文档进行解析得到目录信息推荐给用户,解决了现有技术在使用终端过程中无法根据用户的使用行为而推荐更具体、更准确的本地文档目录信息的技术问题,实现了在使用终端过程中根据用户的使用行为推荐更具体、更准确的本地文档目录信息。
附图说明
图1 :为本发明实施例提供的一种文档的目录信息推荐方法的步骤流程图;
图2 :为本发明实施例提供的一种文档的目录信息推荐系统的结构示意图;
图3 :为本发明实施例提供的终端设备的一种实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
请参照图1,为本发明实施例提供的一种文档的目录信息推荐方法的步骤流程图,所述方法应用于本地终端,包括步骤101至步骤106,各步骤具体如下:
步骤101,获取用户在本地终端上的实时使用记录,提取所述实时使用记录中的用户当前行为,根据所述用户当前行为判断用户是否具有查找文档意图。
在本实施例中,所述步骤101具体包括:步骤1011,对所述实时使用记录进行提取,得到当前用户在本地终端上运行的软件类型、文件类型和操作内容;步骤1012,计算所述软件类型在用户的历史使用记录中发生查找文档的概率,作为第一概率值;步骤1013,计算所述文件类型在用户的历史使用记录中发生查找文档的概率,作为第二概率值;步骤1014,根据所述操作内容,确定用户在当前运行的文件中所在的操作环节,并判断所述操作环节是否已经完结,当确定未完结时,计算所述操作环节在用户的历史使用记录中发生查找文档的概率,作为第三概率值;步骤1015,根据所述第一概率值、第二概率值和第三概率值,计算出当前用户的查找文档意图值,当所述查找文档意图值超过预设意图值时,确定用户具有查找文档意图。
具体地,在实现目录信息推荐之前,我们需要知道用户当前的操作行为,并根据用户当前的操作行为来判断用户是否会具有查找文档的意图。在实际应用中,用户在执行具体的操作过程中,一定会围绕三个要素:软件-文件-具体操作内容。例如,用户正在制作财务报表,此时用户正在使用的软件即为“word软件”,正在打开的文件即为“财务报表”,正在操作的内容为“利润结算计算”。然后我们通过该用户的历史使用记录,发现以往该用户在打开“word软件”后需要查找本地文档的概率,作为第一概率值;在打开“财务报表”后需要查找本地文档的概率,作为第二概率值;在制作“利润结算计算”过程中需要查找本地文档的概率,作为第三概率值。从而计算出用户当前是否具有意图。当然,由于不同的阶段,其权重比例肯定有所不同,我们通过对大量数据进行研究,计算出如下公式,可以准确地表达用户意图:
其中,在本实施例中,所述查找文档意图值的计算公式为:
Figure DEST_PATH_IMAGE002_6A
其中,
Figure 339203DEST_PATH_IMAGE003
为查找文档意图值,
Figure 399563DEST_PATH_IMAGE004
为第一概率值,
Figure 562691DEST_PATH_IMAGE005
为第二概率值,
Figure 479831DEST_PATH_IMAGE006
为第三概率值;
Figure 712098DEST_PATH_IMAGE007
Figure 372887DEST_PATH_IMAGE008
Figure 656101DEST_PATH_IMAGE009
均为常数,且
Figure 681826DEST_PATH_IMAGE010
其中,
Figure DEST_PATH_IMAGE012AAA
Figure DEST_PATH_IMAGE014AAA
Figure DEST_PATH_IMAGE016AAA
其中,
Figure 840537DEST_PATH_IMAGE017
为历史时间内用户使用该软件类型发生查找文档的次数,
Figure 508278DEST_PATH_IMAGE018
为历史时间 内用户使用该文件类型发生查找文档的次数,
Figure 629687DEST_PATH_IMAGE019
为历史时间内用户执行该操作环节发生 查找文档的次数;
Figure 888630DEST_PATH_IMAGE020
为历史时间内用户发生查找文档的总次数,
Figure 846222DEST_PATH_IMAGE021
为历史时间。
步骤102,当确定用户具有查找文档意图时,根据所述实时使用记录建立临时用户画像。
在本实施例中,所述步骤102,具体包括:步骤1021,判断所述操作环节在用户的历史使用记录中是否发生过查找文档,当确定发生过查找文档时,提取查找文档的主题内容,并根据所述主题内容、查找文档和操作环节建立临时用户画像;步骤1022,当确定所述操作环节在用户的历史使用记录中没有发生过查找文档时,判断所述文件类型在用户的历史使用记录中是否发生过查找文档,当确定所述文件类型在用户的历史使用记录中发生过查找文档时,提取查找文档的主题内容,并根据所述主题内容、查找文档和文件类型建立临时用户画像;步骤1023,当确定所述文件类型在用户的历史使用记录中没有发生过查找文档时,判断所述软件类型在用户的历史使用记录中是否发生过查找文档,当确定所述软件类型在用户的历史使用记录中发生过查找文档时,提取查找文档的主题内容,并根据所述主题内容、查找文档和软件类型建立临时用户画像。
具体地,当判断到用户有查找文档的意图时,为了后续步骤中可以精准推荐更合适的文档和推荐目录信息,此步骤需要先建立临时用户画像。该画像不是长久的,与现有技术中的信息咨询推荐策略不同,在现有技术的信息咨询推荐策略中,需要根据用户长期的行为习惯建立该用户的长期用户画像。但在本技术方案中,其目的是根据用户当前操作行为来提供用户查找所需的文档并推荐目录,而用户操作行为是实时不同的,用户执行完一个文件制作后,可能马上又需要进行另一文件制作,所以本步骤建立的是临时用户画像。利用用户以往的使用数据,当用户执行到当前操作内容时,在以往历史中是否发生了查找本地文档的事件,如果发生了,那么被查找的文档时哪一个,以及查找文档的主题内容是什么,然后将主题内容、查找文档和操作环节建立临时用户画像。在具体执行过程中,因为“操作环节”的重要程度最高,“文件类型”次之,最后是“软件类型”,所以我们按照“操作环节”、“文件类型”和“软件类型”的优先级来判断建立临时用户画像。
步骤103,根据预先建立的画像文档规则,确定所述临时用户画像所需的本地文档;其中,所述画像文档规则设置有临时用户画像和对应的本地文档相关联。
在本实施例中,所述步骤103中的画像文档规则的建立步骤,具体包括:步骤1031,建立圆心坐标模型,分别将本地终端上的每个本地文档设置在对应的圆心上,由圆心等距向外依次生成多层圆环;步骤1032,根据用户的历史使用记录,确定临时用户画像由操作环节、文件类型或软件类型建立,并根据对应的概率值,确定所述临时用户画像中构建的查找文档,并计算所述临时用户画像与所在圆心的距离,将所述临时用户画像设置在所述距离对应的圆环上;步骤1033,根据所述临时用户画像分别在不同圆心坐标模型上的圆环位置,确定与所述临时用户画像距离最近的圆心,将距离最近的圆心所对应的本地文档作为所述临时用户画像所需查找的文档。
具体地,经过上一步骤建立了用户的临时用户画像后,本步骤就要利用这个临时用户画像来找到用户想要查找的那个本地文档了。在执行本步骤之前,需要事先建立一个画像文档规则,通过规则来快速的确定所需的本地文档。那么该画像文档规则在实际构建过程中,通过圆心坐标模型的方式进行构建。也就是建立一个圆心规则,将本地文档放在圆心中,如果有本地终端上有一百个文档,那就建立一百个圆心规则,分别将文档放在对应一个圆的圆心中。然后由圆心向外扩展延伸出多个圆环,圆环之间产生了距离。通过不同的操作环节、文件类型或软件类型建立起来的临时用户画像,通过对应的概率值(指步骤101中的第一概率值、第二概率值和第三概率值;当目前的临时用户画像是由软件类型建立时,则概率值为第一概率值;当目前的临时用户画像是由文件类型建立时,则概率值为第二概率值;当目前的临时用户画像是由操作环节建立时,则概率值为第三概率值)来确定与圆心的距离。可以理解的是,同一个临时用户画像可能同时存在于多个圆心规则上,但同一个本地文档只能设置在一个圆心上;这样只需要计算出同一个临时用户画像究竟距离哪个圆心的距离最近,就将距离最近的圆心对应的本地文档作为用户当前需要查找的文档。我们通过大量数据进行研究,发现在计算圆心距离的公式上,总结经验,通过测试后得到拟合效果好、计算度精准的公式,具体如下所示:
其中,在本实施例中,所述临时用户画像与所在圆心的距离的计算公式为:
Figure DEST_PATH_IMAGE023AAA
Figure DEST_PATH_IMAGE025AAA
Figure DEST_PATH_IMAGE027AAA
其中,
Figure 731702DEST_PATH_IMAGE028
为临时用户画像由软件类型建立时,所述临时用户画像与所在圆心的距 离;
Figure 723928DEST_PATH_IMAGE029
为临时用户画像由文件类型建立时,所述临时用户画像与所在圆心的距离;
Figure 91456DEST_PATH_IMAGE030
为临 时用户画像由操作环节建立时,所述临时用户画像与所在圆心的距离;
Figure 598661DEST_PATH_IMAGE031
Figure 857472DEST_PATH_IMAGE032
Figure 438626DEST_PATH_IMAGE033
均为常数, 且
Figure 304951DEST_PATH_IMAGE034
步骤104,对所述本地文档进行解析,根据不同的主题内容将所述本地文档划分为多项目录项,生成所述本地文档所对应的目录信息。
在本实施例中,所述步骤104,具体包括:步骤1041,将所述临时用户画像中构建的主题内容定义为目标内容,根据所述目标内容在本地终端中对每个本地文档进行遍历查询后提取本地文档中的目录信息;步骤1042,当确定对本地文档中的目录信息进行提取成功时,对提取到的目录信息进行划分成多项目录项;步骤1043,当确定对本地文档中的目录信息进行提取失败时,根据本地文档中的章节和段落对本地文档进行划分为多个版块,通过语义识别技术分别对每个版块的主题内容进行提取,生成多项目录项;步骤1044,根据所述目标内容对所述多项目录项按相关度依次排列。
其中,在本实施例中,所述步骤1043中通过语义识别技术分别对每个版块的主题内容进行提取的步骤中,具体包括:对每个版块的字词进行分割,根据每个字词出现的频率,确定该版块对应的关键词,作为第一关键词集合;根据所述实时使用记录中的用户当前行为,确定用户执行的当前操作内容,并对当前操作内容中出现的字词进行分割,确定出现次数最多的若干个关键词,作为第二关键词集合;将同时出现在所述第一关键词集合和所述第二关键词集合中的关键词进行提取,并确定提取的关键词在当前操作内容中出现的次数,选择次数最多的关键词作为该版块的最终关键词,生成对应的主题内容。
具体地,通过上述步骤找到用户所需的本地文档后,需要对本地文档的目录信息进行提取,以便于后续步骤对该目录信息推荐给用户。但是在实际应用中,目录提取也是一个难度,由于本地储存的文档不同于线上文档。这些本地文档有些是有目录的,有些是没有生成目录的。因此,在本步骤中需要分两个情况,一是对自动产生或者自带目录的本地文档直接提取目录信息;二是对没有产生目录的本地文档通过分解和语义识别的方式来生成对应的目录项。在实际分解和语义识别的过程中,考虑到用户当前操作内容的相关性,我们利用用户执行的当前操作内容来分离本地文档的目录信息,使得本地文档目录的生成更为精准,更贴合用户需求。
步骤105,根据所述本地文档的储存位置和每项目录项在所述本地文档中的页面位置,生成跳转链接,并分别将所述跳转链接与所述目录信息下对应的各项目录项相关联。
在本实施例中,所述步骤105具体包括:步骤1051,提取所述本地文档的储存位置,将所述储存位置作为第一链接;步骤1052,根据每项目录项在所述本地文档中的页面位置,分别生成对应的页面跳转链接,将所述页面跳转链接封装在所述第一链接的跳转尾部,生成跳转链接;步骤1053,在所述目录信息下对应的各项目录项进行标引对应的跳转链接,以使用户点击任一项目录项后,控制当前操作界面进入对应的跳转链接。
具体地,通过将本地文档的储存位置和得到的每一项的目录项在该本地文档中对应的页面位置,生成对应的跳转链接,并以此连接,即可使得用户在点击相应地页面时,可直接跳转至用户所需的实际页面。
步骤106,将所述目录信息显示在用户的操作界面上,响应于用户对所述目录信息上选择的目录项,根据选择的目录项确定相关联的跳转链接,控制当前操作界面跳转到对应的本地文档中的页面位置。
本发明技术方案通过用户当前行为判断用户的查找文档意图,建立临时用户画像,利用预设规则来确定用户需要提取的本地文档;从而对提取的本地文档进行解析得到目录信息推荐给用户,解决了现有技术在使用终端过程中无法根据用户的使用行为而推荐更具体、更准确的本地文档目录信息的技术问题,实现了在使用终端过程中根据用户的使用行为推荐更具体、更准确的本地文档目录信息。
实施例二
请参照图2,为本发明另一实施例提供的一种文档的目录信息推荐系统的结构示意图,所述系统应用于本地终端,包括:意图判断模块、用户画像模块、规则确定模块、文档解析模块、链接跳转模块和信息显示模块,各模块具体用于:
所述意图判断模块,用于获取用户在本地终端上的实时使用记录,提取所述实时使用记录中的用户当前行为,根据所述用户当前行为判断用户是否具有查找文档意图。
在本实施例中,所述意图判断模块具体用于:对所述实时使用记录进行提取,得到当前用户在本地终端上运行的软件类型、文件类型和操作内容;计算所述软件类型在用户的历史使用记录中发生查找文档的概率,作为第一概率值;计算所述文件类型在用户的历史使用记录中发生查找文档的概率,作为第二概率值;根据所述操作内容,确定用户在当前运行的文件中所在的操作环节,并判断所述操作环节是否已经完结,当确定未完结时,计算所述操作环节在用户的历史使用记录中发生查找文档的概率,作为第三概率值;根据所述第一概率值、第二概率值和第三概率值,计算出当前用户的查找文档意图值,当所述查找文档意图值超过预设意图值时,确定用户具有查找文档意图。
在本实施例中,所述查找文档意图值的计算公式为:
Figure DEST_PATH_IMAGE002_7A
其中,
Figure 705977DEST_PATH_IMAGE003
为查找文档意图值,
Figure 269944DEST_PATH_IMAGE004
为第一概率值,
Figure 705605DEST_PATH_IMAGE005
为第二概率值,
Figure 742831DEST_PATH_IMAGE006
为第三概率值;
Figure 162311DEST_PATH_IMAGE007
Figure 248079DEST_PATH_IMAGE008
Figure 866142DEST_PATH_IMAGE009
均为常数,且
Figure 261220DEST_PATH_IMAGE010
其中,
Figure DEST_PATH_IMAGE012AAAA
Figure DEST_PATH_IMAGE014AAAA
Figure DEST_PATH_IMAGE016AAAA
其中,
Figure 587903DEST_PATH_IMAGE017
为历史时间内用户使用该软件类型发生查找文档的次数,
Figure 742941DEST_PATH_IMAGE018
为历史时间 内用户使用该文件类型发生查找文档的次数,
Figure 153193DEST_PATH_IMAGE019
为历史时间内用户执行该操作环节发生 查找文档的次数;
Figure 532222DEST_PATH_IMAGE020
为历史时间内用户发生查找文档的总次数,
Figure 926294DEST_PATH_IMAGE021
为历史时间。
所述用户画像模块,用于当确定用户具有查找文档意图时,根据所述实时使用记录建立临时用户画像。
在本实施例中,所述用户画像模块具体用于:判断所述操作环节在用户的历史使用记录中是否发生过查找文档,当确定发生过查找文档时,提取查找文档的主题内容,并根据所述主题内容、查找文档和操作环节建立临时用户画像;当确定所述操作环节在用户的历史使用记录中没有发生过查找文档时,判断所述文件类型在用户的历史使用记录中是否发生过查找文档,当确定所述文件类型在用户的历史使用记录中发生过查找文档时,提取查找文档的主题内容,并根据所述主题内容、查找文档和文件类型建立临时用户画像;当确定所述文件类型在用户的历史使用记录中没有发生过查找文档时,判断所述软件类型在用户的历史使用记录中是否发生过查找文档,当确定所述软件类型在用户的历史使用记录中发生过查找文档时,提取查找文档的主题内容,并根据所述主题内容、查找文档和软件类型建立临时用户画像。
所述规则确定模块,用于根据预先建立的画像文档规则,确定所述临时用户画像所需的本地文档;其中,所述画像文档规则设置有临时用户画像和对应的本地文档相关联。
在本实施例中,所述画像文档规则的建立步骤,具体包括:建立圆心坐标模型,分别将本地终端上的每个本地文档设置在对应的圆心上,由圆心等距向外依次生成多层圆环;根据用户的历史使用记录,确定临时用户画像由操作环节、文件类型或软件类型建立,并根据对应的概率值,确定所述临时用户画像中构建的查找文档,并计算所述临时用户画像与所在圆心的距离,将所述临时用户画像设置在所述距离对应的圆环上;根据所述临时用户画像分别在不同圆心坐标模型上的圆环位置,确定与所述临时用户画像距离最近的圆心,将距离最近的圆心所对应的本地文档作为所述临时用户画像所需查找的文档。
其中,在本实施例中,所述临时用户画像与所在圆心的距离的计算公式为:
Figure DEST_PATH_IMAGE023AAAA
Figure DEST_PATH_IMAGE025AAAA
Figure DEST_PATH_IMAGE027AAAA
其中,
Figure 494810DEST_PATH_IMAGE028
为临时用户画像由软件类型建立时,所述临时用户画像与所在圆心的距 离;
Figure 25149DEST_PATH_IMAGE029
为临时用户画像由文件类型建立时,所述临时用户画像与所在圆心的距离;
Figure 512762DEST_PATH_IMAGE030
为临 时用户画像由操作环节建立时,所述临时用户画像与所在圆心的距离;
Figure 190868DEST_PATH_IMAGE031
Figure 687708DEST_PATH_IMAGE032
Figure 321821DEST_PATH_IMAGE033
均为常数, 且
Figure 42652DEST_PATH_IMAGE034
所述文档解析模块,用于对所述本地文档进行解析,根据不同的主题内容将所述本地文档划分为多项目录项,生成所述本地文档所对应的目录信息。
在本实施例中,所述文档解析模块具体用于:将所述临时用户画像中构建的主题内容定义为目标内容,根据所述目标内容在本地终端中对每个本地文档进行遍历查询后提取本地文档中的目录信息;当确定对本地文档中的目录信息进行提取成功时,对提取到的目录信息进行划分成多项目录项;当确定对本地文档中的目录信息进行提取失败时,根据本地文档中的章节和段落对本地文档进行划分为多个版块,通过语义识别技术分别对每个版块的主题内容进行提取,生成多项目录项;根据所述目标内容对所述多项目录项按相关度依次排列。
其中,在本实施例中,所述文档解析模块用于通过语义识别技术分别对每个版块的主题内容进行提取的步骤中,具体包括:对每个版块的字词进行分割,根据每个字词出现的频率,确定该版块对应的关键词,作为第一关键词集合;根据所述实时使用记录中的用户当前行为,确定用户执行的当前操作内容,并对当前操作内容中出现的字词进行分割,确定出现次数最多的若干个关键词,作为第二关键词集合;将同时出现在所述第一关键词集合和所述第二关键词集合中的关键词进行提取,并确定提取的关键词在当前操作内容中出现的次数,选择次数最多的关键词作为该版块的最终关键词,生成对应的主题内容。
所述链接跳转模块,用于根据所述本地文档的储存位置和每项目录项在所述本地文档中的页面位置,生成跳转链接,并分别将所述跳转链接与所述目录信息下对应的各项目录项相关联。
在本实施例中,所述链接跳转模块具体用于:提取所述本地文档的储存位置,将所述储存位置作为第一链接;根据每项目录项在所述本地文档中的页面位置,分别生成对应的页面跳转链接,将所述页面跳转链接封装在所述第一链接的跳转尾部,生成跳转链接;在所述目录信息下对应的各项目录项进行标引对应的跳转链接,以使用户点击任一项目录项后,控制当前操作界面进入对应的跳转链接。
所述信息显示模块,用于将所述目录信息显示在用户的操作界面上,响应于用户对所述目录信息上选择的目录项,根据选择的目录项确定相关联的跳转链接,控制当前操作界面跳转到对应的本地文档中的页面位置。
实施例三
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行上述任一实施例所述的文档的目录信息推荐方法。
实施例四
请参照图3,是本发明实施例提供的终端设备的一种实施例的结构示意图,所述终端设备包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现上述任一实施例所述的文档的目录信息推荐方法。
优选地,所述计算机程序可以被分割成一个或多个模块/单元(如计算机程序、计算机程序),所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述终端设备中的执行过程。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,通用处理器可以是微处理器,或者所述处理器也可以是任何常规的处理器,所述处理器是所述终端设备的控制中心,利用各种接口和线路连接所述终端设备的各个部分。
所述存储器主要包括程序存储区和数据存储区,其中,程序存储区可存储操作系统、至少一个功能所需的应用程序等,数据存储区可存储相关数据等。此外,所述存储器可以是高速随机存取存储器,还可以是非易失性存储器,例如插接式硬盘,智能存储卡(SmartMedia Card,SMC)、安全数字(Secure Digital,SD)卡和闪存卡(Flash Card)等,或所述存储器也可以是其他易失性固态存储器件。
需要说明的是,上述终端设备可包括,但不仅限于,处理器、存储器,本领域技术人员可以理解,上述终端设备仅仅是示例,并不构成对终端设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种文档的目录信息推荐方法,其特征在于,应用于本地终端,包括:
获取用户在本地终端上的实时使用记录,提取所述实时使用记录中的用户当前行为,根据所述用户当前行为判断用户是否具有查找文档意图;
当确定用户具有查找文档意图时,根据所述实时使用记录建立临时用户画像;
根据预先建立的画像文档规则,确定所述临时用户画像所需的本地文档;其中,所述画像文档规则设置有临时用户画像和对应的本地文档相关联;
对所述本地文档进行解析,根据不同的主题内容将所述本地文档划分为多项目录项,生成所述本地文档所对应的目录信息;
根据所述本地文档的储存位置和每项目录项在所述本地文档中的页面位置,生成跳转链接,并分别将所述跳转链接与所述目录信息下对应的各项目录项相关联;
将所述目录信息显示在用户的操作界面上,响应于用户对所述目录信息上选择的目录项,根据选择的目录项确定相关联的跳转链接,控制当前操作界面跳转到对应的本地文档中的页面位置。
2.如权利要求1所述的文档的目录信息推荐方法,其特征在于,所述获取用户在本地终端上的实时使用记录,提取所述实时使用记录中的用户当前行为,根据所述用户当前行为判断用户是否具有查找文档意图的步骤中,具体包括:
对所述实时使用记录进行提取,得到当前用户在本地终端上运行的软件类型、文件类型和操作内容;
计算所述软件类型在用户的历史使用记录中发生查找文档的概率,作为第一概率值;
计算所述文件类型在用户的历史使用记录中发生查找文档的概率,作为第二概率值;
根据所述操作内容,确定用户在当前运行的文件中所在的操作环节,并判断所述操作环节是否已经完结,当确定未完结时,计算所述操作环节在用户的历史使用记录中发生查找文档的概率,作为第三概率值;
根据所述第一概率值、第二概率值和第三概率值,计算出当前用户的查找文档意图值,当所述查找文档意图值超过预设意图值时,确定用户具有查找文档意图。
3.如权利要求2所述的文档的目录信息推荐方法,其特征在于,所述根据所述实时使用记录建立临时用户画像的步骤中,具体包括:
判断所述操作环节在用户的历史使用记录中是否发生过查找文档,当确定发生过查找文档时,提取查找文档的主题内容,并根据所述主题内容、查找文档和操作环节建立临时用户画像;
当确定所述操作环节在用户的历史使用记录中没有发生过查找文档时,判断所述文件类型在用户的历史使用记录中是否发生过查找文档,当确定所述文件类型在用户的历史使用记录中发生过查找文档时,提取查找文档的主题内容,并根据所述主题内容、查找文档和文件类型建立临时用户画像;
当确定所述文件类型在用户的历史使用记录中没有发生过查找文档时,判断所述软件类型在用户的历史使用记录中是否发生过查找文档,当确定所述软件类型在用户的历史使用记录中发生过查找文档时,提取查找文档的主题内容,并根据所述主题内容、查找文档和软件类型建立临时用户画像。
4.如权利要求3所述的文档的目录信息推荐方法,其特征在于,所述画像文档规则的建立步骤,具体包括:
建立圆心坐标模型,分别将本地终端上的每个本地文档设置在对应的圆心上,由圆心等距向外依次生成多层圆环;
根据用户的历史使用记录,确定临时用户画像由操作环节、文件类型或软件类型建立,并根据对应的概率值,确定所述临时用户画像中构建的查找文档,并计算所述临时用户画像与所在圆心的距离,将所述临时用户画像设置在所述距离对应的圆环上;
根据所述临时用户画像分别在不同圆心坐标模型上的圆环位置,确定与所述临时用户画像距离最近的圆心,将距离最近的圆心所对应的本地文档作为所述临时用户画像所需查找的文档。
5.如权利要求3所述的文档的目录信息推荐方法,其特征在于,所述对所述本地文档进行解析,根据不同的主题内容将所述本地文档划分为多项目录项,生成所述本地文档所对应的目录信息的步骤中,具体包括:
将所述临时用户画像中构建的主题内容定义为目标内容,根据所述目标内容在本地终端中对每个本地文档进行遍历查询后提取本地文档中的目录信息;
当确定对本地文档中的目录信息进行提取成功时,对提取到的目录信息进行划分成多项目录项;
当确定对本地文档中的目录信息进行提取失败时,根据本地文档中的章节和段落对本地文档进行划分为多个版块,通过语义识别技术分别对每个版块的主题内容进行提取,生成多项目录项;
根据所述目标内容对所述多项目录项按相关度依次排列。
6.如权利要求5所述的文档的目录信息推荐方法,其特征在于,所述通过语义识别技术分别对每个版块的主题内容进行提取的步骤中,具体包括:
对每个版块的字词进行分割,根据每个字词出现的频率,确定该版块对应的关键词,作为第一关键词集合;
根据所述实时使用记录中的用户当前行为,确定用户执行的当前操作内容,并对当前操作内容中出现的字词进行分割,确定出现次数最多的若干个关键词,作为第二关键词集合;
将同时出现在所述第一关键词集合和所述第二关键词集合中的关键词进行提取,并确定提取的关键词在当前操作内容中出现的次数,选择次数最多的关键词作为该版块的最终关键词,生成对应的主题内容。
7.如权利要求1所述的文档的目录信息推荐方法,其特征在于,所述根据所述本地文档的储存位置和每项目录项在所述本地文档中的页面位置,生成跳转链接,并分别将所述跳转链接与所述目录信息下对应的各项目录项相关联的步骤中,具体包括:
提取所述本地文档的储存位置,将所述储存位置作为第一链接;
根据每项目录项在所述本地文档中的页面位置,分别生成对应的页面跳转链接,将所述页面跳转链接封装在所述第一链接的跳转尾部,生成跳转链接;
在所述目录信息下对应的各项目录项进行标引对应的跳转链接,以使用户点击任一项目录项后,控制当前操作界面进入对应的跳转链接。
8.一种文档的目录信息推荐系统,其特征在于,应用于本地终端,包括:意图判断模块、用户画像模块、规则确定模块、文档解析模块、链接跳转模块和信息显示模块,各模块具体用于:
所述意图判断模块,用于获取用户在本地终端上的实时使用记录,提取所述实时使用记录中的用户当前行为,根据所述用户当前行为判断用户是否具有查找文档意图;
所述用户画像模块,用于当确定用户具有查找文档意图时,根据所述实时使用记录建立临时用户画像;
所述规则确定模块,用于根据预先建立的画像文档规则,确定所述临时用户画像所需的本地文档;其中,所述画像文档规则设置有临时用户画像和对应的本地文档相关联;
所述文档解析模块,用于对所述本地文档进行解析,根据不同的主题内容将所述本地文档划分为多项目录项,生成所述本地文档所对应的目录信息;
所述链接跳转模块,用于根据所述本地文档的储存位置和每项目录项在所述本地文档中的页面位置,生成跳转链接,并分别将所述跳转链接与所述目录信息下对应的各项目录项相关联;
所述信息显示模块,用于将所述目录信息显示在用户的操作界面上,响应于用户对所述目录信息上选择的目录项,根据选择的目录项确定相关联的跳转链接,控制当前操作界面跳转到对应的本地文档中的页面位置。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行如权利要求1-7中任一项所述的文档的目录信息推荐方法。
10.一种终端设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现如权利要求1-7中任一项所述的文档的目录信息推荐方法。
CN202211608732.XA 2022-12-15 2022-12-15 一种文档的目录信息推荐方法及系统 Active CN115600556B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211608732.XA CN115600556B (zh) 2022-12-15 2022-12-15 一种文档的目录信息推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211608732.XA CN115600556B (zh) 2022-12-15 2022-12-15 一种文档的目录信息推荐方法及系统

Publications (2)

Publication Number Publication Date
CN115600556A true CN115600556A (zh) 2023-01-13
CN115600556B CN115600556B (zh) 2023-03-03

Family

ID=84853856

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211608732.XA Active CN115600556B (zh) 2022-12-15 2022-12-15 一种文档的目录信息推荐方法及系统

Country Status (1)

Country Link
CN (1) CN115600556B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111859118A (zh) * 2020-06-19 2020-10-30 京华信息科技股份有限公司 一种基于文档目录的智能信息推荐方法及装置
CN113553521A (zh) * 2021-07-30 2021-10-26 北京达佳互联信息技术有限公司 内容查找方法及装置
CN114756537A (zh) * 2022-04-16 2022-07-15 长沙鸽儿们智能技术有限公司 一种基于数据埋点的用户画像的方法、系统和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111859118A (zh) * 2020-06-19 2020-10-30 京华信息科技股份有限公司 一种基于文档目录的智能信息推荐方法及装置
CN113553521A (zh) * 2021-07-30 2021-10-26 北京达佳互联信息技术有限公司 内容查找方法及装置
CN114756537A (zh) * 2022-04-16 2022-07-15 长沙鸽儿们智能技术有限公司 一种基于数据埋点的用户画像的方法、系统和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LAN WANG: "HTML Data Capture and User Portrait Data Mining of Landscape Co-Design Platform Based on Distributed Mobile Workstations", 《2022 6TH INTERNATIONAL CONFERENCE ON TRENDS IN ELECTRONICS AND INFORMATICS (ICOEI)》 *
袁红: "用户搜寻意图和搜寻策略选择的关联机制", 《图书情报工作》 *

Also Published As

Publication number Publication date
CN115600556B (zh) 2023-03-03

Similar Documents

Publication Publication Date Title
US20210397980A1 (en) Information recommendation method and apparatus, electronic device, and readable storage medium
RU2501078C2 (ru) Ранжирование результатов поиска с использованием расстояния редактирования и информации о документе
WO2018072071A1 (zh) 知识图谱构建系统及方法
US8473473B2 (en) Object oriented data and metadata based search
WO2020237856A1 (zh) 基于知识图谱的智能问答方法、装置及计算机存储介质
US20080005091A1 (en) Visual and multi-dimensional search
JP5616444B2 (ja) 文書インデックス化およびデータクエリングのための方法およびシステム
US20140180934A1 (en) Systems and Methods for Using Non-Textual Information In Analyzing Patent Matters
CN110704743A (zh) 一种基于知识图谱的语义搜索方法及装置
US20110307479A1 (en) Automatic Extraction of Structured Web Content
WO2020056977A1 (zh) 知识点推送方法、装置及计算机可读存储介质
US20160299891A1 (en) Matching of an input document to documents in a document collection
CN112115232A (zh) 一种数据纠错方法、装置及服务器
CN112883030A (zh) 数据收集方法、装置、计算机设备和存储介质
CN112100470B (zh) 基于论文数据分析的专家推荐方法、装置、设备及存储介质
US10650191B1 (en) Document term extraction based on multiple metrics
US20120130999A1 (en) Method and Apparatus for Searching Electronic Documents
CN112632261A (zh) 智能问答方法、装置、设备及存储介质
WO2021027149A1 (zh) 基于画像相似性的信息检索推荐方法、装置及存储介质
Consoli et al. A quartet method based on variable neighborhood search for biomedical literature extraction and clustering
CN110472058B (zh) 实体搜索方法、相关设备及计算机存储介质
CN115600556B (zh) 一种文档的目录信息推荐方法及系统
CN105512270A (zh) 一种确定相关对象的方法和装置
Ma et al. API prober–a tool for analyzing web API features and clustering web APIs
EP4185966A1 (en) Generating a knowledge base from mathematical formulae in technical documents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant