CN110019705A - 一种信息处理方法、装置和用于信息处理的装置 - Google Patents

一种信息处理方法、装置和用于信息处理的装置 Download PDF

Info

Publication number
CN110019705A
CN110019705A CN201711048819.5A CN201711048819A CN110019705A CN 110019705 A CN110019705 A CN 110019705A CN 201711048819 A CN201711048819 A CN 201711048819A CN 110019705 A CN110019705 A CN 110019705A
Authority
CN
China
Prior art keywords
answer
question
keyword
information
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711048819.5A
Other languages
English (en)
Inventor
牛琳琳
刘玉璇
许嘉明
杨菲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201711048819.5A priority Critical patent/CN110019705A/zh
Publication of CN110019705A publication Critical patent/CN110019705A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Abstract

本发明实施例提供了一种信息处理方法、装置和用于信息处理的装置。其中的方法具体包括:确定与问答对相匹配的关键词;所述问答对包括:问题及其答复;在所述问答对的答复所在的页面中设置所述关键词的信息对应的页面元素。本发明实施例可以提高用户对于所需信息的获取效率,且可以提升用户体验。

Description

一种信息处理方法、装置和用于信息处理的装置
技术领域
本发明涉及信息技术领域,尤其涉及一种信息处理方法、装置和用于信息处理的装置。
背景技术
随着互联网技术的不断发展,互联网中的应用也越来越多,用户利用互联网便捷的交互性来解决问题也成为一种趋势。其中,问答社区为互联网中的一种便捷交互性平台,在问答社区中,提问者将问题发布出来,问答社区中的其他用户可以看到该问题并进行解答,提问者可以从所有问题中选择满意的答复。
目前,问题对应的答复大多为UGC(用户生产内容,User Generated Content),上述答复往往具备主观性较强、信息量有限的特性。问题对应答复的上述特性,容易使得用户在问答社区中检索一个问题时、往往很难从这个问题的答复中获得较为全面的信息,也即,用户往往很难通过一次检索获取到所需的所有信息;此种情况下,用户经常需要反复检索、或需要查看类似问题的答复,以获取更多有效信息,这影响了用户对于信息的获取效率。
发明内容
本发明实施例提供一种信息处理方法、装置和用于信息处理的装置,可以提高用户对于所需信息的获取效率,且可以提升用户体验。
为了解决上述问题,本发明实施例公开了一种信息处理方法,包括:
确定与问答对相匹配的关键词;所述问答对包括:问题及其答复;
在所述问答对的答复所在的页面中设置所述关键词的信息对应的页面元素。
可选地,所述确定与问答对相匹配的关键词,包括:
对所述问答对的问题进行意图识别,以得到所述问题对应的问题意图;
从所述问答对的答复中获取与所述问题意图相匹配的词汇,作为与问答对相匹配的关键词。
可选地,所述确定与问答对相匹配的关键词,包括:
确定问答对的问题对应的问题标签;
依据所述问题标签与链接词之间的映射关系,确定所述问题标签对应的目标链接词;
对所述问答对的答复包括的词汇与所述目标链接词进行匹配,将匹配成功的目标链接词作为与问答对相匹配的关键词。
可选地,所述确定问答对的问题对应的问题标签,包括:
从所述问答对的问题中抽取核心词;
依据所述核心词与所述问题标签之间的映射关系,得到所述问答对的问题中核心词对应的问题标签,作为所述问答对的问题对应的问题标签。
可选地,所述页面元素包括:
用于承载所述关键词的信息的内容元素;或者
用于指向所述关键词的信息的链接元素。
可选地,所述在所述问答对的答复所在的页面中设置所述关键词的信息对应的页面元素,包括:
在所述问答对的答复所在的页面中,针对与所述关键词相匹配的文本添加用于指向所述关键词的信息的链接元素;或者
在所述问答对的答复所在的页面的预设区域,添加用于指向所述关键词的信息的链接元素;其中,所述预设区域为与所述关键词相匹配的文本对应的周围区域。
另一方面,本发明实施例公开了一种信息处理方法,包括:
接收用户针对问答对的答复所在页面的加载请求;所述问答对包括:问题及其答复;
响应于所述加载请求,显示所述页面;所述页面包括:与所述问答对相匹配的关键词的信息对应的页面元素。
可选地,所述页面元素包括:
用于承载所述关键词的信息的内容元素;或者
用于指向所述关键词的信息的链接元素。
可选地,所述链接元素被添加于所述页面中与所述关键词相匹配的文本之上;或者
所述链接元素位于所述页面的预设区域;所述预设区域为与所述关键词相匹配的文本对应的周围区域。
可选地,所述方法还包括:
响应于用户针对所述链接元素的触发操作,显示所述关键词的信息。
再一方面,本发明实施例公开了一种信息处理装置,包括:
关键词确定模块,用于确定与问答对相匹配的关键词;所述问答对包括:问题及其答复;以及
页面元素设置模块,用于在所述问答对的答复所在的页面中设置所述关键词的信息对应的页面元素。
可选地,所述关键词确定模块包括:意图识别子模块和关键词获取子模块;
其中,所述意图识别子模块,用于对所述问答对的问题进行意图识别,以得到所述问题对应的问题意图;
所述关键词获取子模块,用于从所述问答对的答复中获取与所述问题意图相匹配的词汇,作为与问答对相匹配的关键词。
可选地,所述关键词确定模块包括:问题标签确定子模块、目标链接词确定子模块和匹配子模块;
其中,所述问题标签确定子模块,用于确定问答对的问题对应的问题标签;
所述目标链接词确定子模块,用于依据所述问题标签与链接词之间的映射关系,确定所述问题标签对应的目标链接词;
所述匹配子模块,用于对所述问答对的答复包括的词汇与所述目标链接词进行匹配,将匹配成功的目标链接词作为与问答对相匹配的关键词。
可选地,所述问题标签确定子模块包括:核心词抽取单元和问题标签获取单元;
其中,所述核心词抽取单元,用于从所述问答对的问题中抽取核心词;
所述问题标签获取单元,用于依据所述核心词与所述问题标签之间的映射关系,得到所述问答对的问题中核心词对应的问题标签,作为所述问答对的问题对应的问题标签。
可选地,所述页面元素包括:
用于承载所述关键词的信息的内容元素;或者
用于指向所述关键词的信息的链接元素。
可选地,所述页面元素设置模块包括:第一添加子模块、或者第二添加子模块;
其中,所述第一添加子模块,用于在所述问答对的答复所在的页面中,针对与所述关键词相匹配的文本添加用于指向所述关键词的信息的链接元素;
所述第二添加子模块,用于在所述问答对的答复所在的页面的预设区域,添加用于指向所述关键词的信息的链接元素;其中,所述预设区域为与所述关键词相匹配的文本对应的周围区域。
又一方面,本发明实施例公开了一种信息处理装置,包括:
加载请求接收模块,用于接收用户针对问答对的答复所在页面的加载请求;所述问答对包括:问题及其答复;以及
页面显示模块,用于响应于所述加载请求,显示所述页面;所述页面包括:与所述问答对相匹配的关键词的信息对应的页面元素。
可选地,所述页面元素包括:
用于承载所述关键词的信息的内容元素;或者
用于指向所述关键词的信息的链接元素。
可选地,所述链接元素被添加于所述页面中与所述关键词相匹配的文本之上;或者
所述链接元素位于所述页面的预设区域;所述预设区域为与所述关键词相匹配的文本对应的周围区域。
可选地,所述装置还包括:
信息显示模块,用于响应于用户针对所述链接元素的触发操作,显示所述关键词的信息。
再一方面,本发明实施例公开了一种用于信息处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定与问答对相匹配的关键词;所述问答对包括:问题及其答复;
在所述问答对的答复所在的页面中设置所述关键词的信息对应的页面元素。
又一方面,本发明实施例公开了一种用于信息处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
接收用户针对问答对的答复所在页面的加载请求;所述问答对包括:问题及其答复;
响应于所述加载请求,显示所述页面;所述页面包括:与所述问答对相匹配的关键词的信息对应的页面元素。
又一方面,本发明公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的信息处理方法。
本发明实施例包括以下优点:
本发明实施例确定与问答对相匹配的关键词;上述问答对可以包括:问题及其答复;在上述问答对的答复所在的页面中设置上述关键词的信息对应的页面元素。其中,上述关键词与问答对相匹配可以指上述关键词与问题及其答复均相匹配,故可以提高上述关键词与用户的信息意图之间的匹配度,进而使得上述关键词的信息符合用户的信息意图;本发明实施例在上述问答对的答复所在的页面中设置上述关键词的信息对应的页面元素,可以使用户通过该页面元素快速获取符合用户的信息意图的信息,节省用户的信息检索成本,提高用户对于所需信息的获取效率,且可以提升用户体验。
本发明实施例可以应用于问答对的答复中存在用户较为陌生或者想深入了解的事物或概念的场景,在该场景下,上述关键词可以与该事物或概念相匹配,上述关键词的信息可以为该事物或概念对应的知识(如事物或概念对应的事实、信息的描述或在教育和实践中获得的技能知识等),故可以使用户通过上述关键词的信息更好地了解该事物或概念,因此可以满足用户的信息需求。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的信息处理方法的应用环境的示意;
图2是本发明的一种信息处理方法实施例一的步骤流程图;
图3是本发明的一种信息处理方法实施例二的步骤流程图;
图4是本发明的一种信息处理装置实施例的结构框图;
图5是本发明的另一种信息处理装置实施例的结构框图;
图6是本发明的一种用于信息处理的装置800的框图;及
图7是本发明的一些实施例中服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,问题对应答复的主观性较强、信息量有限等特性,容易使得用户在问答社区中检索一个问题时、往往很难从这个问题的答复中获得较为全面的信息;此种情况下,用户往往需要通过二次检索获得所需的信息。例如,问题为“范冰冰的男友是谁”,该问题的答复为“李晨啊”,如果用户不知道“李晨”是谁,还需要通过检索获得“李晨”的信息,这增加了用户的检索成本,影响了用户对于信息的获取效率,且影响了用户的使用体验。
本发明实施例提供了一种信息处理方案,该方案可以确定与问答对相匹配的关键词;上述问答对可以包括:问题及其答复;在上述问答对的答复所在的页面中设置上述关键词的信息对应的页面元素。
上述关键词与问答对相匹配可以指上述关键词与问题及其答复均相匹配,故可以提高上述关键词与用户的信息意图之间的匹配度,进而使得上述关键词的信息符合用户的信息意图;本发明实施例在上述问答对的答复所在的页面中设置上述关键词的信息对应的页面元素,可以使用户通过该页面元素快速获取符合用户的信息意图的信息,由于可以节省用户的信息检索成本,因此可以提高用户对于所需信息的获取效率,且可以提升用户体验。
本发明实施例可以应用于问答对的答复中存在用户较为陌生或者想深入了解的事物或概念的场景,在该场景下,上述关键词可以与该事物或概念相匹配,上述关键词的信息可以为该事物或概念对应的知识(如事物或概念对应的事实、信息的描述或在教育和实践中获得的技能知识等),故可以使用户通过上述关键词的信息更好地了解该事物或概念,因此可以满足用户的信息需求。
在本发明的一种示例中,假设问题为“范冰冰的男友是谁”、以及该问题的答复为“李晨啊”,本发明实施例可以确定与问题及其答复相匹配的关键词“李晨”,并在上述答复所在的页面中设置上述关键词“李晨”的信息对应的页面元素。如果用户想进一步了解“李晨”的信息,则可以通过该页面元素直接获取“李晨”的信息,这相对于用户通过检索获得“李晨”的信息,可以缩短用户对于“李晨”的信息的操作路径,因此可以提高用户对于“李晨”的信息的便捷性。
根据一种实施例,上述页面元素可以包括:用于承载上述关键词的信息的内容元素,上述内容元素的例子可以包括:文字、图片、音频和动画、视频中的至少一种;也即,本发明实施例可以直接将关键词的信息显示在上述答复所在的页面,以使用户直接查看关键词的信息,故可以提高用户对于所需信息的获取效率。
根据另一种实施例,上述页面元素可以包括:用于指向所述关键词的信息的链接元素。也即,本发明实施例可以将关键词的信息对应的链接显示在上述答复所在的页面,若用户想进一步了解上述关键词的信息,可以通过触发该链接获得上述关键词的信息,节省用户的信息检索成本,提高用户对于所需信息的获取效率。链接也称超级链接,是指从一个网页指向一个目标的连接关系,所指向的目标可以是另一个网页,也可以是相同网页上的不同位置,还可以是图片、电子邮件地址、文件、甚至是应用程序。具体到本发明实施例,上述链接可以指向所述关键词的信息,具体地,上述链接可以指向所述关键词的信息所在的路径,如URL(统一资源标识符,Uniform Resource Locator)地址等。
本发明实施例提供的信息处理方法可以应用于例如网站和/或APP(应用程序,Application)的交互性平台的应用环境中。具体地,可以确定与问答对相匹配的关键词,并在上述问答对的答复所在的页面中设置上述关键词的信息对应的页面元素,以提高用户对于所需信息的获取效率,且可以提升用户体验。
上述交互性平台的例子可以包括:问答社区、BBS(电子公告牌系统,BulletinBoard System)社区、微博社区等。用户可以通过上述交互性平台发布问题,上述交互性平台中的其他用户可以看到该问题并给出相应的答复。在实际应用中,一个问题可以对应零个答复,或者可以对应一个答复,或者可以对应多个答复。本发明实施例的问答对可以指问题及其答复表征的配对关系,该问答对具体可以包括:问题、以及其对应的答复。通常情况下,一个问答对可以包括:一个问题及其对应的一个答复,也即,可以针对一个答复,执行本发明实施例的信息处理方法。当然,一个问答对也可以包括:一个问题及其对应的多个答复,此种情况下,可以分别针对问答对中的每个答复,执行本发明实施例的信息处理方法。
在实际应用中,可以对问答对数据进行数据清洗,以去除问答对数据中的脏数据,且可以减少运算量。例如,可以对问题进行过滤,以去除无意义的问题。又如,可以对问题对应的答复进行过滤,以去除无效的答复,保留有效的答复;无效的答复的例子可以包括:与问题无关的答复、包含不文明词汇的答复、用户不采纳的答复、或者用户给出的评分低于分数阈值的答复等。
本发明实施例提供的信息处理方法可应用于图1所示的应用环境中,如图1所示,客户端100与服务器200位于有线或无线网络中,通过该有线或无线网络,客户端100与服务器200进行数据交互。
可选地,客户端100可以运行在终端上,上述终端具体包括但不限:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture ExpertsGroup Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4,Moving PictureExperts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。
服务器200可以保存并维护问答对数据,其中,问答对数据可以来源于交互性平台。
服务器200可以通过本发明实施例的信息处理方法,对问答对、以及问答对的答复所在的页面进行处理。在本发明的一种应用示例中,问答对的答复所在的页面可以包括:问题区域和答复区域,其中,问题区域可以包括问题,答复区域可以包括答复。服务器200可以对问答对进行处理,以得到与问答对相匹配的关键词;进一步,服务器200可以在上述页面的答复区域中设置上述关键词的信息对应的页面元素,例如,可以直接在上述答复区域中添加上述关键词的信息对应的内容元素(如文本、图片等),又如,可以在上述答复区域中添加上述关键词的信息对应的链接元素,以供用户选择是否通过该链接元素查看上述关键词的信息。
在实际应用中,客户端100可以向用户提供接口,以使用户通过接口对该问答对的答复所在的页面进行访问。由于本发明实施例的所述页面可以包括:与所述问答对相匹配的关键词的信息对应的页面元素,故可以使用户通过该页面元素快速获取符合用户的信息意图的信息,由于可以节省用户的信息检索成本,因此可以提高用户对于所需信息的获取效率,且可以提升用户体验。
作为一种示例,上述接口可以包括搜索接口,用户可以通过上述搜索接口提交搜索词,以实现对于问题的搜索,并且,可以通过触发搜索结果页中的搜索结果,触发对于该问答对的答复所在的页面的加载请求,以触发该问答对的答复所在的页面的显示。
方法实施例一
参照图2,示出了本发明的一种信息处理方法实施例一的步骤流程图,具体可以包括如下步骤:
步骤201、确定与问答对相匹配的关键词;所述问答对可以包括:问题及其答复;
步骤202、在所述问答对的答复所在的页面中设置所述关键词的信息对应的页面元素。
图2所示实施例的至少一个步骤可由服务器执行,当然本发明实施例对于步骤的具体执行主体不加以限制。
上述关键词与问答对相匹配可以指上述关键词与问题及其答复均相匹配,故可以提高上述关键词与用户的信息意图之间的匹配度,进而使得上述关键词的信息符合用户的信息意图。
在本发明的一种可选实施例中,上述关键词可以为实体词,在问答对的答复中存在用户较为陌生或者想深入了解的事物或概念的场景下,该关键词可以与用户较为陌生或者想深入了解的事物或概念相匹配。
本发明实施例中,实体是一个具体事物或概念,实体一般会划分类型,例如人物类实体、电影类实体等;同一个实体可以对应多个实体实例,实体实例是在网络(或其它媒介)中对一个实体的描述性页面(内容),例如各种百科的页面中即包含实体对应的实体实例。实体词的例子可以包括但不限于:人名、地名、机构名、书名、歌名、影视剧名、产品名、品牌名等专有名词。在实际应用中,可以从互联网抓取实体相关数据,并对实体相关数据进行分析,以得到对应的实体词,并将该实体词存储至实体库,本发明实施例对于具体的实体词及其获取方式不加以限制。
在本发明的一种示例中,假设问题为“范冰冰的男友是谁”、以及该问题的答复为“李晨啊”,假设用户的信息意图为:想深入了解答复“李晨啊”中“李晨”的信息,则本发明实施例可以确定与问答对相匹配的关键词“李晨”,并在问答对的答复所在的页面中设置所述关键词“李晨”的信息对应的页面元素。
本发明实施例中,关键词与问题相匹配可以包括:关键词与问题相关。关键词与答复相匹配可以包括:关键词与答复包括的词汇相同、相近、相关等。
在本发明的一种可选实施例中,上述步骤201确定与问答对相匹配的关键词的过程,可以包括:从问答对的答复中获取与所述问答对的问题相关的词汇,作为与问答对相匹配的关键词。由于上述关键词为问答对的答复包含的词汇,且与问答对的问题相关,因此可以提高上述关键词与用户的信息意图之间的匹配度。
根据一种实施例,上述从问答对的答复中获取与所述问答对的问题相关的词汇的过程可以包括:
步骤A1、对问答对的问题进行意图识别,以得到该问题对应的问题意图;以及
步骤A2、从问答对的答复中获取与所述问题意图相匹配的词汇,作为与问答对相匹配的关键词。
问题意图可以指问题所表达的用户意图。例如问题“范冰冰的男友是谁”对应的问题意图可以为“人物查询”意图,又如问题“土耳其女排与中国女排哪个更强?”对应的问题意图可以为“选择”意图,再如问题“疯狂魔方是哪家公司的品牌”对应的问题意图可以为“品牌查询”意图,或者问题“助听器刚配到可以戴着到公共场所吗?”对应的问题意图可以为“是否”意图,等等。
在本发明的一种可选实施例中,步骤A1可以通过领域识别模块以及领域意图识别模块,对问答对的问题进行意图识别。
其中,领域识别模块可用于识别问题所属的领域;领域的例子可以包括:“奥运体育”、“地域问题”、“电脑数码”、“法律法规”、“健康生活”、“教育科学”、“经济金融”、“情感家庭”、“社会民生”、“休闲娱乐”、“医疗卫生”、“艺术文字”、“游戏”等,当然本发明实施例对于具体的领域不加以限制。
领域意图识别模块可用于在领域内识别问题对应的问题意图。根据一种实施例,意图识别可以看作是一个多分类任务,故领域意图识别模块可以通过分类器,在领域内识别问题对应的问题意图,其中,可以依据多个问题意图得到分类器的分类任务(一个问题意图可以对应一个分类任务),并依据多个问题意图对应的问答对语料得到的分类器的训练样本,例如,训练样本可以为问题语料及标注好的问题意图类别,在此基础上对训练样本进行训练以得到分类器。根据另一种实施例,领域意图识别模块可以通过问题意图语句模式,在领域内识别问题对应的问题意图,其中,问题意图语句模式可用于表示领域内问题意图所对应的语句模式,其可以包括至少一个关键词,且该至少一个关键词可以符合对应的语法规则;这样,可以基于问题与问题意图模式之间的匹配,得到问题对应的问题意图模式。
在步骤A1得到该问题对应的问题意图后,步骤A2可以从问答对的答复中获取与该问题意图相匹配的词汇;具体地,步骤A2可以将答复包括的词汇与该问题意图对应的关键词进行匹配,并将答复包括的与该问题意图对应的关键词匹配成功的词汇,作为与该问题意图相匹配的词汇。在实际应用中,一个问题意图可以对应有至少一个关键词,如“人物查询”意图对应的关键词可以包括:人物属性词等。
上述将答复包括的词汇与该问题意图对应的关键词进行匹配的过程可以包括:计算答复包括的词汇与该问题意图对应的关键词之间的匹配度,例如,分别确定答复包括的词汇对应的第一向量、以及该问题意图对应的关键词对应的第二向量,然后通过例如欧氏距离、马氏距离的方式确定第一向量和第二向量之间的语义相似度,根据该语义相似度得到答复包括的词汇与该问题意图对应的关键词之间的匹配度。可以理解,本发明实施例对于将答复包括的词汇与该问题意图对应的关键词进行匹配的具体过程不加以限制。
根据另一种实施例,上述从问答对的答复中获取与所述问答对的问题相关的词汇的过程可以包括:
步骤B1、确定问答对的问题对应的问题标签;
步骤B2、依据问题标签与链接词之间的映射关系,确定所述问题标签对应的目标链接词;
步骤B3、对所述问答对的答复包括的词汇与所述目标链接词进行匹配,将匹配成功的目标链接词作为与问答对相匹配的关键词。
本发明实施例通过问题标签、以及问题标签与链接词之间的映射关系,从问答对的答复中获取与所述问答对的问题相关的词汇。
本发明实施例中,问题标签可用于表征问题的关键特征。可选地,上述步骤B1确定问答对的问题对应的问题标签的过程,可以包括:从问答对的问题中抽取核心词;依据核心词与问题标签之间的映射关系,得到所述问答对的问题中核心词对应的问题标签,作为所述问答对的问题对应的问题标签。
在实际应用中,可以通过句法分析和/或语义分析等自然语言处理方式,从问答对的问题中抽取核心词。其中,句法分析是指对句子中的词语语法功能进行分析,依存句法分析是一种常见的句法分析方式,在实际应用中,依存句法分析结果可以包括:依存树,该依存树可用于表征问题包括的各词汇之间的依存关系,对该依存树进行分析,并根据分析结果从该依存树中抽取核心词。
在实际应用中,可以按照预置的提取规则,对该依存树进行分析,并根据分析结果从该依存树中抽取核心词,对应的抽取方式可以包括:
抽取方式1、若依存树中的疑问词后紧邻的词汇为名词或者名词短语,则提取所述名词或者名词短语作为所述核心词。
抽取方式2、若依存树中疑问词后紧跟着名词或者名词短语,那么该名词或者名词短语可能是用于表征问题意图的上述核心词;例如,问题“哪位科学家曾帮助犹太科学家逃出德国”可以对应“哪位科学家”、“哪位科学家曾帮助犹太科学家”等问题中,该问题中疑问词“哪位”后紧跟着名词“科学家”,故可以将“科学家”作为核心词。
抽取方式3、若依存树中的疑问词处于问题的末尾,则提取距离所述疑问词最近的名词或者名词短语,作为所述核心词。若疑问词处于问题的末尾,那么距离该疑问词最近的名词或者名词短语可以为核心词。例如,假设问题为“被誉为CD之父的是哪位”,其对应的问题包括:“被誉为CD之父的是哪”,该问题中距离疑问词“哪”最近的名词短语为“CD之父”,则该可以将“CD之父”作为核心词。假设问题为“范冰冰的男友是谁”,则核心词可以为“男友”或者“范冰冰的男友”或者“范冰冰”。
抽取方式4、若依存树中的疑问词后紧邻的词汇为动词,则提取所述问题中最后出现的名词或者名词短语,作为所述核心词。若疑问词后面跟着动词,那么问题中最后出现的名词或者名词短语可以为核心词。例如,假设问题为“中国戏曲中的人物按角色分为生、旦、净、末、丑,哪一个是女角色的统称”,该问题中疑问词“哪一个”跟着动词“是”,故可以将最后出现的名词短语“女角色的统称”作为核心词。
可以理解,本领域技术人员可以根据实际应用需求,采用上述抽取方式1至抽取方式4中的任一或者组合;并且,可以理解,上述抽取方式只是作为可选实施例,本发明实施例对于具体的抽取方式不加以限制。
本领域技术人员或者用户可以根据实际应用需求,预置核心词与问题标签之间的映射关系。可选地,问题标签可以包括核心词本身,还可以包括:核心词所属的类别词、相关词等。例如问题标签“娱乐八卦”对应的核心词可以包括明星及其明星对应的事物或者概念(如明星生活、明星作品等);又如,问题标签“范冰冰”对应的核心词可以包括与“范冰冰”相关的事物或者概念,“范冰冰”的亲朋好友、影视作品、获得的奖励等等。
以问题“范冰冰的男友是谁”为例,可以从中抽取核心词“范冰冰”,然后依据核心词与问题标签之间的映射关系,得到核心词“范冰冰”对应的问题标签:“范冰冰”、“娱乐八卦”等。
步骤B2可以依据问题标签与链接词之间的映射关系,确定步骤B1中问题标签对应的目标链接词。
在实际应用中,链接词可以为事物或概念对应的词汇,以使与问答对相匹配的关键词满足用户对于事物或概念的信息需求。可选地,该链接词可以为实体词。
在实际应用中,问题标签对应的链接词可以为问题标签本身,或者,问题标签对应的链接词可以与问题标签相关联。本发明实施例中,一个问题标签可以对应有至少一个标签词,标签词与链接词之间的关系可以包括:实体词与实体词之间的关系。
实体词与实体词之间的关系可以包括:
1)两个实体词e1和实体词e2在相同情景中出现,例如具有搭配关系的运动员等。
2)实体词e1和实体词e2的关系被人们广泛关注,例如两个具有亲朋好友关系的人名等。
3)实体词e1和实体词e2在某种定义的特征上很相似,例如两个歌星均出身于某选秀活动,彼此有很多共同特征。
假设本发明实施例可以提供问题标签对应的链接词的如下获取方式:
获取方式1:基于互联网语料共现统计的方式;确定与标签词共现在长度为L的窗口中的次数值排在前N1个的词汇作为标签词对应的链接词,其中N1为预设的自然数。其中,互联网语料可以包括:新闻语料、用户行为语料等,用户行为语料的例子可以包括:用户搜索行为语料、用户输入行为语料等。
获取方式2:基于词汇相似度计算的方式;确定标签词对应的第三向量、以及实体词对应的第四向量,计算第三向量与第四向量之间语义相似度,并依据该语义相似度得到与标签词相似的至少一个词汇,作为标签词对应的链接词。
可以理解,上述获取方式1至获取方式2只是作为问题标签对应的链接词的获取方式的示例,实际上,本领域技术人员可以根据实际应用需求,采用问题标签对应的链接词的任意获取方式,本发明实施例对于问题标签对应的链接词的具体获取方式不加以限制。
以问题标签为“范冰冰”为例,本发明实施例中问题标签与链接词之间的映射关系可以记录有与“范冰冰”相关联的链接词,如“李晨”、“我不是潘金莲”、“观音山”等,故步骤B2得到的目标链接词可以包括:“李晨”、“我不是潘金莲”、“观音山”等。
步骤B3可以对所述问答对的答复包括的词汇与步骤B2得到的目标链接词进行匹配,将匹配成功的目标链接词作为与问答对相匹配的关键词。例如,可以将答复“李晨啊”包括的词汇与“李晨”、“我不是潘金莲”、“观音山”等目标链接词进行匹配,以得到匹配成功的目标链接词“李晨”。
以上通过具体的实施例对步骤201确定与问答对相匹配的关键词的过程进行了详细介绍,可以理解,上述实施例只是作为可选的实施例,而不理解为对于本发明实施例的限制,实际上本领域技术人员可以根据实际应用需求,采用所需的方案确定与问答对相匹配的关键词,本发明实施例对于步骤201确定与问答对相匹配的关键词的具体过程不加以限制。
步骤202可以在所述问答对的答复所在的页面中设置步骤201得到的所述关键词的信息对应的页面元素。
在实际应用中,所述关键词的信息可以源自至少一个信息平台,其中,在上述关键词的信息源自多个信息平台时,上述关键词的信息可以为聚合信息,因此可以提高信息的丰富度。其中,信息平台可以包括:例如百科平台、知乎平台、问答平台、指南平台的知识类型平台,当然,关键词的信息还可以源自垂直平台,如书评网站、影评网站等,本发明实施例对于关键词的信息对应的具体来源不加以限制。
在本发明的一种示例中,可通过信息库保存链接词的信息,以从该信息库中获取关键词的信息。例如,可以从至少一个信息平台收集链接词的信息,对来自至少一个信息平台进行聚合,以得到结构化的聚合信息,并将结构化的聚合信息保存至信息库。其中,结构化信息可以指通过二维表结构逻辑表达的信息,上述二维表结构可以包括:字段及字段的值;且字段之间可以具有明确的层次结构,其使用和维护通过数据库进行管理,可以理解,本发明实施例对于具体的结构化信息不加以限制。
在本发明的一种可选实施例中,所述页面元素具体可以包括:
用于承载所述关键词的信息的内容元素,如文本、图片元素等;或者
用于指向所述关键词的信息的链接元素。
可选地,所述在所述问答对的答复所在的页面中设置所述关键词的信息对应的页面元素所采用的设置方式,具体可以包括:
设置方式1、在所述问答对的答复所在的页面中,针对与所述关键词相匹配的文本添加用于指向所述关键词的信息的链接元素;或者
设置方式2、在所述问答对的答复所在的页面的预设区域,添加用于指向所述关键词的信息的链接元素;其中,所述预设区域可以为与所述关键词相匹配的文本对应的周围区域。
与所述关键词相匹配的文本可以为答复中与关键词相匹配的文本。
对于设置方式1,如答复“李晨啊”与关键词“李晨”相匹配的文本为“李晨”,故可以针对如答复“李晨啊”中的文本“李晨”添加用于指向“李晨”的信息的链接元素。
对于设置方式2,可以在与所述关键词相匹配的文本对应的周围区域,添加用于指向所述关键词的信息的链接元素,上述链接元素位于与所述关键词相匹配的文本对应的周围区域,故可以增加链接元素与页面中原有文本如答复文本之间的联系,增加用户对于该链接元素的点击率。
综上,本发明实施例的信息处理方法,上述关键词与问答对相匹配可以指上述关键词与问题及其答复均相匹配,故可以提高上述关键词与用户的信息意图之间的匹配度,进而使得上述关键词的信息符合用户的信息意图;本发明实施例在上述问答对的答复所在的页面中设置上述关键词的信息对应的页面元素,可以使用户通过该页面元素快速获取符合用户的信息意图的信息,节省用户的信息检索成本,提高用户对于所需信息的获取效率,且可以提升用户体验。
本发明实施例可以应用于问答对的答复中存在用户较为陌生或者想深入了解的事物或概念的场景,在该场景下,上述关键词可以与该事物或概念相匹配,上述关键词的信息可以为该事物或概念对应的知识(如事物或概念对应的事实、信息的描述或在教育和实践中获得的技能知识等),故可以使用户通过上述关键词的信息更好地了解该事物或概念,因此可以满足用户的信息需求。
方法实施例二
参照图3,示出了本发明的一种信息处理方法实施例二的步骤流程图,具体可以包括如下步骤:
步骤301、接收用户针对问答对的答复所在页面的加载请求;所述问答对可以包括:问题及其答复;
步骤302、响应于所述加载请求,显示所述页面;所述页面可以包括:与所述问答对相匹配的关键词的信息对应的页面元素。
图3所示实施例的至少一个步骤可由客户端执行,当然本发明实施例对于步骤的具体执行主体不加以限制。
本发明实施例在问答对的答复所在的页面中设置关键词的信息对应的页面元素,而该关键词与上述问答对相匹配,故可以符合用户的信息意图,这样本发明实施例可以使用户通过该页面元素快速获取符合用户的信息意图的信息,由于可以节省用户的信息检索成本,因此可以提高用户对于所需信息的获取效率,且可以提升用户体验。
本发明实施例对于上述加载请求的触发方式不加以限制。例如,在接收到用户通过上述搜索接口提交的搜索词时,可以向用户呈现搜索结果页,该搜索结果页可以包括搜索词对应的若干个搜索结果,每个搜索结果可以包括问答对的摘要信息;当接收到用户对于搜索结果页中搜索结果的触发请求时,可以将该触发请求作为对于该问答对的答复所在的页面的加载请求,以触发该问答对的答复所在的页面的显示。
在本发明的一种可选实施例中,所述页面元素可以包括:
用于承载所述关键词的信息的内容元素;也即,可以直接通过文本等内容元素在页面中显示该关键词的信息。或者
用于指向所述关键词的信息的链接元素;也即,可以在页面中设置用于指向所述关键词的信息的链接。
可选地,所述链接元素可以被添加于所述页面中与所述关键词相匹配的文本之上;或者
所述链接元素可以位于所述页面的预设区域;所述预设区域为与所述关键词相匹配的文本对应的周围区域。
在实际应用中,所述关键词的信息可以源自至少一个信息平台,其中,在上述关键词的信息源自多个信息平台时,上述关键词的信息可以为聚合信息,因此可以提高信息的丰富度。其中,信息平台可以包括:例如百科平台、知乎平台、问答平台、指南平台的知识类型平台,当然,关键词的信息还可以源自垂直平台,如书评网站、影评网站等,本发明实施例对于关键词的信息对应的具体来源不加以限制。
在本发明的一种可选实施例中,本发明实施例的方法还的包括:响应于用户针对所述链接元素的触发操作,显示所述关键词的信息。例如,在接收到该触发操作后,可以跳转至关键词的信息页面,并通过该信息页面显示该关键词的信息。上述关键词的信息可以为聚合信息,因此可以提高信息的丰富度,使得用户更好地理解答复,提升用户体验。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的运动动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的运动动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的运动动作并不一定是本发明实施例所必须的。
装置实施例
参照图4,示出了本发明的一种信息处理装置实施例的结构框图,具体可以包括:
关键词确定模块401,用于确定与问答对相匹配的关键词;所述问答对可以包括:问题及其答复;以及
页面元素设置模块402,用于在所述问答对的答复所在的页面中设置所述关键词的信息对应的页面元素。
可选地,所述关键词确定模块401可以包括:意图识别子模块和关键词获取子模块;
其中,所述意图识别子模块,用于对所述问答对的问题进行意图识别,以得到所述问题对应的问题意图;
所述关键词获取子模块,用于从所述问答对的答复中获取与所述问题意图相匹配的词汇,作为与问答对相匹配的关键词。
可选地,所述关键词确定模块401可以包括:问题标签确定子模块、目标链接词确定子模块和匹配子模块;
其中,所述问题标签确定子模块,用于确定问答对的问题对应的问题标签;
所述目标链接词确定子模块,用于依据所述问题标签与链接词之间的映射关系,确定所述问题标签对应的目标链接词;
所述匹配子模块,用于对所述问答对的答复可以包括的词汇与所述目标链接词进行匹配,将匹配成功的目标链接词作为与问答对相匹配的关键词。
可选地,所述问题标签确定子模块可以包括:核心词抽取单元和问题标签获取单元;
其中,所述核心词抽取单元,用于从所述问答对的问题中抽取核心词;
所述问题标签获取单元,用于依据所述核心词与所述问题标签之间的映射关系,得到所述问答对的问题中核心词对应的问题标签,作为所述问答对的问题对应的问题标签。
可选地,所述页面元素可以包括:
用于承载所述关键词的信息的内容元素;或者
用于指向所述关键词的信息的链接元素。
可选地,所述页面元素设置模块402可以包括:第一添加子模块、或者第二添加子模块;
其中,所述第一添加子模块,用于在所述问答对的答复所在的页面中,针对与所述关键词相匹配的文本添加用于指向所述关键词的信息的链接元素;
所述第二添加子模块,用于在所述问答对的答复所在的页面的预设区域,添加用于指向所述关键词的信息的链接元素;其中,所述预设区域为与所述关键词相匹配的文本对应的周围区域。
参照图5,示出了本发明的一种信息处理装置实施例的结构框图,具体可以包括:
加载请求接收模块501,用于接收用户针对问答对的答复所在页面的加载请求;所述问答对可以包括:问题及其答复;以及
页面显示模块502,用于响应于所述加载请求,显示所述页面;所述页面可以包括:与所述问答对相匹配的关键词的信息对应的页面元素。
可选地,所述页面元素可以包括:
用于承载所述关键词的信息的内容元素;或者
用于指向所述关键词的信息的链接元素。
可选地,所述链接元素被添加于所述页面中与所述关键词相匹配的文本之上;或者
所述链接元素位于所述页面的预设区域;所述预设区域为与所述关键词相匹配的文本对应的周围区域。
可选地,所述装置还可以包括:
信息显示模块,用于响应于用户针对所述链接元素的触发操作,显示所述关键词的信息。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例提供了一种用于信息处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:确定与问答对相匹配的关键词;所述问答对包括:问题及其答复;在所述问答对的答复所在的页面中设置所述关键词的信息对应的页面元素。
可选地,所述确定与问答对相匹配的关键词,包括:
对所述问答对的问题进行意图识别,以得到所述问题对应的问题意图;
从所述问答对的答复中获取与所述问题意图相匹配的词汇,作为与问答对相匹配的关键词。
可选地,所述确定与问答对相匹配的关键词,包括:
确定问答对的问题对应的问题标签;
依据所述问题标签与链接词之间的映射关系,确定所述问题标签对应的目标链接词;
对所述问答对的答复包括的词汇与所述目标链接词进行匹配,将匹配成功的目标链接词作为与问答对相匹配的关键词。
可选地,所述确定问答对的问题对应的问题标签,包括:
从所述问答对的问题中抽取核心词;
依据所述核心词与所述问题标签之间的映射关系,得到所述问答对的问题中核心词对应的问题标签,作为所述问答对的问题对应的问题标签。
可选地,所述页面元素包括:
用于承载所述关键词的信息的内容元素;或者
用于指向所述关键词的信息的链接元素。
可选地,所述在所述问答对的答复所在的页面中设置所述关键词的信息对应的页面元素,包括:
在所述问答对的答复所在的页面中,针对与所述关键词相匹配的文本添加用于指向所述关键词的信息的链接元素;或者
在所述问答对的答复所在的页面的预设区域,添加用于指向所述关键词的信息的链接元素;其中,所述预设区域为与所述关键词相匹配的文本对应的周围区域。
本发明实施例提供了一种用于信息处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:接收用户针对问答对的答复所在页面的加载请求;所述问答对包括:问题及其答复;响应于所述加载请求,显示所述页面;所述页面包括:与所述问答对相匹配的关键词的信息对应的页面元素。
可选地,所述页面元素包括:
用于承载所述关键词的信息的内容元素;或者
用于指向所述关键词的信息的链接元素。
可选地,所述链接元素被添加于所述页面中与所述关键词相匹配的文本之上;或者
所述链接元素位于所述页面的预设区域;所述预设区域为与所述关键词相匹配的文本对应的周围区域。
可选地,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
响应于用户针对所述链接元素的触发操作,显示所述关键词的信息。
图6是根据一示例性实施例示出的一种用于信息处理的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图6,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音信息处理模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频信息处理(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由终端的处理器执行时,使得终端能够执行一种信息处理方法,所述方法包括:接收用户针对问答对的答复所在页面的加载请求;所述问答对包括:问题及其答复;响应于所述加载请求,显示所述页面;所述页面包括:与所述问答对相匹配的关键词的信息对应的页面元素。
图7是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行一种信息处理方法,所述方法包括:确定与问答对相匹配的关键词;所述问答对包括:问题及其答复;在所述问答对的答复所在的页面中设置所述关键词的信息对应的页面元素。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种信息处理方法、一种信息处理装置和一种用于信息处理的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (16)

1.一种信息处理方法,其特征在于,所述方法包括:
确定与问答对相匹配的关键词;所述问答对包括:问题及其答复;
在所述问答对的答复所在的页面中设置所述关键词的信息对应的页面元素。
2.根据权利要求1所述的方法,其特征在于,所述确定与问答对相匹配的关键词,包括:
对所述问答对的问题进行意图识别,以得到所述问题对应的问题意图;
从所述问答对的答复中获取与所述问题意图相匹配的词汇,作为与问答对相匹配的关键词。
3.根据权利要求1所述的方法,其特征在于,所述确定与问答对相匹配的关键词,包括:
确定问答对的问题对应的问题标签;
依据所述问题标签与链接词之间的映射关系,确定所述问题标签对应的目标链接词;
对所述问答对的答复包括的词汇与所述目标链接词进行匹配,将匹配成功的目标链接词作为与问答对相匹配的关键词。
4.根据权利要求3所述的方法,其特征在于,所述确定问答对的问题对应的问题标签,包括:
从所述问答对的问题中抽取核心词;
依据所述核心词与所述问题标签之间的映射关系,得到所述问答对的问题中核心词对应的问题标签,作为所述问答对的问题对应的问题标签。
5.根据权利要求1至4中任一所述的方法,其特征在于,所述页面元素包括:
用于承载所述关键词的信息的内容元素;或者
用于指向所述关键词的信息的链接元素。
6.根据权利要求5所述的方法,其特征在于,所述在所述问答对的答复所在的页面中设置所述关键词的信息对应的页面元素,包括:
在所述问答对的答复所在的页面中,针对与所述关键词相匹配的文本添加用于指向所述关键词的信息的链接元素;或者
在所述问答对的答复所在的页面的预设区域,添加用于指向所述关键词的信息的链接元素;其中,所述预设区域为与所述关键词相匹配的文本对应的周围区域。
7.一种信息处理方法,其特征在于,包括:
接收用户针对问答对的答复所在页面的加载请求;所述问答对包括:问题及其答复;
响应于所述加载请求,显示所述页面;所述页面包括:与所述问答对相匹配的关键词的信息对应的页面元素。
8.根据权利要求7所述的方法,其特征在于,所述页面元素包括:
用于承载所述关键词的信息的内容元素;或者
用于指向所述关键词的信息的链接元素。
9.根据权利要求8所述的方法,其特征在于,所述链接元素被添加于所述页面中与所述关键词相匹配的文本之上;或者
所述链接元素位于所述页面的预设区域;所述预设区域为与所述关键词相匹配的文本对应的周围区域。
10.根据权利要求8或9所述的方法,其特征在于,所述方法还包括:
响应于用户针对所述链接元素的触发操作,显示所述关键词的信息。
11.一种信息处理装置,其特征在于,包括:
关键词确定模块,用于确定与问答对相匹配的关键词;所述问答对包括:问题及其答复;以及
页面元素设置模块,用于在所述问答对的答复所在的页面中设置所述关键词的信息对应的页面元素。
12.一种信息处理装置,其特征在于,包括:
加载请求接收模块,用于接收用户针对问答对的答复所在页面的加载请求;所述问答对包括:问题及其答复;以及
页面显示模块,用于响应于所述加载请求,显示所述页面;所述页面包括:与所述问答对相匹配的关键词的信息对应的页面元素。
13.一种用于信息处理的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定与问答对相匹配的关键词;所述问答对包括:问题及其答复;
在所述问答对的答复所在的页面中设置所述关键词的信息对应的页面元素。
14.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至6中一个或多个所述的信息处理方法。
15.一种用于信息处理的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
接收用户针对问答对的答复所在页面的加载请求;所述问答对包括:问题及其答复;
响应于所述加载请求,显示所述页面;所述页面包括:与所述问答对相匹配的关键词的信息对应的页面元素。
16.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求7至10中一个或多个所述的信息处理方法。
CN201711048819.5A 2017-10-31 2017-10-31 一种信息处理方法、装置和用于信息处理的装置 Pending CN110019705A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711048819.5A CN110019705A (zh) 2017-10-31 2017-10-31 一种信息处理方法、装置和用于信息处理的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711048819.5A CN110019705A (zh) 2017-10-31 2017-10-31 一种信息处理方法、装置和用于信息处理的装置

Publications (1)

Publication Number Publication Date
CN110019705A true CN110019705A (zh) 2019-07-16

Family

ID=67186724

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711048819.5A Pending CN110019705A (zh) 2017-10-31 2017-10-31 一种信息处理方法、装置和用于信息处理的装置

Country Status (1)

Country Link
CN (1) CN110019705A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111914072A (zh) * 2020-07-14 2020-11-10 青岛聚好联科技有限公司 一种信息交互方法、设备及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100834128B1 (ko) * 2006-10-16 2008-06-02 유석호 게시물을 이용한 광고 서비스 방법 및 그 시스템
CN101477563A (zh) * 2009-01-21 2009-07-08 北京百问百答网络技术有限公司 一种短文本聚类的方法、系统及其数据处理装置
CN104573028A (zh) * 2015-01-14 2015-04-29 百度在线网络技术(北京)有限公司 实现智能问答的方法和系统
CN106874467A (zh) * 2017-02-15 2017-06-20 百度在线网络技术(北京)有限公司 用于提供搜索结果的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100834128B1 (ko) * 2006-10-16 2008-06-02 유석호 게시물을 이용한 광고 서비스 방법 및 그 시스템
CN101477563A (zh) * 2009-01-21 2009-07-08 北京百问百答网络技术有限公司 一种短文本聚类的方法、系统及其数据处理装置
CN104573028A (zh) * 2015-01-14 2015-04-29 百度在线网络技术(北京)有限公司 实现智能问答的方法和系统
CN106874467A (zh) * 2017-02-15 2017-06-20 百度在线网络技术(北京)有限公司 用于提供搜索结果的方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111914072A (zh) * 2020-07-14 2020-11-10 青岛聚好联科技有限公司 一种信息交互方法、设备及装置

Similar Documents

Publication Publication Date Title
CN109522419B (zh) 会话信息补全方法及装置
CN110770694B (zh) 获得来自多个语料库的响应信息
CN114072832A (zh) 用于助理系统的基于记忆的对话推理和问答
CN109614482B (zh) 标签的处理方法、装置、电子设备及存储介质
CN109918669B (zh) 实体确定方法、装置及存储介质
EP3403169A1 (en) User interface for multivariate searching
CN105701254A (zh) 一种信息处理方法和装置、一种用于信息处理的装置
CN110222256B (zh) 一种信息推荐方法、装置和用于信息推荐的装置
CN108446320A (zh) 一种数据处理方法、装置和用于数据处理的装置
WO2019109663A1 (zh) 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置
CN108345625B (zh) 一种信息挖掘方法和装置、一种用于信息挖掘的装置
CN108073606A (zh) 一种新闻推荐方法和装置、一种用于新闻推荐的装置
CN111708943A (zh) 一种搜索结果展示方法、装置和用于搜索结果展示的装置
CN107515869B (zh) 一种搜索方法和装置、一种用于搜索的装置
CN110019675A (zh) 一种关键词提取的方法及装置
CN110391966A (zh) 一种消息处理方法、装置和用于消息处理的装置
CN107515870A (zh) 一种搜索方法和装置、一种用于搜索的装置
CN108959296A (zh) 网页访问错误的处理方法和装置
CN108717403B (zh) 一种处理方法、装置和用于处理的装置
CN109814730A (zh) 输入方法和装置、用于输入的装置
CN111752436A (zh) 一种推荐方法、装置和用于推荐的装置
CN110019705A (zh) 一种信息处理方法、装置和用于信息处理的装置
CN110399468A (zh) 一种数据处理方法、装置和用于数据处理的装置
CN110110046A (zh) 同名实体推荐方法及装置
CN106156299B (zh) 文本信息的主题内容识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination