CN102314458B - 网络百科数据获取方法及系统 - Google Patents

网络百科数据获取方法及系统 Download PDF

Info

Publication number
CN102314458B
CN102314458B CN201010222402.8A CN201010222402A CN102314458B CN 102314458 B CN102314458 B CN 102314458B CN 201010222402 A CN201010222402 A CN 201010222402A CN 102314458 B CN102314458 B CN 102314458B
Authority
CN
China
Prior art keywords
task agent
entry
encyclopaedia
user terminal
encyclopaedia data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010222402.8A
Other languages
English (en)
Other versions
CN102314458A (zh
Inventor
王京津
邓亮
支静
严冰
王清明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201010222402.8A priority Critical patent/CN102314458B/zh
Publication of CN102314458A publication Critical patent/CN102314458A/zh
Application granted granted Critical
Publication of CN102314458B publication Critical patent/CN102314458B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及一种网络百科数据获取方法,包括:根据百科数据库内的历史数据生成任务包,所述任务包包括词条和编辑词条的提示信息;将所述任务包推送到用户终端;接收所述用户终端上传的根据所述任务包中的编辑词条的提示信息对所述词条编辑后生成的百科数据,并将所述百科数据存入所述百科数据库。本发明涉及一种网络百科数据获取系统。本发明通过下发任务包的方式来获取网络用户上传的百科数据,降低获得的百科数据的冗余程度,并可以有针对性地对百科数据进行完整性的编辑,从而使这些数据进入系统后不会占用较多的系统资源,进而减轻了系统的处理负担,形成有意义的百科数据。

Description

网络百科数据获取方法及系统
技术领域
本发明涉及网络数据处理技术,尤其涉及一种网络上百科数据的获取方法及获取系统。
背景技术
随着互联网的逐渐普及和应用,人们逐渐改变了传统的获取信息的方式,形成了通过网络来获取需要的信息的新的信息获取方式。而网络使得信息的采集传播的速度和规模都达到了空前的水平,其带来的副作用是这些汹涌而来的信息给人们的认知带来了困难,人们很难在信息海洋中迅速准确地获取自己所需的信息。为了获取有用的信息,已有一些公司和组织开发出搜索引擎等工具试图帮助人们尽量容易的获取所需要的信息。
在这些信息中,知识型信息由于其完整性和权威性往往成为人们更希望获得的信息,而传统的知识型信息,例如纸质百科全书或辞典中记载的信息已经无法适应信息爆炸下的人们的需要。因此出现了网络百科的业务形式,即在网络上建立信息量更大、更新更为迅速的网络百科数据查询系统,使得人们能够更容易的查询到需要的知识。
现有的网络百科数据查询系统的百科数据是通过网络用户自发上传,再由一些领域专家对上传数据进行人工审核而形成的,这种方式确保了作为百科数据的信息的来源广泛,而且获取迅速,但也带来了一定的问题。
在现有的网络百科数据查询系统中,网络用户自发向系统上传的百科数据通常是无限制的,可能存在着大量的冗余数据,而且在冗余数据中也可能存在有些数据内容或形式上不完整,这些数据在进入系统后会占用大量的系统资源,增加系统的处理负担,而且也可能难以形成有意义的百科数据。
发明内容
本发明的目的是提出一种网络百科数据获取方法及系统,能够在获取百科数据时降低系统的处理负担,尽量减少占用的系统资源。
为实现上述目的,本发明提供了一种网络百科数据获取方法,包括:
根据百科数据库内的历史数据生成任务包,所述任务包包括词条和编辑词条的提示信息;
将所述任务包推送到用户终端;
接收所述用户终端上传的根据所述任务包中的编辑词条的提示信息对所述词条编辑后生成的百科数据,并将所述百科数据存入所述百科数据库。
进一步的,所述编辑词条的提示信息为已有词条的编辑提示信息或新词条的定义创建信息。
进一步的,所述用户终端接收到所述任务包后,选择接受或更换所述任务包,如果选择接受所述任务包,则对所述任务包进行解析,获得词条和编辑词条的提示信息以进行词条编辑;如果选择更换所述任务包,则返回更换所述任务包的请求。
进一步的,所述任务包中包括至少一个词条,在所述用户终端接受所述任务包后,对所述任务包进行解析,获得词条和编辑词条的提示信息,并对所述至少一个词条进行编辑,或返回更换所述任务包中的至少一个词条的请求。
进一步的,所述将任务包推送到用户终端的操作具体为:将所述任务包推送到至少一个指定用户终端。
进一步的,在接收所述用户终端上传的百科数据后,对所述百科数据进行审核和任务完成程度的反馈。
进一步的,对所述用户终端上传的百科数据进行完成程度、复杂度和/或编辑质量的评分,并根据所述评分进行排序,生成排序结果。
为实现上述目的,本发明提供了一种网络百科数据获取系统,包括:
百科数据库,用于保存百科数据;
任务包生成服务器,用于根据百科数据库内的历史数据生成任务包,所述任务包包括词条和编辑词条的提示信息;
任务包分发服务器,用于将所述任务包推送到用户终端;
百科数据处理服务器,用于接收所述用户终端上传的根据所述任务包中的编辑词条的提示信息对所述词条编辑后生成的百科数据,并将所述百科数据存入所述百科数据库。
进一步的,所述编辑词条的提示信息为已有词条的编辑提示信息或新词条的定义创建信息。
进一步的,任务包生成服务器还包括:
任务包/词条更换模块,用于接收所述用户终端返回的更换任务包/词条的请求,并根据所述请求触发任务包生成服务器生成新的任务包。
进一步的,所述用户终端为至少一个指定用户终端。
进一步的,还包括:
百科数据审核服务器,用于对所述用户终端上传的百科数据进行审核和任务完成程度的反馈。
进一步的,还包括:
排序服务器,用于对所述用户终端上传的百科数据进行完成程度、复杂度和/或编辑质量的评分,并根据所述评分进行排序,生成排序结果。
基于上述技术方案,本发明通过下发任务包的方式来获取网络用户上传的百科数据,降低获得的百科数据的冗余程度,并可以有针对性地对百科数据进行完整性的编辑,从而使这些数据进入系统后不会占用较多的系统资源,进而减轻了系统的处理负担,形成有意义的百科数据。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明网络百科数据获取方法的第一实施例的流程示意图。
图2为本发明网络百科数据获取方法的第二实施例的流程示意图。
图3为本发明网络百科数据获取方法的第三实施例的流程示意图。
图4为本发明网络百科数据获取方法的第四实施例的流程示意图。
图5为本发明网络百科数据获取系统的第一实施例的结构示意图。
图6为本发明网络百科数据获取系统的第二实施例的结构示意图。
图7为本发明网络百科数据获取系统的第三实施例的结构示意图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
如图1所示,为本发明网络百科数据获取方法的第一实施例的流程示意图。在本实施例中,网络百科数据获取流程包括:
步骤101、根据百科数据库内的历史数据生成任务包,所述任务包包括词条和编辑词条的提示信息;
步骤102、将所述任务包推送到用户终端;
步骤103、接收所述用户终端上传的根据所述任务包中的编辑词条的提示信息对所述词条编辑后生成的百科数据;
步骤104、将所述百科数据存入所述百科数据库。
在本实施例中,系统可以根据百科数据库中的历史数据有针对性的生成任务包,例如检查到百科数据库中的已有词条的内容或形式上不完整,需要词条的补完,此时可以将该已有词条添加到任务包中,提供给网络用户;又例如针对目前的热点话题形成新词条,也可以添加到任务包中。在任务包的生成过程中,系统可以针对各个词条的编辑情况进行挑选,对于已经充分编辑的词条可能就不再作为任务下发了,而对于网络用户经常性查询的词条或者被编辑次数较少的词条,则可以优先选入任务包。
在任务包中可以包括至少一个词条,在下发到用户终端并被用户终端接受后,网络用户可以对至少一个词条进行批量编辑。系统在生成任务包时,可以在任务包中包括同一类型的词条,也可以包括多个类型的词条。在下发时,系统可以根据记录的多个用户终端的历史编辑情况,将生成的任务包推送到指定用户终端,对于经常性编辑某类词条的网络用户,如果接收到包括该类词条的任务包,则可能更容易地完成较高质量的词条编辑。这种有针对性地用户终端推送可以进一步的提高可能获得的百科数据的质量,进而减轻系统的处理负担,形成更有效的百科数据。
任务包在发送的时候可以采用定向的方式,即任务包推送到某一用户终端,也可以采用将多个任务包向多个指定用户终端推送的方式,这样多个用户终端可以同时接收到多个任务包,方便网络用户可以根据自身的知识状况选择能更好完成编辑任务的任务包,这样也可以避免系统根据历史编辑情况进行某一指定用户终端的推送可能对该网络用户并不合适的情况。
为了方便网络用户了解词条编辑的任务,在任务包中还设置了编辑词条的提示信息,主要分两类:已有词条的编辑提示信息或新词条的定义创建信息。提示信息可以包括一些文字性的帮助信息,也可以根据一些与词条相关的链接信息。
系统在接收到用户终端上传的百科数据后,为了确保百科数据的质量和形成有效的百科数据,系统还可以对该百科数据进行审核,审核工作可以在入百科数据库之前进行,也可以在入库之后统一进行。为了使网络用户了解到其任务的完成情况,系统在接收到用户终端上传的百科数据后,还会将任务完成程度反馈给用户终端。
如图2所示,为本发明网络百科数据获取方法的第二实施例的流程示意图。与上一实施例相比,本实施例在步骤102和步骤103之间增加了以下步骤:
步骤102a、用户终端接收到任务包后,选择接受或更换任务包,如果选择接受所述任务包,则执行步骤103,否则执行步骤102b;
步骤102b、返回更换任务包的请求;
步骤103a、对任务包进行解析,获得词条和编辑词条的提示信息以进行词条编辑。
系统在接收到更换任务包的请求时,将生成新的任务包或者一生成的任务包再次进行下发。网络用户可以根据自己的知识情况进行任务包的选择,由于某类词条对于某个网络用户更为熟悉,则更容易获得该类词条的准确信息,从而更容易形成较高质量的百科数据,在上传给系统后,可以形成更有效的百科数据。
如图3所示,为本发明网络百科数据获取方法的第三实施例的流程示意图。与上一实施例相比,本实施例在步骤102a和步骤103a之间增加了以下步骤:
步骤102c、在用户终端接受所述任务包后,任务包中包括至少一个词条,用户终端可以选择对任务包中的至少一个词条进行更换,如果选择更换,则执行步骤102d,否则执行步骤103a,来对任务包进行解析,获得词条和编辑词条的提示信息,并对所述至少一个词条进行编辑;
步骤102d、返回更换任务包中的至少一个词条的请求。
对于具有多个词条的任务包,网络用户可以选择其中的几个词条进行更换,而无需更换整个任务包,使网络用户接收词条编辑任务时更加灵活。
如图4所示,为本发明网络百科数据获取方法的第四实施例的流程示意图。与第一实施例相比,本实施例在步骤104之后还包括步骤105,即对用户终端上传的百科数据进行完成程度、复杂度和/或编辑质量的评分,并根据评分进行排序,生成排序结果。获得的排序结果对系统了解网络用户的贡献情况具有一定的参考意义。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
如图5所示,为本发明网络百科数据获取系统的第一实施例的结构示意图。在本实施例中,网络百科数据获取系统包括:百科数据库1、任务包生成服务器2、任务包分发服务器3和百科数据处理服务器4。其中百科数据库1负责保存百科数据。任务包生成服务器2用于根据百科数据库内的历史数据生成任务包,所述任务包包括词条和编辑词条的提示信息。任务包分发服务器3用于将所述任务包推送到用户终端。百科数据处理服务器4用于接收所述用户终端上传的根据所述任务包中的编辑词条的提示信息对所述词条编辑后生成的百科数据,并将所述百科数据存入百科数据库1。
本实施例中,任务包生成服务器根据百科数据库中的历史数据有针对性的生成任务包,再由任务包分发服务器将任务包发送到用户终端,从而引导用户在上传百科数据时能更有针对性,更容易形成有效的百科数据,同时也减轻了系统的处理负担。
在任务包中可以包括至少一个词条,在下发到用户终端并被用户终端接受后,网络用户可以对至少一个词条进行批量编辑。系统在生成任务包时,可以在任务包中包括同一类型的词条,也可以包括多个类型的词条。在下发时,系统可以根据记录的多个用户终端的历史编辑情况,将生成的任务包推送到指定用户终端。
任务包在发送的时候可以采用定向的方式,即任务包推送到某一用户终端,也可以采用将多个任务包向多个指定用户终端推送的方式,这样多个用户终端可以同时接收到多个任务包,方便网络用户可以根据自身的知识状况选择能更好完成编辑任务的任务包,这样也可以避免系统根据历史编辑情况进行某一指定用户终端的推送可能对该网络用户并不合适的情况。
为了方便网络用户了解词条编辑的任务,在任务包中还设置了编辑词条的提示信息,主要分两类:已有词条的编辑提示信息或新词条的定义创建信息。提示信息可以包括一些文字性的帮助信息,也可以根据一些与词条相关的链接信息。
系统在接收到用户终端上传的百科数据后,为了确保百科数据的质量和形成有效的百科数据,在本发明的另一实施例中,网络百科数据获取系统还可以包括百科数据审核服务器,用来完成对所述用户终端上传的百科数据进行审核,百科数据审核服务器还可以完成任务完成程度的反馈,使网络用户了解到其任务的完成情况。
如图6所示,为本发明网络百科数据获取系统的第二实施例的结构示意图。与上一实施例相比,本实施例还包括任务包/词条更换模块5,用于接收用户终端返回的更换任务包/词条的请求,并根据请求触发任务包生成服务器生成新的任务包。
网络用户可以根据自己的知识情况进行任务包的选择,由于某类词条对于某个网络用户更为熟悉,则更容易获得该类词条的准确信息,从而更容易形成较高质量的百科数据,在上传给系统后,可以形成更有效的百科数据。
对于具有多个词条的任务包,网络用户可以选择其中的几个词条进行更换,而无需更换整个任务包,使网络用户接收词条编辑任务时更加灵活。
图7为本发明网络百科数据获取系统的第三实施例的结构示意图。与第一实施例相比,本实施例还包括排序服务器6,该服务器负责对所述用户终端上传的百科数据进行完成程度、复杂度和/或编辑质量的评分,并根据所述评分进行排序,生成排序结果。获得的排序结果对系统了解网络用户的贡献情况具有一定的参考意义。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制;尽管参照较佳实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者对部分技术特征进行等同替换;而不脱离本发明技术方案的精神,其均应涵盖在本发明请求保护的技术方案范围当中。

Claims (12)

1.一种网络百科数据获取方法,包括:
根据百科数据库内的历史数据生成任务包,所述任务包包括词条和编辑词条的提示信息;
将所述任务包推送到用户终端;
接收所述用户终端返回的更换任务包的请求,生成新的任务包再次进行下发;
接收由接收到所述任务包的所述用户终端上传的根据所述任务包中的编辑词条的提示信息对所述词条编辑后生成的百科数据,并将所述百科数据存入所述百科数据库。
2.根据权利要求1所述的网络百科数据获取方法,其中所述编辑词条的提示信息为已有词条的编辑提示信息或新词条的定义创建信息。
3.根据权利要求1所述的网络百科数据获取方法,其中所述用户终端接收到所述任务包后,选择接受或更换所述任务包,如果选择接受所述任务包,则对所述任务包进行解析,获得词条和编辑词条的提示信息以进行词条编辑;如果选择更换所述任务包,则返回更换所述任务包的请求。
4.根据权利要求3所述的网络百科数据获取方法,其中所述任务包中包括至少一个词条,在所述用户终端接受所述任务包后,对所述任务包进行解析,获得词条和编辑词条的提示信息,并对所述至少一个词条进行编辑,或返回更换所述任务包中的至少一个词条的请求。
5.根据权利要求1所述的网络百科数据获取方法,其中所述将任务包推送到用户终端的操作具体为:将所述任务包推送到至少一个指定用户终端。
6.根据权利要求1所述的网络百科数据获取方法,其中在接收所述用户终端上传的百科数据后,对所述百科数据进行审核和任务完成程度的反馈。
7.根据权利要求1所述的网络百科数据获取方法,其中对所述用户终端上传的百科数据进行完成程度、复杂度和/或编辑质量的评分,并根据所述评分进行排序,生成排序结果。
8.一种网络百科数据获取系统,包括:
百科数据库,用于保存百科数据;
任务包生成服务器,用于根据百科数据库内的历史数据生成任务包,所述任务包包括词条和编辑词条的提示信息;
任务包分发服务器,用于将所述任务包推送到用户终端;
任务包/词条更换模块,用于接收所述用户终端返回的更换任务包/词条的请求,并根据所述请求触发任务包生成服务器生成新的任务包;
百科数据处理服务器,用于接收由接收到所述任务包的所述用户终端上传的根据所述任务包中的编辑词条的提示信息对所述词条编辑后生成的百科数据,并将所述百科数据存入所述百科数据库。
9.根据权利要求8所述的网络百科数据获取系统,其中所述编辑词条的提示信息为已有词条的编辑提示信息、或新词条的定义创建信息。
10.根据权利要求8所述的网络百科数据获取系统,其中所述用户终端为至少一个指定用户终端。
11.根据权利要求8所述的网络百科数据获取系统,其中还包括:
百科数据审核服务器,用于对所述用户终端上传的百科数据进行审核和任务完成程度的反馈。
12.根据权利要求8所述的网络百科数据获取系统,其中还包括:
排序服务器,用于对所述用户终端上传的百科数据进行完成程度、复杂度和/或编辑质量的评分,并根据所述评分进行排序,生成排序结果。
CN201010222402.8A 2010-06-30 2010-06-30 网络百科数据获取方法及系统 Active CN102314458B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010222402.8A CN102314458B (zh) 2010-06-30 2010-06-30 网络百科数据获取方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010222402.8A CN102314458B (zh) 2010-06-30 2010-06-30 网络百科数据获取方法及系统

Publications (2)

Publication Number Publication Date
CN102314458A CN102314458A (zh) 2012-01-11
CN102314458B true CN102314458B (zh) 2015-11-25

Family

ID=45427636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010222402.8A Active CN102314458B (zh) 2010-06-30 2010-06-30 网络百科数据获取方法及系统

Country Status (1)

Country Link
CN (1) CN102314458B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544308A (zh) * 2013-11-04 2014-01-29 北京中搜网络技术股份有限公司 一种信息词条的审核方法
CN104484374B (zh) * 2014-12-08 2018-11-16 百度在线网络技术(北京)有限公司 一种创建网络百科词条的方法及装置
CN109325642A (zh) * 2017-07-31 2019-02-12 北京搜狗科技发展有限公司 一种任务处理方法、装置、设备及机器可读存储介质
CN109598477B (zh) * 2017-09-30 2021-03-16 北京搜狗科技发展有限公司 词条编辑控制方法、设备及存储介质
CN108959436A (zh) * 2018-06-12 2018-12-07 苏州思必驰信息科技有限公司 用于语音对话平台的词库编辑方法及系统
CN113868538B (zh) * 2021-10-19 2024-04-09 北京字跳网络技术有限公司 信息处理方法、装置、设备及介质
CN115640790A (zh) * 2022-10-28 2023-01-24 北京字跳网络技术有限公司 信息处理方法、装置和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6149438A (en) * 1991-08-09 2000-11-21 Texas Instruments Incorporated System and method for the delivery, authoring, and management of courseware over a computer network
CN1645371A (zh) * 2005-02-23 2005-07-27 新浪网技术(中国)有限公司 一种基于搜索引擎技术的提问式知识聚合方法以及知识共享方法
CN101334784A (zh) * 2008-07-30 2008-12-31 施章祖 计算机辅助报告与知识库产生的方法
CN101398828A (zh) * 2007-09-28 2009-04-01 李凤仙 一种信息精确搜索和信息发布的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6149438A (en) * 1991-08-09 2000-11-21 Texas Instruments Incorporated System and method for the delivery, authoring, and management of courseware over a computer network
CN1645371A (zh) * 2005-02-23 2005-07-27 新浪网技术(中国)有限公司 一种基于搜索引擎技术的提问式知识聚合方法以及知识共享方法
CN101398828A (zh) * 2007-09-28 2009-04-01 李凤仙 一种信息精确搜索和信息发布的方法
CN101334784A (zh) * 2008-07-30 2008-12-31 施章祖 计算机辅助报告与知识库产生的方法

Also Published As

Publication number Publication date
CN102314458A (zh) 2012-01-11

Similar Documents

Publication Publication Date Title
CN102314458B (zh) 网络百科数据获取方法及系统
CN106529028B (zh) 一种工艺规程的自动生成方法
CN102609402B (zh) 一种基于实时策略的本体模型生成及管理装置及方法
CN105005642A (zh) 一种三维模型批量格式转换及轻量化方法
CN111078094B (zh) 分布式机器学习可视化装置
CN102999524B (zh) 一种文档关联检索方法及系统
Gu et al. Shape grammars: A key generative design algorithm
Liu et al. A new method of reusing the manufacturing information for the slightly changed 3D CAD model
US8706436B2 (en) Manufacture of engineering components with designed defects for analysis of production components
US20080282870A1 (en) Automated disc jockey
CN110502735B (zh) 一种电子设备通用工艺文件快速制作方法及系统
CN115238710B (zh) 一种文档智能生成与管理方法及装置
CN116644168A (zh) 一种交互数据构建方法、装置、设备及存储介质
CN110990907A (zh) 基于特征-资源知识的船用柴油机关重件可制造性三级优化方法
Neumann et al. Novel approach for shape-based similarity search enabled by 3D PDF
Deshayes et al. The use of process specification language for cutting processes
US20090259953A1 (en) Customizable Specification Library
CN101388006B (zh) 一种自动化的文摘实验装置与方法
Shah Key technology of CADDCAM integration for complex parts of marine diesel engine
CN110162791A (zh) 一种面向国防科技领域的文本关键词提取方法及系统
CN104102739B (zh) 一种扩充实体库的方法及装置
CN117216193B (zh) 基于大语言模型的可控文本生成方法及装置
Farazi et al. Model-based documentation
Schiller et al. Blisk Specific Query Language (BLISQL)–An approach for domain specific data querying in Blisk Manufacturing
Han et al. Construction of Machine News Production System Based on Graph Database and Natural Language Generating Technology

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant