CN1374603A - 互联网信息共享系统及其信息共享方法 - Google Patents

互联网信息共享系统及其信息共享方法 Download PDF

Info

Publication number
CN1374603A
CN1374603A CN 01109156 CN01109156A CN1374603A CN 1374603 A CN1374603 A CN 1374603A CN 01109156 CN01109156 CN 01109156 CN 01109156 A CN01109156 A CN 01109156A CN 1374603 A CN1374603 A CN 1374603A
Authority
CN
China
Prior art keywords
information
angle
semantic
provides
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 01109156
Other languages
English (en)
Inventor
刘莎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 01109156 priority Critical patent/CN1374603A/zh
Publication of CN1374603A publication Critical patent/CN1374603A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明涉及一种互联网信息共享系统及信息共享方法,包括:建立包括不同语言版本文件摘要信息通用模板、文件摘要信息统一代码数据库、文本语义标注通用模板和摘要、文本信息的统一语义代码多语转换浏览器的信息共享系统,并嵌入国际互联网系统中;用户利用不同语言版本文件摘要信息通用模板,对任意数据文件进行摘要信息输入、存储与检索,在统一语义代码多语转换浏览器上,实现共享信息浏览,和进一步访问存储于用户指定地址中的非文摘信息存储服务器。

Description

互联网信息共享系统及其信息共享方法
本发明涉及互联网技术,更确切地说是涉及互联网信息共享系统和利用该系统进行信息共享—发布与检索的方法。
虽然互联网至今没有给它们的风险投资商们带来可观的经济效益,但消费大众对互联网的热情却并未消退,利用互联网发电子邮件、看新闻、玩游戏、炒股票、聊天、远程教育、电子商务等,这主要得益于其廉价且方便的通讯工具功能。但是,如果互联网仅仅作为一个廉价的通讯工具,只能实现数据层面的信息共享,其应用和商业价值是不能得到真正体现的。
上网者都希望:凡发布信息,能及时到达所有需要者面前;凡寻求信息,都能无一遗漏地自动来到自己面前。换句话说,只有语义层面上的互联网信息共享,互联网才能发展成为名符其实并不可替代的全球信息共享系统,从而真正实现自身的应用和商业价值。因此,互联网除了是一个廉价的通讯工具之外,还应该是一个海量信息的共享俱乐部,即一个全球信息共享系统。
中国专利申请号为98101156.X、名称为“全息全选全程模板式人机对话语言翻译方法”,该方法包括:首先建立一个以句子为对象的自然语言全息受限对话模板,模板中包含有理解各种自然语言文字符号系统的所有必要语言信息要素;再在模板上通过全程全选式人机对话结果的多语转换确定任意自然语言符号串实际携带的词汇信息项和句法信息项,完成源语信息求解和译文语义查询。
此后,中国专利申请号为98125015.7、名称为“开放式全息全选全程模板式人机互补语言翻译方法”又对上述技术方案作出了改进与充实,包括:建立一个开放的以句子为对象的自然语言翻译多语通用人机对话全息模板,模板中包含有多语翻译人机对话所需的全部有限备用信息项;根据人机对话及用有限备用信息项解释任意新增文字符号的概念定义,求解各自然语言符号实际携带的所有信息项;系统自动转换生成以句子为单元的译文自然语言表达形式,并同时提供用译文符号标注的原文符号信息项求解清单,供译文用户在需要时进行查询。
上述方法所提出的是在计算机网络中适于各网络终端以不同自然语言进行信息传递交流的机器翻译方法。通过机器翻译处理使各网络终端用户仅使用自己的自然语言就可在网络上进行语义信息传递,在计算机网络中实现多语种语义信息交流,为提高网络信息的传递效率和实现网络信息资源的大众化国际共享,扫除了不同自然语言语义信息传递障碍。
申请人认为:将互联网建设成为名符其实的信息共享系统,在解决了不同自然语言语义信息传递障碍的情况下,还应着重解决三个基本技术:信息发布;信息存储;信息获取。从理论上讲,信息发布与信息获取是针对同一信息的“对称”行为,应该具有相同的数据关系模型,因此,问题的关键在于:能否在包括文本、符号、图像、声音、多媒体等的不同数据类型中,提取出通用的数据要素和结构。
本发明的目的是设计一种互联网信息共享系统及其信息共享方法,用于实现互联网全球信息共享,使互联网系统真正成为一个语义层面的全球信息共享系统。
实现本发明目的的技术方案是这样的:一种互联网信息共享系统的信息共享方法,其特征在于包括:
A.建立包括不同语言版本文件摘要信息通用模板和文件摘要信息统一代码数据库的信息共享系统;
B.进行共享信息存储时,用户在门户网站上,利用不同语言版本文件摘要信息通用模板,对任意数据文件进行文件摘要信息输入,系统将不同语言版本文件摘要信息的统一语义代码存储在文件摘要信息统一代码数据库中,和根据用户在不同语言版本文件摘要信息通用模板上的指定,将用户的非文件摘要信息文本存储于对应地址的数据存储服务器中;
C.进行共享信息检索与浏览时,用户在门户网站上,在不同语言版本文件摘要信息通用模板上选择并输入检索关键信息,系统搜索引擎搜索文件摘要信息统一代码数据库,根据存储信息与检索信息间的匹配度,对存储的文件摘要信息进行自动匹配与排序,供用户使用统一语义代码多语转换浏览器浏览,并通过自动链接供用户进一步访问所指定的非文件摘要信息存储服务器。
所述的步骤A中还包括,建立一个文本语义标注通用模板和统一语义代码多语转换浏览器;所述的步骤B中还包括,不同自然语言用户,在对任意数据文件进行文件摘要信息输入时还同时使用文本语义标注通用模板,对所输入的不同自然语言文字符号进行通用语义信息人机交互标注;所述的步骤C中还包括,不同自然语言用户,利用不同语言版本文件摘要信息通用模板选择并输入检索关键信息时,还利用统一语义代码多语转换浏览器,浏览以不同语言文字形式显示的关键字及关键句子信息。
所述的文本语义标注通用模板,是对不同自然语言符号,通过人机交互,标注多语通用概念定义、多语通用句法信息、多语通用时态信息、多语通用语态信息和多语通用语体信息。
所述的步骤B中,存储文摘信息是按用户在不同语言版本文件摘要信息通用模板上指定的保留时间请求,存储在所述的文件摘要信息统一代码数据库中。
所述的步骤B中,存储文摘信息是按用户所处地域,同时存储在该用户所在各自网站的文件摘要信息统一代码数据库中和各地的全球数据共享文件摘要信息镜像数据库中。
所述的步骤C中,系统搜索引擎搜索各自网站文件摘要信息统一代码数据库,还包括搜索全球数据共享文件摘要信息镜像数据库。
所述的不同语言版本文件摘要信息通用模板,包含有适于各种数据文件的信息综合分类通用要素,包括从信息发布或信息获取角度提供的功能选择要素项、文件标题要素项、从数据形式角度提供的数据分类要素项、从特殊符号与语义影射关系角度提供的语义要素项、从人类客观认知角度提供的知识分类要素项、从用户主观需求角度提供的应用分类要素项、从物理时空角度提供的消息分类要素项、从事件性质角度提供的主题分类要素项、和从信息对称关系角度提供的信息发布对象要素项。
所述的文件标题要素项是提供文本语义标注的要素项。
所述的从数据形式角度提供的数据分类要素项包括文字、图像及声音。
所述的从特殊符号与语义影射关系角度提供的语义要素项包括含域名、邮箱、公式的符号项与含人名、公司名、公式名的符号解析语义影射关系项。
所述的从人类客观认知角度提供的知识分类要素项是选择专业或普通领域分类,包括政治、经济、科学、文化、体育、卫生、军事、通讯、社会及其它。
所述的从人类客观认知角度提供的知识分类要素项,还包括填入关键词或经文本语义标注后的关键词进一步限定所选知识分类子类的分类项。
所述的从用户主观需求角度提供的应用分类要素包括衣、食、住、行、健康、学习、谋生、互动、交易、生活、综合、新闻及其它。
所述的从用户主观需求角度提供的应用分类要素,还包括填入关键词或经文本语义标注后的关键词进一步扩展所选应用分类下各子类的分类项。
所述的从物理时空角度提供的消息分类要素包括时间、地点、人物、行为、事件、物品、理论和工具。
所述的从物理时空角度提供的消息分类要素项,还包括填入关键词或经文本语义标注后的关键词,进一步限定所选消息分类的内容。
所述的从事件性质角度提供的主题分类要素项,包括状态、背景、关系、历史、影响和评价。
所述的从事件性质角度提供的主题分类要素,还包括填入关键词或经文本语义标注后的关键词,进一步限定所选主题分类的内容。
所述的从信息对称关系角度提供的信息发布对象分类要素项,包括企业、机构、个人、供方、需方、买方和卖方。
所述的从信息对称关系角度提供的信息发布对象分类要素项,还包括填入关键词或经文本语义标注后的关键词,进一步限定所选的信息发布对象分类。
还包括信息源要素项,包括选择提供者、域名或邮箱、提供时间、提供地点和保留时间或选择经文本语义标注后的提供者、域名或邮箱、提供时间、提供地点和保留时间。
实现本发明目的的技术方案还是这样的:一种互联网信息共享系统,其特征在于:包括建立不同语言版本文件摘要信息通用模板、文件摘要信息统一代码数据库、文本语义标注通用模板和统一语义代码多语转换浏览器,并嵌入国际互联网系统中。
本发明的互联网信息共享系统及其信息共享方法的技术方案,是通过建立通用数据关系模型、建立通用的信息存储数据库和建立通用的数据检索方法实现的;是通过提取出互联网不同数据类型文件中通用的数据要素和结构,同时提供通用信息存储数据库、通用数据检索方法和通用语义交流方法实现的。本发明的不同语言版本文件摘要信息通用模板上的所有分类要素项都可根据用户的使用情况进行调整。
本发明的互联网信息共享系统及其信息共享方法的技术方案,既简洁、可靠、实用,又可同时满足以上各条全球信息共享需求;既可与现有互联网信息共享方式并存,又不需要创建任何协议和通讯标准,还可移植到无线互联网络。因此,不仅将实实在在地为全球网民一步步实现信息共享,而且将有力地推动互联网信息服务业,使之走上一条可赢利的健康发展之路。
下面结合实施例及附图进一步说明本发明的技术方案。
图1是本发明的不同语言版本文件摘要信息通用模板结构示意图。
图2是本发明所应用的在先专利申请“文本语义标注通用模板”结构示意图。
图3是本发明互联网信息共享系统通用主流程中的信息加工与存储的步骤框图。
图4是是本发明互联网信息共享系统通用主流程中的信息转换与浏览的步骤框图。
图5是利用本发明的系统与方法进行共享信息综合服务的关系示意图。
参见图1,要将互联网建设成为一个名符其实的信息共享系统,首先要解决的总问题是建立起通用的共享信息数据库关系模型,而且这个关系模型必须包括两个层次的共享,即:“文件”信息共享和“文本”信息共享,同时还能向所有用户提供方便实用的信息存储-获取工具。
因为无论是文本文件还是非文本文件,其在互联网上存储与发布的基本单位皆为“文件”,但文件有多种数据类型,且每个文件的大小没有限制标准,因此难以为文件建立通用的数据库关系模型。但,任何类型的文件,均可提炼出可限定数据量的文字标题及文字信息摘要。
本发明的实现“文件”信息共享的基本方法就是建立一个“文摘”信息的通用输入模板,即不同语言版本文件摘要信息通用模板,也即文件信息共享关系模型。该通用模板应能适用于信息共享中的信息发布、信息存储与信息检索诸环节。
图中所示模板,以汉语方式标注出一“天鹅湖演出消息”的实施例文摘信息。
该文摘信息的通用标注模板包含有适于各种数据文件的十种信息综合分类通用要素:
(1)从信息发布或信息获取角度提供的功能选择要素项,对本实施例来说,可根据用户要求选择获取或发布;
(2)文件标题要素项,该文件标题要素项是可利用图2的标注模板进行多语种文本语义标注的要素项,本实施例的文件标题要素是“天鹅湖演出消息”;
(3)从数据形式角度提供的数据分类要素项,所述的从数据形式角度提供的数据分类要素项包括文字、图像及声音,本实施例的数据分类要素是文字;
(4)从特殊符号与语义影射关系角度提供的语义要素项,包括含域名、邮箱、公式的符号项与含人名、公司名、公式名等的符号解析语义影射关系项,用于进一步对文件标题进行具体解释,对本实施例来说可不对其作标注;
(5)从人类客观认知角度提供的知识分类要素项,是用于选择专业或普通领域的分类要素,包括政治、经济、科学、文化、体育、卫生、军事、通讯、社会及其它,该分类要素项,可再填入关键词或利用图2所示的标注模板进行多语种文本语义标注后的关键词,进一步限定所选知识分类的子类,本实施例所选的领域分类是文化,再填入的子分类的关键词是“戏剧”;
(6)从用户主观需求角度提供的应用分类要素项,包括衣、食、住、行、健康、学习、谋生、互动、交易、生活、综合、新闻及其它,该分类要素项,可再填入关键词或利用图2所示的标注模板进行多语种文本语义标注后的关键词,进一步扩展或新增所选应用分类及其分类下各子类,本实施例所选的应用分类是生活,再填入的子分类的关键词是“娱乐”;
(7)从物理时空角度提供的消息分类要素项,包括时间、地点、人物、行为、事件、物品、理论和工具,该分类要素项,可再填入关键词或利用图2所示的标注模板进行多语种文本语义标注后的关键词,进一步限定所选消息分类的内容,本实施例所选的消息分类包括地点:2/2001,地点-北京,行为-演出;
(8)从事件性质角度提供的主题分类要素项,包括状态、背景、关系、历史、影响和评价,该分类要素项,可再填入关键词或利用图2所示的标注模板进行多语种文本语义标注后的关键词,进一步限定所选主题分类的内容,本实施例所选的主题分类是状态项-票已售完;
(9)从信息对称关系角度提供的信息发布对象要素项,包括企业、机构、个人、供方、需方、买方和卖方,该分类要素项,可再填入关键词或利用图2所示的标注模板进行多语种文本语义标注后的关键词,进一步限定所选信息发布对象分类的内容,本实施例未对其进行选择;
(10)信息源要素项,包括选择提供者、域名或邮箱、提供时间、提供地点和保留时间,可再填入或利用图2所示的标注模板进行多语种文本语义标注后的提供者、域名或邮箱、提供时间、提供地点和保留时间,本实施例所选的保留时间是10天。
显然,使用不同语言的互联网用户,都能在这一通用模板上进行文件信息的发布或检索,换句话说,只要建立起一个适用于任何数据文件的不同语言版本文件摘要信息通用模板,也就提取出了互联网信息的通用数据要素和结构,获得了一个文件摘要信息的通用数据库,从而使互联网成为一个名符其实的全球信息共享系统。
参见图2,是实现本发明技术方案所应用的在先专利申请的文本语义标注通用模板结构。
从图1可以看出,提供不同语言的“文摘”信息选项模板并不困难,但是,文摘信息不可能仅提供信息分类方法,它必须允许用户自由输入一定量的关键字甚至关键句子,因此,本发明的技术方案还涉及对用户自由输入的文本信息,如何实现语义信息多语共享的基本方法。
如果将互联网上不同语言文本的翻译需求,理解为“文本”语义信息共享需求,则“文本”信息共享与“文件”信息共享具有相同的基本环节:语义信息发布、语义信息存储与语义信息获取。于是就可以在“文本”信息发布与获取环节上提供一个共享的文本语义标注通用模板,一个在“文本”信息发布、存储、获取环节上皆适用的通用标注模板,来实现互联网上的“文本”语义信息共享。
该模板中提供了适用于各种语言文本的语义信息通用要素,包括:不同自然语言符号(单词或句子),实施例以汉字写出  “我现在需要文件信息共享系统”;由人机交互标注的多语通用概念定义标注项,包括:对“我”多语标注为“本人”,对“现在”多语标注为“此时”,对“共享”标注为“共同分享”;由人机交互标注的多语通用句法信息标注项,包括:对“我”多语标注为“主词”,对“现在”多语标注为“谓词修饰”,对“需要”标注为“谓词”,对“文件信息共享”标注为“宾词修饰”,对“系统”标注为“宾词”;由人机交互标注的多语通用时态信息标注项,包括:对“需要”多语标注为“现在时”;由人机交互标注的多语通用语态信息标注项,包括:对“需要”多语标注为“主动”;由人机交互标注的多语通用语体信息标注项,包括:对“我现在需要文件信息共享系统”多语标注为“书面语”。
从图2所示可以看出,任何自然语言符号串,都可以用多语通用的有限语义信息项(包括有限基础词汇)进行语义标注(可参考《计算机世界》产品与技术版第19期文章《多语通讯的新技术幽灵-通用语言视窗》)。
由于标注选项受限,利用“文本”语义信息通用标注模板就可将文本信息发布方的文本语义标注结果,自动转换成信息获取方所需要的文字。并且对于原文的语义标注结果,也可通过采用一套转换规则,自动转换成按不同自然语言习惯表达的译文。特别是,有了“文本语义信息标注通用模板”的帮助,即使“译文”不够准确,也能够实现在不同语言用户之间准确传递语义信息的任务。
本发明通过建立“不同语言版本文件摘要信息通用模板”、“文本语义标注通用模板”、“统一语义代码多语转换浏览器(或称软件)”及“文件摘要信息统一代码数据库”,并嵌入在现有的国际互联网信息传播系统中,而建立起一个互联网信息共享系统,其信息共享的方法包括:如图3所示的信息加工与存储程序,和如图4所示的信息转换与浏览程序。
参见图3,图中各框意义是:框1,共享信息数据输入:采用现有文本文件输入软件输入文本文件;框2,文本语义自动标注:将文本文件传输到语义标注语料库,与已经标注过语义信息的文本语料进行自动匹配,以实现文本语义自动标注;框3,通用语义标注语料库:指已经进行过语义标注的文本语料数据库;框4,文本语义人机交互标注:对未能在文本语料数据库找到匹配对象的文本,进行人机交互标注、通过文本语义标注知识库及规则库进行自动标注和由用户对标注结果进行审核及调整;框5,文本语义标注通用模板,如知识库规则库;框6,文本标注结果存储:建立文件标题,将文本标注结果存储于文本信息数据库;框7,文本存储服务器:即文本信息数据库,可以是指定的专用数据库,也可以是现有的存储服务器;框8,文摘信息标注:在“不同语言版本文件摘要信息通用模板”上对任意数据文件(包括图形文件与声音文件)进行关键字词选择与输入:框9,不同语言版本文件摘要信息通用模板;框10,文摘信息标注存储:将文摘信息的标注结果自动存储于文摘信息数据库中;框11,文摘信息数据库:是根据不同语言版本文件摘要信息通用模板结构建立起的文件摘要信息统一代码数据库。
共享信息加工与存储的方法主要包括:1)不同语言用户在使用不同语言的门户网站上,采用“不同语言版本文件摘要信息通用模板”、“文本语义标注通用模板”(对自由填入的各语种的关键词和句子,进行人机交互语义标注),对任意数据文件进行文件摘要信息输入;
2)不同语言用户采用“文本语义标注通用模板”,对需要全球共享的文本信息进行通用语义标注,但如果用户仅需要在一种语言用户中实现信息共享,则不需要使用此模板作标注;
3)将标注后的文摘信息、文本文件分别存储,包括:
A、根据用户对文摘信息的保留时间请求,将文摘信息存储于文摘信息共享数据库中,如不同地域的文摘信息,可存储在不同地域门户网站的文摘信息数据库中;
B、文本文件则存储于用户指定的任意(原有)文本存储服务器中。
参见图4,为本发明共享信息检索与浏览流程框图。其中的框7、框11具有与图3所示相同的功能。框12,文摘信息查询:在“不同语言版本文件摘要信息通用模板”上进行关键字选择和输入;框13,文摘信息浏览:根据用户选择和输入的关键字,在文摘信息数据库中自动检索文件;框14,文摘信息浏览软件(插件):包括文摘信息的多语解码规则库、排序规则、字符库和浏览界面等;框15,文本信息浏览:通过文件信息中的主页标识,进入指定主页;框16,文本信息浏览软件:包括文本信息的多语解码规则库、字符库和浏览界面;框17,译文加工:将带有语义标注信息的译文文本文件传输到译文加工语料库,与已经加工过的文本进行自动匹配,或根据文本语义标注结果,由人工进行译文加工;框18,译文加工语料库:带有语义标注信息的已经进行过译文加工的文本语料数据库。
共享信息检索与浏览的方法主要包括:1)用户用自己熟悉的语言,在“不同语言版本文件摘要信息通用模板”上选择和输入检索关键信息;2)搜索引擎在多个文件摘要信息统一代码数据库中搜索,或在数据共享的镜像文件摘要信息统一代码数据库中搜索,并根据文件存储信息与检索信息的匹配程度,对所有文件摘要信息进行自动匹配和排序;3)用户通过现有浏览器中的多语浏览软件(插件),浏览以不同语言文字形式显示的文摘信息;4)用户在浏览文件信息之后,如果需要进一步浏览文本信息,再通过自动链接,访问指定的文本信息存储服务器;5)用户通过现有浏览器中的多语浏览插件,浏览文本+语义标注信息。
本发明的不同语言版本文件摘要信息通用模板,具有极广的实用价值,包括:
1.访问网站:任何网站只要在模板中提供相关信息,不同自然语言用户皆可通过该“文摘模板”输入检索用的关键信息,自由访问网站。发布或获取信息标注结果浏览举例如下,下例中冒号前为分类要素项,冒号后为用户选项结果(关键字或关键句子),即实际显示的结果,其中括弧外为选项结果,括弧内为用户自由输入的、已进行过文本语义标注的关键字、句。示例如下:
功能选择:发布或获取
标题:(北京通用语言视窗公司)
数据:符号,映射(w-windows.com)
领域:通讯
应用:互动(多语翻译)
消息:时间(2001)、地点(中国、北京)、事件(注册)
主题:状态(开发产品)
2.寻找邮件地址:任何网民只要在“文摘模板”中提供相关信息,不同自然语言用户即可通过在“文摘模板”输入各种检索关键信息,获得邮件地址。示例如下:
功能选择:发布或获取
标题:北京-刘莎
数据:符号,映射:liusha@rol.net.cn
领域:通讯
应用:综合
消息:时间(2001)、地点(中国、北京)、人物
主题:状态(邮箱可使用)
3.消息发布与获取,示例如下:
功能选择:发布或获取
标题:(不明皮肤疾病紧急求医)
数据:文字、图像
领域:卫生
应用:健康
消息:时间(1/2/2001-10/2/2001)、行为(紧急求医)
主题:状态(病症简诉)
对象:机构(所有医院皮肤科)
4.商品交易,示例如下:
功能选择:发布/获取
标题:(拍卖《天鹅湖)》手稿)
数据:文字
领域:文化(戏剧)
应用:交易
消息:时间(2/2001-10/2001)、行为(拍卖)、物品(手稿)
主题:状态(私人拥有)
对象:买方
5.新闻发布,示例如下:
功能选择:发布
标题:(克林顿卸任)
数据:文字、图像
领域:政治
应用:新闻
消息:时间(2/2001-10/2001)、地点(美国、白宫)、人物(总统)
主题:状态、影响、评价
对象:机构(新闻媒体)
6.知识传播与获取,示例如下:
功能选择:发布/获取
标题:(相对论)
数据:文字、符号-影射(E=MC2)
领域:科学(物理)
应用:综合
消息:时间( )、地点( )、人物(爱因斯坦)、理论、工具
主题:背景、影响、评价
提供方:(伦敦图书馆)
7.消息与知识综合获取,示例如下:
标题:巴以关系
数据:文字、图像
领域:政治
应用:综合
消息:时间(2001)、地点(中东)
主题:背景、关系、历史、影响、状态、评价
对象:机构(伦敦图书馆、北京图书馆、以色列XX新闻社)
8.商业广告发布,示例如下:
功能:发布
标题:长城饭店
数据:多媒体
领域:生活
应用:住
消息:时间(2001)、地点(中国、北京)
主题:历史、状态(有空房)
对象:需方
9.非商业广告发布,示例如下:
功能:获取
标题:寻求国内航班打折机票
数据:文字
领域:生活
应用:行
消息:时间(2001)、地点(中国、北京)、物品(机票)
主题:状态(北京至上海,打六折)
10.适时多语对话,示例如下:
标题:意甲联赛现场讨论
数据:文字
领域:体育(足球)
应用:娱乐
消息:时间(2001某月某日)、地点(意大利都灵)、行为(比赛)
主题:评价
(须使用由信息共享系统提供的在线文本语义标注模板及BBS浏览器进行多语对话)。
参见图5,图中示出本发明信息共享系统提供信息共享服务的关系框图。本发明的互联网信息共享系统及其信息共享方法,可在现有互联网通讯模式中成长,初期可采用信息共享软件的“多点式”推广应用,包括通过为数据库类(图书馆、媒体、数据库)网站直接提供信息共享软件,在网民不需要任何新增软件的前提下,直接提供网站信息的多语直接检索和浏览,并开展多语文本信息订阅服务;为普通企业和机构网站提供信息共享软件,在网民不需要任何新增软件的前提下,直接实现网站共享信息的多语直接检索、浏览,以及与用户进行多语沟通;为门户类网站提供信息共享软件,在网民不需要任何新增软件的前提下,直接提供多语“广告信息”自动匹配,以及提供多语共享BBS服务;为个人用户提供文本信息共享软件,使其能够使用该软件独立实现电子邮件多语翻译等,在上述多点式服务网站对共享信息的服务达到一定规模后,在不同语言的大型门户类网站可提供一站式“信息共享”综合服务。服务的基本方式可遵循收费会员制,按个人、普通企业、数据库类企业分级并按年计费,提供软件和服务。向会员提供的服务内容可包括:向用户提供信息共享软件功能;向用户提供不同语言版本文件摘要信息通用模板;向用户提供文本语义标注通用模板;用户访问原文标注及译文加工语料库的权限;向用户提供主页、电子邮件的多语浏览软件(指定译文解码软件)。会员可在线使用的服务包括:共享文摘信息存储镜像数据库;共享文摘信息通用搜索引擎;共享广告信息自动匹配、推送(按时、空用量单独计费);多语共享主题分类聊天;多语对话加密专线等。

Claims (10)

1.一种互联网信息共享系统的信息共享方法,其特征在于包括:
A.建立包括不同语言版本文件摘要信息通用模板和文件摘要信息统一代码数据库的信息共享系统;
B.进行共享信息存储时,用户在门户网站上,利用不同语言版本文件摘要信息通用模板,对任意数据文件进行文件摘要信息输入,系统将不同语言版本文件摘要信息的统一语义代码存储在文件摘要信息统一代码数据库中,和根据用户在不同语言版本文件摘要信息通用模板上的指定,将用户的非文件摘要信息文本存储于对应地址的数据存储服务器中;
C.进行共享信息检索与浏览时,用户在门户网站上,在不同语言版本文件摘要信息通用模板上选择并输入检索关键信息,系统搜索引擎搜索文件摘要信息统一代码数据库,根据存储信息与检索信息间的匹配度,对存储的文件摘要信息进行自动匹配与排序,供用户使用统一语义代码多语转换浏览器浏览,并通过自动链接供用户进一步访问所指定的非文件摘要信息存储服务器。
2.根据权利要求1所述的一种互联网信息共享系统的信息共享方法,其特征在于:所述的步骤A中还包括,建立一个文本语义标注通用模板和统一语义代码多语转换浏览器;所述的步骤B中还包括,不同自然语言用户,在对任意数据文件进行文件摘要信息输入时还同时使用文本语义标注通用模板,对所输入的不同自然语言文字符号进行通用语义信息人机交互标注;所述的步骤C中还包括,不同自然语言用户,利用不同语言版本文件摘要信息通用模板选择并输入检索关键信息时,还利用统一语义代码多语转换浏览器,浏览以不同语言文字形式显示的关键字及关键句子信息。
3.根据权利要求2所述的一种互联网信息共享系统的信息共享方法,其特征在于:所述的文本语义标注通用模板,是对不同自然语言符号,通过人机交互,标注多语通用概念定义、多语通用句法信息、多语通用时态信息、多语通用语态信息和多语通用语体信息。
4.根据权利要求1或2所述的一种互联网信息共享系统的信息共享方法,其特征在于:所述的步骤B中,存储文摘信息是按用户在不同语言版本文件摘要信息通用模板上指定的保留时间请求,存储在所述的文件摘要信息统一代码数据库中。
5.根据权利要求1或2所述的一种互联网信息共享系统的信息共享方法,其特征在于:所述的步骤B中,存储文摘信息是按用户所处地域,同时存储在该用户所在各自网站的文件摘要信息统一代码数据库中和各地的全球数据共享文件摘要信息镜像数据库中。
6.根据权利要求1或2所述的一种互联网信息共享系统的信息共享方法,其特征在于:所述的步骤C中,系统搜索引擎搜索各自网站文件摘要信息统一代码数据库,还包括搜索全球数据共享文件摘要信息镜像数据库。
7.根据权利要求1或2所述的一种互联网信息共享系统的信息共享方法,其特征在于:所述的不同语言版本文件摘要信息通用模板,包含有适于各种数据文件的信息综合分类通用要素,包括从信息发布或信息获取角度提供的功能选择要素项、文件标题要素项、从数据形式角度提供的数据分类要素项、从特殊符号与语义影射关系角度提供的语义要素项、从人类客观认知角度提供的知识分类要素项、从用户主观需求角度提供的应用分类要素项、从物理时空角度提供的消息分类要素项、从事件性质角度提供的主题分类要素项、和从信息对称关系角度提供的信息发布对象要素项。
8.根据权利要求7所述的一种互联网信息共享系统的信息共享方法,其特征在于:所述的文件标题要素项是提供文本语义标注的要素项;所述的从数据形式角度提供的数据分类要素项包括文字、图像及声音;所述的从特殊符号与语义影射关系角度提供的语义要素项包括含域名、邮箱、公式的符号项与含人名、公司名、公式名的符号解析语义影射关系项;所述的从人类客观认知角度提供的知识分类要素项是选择专业或普通领域分类,包括政治、经济、科学、文化、体育、卫生、军事、通讯、社会及其它;所述的从用户主观需求角度提供的应用分类要素包括衣、食、住、行、健康、学习、谋生、互动、交易、生活、综合、新闻及其它;所述的从物理时空角度提供的消息分类要素包括时间、地点、人物、行为、事件、物品、理论和工具;所述的从事件性质角度提供的主题分类要素项,包括状态、背景、关系、历史、影响和评价;所述的从信息对称关系角度提供的信息发布对象分类要素项,包括企业、机构、个人、供方、需方、买方和卖方;还包括信息源要素项,包括选择提供者、域名或邮箱、提供时间、提供地点和保留时间或选择经文本语义标注后的提供者、域名或邮箱、提供时间、提供地点和保留时间。
9.根据权利要求7所述的一种互联网信息共享系统的信息共享方法,其特征在于:所述的从人类客观认知角度提供的知识分类要素项,还包括填入关键词或经文本语义标注后的关键词进一步限定所选知识分类子类的分类项;所述的从用户主观需求角度提供的应用分类要素,还包括填入关键词或经文本语义标注后的关键词进一步扩展所选应用分类下各子类的分类项;所述的从物理时空角度提供的消息分类要素项,还包括填入关键词或经文本语义标注后的关键词,进一步限定所选消息分类的内容;所述的从事件性质角度提供的主题分类要素,还包括填入关键词或经文本语义标注后的关键词,进一步限定所选主题分类的内容。
10.一种互联网信息共享系统,其特征在于:包括建立不同语言版本文件摘要信息通用模板、文件摘要信息统一代码数据库、文本语义标注通用模板和统一语义代码多语转换浏览器,并嵌入国际互联网系统中。
CN 01109156 2001-03-09 2001-03-09 互联网信息共享系统及其信息共享方法 Pending CN1374603A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 01109156 CN1374603A (zh) 2001-03-09 2001-03-09 互联网信息共享系统及其信息共享方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 01109156 CN1374603A (zh) 2001-03-09 2001-03-09 互联网信息共享系统及其信息共享方法

Publications (1)

Publication Number Publication Date
CN1374603A true CN1374603A (zh) 2002-10-16

Family

ID=4657757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 01109156 Pending CN1374603A (zh) 2001-03-09 2001-03-09 互联网信息共享系统及其信息共享方法

Country Status (1)

Country Link
CN (1) CN1374603A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100367280C (zh) * 2005-11-07 2008-02-06 西安工程科技学院 互联网三维人体测量数据共享系统及数据融合方法
CN100458789C (zh) * 2005-11-11 2009-02-04 国际商业机器公司 用于交换门户组件配置数据的方法和系统
CN100458784C (zh) * 2006-04-06 2009-02-04 中国科学院计算技术研究所 在数字图书馆中所采用的检索系统和检索方法
CN100461203C (zh) * 2003-09-21 2009-02-11 季争鸣 以代码交流实现信息交流的方法
CN1902627B (zh) * 2003-12-31 2010-06-02 Google公司 直接导航至目标文档特定部分的系统和方法
CN101390093B (zh) * 2006-02-21 2011-06-22 金东岩 利用语言链提供搜索结果的方法和装置
CN101090376B (zh) * 2007-06-25 2011-10-12 腾讯科技(深圳)有限公司 一种共享及下载文件的方法
CN102339318A (zh) * 2011-10-24 2012-02-01 Tcl集团股份有限公司 一种文件系统管理方法及系统
CN102819594A (zh) * 2012-08-09 2012-12-12 刘莎 一种组织网站信息的方法与装置
CN103327469A (zh) * 2012-03-19 2013-09-25 联想(北京)有限公司 一种数据共享方法、系统及移动终端
CN107025539A (zh) * 2007-05-15 2017-08-08 社会方案有限责任公司 用于形成社交联网在线社区的系统和方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100461203C (zh) * 2003-09-21 2009-02-11 季争鸣 以代码交流实现信息交流的方法
CN1902627B (zh) * 2003-12-31 2010-06-02 Google公司 直接导航至目标文档特定部分的系统和方法
CN100367280C (zh) * 2005-11-07 2008-02-06 西安工程科技学院 互联网三维人体测量数据共享系统及数据融合方法
CN100458789C (zh) * 2005-11-11 2009-02-04 国际商业机器公司 用于交换门户组件配置数据的方法和系统
CN101390093B (zh) * 2006-02-21 2011-06-22 金东岩 利用语言链提供搜索结果的方法和装置
CN100458784C (zh) * 2006-04-06 2009-02-04 中国科学院计算技术研究所 在数字图书馆中所采用的检索系统和检索方法
CN107025539A (zh) * 2007-05-15 2017-08-08 社会方案有限责任公司 用于形成社交联网在线社区的系统和方法
CN101090376B (zh) * 2007-06-25 2011-10-12 腾讯科技(深圳)有限公司 一种共享及下载文件的方法
CN102339318A (zh) * 2011-10-24 2012-02-01 Tcl集团股份有限公司 一种文件系统管理方法及系统
CN103327469A (zh) * 2012-03-19 2013-09-25 联想(北京)有限公司 一种数据共享方法、系统及移动终端
CN102819594A (zh) * 2012-08-09 2012-12-12 刘莎 一种组织网站信息的方法与装置

Similar Documents

Publication Publication Date Title
US11836177B2 (en) Providing knowledge panels with search results
US9703895B2 (en) Organizing search results based upon clustered content
TWI356319B (en) Multi-level search
US20080097985A1 (en) Information Access With Usage-Driven Metadata Feedback
CN1598817A (zh) 计算及通讯应用中构造使用重大事件的模型的系统及方法
US20070174269A1 (en) Generating clusters of images for search results
CN1947421A (zh) 用于对视频新闻片段进行管理的媒体资源管理系统以及相关的方法
CN1758249A (zh) 内容管理系统、内容管理方法及计算机程序
CN1942856A (zh) 通用搜索界面系统和方法
US10783192B1 (en) System, method, and user interface for a search engine based on multi-document summarization
CN102209259B (zh) 一种动态生成电影封面墙的方法及系统
CN1374603A (zh) 互联网信息共享系统及其信息共享方法
US11651039B1 (en) System, method, and user interface for a search engine based on multi-document summarization
Zhang et al. EnjoyPhoto: a vertical image search engine for enjoying high-quality photos
Peters et al. Insights of an African model for digital library development
Heimonen et al. Mobile findex: supporting mobile web search with automatic result categories
Zavalina Collection-level subject access in aggregations of digital collections: metadata application and use
Cetera-Włodarczyk et al. National e-resources of Shakespeare translations in Europe:(Dis) assembling the black box
Mayer Like a box of chocolates: A case study of user-contributed content at Footnote
Konkova et al. Analysing creative image search information needs
CN1384656A (zh) 一种结构化短信息服务系统和服务方法
Gardner The changing landscape of contemporary cataloging
Giles et al. eBizSearch: A niche search engine for e-business
Jangra et al. Metadata standards for content description: Microdata, Microformats and JSON-LD
Skov et al. Unlocking radio broadcasts: user needs in sound retrieval

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication