CN101075929B - 信息查询系统、信息查询服务器及信息查询方法 - Google Patents
信息查询系统、信息查询服务器及信息查询方法 Download PDFInfo
- Publication number
- CN101075929B CN101075929B CN2007100800488A CN200710080048A CN101075929B CN 101075929 B CN101075929 B CN 101075929B CN 2007100800488 A CN2007100800488 A CN 2007100800488A CN 200710080048 A CN200710080048 A CN 200710080048A CN 101075929 B CN101075929 B CN 101075929B
- Authority
- CN
- China
- Prior art keywords
- information
- query
- natural language
- request
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 38
- 238000012423 maintenance Methods 0.000 claims description 29
- 238000006243 chemical reaction Methods 0.000 claims description 16
- 238000001914 filtration Methods 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims 1
- 230000008569 process Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了信息查询系统、信息查询方法和信息查询服务器。其中,信息查询系统包括:前端查询子系统,用于将接收的自然语言形式的信息查询请求发送到信息查询服务器,并转发信息查询服务器返回的信息查询结果;信息查询服务器,用于对所述信息查询请求进行自然语言解析处理,从中提取关键词,根据所提取的关键词查询自身存储的信息知识库。由此,即时通信用户可以用自然语言与信息查询服务器以聊天的方式进行各种类型的信息查询,而不需要进行烦琐的操作,极大方便即时通信用户进行信息查询。
Description
技术领域
本发明涉及到即时通信(IM,Instant Messaging)技术,特别涉及到基于IM的信息查询系统、信息查询服务器和信息查询方法。
背景技术
在日常生活中,人们经常需要进行多种多样的信息查询,例如:查询公交车的线路、车次,查询火车票、飞机票相关信息,查询彩票信息,查看新闻,查询电话号码等等。目前,人们通常只能通过拨打信息咨询台的电话或者登录各种信息网站等方式获取上述信息。
显然,不同类型的信息均有各自的查询入口,例如,查询公交车信息需要拨打160查询台,查询电话号码信息需要拨打114查询台,查询商品信息需要登录商家所对应的网站,查询二手商品信息需要登录跳蚤市场对应的网站,查询新闻需要登录新闻站点等等,这种信息查询方式使得人们不得不记忆繁多的信息咨询台的电话号码、网站地址等信息源相关信息。
另外,当提供同类信息的信息源有多个时,人们通常需要首先从不同的信息源获得相关的信息,然后还需要进一步对来自不同信息源的信息进行比较,以获得最真实或对自身最有利的信息。例如,当某人查询某一班次飞机票的价格时,通常会拨打多个代售点的电话或登录多个机票代售的网站,在获得不同代售点代售的机票的价格后,才能判断出哪个机票代售点的机票更便宜。这种同类信息的比较过程通常需要耗费大量的时间,使得查询信息的效率非常低。
发明内容
本发明提供了基于即时通信的信息查询系统、信息查询服务器和信息查询方法,为用户提供了一个统一的信息查询平台,使用户可以以聊天的方式使用自然语言进行各种类型的信息查询,极大地方便了用户查询各类信息。
本发明所述的信息查询系统,包括:前端查询子系统、信息查询服务器和信息维护子系统;其中,
所述前端查询子系统用于将接收的自然语言形式的信息查询请求发送到信息查询服务器,并转发信息查询服务器返回的信息查询结果;
所述信息维护子系统,用于接收来自信息提供者的自然语言形式的信息浏览请求或信息更新请求,将所述信息浏览请求发送到所述信息查询服务器,从所述信息查询服务器获取欲浏览的信息,将所述信息更新请求发送到所述信息查询服务器,并控制所述信息查询服务器根据所述信息更新请求更新自身存储的信息知识库;
所述信息查询服务器用于对所述信息查询请求进行自然语言解析,提取关键词、主题以及句型,过滤所述关键词中的停用词,根据存储的同义词表对过滤停用词后的关键词进行同义词替换,根据所述关键词或者替换后的同义词、主题以及句型查询自身存储的信息知识库,获得信息查询结果,对得到的查询结果取交集或并集,然后再按预先设定的原则排序,得到其中最佳的查询结果;对所述信息浏览请求或信息更新请求进行自然语言解析,得到信息提供者欲浏览或欲更新的信息内容,根据欲浏览的信息内容,从信息知识库提取相应信息,将相应信息发送给信息维护子系统,或根据所述欲更新的信息内容更新自身存储的信息知识库;
所述信息查询服务器,在接收到信息提供者提供的各类信息后,对所述各类信息进行自然语言理解,得到关键词、句型以及主题,按照关键词、句型和主题分别建索引来存储所述各类信息,以形成所述信息知识库。
一种信息查询服务器,包括:网络收发模块、信息知识库、自然语言解析模块、推理模块及信息转化模块;其中,
所述网络收发模块用于将接收的自然语言形式的信息查询请求发送至推理模块,并转发推理模块返回的信息查询结果;用于接收来自信息提供者的自然语言形式的信息浏览请求或信息更新请求,将所述信息浏览请求或信息更新请求转发到信息转化模块;
所述推理模块用于从网络收发模块接收信息查询请求,并将所述信息查询请求发送至自然语言解析模块,并接收自然语言解析模块输出的关键词、句型以及主题,过滤所述关键词中的停用词,根据存储的同义词表对过滤停用词后的关键词进行同义词替换,然后根据所述关键词或者替换后的同义词、句型以及主题查询所述信息知识库,获得一个或多个信息查询结果,对得到的查询结果取交集或并集,然后再按预先设定的原则排序,得到其中最佳的查询结果,并返回信息查询结果到网络收发模块;
信息转化模块用于从网络收发模块接收信息浏览请求或信息更新请求,并将所述信息浏览请求或信息更新请求发送至自然语言解析模块,并接收自然语言解析模块输出的欲浏览或欲更新的信息内容,然后根据欲浏览的信息内容从信息知识库提取相应信息,将相应信息发送给网络收发模块,以便网络收发模块将相应信息发送给信息浏览请求的发送方,或根据所述欲更新的信息内容更新所述信息知识库中的信息;
所述信息知识库用于按照关键词、句型以及主题分别建索引,来存储供查询的信息;
所述自然语言解析模块用于对所述信息查询请求进行自然语言解析,提取出关键词、句型以及主题。
一种信息查询方法,包括:
接收自然语言形式的信息查询请求;
对所述信息查询请求进行自然语言解析,得到其中的关键词、句型以及主题;
过滤所述关键词中的停用词,根据存储的同义词表对过滤停用词后的关键词进行同义词替换,根据解析得到的关键词或者替换后的同义词、句型以及主题在自身存储的信息知识库中查询相应的信息,并以自然语言形式返回;
接收来自信息提供者的自然语言形式的信息更新请求;
对所述信息更新请求进行自然语言解析,得到欲更新信息的关键词、句型以及主题;
根据所述关键词、句型以及主题更新所述信息知识库中的信息。
由此可以看出,通过本发明所述的信息查询系统、信息查询服务器及方法,即时通信用户可以用自然语言以聊天的方式进行各种类型的信息查询,使得即时通信用户可以更加方便、快捷地获得自身所需的各类信息,增强了即时通信用户的服务体验。
附图说明
下面将通过参照附图详细描述本发明的示例性实施例,使本领域的普通技术人员更清楚本发明的上述及其它特征和优点,附图中:
图1为本发明一实施例所述的信息查询系统结构示意图;
图2为本发明另一实施例所述的信息查询系统结构示意图;
图3为本发明实施例所述信息查询方法流程图;
图4为本发明实施例所述信息更新方法流程图。
具体实施方式
为使本发明的目的、技术方案更加清楚明白,以下参照附图并举实施例,对本发明做进一步的详细说明。
为了解决现有信息查询过程中的诸多问题,本发明的一个实施例给出了一种信息查询系统,其结构如图1所示,主要包括:前端查询子系统1及信息查询服务器2。
在本实施例中,所述前端查询子系统1一方面主要用于接收自然语言形式的信息查询请求,并将所述信息查询请求发送到所述信息查询服务器2,另一方面还主要用于接收并转发信息查询服务器2返回的针对所述信息查询请求的信息查询结果。通常情况下,所述信息查询请求是即时通信用户通过即时通信客户端输入的。
本实施例所述信息查询服务器2用于将接收的信息查询请求进行自然语言解析,从中提取关键词,然后根据所提取的关键词查询自身存储的信息知识库,获得信息查询结果,并将所述信息查询结果返回所述前端查询子系统1。其中,所述关键词包括但不限于地点、时间、主题等信息。
除此之外,图1还显示了上述前端查询子系统1和信息查询服务器2的内部结构。
如图1所示,所述前端查询子系统1主要包括:查询接口11和第一网络收发模块12。
其中,所述查询接口11为即时通信用户与信息查询系统进行信息交互的接口,主要用于接收由即时通信用户输入的信息查询请求,并将所接收的信息查询请求发送至所述第一网络收发模块12,进一步还将从所述第一网络收发模块12接收来自信息查询服务器2的信息查询结果发送给即时通信用户。在本实施例中,所述信息查询请求以及信息查询结果均是通过即时通信消息承载的。
所述第一网络收发模块12主要负责网络通信,将所述信息查询请求发送至信息查询服务器2,接收来自信息查询服务器2的信息查询结果,并发送到所述查询接口11。
如图1所示,所述信息查询服务器2主要包括:第二网络收发模块21、信息知识库22、自然语言解析模块23及推理模块24。
其中,所述第二网络收发模块21一方面用于接收来自前端查询子系统1的信息查询请求,并将接收的信息查询请求发送至推理模块24进行自然语言解析;另一方面用于接收来自推理模块24的信息查询结果,并将所述信息查询结果发送至前端查询子系统1;
所述信息知识库22用于存储各种类型的供即时通信用户查询的信息,例如电话号码信息,公交车线路信息、商品信息、火车及飞机的票务信息等等,供所述推理模块24进行信息查询;
所述自然语言解析模块23用于对从推理模块24接收的信息查询请求进行自然语言解析,从中提取出关键词,并将所述关键词发送给推理模块24;
所述推理模块24用于从第二网络收发模块21接收信息查询请求,将所述信息查询请求发送至自然语言解析模块23,并接收自然语言解析模块23输出的关键词,再根据所述关键词查询所述信息知识库22,获得一个或多个信息查询结果,将所述信息查询结果发送到所述第二网络收发模块21。
为了实现所述自然语言解析,所述信息查询服务器还应当包括一个自然语言知识库25,用于存储包括但不限于词典、词频、句法规则、语意规则等各种统计数据,专供自然语言解析模块23进行自然语言解析。所述自然语言解析模块23通过调用自然语言知识库25实现自然语言解析,从即时通信用户输入的信息查询请求中提取包含地点、时间、主题等信息的关键词。
由上述描述可以看出,本实施例给出的信息查询系统可以接收来自即时通信用户的自然语言形式的信息查询请求,并自然语言解析过程,从即时通信用户输入的信息查询请求中提取出关键词,然后利用所提取的关键词,在自身存储的信息知识库中查找相关信息,最后将得到的信息查询结果返回即时通信用户。如此,即时通信用户可以通过自然语言与信息查询系统进行交互得到想要查询的信息,这极大地方便了用户进行信息查询。
为了保证即时通信查询到的信息的实时性和准确性,本发明的另一实施例还给出了一种信息查询系统,该信息查询系统与图1所示的信息查询系统相比,除了可以供即时通信用户进行信息查询之外,还可以进一步实现自身存储的信息的更新。本实施例所述信息查询系统的结构如图2所示,主要包括:前端查询子系统1和信息查询服务器2以及信息维护子系统3。
其中,所述前端查询子系统1的功能与内部结构与图1所示的信息查询系统中的前端查询子系统1相同,在此就不在赘述了。
新增的所述信息维护子系统3主要用于为信息提供者提供浏览或更新信息查询系统所存储的信息的平台,将接收的信息浏览请求发送到所述信息查询服务器2,从所述信息查询服务器2获取欲浏览的信息,以及将接收的信息更新请求发送到所述信息查询服务器2,并控制所述信息查询服务器2根据所述信息更新请求更新自身存储的信息。通过所述信息维护子系统3,信息提供者可以浏览或者更新信息查询服务器2所存储的信息。在这里所述更新包括:新增信息、删除信息或修改信息等操作。
图2还显示了所述信息维护子系统3的内部结构。如图2所示,所述信息维护子系统3主要包括:信息维护接口31和第三网络收发模块32。
其中,所述信息维护接口31为信息提供者与信息查询系统进行信息交互的接口,用于接收所述信息浏览请求或信息更新请求,并显示信息浏览或更新结果。由此,信息提供者可以通过所述信息维护接口31浏览或更新信息查询系统所存储信息。优选地,所述信息维护接口可以为网页(web)的形式,这样,信息提供者可以通过登陆相应的网站即可实现对自身所提供信息的浏览或者更新。
所述第三网络收发模块32用于将所述信息维护接口接收的信息浏览请求或信息更新请求发送给所述信息查询服务器2,并从所述信息查询服务器获取信息浏览或更新结果。
如图2所示,所述信息查询服务器2除了包括图1所示信息查询服务器2中的所有功能模块之外还进一步包括一个信息转化模块26,主要用于从所述信息维护子系统3接收信息浏览请求或信息更新请求,通过调用所述自然语言解析模块23,对来自信息维护子系统3的信息浏览请求或信息更新请求进行自然语言解析,得到信息提供者欲浏览或更新的信息内容,然后根据自然语言解析出欲浏览的信息内容从信息知识库22提取相应信息,或根据欲更新的信息内容更新存储在所述信息知识库22中的相应信息。
从图2所示的信息查询系统可以看出,上述信息查询系统不仅为即时通信用户提供了一个统一的信息查询平台,使即时通信用户可以通过自然语言的方式实现各种类型的信息查询,还为信息提供者提供了浏览或更新自身所提供信息的平台,从而保证信息提供者所提供信息的实时性和准确性。
除了上述信息查询系统之外,本发明的又一实施例还提供了一种信息查询方法。如图3所示,所述信息查询方法主要包括:
步骤301:接收自然语言形式的信息查询请求。
步骤302:对所述信息查询请求进行自然语言解析,得到其中的关键词。
如前所述,本步骤所述自然语言解析可以通过图1或图2中所示的推理模块24、自然语言解析模块23的配合实现,其具体过程包括:
1)接收自然语言形式的信息查询请求句子,过滤其中的乱码、空格制表符及标点等无用符号;
2)对过滤后的句子进行分词,得到一系列关键词;
3)过滤所述关键词中的停用词;
其中,所述停用词(Stop Word)通常是指文本中出现的连词、介词、冠词等并无太大意义,并且对句子的语义影响不大的词。这些词通常自身并无明确的意义,只有将其放入一个完整的句子中才有一定作用,例如:在英文中常用的停用词有the,a,it等;在中文中常见的有“是”,“的”,“地”等。在自然语言处理中通常可以对停用词忽略不计,采用直接去掉的方法进行处理;
4)根据自身存储的同义词表对过滤停用词后的关键词进行同义词替换。
为了加快信息查询过程,在自然语言解析过程中,可以进一步判断信息查询请求的句型,如是问地点、问时间还是问人物等句型,还可以进一步根据所述关键词判断所述信息查询请求的主题,例如体育、娱乐等方面的主题,并在信息查询时将所述主题以及句型等信息作为除关键词之外的索引查询相关信息。
步骤303:根据解析得到的关键词在自身存储的信息知识库中查询相应的信息。
如前所述,本步骤所述查询相应信息的过程可以通过图1或图2中所示的推理模块24、信息知识库22的配合实现。
由于所述信息转化模块26接收到信息提供者提供的各类信息后,将首先进行自然语言理解,得到关键词,甚至句型及主题等信息,并且,在存储上述信息时将按关键词、句型以及主题分别建索引,以形成所述信息知识库。因此,经过上述步骤302的自然语言解析之后,推理模块24可以直接根据解析得到关键词,甚至进一步根据句型以及主题等信息在信息知识库22里查找,得到若干条查询结果,并对得到的查询结果取交集或并集,然后再按预先设定的原则排序,得到其中最佳的查询结果。
步骤304:返回查询到的信息。
通过上述步骤301-304,信息查询系统即可接收并解析自然语言的形式的信息查询请求,并将信息查询结果返回给进行信息查询的即时通信用户。
除了上述信息查询过程之外,本实施例所述的方法还进一步包括信息更新过程,信息提供者可以通过该信息更新过程,更新自身在信息查询系统中存储的信息。如图4所示,所述信息更新过程主要包括:
步骤401:接收自然语言形式的信息更新请求。
该步骤中所述的信息更新请求应当来自信息提供者。
步骤402:对所述信息更新请求进行自然语言解析,得到其中的关键词。
在该步骤中,所述自然语言解析过程与上述步骤302所述的自然语言解析过程相同,主要是将信息提供者提供的信息解析为关键词。当然,所述自然语言解析过程还可以进一步解析得到欲更新信息的主题等信息,以加快所述信息更新过程。
步骤403:根据对信息更新请求的解析结果,即欲更新信息的关键词,更新自身信息知识库中存储的信息。
在该步骤中,首先应当根据解析得到的欲更新信息的关键词,然后根据信息提供者的要求增加、删除或者修改与所建立索引对应的信息,以更新所述信息知识库。若步骤402中的自然语言解析过程进一步解析出欲更新信息的主题的信息,则在该步骤中,还可以进一步根据解析出的主题信息建立索引,并根据所建立的主题索引更新所述信息知识库。
通过上述步骤401-403,信息提供者可以更新自身为信息查询系统提供的各类信息,从而保证信息查询系统所存储信息的实时性和准确性。需要说明的是,在执行完上述步骤401-403之后,所述信息查询服务器还可以进一步通过信息维护子系统返回信息更新结果给所述信息提供者,以通知所述信息提供者信息更新过程完成。
除了上述信息更新过程之外,信息提供者还可以通过与上述信息更新过程类似的过程进行信息浏览,以查询自身在信息查询服务器上提供的信息。
下面通过一个具体的例子详细说明上述实施例提供的方法。
例如,现有A、B两家飞机票代售点欲为信息查询系统提供今、明两天所代售机票的信息。这样,A、B两家飞机票代售点需要首先登陆信息维护子系统,增加今天及明天的机票信息(如果之前已经提供了相应信息,也可以根据自身机票的销售情况,通过登录信息维护子系统修改或删除自身所提供的今天和明天的机票信息),这些信息经过信息查询服务器中的信息转化模块处理后,将根据处理得到的欲更新的信息内容,更新信息知识库存储的机票信息。此后,如果用户S登陆信息查询系统,输入“今天和明天从北京到上海的机票最底多少折?”的信息查询请求。所述前端查询子系统将用户S输入的信息查询请求发送到信息查询服务器,信息查询服务器中的推理模块通过调用自然语言解析模块解析所述信息查询请求,将得到“今天”、“明天”、“北京到上海”、“机票”、“最低”及“折扣”等关键字,并利用解析得到的关键字在所述信息知识库中查找相关信息,得到“最底7折,由A代售点提供,电话123456”的信息查询结果。最后,所述推理模块将上述信息查询结果通过前端查询子系统返回所述即时通信用户。
通过上述例子可以看出,通过本发明所提供的信息查询系统及信息查询方法,即时通信用户可以以自然语言的方式查询到像要得到的信息,而不需要记忆大量不同的信息源的电话号码或网站地址等信息,也不需要分别从多个信息源分别查询相关信息并进行比较,从而大大方便用户的信息查询过程,极大地增强了用户的体验。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (13)
1.一种信息查询系统,其特征在于,包括:前端查询子系统、信息查询服务器和信息维护子系统;其中,
所述前端查询子系统用于将接收的自然语言形式的信息查询请求发送到信息查询服务器,并转发信息查询服务器返回的信息查询结果;
所述信息维护子系统,用于接收来自信息提供者的自然语言形式的信息浏览请求或信息更新请求,将所述信息浏览请求发送到所述信息查询服务器,从所述信息查询服务器获取欲浏览的信息,将所述信息更新请求发送到所述信息查询服务器,并控制所述信息查询服务器根据所述信息更新请求更新自身存储的信息知识库;
所述信息查询服务器用于对所述信息查询请求进行自然语言解析,提取关键词、主题以及句型,过滤所述关键词中的停用词,根据存储的同义词表对过滤停用词后的关键词进行同义词替换,根据所述关键词或者替换后的同义词、主题以及句型查询自身存储的信息知识库,获得信息查询结果,对得到的查询结果取交集或并集,然后再按预先设定的原则排序,得到其中最佳的查询结果;对所述信息浏览请求或信息更新请求进行自然语言解析,得到信息提供者欲浏览或欲更新的信息内容,根据欲浏览的信息内容,从信息知识库提取相应信息,将相应信息发送给信息维护子系统,或根据所述欲更新的信息内容更新自身存储的信息知识库;
所述信息查询服务器,在接收到信息提供者提供的各类信息后,对所述各类信息进行自然语言理解,得到关键词、句型以及主题,按照关键词、句型和主题分别建索引来存储所述各类信息,以形成所述信息知识库。
2.根据权利要求1所述的信息查询系统,其特征在于,所述前端查询子系统包括:查询接口和第一网络收发模块;其中,
所述查询接口用于将接收的所述信息查询请求发送至所述第一网络收发模块,并转发从第一网络收发模块接收的信息查询结果;
所述第一网络收发模块用于将所述信息查询请求发送至信息查询服务器,并接收信息查询服务器返回的信息查询结果。
3.根据权利要求1所述的信息查询系统,其特征在于,所述信息查询服务器包括:第二网络收发模块、信息知识库、自然语言解析模块、推理模块及信息转化模块;其中,
所述第二网络收发模块用于将接收的所述信息查询请求发送至推理模块,并将推理模块返回的信息查询结果发送至前端查询子系统;将接收到的来自信息提供者的信息浏览请求或信息更新请求发送至信息转化模块;
所述推理模块用于从第二网络收发模块接收信息查询请求,并将所述信息查询请求发送至自然语言解析模块,并接收自然语言解析模块输出的关键词、句型以及主题,然后根据所述关键词、句型以及主题查询所述信息知识库,获得一个或多个信息查询结果,对得到的查询结果取交集或并集,然后再按预先设定的原则排序,得到其中最佳的查询结果,并返回信息查询结果到第二网络收发模块;
所述信息转化模块用于从第二网络收发模块接收信息浏览请求或信息更新请求,并将所述信息浏览请求或信息更新请求发送至自然语言解析模块,并接收自然语言解析模块输出的欲浏览或欲更新的信息内容,然后根据欲浏览的信息内容从信息知识库提取相应信息,将相应信息发送给第二网络收发模块,以便第二网络收发模块将相应信息发送给信息维护子系统,或根据所述欲更新的信息内容更新所述信息知识库中的相关信息;
所述自然语言解析模块用于对信息浏览请求或信息更新请求进行自然语言解析,提取出关键词、句型以及主题。
4.根据权利要求3所述的信息查询系统,其特征在于,所述信息查询服务器进一步包括:自然语言知识库,用于存储词典、词频、句法规则或语意规则,供自然语言解析模块进行自然语言解析;
所述自然语言解析模块通过调用自然语言知识库实现自然语言解析,从所述信息查询请求中提取关键词、句型以及主题。
5.根据权利要求1至4任一项所述的信息查询系统,其特征在于,所述信息维护子系统包括:信息维护接口和第三网络收发模块;其中,
所述信息维护接口用于接收来自所述信息提供者的所述信息浏览请求或信息更新请求,并显示信息浏览结果或更新结果;
所述第三网络收发模块用于将所述信息维护接口接收的信息浏览请求或信息更新请求发送给所述信息查询服务器,并从所述信息查询服务器获取信息浏览结果或更新结果。
6.根据权利要求5所述的信息查询系统,其特征在于,所述第三网络收发模块与信息查询服务器中的第二网络收发模块进行通信,将所述信息浏览请求或信息更新请求发送给所述第二网络收发模块。
7.根据权利要求1所述的信息查询系统,其特征在于,所述信息查询请求及所述信息查询结果由即时消息承载。
8.一种信息查询服务器,其特征在于,包括:网络收发模块、信息知识库、自然语言解析模块、推理模块及信息转化模块;其中,
所述网络收发模块用于将接收的自然语言形式的信息查询请求发送至推理模块,并转发推理模块返回的信息查询结果;用于接收来自信息提供者的自然语言形式的信息浏览请求或信息更新请求,将所述信息浏览请求或信息更新请求转发到信息转化模块;
所述推理模块用于从网络收发模块接收信息查询请求,并将所述信息查询请求发送至自然语言解析模块,并接收自然语言解析模块输出的关键词、句型以及主题,过滤所述关键词中的停用词,根据存储的同义词表对过滤停用词后的关键词进行同义词替换,然后根据所述关键词或者替换后的同义词、句型以及主题查询所述信息知识库,获得一个或多个信息查询结果,对得到的查询结果取交集或并集,然后再按预先设定的原则排序,得到其中最佳的查询结果,并返回信息查询结果到网络收发模块;
信息转化模块用于从网络收发模块接收信息浏览请求或信息更新请求,并将所述信息浏览请求或信息更新请求发送至自然语言解析模块,并接收自然语言解析模块输出的欲浏览或欲更新的信息内容,然后根据欲浏览的信息内容从信息知识库提取相应信息,将相应信息发送给网络收发模块,以便网络收发模块将相应信息发送给信息浏览请求的发送方,或根据所述欲更新的信息内容更新所述信息知识库中的信息;
所述信息知识库用于按照关键词、句型以及主题分别建索引,来存储供查询的信息;
所述自然语言解析模块用于对所述信息查询请求进行自然语言解析,提取出关键词、句型以及主题。
9.根据权利要求8所述的信息查询服务器,其特征在于,进一步包括:
自然语言知识库,用于存储词典、词频、句法规则或语意规则,供自然语言解析模块进行自然语言解析;
所述自然语言解析模块通过调用自然语言知识库实现自然语言解析,从所述信息查询请求中提取关键词、句型以及主题。
10.一种信息查询方法,其特征在于,包括:
接收自然语言形式的信息查询请求;
对所述信息查询请求进行自然语言解析,得到其中的关键词、句型以及主题;
过滤所述关键词中的停用词,根据存储的同义词表对过滤停用词后的关键词进行同义词替换,根据解析得到的关键词或者替换后的同义词、句型以及主题在自身存储的信息知识库中查询相应的信息,并以自然语言形式返回;
接收来自信息提供者的自然语言形式的信息更新请求;
对所述信息更新请求进行自然语言解析,得到欲更新信息的关键词、句型以及主题;
根据所述关键词、句型以及主题更新所述信息知识库中的信息。
11.根据权利要求10所述的信息查询方法,其特征在于,所述自然语言解析包括:
过滤自然语言形式信息查询请求中的乱码、空格制表符及标点;
对过滤后的信息查询请求进行分词,过滤其中停用词,得到关键词;
根据自身存储的同义词表对关键词进行同义词替换。
12.根据权利要求10或11所述的信息查询方法,其特征在于,所述更新的步骤包括:根据所述关键词、句型以及主题分别建立索引,并根据所述索引更新所述信息知识库。
13.根据权利要求10所述的信息查询方法,其特征在于,所述信息查询请求及所述信息查询结果由即时消息承载。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007100800488A CN101075929B (zh) | 2007-03-02 | 2007-03-02 | 信息查询系统、信息查询服务器及信息查询方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007100800488A CN101075929B (zh) | 2007-03-02 | 2007-03-02 | 信息查询系统、信息查询服务器及信息查询方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101075929A CN101075929A (zh) | 2007-11-21 |
CN101075929B true CN101075929B (zh) | 2010-11-24 |
Family
ID=38976758
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007100800488A Active CN101075929B (zh) | 2007-03-02 | 2007-03-02 | 信息查询系统、信息查询服务器及信息查询方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101075929B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106209508A (zh) * | 2016-07-05 | 2016-12-07 | 马岩 | 基于局域网邮件数据的抓取方法及系统 |
CN106209507A (zh) * | 2016-07-04 | 2016-12-07 | 马岩 | 基于网络邮件数据的抓取方法及系统 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101577685B (zh) * | 2008-05-09 | 2012-05-23 | 中国电信股份有限公司 | 信息查询方法及系统 |
CN101739435B (zh) * | 2008-11-07 | 2012-05-09 | 中国移动通信集团公司 | 数据库访问方法、控制装置 |
EP2207110A1 (en) * | 2009-01-07 | 2010-07-14 | THOMSON Licensing | A method and apparatus for exchanging media service queries |
WO2011030355A2 (en) * | 2009-09-14 | 2011-03-17 | Arun Jain | Zolog intelligent human language interface for business software applications |
CN102238219A (zh) * | 2010-04-30 | 2011-11-09 | 上海博泰悦臻电子设备制造有限公司 | 信息处理方法及信息处理系统 |
CN102541930A (zh) * | 2010-12-30 | 2012-07-04 | 上海博泰悦臻电子设备制造有限公司 | 车载终端和车载信息服务系统 |
CN102209048B (zh) * | 2011-05-24 | 2012-05-23 | 苏州阔地网络科技有限公司 | 一种用于实现用户信息共享的即时通讯系统及方法 |
CN102209047B (zh) * | 2011-05-24 | 2012-08-22 | 苏州阔地网络科技有限公司 | 一种信息共享的即时通讯系统及方法 |
CN103514091B (zh) * | 2012-06-28 | 2017-02-08 | 百度在线网络技术(北京)有限公司 | 流式系统的测试方法及装置 |
CN103678418B (zh) * | 2012-09-25 | 2017-06-06 | 富士通株式会社 | 信息处理方法和信息处理设备 |
CN103942203A (zh) * | 2013-01-18 | 2014-07-23 | 北大方正集团有限公司 | 一种信息处理方法及主题信息库制作系统 |
CN104156353B (zh) * | 2014-08-22 | 2017-10-31 | 秦一男 | 一种基于计算机的自然语言句法结构解析的方法和装置 |
CN105100708B (zh) * | 2015-06-26 | 2018-12-25 | 小米科技有限责任公司 | 请求处理方法及装置 |
CN105677635A (zh) * | 2015-12-29 | 2016-06-15 | 聚熵信息技术(上海)有限公司 | 用于自然语言交互的方法、设备及系统 |
CN106776812B (zh) * | 2016-11-24 | 2019-10-15 | 北京小米移动软件有限公司 | 更新关键字的方法及装置 |
CN108920484B (zh) * | 2018-04-28 | 2022-06-10 | 广州市百果园网络科技有限公司 | 搜索内容处理方法、装置及存储设备、计算机设备 |
CN109829085A (zh) * | 2018-12-17 | 2019-05-31 | 深圳壹账通智能科技有限公司 | 报表订阅方法、装置、计算机设备和存储介质 |
-
2007
- 2007-03-02 CN CN2007100800488A patent/CN101075929B/zh active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106209507A (zh) * | 2016-07-04 | 2016-12-07 | 马岩 | 基于网络邮件数据的抓取方法及系统 |
CN106209508A (zh) * | 2016-07-05 | 2016-12-07 | 马岩 | 基于局域网邮件数据的抓取方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN101075929A (zh) | 2007-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101075929B (zh) | 信息查询系统、信息查询服务器及信息查询方法 | |
CN1936893B (zh) | 基于互联网信息的输入法词频库的生成方法和系统 | |
US8417695B2 (en) | Identifying related concepts of URLs and domain names | |
CN102163198A (zh) | 提供新词或热词的方法及系统 | |
CN103902535B (zh) | 获取联想词的方法、装置及系统 | |
CN105389389B (zh) | 一种网络舆情传播态势媒体联动分析方法 | |
CN101179620A (zh) | 一种实现服务器自动问答的方法及系统 | |
WO2008116403A2 (en) | A method, system and equipment for client service | |
US10885283B2 (en) | Real time parsing and suggestions from pre-generated corpus with hypernyms | |
CN201298231Y (zh) | 自动识别多语种的多国语言交流和应用系统 | |
US20080154871A1 (en) | Method and Apparatus for Mobile Information Access in Natural Language | |
CN101330432A (zh) | 一种实现在线问答的系统和方法 | |
CN102385605B (zh) | 微博消息查找方法、系统及微博服务器 | |
CN100578506C (zh) | 网络信息搜索方法及搜索系统 | |
CN103235827A (zh) | 一种科技信息自动分类筛选的方法 | |
CN105279159B (zh) | 联系人的提示方法和装置 | |
US20180357303A1 (en) | Determining feature scores for message features | |
CN108470289B (zh) | 基于电商购物平台的虚拟物品发放方法及设备 | |
CN110059237A (zh) | 一种基于搜索引擎的爱好信息采集系统及其推荐方法 | |
CN106708932A (zh) | 问答类网站的回复的摘要提取方法及装置 | |
EP2518639A1 (en) | Method and device for processing continuous queries | |
CN101094436A (zh) | 信息互递智能平台 | |
CN106502980B (zh) | 一种基于文本词素切分的检索方法及系统 | |
US20140324898A1 (en) | System and method for searching aliases associated with an entity | |
US20180293508A1 (en) | Training question dataset generation from query data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |