CN115640444A - 一种获取全面资讯的方法及系统 - Google Patents
一种获取全面资讯的方法及系统 Download PDFInfo
- Publication number
- CN115640444A CN115640444A CN202110821787.8A CN202110821787A CN115640444A CN 115640444 A CN115640444 A CN 115640444A CN 202110821787 A CN202110821787 A CN 202110821787A CN 115640444 A CN115640444 A CN 115640444A
- Authority
- CN
- China
- Prior art keywords
- retrieval
- search
- keyword
- information
- search result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000002372 labelling Methods 0.000 claims description 6
- OUBMGJOQLXMSNT-UHFFFAOYSA-N N-isopropyl-N'-phenyl-p-phenylenediamine Chemical compound C1=CC(NC(C)C)=CC=C1NC1=CC=CC=C1 OUBMGJOQLXMSNT-UHFFFAOYSA-N 0.000 description 1
- 241000282376 Panthera tigris Species 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035943 smell Effects 0.000 description 1
- 229910052719 titanium Inorganic materials 0.000 description 1
- 239000010936 titanium Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种获取全面资讯的方法及系统,包括以下步骤:获取第一检索需求,对第一检索需求进行处理得到第一检索关键词;将第一检索关键词输入搜索引擎进行检索,以找到与第一检索关键词匹配的第一检索结果;获取包含第一检索需求的第二检索需求,对第二检索需求进行处理得到第二检索关键词;将第二检索关键词与第一检索结果匹配得到第二检索结果并进行存储;分析第二检索结果得到全面资讯。本发明大大提高了企业家群体获取资讯的效率,且使得获取的资讯更为全面,且使得提供的资讯有序和精准。
Description
技术领域
本发明涉及互联网信息处理技术,具体涉及一种获取全面资讯的方法及系统。
背景技术
针对企业家角色,其需要查找与企业经营有关的资讯,如商机主题相关资讯。但是,市面上更多的是泛资讯,没有针对如商机主题类的资讯,有的是混杂在其它栏目中。而企业家为了获得相关资讯,就要花费大量的时间去寻找。如果能够有方法从无法识别的网站栏目中找到企业家所需的主题信息并提供给企业家,则能大大减少企业家在寻找资讯过程中浪费的时间,同时使得提供的资讯有序且精准。
而目前针对企业家对于了解市场资讯,缺乏一种能够快速且精准获取全面资讯的方法。
发明内容
为解决上述问题,本发明提供了一种获取全面资讯的方法及系统。
为实现上述目的,本发明的技术方案为:
一种获取全面资讯的方法,包括以下步骤:
获取第一检索需求,对第一检索需求进行处理得到第一检索关键词;
将第一检索关键词输入搜索引擎进行检索,以找到与第一检索关键词匹配的第一检索结果;
获取包含第一检索需求的第二检索需求,对第二检索需求进行处理得到第二检索关键词;
将第二检索关键词与第一检索结果匹配得到第二检索结果并进行存储;
分析第二检索结果得到全面资讯。
进一步的,所述第一检索需求为包含特征词的检索目标词组,所述特征词为与全面资讯相关的第一检索关键词。
进一步的,所述对第一检索需求进行处理得到第一检索关键词包括:对检索需求进行分类标注得到具有若干类型的第一检索关键词。
进一步的,所述分类标注包括用所述检索目标词组去匹配预设分类库中的预设关键词,将匹配成功的第一检索需求所对应的预设关键词记为资讯主题;所述预设分类库包含与全面资讯相关的预设关键词。
进一步的,所述将第一检索关键词输入搜索引擎进行检索,以找到与第一检索关键词匹配的第一检索结果包括:
接收第一检索关键词,得到一个或多个包含资讯内容的检索结果项,在所述搜索引擎的搜索结果界面中以各个资讯的数量大小对检索结果项进行排布;
判断检索结果项中的各项资讯内容是否与第一检索关键词相关,若是则进入下一步,若否则删除该检索结果项;
确定所述各检索结果项中的一个或多个分别对应的网址;
判断所述网址的每日浏览量是否达到第一预设值,若是则进入下一步,若否则删除该网址以及对应的检索结果项;
判断所述网址的资讯数量是否达到第二预设值,若是则进入下一步,若否则删除该网址以及对应的检索结果项;
将所述网址插入到对应检索结果项的预设位置,以生成第一搜索结果。
进一步的,所述判断检索结果项中的各项资讯内容是否与第一检索关键词相关包括:
在检索结果项中的各项资讯内容查找第一检索关键词以及第一检索关键词的近义词并记录查找结果;
当查找结果为检索到第一检索关键词以及第一检索关键词的近义词,则判定检索结果项中的各项资讯内容与全面资讯相关;
当查找结果为未检索到第一检索关键词以及第一检索关键词的近义词,则判定检索结果项中的各项资讯内容与全面资讯无关。
进一步的,所述第一预设值为所述网址的每日浏览量达到五万;所述第二预设值为所述网址的资讯数量达到五条。
进一步的,所述检索结果项包括资讯内容和资讯标题。
一种获取全面资讯的系统,包括:
第一处理单元,被配置为获取第一检索需求,对第一检索需求进行处理得到第一检索关键词;
检索单元,被配置为将第一检索关键词输入搜索引擎进行检索,以找到与第一检索关键词匹配的第一检索结果;
第二处理单元,被配置为获取包含第一检索需求的第二检索需求,对第二检索需求进行处理得到第二检索关键词;
匹配单元,被配置为将第二检索关键词与第一检索结果匹配得到第二检索结果;
存储单元,被配置为存储第二检索结果;
分析单元,被配置为分析第二检索结果得到全面资讯。
与现有技术相比,本发明的有益效果在于:
本发明大大提高了企业家群体获取资讯的效率,且使得获取的资讯更为全面,且使得提供的资讯有序和精准。
附图说明
图1为本发明实施例中获取全面资讯的方法流程示意图;
图2为本发明实施例中获取全面资讯的系统构架示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
请参阅图1,本发明实施例提供了一种获取全面资讯的方法,包括以下步骤:
S100:获取第一检索需求,对第一检索需求进行处理得到第一检索关键词;
具体的,第一检索需求为包含特征词的检索目标词组,特征词为与全面资讯相关的第一检索关键词。
对第一检索需求进行处理得到第一检索关键词包括:对检索需求进行分类标注得到具有若干类型的第一检索关键词。
分类标注包括用检索目标词组去匹配预设分类库中的预设关键词,将匹配成功的第一检索需求所对应的预设关键词记为资讯主题;预设分类库包含与全面资讯相关的预设关键词。例如,在检索需求为与“商机”相关的资讯内容时,预设关键词一般为“商机”,“风口”,而在其他类型下的检索需求也有与之对应的预设关键词。
S200:将第一检索关键词输入搜索引擎进行检索,以找到与第一检索关键词匹配的第一检索结果;
接收第一检索关键词,将第一检索关键词输入百度搜索、搜狗搜索、360搜索中进行检索得到一个或多个包含资讯内容的检索结果项,在搜索引擎的搜索结果界面中以各个资讯的数量大小对检索结果项进行排布;
判断检索结果项中的各项资讯内容是否与第一检索关键词相关,若是则进入下一步,若否则删除该检索结果项;
确定各检索结果项中的一个或多个分别对应的网址;如“36kr:https://36kr.com/”;“虎嗅网:https://www.huxiu.com/”;“钛媒体:https://www.tmtpost.com/”;“创业邦:https://www.cyzone.cn/”。
通过站长之家"https://alexa.chinaz.com/36kr.com/"判断网址的每日浏览量是否达到五万,若是则进入下一步,若否则删除该网址以及对应的检索结果项;
判断网址的资讯数量是否达到五条,若是则进入下一步,若否则删除该网址以及对应的检索结果项;
将网址插入到对应检索结果项的预设位置,以生成第一搜索结果。
判断检索结果项中的各项资讯内容是否与第一检索关键词相关包括:
在检索结果项中的各项资讯内容查找第一检索关键词以及第一检索关键词的近义词并记录查找结果;
当查找结果为检索到第一检索关键词以及第一检索关键词的近义词,则判定检索结果项中的各项资讯内容与全面资讯相关;
当查找结果为未检索到第一检索关键词以及第一检索关键词的近义词,则判定检索结果项中的各项资讯内容与全面资讯无关。
检索结果项包括资讯内容和资讯标题。
S300:获取包含第一检索需求的第二检索需求,对第二检索需求进行处理得到第二检索关键词;
S400:将第二检索关键词与第一检索结果匹配得到第二检索结果并进行存储;
S500:分析第二检索结果得到全面资讯。
通过已有的目标网站,扩充同类型的网站。主要实现方式是,在站长之家、5118、爱站三个站点中输入一个网站的域名首页,则会出现该网站的竞争网站或同类网站。例如:
爱站:"https://www.aizhan.com/pcsame/36kr.com/"、
站长之家:"https://tool.chinaz.com/vie/36kr.com"、
5118:"https://www.5118.com/seo/relatedsites/36kr.com"。
请参阅图2,本发明另一个实施例提供了一种获取全面资讯的系统,包括:
第一处理单元,被配置为获取第一检索需求,对第一检索需求进行处理得到第一检索关键词;
检索单元,被配置为将第一检索关键词输入搜索引擎进行检索,以找到与第一检索关键词匹配的第一检索结果;
第二处理单元,被配置为获取包含第一检索需求的第二检索需求,对第二检索需求进行处理得到第二检索关键词;
匹配单元,被配置为将第二检索关键词与第一检索结果匹配得到第二检索结果;
存储单元,被配置为存储第二检索结果;
分析单元,被配置为分析第二检索结果得到全面资讯。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (9)
1.一种获取全面资讯的方法,其特征在于,包括以下步骤:
获取第一检索需求,对第一检索需求进行处理得到第一检索关键词;
将第一检索关键词输入搜索引擎进行检索,以找到与第一检索关键词匹配的第一检索结果;
获取包含第一检索需求的第二检索需求,对第二检索需求进行处理得到第二检索关键词;
将第二检索关键词与第一检索结果匹配得到第二检索结果并进行存储;
分析第二检索结果得到全面资讯。
2.根据权利要求1所述的获取全面资讯的方法,其特征在于:所述第一检索需求为包含特征词的检索目标词组,所述特征词为与全面资讯相关的第一检索关键词。
3.根据权利要求2所述的获取全面资讯的方法,其特征在于,所述对第一检索需求进行处理得到第一检索关键词包括:对检索需求进行分类标注得到具有若干类型的第一检索关键词。
4.根据权利要求3所述的获取全面资讯的方法,其特征在于:所述分类标注包括用所述检索目标词组去匹配预设分类库中的预设关键词,将匹配成功的第一检索需求所对应的预设关键词记为资讯主题;所述预设分类库包含与全面资讯相关的预设关键词。
5.根据权利要求3所述的获取全面资讯的方法,其特征在于,所述将第一检索关键词输入搜索引擎进行检索,以找到与第一检索关键词匹配的第一检索结果包括:
接收第一检索关键词,得到一个或多个包含资讯内容的检索结果项,在所述搜索引擎的搜索结果界面中以各个资讯的数量大小对检索结果项进行排布;
判断检索结果项中的各项资讯内容是否与第一检索关键词相关,若是则进入下一步,若否则删除该检索结果项;
确定所述各检索结果项中的一个或多个分别对应的网址;
判断所述网址的每日浏览量是否达到第一预设值,若是则进入下一步,若否则删除该网址以及对应的检索结果项;
判断所述网址的资讯数量是否达到第二预设值,若是则进入下一步,若否则删除该网址以及对应的检索结果项;
将所述网址插入到对应检索结果项的预设位置,以生成第一搜索结果。
6.根据权利要求5所述的获取全面资讯的方法,其特征在于,所述判断检索结果项中的各项资讯内容是否与第一检索关键词相关:
在检索结果项中的各项资讯内容查找第一检索关键词以及第一检索关键词的近义词并记录查找结果;
当查找结果为检索到第一检索关键词以及第一检索关键词的近义词,则判定检索结果项中的各项资讯内容与全面资讯相关;
当查找结果为未检索到第一检索关键词以及第一检索关键词的近义词,则判定检索结果项中的各项资讯内容与全面资讯无关。
7.根据权利要求5所述的获取全面资讯的方法,其特征在于,所述第一预设值为所述网址的每日浏览量达到五万;所述第二预设值为所述网址的资讯数量达到五条。
8.根据权利要求5所述的获取全面资讯的方法,其特征在于:所述检索结果项包括资讯内容和资讯标题。
9.一种获取全面资讯的系统,其特征在于,包括:
第一处理单元,被配置为获取第一检索需求,对第一检索需求进行处理得到第一检索关键词;
检索单元,被配置为将第一检索关键词输入搜索引擎进行检索,以找到与第一检索关键词匹配的第一检索结果;
第二处理单元,被配置为获取包含第一检索需求的第二检索需求,对第二检索需求进行处理得到第二检索关键词;
匹配单元,被配置为将第二检索关键词与第一检索结果匹配得到第二检索结果;
存储单元,被配置为存储第二检索结果;
分析单元,被配置为分析第二检索结果得到全面资讯。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110821787.8A CN115640444A (zh) | 2021-07-20 | 2021-07-20 | 一种获取全面资讯的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110821787.8A CN115640444A (zh) | 2021-07-20 | 2021-07-20 | 一种获取全面资讯的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115640444A true CN115640444A (zh) | 2023-01-24 |
Family
ID=84939515
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110821787.8A Pending CN115640444A (zh) | 2021-07-20 | 2021-07-20 | 一种获取全面资讯的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115640444A (zh) |
-
2021
- 2021-07-20 CN CN202110821787.8A patent/CN115640444A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9773055B2 (en) | Query rewriting with entity detection | |
Noll et al. | Web search personalization via social bookmarking and tagging | |
US7865495B1 (en) | Word deletion for searches | |
US8037068B2 (en) | Searching through content which is accessible through web-based forms | |
CN101819578B (zh) | 检索方法、索引建立方法和装置及检索系统 | |
US7711737B2 (en) | Multi-document keyphrase extraction using partial mutual information | |
US20060253550A1 (en) | System and method for providing data for decision support | |
US20020129062A1 (en) | Apparatus and method for cataloging data | |
US20070022085A1 (en) | Techniques for unsupervised web content discovery and automated query generation for crawling the hidden web | |
CN100433018C (zh) | 电子文档与某一领域相关程度的判别方法及其应用 | |
US20070022125A1 (en) | Systems, methods, and computer program products for accumulating, strong, sharing, annotating, manipulating, and combining search results | |
US20120203778A1 (en) | Inferring search category synonyms | |
RU2236699C1 (ru) | Способ поиска и выборки информации с повышенной релевантностью | |
WO2009039392A1 (en) | A system for entity search and a method for entity scoring in a linked document database | |
US7657513B2 (en) | Adaptive help system and user interface | |
US9262510B2 (en) | Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries | |
US9971782B2 (en) | Document tagging and retrieval using entity specifiers | |
US20100332491A1 (en) | Method and system for utilizing user selection data to determine relevance of a web document for a search query | |
CN102270201A (zh) | 用于网络文件的多维索引的方法和设备 | |
CN116226515B (zh) | 一种搜索结果排序方法、装置、电子设备和存储介质 | |
US20080068627A1 (en) | Method and apparatus for determining and saving a location of a section of an item of content | |
CN115640444A (zh) | 一种获取全面资讯的方法及系统 | |
CN111625570B (zh) | 列表数据资源检索方法及装置 | |
Kowalski | Information Retrieval System Functions | |
KR20060002102A (ko) | 도서 본문 검색 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |