CN109471934A - 基于互联网的金融风险线索发掘方法 - Google Patents

基于互联网的金融风险线索发掘方法 Download PDF

Info

Publication number
CN109471934A
CN109471934A CN201811174968.0A CN201811174968A CN109471934A CN 109471934 A CN109471934 A CN 109471934A CN 201811174968 A CN201811174968 A CN 201811174968A CN 109471934 A CN109471934 A CN 109471934A
Authority
CN
China
Prior art keywords
dictionary
word
financial risks
clue
financial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811174968.0A
Other languages
English (en)
Other versions
CN109471934B (zh
Inventor
黄巍峰
范渊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dbappsecurity Technology Co Ltd
Original Assignee
Hangzhou Dbappsecurity Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dbappsecurity Technology Co Ltd filed Critical Hangzhou Dbappsecurity Technology Co Ltd
Priority to CN201811174968.0A priority Critical patent/CN109471934B/zh
Publication of CN109471934A publication Critical patent/CN109471934A/zh
Application granted granted Critical
Publication of CN109471934B publication Critical patent/CN109471934B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及网络搜索技术,旨在提供一种基于互联网的金融风险线索发掘方法。包括步骤:通过互联网中记载历史金融风险案件的舆情文章,获取金融风险正负面关键词;设置广搜辞典和金融风险相关正面宣传词典,调取互联网搜索引擎;利用搜索引擎推荐的热词,分割金融风险线索;利用金融风险相关负面风险词典,确认在关键目标主体舆情文章中的出现频度,确定金融风险线索可靠度;通过关键目标准确度,优化正面宣传词典和负面风险词典。本发明可以减少传统人为收集线索的工作量,快速发现线索,提高金融监管效率,减少大范围金融风险爆发可能。本发明解决人力分辨金融风险能力远远跟不上金融风险爆发速度的问题,为金融监管、处置部门提供高效的监管工具。

Description

基于互联网的金融风险线索发掘方法
技术领域
本发明涉及网络搜索技术,特别涉及基于互联网的金融风险线索发掘方法。
背景技术
在国内金融风险缺乏监管、金融风险监管目标不定、可监管来源不足的情况下,各监管单位很难去有效尽早发现风险目标。可疑线索往往在互联网上比比皆是,而传统人为收集线索效率极低,易引发大范围金融风险。如果此问题不予解决,仅依靠传统人为收集可疑线索,使得分辨金融风险能力远远跟不上金融风险爆发速度,将会导致中国互联网金融风险“雷暴式”崩溃,对人民群众、对国家都将造成巨大危害。
现有监管中,最多实现的仍是对人为既定收集的线索进行后期相关数据采集,主要是通过人为设置目标列表实时监测。其中虽然也使用了网络爬虫等技术,但是无法做到前期挖掘与发现,纯属于事后工作,所以无法解决线索发掘问题。
发明内容
本发明要解决的技术问题是,克服现有技术中的不足,提供一种基于互联网的金融风险线索发掘方法。
为解决上述技术问题,本发明采用的解决方案是:
提供一种基于互联网的金融风险线索发掘方法,包括以下步骤:
(1)通过互联网中记载历史金融风险案件的舆情文章,获取金融风险正负面关键词;
(2)设置广搜辞典和金融风险相关正面宣传词典,调取互联网搜索引擎;
(3)利用搜索引擎推荐的热词,分割金融风险线索;
(4)利用金融风险相关负面风险词典,确认在关键目标主体舆情文章中的出现频度,确定金融风险线索可靠度;
(5)通过关键目标准确度,优化正面宣传词典和负面风险词典。
本发明中,所述步骤(1)具体包括:
a)建立历史案件库存,其内容是现有历史金融风险案件(可以是任何现有案例的集合),至少需要包含风险目标网站的页面内容和风险目标在公众中的常用名称;
b)利用风险目标在公众中常用名称或风险目标网站页面内容,通过搜索引擎获取相关金融风险舆情文章,汇总得到金融宣传文章样本库;
c)利用感情分类器对金融宣传文章样本库的内容进行分析,对相关词语进行词频统计,取出权重靠前的词语,并区分情感正面词语和情感负面词语;
d)对获得的情感正面词语和情感负面词语进行分类存储(存储形式不局限于文本、数据库),得到正面宣传词典和负面风险词典。
本发明中,所述步骤(2)具体包括:
e)设置广搜辞典,并根据搜索引擎的搜索语法设置遍历规则;调取互联网搜索引擎,对金融风险相关的正面宣传词典中的各个词语进行遍历;
f)以页面解析装置获取遍历过程中各搜索引擎推荐的搜索热词,对获得的推荐结果进行数据存储(存储形式不局限于文本、数据库)。
本发明中,所述步骤(3)具体包括:
g)将正面宣传词典中的词语从引擎推荐的搜索热词中拆解删除,留下金融风险线索目标,并将结果进行数据存储(存储形式不局限于文本、数据库)。
本发明中,所述步骤(4)具体包括:
h)利用金融风险线索目标,通过搜索引擎在互联网中搜寻相关的文章;
i)遍历负面风险词典,根据多个风险词出现的频次计算每篇文章的权重;再整合全部文章的风险权重,得到该条金融风险线索的权重;
j)制定权重线,将权重线设置在能排除99%错误无关词语的权重上,对金融风险线索的风险程度进行评估;
k)将获取的结果作为值得关注金融风险线索进行数据存储(存储形式不局限于文本、数据库)。
本发明中,所述步骤(5)具体包括:
l)长时间持续运行步骤(1)至(4)的操作后,得到积累了正确样本案件的有效线索集合;
m)统计正面宣传词典的命中率,为每个目标关联的正面宣传词语添加一个权重;
n)统计负面风险词典命中率,为每个目标关联的负面风险词语添加一个权重;
o)将正面宣传词典和负面风险词典中的各词语按权重进行梯度排序后,设置词典准确线用于划分词语,淘汰词典准确线以下的词语;
p)利用词典准确线进行词语定期淘汰,得到更好的正面宣传词典和负面风险词典。
与现有技术相比,本发明的技术效果是:
1、本发明可以减少传统人为收集线索的工作量,快速发现线索,提高金融监管效率,减少大范围金融风险爆发可能。
2、本发明能够解决人力分辨金融风险能力远远跟不上金融风险爆发速度的问题,为金融监管、处置部门提供高效的监管工具。
附图说明
图1为字典初始化设置阶段的工作流程图;
图2为搜索引擎推荐分析阶段的工作流程图;
图3为目标主体分离阶段的工作流程图;
图4为舆情主体明确阶段的工作流程图;
图5为评分优化字典阶段的工作流程图。
具体实施方式
本发明利用到的部分术语说明:
搜索引擎技术背景:搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。搜索引擎在大量分析用户数据的情况下,会计算用户最新最关注的内容、最相关的内容、互联网搜索最多的内容,来满足用户的扩展搜索。
网络爬虫技术背景:网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。实现网络爬虫使用的编程语言多样,也衍生出了大量插件可供使用。
正则表达式:又称规则表达式(英语:Regular Expression,在代码中常简写为regex、regexp或RE),属于计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。格式化文本内容经常以此类方式批量获取关注目标。
评分卡技术:评分卡有多种实现方法和优化手段,是机器学习的雏形。用以优化样本群,淘汰低命中率特征,提高命中率特征权重的技术。
负面风险词典:遍历负面风险词典,给每篇文章计算多个风险词出现的权重,再整合全部文章的风险权重,给此条金融风险线索计算一个权重。现有技术中权重评估算法极多。
搜索引擎文章获取:通过编程语言(不限于python、java等),通过金融风险线索在搜索引擎中搜寻相关的文章。
金融风险线索拆解:通过编程语言(不限于python、java等),将正面宣传词典中使用的词语从热词中拆解删除,留下金融风险线索。
页面解析装置:通过编程语言(不限于python、java等),将各搜索引擎推荐热词收集,并将整面宣传词典中使用的词语从热词中删除,仅仅留下金融风险线索。
广搜词典:包含历年中英文常用单词、词句列表,不局限于中英文等语言,数量不定,不局限于每年权威或非正式统计词表。
感情分类器:现有成熟技术,能将舆情文章以及词语区分感情。感情分类器还有一个的功能,对相关词语进行词频统计,取出权重靠前词语,词频统计有成熟有效的方案。
下面结合附图,对本发明的具体实施方式进行详细描述。
本发明中基于互联网的金融风险线索发掘方法,包括以下步骤:
(1)通过互联网中记载历史金融风险案件的舆情文章,获取金融风险正负面关键词(即舆情文章字典初始化设置阶段);具体包括:
a)建立历史案件库存,其内容是现有历史金融风险案件,至少需要包含风险目标网站的页面内容和风险目标在公众中的常用名称;
b)利用风险目标在公众中常用名称或风险目标网站页面内容,通过搜索引擎获取相关金融风险舆情文章,汇总得到金融宣传文章样本库;
c)利用感情分类器对金融宣传文章样本库的内容进行分析,对相关词语进行词频统计,取出权重靠前的词语,并区分情感正面词语和情感负面词语;
d)对获得的情感正面词语和情感负面词语进行分类存储(存储形式不局限于文本、数据库),得到正面宣传词典和负面风险词典。
(2)设置广搜辞典和金融风险相关正面宣传词典,调取互联网搜索引擎(搜索引擎推荐分析阶段);具体包括:
e)设置广搜辞典,并根据搜索引擎的搜索语法设置遍历规则;调取互联网搜索引擎,对金融风险相关的正面宣传词典中的各个词语(可取两个,也可以取多个)进行遍历;
广搜词典包含历年中英文用单词、词句列表,不局限于中英文等语言,数量不定,不局限于每年权威或非正式统计词表。例如,可选择中国常用汉字三千字。
f)以页面解析装置(以编程语言实现,不限于python、java等)获取遍历过程中各搜索引擎推荐的搜索热词,对获得的推荐结果进行数据存储。
以百度为例,“+”符号代表“连接”的意思,此处“+”符号可选用空格代替。
(3)利用搜索引擎推荐的热词,分割金融风险线索(目标主体分离阶段);具体包括:
g)将正面宣传词典中的词语()从引擎推荐的搜索热词中拆解删除(以编程语言实现,不限于python、java等),留下金融风险线索目标,并将结果进行数据存储。
(4)利用金融风险相关负面风险词典,确认在关键目标主体舆情文章中的出现频度,确定金融风险线索可靠度(舆情主体明确阶段);具体包括:
h)利用金融风险线索目标,通过搜索引擎在互联网中搜寻相关的文章(以编程语言实现,不限于python、java等);
i)遍历负面风险词典,根据多个风险词出现的频次计算每篇文章的权重;再整合全部文章的风险权重,得到该条金融风险线索的权重;权重评估算法极多,此处可使用最简单的一种,按照词语出现次数进行加数操作。
j)制定权重线,将权重线设置在能排除99%错误无关词语的权重上,对金融风险线索的风险程度进行评估;
k)将获取的结果作为值得关注金融风险线索进行数据存储。
(5)通过关键目标准确度,优化正面宣传词典和负面风险词典(评分优化字典阶段)。具体包括:
l)长时间持续运行步骤(1)至(4)的操作后,得到积累了正确样本案件的有效线索集合;
m)统计正面宣传词典的命中率,为每个目标关联的正面宣传词语添加一个权重;
n)统计负面风险词典命中率,为每个目标关联的负面风险词语添加一个权重;
o)将正面宣传词典和负面风险词典中的各词语按权重进行梯度排序后,设置词典准确线用于划分词语,淘汰词典准确线以下的词语;例如,可将权重定为3(即至少三个有效线索使用到此词语)。
p)利用词典准确线进行词语定期淘汰,得到更好的正面宣传词典和负面风险词典。
作为示例的实例:
1.首先通过对已有的金融风险案件库A中的数百个金融风险目标的网站、金融风险目标名称进行分析。通过金融风险目标名称在搜索引擎上找到大量舆情文章;对舆情文章、金融风险网站进行第一步骤的碰撞分析,获取正面字典库Y,负面字典库N。
2.选取广搜词典X,遍历广搜词典中元素x与正面词典中元素y,组合成搜索词“x(空格)y”,并在搜索引擎,例如百度上搜索。通过程序获取其下方九个推荐热词n1,存入库N1中
3.通过将库N1中的n1中的正面词典中元素y从推荐热词n1中分离,获取真实金融风险关键词n2,存入库N2中
4.通过N2库中的关键词,去搜索引擎上直接搜索,通过第四步爬取前十篇相关文章,并统计负面字典库N中词语在文章中出现权重,如果一篇文章有则权重加一,满足十篇文章皆有负面字典库N中词语的关键词才进入金融风险目标库Z,其余丢弃
5.为每个正面字典库Y和负面字典库N中的元素y和n设置一个权重,每次由此关键词成功通过了一个金融风险z,则为这个y或n权重加一。持续运行一段时间后,淘汰权重最低的y或n。

Claims (6)

1.一种基于互联网的金融风险线索发掘方法,其特征在于,包括以下步骤:
(1)通过互联网中记载历史金融风险案件的舆情文章,获取金融风险正负面关键词;
(2)设置广搜辞典和金融风险相关正面宣传词典,调取互联网搜索引擎;
(3)利用搜索引擎推荐的热词,分割金融风险线索;
(4)利用金融风险相关负面风险词典,确认在关键目标主体舆情文章中的出现频度,确定金融风险线索可靠度;
(5)通过关键目标准确度,优化正面宣传词典和负面风险词典。
2.根据权利要求1所述的方法,其特征在于,所述步骤(1)具体包括:
a)建立历史案件库存,其内容是现有历史金融风险案件,至少需要包含风险目标网站的页面内容和风险目标在公众中的常用名称;
b)利用风险目标在公众中常用名称或风险目标网站页面内容,通过搜索引擎获取相关金融风险舆情文章,汇总得到金融宣传文章样本库;
c)利用感情分类器对金融宣传文章样本库的内容进行分析,对相关词语进行词频统计,取出权重靠前的词语,并区分情感正面词语和情感负面词语;
d)对获得的情感正面词语和情感负面词语进行分类存储(存储形式不局限于文本、数据库),得到正面宣传词典和负面风险词典。
3.根据权利要求1所述的方法,其特征在于,所述步骤(2)具体包括:
e)设置广搜辞典,并根据搜索引擎的搜索语法设置遍历规则;调取互联网搜索引擎,对金融风险相关的正面宣传词典中的各个词语进行遍历;
f)以页面解析装置获取遍历过程中各搜索引擎推荐的搜索热词,对获得的推荐结果进行数据存储。
4.根据权利要求1所述的方法,其特征在于,所述步骤(3)具体包括:
g)将正面宣传词典中的词语从引擎推荐的搜索热词中拆解删除,留下金融风险线索目标,并将结果进行数据存储。
5.根据权利要求1所述的方法,其特征在于,所述步骤(4)具体包括:
h)利用金融风险线索目标,通过搜索引擎在互联网中搜寻相关的文章;
i)遍历负面风险词典,根据多个风险词出现的频次计算每篇文章的权重;再整合全部文章的风险权重,得到该条金融风险线索的权重;
j)制定权重线,将权重线设置在能排除99%错误无关词语的权重上,对金融风险线索的风险程度进行评估;
k)将获取的结果作为值得关注金融风险线索进行数据存储。
6.根据权利要求1所述的方法,其特征在于,所述步骤(5)具体包括:
l)长时间持续运行步骤(1)至(4)的操作后,得到积累了正确样本案件的有效线索集合;
m)统计正面宣传词典的命中率,为每个目标关联的正面宣传词语添加一个权重;
n)统计负面风险词典命中率,为每个目标关联的负面风险词语添加一个权重;
o)将正面宣传词典和负面风险词典中的各词语按权重进行梯度排序后,设置词典准确线用于划分词语,淘汰词典准确线以下的词语;
p)利用词典准确线进行词语定期淘汰,得到更好的正面宣传词典和负面风险词典。
CN201811174968.0A 2018-10-09 2018-10-09 基于互联网的金融风险线索发掘方法 Active CN109471934B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811174968.0A CN109471934B (zh) 2018-10-09 2018-10-09 基于互联网的金融风险线索发掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811174968.0A CN109471934B (zh) 2018-10-09 2018-10-09 基于互联网的金融风险线索发掘方法

Publications (2)

Publication Number Publication Date
CN109471934A true CN109471934A (zh) 2019-03-15
CN109471934B CN109471934B (zh) 2021-08-17

Family

ID=65663279

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811174968.0A Active CN109471934B (zh) 2018-10-09 2018-10-09 基于互联网的金融风险线索发掘方法

Country Status (1)

Country Link
CN (1) CN109471934B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254650A (zh) * 2021-06-28 2021-08-13 明品云(北京)数据科技有限公司 一种基于知识图谱的评估推送方法、系统、设备和介质
CN114756712A (zh) * 2022-06-14 2022-07-15 飞狐信息技术(天津)有限公司 热词数量的统计方法、装置、电子设备及计算机存储介质
CN116308758A (zh) * 2023-03-20 2023-06-23 深圳征信服务有限公司 一种基于大数据的金融风险分析方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170090370A (ko) * 2017-06-05 2017-08-07 숙명여자대학교산학협력단 리뷰 데이터 분석 방법, 이를 이용한 시스템 및 이동 단말기
KR20170102098A (ko) * 2016-02-29 2017-09-07 중앙대학교 산학협력단 게임분석모형을 통한 인지 정서 장애 환자 감별 장치 및 방법
CN107943800A (zh) * 2016-10-09 2018-04-20 郑州大学 一种微博话题舆情计算与分析的方法
US20180121618A1 (en) * 2016-11-02 2018-05-03 Cota Inc. System and method for extracting oncological information of prognostic significance from natural language
CN108009911A (zh) * 2017-11-29 2018-05-08 上海出版印刷高等专科学校 一种识别p2p网络借贷借款人违约风险的方法
CN108021651A (zh) * 2017-11-30 2018-05-11 中科金联(北京)科技有限公司 一种网络舆情风险评估方法及装置
CN108108352A (zh) * 2017-12-18 2018-06-01 广东广业开元科技有限公司 一种基于机器学习文本挖掘技术的企业投诉风险预警方法
CN108564467A (zh) * 2018-05-09 2018-09-21 平安普惠企业管理有限公司 一种用户风险等级的确定方法及设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170102098A (ko) * 2016-02-29 2017-09-07 중앙대학교 산학협력단 게임분석모형을 통한 인지 정서 장애 환자 감별 장치 및 방법
CN107943800A (zh) * 2016-10-09 2018-04-20 郑州大学 一种微博话题舆情计算与分析的方法
US20180121618A1 (en) * 2016-11-02 2018-05-03 Cota Inc. System and method for extracting oncological information of prognostic significance from natural language
KR20170090370A (ko) * 2017-06-05 2017-08-07 숙명여자대학교산학협력단 리뷰 데이터 분석 방법, 이를 이용한 시스템 및 이동 단말기
CN108009911A (zh) * 2017-11-29 2018-05-08 上海出版印刷高等专科学校 一种识别p2p网络借贷借款人违约风险的方法
CN108021651A (zh) * 2017-11-30 2018-05-11 中科金联(北京)科技有限公司 一种网络舆情风险评估方法及装置
CN108108352A (zh) * 2017-12-18 2018-06-01 广东广业开元科技有限公司 一种基于机器学习文本挖掘技术的企业投诉风险预警方法
CN108564467A (zh) * 2018-05-09 2018-09-21 平安普惠企业管理有限公司 一种用户风险等级的确定方法及设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113254650A (zh) * 2021-06-28 2021-08-13 明品云(北京)数据科技有限公司 一种基于知识图谱的评估推送方法、系统、设备和介质
CN114756712A (zh) * 2022-06-14 2022-07-15 飞狐信息技术(天津)有限公司 热词数量的统计方法、装置、电子设备及计算机存储介质
CN114756712B (zh) * 2022-06-14 2022-09-20 飞狐信息技术(天津)有限公司 热词数量的统计方法、装置、电子设备及计算机存储介质
CN116308758A (zh) * 2023-03-20 2023-06-23 深圳征信服务有限公司 一种基于大数据的金融风险分析方法及系统
CN116308758B (zh) * 2023-03-20 2024-01-05 深圳征信服务有限公司 一种基于大数据的金融风险分析方法及系统

Also Published As

Publication number Publication date
CN109471934B (zh) 2021-08-17

Similar Documents

Publication Publication Date Title
CN103605665B (zh) 一种基于关键词的评审专家智能检索与推荐方法
CN105488196B (zh) 一种基于互联语料的热门话题自动挖掘系统
CN105488024B (zh) 网页主题句的抽取方法及装置
US10909427B2 (en) Method and device for classifying webpages
CN107153658A (zh) 一种基于关键字加权算法的舆情热词发现方法
CN108197117A (zh) 一种基于文档主题结构与语义的中文文本关键词提取方法
CN108829658A (zh) 新词发现的方法及装置
CN104077407B (zh) 一种智能数据搜索系统及方法
CN103246644B (zh) 一种网络舆情信息处理方法和装置
CN102254014A (zh) 一种网页特征自适应的信息抽取方法
CN105320646A (zh) 一种基于增量聚类的新闻话题挖掘方法及其装置
CN109471934A (zh) 基于互联网的金融风险线索发掘方法
CN108345686A (zh) 一种基于搜索引擎技术的数据分析方法及系统
CN104636407B (zh) 参数取值训练及搜索请求处理方法和装置
CN102567409A (zh) 一种提供检索关联词的方法及装置
CN110543595A (zh) 一种站内搜索系统及方法
CN110222260A (zh) 一种搜索方法、装置及存储介质
CN106844482B (zh) 一种基于搜索引擎的检索信息匹配方法及装置
CN103942268A (zh) 搜索与应用相结合的方法、设备以及应用接口
CN108647199A (zh) 一种地名新词的发现方法
CN103761286B (zh) 一种基于用户兴趣的服务资源检索方法
CN113065070A (zh) 一种移动互联网信息搜索检索智能排序方法、系统、设备和计算机存储介质
CN113157903A (zh) 一种面向多领域的电力词库构建方法
US20090024591A1 (en) Device, method and program for producing related words dictionary, and content search device
CN106815195A (zh) 一种分词方法及装置、检索方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant