CN104035997B - 一种基于文本分类和图像深度挖掘的科技情报获取与推送方法 - Google Patents
一种基于文本分类和图像深度挖掘的科技情报获取与推送方法 Download PDFInfo
- Publication number
- CN104035997B CN104035997B CN201410260379.XA CN201410260379A CN104035997B CN 104035997 B CN104035997 B CN 104035997B CN 201410260379 A CN201410260379 A CN 201410260379A CN 104035997 B CN104035997 B CN 104035997B
- Authority
- CN
- China
- Prior art keywords
- information
- text
- scientific
- cut
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
Abstract
Description
Claims (2)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410260379.XA CN104035997B (zh) | 2014-06-13 | 2014-06-13 | 一种基于文本分类和图像深度挖掘的科技情报获取与推送方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410260379.XA CN104035997B (zh) | 2014-06-13 | 2014-06-13 | 一种基于文本分类和图像深度挖掘的科技情报获取与推送方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104035997A CN104035997A (zh) | 2014-09-10 |
CN104035997B true CN104035997B (zh) | 2017-05-10 |
Family
ID=51466767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410260379.XA Active CN104035997B (zh) | 2014-06-13 | 2014-06-13 | 一种基于文本分类和图像深度挖掘的科技情报获取与推送方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104035997B (zh) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016145587A1 (zh) * | 2015-03-14 | 2016-09-22 | 王志强 | 自动买卖股票时的专利信息提醒方法以及股票买卖系统 |
CN105049320A (zh) * | 2015-05-22 | 2015-11-11 | 广西天海信息科技有限公司 | 一种同时管理多个微信公众账号的系统及方法 |
WO2016192028A1 (zh) * | 2015-06-01 | 2016-12-08 | 阮元 | 提醒视频更新时的专利信息推送方法以及信息提醒系统 |
WO2016201622A1 (zh) * | 2015-06-16 | 2016-12-22 | 深圳市华阳信通科技发展有限公司 | 将用户分类实现分类信息传输的系统及方法 |
CN105095402A (zh) * | 2015-07-08 | 2015-11-25 | 广西天海信息科技有限公司 | 一种微信素材的搜集方法 |
CN106445907A (zh) * | 2015-08-06 | 2017-02-22 | 北京国双科技有限公司 | 一种领域词典的生成方法及装置 |
WO2017024506A1 (zh) * | 2015-08-11 | 2017-02-16 | 常平 | 播放影视前插入广告时的信息提示方法和广告推送系统 |
WO2017028094A1 (zh) * | 2015-08-16 | 2017-02-23 | 常平 | 识别用户兴趣时的信息提醒方法和数据处理系统 |
WO2017028098A1 (zh) * | 2015-08-16 | 2017-02-23 | 常平 | 推荐网站时显示技术信息的方法和网站推荐系统 |
WO2017028192A1 (zh) * | 2015-08-18 | 2017-02-23 | 黄冠明 | 基于流量对在线电子书收费时的信息推送方法和收费系统 |
WO2017028194A1 (zh) * | 2015-08-18 | 2017-02-23 | 黄冠明 | 基于流量对在线视频收费时的信息推送方法和收费系统 |
CN108366526B (zh) * | 2015-10-12 | 2021-04-09 | 德罗纳斯德公司 | 通过自动生物特征数据的优先级简化林业信息管理的系统及方法 |
CN105490839B (zh) * | 2015-11-25 | 2018-11-27 | 山东中创软件商用中间件股份有限公司 | 一种网站数据安全的告警方法及装置 |
WO2017128340A1 (zh) * | 2016-01-29 | 2017-08-03 | 杨钰 | 一种分享链接信息时的专利情报展示方法及移动终端 |
WO2017132886A1 (zh) * | 2016-02-03 | 2017-08-10 | 刘芬 | 一种根据目的地推送信息时的专利提醒方法及服务器 |
WO2018018332A1 (zh) * | 2016-07-24 | 2018-02-01 | 张鹏华 | 一种查询单词时的信息提醒方法和阅读系统 |
WO2018023234A1 (zh) * | 2016-07-31 | 2018-02-08 | 杨洁 | 音乐与用户互动时的信息推送方法和音乐播放器 |
WO2018023439A1 (zh) * | 2016-08-02 | 2018-02-08 | 步晓芳 | 一种充值话费时的信息提示方案以及手机 |
WO2018027780A1 (zh) * | 2016-08-11 | 2018-02-15 | 王志远 | 推荐书籍时的技术权属信息展示方法和推送系统 |
CN108109086A (zh) * | 2016-11-24 | 2018-06-01 | 广州市优专网络科技有限公司 | 一种基于互联网用户行为的专利运营系统及方法 |
CN107315816A (zh) * | 2017-06-29 | 2017-11-03 | 朱峰 | 一种专利智能分析系统 |
CN107948052A (zh) * | 2017-11-14 | 2018-04-20 | 福建中金在线信息科技有限公司 | 信息爬取方法、装置、电子设备和系统 |
CN108804501B (zh) * | 2018-04-08 | 2020-12-11 | 深圳市腾讯计算机系统有限公司 | 一种检测有效信息的方法及装置 |
CN108628832B (zh) * | 2018-05-08 | 2022-03-18 | 中国联合网络通信集团有限公司 | 一种信息情报关键字获取方法及装置 |
CN109635714B (zh) * | 2018-12-07 | 2023-05-30 | 光典信息发展有限公司 | 文档扫描图像的矫正方法及装置 |
CN110321471A (zh) * | 2019-04-19 | 2019-10-11 | 四川政资汇智能科技有限公司 | 一种基于政策性资源汇聚的互联网科技金融智能匹配方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6185560B1 (en) * | 1998-04-15 | 2001-02-06 | Sungard Eprocess Intelligance Inc. | System for automatically organizing data in accordance with pattern hierarchies therein |
CN101582080A (zh) * | 2009-06-22 | 2009-11-18 | 浙江大学 | 一种基于图像和文本相关性挖掘的Web图像聚类方法 |
CN102708096A (zh) * | 2012-05-29 | 2012-10-03 | 代松 | 一种基于语义的网络智能舆情监测系统及其工作方法 |
CN103023714A (zh) * | 2012-11-21 | 2013-04-03 | 上海交通大学 | 基于网络话题的活跃度与集群结构分析系统及方法 |
-
2014
- 2014-06-13 CN CN201410260379.XA patent/CN104035997B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6185560B1 (en) * | 1998-04-15 | 2001-02-06 | Sungard Eprocess Intelligance Inc. | System for automatically organizing data in accordance with pattern hierarchies therein |
CN101582080A (zh) * | 2009-06-22 | 2009-11-18 | 浙江大学 | 一种基于图像和文本相关性挖掘的Web图像聚类方法 |
CN102708096A (zh) * | 2012-05-29 | 2012-10-03 | 代松 | 一种基于语义的网络智能舆情监测系统及其工作方法 |
CN103023714A (zh) * | 2012-11-21 | 2013-04-03 | 上海交通大学 | 基于网络话题的活跃度与集群结构分析系统及方法 |
Non-Patent Citations (1)
Title |
---|
The face database development of science and technology expects based on web mining;Chunxia Yang etc.;《2012Fourth International Conference on Multimedia Information Networking and Security》;20121231;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN104035997A (zh) | 2014-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104035997B (zh) | 一种基于文本分类和图像深度挖掘的科技情报获取与推送方法 | |
CN101794311B (zh) | 基于模糊数据挖掘的中文网页自动分类方法 | |
CN101593200B (zh) | 基于关键词频度分析的中文网页分类方法 | |
CN103744981A (zh) | 一种基于网站内容用于网站自动分类分析的系统 | |
CN104572849A (zh) | 基于文本语义挖掘的标准化自动建档方法 | |
CN106354861A (zh) | 电影标签自动标引方法及自动标引系统 | |
CN103577462B (zh) | 一种文档分类方法及装置 | |
CN103886020B (zh) | 一种房地产信息快速搜索方法 | |
CN104199845B (zh) | 基于主体模型的网上评论情感分类方法 | |
CN109345006A (zh) | 一种基于区域发展目标的招商政策分析优化方法及系统 | |
WO2014000130A1 (en) | Method or system for automated extraction of hyper-local events from one or more web pages | |
CN111723256A (zh) | 一种基于信息资源库的政务用户画像构建方法及其系统 | |
CN101751403B (zh) | 将超文字标签语言文件转换成纯文字文件的方法 | |
CN107239787A (zh) | 一种利用多来源数据具有隐私保护功能的图象分类方法 | |
Pappas et al. | Extracting informative textual parts from web pages containing user-generated content | |
CN110309355A (zh) | 内容标签的生成方法、装置、设备及存储介质 | |
Gali et al. | Extracting representative image from web page | |
CN108595466B (zh) | 一种互联网信息过滤以及互联网用户信息和网帖结构分析方法 | |
CN106777124B (zh) | 语义认知方法、装置及系统 | |
Cao et al. | Extraction of informative blocks from web pages | |
CN107368610A (zh) | 基于全文的大文本 crf 和规则分类方法和系统 | |
CN114706948A (zh) | 新闻处理方法、装置、存储介质以及电子设备 | |
CN110059316B (zh) | 一种基于数据感知的动态科技资源语义分析方法 | |
Agombar et al. | A clustering backed deep learning approach for document layout analysis | |
Lupu et al. | Patent images-a glass-encased tool: opening the case |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP02 | Change in the address of a patent holder |
Address after: 223400 8th floor, Anton building, 10 Haian Road, Lianshui County, Jiangsu. Patentee after: Huaijin Polytechnical College Address before: 223005 Jiangsu Huaian Higher Education Park 1 East Road Patentee before: Huaijin Polytechnical College |
|
CP02 | Change in the address of a patent holder | ||
TR01 | Transfer of patent right |
Effective date of registration: 20190627 Address after: 223005 No. 9 Haikou Road, Huaian Economic and Technological Development Zone, Jiangsu Province Patentee after: HUAI'AN FUN SOFTWARE CO., LTD. Address before: 223400 8th floor, Anton building, 10 Haian Road, Lianshui County, Jiangsu. Patentee before: Huaijin Polytechnical College |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210817 Address after: 215313 No. 555, hengchangjing Road, Zhoushi Town, Kunshan City, Suzhou City, Jiangsu Province Patentee after: Suzhou Hongtu Intelligent Technology Co.,Ltd. Address before: 223005 No. 9 Haikou Road, Huaian Economic and Technological Development Zone, Jiangsu Province Patentee before: HUAIAN FUN SOFWARE Co.,Ltd. |
|
TR01 | Transfer of patent right |