CN102591917A - 一种数据处理方法、系统及相关装置 - Google Patents
一种数据处理方法、系统及相关装置 Download PDFInfo
- Publication number
- CN102591917A CN102591917A CN2011104241770A CN201110424177A CN102591917A CN 102591917 A CN102591917 A CN 102591917A CN 2011104241770 A CN2011104241770 A CN 2011104241770A CN 201110424177 A CN201110424177 A CN 201110424177A CN 102591917 A CN102591917 A CN 102591917A
- Authority
- CN
- China
- Prior art keywords
- theme
- document
- information
- node
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 26
- 238000009826 distribution Methods 0.000 claims abstract description 96
- 238000000034 method Methods 0.000 claims abstract description 43
- 239000011159 matrix material Substances 0.000 claims description 155
- 230000008569 process Effects 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000005070 sampling Methods 0.000 abstract description 12
- 238000012545 processing Methods 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 33
- 238000010586 diagram Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 11
- 238000007476 Maximum Likelihood Methods 0.000 description 6
- 230000006399 behavior Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 238000007630 basic procedure Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 241000239290 Araneae Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
Abstract
Description
Claims (18)
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110424177.0A CN102591917B (zh) | 2011-12-16 | 2011-12-16 | 一种数据处理方法、系统及相关装置 |
PCT/CN2012/075842 WO2013086834A1 (zh) | 2011-12-16 | 2012-05-22 | 一种数据处理方法、系统及相关装置 |
US13/722,078 US8527448B2 (en) | 2011-12-16 | 2012-12-20 | System, method and apparatus for increasing speed of hierarchial latent dirichlet allocation model |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110424177.0A CN102591917B (zh) | 2011-12-16 | 2011-12-16 | 一种数据处理方法、系统及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102591917A true CN102591917A (zh) | 2012-07-18 |
CN102591917B CN102591917B (zh) | 2014-12-17 |
Family
ID=46480567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110424177.0A Active CN102591917B (zh) | 2011-12-16 | 2011-12-16 | 一种数据处理方法、系统及相关装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN102591917B (zh) |
WO (1) | WO2013086834A1 (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239327A (zh) * | 2013-06-17 | 2014-12-24 | 中国科学院深圳先进技术研究院 | 一种基于位置信息的移动互联网用户行为分析方法及装置 |
CN104750777A (zh) * | 2014-12-31 | 2015-07-01 | 东软集团股份有限公司 | 文本标注方法及系统 |
CN106502983A (zh) * | 2016-10-17 | 2017-03-15 | 清华大学 | 隐式狄利克雷模型的事件驱动的坍缩吉布斯采样方法 |
CN106776641A (zh) * | 2015-11-24 | 2017-05-31 | 华为技术有限公司 | 一种数据处理方法及装置 |
CN106919997A (zh) * | 2015-12-28 | 2017-07-04 | 航天信息股份有限公司 | 一种基于lda的电子商务的用户消费预测方法 |
CN107491417A (zh) * | 2017-07-06 | 2017-12-19 | 复旦大学 | 一种基于特定划分的主题模型下的文档生成方法 |
CN108140034A (zh) * | 2015-09-30 | 2018-06-08 | 微软技术许可有限责任公司 | 使用主题模型基于接收的词项选择内容项目 |
CN108197154A (zh) * | 2017-12-08 | 2018-06-22 | 复旦大学 | 交互式文档探索的在线子集主题建模方法 |
CN108334897A (zh) * | 2018-01-22 | 2018-07-27 | 上海海事大学 | 一种基于自适应高斯混合模型的海上漂浮物轨迹预测方法 |
CN108573338A (zh) * | 2018-03-14 | 2018-09-25 | 中山大学 | 一种基于mpi的分布式差分进化算法及装置 |
CN108763400A (zh) * | 2018-05-22 | 2018-11-06 | 合肥工业大学 | 基于对象行为和主题偏好的对象划分方法及装置 |
CN109190011A (zh) * | 2018-10-19 | 2019-01-11 | 中国科学院重庆绿色智能技术研究院 | 一种基于lda主题模型的新闻段落检索方法 |
CN110110861A (zh) * | 2019-05-09 | 2019-08-09 | 北京市商汤科技开发有限公司 | 确定模型超参数及模型训练的方法和装置、存储介质 |
CN110299206A (zh) * | 2018-03-21 | 2019-10-01 | 华东师范大学 | 一种多内容隐含狄利克雷分布模型及中医医案隐含病机挖掘方法 |
CN111149117A (zh) * | 2017-09-28 | 2020-05-12 | 甲骨文国际公司 | 机器学习和深度学习模型的基于梯度的自动调整 |
CN112596893A (zh) * | 2020-11-23 | 2021-04-02 | 中标慧安信息技术股份有限公司 | 用于多节点边缘计算设备的监控方法和系统 |
CN112733542A (zh) * | 2021-01-14 | 2021-04-30 | 北京工业大学 | 主题的探测方法、装置、电子设备及存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108763207A (zh) * | 2018-05-22 | 2018-11-06 | 南京大学 | 一种lda主题模型优化采样方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101986298A (zh) * | 2010-10-28 | 2011-03-16 | 浙江大学 | 用于在线论坛的信息实时推荐方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1269064C (zh) * | 2001-03-02 | 2006-08-09 | 惠普公司 | 文档和信息检索方法及设备 |
CN101359333B (zh) * | 2008-05-23 | 2010-06-16 | 中国科学院软件研究所 | 一种基于隐含狄利克雷分配模型的并行数据处理方法 |
CN102243625B (zh) * | 2011-07-19 | 2013-05-15 | 北京航空航天大学 | 一种基于N-gram增量主题模型的语义挖掘方法 |
-
2011
- 2011-12-16 CN CN201110424177.0A patent/CN102591917B/zh active Active
-
2012
- 2012-05-22 WO PCT/CN2012/075842 patent/WO2013086834A1/zh active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101986298A (zh) * | 2010-10-28 | 2011-03-16 | 浙江大学 | 用于在线论坛的信息实时推荐方法 |
Non-Patent Citations (2)
Title |
---|
ASLI CELIKYILMAZ等: "A Hybrid Hierarchical Model for Multiple-Document Summarization", 《PROCEEDINGS OF THE 48TH ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS》 * |
张明慧等: "基于LDA主题特征的自动文摘方法", 《计算机应用与软件》 * |
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239327B (zh) * | 2013-06-17 | 2017-11-07 | 中国科学院深圳先进技术研究院 | 一种基于位置信息的移动互联网用户行为分析方法及装置 |
CN104239327A (zh) * | 2013-06-17 | 2014-12-24 | 中国科学院深圳先进技术研究院 | 一种基于位置信息的移动互联网用户行为分析方法及装置 |
CN104750777A (zh) * | 2014-12-31 | 2015-07-01 | 东软集团股份有限公司 | 文本标注方法及系统 |
CN104750777B (zh) * | 2014-12-31 | 2018-04-06 | 东软集团股份有限公司 | 文本标注方法及系统 |
CN108140034B (zh) * | 2015-09-30 | 2022-03-29 | 微软技术许可有限责任公司 | 使用主题模型基于接收的词项选择内容项目 |
CN108140034A (zh) * | 2015-09-30 | 2018-06-08 | 微软技术许可有限责任公司 | 使用主题模型基于接收的词项选择内容项目 |
CN106776641A (zh) * | 2015-11-24 | 2017-05-31 | 华为技术有限公司 | 一种数据处理方法及装置 |
WO2017088587A1 (zh) * | 2015-11-24 | 2017-06-01 | 华为技术有限公司 | 一种数据处理方法及装置 |
CN106919997A (zh) * | 2015-12-28 | 2017-07-04 | 航天信息股份有限公司 | 一种基于lda的电子商务的用户消费预测方法 |
CN106502983B (zh) * | 2016-10-17 | 2019-05-10 | 清华大学 | 隐式狄利克雷模型的事件驱动的坍缩吉布斯采样方法 |
CN106502983A (zh) * | 2016-10-17 | 2017-03-15 | 清华大学 | 隐式狄利克雷模型的事件驱动的坍缩吉布斯采样方法 |
CN107491417B (zh) * | 2017-07-06 | 2021-06-22 | 复旦大学 | 一种基于特定划分的主题模型下的文档生成方法 |
CN107491417A (zh) * | 2017-07-06 | 2017-12-19 | 复旦大学 | 一种基于特定划分的主题模型下的文档生成方法 |
CN111149117A (zh) * | 2017-09-28 | 2020-05-12 | 甲骨文国际公司 | 机器学习和深度学习模型的基于梯度的自动调整 |
CN111149117B (zh) * | 2017-09-28 | 2023-09-19 | 甲骨文国际公司 | 机器学习和深度学习模型的基于梯度的自动调整 |
CN108197154A (zh) * | 2017-12-08 | 2018-06-22 | 复旦大学 | 交互式文档探索的在线子集主题建模方法 |
CN108197154B (zh) * | 2017-12-08 | 2021-07-23 | 复旦大学 | 交互式文档探索的在线子集主题建模方法 |
CN108334897A (zh) * | 2018-01-22 | 2018-07-27 | 上海海事大学 | 一种基于自适应高斯混合模型的海上漂浮物轨迹预测方法 |
CN108334897B (zh) * | 2018-01-22 | 2023-04-07 | 上海海事大学 | 一种基于自适应高斯混合模型的海上漂浮物轨迹预测方法 |
CN108573338A (zh) * | 2018-03-14 | 2018-09-25 | 中山大学 | 一种基于mpi的分布式差分进化算法及装置 |
CN110299206A (zh) * | 2018-03-21 | 2019-10-01 | 华东师范大学 | 一种多内容隐含狄利克雷分布模型及中医医案隐含病机挖掘方法 |
CN108763400A (zh) * | 2018-05-22 | 2018-11-06 | 合肥工业大学 | 基于对象行为和主题偏好的对象划分方法及装置 |
CN108763400B (zh) * | 2018-05-22 | 2021-09-14 | 合肥工业大学 | 基于对象行为和主题偏好的对象划分方法及装置 |
CN109190011A (zh) * | 2018-10-19 | 2019-01-11 | 中国科学院重庆绿色智能技术研究院 | 一种基于lda主题模型的新闻段落检索方法 |
CN110110861A (zh) * | 2019-05-09 | 2019-08-09 | 北京市商汤科技开发有限公司 | 确定模型超参数及模型训练的方法和装置、存储介质 |
CN110110861B (zh) * | 2019-05-09 | 2021-11-26 | 北京市商汤科技开发有限公司 | 确定模型超参数及模型训练的方法和装置、存储介质 |
CN112596893B (zh) * | 2020-11-23 | 2021-10-08 | 中标慧安信息技术股份有限公司 | 用于多节点边缘计算设备的监控方法和系统 |
CN112596893A (zh) * | 2020-11-23 | 2021-04-02 | 中标慧安信息技术股份有限公司 | 用于多节点边缘计算设备的监控方法和系统 |
CN112733542A (zh) * | 2021-01-14 | 2021-04-30 | 北京工业大学 | 主题的探测方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2013086834A1 (zh) | 2013-06-20 |
CN102591917B (zh) | 2014-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102591917A (zh) | 一种数据处理方法、系统及相关装置 | |
US8527448B2 (en) | System, method and apparatus for increasing speed of hierarchial latent dirichlet allocation model | |
US8380697B2 (en) | Search and retrieval methods and systems of short messages utilizing messaging context and keyword frequency | |
Afrati et al. | Parallel skyline queries | |
CN102402605B (zh) | 用于搜索引擎索引的混合分布模型 | |
CN101266603B (zh) | 一种网页信息分类方法、系统及应用该分类的服务系统 | |
CN102063469B (zh) | 一种用于获取相关关键词信息的方法、装置和计算机设备 | |
Sun et al. | The cost-efficient deployment of replica servers in virtual content distribution networks for data fusion | |
US20120317142A1 (en) | Systmen and method for data management in large data networks | |
CN105701216A (zh) | 一种信息推送方法及装置 | |
CN102508859A (zh) | 一种基于网页特征的广告分类方法及装置 | |
CN102012936B (zh) | 基于云计算平台的海量数据聚合方法和系统 | |
US10467307B1 (en) | Grouping of item data using seed expansion | |
CN104809130A (zh) | 数据查询的方法、设备及系统 | |
CN105786810B (zh) | 类目映射关系的建立方法与装置 | |
CN103268523A (zh) | 一种实现多个性能指标要求同时满足的服务组合方法 | |
US8738628B2 (en) | Community profiling for social media | |
CN102364475A (zh) | 基于身份识别对检索结果排序的系统及方法 | |
CN106789147A (zh) | 一种流量分析方法及装置 | |
CN102760127A (zh) | 基于扩展文本信息来确定资源类型的方法、装置及设备 | |
CN109885651A (zh) | 一种问题推送方法和装置 | |
CN111562990B (zh) | 一种基于消息的轻量级无服务器计算方法 | |
Mahmood et al. | FAST: frequency-aware spatio-textual indexing for in-memory continuous filter query processing | |
US20220284023A1 (en) | Estimating computational cost for database queries | |
CN110781384B (zh) | 一种基于优先级的内容推荐方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220406 Address after: 215010 room 704, building 5, No. 556, Changjiang Road, high tech Zone, Suzhou, Jiangsu Patentee after: SUZHOU YUDESHUI ELECTRICAL TECHNOLOGY Co.,Ltd. Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd. |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220419 Address after: 300000 Building 1, block g, No. 6, Huafeng Road, Huaming high tech Industrial Zone, Dongli District, Tianjin Patentee after: USTC TIANGONG INTELLIGENT EQUIPMENT TECHNOLOGY (TIANJIN) CO.,LTD. Address before: 215010 room 704, building 5, No. 556, Changjiang Road, high tech Zone, Suzhou, Jiangsu Patentee before: SUZHOU YUDESHUI ELECTRICAL TECHNOLOGY Co.,Ltd. |
|
EE01 | Entry into force of recordation of patent licensing contract | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20120718 Assignee: Yifei Xinghe (Tianjin) Intelligent Technology Co.,Ltd. Assignor: USTC TIANGONG INTELLIGENT EQUIPMENT TECHNOLOGY (TIANJIN) CO.,LTD. Contract record no.: X2024980003514 Denomination of invention: A data processing method, system, and related device Granted publication date: 20141217 License type: Common License Record date: 20240326 Application publication date: 20120718 Assignee: TIANJIN SUNCITY TESTING CO.,LTD. Assignor: USTC TIANGONG INTELLIGENT EQUIPMENT TECHNOLOGY (TIANJIN) CO.,LTD. Contract record no.: X2024980003505 Denomination of invention: A data processing method, system, and related device Granted publication date: 20141217 License type: Common License Record date: 20240326 Application publication date: 20120718 Assignee: Youwalker thermal technology (Tianjin) Co.,Ltd. Assignor: USTC TIANGONG INTELLIGENT EQUIPMENT TECHNOLOGY (TIANJIN) CO.,LTD. Contract record no.: X2024980003504 Denomination of invention: A data processing method, system, and related device Granted publication date: 20141217 License type: Common License Record date: 20240326 |