CN105786492A - 利用大数据的方法实现代码预测提示的方法 - Google Patents

利用大数据的方法实现代码预测提示的方法 Download PDF

Info

Publication number
CN105786492A
CN105786492A CN201610098010.2A CN201610098010A CN105786492A CN 105786492 A CN105786492 A CN 105786492A CN 201610098010 A CN201610098010 A CN 201610098010A CN 105786492 A CN105786492 A CN 105786492A
Authority
CN
China
Prior art keywords
code
data
user
big data
prompting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610098010.2A
Other languages
English (en)
Inventor
李源
徐宏伟
姚民伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Software Group Co Ltd
Original Assignee
Inspur Software Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Software Group Co Ltd filed Critical Inspur Software Group Co Ltd
Priority to CN201610098010.2A priority Critical patent/CN105786492A/zh
Publication of CN105786492A publication Critical patent/CN105786492A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了利用大数据的方法实现代码预测提示的方法,所述方法将用户在书写代码时候的代码结构与模块,通过node.js的爬虫工具进行收集,并且通过大数据的方法经过数据的清洗、分析、脱敏、分类将这些数据进行集合整理,存放到数据库中,生成代码预测比对标记库,通过代码比对预测技术,实现用户在代码书写过程中的代码提示功能。

Description

利用大数据的方法实现代码预测提示的方法
技术领域
本发明涉及大数据技术领域,具体涉及一种利用大数据的方法实现代码预测提示的方法。
背景技术
互联网时代,随着互联网使用的越加频繁,对程序开发功能与速度都有很高的要求。程序员需要在较短的时间内写出高质量的代码,在保证代码质量的同时需要使得程序员能写出更多的代码,因此本发明可以在程序员书写代码的时候能够预测性的给予相应的提示,然后对程序员的代码习惯加以纠正与优化,同时能够提高书写代码的效率。
发明内容
本发明要解决的技术问题是:本发明提供一种利用大数据的方法实现代码预测提示的方法。
本发明所采用的技术方案为:
利用大数据的方法实现代码预测提示的方法,所述方法将用户在书写代码时候的代码结构与模块,通过node.js的爬虫工具进行收集,并且通过大数据的方法经过数据的清洗、分析、脱敏、分类将这些数据进行集合整理,存放到数据库中,生成代码预测比对标记库,通过代码比对预测技术,实现用户在代码书写过程中的代码提示功能。
实施例2:
在实施例1的基础上,本实施例所述方法操作步骤如下:
步骤1:利用js与node.js爬虫系统相结合的方法获得用户代码书写时候的结构与模块数据;
步骤2:将生成的数据存到统一的数据库中保存;
步骤3:用大数据的方法对数据进行清洗、分析、分类;
步骤4:对数据中涉及用户隐私的信息处理清除(脱敏);
步骤5:根据分析得到代码预测比对标记库;
步骤6:运用node.js建立预对比程序模块;
步骤7:从代码预测比对标记库中获得对比数据,利用比对模块进行比对并给予用户提示。
JavaScript一种直译式脚本语言,外语缩写JS,是一种动态类型、弱类型、基于原型的语言,内置支持类型。它的解释器被称为JavaScript引擎,为浏览器的一部分,广泛用于客户端的脚本语言,最早是在HTML(标准通用标记语言下的一个应用)网页上使用,用来给HTML网页增加动态功能。
Node.js是一个基于ChromeJavaScript运行时建立的平台,用于方便地搭建响应速度快、易于扩展的网络应用。Node.js使用事件驱动,非阻塞I/O模型而得以轻量和高效,非常适合在分布式设备上运行的数据密集型的实时应用。
爬虫工具:这是一个很形象的说法,是用来形容象“baidu.com,google.com”等搜索引擎的,在互联网上搜索用户请求的信息像一群虫子一样的全方位的爬行、搜索。“爬虫系统”这个词变成了搜索引擎的代名词。
实施例3:
在实施例1或2的基础上,本实施例所述方法收集用户的书写代码结构首先要用户能够同意监测。
本发明的有益效果为:
本发明通过用户在代码书写过程中代码模块结构的收集,将收集的代码经过大数据的比对与“代码训练”生成代码实施比对标记库,通过我们的代码比对预测技术,从而实现用户在代码书写过程中的代码提示功能。
附图说明
图1为本发明方法实现流程图。
具体实施方式
下面结合说明书附图,通过具体实施方式对本发明进一步说明:
实施例1:
如图1所示,利用大数据的方法实现代码预测提示的方法,所述方法将用户在书写代码时候的代码结构与模块,通过node.js的爬虫工具进行收集,并且通过大数据的方法经过数据的清洗、分析、脱敏、分类将这些数据进行集合整理,存放到数据库中,生成代码预测比对标记库,通过代码比对预测技术,实现用户在代码书写过程中的代码提示功能。
实施例2:
如图1所示,在实施例1的基础上,本实施例所述方法操作步骤如下:
步骤1:利用js与node.js爬虫系统相结合的方法获得用户代码书写时候的结构与模块数据;
步骤2:将生成的数据存到统一的数据库中保存;
步骤3:用大数据的方法对数据进行清洗、分析、分类;
步骤4:对数据中涉及用户隐私的信息处理清除(脱敏);
步骤5:根据分析得到代码预测比对标记库;
步骤6:运用node.js建立预对比程序模块;
步骤7:从代码预测比对标记库中获得对比数据,利用比对模块进行比对并给予用户提示。
实施例3:
在实施例1或2的基础上,本实施例所述方法收集用户的书写代码结构首先要用户能够同意监测。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (3)

1.利用大数据的方法实现代码预测提示的方法,其特征在于:所述方法将用户在书写代码时候的代码结构与模块,通过node.js的爬虫工具进行收集,并且通过大数据的方法经过数据的清洗、分析、脱敏、分类将这些数据进行集合整理,存放到数据库中,生成代码预测比对标记库,通过代码比对预测技术,实现用户在代码书写过程中的代码提示功能。
2.根据权利要求1所述的利用大数据的方法实现代码预测提示的方法,其特征在于,所述方法操作步骤如下:
步骤1:利用js与node.js爬虫系统相结合的方法获得用户代码书写时候的结构与模块数据;
步骤2:将生成的数据存到统一的数据库中保存;
步骤3:用大数据的方法对数据进行清洗、分析、分类;
步骤4:对数据中涉及用户隐私的信息处理清除;
步骤5:根据分析得到代码预测比对标记库;
步骤6:运用node.js建立预对比程序模块;
步骤7:从代码预测比对标记库中获得对比数据,利用比对模块进行比对并给予用户提示。
3.根据权利要求1或2任一所述的利用大数据的方法实现代码预测提示的方法,其特征在于:所述方法收集用户的书写代码结构首先要用户能够同意监测。
CN201610098010.2A 2016-02-23 2016-02-23 利用大数据的方法实现代码预测提示的方法 Pending CN105786492A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610098010.2A CN105786492A (zh) 2016-02-23 2016-02-23 利用大数据的方法实现代码预测提示的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610098010.2A CN105786492A (zh) 2016-02-23 2016-02-23 利用大数据的方法实现代码预测提示的方法

Publications (1)

Publication Number Publication Date
CN105786492A true CN105786492A (zh) 2016-07-20

Family

ID=56402741

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610098010.2A Pending CN105786492A (zh) 2016-02-23 2016-02-23 利用大数据的方法实现代码预测提示的方法

Country Status (1)

Country Link
CN (1) CN105786492A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106201519A (zh) * 2016-07-13 2016-12-07 浪潮软件集团有限公司 一种实现代码预测提示的方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007143914A1 (fr) * 2006-06-02 2007-12-21 Beijing Sogou Technology Development Co., Ltd. Procédé, dispositif et système de saisie pour la création d'une base de données de fréquence de mots basée sur des informations issues du web
CN101441524A (zh) * 2008-11-26 2009-05-27 腾讯科技(深圳)有限公司 输入法中候选内容的生成方法及装置
CN101470732A (zh) * 2007-12-26 2009-07-01 北京搜狗科技发展有限公司 一种辅助词库的生成方法和装置
CN101650605A (zh) * 2009-09-25 2010-02-17 中国电信股份有限公司 一种智能汉字输入方法和系统
CN101697109A (zh) * 2009-10-26 2010-04-21 北京搜狗科技发展有限公司 一种获取输入法候选项的方法及系统
CN104036035A (zh) * 2014-06-30 2014-09-10 百度在线网络技术(北京)有限公司 一种历史搜索建议提示方法及装置
CN104166700A (zh) * 2014-08-01 2014-11-26 百度在线网络技术(北京)有限公司 搜索词推荐方法及装置
CN104777916A (zh) * 2014-01-10 2015-07-15 北京搜狗科技发展有限公司 一种文字输入方法和系统
CN105094368A (zh) * 2015-07-24 2015-11-25 上海二三四五网络科技有限公司 一种对输入法候选项进行调频排序的控制方法及控制装置
WO2016008452A1 (zh) * 2014-07-18 2016-01-21 上海触乐信息科技有限公司 高效输入的预测方法和装置
CN105335415A (zh) * 2014-08-04 2016-02-17 北京搜狗科技发展有限公司 基于输入预测的搜索方法和输入法系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007143914A1 (fr) * 2006-06-02 2007-12-21 Beijing Sogou Technology Development Co., Ltd. Procédé, dispositif et système de saisie pour la création d'une base de données de fréquence de mots basée sur des informations issues du web
CN101470732A (zh) * 2007-12-26 2009-07-01 北京搜狗科技发展有限公司 一种辅助词库的生成方法和装置
CN101441524A (zh) * 2008-11-26 2009-05-27 腾讯科技(深圳)有限公司 输入法中候选内容的生成方法及装置
CN101650605A (zh) * 2009-09-25 2010-02-17 中国电信股份有限公司 一种智能汉字输入方法和系统
CN101697109A (zh) * 2009-10-26 2010-04-21 北京搜狗科技发展有限公司 一种获取输入法候选项的方法及系统
CN104777916A (zh) * 2014-01-10 2015-07-15 北京搜狗科技发展有限公司 一种文字输入方法和系统
CN104036035A (zh) * 2014-06-30 2014-09-10 百度在线网络技术(北京)有限公司 一种历史搜索建议提示方法及装置
WO2016008452A1 (zh) * 2014-07-18 2016-01-21 上海触乐信息科技有限公司 高效输入的预测方法和装置
CN104166700A (zh) * 2014-08-01 2014-11-26 百度在线网络技术(北京)有限公司 搜索词推荐方法及装置
CN105335415A (zh) * 2014-08-04 2016-02-17 北京搜狗科技发展有限公司 基于输入预测的搜索方法和输入法系统
CN105094368A (zh) * 2015-07-24 2015-11-25 上海二三四五网络科技有限公司 一种对输入法候选项进行调频排序的控制方法及控制装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106201519A (zh) * 2016-07-13 2016-12-07 浪潮软件集团有限公司 一种实现代码预测提示的方法

Similar Documents

Publication Publication Date Title
Akimova et al. A survey on software defect prediction using deep learning
CN106462399B (zh) 代码推荐
US9070046B2 (en) Learning-based image webpage index selection
CN113822067A (zh) 关键信息提取方法、装置、计算机设备及存储介质
US10387435B2 (en) Computer application query suggestions
JP2010501096A (ja) ラッパー生成およびテンプレート検出の協同最適化
Zanjani et al. Impact analysis of change requests on source code based on interaction and commit histories
US20180032607A1 (en) Platform support clusters from computer application metadata
US8489643B1 (en) System and method for automated content aggregation using knowledge base construction
CN112749284A (zh) 知识图谱构建方法、装置、设备及存储介质
CN110825941A (zh) 一种内容管理系统识别方法、装置和存储介质
CN101571860A (zh) 动态网页生成方法和装置、提取结构化数据的方法和装置
CN110502520A (zh) 一种数据入库的方法、系统、设备及计算机可读存储介质
CN102654873A (zh) 基于中文分词的旅游信息抽取与聚合方法
JP2015508918A (ja) 冗長な消費者トランザクションルールのフィルタリング
CN112035723A (zh) 资源库的确定方法和装置、存储介质及电子装置
Dulhare et al. Hands on MAHOUT—machine learning tool
CN105786492A (zh) 利用大数据的方法实现代码预测提示的方法
CN105824976A (zh) 一种优化分词库的方法和装置
Garcia et al. An automated approach for requirements specification maintenance
CN109033133A (zh) 基于特征项权重增长趋势的事件检测与跟踪方法
Das et al. Adaptive web personalization system using splay tree
Ren et al. A summary of research on web data acquisition methods based on distributed crawler
Aladics et al. An AST-based code change representation and its performance in just-in-time vulnerability prediction
CN105975610A (zh) 场景识别方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160720