Page 43 - 大数据技术及安全研究
P. 43

第一章  大数据核心技术



             更新时能保持一致,确保软件在更新时的质量,同样的开发软件项目是软件工程
             的一种重要方式。在软件工程系统版本信息控制技术当中,数据挖掘技术可以说
             是最广泛的应用,它主要是重点研究软件开发在变更信息当中的各项数据挖掘,

             它不仅会在同一个软件平台下用不同的应用效果进行相应的分析和探索,寻找各
             个模块之间的关系,或者是说存在的差异,而且能够在一定程度上分析和预测
             软件工程系统模块在工作中存在的各项指标,为以后的软件工程开发进行相应的
             分析。

                 5. 数据挖掘在软件工程开发中的应用
                 在数据挖掘时,一般软件程序的开发是整个软件工程的难点,对于整个软件
             的质量起着关键性的作用,所以说在进行开发时,我们必须保证软件程序在开发
             时的质量,对相应的克隆代码进行检测,确保我们所使用的程序代码具有一定的

             准确性,这也是值得我们深入思考的。
                 (五)软件工程中应用数据挖掘技术的方法
                 1. 分类法
                 在执行软件工程方法时,首先为相应的分析模型建立一套方法,即根据相关

             规则和流程提前输入相应的数据信息,然后对其进行分类,以方便后续的分析模
             型。当前,我国现有数据挖掘技术在软件工程中最常用的方法有:判断法、神经
             网络分类、树判断法等。其中判断树法主要依靠贪婪算法作为应用过程中的核心
             算法,将构建自上而下的决策树框架。一般来说,框架上有很多节点,不同的节

             点对应不同的软件类别符号,有助于我们在应用程序中进行判断。
                 2. 关联法
                 在进行关联法过程中,关联法具有一定的严谨度,它的规则本身就是将各类
             数据关联,所以就要求我们的工作人员在进行关联法时将各类有关联的数据进行

             分类。关联法的主要特点就是具有良好的支持度以及可信度,总体来说关联法在
             进行数据关联处理时是一项十分重要的方法。
                 3. 聚类法
                 在进行聚类法的过程中,一般情况下技术人员首先会对数据进行分类,以此

             来防止数据的相似,从而在工作中产生麻烦,同样的,不同类型的数据自身拥有
             不同的特点,作用效果也不同,一般情况下将聚类法主要分为 3 类:划分法、模
             型法以及网络法。



                                                                                  ·35·
   38   39   40   41   42   43   44   45   46   47   48