Page 97 - 大数据技术及安全研究
P. 97

第二章  数据的采集与处理



             Reduce 为基础的深度学习分布式方式,能够有效提升大量数据的处理速度,解
             决深度学习的可拓展问题,减少网络节点的通信代价;第二,以 Spark 为基础的
             深度学习分布式方式,以内存为基础开展大数据计算工作,相较于第一种算法,

             这种学习方法更适用于迭代型计算任务,目前常用的学习模式有 R-CRBN 模型、
             卷积神经网络等。因而,通过在大数据分析中运用该技术功能,能够直观地将复
             杂信息呈现给用户,帮助其根据分析结果对未来做出精准预测。
                 除此之外,现有的以大数据分析优化为目标的深度学习算法正处于不断改进

             状态,针对样本数量缺乏、质量不足等常见问题,固定模型重用策略被提出并应
             用,能够很好地获取判别信息,降低数据分析过程中需要投入的训练样本数量。
             此外,强化检测器性能、改进训练样本质量的方法不断丰富,根据深度学习一训
             练步骤实现对各种数据的迭代计算,从而改变当前的工作质量。

                 3. 以计算智能为基础的大数据分析
                 计算智能为人工智能分支之一,其具有随机性、启发式特征,在大规模优化
             方面能够发挥良好作用,而传统算法以收敛速度为侧重点,强调集中化思想,若
             所需分析的数据过于庞大,则会使传统算法难以处理,即使能够处理分析也会形

             成较大时间消耗,数据分析效率严重不足。而当前数据复杂性、规模化程度日益
             增加,此时可在大数据分析时引入分布式算法,从群智能、进化算法两个方面展
             开大数据分析。首先,群智能算法分析。其构建了分布式计算环境,对算法搜索
             过程具有较强加速效果,其主要借助粒子群算法、布谷鸟算法、蚁群算法、萤火

             虫算法等顺利完成大数据分析。其次,进化算法分析。该算法分析方式含有大量
             迭代计算,在具体大数据分析过程中,主要通过大数据分组保障运算分析效率,
             通过长期的进化算法研究,进化算法现已能够实现差分自动分组,降低不同分组
             内的变量依赖程度,借助智能化分析提高算法分析效率,以此解决传统算法在预

             算效率方面的不足。除此之外,大数据分析时还可混合运用多种算法,如贪心算
             法、遗传算法、模拟退火算法等,同时融入加速技术、分布式计算等,对原算法
             精准优化,继而提高数据分析效率。
                 综上所述,人工智能在大数据分析中发挥的作用日益关键,所取得的成果也日

             益丰富。为促进大数据的更好发展,强化其智能化水平,应对大数据积累、关联分析、
             分类、预测挖掘任务进行分析,并研究分布式深度学习及其算法的改进,最后从群
             智能、进化算法两方面开展分析研究,以此更好应对大数据分析带来的挑战。



                                                                                  ·89·
   92   93   94   95   96   97   98   99   100   101   102