Page 80 - 大数据技术及安全研究
P. 80

大数据技术及安全研究
                Research on Big Data Technology and Security



                综上所述,数据采集系统的发展及应用能够降低数据收集及处理的难度,为
            人员开展工作提供便利,具有较强的现实意义。有关单位应充分认识到数据采集
            系统在实际工作中发挥的积极作用,加大对数据采集系统的关注,为数据采集系

            统的发展及应用提供必要的支持,以此促进数据采集系统的进一步发展,推动数
            据采集系统普及应用。



                                 第二节  数据预处理技术


                一、大数据背景下数据预处理方法


                在经济快速发展的背景下,各类先进技术相继兴起应用,以云计算、大数据
            为代表应用频次最高,其内部蕴含的价值不可估测。海量数据高效处理对目前技
            术应用提出新的要求,为进一步高效、及时获取数据信息中有效信息,需选取高
            速分析处理技术,对数据进行系统性分析优化升级。数据预处理工作是数据分析、

            挖掘前重要准备工作,选取科学处理方式,是保证最终数据质量及有效性举措。
                (一)大数据背景下数据预处理价值
                现下数据信息爆发式增长,为快速从海量数据中提取有价值信息,应选取有

            效技术措施,做好数据预处理工作,增强数据有效性。数据预处理作为数据挖掘
            与知识发现过程核心环节之一,加强数据预处理价值体现在以下几方面:首先,
            海量原始数据中通常包含以下特征:第一,不完整。属性值或仅包含聚离数据;
            第二,含噪声。数据内部含有错误或存在偏离预期分散数值;第三,不一致。数

            据记录规范性和逻辑性与其他数据未实现统一化,缺乏一定科学性。由于上述问
            题存在,人们使用数据过程中对其具有完整性、时效性及可靠性要求,所以需加
            强数据预处理,保证达成上述目标,为人们提供良好的服务。其次,由于数据采

            集规模较大,数据预处理通常需耗损大量时间,高质量决策依附于可靠度较高的
            数据,从实际中获取数据大多结构不一致、完整性不足等,无法实现直接利用目
            标。因此,需加强数据预处理,提高数据自身质量,为后续决策的正确性奠定良

            好基础。
                (二)大数据背景下数据预处理方法
                由于数据种类及组织模式呈现为多元化,内部关联性较为复杂,且数据质量



            ·72·
   75   76   77   78   79   80   81   82   83   84   85