Page 370 - 江西普通高校专升本信息技术
P. 370

江西普通高校专升本信息技术



               成本等的限制,使得当时许多数据都无法得到记录和保存。即使是可以保存的信号,也大多采用
               模拟信号保存,当其转变为数字信号的时候,由于信号的采样和转换,都不可避免存在数据的遗
               漏与丢失。那么现在,大数据的出现,使得信号得以以最原始的状态保存下来,数据量的大小已
               不是最重要的,数据的完整性才是最重要的。

                   Variety意味着要在海量、种类繁多的数据间发现其内在关联。在互联网时代,各种设备连成
               一个整体,个人在这个整体中既是信息的收集者也是信息的传播者,加速了数据量的爆炸式增长
               和信息多样性。这就必然促使我们要在各种各样的数据中发现数据信息之间的相互关联,把看似
               无用的信息转变为有效的信息,从而做出正确的判断。

                   Velocity可以理解为更快地满足实时性需求。目前,对于数据智能化和实时性的要求越来越
               高,比如开车时会查看智能导航仪查询最短路线,吃饭时会了解其他用户对这家餐厅的评价,见
               到可口的食物会拍照发微博等诸如此类的人与人、人与机器之间的信息交流互动,这些都不可避
               免带来数据交换。而数据交换的关键是降低延迟,以近乎实时的方式呈献给用户。

                   大数据特征里最关键的一点,就是Value。Value的意思是指大数据的价值密度低。大数据时
               代数据的价值就像沙子淘金,数据量越大,里面真正有价值的东西就越少。现在的任务就是将这
               些ZB、PB级的数据,利用云计算、智能化开源实现平台等技术,提取出有价值的信息,将信息
               转化为知识,发现规律,最终用知识促成正确的决策和行动。

               9.3.3 大数据的应用领域
                   发展大数据产业将推动世界经济的发展方式由粗放型到集约型的转变,这对于提升企业综合
               竞争力和政府的管制能力具有深远意义的影响。将大量的原始数据汇集在一起,通过智能分析、
               数据挖掘等技术分析数据中潜在的规律,以预测以后事物的发展趋势,有助于人们做出正确的决

               策,从而提高各个领域的运行效率,取得更大的收益。
                   (1)商业
                   商业是大数据应用最广泛的领域。沃尔玛(Walmart)通过对消费者购物行为等这种非结构
               化数据进行分析,了解顾客购物习惯,公司从销售数据分析适合搭配在一起买的商品,创造了

               “啤酒与尿布”的经典商业案例;淘宝服务于卖家的大数据平台—“淘宝数据魔方”有一个
               “无量神针—倾听用户的痛”屏幕,监听着几百万淘宝买家的心跳,收集分析买家的购物行
               为,找出问题的先兆,避免“恶拍”(买家拍下产品但拒收)发生,淘宝还针对买家设置大数据
               平台,为买家量身打造完善网购体验的产品。

                   (2)金融
                   大数据在金融业也有着相当重要的作用。华尔街“德温特资本市场”公司分析全球3.4亿微博
               帐户的留言,判断民众情绪,人们高兴的时候会买股票,而焦虑的时候会抛售股票,依此决定公
               司股票的买入或卖出,该公司2012年第一季度获得了7%的收益率。Equifax公司是美国三大征信

               所之一,其存储的财务数据覆盖了所有美国成年人,包括全球5亿个消费者和8100万家企业。在
               它的数据库中与财务有关的记录包括贷款申请、租赁、房地产、购买零售商品、纳税申报、费用
               缴付、报纸与杂志订阅等,看似杂乱无章的共26PB数据,经过交叉分享和索引处理,能够得出消
               费者的个人信用评分,从而推断客户支付意向与支付能力,发现潜在的欺诈。

                   (3)医疗
                   随着大数据在医疗与生命科学研究过程中的广泛应用和不断扩展,产生的数据之大、种类之



                                                          ·348·
   365   366   367   368   369   370   371   372   373   374   375