当前位置:首页 > 新闻资讯 > 人物观点 > 新闻
独家对话《大数据时代》
  • 2012-12-21 11:04:37
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:邓晓进
  • 作者: 王星
【电脑报在线】当“大数据”成为业界新的热点之时,在这一领域有着深入研究的维克托于近日出版了其新作《大数据时代:生活、工作与思维的大变革》,通过一个个生动的案例向读者介绍大数据的价值及其将会带来的改变。

        三大转变定义大数据
        大数据是今年IT界最热门的概念之一,然而对于“大数据是什么”,连许多经常谈论这一概念的从业者也无法给出准确的答案。正因为如此,大数据也被质疑为一个炒作出来的伪命题。
        维克托也并未直接给出大数据的定义——在《大数据时代》的引言部分,他就明确指出“大数据并非一个确切的概念”。不过,他用三大转变描述了大数据的特性。在接受记者采访时,他详细阐释了这三个转变:
         “首先,在大数据时代,我们可以获得和某个现象相关的所有数据,而不只是少量的样本。例如一项针对相扑比赛中非法操纵比赛结果的研究对64000场比赛进行了分析,这算不上一个很大的数字,但由于这是过去十年所有的比赛,所以它是大数据。大数据是相对的而非绝对的。”
         “第二,由于有了更多的数据,我们可以接受更多的混杂、更多数据上的不精确。如果我们对于一个事物只有50个数据点,那么每一个数据点都必须非常精确,因为每个数据点都是有用的;但是如果我们有5000万个,去掉10个,甚至去掉1000个都没有太大的问题。”

         “第三,我们分析大数据主要为了预测未来‘是什么’,而不是‘为什么’。我们关注的是揭示哪些事情将会发生的相关关系,而非揭示为什么这些事情会发生的因果关系。因为很多时候我们以为我们找到了事情背后的原因,实际上却没有找到。更多时候知道了‘是什么’就足够了。例如知道流感将会扩散到哪里就足够了,我不需要知道为什么;知道什么时候在网上购买机票能够获得最优惠的价格就足够了,我不需要知道为什么此时价格最低。”


         “忘记”不相关的数据会带来更好的预测结果
        表面上看,此次出版的两本书相互矛盾:《大数据时代》强调了数据的价值,而《删除》却提出数据应该能够被“忘记”。对此,维克托表示,两本书相互补充,而以上的两个观点可以完美地相互作用。
         “大数据只有在没有噪音、没有无用的数据的情况下才能很好地发挥作用。在《删除》中,我认为我们需要有摆脱那些过时的、和我们现在不相关的数据的可能性。如果亚马逊忘记了和你当前的兴趣与偏好不相关的购书记录,它推荐书的效果将会更好。只有好的数据才能带来好的预测。”

        对于大数据被过分炒作,维克托也表示担忧:“它被夸大了,好像一切都突然成为了大数据,大数据能解决所有问题,事实上人们并不了解它究竟是什么;一旦人们发现它不是万能的,就会感到泄气,然后大数据就被抛弃了。”在他看来,尽管大数据非常强大,但“人们需要明白它不是什么,我们不能将它过分夸大”。


本文出自2012-12-24出版的《电脑报》第51期 A.新闻周刊
(网站编辑:王润武)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交