作为海报的孩子 大数据,Hadoop对企业采用大数据既是福也是祸。功能强大但复杂,许多企业希望在推出大数据项目之前先等待更轻松的事情。 

等待结束了。 Hadoop的发展步伐如此之快,Hortonworks和Cloudera等供应商大力改进了易用性,’的学习曲线减少了一半。如 I’ve written before,企业正逐渐摆脱大数据培训的重心,从基本的ETL工作负载转移到Hadoop旨在解决的高级数据分析上。

事实证明,使用Hadoop的企业使用大数据的诀窍是从小处着手。

小象无处不在

小?那’这不是通常与Hadoop相关联的词。但是,它完全符合大数据的现实。对于我们谈论的PB和ZOB,大多数企业没有’有PB级的问题。至少他们没有’他们有今天知道如何管理的大规模问题。 

而是这样 NewVantage Partners调查显示,企业主要关心掌握新型非结构化数据。 Gartner确认这一点,并指出“许多组织发现大数据的多样性维度比容量或速度维度面临的挑战要大得多。”

因此,聪明的Hadoop供应商一直在修补其消息传递,以帮助企业从较小规模的部署开始并从那里开始发展。正如Hortonworks战略副总裁Shaun Connolly在接受采访时告诉我的那样:

We’我们已经看到了一种可重复的采用模式,从专注于 新型数据并围绕它创建或增强目标应用程序 that new type data. 这些新应用通常由业务部门驱动, 从以下新的数据类型之一开始: 社交媒体,点击流,服务器日志,传感器&机器数据,地理位置 数据和文件(文本,视频,音频等)。

最终部署更多应用程序和新型数据将导致 更广泛的现代数据架构。 但是成功的客户开始了从 特定类型的数据,然后从那里进行冲洗和重复。

从小型,可衡量的Hadoop项目开始,是一种展示其价值而又不强迫企业先吞下整个大象的好方法。它’对于一项强大的技术而言,这是明智的策略,因为其强大的功能很容易使潜在的采用者不堪重负。

使大数据变小

这样,Hadoop便成为人们实际想谈论的话题。尽管谈论真正的大数据的人比实际推出重要的大数据项目要多得多,但Gartner强调指出,尽管有64%的企业宣称打算这样做,但实际上只有8%的企业实际部署了大数据项目。现在,基于Hadoop的大数据项目的主要支持者正在销售实质性,可实现的业务价值,而不是Hadoop的炒作,因此从事基于Hadoop的大数据项目的人数应该会增加。

实际上,当今大多数大数据项目都以现有用例的增量改进为中心,例如,更好地了解客户需求,提高流程效率,进一步降低成本或更好地检测风险。对于所有关于戏剧性地改变一个人的讨论’业务,大多数大数据以及扩展到大多数Hadoop的部署都侧重于增量改进,而不是改变世界的项目。

有道理。企业首先对具有可实现项目的Hadoop迈出了轻松的一步,然后掌握了技术,然后发展壮大。 

2014年,我们’将会看到Hadoop的采用加速。与Hortonworks的Connolly和Cloudera的Mike Olson进行了交谈,他们都在2013年见证了业务的蓬勃发展,并且在今年最后两个季度的步伐进一步加快。这样的加速既反映了其营销信息的改进,这些改进围绕企业如何更轻松地从Hadoop获取价值为中心,也表明降低了从Hadoop获取价值的门槛。

我的预测? Hadoop越关注于较小规模的部署,最终将更多地用于大型部署。

前导图片由Shutterstock提供