大规模数据仓库解决方案

  业务挑战

  自云计算和大数据概念被提出后,针对该市场应运而生的解决方案层出不穷,软硬件一体化设备作为大数据解决方案中的一员,扮演着重要角色。企业在面对大数据的分析与应用方面,面临的主要挑战有以下几点:

  ●大数据分析:大量新技术需要学习掌握,周期长、见效缓慢,需要IT人员提前手动将数据从HDFS导入数据仓库或集市,才可进行分析。

  ●性能和规模:纵向扩展规模有限,无法满足需求的增长,数据仓库分析查询性能欠佳。

  ●硬件和软件的集成:用户必须搭建硬件环境、配置并调试软件环境,一体机具备预装的硬件和软件,提供性价比优势。

  解决方案

  微软大数据战略致力于让所有用户能够从几乎任何数据中获得可转换为业务执行的洞察力,包括之前隐藏在非结构化数据中的洞察力。微软的大数据战略及解决方案包括:

  ●数据管理层:可对所有类型的数据进行搜集和管理,包括结构化、半结构化、非结构化和流数据等。在数据丰富方面,微软提供了基于Windows Azure这个数据集市,各行各业的用户可以把自己认为有价值的数据放到这个数据集市上面,进行分享和丰富。

  ●扩展层:通过数据发现以丰富数据集,与来自全球的多种类型数据互联,以及通过高级数据分析将数据变成信息以及知识。

  ●洞察力层:通过用户所熟悉的类似Excel、Power Pivot、Power View这样的工具,为用户提供全面、深入的洞察力,为从领导层到每个员工提供直观易用的决策支持,即实现数据以及信息的消费化。

  另外,微软非常注重社区方面的建设,比如Hadoop社区等开源社区方面的合作,保证所提供的平台和解决方面是开放的、灵活的,并且可以和目前其他开源平台实现无缝对接。

  前端使用的微软Office Excel、IE、Share Point等工具,同时可以使用多种设备,包括笔记本、移动终端等,从任何数据中随时获得所需要的信息,以提供决策支持。随时与全球的数据互连,将内部与公用的数据和服务相结合。通过支持任何数据的现代数据管理平台,处理任意大小和种类的数据,不仅具有Windows的易用性,同时兼具云的弹性和可扩展性。

  SQL Server2012并行数据仓库一体机面向大数据服务设计,在数据处理方面实现了突破:

  ●新一代性能与规模:采用xVelocity列存储,查询速度大幅提升10至50倍,并可以满足实时数据仓库需求;采用高密度DirectAttachedStorage,存储容量提升7倍之多;采用更加高效的架构设计,在大幅提升性能的同时,总体成本大幅降低。

  ●最优化的系统价值:通过Windows Server2012虚拟化技术创新,SQL Server2012并行数据仓库一体机实现业界每TB更低成本。

  SQL Server2012并行数据仓库一体机在性能方面最大的亮点,就是采用了列存储的技术,这个列存储的技术颠覆了以往传统的数据仓库,通过采用列存储形式,能够迅速响应,达到立即返回查询结果的速度。

  客户收益

  由于软硬件一体,并行数据仓库一体机只需要很少的调整和优化,可有助于降低IT成本。该设备开箱即用,可以非常快的速度安装并开始加载数据,在服务器调整和优化上也仅需很少时间,从而显著缩短部署时间、减少工作量和降低成本。

  此外,还能够非常快地运行大规模查询,企业可以运行更多报表、完成更复杂的分析、处理更大的数据集以及分析更详细的数据。微软并行数据仓库一体机自推出以来,已经被全球多家企业采用,帮助应对大数据的挑战、提升了生产力、降低了IT总体成本。目前,我国审计署已采用该方案。

  点评:微软在数据库方面有多年技术积累和经验优势,在此方案中得到了很好的体现。列存储技术的应用是突出亮点之一。

关注读览天下微信, 100万篇深度好文, 等你来看……