这个定义是给研究机构“大数据”的Gartner。 “大数据”是一种信息资产,需要新的处理模型才能拥有更好的决策,信息和流程优化能力,以适应大规模的利率,高增长和多样化。 [1]
麦肯锡全球研究所给出的定义是一个足以捕获,存储,管理和分析传统数据库软件工具功能的数据集合。它具有大规模的数据,快速和多样化的数据流数据类型和值密度的四个特征是低的。 [4]
大数据技术的战略重要性不是控制大量数据的信息,而是使这些重要数据专业化。换句话说,如果将大数据与行业进行比较,这个行业的盈利能力的关键是通过“处理”来提高数据的“处理能力”和数据的“附加值”。 [5]
从技术角度来看,大数据与云计算之间的关系与硬币的正面和背面密不可分。大数据不应由单台计算机处理,应使用分布式架构。它为海量数据分布了数据挖掘。但是,您必须依靠云计算来实现分布式处理,分布式数据库和云中的存储以及虚拟化技术。 [2]
随着云时代的到来,大数据引起了越来越多的关注。分析师团队认为,大数据通常用于描述公司创建的大量非结构化和半结构化数据,这些数据在下载到关系数据库进行分析时会花费太多时间和金钱。大数据分析通常与云计算相关联,因为分析大量实时数据需要像MapReduce这样的框架将工作分配给数十,数百甚至数千台计算机。
大数据需要特殊的技术来有效地管理大量被容忍一段时间的数据。大数据技术,包括大规模并行处理(MPP)数据库,数据挖掘,分布式文件系统,分布式数据库,云计算平台,Internet和可扩展存储系统。
上海IT外包服务网 链接:http://www.linemore.com