什么是大数据
大数据,以其最基本的形式,可以被描述为由数据的不同方面衡量的总括性术语。这些不同的方面是
体积(大量数据),速度(更高的数据流速度),多样性(结构化,非结构化和半结构化数据)和准确性(根据数据做出正确的决策)。
这些指标很难被老年关系数据库所照顾。出现了对新系统的需求和大数据处理的拯救。虽然许多人对大数据的理解有不同的理解,但数据部门的行业领导者给出的大数据定义很少:
定义:
- “大数据超出了常用硬件环境和软件工具的覆盖范围,可以在其用户数量的可容忍的时间内捕获,管理和处理它。”(Teradata Magazine 文章,2011)
- “大数据是指数据集的大小超出典型数据库软件工具捕获,存储,管理和分析的能力。”(麦肯锡全球研究院,2012)
- “大数据是一个如此庞大和复杂的数据集合,很难使用现有的数据库管理工具进行处理。”(维基百科,2014)
- “大数据是高容量,高速度和/或高品种的信息资产,需要新的处理形式,以实现增强的决策,洞察力恢复和流程优化”(Gartner, 2012)
当数据变得大时?
IOPS:Input/Output Operations Per Second