什麼是大資料
大資料,以其最基本的形式,可以被描述為由資料的不同方面衡量的總括性術語。這些不同的方面是
體積(大量資料),速度(更高的資料流速度),多樣性(結構化,非結構化和半結構化資料)和準確性(根據資料做出正確的決策)。
這些指標很難被老年關聯式資料庫所照顧。出現了對新系統的需求和大資料處理的拯救。雖然許多人對大資料的理解有不同的理解,但資料部門的行業領導者給出的大資料定義很少:
定義:
- “大資料超出了常用硬體環境和軟體工具的覆蓋範圍,可以在其使用者數量的可容忍的時間內捕獲,管理和處理它。”(Teradata Magazine 文章,2011)
- “大資料是指資料集的大小超出典型資料庫軟體工具捕獲,儲存,管理和分析的能力。”(麥肯錫全球研究院,2012)
- “大資料是一個如此龐大和複雜的資料集合,很難使用現有的資料庫管理工具進行處理。”(維基百科,2014)
- “大資料是高容量,高速度和/或高品種的資訊資產,需要新的處理形式,以實現增強的決策,洞察力恢復和流程優化”(Gartner, 2012)
當資料變得大時?
IOPS:Input/Output Operations Per Second