大数据日知录读书笔记(1):大数据基础理论

1.大数据概览

1.1 定义

最广为接受的定义为4V定义

数据量大(volumn):google一天处理数据量25PB

多样性(variety):结构化数据(数据库中的表)、非结构化数据(图片、音频、视频)

高速性(velocity):数据产生速度快,比如各种实时传感器数据

价值性(value):价值密度低

1.2 大数据基本处理流程