Notes:
数据来源
传感器、数字化仪、扫描仪、数值建模、手机、互联网、视频、电子邮件和社交网络。
数据类型
文本、几何图形、图像、视频、声音以及它们的组合。
云计算
云计算为解决共享计算资源(包括计算、存储、网络和分析软件)的挑战提供了基础支持;
大数据特点
大数据技术挑战
数据传输
- 从传感器到存储的数据收集
- 多个数据中心的数据整合
- 将集成数据传输到处理平台(例如云平台)的数据管理
- 将数据从存储移动到分析主机(例如高性能计算 (HPC) 集群)的数据分析
- 需要智能的预处理技术和数据压缩算法在传输数据之前有效地减少数据大小(Yang, Long, and Jiang 2013)。
数据管理
- 大数据的多样性和准确性正在重新定义数据管理范式,需要新技术(例如 Hadoop、NoSQL)来清理、存储和组织非结构化数据(Kim、Trimi 和 Chung,2014 年)。
- 数据的高维(3D 空间和1D 时间)和复杂性(例如时空相关性和依赖性)
数据架构
理想的架构将无缝合成和共享数据、计算资源、网络、工具、模型以及最重要的人员(Wright 和 Wang 2011)。
方法、技术和解决方案
3. 移动数据采集、计算和近场通讯
4. 大数据计算和处理基础设施
- 计算基础设施
- 管理和处理架构
- 远程协作
- 云端监控与追踪
- 能源效率和成本管理
云计算应对大数据
- 按需资源提供
- 调度
- 可扩展性
- 数据局部性
- 社交媒体和其他流数据的云计算