🔔
BigData Note1:大数据体系架构
- 架构底层技术体系
- Java SE
- 数据库
- Git+Maven
- shell命令
- MyBati持久化
- Spring容器框架
- Spring MVC Web框架
- SpringBoot框架
- 技术底层JVN调优
- 多线程与高并发
- 网络通信IO
- Linux操作系统
- 数据采集术技术体系
- 离线数据分布式采集技术
- 数据采集系统Sqoop
- 数据采集系统DataX
- 数据采集系统Kettle
- 实时数据分布式采集技术
- 数据采集系统Flume
- 数据采集系统Maxwell
- 数据采集系统Canal
- 数据采集系统Nifi
- 中间件技术体系
- 分布式协调系统Zookeeper
- 分布式缓存系统Redis
- 分布式消息系统
- 分布式消息系统Kafka
- 分布式消息系统Pular
- 分布式数据分析系统ELK Stack
- 数据存储技术体系
- 分布式文件系统HDFS
- 分布式数据湖HBase
- 分布式数据仓库Hive
- 新一代分布式数据存储-数据湖生态体系
- 数据湖技术Hudi
- 数据湖技术Delta Lake
- 数据湖技术 Iceberg
- 数据处理技术体系
- 分布式计算引擎MapReduce
- 分布式计算引擎Spark
- 分布式计算引擎Flink
- OLAP数据分析生态体系
- OLAP分析引擎Kylin
- OLAP分析引擎Presto
- OLAP分析引擎Druid
- OLAP分析引擎Impala
- OLAP分析引擎Phoenix
- OLAP分析引擎Kudu
- OLAP分析引擎Clickhouse
- OLAP分析引擎Doris
- 架构设计体系
- 分布式离线数据仓库体系
- 分布式实时数据仓库体系
- 分布式数据治理技术体系
- 数据质量管理
- 元数据管理Atlas
- 数据安全管理Ranger
- 数据安全管理Kerberos
- 信息化数据中台技术体系
- 数据中台构建
- BI大数据可视化技术体系
- BI可视化Hue
- BI可视化Superset
- BI大屏可视化TCV
- 集群调度管理体系
- 分布式资源调度引擎Yarn
- 分布式任务调度引擎
- 任务流调度oozie
- 任务流调度Azkaban
- 任务流调度Airflow
- 大数据集群管理平台体系
- 集群管理平台Cloudera Manager
- 集群管理平台Ambari
- 数据挖掘体系
- 机器学习与数据碗蕨算法体系
- 多源线性回归算法
- 贝叶斯分类算法
- KNN分类算法
- Kmeans算法、Kmeans++算法
- TF-IDF算法
- 逻辑回归算法
- 决策树算法
- 随机森林算法
- 企业级项目体系