全部教程

大数据教程

【学习 Hadoop】

Hadoop 是大数据其中的一个解决方案

【学习 HDFS】

HDFS 是 Hadoop 其中的一个组件,主要用于数据存储

【学习 MapReduce】

MapReduce 是 Hadoop 其中的一个组件,主要负责数据计算

【学习 Hive】

Hive 是 Hadoop 其中的一个组件,主要用于数据仓库开发

【学习 Impala】

Impala 是用于处理存储在 Hadoop 集群中的大量数据的 SQL查询引擎

【学习 HBase】

HBase 是一个开源的非关系型分布式数据库

【学习 Pig】

Pig 适用于使用Hadoop 和MapReduce 平台来查询大型半结构化数据集

【学习 Flume】

Flume 是一个分布式、可靠、和高可用的海量日志聚合的系统

【学习 Sqoop】

Sqoop 是一个用来将 Hadoop 和关系型数据库中的数据相互转移的开源工具

【学习 Zookeeper】

Zookeeper 主要用来解决分布式应用中经常遇到的一些数据管理问题

【学习 HCatalog】

HCatalog 是 Hadoop 中的表和存储管理层,能够支持用户用不同的工具(Pig、MapReduce)更容易地表格化读写数据

【学习 Ambari】

Ambari 是一种基于 Web 的工具,支持 Hadoop 集群的供应、管理和监控

【学习 Spark】

Spark 是专为大规模数据处理而设计的快速通用的计算引擎

【学习 Avro】

Avro 是一种远程过程调用和数据序列化框架

【学习 Spark GraphX】

GraphX 是 Spark 上的分散式图形处理框架

【学习 YARN】

YARN 是一种新的 Hadoop 资源管理器

【学习 Spark SQL】

Spark SQL 提供了一个称为 DataFrame 的编程抽象,并且可以充当分布式 SQL 查询引擎

【学习 Spark Streaming】

Spark Streaming 用于处理实时流数据的计算框架

【学习 ElasticSearch】

ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎。

【学习 Flink】

Apache Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算

人工智能

数据仓库

数据分析

数据可视化

数据爬虫

大数据编程语言

操作系统