分布式计算 发表于 2018-12-10 更新于 2018-12-12 分类于 BigData Waline: 三大主流分布式计算系统HadoopHadoop常用于离线的复杂的大数据分析处理 Hadoop采用MapReduce分布式计算框架,并根据GFS开发了HDFS分布式文件系统,根据BigTable开发了HBase数据存储系统。 SparkSpark常用于离线的快速的大数据处理 Spark使用内存来存储数据 StormStorm常用于在线的实时的大数据处理 Storm不进行数据的收集和存储工作,它直接通过网络实时的接受数据并且实时的处理数据,然后直接通过网络实时的传回结果。 参考主流的三大分布式计算系统:Hadoop,Spark和Storm