本文主要讨论这几个问题:
什么是Hadoop,Hadoop发展历史,Hadoop组成及生态
为什么要使用Hadoop构建大数据平台
Hadoop中常见大数据处理思想、理论、术语、常用算法、数据结构、系统架构
Hadoop平台版本...
Quarterback
2年前 (2019-05-23) 998℃ 0评论
6喜欢
本文主要讨论这几个问题:
何谓大数据
大数据的特点
大数据应用场景
通用大数据处理流程
大数据开发职能分工
常用大数据技术栈概览
1. 何谓大数据(Big Data)
定义:大数据通常指
无法用常规软件工具或手段,在期望的时...
Quarterback
2年前 (2019-04-25) 561℃ 0评论
2喜欢
本文主要讨论这几个问题:
1.Mongo shell中使用大整数字面量
2.片键使用自增长字段
3.程序里游标循环迭代过程中进行长时间的操作
4.滥用数组类型
5.滥用upsert更新参数
6.错误的设计索引
7.错误的认为复制等于备份
...
Quarterback
3年前 (2018-08-26) 870℃ 0评论
2喜欢
本文主要讨论这几个问题:
基本架构
适用场景
搭建步骤
小结
1. 基本架构
本文描述如何利用Apache Kafka(消息中间件),Apache Nifi(数据流转服务)两个组件,通过Nifi的可视化界面配置,快速构建异步持久化Mo...
Quarterback
3年前 (2018-06-02) 1745℃ 0评论
9喜欢
持续整理中…
本文主要讨论这几个问题:
Google File System(分布式文件系统)
Google MapReuce(分布式批处理计算模型)
Google Bigtable(分布式结构化数据存储系统)
Google...
Quarterback
4年前 (2017-01-09) 1453℃ 0评论
1喜欢