HBase
作者介绍:熊训德 Hbase 是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用 HBase 技术可在廉价 PC Server 上搭建起大规模结构化存储集群。本文档用于说明 hbase 的 wal 简单原理以及从源码的角度分析一个“写”请求是如何到达 wal ,wal 又会做哪些请求。 特


作者介绍:熊训德 腾讯云工程师 Hbase 的 WAL 机制是保证 hbase 使用 lsm 树存储模型把随机写转化成顺序写,并从内存 read 数据,从而提高大规模读写效率的关键一环。wal 的多生产者单消费者的线程模型让wal的写入变得安全而高效。 在文章《WAL在RegionServer调


作者:熊训德 腾讯云工程师 本文档从源码角度分析了,hbase 作为 dfs client 写入hdfs 的 hadoop sequence 文件最终刷盘落地的过程。 之前在《wal线程模型源码分析》中描述wal的写过程时说过会写入hadoop sequence文件,hbase为了保证数据的安全性,


导语:Atlas 是一个可扩展的核心基础治理服务集 - 使企业能够有效地和高效地满足 Hadoop 中的合规性要求,并允许与整个企业数据生态系统的集成。该项目用于管理共享元数据、数据分级、审计、安全性以及数据保护等各个方面,是数据治理的重要组成部分。本文介绍Atlas的存储子系统,分析Atlas的存


本文共计845字 预计阅读时长3分钟 背景介绍 在大数据体系中,HBase是一个非常重要的组件,主要用于处理和存储海量结构化和非结构化数据。HBase广泛应用于个性化推荐画像、订单存储、车辆轨迹查询、物联网传感器分析等海量数据存储和高并发读写场景。 EMR主要以半托管形式提供开源大数据服务部署和管理

