伍佰目录 短网址
  当前位置:海洋目录网 » 站长资讯 » 站长资讯 » 文章详细 订阅RssFeed

HBase服务|阿里云NoSQL X-Pack如何做到在线存储及计算一体?

来源:本站原创 浏览:108次 时间:2022-04-02

数据处理的挑战

随着企业数据的逐渐积累增多,数据架构从单节点的关系型数据库,演进到分库分表,再演进到NoSQL及Hadoop生态。Hadoop生态百花齐放,没有统一的架构标准,目前用的比较多的是Lambda架构,该架构主要特点为流计算、批处理、在线存储独立的,通过Pipeline来连接。

大数据Lambda架构比较复杂,流、批、在线存储需要独立建设,同时需要构建数据Pipeline来做数据交换流动。

  • 数据写入:批处理、流处理、在线存储需要分别写入数据。一方面流及批两层需要独立写入数据,同时很多大数据业务数据也会直接写入MongoDB、Cassandra、HBase、Redis等NoSQL系统这样的在线存储系统。

  • 数据交换:批处理、在线存储之间交换需要构建大量ETL批作业。

  • 数据质量:批处理、流处理、在线存储需要分别写入数据,会导致数据维护繁琐,不同写入链路的数据可能不一致。

  • 系统稳定性:Lambda架构批计算层和在线存储层需要做频繁的数据交换,且都是批处理直接通过在线存储API抽取数据以及回流,大数据量场景会影响在线存储的稳定性。


NoSQL X-Pack构建大数据在线存储及计算一体化架构

为了从架构上解决上面这些问题云X-Pack Spark提供了一键流式归档NoSQL数据库的日志到Spark离线数仓的能力。写入MongoDB、Cassandra、HBase的在线存储明细数据,可以自动归档到Spark离线数仓然后做复杂计算、机器学习等。云X-Pack Spark产品文档:

https://help.aliyun.com/document_detail/93899.html?spm=a2c4e.11153940.0.0.e4a61d94Yg9Cxs

  • X-Pack Spark一键流式归档

X-Pack Spark一键归档支持将Cassandra、HBase、MongoDB数据通过增量日志方式归档到X-Pack Spark数据仓库(对在线业务稳定性无影响),在X-Pack Spark集群进行数据计算性能大幅提升。整体架构如下:

X-Pack Spark 一键归档模式推出了”大数据在线存储和计算一体化”架构,具有以下优点:

  • 数据一致性:避免双写;业务直接写NoSQL系统,数据自动归档到Spark离线数仓。

  • 稳定性:异步log同步到Spark数仓,对NoSQL在线业务稳定性没有任何影响。

  • 性能:Spark分析列存,比直接分析NoSQL数据库性能大幅提升。

  • 限制:目前X-Pack Spark一键流式归档上线支持HBase,Phoenix、MongoDB、Cassandra敬请期待。

  • 归档数据计算

数据会周期的归档到Spark的离线数仓(HiveMeta),然后可以直接在X-Pack Spark中查看数据以及计算。


阿里云NoSQL数据库其他动态

阿里云Cassandra数��һî��,��һȷ��据库正式公测,提供免费试用:

https://www.aliyun.com/product/cds



  推荐站点

  • At-lib分类目录At-lib分类目录

    At-lib网站分类目录汇集全国所有高质量网站,是中国权威的中文网站分类目录,给站长提供免费网址目录提交收录和推荐最新最全的优秀网站大全是名站导航之家

    www.at-lib.cn
  • 中国链接目录中国链接目录

    中国链接目录简称链接目录,是收录优秀网站和淘宝网店的网站分类目录,为您提供优质的网址导航服务,也是网店进行收录推广,站长免费推广网站、加快百度收录、增加友情链接和网站外链的平台。

    www.cnlink.org
  • 35目录网35目录网

    35目录免费收录各类优秀网站,全力打造互动式网站目录,提供网站分类目录检索,关键字搜索功能。欢迎您向35目录推荐、提交优秀网站。

    www.35mulu.com
  • 就要爱网站目录就要爱网站目录

    就要爱网站目录,按主题和类别列出网站。所有提交的网站都经过人工审查,确保质量和无垃圾邮件的结果。

    www.912219.com
  • 伍佰目录伍佰目录

    伍佰网站目录免费收录各类优秀网站,全力打造互动式网站目录,提供网站分类目录检索,关键字搜索功能。欢迎您向伍佰目录推荐、提交优秀网站。

    www.wbwb.net