@niupengju 银行 研发工程师:
备份的需求是基于数据重要性和系统稳定性。正常来说是需要备份的,即使分布式存储拥有多副本,保证一定的数据可恢复性。但是为了安全期间,防止整个系统的宕机,还是要备份的。备份的选择,主要考虑两个方面,一是分布式存储系统自身支持的备份恢复及双活,可以保证应用系统的稳定性。二是选择第三方备份软件。
@宁泽阳 中信银行信用卡中心 系统工程师:
是否需要备份建议针对业务系统保存的数据重要性级别而定,如业务系统数据需进行本地、同城或异地备份,那么建议在应用端对需要备份的数据进行统一备份,存储端不进行备份,这样可保持整体备份架构统一性,避免备份大量无用数据造成备份设备容量浪费。应用端备份时可使用统一备份软件,如NBU、TSM等。
@Garyy 某保险 系统工程师:
在分布式存储系统中,系统可用性是最重要的指标之一,需要保证在机器发生故障时,系统可用性不受影响,为了做到这点,数据就需要保存多个副本,并且多个副本要分布在不同的机器上,只要多个副本的数据是一致的,在机器故障引起某些副本失效时,其它副本仍然能提供服务。同时,分布式存储还支持纠删码技术,具体技术实现可以参考相关的技术文档,纠删码技术相对副本技术而言,极大地节省了存储空间,一般1:1.5左右甚至更低的空间即可,但是会消耗部分的CPU资源来进行数据冗余/恢复的计算。
@anthonyhenry 某厂商 系统架构师:
依然需要备份,分布式存储的副本或纠删码是防止存储部件损坏造成数据丢失或业务暂停,哪怕分布式存储启用快照功能,也是无法防止物理故障。备份的意义在于使用与存储完全隔离的故障域来保护数据,分离的存储操作系统,不同的物理设备,不同的物理区域,以防止物理故障,逻辑故障。
方式的话有
1.备份软件+硬盘设备或磁带设备;
2.存储之间的复制;
3.以及现在新的存储至对象存储方式,其本质是存储自带备份小软件将属于备份到硬盘设备的方式