什么是分布式事务
跨库的事务就属于分布式事务,比如对两个库的不同表同时修改和同时rollback等。
上一节中,我们只是演示了单个库(数据源)的事务处理。这一节主要讲如何处理多个数据源的事务。
为什么多数据源下不能使用普通事务来处理呢?
我想很多人都有这个问题,打个比方,分库分表后有个数据库A和数据库B,A中有抢票记录,B中有票数记录。当我们完成抢票功能,需要在B减少票数的同时在A中增加记录。但是如果有下面的代码发生:
我在B扣除票数后抛出异常,然后执行A库添加记录。
如果没有分布式事务处理,则结果就是B票数扣除,但A没有保存记录。也就是出错后B并没有进行事务回滚。
那问题来了,怎么才能实现我们的要求呢。
分布式事务原则
CAP定理
web无法同时满足以下三点:
一致性: 所有数据变动都是同步的
可用性: 每个操作都必须有预期的响应
分区容错性: 出现单个节点无法可用,系统依然正常对外提供服务
BASE理论
BASE理论是对CAP中的一致性和可用性进行一个权衡的结果。核心思想是即使无法做到强一致性,但可以使用一些技术手段达到最终一致。
Basically Available(基本可用):允许系统发生故障时,损失一部分可用性。
Soft state(软状态):允许数据同步存在延迟。
Eventually consistent(最终一致性): 不需要保持强一致性,最终一致即可。
那如何来实现分布式事务管理呢?
分布式事务管理实践
1. JTA实现
事务有效的屏蔽了底层事务资源,使应用可以以透明的方式参入到事务处理中,但是与本地事务相比,XA 协议的系统开销大
在这里我先带大家走出一个误解,你在网上搜JTA一般都是分布式事务用它,但是它就是用来做分布式事务的吗?不是的,我在上文说过,JTA只是Java实现XA事务的一个规范,我们在第一节 Spring事务管理(一)快速入门中用到的事务,都可以叫JTA事务管理。下面主要说JTA实现分布式事务管理:
这里我们会用到Atomikos事务管理器,它是一个开源的事务管理器,实现了XA的一种分布式事务处理并可以嵌入到你的SpringBoot当中。
拓展:什么是XA
基本上所有的数据库都会支持XA事务,百度百科上说法:XA协议由Tuxedo首先提出的,并交给X/Open组织,作为资源管理器(数据库)与事务管理器的接口标准。简单的说,它是事务的标准,JTA也是它标准的java实现。
1.1 导入pom
<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-jta-atomikos</artifactId></dependency>
1.2 设置数据源
SpringBoot设置多数据源这里只说下思路(重点还是说事务实现):
在 application.yml中配置多数据源配置。
- 写配置类加载配置并放入DataSource并设置事务:
这只是一个数据源的配置,第二个数据源的配置也类似,注意不能同Entity同Repository,映射放在不同包下实现。 ����,����两个都返回LocalContainerEntityManagerFactoryBean它便会交给@Transaction去管理,两个数据源配置完后。这样的代码B将会回滚。
1.3 JTA缺点
因为JTA采用两阶段提交方式,第一次是预备阶段,第二次才是正式提交。当第一次提交出现错误,则整个事务出现回滚,一个事务的时间可能会较长,因为它要跨越多个 数据库 多个数据资源的的操作,所以在性能上可能会造成吞吐量低。而且,它只能用在单个服务内。一个完善的JTA事务还需要同时考虑很多元素,这只是个示例。
2. 链式事务管理
链式事务就是声明一个ChainedTransactionManager 将所有的数据源事务按顺序放到该对象中,则事务会按相反的顺序来执行事务。
网上发现了一个链式事务管理的处理顺序,总结的很到位。
6.commit
message transaction
##当这一步出现错误时,上面的因为已经commit,所以不会rollback
可以看到,从345可以看到,它后拿到的事务先提交,这就导致如果1出错,则不会进行数据回滚。跟Spring的同步事务差不多,同步事务也是这种特性。
下面我会测试这个性质。
为了方便,我拿JdbcTemplate来测试该事务。
DBConfig.java
配置DataSource以及返回Template新实例和链式事务配置。
transactionManager()方法实现了链式事务配置,注意我放置的顺序先userTM后resultTM,所以事务应该是先拿到 userTM然后拿到 resultTM然后提交 resultTM最后提交 userTM,也就是说,如果我在提交user事务的时候出错,此时result相关的事务已经提交完成,所以result数据是不能回滚的。
2.1 测试
两个数据库没有内容。
控制台精简后的日志:
其实只要是两个dao操作中间出错或者第一个dao操作之前出错,事务都能正常回滚。如果result操作再前,user操作再后,user操作完抛出异常,也能回滚事务,原因上文有讲。
这段代码也能正常回滚,结果我就不贴了。(浪费大家精力)
2.2 验证第二个事务不能回滚的情况
重要的事情再重复一遍:注意我放置的顺序先userTM后resultTM,所以事务应该是先拿到 userTM然后拿到 resultTM然后提交 resultTM最后提交 userTM,也就是说,如果我在提交user事务的时候出错,此时result相关的事务已经提交完成,所以result数据是不能回滚的。
代码和之前的一样,需要在事务提交的方法中打断点
注意拦截到断点时,先放行一个commit,也就是result事务的commit,然后拦截到第二个commit请求时,关闭user所在的数据库,然后放行。
下面是将第一个commit请求放行后的控制台日志:
注意倒数第三行日志,它出现证明我们第一个result的sql事务已经提交,此时你刷新数据库数据已经更新了,但是我们断点并还没有放行,user的事务还没有提交,我把user的数据库源关闭,再放行,可以看到,result已经有数据,user没有数据,此时result并没有进行回滚,这是链式事务的缺点。
谈谈使用环境
JTA优缺点
JTA它的缺点是二次提交,事务时间长,数据锁的时间太长,性能比较低。
优点是强一致性,对于数据一致性要求很强的业务很有利,而且可以用于微服务。
链式/同步事务优缺点
优点: 比JTA轻量,能满足大部分事务需求,也是强一致性。
缺点: 只能单机玩,不能用于微服务,事务依次提交后提交的事务若出错不能回滚。
它两的比较
JTA重,Chained轻。
JTA能用于微服务分布式事务,Chained只能用于单机分布式事务。
事实上我们处理分布式事务都要求做到最终一致性。就是你刚开始我不需要保持你的数据一致,你中间可以出错,但是我能保证最终数据是一致的。这种做法性能最高,下一章节会谈。