解析Mybatis延迟加载问题

网友投稿 295 2022-10-26


解析Mybatis延迟加载问题

延迟加载问题

MyBatis针对关联表中的数据支持延迟加载。延迟加载其实就是将数据加载时机推迟,比如推迟嵌套查询的执行时机。

延迟加载可以实现先查询主表,按需实时做关联查询,返回关联表结果集,一定程度上提高了效率。

lazyLoadingEnabled:是否启用延迟加载,默认值为false,不启用延迟加载。lazyLoadingEnabled属性控制全局是否使用延迟加载,特殊关联关系也可以通过嵌套查询中fetchType属性单独配置(fetchType属性值可以是lazy或者eager)

aggressiveLazyLoading:是否按需加载属性,默认值false,lazyLoadingEnabled属性启用时只要加载对象,就会加载该对象的所有属性;关闭该属性则会按需加载,即使用到某关联属性时,实时执行嵌套查询加载该属性

对一

如果不访问role属性,则不会执行t_roles表的查询。当访问role属性时才会执行查询操作,而且如果session关闭,则自动新打开session执行查询

对多

缓存

MyBatis支持一二级缓存

Mybatis提供查询缓存,如果缓存中有数据就不用从数据库中获取,用于减轻数据压力,提高系统性能

缓存的重要性是不言而喻的。 使用缓存可以避免频繁的与数据库进行交互, 尤其是在查询越多、缓存命中率越高的情况下, 使用缓存对性能的提高更明显。

mybatis也提供了对缓存的支持, 分为一级缓存和二级缓存。 但是在默认的情况下, 只开启一级缓存(一级缓存是对同一个 SqlSession 而言的)

默认情况下,只有一级缓存(SqlSession级别的缓存,也称为本地缓存)开启

二级缓存需要手动开启和配置,是基于namespace级别的缓存

为了提高扩展性。MyBatis定义了缓存接口Cache。可以通过实现Cache接口来自定义二级缓存

一级缓存是SqlSession级别的缓存。在操作数据库时需要构造sqlSession对象,在对象中有一个数据结构HashMap用于存储缓存数据。不同的sqlSession之间的缓存数据区域HashMap是互相不影响的

二级缓存是mapper级别的缓存,多个SqlSession去操作同一个Mapper的sql语句,多个SqlSession可以共用二级缓存,二级缓存是跨SqlSession的

一级缓存

一级缓存即local cache本地缓存,作用域默认为sqlSession。当Session flush或close后该Session中的所有Cache将被清空

RoleMapper rm= MybatisSessionFactory.getMapper(RoleMapper.class);

Role role=rm.selectByPrimaryKey(1L);

System.out.println(role.getId()+":"+role.getName());

System.out.println("--------------------------------");

MybatisSessionFactory.closeSession();

rm= MybatisSessionFactory.getMapper(RoleMapper.class);

role=rm.selectByPrimaryKey(1L);

System.out.println(role.getId()+":"+role.getName());

两次查询操作,分别是2次sql语句,证明缓存是session级的。如果不关闭session,即使2次获取Mapper执行的查询仍旧只有一个sql语句

每个SqlSession中持有了Executor,每个Executor中有一个LocalCache。当用户发起查询时,MyBatis根据当前执行的语句生成MappedStatement,在Local Cache进行查询,如果缓存命中的话,直接返回结果给用户,如果缓存没有命中的话,查询数据库,结果写入Local Cache,最后返回结果给用户

一级缓存配置

开发者只需在MyBatis的配置文件localCacheScope中可以设置使用一级缓存。共有两个选项SESSION或者STATEMENT,默认是SESSION级别,即在一个MyBatis会话中执行的所有语句,都会共享这一个缓存。一种是STATEMENT级别,可以理解为缓存只对当前执行的这一个Statement有效。

UserMapper userMapper = MyBatisSessionFactory.getMapper(UserMapper.class);

User user1=userMapper.loadById(1L);

System.out.println(user1);

SqlSession session = MyBatisSessionFactory.openSession();

session.clearCache();//清空缓存 ,后续查询会发送SQL语句

User user2=userMapper.loadById(1L);

System.out.println(user2);

System.out.println(user1==user2);

MyBatisSessionFactory.closeSession();

1、第一次发起查询用户id为1的用户信息,先去找缓存中是否有id为1的用户信息,如果没有,从数据库查询用户信息。得到用户信息,将用户信息存储到一级缓存中。

2、如果中间sqlSession去执行commit操作(执行插入、更新、删除),则会清空SqlSession中的一级缓存,这样做的目的为了让缓存中存储的是最新的信息,避免脏读。

3、第二次发起查询用户id为1的用户信息,先去找缓存中是否有id为1的用户信息,缓存中有,直接从缓存中获取用户信息。

##源码分析

SqlSession对外提供了用户和数据库之间交互需要的所有方法,隐藏了底层的细节。默认实现类是DefaultSqlSession

Executor: SqlSession向用户提供操作数据库的方法,但和数据库操作有关的职责都会委托给Executor。

BaseExecutor是一个实现了Executor接口的抽象类,定义若干抽象方法,在执行的时候,把具体的操作委托给子类进行执行。

Cache: MyBatis中的Cache接口,提供了和缓存相关的最基本的操作

BaseExecutor成员变量之一的PerpetualCache,是对Cache接口最基本的实现,其实现非常简单,内部持有HashMap,对一级缓存的操作实则是对HashMap的操作。

1、为执行和数据库的交互,首先需要初始化SqlSession,通过DefaultSqlSessionFactory开启SqlSession

2、在初始化SqlSesion时,会使用Configuration类创建一个全新的Executor,作为DefaultSqlSession构造函数的参数

3、SqlSession创建完毕后,根据Statment的不同类型,会进入SqlSession的不同方法中,如果是Select语句的话,最后会执行到SqlSession的selectList

4、SqlSession把具体的查询职责委托给了Executor。如果只开启了一级缓存的话,首先会进入BaseExecutor的query方法。

5、会先根据传入的参数生成CacheKey,默认将MappedStatement的Id、sql的offset、Sql的limit、Sql本身以及Sql中的参数传入了CacheKey这个类,最终构成CacheKey

6、如果查不到的话,就从数据库查,在queryFromDatabase中,会对localcache进行写入。 在query方法执行的最后,会判断一级缓存级别是否是STATEMENT级别,如果是的话,就清空缓存,这也就是STATEMENT级别的一级缓存无法共享localCache的原因。

##总结

MyBatis一级缓存的生命周期和SqlSession一致。MyBatis一级缓存内部设计简单,只是一个没有容量限定的HashMap,在缓存的功能性上有所欠缺。MyBatis的一级缓存最大范围是SqlSession内部,有多个SqlSession或者分布式的环境下,数据库写操作会引起脏数据,建议设定缓存级别为Statement。

##一级缓存的生命周期

MyBatis在开启一个数据库会话时,会 创建一个新的SqlSession对象,SqlSession对象中会有一个新的Executor对象,Executor对象中持有一个新的PerpetualCache对象;当会话结束时,SqlSession对象及其内部的Executor对象还有PerpetualCache对象也一并释放掉。如果SqlSession调用了close()方法,会释放掉一级缓存PerpetualCache对象,一级缓存将不可用;如果SqlSession调用了clearCache(),会清空PerpetualCache对象中的数据,但是该对象仍可使用;SqlSession中执行了任何一个update操作(update()、delete()、insert()) ,都会清空PerpetualCache对象的数据,但是该对象可以继续使用

##一级缓存的不足

使用一级缓存的时候,因为缓存不能跨会话共享,不同的会话之间对于相同的数据可能有不一样的缓存。在有多个会话或者分布式环境下,会存在脏数据的问题。如果要解决这个问题,就要用到二级缓存。

MyBatis 一级缓存(MyBaits 称其为 Local Cache)无法关闭,但是有两种级别可选:

session级别的缓存,在同一个 sqlSession 内,对同样的查询将不再查询数据库,直接从缓存中。

statement级别的缓存,session级别缓存不能获取最新数据: 为了避免这个问题,可以将一级缓存的级别设为 statement 级别的,这样每次查询结束都会清掉一级缓存。

由于不同的sqlSession之间的缓存数据区域不共享,如果使用多个SqlSession对数据库进行操作时,就会出现脏数据

##二级缓存

一级缓存中,其最大的共享范围就是一个SqlSession内部,如果多个SqlSession之间需要共享缓存,则需要使用到二级缓存。开启二级缓存后,会使用CachingExecutor装饰Executor,进入一级缓存的查询流程前,先在CachingExecutor进行二级缓存的查询

二级缓存开启后,同一个namespace下的所有操作语句,都影响着同一个Cache,即二级缓存被多个SqlSession共享,是一个全局的变量。 当开启缓存后,数据的查询执行的流程就是 二级缓存 -> 一级缓存 -> 数据库。

二级缓存(全局缓存):基于namespace级别的缓存,一个namespace对应一个二级缓存

###二级缓存配置

1、在MyBatis的配置文件中开启二级缓存。

cacheEnabled 全局性地开启或关闭所有映射器配置文件中已配置的任何缓存。

2、在MyBatis的映射XML中配置cache或者 cache-ref

type:cache使用的类型,默认是PerpetualCache,这在一级缓存中提到过。

eviction: 定义回收的策略,常见的有FIFO,LRU。

flushInterval: 配置一定时间自动刷新缓存,单位是毫秒。

size: 最多缓存对象的个数。

readOnly: 是否只读,若配置可读写,则需要对应的实体类能够序列化。

blocking: 若缓存中找不到对应的key,是否会一直blocking,直到有对应的数据进入缓存。

cache-ref代表引用别的命名空间的Cache配置,两个命名空间的操作使用的是同一个Cache。

二级缓存实验

1、测试二级缓存效果,不提交事务,sqlSession1查询完数据后,sqlSession2相同的查询是否会从缓存中获取数据。 可以看到,当sqlsession没有调用commit()方法时,二级缓存并没有起到作用。

SqlSession session1=MybatisSessionFactory.getFactory().openSession();

SqlSession session2=MybatisSessionFactory.getSession();

RoleMapper rm1=session1.getMapper(RoleMapper.class);

RoleMapper rm2=session2.getMapper(RoleMapper.class);

Role r1=rm1.selectByPrimaryKey(1L);

session1.commit(); //如果不进行提交,则缓存无效

Role r2=rm2.selectByPrimaryKey(1L);

System.out.println(r1==r2); //不是同一个对象,应该是对象的深克隆

2、测试二级缓存效果,当提交事务时,sqlSession1查询完数据后,sqlSession2相同的查询是否会从缓存中获取数据。 sqlsession2的查询,使用了缓存,缓存的命中率是0.5。

3、测试update操作是否会刷新该namespace下的二级缓存。 可以看到,在sqlSession3更新数据库,并提交事务后,sqlsession2的StudentMapper namespace下的查询走了数据库,没有走Cache。

4、验证MyBatis的二级缓存不适应用于映射文件中存在多表查询的情况。 通常我们会为每个单表创建单独的映射文件,由于MyBatis的二级缓存是基于namespace的,多表查询语句所在的namspace无法感应到其他namespace中的语句对多表查询中涉及的表进行的修改,引发脏数据问题。

5、为了解决实验4的问题呢,可以使用Cache ref,让ClassMapper引用StudenMapper命名空间,这样两个映射文件对应的Sql操作都使用的是同一块缓存了。 不过这样做的后果是,缓存的粒度变粗了,多个Mapper namespace下的所有操作都会对缓存使用造成影响。

###二级缓存源码

在一级缓存处理前,用CachingExecutor装饰了BaseExecutor的子类,在委托具体职责给delegate之前,实现了二级缓存的查询和写入功能

CachingExecutor的query方法,首先会从MappedStatement中获得在配置初始化时赋予的Cache。

本质上是装饰器模式的使用,具体的装饰链是SynchronizedCache -> LoggingCache -> SerializedCache -> LruCache -> PerpetualCache。

SynchronizedCache: 同步Cache,实现比较简单,直接使用synchronized修饰方法。

LoggingCache: 日志功能,装饰类,用于记录缓存的命中率,如果开启了DEBUG模式,则会输出命中率日志。SerializedCache: 序列化功能,将值序列化后存到缓存中。该功能用于缓存返回一份实例的Copy,用于保存线程安全。LruCache: 采用了Lru算法的Cache实现,移除最近最少使用的key/value。

PerpetualCache: 作为为最基础的缓存类,底层实现比较简单,直接使用了HashMap。

总结

MyBatis的二级缓存相对于一级缓存来说,实现了SqlSession之间缓存数据的共享,同时粒度更加的细,能够到namespace级别,通过Cache接口实现类不同的组合,对Cache的可控性也更强。

MyBatis在多表查询时,极大可能会出现脏数据,有设计上的缺陷,安全使用二级缓存的条件比较苛刻。一般在具体开发中不使用MyBatis的二级缓存,而是通过Spring框架引入业务层缓存

在分布式环境下,由于默认的MyBatis Cache实现都是基于本地的,分布式环境下必然会出现读取到脏数据,需要使用集中式缓存将MyBatis的Cache接口实现,有一定的开发成本,直接使用Redis,Memcached等分布式缓存可能成本更低,安全性也更高。


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:dubbo之rmi协议使用
下一篇:CUCM V8.5 修改IP地址
相关文章

 发表评论

评论列表