MongoDB 单文档原生支持原子性,也具有事务的特性,但是我们说起事务,通常是指在多文档中的实现,因此,MongoDB 在 4.0 版本支持了多文档事务,4.0 对应于复制集的多表、多行,后续又在 4.2 版本支持了分片集的多表、多行事务操作。
-
原子性(Atomicity):事务必须是原子工作单元,对于其数据修改,要么全执行,要么全不执行。类似于 Redis 中我通常使用 Lua 脚本来实现多条命令操作的原子性。
-
一致性(Consistency):事务在完成时,必须使所有的数据都保持一致状态。
-
隔离性(Isolation):由并发事务所做的修改必须与任何其他并发事务所作的修改隔离(简而言之:一个事务执行过程中不应受其它事务影响)。
-
持久性(Durability):事务完成之后,对于系统的影响是永久性的。
原子性:MongoDB 单表、单文档原生支持,但是我们说事务通常是指多文档下的实践,MongoDB 4.0 支持复制集多表、多行,MongoDB 4.2 支持了分片集群多表、多行。
一致性:可使用 writeConcern、readConcern 的结合来完用,下文有示例介绍。
隔离性:MongoDB readConcern 支持隔离性的各级别。
持久性:Journal 和 Replication,Journal 是指先把数据写入日志文件,再提交至数据文件,当服务器宕机时可在日志文件进行恢复,在这基础之上 MongoDB 会将数据写入其它节点,持久性相比其它数据库更高级些。
在事务操作中会分别使用到 readConcern、writeConcern、readPreference 这几个选项,用于控制 Session 的行为,下面分别予以介绍。
事务使用事务级别的 writeConcern 来提交写操作,决定一个事务的写入成功与否要看 writeConcern 选项设置了几个节点,默认情况下为 1。
- w:0 设置为 0 无需关注写入成功与否。
- w:1 ~ 任意节点数 自定义节点数设置,复制集中不得大于最大节点数。默认情况下为 1,表示写入到 Primary 节点就开始往客户端发送确认写入成功。
- w:"majority" 大多数节点成功原则,例如一个复制集 3 个节点,2 个节点成功就认为本次写入成功。
- w:"all" 所以节点都成功,才认为写入成功。
- j:true 默认情况 j:false,写操作到达内存算作完成。如果设置为 j:true,写操作只有到达 journal 文件才算成功。
- wtimeout: 写入超时实践
writeConcern: {
w:"majority" // 大多数原则
j:true,
wtimeout: 5000,
}
JavaScript 使用示例:
db.user.insert({name: "Jack"}, {writeConcern: {w: "majority"}})
对于重要数据可以应用 w:"majority" 设置,普通数据 w:1 设置则可以保证性能最佳,w 设置的节点数越多,等待的延迟也就越大,如果 w 等于总节点数,一旦其中某个节点出现故障就会导致整个写入失败,也是有风险的。
docs.mongodb.com/manual/reference/write-concern/?spm=a2c4e.10696291.0.0.68d519a4ob3Yya
在一个事务操作中使用事务级别的 readPreference 来决定读取时从哪个节点读取。可方便的实现读写分离、就近读取策略。
- primary 只从主节点读取,默认值。
- primaryPreferred 优先选择主节点,不可用时选择从节点
- secondary 只在从节点读取
- secondaryPreferred 优先在从节点读取,从节点不可用时选择主节点。
- nearest 选择附近节点
- primary/primaryPreferred:适合于数据实时性要求较高的场景,例如,订单创建完毕直接跳转到订单详情,如果选择从节点读取,可能会造成主节点数据写入之后,从节点还未复制的情况,因为复制过程是一个异步的操作。
- secondary/secondaryPreferred:适应用于数据实时性要求不高的场景,例如,报表数据、历史订单。还可以减轻对主节点的压力。
- 链接字符串配置:
mongodb://mongodb0.example.com:27017,mongodb1.example.com:27017,mongodb2.example.com:27017/admin?replicaSet=myRepl&readPreference=secondary
- Mongo Shell:
db.collection.find({}).readPref( "secondary")
测试时可借助 db.fsyncUnlock() 对从节点锁定,仅主节点写入数据。
docs.mongodb.com/manual/core/read-preference/#replica-set-read-preference
MongoDB 3.2 引入了 readConcern 来决定读取的策略,但是与 readPreference 不同,readPreference 决定从哪个节点读取,readConcern 决定该节点的哪些数据是可读的。主要保证事务中的隔离性,避免脏读。
- available:读取所有可用的数据。
- local:仅读取当前分片的数据。
- majority:读取在大多数节点上提交完成的数据。
- snapshot:读取最近快照中的数据。
- linearizable:线性读,比 majority 更安全但是性能也更消耗,可能会非常慢,建议配合 maxTimeMS 使用
在启动 Mongod 实例时,指定 --enableMajorityReadConcern 选项或在配置文件中配置
enableMajorityReadConcern=true
重新启动实例,Mongo shell 登陆实例,使用 db._adminCommand( {getCmdLineOpts: 1})
查看配置,可以看到在复制集中会多出一个配置,说明配置成功。
{
...
"parsed" : {
"replication" : {
"enableMajorityReadConcern" : true, // 变化之处
"oplogSizeMB" : 1024,
"replSet" : "May"
},
},
}
db.user.find().readConcern("majority")
// maxTimeMS 确保操作不会无限期地阻塞
db.user.find().readConcern("linearizable").maxTimeMS(10000)
- 未提交读(Read uncommitted)
- 提交读(Read committed)
- 可重复读(Repeatable reads)
- 可序列化(Serializable)
详细内容可参考 深入分析事务的隔离级别
MongoDB 的 readConcern 默认情况下是脏读(readConcer=local),例如,用户在主节点读取一条数据之后,该节点未将数据同步至其它从节点,就因为异常挂掉了,待主节点恢复之后,将未同步至其它节点的数据进行回滚,就出现了脏读。
readConcern 级别的 majority 可以保证读到的数据已经落入到大多数节点。所以说保证了事务的隔离性的提交读,所谓隔离性也是指事务内的操作,事务外是看不见的,在事务隔离级别中为提交读(readConcer=majority)。
readConcern 的 snapshot 属性对应事务隔离级别的可重复读,例如,当开启事务先读取一条数据,之后在事务外对该数据进行修改,如果此时事务内在查询一次该数据可保证重复读,也就是不会读取到事务外修改的数据,例如下例琐事
var session = db.getMongo().startSession();
session.startTransaction({readConcern: { level: 'snapshot' },writeConcern: { w: 'majority' }});
var coll = session.getDatabase('test').getCollection('user');
coll.find({name: 'Jack'}) // { age: 12 } 事务内
db.coll.update({name: 'Jack'}, {$set: {age: 18}}) // 事务外操作
db.coll.find({name: 'Jack'}) // { age: 18 } 事务外操作
coll.find({name: 'Jack'}) // { age: 12 } 事务内
readConcern 的 snapshot 是事务隔离级别中的最高级别,可以保证不会出现脏读、不可重复读、幻读,仅在多文档事务中生效。
一个典型的应用场景是用户写入订单数据(数据写入 Primary),立即调用查询接口,由于采用读写分离模式,链接字符串设置 readPreference=secondaryPreferred 订单写入主节点之后并不能保证数据立即同步到从节点,若此时直接由从节点读取数据, 偶尔会出现订单数据无法找到,用户就会感觉很奇怪,明明下了订单,却又查找不到,造成一些异常订单。
一种导致下单之后再次查找丢失订单的的写法如下:
db.order.insert({"id": "123456789"})
db.order.find({"id": "123456789"}).readPref("secondaryPreferred")
解决方法一:
设置 readPreference=primary,将复制集的节点读取由从节点转换为主节点。
这种方式一个缺点是数据量大了之后会增加主节点的压力,也就没有了主从分离的模式。
解决方法二:
使用 writeConcern、readConcern 组合来解决,即保证读写分离模式,也保证了数据的一致性。
// 写入时保证大多数节点写入成功
db.order.insert({"id": "123456789"}, {writeConern: {w: "majority"}})
// 读取时保证这条数据已在大多数节点存在
db.order.find({"id": "123456789"}).readPref("secondaryPreferred").readConcern("majority")
本文是对 MogoDB 事务的一个初步了解,Read Concern/Write Concern/Read Preference 这些在后续事务实践中都会应用,希望大家可以事先进行一个了解,在接下来的一篇文章中,我会介绍 MongoDB 的事务应该如何应用,同时结合 Node.js 进行实践说明,欢迎关注!