- A+
无论何时,只要有多个查询需要在同一时刻修改数据,都会产生并发控制的问题。
以 Unix 系统的 email box 为例,典型的 mbox 文件格式是非常简单的。一个 mbox 邮箱中的所有邮件都串行在一起,彼此首尾相连。这种格式对于读取和分析邮件信息非常友好,同时投递邮件也很容易,只要在文件末尾附件上新的邮件内容即可。
但如果两个进程在同一时刻对同一个邮箱投递邮件,会发生什么情况? 显然,邮箱的数据会被破坏,两封邮件的内容会交叉地附加在邮箱文件的末尾。设计良好的邮箱投递系统会通过锁(lock)来防止数据损坏。如果客户试图投递邮件,而邮箱已经被其他客户锁住,那就必须等待,直到锁释放才能进行投递。
读写锁
从邮箱中读取数据没有这样的麻烦,即使同一时刻多个用户并发读取也不会有什么问题。因为读取不会修改数据,所以不会出错。但如果某个用户正在读取邮箱,另一个用户正在删除邮件,会产生很多不确定的结果。所以,为了安全起见,即使是读取邮箱也需要格外注意。
如果把上述的邮箱当作数据库中的一张表,把邮件当作表中的一行记录,就很容易看出,同样的问题依然存在。
解决这类经典问题的办法就是并发控制。在处理读或者写时,可以通过实现一个由两种类型的锁组成的锁系统来解决问题。这两种类型的锁通常被称为共享锁(share lock)和排他锁(exclusive lock),或者被称为读锁(read lock)和 写锁(write lock)。
读锁是共享的,或者说是互相不阻塞的。多个客户可以在同一时刻读取同一个资源,而不互相干扰。
写锁的排他的,也就是说一个写锁会阻塞其他的写锁和读锁,这是出于安全策略的考虑,只有这样,才能保证在确保的时间里,只有一个用户进行写入,并防止其他用户读取正在写入的统一资源。
在实际的数据库系统中,每时每刻都在发生锁定,当某个用户在修改一部分数据时,MySQL 会通过锁定防止其他用户读取同一数据。大多数时候,MySQL 锁的内部管理都是透明的。
锁粒度
一种提高共享资源的并发性的方式就是让锁定对象更有选择性。尽量只锁定需要修改的部分数据,而不是所有的资源。更理想的方式,只对会修改的数据片进行精确的锁定。任何时候,在给定的资源上,锁定的数据量越少,则系统的并发程度越高。
问题是加锁也会需要消耗资源。锁的各种操作,包括获得锁、检查锁是否已经解除、释放锁等,都会增加系统的开销。如果系统花费大量的时间来管理锁,而不是存取数据,那么系统的性能可能会因此受到影响。所谓的锁策略,就是在锁的开销和数据的安全性之间寻求平衡,这种平衡当然也会影响到性能。
MySQL 提供多种策略。每种 MySQL 存储引擎都可以实现自己的锁策略和锁粒度。在存储引擎的设计中,锁管理是个非常重要的决定。将锁粒度固定在某个级别,可以为某些特定的场景提供更好的性能。
表锁(table lock)
表锁是 MySQL 中最基本的锁策略,并且是开销最小的策略。表锁会锁定整张表,一个用户在对表进行写操作(插入、删除、更新等)前,需要先获得写锁,这会阻塞其他用户对该表的读写操作。只是没有写锁时,其他读取的用户才能获得读锁,读锁之间是不相互阻塞的。
在特定的场景中,表锁也可能有良好的性能。例如,Read Lock 表锁支持某些类型的并发写操作。另外,写锁也比读锁有更高的优先级,因此一个写锁请求可能会被插入到读锁队列的前面。
行级锁(row lock)
行级锁可以最大程度地支持并发处理。