前言

最近老顧經常碰到同事說，MySQL又死鎖了導致業務報錯。今天我們就來聊聊死鎖以及怎么解決

鎖類型

mysql鎖級別：頁級、表級、行級

表級鎖：開銷小，加鎖快；不會出現死鎖；鎖定粒度大，發生鎖沖突的概率最高,并發度最低。

行級鎖：開銷大，加鎖慢；會出現死鎖；鎖定粒度最小，發生鎖沖突的概率最低,并發度也最高。

頁面鎖：開銷和加鎖時間界于表鎖和行鎖之間；會出現死鎖；鎖定粒度界于表鎖和行鎖之間，并發度一般

死鎖產生原因和示例

1、產生原因：

死鎖是指兩個或兩個以上的進程在執行過程中,因爭奪資源而造成的一種互相等待的現象,若無外力作用，它們都將無法推進下去.此時稱系統處于死鎖狀態或系統產生了死鎖，這些永遠在互相等待的進程稱為死鎖進程。表級鎖不會產生死鎖.所以解決死鎖主要還是針對于最常用的InnoDB。

死鎖的關鍵在于：兩個(或以上)的Session加鎖的順序不一致。

那么對應的解決死鎖問題的關鍵就是：讓不同的session加鎖有次序

2、產生示例：

案例一

需求：將投資的錢拆成幾份隨機分配給借款人。

起初業務程序思路是這樣的：

投資人投資后，將金額隨機分為幾份，然后隨機從借款人表里面選幾個，然后通過一條條select for update 去更新借款人表里面的余額等。

例如兩個用戶同時投資，A用戶金額隨機分為2份，分給借款人1，2

B用戶金額隨機分為2份，分給借款人2，1

由于加鎖的順序不一樣，死鎖當然很快就出現了。

對于這個問題的改進很簡單，直接把所有分配到的借款人直接一次鎖住就行了。

Select * from xxx where id in (xx,xx,xx) for update

在in里面的列表值mysql是會自動從小到大排序，加鎖也是一條條從小到大加的鎖

第一個會話：

注意：關閉掉自動提交set autocommit=0;

mysql> select * from goods where goods_id in (2,3) for update;
+----+--------+------+---------------------+
| good_id | goods_name | price             |
+----+--------+------+---------------------+
|  2 | bbbb     | 1.00 |
|  3 | vvv     | 3.00 |
+----+--------+------+---------------------+

第二個會話:

select * from goods where goods_id in (3,4,5) for update;

鎖等待中……

案例二

在開發中，經常會做這類的判斷需求：根據字段值查詢（有索引），如果不存在，則插入；否則更新。

以id為主鍵為例，目前還沒有id=22的行

注意：關閉掉自動提交set autocommit=0;

第一個會話:

select * from goods where goods_id=22 for update;

第二個會話:

select * from goods where goods_id=23  for update;

再在第一個會話:

insert into goods values(22,'ac',11.5);

鎖等待中……

再到第二個會話:

insert into goods values(23,'bc',23.0);

ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction

當對存在的行進行鎖的時候(主鍵)，mysql就只有行鎖。

當對未存在的行進行鎖的時候(即使條件為主鍵)，mysql是會鎖住一段范圍

鎖住的范圍為：

(無窮小或小于表中鎖住id的最大值，無窮大或大于表中鎖住id的最小值)

如一：如果表中目前有已有的id為（11 ， 12）

那么就鎖住（12，無窮大）

如二：如果表中目前已有的id為（11 ， 30）

那么就鎖住（11，30）

對于這種死鎖的解決辦法是：

insert into goods(xx,xx) on duplicate key update `xx`='XX';

用mysql特有的語法來解決此問題。因為insert語句對于主鍵來說，插入的行不管有沒有存在，都會只有行鎖

死鎖檢查處理

正常情況下，死鎖發生時，權重最小的連接將被kill并回滾。但是為了找出語句來優化，啟用可啟用死鎖將死鎖信息記錄下來。

#step 1：窗口一
mysql> start transaction;
mysql> update aa set name='aaa' where id = 1;
 
#step 2：窗口二
mysql> start transaction;
mysql> update bb set name='bbb' where id = 1;
 
#step 3：窗口一
mysql> update bb set name='bbb';

查看方式

#step 4：窗口三
#是否自動提交
mysql> show variables like 'autocommit';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| autocommit    | ON    |
+---------------+-------+

查看當前鏈接

#查看當前連接
mysql> show processlist;
mysql> show full processlist;
mysql> SELECT * FROM INFORMATION_SCHEMA.PROCESSLIST;
+----+------+-----------+------+---------+------+-------+------------------+
| Id | User | Host      | db   | Command | Time | State | Info             |
+----+------+-----------+------+---------+------+-------+------------------+
|  4 | root | localhost | test | Sleep   |  244 |       | NULL             |
|  5 | root | localhost | test | Sleep   |  111 |       | NULL             |
|  6 | root | localhost | NULL | Query   |    0 | init  | show processlist |
+----+------+-----------+------+---------+------+-------+------------------+

id列:一個標識，你要kill 一個語句的時候很有用。
user列: 顯示當前用戶，如果不是root，這個命令就只顯示你權限范圍內的sql語句。
host列:顯示這個語句是從哪個ip 的哪個端口上發出的。可用來追蹤出問題語句的用戶。
db列:顯示這個進程目前連接的是哪個數據庫。
command列:顯示當前連接的執行的命令，一般就是休眠（sleep），查詢（query），連接（connect）
time列:此這個狀態持續的時間，單位是秒。

這個命令中最關鍵的就是state列，mysql列出的狀態主要有以下幾種：

Checking table

正在檢查數據表（這是自動的）。

Closing tables

正在將表中修改的數據刷新到磁盤中，同時正在關閉已經用完的表。這是一個很快的操作，如果不是這樣的話，就應該確認磁盤空間是否已經滿了或者磁盤是否正處于重負中。

Connect Out

復制從服務器正在連接主服務器。

Copying to tmp table on disk

由于臨時結果集大于tmp_table_size，正在將臨時表從內存存儲轉為磁盤存儲以此節省內存。

Creating tmp table

正在創建臨時表以存放部分查詢結果。

deleting from main table

服務器正在執行多表刪除中的第一部分，剛刪除第一個表。

deleting from reference tables

服務器正在執行多表刪除中的第二部分，正在刪除其他表的記錄。

Flushing tables

正在執行FLUSH TABLES，等待其他線程關閉數據表。

Killed

發送了一個kill請求給某線程，那么這個線程將會檢查kill標志位，同時會放棄下一個kill請求。MySQL會在每次的主循環中檢查kill標志位，不過有些情況下該線程可能會過一小段才能死掉。如果該線程程被其他線程鎖住了，那么kill請求會在鎖釋放時馬上生效。

Locked

被其他查詢鎖住了。

Sending data

正在處理SELECT查詢的記錄，同時正在把結果發送給客戶端。

Sorting for group

正在為GROUP BY做排序。

Sorting for order

正在為ORDER BY做排序。

Opening tables

這個過程應該會很快，除非受到其他因素的干擾。例如，在執ALTER TABLE或LOCK TABLE語句行完以前，數據表無法被其他線程打開。正嘗試打開一個表。

Removing duplicates

正在執行一個SELECT DISTINCT方式的查詢，但是MySQL無法在前一個階段優化掉那些重復的記錄。因此，MySQL需要再次去掉重復的記錄，然后再把結果發送給客戶端。

Reopen table

獲得了對一個表的鎖，但是必須在表結構修改之后才能獲得這個鎖。已經釋放鎖，關閉數據表，正嘗試重新打開數據表。

Repair by sorting

修復指令正在排序以創建索引。

Repair with keycache

修復指令正在利用索引緩存一個一個地創建新索引。它會比Repair by sorting慢些。

Searching rows for update

正在講符合條件的記錄找出來以備更新。它必須在UPDATE要修改相關的記錄之前就完成了。

Sleeping

正在等待客戶端發送新請求.

System lock

正在等待取得一個外部的系統鎖。如果當前沒有運行多個mysqld服務器同時請求同一個表，那么可以通過增加--skip-external-locking參數來禁止外部系統鎖。

Upgrading lock

INSERT DELAYED正在嘗試取得一個鎖表以插入新記錄。

Updating

正在搜索匹配的記錄，并且修改它們。

User Lock

正在等待GET_LOCK()。

Waiting for tables

該線程得到通知，數據表結構已經被修改了，需要重新打開數據表以取得新的結構。然后，為了能的重新打開數據表，必須等到所有其他線程關閉這個表。以下幾種情況下會產生這個通知：FLUSH TABLES tbl_name, ALTER TABLE, RENAME TABLE, REPAIR TABLE, ANALYZE TABLE,或OPTIMIZE TABLE。

Waiting for handler insert

INSERT DELAYED已經處理完了所有待處理的插入操作，正在等待新的請求。

查看當前正在被鎖的事務

 
#查看當前正在被鎖的事務（鎖請求超時后則查不到）
mysql> SELECT * FROM INFORMATION_SCHEMA.INNODB_LOCKS;
+------------------+-------------+-----------+-----------+-------------+-----------------+------------+-----------+----------+----------------+
| lock_id          | lock_trx_id | lock_mode | lock_type | lock_table  | lock_index      | lock_space | lock_page | lock_rec | lock_data      |
+------------------+-------------+-----------+-----------+-------------+-----------------+------------+-----------+----------+----------------+
| 130718495:65:3:4 | 130718495   | X         | RECORD    | `test`.`bb` | GEN_CLUST_INDEX |         65 |         3 |        4 | 0x000000000300 |
| 130718496:65:3:4 | 130718496   | X         | RECORD    | `test`.`bb` | GEN_CLUST_INDEX |         65 |         3 |        4 | 0x000000000300 |
+------------------+-------------+-----------+-----------+-------------+-----------------+------------+-----------+----------+----------------+

查看當前等待鎖的事務

#查看當前等待鎖的事務（鎖請求超時后則查不到）
mysql> SELECT * FROM INFORMATION_SCHEMA.INNODB_LOCK_WAITS; 
+-------------------+-------------------+-----------------+------------------+
| requesting_trx_id | requested_lock_id | blocking_trx_id | blocking_lock_id |
+-------------------+-------------------+-----------------+------------------+
| 130718499         | 130718499:65:3:4  | 130718500       | 130718500:65:3:4 |
+-------------------+-------------------+-----------------+------------------+

查看當前未提交的事務

 
#查看當前未提交的事務（如果死鎖等待超時,事務可能還沒有關閉）
mysql> SELECT * FROM INFORMATION_SCHEMA.INNODB_TRX;

主要看箭頭指向的這幾個字段，如果有阻塞數據（不為0的就是阻塞的）,找到后在根據下圖這個字段：try_mysql_thread_id 作為這條數據的主鍵id執行這個sql進行刪除： kill id ;(殺死對應id的進程).假設這里try_mysql_thread_id=14的這條數據是鎖了。我們執行 kill 14刪除就不再鎖表了。

查看正在被訪問的表

#查看正在被訪問的表
mysql> show OPEN TABLES where In_use > 0;
+----------+-------+--------+-------------+
| Database | Table | In_use | Name_locked |
+----------+-------+--------+-------------+
| test     | bb    |      1 |           0 |
+----------+-------+--------+-------------+

死鎖異常

#step 3：窗口一 （若第三步中鎖請求太久，則出現鎖超時而終止執行）
mysql> update bb set name='bbb';
ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction
 
 
#"窗口一" 鎖請求超時前，執行第五步，使死鎖產生，則該連接 "窗口二" 執行終止，"窗口一" 順利執行
#step 5：窗口二
mysql> update aa set name='aa';
ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction

查看最近一個死鎖情況

mysql> SHOW ENGINE INNODB STATUS;

死鎖日志

#死鎖記錄只記錄最近一個死鎖信息，若要將每個死鎖信息都保存到錯誤日志，啟用以下參數：
mysql> show variables like 'innodb_print_all_deadlocks';
+----------------------------+-------+
| Variable_name              | Value |
+----------------------------+-------+
| innodb_print_all_deadlocks | OFF   |
+----------------------------+-------+

鎖等待超時

 
#上面 【step 3：窗口一】若一直請求不到資源，默認50秒則出現鎖等待超時。
mysql> show variables like 'innodb_lock_wait_timeout'; 
+--------------------------+-------+
| Variable_name            | Value |
+--------------------------+-------+
| innodb_lock_wait_timeout | 50    |
+--------------------------+-------+
 
ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction
 
 
#設置全局變量 鎖等待超時為60秒（新的連接生效）
#mysql> set session innodb_lock_wait_timeout=50; 
mysql> set global innodb_lock_wait_timeout=60;

事務回滾

 
#上面測試中，當事務中的某個語句超時只回滾該語句，事務的完整性屬于被破壞了。為了回滾這個事務，啟用以下參數：
mysql> show variables like 'innodb_rollback_on_timeout';
+----------------------------+-------+
| Variable_name              | Value |
+----------------------------+-------+
| innodb_rollback_on_timeout | OFF   |
+----------------------------+-------+

最終參數設置如下：(重啟服務重新連接測試)

[mysqld]
log-error =/var/log/mysqld3306.log
innodb_lock_wait_timeout=60     #鎖請求超時時間(秒)
innodb_rollback_on_timeout = 1  #事務中某個語句鎖請求超時將回滾真個事務
innodb_print_all_deadlocks = 1  #死鎖都保存到錯誤日志

Command='Sleep'

表示連接休眠，如果太多，可以手動刪除

#若手動刪除堵塞會話，刪除 Command='Sleep' 、無State、無Info、trx_weight 權重最小的。
show processlist;
SELECT trx_mysql_thread_id,trx_state,trx_started,trx_weight FROM INFORMATION_SCHEMA.INNODB_TRX;

總結

上面是老顧總結的mysql死鎖相關的內容，尤其是死鎖檢查處理，是比較實用的，小伙伴們可以參考。

推薦閱讀

解決Api統一格式返回，遺留地返回String一個問題

SpringMVC全局異常方案、源碼分析，以及常見的入坑

Spring多種啟動初始化方案，看這篇就夠了

來說說ThreadLocal內存溢出問題

阿里面試題：強、軟、弱、虛引用的特點及應用場景

企業常用的并發編程Queue的源碼分析

了解JAVA中的SPI機制，以及數據庫驅動插件，這一篇就夠了

企業實戰之阿里druid統一監控方案，你了解嗎？

千人千面精準推薦之大白話講解協同算法（一）,看這篇就夠了

企業實戰之分布式鎖方案一步步的演變

你了解滑動時間窗口嗎？Sentinel核心源碼剖析

Sentinel全局Feign默認熔斷降級策略的思考

你所不知道的頭部參數傳遞的坑，來吧！抓緊出坑

5分鐘讓你理解K8S必備架構概念，以及網絡模型（一）

5分鐘讓你理解K8S必備架構概念，以及網絡模型（二）

5分鐘讓你理解K8S必備架構概念，以及網絡模型（三）

大廠如何基于binlog解決多機房同步mysql數據（一）？

大廠如何基于binlog解決多機房同步mysql數據（二）？

基于binlog的canal組件有哪些使用場景（三）？

基于binlog日志之canal企業應用及高可用原理（四）？

可用于大型應用的微服務生態灰度發布如何實現？

一線大廠級別公共redis集群監控，細化到每個項目實例

Sharding-jdbc的實戰入門之水平分表（一）

Sharding-Jdbc之水平分庫和讀寫分離（二）

亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

MySQL死鎖產生的原因和解決方法

前言

鎖類型

死鎖產生原因和示例

1、產生原因：

2、產生示例：

案例一

案例二

死鎖檢查處理

查看當前鏈接

查看當前正在被鎖的事務

查看當前等待鎖的事務

查看當前未提交的事務

查看正在被訪問的表

死鎖異常

查看最近一個死鎖情況

相關參數配置

死鎖日志

鎖等待超時

事務回滾

Command='Sleep'

總結

數獨大挑戰2018-06-03

答題星2018-06-03

全階人生考試2018-06-03

運動步數有氧達人2018-06-03

每日養生app2018-06-03

體育訓練成績評定2018-06-03