導(dǎo)讀:InnoDB是事務(wù)安全的MySQL存儲引擎,設(shè)計上采用了類似于Oracle數(shù)據(jù)庫的架構(gòu)。通常來說,InnoDB存儲引擎是OLTP應(yīng)用中核心表的首選存儲引擎。同時,也正是因為InnoDB的存在,才使MySQL數(shù)據(jù)庫變得更有魅力。
本文將簡要介紹InnoDB存儲引擎的體系架構(gòu)及其不同于其他存儲引擎的特性。
作者:姜承堯
來源:華章科技

01 InnoDB存儲引擎概述
InnoDB存儲引擎最早由Innobase Oy公司開發(fā),被包括在MySQL數(shù)據(jù)庫所有的二進(jìn)制發(fā)行版本中,從MySQL 5.5版本開始是默認(rèn)的表存儲引擎(之前的版本InnoDB存儲引擎僅在windows下為默認(rèn)的存儲引擎)。
該存儲引擎是第一個完整支持ACID事務(wù)的MySQL存儲引擎(BDB是第一個支持事務(wù)的MySQL存儲引擎,現(xiàn)在已經(jīng)停止開發(fā)),其特點是行鎖設(shè)計、支持MVCC、支持外鍵、提供一致性非鎖定讀,同時被設(shè)計用來最有效地利用以及使用內(nèi)存和CPU。
Heikki Tuuri是InnoDB存儲引擎的創(chuàng)始人,和著名的linux創(chuàng)始人Linus是芬蘭赫爾辛基大學(xué)校友。在1990年獲得赫爾辛基大學(xué)的數(shù)學(xué)邏輯博士學(xué)位后,他于1995年成立Innobase Oy公司并擔(dān)任CEO。
同時,在InnoDB存儲引擎的開發(fā)團(tuán)隊中,有來自中國科技大學(xué)的Calvin Sun。隨后又有一個中國人Jimmy Yang也加入了InnoDB存儲引擎的核心開發(fā)團(tuán)隊,負(fù)責(zé)全文索引的開發(fā),其之前任職于Sybase數(shù)據(jù)庫公司,負(fù)責(zé)數(shù)據(jù)庫的相關(guān)開發(fā)工作。
InnoDB存儲引擎已經(jīng)被許多大型網(wǎng)站使用,如用戶熟知的google、Yahoo!、Facebook、YouTube、Flickr,在網(wǎng)絡(luò)游戲領(lǐng)域有《魔獸世界》《Second Life》《神兵玄奇》等。我不是MySQL數(shù)據(jù)庫的布道者,也不是InnoDB的鼓吹者,但是我認(rèn)為當(dāng)前實施一個新的OLTP項目不使用MySQL InnoDB存儲引擎將是多么的愚蠢。
從MySQL數(shù)據(jù)庫的官方手冊可得知,著名的Internet新聞?wù)军cSlashdot.org運行在InnoDB上。Mytrix、Inc.在InnoDB上存儲超過1TB的數(shù)據(jù),還有一些其他站點在InnoDB上處理插入/更新操作的速度平均為800次/秒。這些都證明了InnoDB是一個高性能、高可用、高可擴(kuò)展的存儲引擎。
InnoDB存儲引擎同MySQL數(shù)據(jù)庫一樣,在GNU GPL 2下發(fā)行。更多有關(guān)MySQL證書的信息,這里不再詳細(xì)介紹,可參考:
http://www.mysql.com/about/legal/

02 InnoDB存儲引擎的版本
InnoDB存儲引擎被包含于所有MySQL數(shù)據(jù)庫的二進(jìn)制發(fā)行版本中。早期其版本隨著MySQL數(shù)據(jù)庫的更新而更新。從MySQL 5.1版本時,MySQL數(shù)據(jù)庫允許存儲引擎開發(fā)商以動態(tài)方式加載引擎,這樣存儲引擎的更新可以不受MySQL數(shù)據(jù)庫版本的限制。
所以在MySQL 5.1中,可以支持兩個版本的InnoDB,一個是靜態(tài)編譯的InnoDB版本,可將其視為老版本的InnoDB;另一個是動態(tài)加載的InnoDB版本,官方稱為InnoDB Plugin,可將其視為InnoDB 1.0.x版本。
MySQL 5.5版本中又將InnoDB的版本升級到了1.1.x。而在MySQL 5.6版本中InnoDB的版本也隨著升級為1.2.x版本。
以下是InnoDB各版本功能對比。
- 老版本InnoDB:支持ACID、行鎖設(shè)計、MVCC
- InnoDB 1.0.x:繼承了上述版本所有功能,增加了compress和dynamic頁格式
- InnoDB 1.1.x:繼承了上述版本所有功能,增加了Linux AIO、多回滾段
- InnoDB 1.2.x:繼承了上述版本所有功能,增加了全文索引支持、在線索引添加
在現(xiàn)實工作中我發(fā)現(xiàn)很多MySQL數(shù)據(jù)庫還是停留在MySQL 5.1版本,并使用InnoDB Plugin。很多DBA錯誤地認(rèn)為InnoDB Plugin和InnoDB 1.1版本之間是沒有區(qū)別的。但從功能對比中還是可以發(fā)現(xiàn),雖然都增加了對于compress和dynamic頁的支持,但是InnoDB Plugin是不支持Linux Native AIO功能的。
此外,由于不支持多回滾段,InnoDB Plugin支持的最大支持并發(fā)事務(wù)數(shù)量也被限制在1023。而且隨著MySQL 5.5版本的發(fā)布,InnoDB Plugin也變成了一個歷史產(chǎn)品。
03 InnoDB體系架構(gòu)
圖2-1簡單顯示了InnoDB的存儲引擎的體系架構(gòu),從圖可見,InnoDB存儲引擎有多個內(nèi)存塊,可以認(rèn)為這些內(nèi)存塊組成了一個大的內(nèi)存池,負(fù)責(zé)如下工作:
- 維護(hù)所有進(jìn)程/線程需要訪問的多個內(nèi)部數(shù)據(jù)結(jié)構(gòu)。
- 緩存磁盤上的數(shù)據(jù),方便快速地讀取,同時在對磁盤文件的數(shù)據(jù)修改之前在這里緩存。
- 重做日志(redo log)緩沖。
……

▲圖2-1 InnoDB存儲引擎體系架構(gòu)
后臺線程的主要作用是負(fù)責(zé)刷新內(nèi)存池中的數(shù)據(jù),保證緩沖池中的內(nèi)存緩存的是最近的數(shù)據(jù)。此外將已修改的數(shù)據(jù)文件刷新到磁盤文件,同時保證在數(shù)據(jù)庫發(fā)生異常的情況下InnoDB能恢復(fù)到正常運行狀態(tài)。
InnoDB存儲引擎是多線程的模型,因此其后臺有多個不同的后臺線程,負(fù)責(zé)處理不同的任務(wù)。
InnoDB存儲引擎是基于磁盤存儲的,并將其中的記錄按照頁的方式進(jìn)行管理。因此可將其視為基于磁盤的數(shù)據(jù)庫系統(tǒng)(Disk-base Database)。在數(shù)據(jù)庫系統(tǒng)中,由于CPU速度與磁盤速度之間的鴻溝,基于磁盤的數(shù)據(jù)庫系統(tǒng)通常使用緩沖池技術(shù)來提高數(shù)據(jù)庫的整體性能。
緩沖池簡單來說就是一塊內(nèi)存區(qū)域,通過內(nèi)存的速度來彌補(bǔ)磁盤速度較慢對數(shù)據(jù)庫性能的影響。
在數(shù)據(jù)庫中進(jìn)行讀取頁的操作,首先將從磁盤讀到的頁存放在緩沖池中,這個過程稱為將頁“FIX”在緩沖池中。下一次再讀相同的頁時,首先判斷該頁是否在緩沖池中。若在緩沖池中,稱該頁在緩沖池中被命中,直接讀取該頁。否則,讀取磁盤上的頁。

▲圖2-2 InnoDB內(nèi)存數(shù)據(jù)對象
通常來說,數(shù)據(jù)庫中的緩沖池是通過LRU(Latest Recent Used,最近最少使用)算法來進(jìn)行管理的。即最頻繁使用的頁在LRU列表的前端,而最少使用的頁在LRU列表的尾端。當(dāng)緩沖池不能存放新讀取到的頁時,將首先釋放LRU列表中尾端的頁。
04 InnoDB關(guān)鍵特性
InnoDB存儲引擎的關(guān)鍵特性包括:
- 插入緩沖(Insert Buffer)
- 兩次寫(Double Write)
- 自適應(yīng)哈希索引(Adaptive Hash Index)
- 異步IO(Async IO)
- 刷新鄰接頁(Flush Neighbor Page)
上述這些特性為InnoDB存儲引擎帶來更好的性能以及更高的可靠性。
關(guān)于作者:姜承堯(David Jiang),資深MySQL數(shù)據(jù)庫專家,擅長于數(shù)據(jù)庫的故障診斷、性能調(diào)優(yōu)、容災(zāi)處理、高可用和高擴(kuò)展研究,同時一直致力于MySQL數(shù)據(jù)庫底層實現(xiàn)原理的研究和探索。此外,對高性能數(shù)據(jù)庫和數(shù)據(jù)倉庫也有深刻而獨到的理解。曾為MySQL編寫了許多開源工具和性能擴(kuò)展補(bǔ)丁,如廣受好評的InnoDB引擎二級緩存項目。
本文摘編自《MySQL技術(shù)內(nèi)幕:InnoDB存儲引擎(第2版)》,經(jīng)出版方授權(quán)發(fā)布。