歷時(shí)七天，史上最強(qiáng)MySQL優(yōu)化總結(jié)，從此優(yōu)化So Easy

一、概述

1. 為什么要優(yōu)化

一個(gè)應(yīng)用吞吐量瓶頸往往出現(xiàn)在數(shù)據(jù)庫(kù)的處理速度上
隨著應(yīng)用程序的使用，數(shù)據(jù)庫(kù)數(shù)據(jù)逐漸增多,數(shù)據(jù)庫(kù)處理壓力逐漸增大
關(guān)系型數(shù)據(jù)庫(kù)的數(shù)據(jù)是存放在磁盤(pán)上的，讀寫(xiě)速度較慢(與內(nèi)存中的數(shù)據(jù)相比)

2. 如何優(yōu)化

表、字段的設(shè)計(jì)階段,考量更優(yōu)的存儲(chǔ)和計(jì)算
數(shù)據(jù)庫(kù)自身提供的優(yōu)化功能，如索引
橫向擴(kuò)展，主從復(fù)制、讀寫(xiě)分離、負(fù)載均衡和高可用
典型SQL語(yǔ)句優(yōu)化(收效甚微)

二、字段設(shè)計(jì)

1. 典型方案

①. 對(duì)精度有要求

decimal
小數(shù)轉(zhuǎn)整數(shù)

②. 盡量使用整數(shù)表示字符串（IP）

inet_ aton("ip' )
inet_ ntoa(num)

③. 盡可能使用not null

nuI數(shù)值的計(jì)算邏輯比較復(fù)雜

④. 定長(zhǎng)和非定長(zhǎng)的選擇

較長(zhǎng)的數(shù)字?jǐn)?shù)據(jù)可以使用decimal
char為定長(zhǎng)(超過(guò)長(zhǎng)度的內(nèi)容將被截掉)， varchar為非定長(zhǎng)，text對(duì)內(nèi)容長(zhǎng)度的保存額外保存而varchar對(duì)長(zhǎng)度的保存占用數(shù)據(jù)空間

⑤. 字段數(shù)不要過(guò)多字段注釋是必要的、字段命名見(jiàn)名思意、可以預(yù)留字段以備擴(kuò)展

2. 范式

①. 第一范式：段原子性(關(guān)系型數(shù)據(jù)庫(kù)有列的念，默認(rèn)就符合了)

②. 第二范式：消除對(duì)主鍵的部分依賴(因?yàn)橹麈I可能不止一個(gè))；使用一個(gè)與業(yè)務(wù)無(wú)關(guān)的字段作為主鍵

③. 第三范式：消除對(duì)主鍵的傳遞依賴；高內(nèi)聚, 如商品表可分為商品簡(jiǎn)略信息表和商品詳情表兩張表

三、存儲(chǔ)引擎的選擇（MyISAM和Innodb）

1. 功能差異

Innodb支持事務(wù)、行級(jí)鎖定、外健

2. 存儲(chǔ)差異

①. 存儲(chǔ)方式：MyISAM的數(shù)據(jù)和索弓 |是分開(kāi)存儲(chǔ)的(.MYI.MYD) ，而Innodb是存在一起的(.frm)

②. 表可移動(dòng)性：可以通過(guò)移動(dòng)表對(duì)應(yīng)的MYI和MYD能夠?qū)崿F(xiàn)表的移動(dòng)，而Innodb還有額外的關(guān)聯(lián)文件

③. 碎片空間：MyISAM刪除數(shù)據(jù)時(shí)會(huì)產(chǎn)生碎片空間(占用表文件空間)，需要定期通過(guò)optimizetable table-name手動(dòng)優(yōu)化。而Innodb不會(huì)。

④. 有序存儲(chǔ)：Innodb插入數(shù)據(jù)時(shí)按照主鍵有序來(lái)插入。因此表中數(shù)據(jù)默認(rèn)按主鍵有序(耗費(fèi)寫(xiě)入時(shí)間，因?yàn)樾枰赽+ tree中查找插入點(diǎn)，但查找效率高)

3. 選擇差異

①. 讀多寫(xiě)少用MyISAM：新聞、博客網(wǎng)站

②. 讀多寫(xiě)也多用Innodb：

支持事務(wù)/外鍵，保證數(shù)據(jù)-致性、完整性
并發(fā)能力強(qiáng)(行鎖)

四、索引

1. 什么是索引

從數(shù)據(jù)中提取的具有標(biāo)識(shí)性的關(guān)鍵字，并且有到對(duì)應(yīng)數(shù)據(jù)的映射關(guān)系

2. 類型

①. 主鍵索引primary key：要求關(guān)鍵字唯一且不為null

②. 普通索引key：符合索引僅按照第一字段有序

③. 唯一索引unique key：要求關(guān)鍵字唯一

④. 全文索引fulltext key (不支持中文)

3. 索引管理語(yǔ)法

①. 查看索引

show create table student
desc student

②. 建立索引

創(chuàng)建時(shí)指定，如first. name varchar(1 6),last name(1 6) , key name(first_ name,last_ name)
更改表結(jié)構(gòu)：alter table student add key/unique key/primary key/ultext key key. name(first_ name,last_ name)

③. 刪除索引

alter table student drop key key_ name
如果刪除的是主鍵索引，并且主鍵自增長(zhǎng)，則需要alter modify先取消自增長(zhǎng)再刪除

4. 執(zhí)行計(jì)劃explain

分析SQL執(zhí)行是否用到了索引，用到了什么索引

5. 索引使用的場(chǎng)景

where：如果查找字段都建立了索引，則會(huì)索引覆蓋
order by：如果排序字段建立了索引，而索引又是有序排列的，直接根據(jù)索引拿對(duì)應(yīng)數(shù)據(jù)即可，與讀取查詢出來(lái)的所有數(shù)據(jù)再排序相比效率很高
join：如果join on的條件字段建立了索引，查找會(huì)變得高效
索引覆蓋：直接對(duì)索引做查找，而不去讀取數(shù)據(jù)

6. 語(yǔ)法細(xì)節(jié)

即使建立了索引，有些場(chǎng)景也不一定使用

where id+1 = ?建議寫(xiě)成where id = ?-1，即保證索弓|字段的獨(dú)立出現(xiàn)
like語(yǔ)句不要在關(guān)鍵字前模糊匹配，即"%keyword不會(huì)使用索引，而"keyword% 會(huì)使用索引
or關(guān)鍵兩邊條件字段都建立索引時(shí)才會(huì)使用索引，只要有一邊不是就會(huì)做全表掃描
狀態(tài)值。像性別這樣的狀態(tài)值，-個(gè)關(guān)鍵字對(duì)應(yīng)很多條數(shù)據(jù)，會(huì)認(rèn)為使用索引比全表掃描效率還低

7. 索引的存儲(chǔ)結(jié)構(gòu)

btree：搜索多叉樹(shù)：結(jié)點(diǎn)內(nèi)關(guān)鍵字有序排列，關(guān)鍵字之間有一個(gè)指針,查找效率log(nodeSize,N)，其中nodeSize指一個(gè)結(jié)點(diǎn)內(nèi)關(guān)鍵字?jǐn)?shù)量 (這取決于關(guān)鍵字長(zhǎng)度和結(jié)點(diǎn)大小)
b+ tree：由btree升級(jí)而來(lái)，數(shù)據(jù)和關(guān)鍵字存在一塊空間，省去了由關(guān)鍵字到數(shù)據(jù)的映射找數(shù)據(jù)存放地的時(shí)間

歷時(shí)七天，史上最強(qiáng)MySQL優(yōu)化總結(jié)，從此優(yōu)化So Easy

五、查詢緩存

1. 將select查詢結(jié)果緩存起來(lái)，key為SQL語(yǔ)句,value為查詢結(jié)果

如果SQL功能一樣，但只是多個(gè)空格或略微改動(dòng)都會(huì)導(dǎo)致key的不匹配

2. 客戶端開(kāi)啟

query. cache. _type

0-不開(kāi)啟
1-開(kāi)啟，默認(rèn)緩存每條select,針對(duì)某個(gè)sq不緩存: select sql-no-cache
2-開(kāi)啟，默認(rèn)都不緩存,通過(guò)select sql-cache制定緩存哪-個(gè)條

3. 客戶端設(shè)置緩存大小

query_ cache .size

4. 重蛋緩存

reset query cache

5. 緩存失效

日對(duì)數(shù)據(jù)表的改動(dòng)會(huì)導(dǎo)致基于該數(shù)據(jù)表的所有緩存失效(表層面的管理)

六、分區(qū)

1. 默認(rèn)情況下一張表對(duì)應(yīng)一組存儲(chǔ)文件，但當(dāng)數(shù)據(jù)量較大時(shí)(通常千萬(wàn)條級(jí)別)需要將數(shù)據(jù)分到多組存儲(chǔ)文件，保證單個(gè)文件的處理效率

2. partition by分區(qū)函數(shù)(分區(qū)字段)(分區(qū)邏輯)

hash-分區(qū)字段為整型
key-分區(qū)字段為字符串
range-基于比較，只支持less than
list-基于狀態(tài)值

3. 分區(qū)管理

創(chuàng)建時(shí)分區(qū)：create table article0 partition by key(title) partitions 10
修改表結(jié)構(gòu)：alter table article add partition(分區(qū)邏輯)

4. 分區(qū)字段應(yīng)選擇常用的檢素字段，否則分區(qū)意義不大

七、水平分割和垂直分割

1. 水平

多張結(jié)構(gòu)相同的表存儲(chǔ)同一類型數(shù)據(jù)

單獨(dú)一張表保證id唯一性

2. 垂直

分割字段到多張表，這些表記錄是一對(duì)應(yīng)關(guān)系

八、集群

1. 主從復(fù)制

①. 首先手動(dòng)將slave和master同步一下

stop slave
master導(dǎo)出數(shù)據(jù)到slave執(zhí)行一遍
show master status with read lock記錄File和Position
到slave.上change master to

②. start slave查看Slave_ IO_ Running和Slave_ SQL_ _Running,必須都為YES

③. master可讀可寫(xiě)，但slave只能讀，否則主從復(fù)制會(huì)失效需要重新手動(dòng)同步

④. MySQLreplicate快速配置主從復(fù)制

2. 讀寫(xiě)分離(基于主從復(fù)制)

①. 使用原stcConecton

WriteDatabase提供寫(xiě)連接

ReadDatabase提供讀連接

②. 借助Sping AOP和Aspec實(shí)現(xiàn)數(shù)據(jù)源動(dòng)態(tài)切換

RoutingDataSourcelmpl extends AbstractRoutingDataSource,重寫(xiě)determineDatasource,注入到SqISessionFactory, 配置defaultTargetDatasource和targetDatasource (根據(jù)determineDatasource的返回值選擇具體數(shù)據(jù)源value-ref)
DatasourceAspect切面組件，配置切入點(diǎn)@Pointcut aspect0 (所有DAO類的所有方法)，配置前置增強(qiáng)@Before(" aspect0") before(Joinpoint point)，通過(guò)point.getSignature.getName獲取方法名，與METHOD TYPE MAP的前綴集合比對(duì)，將write/read設(shè)置到當(dāng)前線程上(也是接下來(lái)要執(zhí)行DAO方法的線程，前置增強(qiáng)將其攔截下來(lái)了)
DatasourceHandler,使用ThreadLocal在前置通知中將方法要使用的數(shù)據(jù)源綁定到執(zhí)行該方法的線程上，執(zhí)行方法要獲取數(shù)據(jù)源時(shí)再根據(jù)當(dāng)前線程獲取

3. 負(fù)載均衡

算法

輪詢
加權(quán)輪詢
依據(jù)負(fù)載情況

4. 高可用

為單機(jī)服務(wù)提供一個(gè)冗余機(jī)

心跳檢測(cè)
虛IP
主從復(fù)制

九、典型SQL

1. 線上DDL

為了避免長(zhǎng)時(shí)間表級(jí)鎖定

copy策略,逐行復(fù)制，記錄復(fù)制期間舊表SQL日志重新執(zhí)行
mysq|5.6 online ddl,大大縮短鎖定時(shí)間

2. 批量導(dǎo)入

①. 先禁用索引和約束,導(dǎo)入之后統(tǒng)一建立

②. 避免逐條事務(wù)

innodb為了保證一致性，默認(rèn)為每條SQL加事務(wù)(也是要耗費(fèi)時(shí)間的)，批量導(dǎo)入前應(yīng)手動(dòng)建立事務(wù)，導(dǎo)入完畢后手動(dòng)提交事務(wù)。

3. limit offset,rows

避兔較大的offset (較大頁(yè)碼數(shù))

offset用來(lái)跳過(guò)數(shù)據(jù)，完全可以用過(guò)濾篩選數(shù)據(jù)，而不是查出來(lái)之后再通過(guò)offset跳過(guò)

4. select *

盡量查詢所需字段,減少網(wǎng)絡(luò)傳輸延時(shí)(影響不大)

5. order by rand（）

會(huì)為每條數(shù)據(jù)生成一個(gè)隨機(jī)數(shù)最后根據(jù)隨機(jī)數(shù)排序，可以使用應(yīng)用程序生成隨機(jī)主鍵代替

6. limit 1

如果確定了僅僅檢索一條數(shù)據(jù)，建議都加上limit 1

十、慢查詢?nèi)罩?/h1>
1. 定位查詢效率較低的SQL,針對(duì)性地做優(yōu)化

2. 配置項(xiàng)

開(kāi)啟slow_ query. log

臨界時(shí)間long_ query. time

3. 慢查詢?nèi)罩緯?huì)自己記錄超過(guò)臨界時(shí)間的SQL，并保存在datadir下的xxx-slow.log中

十一、Profile

1. 自動(dòng)記錄每條SQL的執(zhí)行時(shí)間和具體某個(gè)SQL的詳細(xì)步驟花費(fèi)的時(shí)間

2. 配置項(xiàng)日

開(kāi)啟profiling

3. 查看日志信息show profiles

4. 查看具體SQL的詳細(xì)步驟花費(fèi)的時(shí)間日

show profiles for query Query_ ID

十二、典型的服務(wù)器配置

1. max_ connections, 最大客戶端連接數(shù)

2. table_ open_ cache, 表文件緩存句柄數(shù)，加快表文件的讀寫(xiě)

3. key_ buffer. _size, 索引緩存大小

4. innodb_ buffer. pool size, innodb的緩沖池大小，實(shí)現(xiàn)innodb各種功能的前提

5. innodb_ file_ per_ table,每個(gè)表一個(gè)ibd文件，否則innodb共享表空間

十三、壓測(cè)工具M(jìn)ySQLSlap

1. 自動(dòng)生成sq|并執(zhí)行來(lái)測(cè)試性能

myqslap -a-to-generate sql -root -root

2. 并發(fā)測(cè)試

mysqlslap --auto-generate-sql --concurrency= 100 -uroot -proot,模擬100個(gè)客戶端執(zhí)行sql

3. 多輪測(cè)試，反應(yīng)平均情況

mysqlslap --auto-generate-sql --concurrency= 100 --interations=3 -uroot -proot,模擬100個(gè)客戶端執(zhí)行sql.執(zhí)行3輪

4. 存儲(chǔ)引擎測(cè)試

--engine=innodb：mysqlslap --auto-generate-sql --concurrency= 100 --interations=3 -- engine-innodb -uroot -proot,模擬100個(gè)客戶端執(zhí)行sql.執(zhí)行3輪，innodb的處理性能
-- engine= myisam：mysqlslap -- auto-generate-sql --concurrency= 100 --interations=3 --engine-innodb -uroot -proot,模擬100個(gè)客戶端執(zhí)行sql.執(zhí)行3輪，myisam的處理性能