一、mysql為什么需要undo log
MySQL是原地更新記錄的,事務(wù)的更新是直接作用到舊有記錄,舊有記錄被寫到undo。同時(shí),它又是steal的,意味著未提交的數(shù)據(jù)可以被持久化。undo有兩個(gè)作用,名列前茅,必須要有辦法找回舊記錄以回滾事務(wù)。同時(shí),需要保存舊記錄實(shí)現(xiàn)多版本。
當(dāng)然,沒有undo的數(shù)據(jù)庫也有,比如PostgreSQL。它不會(huì)原地更新,更新就是插入一個(gè)新版本。當(dāng)然,這樣做的代價(jià)是浪費(fèi)空間,失效記錄太多了就會(huì)影響效率,需要定期的垃圾回收。
在InnoDB中,有三種日志跟事務(wù)的ACID關(guān)系都很大:
undo log負(fù)責(zé)原子性,保護(hù)事務(wù)在exception或手動(dòng)rollback時(shí)可以回滾到歷史版本數(shù)據(jù)redo log負(fù)責(zé)落盤式持久性,保證事務(wù)提交后新的數(shù)據(jù)不會(huì)丟失binlog負(fù)責(zé)副本式持久性,可以將主節(jié)點(diǎn)上的數(shù)據(jù)復(fù)制到從節(jié)點(diǎn),主節(jié)點(diǎn)crash后業(yè)務(wù)可以正常運(yùn)轉(zhuǎn)可以看到,undo log只關(guān)心過去,redo log只關(guān)心未來
如果我們只記錄一個(gè)歷史版本數(shù)據(jù),其它事務(wù)每次都只需要讀取到最新版本的數(shù)據(jù),的確是這樣,這個(gè)就是Read Committed
但是,如果說你要備份整個(gè)數(shù)據(jù)庫,整個(gè)事務(wù)可能會(huì)持續(xù)一個(gè)小時(shí),同時(shí)有大量線上并發(fā)修改操作,我相信你一定希望讀取到邏輯一致的數(shù)據(jù)。這時(shí)同一行數(shù)據(jù)就需要支持多個(gè)歷史版本的數(shù)據(jù)了,這一招叫MVCC,對(duì)應(yīng)Repeatable Read隔離級(jí)別,而記錄多個(gè)歷史版本數(shù)據(jù)的地方就叫undo log
實(shí)踐中,對(duì)于面向個(gè)人業(yè)務(wù)的互聯(lián)網(wǎng)在線業(yè)務(wù),推薦Read Committed;對(duì)于分析性業(yè)務(wù),推薦Repeatable Read(InnoDB的默認(rèn)事務(wù)隔離級(jí)別)
InnoDB將undo log作為數(shù)據(jù)的一部分存儲(chǔ)到了redo log中,因此很多時(shí)候不太區(qū)分它們。
延伸閱讀:
二、undo log的工作原理
在更新數(shù)據(jù)之前,MySQL會(huì)提前生成undo log日志,當(dāng)事務(wù)提交的時(shí)候,并不會(huì)立即刪除undo log,因?yàn)楹竺婵赡苄枰M(jìn)行回滾操作,要執(zhí)行回滾(rollback)操作時(shí),從緩存中讀取數(shù)據(jù)。undo log日志的刪除是通過通過后臺(tái)purge線程進(jìn)行回收處理的。
1、事務(wù)A執(zhí)行update操作,此時(shí)事務(wù)還沒提交,會(huì)將數(shù)據(jù)進(jìn)行備份到對(duì)應(yīng)的undo buffer,然后由undo buffer持久化到磁盤中的undo log文件中,此時(shí)undo log保存了未提交之前的操作日志,接著將操作的數(shù)據(jù),也就是Teacher表的數(shù)據(jù)持久保存到InnoDB的數(shù)據(jù)文件IBD。
2、此時(shí)事務(wù)B進(jìn)行查詢操作,直接從undo buffer緩存中進(jìn)行讀取,這時(shí)事務(wù)A還沒提交事務(wù),如果要回滾(rollback)事務(wù),是不讀磁盤的,先直接從undo buffer緩存讀取。