交叉驗證(Cross-validation)是一種常用的機器學(xué)習(xí)模型評估方法,目的是用來驗證機器學(xué)習(xí)模型的泛化能力。在交叉驗證中,將原始數(shù)據(jù)分為訓(xùn)練集和測試集,然后在訓(xùn)練集上訓(xùn)練模型,在測試集上測試模型性能,得到一個測試誤差。重復(fù)這個過程多次,每次選擇不同的訓(xùn)練集和測試集,得到多個測試誤差,最終對這些測試誤差進行平均,作為模型的性能評估指標(biāo)。
交叉驗證的目的是避免模型對某一數(shù)據(jù)集過擬合(Overfitting),即模型在訓(xùn)練數(shù)據(jù)上表現(xiàn)良好,但在測試數(shù)據(jù)上表現(xiàn)很差的情況。通過交叉驗證,可以評估模型的泛化能力,提高模型的魯棒性。常用的交叉驗證方法包括 K-fold 交叉驗證、Leave-one-out 交叉驗證等。