国产睡熟迷奷白丝护士系列精品,中文色字幕网站,免费h网站在线观看的,亚洲开心激情在线

      <sup id="hb9fh"></sup>
          1. 千鋒教育-做有情懷、有良心、有品質的職業(yè)教育機構

            手機站
            千鋒教育

            千鋒學習站 | 隨時隨地免費學

            千鋒教育

            掃一掃進入千鋒手機站

            領取全套視頻
            千鋒教育

            關注千鋒學習站小程序
            隨時隨地免費學習課程

            當前位置:首頁  >  技術干貨  > pythonpandas的5種使用技巧

            pythonpandas的5種使用技巧

            來源:千鋒教育
            發(fā)布人:xqq
            時間: 2023-11-05 18:14:37 1699179277

            Python正迅速成為數據科學家們更為鐘愛的編程語言。形成該現狀的理由非常充分:Python提供了一種覆蓋范圍更為廣闊的編程語言生態(tài)系統(tǒng),以及具有一定計算深度且性能良好的科學計算庫。

            在Python自帶的科學計算庫中,Pandas模塊是最適于數據科學相關操作的工具。本文著重介紹了Python中數據處理的5種方法。

            首先導入相關模塊并加載數據集到Python環(huán)境中:

            importpandasaspd

            importnumpyasnp

            data=pd.read_csv("***.csv",index_col="Loan_ID")

            1、Apply函數

            Apply函數是處理數據和建立新變量的常用函數之一。在向數據框的每一行或每一列傳遞指定函數后,Apply函數會返回相應的值。這個由Apply傳入的函數可以是系統(tǒng)默認的或者用戶自

            defnum_missing(x):

            returnsum(x.isnull())

            #Applyingpercolumn:

            print"Missingvaluespercolumn:"

            printdata.apply(num_missing,axis=0)

            2、填補缺失值

            fillna()函數可一次性完成填補功能。它可以利用所在列的均值/眾數/中位數來替換該列的缺失數據。下面利用“Gender”、“Married”、和“Self_Employed”列中各自的眾數值填補對應列的缺失數據。

            fromscipy.statsimportmode

            mode(data['Gender'])

            3、數據透視表

            Pandas可建立MSExcel類型的數據透視表。例如在下文的代碼段里,關鍵列“LoanAmount”存在缺失值。我們可以根據“Gender”,“Married”和“Self_Employed”分組后的平均金額來替換。“LoanAmount”的各組均值可由如下方法確定

            4、復合索引

            如果您注意觀察#3計算的輸出內容,會發(fā)現它有一個奇怪的性質。即每個索引均由三個數值的組合構成,稱為復合索引。它有助于運算操作的快速進行。

            從#3的例子繼續(xù)開始,已知每個分組數據值但還未進行數據填補。具體的填補方式可結合此前學到的多個技巧來完成。

            fori,rowindata.loc[data['LoanAmount'].isnull(),:].iterrows():

            ind=tuple([row['Gender'],row['Married'],row['Self_Employed']])

            data.loc[i,'LoanAmount']=impute_grps.loc[ind].values[0]

            #Nowcheckthe#missingvaluesagaintoconfirm:

            printdata.apply(num_missing,axis=0)

            5、Crosstab函數

            該函數用于獲取數據的初始印象(直觀視圖),從而驗證一些基本假設。例如在本例中,“Credit_History”被認為會顯著影響貸款狀態(tài)。這個假設可以通過如下代碼生成的交叉表進行驗證:

            pd.crosstab(data["Credit_History"],data["Loan_Status"],margins=True)

            tags: python培訓
            聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
            10年以上業(yè)內強師集結,手把手帶你蛻變精英
            請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
            免費領取
            今日已有369人領取成功
            劉同學 138****2860 剛剛成功領取
            王同學 131****2015 剛剛成功領取
            張同學 133****4652 剛剛成功領取
            李同學 135****8607 剛剛成功領取
            楊同學 132****5667 剛剛成功領取
            岳同學 134****6652 剛剛成功領取
            梁同學 157****2950 剛剛成功領取
            劉同學 189****1015 剛剛成功領取
            張同學 155****4678 剛剛成功領取
            鄒同學 139****2907 剛剛成功領取
            董同學 138****2867 剛剛成功領取
            周同學 136****3602 剛剛成功領取
            相關推薦HOT