国产睡熟迷奷白丝护士系列精品,中文色字幕网站,免费h网站在线观看的,亚洲开心激情在线

      <sup id="hb9fh"></sup>
          1. 千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

            手機(jī)站
            千鋒教育

            千鋒學(xué)習(xí)站 | 隨時(shí)隨地免費(fèi)學(xué)

            千鋒教育

            掃一掃進(jìn)入千鋒手機(jī)站

            領(lǐng)取全套視頻
            千鋒教育

            關(guān)注千鋒學(xué)習(xí)站小程序
            隨時(shí)隨地免費(fèi)學(xué)習(xí)課程

            當(dāng)前位置:首頁(yè)  >  技術(shù)干貨  > k-Means聚類(lèi)

            k-Means聚類(lèi)

            來(lái)源:千鋒教育
            發(fā)布人:xqq
            時(shí)間: 2023-12-04 07:50:46 1701647446

            k-Means聚類(lèi)

            1)k-Means聚類(lèi)算法原理k-Means算法接受參數(shù)k,然后將事先輸入的n個(gè)數(shù)據(jù)對(duì)象劃分為k個(gè)聚類(lèi)以便使所獲得的聚類(lèi)滿足:同一聚類(lèi)中的對(duì)象相似度較高;而不同聚類(lèi)中的對(duì)象相似度較小。

            聚類(lèi)相似度是利用各聚類(lèi)中對(duì)象的均值所獲得一個(gè)“中心對(duì)象”(引力中心)來(lái)進(jìn)行計(jì)算的。

            k-Means算法是最為經(jīng)典的基于劃分的聚類(lèi)方法,是十大經(jīng)典數(shù)據(jù)挖掘算法之一。k-Means算法的基本思想是:以空間中k個(gè)點(diǎn)為中心進(jìn)行聚類(lèi),對(duì)最靠近它們的對(duì)象歸類(lèi)。通過(guò)迭代的方法,逐次更新各聚類(lèi)中心的值,直至得到最好的聚類(lèi)結(jié)果。

            假設(shè)要把樣本集分為c個(gè)類(lèi)別,算法描述如下:

            ① 適當(dāng)選擇c個(gè)類(lèi)的初始中心;

            ② 在第k次迭代中,對(duì)任意一個(gè)樣本,求其到c個(gè)中心的距離,將該樣本歸到距離最短的中心所在的類(lèi);

            ③ 利用均值等方法更新該類(lèi)的中心值;

            ④ 對(duì)于所有的c個(gè)聚類(lèi)中心,如果利用②及③的迭代法更新后其值保持不變,則迭代結(jié)束,否則繼續(xù)迭代。

            該算法的較大優(yōu)勢(shì)在于簡(jiǎn)潔和快速。算法的關(guān)鍵在于初始中心的選擇和距離公式。

            2)k-Means聚類(lèi)算法的實(shí)現(xiàn)

            k-Means聚類(lèi)算法的實(shí)現(xiàn)步驟如下。

            (1)參數(shù)input指定待聚類(lèi)的所有數(shù)據(jù)點(diǎn),clusters指定初始聚類(lèi)中心。如果指定參數(shù)k,由org.apache.mahout.clustering.kmeans.RandomSeedGenerator.buildRandom通過(guò)org.apache. hadoop.fs直接從input指定文件中隨機(jī)讀取k個(gè)點(diǎn)放入clusters中。

            (2)根據(jù)原數(shù)據(jù)點(diǎn)和上一次迭代(或初始聚類(lèi))的聚類(lèi)中心計(jì)算本次迭代的聚類(lèi)中心,輸出到clusters-N目錄下。該過(guò)程由org.apache.mahout.clustering.kmeans下的KMeansMapper\KMeansCombiner\KMeansReducer\KMeansDriver實(shí)現(xiàn)。

            ① KMeansMapper:在configure中初始化mapper時(shí)讀入上一次迭代產(chǎn)生或初始聚類(lèi)中心(每個(gè)mapper都讀入所有的聚類(lèi)中心)。map方法對(duì)輸入的每個(gè)點(diǎn)都計(jì)算其最近的距離類(lèi),并加入輸出的key為該點(diǎn)所屬聚類(lèi)ID,value為KMeansInfo實(shí)例,包含點(diǎn)的個(gè)數(shù)和各分量的累加和。

            ② KMeansCombiner:本地累加KMeansMapper輸出的同一聚類(lèi)ID下的點(diǎn)個(gè)數(shù)和各分量的和。

            ③ KMeansReducer:累加同一聚類(lèi)ID下的點(diǎn)個(gè)數(shù)和各分量的和,求本次迭代的聚類(lèi)中心,并根據(jù)輸入Delta判斷該聚類(lèi)是否已收斂。上一次迭代聚類(lèi)中心與本次迭代聚類(lèi)中心距離小于Delta。輸出各聚類(lèi)中心和其是否收斂標(biāo)記。

            ④ KMeansDriver:控制迭代過(guò)程直至超過(guò)較大迭代次數(shù)或所有聚類(lèi)都已收斂每輪迭代后,KMeansDriver讀取其clusters-N目錄下的所有聚類(lèi)。若所有聚類(lèi)已收斂,則整個(gè)k-Means聚類(lèi)過(guò)程收斂了。

            3)k-Means聚類(lèi)算法參數(shù)調(diào)整

            manhout kmeans聚類(lèi)有兩個(gè)重要參數(shù),即收斂Delta和較大迭代次數(shù)。通常情況下,Delta值越小,表示收斂條件越高,因此最終收斂的聚類(lèi)數(shù)可能會(huì)降低,而較大迭代次數(shù)可通過(guò)觀察每次迭代后收斂聚類(lèi)數(shù)決定,當(dāng)收斂聚類(lèi)數(shù)幾乎不再變化或振蕩時(shí)可停止迭代。

            聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
            10年以上業(yè)內(nèi)強(qiáng)師集結(jié),手把手帶你蛻變精英
            請(qǐng)您保持通訊暢通,專(zhuān)屬學(xué)習(xí)老師24小時(shí)內(nèi)將與您1V1溝通
            免費(fèi)領(lǐng)取
            今日已有369人領(lǐng)取成功
            劉同學(xué) 138****2860 剛剛成功領(lǐng)取
            王同學(xué) 131****2015 剛剛成功領(lǐng)取
            張同學(xué) 133****4652 剛剛成功領(lǐng)取
            李同學(xué) 135****8607 剛剛成功領(lǐng)取
            楊同學(xué) 132****5667 剛剛成功領(lǐng)取
            岳同學(xué) 134****6652 剛剛成功領(lǐng)取
            梁同學(xué) 157****2950 剛剛成功領(lǐng)取
            劉同學(xué) 189****1015 剛剛成功領(lǐng)取
            張同學(xué) 155****4678 剛剛成功領(lǐng)取
            鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
            董同學(xué) 138****2867 剛剛成功領(lǐng)取
            周同學(xué) 136****3602 剛剛成功領(lǐng)取
            相關(guān)推薦HOT
            嵌入式培訓(xùn)課程:探索技術(shù)的無(wú)限可能

            近年來(lái),嵌入式系統(tǒng)的廣泛應(yīng)用已經(jīng)深刻改變了我們的生活方式。從智能手機(jī)到智能家居,從汽車(chē)到醫(yī)療設(shè)備,嵌入式技術(shù)已經(jīng)成為現(xiàn)代社會(huì)不可或缺的...詳情>>

            2023-12-12 11:02:35
            嵌入式開(kāi)發(fā):Linux網(wǎng)絡(luò)編程的探索與實(shí)踐

            在當(dāng)今的科技世界中,嵌入式系統(tǒng)已經(jīng)滲透到我們生活的方方面面,從智能手機(jī)、電視、汽車(chē)到醫(yī)療設(shè)備等。而在這些設(shè)備中,Linux網(wǎng)絡(luò)編程扮演著至...詳情>>

            2023-12-12 09:55:55
            Java游戲項(xiàng)目開(kāi)發(fā):技術(shù)概覽與實(shí)踐

            在數(shù)字化世界中,游戲已經(jīng)成為了人們休閑娛樂(lè)的重要方式之一。隨著科技的不斷進(jìn)步,游戲開(kāi)發(fā)行業(yè)也在不斷發(fā)展,而Java作為一門(mén)廣泛使用的編程語(yǔ)...詳情>>

            2023-12-12 08:49:15
            Web前端的基石:HTML

            在數(shù)字化的時(shí)代,網(wǎng)頁(yè)設(shè)計(jì)已經(jīng)成為了一個(gè)重要的領(lǐng)域。而在這個(gè)領(lǐng)域中,HTML(HyperTextMarkupLanguage)無(wú)疑是最基礎(chǔ)、最重要的一環(huán)。它是構(gòu)建...詳情>>

            2023-12-12 08:15:55
            嵌入式開(kāi)發(fā):內(nèi)存分配的方式

            嵌入式系統(tǒng)開(kāi)發(fā)中,內(nèi)存分配是一個(gè)至關(guān)重要的話題。嵌入式系統(tǒng)通常具有有限的內(nèi)存資源,因此合理的內(nèi)存分配方式對(duì)系統(tǒng)的性能和穩(wěn)定性至關(guān)重要。...詳情>>

            2023-12-12 06:35:55
            快速通道