Ki sa ki vle di Clustering?

Done min ak algorithm nan k-vle di

K- vle di algorithm clustering a se yon done min ak zouti aprantisaj machin yo itilize obsèvasyon gwoup nan gwoup obsèvasyon ki gen rapò san okenn konesans anvan nan sa yo relasyon. Pa echantiyon, algorithm la eseye montre nan ki kategori, oswa grap, done yo apatni a, ak nimewo a nan grap ke yo te defini nan valè a k.

K - vle di algorithm la se youn nan teknik yo ki pi senp clustering ak li se souvan yo itilize nan medikal D, biometrics, ak jaden ki gen rapò. Avantaj ki genyen nan k- vle di clustering se ke li di sou done ou (lè l sèvi avèk fòm san sipèvize li) olye ke ou gen yo enstwi algorithm a sou done yo nan kòmansman an (lè l sèvi avèk fòm nan sipèvize nan algorithm la).

Li se pafwa refere yo kòm Algorithm Lloyd a, patikilyèman nan ti sèk syans òdinatè paske yo te algorithm nan estanda premye pwopoze pa Stuart Lloyd nan 1957. Tèm nan "k-vle di" te envante nan 1967 pa James McQueen.

Ki jan fonksyon yo algorithm k-vle di

K - vle di algorithm la se yon algorithm evolisyonè ki pwogrè non li soti nan metòd li yo nan operasyon. Algorithm grap obsèvasyon yo nan gwoup k , kote k yo bay kòm yon paramèt opinyon. Li Lè sa a, asiyen chak obsèvasyon grap ki baze sou pwoksimite obsèvasyon an nan vle di nan gwoup la. Gwosè a vle di Lè sa a, recomputed ak pwosesis la kòmanse ankò. Men ki jan algorithm a ap travay:

  1. Algorithm la abitrèman chwazi k pwen kòm sant sa yo grap premye (vle di la).
  2. Chak pwen nan dataset la asiyen nan gwoup la fèmen, ki baze sou distans la euclidean ant chak pwen ak chak sant gwoup.
  3. Chak gwoup grap recomputed kòm mwayèn nan pwen yo nan gwoup sa a.
  4. Etap 2 ak 3 repete jouk grap yo konvèje. Convergence ka defini yon fason diferan selon aplikasyon an, men li nòmalman vle di ke swa pa gen okenn obsèvasyon grap chanje lè etap 2 ak 3 yo repete, oswa ke chanjman yo pa fè yon diferans materyèl nan definisyon an nan grap yo.

Chwazi nimewo a nan grap

Youn nan dezavantaj yo prensipal nan k- vle di gwoupman se lefèt ke ou dwe presize kantite grap kòm yon opinyon algorithm la. Kòm fèt, algorithm la se pa kapab detèmine kantite ki apwopriye a nan grap epi depann sou itilizatè a yo idantifye sa a an davans.

Pou egzanp, si ou te gen yon gwoup moun ki dwe regwoupe ki baze sou idantite gender binè kòm gason oswa fi, rele algorithm nan k- vle di lè l sèvi avèk opinyon k = 3 a ta fòse moun yo nan twa grap lè sèlman de, oswa yon D 'de k = 2, ta bay yon anfòm plis natirèl.

Menm jan tou, si yon gwoup moun yo te fasil regwoupe ki baze sou eta lakay yo epi ou rele algorithm la k- vle di ak opinyon k = 20, rezilta yo ka twò jeneralize yo dwe efikas.

Pou rezon sa a, li souvan yon bon lide fè eksperyans ak valè diferan nan k yo idantifye valè a ki pi bon kostim done ou. Ou menm tou ou ka vle eksplore itilizasyon lòt algoritm min done nan demand ou pou konesans machin-aprann.