Sa Ou Dwe Konnen Sou Bayesian Spam Filtering

Chache konnen ki jan estatistik ede kenbe bwat resepsyon ou pwòp

Filè Spam Bayesian kalkile pwobabilite pou yon mesaj ke yo te Spam ki baze sou sa li yo. Kontrèman ak filtè kontni ki senp, Bayesian Spam filtraj ap aprann soti nan Spam ak nan bon lapòs, sa ki lakòz yon apwòch trè gaya, adapte ak efikas anti-Spam ki, pi bon nan tout, retounen diman nenpòt positifs fo.

Kijan ou Rekonèt Junk Imèl?

Reflechi sou fason ou detekte spam . Yon gade rapid se souvan ase. Ou konnen ki sa Spam sanble, epi ou konnen ki sa bon lapòs sanble.

Pwobabilite nan Spam kap tankou lapòs bon se alantou ... zewo.

Ki make filtè kontni ki baze sou pa adapte

Èske li pa ta dwe gwo si otomatik filtè Spam te travay tankou sa, tou?

Kontwole filtè Spam ki baze sou kontni eseye jis sa. Yo gade pou mo ak karakteristik lòt tipik nan Spam. Chak eleman karakteristik asiyen yon nòt, epi yon nòt Spam pou mesaj la tout antye kalkile nan nòt endividyèl yo. Gen kèk filtè ki fè nòt tou gade pou karakteristik nan lapòs lejitim, bese nòt final yon mesaj la.

Apwòch filtè yo ap fè travay, men tou li gen dezavantaj plizyè:

Bayesian Spam Filtè Tweak tèt yo, Vin pi bon ak pi bon

Filè Spam Bayesian yo se yon kalite filtè kontni ki baze sou ki baze sou, tou. Apwòch yo ale ak pwoblèm ki genyen nan filtè ki senp nòt Spam, menm si, epi li fè sa radikalman. Depi feblès nan filtè ki fè nòt se nan lis la manyèlman bati nan karakteristik ak nòt yo, se lis sa a elimine.

Olye de sa, filtre Spam Bayesian bati lis la tèt yo. Idealman, ou kòmanse ak yon (gwo) pakèt nan Imèl ke ou te klase kòm Spam, ak yon lòt pakèt moun sou lapòs bon. Filtè yo gade nan tou de ak analize lapòs la lejitim kòm byen ke Spam a kalkile pwobabilite pou divès kalite karakteristik parèt nan Spam, ak nan lapòs bon.

Kijan yon filtre Spam Bayesian egzamine yon imèl

Karakteristik sa yo yon filtre Spam Bayesian ka gade nan ka:

Si yon mo, "Cartesian" pou egzanp, pa janm parèt nan Spam, men souvan nan imel la lejitim ou resevwa, pwobabilite ke "Cartesian" endike Spam se tou pre zewo. "Toner", sou lòt men an, parèt sèlman, e souvan, nan Spam. "Toner" gen yon pwobabilite trè wo pou yo te jwenn nan Spam, pa anpil anba a 1 (100%).

Lè yon nouvo mesaj rive, li analize pa filtre Spam Bayesian, ak pwobabilite pou mesaj konplè ke yo te Spam kalkile lè l sèvi avèk karakteristik endividyèl yo.

Sipoze yon mesaj gen tou de "Cartesian" ak "toner". Soti nan mo sa yo pou kont li li pa toujou klè si nou gen Spam oswa lapòs legi. Lòt karakteristik pral (èspere ke ak pi pwobableman) endike yon pwobabilite ki pèmèt filtè a klasifye mesaj la kòm swa Spam oswa lapòs bon.

Filè Spam Bayesian ka aprann otomatikman

Koulye a, ke nou gen yon klasifikasyon, ka mesaj la dwe itilize nan tren filtre nan tèt li pi lwen. Nan ka sa a, swa pwobabilite nan "Cartesian" ki endike bon lapòs bese (si mesaj la ki gen tou de "Cartesian" ak "toner" yo jwenn yo dwe Spam), oswa pwobabilite pou "toner" ki endike Spam dwe rekonsidere.

Sèvi ak teknik oto-adaptive a, filtè Bayesian ka aprann nan tou de pwòp yo ak desizyon itilizatè a (si li manyèlman korije yon misjudgment pa filtè yo). Adaptabilite nan filtre Bayesian tou asire ke yo pi efikas pou itilizatè a imel endividyèl. Pandan ke pifò moun nan Spam ka gen karakteristik ki sanble, lapòs la lejitim se karakteristik diferan pou tout moun.

Kouman Èske Spammers Jwenn Filè Bayesian sot pase yo?

Karakteristik sa yo nan lapòs lejitim yo se jis kòm enpòtan pou pwosesis la filtre Spam Bayesian kòm Spam la se. Si filtè yo ap fòme espesyalman pou chak itilizatè, spame pral gen yon tan menm pi difisil k ap travay nan filtè Spam tout moun (oswa menm pi fò moun nan), ak filtè yo ka adapte yo nan prèske tout bagay spame eseye.

Spam yo pral sèlman fè li sot pase byen ki antrene filtè Bayesian yo si yo fè mesaj spam yo gade parfe tankou tout imel òdinè a ka jwenn.

Spame pa anjeneral voye tankou Imèl òdinè. Se pou nou asime sa a se paske sa yo Imèl pa travay kòm imel tenten. Se konsa, chans yo se yo pa pral fè li lè òdinè, Imèl raz yo se yon fason a sèlman fè li sot pase filtè Spam.

Si spame yo chanje nan Imèl sitou òdinè-kap, sepandan, nou pral wè yon anpil nan Spam nan Inboxes nou an ankò, ak imèl ka vin tankou fwistre jan li te ye nan pre-Bayesian jou (oswa menm vin pi mal). Li pral tou te pèdi touche mache a pou pifò kalite Spam, menm si, e konsa pa pral dire lontan.

Endikatè fò yo ka yon filtre Spam Bayesian & # 39; s Achilles & # 39; Talon

Youn nan eksepsyon ka vin konnen pou spame yo travay nan wout yo nan filtè Bayesian menm avèk kontni abityèl yo. Li se nan nati a nan Statistik Bayesian ke yon mo oswa karakteristik ki trè souvan parèt nan lapòs bon ka konsa enpòtan kòm yo vire nenpòt mesaj soti nan kap tankou Spam yo te rated kòm janbon pa filtre la.

Si spamè yo jwenn yon fason pou detèmine si ou byen-dife-mo-mo pa-itilize resi retounen HTML pou wè ki mesaj ou louvri, pou egzanp, yo ka gen ladan youn nan yo nan yon lapòs tenten ak rive jwenn ou menm atravè yon byen- ki resevwa fòmasyon Bayesian filtre.

Jan Graham-Cumming te eseye sa a pa kite de filtè Bayesian travay kont youn ak lòt, yon "move" yon sèl adapte a ki mesaj yo jwenn yo jwenn nan fil a "bon". Li di ke li ap travay, menm si pwosesis la se tan konsome ak konplèks. Nou pa panse ke nou pral wè anpil nan sa a pase, omwen pa sou yon gwo echèl, epi yo pa pwepare ak karaktè imel moun yo '. Spammers yo ka (eseye) kalkile kèk mo kle pou òganizasyon (yon bagay tankou "Almaden" pou kèk moun nan IBM petèt?) Olye.

Anjeneral, Spam ap toujou (siyifikativman) diferan de lapòs regilye oswa li pa pral Spam, menm si.

Anba liy lan: Bayesian filtraj fòs pouvwa ka feblès li yo

Filè Spam Bayesian yo se filtè kontni ki baze sou ki: