Cilat janë të metat e imputimit të vlerave që mungojnë me mesataren?

Përmbajtje:

Cilat janë të metat e imputimit të vlerave që mungojnë me mesataren?
Cilat janë të metat e imputimit të vlerave që mungojnë me mesataren?

Video: Cilat janë të metat e imputimit të vlerave që mungojnë me mesataren?

Video: Cilat janë të metat e imputimit të vlerave që mungojnë me mesataren?
Video: Cilat janë përparësitë dhe të metat e metodës së mikroinjetkimit krahasuar me metodën... 2024, Dhjetor
Anonim

Përcaktimi mesatar shtrembëron marrëdhëniet ndërmjet variablave Por imputimi mesatar shtrembëron gjithashtu marrëdhëniet me shumë variacione dhe ndikon në statistika të tilla si korrelacioni. Për shembull, thirrja e mëposhtme për PROC CORR llogarit korrelacionin midis ndryshores Orig_Height dhe variablave Weight dhe Age.

Pse përdorimi i një mjeti për të dhënat që mungojnë është një ide e keqe?

Mesatarja zvogëlon një variancë të të dhënave Duke shkuar më thellë në matematikë, një variancë më e vogël çon në intervalin më të ngushtë të besimit në shpërndarjen e probabilitetit[3]. Kjo nuk çon në asgjë tjetër veçse të prezantojmë një paragjykim ndaj modelit tonë.

Pse vlerat që mungojnë janë problem?

Të dhënat që mungojnë paraqesin probleme të ndryshme. Së pari, mungesa e të dhënave redukton fuqinë statistikore, që i referohet probabilitetit që testi të refuzojë hipotezën zero kur ajo është e rreme. Së dyti, të dhënat e humbura mund të shkaktojnë paragjykime në vlerësimin e parametrave. Së treti, mund të zvogëlojë përfaqësimin e mostrave.

Pse është i keq imputimi mesatar?

Problemi 1: Mesatarja imputimi nuk ruan marrëdhëniet midis variablave. Vërtetë, imputimi i mesatares ruan mesataren e të dhënave të vëzhguara. Pra, nëse të dhënat mungojnë plotësisht në mënyrë të rastësishme, vlerësimi i mesatares mbetet i paanshëm.

A duhet të zëvendësoni të dhënat që mungojnë me mesataren?

Pikat e të dhënave të jashtme do të kenë një ndikim të rëndësishëm në mesataren dhe për këtë arsye, në raste të tilla, nuk rekomandohet përdorimi i mesatares për zëvendësimin e vlerave që mungojnë. Përdorimi i vlerave mesatare për zëvendësimin e vlerave që mungojnë mund të mos krijojë një model të shkëlqyeshëm dhe kështu të përjashtohet.

Recommended: