• 2024-07-01

Pojednostavljivanje podataka Definicija i primjer

📣 MISLAV ORŠIĆ ⚽ ŽIVOTNA PRIČA

📣 MISLAV ORŠIĆ ⚽ ŽIVOTNA PRIČA

Sadržaj:

Anonim

Što je to:

Izjednačavanje podataka je statistička tehnika koja uključuje uklanjanje outliera iz skupa podataka kako bi obrazac je vidljiviji.

Kako funkcionira (primjer):

Na primjer, recimo da sveučilište analizira podatke o zločinu tijekom proteklih 10 godina. Broj nasilnih zločina izgleda ovako:

Kao što možete vidjeti, većinu vremena sveučilište doživljava manje od 15 zločina godišnje. Međutim, u 2006. i 2007. godini došlo je do 44 zbog eksperimentalnih zahtjeva za izvješćivanjem sveučilišnog tima za javnu sigurnost. Eksperimentalni izvještaj promijenio je definiciju nasilnog zločina da uključi krađe bilo koje vrste tijekom tih godina, što je stvorilo veliki skok u broju "nasilnih" zločina na kampusu. Ukoliko ove godine uključujemo u prosjek - tj. Ako učinimo nešto za izravnavanje podataka - sveučilište je godišnje imalo prosječno oko 19 nasilnih zločina. Ali ako napustimo one godine, možemo vidjeti da je realniji prosjek 13 nasilnih zločina godišnje - razlika od 32%.

Zašto je to važno:

Postoji mnogo načina za glatke podatke, uključujući i kretanje prosjeci i algoritmi. Ideja je da zaglađivanje podataka čini obrasce više vidljivim i time pomaže u predviđanju promjena cijena dionica, trendova kupaca ili bilo kojeg drugog poslovnog informiranja. Međutim, zaglađivanje podataka može zanemariti ključne informacije ili učiniti važne činjenice manje vidljivima; drugim riječima, "zaokruživanje rubova" podataka može prenaglasiti određene podatke i ignorirati druge podatke.