Avíza

Čo je Chebyshevova nerovnosť?

Čo je Chebyshevova nerovnosť?

Chebyshevova nerovnosť hovorí, že aspoň 1-1 /K2 údajov zo vzorky musia spadať K štandardné odchýlky od priemeru (tu) K je akékoľvek kladné reálne číslo väčšie ako jedno).

Akákoľvek množina údajov, ktorá je bežne distribuovaná alebo má tvar zvonovej krivky, má niekoľko funkcií. Jeden z nich sa zaoberá šírením údajov vo vzťahu k počtu štandardných odchýlok od priemeru. Pri normálnom rozdelení vieme, že 68% údajov predstavuje jednu štandardnú odchýlku od priemeru, 95% sú dve štandardné odchýlky od priemeru a približne 99% je v rámci troch štandardných odchýlok od priemeru.

Ak však dátový súbor nie je distribuovaný v tvare zvonovej krivky, môže sa v rámci jednej štandardnej odchýlky pohybovať iné množstvo. Chebyshevova nerovnosť poskytuje spôsob, ako zistiť, do ktorej časti údajov spadá K štandardné odchýlky od priemeru pre akýkoľvek súbor údajov.

Fakty o nerovnosti

Vyššie uvedenú nerovnosť môžeme konštatovať aj nahradením vety „údaje zo vzorky“ rozdelením pravdepodobnosti. Je to preto, že Chebyshevova nerovnosť je výsledkom pravdepodobnosti, ktorá sa potom môže uplatniť na štatistiku.

Je dôležité poznamenať, že táto nerovnosť je výsledkom, ktorý sa preukázal matematicky. Nie je to ako empirický vzťah medzi priemerom a režimom alebo pravidlom, ktoré spája rozsah a štandardnú odchýlku.

Ilustrácia nerovnosti

Na ilustráciu nerovnosti sa na ňu pozrieme na niekoľko hodnôt K:

  • pre K = 2 máme 1 - 1 /K2 = 1 - 1/4 = 3/4 = 75%. Chebyshevova nerovnosť teda hovorí, že najmenej 75% údajových hodnôt akejkoľvek distribúcie musí byť v rámci dvoch štandardných odchýlok od priemeru.
  • pre K = 3 máme 1 - 1 /K2 = 1 - 1/9 = 8/9 = 89%. Chebyshevova nerovnosť teda hovorí, že najmenej 89% dátových hodnôt akejkoľvek distribúcie musí byť v rámci troch štandardných odchýlok od priemeru.
  • pre K = 4 máme 1 - 1 /K2 = 1 - 1/16 = 15/16 = 93,75%. Chebyshevova nerovnosť teda hovorí, že najmenej 93,75% dátových hodnôt akejkoľvek distribúcie musí byť v rámci dvoch štandardných odchýlok od priemeru.

Príklad

Predpokladajme, že sme odobrali vzorky hmotnosti psov v miestnom útulku pre zvieratá a zistili sme, že naša vzorka má priemer 20 libier so štandardnou odchýlkou ​​3 libry. S použitím Chebyshevovej nerovnosti vieme, že najmenej 75% psov, z ktorých sme odobrali vzorky, má závažia, ktoré sú dvoma štandardnými odchýlkami od priemeru. Dvojnásobok štandardnej odchýlky nám dáva 2 x 3 = 6. Odpočítajte a pridajte túto hodnotu od priemeru 20. To znamená, že 75% psov má hmotnosť od 14 libier do 26 libier.

Použitie nerovnosti

Ak vieme viac o distribúcii, s ktorou pracujeme, potom zvyčajne môžeme zaručiť, že viac údajov je určitý počet štandardných odchýlok od priemeru. Napríklad, ak vieme, že máme normálne rozdelenie, potom 95% údajov sú dve štandardné odchýlky od priemeru. Chebyshevova nerovnosť hovorí, že v tejto situácii to vieme najmenej 75% údajov sú dve štandardné odchýlky od priemeru. Ako vidíme v tomto prípade, mohlo by to byť oveľa viac ako 75%.

Hodnota nerovnosti spočíva v tom, že nám poskytuje scenár „horšieho prípadu“, v ktorom jediné, čo vieme o našich vzorkách (alebo rozdelení pravdepodobnosti), je priemer a štandardná odchýlka. Keď o našich údajoch nevieme nič iné, Chebyshevova nerovnosť poskytuje ďalší pohľad na to, ako je súbor údajov rozšírený.

História nerovnosti

Nerovnosť je pomenovaná po ruskom matematikovi Pafnutom Chebyshevovi, ktorý prvýkrát uviedol nerovnosť bez dôkazu v roku 1874. O desať rokov neskôr túto nerovnosť dokázal Markov vo svojom Ph.D. dizertačnej práce. Kvôli rozdielom v spôsobe, ako reprezentovať ruskú abecedu v angličtine, je Chebyshev tiež označovaný ako Tchebysheff.