Režim (statistiky)
Ve statistikách, režim je hodnota, která nastane nejvíce často v souboru dat nebo rozdělení pravděpodobnosti. V některých polích, pozoruhodně vzdělání, vzorová data jsou často nazývána skóre a režim vzorku je známý jako skóre způsobového slovesa.
Jako statistický zlý a střední, režim je způsob, jak zachytit důležitou informaci o náhodné proměnné nebo populace v jediném velkém množství. Režim je obecně různý od zlý a střední, a smět být velmi odlišný pro silně zkosené distribuce.
Nepřehlédněte: Tato stránka obsahuje strojový překlad textu z anglické encyklopedie Wikipedia. Pokud budou některé pasáže špatně srozumitelné, zkuste se podívat i na text v originále, který najdete pod odkazem Mode (statistics). Překlad byl vytvořen pomocí překladače Eurotran.
Režim není nutně jedinečný od té doby, co stejná maximální frekvence může být dosáhnuta u různých hodnot. Nejdvojznačnější případ se vyskytuje v jednotných distribucích, wherein všechny hodnoty jsou stejně pravděpodobně.
Způsob rozdělení pravděpodobnosti
Způsob jednotlivého rozdělení pravděpodobnosti je hodnota x u kterého jeho funkce pravděpodobnostní míry vezme jeho nejvyšší hodnotu. Jinými slovy, to je hodnota, která nejvíce pravděpodobně je užívána.
Způsob nepřetržitého rozdělení pravděpodobnosti je hodnota x u kterého jeho funkce hustoty pravděpodobnosti dosáhne jeho nejvyšší hodnoty, tak, informally mluvení, režim je na vrcholu.
Jak známý nahoře, režim není nutně jedinečný od té doby, co funkce pravděpodobnostní míry nebo funkce hustoty pravděpodobnosti mohou dosáhnout jeho nejvyšší hodnoty u několika bodů x1, x2, etc.. Když funkce hustoty pravděpodobnosti má rozmanité místní maxima, to je obyčejné odkazovat se na všechny místních maxima jako způsoby distribuce (dokonce ačkoli nahoře definice znamená, že jenom globální maxima jsou režimy). Takový spojité rozdělení je voláno multimodal (jak protichůdný k unimodal).
V symmetric unimodal distribucích, takový jak normální (nebo Gaussian) distribuce (distribuce jehož hustota rozložení, když graphed, dá slavný “křivka zvonku”), zlý (jestliže definovaný), střední a režim všichni splývají. Pro vzorky, jestliže to je znáno že oni jsou kresleni od distribuce symmetric, vzorek zlý moci být používán jako odhad režimu populace.
Způsob vzorku
Způsob vzorku dat je element, který nastane nejvíce často ve sbírce. Například, způsob vzorku [1, 3, 6, 6, 6, 6, 7, 7, 12, 12, 17] je 6. Daný seznam dat [1, 1, 2, 4, 4] režim není jedinečný, na rozdíl od aritmetiky zlý.
Pro vzorek od spojitého rozdělení, takový jak [0.935..., 1.211..., 2.430..., 3.668..., 3.874...], pojetí je nepoužitelné v jeho surové formě od té doby, co každá cena bude se udávat přesně jednou. Běžná praxe má discretize data tím, že zadá hodnoty stejně vzdáleným pauzám, jak pro dělat histogram, účinně nahrazovat hodnoty midpoints pauz oni jsou přiřazeni k. Režim je pak hodnota kde histogram dosáhne jeho vrcholu. Pro malý nebo středně velké vzorky výsledek této procedury je citlivý na volbu šířky pauzy jestliže volený příliš úzký nebo příliš široký; typicky jeden by měl mít značný zlomek dat soustředěných v relativně malém množství pauz (5 k 10), zatímco zlomek klesání dat u těchto pauz je také značný. Střídavý přístup je jádrový hustotní názor, který nezbytně rozmaže vzorky bodu produkovat nepřetržitý odhad funkce hustoty pravděpodobnosti, která může poskytovat odhad režimu.
Srovnání zlý, střední a režim
Pro rozdělení pravděpodobnosti, zlý je také nazýván finančním efektem náhodné proměnné. Pro vzorek dat, zlý je také volal průměr.
Kdy tyto míry dávají smysl?
Unlike zlý a střední, představa o režimu také dává smysl pro “nominální data” (tj., ne sestávat z numerických hodnot). Například, brát vzorek korejských příjmení, jeden by mohl shledat, že “Kim” nastane více často než nějaké jiné jméno. Pak “Kim” by mohl být nazýván způsobem vzorku. Nicméně, toto použití není obyčejné.
Unlike střední, pojetí zlý dává smysl pro nějakou náhodnou proměnnou předpokládat hodnoty od vektorového prostoru, včetně reálných čísel (jednorozměrný vektorový prostor) a celá čísla (který může být zvažován vložený v reals). Například, distribuce důvodů k vůli letadla typicky mít zlý a režim, ale představa o středních laních ne platit. Střední dává smysl když tam je lineární objednávka na možných hodnotách.
Jedinečnost a definedness
Pro zbytek, předpoklad je že my máme (vzorek) skutečný-cenil náhodnou proměnnou.
Pro některá rozdělení pravděpodobnosti, předpokládaná hodnota může být nekonečná nebo undefined, ale jestliže definovaný, to je jedinečné. Průměr (konečného) vzorku je vždy definován. Střední je hodnota taková to zlomky ne překonávat to a ne klesnout pod to jsou oba přinejmenším 1/2. To není nutně jedinečné, ale nikdy nekonečný nebo totálně undefined. Pro vzorek dat to je “poloviční” hodnota, když seznam hodnot je organizován ve zvyšování hodnoty, kde obvykle pro seznam vyrovnat délku numerický průměr je vzat dvou hodnot nejblíže k “uprostřed”. Konečně, jak říkal dříve, režim není nutně jedinečný. Jisté patologické distribuce (například, Cantor distribuce) mít žádný definovaný režim vůbec. Pro konečný datový vzorek, režim je jeden (nebo více) hodnot ve vzorku.
Vlastnosti
Předpokládat definedness, a pro jedinečnost jednoduchosti, pokračování jsou některé ty nejzajímavější vlastnosti.
- Všechny tři míry mají následující vlastnost: Jestliže náhodná proměnná (nebo každá hodnota od vzorku) je vystaven k lineární nebo affine transformaci který nahradí X sekyrou + b, tak být zlý, střední a režim.
- Nicméně, jestliže tam je libovolná monotonic transformace, jediný střední následuje; například, jestliže X je nahrazený exp (X), střední změny od m exp (m) ale zlý a vůle režimu ne.
- Kromě pro extrémně malé vzorky, režim je necitlivý k “outliers” (takový jak příležitostný, vzácný, falešné experimentální četby). Střední je také velmi robustní v přítomnosti outliers, zatímco zlý je poněkud citlivý.
- Ve spojitých unimodal distribucích střední lži, jako orientační pravidlo, mezi zlý a režim, o jedné třetině cesty běžný od zlý na režim. V rovnici, střední? (2 × zlý + režim) / 3. Toto pravidlo, kvůli Karlovi Pearsonovi, je nicméně ne vždy pravdivý a tři statistiky mohou objevit se v nějaké objednávce. [1] to často žádá mírně non-distribuce symmetric, které se podobají normální distribuci.
Příklad pro asymetrické rozdělení
Známý příklad asymetrického rozdělení je osobní bohatství: Páry lidí jsou velmi bohaté, ale mezi ty někteří jsou extrémně bohatí. Nicméně, mnoho být poněkud chudý.
Známá třída distribucí, které mohou být libovolně překrouceny je dána žurnálem-normální distribuce. To je získáno tím, že změní náhodnou proměnnou X mít normální distribuci do náhodné proměnné Y = exp (X). Pak logaritmus náhodné proměnné Y je normálně distribuovaný, proto jméno.
Brát zlý? X být 0, střední Y bude být 1, nezávislý na standardní odchylce? X. toto je tak protože X má distribuce symmetric, tak jeho střední je také 0. Transformace od X k Y monotonic, a tak my najdeme střední exp (0) = 1 pro Y.
Když X má standardní odchylka? = 0.2, distribuce Y je ne velmi zkosený. My objevíme (vidět pod žurnálem-normální distribuce), s hodnotami obejitými ke čtyřem číslicím:
- zlý = 1.0202
- režim = 0.9608
Opravdu, střední je o jedné třetině na cestě od zlý na režim.
Když X má mnohem větší směrodatná odchylka,? = 5, distribuce Y je silně zkosený. Nyní
- zlý = 7.3891
- režim = 0.0183
Tady, Pearsonovo orientační pravidlo propadne.
Viz též
- funkce unimodal
- souhrnné statistiky
- popisná statistika
- centrální tendence
- argument maximální
- moment (matematika)
Odkazy
- Paul T. von Hippel. Zlý, střední, a překroutit: Opravovat pravidlo učebnice. J. vzdělání statistik 13: 2 (2005)