Runstoets
De runstoets of Wald-Wolfowitztoets is een verdelingsvrije toets, waarmee men beoordeelt of er een significante trend is te zien in een reeks meetwaarden. Evenals bij de tekentoets, wordt alleen naar de tekens gekeken, waarbij + staat voor een toename en – voor een afname van de meetwaarde ten opzichte van de vorige.
De naam Wald-Wolfowitztoets is afgeleid van de statistici Abraham Wald en Jacob Wolfowitz.
In de reeks meetwaarden wordt gekeken naar de runs. Een run is een opeenvolgende serie gelijke tekens. Bijvoorbeeld, in de reeks
- + + + + – – – + + + – – + + + + + + – – – –
kunnen de volgende zes runs worden onderscheiden:
- (+ + + +) (– – –) (+ + +) (– –) (+ + + + + +) (– – – –)
Een serie tekens wordt geacht toevallig te zijn, als het aantal runs niet te groot en niet te klein is, ten opzichte van het totale aantal plussen en minnen. Het minimale en maximale aantal toegelaten runs kan in een tabel worden opgezocht.
Voorbeelden
bewerkenEen voorbeeld van een reeks met 4 plussen en 5 minnen en twee runs:
- + + + + – – – – –
Volgens de tabel heeft deze reeks te weinig runs om als toevallig beschouwd te worden. De reeks heeft kennelijk een bepaalde regelmatigheid.
Een ander voorbeeld met evenveel plussen en minnen als in het vorige voorbeeld, maar met veel meer runs, is:
- – + – + – + – + –
Dit voorbeeld heeft te veel groepen om als toevallig beschouwd te worden. Ook deze reeks heeft een bepaalde regelmatigheid.
De volgende reeks heeft ook 4 plussen en 5 minnen, waarmee zes runs worden gevormd:
- + + – + – – – + –
In deze reeks is geen regelmatigheid te vinden. Door het vergelijken van het aantal runs met de waarden in de tabel kan worden vastgesteld dat er vermoedelijk onvoldoende bewijs is om aan de toevalligheid van deze reeks te twijfelen.
Verdeling
bewerkenAls de plussen en minnen elkaar volkomen willekeurig opvolgen, vormt het aantal runs R een stochastische variabele met de volgende kansverdeling, waarin het aantal +'en en het aantal –'en voorstelt:
en
Voor de verwachting en de variantie van R geldt:
en
Afleiding van de verdeling
bewerkenEr zijn willekeurige rijtjes van +'en en -'en.
Een rijtje met runs kan als volgt gerealiseerd worden. Het rijtje begint met een run van +'en of met een run van -'en. In beide gevallen zijn er runs met +'en, met mogelijkheden, en ook k runs met -'en, met mogelijkheden.
Een rijtje met runs kan als volgt gerealiseerd worden. Het rijtje begint met een run van +'en of met een run van -'en. Als het begint met +'en, zijn er runs met +'en, met mogelijkheden, en k runs met -'en, met mogelijkheden. Analoog als het rijtje begint met -'en.
Toepassingen
bewerkenRuntoetsen kunnen worden gebruikt voor de volgende toepassingen:
- Om de willekeurigheid (toevalligheid) van een verdeling te toetsen, door de data in de gegeven volgorde te markeren met + als een waarde boven de mediaan is en de rest met -.
- Om te toetsen of een functie (wiskunde) goed op een dataset past, door de waarden die boven de functie liggen te markeren met "+" en de waarden die onder de functie liggen met een "-". Voor deze toepassing is de runstoets, die het teken maar niet de grootte van de afwijking van de waarden in beschouwing neemt, op te vatten als complementair aan de Chi-kwadraattoets, die de grootte van de afwijking gebruikt, maar niet het teken.
De Kolmogorov-Smirnovtoets en de Chi-kwadraattoets zijn krachtiger, maar kunnen in sommige situaties niet worden gebruikt.