Middelen maar.

Enige eeuwen terug bewees Gauss al dat de beste wijze voor waarde bepaling van random-data het gemiddelde is.
Dat is dan ook één van de redenen waarom gemiddelden veel gebruikt worden in de technische analyse.
Een ieder heeft ze zitten in zijn technische analyse pakket --> gemiddelden, ook wel moving-averages of kortweg MA genoemd.
Meestal heeft men de keuze uit een eenvoudig-MA, een gewogen-MA of een Exponential-MA.
Elke MA heeft zo zijn specifieke eigenschappen wat betreft de wijze van berekening, de wijze van lag en de manier van filtering.
Omdat de koersgrafiek is opgebouwd uit allemaal sinusgolven van verschillende frequentie en amplitude welke ook onderling nog weer verschillen in fase zullen we de specifieke eigenschappen voor elk type MA bekijken vanuit een sinusvorm -golf.
U ziet deze sinus in figuur 1.
Figuur 1:

We pakken uit deze sinusgolf serie even één complete cyclus en kleuren deze even geel, waarna u het resultaat ziet in figuur 2.
Figuur 2:

Het aantal koersbars waaruit deze sinus is opgebouwd kunt u "aflezen" aan het aantal witte stippen op de 0-lijn.
Als u de moeite neemt zult u ontdekken dat het er 30 zijn, dus één complete cyclus is dertig perioden.
*
In onderstaand artikeltje zullen we vervolgens de eigenschappen gaan bekijken voor bovengenoemde typen gemiddelden en we zullen er nog een andere manier van middeling / filtering  bijpakken, de Median.
.
Het eenvoudig gemiddelde.
We zullen nu als eerste deze sinus gaan bekijken door middel van een eenvoudig -MA , ook wel SMA of kortweg MA genoemd.
SMA staat voor Simple Moving Average.
Een SMA berekent de gemiddelde waarde door elke koerswaarde op te tellen en dan te delen door het aantal koerswaarden, een berekening waarbij elk record of koerswaarde even zwaar weegt.
We gaan dit even doen voor een eenvoudig-MA waarbij wordt gerekend met 15 koersbars, een zogenaamd MA-15 en we bekijken dit voor de positieve helft van de cyclus.
De uitkomst ziet u weergegeven in figuur 3.
Figuur 3:

De positieve helft van de cyclus is geel ingekleurd.
De MA-15 is rood weergegeven.
.
Waarom nemen we een MA over 15-perioden?
Wel, 15 perioden beslaan het totale positieve gedeelte van de cyclus.
Zouden we bijvoorbeeld twintig perioden nemen in de berekening van de MA, dat zitten er negatieve waarden van de sinus bij die de berekening beïnvloeden, waarden welke buiten het geel -gekleurde gedeelte van de sinus liggen.
Zouden we bijvoorbeeld 10 perioden nemen dan worden niet alle waarden van het gele gekleurde sinus gedeelte meegenomen in de berekening.
MA-15 dus.
.
We zien dat de rode MA-15 keurig de sinusvorm volgt, er vallen echter een paar dingen op:
De gele sinus vormt de hoogste waarde bij de gele A, maar de MA-15 doet dit pas later bij de rode B.
Aan het aantal periode -stippen op de nullijn kunt u tellen dat de rode top B zeven stippen later wordt gevormd dan de gele top A.
De rode MA-15 lijn loopt dus 7 perioden achter op de sinus lijn.
De lag voor een eenvoudig-MA is dan de lengte van de MA minus 1, gedeeld door 2.
Lag = (15-1) /2 = 14/2 --> 7.
.
Vanuit mijn stukje Cyclus weet u van figuur 5 in dat stukje dat een volledige cyclus  360 graden is.
In figuur 4 ziet u de figuur waar ik naar verwijs.
Figuur 4:

Terug naar figuur 2 en figuur 3 hierboven geeft dan het volgende:
* Een volledige cyclus zoals te zien in figuur 2  is 360 graden.
* Het gele positieve gedeelte in figuur 3 is dan 180 graden.
We zien dat de rode top B wordt gevormd wanneer de gele sinus door 0 gaat.
Dat is dus 90 graden (180-90) later.
De rode MA-15 loopt dus 90 graden achter de sinusgolf aan, dus de MA is een negatieve cosinus golf.
.
Wat ook opvalt is de lagere amplitude van de MA-15.
Ik kom er bij de frequentie filtering van de MA nog even op terug, maar de amplitude van MA is   2/Pi  van de amplitude van de Sinus.
Dit is een waarde om rekening mee te houden bij gecompliceerde indicators.
.
Wat gebeurt er nu wanneer we de MA korter nemen dan 15 perioden, dus bewust een verkeerde sample keuze maken?
Dat zien we in figuur 5.
Figuur 5:

We zien twee afwijkingen ontstaan.
Ten eerste voldoet de lag niet meer aan de formule, dus er ontstaat een niet bekende lag hetgeen lastig is voor juiste berekeningen.
Verder neemt de amplitude van de MA toe, en voldoet ook niet meer aan de berekende waarde van 2/Pi.
Door de verkeerde keuze ontstaat er dus een niet van te voren bekende vervorming van de MA, dus er kan al snel een mis -interpretatie van de gegevens ontstaan.
Fout dus.
.
Laten we dan eens een langere MA nemen dan de juiste sample periode, bijvoorbeeld een MA-20.
Figuur 6:

We zien nu dat het tegenover gestelde ontstaat van de keuze van een te korte periode van de MA.
De te lange sample periode van 20 zorgt ervoor dat de lag toeneemt en de amplitude van de MA afneemt.
Fout dus.
.
Laten we nu eens in figuur 2 , waarin een volledige cyclus te zien is, een trendlijn trekken.
Het is niet moeilijk voor te stellen, dat deze trendlijn exact op de nullijn zal liggen, immers in een volledige cyclus hebben we net zoveel positieve waarden als negatieve waarden.
Laten we nu eens een eenvoudige MA nemen over de cyclus periode, dus dertig perioden, dus een MA-30.
Deze MA-30 ziet u in figuur 7.
Figuur 7:

Ja, kijkt u nog maar eens goed ;) , de MA-30 is een nullijn geworden in de grafiek met de 30-perioden Sinus.
Als conclusie kan dus worden getrokken dat een MA met de waarde gelijk aan het aantal perioden van de cyclus een trendlijn is.
Een MA met de lengte instelling gelijk aan het aantal perioden van de cyclus verwijdert de cyclus, en laat de trend achter.
.
Als basis ziet u hier de ingrediënten voor een soort van handel systeem:, koop wanneer het gemiddelde ( MA-15) door de trendlijn heen stijgt (MA-30)  of verkoop wanneer het gemiddelde (MA-15) doorheen de trendlijn daalt (MA-30).
.
Ik noemde het al hierboven, een MA  heeft ook een filter functie.
We gaan daar de volgende keer even mee verder, maar alvast even een voorproefje.
Figuur 8:

In figuur 8 is de groene lijn de koersgrafiek, en de gele lijn een willekeurig gekozen eenvoudig gemiddelde van 13 perioden.
De groene lijn heeft een grillig koersverloop; waarin we snelle wisselingen zien omhoog en omlaag.
Deze snelle wisselingen zijn hogere frequenties.
In de gele gemiddelde lijn ontbreken deze snelle wisselingen, waaruit we in eerste instantie al mogen concluderen dat een gemiddelde de hogere frequenties niet of minder doorlaat (dempt) en de lagere frequenties wel doorlaat.
Dit wordt een lowpass filter genoemd.
*
In figuur 9 ziet u een plaatje welke ik even van Dhr. Ehlers geleend heb.
Figuur 9:

De grafiek is gemaakt voor een periode van P=12 met een SMA=12
Op de horizontale as zien we de frequentie weergegeven, en op de verticale as de demping.
De horizontale as behoeft waarschijnlijk enige uitleg.
In de grafiek is weergegeven de "normalized frequency"
Het is zo, dat in deze wijze van grafiek weergave de hoogst haalbare frequentie wordt weergegeven als Nyquist=1.
De snelste wisseling (hoogste frequentie) welke we kunnen hebben in een koersgrafiek bestaat uit twee koersbars.
U ziet dat ook weergegeven als P=2, en dat is dan Nyquist 1.
Neemt de wisseling meer koers-bars in beslag, dan wordt de frequentie lager en de Nyquist waarde dus ook.
Zo is bij een periode welke vier koers-bars in beslag neemt de Nyquist = 0,5.
En bij een sinus die twaalf perioden in beslag neemt (bovenstaande grafiek) is dit 0,166... .
Mag u allemaal voor even vergeten, waar het omdraait is dat de demping met een SMA-12 bij 12 perioden maximaal is, in bovenstaande grafiek ziet u dat dit pakweg 50 dB is, en dat is behoorlijk veel indien u bedenkt dat een demping van 3 dB al een halvering  van de output betekent.
We zagen dat al in figuur 7, bij een gemeten periode van 30 voor de sinus en een SMA-30, lag de amplitude van de SMA op  0.
In figuur 9 ziet u dat dan voor een periode van de sinus voor 12 met een SMA-12.
.
Wat zien we nog meer in figuur 9:
We zien dat de demping bij de helft van P=12, dus een SMA=6 ofwel de helft van de periode, vrij laag is.
We zagen dat ook al in bovenstaande grafieken, immers de amplitude van de SMA-sinus was gelijk aan   2/Pi ~0,64 bij een SMA=15 voor een Periode=30.
.
Er valt nog iets op in bovenstaande grafiek.
Na het dieptepunt bij P=12, valt de demping weer gedeeltelijk terug, maar is weer maximaal bij P=6.
U ziet trouwens dat de demping steeds iets hoger wordt naarmate de frequentie toeneemt.
.
Diegene die de code hebben aangevraagd, kunnen dit eenvoudig controleren.
Zet de SMA bijvoorbeeld op 60 bij een periode=30 en dan zult u ook zien dat de demping maximaal is, ofwel u ziet weer een trendlijn.
Wanneer u dit doet via het parametervenster, zult u ook zien dat bij de tussenliggende waarden de oorspronkelijke amplitude niet meer wordt gehaald.
.
De overige zaken die opvallen in bovenstaande grafieken behandel ik in een ander stukje, de fase verschillen welke optreden zijn namelijk ook heel interessant maar vallen echter een beetje buiten het bestek van dit MA-stukje.
.
Wat u uit bovenstaande moet onthouden, is dat u niet zomaar willekeurig een waarde voor de te gebruiken SMA-periode moet kiezen.
Bij een "ongelukkige keuze" krijgt u een enorme vervorming/verzwakking van het output signaal, waardoor u zichzelf in feite voor de gek houdt.
Kies altijd een SMA gerelateerd aan de gemeten periode.
Verder ziet u dat hogere frequenties / snelle wisselingen van de koers / een steeds grotere demping ondervinden naarmate de frequentie toeneemt, terwijl lage frequenties nagenoeg geen demping ondervinden, dus de lage frequenties worden zonder teveel demping doorgelaten waardoor de SMA valt onder de "Low pass" filters.
***
**
*
Het gewogen gemiddelde.
In diverse TA programma's vindt u deze MA terug onder de naam WMA welke afkorting afkomstig is van Weighted Moving Average.
Bij de SMA hadden alle records waarover de SMA werd berekent een gelijke inbreng in het geheel, wat weging wordt genoemd.
Bij de WMA wordt de invloed van een record minder naarmate deze verdere terug ligt in de tijd.
Zou je bijvoorbeeld een WMA nemen over drie records, dan neem je 1X de waarde van het oudste record, 2X waarde van het opvolgende record en 3X de waarde van het laatste record, waarna je de optelsom deelt door 6.
Een licht andere samenstelling is natuurlijk ook mogelijk indien u bepaalde correcties wilt aanbrengen, maar onderstaand gaan we even uit van de standaard WMA.
Laten we eens zo'n WMA in de grafiek met de Sinus plaatsen zoals in bovenstaande voorbeelden is gebeurd met de SMA.
Figuur 10:

Duidelijk is te zien dat de blauwe top B naijlt op de gele top A.
Het is in deze grafiek iets moeilijker te tellen dan in het geval van de SMA, maar de blauwe top B ijlt 4,67 records na op de gele top A.
Het aantal na te ijlen records kunt u bereken met behulp van de formule door van de waarde van WMA er 1 af te trekken en daarna te delen door 3.
In dit geval is dat dan (15-1)/3 --> 4,67.
We kunnen dit vergelijken met de SMA-15 door deze even tegelijk met de WMA in de grafiek te plaatsen.
Figuur 11:

Duidelijk is te zien in figuur 11 dat de WMA minder naijlt dan de SMA, dus de WMA reageert sneller dan de SMA.
We zien echter ook iets anders.
De amplitude van de WMA is groter dan die van de SMA.
De mate van demping van de WMA is  dus anders dan die van de SMA.
Laten we eens kijken, wat er gebeurt wanneer we de instelling van de WMA plaatsen op de waarde van het aantal perioden, dus de waarde 30.
Figuur 12:

We zien een opmerkelijk verschil ten opzichte van de SMA-30 in grafiek 7.
In grafiek 7 werd de SMA-30 een trendlijn doordat de cyclus was verwijderd maar in figuur 12 zien we dat de demping groter geworden is, maar dus niet zo groot als in figuur 7.
Verder valt op dat de lag niet meer voldoet aan de eerder gegeven formule (n-1)/3.   ( n- de SMA waarde)
Immers de lag zou dan(  30-1)/3 --> zou 9,7 eenheden moeten zijn, in grafiek 12 telt u er echter 7.
De lag loopt dus niet helemaal lineair met het aantal gemeten perioden, echter bij lagere waarden klopt de gegeven formule vrij goed.
.
In figuur 13 ziet u de frequentie respons van een WMA-4.
Figuur 13:

Wanneer u deze vergelijkt met de frequentie respons van de SMA ( figuur 9) dan ziet u dat deze totaal anders verloopt.
Goed is te zien dat ook de WMA een laag doorlaat filter is, immers lagere frequentie worden met weinig demping doorgelaten.
Als belangrijk punt wordt meestal het -3dB niveau genomen.
In figuur 13 ziet u dat deze waarde ongeveer wordt bereikt bij de waarde 0,25 ; wat overeenkomt met een cyclus van 8 koers-bars.
Vergelijken we dit met een WMA-7 welke u in figuur 14  hieronder ziet, dat ziet u dat het -3dB punt wordt bereikt bij een waarde van 0,14 wat ongeveer 14 koers-bars is.
Met de waarde welke u kiest voor de instelling van de WMA kiest u dus ook de doorlaatwaarde van het laag doorlaat filter ( low pass filter).
Als vuistregel geldt dat de doorlaat 2X de gekozen WMA waarde is, wat overigens ook opgaat voor een SMA.
Figuur 14:

In diverse stukjes TA-script welke ik publiceer vindt u vaak de WMA-4 terug met soms een lichte variatie in de samenstelling wat betreft de inbreng van oudere koersrecords.
U ziet de frequentie respons van de WMA-4 in afbeelding 13, de WMA-4 in de sinus grafiek ziet u hieronder in figuur 15.
Figuur 15:

U ziet dat deze WMA-4 slechts 1-koers-bar na -ijlt terwijl de hoge frequenties toch prima worden verwijderd.
.
Wat nu, wanneer we wel een WMA-4 nemen, maar de weging van de records wat wijzigen.
We nemen bijvoorbeeld 1Xprijs-vandaag+ 2Xprijs gisteren+2Xprijs-eergisteren + 1 x prijs de dag daarvoor.
In Ta-script:  -->  (Close[i]+close[i-1]*2+close[i-2]*2+close[i-3])/6
Ik heb dat even weergegeven met een witte lijn, waarbij ik de standaard WMA-4 lijn in het blauw heb laten staan, u ziet dat in grafiek 16.
Figuur 16:

U ziet het resultaat, de lag wordt groter, deze bedraagt nu 1,5 bar in plaats van 1 bar zoals bij de standaard WMA-4.
Wanneer u goed kijkt, ziet u dat de amplitude van de witte WMA-4 ook een fractie groter is dan van de standaard WMA-4  -->  0,7% groter.
Waarom zou je willen afwijken van de standaard WMA-4 ?
Wel, het afwijken van de standaard WMA-4 kan correcties later in je formule voorkomen, je kan proberen de weging van de diverse records dusdanig te wijzigen dat je verdere correcties later in je berekeningen voorkomt.
Wanneer dat niet de reden is, kun je beter niet afwijken van de standaard berekening van de WMA.
***
**
*
Het exponentiele gemiddelde.
Dit gemiddelde vindt u vaak terug in uw technische analyse pakket als EMA wat staat voor Exponential Moving Average.
De EMA valt ten opzichte van de SMA en de WMA op door zijn totaal andere manier van opbouw.
Gaan we bij  de SMA en de WMA uitsluitend uit van de records van diverse datums, bij de EMA gaan we uit van een percentage van het laatste record/koers, en van een percentage van de vorige waarde van de EMA ...dus niet van de koers, maar de vorige waarde van de EMA ..! .
De som van de percentages is 100%.
We weten dus dat het gedeelte van de huidige waarde van de koers, en het gedeelte van de vorige waarde van de EMA samen 1 is (1=100%).
Het eerste gedeelte van 1 waarmee we de huidige prijs vermenigvuldigen wordt Alpha genoemd.
Het gedeelte wat dan overblijft voor vermenigvuldiging met de voorgaande -waarde van de EMA is dan  1-alpha.
Wanneer ik Alpha even weergeef als @ dan wordt de formule voor de EMA:
EMA = @*Price[i] + (1-@)*EMA[i-1]
Welke variaties u daarop ook wenst te maken, zorg er altijd voor dat er een @ en een (1-@) ontstaat, wanneer u namelijk totaal niet uitkomt op 1 dan kan dat zeer ongewenste effecten veroorzaken.
.
laten we even een EMA-15 in de sinus grafiek plaatsen.
Figuur 17:

Daar is zo 1-2-3 niets bijzonders aan te zien.
laten we in de grafiek ook even de SMA-15 en de WMA-15 erbij plaatsen.
Figuur 18:

We zien dat de lag van de EMA in de orde van grootte ligt van de WMA en dat de amplitude kleiner is.
Laten we de frequentie respons grafiek er even bij halen.
Figuur 19:

We zien ook in deze grafiek dat naarmate de frequentie lager wordt, de demping ook daalt.
De EMA behoort dus ook tot de groep low-pass ofwel laag -doorlaat filters.
Duidelijk is te zien dat deze dempingcurve veel vloeiender verloopt dan bij de SMA en de WMA het geval was.
.
Laten we eens even terug gaan naar die waarde Alpha ofwel @ voor wat betreft de Lsag van de EMA en wat betreft de waarde t.o.v de SMA.
.
Als eerste even de Lag.
Ik zal u de berekeningen besparen, maar in het algemeen geldt dat @=1/(Lag+1)
Willen we bijvoorbeeld dat voor een berekening de gemiddelde lijn 3 records achterloopt, dat geeft dit voor Alpha --> @ = 1 / (3+1) =1/4 = 0,25.
Even testen.
In ons programma geven we voor @ de waarde 0.25 in en we krijgen dan figuur 20.
Figuur 20:

Dat klopt vrij redelijk.
Laten we datzelfde nog eens doen, maar dan voor Alpha=0,5. 
Dat zou een Lag moeten geven van 1-record, immers @=1/(Lag+1) wat overeenkomt met 0,5=1/(1+1).
We vullen in voor @=0.5 en kijken weer even naar de grafiek.
Figuur 21:

We zien dat we met de @ redelijk de te verwachten Lag kunnen bepalen.
.
Via berekeningen kunnen we de EMA ook relateren aan de SMA.
Bij de SMA zag u dat de lag=(ma-1)/2
@=1/(Lag+1) 
Wanneer we dat nu combineren krijgen we @ =1/ ( (ma-1)/2 +1) wat geeft: --> @=2/(ma+1)
Om niet al te technisch te worden breek ik het stukje over de EMA hier af, maar u mag aannemen, dat bij verdere uitwerking blijkt (via de frequentie response etc.) dat bij een gelijkwaardige hoeveelheid lag de EMA een betere filtering geeft dan een SMA; of anders gezegd, een  EMA zal een gelijkwaardige filtering geven als een SMA bij dezelfde hoeveelheid Lag.
.
De doorlaat bandbreedte van dit type filter wordt berekend met de formule: 4*Pi/(@*(2+@))
.
***
**
*
Median
De Median is een filter welke u niet in elk TA-pakket aantreft, maar er eigenlijk niet in mag ontbreken.
Ik kom bij dit filter even vanaf de andere kant als bij voorgaande filters met de uitleg.
Stel, ik heb een stukje TA-code met als output een signaal zoals te zien is in onderstaande figuur.
Figuur 22:

U ziet in figuur 22 een snel piekende data, welke begrenst is tussen de waarden 0,10 en 1,10.
Graag willen we deze data een beetje afvlakken/middelen, zonder de snelle stijgingen en dalingen teniet te willen doen, zodat het wat beter geschikt is voor verdere bewerking.
Oké, wat let ons, we plaatsen even een WMA met de waarde 10.
Het resultaat ziet u in figuur 23.
Figuur 23:

We zien die WMA-10 als een gele lijn in figuur 23.
Tja, ...   niet helemaal wat ik nodig heb voor verdere bewerking.
En daar komt dan de Median in beeld.
In figuur 24 ziet u nogmaals het basis signaal, maar deze keer met een Median-5 als smoothing.
Figuur 24:

In figuur 24 ziet u in de kleur geel de Median-5 en in het grijs de WMA-10
U ziet dat de snelle wisselingen (de hogere frequenties) door de grijze lijn worden gedempt, terwijl die voor verdere bewerking echt benodigd zijn.
Die snelle wisselingen omhoog en omlaag zien we keurig terug in de gele lijn, de Median-5.
We zien ook een vertraging, welke constant is, van 2,5 koers-bars/records.
De gele lijn, de Median, zorgt op deze manier voor een soort van gemiddelde, met een bekende Lag en zeer snelle respons.
Het is dus een totaal andere manier van middeling dan de SMA,WMA of EMa.
***
**
*
Wat kunnen we uit bovenstaande leren?
*Elke soort MA heeft zijn eigen specifieke kenmerken wat betreft de wijze waarop ze zijn opgebouwd, en daardoor de mate van lag en smoothing welke we verkrijgen.
*De WMA heeft vaak voorkeur t.o.v. de SMA vanwege een kleinere lag en gelijkmatiger frequentie karakteristiek.
*De EMA is instelbaar wat betreft de mate van Lag via de @.
*Ook kan de @ worden gebruikt om een EMA te construeren met een zelfde mate van demping als een SMA maar dan met lagere Lag.
*De @ is zeer bruikbaar en berekenbaar in eigen TA-script formules.
* De EMA heeft de meest gelijkmatige manier van frequentie demping.
*De SMA en de WMA en de EMA zijn niet erg bruikbaar voor data met snelle pieken etc, vanwege de demping op hogere frequenties.
*Daarvoor kan beter een Median worden toegepast.
*Denk goed na voordat u een MA of Median plaatst, bedenk wat u wilt, en kies daarna de juiste MA of Median.
*U zag al in bovenstaande, dat een verkeerde SMA zelfs een cyclus volledig kan verwijderen.
.
Ik beloofde u ook al de moving-average zonder Lag, maar die behandel ik in een anders stukje, dit stukje wordt anders te lang.
.
Ik heb in bovenstaande geprobeerd, zonder al te diep in te gaan op de theorie een beetje de verschillen weer te geven tussen de diverse soorten van middeling / smoothing die ons in de diverse TA -pakketten ter beschikking staan, in de hoop dat u wanneer u er weer eentje in uw grafiek plaatst, u door  dit stukje er de juiste MA voor weet te selecteren.
*
**
Indien bovenstaande vragen bij u opwerpt, stuur gewoon een e-mail naar Jan@JSTAS.com  dan probeer ik het nader toe te lichten.
.
Vriendelijke groet,
JanS ;)
.
De TA-script code voor de sinusgolf met de MA, de WMA en de EMA  en daarin en de kleuring van de sample periode , welke ik gebruikt heb voor de diverse grafieken in dit stukje kunt u opvragen bij Jan@JSTAS.com
.
Bron: J.F. Ehlers.
Disclaimer: Bovenstaande zijn slechts ideeën, verwachtingen en hersenspinsels. Ze hoeven dan ook helemaal niet te kloppen met de werkelijkheid. Handelen met deze gegevens op de beurs is derhalve voor eigen risico, en wordt afgeraden. U kunt daarbij al uw geld verliezen, en meer dan dat !!