U zult niet veel kunnen doen in onderzoek als u niet weet hoe u over variabelen moet praten. Een variabele is een entiteit die verschillende waarden kan aannemen. OK, dus wat betekent dat? Alles wat kan variëren kan als variabele worden beschouwd. Leeftijd bijvoorbeeld kan als een variabele worden beschouwd omdat leeftijd verschillende waarden kan aannemen voor verschillende mensen of voor dezelfde persoon op verschillende tijdstippen. Evenzo kan land worden beschouwd als een variabele omdat aan het land van een persoon een waarde kan worden toegekend.
Variabelen zijn niet altijd “kwantitatief” of numeriek. De variabele stad bestaat uit tekstwaarden als New York
of Sydney
. We kunnen, als dat nuttig is, kwantitatieve waarden toekennen in plaats van (of in plaats van) de tekstwaarden, maar we hoeven geen getallen toe te kennen om iets een variabele te laten zijn. Het is ook belangrijk te beseffen dat variabelen niet alleen dingen zijn die we meten in de traditionele zin. In veel sociaal onderzoek en bij programma-evaluatie bijvoorbeeld, beschouwen we de behandeling of het programma als samengesteld uit één of meer variabelen (d.w.z. de “oorzaak” kan als een variabele worden beschouwd). Een onderwijsprogramma kan verschillende hoeveelheden “tijd aan de taak”, “klassikale instellingen”, “leerling-leraar verhoudingen”, enzovoort hebben. Dus zelfs het programma kan worden beschouwd als een variabele (die kan bestaan uit een aantal sub-variabelen).
Een attribuut is een specifieke waarde van een variabele. Bijvoorbeeld, de variabele Studentencijfer heeft twee attributen: pass
en fail
. Of, de variabele overeenkomst zou kunnen worden gedefinieerd als hebbende vijf attributen:
-
1
= sterk mee oneens -
2
= mee oneens -
3
= neutraal -
4
= mee eens -
5
= sterk mee eens
Een ander belangrijk onderscheid dat te maken heeft met de term “variabele” is het onderscheid tussen een onafhankelijke en een afhankelijke variabele. Dit onderscheid is vooral van belang wanneer je oorzaak-gevolgrelaties onderzoekt. Het heeft mij de meeste tijd gekost om dit onderscheid te leren. (Ik ben natuurlijk iemand die verward raakt over de borden “aankomst” en “vertrek” op luchthavens – ga ik naar “aankomst” omdat ik aankom op de luchthaven of gaat de persoon die ik ga oppikken naar “aankomst” omdat hij/zij aankomt op het vliegtuig!) Ik dacht oorspronkelijk dat een onafhankelijke variabele een variabele was die vrij kan variëren of reageren op een of ander programma of behandeling, en dat een afhankelijke variabele een variabele moest zijn die afhankelijk is van mijn inspanningen (dat wil zeggen, de behandeling is). Maar dit is volledig omgekeerd! In feite is de onafhankelijke variabele datgene wat jij (of de natuur) manipuleert – een behandeling of programma of oorzaak. De afhankelijke variabele is datgene wat wordt beïnvloed door de onafhankelijke variabele – uw effecten of uitkomsten. Bijvoorbeeld, als u de effecten van een nieuw onderwijsprogramma op de prestaties van studenten bestudeert, is het programma de onafhankelijke variabele en zijn uw metingen van prestaties de afhankelijke.
Ten slotte zijn er twee eigenschappen van variabelen die altijd moeten worden bereikt. Elke variabele moet uitputtend zijn, zij moet alle mogelijke antwoordmogelijkheden omvatten. Als de variabele bijvoorbeeld “godsdienst” is en de enige antwoordmogelijkheden zijn “protestants”, “joods” en “moslim”, dan zijn er heel wat godsdiensten die ik kan bedenken die niet zijn opgenomen. De lijst put niet alle mogelijkheden uit. Aan de andere kant, als je alle mogelijkheden zou uitputten met sommige variabelen – religie is er daar één van – zou je gewoon te veel antwoorden hebben. De manier om dit op te lossen is door de meest voorkomende kenmerken expliciet op te sommen en vervolgens een algemene categorie als “Andere” te gebruiken om alle resterende kenmerken op te nemen. De attributen van een variabele moeten niet alleen uitputtend zijn, maar moeten elkaar ook uitsluiten: geen enkele respondent mag twee attributen tegelijk hebben. Hoewel dit voor de hand lijkt te liggen, is het in de praktijk vaak nogal lastig. U zou bijvoorbeeld in de verleiding kunnen komen om de variabele “arbeidsstatus” weer te geven met de twee attributen “werkzaam” en “werkloos”. Maar deze attributen sluiten elkaar niet noodzakelijk uit – iemand die op zoek is naar een tweede baan terwijl hij werk heeft, zou beide attributen kunnen aanvinken! Maar gebruiken we in enquêtes niet vaak vragen waarin de respondent wordt gevraagd “alles aan te vinken wat van toepassing is” en vervolgens een reeks categorieën op te sommen? Ja, dat doen we, maar technisch gesproken is elk van de categorieën in een dergelijke vraag zijn eigen variabele en wordt deze dichotoom behandeld als “aangevinkt” of “niet aangevinkt”, attributen die elkaar wederzijds uitsluiten.