vrijdag 27 juni 2014

Onethische Psychologische Experimenten


In het eerste jaar als psychologiestudent hoor je er over en in het tweede jaar kom je er tijdens het onderzoekspracticum mee in aanraking: de commissie ethiek. Want voordat jij je onderzoek mag uitvoeren moeten zij datgene wat je van plan bent te gaan doen eerst goedkeuren. Het is namelijk niet de bedoeling dat de deelnemers aan  jouw onderzoek de onderzoeksruimtes vervolgens gillend gek, gehersenspoeld of getraumatiseerd weer verlaten (en dat voor tien euro of een proefpersoonpunt). Maar welke duistere onderzoeken vonden er in het lab plaats toen er nog helemaal geen ethische commissies bestonden? En hebben we vandaag de dag nog iets aan de resultaten van deze studies?

Aandacht voor de ethische kant binnen psychologisch onderzoek is er niet altijd geweest; Pas in 1953 is er door de American Psychological Association (APA) officieel een ethische richtlijn opgesteld voor psychologisch onderzoek: Ethical Standards of Psychologists. Voor die tijd waren er al behoorlijk wat studies gedaan die volgens de APA voorschriften niet door de ethische beugel konden. Maar ook daarna werden proefpersonen nog niet helemaal beschermd tegen de duistere plannen van onderzoekers…

Onethische onderzoeken

The Monster Study (1939)

Het Monster Experiment was een experiment naar het stottergedrag van kinderen. Wendell Johnson (University of Iowa) was ervan overtuigd dat stotteren aangeleerd gedrag was. Hij wilde in een experiment aantonen dat door middel van positieve of negatieve bekrachtiging kinderen stotteren kon worden aangeleerd of afgeleerd. Hij koos tweeëntwintig weeskinderen uit waarvan er tien al voor het experiment werden geïdentificeerd als stotteraars. Van deze tien kinderen werden er vijf toegewezen aan groep IA. Aan hen werd verteld dat hun spraak prima was. De andere vijf werden toegewezen aan groep IB, de controlegroep. Hen zou worden verteld dat zij inderdaad net zo slecht spraken als mensen zeggen. De overige twaalf kinderen zonder spraakproblemen werden verdeeld over condities IIA en IIB. In conditie IIA zaten zes kinderen die te horen kregen dat hun spraak niet normaal was, dat zij beginnende stotteraars waren en hun spraak onmiddellijk moesten corrigeren. In conditie IIB kregen de overgebleven zes kinderen te horen dat zij normale sprekers waren en zij werden gecomplimenteerd met hun spraakvaardigheid.

Van de zes 'normale' kinderen in de stotterconditie, verslechterde van twee het spraakvermogen, van twee bleef het gelijk en van twee verbeterde het spraakvermogen zelfs. Van de vijf kinderen die voor het experiment al stotterden en juist positieve feedback op hun spraak kregen, lieten twee kinderen verbetering zien. Van twee kinderen daalde de vloeiendheid qua spraak juist en van één kind bleef het spraakvermogen onveranderd. Echter, los van het spraakvermogen, lieten wel alle kinderen die valselijk beschuldigd werden van stotteren kenmerkend gedrag van stotterende kinderen zien. Zij werden minder spraakzaam, schuifelden met hun voeten, fluisterden, slikten veel, klemden met hun mond en vertelden dat ze zich schaamden voor hoe zij spraken.

Deze studie werd later tot Monster Study gebombardeerd door de collega’s van Johnson, die met afschuw waren vervuld dat hij geëxperimenteerd had op weeskinderen om zijn theorie te bewijzen. De resultaten gingen daarnaast volledig tegen de verwachting van Johnson in, omdat uit zijn studie bleek dat conditionering juist op het spraakvermogen geen invloed had. Johnson zelf maakte de resultaten dan ook alleen maar kenbaar in zijn masterthese en publiceerde deze nooit. Tot aan zijn dood in 1965 bleef hij volhouden dat stotteren aangeleerd gedrag was. De universiteit van Iowa heeft in 2001 publiekelijk excuses aangeboden voor de Monster Study. 

Stanford Prison Experiment (1971)

Het Stanford Prison Experiment is een vrij bekend onderzoek en een goed voorbeeld van hoe onderzoekers niet altijd zelf overzien in hoeverre hun studie ethisch door de beugel kan. Op 14 augustus in 1971 kregen 24 mannelijke studenten willekeurig de rol van bewaker of gevangene toebedeeld, waarna zij een gevangenissituatie naspeelden in de kelder van het gebouw van de psychologiefaculteit van Stanford University. Het experiment stond onder leiding van Philip Zimbardo, die samen met zijn team van psychologen wilde onderzoeken wat de oorzaken van conflicten zijn tussen gevangenen en bewakers.
Stanford Prison Experiment
(http://www.nytimes.com/imagepages/2011/11/19/business/Shortcuts.html)

Alle deelnemers aan het experiment hadden van tevoren een informed consent getekend waarin zij akkoord gingen met het feit dat zij tijdens het onderzoek geïntimideerd zouden kunnen worden, weinig privacy zouden ervaren en tijdelijk moesten leven op een sober dieet. Alleen de gevangenen kregen hier uiteindelijk mee te maken. De bewakers werd alleen verteld dat zij (binnen bepaalde grenzen, zoals fysiek geweld) vrij waren om op iedere mogelijke manier de orde binnen de gevangenis te bewaren en respect af te dwingen bij de gevangenen.
De studenten die deelnamen aan het onderzoek voegden zich bijzonder snel naar hun rollen, maar gingen vervolgens veel verder dan dat. De bewakers veranderden van gewone jongens in autoritaire en soms zelfs sadistische ordebewakers, die sommige gevangenen onderwierpen aan pesterijen die grensden aan psychologische marteling. Op hun beurt transformeerden de gevangenen in passieve gedetineerden die de geestelijke mishandeling ondergingen. Zij keerden zich zelfs tegen gevangenen die in opstand kwamen, om te voorkomen dat de pesterijen nog erger zouden worden. Philip Zimbardo zelf was gefascineerd en liet de misstanden gebeuren, totdat een medeonderzoeker hem wakker schudde en hem herinnerde aan de ethische grenzen die werden overschreden. Het experiment, dat oorspronkelijk twee weken lang zou duren, werd na zes dagen afgebroken.

De resultaten van dit experiment worden regelmatig aangevoerd om de ontvankelijkheid van mensen aan te tonen voor sociaal –en institutioneel gedragen ideologieën en ideeën. Daarnaast wordt het onderzoek van Zimbardo vaak aangehaald om de cognitieve dissonantie theorie (overeenstemming willen aanbrengen tussen emoties, overtuigingen en het eigen gedrag) en de macht van gezag en autoriteit aan te tonen.

Landis’ Facial Expressions Experiment (1924)
           
Gezichtsuitdrukkingen bij het onthoofden van een rat
(http://www.madsciencemuseum.com/msm/pl/facial_expressions_while_decapitating_a_rat)
De psycholoog Camey Landis voerde in 1924 een experiment uit om te kijken of verschillende emoties ook specifieke gezichtsuitdrukkingen veroorzaken. Zijn doel was de universele gezichtsuitdrukkingen voor emoties als walging, verbazing en blijdschap te vinden. Veel van de deelnemers van zijn experiment waren studenten. Zij werden blootgesteld aan verschillende stimuli die vaak een sterke reactie veroorzaakten, bijvoorbeeld het ruiken aan ammonia of het kijken naar pornografie. Tot zover viel het nog mee, maar bij het laatste gedeelte  van het experiment ging het mis. Proefpersonen werden bij dit onderdeel geacht een levende rat te onthoofden. Niet alleen waren de studenten geschokt dat zij dit moesten doen, maar veel deelnemers hadden ook geen idee hoe zij dit op een humane manier voor elkaar konden krijgen. Voor de 33 procent van de deelnemers die het echt niet wilden doen, onthoofde Landis zelf het ratje met een mes.

Uit de resultaten kwam er uiteindelijk niet dat er één universele gezichtsuitdrukking voor bepaalde emoties bestaat. Wel bleek uit deze studie (ruim voor het Milgram Experiment, zie hieronder) al hoe gehoorzaam proefpersonen aan de proefleider zijn tijdens een experiment.

Little Albert (1920)

Little Albert (http://pablosangel.blogspot.nl/2012/05/psych-corner-little-albert.html)
John Watson was de grondlegger van het behaviorisme en gebruikte vaak weeskinderen in zijn experimenten. Hij wilde testen of angst een geconditioneerde of aangeboren reactie was en koos voor zijn experiment ‘Little Albert’, een negen maanden oude baby uit het lokale ziekenhuis. Het jongetje werd twee maanden lang blootgesteld aan onder andere een wit konijn, een witte rat en katoen. Hij bleek niet bang te zijn voor de dieren en voorwerpen. De derde maand begon Watson met een hamer op een metalen stang te slaan zodra de baby de rat aanraakte. Bij het horen van het geluid begon de kleine Albert te huilen en leek angstig te zijn. Nadat dit een aantal malen herhaald werd, hoefde hij de rat maar te zien en hij werd bang. Op een gegeven moment associeerde Albert niet alleen de rat met gevaar, maar alles wat harig en wit was.

Milgram Study (1974)

Het onderzoek van Stanley Milgram naar gehoorzaamheid aan autoriteit is controversieel, maar wereldwijd bekend. Het experiment draait om drie verschillende rollen: de ‘leraar’, de ‘leerling’ en de testleider. Deelnemers aan het onderzoek werd verteld dat zij samen met iemand meededen aan het onderzoek, terwijl deze persoon in werkelijkheid een acteur was. Vervolgens werd er zogenaamd geloot om wie er leraar of leerling zou worden, maar in feite kreeg de acteur altijd de rol van leerling en de proefpersoon de rol van leraar. De leraar bleef in de kamer met de testleider, terwijl de leerling achter een wand plaatsnam. Alle contact met de leraar ging vanaf dat moment via een intercom. Aan de leraar werd vervolgens gevraagd de leerling een schok toe te dienen op het moment dat deze een fout maakt in een taakje. De schokken namen iedere keer toe in sterkte; iets waar de leraar van op de hoogte was (zie afbeelding). In werkelijkheid kreeg de leerling helemaal geen schokken, maar deed hij alsof. Bij hoge schokken begon de acteur te bonzen op de muur en klaagde hij over een hartkwaal. Na nog hogere schokken liet hij niets meer van zich horen. Op dit punt in het experiment ervoeren veel deelnemers hevige stress en wilden zij stoppen. Zodra zij dit echter aangaven, kregen zij onder andere van de testleider te horen dat ‘het absoluut noodzakelijk is dat zij doorgaan’. Als de proefpersoon desalniettemin bleef aangeven te willen stoppen, werd het experiment beëindigd. Anders werd het onderzoek pas gestaakt nadat zij driemaal de maximale 450-volt schok hadden gegeven.


Wie gaf hoeveel Volt? (http://commons.wikimedia.org/wiki/File:Graph_of_Milgram-Experiment.svg) 

Zoals hierboven te zien is, ging maar liefst 65 procent van proefpersonen door tot de maximale schok (de meesten jammerend en badend in het zweet). Volgens Milgram kwam dit doordat twee theorieën in werking traden:
Theory of Conformism: Iemand die niet de kennis of vaardigheden heeft om beslissingen te nemen, met name in een crisis, zal de besluitvorming overlaten aan de groep en mensen die hiërarchisch hoger geplaatst zijn.
Agentic State Theory: De essentie van gehoorzaamheid bestaat uit het feit dat een persoon zichzelf beschouwt als een instrument die de wensen van een ander uitvoert. Oftewel, zij zien zichzelf niet meer als een verantwoordelijk persoon en zullen doen wat hen gezegd wordt.
Het experiment van Milgram is vele malen gerepliceerd en in verschillende variaties uitgevoerd. Het meeste recente replicatieonderzoek uit 2006 (Burger, 2006) laat vrijwel dezelfde resultaten zien als die van Milgram uit 1974.

Tearoom Trade (1970)

In de jaren zeventig wilde socioloog Laud Humphreys controleren of de stereotypische overtuigingen over mannen die onpersoonlijke seks met elkaar hadden (Tea Room Sex) in openbare toiletruimtes klopten. Voor zijn PhD dissertatie positioneerde hij zichzelf als ‘uitkijk’ en waarschuwde mannen als er andere mensen of politieagenten aankwamen. Zo won hij het vertrouwen van enkele van deze mannen en vertelde hij dat hij onderzoek naar hen en hun motieven deed. Vervolgens nam een gestructureerd interview af bij degenen die mee wilden doen. Maar wat hij hen niet vertelde was dat hij hen ook stiekem volgde en het kenteken van hun auto opschreef. Een jaar later verscheen hij aan hun voordeur en deed hij zich voor als een onderzoeker naar publieke gezondheid. Zo verzamelde hij data met betrekking tot hun baan, burgerlijke staat, gezondheid en andere persoonlijke zaken.

Humprey’s bevindingen lieten zien dat veel heersende stereotypen niet klopten. Maar liefst 54 procent van de mannen die Tea Room Sex hadden waren getrouwd met een vrouw. Ongeveer 38 procent vond zichzelf niet biseksueel of homoseksueel en de meeste mannen waren succesvolle, hoogopgeleide en gerespecteerde leden van hun gemeenschap. Slechts veertien procent van de mannen die hij interviewde en observeerde was homoseksueel en maakte onderdeel uit van de homogemeenschap.

Nuttig of niet?

Negen updates van de ethische richtlijn later (met de laatste update in 2001) lijkt de positie van deelnemers aan psychologisch onderzoek redelijk veiliggesteld. Een onderzoeker moet kunnen aantonen dat iedereen die aan zijn of haar onderzoek meedoet geen (blijvende) psychische of fysieke schade zal oplopen door het experiment. Daarnaast moet deelname aan een onderzoek vrijwillig zijn en moeten de persoonsgegevens van proefpersonen indien mogelijk worden geanonimiseerd en anders zorgvuldig worden gebruikt en beveiligd.

Regels die in bovenstaande onderzoeken niet of niet volledig zijn opgevolgd. We weten namelijk niet of de deelnemers aan bovengenoemde onderzoeken wel een redelijke inschatting konden maken waar ze aan begonnen en of ze, als dat wel het geval was, nog wel vrijwillig hadden meegedaan. Zeker is dat door de Monster Study bij verschillende kinderen blijvende psychische schade is aangericht en sommigen de rest van hun leven last bleven houden van spraakproblemen. En Little Albert verliet het ziekenhuis waar het experiment werd uitgevoerd voordat hij gedesensibiliseerd was van zijn angst voor witte, pluizige objecten. Hoewel zijn ware identiteit achteraf nooit met zekerheid is vastgesteld en het dus niet gecheckt kan worden, zou het goed mogelijk zijn dat hij nog geruime tijd last heeft gehad van zijn fobie. Hoewel deze onderzoeken onethisch zijn gebleken en vandaag de dag waarschijnlijk niet door de ethische commissie waren gekomen, zijn de resultaten wel beschikbaar. Hoe nuttig zijn de bevindingen van onethisch onderzoek uiteindelijk voor de psychologie geweest?

Het is mogelijk te beargumenteren dat het nodig is om grenzen binnen psychologieonderzoek te overschrijden, omdat dit stimuleert verder te kijken dan de op dat moment heersende norm. Denk bijvoorbeeld aan het Milgram Experiment dat, zeker in die tijd (vrij recent na de Tweede Wereldoorlog), een nieuwe impuls gaf aan de discussie over hoe zoveel ogenschijnlijk ‘normale’ mensen hun medemensen zo gruwelijk konden behandelen. Het experiment liet zien dat de mensen bij een moreel dilemma onder sociale druk, veel minder naar hun eigen eer en geweten handelen dan werd aangenomen.

Echter, het lastige is dat het nooit te controleren valt of het Milgram Experiment daar echt de enige oorzaak voor was; we weten immers niet hoe de geschiedenis anders verlopen was. Daarnaast blijkt inderdaad uit veel onderzoeken dat in bepaalde gevallen belonen een sterkere stimulans voor gedrag is dan straffen (Lalli, 1999; Kodak, Lerman, Volkert & Trosclair, 2013). Maar of slechts positieve of negatieve feedback op spraak daadwerkelijk stotteren kan genezen of veroorzaken is maar de vraag. Stotteren is namelijk een coördinatiestoornis in de hersenen waarvan wordt aangenomen dat genetica een grote rol speelt, aangezien stotteren vaak in dezelfde families voorkomt (Yairi, E., Ambrose, N. & Cox, N., 1996; Guitar, B., 2005). En tenslotte is het juist vanwege het ethische aspect niet mogelijk het Monster Experiment te herhalen om te kijken of de uitkomsten repliceerbaar zijn.

Wat de resultaten van sommige onethische onderzoek zeker wel doen is het halen van de pers. Denk bijvoorbeeld aan het martelschandaal in de de Abu Ghraib gevangenis in Irak. Journalisten schreven uitgebreide analyses over de overeenkomsten van deze gebeurtenis met het het Stanford Prison Experiment. Sociaal Psychologen kwamen uitvoerig aan het woord in de media. Zij kregen de gelegenheid te betogen dat de soldaten die deze misdaden pleegden niet alleen individueel verantwoordelijk konden worden gehouden, maar dat de (sociale) omgeving ook van grote invloed is op menselijk gedrag.
Hierin schuilt echter ook weer een risico, want er wordt niet altijd positief in de pers gereageerd op onethisch onderzoek. Er was bijvoorbeeld bijzonder veel publieke woede over de schending van privacy in het Tea Room sex onderzoek van Laud Humphrey. Journalist Nicholas von Hoffman beschuldigde in de Washington Post zelfs alle sociale wetenschappers van onverschilligheid ten opzichte van de menselijke behoefte sommige aspecten van het leven geheim te willen houden (Von Hoffman, 1970).
Hoe dan ook leveren de besproken onderzoeken een interessante kijk op hoe mensen handelen en reageren onder extreme omstandigheden in een min of meer gecontroleerde omgeving. Hoewel er bij veel onderzoeken later niet alleen ethische, maar ook methodologische vraagtekens zijn geplaatst, roepen ze een hoop vragen op. Vragen die kunnen worden omgevormd naar hypothesen voor nieuw onderzoek, om de menselijke geest nog beter te kunnen begrijpen. Maar dan wel met iets meer oog voor het welzijn van de deelnemers aan het onderzoek.

GLaDOS: "Cake and grief counseling, will be available at the conclusion of the test."

Referenties
American Psychological Association. (1953). Ethical standards of psychologists. Washington, DC: Author.
Burger, J. M. (2009). Replicating Milgram: would people still obey today? American Psychologist, 64(1), 1–11.

Guitar, Barry (2005). Stuttering: An Integrated Approach to Its Nature and Treatment. San Diego: Lippincott Williams & Wilkins.

Haney, C., Banks, W. C. & Zimbardo, P. G. (1973). Study of prisoners and guards in a simulated prison. Naval Research Reviews, 9, 1–17.

Humphreys, Laud (1972), Out of the closets; the sociology of homosexual liberation, A Spectrum book, S-288, Englewood Cliffs, N.J., Prentice-Hall.
           
Kodak, T., Lerman, D.C., Volkert, V.M. & Trosclair, N. (2013). Further examination of factors that influence preference for positive versus negative reinforcement. Journal of Applied Behavior Analysis, 40(1), 25-44.

Lalli, J.S., Vollmer, T.R., Progar, Wright, C., Borrero, J., Daniel, D., Hoffner Barthold, C., Tocco, K. & May, W. (1999). Competition between positive and negative reinforcement in the treatment of escape behavior. Journal of Applied Behavior Analysis, 32(3), 285-296.

Landis, C. (1924). Studies of Emotional Reactions, II., General Behavior and Facial Expression. Journal of Comparative Psychology. 4(5), 447-509.

Milgram, S. (1963). Behavioral Study of Obedience. Journal of Abnormal and Social Psychology, 67(4), 371-8.
           
Yairi, E., Ambrose, N. & Cox, N. (1996). Genetics of stuttering: a critical review. Journal of Speech Language Hearing Research 39, 771–784.

Watson, J.B. and Rayner, R. (1920). Conditioned emotional reactions. Journal of Experimental Psychology, 3, 1, 1–14.

Websites


Nicholas Von Hoffman, "Sociological Snoopers", The Washington Post, January 30, 1970. Reprinted in The Tearoom Trade, enlarged edition, 1975, page 177, "Sociological Snoopers and Journalistic Moralizers"