Amplificatiebots op Twitter: wat zijn het en hoe herken je ze (Linda Duits)

Deze post verscheen eerst op dieponderzoek.nl.

Op Twitter zijn er verschillende soorten nepaccounts die allemaal verschillende doelen hebben. Veel van hen zijn erop gericht om grassroots activiteit te faken, dus om te doen alsof iets leeft onder ‘de bevolking’. Ze kunnen ervoor zorgen dat ideeën of accounts meer geloofwaardigheid verkrijgen, door tweets of personen populairder te laten lijken dan ze daadwerkelijk zijn. Namaakvolgers zijn een bekend voorbeeld: die kun je kopen en dan lijk je heel wat op Twitter.

Een amplificatiebot is een account dat bestaat om ideeën groter te lijken zijn. Onderzoekers van het commerciële bureau Duo Security analyseerden gedeelde kenmerken van zulke accounts. Ze schreven vervolgens een script dat zulke nepaccounts opspoort. Na 24 uur had dat script al ruim 7000 accounts gevonden.

Onderzoekers Jordan Wright en Olabode Anise stelden eerst vast wat ‘normale’ twitteractiviteit is. Zo is het logisch dat een echte tweet meer likes dan retweets krijgt. Een normaal account mixt retweets, replies en eigen content. Een amplificatie-account heeft meer retweets – daar is ‘ie immers voor gemaakt. Tot slot is het waarschijnlijk dat een echt account tweets min of meer chronologisch retweet, terwijl een bot dit niet zal doen. Om bots vervolgens op te sporen formuleerden ze drie criteria:

  • Minstens negentig procent van de tweets zijn retweets;
  • Minimaal een derde van deze retweets zijn geamplificeerd, dat wil zeggen: hebben minder likes dan retweets;
  • Het aantal inversies (niet-chronologische retweets) was groter dan honderd.

Op deze manier is het mogelijk amplificatiebots te herkennen.

Zulke bots kunnen worden ingezet voor verschillende doelen: commercieel en politiek. Een vervolgstap die de onderzoekers niet doen is nagaan welke content precies door zulke amplificatiebots wordt versterkt. Uiteindelijk willen we natuurlijk weten wie zulke bots inzet, om zo manipulatie aan het licht te brengen.

Een TED-talk over hoe kennis drie belangrijke denkfouten kan verslaan

De vorige keer dat ik hier een TED-talk plaatste reageerde iemand op Twitter dat ze bedenkingen hadden bij TED. Dat is geen nieuws: ik ook. In ons mytheboek fileerden we twee van de meest bekende TED-talks ooit. TED is geen wetenschappelijke conferentie. Maar dat wil niet zeggen dat de informatie per definitie fout is.

Deze talk door J. Marshall Sheppherd is een vrij mooie uitleg over drie bekende denkfouten (of zijn het er in feite twee?) die mensen maken en hoe kennis hier een antwoord kan op zijn. Als je helemaal in verwarring wil raken, lees je verder onder de video nà het bekijken van de video. Ook als je wil weten waarom ik net iets tussen haakjes toevoegde.

Video bekeken? En moedig of nieuwsgierig? Het gaat ten eerste over de confirmation bias. Bij het posten van deze video vroeg ik mezelf af of ik hier nu ook niet zelf net die denkfout maak. Veel van wat Shepherd stelt, ben ik het wel degelijk mee eens. Het is de reden waarom we Paul, Casper en ikzelf in het nieuwe mytheboek dat in februari verschijnt Evidence-Based Education ook als mythe bespreken. Het is belangrijk kritisch te zijn voor waar je meest in gelooft.

Tegelijk kan het ook zijn dat ik wel degelijk aan Dunning Kruger lijd, zodat ik niet eens door heb dat ik fout ben en ik foutief denk dat ik er veel van af weet…

Of wacht: misschien is er toch iets. Ik ben het namelijk niet zo eens met zijn omschrijving van cognitieve dissonantie aan de hand van de twee voorbeelden die hij geeft die volgens mij eerder op extra voorbeelden van Dunning Kruger lijken of op voorbeelden van wat in deze link beschreven wordt. Om echt cognitieve dissonantie te zijn, ontbreekt mijns inziens het element dat men er zelf (onbewust?) moeite mee heeft dat je als intelligentie mens aan bijgeloof doet en daarom een verantwoording zoekt en daarna je gedrag ook aanpast.

Oef, blijf ik toch nog kritisch ;).

Lectuur op zaterdag: achterstand, het beste zoeken is zinloos, lente vs autocratie (en meer)

De weekendbijlage bij deze blog:

Tot slot, meer dan twee uur Xander De Rycke

 

Wil geen pessimist zijn, maar…

…ik moest even opkijken toen ik dit stuk van Kris Van den Branden las in De Standaard. In feite gaat het stuk vooral over de nieuwe eindtermen die vanaf 1 september volgend jaar zullen ingaan. Maar het stuk wordt opgehangen aan de vraag of ons onderwijs al dan niet achteruit gaat. De stelling is als volgt:

Het niveau van het onderwijs wordt in de 21ste eeuw niet afgemeten aan de hoogte van de berg feiten die leerlingen in hun hoofd kunnen proppen en slaafs op een test kunnen reproduceren. Het niveau zal in de eerste plaats worden afgemeten aan de diepgang waarmee leerlingen kennis begrijpen, verantwoord en kritisch toepassen, doelgericht doen werken, creatief bewerken en verbinden aan menselijke waarden.

Ok, maar dan zitten we wel degelijk met enkele problemen die aangeven dat ons onderwijs wel degelijk achteruit gaat:

Als we het over burgerschap hebben blijkt uit ICCS dat we wel degelijk positieve evoluties zien maar dat er wel degelijk ook grote uitdagingen zijn. 

Ik ben de eerste om ons leerkrachten en scholen te verdedigen. Onder steeds moeilijkere omstandigheden – al was het maar met net alle veranderingen die de komende maanden doorgevoerd moeten worden – doen ze vaak zeer goed werk. Maar de problemen ontkennen die net ook mee tot de nieuwe eindtermen hebben geleid, lijkt me ook geen goed idee.

Persbericht en rapport KBS over kinderarmoede in België

Een belangrijk nieuw rapport over kinderarmoede waarvan je hier het samenvattende persbericht leest:

Om kinderarmoede te meten, kan men kijken naar het inkomen van het gezin waarin ze geboren worden en opgroeien. Maar wat betekent dat in het dagelijkse leven van die kinderen? Om het beeld scherper te stellen ontwikkelden onderzoekers op Europees niveau een aanvullende indicator, die de specifieke deprivatie bij kinderen meet. De Koning Boudewijnstichting publiceert vandaag een studie waarin Frank Vandenbroucke (Universiteit van Amsterdam) en Anne-Catherine Guio (Luxembourg Institute of Socio-Economic Research) de deprivatie bij kinderen in België (globaal en per regio) vergelijken met andere Europese landen. Ze formuleren ook aanbevelingen voor een ambitieus beleid tegen kinderarmoede.

NOOT: dit persbericht verwijst naar drie grafieken die u gratis kan downloaden via het Infogram-programma.

De Koning Boudewijnstichting levert al jaren mee strijd tegen kinderarmoede, een gesel die deze kinderen ervan weerhoudt om in waardigheid te leven en echt deel uit te maken van de samenleving. Om sleutelactoren blijvend te mobiliseren, ondersteunt de Stichting de publicatie van een nieuwe studie, die een andere kijk geeft op de cijfers over kinderarmoede.

17 criteria

De indicator van deprivatie die op Europees niveau werd uitgewerkt, benadert het dichtst de echte leefomstandigheden van kinderen. Hij is gebaseerd op de toegang tot 17 essentiële zaken: eet het kind dagelijks fruit en groenten? Is de woning voldoende verwarmd? Kan het kind deelnemen aan uitstappen en schoolfeesten? Komen er soms thuis vriendjes over de vloer? Kan het kind minstens één week per jaar op vakantie?… Een kind wordt beschouwd als gedepriveerd als minstens drie van de 17 elementen ontbreken in zijn leven.

Vergelijkingen

In België bedraagt het aantal gedepriveerde kinderen ongeveer 15%. Dat cijfer is vergelijkbaar met dat van Frankrijk, maar het ligt hoger dan dat van de andere buurlanden. Deprivatie is in ons land ernstiger: als we een hogere drempel nemen (bijvoorbeeld vier of vijf criteria), wordt de kloof met onze buurlanden (Duitsland, Nederland, Luxemburg) nog groter – Zie grafiek 1.

Het Belgische gemiddelde verbergt bovendien grote regionale verschillen: het aantal kinderen dat tot minstens 3 zaken geen toegang heeft, bedraagt 29% in Brussel, 22% in Wallonië en 8% in Vlaanderen. – Zie Grafiek 2. In een Europese vergelijking positioneert Vlaanderen zich in de groep van de best presterende landen, met een laag percentage gedepriveerde kinderen (zoals in Scandinavische landen), Wallonië neemt een middenpositie in (vergelijkbaar met Kroatië, Malta, Polen en het Verenigd Koninkrijk), terwijl het Brusselse Hoofdstedelijke Gewest kampt met zeer ernstige vormen van deprivatie bij kinderen(vergelijkbaar met Spanje, Italië of Litouwen).

Risicofactoren

Verschillende factoren verklaren deprivatie bij kinderen: het gezinsinkomen, opgroeien in een huishouden waar (bijna) niet gewerkt wordt, het opleidingsniveau van de ouders, opgroeien in een eenoudergezin, schulden en woonkostenhuurder zijn of chronische gezondheidsproblemen.

België en zijn drie regio’s zijn overigens de uitzondering in de Europese Unie wat betreft het hoge percentage gedepriveerde kinderen die opgroeien in een huishouden waar niet gewerkt wordt – Zie grafiek 3. Dit kan verklaard worden door het feit dat de meeste vervangingsinkomens (zoals de minimum werkloosheidsuitkering of het leefloon) niet volstaan om begunstigden boven de armoededrempel uit te tillen.

Aanbevelingen

De aanbevelingen in dit rapport zijn uitgewerkt in samenwerking met een comité van experten in dit vakgebied. Ze tonen aan dat geen enkele speler, geen enkel bevoegdheidsniveau in zijn eentje kinderarmoede kan aanpakken. De situatie van deze kinderen kan alleen fors verbeteren met een globale, ambitieuze en gecoördineerde aanpak, die alle bevoegdheidsniveaus betrekt, ook de lokale besturen – een niveau dat cruciaal is om kinderen met een risico op een leven in armoede, te bereiken.

Concreet moeten verschillende beleidslijnen gecombineerd worden om gunstige effecten te bereiken: vroege kindertijd, werk, huisvesting, gezondheid, onderwijs… Er moeten nieuwe sociale en fiscale hervormingen komen om het netto-inkomen van geïsoleerde en laagopgeleide ouders te verhogen, zonder de koopkracht van werkloze gezinnen aan te tasten. Deze hervormingen moeten gepaard gaan met een uitgebreider aanbod van betaalbare en kwaliteitsvolle kinderopvang. Op het vlak van huisvesting moeten er meer sociale woningen komen; sociale verhuurkantoren moeten meer ondersteund worden op de private huurmarkt.

Samengevat: een ambitieus plan voor de strijd tegen deprivatie bij kinderen, waarvan de volgende regeringen (op federaal, gewest- en gemeenschapsniveau) een prioriteit moeten maken.

5 mythes over kinderen in het digitale tijdperk (Linda Duits)

Deze post verscheen eerst op dieponderzoek.nl.

Sonia Livingstone is wellicht de meest toonaangevende communicatiewetenschapper binnen het jeugd & media-domein. Livingstone doet zowel kwali- als kwantitatief onderzoek en is betrokken bij de grote EU Kids Online-studie die vergelijking van omgang met gevaren en kansen van internet in Europese landen mogelijk maakt. Ze blogt op de site van haar universiteit LSE, wat interessante korte stukken oplevert voor iedereen met interesse in ‘digitale’ kinderen. Onlangs publiceerde ze haar topmythen over kinderen in het digitale tijdperk.

1. Kinderen zijn ‘digital natives’ en weten alles, ouders zijn digitale immigranten en weten niets
Deze mythe is op meerdere plekken, waaronder dit blog, gedebunkt. Dat kinderen zelfverzekerd zijn over hun digitale vaardigheden, betekent niet dat ze het internet begrijpen. Er zit grote variatie tussen kinderen en tussen ouders,

2. Tijd die aan media besteed wordt is verspild in vergelijking met ‘echte’ gesprekken of buitenspelen
De niet-digitale wereld is niet inherent ‘echter’ of ‘beter’ dan de digitale wereld.

3. Ouders moeten kinderen online aan banden leggen omdat de digitale risico’s wegen zwaarder dan de kansen
De online wereld is niet enger dan de offline. Kinderen online beperkingen opleggen neemt niet automatisch gevaren weg, maar belemmert kinderen wel in de mogelijkheden die internet biedt.

4. Kinderen geven niet om privacy
Ze hebben wel andere opvattingen: ze maken zich zorgen over welke bekenden wat van hen weten, maar niet over bedrijven die hun data verzamelen.

5. Mediawijsheid is het antwoord op de uitdagingen van het digitale tijdperk
Meer kennis over bedrijven en inbreuk op privacy lost het probleem niet op, omdat bedrijven je de keuze geven of je gebruikt het product en wij krijgen je data, of je gebruikt het product niet. Onderwijs verandert daar niets aan. Mediawijsheid is een oplossing gericht op het individu: omdat de wereld niet maakbaar is, proberen we het via het individu te doen.

Hoe makkelijk kan je met anonieme data mensen herkennen? (saved you the click: vrij makkelijk)

Onderzoekers van MIT hebben in samenwerking met planologen onderzocht hoe makkelijk geanonimiseerde data die steden verzamelen via camera’s, sensoren,… kan gebruikt worden om de personen toch te herkennen. De onderzoekers gebruikten twee geanonimiseerde datasets van Singapore:

  • mobiele telefoon-bewegingen in de stad
  • informatie van het openbaar vervoer

In beide gevallen wordt een lokatie bewaard, terwijl de informatie verder anoniem was voor de onderzoekers. Door deze twee datasets te vergelijken via verschillende algoritmes, konden de onderzoekers binnen de week 17% van de gebruikers van het openbaar vervoer matchen met een telefoon, na 4 weken 55%, na 11 weken behaalde men 95%. Als ze de GPS-data van de smartphones gebruikten, slaagde men er in binnen de week 95% match te bereiken.

Voor alle duidelijkheid: op dat moment heb je nog niet de namen en gegevens van de personen in kwestie, maar de onderzoekers geven aan dat iemand met slechte bedoelingen hier al heel veel mee komt om vervolgens dit te koppelen aan wie wie is. De onderzoekers concluderen vooral dat geanonimiseerde data geen garantie is op privacy.

Abstract van het onderzoek:

The problem of unicity and reidentifiability of records in large-scale databases has been studied in different contexts and approaches, with focus on preserving privacy or matching records from different data sources. With an increasing number of service providers nowadays routinely collecting location traces of their users on unprecedented scales, there is a pronounced interest in the possibility of matching records and datasets based on spatial trajectories. Extending previous work on reidentifiability of spatial data and trajectory matching, we present the first large-scale analysis of user matchability in real mobility datasets on realistic scales, i.e. among two datasets that consist of several million people’s mobility traces, coming from a mobile network operator and transportation smart card usage. We extract the relevant statistical properties which influence the matching process and analyze their impact on the matchability of users. We show that for individuals with typical activity in the transportation system (those making 3-4 trips per day on average), a matching algorithm based on the co-occurrence of their activities is expected to achieve a 16.8% success only after a one-week long observation of their mobility traces, and over 55% after four weeks. We show that the main determinant of matchability is the expected number of co-occurring records in the two datasets. Finally, we discuss different scenarios in terms of data collection frequency and give estimates of matchability over time. We show that with higher frequency data collection becoming more common, we can expect much higher success rates in even shorter intervals.

Psychologisch onderzoek heeft wellicht een WEIRD probleem

Hoe representatief is psychologisch onderzoek? Na alle berichten over de replicatiecrisis in psychologie, vermoeden misschien enkele lezers dat ik nu over een te kleine steekproef zal beginnen, maar nee, het probleem is ook WEIRD. Wat is WEIRD? De meeste proefpersonen in de huidige onderzoeken komen uit Western, Educated, Industrialised, Rich Democracies. Waarbij je de vraag kan stellen hoe representatief bevindingen uit deze specifieke doelgroep kunnen zijn voor bijvoorbeeld een arme bevolking in Somalië.

Ik botste op dit fenomeen door een nieuwe post op BPS Digest over een onderzoek geleid door Mostafa Salari Rad waarbij men alle artikel uit 2014 en de laatste drie edities ui 2017 van Psychological Science scande op de gebruikte steekproef. Wat stellen de onderzoekers vast in de artikels uit 2014: “57.76% were drawn from the US, 71.25% were drawn from English-speaking countries (including the US and UK), and 94.15% … sampled Western countries (including English-speaking countries, Europe, and Israel).” Dit verbeterde nauwelijks in de steekproef uit 2017.

De onderzoekers stellen niet enkel het fenomeen vast, maar bieden ook suggesties, die je mooi samengevat hier kan terugvinden.

Abstract van het onderzoek:

Two primary goals of psychological science should be to understand what aspects of human psychology are universal and the way that context and culture produce variability. This requires that we take into account the importance of culture and context in the way that we write our papers and in the types of populations that we sample. However, most research published in our leading journals has relied on sampling WEIRD (Western, educated, industrialized, rich, and democratic) populations. One might expect that our scholarly work and editorial choices would by now reflect the knowledge that Western populations may not be representative of humans generally with respect to any given psychological phenomenon. However, as we show here, almost all research published by one of our leading journals, Psychological Science, relies on Western samples and uses these data in an unreflective way to make inferences about humans in general. To take us forward, we offer a set of concrete proposals for authors, journal editors, and reviewers that may lead to a psychological science that is more representative of the human condition.