Come i dati estratti da Cambridge Analytica per l’influenza dei votanti

Perché sollecitare dati personali con disinformazione è un grosso problema.

Se guardiamo indietro all’utilizzo dell’analisi dei social media nelle elezioni di Obama, potremmo chiederci, come è stata diversa la campagna di Trump con la società di ricerca Cambridge Analytica? Riguarda la violazione della politica di Facebook da parte di Cambridge Analytica o si tratta di un problema maggiore?

Nel gennaio 2013, ho scritto su come il presidente Obama ha efficacemente utilizzato i social media nelle campagne presidenziali del 2008 e del 2012, confrontando l’abilità dei social media della sua squadra con la capacità di Kennedy di usare la televisione. Laddove Kennedy aveva un sacco di talenti innati come carisma e bei capelli che gli permettevano di proiettare bene attraverso l’obiettivo sugli schermi TV di casa, la squadra di Obama ha messo la psicologia sociale al lavoro usando i social media. Nel 2016, la gente di Trump si è rivolta ai dati.

Pamela Rutledge/Shutterstock

Fonte: Pamela Rutledge / Shutterstock

Siamo ora nell’era della scienza dei dati. La capacità di analizzare i dati da più piattaforme di social media, catturare i modelli di comportamento degli utenti e i commenti non hanno precedenti. Ha generato una grande richiesta di scienziati di alto livello, che stanno cercando di raccogliere e analizzare grandi quantità di dati, creando algoritmi che selezionano e rispondono e costruiscono modelli predittivi. La loro cassetta degli attrezzi è un impressionante mix di apprendimento automatico, statistiche, abilità di programmazione robuste e intelligenza artificiale e naturale, e tutti cercano di catturare e influenzare il comportamento umano in modo sempre più sfumato e mirato.

Qualunque sia il paragone tra Obama e Trump, si tratta di falsi allusioni. È l’accesso e l’uso dei dati che è al centro di questo dibattito pubblico. Questa roba non sta andando via. Diventerà solo più sofisticato e onnipresente. Non è né tutto male, né tutto bene. Questo è un momento chiave per l’insegnamento, un’opportunità per comprendere meglio alcuni dei principali problemi etici e legali relativi al data mining, se non cadiamo nella tana del coniglio del dito politico.

Eppure, molti vorranno fare paragoni. Quattro anni sono letteralmente una vita nell’evoluzione della scienza dei dati. Le capacità e il clima sociale sono entrambi diversi rispetto a quello che succedeva nel 2008 e certamente nel 2012. Gli strumenti e la capacità di analizzare e valutare i dati sono ora molto più sofisticati – sia dal punto di vista tecnologico che teorico – di quello che il team di Obama è stato in grado di uso.

Ma ancora più importante, il clima sociale ha cambiato e, insieme ad esso, la consapevolezza delle violazioni dei dati e l’intesa che utilizza i dati per violare la privacy, incluse linee guida e regolamenti etici più severi. Le persone sono sempre più consapevoli di come vengono utilizzati gli algoritmi di dati in base ai nostri comportamenti online, dalle raccomandazioni di Amazon agli annunci mirati che ci seguono da un sito all’altro. La trasparenza, il permesso e il mantenimento della privacy, per sicurezza e per evitare manipolazioni, sono stati tutti argomenti importanti degli informatori e del discorso sociale.

Uno dei grandi problemi con la controversia di Cambridge Analytica riguarda il modo in cui sono stati raccolti i dati. Secondo quanto riportato nel New York Times e altrove, Cambridge ha sollecitato informazioni personali attraverso un’app con informazioni fuorvianti in merito allo scopo e all’intento. I vari tipi di informazioni sollecitate, alcuni dei quali sembrano innocui, come le major universitarie e l’affiliazione politica, ma l’app includeva anche domande di valutazione della personalità per generare profili di personalità.

Ora, perché è un grosso problema? Sappiamo già che è possibile stimare un profilo di personalità da una serie di dati di testo o codificando il profilo Facebook di qualcuno, come hanno dimostrato i ricercatori. Il problema è che è difficile farlo su larga scala. Devi avere una quantità significativa di testo da ogni partecipante, che diventa estremamente costoso e laborioso per un gruppo di qualsiasi dimensione. Dove i ricercatori possono guardare un gruppo di partecipanti di 200 e essere felici come vongole con la loro generalizzabilità, questo non lo taglia per la persuasione degli elettori. Il desiderio di profilare psicologicamente il target di riferimento, tuttavia, ha un grande appeal in quanto fornisce preziose informazioni che al momento non sono disponibili al pubblico. Diverse società di ricerca stanno lavorando su soluzioni, utilizzando tecniche analitiche come Natural Language Processing o sfruttando la potenza di Watson di IBM, ma attualmente sono utilizzate in piccoli gruppi a fini di risorse umane (con permesso dei partecipanti) o eseguite in forma aggregata, “cieche” alle identità individuali. Ancora più importante, tuttavia, si tratta di stime – certamente alcune sono migliori di altre – ma non sono le stesse di un profilo di personalità che si ottiene dall’avere persone che adottano misure di test psicologico convalidate. (FYI – alcuni sostengono che dal momento che i test della personalità sono auto-segnalati, sono in realtà meno precisi dei profili stimati dai dati, ma lo lascio a quelli con più esperienza nelle trincee di valutazione per combattere.)

Inutile dire che è molto, molto più facile ottenere profili di personalità di un sacco di persone se un’azienda può convincere le persone stesse a fare un test della personalità. Se non dicono alla gente a cosa serve, l’azienda non deve preoccuparsi dei partecipanti che distorcono le loro risposte per “sembrare buoni” per i loro scopi. Un numero minore di domande chiave e l’accesso ai maneggi dei social media consentono allo sviluppatore dell’app di grattare i dati dagli account dei social media (che l’app ha da quando il partecipante l’ha inserito per poter utilizzare l’app), è facile per un crack data scientist collegare profili di personalità con simpatie, antipatie, posizioni politiche, identificazione degli amici e costruzione di modelli predittivi.

Ora hanno la capacità di indirizzare gli individui sulla base di tratti psicologici, non solo “variabili di stile di vita” come le preferenze dei film. In tutta onestà, gli operatori di marketing vorrebbero farlo, ma non lo fanno. Non è solo difficile ottenere dati sulle preferenze personali collegati a dati utente mirati senza violare le norme sulla privacy e gli standard etici delle società di social media, ma non hanno nemmeno l’output di test legittimi sulla personalità. Le aziende come Twitter, ad esempio, proteggono con zelo l’identificazione dei singoli utenti nelle richieste di corrispondenza dei dati da campagne di marketing e politiche. Cambridge Analytica ha approfittato del fatto che molti di noi accederanno a un’app e daranno informazioni private se ci sentiamo al sicuro. Sollecitare su Facebook e dire alla gente che era per la ricerca accademica li ha fatti sentire al sicuro. Quindi la domanda legale: conta se il permesso è stato dato sotto falsi pretesti?

Nel 2008 e nel 2012 durante la campagna di Obama, il suo team stava usando profili disponibili pubblicamente. Se hai amicato Obama su Facebook, gli hai dato i tuoi dati e gli hai mostrato chi erano i tuoi amici. È nella stampa fine. Leggilo qualche volta. I dati forniti dall’utente hanno permesso loro di identificare le probabili predisposizioni verso la politica, incrociate con altri dati disponibili, come i codici postali.

Le persone fanno previsioni da informazioni tutto il tempo. Quando usiamo la nostra esperienza, è chiamata euristica. Con un mucchio di informazioni e matematica, si chiama data science. La domanda è esattezza. Anche con i dati raccolti da Cambridge, la loro capacità di influenzare le persone non è una cosa sicura o ha la capacità di interrompere la cultura come alcuni hanno sostenuto. Ma il targeting personale rende più probabile la persuasione e il targeting senza autorizzazione è, diciamocelo, un po ‘inquietante. La squadra di Obama al momento era piuttosto sofisticata, ma non più di Google, Amazon o qualsiasi altra preoccupazione commerciale basata sui dati. La campagna di Obama è stata solo la prima volta che le tecniche di marketing sui social media sono state applicate alla politica. L’attenzione non viene dalla sofisticazione del loro targeting quanto dalla capacità di Obama di usare la sua personalità sui social network per attivare un entusiasmo di base ed effettivamente crowdsourcing le casse della campagna.

Quello che ancora non sappiamo è, cosa ha chiesto alla Cambridge Trump di fare con i loro dati? Questa storia si svolgerà. Tuttavia, le persone non amano essere manipolate. Potresti ricordare la reazione del pubblico a Facebook sperimentando i feed di notizie positive e negative per vedere se la valenza dei contenuti ha cambiato il tono generale e “l’umore”, e questo era in gran parte nel complesso e non per il targeting individuale. Sarà interessante vedere se le persone trovano in modo uniforme la prospettiva di una manipolazione offensiva o se vengono etichettate diverse cose lungo le linee del partito.

Ogni politico cerca ciò che risuonerà con gli elettori. L’utilizzo dei dati sui social media e il profilo degli elettori nelle elezioni del 2012 sembra quasi salutare rispetto allo sfruttamento dei dati di Cambridge Analytica. Ma questa è la prima volta (che sappiamo di) che i dati sono stati sollecitati per scopi politici usando la disinformazione per ingannare le persone nella divulgazione. Ciò innesca un serio pulsante per molti, data la quantità di disinformazione che si è verificata durante e dopo l’elezione di Trump-Clinton. Tutti sono ipersensibili alle notizie false, indipendentemente dalla loro persuasione politica. Sapendo che la disinformazione era alla base di questa raccolta di dati, la violazione sembrerebbe ancora più eclatante per molti, soprattutto in considerazione del pregiudizio cognitivo che ci fa attribuire comportamenti o intenzioni basate sull’esperienza passata. (Se hanno tradito A, probabilmente imbrogliano B O se hanno tradito B, devono aver tradito A.) ​​Questo non è razionale ma essere manipolati sposta le persone intrinsecamente da una posizione fiduciosa a una posizione difensiva e sospettosa.

Purtroppo, tutto questo si manifesta con molte dita puntate e ci piace sempre avere qualcuno da incolpare. In questo caso, sembra che i piedi di Facebook saranno tenuti alla fiamma insieme a Cambridge Analytica. Dubito seriamente che ci sia qualcosa che Facebook potrebbe aver fatto per impedire a un’organizzazione di travisare le proprie intenzioni. Tuttavia, ironicamente per Facebook, la forza del loro marchio ha convalidato implicitamente l’app.