La teoria dei giochi ai tempi del Covid-19Tempo di lettura stimato: 16 min

Categories per l'individuo, per la società

di Felice Giuliani

Decisioni individuali, conseguenze collettive

Photo by Hello I’m Nik 🎞 on Unsplash

La situazione che stiamo vivendo nel corso dell’attuale pandemia da Covid-19 pone gli individui di fronte a delle sfide di diversa natura, evidenziando, tra le tante dinamiche complesse, la natura strettamente interconnessa di alcuni comportamenti decisionali. Questo concetto può essere analizzato prendendo come riferimento la questione legata alle misure di contenimento del contagio, che hanno riguardato e stanno riguardando l’Italia, da quando è in atto l’emergenza Coronavirus, o Covid-19. Misure dalle quali dipenderebbe la riduzione dei danni provocati dal contagio.

Il rispetto di tali misure da parte di tutti è considerato indispensabile al fine di evitare quanto più possibile la libera circolazione delle persone fino a quando il fattore di contagio non sarà sceso al di sotto di una determinata soglia. A questo punto, inizia a configurarsi uno scenario nel quale il comportamento del singolo individuo non ha un impatto solo su sé stesso, ma anche, e soprattutto, su altri N individui, dove con N ci si riferisce al numero di potenziali persone che un singolo portatore di Covid-19 (anche asintomatico) può contagiare.

Questo genere di dinamica, non solo legata al contagio, è in realtà alla base di tante altre situazioni della vita quotidiana in una società composta da individui le cui azioni sono quasi sempre inevitabilmente interconnesse. Tuttavia, in questo caso specifico, tale dinamica è particolarmente rilevante, nonché estremamente evidente per effetto dell’attenzione mediatica che sta ricevendo nelle ultime settimane. Da un punto di vista comportamentale, la teoria dei giochi e, più nello specifico, il dilemma del prigioniero, potrebbero offrirci una lente attraverso la quale andare a guardare alcuni aspetti specifici del fenomeno in questione.

Collaborare o non collaborare? Questo è il dilemma…

Il dilemma del prigioniero è un gioco non cooperativo in cui le scelte congiunte (ma indipendenti) di due giocatori determinano il payoff (cioè la ricompensa) di ciascuno dei due giocatori. Le sue origini risalgono al 1950, quando due matematici, Merrill Flood e Melvin Dresher, svilupparono la prima versione mentre erano in servizio presso la RAND Corporation (Research ANd Development), un think tank nordamericano che offriva supporto, in termini di analisi e ricerca, alle forze armate degli Stati Uniti. Successivamente, il matematico Albert W. Tucker formalizzò l’idea, dando origine al dilemma del prigioniero (prisoner’s dilemma) così come lo conosciamo oggi. Stando ad alcune fonti, è probabile che Tucker si sia confrontato con John Nash (premio Nobel per l’economia e famoso proprio per il suo prezioso contributo alla teoria dei giochi) durante la formulazione del famoso dilemma (Peterson, 2015).

Il Dilemma del Prigioniero – Heritage Project

Lo scenario proposto dal gioco è il seguente (adattamento e traduzione da Kuhn, 2019):

Tizio e Caio sono stati arrestati per aver rapinato una banca e messi in due celle di isolamento separate. Entrambi hanno molto più a cuore la propria libertà personale piuttosto che il benessere del complice. Uno scaltro procuratore (che non ha sufficienti prove per condannarli) fa la seguente offerta ad ognuno di loro: “Puoi scegliere se confessare o rimanere in silenzio. Se confessi, e il tuo complice rimane in silenzio, farò cadere tutte le accuse contro di te e userò la tua testimonianza per assicurarmi che al tuo complice venga dato il massimo della pena. Allo stesso modo, se il tuo complice confessa, e tu rimani in silenzio, lui sarà libero e tu sconterai il massimo della pena. Se entrambi confessate, verrete entrambi condannati, ma mi assicurerò di farvi avere una riduzione della pena. Se entrambi rimarrete in silenzio, dovrò accontentarmi di dare ad entrambi una pena simbolica per possesso di armi da fuoco. Se desideri confessare, lascia una nota alla guardia carceraria prima del mio ritorno domani mattina”.

Qui il “dilemma” dei due prigionieri è dato dal fatto che, qualunque cosa l’altro prigioniero faccia, è meglio confessare che rimanere in silenzio. Tuttavia, il risultato che otterrebbero confessando entrambi (lieve sconto della pena) è peggiore rispetto a quello che otterrebbero se invece entrambi restassero in silenzio (condanna simbolica per possesso d’armi).

Vediamola più analiticamente dalla prospettiva di Tizio. Se Tizio confessasse, la cosa peggiore che potrebbe succedere sarebbe che lo faccia anche Caio. Quindi, entrambi verrebbero condannati con una riduzione della pena (scenario A). Se invece Caio dovesse rimanere in silenzio, Tizio verrebbe addirittura assolto (scenario B). Se invece Tizio non confessasse, la cosa peggiore che potrebbe succedere sarebbe che Caio invece confessi, facendo scontare a Tizio la massima pena (scenario C). Se invece anche Caio non confessasse, allora entrambi prenderebbero solo la pena simbolica (scenario D).

La strategia confessa implica la possibilità che sia A che B si verifichino dove, per Tizio, B risulta essere il miglior scenario possibile ed A una situazione appena migliore di quella peggiore (scenario C). La strategia non confessa implica invece che C e D si verifichino, dove, per Tizio, C risulta essere il peggior scenario possibile e D il secondo miglior scenario possibile dopo B (assoluzione totale). Ricapitolando, in termini di utilità (o payoff, che in questo caso è rappresentata dalla riduzione degli anni di galera) che Tizio può ottenere, avremo che:

 

B (4) > D (3) > A (2) > C (1)

 

Siccome la somma di B + A, che sono i due scenari associati alla strategia confessa, è maggiore rispetto alla somma di D + C, che sono i due scenari associati alla strategia non confessa, la strategia confessa è considerata quella dominante. Quanto detto finora vale esattamente allo stesso modo per Caio, per cui avremo che anche per lui la strategia dominante sarà confessa. Quindi, con l’obiettivo di massimizzare la propria utilità, due decisori perfettamente razionali confesserebbero, trovandosi così entrambi nella situazione A. Tuttavia, come si può vedere dallo schema di sopra, lo scenario A è il secondo peggior scenario possibile per entrambi (condanna con sconto della pena). Lo scenario migliore per entrambi è invece il D (condanna simbolica). Messa in questi termini, la scelta dei due prigionieri è tra il collaborare l’un l’altro (strategia non confessa) e il non collaborare (confessa).

Vediamo adesso cosa accadrebbe se applicassimo questo modello alla situazione in cui ogni individuo, in tempi di restrizioni da Covid-19, deve prendere decisioni specifiche. Partendo da quanto brevemente accennato nell’introduzione, e senza voler entrare nel merito dell’efficacia o meno rispetto alle misure proposte per il contenimento del contagio, possiamo schematizzare la quesitone nel modo seguente: 1) senza considerare il vincolo imposto dalle sanzioni (che renderebbe la questione molto più complessa), ogni individuo può scegliere se rispettare le regole imposte dalla quarantena oppure trasgredirle; 2) ogni individuo sceglie individualmente, ma il risultato delle sue azioni dipenderà anche da quello che faranno gli altri individui. Semplificando, pensiamo ad N decisori che devono fare una singola scelta: collaborare (cioè rispettare le regole) o non collaborare (quindi trasgredirle). Partendo da questa schematizzazione del problema, proviamo ora ad immaginare tre possibili scenari che dipendono dall’interazione tra le scelte dei singoli individui.

Scenario A – Nessuno collabora

Decisione individuale: ogni decisore sceglie in base al proprio personale stato di bisogno soggettivo, senza porre alcun vincolo alla propria libertà personale.

Conseguenza collettiva: ogni decisore continua a condurre la propria vita normalmente, favorendo la diffusione del contagio in una ristretta unità di tempo, aumentando notevolmente le probabilità che lui stesso, o le persone a lui vicine, non possano ricevere cure adeguate in caso di contagio associato a sintomi gravi.

È la situazione in cui sia Tizio che Caio confessano (non collaborando l’un l’altro), venendo entrambi condannati con una riduzione della pena (ricordate che nella formulazione di Kuhn, Tizio e Caio hanno molto più a cuore la propria libertà personale piuttosto che il benessere del complice?).

Scenario D – Tutti collaborano

Decisione individuale: ogni decisore sceglie in base allo stato di bisogno collettivo, rinunciando alla propria libertà personale.

Conseguenza collettiva: ogni decisore riduce al minimo indispensabile i propri spostamenti, favorendo il contenimento del contagio e aumentando notevolmente le probabilità che lui stesso, o le persone a lui vicine, possano ricevere cure adeguate in caso di contagio associato a sintomi gravi.

È la situazione in cui entrambi, sia Tizio che Caio non confessano (collaborando l’un l’altro), venendo entrambi condannati ad una pena simbolica.

Scenario B e C – Per ogni cittadino che collabora, ce n’è uno che non collabora

Decisione individuale: alcuni decisori scelgono in base allo stato di bisogno collettivo, altri in base al proprio personale stato di bisogno soggettivo.

Conseguenza collettiva: chi non collabora, oltre a non rinunciare a nulla in termini di libertà personale, trae vantaggio dal sacrificio fatto da chi collabora (riduzione, seppure parziale, del rischio di non ricevere cure adeguate in caso di contagio associato a sintomi gravi). Chi collabora invece, oltre a fare rinunce in termini di libertà personale, vede ridursi l’impatto dei propri sacrifici, per sé stesso e per le persone a lui vicine.

È la situazione in cui Tizio non confessa (collaborando con il complice) quando Caio invece confessa (non collaborando con il complice). Caio esce immediatamente di galera, mentre Tizio ci resta più a lungo di quanto ci sarebbe rimasto in tutti gli alti tre scenari possibili.

Photo by Branimir Balogović on Unsplash

A questo punto, è necessario introdurre un altro concetto fondamentale per comprendere meglio come funziona questo modello: l’equilibrio di Nash. Quando due giocatori si trovano entrambi nello scenario A (condanna con riduzione della pena), perché hanno entrambi adottato la strategia dominante (ossia non collabora), a nessuno dei due conviene cambiarla, a meno che non lo faccia anche l’altro. Infatti, se Tizio e Caio avessero entrambi deciso di confessare, ma poi Tizio cambiasse idea e non confessasse, se anche Caio non facesse lo stesso, Tizio sconterebbe il massimo della pena (mentre Caio uscirebbe immediatamente di galera). La stessa cosa vale all’inverso per Caio. Questa può essere considerata una situazione di equilibrio, in cui a nessuno dei due prigionieri conviene cambiare unilateralmente. Come Nash stesso disse in un’intervista, l’equilibrio si viene a creare nel momento in cui nessuno riesce a migliorare in maniera unilaterale la propria situazione. E poi aggiunge che “per cambiare, occorre agire insieme”. Estendendo questo principio alla situazione delle restrizioni comportamentali anti-contagio, si può vedere come, per passare da uno stato in cui nessuno collabora ad uno in cui tutti collaborano, sarebbe necessario che tutti insieme collaborassimo. Infatti, se due ipotetici decisori N1 ed N2, in un dato momento, non stessero rispettando le regole imposte dalla quarantena, trovandosi in una situazione di equilibrio, nessuno dei due, individualmente, avrà interesse a porsi in isolamento rinunciando alla propria libertà (finendo così nello scenario C), a meno che non siano entrami, collettivamente, a farlo (finendo entrambi nello scenario D).

Cosa accadrebbe dunque se si rompesse l’equilibrio di Nash e tutti passassero da uno stato non collaborativo ad uno collaborativo nel dilemma del prigioniero? Si raggiungerebbe il cosiddetto ottimo paretiano, cioè uno stato di cose in cui non è possibile migliorare la propria situazione senza peggiorare quella dell’altro. Infatti, se sia Tizio e Caio si trovassero nello scenario D (pena simbolica per entrambi), ma Caio cambiasse idea e confessasse, da un lato Caio migliorerebbe la propria condizione (uscendo di galera), ma a discapito di Tizio, che sconterebbe il massimo della pena. La stessa cosa accadrebbe se N1 ed N2 stessero entrambi rispettando le regole della quarantena e, improvvisamente, N2 decidesse di iniziare a vivere di nuovo la sua vita normalmente. N1 si ritroverebbe ad affrontare inutilmente i sacrifici della quarantena, perché questi sarebbero in parte vanificati da N2, che invece non starebbe più facendo alcun sacrificio.

Come si può notare quindi, l’equilibrio di Nash possiede una forza intrinseca, avendo il potere di rimanere stabile nel tempo. Chi sarebbe disposto a sacrificarsi per primo, collaborando, sapendo che l’altro potrebbe sfruttare la cosa a proprio vantaggio, non collaborando? Di contro, l’ottimo paretiano, per quanto possa portare un beneficio collettivo superiore all’equilibrio di Nash, è intrinsecamente debole, infatti non è un equilibrio. In questa condizione l’individuo sarebbe continuamente tentato dalla possibilità di smettere di collaborare, approfittandosi del fatto che l’altro (o gli altri) lo stiano ancora facendo. Questa azione romperebbe l’equilibrio perché, successivamente, anche chi era inizialmente collaborativo smetterebbe di esserlo, visto che non ne avrebbe più convenienza (verrebbe solo sfruttato da chi non collabora). Questo tipo di dinamica rimanda al concetto del “rendere pan per focaccia” (la strategia del tit for tat di Axelrod) che si trova nella versione del dilemma del prigioniero ad interazioni ripetute.

Facendo un ulteriore passo avanti, si arriva al modello della tragedia dei beni comuni (per approfondimenti vedi Tragedies of Commons in Kuhn, 2019), che potremmo considerare una variante a più giocatori del dilemma del prigioniero. Questo modello ci dice che se il numero di individui che cooperano fosse anche solo di poco superiore (ad es. 60%) a quello degli individui che non cooperano (ad es. 40%), ma questo bastasse a garantire benefici significativi per tutti in termini di contenimento del contagio, questo sarebbe un equilibrio di Nash. A chi sta collaborando non conviene smettere di farlo, perché il vantaggio che otterrebbe dalla maggior libertà di movimento verrebbe annullato dallo svantaggio legato al fatto di contribuire ad una crisi sanitaria, di cui lui stesso e i propri cari potrebbero essere vittima. Chi non sta collaborando invece non ha interesse a smettere di farlo, dato che sta già usufruendo dei benefici dovuti al contenimento del contagio senza dover fare alcuno sforzo in tal senso. Paradossalmente però, questa situazione è anche un ottimo paretiano, in quanto non è possibile migliorare la propria situazione senza peggiorare quella dell’altro. Infatti, chi non sta collaborando si trova già nel miglior scenario possibile (gode dei benefici senza pagare i costi), quindi non può migliorare ulteriormente. Invece, se ad esempio una parte degli individui che stava collaborando (poniamo il 20%) smettesse di farlo, l’efficacia dell’intero sistema anti-contagio sarebbe compromessa e non ci sarebbero più benefici per nessuno. A questo punto avremmo un certo numero di persone che sta ancora collaborando (40%), sacrificandosi inutilmente, e un certo numero di persone che invece non sta collaborando (60%), e che quindi né si sacrifica né usufruisce di alcun beneficio.

 

Dai modelli alla realtà

I modelli teorici, per quanto affascinanti e suggestivi, sono delle semplificazioni della realtà. È possibile che i modelli proposti non descrivano per nulla ciò che abbiamo osservato nelle ultime settimane o che lo descrivano in maniera parziale. Certamente, è altamente improbabile che possano cogliere la complessità dell’intera questione, che meriterebbe spazi di approfondimento molto più ampi di questo.

Fatta questa doverosa premessa, proviamo comunque a ragionare su quello che potremmo imparare da questi modelli. La tragedia dei beni comuni potrebbe far riflettere sul motivo per il quale assistiamo, a volte, ad un fenomeno di stigmatizzazione sociale delle persone che “non collaborano”, cioè che non stano rispettando le regole imposte dalla quarantena. Questo è un esempio di come il modello non colga la complessità della realtà, in quanto i motivi che portano una persona a “non collaborare”, infrangendo le regole imposte dalla quarantena, possono essere i più disparati. La motivazione a non collaborare potrebbe dipendere da un interesse economico, affettivo, di salute, e via discorrendo. Una persona che “non collabora” potrebbe in realtà essere confusa rispetto a quali siano le regole da seguire. I soggetti che collaborano o non collaborano potrebbero essere non solo persone fisiche ma anche aziende. E così via fino a poter elencare una serie di altre variabili che renderebbero i modelli sopra descritti progressivamente più complessi. Dovremmo quindi fare attenzione a non etichettare persone e comportamenti come faremmo se fossero variabili di un modello teorico.

Un’altra precisazione che va fatta è che, nella realtà, le persone non si comportano sempre come ci si aspetterebbe da due perfetti ottimizzatori di utilità come i nostri prigionieri Tizio e Caio: la strategia dominante “non collabora” non è sempre l’opzione preferita (vedi ad esempio Andreoni & Miller, 1993). Infine, nella teoria dei giochi, il decisore può calcolare esattamente il suo payoff, perché tutte le informazioni gli vengono date a priori. La realtà quotidiana invece presenta il più delle volte degli scenari incerti e di difficile lettura. Le decisioni finiscono quindi per essere prese in maniera piuttosto approssimativa e niente affatto razionali.

Al netto di tutte queste considerazioni, possiamo ancora imparare qualcosa della teoria dei giochi ai tempi delle restrizioni da Covid-19? Probabilmente sì.

La collaborazione, oltre ad essere la chiave per il successo di una strategia finalizzata al raggiungimento di un obiettivo comune, potrebbe diventare necessaria alla nostra sopravvivenza. In un sistema interconnesso, dove ogni nostra decisione, pure rimanendo individuale e libera, produce un effetto su altri individui le cui decisioni a loro volta avranno un impatto su di noi, agire in un’ottica strettamente individualistica potrebbe non essere più sostenibile. Infatti, quello che l’attuale pandemia ci sta mostrando chiaramente è proprio il livello di interdipendenza raggiunto dagli individui a livello globale.

Un’altra cosa su cui potremmo riflettere è che il trovarsi in una situazione di crisi potrebbe portare le persone a focalizzarsi maggiormente sui propri bisogni urgenti e immediati. Degli esempi potrebbero essere gli assalti ai supermercati, la corsa alle mascherine, i rientri nei paesi di origine dalle zone rosse. Quando si avverte la minaccia di rimanere senza cibo, senza protezione dal contagio oppure isolati in una situazione ostile, che queste minacce siano reali o solo percepite, il non focalizzarsi sui propri bisogni immediati diventa difficile.

Infine, l’esperienza che abbiamo avuto finora sembra suggerirci che per raggiungere alti livelli di collaborazione durante un’epidemia, questa debba essere forzata tramite apposite leggi. Il che dimostra quanto sia difficile, nella realtà, uscire da un equilibrio non collaborativo. E questo dovrebbe far riflettere.

Collaborare o non collaborare, questo è il dilemma. Sarà forse una delle grandi sfide che ci troveremo ad affrontare in un mondo fatto di decisioni individuali e conseguenze collettive?

Felice Giuliani, psicologo e dottore di ricerca. Tra i suoi principali argomenti di ricerca troviamo i contributi allo studio dei processi cognitivi coinvolti nella percezione del valore economico. Ha inoltre condotto alcune ricerche empiriche sul dilemma del prigioniero e sulla presa di decisione in condizioni di rischio. Ha pubblicato su diverse riviste scientifiche internazionali ed è stato visiting PhD student al Max Planck Institute for Human Development di Berlino dove ha collaborato con il gruppo di Gerd Gigerenzer.
LinkedIn | Research Gate

 

 

 

 

Bibliografia

Andreoni, J., & Miller, J. H. (1993). Rational cooperation in the finitely repeated prisoner’s dilemma: Experimental evidence. The economic journal103(418), 570-585.

Kuhn, Steven, “Prisoner’s Dilemma”, The Stanford Encyclopedia of Philosophy (Winter 2019 Edition), Edward N. Zalta (ed.).

Peterson, Martin (ed), 2015, The Prisoner’s Dilemma, Cambridge: Cambridge University Press.

https://www.corriere.it/cronache/20_marzo_02/rizzardini-limitiamo-nostri-contatti-sociali-venerdi-faremo-primo-bilancio-ed3e5922-5cc9-11ea-9c1d-20936483b2e0.shtml

https://it.wikipedia.org/wiki/Equilibrio_di_Nash

https://espresso.repubblica.it/visioni/cultura/2008/03/11/news/john-nash-genio-e-follia-1.7633

https://it.wikipedia.org/wiki/Ottimo_paretiano

https://en.wikipedia.org/wiki/Tit_for_tat

Economia comportamentale è un blog collaborativo, il che significa che gli autori dei post cambiano di volta in volta e spesso un articolo viene scritto anche a quattro mani! Se anche tu vuoi collaborare con noi visita la sezione Contatti del nostro sito.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *