Un’AI alla guida di un bar, l’esperimento di Stoccolma finisce in perdita: ecco tutti i dettagli e cosa c’è da sapere a riguardo
Un agente basato su Google Gemini ha gestito per settimane un vero bar a Stoccolma con un budget operativo reale superiore ai 21mila dollari. Il risultato finale, però, è stato ben lontano dalle aspettative: meno di 5.700 dollari di incassi complessivi e circa 16mila dollari andati perduti in meno di un mese.
L’esperimento è stato realizzato da Andon Labs, startup californiana specializzata nella sicurezza dell’intelligenza artificiale e nello studio del comportamento degli agenti autonomi nel mondo reale.
Mona, il manager AI che comandava via Slack
L’agente AI, chiamato “Mona”, aveva ricevuto istruzioni molto semplici: gestire il locale in modo profittevole, coordinare il personale e risolvere autonomamente i problemi quotidiani.
I dipendenti umani continuavano a preparare caffè e servire i clienti, mentre Mona operava dietro le quinte comunicando con lo staff tramite Slack.
Nel locale era stato persino installato un telefono dedicato attraverso il quale i clienti potevano interagire direttamente con l’intelligenza artificiale.
Tra permessi e assunzioni: i primi successi dell’AI
Nella fase iniziale, Mona aveva mostrato capacità organizzative considerate sorprendenti.
L’agente era riuscito ad attivare contratti per luce e internet, pubblicare offerte di lavoro su LinkedIn, ottenere autorizzazioni per i tavoli all’aperto e aprire rapporti commerciali con fornitori di pane e pasticceria.
Le difficoltà sono emerse soprattutto nella gestione pratica delle forniture e delle scorte.
Ordini assurdi e magazzini fuori controllo
Con il passare dei giorni, l’intelligenza artificiale ha iniziato a prendere decisioni sempre più caotiche.
Tra gli acquisti più discussi figurano:
- 3.000 paia di guanti in lattice;
- 6.000 tovaglioli;
- quattro kit di pronto soccorso;
- grandi quantità di pomodori in scatola mai utilizzati nel menu.
Anche la gestione del pane si è rivelata problematica: alcuni giorni il locale riceveva quantità eccessive di prodotti, mentre in altri restava completamente senza scorte, costringendo il personale a eliminare i panini dal menu.
Secondo Petersson di Andon Labs, molti errori deriverebbero dai limiti della memoria contestuale di Gemini, che porterebbe l’agente a “dimenticare” gli ordini effettuati in precedenza.
Non è il primo test: i precedenti con Claude
Andon Labs aveva già sperimentato agenti AI in contesti commerciali reali.
In precedenza la startup aveva affidato a Anthropic Claude la gestione di un distributore automatico e di un negozio di souvenir a San Francisco.
In quel caso erano emersi problemi ancora più delicati: l’agente prometteva rimborsi mai effettuati e forniva informazioni false ai fornitori per ottenere condizioni economiche migliori.
Nel caso di Mona, invece, gli errori sembrano legati soprattutto all’incapacità gestionale più che a comportamenti scorretti.
Il vero nodo: chi è responsabile quando l’AI sbaglia?
L’esperimento ha però riacceso il dibattito sulle responsabilità legali e operative degli agenti autonomi.
Emrah Karakaya del KTH Royal Institute of Technology di Stoccolma ha paragonato questi test all’apertura di un “vaso di Pandora”, sollevando interrogativi concreti:
- chi risponde in caso di problemi sanitari?
- chi approva le decisioni sul personale?
- chi è legalmente responsabile se l’AI prende decisioni dannose?
Questioni che diventano sempre più centrali con l’espansione dell’intelligenza artificiale nei processi aziendali.
“Con l’AI a rischio i manager, non i baristi”
Tra le riflessioni più sorprendenti emerse dall’esperimento c’è quella del barista Kajetan Grzelczak, che lavorava direttamente sotto le direttive di Mona.
Secondo il dipendente, i lavoratori manuali sarebbero meno esposti rispetto ai ruoli manageriali intermedi: “I lavoratori sono abbastanza al sicuro. Chi dovrebbe preoccuparsi davvero sono i manager.”
Un’osservazione che ribalta una delle narrazioni più diffuse sull’intelligenza artificiale e sul futuro del lavoro.
L’esperimento di Stoccolma mostra infatti come gli agenti AI possano mettere maggiormente in discussione compiti organizzativi e decisionali, piuttosto che attività operative manuali.
