ChatGPT cita Grokipedia (ecosistema Musk): chi decide le fonti dell’AI?

Alcuni test del Guardian indicano che l’ultimo ChatGPT ha citato Grokipedia, l’enciclopedia AI dell’ecosistema Musk, come fonte. Non è un dettaglio tecnico: qui si gioca la governance dell’informazione. Ecco perché questo cambio di “menù” delle fonti ti riguarda direttamente.

Dal “quanto è bravo il modello” a “chi sceglie le fonti”

Secondo test riportati dal Guardian, ChatGPT avrebbe indicato Grokipedia come fonte su temi sensibili, dall’Iran al negazionismo dell’Olocausto. Il punto non è solo la precisione della singola risposta, ma il perimetro informativo che regola quelle risposte: se cambiano le fonti, cambia il mondo che l’AI ti restituisce.

Questa è la differenza tra abilità tecnica e governance: una risposta brillante può nascondere un elenco di fonti che orientano i fatti, il contesto e, di conseguenza, la tua fiducia. Quando un modello cita, non sta solo mostrando trasparenza: sta dichiarando la sua dieta informativa.

Cos’è Grokipedia e perché fa discutere

Grokipedia è una “enciclopedia” generata dall’intelligenza artificiale e legata all’ecosistema di Elon Musk. A differenza di Wikipedia, non si fonda sulla correzione e sul controllo umano diffuso, ma su contenuti prodotti e aggiornati da un modello AI. È stata criticata per aver amplificato narrazioni estremiste o polarizzanti su temi sociali e politici.

Niente human-in-the-loop sistematico: le modifiche non passano al vaglio di una comunità di editor e moderatori.
Rischio di bias amplificati: se l’AI scrive e l’AI corregge, gli errori e le distorsioni possono autoriprodursi.
Affidabilità opaca: senza processi editoriali chiari, la tracciabilità delle fonti originarie diventa più fragile.

Quando un’AI “cita le fonti”, cosa significa davvero

Le citazioni nei chatbot generativi non equivalgono a peer review. Spesso sono un mix di recupero di documenti (retrieval), riassunto e ranking. Questo introduce almeno tre livelli di scelta che influenzano il risultato finale.

Selezione: quali fonti entrano nel paniere? Piattaforme aperte, contenuti proprietari, enciclopedie AI come Grokipedia o dataset curati?
Ordinamento: quali fonti vengono mostrate per prime? Un link in alto vale più attenzione e più fiducia.
Riscrittura: la sintesi del modello può attenuare, enfatizzare o cambiare il tono del contenuto originale.

OpenAI ha spiegato di attingere a una gamma ampia di fonti pubbliche e di applicare filtri di sicurezza per evitare link ad alto rischio, mostrando citazioni per trasparenza. Bene, ma non basta: senza criteri chiari e audit indipendenti, la delega di fatto del fact-checking a un elenco di fonti “pre-approvate” resta problematica.

Perché la partita delle fonti tocca privacy, lavoro e informazione

Bias e pluralità: se il mix pende verso fonti opache o polarizzate, la rappresentazione della realtà si deforma, soprattutto su temi complessi.
Trasparenza e fiducia: sapere “cosa” è citato è utile; sapere “perché” e “come” è stato scelto è essenziale. Servono log chiari, criteri pubblici e revisioni terze.
Impatto sul lavoro: il ranking delle fonti sposta traffico, monetizzazione e riconoscimento. Se l’AI parafrasa e trattiene l’utente, editori e giornalisti perdono visibilità.
Privacy e potere: chi controlla le fonti e le pipeline di dati controlla anche le tracce informative e il comportamento degli utenti.

Il contesto: gli accordi di Wikipedia e il “modello Grokipedia”

Negli ultimi mesi si discute di accordi tra grandi player dell’AI e Wikipedia per usare contenuti verificati e curati da comunità umane. È una direzione che, almeno in teoria, rende più solida la base informativa dei modelli. L’emergere di Grokipedia come fonte citata va nella direzione opposta: sposta il baricentro su contenuti generati e “controllati” da un’AI, con un controllo umano limitato.

Il risultato? Due visioni in tensione:

Pipeline “umana” (stile Wikipedia): revisione comunitaria, versioning, discussioni pubbliche, accountability.
Pipeline “automatica” (stile Grokipedia): velocità e scalabilità, ma maggiore opacità e rischio di autoreferenzialità del sistema.

Se una piattaforma mainstream come ChatGPT legittima anche la seconda strada, il mercato potrebbe premiare la quantità sulla qualità. E una volta spostato l’equilibrio, tornare indietro è difficile.

Cosa fare adesso: pratiche concrete per utenti e aziende

Per chi usa i chatbot

Controlla sempre le citazioni: apri i link, valuta la reputazione della fonte, verifica altrove.
Chiedi trasparenza: domanda quali criteri sono stati usati per scegliere le fonti e se esistono alternative.
Incrocia le informazioni: confronta con fonti indipendenti e con repository umani (es. discussioni e note di Wikipedia).
Diffida delle risposte “perfette”: stile fluido non significa verità.

Per team e aziende che integrano AI

Curate un elenco di fonti autorevoli: definite whitelist e blacklist, con revisione periodica e criteri pubblici.
Audit e logging: tracciate quali fonti hanno informato ogni output e rendete possibile la verifica ex post.
Evitate il lock-in informativo: non dipendete da una sola piattaforma; integrate più provider e dataset verificati.
Formazione interna: policy di fact-checking e linee guida su citazioni, bias e attribuzioni.

Il punto critico

La domanda non è “posso fidarmi dell’AI?”, ma “posso fidarmi delle sue fonti e di chi le ordina?”. Se la risposta non è verificabile, la trasparenza è apparente e la fiducia resta fragile.

👉 Per scoprire tutti i dettagli e l’opinione personale di Mario Moroni, ascolta la puntata completa su Spotify.