Cyber AI România

Cum verifici răspunsurile generate de AI și recunoști informațiile inventate sau incorecte

Un răspuns bine formulat nu este automat și corect. Modelele AI pot prezenta cu multă siguranță date greșite, citate inexistente, legi interpretate incorect sau studii complet inventate. NIST folosește termenul „confabulație” pentru situațiile în care un sistem AI generează și prezintă conținut fals ori eronat ca fiind adevărat.

Verificarea trebuie făcută înainte ca răspunsul să fie publicat, trimis unui client sau folosit pentru luarea unei decizii.

Pasul 1: separă faptele de explicații și recomandări

Copiază răspunsul într-o conversație nouă și folosește:

Extrage din răspuns toate afirmațiile care pot fi verificate.

Creează un tabel cu:
Afirmația | Tipul informației | Sursa necesară | Nivelul de risc

Folosește tipurile: dată, statistică, citat, lege, persoană,
instituție, specificație tehnică, calcul sau recomandare.

Nu verifica încă afirmațiile și nu adăuga informații noi.

Afirmații precum „legea a intrat în vigoare la 1 iunie”, „studiul arată o creștere de 35%” sau „instituția oferă acest serviciu” trebuie verificate. Formulările de tipul „ar putea fi util” reprezintă opinii sau recomandări, nu fapte confirmate.

Pasul 2: verifică mai întâi informațiile cu risc ridicat

Prioritatea nu este lungimea răspunsului, ci consecința unei erori. Consideră cu risc ridicat informațiile despre:

  • sănătate și tratamente;
  • legi, taxe, vize și termene oficiale;
  • bani, investiții și contracte;
  • securitate cibernetică;
  • acuzații despre persoane sau firme;
  • știri recente;
  • actualizări și vulnerabilități software.

Pentru aceste domenii, răspunsul AI trebuie tratat doar ca punct de pornire.

Pasul 3: cere surse precise

Trimite modelului următorul prompt:

Pentru fiecare afirmație factuală, indică:
- instituția sau autorul;
- titlul exact al sursei;
- data publicării sau actualizării;
- linkul direct;
- fragmentul care susține afirmația.

Dacă nu poți identifica o sursă verificabilă, scrie „NECONFIRMAT”.
Nu inventa titluri, linkuri, citate sau numere de documente.

Acest prompt poate scoate la suprafață problemele, dar nu dovedește că sursele sunt reale. Un model poate inventa inclusiv referințe care par credibile.

Pasul 4: deschide fiecare sursă

Nu te opri la existența unui link. Verifică:

  1. Linkul se deschide?
  2. Pagina aparține instituției sau autorului indicat?
  3. Titlul și data corespund?
  4. Informația apare efectiv în pagină?
  5. Sursa spune exact ce susține AI-ul sau doar discută un subiect apropiat?
  6. Documentul este încă valabil?

O sursă despre „protecția conturilor” nu confirmă automat o afirmație despre un atac produs ieri.

Pasul 5: caută sursa primară

Folosește cu prioritate:

  • textul oficial al legii, nu un articol care îl rezumă;
  • comunicatul instituției, nu o postare care îl citează;
  • studiul original, nu relatarea unui blog;
  • documentația producătorului, nu un tutorial vechi;
  • raportul financiar oficial, nu o captură distribuită pe rețele sociale.

Pentru știri importante, confirmă informația și printr-o a doua sursă credibilă, independentă de prima.

Pasul 6: controlează data și versiunea

Informația poate fi reală, dar expirată. Verifică data publicării, ultima actualizare, țara vizată și versiunea produsului.

Pentru software, caută numărul versiunii. Pentru legislație, verifică dacă actul a fost modificat sau abrogat. Pentru taxe și beneficii, confirmă anul fiscal și perioada de aplicare.

Pasul 7: verifică separat citatele, statisticile și calculele

Pentru un citat, caută formularea în documentul original. Dacă nu apare exact, nu utiliza ghilimele.

Pentru statistici, verifică unitatea, perioada, eșantionul și instituția care a colectat datele. „A crescut cu 20%” nu înseamnă automat o creștere de 20 de puncte procentuale.

Refă manual calculele importante sau folosește un tabel de calcul. Cere AI-ului formula, nu doar rezultatul.

Pasul 8: cere o verificare adversarială

După verificarea manuală, folosește:

Încearcă să demonstrezi că răspunsul anterior este greșit.

Identifică:
- afirmațiile fără sursă directă;
- sursele care nu susțin concluzia;
- datele posibil depășite;
- contradicțiile;
- presupunerile prezentate ca fapte;
- întrebările la care răspunsul corect este „nu știm”.

Nu rescrie textul și nu completa golurile prin presupuneri.

Această etapă ajută la audit, dar nu înlocuiește controlul surselor originale.

Semne că răspunsul poate fi inventat

Fii atent când AI-ul oferă detalii foarte precise fără linkuri, combină informații din țări diferite, citează studii imposibil de găsit, schimbă răspunsul după o întrebare simplă sau folosește expresii precum „conform experților” fără să-i numească.

OpenAI confirmă că modelele pot inventa date, definiții, citate și referințe, chiar dacă răspunsul pare sigur. Google avertizează similar că existența surselor lângă un răspuns nu garantează corectitudinea acestuia. Regula practică rămâne simplă: dacă nu poți confirma informația în sursa originală, nu o publica drept fapt.

Surse folosite

Facebook
X
WhatsApp

Cuprins


Te-ar putea interesa si: