Sigurnost AI sustava15. lipnja 2026. · 13 min čitanja
Sigurnost LLM i RAG aplikacija: što tvrtka mora znati
Aplikacije nad velikim jezičnim modelima donose nove rizike koje klasična sigurnost ne pokriva. Evo glavnih prijetnji LLM i RAG sustava i kako ih smanjiti.
Sve više tvrtki gradi aplikacije nad velikim jezičnim modelima (LLM), često uz pristup zvan RAG, gdje model odgovara koristeći vlastite dokumente i bazu znanja tvrtke. Takve aplikacije donose stvarnu vrijednost, ali i napadnu površinu koja se ne ponaša kao klasični softver. Ulaz je prirodni jezik, a model je nedeterminističan, pa stari obrasci obrane ne pokrivaju nove rizike. Ovaj tekst objašnjava glavne prijetnje LLM i RAG aplikacija i kako ih smanjiti.
Ovo je dio našeg pregleda sigurnosti AI sustava. Procjenu i jačanje AI aplikacija pružamo kroz sigurnost umjetne inteligencije.
Zašto su LLM aplikacije poseban slučaj
Klasična aplikacija ima predvidljiv ulaz i izlaz. LLM aplikacija prima slobodan tekst i generira slobodan tekst, pa napadač može uputama u prirodnom jeziku pokušati promijeniti ponašanje sustava. Uz to, model nema ugrađen pojam povjerljivosti: ako ima pristup nekom podatku, može ga u odgovoru otkriti. Zato sigurnost mora biti u tome što model smije, ne u tome kako ga molimo da se ponaša.
Glavni rizici
OWASP održava zaseban popis najvažnijih rizika LLM aplikacija.1 Najvažniji su sljedeći.
Rizik
Što znači
Prompt injection
Napadač uputama mijenja ponašanje modela ili zaobilazi pravila.
Curenje podataka
Model u odgovoru otkrije osjetljive ili tuđe podatke.
Trovanje baze znanja
Zlonamjeran sadržaj u dokumentima RAG sustava utječe na odgovore.
Prekomjerne ovlasti
Model smije pokretati radnje šire nego što bi smio.
Nepouzdan izlaz
Aplikacija slijepo vjeruje tekstu koji je model generirao.
Najčešći rizici LLM i RAG aplikacija.
Poseban rizik RAG sustava
RAG sustav odgovara koristeći dokumente koje mu tvrtka da. To donosi dvije opasnosti. Prva je kontrola pristupa: ako model dohvaća dokumente bez provjere tko ih smije vidjeti, korisnik može kroz pitanje doći do podataka za koje nema ovlasti. Druga je trovanje: ako u bazu znanja uđe dokument sa skrivenim uputama, te upute mogu utjecati na buduće odgovore. Kontrola pristupa dokumentima mora vrijediti i za model, ne samo za korisnika.
Kako smanjiti rizik
Sigurnost LLM aplikacije gradi se u arhitekturi, ne u tekstu prompta.2
01
Ograničite ovlasti modela
Model dobiva pristup samo podacima i radnjama koje su nužne za zadatak.
02
Poštujte kontrolu pristupa u RAG-u
Dohvat dokumenata mora poštovati prava korisnika koji postavlja pitanje.
03
Provjeravajte izlaz
Ne vjerujte slijepo tekstu modela; provjerite ga prije nego pokrene radnju.
04
Filtrirajte i pratite
Bilježite upite i odgovore te pratite sumnjive obrasce.
05
Testirajte protivnički
Provjerite otpornost na prompt injection i pokušaje curenja podataka.
Rješava li bolji sistemski prompt sigurnost LLM aplikacije?+
Ne. Model upute u promptu i upute u korisničkom unosu vidi kao isti tekst, pa ga vješt unos može nadjačati. Stvarne kontrole su ograničene ovlasti modela i provjera izlaza, dakle arhitektura.
Koji je glavni rizik RAG sustava?+
Dva su glavna: dohvat dokumenata bez poštovanja prava korisnika, čime se dolazi do tuđih podataka, i trovanje baze znanja zlonamjernim dokumentima koji utječu na buduće odgovore.
Može li LLM otkriti podatke kojima ima pristup?+
Da. Model nema ugrađen pojam povjerljivosti, pa ako ima pristup nekom podatku, može ga otkriti u odgovoru. Zato treba ograničiti čemu model uopće smije pristupiti.
Pomaže li OWASP kod sigurnosti LLM aplikacija?+
Da. OWASP održava zaseban popis najvažnijih rizika LLM aplikacija, koji je dobra polazna referenca za procjenu i testiranje takvih sustava.
Izvori
1OWASP. OWASP Top 10 for Large Language Model Applications. Open Worldwide Application Security Project, 2025. Poveznica
2NIST. AI Risk Management Framework (AI RMF 1.0). National Institute of Standards and Technology, 2023. Poveznica
Želite li ovakvu provjeru na vlastitim sustavima?
Naš tim definirat će opseg posla s vama u 30-minutnom razgovoru.