AI

Microsoftov zaustavlja trikove s chatbotovima

Kopilot poduzeća je nedavno isporučio čudne, štetne odgovore. Obrambeni mehanizmi bi trebali prepoznati i blokirati sumnjive aktivnosti.

Eulerpool News 31. ožu 2024. 15:01

Microsoft Corp poduzima mjere kako bi spriječio da se umjetna inteligencija chatbotovi uz pomoć trikova navedu na neobično ili štetno ponašanje. U blog postu od četvrtka, tvrtka sa sjedištem u Redmondu, Washington, najavila je nove sigurnosne značajke za Azure AI Studio. Ovaj alat omogućava programerima da stvore prilagođene AI pomoćnike s vlastitim podacima.

Među novim alatima su „Prompt-shieldovi“ koji su osmišljeni za prepoznavanje i blokiranje namjernih pokušaja – tzv. napada injektiranjem upita ili proboja – koji ciljaju na navođenje AI modela na neželjeno ponašanje.

Microsoft se bavi i "indirektnim injekcijama naredbi", pri čemu hakeri umetnu štetne naredbe u podatke s kojima se model trenira, potičući ga na neautorizirane radnje poput krađe korisničkih informacija ili preuzimanja sustava.

Takvi napadi predstavljaju jedinstveni izazov i prijetnju prema Sarah Bird, glavnoj direktorici za proizvode odgovorne umjetne inteligencije u Microsoftu. Nove mjere obrane dizajnirane su da prepoznaju sumnjive unose i blokiraju ih u stvarnom vremenu.

Microsoft uvodi funkciju koja upozorava korisnike kada model izmišlja ili generira pogrešne odgovore. Microsoft teži jačanju povjerenja u svoje generativne AI alate koji se koriste od strane potrošača kao i poslovnih klijenata.

U veljači je tvrtka istraživala incidente s svojim chatbotom Copilotom koji je generirao odgovore od čudnih do štetnih. Nakon pregleda incidenta, Microsoft je objasnio da su korisnici namjerno pokušavali izmamiti takve odgovore od Copilota.

Microsoft je najveći ulagač u OpenAI i partnerstvo je učinio ključnim elementom svoje strategije umjetne inteligencije. Bird je naglasio da se Microsoft i OpenAI posvećuju sigurnoj upotrebi AI te integriraju zaštitne mjere u velike jezične modele koji leže u osnovi generativne AI. „Međutim, ne može se osloniti isključivo na model“, rekla je. „Ovi 'jailbreaks', na primjer, predstavljaju inherentnu slabost tehnologije modela.“

Učini najbolje investicije svog života
fair value · 20 million securities worldwide · 50 year history · 10 year estimates · leading business news

Od 2 eura osigurajте

Novosti