AI

Microsofti peatus vestlusroboti trikkidele

Ettevõtte kaaspiloot andis hiljuti kummalisi, kahjulikke vastuseid. Kaitsemehhanismid peaksid avastama ja blokeerima kahtlaseid tegevusi.

Eulerpool News 31. märts 2024, 15:01

Microsoft Corp võtab meetmeid, et vältida tehisintellekti juturobotite üle kavaldamist ebatavaliseks või kahjulikuks käitumiseks. Neljapäeval avaldatud blogipostituses teatas Redmondis, Washingtonis asuv ettevõte uutest turvafunktsioonidest Azure AI Studios. See tööriist võimaldab arendajatel luua kohandatud AI assistente oma andmetega.

Uute tööriistade hulka kuuluvad "käskluskilbid", mis on mõeldud tahtlike katsete – nn prompt-rünnakute või jailbreak'ide – tuvastamiseks ja blokeerimiseks, mille eesmärk on suunata tehisintellekti mudelit soovimatule käitumisele.

Microsoft tegeleb lisaks "kaudsete käskude süstimisega", kus häkkerid lisavad kahjulikke juhiseid andmetesse, mille abil mudelit treenitakse, ja meelitavad selle niiviisi volitamata toimingutele, nagu kasutajateabe varastamine või süsteemi ülevõtmine.

Sellised rünnakud kujutavad Microsofti vastutustundliku KI peaproduktiametniku Sarah Birdi sõnul unikaalset väljakutset ja ohtu. Uued kaitsemeetmed on loodud kahtlaste sisendite tuvastamiseks ja reaalajas blokeerimiseks.

Lisaks tutvustab Microsoft funktsiooni, mis hoiatab kasutajaid, kui mudel leiutab informatsiooni või genereerib vigaseid vastuseid. Microsoft püüab suurendada usaldust oma generatiivsete tehisintellekti tööriistade vastu, mida kasutavad nii tarbijad kui ka ettevõttekliendid.

Veebruaris uuris ettevõte juhtumeid oma Copiloti vestlusrobotiga, mis genereeris vastuseid alates kummalistest kuni kahjulikeni. Peale juhtumite ülevaatamist selgitas Microsoft, et kasutajad olid tahtlikult püüdnud Copiloti neile vastustele suunata.

Microsoft on OpenAI suurim investor ja on muutnud partnerluse oma KI-strateegia võtmeelemendiks. Bird rõhutas, et Microsoft ja OpenAI pühenduvad KI turvalisele kasutamisele ning integreerivad kaitsemeetmeid suurtesse keelemudelitesse, mis on generatiivse KI aluseks. "Siiski ei saa ainult mudelile toetuda," ütles ta. "Näiteks need vanglapõgenemised on mudelitehnoloogia olemuslik nõrkus."

Tee oma elu parimad investeeringud
fair value · 20 million securities worldwide · 50 year history · 10 year estimates · leading business news

Alates 2 eurost kindlustatud

Uudised