Microsofti peatus vestlusroboti trikkidele

Eulerpool News 31. märts 2024, 15:01

Microsoft Corp võtab meetmeid, et vältida tehisintellekti juturobotite üle kavaldamist ebatavaliseks või kahjulikuks käitumiseks. Neljapäeval avaldatud blogipostituses teatas Redmondis, Washingtonis asuv ettevõte uutest turvafunktsioonidest Azure AI Studios. See tööriist võimaldab arendajatel luua kohandatud AI assistente oma andmetega.

Uute tööriistade hulka kuuluvad "käskluskilbid", mis on mõeldud tahtlike katsete – nn prompt-rünnakute või jailbreak'ide – tuvastamiseks ja blokeerimiseks, mille eesmärk on suunata tehisintellekti mudelit soovimatule käitumisele.

Microsoft tegeleb lisaks "kaudsete käskude süstimisega", kus häkkerid lisavad kahjulikke juhiseid andmetesse, mille abil mudelit treenitakse, ja meelitavad selle niiviisi volitamata toimingutele, nagu kasutajateabe varastamine või süsteemi ülevõtmine.

Sellised rünnakud kujutavad Microsofti vastutustundliku KI peaproduktiametniku Sarah Birdi sõnul unikaalset väljakutset ja ohtu. Uued kaitsemeetmed on loodud kahtlaste sisendite tuvastamiseks ja reaalajas blokeerimiseks.

Lisaks tutvustab Microsoft funktsiooni, mis hoiatab kasutajaid, kui mudel leiutab informatsiooni või genereerib vigaseid vastuseid. Microsoft püüab suurendada usaldust oma generatiivsete tehisintellekti tööriistade vastu, mida kasutavad nii tarbijad kui ka ettevõttekliendid.

Veebruaris uuris ettevõte juhtumeid oma Copiloti vestlusrobotiga, mis genereeris vastuseid alates kummalistest kuni kahjulikeni. Peale juhtumite ülevaatamist selgitas Microsoft, et kasutajad olid tahtlikult püüdnud Copiloti neile vastustele suunata.

Microsoft on OpenAI suurim investor ja on muutnud partnerluse oma KI-strateegia võtmeelemendiks. Bird rõhutas, et Microsoft ja OpenAI pühenduvad KI turvalisele kasutamisele ning integreerivad kaitsemeetmeid suurtesse keelemudelitesse, mis on generatiivse KI aluseks. "Siiski ei saa ainult mudelile toetuda," ütles ta. "Näiteks need vanglapõgenemised on mudelitehnoloogia olemuslik nõrkus."

AI

Microsofti peatus vestlusroboti trikkidele

Tee oma elu parimad investeeringud
fair value · 20 million securities worldwide · 50 year history · 10 year estimates · leading business news

Uudised

Valitsus plaanib muudatusi Suurbritannia väljaostutööstuse ja jõukate välismaalaste jaoks

Spotify: Tulu kasvu ja kulude vähendamise viljad lähevad kaubaks

Heineken teatab netokahjumist seoses osaluse allahindlusega Hiina õlletehases

YouTube registreerib sportsegmendis tugeva kasvu

NHS-i järelevalveamet blokeerib AstraZeneca rinnavähiravimi

Tee oma elu parimad investeeringud fair value · 20 million securities worldwide · 50 year history · 10 year estimates · leading business news