Microsoftin Stoppi Chatbot-Kikkailuille

31.3.2024 klo 15.01

Yrityksen kopilotti toimitti äskettäin outoja, haitallisia vastauksia. Puolustusmekanismien tulisi tunnistaa ja estää epäilyttävät toimet.

Eulerpool News 31. maalisk. 2024 klo 15.01

Microsoft Corp. ryhtyy toimiin estääkseen keinotekoisen älykkyyden chatbotteja huijataan epätavalliseen tai haitalliseen käytökseen. Yhtiö, jonka pääkonttori sijaitsee Redmondissa, Washingtonissa, ilmoitti torstaina blogikirjoituksessa uusista turvatoimista Azure AI Studiolle. Tämä työkalu mahdollistaa kehittäjien luoda räätälöityjä AI-assistentteja omilla tiedoillaan.

Uusiin työkaluihin kuuluvat "kehotussuojat", jotka on suunniteltu tunnistamaan ja estämään tahalliset yritykset – niin sanotut kehotusinjektiohyökkäykset tai jailbreakit – joilla pyritään houkuttelemaan tekoälymalli ei-toivottuun käyttäytymiseen.

Microsoft puuttuu myös "epäsuoriin käskevaihtoihin", joissa hakkerit syöttävät haitallisia komentoja koulutettavan mallin tietoihin, houkutellen sen tekemään luvattomia toimia kuten käyttäjätietojen varastamista tai järjestelmän kaappaamista.

Tällaiset hyökkäykset ovat Microsoftin vastuullisen tekoälyn pääjohtaja Sarah Birdin mukaan ainutlaatuinen haaste ja uhka. Uudet puolustustoimenpiteet on suunniteltu tunnistamaan epäilyttävät syötteet ja estämään ne reaaliajassa.

Lisäksi Microsoft ottaa käyttöön toiminnon, joka varoittaa käyttäjiä, jos malli tekee keksintöjä tai tuottaa virheellisiä vastauksia. Microsoft pyrkii vahvistamaan luottamusta sen generatiivisiin tekoälytyökaluihin, joita käyttävät sekä kuluttaja- että yritysasiakkaat.

Helmikuussa yritys tutki tapauksia, joissa sen Copilot-keskustelurobotti tuotti outoja ja vahingollisia vastauksia. Tapausten tarkastelun jälkeen Microsoft ilmoitti, että käyttäjät olivat tahallaan yrittäneet saada Copilotin antamaan näitä vastauksia.

Microsoft on OpenAI:n suurin sijoittaja ja on tehnyt kumppanuudesta avainelementin KI-strategiassaan. Bird korosti, että Microsoft ja OpenAI sitoutuvat turvallisen tekoälyn käyttöön ja integroivat suojatoimenpiteitä suuriin kielimalleihin, jotka ovat generatiivisen tekoälyn perustana. "Mutta ei voi luottaa pelkästään malliin", hän sanoi. "Nämä jailbreakit esimerkiksi ovat malliteknologian synnynnäinen heikkous."

Tee elämäsi parhaat sijoitukset
fair value · 20 million securities worldwide · 50 year history · 10 year estimates · leading business news

Alkaen 2 euroa

Uutiset