AI

Microsofts Stopp voor Chatbot-gesjoemel

De copiloot van het bedrijf leverde onlangs vreemde, schadelijke antwoorden. Afweermechanismen moeten verdachte activiteiten herkennen en blokkeren.

Eulerpool News 31 mrt 2024, 15:01

Microsoft Corp. neemt maatregelen om te voorkomen dat kunstmatige intelligentie-chatbots door trucs tot ongewoon of schadelijk gedrag worden aangezet. In een blogpost van donderdag kondigde het bedrijf, gevestigd in Redmond, Washington, nieuwe veiligheidsfuncties aan voor Azure AI Studio. Dit hulpmiddel maakt het voor ontwikkelaars mogelijk om op maat gemaakte AI-assistenten met eigen gegevens te creëren.

Nieuwe hulpmiddelen omvatten "Prompt-Schilden", ontworpen om opzettelijke pogingen - zogenaamde prompt-injectieaanvallen of jailbreaks - te detecteren en te blokkeren, die proberen een AI-model tot onbedoeld gedrag te verleiden.

Microsoft richt zich ook op "indirecte promptinjecties", waarbij hackers schadelijke instructies invoegen in de gegevens waarmee een model wordt getraind, waardoor het tot niet-geautoriseerde acties kan worden verleid, zoals het stelen van gebruikersinformatie of het overnemen van een systeem.

Dergelijke aanvallen vormen volgens Sarah Bird, Chief Product Officer van Microsoft voor verantwoorde AI, een unieke uitdaging en bedreiging. De nieuwe verdedigingsmaatregelen zijn ontworpen om verdachte invoer te detecteren en in real-time te blokkeren.

Microsoft introduceert ook een functie die gebruikers waarschuwt wanneer een model verzinsels produceert of foutieve antwoorden genereert. Microsoft streeft ernaar het vertrouwen in zijn generatieve AI-tools te vergroten, die zowel door consumenten als zakelijke klanten worden gebruikt.

In februari onderzocht het bedrijf incidenten met zijn Copilot-chatbot, die alles genereerde van vreemde tot schadelijke antwoorden. Na herziening van de incidenten verklaarde Microsoft dat gebruikers opzettelijk hadden geprobeerd Copilot tot deze antwoorden te verleiden.

Microsoft is de grootste investeerder in OpenAI en heeft het partnerschap tot een sleutelelement van zijn AI-strategie gemaakt. Bird benadrukte dat Microsoft en OpenAI zich wijden aan het veilige gebruik van AI en beschermingsmaatregelen integreren in de grote taalmodellen die de basis vormen voor generatieve AI. "Men kan echter niet alleen op het model vertrouwen", zei ze. "Deze jailbreaks zijn bijvoorbeeld een inherente zwakte van de modeltechnologie."

Doe de beste investeringen van je leven
fair value · 20 million securities worldwide · 50 year history · 10 year estimates · leading business news

Vanaf 2 € veiliggesteld

Nieuws