Home Nieuws Het AI-beveiligingsteam van Microsoft onthult hoe verborgen achterdeurtjes voor trainingen stilletjes overleven...

Het AI-beveiligingsteam van Microsoft onthult hoe verborgen achterdeurtjes voor trainingen stilletjes overleven in bedrijfstaalmodellen

2
0
Het AI-beveiligingsteam van Microsoft onthult hoe verborgen achterdeurtjes voor trainingen stilletjes overleven in bedrijfstaalmodellen


  • Microsoft lanceert een scanner om vergiftigde taalmodellen te detecteren vóór implementatie
  • Backdoor LLM’s kunnen kwaadaardig gedrag verbergen totdat specifieke triggerzinnen verschijnen
  • De scanner identificeert abnormale aandachtspatronen die verband houden met verborgen achterdeurtriggers

Microsoft heeft de ontwikkeling aangekondigd van een nieuwe scanner die is ontworpen om verborgen achterdeurtjes te detecteren in grote, open-source taalmodellen die in bedrijfsomgevingen worden gebruikt.

Het bedrijf zegt dat zijn tool gericht is op het identificeren van gevallen van modelvergiftiging, een vorm van manipulatie waarbij kwaadaardig gedrag tijdens de training rechtstreeks in modelgewichten wordt ingebed.

Nieuwsbron

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in