A New Trick Uses AI to Jailbreak AI Models—Including GPT-4

Will Knight

from on 2023-12-05 11:00 (#6GX9G)

Adversarial algorithms can systematically probe large language models like OpenAI's GPT-4 for weaknesses that can make them misbehave.

External Content

Source	RSS or Atom Feed
Feed Location	http://feeds.wired.com/wired/index
Feed Title
Feed Link	http://feeds.wired.com/

0 comments