AI safety guardrails easily thwarted, security study finds

from www.theregister.com - Articles on 2023-10-12 07:28 (#6FGH5)

OpenAI GPT-3.5 Turbo chatbot defenses dissolve with '20 cents' of API tickling

The "guardrails" created to prevent large language models (LLMs) such as OpenAI's GPT-3.5 Turbo from spewing toxic content have been shown to be very fragile....

Source	RSS or Atom Feed
Feed Location	http://www.theregister.co.uk/headlines.atom
Feed Title	www.theregister.com - Articles
Feed Link	https://www.theregister.com/