The Eval Index / Red Teaming & Safety / #178

whitecircle/circle-guard-bench

by whitecircle · Red Teaming & Safety · updated 3mo ago

First-of-its-kind AI benchmark for evaluating the protection capabilities of large language model (LLM) guard systems (guardrails and safeguards)

momentum

stars

forks

#178

rank

aibenchmarkbenchmarkingguardrailguardrailsjailbreaklarge-language-modellarge-language-modelsllmllm-as-a-judgellm-evalllm-evaluation

More in Red Teaming & Safety