multivon-ai/multivon-eval

by multivon-ai · RAG Eval · updated today

Practical LLM evaluation for teams that ship to production. Deterministic + LLM-as-judge evaluators, dataset support, CI/CD integration.

momentum

stars

forks

#154

rank

agent-evaluationai-evaluationevalshallucination-detectionllm-as-judgellm-evalllm-evaluationllmopsmlopsprompt-engineeringpythonrag-evaluation

More in RAG Eval