evals.stream

Cross-eval

Come si comporta ogni modello su tutti gli eval. La media «equa» si calcola solo sui modelli presenti in tutti gli eval confrontati.