fix #4820

2024-07-15 22:32:07 +08:00 · 2024-07-15 22:32:07 +08:00 · fd8cc49008
parent b0aa321a4a
commit fd8cc49008
1 changed files with 9 additions and 1 deletions
--- a/src/llamafactory/train/sft/metric.py
+++ b/src/llamafactory/train/sft/metric.py
@ -55,7 +55,15 @@ def compute_accuracy(eval_preds: "EvalPrediction") -> Dict[str, float]:
 def eval_logit_processor(logits: "torch.Tensor", labels: "torch.Tensor") -> "torch.Tensor":
-    logits = logits[0] if isinstance(logits, (list, tuple)) else logits
+    if isinstance(logits, (list, tuple)):
        if logits[0].dim() == 3:  # (batch_size, seq_len, vocab_size)
            logits = logits[0]
        else:  # moe models have aux loss
            logits = logits[1]
    if logits.dim() != 3:
        raise ValueError("Cannot process the logits.")
    return torch.argmax(logits, dim=-1)