Update batch size default

JacobSzwejbka · web-flow · commit 06b946e3c649 · 2025-05-20T20:53:03.000-07:00
Differential Revision: D75089945 Pull Request resolved: #11009
diff --git a/examples/models/llama/model_args.py b/examples/models/llama/model_args.py
@@ -14,7 +14,7 @@ class ModelArgs:
     multiple_of: int = 256  # make SwiGLU hidden layer size multiple of large power of 2
     ffn_dim_multiplier: Optional[float] = None
     norm_eps: float = 1e-5
-    max_batch_size: int = 32
+    max_batch_size: int = 1
     max_seq_len: int = 2048
     max_context_len: int = 2048
     moe: bool = False  # True to enable the MoE (Mixture of Experts)