Commit 80c1d03

committed

Update on "[Excutorch][Llama] Decouple input sequence length from kv cache context length"

Decouple max sequence length, for shape dynamism in torch.export, from sequence length used for kv cache sizing. Differential Revision: [D68448334](https://our.internmc.facebook.com/intern/diff/D68448334/) cc mergennachin cccclai helunwencser dvorjackz [ghstack-poisoned]

2 parents c092a77 + 637acaf commit 80c1d03Copy full SHA for 80c1d03

0 file changed

-0

lines changed

0 file changed

-0

lines changed

Comments

(0)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Commit 80c1d03

0 file changed

0 file changed

File tree

0 file changed

0 file changed

0 commit comments