Commit 8a24dfb

committed

Update base for Update on "[Excutorch][Llama] Decouple input sequence length from kv cache context length"

Decouple max sequence length, for shape dynamism in torch.export, from sequence length used for kv cache sizing. Differential Revision: [D68448334](https://our.internmc.facebook.com/intern/diff/D68448334/) cc mergennachin cccclai helunwencser dvorjackz [ghstack-poisoned]

1 parent 637acaf commit 8a24dfbCopy full SHA for 8a24dfb

0 file changed

-0

lines changed

0 file changed

-0

lines changed

Comments

(0)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Commit 8a24dfb

0 file changed

0 file changed

File tree

0 file changed

0 file changed

0 commit comments