Make seq_len param available in JNI layer generate()

Riandy · web-flow · commit 7b795d7e9385 · 2024-08-16T11:44:30.000-07:00
Differential Revision: D61343892 Pull Request resolved: #4745
diff --git a/extension/android/jni/jni_layer_llama.cpp b/extension/android/jni/jni_layer_llama.cpp
@@ -127,10 +127,11 @@ class ExecuTorchLlamaJni
 
   jint generate(
       facebook::jni::alias_ref<jstring> prompt,
+      jint seq_len,
       facebook::jni::alias_ref<ExecuTorchLlamaCallbackJni> callback) {
     runner_->generate(
         prompt->toStdString(),
-        128,
+        seq_len,
         [callback](std::string result) { callback->onResult(result); },
         [callback](const Stats& result) { callback->onStats(result); });
     return 0;
diff --git a/extension/android/src/main/java/org/pytorch/executorch/LlamaModule.java b/extension/android/src/main/java/org/pytorch/executorch/LlamaModule.java
@@ -22,6 +22,7 @@ public class LlamaModule {
   }
 
   private final HybridData mHybridData;
+  private static final int DEFAULT_SEQ_LEN = 128;
 
   @DoNotStrip
   private static native HybridData initHybrid(
@@ -42,8 +43,19 @@ public void resetNative() {
    * @param prompt Input prompt
    * @param llamaCallback callback object to receive results.
    */
+  public int generate(String prompt, LlamaCallback llamaCallback) {
+    return generate(prompt, DEFAULT_SEQ_LEN, llamaCallback);
+  }
+
+  /**
+   * Start generating tokens from the module.
+   *
+   * @param prompt Input prompt
+   * @param seqLen sequence length
+   * @param llamaCallback callback object to receive results.
+   */
   @DoNotStrip
-  public native int generate(String prompt, LlamaCallback llamaCallback);
+  public native int generate(String prompt, int seqLen, LlamaCallback llamaCallback);
 
   /** Stop current generate() before it finishes. */
   @DoNotStrip