huggingface · Vaibhavs10 · Jun 7, 2024 · Jun 6, 2024 · Jun 6, 2024 · Jun 7, 2024
@@ -326,6 +326,43 @@ export const sklearn = (model: ModelData): string[] => {
 	}
 };
 
+export const stable_audio_tools = (model: ModelData): string[] => [
+	`import torch
+import torchaudio
+from einops import rearrange
+from stable_audio_tools import get_pretrained_model
+from stable_audio_tools.inference.generation import generate_diffusion_cond
+
+device = "cuda" if torch.cuda.is_available() else "cpu"
+
+# Download model
+model, model_config = get_pretrained_model("${model.id}")
+sample_rate = model_config["sample_rate"]
+sample_size = model_config["sample_size"]
+
+model = model.to(device)
+
+# Set up text and timing conditioning
+conditioning = [{
+	"prompt": "128 BPM tech house drum loop",
+}]
+
+# Generate stereo audio
+output = generate_diffusion_cond(
+	model,
+	conditioning=conditioning,
+	sample_size=sample_size,
+	device=device
+)
+
+# Rearrange audio batch to a single sequence
+output = rearrange(output, "b d n -> d (b n)")
+
+# Peak normalize, clip, convert to int16, and save to file
+output = output.to(torch.float32).div(torch.max(torch.abs(output))).clamp(-1, 1).mul(32767).to(torch.int16).cpu()
+torchaudio.save("output.wav", output, sample_rate)`,
+];
+
 export const fastai = (model: ModelData): string[] => [
 	`from huggingface_hub import from_pretrained_fastai
 

@@ -361,6 +361,14 @@ export const MODEL_LIBRARIES_UI_ELEMENTS = {
 			term: { path: "hyperparams.yaml" },
 		},
 	},
+	"stable-audio-tools": {
+		prettyLabel: "Stable Audio Tools",
+		repoName: "stable-audio-tools",
+		repoUrl: "https://github.com/Stability-AI/stable-audio-tools.git",
+		filter: false,
+		countDownloads: { term: { path: "model.safetensors" } },
+		snippets: snippets.stable_audio_tools,
+	},
 	"stable-baselines3": {
 		prettyLabel: "stable-baselines3",
 		repoName: "stable-baselines3",