[Model] Add gemma-2 2b and 9b (#520)

Add gemma-2 2b and 9b to prebuilt models, kept old gemma as well.
mlc-ai · Aug 1, 2024 · 07cb01b · 07cb01b
1 parent 796631d
commit 07cb01b
Show file tree

Hide file tree

Showing 2 changed files with 104 additions and 22 deletions.
diff --git a/examples/simple-chat-ts/src/simple_chat.ts b/examples/simple-chat-ts/src/simple_chat.ts
@@ -342,7 +342,7 @@ let engine: webllm.MLCEngineInterface;
 if (useWebWorker) {
   engine = new webllm.WebWorkerMLCEngine(
     new Worker(new URL("./worker.ts", import.meta.url), { type: "module" }),
-    { appConfig },
+    { appConfig, logLevel: "INFO" },
   );
 } else {
   engine = new webllm.MLCEngine({ appConfig });

diff --git a/src/config.ts b/src/config.ts
@@ -708,65 +708,88 @@ export const prebuiltAppConfig: AppConfig = {
         context_window_size: 2048,
       },
     },
-    // Gemma-2B
+    // Gemma2
     {
-      model: "https://huggingface.co/mlc-ai/gemma-2b-it-q4f16_1-MLC",
-      model_id: "gemma-2b-it-q4f16_1-MLC",
+      model: "https://huggingface.co/mlc-ai/gemma-2-2b-it-q4f16_1-MLC",
+      model_id: "gemma-2-2b-it-q4f16_1-MLC",
       model_lib:
         modelLibURLPrefix +
         modelVersion +
-        "/gemma-2b-it-q4f16_1-ctx4k_cs1k-webgpu.wasm",
-      vram_required_MB: 1476.52,
+        "/gemma-2-2b-it-q4f16_1-ctx4k_cs1k-webgpu.wasm",
+      vram_required_MB: 1895.3,
       low_resource_required: false,
-      buffer_size_required_bytes: 262144000,
       required_features: ["shader-f16"],
       overrides: {
         context_window_size: 4096,
       },
     },
     {
-      model: "https://huggingface.co/mlc-ai/gemma-2b-it-q4f32_1-MLC",
-      model_id: "gemma-2b-it-q4f32_1-MLC",
+      model: "https://huggingface.co/mlc-ai/gemma-2-2b-it-q4f32_1-MLC",
+      model_id: "gemma-2-2b-it-q4f32_1-MLC",
       model_lib:
         modelLibURLPrefix +
         modelVersion +
-        "/gemma-2b-it-q4f32_1-ctx4k_cs1k-webgpu.wasm",
-      vram_required_MB: 1750.66,
+        "/gemma-2-2b-it-q4f32_1-ctx4k_cs1k-webgpu.wasm",
+      vram_required_MB: 2508.75,
       low_resource_required: false,
-      buffer_size_required_bytes: 262144000,
       overrides: {
         context_window_size: 4096,
       },
     },
     {
-      model: "https://huggingface.co/mlc-ai/gemma-2b-it-q4f16_1-MLC",
-      model_id: "gemma-2b-it-q4f16_1-MLC-1k",
+      model: "https://huggingface.co/mlc-ai/gemma-2-2b-it-q4f16_1-MLC",
+      model_id: "gemma-2-2b-it-q4f16_1-MLC-1k",
       model_lib:
         modelLibURLPrefix +
         modelVersion +
-        "/gemma-2b-it-q4f16_1-ctx4k_cs1k-webgpu.wasm",
-      vram_required_MB: 1476.52,
+        "/gemma-2-2b-it-q4f16_1-ctx4k_cs1k-webgpu.wasm",
+      vram_required_MB: 1583.3,
       low_resource_required: true,
-      buffer_size_required_bytes: 262144000,
       required_features: ["shader-f16"],
       overrides: {
         context_window_size: 1024,
       },
     },
     {
-      model: "https://huggingface.co/mlc-ai/gemma-2b-it-q4f32_1-MLC",
-      model_id: "gemma-2b-it-q4f32_1-MLC-1k",
+      model: "https://huggingface.co/mlc-ai/gemma-2-2b-it-q4f32_1-MLC",
+      model_id: "gemma-2-2b-it-q4f32_1-MLC-1k",
       model_lib:
         modelLibURLPrefix +
         modelVersion +
-        "/gemma-2b-it-q4f32_1-ctx4k_cs1k-webgpu.wasm",
-      vram_required_MB: 1750.66,
+        "/gemma-2-2b-it-q4f32_1-ctx4k_cs1k-webgpu.wasm",
+      vram_required_MB: 1884.75,
       low_resource_required: true,
-      buffer_size_required_bytes: 262144000,
       overrides: {
         context_window_size: 1024,
       },
     },
+    {
+      model: "https://huggingface.co/mlc-ai/gemma-2-9b-it-q4f16_1-MLC",
+      model_id: "gemma-2-9b-it-q4f16_1-MLC",
+      model_lib:
+        modelLibURLPrefix +
+        modelVersion +
+        "/gemma-2-9b-it-q4f16_1-ctx4k_cs1k-webgpu.wasm",
+      vram_required_MB: 6422.01,
+      low_resource_required: false,
+      required_features: ["shader-f16"],
+      overrides: {
+        context_window_size: 4096,
+      },
+    },
+    {
+      model: "https://huggingface.co/mlc-ai/gemma-2-9b-it-q4f32_1-MLC",
+      model_id: "gemma-2-9b-it-q4f32_1-MLC",
+      model_lib:
+        modelLibURLPrefix +
+        modelVersion +
+        "/gemma-2-9b-it-q4f32_1-ctx4k_cs1k-webgpu.wasm",
+      vram_required_MB: 8383.33,
+      low_resource_required: false,
+      overrides: {
+        context_window_size: 4096,
+      },
+    },
     // Qwen-2
     {
       model: "https://huggingface.co/mlc-ai/Qwen2-0.5B-Instruct-q4f16_1-MLC",
@@ -1180,6 +1203,65 @@ export const prebuiltAppConfig: AppConfig = {
         context_window_size: 4096,
       },
     },
+    // Gemma-2B
+    {
+      model: "https://huggingface.co/mlc-ai/gemma-2b-it-q4f16_1-MLC",
+      model_id: "gemma-2b-it-q4f16_1-MLC",
+      model_lib:
+        modelLibURLPrefix +
+        modelVersion +
+        "/gemma-2b-it-q4f16_1-ctx4k_cs1k-webgpu.wasm",
+      vram_required_MB: 1476.52,
+      low_resource_required: false,
+      buffer_size_required_bytes: 262144000,
+      required_features: ["shader-f16"],
+      overrides: {
+        context_window_size: 4096,
+      },
+    },
+    {
+      model: "https://huggingface.co/mlc-ai/gemma-2b-it-q4f32_1-MLC",
+      model_id: "gemma-2b-it-q4f32_1-MLC",
+      model_lib:
+        modelLibURLPrefix +
+        modelVersion +
+        "/gemma-2b-it-q4f32_1-ctx4k_cs1k-webgpu.wasm",
+      vram_required_MB: 1750.66,
+      low_resource_required: false,
+      buffer_size_required_bytes: 262144000,
+      overrides: {
+        context_window_size: 4096,
+      },
+    },
+    {
+      model: "https://huggingface.co/mlc-ai/gemma-2b-it-q4f16_1-MLC",
+      model_id: "gemma-2b-it-q4f16_1-MLC-1k",
+      model_lib:
+        modelLibURLPrefix +
+        modelVersion +
+        "/gemma-2b-it-q4f16_1-ctx4k_cs1k-webgpu.wasm",
+      vram_required_MB: 1476.52,
+      low_resource_required: true,
+      buffer_size_required_bytes: 262144000,
+      required_features: ["shader-f16"],
+      overrides: {
+        context_window_size: 1024,
+      },
+    },
+    {
+      model: "https://huggingface.co/mlc-ai/gemma-2b-it-q4f32_1-MLC",
+      model_id: "gemma-2b-it-q4f32_1-MLC-1k",
+      model_lib:
+        modelLibURLPrefix +
+        modelVersion +
+        "/gemma-2b-it-q4f32_1-ctx4k_cs1k-webgpu.wasm",
+      vram_required_MB: 1750.66,
+      low_resource_required: true,
+      buffer_size_required_bytes: 262144000,
+      overrides: {
+        context_window_size: 1024,
+      },
+    },
     // Phi-2
     {
       model: "https://huggingface.co/mlc-ai/phi-2-q4f16_1-MLC",