oobabooga · oobabooga · Nov 18, 2023 · Nov 11, 2023 · Nov 13, 2023 · Nov 15, 2023
diff --git a/extensions/openai/completions.py b/extensions/openai/completions.py
@@ -235,7 +235,7 @@ def chat_completions_common(body: dict, is_legacy: bool = False, stream=False) -
 
     max_tokens = generate_params['max_new_tokens']
     if max_tokens in [None, 0]:
-        generate_params['max_new_tokens'] = 4096
+        generate_params['max_new_tokens'] = 200
         generate_params['auto_max_new_tokens'] = True
 
     requested_model = generate_params.pop('model')

diff --git a/extensions/openai/embeddings.py b/extensions/openai/embeddings.py
@@ -1,11 +1,11 @@
 import os
 
 import numpy as np
+from transformers import AutoModel
 
 from extensions.openai.errors import ServiceUnavailableError
 from extensions.openai.utils import debug_msg, float_list_to_base64
 from modules.logging_colors import logger
-from transformers import AutoModel
 
 embeddings_params_initialized = False
 
@@ -43,11 +43,11 @@ def load_embedding_model(model: str):
     try:
         print(f"Try embedding model: {model} on {embeddings_device}")
         if 'jina-embeddings' in model:
-            embeddings_model = AutoModel.from_pretrained(model, trust_remote_code=True) # trust_remote_code is needed to use the encode method
-            # Move the model to the device
+            embeddings_model = AutoModel.from_pretrained(model, trust_remote_code=True)  # trust_remote_code is needed to use the encode method
             embeddings_model = embeddings_model.to(embeddings_device)
         else:
             embeddings_model = SentenceTransformer(model, device=embeddings_device)
+
         print(f"Loaded embedding model: {model}")
     except Exception as e:
         embeddings_model = None