Openai embedding fix to support jina-embeddings-v2 #4642

wizd · 2023-11-18T12:47:28Z

Checklist:

I have read the Contributing guidelines.

tested with: https://huggingface.co/jinaai/jina-embeddings-v2-base-en

Merge dev branch

wizd · 2023-11-18T13:10:34Z

tested embedding model:

jinaai/jina-embeddings-v2-base-en
BAAI/bge-large-zh-v1.5

oobabooga · 2023-11-18T23:23:38Z

extensions/openai/completions.py

@@ -235,7 +235,7 @@ def chat_completions_common(body: dict, is_legacy: bool = False, stream=False) -

    max_tokens = generate_params['max_new_tokens']
    if max_tokens in [None, 0]:
-        generate_params['max_new_tokens'] = 4096
+        generate_params['max_new_tokens'] = 200


Setting this high isn't necessary, as the auto_max_new_tokens fills the context. The 200 reference value is used when the context is fully used to remove old messages.

oobabooga · 2023-11-18T23:23:52Z

Looks good, thanks

yhyu13 · 2023-11-20T06:51:28Z

@wizd Does Jina embedding runs on cuda devices? Other setense transformer embedding always lies on CPU even if specifiying cuda

wizd and others added 10 commits November 11, 2023 18:34

update default max_new_tokens to 4096

df8288c

Merge pull request oobabooga#4579 from oobabooga/dev

454fcf3

Merge dev branch

Merge pull request oobabooga#4606 from oobabooga/dev

2337aeb

Merge dev branch

Merge pull request oobabooga#4608 from oobabooga/dev

8a2af87

Merge dev branch

Merge pull request oobabooga#4627 from oobabooga/dev

0ee8d2b

Merge dev branch

Merge pull request oobabooga#4628 from oobabooga/dev

f889302

Merge dev branch

Merge pull request oobabooga#4632 from oobabooga/dev

3146124

Merge dev branch

Merge branch 'oobabooga:main' into openai_embedding_fix

204d967

add support to load embeding model from local path to device (like cuda)

828f6a7

check model name before loading

d3fb920

Small changes

b3b5202

oobabooga reviewed Nov 18, 2023

View reviewed changes

oobabooga changed the base branch from main to dev November 18, 2023 23:24

oobabooga merged commit af76fbe into oobabooga:dev Nov 18, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Openai embedding fix to support jina-embeddings-v2 #4642

Openai embedding fix to support jina-embeddings-v2 #4642

wizd commented Nov 18, 2023 •

edited

Loading

wizd commented Nov 18, 2023

oobabooga Nov 18, 2023

oobabooga commented Nov 18, 2023

yhyu13 commented Nov 20, 2023

Openai embedding fix to support jina-embeddings-v2 #4642

Openai embedding fix to support jina-embeddings-v2 #4642

Conversation

wizd commented Nov 18, 2023 • edited Loading

Checklist:

wizd commented Nov 18, 2023

oobabooga Nov 18, 2023

Choose a reason for hiding this comment

oobabooga commented Nov 18, 2023

yhyu13 commented Nov 20, 2023

wizd commented Nov 18, 2023 •

edited

Loading