Change default values for decode bucket flags #316

iboiko-habana · 2024-09-23T08:42:17Z

Change default values for decode bucket flags

michalkuligowski · 2024-09-23T09:36:58Z

README_GAUDI.md

@@ -388,7 +388,7 @@ INFO 08-02 17:37:54 habana_worker.py:190] Initializing cache engine took 23.73 G
 INFO 08-02 17:37:54 habana_model_runner.py:1066] [Warmup][Prompt][1/24] batch_size:4 seq_len:1024 free_mem:55.43 GiB
 ...
 INFO 08-02 17:38:22 habana_model_runner.py:1066] [Warmup][Decode][48/48] batch_size:1 seq_len:128 free_mem:55.43 GiB
-INFO 08-02 17:38:22 habana_model_runner.py:1159] Using 15.85 GiB/55.43 GiB of free device memory for HPUGraphs, 7.923 GiB for prompt and 7.923 GiB for decode (VLLM_GRAPH_PROMPT_RATIO=0.5)
+INFO 08-02 17:38:22 habana_model_runner.py:1159] Using 15.85 GiB/55.43 GiB of free device memory for HPUGraphs, 7.923 GiB for prompt and 7.923 GiB for decode (VLLM_GRAPH_PROMPT_RATIO=0.3)


Ration does not map the log in the line (the "7.923 GiB for prompt and 7.923 GiB for decode")

after review

iboiko-habana added 2 commits September 23, 2024 11:38

Change default values for decode bucket flags

b58f077

Change VLLM_GRAPH_PROMPT_RATIO default value to 0.3

3816ba0

michalkuligowski reviewed Sep 23, 2024

View reviewed changes

Update README_GAUDI.md

eb2ca78

after review

michalkuligowski approved these changes Sep 25, 2024

View reviewed changes

michalkuligowski merged commit 45ee586 into habana_main Sep 25, 2024
19 checks passed

iboiko-habana mentioned this pull request Sep 26, 2024

[Bug]: Unexpected decode graph compilation after preemption #158

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Change default values for decode bucket flags #316

Change default values for decode bucket flags #316

iboiko-habana commented Sep 23, 2024

michalkuligowski Sep 23, 2024

iboiko-habana Sep 25, 2024

Change default values for decode bucket flags #316

Change default values for decode bucket flags #316

Conversation

iboiko-habana commented Sep 23, 2024

michalkuligowski Sep 23, 2024

Choose a reason for hiding this comment

iboiko-habana Sep 25, 2024

Choose a reason for hiding this comment