LLM: fix mistral hidden_size setting for deepspeed autotp #10527

plusbang · 2024-03-25T06:33:45Z

Description

Background: #10507
When run mistral/neural-chat inference with Deepspeed AutoTP, tensor shape error is caused by wrong hidden_size

This PR fixes following error:

plusbang mentioned this pull request Mar 25, 2024

Run neural-chat 7b inference with Deepspeed on Flex 140. #10507

Open

plusbang requested a review from MeouSker77 March 25, 2024 07:42

MeouSker77 approved these changes Mar 25, 2024

View reviewed changes

fix

b210b9e

plusbang merged commit 0a3e4e7 into intel-analytics:main Mar 26, 2024
17 checks passed