language model load from checkpoint error #295

omerarshad · 2022-10-14T21:01:05Z

🐛 Bug

Saving aggregated checpoint for language modeling transformer gives error

RuntimeError: Error(s) in loading state_dict for LanguageModelingTransformer:
	Missing key(s) in state_dict: "model.lm_head.weight".

To Reproduce

from pytorch_lightning.utilities.deepspeed import convert_zero_checkpoint_to_fp32_state_dict

convert_zero_checkpoint_to_fp32_state_dict(
    "./recreate_model/epoch=0-step=363.ckpt/",
    "./recreate_model/pytorch_model.bin"
 )

# Load best model from aggregated checkpoint file
best_model = LanguageModelingTransformer.load_from_checkpoint(
    "./recreate_model/pytorch_model.bin"
)

The text was updated successfully, but these errors were encountered:

Borda · 2022-11-21T09:30:58Z

could you please share the full trace? 🐰
seems to be a duplicate of #273 (comment) so lets keep only one 🦦

omerarshad added bug / fix Something isn't working help wanted Extra attention is needed labels Oct 14, 2022

Borda closed this as completed Nov 21, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

language model load from checkpoint error #295

language model load from checkpoint error #295

omerarshad commented Oct 14, 2022 •

edited by Borda

Loading

Borda commented Nov 21, 2022 •

edited

Loading

language model load from checkpoint error #295

language model load from checkpoint error #295

Comments

omerarshad commented Oct 14, 2022 • edited by Borda Loading

🐛 Bug

To Reproduce

Borda commented Nov 21, 2022 • edited Loading

omerarshad commented Oct 14, 2022 •

edited by Borda

Loading

Borda commented Nov 21, 2022 •

edited

Loading