[fix] Fix model loading inconsistency after Peft training by using PeftModel #2980

pesuchin · 2024-10-11T09:17:50Z

Pull Request Overview

We have tried an implementation that uses PeftModel to load models trained by Peft.

Experiment

Evaluation Results of Experiment: Case of Using PeftModel

The following script was used to calculate the evaluation results.

from sentence_transformers import SentenceTransformer, SentenceTransformerTrainingArguments, SentenceTransformerTrainer, losses
from datasets import load_dataset

train_dataset = load_dataset("sentence-transformers/all-nli", "triplet", split="train").select(range(100))
eval_dataset = load_dataset("sentence-transformers/all-nli", "triplet", split="dev").select(range(100))

model_name = "sentence-transformers-testing/stsb-bert-tiny-safetensors" 
model = SentenceTransformer(model_name)

from peft import LoraConfig, TaskType, get_peft_model
peft_config = LoraConfig(
    target_modules=["dense"],
    task_type=TaskType.FEATURE_EXTRACTION,
    inference_mode=False,
    r=8,
    lora_alpha=32,
    lora_dropout=0.1,
)

model._modules["0"].auto_model = get_peft_model(
    model._modules["0"].auto_model, peft_config
)

train_loss = losses.CachedMultipleNegativesRankingLoss(model, mini_batch_size=1)
args = SentenceTransformerTrainingArguments("working_dir")
trainer = SentenceTransformerTrainer(
    model=model,
    args=args,
    train_dataset=train_dataset,
    eval_dataset=eval_dataset,
    loss=train_loss,
    evaluator=eval_dataset,
)
trainer.train()
test_dataset = load_dataset("sentence-transformers/stsb", split="test")
test_evaluator = EmbeddingSimilarityEvaluator(
    sentences1=test_dataset["sentence1"],
    sentences2=test_dataset["sentence2"],
    scores=test_dataset["score"],
    main_similarity=SimilarityFunction.COSINE,
    name="sts-test",
)
print(test_evaluator(model))

Evaluation results before saving the model:

{'sts-test_pearson_cosine': 0.7324155392944408, 'sts-test_spearman_cosine': 0.7308799021176352, 'sts-test_pearson_manhattan': 0.7278141028793592, 'sts-test_spearman_manhattan': 0.7103180463184993, 'sts-test_pearson_euclidean': 0.7296304300347718, 'sts-test_spearman_euclidean': 0.7114234949673607, 'sts-test_pearson_dot': 0.6415791460360187, 'sts-test_spearman_dot': 0.6223641892328629, 'sts-test_pearson_max': 0.7324155392944408, 'sts-test_spearman_max': 0.7308799021176352}

Evaluation results after loading the model:

model = SentenceTransformer("working_dir/checkpoint-39")

test_dataset = load_dataset("sentence-transformers/stsb", split="test")
test_evaluator = EmbeddingSimilarityEvaluator(
    sentences1=test_dataset["sentence1"],
    sentences2=test_dataset["sentence2"],
    scores=test_dataset["score"],
    main_similarity=SimilarityFunction.COSINE,
    name="sts-test",
)
print(test_evaluator(model))

{'sts-test_pearson_cosine': 0.7324155392944408, 'sts-test_spearman_cosine': 0.7308799021176352, 'sts-test_pearson_manhattan': 0.7278141028793592, 'sts-test_spearman_manhattan': 0.7103180463184993, 'sts-test_pearson_euclidean': 0.7296304300347718, 'sts-test_spearman_euclidean': 0.7114234949673607, 'sts-test_pearson_dot': 0.6415791460360187, 'sts-test_spearman_dot': 0.6223641892328629, 'sts-test_pearson_max': 0.7324155392944408, 'sts-test_spearman_max': 0.7308799021176352}

…orts in Matryoshka2dLoss.py

into pr-2907

…d after the model is saved and loaded.

Also load a PEFT model if we have a T5 or MT5 model

tomaarsen · 2024-11-08T15:25:53Z

Hello @pesuchin!

Apologies for the radio silence on my part - this PR came right as the new backends were being introduced, and I was worried that they might clash. With some minor changes (e.g. an extra error if backend != "torch" and using if is_peft_available() rather than try-except despite the EAFP principle, etc.) this is ready to be included as one of the 4 major features in the next update (scheduled for Monday!)

I also appreciate you answering some questions across the repository.

Tom Aarsen

ryoji.nagata and others added 17 commits August 23, 2024 22:05

Fix 'module object is not callable' error by changing to relative imp…

b58eb17

…orts in Matryoshka2dLoss.py

run formatter

fe3a9c9

Merge branch 'master' of https://github.com/UKPLab/sentence-transformers

a5a8d30

into pr-2907

Merge branch 'UKPLab:master' into master

7472284

Merge branch 'UKPLab:master' into master

e16f9d0

add: Load fine-tuned model by Peft and LoRa

70ba486

fix: must run peft load test

dc6224c

fix: Using PeftConfig and PeftModel

c7da6d8

fix: Remove unnecessary peft package check implementation

009ff5c

Merge branch 'master' into master

f87efce

fix: remove peft

c8adb12

fix: bug

e35f093

fix: delete breakpoint and monkeypatch

11a169e

fix: run format

8aaa145

fix: format

541eba0

fix: add peft in dev environment

1b1b08f

add: More test cases to verify if the encoded vectors match before an…

0332564

…d after the model is saved and loaded.

pesuchin changed the title ~~Fix model loading inconsistency after Peft training by using PeftModel for correct inference results~~ [fix] Fix model loading inconsistency after Peft training by using PeftModel Oct 11, 2024

pesuchin and others added 3 commits October 30, 2024 09:34

Merge branch 'master' into master

750f479

fix: format

4711500

Rely on is_peft_available more, error if backend != "torch"

c224c90

Also load a PEFT model if we have a T5 or MT5 model

tomaarsen merged commit 6baee57 into UKPLab:master Nov 8, 2024
9 checks passed

J-Curwell mentioned this pull request Nov 13, 2024

Issue loading private Transformer model in version 3.3.0 #3053

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[fix] Fix model loading inconsistency after Peft training by using PeftModel #2980

[fix] Fix model loading inconsistency after Peft training by using PeftModel #2980

pesuchin commented Oct 11, 2024 •

edited

Loading

tomaarsen commented Nov 8, 2024

[fix] Fix model loading inconsistency after Peft training by using PeftModel #2980

[fix] Fix model loading inconsistency after Peft training by using PeftModel #2980

Conversation

pesuchin commented Oct 11, 2024 • edited Loading

Pull Request Overview

Experiment

Evaluation Results of Experiment: Case of Using PeftModel

tomaarsen commented Nov 8, 2024

pesuchin commented Oct 11, 2024 •

edited

Loading