run_conv_image_alignment_finetuning.sh

# CUDA_VISIBLE_DEVICES=1 python conv_image_alignment_finetuning.py \
#     --output_dir="./save/coref_candidates|mm/conv-im-align/clip" \
#     --cache_dir="./cache/coref_candidates|mm/conv-im-align/clip" \
#     --train_dataset_path="./preprocessed_data/coref_candidates|mm/simmc2.1_coref_candidates_dstc11_train.json" \
#     --dev_dataset_path="./preprocessed_data/coref_candidates|mm/simmc2.1_coref_candidates_dstc11_dev.json" \
#     --devtest_dataset_path="./preprocessed_data/coref_candidates|mm/simmc2.1_coref_candidates_dstc11_devtest.json" \
#     --additional_special_token_path "./preprocessed_data/coref_candidates|mm/simmc2_special_tokens.json" \
#     --model_name_or_path="openai/clip-vit-base-patch32" \
#     --include_other_similar_objects=False \
#     --include_other_referred_objects=False \
#     --per_device_train_batch_size=32 \
#     --per_device_eval_batch_size=32 \
#     --num_train_epochs=200 \
#     --max_seq_length=77 \
#     --fp16=True \
#     --save_strategy="epoch" \
#     --save_steps=1 \
#     --logging_strategy="epoch" \
#     --logging_steps=1 \
#     --evaluation_strategy="epoch" \
#     --eval_steps=1 \
#     --gradient_accumulation_steps=8 \
#     --eval_accumulation_steps=8 \
#     --learning_rate=1e-4 \
#     --save_total_limit=1 \
#     --remove_unused_columns=False \
#     --report_to="tensorboard" \
#     --seed=42 \
#     --data_seed=42 \
#     --load_best_model_at_end=True \
#     --dataloader_num_workers=4 \
#     --overwrite_output_dir=True

CUDA_VISIBLE_DEVICES=1 python conv_image_alignment_finetuning.py \
    --output_dir="./save/ambiguous_candidates/conv-im-align/clipper_v3" \
    --cache_dir="./cache/ambiguous_candidates/conv-im-align/clipper_v3" \
    --train_dataset_path="./preprocessed_data/ambiguous_candidates/simmc2.1_ambiguous_candidates_dstc11_train.json" \
    --dev_dataset_path="./preprocessed_data/ambiguous_candidates/simmc2.1_ambiguous_candidates_dstc11_dev.json" \
    --devtest_dataset_path="./preprocessed_data/ambiguous_candidates/simmc2.1_ambiguous_candidates_dstc11_devtest.json" \
    --model_name_or_path="openai/clip-vit-base-patch32" \
    --include_other_similar_objects=True \
    --include_other_referred_objects=True \
    --per_device_train_batch_size=32 \
    --per_device_eval_batch_size=32 \
    --num_train_epochs=200 \
    --max_seq_length=77 \
    --fp16=True \
    --save_strategy="epoch" \
    --save_steps=1 \
    --logging_strategy="epoch" \
    --logging_steps=1 \
    --evaluation_strategy="epoch" \
    --eval_steps=1 \
    --gradient_accumulation_steps=1 \
    --eval_accumulation_steps=1 \
    --learning_rate=1e-5 \
    --save_total_limit=1 \
    --remove_unused_columns=False \
    --report_to="tensorboard" \
    --seed=42 \
    --data_seed=42 \
    --load_best_model_at_end=True \
    --dataloader_num_workers=4 \
    --overwrite_output_dir=True

# CUDA_VISIBLE_DEVICES=1 python conv_image_alignment_finetuning.py \
#     --output_dir="./save/coref_candidates|no_mm/conv-im-align/clipper_v3" \
#     --cache_dir="./cache/coref_candidates|no_mm/conv-im-align/clipper_v3" \
#     --train_dataset_path="./preprocessed_data/coref_candidates|no_mm/simmc2.1_coref_candidates_dstc11_train.json" \
#     --dev_dataset_path="./preprocessed_data/coref_candidates|no_mm/simmc2.1_coref_candidates_dstc11_dev.json" \
#     --devtest_dataset_path="./preprocessed_data/coref_candidates|no_mm/simmc2.1_coref_candidates_dstc11_devtest.json" \
#     --model_name_or_path="openai/clip-vit-base-patch32" \
#     --include_other_similar_objects=True \
#     --include_other_referred_objects=True \
#     --per_device_train_batch_size=32 \
#     --per_device_eval_batch_size=32 \
#     --num_train_epochs=200 \
#     --max_seq_length=77 \
#     --fp16=True \
#     --save_strategy="epoch" \
#     --save_steps=1 \
#     --logging_strategy="epoch" \
#     --logging_steps=1 \
#     --evaluation_strategy="epoch" \
#     --eval_steps=1 \
#     --gradient_accumulation_steps=8 \
#     --eval_accumulation_steps=8 \
#     --learning_rate=1e-4 \
#     --save_total_limit=1 \
#     --remove_unused_columns=False \
#     --report_to="tensorboard" \
#     --seed=42 \
#     --data_seed=42 \
#     --load_best_model_at_end=True \
#     --dataloader_num_workers=4 \
#     --overwrite_output_dir=True

# CUDA_VISIBLE_DEVICES=0 python conv_image_alignment_finetuning.py \
#     --output_dir="./save/conv-im-align/clip_sigmoid" \
#     --cache_dir="./cache/conv-im-align/clip_sigmoid" \
#     --model_name_or_path="openai/clip-vit-base-patch32" \
#     --vision_model_name_or_path="openai/clip-vit-base-patch32" \
#     --text_model_name_or_path="roberta-base" \
#     --per_device_train_batch_size=32 \
#     --per_device_eval_batch_size=32 \
#     --num_train_epochs=200 \
#     --max_seq_length=77 \
#     --fp16=True \
#     --save_strategy="epoch" \
#     --save_steps=1 \
#     --logging_strategy="epoch" \
#     --logging_steps=1 \
#     --evaluation_strategy="epoch" \
#     --eval_steps=1 \
#     --gradient_accumulation_steps=8 \
#     --eval_accumulation_steps=8 \
#     --learning_rate=1e-4 \
#     --save_total_limit=1 \
#     --remove_unused_columns=False \
#     --report_to="tensorboard" \
#     --seed=42 \
#     --data_seed=42 \
#     --load_best_model_at_end=True \
#     --dataloader_num_workers=4 \
#     --overwrite_output_dir=True

# # DUMMY FOR TESTING
# CUDA_VISIBLE_DEVICES=0 python conv_image_alignment_finetuning.py \
#     --output_dir="./save/test" \
#     --cache_dir="./cache/test" \
#     --model_name_or_path="openai/clip-vit-base-patch32" \
#     --vision_model_name_or_path="openai/clip-vit-base-patch32" \
#     --text_model_name_or_path="roberta-base" \
#     --per_device_train_batch_size=32 \
#     --per_device_eval_batch_size=32 \
#     --num_train_epochs=10 \
#     --fp16=True \
#     --save_strategy="epoch" \
#     --save_steps=1 \
#     --logging_strategy="epoch" \
#     --logging_steps=1 \
#     --evaluation_strategy="epoch" \
#     --eval_steps=1 \
#     --gradient_accumulation_steps=8 \
#     --eval_accumulation_steps=8 \
#     --learning_rate=1e-4 \
#     --save_total_limit=1 \
#     --remove_unused_columns=False \
#     --report_to="tensorboard" \
#     --seed=42 \
#     --data_seed=42 \
#     --load_best_model_at_end=True \
#    --dataloader_num_workers=4 \
#     --overwrite_output_dir=True