GitHub - yuanwu2017/llm-dbg

Run test with accelerate on XPU/GPU

accelerate config

CCL_ZE_IPC_EXCHANGE=sockets accelerate launch --main_process_port=29502 ccl_test.py --device xpu --launch torch

accelerate launch --main_process_port=29502  ccl_test.py --device cuda 2>&1 |tee nvidia.log

CCL_ZE_IPC_EXCHANGE=sockets mpirun -n 2 -l  python ccl_test.py --device xpu --launch mpi

Name		Name	Last commit message	Last commit date
Latest commit History 33 Commits
README.md		README.md
autogptq_bench.py		autogptq_bench.py
benchmark_inpaint.py		benchmark_inpaint.py
benchmark_tgi.py		benchmark_tgi.py
ccl_test.py		ccl_test.py
default.txt		default.txt
diffusers_test_output_type.py		diffusers_test_output_type.py
err3.txt		err3.txt
rabbit.png		rabbit.png
requirement.txt		requirement.txt
run_tei_benchmark.sh		run_tei_benchmark.sh
run_tgi_benchmark.sh		run_tgi_benchmark.sh
run_tgi_llava_next_benchmark.sh		run_tgi_llava_next_benchmark.sh
run_tgi_stream_benchmark.sh		run_tgi_stream_benchmark.sh
tensor.pt		tensor.pt
test_autocast.py		test_autocast.py
test_fft.py		test_fft.py
test_set_queries.tsv		test_set_queries.tsv