-
Notifications
You must be signed in to change notification settings - Fork 46
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[GCP:GPU] Unable to Provision VMs with GPU Accelerators #1125
Comments
@seokho-son @yunkon-kim (cc: @hippo-an)
[요약]
|
gcp+us-central1 등 specId: a2-highgpu-1g
로 VM 생성 요청시, GCP의 쿼터 부족이나 가용자원 부족 등의 추정 이슈로, VM이 생성되지 않는 경우들이 많습니다. 이 경우, CB-Spider에서는 정상적인 오류를 리턴하지 않고, 현황 파악 및 오류 메시지 개선이 필요한 상황으로 보입니다.
|
이상 위 오류 메시지는 다른 오류 메시지
(1) WaitForRun() 발생 에러 메시지
(2) GetVMStatus() 발생 에러 메시지
(3) 쿼터 또는 자원 부족시 발생할 수 있는 Error Notification 타입 무인식
|
[API 에러 메시지] GCP 한정 메시지
[출력 로그]
|
@powerkimhub 신속한 지원 감사합니다!!!!!!!! :) |
from) #1124
[현황]
[사유]
[방안]
live migration
이 적극 사용되지 않으니 다음처럼 임시 코드 블록을 추가하여live migration
기능을 차단 시킨 버전(v0.8.10)을 사용할 수 있도록 빠르게 배포하였습니다.드라이버팀에서 정식 버전으로 Patch 부탁드립니다.
@seokho-son
[GCP GPU-VM 활용 방법]
[시험 환경 및 현황]
https://www.googleapis.com/compute/v1/projects/ubuntu-os-cloud/global/images/ubuntu-2204-jammy-v20240319
a2-highgpu-1g
The text was updated successfully, but these errors were encountered: