Deep Learning
YOLOv10 Multi-GPU DDP 사용하기
씨주
2024. 9. 21. 16:06
YOLOv10으로 학습을 하려는데 DDP(DistributedDataParallel)로 학습을 하려니 안된다..
GPU 1개로 잘만 돌아가던 것이 2개 이상만 되면 NoModule을 띄우며 yolo를 찾지 못했다.(터미널창 지워버림ㅠ)
그래서 찾은 방법이 아래의 방법이다. (ㅈㅎ아 고마워 ㅠ)
참고 : https://docs.ultralytics.com/yolov5/tutorials/multi_gpu_training/#training
CUDA_VISIBLE_DEVICES=0,1 python -m torch.distributed.run --nproc_per_node 2 train.py --epochs 300 --batch_size 2 --data dataset.yaml
pytorch에서 ddp을 사용할 때 유용하다는 gpt선생님의 말씀에 따라 블로그에 기록
python -m torch.distributed.run --nproc_per_node=2 <your_script>.py