YOLOv10으로 학습을 하려는데 DDP(DistributedDataParallel)로 학습을 하려니 안된다..
GPU 1개로 잘만 돌아가던 것이 2개 이상만 되면 NoModule을 띄우며 yolo를 찾지 못했다.(터미널창 지워버림ㅠ)
그래서 찾은 방법이 아래의 방법이다. (ㅈㅎ아 고마워 ㅠ)
참고 : https://docs.ultralytics.com/yolov5/tutorials/multi_gpu_training/#training
CUDA_VISIBLE_DEVICES=0,1 python -m torch.distributed.run --nproc_per_node 2 train.py --epochs 300 --batch_size 2 --data dataset.yaml
pytorch에서 ddp을 사용할 때 유용하다는 gpt선생님의 말씀에 따라 블로그에 기록
python -m torch.distributed.run --nproc_per_node=2 <your_script>.py
'Computer Vision' 카테고리의 다른 글
Open Set, Open Vocabulary, Open World 차이점 (0) | 2024.12.10 |
---|---|
[3D] Voxel, Mesh, Point Cloud란? (1) | 2024.10.09 |
YOLOv7 사용 및 학습해보기 (1) | 2024.09.12 |