clip 2

[논문 리뷰] Learning Transferable Visual Models From Natural Language Supervision (CLIP)

Learning Transferable Visual Models From Natural Language Supervision https://arxiv.org/abs/2103.00020 총 48페이지의 방대한 논문으로 다 읽지는 못했다. 하지만 신인의 패기(?)로 첫 세미나를 해당 논문으로 진행했었는데 그 때의 발표자료를 참고하여 리뷰를 작성해보려 한다. 1. IntroductionNLP에서 GPT와 같이 raw text를 이용하여 학습하는 Pre-training 방법이 몇 년간 발전해왔다. 그러나 computer vision에서는 여전히 label 데이터셋을 사용하고 있어 저자들은 web text로부터 pre-training을 하는 방법이 computer vision에 돌파구가 될 것이라 생각했다. 이를..

논문리뷰 2024.11.27

[논문 리뷰] Feedback-Guided Autonomous Driving

Feedback-Guided Autonomous Driving https://openaccess.thecvf.com/content/CVPR2024/papers/Zhang_Feedback-Guided_Autonomous_Driving_CVPR_2024_paper.pdf 자율주행관련 대학원 수업을 들으며 세미나 준비를 했던 논문으로 당시 발표자료를 참고하여 리뷰해보려 한다.(내용이 많이 생략되어 있을 수도 있으니 논문을 참고해주세요) 1. Introduction behavior cloning 즉 행동복제는 최근 자율주행에서 성공적인 패러다임으로 자리잡고 있다. 하지만 novel한 시나리오에서는 fail한 경우가 많다. 반면에 사람은 학습할 때 언어적으로 피드백을 받는다. 어느 부분이 잘못됐는지, 최적화되지 ..

논문리뷰 2024.11.24