논문리뷰 13

[논문 리뷰] Open-set Semantic Segmentation for Point Clouds via Adversarial Prototype Framework

Open-set Semantic Segmentation for Point Clouds via Adversarial Prototype Framework https://openaccess.thecvf.com/content/CVPR2023/papers/Li_Open-Set_Semantic_Segmentation_for_Point_Clouds_via_Adversarial_Prototype_Framework_CVPR_2023_paper.pdf 0. Abstract저자들은 Adversarial Prototype Framework(APF)를 제안한다. 이는 open-set 3D semantic segmentation을 다루며, seen class point는 유지하면서 3D unseen class를 구분하는 것을 목..

논문리뷰 2024.12.19

[논문 리뷰] PDF: A Probability-Driven Framework for Open World 3D Point Cloud Semantic Segmentation

PDF: A Probability-Driven Framework for Open World 3D Point Cloud Semantic Segmentation https://arxiv.org/pdf/2404.00979 0. Abstract존재하는 point cloud semantic segmentation network는 real world에 대한 closed-set과 정적인 관점으로 인해 unknown class를 구분하지 못하고, knowledge를 update하지 못한다. 이는 intelligent agent가 잘못된 결정을 내리게 한다. 이를 해결하기 위해  open-world semantic segmentation인 Probability-Driven Framework(PDF)를 제안한다. 이는 다..

논문리뷰 2024.12.05

[논문 리뷰] Entropic Open-set Active Learning

Entropic Open-set Active Learning https://arxiv.org/pdf/2312.14126 0. AbstractActive learnin(AL)은 unlabeled data에서 가장 informative sample을 선택하여 annotation함으로써 deep model의 수행을 향상시키는 목적을 가진다. closed set에서 인상깊은 수행을 보이지만, 대부분의 AL은 unknown category가 포함된 unlabel데이터인 real-world에서 성능이 떨어진다. 저자들은 AL동안 informative sample을 효과적으로 선택하기 위해 known과 unknown 분포를 사용하는 Entropic Open-set AL(EOAL)을 제시한다. 1. Introducti..

논문리뷰 2024.12.04

[논문 리뷰] Learning Transferable Visual Models From Natural Language Supervision (CLIP)

Learning Transferable Visual Models From Natural Language Supervision https://arxiv.org/abs/2103.00020 총 48페이지의 방대한 논문으로 다 읽지는 못했다. 하지만 신인의 패기(?)로 첫 세미나를 해당 논문으로 진행했었는데 그 때의 발표자료를 참고하여 리뷰를 작성해보려 한다. 1. IntroductionNLP에서 GPT와 같이 raw text를 이용하여 학습하는 Pre-training 방법이 몇 년간 발전해왔다. 그러나 computer vision에서는 여전히 label 데이터셋을 사용하고 있어 저자들은 web text로부터 pre-training을 하는 방법이 computer vision에 돌파구가 될 것이라 생각했다. 이를..

논문리뷰 2024.11.27

[논문 리뷰] Open-world Semantic Segmentation for LIDAR Point Clouds

Open-world Semantic Segmentation for LIDAR Point Clouds https://arxiv.org/pdf/2207.01452 0. Abstract현재 LIDAR semantic segmentation 방법은 closed set, static 하기 때문에 real world에서 robust하지 않다. 그래서 저자들은 아래의 내용을 목표로 하는 LIDAR point cloud를 활용한 open-world semantic segmentation task를 제안한다.1) open-set semantic segmentation을 활용하여 기존의 class와 novel한 class를 모두 구분한다.2) 기존 class를 잊지 않고 incremental learning을 활용하여 기..

논문리뷰 2024.11.26

[논문 리뷰] Open-World Semantic Segmentation Including Class Similarity

Open-World Semantic Segmentation Including Class Similarity https://arxiv.org/pdf/2403.07532 0. Abstract본 논문은 open-world semantic segmentation(학습동안 보지 못한 객체가 있는 이미지 데이터를 해석하는)을 다룬다. closed-world semantic segmentation을 정확하게 수행하면서, 동시에 추가적인 학습데이터 필요없이 새로운 카테고리 분리가 가능한 novel한 방법을 제시한다. 추가적으로 새로운 카테고리에 대해 학습한 카테고리 중 유사한 class를 제공한다. 이 방법을 통해 known class과 anomaly segmentation에서 최신 성능을 달성했고 unknown cl..

논문리뷰 2024.11.25

[논문 리뷰] Feedback-Guided Autonomous Driving

Feedback-Guided Autonomous Driving https://openaccess.thecvf.com/content/CVPR2024/papers/Zhang_Feedback-Guided_Autonomous_Driving_CVPR_2024_paper.pdf 자율주행관련 대학원 수업을 들으며 세미나 준비를 했던 논문으로 당시 발표자료를 참고하여 리뷰해보려 한다.(내용이 많이 생략되어 있을 수도 있으니 논문을 참고해주세요) 1. Introduction behavior cloning 즉 행동복제는 최근 자율주행에서 성공적인 패러다임으로 자리잡고 있다. 하지만 novel한 시나리오에서는 fail한 경우가 많다. 반면에 사람은 학습할 때 언어적으로 피드백을 받는다. 어느 부분이 잘못됐는지, 최적화되지 ..

논문리뷰 2024.11.24

[논문 리뷰] Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

Swin Transformer: Hierarchical Vision Transformer using Shifted Windowshttps://arxiv.org/abs/2103.14030 0. Abstract본 논문은 새로운 vision Transformer인 SwinTransformer를 제안한다. transformer를 language로부터 vision으로 전환하는데 어려움이 있었는데, 예를 들어 시각적 entity의 차이, 텍스트에 비해 큰 해상도가 있다. 이를 다루기 위해, representation을 shifted window로 계산하는 계층적 transformer를 제안한다. shifted window는 self-attention을 overlapping되지 않는 local window로 제한하여..

논문리뷰 2024.11.21

[논문 리뷰] An Image Is Worth 16X16 Words:Transformers For Image Recognition At Scale(ViT)

An Image Is Worth 16X16 Words:Transformers For Image Recognition At Scalehttps://arxiv.org/pdf/2010.11929 0. AbstractNLP에서 Transformer가 사실상 standard가 되었지만 computer vision에는 적용이 제한되어있다. 하지만 저자들은 image classification에서 CNN없이 image patch의 sequence를 적용한 pure transformer를 성공적으로 보여주었다. 많은 양의 data를 pre-train하고 중간이나 작은 사이즈의 image로 구성된 benchmark를 사용했을 때, Vision Transformer(ViT)는 상대적으로 작은 계산량을 필요로하면서 최신 C..

논문리뷰 2024.11.19

[논문 리뷰] PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation

PointNet: Deep Learning on Point Sets for 3D Classification and Segmentationhttps://arxiv.org/pdf/1612.00593  0. Abstract Point cloud는 geometric data structure에서 중요하다. 불규칙적인 형태때문에 대부분의 연구자들은 3D voxel grid나 collection으로 데이터를 변환한다. 그러나 render된 데이터는 불필요하게 방대하고 문제를 일으킨다. 저자들은 point cloud를 바로 사용하는 novel type을 디자인한다. 이는 입력 point의 불변성을 잘 반영한다. PointNet은 scene semantic parsing부터 object classification, p..

논문리뷰 2024.09.25