전체 글 209

[논문 리뷰] PDF: A Probability-Driven Framework for Open World 3D Point Cloud Semantic Segmentation

PDF: A Probability-Driven Framework for Open World 3D Point Cloud Semantic Segmentation https://arxiv.org/pdf/2404.00979 0. Abstract존재하는 point cloud semantic segmentation network는 real world에 대한 closed-set과 정적인 관점으로 인해 unknown class를 구분하지 못하고, knowledge를 update하지 못한다. 이는 intelligent agent가 잘못된 결정을 내리게 한다. 이를 해결하기 위해  open-world semantic segmentation인 Probability-Driven Framework(PDF)를 제안한다. 이는 다..

논문리뷰 2024.12.05

[논문 리뷰] Entropic Open-set Active Learning

Entropic Open-set Active Learning https://arxiv.org/pdf/2312.14126 0. AbstractActive learnin(AL)은 unlabeled data에서 가장 informative sample을 선택하여 annotation함으로써 deep model의 수행을 향상시키는 목적을 가진다. closed set에서 인상깊은 수행을 보이지만, 대부분의 AL은 unknown category가 포함된 unlabel데이터인 real-world에서 성능이 떨어진다. 저자들은 AL동안 informative sample을 효과적으로 선택하기 위해 known과 unknown 분포를 사용하는 Entropic Open-set AL(EOAL)을 제시한다. 1. Introducti..

논문리뷰 2024.12.04

[ROS2] Tutorial Intermediate - Integrating launch files into ROS 2 packages

Integrating launch files into ROS 2 packagesTasksCreate a packagemkdir -p launch_ws/srccd launch_ws/srcros2 pkg create --build-type ament_python --license Apache-2.0 py_launch_example Creating the structure to hold launch files모든 launch file은 launch directory안에 저장된다.launch file을 사용하기 위헤 setup.py의 data_file에 launch 파일을 추가해야 한다.import osfrom glob import glob# Other imports ...package_name = 'py_la..

ROS2 2024.11.27

[논문 리뷰] Learning Transferable Visual Models From Natural Language Supervision (CLIP)

Learning Transferable Visual Models From Natural Language Supervision https://arxiv.org/abs/2103.00020 총 48페이지의 방대한 논문으로 다 읽지는 못했다. 하지만 신인의 패기(?)로 첫 세미나를 해당 논문으로 진행했었는데 그 때의 발표자료를 참고하여 리뷰를 작성해보려 한다. 1. IntroductionNLP에서 GPT와 같이 raw text를 이용하여 학습하는 Pre-training 방법이 몇 년간 발전해왔다. 그러나 computer vision에서는 여전히 label 데이터셋을 사용하고 있어 저자들은 web text로부터 pre-training을 하는 방법이 computer vision에 돌파구가 될 것이라 생각했다. 이를..

논문리뷰 2024.11.27

[논문 리뷰] Open-world Semantic Segmentation for LIDAR Point Clouds

Open-world Semantic Segmentation for LIDAR Point Clouds https://arxiv.org/pdf/2207.01452 0. Abstract현재 LIDAR semantic segmentation 방법은 closed set, static 하기 때문에 real world에서 robust하지 않다. 그래서 저자들은 아래의 내용을 목표로 하는 LIDAR point cloud를 활용한 open-world semantic segmentation task를 제안한다.1) open-set semantic segmentation을 활용하여 기존의 class와 novel한 class를 모두 구분한다.2) 기존 class를 잊지 않고 incremental learning을 활용하여 기..

논문리뷰 2024.11.26

[ROS2] Tutorial Intermediate - Creating a launch file

Creating a launch fileBackgroundROS2의 launch 시스템은 유저가 시스템 configuration을 표현할 수 있도록 도와준다. configuration은 실행할 프로그램, 실행 위치, 전달할 argument, ROS 관련 규칙이 포함된다. 또한 launch process 상태를 모니터링할 수 있고, 보고도 한다.python, XML, YAML로 작성된 launch 파일은 다른 노드로 시작, 정지할 수 있고 다양한 event를 실행할 수 있다.  TasksWrite the launch filemkdir launch# launch/turtlesim_mimic_launch.pyfrom launch import LaunchDescriptionfrom launch_ros.actio..

ROS2 2024.11.26

[논문 리뷰] Open-World Semantic Segmentation Including Class Similarity

Open-World Semantic Segmentation Including Class Similarity https://arxiv.org/pdf/2403.07532 0. Abstract본 논문은 open-world semantic segmentation(학습동안 보지 못한 객체가 있는 이미지 데이터를 해석하는)을 다룬다. closed-world semantic segmentation을 정확하게 수행하면서, 동시에 추가적인 학습데이터 필요없이 새로운 카테고리 분리가 가능한 novel한 방법을 제시한다. 추가적으로 새로운 카테고리에 대해 학습한 카테고리 중 유사한 class를 제공한다. 이 방법을 통해 known class과 anomaly segmentation에서 최신 성능을 달성했고 unknown cl..

논문리뷰 2024.11.25

[논문 리뷰] Feedback-Guided Autonomous Driving

Feedback-Guided Autonomous Driving https://openaccess.thecvf.com/content/CVPR2024/papers/Zhang_Feedback-Guided_Autonomous_Driving_CVPR_2024_paper.pdf 자율주행관련 대학원 수업을 들으며 세미나 준비를 했던 논문으로 당시 발표자료를 참고하여 리뷰해보려 한다.(내용이 많이 생략되어 있을 수도 있으니 논문을 참고해주세요) 1. Introduction behavior cloning 즉 행동복제는 최근 자율주행에서 성공적인 패러다임으로 자리잡고 있다. 하지만 novel한 시나리오에서는 fail한 경우가 많다. 반면에 사람은 학습할 때 언어적으로 피드백을 받는다. 어느 부분이 잘못됐는지, 최적화되지 ..

논문리뷰 2024.11.24

[논문 리뷰] Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

Swin Transformer: Hierarchical Vision Transformer using Shifted Windowshttps://arxiv.org/abs/2103.14030 0. Abstract본 논문은 새로운 vision Transformer인 SwinTransformer를 제안한다. transformer를 language로부터 vision으로 전환하는데 어려움이 있었는데, 예를 들어 시각적 entity의 차이, 텍스트에 비해 큰 해상도가 있다. 이를 다루기 위해, representation을 shifted window로 계산하는 계층적 transformer를 제안한다. shifted window는 self-attention을 overlapping되지 않는 local window로 제한하여..

논문리뷰 2024.11.21

[논문 리뷰] An Image Is Worth 16X16 Words:Transformers For Image Recognition At Scale(ViT)

An Image Is Worth 16X16 Words:Transformers For Image Recognition At Scalehttps://arxiv.org/pdf/2010.11929 0. AbstractNLP에서 Transformer가 사실상 standard가 되었지만 computer vision에는 적용이 제한되어있다. 하지만 저자들은 image classification에서 CNN없이 image patch의 sequence를 적용한 pure transformer를 성공적으로 보여주었다. 많은 양의 data를 pre-train하고 중간이나 작은 사이즈의 image로 구성된 benchmark를 사용했을 때, Vision Transformer(ViT)는 상대적으로 작은 계산량을 필요로하면서 최신 C..

논문리뷰 2024.11.19