전체 글 185

[논문 리뷰] Learning Transferable Visual Models From Natural Language Supervision (CLIP)

Learning Transferable Visual Models From Natural Language Supervision https://arxiv.org/abs/2103.00020 총 48페이지의 방대한 논문으로 다 읽지는 못했다. 하지만 신인의 패기(?)로 첫 세미나를 해당 논문으로 진행했었는데 그 때의 발표자료를 참고하여 리뷰를 작성해보려 한다. 1. IntroductionNLP에서 GPT와 같이 raw text를 이용하여 학습하는 Pre-training 방법이 몇 년간 발전해왔다. 그러나 computer vision에서는 여전히 label 데이터셋을 사용하고 있어 저자들은 web text로부터 pre-training을 하는 방법이 computer vision에 돌파구가 될 것이라 생각했다. 이를..

논문리뷰 2024.11.27

[논문 리뷰] Open-world Semantic Segmentation for LIDAR Point Clouds

Open-world Semantic Segmentation for LIDAR Point Clouds https://arxiv.org/pdf/2207.01452 0. Abstract현재 LIDAR semantic segmentation 방법은 closed set, static 하기 때문에 real world에서 robust하지 않다. 그래서 저자들은 아래의 내용을 목표로 하는 LIDAR point cloud를 활용한 open-world semantic segmentation task를 제안한다.1) open-set semantic segmentation을 활용하여 기존의 class와 novel한 class를 모두 구분한다.2) 기존 class를 잊지 않고 incremental learning을 활용하여 기..

논문리뷰 2024.11.26

[ROS2] Tutorial Intermediate - Creating a launch file

Creating a launch fileBackgroundROS2의 launch 시스템은 유저가 시스템 configuration을 표현할 수 있도록 도와준다. configuration은 실행할 프로그램, 실행 위치, 전달할 argument, ROS 관련 규칙이 포함된다. 또한 launch process 상태를 모니터링할 수 있고, 보고도 한다.python, XML, YAML로 작성된 launch 파일은 다른 노드로 시작, 정지할 수 있고 다양한 event를 실행할 수 있다.  TasksWrite the launch filemkdir launch# launch/turtlesim_mimic_launch.pyfrom launch import LaunchDescriptionfrom launch_ros.actio..

ROS2 2024.11.26

[논문 리뷰] Open-World Semantic Segmentation Including Class Similarity

Open-World Semantic Segmentation Including Class Similarity https://arxiv.org/pdf/2403.07532 0. Abstract본 논문은 open-world semantic segmentation(학습동안 보지 못한 객체가 있는 이미지 데이터를 해석하는)을 다룬다. closed-world semantic segmentation을 정확하게 수행하면서, 동시에 추가적인 학습데이터 필요없이 새로운 카테고리 분리가 가능한 novel한 방법을 제시한다. 추가적으로 새로운 카테고리에 대해 학습한 카테고리 중 유사한 class를 제공한다. 이 방법을 통해 known class과 anomaly segmentation에서 최신 성능을 달성했고 unknown cl..

논문리뷰 2024.11.25

[논문 리뷰] Feedback-Guided Autonomous Driving

Feedback-Guided Autonomous Driving https://openaccess.thecvf.com/content/CVPR2024/papers/Zhang_Feedback-Guided_Autonomous_Driving_CVPR_2024_paper.pdf 자율주행관련 대학원 수업을 들으며 세미나 준비를 했던 논문으로 당시 발표자료를 참고하여 리뷰해보려 한다.(내용이 많이 생략되어 있을 수도 있으니 논문을 참고해주세요) 1. Introduction behavior cloning 즉 행동복제는 최근 자율주행에서 성공적인 패러다임으로 자리잡고 있다. 하지만 novel한 시나리오에서는 fail한 경우가 많다. 반면에 사람은 학습할 때 언어적으로 피드백을 받는다. 어느 부분이 잘못됐는지, 최적화되지 ..

논문리뷰 2024.11.24

[논문 리뷰] Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

Swin Transformer: Hierarchical Vision Transformer using Shifted Windowshttps://arxiv.org/abs/2103.14030 0. Abstract본 논문은 새로운 vision Transformer인 SwinTransformer를 제안한다. transformer를 language로부터 vision으로 전환하는데 어려움이 있었는데, 예를 들어 시각적 entity의 차이, 텍스트에 비해 큰 해상도가 있다. 이를 다루기 위해, representation을 shifted window로 계산하는 계층적 transformer를 제안한다. shifted window는 self-attention을 overlapping되지 않는 local window로 제한하여..

논문리뷰 2024.11.21

[논문 리뷰] An Image Is Worth 16X16 Words:Transformers For Image Recognition At Scale(ViT)

An Image Is Worth 16X16 Words:Transformers For Image Recognition At Scalehttps://arxiv.org/pdf/2010.11929 0. AbstractNLP에서 Transformer가 사실상 standard가 되었지만 computer vision에는 적용이 제한되어있다. 하지만 저자들은 image classification에서 CNN없이 image patch의 sequence를 적용한 pure transformer를 성공적으로 보여주었다. 많은 양의 data를 pre-train하고 중간이나 작은 사이즈의 image로 구성된 benchmark를 사용했을 때, Vision Transformer(ViT)는 상대적으로 작은 계산량을 필요로하면서 최신 C..

논문리뷰 2024.11.19

[ROS2] Tutorial Intermediate - Composing multiple nodes in a single process

Composing multiple nodes in a single processRun the demosDiscover available components어떤 components가 등록되어있고 사용가능한지 알려면 아래의 코드를 사용하면 된다.ros2 component types Run-time composition using ROS services with a publisher and subscriber먼저 component container를 실행하고ros2 run rclcpp_components component_container 두번째 shell에서 ros2 command line tool을 통해 실행중인 container를 확인하자.ros2 component list 두번째 shell에서 talk..

ROS2 2024.11.18

[ROS2] Tutorial Intermediate - Writing an action server and client(Python)

Writing an action server and client(Python)Backgroundaction은 ROS2에서 비동기식 커뮤니케이션 형태이다. client는 request를 server에게 보내고, server는 feedback과 result를 client에게 보낸다.TasksWriting an action serverimport rclpyfrom rclpy.action import ActionServerfrom rclpy.node import Nodefrom action_tutorials_interfaces.action import Fibonacciclass FibonacciActionServer(Node): def __init__(self): super().__init__..

ROS2 2024.11.17

[ROS2] Tutorial Intermediate - Creating an action

Creating an actionTaskDefining an actionAction은 .action파일에서 정의된다.# Request---# Result---# Feedback action은 ---로 구분된 3가지 메세지 정의로 이루어져있다.request message는 새로운 목표를 시작할 때 server에게 client가 보내는 것이다.result message는 목표를 끝냈을 때, client에게 server가 보내는 것이다.feedback message는 주기적으로 client에게 server가 목표에 대한 정보를 update하는 것이다. 피보나치수열을 계산하는 'Fibonacci'라는 새로운 action을 정의해보자.action_tutorials_interfaces 패키지 안에 action 경로..

ROS2 2024.11.16