'2024/11/19 글 목록

[논문 리뷰] An Image Is Worth 16X16 Words:Transformers For Image Recognition At Scale(ViT)

An Image Is Worth 16X16 Words:Transformers For Image Recognition At Scalehttps://arxiv.org/pdf/2010.11929 0. AbstractNLP에서 Transformer가 사실상 standard가 되었지만 computer vision에는 적용이 제한되어있다. 하지만 저자들은 image classification에서 CNN없이 image patch의 sequence를 적용한 pure transformer를 성공적으로 보여주었다. 많은 양의 data를 pre-train하고 중간이나 작은 사이즈의 image로 구성된 benchmark를 사용했을 때, Vision Transformer(ViT)는 상대적으로 작은 계산량을 필요로하면서 최신 C..

논문리뷰 2024.11.19

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

희주는 개발중

2024/11/19 1

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역