Kaggle의 Transformer from scratch using pytorch (작성자: arunmohan_003)의 글을 한글로 번역하였습니다. 원글: https://www.kaggle.com/code/arunmohan003/transformer-from-scratch-using-pytorch 참고: 아래 코드 조각들은 하나의 프로젝트에서 클래스 별 파일을 따로 생성하였습니다.) 1. 서론이 튜토리얼에서는 파이토치를 사용하여 “Attention is all you need”의 트랜스포머를 처음부터 구현하는 방법을 설명합니다. 기본적으로 트랜스포머는 인코더-디코더 아키텍처를 가지고 있습니다. 이는 언어 번역 모델에서 흔히 볼 수 있는 구조입니다. 위 이미지는 프랑스어에서 영어로 언어 번역 모델..