Yong's Blog :: Yong's Blog

ABOUT ME

-

Today: -

Yesterday: -

Total: -

Popular Posts

[yongggg's] Mamba: Linear-Time Sequence Modeling with Selective State Spaces (Review)

Mamba는 transformer의 아키텍처의 문제점을 보완하고 이 모델의 성능을 능가할 수도 있다라는 새로운 아키텍처 입니다.공식의 구현과 모델의 Checkpoint는 다음 github에서 확인할 수 있습니다.https://github.com/state-spaces/mamba GitHub - state-spaces/mamba: Mamba SSM architectureMamba SSM architecture. Contribute to state-spaces/mamba development by creating an account on GitHub.github.com그럼 바로 설명하겠습니다!1. Transformer의 문제점Transformer는 위의 그림처럼 모든 text 입력을 token 단위의 Seq..
[yongggg's] DeepSpeed + Zero 둘러보기

안녕하세요 이번 장에서는 효율적인 Deep Learning training 툴인 Deepspeed에 대해 간단히 살펴보겠습니다.간략하게 핵심부터 말씀드리자면, GPU에 모델 학습 parameter를 복제하는 기존의 비효율 시스템을 효율적으로 구동할 수 있도록 만든 framework라고 할 수 있습니다. 아래는 DeepSpeed + Zero와 그렇지 않은 모듈의 GPU 사용량 및 여러 장점들을 나타냅니다.지금부터 짧게 DeepSpeed + Zero에 대해 설명하겠습니다.1. Introduction현재 딥러닝 trend가 LLM으로 들어오면서, 해당 모델의 크기는 점점 커지며 좋은 데이터, 큰 모델의 시너지는 굉장히 powerful하다는 것이 입증되고 있다. 모델의 두 가지 조건 중에서 큰 모델의 학습은 점..
[yongggg's] Docker container를 images로 저장하기

안녕하십니까 이번 docker part에선 현재 상태의 container를 image로 저장하는 방법을 설명드리고자 합니다. 개인 서버가 아닌 공용으로 사용해야할 서버에서는 독립적인 환경을 위해, docker를 유용하게 사용합니다. 뿐만 아니라, 서비스할 condition을 동일하게 하여 testing하기 위해서도 이 docker를 많이 씁니다. 따라서, 여러가지 조건에 따라 많은 패키지들을 한 container에 설치할텐데요, 이제 저희가 입맛에 맞게 여러 패키지를 설치한 현재 container 자체를 image로 만드는 작업과 이 image를 저장하는 방법에 대해 소개하겠습니다. 1. 원하는 환경의 container 구성 먼저, 자신이 원하는 condition의 docker container를 구성한..
[Python] pip install 'SSLCertVerificationError' 해결 방법

pip install 로 특정 모듈을 설치할 때, 다음의 error 가 발생할 수 있다. Could not fetch URL https://download.pytorch.org/whl/cu121/torch/: There was a problem confirming the ssl certificate: HTTPSConnectionPool(host='download.pytorch.org', port=443): Max retries exceeded with url: /whl/cu121/torch/ (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: self-signed..

Latest post

Latest post

인기포스트

ABOUT ME

LINK

ADMIN

티스토리툴바