Popular Posts
-
[yongggg's] Mamba: Linear-Time Sequence Modeling with Selective State Spaces (Review)
Mamba는 transformer의 아키텍처의 문제점을 보완하고 이 모델의 성능을 능가할 수도 있다라는 새로운 아키텍처 입니다.공식의 구현과 모델의 Checkpoint는 다음 github에서 확인할 수 있습니다.https://github.com/state-spaces/mamba GitHub - state-spaces/mamba: Mamba SSM architectureMamba SSM architecture. Contribute to state-spaces/mamba development by creating an account on GitHub.github.com그럼 바로 설명하겠습니다!1. Transformer의 문제점Transformer는 위의 그림처럼 모든 text 입력을 token 단위의 Seq..
-
[yongggg's] DeepSpeed + Zero 둘러보기
안녕하세요 이번 장에서는 효율적인 Deep Learning training 툴인 Deepspeed에 대해 간단히 살펴보겠습니다.간략하게 핵심부터 말씀드리자면, GPU에 모델 학습 parameter를 복제하는 기존의 비효율 시스템을 효율적으로 구동할 수 있도록 만든 framework라고 할 수 있습니다. 아래는 DeepSpeed + Zero와 그렇지 않은 모듈의 GPU 사용량 및 여러 장점들을 나타냅니다.지금부터 짧게 DeepSpeed + Zero에 대해 설명하겠습니다.1. Introduction현재 딥러닝 trend가 LLM으로 들어오면서, 해당 모델의 크기는 점점 커지며 좋은 데이터, 큰 모델의 시너지는 굉장히 powerful하다는 것이 입증되고 있다. 모델의 두 가지 조건 중에서 큰 모델의 학습은 점..
-
[yongggg's] Docker container를 images로 저장하기
안녕하십니까 이번 docker part에선 현재 상태의 container를 image로 저장하는 방법을 설명드리고자 합니다. 개인 서버가 아닌 공용으로 사용해야할 서버에서는 독립적인 환경을 위해, docker를 유용하게 사용합니다. 뿐만 아니라, 서비스할 condition을 동일하게 하여 testing하기 위해서도 이 docker를 많이 씁니다. 따라서, 여러가지 조건에 따라 많은 패키지들을 한 container에 설치할텐데요, 이제 저희가 입맛에 맞게 여러 패키지를 설치한 현재 container 자체를 image로 만드는 작업과 이 image를 저장하는 방법에 대해 소개하겠습니다. 1. 원하는 환경의 container 구성 먼저, 자신이 원하는 condition의 docker container를 구성한..
-
[Python] pip install 'SSLCertVerificationError' 해결 방법
pip install 로 특정 모듈을 설치할 때, 다음의 error 가 발생할 수 있다. Could not fetch URL https://download.pytorch.org/whl/cu121/torch/: There was a problem confirming the ssl certificate: HTTPSConnectionPool(host='download.pytorch.org', port=443): Max retries exceeded with url: /whl/cu121/torch/ (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: self-signed..
Latest post
-
[yongggg's] Kubernetes(쿠버네티스) 생성 및 배포 테스트kubernetes & Docker 관련 2025.07.25 09:40
안녕하세요 이번 장에서는 kubernetes의 기본적인 배포 testing을 위한 글을 작성하려고 합니다! 현재 제가 커스텀하고 만든 모델을 서빙하는 코드를 FastAPI로 서빙할 수 있는 상태로 만들었고, 이후 배포가 잘되는지 테스팅하기 위한 과정을 담아보았습니다. 지금부터 그 과정을 설명하겠습니다.1. Kubernetes CLUSTER 생성** CLUSTER 란?쿠버네티스 클러스터는 여러 대의 서버(노드)를 하나의 거대한 컴퓨터처럼 묶어서 컨테이너(=서버 프로그램)를 자동으로 배포/운영/관리해주는 시스템이다.클러스터 안에는 여러 노드(서버)가 있고,쿠버네티스가 이 노드들에 컨테이너를 자동으로 분산시켜준다.위 까지 docker image가 잘 build 되었다면, 사용할 CLUSTER의 namespa..
-
[yongggg's] ray 분산처리GPUTraining & View 2025.05.22 14:48
안녕하세요~! 오늘 장에서는 대용량의 데이터를 ray로 분산처리하여, 기존 방법보다 훨씬 빠르게 전처리나 추론할 수 있는 방법에 대해 다루고자 합니다. parsing task를 겪으면서, 단순히 inference 코드로 여러 파일들을 sequential 하게 parsing을 하게되면,parsing 속도가 매우 저조하여 이를 현실 업무에서 사용할 수 없는 문제를 해결하고자 했습니다. 간단히 ray를 적용하면, 이런 문제를 해결할 수 있습니다! 1. ray module 설치ray를 이용하기 앞서, module을 설치해야 합니다. 각자 서버에서 다음 코드를 통해 Module을 설치하실 수 있다.pip install raypip install ray[default]2. ray startray module을 설치..
-
[yongggg's] A Survey on Audio Diffusion Models: Text To Speech Synthesis andEnhancement in Generative AI 요약(2)Machine & Deep Learning 2025.04.28 15:11
이전 장의 A Survey on Audio Diffusion Models: Text To Speech Synthesis andEnhancement in Generative AI 요약(1)에서는 소리의 기초 지식과 소리에서의 Diffusion model의 배경인 DDPM 모델을 자세하게 다루었고, Acoustic model이 어떻게 발전되어 왔는지, 어떤 역할을 하는지를 살펴보았습니다.https://yongggg.tistory.com/100 [yongggg's] A Survey on Audio Diffusion Models: Text To Speech Synthesis andEnhancement in Generative AI 요약(1)안녕하세요 요즘 TTS 연구에 필수로 들어간다고해도 과언이 아닌 Diff..
-
[yongggg's] Audio Domain (소리의 기초)domain 2025.04.23 09:53
* 소리의 기초(1) Sound소리는 일반적으로 진동으로 인한 공기의 압축에서 생성된다.(2) Wave공기의 압축이 얼마나 됐는지에 따라 표현한 것을 wave(파동)이라고 한다. $/rightarrow$ 파동은 진동 하며, 공간(매질)을 전파해 나가는 현상이다.(3) Frequency(주파수)파동의 초당 진동수를 주파수라고 하며, 헤르츠(Hz) 단위로 표기한다.소리가 얼마나 압축되어 있는지를 나타내며, 1초 동안의 진동 횟수를 나타낸다.주파수가 높다면, 높은 소리를 내고 낮다면, 낮은 소리를 낸다.주파수는 다음 세 가지의 요소를 가진다. (4) Amlitude(진폭)소리의 크기와 관련이 되어 있는 요소이다. 진폭이 클수록 큰 소리가 되며, 작을수록 작은 소리가 된다."bel"이라는 소리 크기(음압)에 대..
-
[yongggg's] A Survey on Audio Diffusion Models: Text To Speech Synthesis andEnhancement in Generative AI 요약(1)Machine & Deep Learning 2025.04.22 10:43
안녕하세요 요즘 TTS 연구에 필수로 들어간다고해도 과언이 아닌 Diffusion model의 survey 논문을 소개 해드리겠습니다. Diffusion model은 vision model에서 연구가 먼저 되었지만, 음성 합성 분야에 많이 쓰이는 model입니다.다른 Survey이의 Diffusion model은 vison 쪽에 focus 되어 있지만 이 논문에는 Audio 쪽에 focus가 되어 있어서 audio 쪽 diffusion model에 관심이 있으신 분은 한 번 읽어보시면 좋을 것 같습니다! 그럼 요약 시작하겠습니다!AbstractText-to-Speech 변환 과제에서는 모델이 적용되는 단계에 따라 세 가지 범주로 나뉜다.acoustic model (음향 모델)vocoderend-to-en..