Popular Posts
-
[yongggg's] Mamba: Linear-Time Sequence Modeling with Selective State Spaces (Review)
Mamba는 transformer의 아키텍처의 문제점을 보완하고 이 모델의 성능을 능가할 수도 있다라는 새로운 아키텍처 입니다.공식의 구현과 모델의 Checkpoint는 다음 github에서 확인할 수 있습니다.https://github.com/state-spaces/mamba GitHub - state-spaces/mamba: Mamba SSM architectureMamba SSM architecture. Contribute to state-spaces/mamba development by creating an account on GitHub.github.com그럼 바로 설명하겠습니다!1. Transformer의 문제점Transformer는 위의 그림처럼 모든 text 입력을 token 단위의 Seq..
-
[yongggg's] DeepSpeed + Zero 둘러보기
안녕하세요 이번 장에서는 효율적인 Deep Learning training 툴인 Deepspeed에 대해 간단히 살펴보겠습니다.간략하게 핵심부터 말씀드리자면, GPU에 모델 학습 parameter를 복제하는 기존의 비효율 시스템을 효율적으로 구동할 수 있도록 만든 framework라고 할 수 있습니다. 아래는 DeepSpeed + Zero와 그렇지 않은 모듈의 GPU 사용량 및 여러 장점들을 나타냅니다.지금부터 짧게 DeepSpeed + Zero에 대해 설명하겠습니다.1. Introduction현재 딥러닝 trend가 LLM으로 들어오면서, 해당 모델의 크기는 점점 커지며 좋은 데이터, 큰 모델의 시너지는 굉장히 powerful하다는 것이 입증되고 있다. 모델의 두 가지 조건 중에서 큰 모델의 학습은 점..
-
[yongggg's] huggingface-cli download error
huggingface에서는 다음과 같은 코드로 공식 repo에 있는 모델을 불러올 수 있는데, AutoModelForCausalLM.from_pretrained(model_path)사내 서버에서 보안의 issue가 있을 때, SSL 통신 에러가 나오며 모델이 불러와지지 않을 때가 있습니다.requests.exceptions.SSLError: (MaxRetryError("HTTPSConnectionPool(host='cdn-lfs-us-1.hf.co', port=443): 이럴 때에는 먼저 local 환경에 해당 모델을 다운로드를 한 뒤, 불러올 수 있습니다. - 모델 다운로드는 다음 과정으로 진행할 수 있다.1. huggingface-cli login : llama-3와 같은 모델은 권한을 먼저 수락 받..
-
[yongggg's] Ubuntu / Linux : curl 명령어로 url 파일 다운로드
안녕하세요 이번 장에서는 로컬에서 클릭 한 번으로 받을 수 있는 파일들을 ubuntu 서버에서 curl 명령어로 손쉽게 받을 수 있는 방법을 소개해드리고자 합니다!이 내용으로 필요한 모듈 및 파일을 조금 더 빠르고 손 쉽게 다운 받으셨으면 좋겠습니다 :)1. local에서 해당 파일의 링크 확인먼저 본인이 Ubuntu 서버에 다운받고자 하는 파일을 로컬에서 찾는다. 필자는 llama.cpp binary file ubuntu version을 서버에 다운로드 하고자 했으며, 해당 파일에 우클릭 후 "링크 주소 복사"를 선택하면 손 쉽게 그 링크를 복사할 수 있다.2. curl 명령어로 해당 파일을 다운로드위의 링크가 잘 복사되었다면, 해당 명령어로 파일을 손쉽게 받을 수 있다.curl -L [URL] 이를..
Latest post
-
[yongggg's] Kubernetes(쿠버네티스) 생성 및 배포 테스트kubernetes & Docker 관련 2025.07.25 09:40
안녕하세요 이번 장에서는 kubernetes의 기본적인 배포 testing을 위한 글을 작성하려고 합니다! 현재 제가 커스텀하고 만든 모델을 서빙하는 코드를 FastAPI로 서빙할 수 있는 상태로 만들었고, 이후 배포가 잘되는지 테스팅하기 위한 과정을 담아보았습니다. 지금부터 그 과정을 설명하겠습니다.1. Kubernetes CLUSTER 생성** CLUSTER 란?쿠버네티스 클러스터는 여러 대의 서버(노드)를 하나의 거대한 컴퓨터처럼 묶어서 컨테이너(=서버 프로그램)를 자동으로 배포/운영/관리해주는 시스템이다.클러스터 안에는 여러 노드(서버)가 있고,쿠버네티스가 이 노드들에 컨테이너를 자동으로 분산시켜준다.위 까지 docker image가 잘 build 되었다면, 사용할 CLUSTER의 namespa..
-
[yongggg's] ray 분산처리GPUTraining & View 2025.05.22 14:48
안녕하세요~! 오늘 장에서는 대용량의 데이터를 ray로 분산처리하여, 기존 방법보다 훨씬 빠르게 전처리나 추론할 수 있는 방법에 대해 다루고자 합니다. parsing task를 겪으면서, 단순히 inference 코드로 여러 파일들을 sequential 하게 parsing을 하게되면,parsing 속도가 매우 저조하여 이를 현실 업무에서 사용할 수 없는 문제를 해결하고자 했습니다. 간단히 ray를 적용하면, 이런 문제를 해결할 수 있습니다! 1. ray module 설치ray를 이용하기 앞서, module을 설치해야 합니다. 각자 서버에서 다음 코드를 통해 Module을 설치하실 수 있다.pip install raypip install ray[default]2. ray startray module을 설치..
-
[yongggg's] A Survey on Audio Diffusion Models: Text To Speech Synthesis andEnhancement in Generative AI 요약(2)Machine & Deep Learning 2025.04.28 15:11
이전 장의 A Survey on Audio Diffusion Models: Text To Speech Synthesis andEnhancement in Generative AI 요약(1)에서는 소리의 기초 지식과 소리에서의 Diffusion model의 배경인 DDPM 모델을 자세하게 다루었고, Acoustic model이 어떻게 발전되어 왔는지, 어떤 역할을 하는지를 살펴보았습니다.https://yongggg.tistory.com/100 [yongggg's] A Survey on Audio Diffusion Models: Text To Speech Synthesis andEnhancement in Generative AI 요약(1)안녕하세요 요즘 TTS 연구에 필수로 들어간다고해도 과언이 아닌 Diff..
-
[yongggg's] Audio Domain (소리의 기초)domain 2025.04.23 09:53
* 소리의 기초(1) Sound소리는 일반적으로 진동으로 인한 공기의 압축에서 생성된다.(2) Wave공기의 압축이 얼마나 됐는지에 따라 표현한 것을 wave(파동)이라고 한다. $/rightarrow$ 파동은 진동 하며, 공간(매질)을 전파해 나가는 현상이다.(3) Frequency(주파수)파동의 초당 진동수를 주파수라고 하며, 헤르츠(Hz) 단위로 표기한다.소리가 얼마나 압축되어 있는지를 나타내며, 1초 동안의 진동 횟수를 나타낸다.주파수가 높다면, 높은 소리를 내고 낮다면, 낮은 소리를 낸다.주파수는 다음 세 가지의 요소를 가진다. (4) Amlitude(진폭)소리의 크기와 관련이 되어 있는 요소이다. 진폭이 클수록 큰 소리가 되며, 작을수록 작은 소리가 된다."bel"이라는 소리 크기(음압)에 대..
-
[yongggg's] A Survey on Audio Diffusion Models: Text To Speech Synthesis andEnhancement in Generative AI 요약(1)Machine & Deep Learning 2025.04.22 10:43
안녕하세요 요즘 TTS 연구에 필수로 들어간다고해도 과언이 아닌 Diffusion model의 survey 논문을 소개 해드리겠습니다. Diffusion model은 vision model에서 연구가 먼저 되었지만, 음성 합성 분야에 많이 쓰이는 model입니다.다른 Survey이의 Diffusion model은 vison 쪽에 focus 되어 있지만 이 논문에는 Audio 쪽에 focus가 되어 있어서 audio 쪽 diffusion model에 관심이 있으신 분은 한 번 읽어보시면 좋을 것 같습니다! 그럼 요약 시작하겠습니다!AbstractText-to-Speech 변환 과제에서는 모델이 적용되는 단계에 따라 세 가지 범주로 나뉜다.acoustic model (음향 모델)vocoderend-to-en..