분류 전체보기
-
[yongggg's] ray 분산처리GPUTraining & View 2025. 5. 22. 14:48
안녕하세요~! 오늘 장에서는 대용량의 데이터를 ray로 분산처리하여, 기존 방법보다 훨씬 빠르게 전처리나 추론할 수 있는 방법에 대해 다루고자 합니다. parsing task를 겪으면서, 단순히 inference 코드로 여러 파일들을 sequential 하게 parsing을 하게되면,parsing 속도가 매우 저조하여 이를 현실 업무에서 사용할 수 없는 문제를 해결하고자 했습니다. 간단히 ray를 적용하면, 이런 문제를 해결할 수 있습니다! 1. ray module 설치ray를 이용하기 앞서, module을 설치해야 합니다. 각자 서버에서 다음 코드를 통해 Module을 설치하실 수 있다.pip install raypip install ray[default]2. ray startray module을 설치..
-
[yongggg's] A Survey on Audio Diffusion Models: Text To Speech Synthesis andEnhancement in Generative AI 요약(2)Machine & Deep Learning 2025. 4. 28. 15:11
이전 장의 A Survey on Audio Diffusion Models: Text To Speech Synthesis andEnhancement in Generative AI 요약(1)에서는 소리의 기초 지식과 소리에서의 Diffusion model의 배경인 DDPM 모델을 자세하게 다루었고, Acoustic model이 어떻게 발전되어 왔는지, 어떤 역할을 하는지를 살펴보았습니다.https://yongggg.tistory.com/100 [yongggg's] A Survey on Audio Diffusion Models: Text To Speech Synthesis andEnhancement in Generative AI 요약(1)안녕하세요 요즘 TTS 연구에 필수로 들어간다고해도 과언이 아닌 Diff..
-
[yongggg's] Audio Domain (소리의 기초)domain 2025. 4. 23. 09:53
* 소리의 기초(1) Sound소리는 일반적으로 진동으로 인한 공기의 압축에서 생성된다.(2) Wave공기의 압축이 얼마나 됐는지에 따라 표현한 것을 wave(파동)이라고 한다. $/rightarrow$ 파동은 진동 하며, 공간(매질)을 전파해 나가는 현상이다.(3) Frequency(주파수)파동의 초당 진동수를 주파수라고 하며, 헤르츠(Hz) 단위로 표기한다.소리가 얼마나 압축되어 있는지를 나타내며, 1초 동안의 진동 횟수를 나타낸다.주파수가 높다면, 높은 소리를 내고 낮다면, 낮은 소리를 낸다.주파수는 다음 세 가지의 요소를 가진다. (4) Amlitude(진폭)소리의 크기와 관련이 되어 있는 요소이다. 진폭이 클수록 큰 소리가 되며, 작을수록 작은 소리가 된다."bel"이라는 소리 크기(음압)에 대..
-
[yongggg's] A Survey on Audio Diffusion Models: Text To Speech Synthesis andEnhancement in Generative AI 요약(1)Machine & Deep Learning 2025. 4. 22. 10:43
안녕하세요 요즘 TTS 연구에 필수로 들어간다고해도 과언이 아닌 Diffusion model의 survey 논문을 소개 해드리겠습니다. Diffusion model은 vision model에서 연구가 먼저 되었지만, 음성 합성 분야에 많이 쓰이는 model입니다.다른 Survey이의 Diffusion model은 vison 쪽에 focus 되어 있지만 이 논문에는 Audio 쪽에 focus가 되어 있어서 audio 쪽 diffusion model에 관심이 있으신 분은 한 번 읽어보시면 좋을 것 같습니다! 그럼 요약 시작하겠습니다!AbstractText-to-Speech 변환 과제에서는 모델이 적용되는 단계에 따라 세 가지 범주로 나뉜다.acoustic model (음향 모델)vocoderend-to-en..
-
[yongggg's] Mixture of Experts (MoE) LLMSMachine & Deep Learning 2025. 4. 16. 15:43
MoE는 효율성과 성능을 동시에 향상시키기 위해 사용되는 신경망이며, 모델 architecture에 희소성을 도입하여 모델 크기를 크게 증가시키면서도 컴퓨팅 비용을 증가시키지 않는다는 장점을 갖고 있습니다. 이 내용을 공부하면서 간단한 아이디어이지만, 그 아이디어에서 나오는 문제까지 집요하게 해결할 수 있는 눈을 길러야 겠다는 생각을 했습니다. 지금부터 설명을 시작하겠습니다.1. MoE를 공부하기 위한 기본 지식1-1. LLMMoE 기반 LLM은 Decoder 전용 transformer architecture를 기반으로 한다. 이 Decoder 전용 LLM의 한 Block에서는 Normalization(LayerNorm, RMSLayerNorm 등), Masked multi-headed self-atte..
-
[yongggg's] Speech To Text (STT; whisper로 갖고 놀기)Machine & Deep Learning 2025. 3. 12. 13:24
안녕하세요, 이번 장에는 음성을 텍스트로 바꿔주는 기술에 대해 이야기해보려고 합니다.STT opensource 모델인 구글의 whisper로 이를 구현해보았는데,mac M1 칩(16GB memory)에서도 돌아가니 관심이 있으시다면, 한 번 시도해보셔도 좋을 것 같습니다! 이제 설명 시작하겠습니다!1. STTSTT는 'Speech-to-Text'의 줄임말으로 쉽게 말하자면, 사람이 말하는 소리를 듣고 그걸 텍스트로 변환해주는 기술이다.예를 들어, 너가 "안녕"이라고 말하면 그걸 "안녕"이라는 글자로 바꿔주는 것이다. 이 기술은 스마트폰 음성 비서, 회의 기록, 자막 생성 같은 데서 유용하게 쓰이며, AI가 발전하면서 정확도 또한 높아져 실생활에서 점점 더 자주 사용되는 추세이다.2. Whisper Moe..
-
[yongggg's] Kubernetes 에서 Job 이란?kubernetes & Docker 관련 2025. 2. 18. 14:45
이번 장에서는 Kubernetes에서 testing 시 이용하는 Job에 대해 설명 드리겠습니다.Job은 특정 작업(배치 작업, 데이터 처리 등)을 수행하고 종료하는 일회성 작업을 위해 사용됩니다.** (vs. Pod) Pod은 일반적으로 웹 서버처럼 계속 동작하는 Application을 실행할 때, 사용됩니다.Kubernetes의 Job에 대해서 더 자세히 알아보겠습니다!1. Kubernetes JobKubernetes Job은 일회성(One-time) 작업을 실행하는 데 사용되는 Kubernetes 리소스이며, Job의 역할은 Pod을 실행하고, 해당 작업이 완료되면 종료되도록 설계되었다. 주로 배치 작업(Batch Processing) 또는 데이터 처리 작업에서 활용된다.📌 1. Job의 특징 •..
-
[yongggg's] Kubernetes 개념 (Docker 와의 비교)kubernetes & Docker 관련 2025. 2. 18. 14:41
안녕하십니까 이번 장에는 Kubernetes의 기본 개념에 대해 살펴보는 시간이 되겠습니다.클라우드 환경에서 대규모 애플리케이션을 관리하는 일은 쉽지 않습니다. 서버가 다운되면 자동으로 복구해야 하고, 트래픽이 늘어나면 새로운 서버를 빠르게 추가해야 합니다. 이런 작업을 자동화해주는 것이 바로 Kubernetes(쿠버네티스)입니다.1. Kubernetes란?Kubernetes(쿠버네티스, 줄여서 k8s)는 Container 기반 Application을 자동으로 배포, 확장 운영할 수 있도록 도와주는 Opensource-platform이다. 이를 Container Orchestration Platform(컨테이너 오케스트레이션 플랫폼)이라고도 말하며 쉽게 말해, 여러 개의 서버에서 Container를 관..