단순히 모델을 학습시키는 것을 넘어, 비즈니스 문제를 데이터 관점에서 재정의하고 실행 가능한 솔루션으로 구체화합니다.
데이터 수집부터 전처리, 모델링, 시각화를 통한 인사이트 도출까지 분석 전 과정을 주도적으로 수행하며, 의사결정에 도움이 되는 결과물을 만들어내는 것을 목표로 하고 있습니다.
머신러닝 및 심층학습 모델 개발 경험을 바탕으로, 데이터의 패턴을 분석하고 예측 모델을 구축하는 과정에 익숙해지고 있으며, 데이터의 특성과 비즈니스 맥락을 함께 고려하는 시각을 갖추기 위해 노력하고 있습니다.
좋은 알고리즘보다 안정적으로 운영되는 시스템이 더 큰 가치를 만든다고 믿으며, 프로토타입을 넘어 실제 환경에서 지속 가능한 서비스를 구축하는 데 집중합니다.
API 설계, 데이터 파이프라인 구축, 자동화 로직 개발 등 기술 스택 전반에 걸친 경험을 통해 백엔드부터 AI 모델 배포까지 end-to-end로 구현하는 것을 경험했습니다.
LLM 기반 시스템에서는 Langchain, ChromaDB, Redis 등을 활용하여 대규모 데이터를 처리하고, 사용자가 체감할 수 있는 응답 품질과 효율성을 구현했습니다.
빠르고 정확한 결과도 중요하지만, 그것이 사용자에게 어떻게 전달되는지, 시스템이 얼마나 직관적으로 이해되는지가 최종 가치를 결정한다고 생각합니다.
모델 성능 최적화뿐만 아니라 응답 속도 개선, 에러 핸들링, 실시간 스트리밍 등 사용자가 실제로 체감하는 경험을 개선하는 작업에 많은 시간을 투자합니다.
정확성과 효율성을 중요하게 생각하며, 끊임없는 학습과 실무 경험을 통해 더 나은 분석가이자 개발자로 성장하려고 노력하고 있습니다.
LangChain & RAG
GPT-4o 기반 클라우드 전용 챗봇 개발 경험을 통해 Chain-of-Thought 구조로 7단계 추론 파이프라인을 설계했습니다. FAISS와 ChromaDB를 활용한 벡터 검색 기반 RAG 시스템을 구축하고, S3 기반 동적 프롬프트 관리 및 Redis를 통한 컨텍스트 윈도우 최적화로 긴 대화에서도 맥락을 유지하는 시스템을 만들었습니다.
FastAPI
클라우드 챗봇과 리소스 추천 플랫폼 개발에서 FastAPI를 활용해 RESTful API를 설계하고 구현했습니다. SSE 스트리밍을 통한 실시간 응답 제공, ThreadPoolExecutor 기반 병렬 처리로 성능을 최적화하고, 안정적인 백엔드 시스템을 구축했습니다.
Python & Data Analysis
Pandas와 NumPy를 활용한 대규모 데이터 전처리 및 시계열 분석 경험이 있습니다. 결측치 처리, 정규화, 노이즈 필터링 등 데이터 품질 관리를 수행하고, 동적 임계치 알고리즘을 설계하여 이상 탐지 시스템을 개발했습니다. Matplotlib과 Seaborn을 활용한 데이터 시각화로 인사이트를 도출했습니다.
Machine Learning & Deep Learning
Transfer Learning 기반 의료 도메인 특화 STT 모델 개발 및 Data Augmentation을 통한 모델 강건성 확보 경험이 있습니다. 가중치 코사인 유사도 알고리즘 설계, ARIMA 및 SEIHR 모델을 활용한 시계열 예측, 하이퍼파라미터 튜닝을 통한 성능 최적화 작업을 수행했습니다.
Overview
Background & Objective
Technical Implementation
System Architecture
Key Features
Results & Impact
Tech Stack