Recent Notes
284 notes
헬스케어 챗봇 개발 중 발견한 LLM의 고유명사 오표기 문제의 근본 원인을 분석하고, 다양한 해결 방법을 실험한 과정을 정리한다.
LangChain과 Manus 웨비나에서 배운 AI 에이전트의 컨텍스트 엔지니어링 핵심 전략. 컨텍스트 오프로딩, 축소(압축 vs 요약), 격리(통신 vs 메모리 공유), 계층형 액션 공간 등 실전 검증된 기법과 '덜 구축하고 더 이해하라'는 철학을 다룬다.
PostgreSQL에서 벡터 검색을 가능하게 하는 pgvector 익스텐션의 개념, 작동 원리, 인덱스 알고리즘(HNSW), 그리고 다른 벡터 데이터베이스와의 비교를 다룬다.
2025년 최신 버전을 기준으로 pgvector (PostgreSQL 18), Qdrant 1.15, Milvus 2.6의 실제 성능, 기능, 비용을 상세 비교한다. 데이터 삽입, 검색 속도, 필터링, 확장성, 실전 시나리오별 권장사항을 다룬다.
학술 논문을 위한 전문 문서 파싱 및 RAG 시스템 구축 프로젝트 분석. Upstage Document Parse와 LLM을 활용한 고품질 멀티모달 콘텐츠 추출, 벡터 데이터베이스 구축, 그리고 Multi-Query + Reranker 기반 하이브리드 검색 시스템 구현까지 포괄적으로 다룬다.
실제 AI 서비스 아키텍처 구성도 작성 과정에서 마주한 핵심 설계 결정들을 다룹니다. ECS vs EKS 선택, Docker 없는 개발 워크플로우, 멀티 모듈 시스템 분리 전략 등 엔터프라이즈 환경에서의 컨테이너 아키텍처 설계 철학을 컨셉 중심으로 분석합니다.
AI 챗봇의 비용을 최대 90%까지 절감하고 응답 속도를 80% 향상시키는 프롬프트 캐싱, 시맨틱 캐싱, 딕셔너리 캐싱 전략을 상세히 분석하고 실제 구현 방법을 제시합니다.
OpenAI API를 활용한 서비스에서 사용자별 월별 사용량을 효율적으로 추적하고 관리하기 위한 Redis 하이브리드 아키텍처 설계와 성능 최적화 전략을 체계적으로 분석한다.
멀티에이전트 시스템의 핵심 아키텍처 패턴들과 대규모 환경에서의 구현 전략을 분석하고, 최신 통신 프로토콜과 확장성 해결책을 포괄적으로 다룬 가이드
워크플로우와 에이전트의 차이점, 그리고 ReAct, Plan-and-Execute, Supervisor 아키텍처의 특징과 장단점을 체계적으로 비교 분석한 포괄적 가이드