Skip to content
logo

Recent Notes

284 notes

LLM이 고유명사를 틀리는 이유와 해결 방법2025-11-11

헬스케어 챗봇 개발 중 발견한 LLM의 고유명사 오표기 문제의 근본 원인을 분석하고, 다양한 해결 방법을 실험한 과정을 정리한다.

AI
#AI
#LLM
#ChatBot
#Tokenization
#Prompt-Engineering
#Healthcare
#NLP
Context Engineering for AI Agents: With LangChain and Manus2025-10-26

LangChain과 Manus 웨비나에서 배운 AI 에이전트의 컨텍스트 엔지니어링 핵심 전략. 컨텍스트 오프로딩, 축소(압축 vs 요약), 격리(통신 vs 메모리 공유), 계층형 액션 공간 등 실전 검증된 기법과 '덜 구축하고 더 이해하라'는 철학을 다룬다.

AI
#AI
#Agent
#LLM
#Context-Engineering
#Manus
#LangChain
pgvector: PostgreSQL의 벡터 검색 익스텐션2025-10-13

PostgreSQL에서 벡터 검색을 가능하게 하는 pgvector 익스텐션의 개념, 작동 원리, 인덱스 알고리즘(HNSW), 그리고 다른 벡터 데이터베이스와의 비교를 다룬다.

AI
#AI
#pgvector
#PostgreSQL
#Vector-Database
#Embedding
#ANN
#HNSW
#RAG
#Semantic-Search
2025년 pgvector vs Qdrant vs Milvus 상세 성능 비교2025-10-13

2025년 최신 버전을 기준으로 pgvector (PostgreSQL 18), Qdrant 1.15, Milvus 2.6의 실제 성능, 기능, 비용을 상세 비교한다. 데이터 삽입, 검색 속도, 필터링, 확장성, 실전 시나리오별 권장사항을 다룬다.

AI
#AI
#pgvector
#Qdrant
#Milvus
#Vector-Database
#Performance
#Benchmark
#RAG
#Hybrid-Search
학술 논문 특화 파서 시스템 분석2025-09-14

학술 논문을 위한 전문 문서 파싱 및 RAG 시스템 구축 프로젝트 분석. Upstage Document Parse와 LLM을 활용한 고품질 멀티모달 콘텐츠 추출, 벡터 데이터베이스 구축, 그리고 Multi-Query + Reranker 기반 하이브리드 검색 시스템 구현까지 포괄적으로 다룬다.

AI
#AI
#PDF-Parser
#RAG
#Document-Processing
#Multi-Modal
#Vector-Database
#Qdrant
#OpenAI
#UPSTAGE
#GPT-4o
#Academic-Papers
#NLP
#Data-Pipeline
#Information-Retrieval
#Semantic-Search
엔터프라이즈 AI 서비스 아키텍처 설계: ECS와 컨테이너 전략2025-09-13

실제 AI 서비스 아키텍처 구성도 작성 과정에서 마주한 핵심 설계 결정들을 다룹니다. ECS vs EKS 선택, Docker 없는 개발 워크플로우, 멀티 모듈 시스템 분리 전략 등 엔터프라이즈 환경에서의 컨테이너 아키텍처 설계 철학을 컨셉 중심으로 분석합니다.

Dev
#AI
#Architecture
#AWS
#ECS
#ECR
#Docker
#Container
#Enterprise
#Microservices
챗봇 성능 최적화: 캐싱 전략으로 비용 절감과 속도 향상2025-09-07

AI 챗봇의 비용을 최대 90%까지 절감하고 응답 속도를 80% 향상시키는 프롬프트 캐싱, 시맨틱 캐싱, 딕셔너리 캐싱 전략을 상세히 분석하고 실제 구현 방법을 제시합니다.

AI
#AI
#Caching
#ChatBot
#Performance
#Optimization
#OpenAI
#Anthropic
#LangChain
#Redis
#Qdrant
#Cost-Reduction
API 사용량 추적 시스템 설계 - Redis 하이브리드 접근법과 성능 최적화 전략2025-08-30

OpenAI API를 활용한 서비스에서 사용자별 월별 사용량을 효율적으로 추적하고 관리하기 위한 Redis 하이브리드 아키텍처 설계와 성능 최적화 전략을 체계적으로 분석한다.

Dev
#API
#Redis
#사용량-추적
#성능-최적화
#시스템-설계
#하이브리드-아키텍처
#백엔드
#캐싱
#레이트-리미팅
#트래픽-관리
멀티에이전트 아키텍처와 대규모 구현 전략2025-06-23

멀티에이전트 시스템의 핵심 아키텍처 패턴들과 대규모 환경에서의 구현 전략을 분석하고, 최신 통신 프로토콜과 확장성 해결책을 포괄적으로 다룬 가이드

AI
#AI
#Multi-Agent
#Architecture
#Scalability
#MCP
#A2A
#FIPA
#Distributed-Systems
LLM 에이전트 아키텍처 비교 - ReAct, Plan-and-Execute, Supervisor2025-06-04

워크플로우와 에이전트의 차이점, 그리고 ReAct, Plan-and-Execute, Supervisor 아키텍처의 특징과 장단점을 체계적으로 비교 분석한 포괄적 가이드

AI
#AI
#LLM
#agent
#ReAct
#Plan-and-Execute
#Supervisor
#architecture
#LangChain
#workflow
#Agentic-AI
#multi-agent
#MCP
#A2A