Skip to content
logo

AI

42 notes

LLM Text-to-SQL 실전 가이드 — 스키마 설계부터 Eval까지2026-04-19

프로덕션 환경에서 LLM 기반 Text-to-SQL을 구축하면서 배운 것들. 동적 스키마 조회, COMMENT 기반 zero-shot, 보안 레이어, 그리고 52문항 5모델 Eval 결과까지 정리한다.

#text-to-sql
#llm
#agent
#postgresql
#prompt-engineering
#evaluation
#langsmith
블로그 검색 실험 (1) — 검색 방법론 개요와 실험 설계2026-04-04

280개 한국어+영어 블로그 포스트를 테스트베드로 활용하여 다양한 검색 방법론을 실험하는 시리즈의 첫 번째 글. 키워드 검색부터 벡터 검색, 하이브리드 검색까지 각 방법의 원리를 정리하고, 실험 설계와 평가 기준을 수립한다.

#AI
#RAG
#Search
#BM25
#Vector-Database
#Hybrid-Search
#Embedding
#Experiment
OpenDataLoader PDF v2 - Java 기반 Apache 2.0 PDF 파서2026-03-27

OpenDataLoader PDF v2.1.1의 READoc 벤치마크 결과와 파싱 예시를 분석한다. Java 기반 Apache 2.0 파서로, 72.6% Edit Similarity에 ~3초/문서 속도를 보여주지만, 테이블 구조 보존과 수식 LaTeX 변환에 한계가 있다.

#pdf-parser
#document-ai
#rag
#opendataloader
#java
#apache-license
Docling - IBM의 MIT 라이선스 문서 파서, 가성비 최강2026-03-26

Docling v2.81.0의 내부 구조를 분석하고 READoc 벤치마크로 성능을 평가한다. IBM Research가 개발한 MIT 라이선스 파서로, Heron 레이아웃 모델과 Granite-Docling VLM을 사용하며, GPU 없이 4.9초/문서에 74.3% Edit Similarity를 달성한다.

#pdf-parser
#document-ai
#rag
#docling
#ibm
#layout-analysis
#ocr
LiteParse - LlamaIndex가 오픈소스로 공개한 초경량 PDF 파서2026-03-26

LiteParse는 LlamaIndex가 LlamaParse의 오픈소스 코어로 공개한 TypeScript 기반 PDF 파서다. PDF.js + Tesseract.js로 구현되어 ML 모델 없이 0.1초/문서의 극한 속도를 달성하지만, Markdown 구조화 없이 순수 텍스트만 추출하는 한계가 있다. READoc 벤치마크 결과 50.7%로 구조화 파서 대비 낮은 품질.

#pdf-parser
#document-ai
#rag
#llamaindex
#typescript
#ocr
Marker - 성공하면 최고, 하지만 안정성이 문제인 PDF 파서2026-03-26

Marker v1.10.1의 내부 구조를 분석하고 READoc 벤치마크로 성능을 평가한다. Surya OCR 기반의 ML 파서로, 성공한 문서에서 80.6% Edit Similarity(5개 파서 중 최고)를 달성하지만, 63%의 문서에서 에러가 발생하여 안정성에 문제가 있다.

#pdf-parser
#document-ai
#rag
#marker
#surya-ocr
#layout-analysis
OmniDocBench로 측정한 PDF 파서별 파싱 성능 - 텍스트, 테이블, 수식, 읽기 순서2026-03-26

OmniDocBench(CVPR 2025)로 MinerU, Docling, Marker 3개 파서의 요소별 파싱 성능을 측정한다. 텍스트 정확도, 테이블 TEDS, 수식 인식, 읽기 순서를 분리하여 평가하며, MinerU가 텍스트/테이블/읽기순서에서 압도적 1위, Marker는 수식에서 강점을 보인다.

#pdf-parser
#benchmark
#omnidocbench
#document-ai
#rag
#mineru
#docling
#marker
PDF 파서 5종 비교 분석 - 같은 문서, 다른 결과2026-03-26

동일한 PDF 문서(Attention Is All You Need)를 MinerU, Docling, Marker, PyMuPDF4LLM, LiteParse 5개 파서로 파싱한 결과를 요소별(헤딩, 테이블, 수식, 이미지)로 직접 비교한다.

#pdf-parser
#benchmark
#document-ai
#rag
#comparison
#mineru
#docling
#marker
#pymupdf4llm
#liteparse
PyMuPDF4LLM - 경량 GNN으로 GPU 없이 가장 빠른 PDF 파서2026-03-25

PyMuPDF4LLM v1.27.2.2의 내부 구조를 분석하고, 4종 문서(영문 논문, 한국어 보고서, PPT 슬라이드, 복잡한 레이아웃)로 성능을 테스트한다. 경량 GNN 모델(ONNX)로 레이아웃을 분석하고 규칙 기반으로 텍스트를 추출하여, 페이지당 0.05~0.25초의 압도적 속도를 보여준다.

#pdf-parser
#document-ai
#rag
#pymupdf
#ocr
#markdown
MinerU 2.x 파이프라인 분석 - 달라진 PDF 파서의 내부 구조와 성능 테스트2026-03-23

MinerU 2.7.6의 내부 파싱 파이프라인을 분석한다. YOLOv10 레이아웃 감지, SLANET+ 테이블 인식, UniMERNet 수식 인식 등 각 모델의 역할과 흐름을 정리하고, Apple Silicon MPS vs CPU 성능을 실측 비교한다.

#mineru
#pdf-parser
#document-ai
#layout-analysis
#ocr
#yolo
#rag
#multimodal
#apple-silicon
#mps
RAG-Anything 파헤치기 - 멀티모달 GraphRAG의 구조와 원리2026-03-22

RAG-Anything의 내부 구조를 파헤쳐본다. MinerU 파서, LightRAG 기반 지식 그래프 구축, 멀티모달 처리, VLM 강화 쿼리까지 전체 파이프라인을 상세히 분석한다.

#rag
#knowledge-graph
#graphrag
#lightrag
#mineru
#multimodal
#pdf-parser
#document-ai
#llm
#embedding
AI 개발 방법론 4종 비교: BMAD Method vs MoAI-ADK vs GitHub Spec Kit vs Get Shit Done2026-02-26

AI 코딩 도구가 넘쳐나는 시대, 실제로 개발 워크플로우를 바꿀 수 있는 방법론 4가지 — BMAD Method, MoAI-ADK, GitHub Spec Kit, Get Shit Done — 를 철학, 워크플로우, 커뮤니티 반응까지 철저하게 비교한다.

#AI
#agent
#workflow
#BMAD
#MoAI-ADK
#spec-kit
#GSD
#Agentic-AI
#Claude-Code
#development-methodology
#vibe-coding
#context-engineering
LLM이 고유명사를 틀리는 이유와 해결 방법2025-11-11

헬스케어 챗봇 개발 중 발견한 LLM의 고유명사 오표기 문제의 근본 원인을 분석하고, 다양한 해결 방법을 실험한 과정을 정리한다.

#AI
#LLM
#ChatBot
#Tokenization
#Prompt-Engineering
#Healthcare
#NLP
Context Engineering for AI Agents: With LangChain and Manus2025-10-26

LangChain과 Manus 웨비나에서 배운 AI 에이전트의 컨텍스트 엔지니어링 핵심 전략. 컨텍스트 오프로딩, 축소(압축 vs 요약), 격리(통신 vs 메모리 공유), 계층형 액션 공간 등 실전 검증된 기법과 '덜 구축하고 더 이해하라'는 철학을 다룬다.

#AI
#Agent
#LLM
#Context-Engineering
#Manus
#LangChain
pgvector: PostgreSQL의 벡터 검색 익스텐션2025-10-13

PostgreSQL에서 벡터 검색을 가능하게 하는 pgvector 익스텐션의 개념, 작동 원리, 인덱스 알고리즘(HNSW), 그리고 다른 벡터 데이터베이스와의 비교를 다룬다.

#AI
#pgvector
#PostgreSQL
#Vector-Database
#Embedding
#ANN
#HNSW
#RAG
#Semantic-Search
2025년 pgvector vs Qdrant vs Milvus 상세 성능 비교2025-10-13

2025년 최신 버전을 기준으로 pgvector (PostgreSQL 18), Qdrant 1.15, Milvus 2.6의 실제 성능, 기능, 비용을 상세 비교한다. 데이터 삽입, 검색 속도, 필터링, 확장성, 실전 시나리오별 권장사항을 다룬다.

#AI
#pgvector
#Qdrant
#Milvus
#Vector-Database
#Performance
#Benchmark
#RAG
#Hybrid-Search
학술 논문 특화 파서 시스템 분석2025-09-14

학술 논문을 위한 전문 문서 파싱 및 RAG 시스템 구축 프로젝트 분석. Upstage Document Parse와 LLM을 활용한 고품질 멀티모달 콘텐츠 추출, 벡터 데이터베이스 구축, 그리고 Multi-Query + Reranker 기반 하이브리드 검색 시스템 구현까지 포괄적으로 다룬다.

#AI
#PDF-Parser
#RAG
#Document-Processing
#Multi-Modal
#Vector-Database
#Qdrant
#OpenAI
#UPSTAGE
#GPT-4o
#Academic-Papers
#NLP
#Data-Pipeline
#Information-Retrieval
#Semantic-Search
챗봇 성능 최적화: 캐싱 전략으로 비용 절감과 속도 향상2025-09-07

AI 챗봇의 비용을 최대 90%까지 절감하고 응답 속도를 80% 향상시키는 프롬프트 캐싱, 시맨틱 캐싱, 딕셔너리 캐싱 전략을 상세히 분석하고 실제 구현 방법을 제시합니다.

#AI
#Caching
#ChatBot
#Performance
#Optimization
#OpenAI
#Anthropic
#LangChain
#Redis
#Qdrant
#Cost-Reduction
멀티에이전트 아키텍처와 대규모 구현 전략2025-06-23

멀티에이전트 시스템의 핵심 아키텍처 패턴들과 대규모 환경에서의 구현 전략을 분석하고, 최신 통신 프로토콜과 확장성 해결책을 포괄적으로 다룬 가이드

#AI
#Multi-Agent
#Architecture
#Scalability
#MCP
#A2A
#FIPA
#Distributed-Systems
LLM 에이전트 아키텍처 비교 - ReAct, Plan-and-Execute, Supervisor2025-06-04

워크플로우와 에이전트의 차이점, 그리고 ReAct, Plan-and-Execute, Supervisor 아키텍처의 특징과 장단점을 체계적으로 비교 분석한 포괄적 가이드

#AI
#LLM
#agent
#ReAct
#Plan-and-Execute
#Supervisor
#architecture
#LangChain
#workflow
#Agentic-AI
#multi-agent
#MCP
#A2A
다중공선성 (Multicollinearity)2025-04-22

다중공선성의 개념, 탐지 방법, 해결 방법 및 관련 작업들에 대한 포괄적인 가이드

#AI
#Machine Learning
#Statistics
#Regression
#Feature Engineering
MinerU - 고품질 PDF 변환 및 데이터 추출 도구2025-04-03

MinerU는 PDF 문서를 Markdown과 JSON으로 고품질 변환해주는 오픈소스 데이터 추출 도구이다.

#pdf-converter
#pdf-parser
#data-extraction
#markdown
#ocr
#ai
#PDF
#rag
#document-ai
#layout-analysis
MCP(Model Context Protocol)2025-03-31

Anthropic에서 개발한 MCP(Model Context Protocol)의 개념, 구조 및 활용에 대한 설명

#ai
#anthropic
#mcp
#claude
#langchain
#langgraph
#tool-use
#smithery
LLM Compiler for Parallel Function Calling2025-01-26

LLM 기능 호출을 병렬로 처리하여 지연 시간과 비용을 줄이는 LLM Compiler 연구에 대한 검토

#AI
#PaperReview
#LLM
#ToolCalling
#Optimization
#ParallelProcessing
#Plan-and-Execute
Knowledge Graphs for RAG2024-08-15

RAG(Retrieval-Augmented Generation) 시스템에서 지식 그래프 활용 방법과 Neo4j 구현

#ai
#deep-learning
#knowledge-graph
#rag
#neo4j
#graph-database
Chainlit2024-08-13

빠르게 대화형 AI 애플리케이션을 개발할 수 있는 Chainlit 라이브러리 사용법

#ai
#ui
#langchain
#chatbot
#development
문서(pdf 등) 내 시각 자료와 텍스트의 추출 및 활용2024-07-23

멀티모달 RAG를 활용한 PDF 문서 내 시각 자료와 텍스트 추출 및 활용 기법

#AI
#RAG
#MultiModal
#PDF
#pdf-parser
문서(pdf 등) 내 시각 자료와 텍스트의 추출 및 활용 연구2024-06-08

멀티모달 RAG를 통한 문서 내 텍스트와 이미지 추출 및 활용 연구

#AI
#RAG
#MultiModal
#PDF
#pdf-parser
RAG용 PDF Loader 비교2024-05-22

LangChain에서 사용 가능한 다양한 PDF Loader 라이브러리들의 특징과 성능을 비교 분석한 문서

#rag
#langchain
#pymupdf
#pypdflium2
#document-loader
#PDF
#pdf-parser
Agent 사용 RAG+Tavily2024-05-05

LangChain Agent와 Tavily 검색 엔진을 활용한 고급 RAG 시스템 구현 방법과 활용 사례 분석

#rag
#agent
#langchain
#tavily
#llm
#pdf-search
#information-retrieval
RAG+Groq2024-04-29

Groq LPU 모델을 활용한 RAG 시스템 구축 및 성능 특징 설명

#ai
#deep-learning
#langchain
#rag
#groq
LLM Chain Chatbot + RAG2024-04-11

LangChain의 ConversationalRetrievalChain을 활용한 대화형 RAG 시스템 구현 방법과 주요 기능 설명

#llm
#langchain
#chatbot
#rag
#nlp
#conversational-ai
LayoutLM2024-04-04

LayoutLM의 발전 과정과 시각적으로 풍부한 문서 이해를 위한 다양한 버전별 특징 및 성능 분석

#document-ai
#nlp
#deep-learning
#computer-vision
#multimodal
#layout-analysis
#ocr
Imbalanced Data Prediction(Anomaly Detection)2024-03-18

불균형 데이터에서의 이상치 탐지를 위한 다양한 모델과 기법을 비교 분석한 글이다.

#anomaly-detection
#imbalanced-data
#classification
#clustering
#machine-learning
#deep-learning
T-SNE (t-distributed stochastic neighbor embedding)2024-03-16

고차원 데이터를 효과적으로 시각화하는 비선형 차원 축소 기법인 t-SNE의 원리와 활용법을 설명한 글이다.

#dimensionality-reduction
#t-sne
#visualization
#machine-learning
#deep-learning
#data-science
Anomaly Detection2024-03-12

이상 탐지(Anomaly Detection)의 주요 방법론과 기법을 정리하고 각 접근법의 장단점을 비교한 글이다.

#anomaly-detection
#machine-learning
#deep-learning
#imbalanced-data
#classification
#autoencoder
LangGraph2024-03-06

LangGraph 라이브러리의 개념과 다중 에이전트 협업 시스템 구현 방법 설명

#ai
#deep-learning
#langchain
#langgraph
#agent
#llm
LangChain2024-02-02

LangChain 프레임워크의 기본 개념, 활용 방법 및 LLama2와 결합한 실전 프로젝트 구현 과정 설명

#ai
#deep-learning
#langchain
#llm
#openai
#llama2
#gemini-pro
#streamlit
차원 축소 (Dimensionality Reduction) 기법2023-09-12

데이터의 복잡성을 줄이는 주요 차원 축소 기법인 PCA, t-SNE, UMAP의 개념과 활용법을 정리한 글이다.

#dimensionality-reduction
#pca
#t-sne
#umap
#machine-learning
#visualization
Track Anything: Segment Anything Meets Videos2023-06-19

SAM을 비디오에 적용한 Track Anything Model(TAM)의 특징과 활용 방안을 정리한 글이다.

#tam
#sam
#paper
#computer-vision
#tracking
#segmentation
Tensorflow Deep-Learning Computer-Vision Guide Notes 22022-08-11

컴퓨터 비전에서 객체 탐지(Object Detection)와 위치 찾기(Localization) 개념 및 Region Proposal 방식에 대해 설명한 글이다.

#deep-learning
#computer-vision
#tensorflow
#object-detection
#localization
#region-proposal
Tensorflow Deep-Learning Computer-Vision Guide Notes 12022-07-25

딥러닝 기반 컴퓨터 비전의 객체 탐지(Object Detection)와 세그멘테이션(Segmentation)에 대한 기본 개념과 발전 과정을 정리한 글이다.

#deep-learning
#computer-vision
#tensorflow
#object-detection
#segmentation