AI 활용해서 LLM 기반 서비스 구상 테스트준비

티스토리 뷰

카테고리 없음

AI 활용해서 LLM 기반 서비스 구상 테스트준비

미니대왕님 2025. 12. 19. 15:16

별첨 #1 KoSimCSE란?

별첨 #2. Chunking 청킹이란...

별첨 #3. n8n 완전 정복 가이드

별첨 #4. Chroma DB 완전 가이드

별첨 #10. kiwipiepy(키위파이파이)

별첨 #11. Poetry란?

스터디 앞서 기본적으로 알아야만 하는 키워드 모음
Kosimcse / chunking(문서분할) / N8N / Vector Store / Rag / MCP 서버 / KoSimCSE
embedding / LLaMA / kiwipiepy / poetry / Langchain

✅ 1. 개요 및 핵심 목표 (온프레미스 기반)

목표 항목설명

🔗 통합 포털 구축	Tableau 등 여러 대시보드를 하나의 웹 포털로 통합
📚 문서 검색 시스템	TXT, PDF, Word 기반 문서를 전처리하여 RAG로 구축
⚙️ 온프레미스 K8s 기반	자체 IDC 환경 또는 VM에 구축된 K8s 위에 모든 서비스 운영
👥 900명 사용자	SSO, 권한 관리, 사용자 로그 모니터링까지 필요

✅ 2. 온프레미스 K8s 환경 구성 시 고려사항

🧱 인프라 구성 예시

⚙️ K8s 구성 요소

구성 요소설명

노드 구성	마스터 3대 + 워커 3~6대 (사용자 수 대비 확장 가능)
스토리지	NFS, Ceph, Longhorn, GlusterFS 등 온프레미스용
인그레스	NGINX Ingress Controller + 인증 (SSO 연동)
로깅/모니터링	Prometheus + Grafana + Loki or ELK
CI/CD	GitLab CI, ArgoCD
보안	RBAC, 네임스페이스 분리, 인증서 관리 (cert-manager)

✅ 3. RAG 시스템 구성 (문서 검색 시스템)

🔹 구성 흐름

결론 : KoSimCSE는 한국어에 최적화된 SimCSE 기반 문장 임베딩 모델로,
빠른 속도 + 높은 품질 + HuggingFace 호환성 덕분에 실무에서 RAG 시스템에 매우 많이 사용됩니다.

https://tommypagy.tistory.com/761 KoSimCSE별첨 #1 참고하기

별첨 #1 KoSimCSE란?

✅ 1. KoSimCSE란?SimCSE 구조 + 한국어 사전학습 모델(RoBERTa 등) 조합한국어 문장 간 의미 유사도 계산, 임베딩, 벡터 DB 구축에 적합대표 개발자: BM-K 팀📦 대표 모델:BM-K/KoSimCSE-robertaBM-K/KoSimCSE-bertBM-K/

tommypagy.tistory.com

🔸 온프레미스에 적합한 구성

요소온프레미스 추천

LLM API	내부에 설치 가능한 모델 (예: Llama 2, Mistral) 또는 외부 API (VPN 통해 제한적 사용)
Embedding 모델	KoBERT, E5, text-embedding-ada
Vector DB	FAISS (가볍고 로컬에 적합), Qdrant (Docker로 쉽게 배포)
LangChain	Python 기반 RAG 파이프라인 구축에 유용
LLM 실행	Text Generation WebUI, Ollama, LM Studio 등 LLM On-Prem 실행 도구 활용 가능

✅ 4. 포털 및 대시보드 통합

🔹 구성 요소

구성 요소설명

통합 포털 UI	React / Next.js로 구성하여 iframe 또는 API 연동
Tableau 연동	JavaScript API 사용, SSO 인증 연동
Grafana 등	iframe 또는 직접 API 연동 가능
SSO 인증	Keycloak, SAML, OAuth2 연동 구성 필수

각 대시보드는 사용자 권한에 따라 접근 제어되어야 하며, 포털 자체에서도 그룹별 대시보드 탭을 관리해야 합니다.

✅ 5. 900명 사용자 대응 전략

항목대응 방식

인증 및 권한 관리	Keycloak 등으로 LDAP/AD 연동, 그룹 단위 권한 설정
부하 분산	HPA 설정, Ingress에 LoadBalancer 구성 (MetalLB)
데이터 분리	문서 유형/부서별 vector DB 나누기
로깅/감사	사용자 로그 기록 → Grafana or ELK에서 시각화
문서 자동 갱신	문서 업로드 후 자동 전처리 스케줄러 (CronJob in K8s) 구성

✅ 6. 온프레미스 구축 시 리스크 & 해결방안

리스크해결책

LLM API 속도/비용 문제	내부 LLM 직접 실행 (LLaMA2, Mistral 등) or 프록시 캐싱
벡터 DB 부하	수평 확장 지원하는 Qdrant, Redis Search 고려
인증 복잡성	Keycloak을 통해 포털 + 대시보드 + 챗봇 모두 통합 인증 구성
업데이트 자동화	GitOps 방식으로 ArgoCD 또는 FluxCD 도입 권장

✅ 7. 기술 스택 요약 (온프레미스 친화적)

분야기술 스택

웹 UI	Next.js, React, Tailwind
챗봇 백엔드	FastAPI, LangChain
Vector DB	FAISS, Qdrant (Docker 배포)
LLM	Ollama + LLaMA 2 / Mistral (내부 실행)
K8s 관리	Rancher, Lens, ArgoCD
스토리지	Ceph / NFS (공유 저장소)
인증	Keycloak + LDAP 연동
모니터링	Prometheus + Grafana + Loki

✅ 다음 단계 추천

📌 온프레미스 K8s 클러스터 현황 점검 (리소스, 스토리지, 인증 체계)
⚙️ RAG POC부터 소규모로 시작 (간단한 문서 검색 시스템)
🧩 통합 포털 UI 설계 및 대시보드 연결 방식 정의
📈 트래픽 예측 + 사용자 로그 수집 전략 세우기

저작자표시 (새창열림)

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

미니대왕님

TAG more

« 2026/03 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

글 보관함

IT 냉동인간 미니대왕님(miniking)

티스토리 뷰