콘텐츠로 이동

DGX Spark 구성 정보

DGX Spark를 AI Poc 용도로 사용하기 위해 구성한 정보들입니다.


빠른 시작

  • 시스템 구성


    DGX Spark 초기 설정, 파일시스템, 계정, 원격접속 구성

    시작하기

  • LLM 추론 엔진


    TensorRT-LLM, vLLM, Ollama를 이용한 LLM 구동

    LLM 구성

  • 사용자 앱


    OpenWebUI, AnythingLLM을 통한 채팅 인터페이스

    WebUI 구성

  • 개발 환경


    에어갭 환경을 위한 Python 패키지 오프라인 저장소

    패키지 설치


문서 목록

시스템 구성

번호 제목 설명
01 서비스 연결 정보 주요 서비스, 접속 계정 및 URL 정보 요약
02 기본 구성 파일시스템, 계정, 쉘, 원격제어, 한국어 지원

LLM 다운로드

번호 제목 설명
03 모델 다운로드 툴 (model-tool) 사내 모델 서버로부터 모델을 다운로드하는 전용 CLI

LLM 추론 엔진

번호 제목 설명
04 LLM 구성 TensorRT-LLM, vLLM, Ollama를 이용한 LLM 6종 구동
04-1 Ollama 구성 Docker 기반 Ollama 설치 및 실행
04-2 TRT-LLM 구성 TensorRT-LLM 고성능 추론 엔진 및 OpenWebUI 연동

Web UI

번호 제목 설명
05 OpenWebUI 구성 다양한 LLM 백엔드 연동을 위한 웹 채팅 인터페이스
05-1 AnythingLLM 구성 RAG 및 Knowledge Base 구축에 특화된 챗봇
05-2 LM Studio 구성 로컬 LLM 모델 구동 플랫폼 및 AppImage 관리

LLM 연동 활용

번호 제목 설명
06 VSCode 연동 Continue 확장을 이용한 VSCode와 LLM 서버 연동

개발 환경

번호 제목 설명
07 Python 패키지 오프라인 저장소 에어갭 환경을 위한 Python 패키지 사전 다운로드 및 설치
08 Next.js 오프라인 템플릿 폐쇄망 개발을 위한 Next.js + shadcn/ui 템플릿 및 가이드