시놀로지 NAS를 쓰는 가장 큰 이유가 사진이랑 영상 저장이잖아요. 그런데 막상 파일이 수만 장 쌓이고 나면 찾기가 더 힘들어지는 경우가 많습니다.
Synology Photos의 얼굴 인식은 잘 돼요. 그런데 "바다에서 찍은 사진"이나 "2023년 제주 여행"처럼 내용 기반으로 검색하려면 태그를 직접 달아야 하거든요. 영상도 마찬가지예요. 파일명이 IMG_4823.mov로 저장된 영상이 수백 개면, 뭐가 뭔지 열어보기 전까지 알 수가 없습니다.
여기서 로컬 AI가 실제로 쓸 수 있는 자리가 생깁니다. 사진 자동 태깅, 영상 자막 생성, 파일 자동 분류·정규화 — 이 세 가지가 NAS 로컬 AI의 가장 현실적인 활용법이에요. 빠른 응답이 필요 없고, 새벽에 돌려도 되는 작업들이라 CPU만 있는 NAS 환경과도 잘 맞습니다.
이 글에서는 시놀로지 NAS에 로컬 AI를 설치한 환경을 기준으로, 미디어와 파일 관리에서 실제로 쓸 수 있는 방법을 구체적으로 정리합니다. 설치가 아직 안 됐다면 시놀로지 Ollama 설치 가이드를 먼저 보고 오세요.
먼저 역할을 구분해두는 게 좋아요. 로컬 AI가 Synology Photos를 대체하는 게 아니라, 부족한 부분을 채우는 구조입니다.
표에서 보면 Synology Photos가 이미 잘 하는 얼굴 인식·날짜 분류는 건드릴 필요가 없어요. 로컬 AI가 진짜 힘을 발휘하는 건 내용 기반 태깅, 자막 생성, 파일 정규화처럼 Photos가 아예 지원하지 않는 영역입니다. 이 세 가지에만 집중하면 구조가 단순해져요.
수만 장의 사진에서 "고양이가 있는 사진"이나 "저녁 식사 사진"을 찾으려면 태그가 있어야 합니다. 직접 달려면 끝이 없고요. 멀티모달 LLM을 쓰면 사진을 AI에 넘기고 "이 사진에 뭐가 있는지 한 줄로 설명해줘"라는 프롬프트로 자동 태그를 뽑아낼 수 있어요.
실제로 해보면 생각보다 잘 됩니다. 음식 사진이면 "저녁 식사, 파스타, 실내 조명", 바다 사진이면 "해변, 낮, 파란 하늘" 식으로 설명이 나오고, 이걸 파일 메타데이터나 별도 CSV로 저장해두면 나중에 검색이 가능해져요.
영상 자막 생성은 NAS 로컬 AI 활용 중에서 가장 진입 장벽이 낮습니다. 이게 핵심이에요.
Whisper는 OpenAI가 만든 음성 인식 모델인데, faster-whisper 버전은 RAM 2~4GB만 있어도 돌아갑니다. GPU 없이 CPU만으로도 동작하고, 한국어 인식 품질도 실용적인 수준이에요. 8GB RAM NAS에서도 충분히 쓸 수 있는 거의 유일한 AI 작업이라고 봐도 됩니다.
실제로 가장 많이 쓰이는 패턴은 두 가지예요. 강의 영상이나 인터뷰 영상을 텍스트로 뽑아서 내용 검색을 가능하게 하거나, 가족 행사 영상에 자막을 붙여서 추억 보관용으로 쓰는 경우입니다. 빠른 속도가 필요 없는 작업이라 NAS 환경과 딱 맞아요.
NAS에 파일이 오래 쌓이면 반드시 생기는 문제가 두 가지입니다. 파일명이 제각각이라 찾기 어렵고, 같은 파일이 여러 폴더에 중복 저장돼 있어요.
IMG_4823.jpg, KakaoTalk_20231105_183422.jpg, screenshot_0042.png처럼 제각각인 파일명을 2024-11-05_제주여행_해변.jpg 식으로 바꾸는 작업입니다. n8n으로 새 파일 업로드를 감지하고, Ollama 멀티모달 모델이 내용을 분석해서 이름 제안을 만들어요.
파일명 변경 자체는 n8n의 Move/Rename 노드로 처리합니다. 실제로 써보면 EXIF 날짜 데이터를 먼저 앞에 붙이고, 뒤에 AI가 만든 내용 설명을 붙이는 방식이 가장 안정적이에요. 날짜는 EXIF가 정확하고, 내용 설명은 AI가 담당하는 역할 분리가 핵심입니다.
완전히 같은 파일(해시값 동일)은 기존 툴로도 찾을 수 있어요. 그런데 "거의 같은 사진"은 다릅니다. 같은 장면을 연속으로 찍은 3장, 카카오톡으로 받아서 화질이 살짝 다른 파일, 크기만 다른 썸네일 파일 — 이런 유사 파일은 해시값이 달라서 기존 툴이 잡아내지 못해요.
멀티모달 LLM으로 사진 임베딩을 만들고 유사도를 비교하면 "내용이 비슷한 파일"을 찾을 수 있습니다. 다만 이 방식은 RAM을 많이 쓰고 처리 시간도 깁니다. 솔직히 말하면 수만 장 전체를 한 번에 처리하기보다, 특정 기간·폴더 단위로 범위를 좁혀서 주기적으로 돌리는 게 현실적이에요.
위 세 가지 작업을 n8n 하나로 연결하면 새 파일이 올라올 때마다 자동으로 처리되는 구조가 됩니다.
처음부터 전부 구성하려고 하면 설정이 복잡해서 중간에 막히는 경우가 많아요. Whisper 자막 생성 하나만 먼저 돌려보고, 안정되면 사진 태깅을 추가하는 순서가 실제로 오래 쓸 수 있는 방식입니다.
8GB 환경이라도 Whisper 하나만으로 충분히 실용적인 구조가 됩니다. 사진 태깅이나 파일 정규화까지 하려면 16GB 이상이 현실적인 기준선이에요. 내 NAS 기종의 RAM 한도가 어디까지인지는 시놀로지 NAS 기종별 실행 조건 비교에서 확인할 수 있습니다.
충돌 없습니다. Synology Photos의 얼굴 인식·날짜 분류는 NAS 자체 기능으로 작동하고, 로컬 LLM은 파일에 직접 메타데이터를 쓰거나 별도 CSV를 만드는 방식이라 서로 영역이 달라요. Synology Photos의 태그 항목에 직접 쓰고 싶다면 Synology Photos API를 연동해야 하는데, 처음에는 별도 관리 파일로 시작하는 게 더 단순합니다.
Container Manager에서 fedirz/faster-whisper-server 이미지를 검색해서 설치하면 됩니다. 포트는 8000번을 기본으로 씁니다. 설치 방법은 시놀로지 Container Manager 설치 가이드의 방식과 동일하게 적용하면 돼요. 모델은 컨테이너 환경 변수에서 WHISPER_MODEL=small로 지정하면 됩니다.
Whisper small 모델 기준으로 일상 대화나 강의처럼 비교적 명확한 발음에서는 실용적인 수준이 됩니다. 사투리가 강하거나 배경 소음이 심한 영상은 오류가 늘어요. medium 모델을 쓰면 품질이 올라가지만 RAM을 2배 가까이 더 씁니다. 8GB NAS라면 small로 시작해서 품질을 확인하는 게 현실적이에요.
CPU 연산 기준 사진 1장에 10~30초라면, 10만 장은 단순 계산으로 300~800시간입니다. 한 번에 다 돌리는 건 비현실적이에요. 현실적인 접근은 두 가지입니다. 신규 추가 파일만 자동 처리하는 구조를 먼저 만들고, 기존 파일은 날짜·폴더 단위로 나눠서 월 단위로 조금씩 처리하는 방식이에요. 처음부터 전체를 한 번에 처리하려고 하면 중간에 지치게 됩니다.
n8n 파이프라인에서 파일명을 바꾸기 전에 원본 파일명을 별도 로그 파일에 기록해두면 됩니다. 이 로그만 있으면 잘못됐을 때 일괄 복원이 가능해요. Synology의 파일 버전 관리(Btrfs 스냅샷)가 설정돼 있다면 이중으로 안전합니다. 파이프라인 첫 번째 노드로 원본 파일명 로깅을 반드시 넣어두는 게 맞아요.
그렇지는 않습니다. Google Photos나 iCloud는 스마트폰 자동 백업, 어디서나 접근, 얼굴 인식 기반 공유 같은 기능이 잘 돼 있어요. NAS 로컬 구조는 민감한 사진을 외부에 올리지 않거나, 구독료 없이 대용량 원본을 보관하고 싶은 경우에 병행하는 선택이에요. 클라우드 AI 구독 비용이 부담스럽다면 클라우드 AI 구독 비용 조건 비교도 함께 보면 어떤 부분을 로컬로 대체할지 판단하기 쉬워요.
NAS에 사진과 영상이 쌓여 있는데 정리가 안 된 상태라면, Whisper 자막 생성 하나부터 시작해보세요. 설치가 가장 간단하고, 8GB NAS에서도 돌아가고, 결과가 바로 파일로 남아서 체감이 빠릅니다.
사진 태깅이나 파일 정규화는 그다음 단계예요. 한 번에 전부 구성하려다가 중간에 막히는 경우가 많아서, 하나 안정화하고 나서 붙이는 순서가 실제로 오래 유지되는 방식입니다. 로컬 AI로 어떤 작업을 더 할 수 있는지는 시놀로지 NAS 로컬 AI 활용법 전체 정리에서 확인해보세요.
📌 시놀로지 NAS Whisper 설치 + 영상 자막 자동 생성 실전 가이드
8GB NAS도 가능 — faster-whisper Docker 설치부터 n8n 자동화 연결까지
📌 시놀로지 NAS n8n 설치 + Ollama 연동 자동화 파이프라인 가이드
문서 요약·파일 분류·사진 태깅 자동화의 핵심 연결 구조
📌 시놀로지 NAS AnythingLLM 설치 + RAG 문서 질의응답 구성 가이드
계약서·의료 기록·개인 문서를 외부 서버 없이 AI로 검색하는 방법