Como configurar o Qsirch RAG On-Prem
Produtos Aplicáveis
Qsirch 6.0.0 (ou posterior) na plataforma QuTS hero
Pesquisa RAG On-Premise
Para utilizadores avançados e empresas que necessitam de total privacidade de dados ou IA offline, o Qsirch executa RAG em LLMs alojados localmente. Tudo é realizado no seu NAS ou hardware conectado - nenhum dado sai do seu ambiente.
Hardware e Configuração
Recomendações de hardware
- NAS: TS-h1290FX ( https://www.qnap.com/zh-tw/product/ts-h1290fx )
- GPUs: RTX 6000 Ada e RTX 4000 Ada
- QuTS hero 5.2.1 ou versões posteriores
- O LLM Core está instalado e ativado
- Vá para Painel de Controlo > Hardware > Recursos de hardware > Uso de Recursos > modo Container Station

LLM Core (app) - Modelos suportados pelo RAG On-Prem
O LLM Core traz grandes modelos de linguagem diretamente para o seu NAS, permitindo que o Qsirch execute RAG de forma privada e eficiente sem serviços na nuvem. Com gestão de modelos integrada, pode descarregar, organizar e alternar entre modelos locais, e depois usá-los no Qsirch para geração. Tudo é executado no seu hardware para total controlo sobre o desempenho e a privacidade.
Modelos locais atualmente suportados (a lista é atualizada ao longo do tempo; verifique na aplicação para os modelos mais recentes):
| Nome de exibição | Parâmetros | Quantização | Tamanho |
|---|---|---|---|
| DeepSeek R1 7B | 7.628B | Q4_K_M | 4.70 GB |
| DeepSeek R1 14B | 14.8B | Q4_K_M | 9.00 GB |
| Gemma3 12B | 12.2B | Q4_K_M | 8.10 GB |
| DeepSeek R1 8B | 8.03B | Q4_K_M | 4.90 GB |
| DeepSeek R1 32B | 32,8B | Q4_K_M | 20,00 GB |
| Gemma3 1B | 1,0B | Q4_K_M | 0,815 GB |
| Gemma3 4B | 4,38B | Q4_K_M | 3,30 GB |
| Gemma3 27B | 27,4B | Q4_K_M | 18,00 GB |
| gpt-oss 20B | 20,98B | MXFP4 | 14,00 GB |
| Mistral 7B | 7,25B | Q4_K_M | 4,10 GB |
| Microsoft Phi-4 14B | 14,7B | Q4_K_M | 9,10 GB |
Como configurar o serviço On-premise no Qsirch
- Vá para Definições > definição de administrador > Pesquisa RAG > Serviço On-premise.

- Se o LLM Core não estiver instalado/ativado, clique em Ativar agora para ir para o App Center e instalar/ativar o LLM Core.


Se a placa GPU não estiver configurada para o modo Container Station, clique em Ativar agora para ir para Painel de Controlo e definir a GPU para o modo Container Station.

