Questo contenuto è una traduzione automatica. Vedere la sezione Esclusione di responsabilità per la traduzione automatica.

Passa a Inglese

How to use large language models for Qsirch RAG search?

Come utilizzare i modelli linguistici avanzati per la ricerca RAG di Qsirch?

Ultima data di modifica 2025-09-24

Applicable Products

Qsirch 6.0.0 (or later) on all platforms

Qsirch RAG Search with Cloud and On-Premise LLMs

Qsirch supports using Retrieval-Augmented Generation (RAG) with cloud-based large language models (LLMs) to deliver accurate and context-aware responses. When you enter a query, Qsirch retrieves relevant documents from your NAS and uses them as context for the language model. This combination of search and generative AI enables Qsirch to generate precise and informed answers based on your own data.

Qsirch also supports multi-turn conversation, enabling natural and context-aware interactions. Users can ask follow-up questions without repeating prior context, and context is preserved across turns for coherent answers. Multi-turn conversation support works with both cloud and on-premise RAG modes.

Integrate RAG with Cloud-based AI Services

To integrate RAG search, you must first obtain an API key from an AI service of your choice.

ChatGPT (OpenAI API)

ChatGPT (OpenAI API) provides powerful GPT models for both RAG embeddings and generative responses. Follow the steps below to apply for an API key:

Sign up for an account on OpenAI: https://auth.openai.com/create-account
Create an API key in the account settings.

For more information, see OpenAI API Documentation.

Azure OpenAI

Azure OpenAI provides access to OpenAI models (like GPT-4.1) via Azure infrastructure, which is ideal for enterprise solutions. Follow the steps below to apply for an API key:

Sign in to the Azure Portal.
Select your OpenAI resource (or create one if you do not already have one).
On the left menu, click Keys and Endpoint.
Copy an API key and copy the endpoint (base URL) for API requests.

For more information, see Azure OpenAI Documentation.

Gemini (Google Cloud AI)

Gemini (Google Cloud AI) provides a set of models designed for high-performance reasoning and RAG. Follow the steps below to apply for an API key:

Visit the Google Gemini API Documentation.
Get a Gemini API key in Google AI Studio.
Sign in to your Google account.
Click Create API key.

For more information, see Google Cloud AI Documentation.

OpenAI-Compatible API

OpenAI Compatible API allows users to access various AI models beyond OpenAI’s own offerings, including models like DeepSeek and Grok, using the same API format. This enables seamless integration with existing applications built for OpenAI API. Follow the steps below to apply for an API key:

Choose a provider that supports OpenAI-compatible API (for example, DeepSeek or Grok).
Sign up on the provider's platform.
Generate an API key in the account settings.
Update your API endpoint and model settings as required.

For more information, refer to the provider's official API documentation.

On-Premise RAG Search

For advanced users and enterprises who require full data privacy or offline AI capabilities, Qsirch offers on-premise RAG search powered by locally hosted LLMs. This mode runs entirely on your NAS or connected hardware, without sending data to external services.

Note

This feature is only available on specific NAS models. For details, see the introduction to RAG search on the QNAP website.

To enable on-premise RAG:

Ensure that the LLM Core is ready.
Set the GPU to Container Station mode (Go to Control Panel > Hardware > Hardware Resources > Resource Use > Container Station mode).

How to Use RAG Search in Qsirch

Go to Settings > Administrative setting > RAG Search.
Add one or more cloud services to use RAG search.
(Optional) Verify your API key. This helps check whether an API key is valid.
Download one or more edge models from the on-premise services. This feature can only be used on the specific NAS models.
Add more AI models that are compatible with OpenAI API, including the GPT series, DeepSeek models, and Grok models.
Choose file formats for your RAG search.
Go to Qsirch home page and click the RAG search button.
Qsirch RAG search will only use the files included in "Source" for data retrieval.
Check the model you want to use and then start using RAG search.

Prodotti applicabili

Qsirch 6.0.0 (o versione successiva) su tutte le piattaforme

Ricerca RAG di Qsirch con Cloude LLM On-Premise

Qsirch supporta l'uso di Retrieval-Augmented Generation (RAG) con modelli linguistici di grandi dimensioni (LLM) basati su cloud per fornire risposte accurate e consapevoli del contesto. Quando inserisci una query, Qsirch recupera documenti pertinenti dal tuo NAS e li utilizza come contesto per il modello linguistico. Questa combinazione di ricerca e AI generativa consente a Qsirch di generare risposte precise e informate basate sui tuoi dati.

Qsirch supporta anche la conversazione multi-turn, consentendo interazioni naturali e consapevoli del contesto. Gli utenti possono fare domande di follow-up senza ripetere il contesto precedente, e il contesto è preservato tra i turni per risposte coerenti. Il supporto alla conversazione multi-turn funziona sia con modalità RAG cloud che on-premise.

Integra RAG con servizi AI basati su cloud

Per integrare la ricerca RAG, devi prima ottenere una chiave API da un servizio AI a tua scelta.

ChatGPT (API OpenAI)

ChatGPT (API OpenAI) fornisce potenti modelli GPT sia per embedding RAG che per risposte generative. Segui i passaggi seguenti per richiedere una chiave API:

Registrati per un account su OpenAI: https://auth.openai.com/create-account
Crea una chiave API nelle impostazioni dell'account.

Per ulteriori informazioni, vedere Documentazione API di OpenAI.

Azure OpenAI

Azure OpenAI fornisce accesso ai modelli OpenAI (come GPT-4.1) tramite infrastruttura Azure, ideale per soluzioni aziendali. Segui i passaggi seguenti per richiedere una chiave API:

Accedi al Portale Azure.
Seleziona la tua risorsa OpenAI (o creane una se non ne hai già una).
Nel menu a sinistra, fai clic su Chiavi e Endpoint.
Copia una chiave API e copia l'endpoint (URL base) per le richieste API.

Per ulteriori informazioni, vedere Documentazione OpenAI di Azure.

Gemini (Google Cloud AI)

Gemini (Google Cloud AI) fornisce un insieme di modelli progettati per ragionamenti ad alte prestazioni e RAG. Segui i passaggi seguenti per richiedere una chiave API:

Visita il Documentazione API di Google Gemini.
Ottieni una chiave API Gemini in Google AI Studio.
Accedi al tuo account Google.
Fai clic su Crea chiave API.

Per ulteriori informazioni, vedere Documentazione AI di Google Cloud.

API compatibile con OpenAI

L'API compatibile con OpenAI consente agli utenti di accedere a vari modelli AI oltre alle offerte di OpenAI, inclusi modelli come DeepSeek e Grok, utilizzando lo stesso formato API. Questo consente un'integrazione senza soluzione di continuità con le applicazioni esistenti costruite per l'API OpenAI. Segui i passaggi seguenti per richiedere una chiave API:

Scegli un fornitore che supporti l'API compatibile con OpenAI (ad esempio, DeepSeek o Grok).
Registrati sulla piattaforma del fornitore.
Genera una chiave API nelle impostazioni dell'account.
Aggiorna il tuo endpoint API e le impostazioni del modello come richiesto.

Per ulteriori informazioni, fare riferimento alla documentazione ufficiale dell'API del fornitore.

Ricerca RAG on-premise

Per utenti avanzati e aziende che richiedono piena privacy dei dati o capacità AI offline, Qsirch offre una ricerca RAG on-premise alimentata da LLM ospitati localmente. Questa modalità funziona interamente sul tuo NAS o hardware connesso, senza inviare dati a servizi esterni.

Nota

Questa funzione è disponibile solo su modelli NAS specifici. Per i dettagli, vedere il introduzione alla ricerca RAG sul sito web di QNAP.

Per abilitare la ricerca RAG on-premise:

Assicurati che il Core LLM sia pronto.
Imposta la GPU in modalità Container Station (Vai a Pannello di controllo > Hardware > Risorse hardware > Uso delle risorse > modalità Container Station ).

Come utilizzare la ricerca RAG in Qsirch

Vai a Impostazioni > Impostazioni amministrative > Ricerca RAG.
Aggiungi uno o più servizi cloud per utilizzare la ricerca RAG.
(Opzionale) Verifica la tua chiave API. Questo aiuta a controllare se una chiave API è valida.
Scarica uno o più modelli Edge dai servizi on-premise. Questa funzione può essere utilizzata solo sui modelli NAS specifici.
Aggiungi più modelli AI compatibili con l'API OpenAI, inclusi i modelli della serie GPT, i modelli DeepSeek e i modelli Grok.
Scegli i formati di file per la tua ricerca RAG.
Vai alla home page di Qsirch e fai clic sul pulsante di ricerca RAG.
La ricerca RAG di Qsirch utilizzerà solo i file inclusi in "Source" per il recupero dei dati.
Controlla il modello che desideri utilizzare e poi inizia a utilizzare la ricerca RAG.

Questo articolo è stato utile?

Sì. No.

93% delle persone lo ritengono utile.

Informarci su come può essere migliorato l'articolo:

L’articolo non contiene informazioni importanti
Le soluzioni dell’articolo non funzionano
L’articolo è troppo complesso
L’articolo contiene informazioni errate
L’articolo non è aggiornato

Per offrire un’ulteriore feedback, includerlo di seguito.

NAS

Rete

Sorveglianza

Applicable Products

Qsirch RAG Search with Cloud and On-Premise LLMs

Integrate RAG with Cloud-based AI Services

ChatGPT (OpenAI API)

Azure OpenAI

Gemini (Google Cloud AI)

OpenAI-Compatible API

On-Premise RAG Search

How to Use RAG Search in Qsirch

Prodotti applicabili

Ricerca RAG di Qsirch con Cloude LLM On-Premise

Integra RAG con servizi AI basati su cloud

ChatGPT (API OpenAI)