Ce contenu est traduit automatiquement. Veuillez consulter la Clause de non-responsabilité relative à la traduction automatique.

How to use large language models for Qsirch RAG search?

Comment utiliser les grands modèles de langage pour la recherche Qsirch RAG ?

Date de la dernière modification : 2025-09-24

Applicable Products

Qsirch 6.0.0 (or later) on all platforms

Qsirch RAG Search with Cloud and On-Premise LLMs

Qsirch supports using Retrieval-Augmented Generation (RAG) with cloud-based large language models (LLMs) to deliver accurate and context-aware responses. When you enter a query, Qsirch retrieves relevant documents from your NAS and uses them as context for the language model. This combination of search and generative AI enables Qsirch to generate precise and informed answers based on your own data.

Qsirch also supports multi-turn conversation, enabling natural and context-aware interactions. Users can ask follow-up questions without repeating prior context, and context is preserved across turns for coherent answers. Multi-turn conversation support works with both cloud and on-premise RAG modes.

Integrate RAG with Cloud-based AI Services

To integrate RAG search, you must first obtain an API key from an AI service of your choice.

ChatGPT (OpenAI API)

ChatGPT (OpenAI API) provides powerful GPT models for both RAG embeddings and generative responses. Follow the steps below to apply for an API key:

Sign up for an account on OpenAI: https://auth.openai.com/create-account
Create an API key in the account settings.

For more information, see OpenAI API Documentation.

Azure OpenAI

Azure OpenAI provides access to OpenAI models (like GPT-4.1) via Azure infrastructure, which is ideal for enterprise solutions. Follow the steps below to apply for an API key:

Sign in to the Azure Portal.
Select your OpenAI resource (or create one if you do not already have one).
On the left menu, click Keys and Endpoint.
Copy an API key and copy the endpoint (base URL) for API requests.

For more information, see Azure OpenAI Documentation.

Gemini (Google Cloud AI)

Gemini (Google Cloud AI) provides a set of models designed for high-performance reasoning and RAG. Follow the steps below to apply for an API key:

Visit the Google Gemini API Documentation.
Get a Gemini API key in Google AI Studio.
Sign in to your Google account.
Click Create API key.

For more information, see Google Cloud AI Documentation.

OpenAI-Compatible API

OpenAI Compatible API allows users to access various AI models beyond OpenAI’s own offerings, including models like DeepSeek and Grok, using the same API format. This enables seamless integration with existing applications built for OpenAI API. Follow the steps below to apply for an API key:

Choose a provider that supports OpenAI-compatible API (for example, DeepSeek or Grok).
Sign up on the provider's platform.
Generate an API key in the account settings.
Update your API endpoint and model settings as required.

For more information, refer to the provider's official API documentation.

On-Premise RAG Search

For advanced users and enterprises who require full data privacy or offline AI capabilities, Qsirch offers on-premise RAG search powered by locally hosted LLMs. This mode runs entirely on your NAS or connected hardware, without sending data to external services.

Note

This feature is only available on specific NAS models. For details, see the introduction to RAG search on the QNAP website.

To enable on-premise RAG:

Ensure that the LLM Core is ready.
Set the GPU to Container Station mode (Go to Control Panel > Hardware > Hardware Resources > Resource Use > Container Station mode).

How to Use RAG Search in Qsirch

Go to Settings > Administrative setting > RAG Search.
Add one or more cloud services to use RAG search.
(Optional) Verify your API key. This helps check whether an API key is valid.
Download one or more edge models from the on-premise services. This feature can only be used on the specific NAS models.
Add more AI models that are compatible with OpenAI API, including the GPT series, DeepSeek models, and Grok models.
Choose file formats for your RAG search.
Go to Qsirch home page and click the RAG search button.
Qsirch RAG search will only use the files included in "Source" for data retrieval.
Check the model you want to use and then start using RAG search.

Produits Applicables

Qsirch 6.0.0 (ou version ultérieure) sur toutes les plateformes

Qsirch RAG Search avec Cloudet LLMs sur site

Qsirch prend en charge l'utilisation de la génération augmentée par récupération (RAG) avec des modèles de langage de grande taille (LLM) basés sur le cloud pour fournir des réponses précises et contextuelles. Lorsque vous entrez une requête, Qsirch récupère les documents pertinents de votre NAS et les utilise comme contexte pour le modèle de langage. Cette combinaison de recherche et d'IA générative permet à Qsirch de générer des réponses précises et informées basées sur vos propres données.

Qsirch prend également en charge la conversation multi-tours, permettant des interactions naturelles et contextuelles. Les utilisateurs peuvent poser des questions de suivi sans répéter le contexte précédent, et le contexte est préservé d'un tour à l'autre pour des réponses cohérentes. La prise en charge de la conversation multi-tours fonctionne avec les modes RAG cloud et sur site.

Intégrer RAG avec les services d'IA basés sur le cloud

Pour intégrer la recherche RAG, vous devez d'abord obtenir une clé API d'un service d'IA de votre choix.

ChatGPT (API OpenAI)

ChatGPT (API OpenAI) fournit des modèles GPT puissants pour les embeddings RAG et les réponses génératives. Suivez les étapes ci-dessous pour demander une clé API :

Inscrivez-vous pour un compte sur OpenAI : https://auth.openai.com/create-account
Créez une clé API dans les paramètres du compte.

Pour plus d'informations, voir Documentation de l'API OpenAI.

Azure OpenAI

Azure OpenAI offre un accès aux modèles OpenAI (comme GPT-4.1) via l'infrastructure Azure, idéale pour les solutions d'entreprise. Suivez les étapes ci-dessous pour demander une clé API :

Connectez-vous au Portail Azure.
Sélectionnez votre ressource OpenAI (ou créez-en une si vous n'en avez pas déjà une).
Dans le menu de gauche, cliquez sur Clés et Point de terminaison.
Copiez une clé API et copiez le point de terminaison (URL de base) pour les requêtes API.

Pour plus d'informations, voir Documentation Azure OpenAI.

Gemini (Google Cloud AI)

Gemini (Google Cloud AI) fournit un ensemble de modèles conçus pour un raisonnement haute performance et RAG. Suivez les étapes ci-dessous pour demander une clé API :

Visitez le Documentation de l'API Google Gemini.
Obtenez une clé API Gemini dans Google AI Studio.
Connectez-vous à votre compte Google.
Cliquez sur Créer une clé API.

Pour plus d'informations, voir Documentation de Google Cloud AI.

API compatible avec OpenAI

L'API compatible avec OpenAI permet aux utilisateurs d'accéder à divers modèles d'IA au-delà des offres propres d'OpenAI, y compris des modèles comme DeepSeek et Grok, en utilisant le même format d'API. Cela permet une intégration transparente avec les applications existantes conçues pour l'API OpenAI. Suivez les étapes ci-dessous pour demander une clé API :

Choisissez un fournisseur qui prend en charge l'API compatible avec OpenAI (par exemple, DeepSeek ou Grok).
Inscrivez-vous sur la plateforme du fournisseur.
Générez une clé API dans les paramètres du compte.
Mettez à jour votre point de terminaison API et les paramètres du modèle selon les besoins.

Pour plus d'informations, consultez la documentation officielle de l'API du fournisseur.

Recherche RAG sur site

Pour les utilisateurs avancés et les entreprises qui nécessitent une confidentialité totale des données ou des capacités d'IA hors ligne, Qsirch propose une recherche RAG sur site alimentée par des LLM hébergés localement. Ce mode fonctionne entièrement sur votre NAS ou matériel connecté, sans envoyer de données à des services externes.

Remarque

Cette fonctionnalité est uniquement disponible sur certains modèles de NAS. Pour plus de détails, consultez le introduction à la recherche RAG sur le site Web de QNAP.

Pour activer la recherche RAG sur site :

Assurez-vous que le noyau LLM est prêt.
Réglez le GPU sur le mode Container Station (Accédez à Panneau de configuration > Matériel > Ressources matérielles > Utilisation des ressources > mode Container Station ).

Comment utiliser la recherche RAG dans Qsirch

Accédez à Paramètres > Paramètre administratif > Recherche RAG.
Ajoutez un ou plusieurs services cloud pour utiliser la recherche RAG.
(Optionnel) Vérifiez votre clé API. Cela aide à vérifier si une clé API est valide.
Téléchargez un ou plusieurs modèles Edge à partir des services sur site. Cette fonctionnalité ne peut être utilisée que sur les modèles de NAS spécifiques.
Ajoutez plus de modèles d'IA compatibles avec l'API OpenAI, y compris la série GPT, les modèles DeepSeek et les modèles Grok.
Choisissez les formats de fichiers pour votre recherche RAG.
Accédez à la page d'accueil de Qsirch et cliquez sur le bouton de recherche RAG.
La recherche RAG de Qsirch n'utilisera que les fichiers inclus dans "Source" pour la récupération de données.
Vérifiez le modèle que vous souhaitez utiliser, puis commencez à utiliser la recherche RAG.

Est-ce que cet article a été utile ?

Oui. Non.

93% des utilisateurs pensent que ces informations sont utiles.

Veuillez nous indiquer comment améliorer cet article :

Il manque des informations importantes dans l’article
Les solutions de l’article ne fonctionnent pas
L’article est trop compliqué
L’article contient des informations inexactes
L’article est désuet

Si vous souhaitez fournir un commentaire supplémentaire, veuillez l’inclure ci-dessous.

NAS

Réseau

Surveillance

Applicable Products

Qsirch RAG Search with Cloud and On-Premise LLMs

Integrate RAG with Cloud-based AI Services

ChatGPT (OpenAI API)

Azure OpenAI

Gemini (Google Cloud AI)

OpenAI-Compatible API

On-Premise RAG Search

How to Use RAG Search in Qsirch

Produits Applicables

Qsirch RAG Search avec Cloudet LLMs sur site

Intégrer RAG avec les services d'IA basés sur le cloud

ChatGPT (API OpenAI)