Abstract:
Ce mémoire présente le développement d’un assistant intelligent basé sur l’architecture de Génération Augmentée par Récupération (RAG) pour simplifier l’accès à des informations techniques complexes. Le système automatise l’extraction de données à partir de sources en ligne, les structure au format JSON, et utilise FAISS pour une recherche sémantique efficace. En intégrant un modèle de langage avancé (LLM) à un module de récupération, il fournit des réponses précises, contextualisées et traçables, surmontant les limites des LLMs traditionnels, telles que les hallucinations.
Une interface utilisateur intuitive, développée avec Streamlit, facilite les interactions en langage naturel, la comparaison de produits et la consultation de l’historique des échanges. Évalué via BERTScore et des validations humaines, le système démontre une précision et une pertinence supérieures aux approches classiques. Ce projet illustre le potentiel des architectures hybrides comme RAG pour transformer des données hétérogènes en un service accessible, interprétable et adaptable à divers domaines.