Quels types de services informatiques propose Novane ?

Novane est un cabinet spécialisé dans le développement de plateformes Web, de logiciels métiers et de solutions IA. On couvre l'intégralité du cycle de vie d'un projet digital : du maquettage à la prise en main par vos utilisateurs, en passant par le développement, le déploiement et l'acquisition. On propose aussi des services de conseil en stratégie digitale (première séance offerte), en transformation, en SEO et en cybersécurité.

Proposez-vous une garantie satisfait ou remboursé ?

Oui. Vous bénéficiez d'une garantie 7 jours satisfait ou remboursé à compter du début de la prestation. Cela couvre 100 % des honoraires Novane facturés durant la première semaine, hors frais tiers (nom de domaine, licences, hébergement). Un simple email suffit pour l'activer. Remboursement sous 14 jours ouvrés.

Quel est le délai moyen de réalisation d'un projet ?

Le délai dépend de la complexité. À titre indicatif : un site vitrine peut être livré en 1 à 3 semaines, une plateforme web ou un logiciel métier se réalise à partir de 3 semaines, une solution IA peut être fonctionnelle dès 2 semaines. Chaque étape est planifiée dès l'appel découverte pour vous donner une visibilité totale.

Quels sont vos tarifs et modèles de facturation ?

Nous proposons des formules forfaitaires et des missions en régie. Tous les tarifs sont transparents et validés par devis avant démarrage. Le paiement se fait à la semaine, au fur et à mesure de l'avancement du projet, ce qui permet de maîtriser le budget. Si vous avez un budget précis, nous adaptons la roadmap pour rester dans vos objectifs financiers.

Comment se passe le suivi et la maintenance après livraison ?

Le support technique est inclus gratuitement pendant 2 mois après la mise en ligne : corrections de bugs, ajustements mineurs et accompagnement sur la prise en main. Passé ce délai, nous proposons des formules de maintenance sur devis. Nous répondons sous 24h ouvrées à toutes vos questions même après la livraison.

Comment Novane fonctionne au quotidien sur un projet ?

Chez Novane, 1 sprint = 1 semaine. Chaque semaine, on définit ensemble les fonctionnalités à développer. Vous suivez l'avancement via un environnement de test déployé sur nos serveurs et un outil de suivi Jira. Un point hebdomadaire est organisé entre vous, le développeur et le manager du projet. La communication se fait via un canal Discord ou Slack dédié. Le paiement se fait à la semaine et la première semaine est satisfait ou remboursé.

Comment les solutions IA de Novane s'intègrent à mon écosystème existant ?

Nous nous adaptons à votre écosystème existant sans nécessiter de modifications majeures. Notre approche vise une intégration fluide des solutions IA, garantissant une transition en douceur et une efficacité accrue sans perturber vos opérations courantes. Nos assistants IA peuvent se connecter à vos outils existants : CRM, email, Slack, ERP, bases de données, Drive.

En quoi un assistant IA Novane est mieux que ChatGPT avec des documents uploadés ?

ChatGPT est un outil généraliste qui ne connaît pas votre entreprise. À chaque conversation, vous devez ré-uploader et recontextualiser vos documents. L'assistant IA Novane est une mémoire d'entreprise permanente, connectée nativement à vos outils (CRM, tickets, emails, Slack), avec vos règles et process intégrés. Il peut aussi automatiser des tâches comme envoyer des mails, trier des leads ou générer des comptes-rendus. Option déploiement local pour la confidentialité.

Mettre en place un pipeline RAG pour votre ERP/CRM : guide technique pas à pas pour CTO

17/04/2026

pipeline RAG pour ERP/CRM : architecture et implémentation

Ce guide technique explique comment construire un pipeline RAG (retrieval‑augmented generation) fiable et scalable pour enrichir un assistant IA ou un module de recherche dans un ERP/CRM. Public : CTO, lead dev, ingénieurs backend qui doivent intégrer récupération de documents + génération (RAG) sans sacrifier la sécurité, la latence ni la maintenabilité.

Pourquoi un pipeline RAG pour un ERP/CRM ?

RAG permet de combiner des documents métiers (fiches client, contrats, tickets, procédures) avec un modèle de génération pour répondre précisément à des questions métier. Avantages : réponses contextualisées, mise à jour indépendante des modèles, traçabilité des sources. Risques à anticiper : fuite de données sensibles, coût d'embeddings et latence de recherche.

Vue d'ensemble de l'architecture

Ingestion : extraction des textes (PDF, HTML, champs DB), nettoyage, segmentation (chunking).
Embeddings : transformation des chunks en vecteurs via un provider d'embeddings.
Indexation : stockage des vecteurs et métadonnées dans un vector store (ex. PostgreSQL + pgvector, FAISS, Milvus).
Retrieval : recherche des top‑k documents similaires (annonce, scoring, filtrage par métadonnées).
Reranking / prompt assembly : construction du prompt avec contexte et instructions métier.
Generation : appel au LLM et post‑processing (sécurité, contrôle de la hallucination).

Étape 1 — ingestion et chunking (exemple concret)

Objectifs : obtenir des unités de texte cohérentes (chunks) de 200 à 800 tokens selon la granularité métier. Conserver métadonnées : source, id_record, date, access_level.

// pseudo-code Node.js : découpage simple
const chunkSize = 500; // tokens approximatifs
const overlap = 50;
function chunkText(tokens) {
  const chunks = [];
  for (let i = 0; i < tokens.length; i += (chunkSize - overlap)) {
    chunks.push(tokens.slice(i, i + chunkSize).join(' '));
  }
  return chunks;
}

Bonnes pratiques : normaliser (unicodes), enlever données de tracking, maintenir mapping chunk ↔ source pour traçabilité.

Étape 2 — embeddings et stockage dans PostgreSQL + pgvector (snippet)

Exemple minimal : table documents avec embedding vectorial. Vérifiez la doc officielle de pgvector pour l’indexation et le tuning : pgvector (GitHub).

-- SQL : activer pgvector et créer la table
CREATE EXTENSION IF NOT EXISTS vector;
CREATE TABLE documents (
  id uuid PRIMARY KEY,
  source_id text,
  content text,
  metadata jsonb,
  embedding vector(1536) -- ajuster dimension selon le provider
);
-- requêtes d'insertion depuis votre backend

Exemple Node.js (pseudo) pour créer embeddings puis insérer :

// Node.js : générer embeddings (placeholder pour votre provider)
const embedding = await embeddingsClient.create({
  model: "nom_du_modèle_embeddings", // voir doc provider
  input: chunkText
});
// insérer dans Postgres
await db.query('INSERT INTO documents (id, source_id, content, metadata, embedding) VALUES ($1,$2,$3,$4,$5)', [id, source, chunkText, metadata, embeddingVector]);

Conseils :

Fixez la dimension d'embedding selon le provider et vérifiez les erreurs de mismatch.
Batcher les appels d’embeddings pour limiter coûts et latence.
Indexer la colonne embedding selon le volume (ivfflat pour grandes tables, voir pgvector).

Étape 3 — recherche et assembly du contexte

Requête de similarité simple avec pgvector :

-- recherche top 5 par proximité
SELECT id, content, metadata
FROM documents
ORDER BY embedding <-> query_embedding
LIMIT 5;

Règles d'assemblage du contexte :

Filtrer par métadonnées (ex. access_level, customer_id) avant le tri vectoriel pour respecter les droits.
Limiter la taille totale du prompt (tokens) : prioriser les chunks les plus pertinents puis les metadata essentiels.
Inclure des instructions claires au LLM sur la provenance des données et la nécessité de citer les sources.

Étape 4 — génération et sécurité

Avant de renvoyer la réponse :

Appliquer des règles de sécurité (masquage PII, suppression d’informations sensibles).
Réaliser un contrôle de factualité si nécessaire (cross‑checks via business rules).
Conserver un audit log : question, context_chunks_ids, réponse du LLM, utilisateur.

Exemple de prompt assembly (simplifié) :

System: Vous êtes un assistant métier pour l'ERP X.
Context: [chunk1] [chunk2] ...
User: "Quel est le délai moyen de traitement pour la commande #123 ?"
Instruction: Réponds en 3 lignes, cite les sources (ids).

Erreurs fréquentes et debugging

Dimension mismatch : "vector length must be N" → vérifiez la taille d'embedding lors de l'insertion et du provider.
Recherche lente sur grosse table → créer index ivfflat / HNSW, augmenter work_mem PostgreSQL, ou externaliser vers Milvus/FAISS.
Résultats hors-contexte → diminuer chunk size, ajouter plus de métadonnées pour le filtrage, améliorer le scoring (BM25 + vector mix).
Coût embedding élevé → utiliser batching et embeddings float16 si le provider le permet, ou filtrer les documents non pertinents avant génération.

Perf, scalabilité et coûts

Points à monitorer : latence d’embeddings, QPS du retrieval, taille des index, coût par million d’embeddings. Pour de gros corpus (>10M chunks) privilégiez un moteur spécialisé (Milvus, FAISS) ou partitionnez par tenant/organisation. Pensez à mettre en cache les embeddings ou résultats fréquents pour réduire coût et latence.

Sécurité et conformité

Ne stockez pas d’informations extraites sensibles sans consentement. Chiffrez la base à repos et en transit, limitez l’accès via roles DB. Pour les enjeux RGPD, vérifiez vos obligations locales et conservez les logs d’accès. En cas de doute, faites valider l’architecture par votre équipe sécurité ou un conseil juridique.

Ressources officielles

pgvector — extension vectorielle PostgreSQL.
LangChain — patterns pour orchestration RAG (docs officiels).
OpenAI embeddings — guide fournisseur (exemple).
CNIL — pour les questions de conformité RGPD.

Conclusion et checklist de déploiement

Définir scope des sources et règles d’accès (tenant, rôle).
Choisir provider d’embeddings et dimension d’embedding.
Mettre en place ingestion, chunking, mapping source↔chunk.
Stocker dans vector store adapté (Postgres+pgvector ou moteur spécialisé).
Construire pipeline retrieval → prompt assembly → génération → post‑processing.
Ajouter monitoring coûts/latences + audits sécurité.

Ce guide fournit une feuille de route technique pour construire un RAG intégré à un ERP/CRM. Pour un accompagnement pratique (audit d’architecture, prototype ou développement), nos équipes peuvent aider à dimensionner la solution et implémenter un pilote conforme à vos contraintes métier et sécurité. Voir aussi nos services IA, nos services ERP/CRM et un exemple technique avec PostgreSQL ici.

Vous voulez un audit rapide de faisabilité pour votre projet RAG ? Contactez‑nous.

1. pipeline RAG pour ERP/CRM : architecture et implémentation

1.1. Pourquoi un pipeline RAG pour un ERP/CRM ?

1.2. Vue d'ensemble de l'architecture

1.3. Étape 1 — ingestion et chunking (exemple concret)

1.4. Étape 2 — embeddings et stockage dans PostgreSQL + pgvector (snippet)

1.5. Étape 3 — recherche et assembly du contexte

1.6. Étape 4 — génération et sécurité

1.7. Erreurs fréquentes et debugging

1.8. Perf, scalabilité et coûts

1.9. Sécurité et conformité

1.10. Conclusion et checklist de déploiement