Produit

Un moteur précis.
Pour tous vos documents.

MasqID combine des règles déterministes, des référentiels officiels et un modèle d'IA local pour détecter et protéger les données sensibles de tous vos formats : contrats, rapports, bilans, CV, courriers, emails. Pas de cloud tiers. Pas de LLM. Pas de surprise.

Pour le détail du pipeline complet : voir la méthode →

01

Règles structurelles

Identifiants normés reconnus par leur format avec vérification mathématique du checksum : numéros d'entreprise (SIREN, SIRET), comptes bancaires (IBAN, BIC), sécurité sociale (NIR), TVA, immatriculations, CERFA, conventions collectives. Chaque détection est inspectable et reproductible.

02

Référentiels officiels

Validation par bases publiques INSEE/SIRENE embarquées localement : 32 677 communes, 6,5 M entreprises actives, 526 prénoms FR, 289 patronymes, 90 juridictions, 135 organismes publics. Aucune requête sortante, aucune API tierce.

03

Modèle d'IA local

Un modèle d'IA spécialisé sur le français — entraîné sur des textes juridiques, efficace bien au-delà — identifie les noms rares non couverts par les règles. S'exécute sur notre serveur, en France, sans connexion vers l'extérieur. Aucun LLM externe, aucun GPU cloud.

04

Filtre des références publiques NEW

Les codes BOFIP, articles de codes, lois nommées, jurisprudences (CE, Cass.) et réponses ministérielles sont reconnus comme données publiques et préservés en clair — plus de pseudonymisation parasite des références doctrinales dans vos analyses juridiques ou fiscales.

Co-référence intelligente

« Pierre DURAND » + « M. DURAND » + « DURAND » dans le même document = un seul jeton, un seul cluster. Les variantes sont automatiquement regroupées avant la pseudonymisation — votre lecture reste cohérente.

#

Jetons stables & déterministes

Le même nom produit toujours le même jeton. Cohérence cross-document par dossier : vos jointures internes restent valides, votre IA reçoit toujours les mêmes pseudonymes pour les mêmes entités.

Anonymisation ou pseudonymisation

Caviardage irréversible (blocs noirs, communicable à un tiers) ou pseudonymisation réversible (jetons + table de correspondance chiffrée). Le choix se fait à l'upload, document par document.

🔐

Chiffrement bout-en-bout

Chiffrement de niveau bancaire au repos sur le serveur (clé par document). Mapping pseudonyme ↔ original chiffré sur votre poste avec votre mot de passe — il ne quitte jamais votre navigateur.

📋

Journal d'audit horodaté NEW

Chaque opération est tracée (qui, quand, quoi) sans contenu sensible. Rapport PDF horodaté UTC avec empreinte SHA-256 du fichier source — communicable à un tiers, exploitable pour votre registre RGPD article 30.

🛡️

Auto-exemption organismes publics

DGFiP, URSSAF, ministères, juridictions, communes et agents publics sont automatiquement décochés (CNIL n° 01-057). Vous pouvez toujours les inclure ponctuellement en 1 clic.

📧

Emails & archives mail NEW

Support natif des messages électroniques : .eml (RFC 822), .mbox (archives), .msg (Outlook). Headers, corps, signatures et fils de discussion sont extraits et anonymisés ensemble.

⚙️

Personnalisable par organisation

Listes blanches (jamais pseudonymisé) et entités forcées (toujours détectées comme type X) persistantes. Importables/exportables en CSV pour partage entre collaborateurs ou onboarding depuis votre annuaire/CRM.

Formats

Tout ce que vous manipulez déjà.

Documents & emails

Texte, tableaux, headers d'email, métadonnées. Structure préservée.

  • PDF (texte + OCR auto) .pdf
  • Microsoft Word .docx
  • Excel .xlsx
  • Email RFC 822 .eml
  • Archive mail (Mozilla, Mail.app) .mbox
  • Email Outlook .msg
  • Markdown .md
  • Texte brut .txt

Exports

Le document anonymisé + ses artefacts d'audit.

  • Document pseudonymisé format d'origine
  • Document caviardé blocs noirs
  • Table de correspondance .json
  • Mapping chiffré (mot de passe) .enc.json
  • Rapport d'audit RGPD .pdf
  • Journal des opérations .jsonl
Écran de validation

Tout est groupé par rôle.
Vous validez en un coup d'œil.

Les entités détectées sont groupées par catégorie et par rôle dans le document (parties prenantes, conseils, organismes, coordonnées, références publiques, tiers). Aperçu en direct à droite (Original / Pseudonymisé / Caviardé). Chaque entité porte un badge indiquant la source de la détection.

Catégories d'entités

Détection automatique par règles, IA et inférence contextuelle

  • Personnes physiques PERSONNE
  • Sociétés & organisations SOCIETE
  • Adresses postales ADRESSE
  • Codes postaux & villes CP_VILLE
  • Emails, téléphones, URLs COORD
  • IBAN, montants, comptes FIN
  • SIREN, SIRET, NIR, TVA, RCS ID
  • Dates & références dossier DATE/REF
  • Juridictions & références publiques PUBLIC

Badges de confiance

Chaque entité indique d'où vient la détection

  • S — Validée SIRENE INSEE vert
  • C — Validée commune INSEE vert
  • I — Validée prénoms/patronymes INSEE vert
  • P — Organisme public exempté gris
  • F — Forcée par votre dictionnaire indigo
  • W — Liste blanche persistante teal
Dictionnaire d'organisation

Vos contacts récurrents.
Une seule fois.

Persistance par utilisateur ou par organisation. Deux listes : liste blanche (jamais pseudonymisée — votre entreprise, vos partenaires habituels) et entités forcées (toujours détectée comme type X — clients récurrents, projets internes). Importable / exportable en CSV.

Liste blanche

Termes jamais pseudonymisés — votre organisation, vos partenaires habituels

  • Mon Cabinet / Ma Société all
  • Mes interlocuteurs récurrents all
  • Mes outils internes all
  • Mes références sectorielles all

Entités forcées

Termes toujours détectés comme un type donné — clients récurrents, projets cibles

  • Acme Industries SAS societe
  • Altaïr Conseil societe
  • Projet Mercure interne
Format CSV : terme;type;portée — onboarding rapide depuis votre annuaire / CRM existant.
En pratique

Un upload.
Ou trois lignes d'API.

# Option 1 — Interface web : drag & drop, validation, téléchargement
anonymize.fsiavocat.com/app.html

# Option 2 — API REST : intégration dans vos workflows (n8n, Make, Zapier, curl, Python, Node)
$ curl -X POST https://n8n.fsiavocat.com/webhook/anonymize \
-F "file=@contrat-acme.pdf" \
-F "mode=pseudo"
→ détecté : 47 entités (12 personnes · 9 emails · 6 téléphones · 3 IBAN · 17 divers)
→ retour : {"jobId": "a1b2c3…"}
→ durée : ~15 s · infrastructure dédiée en France

# La doc complète et les SDK :
anonymize.fsiavocat.com/api.html
Comparaison

Ce que MasqID n'est pas.

Capacité
MasqID
Outils IA / LLM cloud
Reproductible à 100 %
✓ déterministe, toujours
≈ varie selon la version du modèle
Explication par entité
✓ règle + source de validation
— sortie opaque
Données hébergées en France
✓ infrastructure souveraine UE
cloud US (le plus souvent)
Aucun appel sortant pendant le traitement
✓ vérifiable par inspection réseau
API externe systématique
Référentiels officiels embarqués
✓ 6,5 M entreprises + 32 677 communes
généralement aucun
Mapping pseudonyme ↔ original
✓ jamais sur nos serveurs
conservé côté éditeur
Jetons stables entre documents
✓ cohérence cross-document
jetons aléatoires à chaque appel
Rapport d'audit RGPD article 30
✓ horodaté UTC + empreinte SHA-256
non documenté
Performance prévisible
✓ ~15 s / document, infra dédiée
latence variable, files d'attente
Tarif au document
✓ forfait, traitement illimité
facturation au token / appel

Prêt à protéger votre premier document ?

Accès immédiat à l'application. Essai gratuit pendant la phase de validation.

Essayer gratuitement → Parler à l'équipe
© 2026 MasqID — édité par FSI Avocats · Montpellier
v3.6 · build 2026.05