MasqID combine des règles déterministes, des référentiels officiels et un modèle d'IA local pour détecter et protéger les données sensibles de tous vos formats : contrats, rapports, bilans, CV, courriers, emails. Pas de cloud tiers. Pas de LLM. Pas de surprise.
Pour le détail du pipeline complet : voir la méthode →
Identifiants normés reconnus par leur format avec vérification mathématique du checksum : numéros d'entreprise (SIREN, SIRET), comptes bancaires (IBAN, BIC), sécurité sociale (NIR), TVA, immatriculations, CERFA, conventions collectives. Chaque détection est inspectable et reproductible.
Validation par bases publiques INSEE/SIRENE embarquées localement : 32 677 communes, 6,5 M entreprises actives, 526 prénoms FR, 289 patronymes, 90 juridictions, 135 organismes publics. Aucune requête sortante, aucune API tierce.
Un modèle d'IA spécialisé sur le français — entraîné sur des textes juridiques, efficace bien au-delà — identifie les noms rares non couverts par les règles. S'exécute sur notre serveur, en France, sans connexion vers l'extérieur. Aucun LLM externe, aucun GPU cloud.
Les codes BOFIP, articles de codes, lois nommées, jurisprudences (CE, Cass.) et réponses ministérielles sont reconnus comme données publiques et préservés en clair — plus de pseudonymisation parasite des références doctrinales dans vos analyses juridiques ou fiscales.
« Pierre DURAND » + « M. DURAND » + « DURAND » dans le même document = un seul jeton, un seul cluster. Les variantes sont automatiquement regroupées avant la pseudonymisation — votre lecture reste cohérente.
Le même nom produit toujours le même jeton. Cohérence cross-document par dossier : vos jointures internes restent valides, votre IA reçoit toujours les mêmes pseudonymes pour les mêmes entités.
Caviardage irréversible (blocs noirs, communicable à un tiers) ou pseudonymisation réversible (jetons + table de correspondance chiffrée). Le choix se fait à l'upload, document par document.
Chiffrement de niveau bancaire au repos sur le serveur (clé par document). Mapping pseudonyme ↔ original chiffré sur votre poste avec votre mot de passe — il ne quitte jamais votre navigateur.
Chaque opération est tracée (qui, quand, quoi) sans contenu sensible. Rapport PDF horodaté UTC avec empreinte SHA-256 du fichier source — communicable à un tiers, exploitable pour votre registre RGPD article 30.
DGFiP, URSSAF, ministères, juridictions, communes et agents publics sont automatiquement décochés (CNIL n° 01-057). Vous pouvez toujours les inclure ponctuellement en 1 clic.
Support natif des messages électroniques : .eml (RFC 822), .mbox (archives), .msg (Outlook). Headers, corps, signatures et fils de discussion sont extraits et anonymisés ensemble.
Listes blanches (jamais pseudonymisé) et entités forcées (toujours détectées comme type X) persistantes. Importables/exportables en CSV pour partage entre collaborateurs ou onboarding depuis votre annuaire/CRM.
Texte, tableaux, headers d'email, métadonnées. Structure préservée.
Le document anonymisé + ses artefacts d'audit.
Les entités détectées sont groupées par catégorie et par rôle dans le document (parties prenantes, conseils, organismes, coordonnées, références publiques, tiers). Aperçu en direct à droite (Original / Pseudonymisé / Caviardé). Chaque entité porte un badge indiquant la source de la détection.
Détection automatique par règles, IA et inférence contextuelle
Chaque entité indique d'où vient la détection
Persistance par utilisateur ou par organisation. Deux listes : liste blanche (jamais pseudonymisée — votre entreprise, vos partenaires habituels) et entités forcées (toujours détectée comme type X — clients récurrents, projets internes). Importable / exportable en CSV.
Termes jamais pseudonymisés — votre organisation, vos partenaires habituels
Termes toujours détectés comme un type donné — clients récurrents, projets cibles
terme;type;portée —
onboarding rapide depuis votre annuaire / CRM existant.
Accès immédiat à l'application. Essai gratuit pendant la phase de validation.