Méthode

Quatre étapes. Aucune magie.

Tout ce que MasqID fait est traçable — dans une règle, un référentiel, un modèle versionné. Un DPO, un auditeur, un client ou un régulateur peut vous demander pourquoi une donnée a été détectée. Vous obtenez une réponse précise, à la ligne près.

01

Ingestion

Upload via navigateur (drag & drop) ou API REST. MasqID extrait le texte de votre document — y compris les emails et les archives mail. Les PDF scannés passent par OCR automatique (français + anglais). Aucun appel à une API tierce, aucune copie envoyée hors de l'infrastructure.

.pdf .docx .xlsx .md .txt .eml .mbox .msg (NEW) OCR auto 100 % local 256 Mo max
> upload contrat-acme.pdf
extraction: texte + tableaux
pages: 12
ocr: 0 page scannée
caracteres: 18 421
> prêt pour détection
02

Détection — quatre garde-fous

1. Règles structurelles — identifiants normés (numéros d'entreprise, IBAN, sécurité sociale, immatriculations) avec vérification mathématique du checksum.
2. Modèle d'IA local — reconnaissance des noms rares qui échappent aux règles.
3. Référentiels officiels — chaque entité est confrontée aux bases publiques INSEE et SIRENE pour validation.
4. Filtre des références publiques — codes BOFIP, jurisprudences, lois nommées, articles de codes : préservés en clair.

Règles déterministes Vérification checksum Modèle d'IA local FR INSEE · SIRENE Co-référence (clusters) Filtre publics (NEW)
> scan contrat-acme.pdf
Jean DUPONTPERSONNE (INSEE ✓)
SAS ACME INDUSTRIESOCIETE (SIRENE ✓)
FR76 3000…IBAN (checksum ✓)
852 784 305SIREN (format ✓)
contact@acme.frEMAIL
59800 LILLEVILLE (commune ✓)
CE, 12 juil. 2023PUBLIC (préservé)
DGFiPEXEMPT (CNIL 01-057)
> 47 entités détectées
03

Validation humaine — vous gardez la main

L'écran de validation affiche les entités groupées par catégorie et par rôle (parties prenantes, conseils, organismes, coordonnées, identifiants, références publiques, tiers). Aperçu en direct à droite : Original / Pseudonymisé / Caviardé — voir l'écran en action ↓. Six couleurs par catégorie. Badges indiquant la source de chaque détection. Décochez un faux positif. Ajoutez un terme manquant. Votre dictionnaire personnel persiste.

Groupement par rôle Aperçu live 3 modes Palette 6 couleurs Badges de source Auto-exemption CNIL Dictionnaire persistant
Personnes (1)
[✓] Jean DUPONT PER I
Sociétés (1)
[✓] SAS ACME INDUSTRIE ORG S
Références publiques (2)
[ ] CE, 12 juil. 2023 PUBLIC préservé
[ ] BOI-BIC-RICI-10-10 PUBLIC préservé
Tiers exemptés (1)
[ ] DGFiP ORG P
[+] Projet Mercure PII (manuel)
> appliquer le traitement
04

Application & export auditable

Selon le mode choisi : pseudonymisation (jetons + table de correspondance chiffrée avec votre mot de passe — la table reste sur votre poste) ou anonymisation (caviardage irréversible). Vous récupérez le document protégé au format d'origine, un rapport d'audit horodaté avec empreinte SHA-256, et le journal des opérations — exploitables pour votre registre RGPD article 30 ou un audit interne.

Pseudonymisation Anonymisation Mapping chiffré côté client Empreinte SHA-256 Horodatage UTC RGPD art. 30
> export pseudonymisation
contrat-acme_pseudo.pdf ✓ format d'origine
mapping.json ✓ 47 entités
mapping.enc.json ✓ chiffré (mot de passe)
rapport_audit.pdf ✓ horodaté UTC
journal.jsonl ✓ traçabilité
empreinte: a1b2c3…4e5f
> prêt à transmettre / soumettre à l'IA
Librairie de règles

Chaque règle est écrite, versionnée, testable.

8
Identifiants normés
SIREN · SIRET · NIR · IBAN
TVA · RCS · BIC · IMMAT
9
Personnes
Nom + prénom · titre + nom
Signature email · qualité
Co-référence (clusters)
6
Sociétés & organisations
Raison sociale · suffixe
Acronyme · forme juridique
Marque commerciale · objet
9
Références publiques (NEW)
BOFIP · jurisprudence CE/Cass/CA
Lois nommées · décrets · ordonnances
Articles de codes · réponses min.
3
Fiscal & social
NIF · avis d'imposition
Numéro télédéclarant · IDCC
URSSAF · CERFA
12
Coordonnées & contextes
Adresse · code postal + ville
Date · email · téléphone
URL · IP · montant
Total : ~50 patterns déterministes + modèle d'IA local FR + 33 717 entrées de référentiels INSEE + 6,5 M entreprises actives SIRENE. Tout est versionné, testé, reproductible.
Audit

Chaque décision, traçable.

{ "version": "3.6", "timestamp": "2026-05-09T14:32:18Z", "document": "contrat-acme.pdf", "empreinte_source": "a1b2c3d4e5f6…", "entites": [ { "texte": "Jean DUPONT", "detection": "règle + IA + INSEE", "confiance": 0.92, "cluster": "PERSONNE_1 (3 variantes)", "jeton": "<PERSONNE_1>", "occurrences": 12 }, { "texte": "FR76 3000…", "detection": "règle IBAN", "confiance": 0.95, "checksum": "vérifié ✓", "jeton": "<IBAN_1>" }, { "texte": "CE, 12 juil. 2023, n° 463363", "detection": "référence publique", "action": "préservée (donnée publique)" } ] }

Une méthode n'est pas une promesse.
Elle est démontrable.

Essayez sur votre premier document. Tout est auditable, ligne par ligne.

Essayer gratuitement → Voir les fonctionnalités
© 2026 MasqID — édité par FSI Avocats · Montpellier
v3.6 · build 2026.05