Fonctionnalités MasqID — Anonymisation et pseudonymisation tous métiers

01

Règles structurelles

Identifiants normés reconnus par leur format avec vérification mathématique du checksum : numéros d'entreprise (SIREN, SIRET), comptes bancaires (IBAN, BIC), sécurité sociale (NIR), TVA, immatriculations, CERFA, conventions collectives. Chaque détection est inspectable et reproductible.

02

Référentiels officiels

Validation par bases publiques INSEE/SIRENE embarquées localement : 32 677 communes, 6,5 M entreprises actives, 526 prénoms FR, 289 patronymes, 90 juridictions, 135 organismes publics. Aucune requête sortante, aucune API tierce.

03

Modèle d'IA local

Un modèle d'IA spécialisé sur le français — entraîné sur des textes juridiques, efficace bien au-delà — identifie les noms rares non couverts par les règles. S'exécute sur notre serveur, en France, sans connexion vers l'extérieur. Aucun LLM externe, aucun GPU cloud.

04

Filtre des références publiques NEW

Les codes BOFIP, articles de codes, lois nommées, jurisprudences (CE, Cass.) et réponses ministérielles sont reconnus comme données publiques et préservés en clair — plus de pseudonymisation parasite des références doctrinales dans vos analyses juridiques ou fiscales.

⤴

Co-référence intelligente

« Pierre DURAND » + « M. DURAND » + « DURAND » dans le même document = un seul jeton, un seul cluster. Les variantes sont automatiquement regroupées avant la pseudonymisation — votre lecture reste cohérente.

#

Jetons stables & déterministes

Le même nom produit toujours le même jeton. Cohérence cross-document par dossier : vos jointures internes restent valides, votre IA reçoit toujours les mêmes pseudonymes pour les mêmes entités.

2×

Anonymisation ou pseudonymisation

Caviardage irréversible (blocs noirs, communicable à un tiers) ou pseudonymisation réversible (jetons + table de correspondance chiffrée). Le choix se fait à l'upload, document par document.

🔐

Chiffrement bout-en-bout

Chiffrement de niveau bancaire au repos sur le serveur (clé par document). Mapping pseudonyme ↔ original chiffré sur votre poste avec votre mot de passe — il ne quitte jamais votre navigateur.

📋

Journal d'audit horodaté NEW

Chaque opération est tracée (qui, quand, quoi) sans contenu sensible. Rapport PDF horodaté UTC avec empreinte SHA-256 du fichier source — communicable à un tiers, exploitable pour votre registre RGPD article 30.

🛡️

Auto-exemption organismes publics

DGFiP, URSSAF, ministères, juridictions, communes et agents publics sont automatiquement décochés (CNIL n° 01-057). Vous pouvez toujours les inclure ponctuellement en 1 clic.

📧

Emails & archives mail NEW

Support natif des messages électroniques : .eml (RFC 822), .mbox (archives), .msg (Outlook). Headers, corps, signatures et fils de discussion sont extraits et anonymisés ensemble.

⚙️

Personnalisable par organisation

Listes blanches (jamais pseudonymisé) et entités forcées (toujours détectées comme type X) persistantes. Importables/exportables en CSV pour partage entre collaborateurs ou onboarding depuis votre annuaire/CRM.

Formats

Tout ce que vous manipulez déjà.

Documents & emails

Texte, tableaux, headers d'email, métadonnées. Structure préservée.

PDF (texte + OCR auto) .pdf
Microsoft Word .docx
Excel .xlsx
Email RFC 822 .eml
Archive mail (Mozilla, Mail.app) .mbox
Email Outlook .msg
Markdown .md
Texte brut .txt

Exports

Le document anonymisé + ses artefacts d'audit.

Document pseudonymisé format d'origine
Document caviardé blocs noirs
Table de correspondance .json
Mapping chiffré (mot de passe) .enc.json
Rapport d'audit RGPD .pdf
Journal des opérations .jsonl

Écran de validation

Tout est groupé par rôle.
Vous validez en un coup d'œil.

Les entités détectées sont groupées par catégorie et par rôle dans le document (parties prenantes, conseils, organismes, coordonnées, références publiques, tiers). Aperçu en direct à droite (Original / Pseudonymisé / Caviardé). Chaque entité porte un badge indiquant la source de la détection.

Catégories d'entités

Détection automatique par règles, IA et inférence contextuelle

Personnes physiques PERSONNE
Sociétés & organisations SOCIETE
Adresses postales ADRESSE
Codes postaux & villes CP_VILLE
Emails, téléphones, URLs COORD
IBAN, montants, comptes FIN
SIREN, SIRET, NIR, TVA, RCS ID
Dates & références dossier DATE/REF
Juridictions & références publiques PUBLIC

Badges de confiance

Chaque entité indique d'où vient la détection

S — Validée SIRENE INSEE vert
C — Validée commune INSEE vert
I — Validée prénoms/patronymes INSEE vert
P — Organisme public exempté gris
F — Forcée par votre dictionnaire indigo
W — Liste blanche persistante teal

Dictionnaire d'organisation

Vos contacts récurrents.
Une seule fois.

Persistance par utilisateur ou par organisation. Deux listes : liste blanche (jamais pseudonymisée — votre entreprise, vos partenaires habituels) et entités forcées (toujours détectée comme type X — clients récurrents, projets internes). Importable / exportable en CSV.

Liste blanche

Termes jamais pseudonymisés — votre organisation, vos partenaires habituels

Mon Cabinet / Ma Société all
Mes interlocuteurs récurrents all
Mes outils internes all
Mes références sectorielles all

Entités forcées

Termes toujours détectés comme un type donné — clients récurrents, projets cibles

Acme Industries SAS societe
Altaïr Conseil societe
Projet Mercure interne

Format CSV : terme;type;portée — onboarding rapide depuis votre annuaire / CRM existant.

En pratique

Un upload.
Ou trois lignes d'API.

# Option 1 — Interface web : drag & drop, validation, téléchargement

→ anonymize.fsiavocat.com/app.html

# Option 2 — API REST : intégration dans vos workflows (n8n, Make, Zapier, curl, Python, Node)

$ curl -X POST https://n8n.fsiavocat.com/webhook/anonymize \

-F "file=@contrat-acme.pdf" \

-F "mode=pseudo"

→ détecté : 47 entités (12 personnes · 9 emails · 6 téléphones · 3 IBAN · 17 divers)

→ retour : {"jobId": "a1b2c3…"}

→ durée : ~15 s · infrastructure dédiée en France

# La doc complète et les SDK :

→ anonymize.fsiavocat.com/api.html

Comparaison

Ce que MasqID n'est pas.

Capacité

MasqID

Outils IA / LLM cloud

Reproductible à 100 %

✓ déterministe, toujours

≈ varie selon la version du modèle

Explication par entité

✓ règle + source de validation

— sortie opaque

Données hébergées en France

✓ infrastructure souveraine UE

cloud US (le plus souvent)

Aucun appel sortant pendant le traitement

✓ vérifiable par inspection réseau

API externe systématique

Référentiels officiels embarqués

✓ 6,5 M entreprises + 32 677 communes

généralement aucun

Mapping pseudonyme ↔ original

✓ jamais sur nos serveurs

conservé côté éditeur

Jetons stables entre documents

✓ cohérence cross-document

jetons aléatoires à chaque appel

Rapport d'audit RGPD article 30

✓ horodaté UTC + empreinte SHA-256

non documenté

Performance prévisible

✓ ~15 s / document, infra dédiée

latence variable, files d'attente

Tarif au document

✓ forfait, traitement illimité

facturation au token / appel

Un moteur précis.
Pour tous vos documents.

Règles structurelles

Référentiels officiels

Modèle d'IA local

Filtre des références publiques NEW

Co-référence intelligente

Jetons stables & déterministes

Anonymisation ou pseudonymisation

Chiffrement bout-en-bout

Journal d'audit horodaté NEW

Auto-exemption organismes publics

Emails & archives mail NEW

Personnalisable par organisation

Tout ce que vous manipulez déjà.

Documents & emails

Exports

Tout est groupé par rôle.
Vous validez en un coup d'œil.

Catégories d'entités

Badges de confiance

Vos contacts récurrents.
Une seule fois.

Liste blanche

Entités forcées

Un upload.
Ou trois lignes d'API.

Ce que MasqID n'est pas.

Prêt à protéger votre premier document ?

Un moteur précis.Pour tous vos documents.

Règles structurelles

Référentiels officiels

Modèle d'IA local

Filtre des références publiques NEW

Co-référence intelligente

Jetons stables & déterministes

Anonymisation ou pseudonymisation

Chiffrement bout-en-bout

Journal d'audit horodaté NEW

Auto-exemption organismes publics

Emails & archives mail NEW

Personnalisable par organisation

Tout ce que vous manipulez déjà.

Documents & emails

Exports

Tout est groupé par rôle.Vous validez en un coup d'œil.

Catégories d'entités

Badges de confiance

Vos contacts récurrents.Une seule fois.

Liste blanche

Entités forcées

Un upload.Ou trois lignes d'API.

Ce que MasqID n'est pas.

Prêt à protéger votre premier document ?

Un moteur précis.
Pour tous vos documents.

Tout est groupé par rôle.
Vous validez en un coup d'œil.

Vos contacts récurrents.
Une seule fois.

Un upload.
Ou trois lignes d'API.