Les outils d’analyse de données au service de la recherche de la fraude

- Romain DUPRAT -



De par les fonctionnalités qu’ils possèdent, certains logiciels d’analyse de données peuvent être configurés pour identifier des anomalies dans le système de contrôle interne et dans les enregistrements comptables. Ainsi, ils peuvent contribuer fortement à la détection des détournements d’actifs, s’ils sont utilisés spécifiquement dans cet objectif.

Sommaire




Au cours des dix dernières années ont été développés des programmes informatiques permettant d’explorer quantités d’informations. Ces logiciels d’analyse de données peuvent être configurés pour identifier des anomalies dans le système de contrôle interne et dans les enregistrements comptables et donc jouent un rôle déterminant dans la détection des détournements d’actifs.

En effet, les traitements informatiques d’analyse de données présentent de nombreux avantages pour la mission de l’auditeur : d’une part, ils permettent de travailler directement sur les fichiers sources du client et, d’autre part, ils permettent d’effectuer des contrôles sur l’intégralité d’une population et non sur un échantillon et ce, dans un temps relativement réduit. En travaillant sur l’intégralité d’un fichier, il devient possible de détecter des éléments de plus faible taille. Enfin, ils permettent de mettre en relation les données de différents fichiers ou systèmes, ou de faire des tris de différentes natures.

Les progiciels de gestion intégrés, aussi appelés par leur nom anglo-saxon « ERP » (Entreprise Ressources Planning), que l’on retrouve de plus en plus au sein des entreprises, se prêtent particulièrement bien aux analyses de données, car ils centralisent l’ensemble des activités d’une société autour d’un même système d’information et offrent, presque tous, des possibilités d’extraction des données dans des fichiers directement exploitables (extractions sous Excel).




Cette fonction permet de déterminer la relation entre plusieurs variables parmi des données brutes. Ainsi, cela apprend beaucoup sur les fichiers informatiques. Car certaines corrélations seront mises en évidence et il sera possible de juger de leur caractère normal ou non ; et, d’autres corrélations qui sont attendues ne seront pas identifiées par le logiciel ce qui présumera d’une anomalie.

Par exemple, une forte relation est prévue entre les variables suivantes - l’une étant indépendante et l’autre dépendante - car une relation directe existe entre elles :

Variable indépendante Variable dépendante
Nombre de jours de voyage Frais d’hôtels
Nombre de magasins ouverts Coûts de lancement
Quantité de linge produit Quantité de coton consommée

L’analyse de corrélation permet donc, à partir d’une masse d’information importante, d’orienter les investigations plus détaillées, puisque toute corrélation anormale ou toute absence de corrélation attendue est susceptible de provenir d’opérations de dissimulation de fraude.


Avec cette fonction il est possible de vérifier rapidement et de façon exhaustive si certaines procédures internes sont bien respectées.

Si une entreprise limite le montant de ses remboursements de frais à ses employés, le logiciel peut s’en assurer. Par exemple, dans le cas d’une entreprise dont les règles internes sont de plafonner à 20 € les dépenses de repas pour les employés en déplacement, il convient de lancer une analyse des montants supérieurs à 20 € sur le fichier des notes de frais. Les résultats de l’analyse permettront de se focaliser sur les montants excédentaires qui sont potentiellement symptomatiques de fraude.

De plus, le temps gagné grâce à l’approche informatique laisse plus de possibilités à l’auditeur pour se consacrer sur les sommes en dépassement et les auditer davantage dans le détail. Ainsi, un petit écart par rapport à la limite autorisée, qui n’aurait pas été étudié précédemment, pourrait révéler une fraude plus importante. Par exemple, un employé se faisait rembourser des notes de frais légèrement excédentaires (pour ne pas trop attirer l’attention), qui en plus n’étaient pas assorties de justificatifs car les repas étaient en fait payés par les fournisseurs. Ainsi, il a été découvert, d’une part, la fraude du salarié et, d’autre part, le manquement à son devoir de contrôle du supérieur hiérarchique qui approuvait les notes de frais sans les vérifier.


La stratification consiste à découper la population en sous-populations partageant une caractéristique commune, de façon à avoir une analyse plus fine et identifier les éventuelles anomalies.

Par exemple, une population de retour de marchandises peut être scindée en sous-familles clients de façon à identifier si certains d’entre eux n’auraient pas reçu de la marchandise qu’ils n’avaient pas commandée : un commercial qui souhaite atteindre ses objectifs peut essayer de livrer de la marchandise non commandée ou d’anticiper des commandes.

Egalement, cette fonction permet de regrouper les dépenses engagées par département de la société et par personne habilitée à autoriser les achats afin d’identifier les éventuels abus ou fraudes de certains services.

Par ailleurs, la stratification peut être utilisée pour connaître les caractéristiques des données du fichier : montants les plus élevés, montants les plus petits, montants moyens, écart type, etc.



La sélection d’enregistrements spécifiques est réalisée à l’aide d’une requête ou d’un tri du logiciel permettant de trouver dans un fichier ou dans un champ du fichier la présence des données voulues. Ce type de requête permet d’isoler les cas où les enregistrements apparaissent et, ainsi, de réduire un volume d’informations important en une courte liste. L’auditeur sera alors à même de procéder à des investigations complémentaires sur les données identifiées. Cette fonction est très utilisée pour extraire d’un fichier les exceptions qui par nature méritent une investigation complémentaire.

Généralement plusieurs critères sont appliqués à la sélection des enregistrements afin d’avoir un résultat le plus précis possible.

Par exemple, dans le cas d’une analyse des fichiers fournisseurs, on peut demander une extraction des factures fournisseurs qui ont des montants ronds car cela peut laisser présager des factures fictives. Egalement, une recherche des fiches fournisseurs avec un numéro en 99999 permet d’identifier des enregistrements susceptibles de masquer des fournisseurs fictifs. Aussi, une sélection des montants figurant dans une fourchette légèrement inférieure aux seuils d’autorisation de dépenses peut permettre de mettre en exergue des achats non justifiés.


Avec cette fonction il est possible de comparer les données présentes dans deux fichiers séparés afin d’extraire sur un troisième fichier, soit les données communes (partiellement ou entièrement), soit les données différentes.

Par exemple, il peut être intéressant de comparer les factures des prestataires de services de l’année N avec celles de l’année N-1 :

Fichier 2004
Fournisseur Compte auxiliaire Montant (€) Date
McCormak 25211 12.750 12/02/2004
Fiduciaire 12401 6.208 26/04/2004
Experienz 21004 15.375 09/07/2004

Fichier 2005
Fournisseur Compte auxiliaire Montant (€) Date
McCormak 25211 13.825 25/02/2005
Fiduciaire 12401 7.102 12/04/2005
Conseil plus 12999 11.232 26/07/2005

Fichier comparatif des différences de fournisseurs
Fournisseur Compte auxiliaire Montant (€) Date
Experienz 21004 15.375 09/07/2004
Conseil plus 12999 11.232 26/07/2005

On peut alors s’interroger sur la réalité des factures de ces deux fournisseurs qui n’apparaissent que sur une seule année, si, dans son activité, la société n’a pas mis en oeuvre de travaux susceptibles de faire appel à des prestataires différents d’une année sur l’autre.


Ce traitement permet de relier plusieurs données figurant dans des fichiers différents sur la base d’un élément commun.

On peut, par exemple, rapprocher les factures issues du fichier des impayés du fichier des créances clients en se basant sur le nom du client. Ainsi, on pourra visualiser tous les impayés par client.

Egalement, on pourrait rapprocher le fichier du référencement des fournisseurs avec celui de factures fournisseurs afin d’obtenir l’adresse en face de chaque facture.


L’analyse des doublons sert à identifier plusieurs données strictement identiques au sein d’une population dans un même fichier. Les doublons peuvent concerner un montant, un numéro de facture, un code fournisseur, une adresse, etc. En général, l’étude comprend plusieurs critères de similarité, c’est à dire que l’on va, par exemple, rechercher les fournisseurs qui ont le même nom, le même code et la même adresse.

Par exemple, avec cette technique, les recherches d’anomalies suivantes peuvent notamment être mises en oeuvre sur le fichier des paiements :
- Recherche de tous les montants payés apparaissant en double,
- Recherche de doublons sur les numéros de chèques,
- Recherche des fiches fournisseurs identiques avec deux relevés d’identité bancaire différents.

A partir des listes de doublons identifiés, l’auditeur devra procéder à des investigations pour en déterminer les raisons, celles-ci pouvant être multiples :
- Les doublons peuvent être justifiés (exemple : des factures d’un montant identique payées à un même fournisseur à des dates différentes peuvent correspondre à des abonnements de charges ou à des charges récurrentes et fixes telles qu’un loyer).
- Ils peuvent provenir d’une erreur humaine ou du système informatique.
- Ils peuvent résulter de fraudes.

Parallèlement, il est intéressant d’effectuer une analyse des « trous » ou des « manquants » dans les séquences numériques, chronologiques ou alphanumériques de certaines données.

En matière de revue des fournisseurs, on peut par exemple procéder aux recherches de ruptures sur les numéros de chèques, ou de ruptures de séquence dans les numéros d’enregistrement de factures fournisseurs si le système en applique un.

En effet, ces anomalies peuvent résulter de manipulations pour dissimuler une fraude, notamment par le biais d’annulation de transactions.


Il existe différents logiciels d’analyse de données permettant la détection des fraudes. Toutefois, étant donné que chaque mission de revue des fraudes possède ses particularités et implique différents types d’analyse, il est difficile pour un logiciel d’être adapté à tous les cas. Aussi, les logiciels que nous présentons ci-dessous n’ont pas la prétention de répondre à toutes les investigations possibles, mais ils sont actuellement les plus communément employés dans le domaine.


ACL (Audit Command Language) pour Windows est un outil d’analyse de données, d’audit et de reporting. Il a la possibilité de récupérer les informations en provenance des principaux gestionnaires de base de données. Egalement, les fichiers Excel sont facilement importables dans le logiciel.

L'approche d'ACL en matière de prévention et de détection des fraudes est basée sur une analyse complète des données transactionnelles circulant dans les systèmes financiers et opérationnels. ACL a l’avantage de conserver totalement intact les sources d’information. Après avoir effectué les traitements, le logiciel présente les données brutes initiales sous différentes formes mais sans modifier les données d’origine. Cela permet aux auditeurs d’avoir une plus grande confiance dans les résultats qu’avec un logiciel qui autorise des suppressions ou des modifications, qu’elles soient faites par inadvertance ou non.

Ce logiciel d'analyse des données peut identifier les tendances, localiser les exceptions et mettre en évidence les zones sensibles, permettant ainsi de surmonter les obstacles qui viennent entraver les méthodes conventionnelles de détection des fraudes.

ACL a plusieurs caractéristiques utiles pour la recherche de fraudes. Il dispose des fonctionnalités de base permettant d’effectuer des tris, de faire des sommations sur des sous-groupes, ou de mettre en place des filtres. Il peut aussi rechercher les « trous » dans les séquences numériques ou les doublons dans les données. Egalement, il effectue des comparaisons et des stratifications de fichiers, et est à même de pouvoir identifier des valeurs particulières en fonction de critères définis. Enfin, il est capable d’appliquer le test de la loi de Benford à un volume de transactions important pour essayer d’identifier des anomalies potentiellement frauduleuses.

En terme d’affichage et de restitution, le logiciel donne la possibilité aux utilisateurs de créer différents types de graphiques (histogramme, courbes, secteurs,…). Ces graphiques peuvent être sauvegardés en tant que fichiers bitmap pour une exportation vers un autre logiciel ou à destination du rapport d’audit.

Egalement, grâce à des capacités de contrôle continu, ACL permet de tester et de valider de manière indépendante les données provenant des différentes applications utilisées au sein d'une entreprise et d'informer automatiquement la direction lorsque des signes avantcoureurs de fraudes sont détectés


IDEA (Interactive Data Extraction & Analysis) est un outil d’interrogation de fichiers qui permet aux auditeurs, aux contrôleurs de gestion ou aux enquêteurs sur les fraudes de lire, d’afficher, d’analyser, de manipuler, d’échantillonner et d’extraire les données générées par une vaste gamme de systèmes informatiques, y compris les rapports imprimés dans un fichier.

Ce logiciel offre, comme ACL, des fonctionnalités jusque là réservées aux spécialistes des systèmes d’information. Il donne la possibilité aux utilisateurs de procéder à des investigations de fichiers de données, de réaliser des échantillonnages selon plusieurs modes, d’effectuer des totalisations, des moyennes et des stratifications. Egalement, IDEA réalise des recherches en fonction de critères spécifiques, identifie les doublons et les trous dans les séquences numériques, met en exergue les éléments anormaux et fait des tests de comparaison de fichiers.

Le logiciel inclut aussi un certain nombre d’outils destinés à prévenir et à détecter la fraude comme les autorisations de transactions. Il prend en considération les cycles de l’entreprise les plus exposés aux fraudes (notamment Achats, Ventes, Trésorerie, Stock).


ActiveData pour Excel est un outil d’analyse de données dans un environnement Excel. Il a le mérite d’être très accessible en termes de facilité d’utilisation.

Beaucoup d’auditeurs utilisent déjà Excel pour effectuer des travaux basiques comme des tris, des sous-totaux, des filtres mais sont limités dans la réalisation de certaines taches soit par les compétences très pointues qu’elles requièrent, soit par les limites mêmes d’Excel. Aussi, des spécialistes dans la détection de fraude assistée par ordinateur ont mis au point des tests via des macros dans Excel qui, d’une part, sont spécialement adaptés aux principaux besoins en matière de détection des fraudes et, d’autre part, surmontent certains des inconvénients d’Excel.

Ainsi, on retrouvera notamment dans ActiveData pour Excel, outre les fonctionnalités de base d’Excel, les possibilités suivantes :
- Comparaison de fichiers.
- Stratifications de fichiers.
- Analyse statistique du fichier (montant minimum, maximum, moyen, …).
- Extraction des montants supérieurs à la moyenne.
- Analyse selon la loi de Benford.
- Analyse des doublons et des « manquants ».

Toutefois, ce logiciel est limité sur le volume d’analyse de données par le nombre de lignes que peut contenir une feuille Excel, à savoir 65.536, ce qui peut être gênant pour l’étude de certaines organisations. Par ailleurs, il nécessite une attention particulière dans son utilisation, car les données, n’étant pas protégées, peuvent être modifiées.


Ce genre de logiciel permet de revoir de manière exhaustive les journaux comptables des entreprises afin d’identifier des anomalies. Ce type d’examen n’est pas effectué par des progiciels standards mais plutôt par des développements spécifiques réalisés par des cabinets intervenant dans le domaine de la recherche de fraude. A l’image de celui développé et utilisé au sein du cabinet Pansard & Associés, de tels programmes reposent généralement sur le fonctionnement suivant :

Le logiciel analyse chacune des écritures présentes dans les journaux comptables et détermine :
- D’une part, si l’écriture est correcte de par sa construction. En cas de construction incorrecte (ex : absence de débit ou de crédit, total des débits différent du total des crédits,…), l’écriture est identifiée comme étant «erronée».
- D’autre part, si le schéma de l’écriture comptable respecte les principaux schémas d’écritures standards issus du plan comptable général, en le comparant à une table qui recense les principaux schémas d’écritures comptables. En cas de non respect des schémas standards, l’écriture est identifiée comme étant «atypique».

Puis l’auditeur enquête sur les écritures identifiées comme étant erronées ou atypiques en analysant la pièce justificative et la contrepartie des écritures comptables isolées afin d’être en mesure de conclure sur l’existence éventuelle d’anomalie.

Les résultats issus de ce logiciel d’analyse d’écritures comptables sont à classer en différentes catégories :
- Ecritures erronées de par leur construction (ex : absence de débit ou de crédit, total des débits différent du total des crédits,…).
- Ecritures comptables correctes mais dont le schéma d’écriture n’a pas été renseigné dans la base de données des écritures autorisées car, s’agissant d’écritures comptables « non-standards », il convient de les étudier au cas par cas.
- Ecritures comptables venant corriger une erreur de saisie (donc correctes car à rattacher à l’écriture corrigée).
- Erreurs de saisie informatique (par exemple : suppression involontaire ou volontaire et renseignement manuel du numéro de transaction).
- Ecritures comptables atypiques mais non frauduleuses (liées à une méconnaissance comptable).
- Ecritures comptables atypiques et frauduleuses (détournement de fonds, «maquillage» des comptes).

Les limites inhérentes à ce type de logiciel sont de deux ordres :
- D’une part, les écritures comptables correctes mais frauduleuses ne peuvent pas être identifiées par le logiciel (ex : enregistrement d’une fausse facture, …).
- D’autre part, la démarche n’est réalisable que dans les environnements possédant des plans comptables normalisés afin de pouvoir dégager des schémas standards obligatoires (ce qui est le cas actuellement en France mais pas dans les pays anglo-saxons).



En résumé, il est difficile d’identifier le logiciel le plus performant ; chaque logiciel ayant ses propres spécificités qui peuvent, dans certains cas, se compléter. Toutefois, un logiciel adapté aux audits de fraude doit au minimum respecter les conditions suivantes :
- Etre en mesure d’exporter et d’importer facilement les données.
- Permettre la visualisation des données et des résultats sous différentes formes (tableaux, graphiques) facilitant l’analyse et l’interprétation.
- Posséder les fonctionnalités les mieux adaptées aux types d’investigations à réaliser.


Le Cabinet Pansard & Associés est un cabinet d’aide à la transmission d’entreprise dans le Nord.

PANSARD & ASSOCIÉS : Les outils d’analyse de données au service de la recherche de la fraude

Notre cabinet d'expert comptable - Outils financiers - Sites utiles - Mentions légales - Plan du site - Contact
Nos Publications : Finance - Audit & Comptabilité - Contrôle de gestion - Stratégie & Economie
La Propriété Industrielle : Fiscalité et Comptabilité