IA & Numérique Intelligence artificielle Prédiction

IA prédictive des risques — IA & numérique en santé au travail

Modèles prédictifs pour anticiper AT/MP, TMS, RPS. Machine learning sur données SPSTI. Exemples concrets.

1. Définition et principes

L'IA prédictive des risques utilise le machine learning pour identifier les salariés ou postes à risque élevé d'accident du travail (AT), de maladie professionnelle (MP), de troubles musculosquelettiques (TMS) ou de risques psychosociaux (RPS).

Objectif : Intervention préventive anticipée plutôt que réactive.

  • Identifier les facteurs de risque individuels et collectifs
  • Prédire les salariés à haut risque dans les 3-12 prochains mois
  • Recommander des actions de prévention ciblées
  • Mesurer l'impact des interventions

Exemple simplifié : Si un salarié A travaille sur poste B avec antécédent C, le modèle estime un risque de RPS de 35 % à 6 mois → action d'aménagement proposée.

2. Risques anticipés

Type de risqueFacteurs prédictifsExemple
TMSGestes répétitifs, mauvaise posture, durée d'emploi, âgeOpérateur d'emballage, +40 ans, 10+ ans au poste
RPSCharge de travail, manque autonomie, mobbing, changement d'équipeManager 3 départs d'équipe en 1 an
AbsentéismeArrêts antérieurs, AT, maladie chronique2+ arrêts supérieurs à 15 jours dans les 2 ans
ATSecteur d'activité, expérience, environnement travail, anciennetéBTP, nouveau salarié, peu de formation SST

3. Méthodologie d'apprentissage machine

Approche générique :

  1. Collecte de données historiques : DMST, AT/MP, absences, données RH (3-5 ans minimum)
  2. Nettoyage et anonymisation : suppression ID, doublons, normalization
  3. Feature engineering : création de variables pertinentes (âge catégorisé, ancienneté, ratio TMS passés...)
  4. Séparation train/test : 80/20 ou cross-validation
  5. Entraînement du modèle : Random Forest, XGBoost, régression logistique...
  6. Évaluation : précision, rappel, ROC-AUC (compromis sensibilité/spécificité)
  7. Déploiement : scoring des salariés actuels, prédictions périodiques (mensuelles/trimestrielles)

Défi : Données déséquilibrées (peu d'AT/MP en absolu), nécessité de au moins 500-1000 cas historiques pour modèle fiable.

4. Données d'apprentissage et sources

Sources de données idéales :

  • DMST numérique : antécédents médicaux, restrictions, avis aptitude
  • Data RH/paie : emploi occupé, ancienneté, absences (avec raison si possible)
  • Données AT/MP : CNAMTS si disponible, rapports accident
  • Conditions de travail : DUERP, évaluations risque sectorielles
  • Données environnementales : changement managérial, réorganisation, projet

Problème clé : Fragmentation des données. Le DMST est en SPSTI, la paie chez un prestataire RH, les arrêts à la Sécurité Sociale. Intégration = défi.

Solution INTELIGIA : Accompagnement pour fédérer les données dans un logiciel métier HDS, en respectant l'anonymat et le RGPD.

5. Exemples concrets d'application

Exemple 1 : Prédiction TMS en secteur logistique

  • Data : 1200 salariés, 5 ans d'historique (VIP, TMS, arrêts)
  • Facteurs : âge, ancienneté au poste, poids de charges (du DUERP), changements d'équipe
  • Résultat : Modèle identifie 85 salariés à risque élevé TMS (40%+ de probabilité à 12 mois)
  • Action : Formation ergonomie renforcée, rotation de poste, aménagement station
  • Impact mesuré : -25 % TMS déclarées dans le groupe à risque après 12 mois

Exemple 2 : Détection RPS en PME

  • Data : 150 salariés, absences plus de 3 jours, données VIP (auto-questionnaire bien-être)
  • Facteurs : charge de travail perçue (VIP), changeement de manager, turnover équipe
  • Résultat : 12 salariés identifiés à risque RPS 6-9 mois
  • Action : Entretien confidentialité manager, ajustement charge travail, médiation si conflit
  • Suivi : Retour mesuré via absences (diminution -30 %), satisfaction (enquête)

6. Éthique et limitation des biais

Risques à maîtriser :

  • Biais de genre : données historiques peuvent refléter discrimination passée
  • Biais d'âge : risque de stigmatiser salariés supérieurs à 50 ans
  • Biais de classe : certains métiers/secteurs surreprésentés
  • Faux positifs : modèle crie au loup → démotivation salarié
  • Autonomie salarié : qui prend la décision basée sur prédiction ?

Bonnes pratiques (INTELIGIA) : Audit de biais avant déploiement, communication transparente avec salariés, explainabilité, pas de décision automatique (recommandation seulement), droit d'opposition et recours, évaluation d'impact RGPD.

7. Ressources liées