IA prédictive des risques — IA & numérique en santé au travail

1. Définition et principes

L'IA prédictive des risques utilise le machine learning pour identifier les salariés ou postes à risque élevé d'accident du travail (AT), de maladie professionnelle (MP), de troubles musculosquelettiques (TMS) ou de risques psychosociaux (RPS).

Objectif : Intervention préventive anticipée plutôt que réactive.

Identifier les facteurs de risque individuels et collectifs
Prédire les salariés à haut risque dans les 3-12 prochains mois
Recommander des actions de prévention ciblées
Mesurer l'impact des interventions

Exemple simplifié : Si un salarié A travaille sur poste B avec antécédent C, le modèle estime un risque de RPS de 35 % à 6 mois → action d'aménagement proposée.

2. Risques anticipés

Type de risque	Facteurs prédictifs	Exemple
TMS	Gestes répétitifs, mauvaise posture, durée d'emploi, âge	Opérateur d'emballage, +40 ans, 10+ ans au poste
RPS	Charge de travail, manque autonomie, mobbing, changement d'équipe	Manager 3 départs d'équipe en 1 an
Absentéisme	Arrêts antérieurs, AT, maladie chronique	2+ arrêts supérieurs à 15 jours dans les 2 ans
AT	Secteur d'activité, expérience, environnement travail, ancienneté	BTP, nouveau salarié, peu de formation SST

3. Méthodologie d'apprentissage machine

Approche générique :

Collecte de données historiques : DMST, AT/MP, absences, données RH (3-5 ans minimum)
Nettoyage et anonymisation : suppression ID, doublons, normalization
Feature engineering : création de variables pertinentes (âge catégorisé, ancienneté, ratio TMS passés...)
Séparation train/test : 80/20 ou cross-validation
Entraînement du modèle : Random Forest, XGBoost, régression logistique...
Évaluation : précision, rappel, ROC-AUC (compromis sensibilité/spécificité)
Déploiement : scoring des salariés actuels, prédictions périodiques (mensuelles/trimestrielles)

Défi : Données déséquilibrées (peu d'AT/MP en absolu), nécessité de au moins 500-1000 cas historiques pour modèle fiable.

4. Données d'apprentissage et sources

Sources de données idéales :

DMST numérique : antécédents médicaux, restrictions, avis aptitude
Data RH/paie : emploi occupé, ancienneté, absences (avec raison si possible)
Données AT/MP : CNAMTS si disponible, rapports accident
Conditions de travail : DUERP, évaluations risque sectorielles
Données environnementales : changement managérial, réorganisation, projet

Problème clé : Fragmentation des données. Le DMST est en SPSTI, la paie chez un prestataire RH, les arrêts à la Sécurité Sociale. Intégration = défi.

Solution INTELIGIA : Accompagnement pour fédérer les données dans un logiciel métier HDS, en respectant l'anonymat et le RGPD.

5. Exemples concrets d'application

Exemple 1 : Prédiction TMS en secteur logistique

Data : 1200 salariés, 5 ans d'historique (VIP, TMS, arrêts)
Facteurs : âge, ancienneté au poste, poids de charges (du DUERP), changements d'équipe
Résultat : Modèle identifie 85 salariés à risque élevé TMS (40%+ de probabilité à 12 mois)
Action : Formation ergonomie renforcée, rotation de poste, aménagement station
Impact mesuré : -25 % TMS déclarées dans le groupe à risque après 12 mois

Exemple 2 : Détection RPS en PME

Data : 150 salariés, absences plus de 3 jours, données VIP (auto-questionnaire bien-être)
Facteurs : charge de travail perçue (VIP), changeement de manager, turnover équipe
Résultat : 12 salariés identifiés à risque RPS 6-9 mois
Action : Entretien confidentialité manager, ajustement charge travail, médiation si conflit
Suivi : Retour mesuré via absences (diminution -30 %), satisfaction (enquête)

6. Éthique et limitation des biais

Risques à maîtriser :

Biais de genre : données historiques peuvent refléter discrimination passée
Biais d'âge : risque de stigmatiser salariés supérieurs à 50 ans
Biais de classe : certains métiers/secteurs surreprésentés
Faux positifs : modèle crie au loup → démotivation salarié
Autonomie salarié : qui prend la décision basée sur prédiction ?

Bonnes pratiques (INTELIGIA) : Audit de biais avant déploiement, communication transparente avec salariés, explainabilité, pas de décision automatique (recommandation seulement), droit d'opposition et recours, évaluation d'impact RGPD.

7. Ressources liées

Ressource

IA et SST

Contexte général

Ressource

Data analytics

Exploitation des données

Dispositif

DUERP

Source de données risques