ShelkidShelkid · SOS Écrans
📄 Télécharger (PDF)
Dossier de présentation préparé pour e-Enfance · juin 2026

Shelkid & l'écosystème SOS Écrans

Un écosystème gratuit de prévention et de protection des mineurs face au cyberharcèlement. Tout est ici, d'un seul tenant : la présentation, le moteur, les résultats mesurés, l'histoire des expériences, le socle scientifique complet, l'éthique — et pourquoi nous cherchons un partenaire pour la suite. Avec la même franchise, nos résultats et nos limites.

En bref. SOS Écrans est née d'une conviction simple : on devrait pouvoir voir qu'un enfant va mal avant que tout explose. Autour de cette idée, une association loi 1901 et un fondateur qui n'est pas ingénieur ont construit, en quelques mois, un écosystème d'outils gratuits de prévention et de protection — dont Shelkid, une application qui repère sur le téléphone les signaux de cyberharcèlement et de détresse, et oriente l'enfant vers un adulte de confiance et le 3018. Notre démarche tient en deux mots : l'honnêteté (nous montrons nos limites autant que nos forces) et l'enfant au centre (notre vraie réussite n'est pas un taux de détection, c'est un enfant aidé).

SOS Écrans est une association loi 1901 (W751283606) qui développe des outils numériques gratuits pour protéger les enfants des risques liés aux écrans et au cyberharcèlement. Le fondateur n'est pas ingénieur de métier : ces outils sont nés de mois de travail acharné, avec une obsession — ne pas survendre, et mesurer honnêtement.

« Beaucoup d'outils promettent monts et merveilles. Nous venons aussi montrer nos limites — parce que c'est en les comblant ensemble qu'on protégera vraiment des enfants. »
« Nous avons de bonnes raisons de penser que notre approche est juste ; nous n'avons encore aucune preuve qu'elle généralise sur de vrais adolescents. » — c'est précisément ce que nous voulons découvrir, avec un partenaire.
Note de lecture. Tous les chiffres sont mesurés sur des bancs de test indépendants de petite taille (~157 conversations pour le moteur champion) : ils sont indicatifs, avec des marges d'incertitude réelles, à reconfirmer sur un échantillon plus large. L'application a été testée sur émulateur ; la preuve finale se fera sur appareils réels. Shelkid est un outil d'écoute et d'orientation — il ne pose aucun diagnostic et ne remplace ni un adulte, ni un professionnel, ni les lignes d'aide (3018, 3114, 119, 15).

Conventions de lecture. On distingue toujours deux régimes : optimiste (chiffres réglés sur les données de test, flatteurs, à ne pas publier comme preuve) et sans fuite (mesuré sur un lot jamais vu, ni pour entraîner ni pour régler les seuils). On préfère le vrai au flatteur.

Niveau de preuve : 🧪 = synthétique / petit échantillon (données générées ou banc réduit : sert à piloter une direction, pas à certifier) · 🔬 = validé sur vrai corpus humain (la barre que nous visons). À ce jour, la grande majorité de nos chiffres sont 🧪 — c'est notre principale limite, et la raison du test terrain.

L'écosystème

Shelkid n'est qu'une pièce. Autour, une suite d'outils gratuits couvrant la prévention, la protection et l'orientation — pour l'enfant, le parent et l'éducateur.

Protection
🛡️ Shelkid
Application Android qui repère, sur l'appareil, les signaux de cyberharcèlement/détresse dans ce que l'enfant écrit, et l'oriente vers un adulte de confiance et le 3018.
Prévention · classe
🎓 Déclio
Atelier de prévention pour la classe (banque de 235 questions, méthodologie pour l'enseignant).
Parents
📊 Shield — tableau de bord
Espace parent + interface enfant. Le parent y voit des repères et une page « limites honnêtes », jamais le contenu des messages flaggés : l'alerte va d'abord à l'enfant.
Observation
🧪 Le Labo / Observatoire
Cadre de test encadré auprès d'adolescents (anonyme, consenti) et observatoire des tendances.
Pédagogie
🎭 PREVENTO PLAY
Simulation sociale pédagogique (et non un jeu vidéo) : vivre une situation pour la comprendre, avec débrief.
Public
🧭 Parcours & urgence
Parcours dédiés familles / encadrants, et une page d'urgence regroupant les numéros d'aide (3018, 3114, 119, 15).
Honnêteté : ces outils sont à des stades de maturité différents (certains en prototype). Shelkid est le plus abouti côté moteur ; tous partagent la même charte de franchise.

Shelkid en profondeur — un moteur à plusieurs cerveaux

Pendant que l'enfant écrit, Shelkid analyse sur le téléphone (le texte ne part jamais sur un serveur), en 5 à 9 millisecondes par message, en combinant des cerveaux complémentaires :

Constat important : aucun cerveau seul ne suffit. Le modèle d'IA peut manquer une phrase explicite que les règles, elles, captent. La combinaison retient toujours le niveau le plus prudent. Un humain décide toujours.

L'ampleur du travail

Ces résultats ne sortent pas d'un essai unique. Ils reposent sur un travail d'entraînement et de mesure mené en continu.

~10
modèles d'IA entraînés et comparés (CamemBERT, DistilCamembert, mDeBERTa…)
110 M
paramètres dans le moteur retenu (E5), exécuté en 5–9 ms par message
~6 000
conversations d'adolescents synthétiques (générées et contrôlées) pour l'entraînement
152 179
messages de détresse/soutien (corpus public anglais) — réservés à un pré-entraînement futur, non utilisés à ce jour
Le moteur retenu a été entraîné sur ~52 000 exemples annotés (8 passages complets sur les données), soit des centaines de milliers d'étapes d'apprentissage et des milliards d'opérations. Chaque candidat est mesuré sur un banc indépendant, avant d'être retenu ou écarté selon un protocole anti-régression strict (aucun modèle ne remplace le précédent sans le battre).

Ce que nous faisons du signal — nous rendons la main à l'enfant

Détecter ne suffit pas. La plupart des outils s'arrêtent à une alerte envoyée au parent. Nous avons conçu autre chose : une réponse constructive qui respecte l'enfant et lui rend le contrôle. À notre connaissance, personne ne le fait — et c'est, pour nous, le cœur du projet.

Quand un signal apparaît, plutôt que de dénoncer l'enfant ou de le surveiller, Shelkid peut lui proposer (s'il le veut) un petit moment qui l'aide à mettre des mots, à reconnaître ce qui se joue, et surtout à trouver son plus petit geste possible. Le but n'est pas de diagnostiquer ni de moraliser : c'est d'outiller l'enfant, et de garder la porte du 3018 ouverte à côté de lui.

Déjà jouable
🎮 Des mini-jeux qui tournent
10 mini-jeux dans Le Labo (Le Juge, L'oreille, Détective des signaux, Le Slang, Reste ou lâche…), jouables, anonymes, éducatifs — pour apprendre à lire les signaux faibles.
Scénarios écrits
🎭 5 épisodes de simulation
La Cabane (6-8), L'Anniv' (9-11), Le Screenshot (12-14, le pilote), La Story (13-15), Les Likes (16-18) : vivre une situation « grise » pour la comprendre, suivie d'un débrief.
Conçu & éprouvé
🪡 Le bon moment, « en dentelle »
L'art d'offrir le bon micro-moment au bon instant, sans jamais s'imposer. Spécifié dans le détail et éprouvé en simulation avant toute mise en contact avec un enfant.
La confiance dans l'enfant, inscrite dans l'architecture :
  • L'enfant regarde s'il veut, ferme quand il veut — un refus n'a aucune conséquence, aucune relance.
  • L'écran ne lui dit jamais ce qu'il est : « on a vu que… » est interdit dans le code. La détection choisit quoi proposer, jamais elle ne renvoie un diagnostic à l'enfant.
  • Le débrief ne demande pas « qu'est-ce qui s'est passé », mais « quel était le plus petit geste possible » — et il dé-culpabilise le silence (se figer, c'est normal).
  • La porte du 3018 reste visible à chaque écran. Zéro stockage côté serveur.
🚫 La ligne rouge, sacrée : un enfant en danger vital n'aura jamais un jeu — il a un humain, immédiatement (3018 / 3114 / 112). En simulation sur 70 trajectoires réelles + 250 synthétiques, aucun jeu n'a été proposé à un enfant exprimant un appel à l'aide grave (danger vital) — une première version naïve le faisait, nous l'avons corrigée avant tout contact humain.
Où nous en sommes, franchement : les mini-jeux sont jouables et les scénarios sont écrits. Le déclenchement automatique sur détection est conçu et prouvé en simulation, mais nous ne l'avons pas activé — volontairement. Aucune proposition automatique ne touchera un enfant tant que des professionnels de l'enfance (psychologues, pédopsychiatres, chercheurs) n'auront pas validé les seuils. Le mode « solo » (proposer un jeu à un enfant repéré seul) est explicitement reporté, pour ne jamais risquer de réactiver une blessure sans accompagnement — « d'abord, ne pas nuire ». C'est exactement le genre de garde-fou sur lequel nous aimerions le regard d'e-Enfance.

Notre place dans le paysage — ce que nous couvrons, ce que nous ne couvrons pas

Pour situer Shelkid honnêtement : voici en quoi il se distingue des outils existants, et — tout aussi clairement — ce qu'il ne couvre pas.

C'est là où le harcèlement se passe vraiment — Snapchat, TikTok, WhatsApp, Instagram — que tout se joue. Voici, face à face, ce que chaque solution fait sur ce terrain. (✓ = oui · ~ = partiel · — = non)

Apple
Screen Time
iOS · gratuit
Google
Family Link
Android · gratuit
Bark
US · payant
Qustodio
ES · payant
App 3018
FR · gratuit
Shelkid
FR · gratuit
Approchetemps d'écran, blocagetemps d'écran, blocagesurveillance (cloud)filtrage + surveillancesignalement (réactif)détection dans le texte, sur l'appareil
Lit le texte écrit dans Snap / TikTok / WhatsApp / Insta
cloud, EN
~
Android, alertes IA

sur l'appareil
Rien n'est envoyé sur un serveur~
coffre-fort / envoi au 3018 avec consentement
Repère en français un appel à l'aide pour orienter(EN)~
FR, alertes IA, côté parent

l'explicite ; le subtil reste limité
Oriente vers 3018 / 3114 / 119
3018
L'enfant est acteur (pas seulement surveillé)
Gratuit
Ce qu'on fait que personne d'autre ne combine : Qustodio détecte aussi certains signaux en français, mais côté parent, dans le cloud et sur abonnement payant. À notre connaissance, aucune autre solution ne réunit à la fois — gratuit + français + analyse du texte sur l'appareil (rien envoyé) + enfant acteur + orientation vers le 3018. Ce n'est pas « meilleur que tout le monde sur tout » (Bark couvre plus de plateformes ; Apple/Google gèrent le temps d'écran) — c'est le seul outil à cet endroit précis, là où le besoin n'est pas couvert. Notre parti pris d'honnêteté (montrer nos faux positifs et nos marges d'erreur) fait partie de cette singularité. (Benchmark interne sur 32 solutions ; détail et sources dans nos documents — chiffres et prix concurrents à titre indicatif, état du marché début 2026, sources 2025-2026.)
✅ Ce que Shelkid couvre (Android)
  • Le texte que l'enfant écrit dans ses applications (WhatsApp, Snap, Insta, commentaires…)
  • Le danger explicite (crise, grooming, sextorsion)
  • L'orientation vers un adulte de confiance et le 3018
❌ Ce que nous ne couvrons pas (encore) — dit franchement
  • Ce que l'enfant reçoit / lit (seulement ce qu'il écrit)
  • Les vidéos (TikTok, Snap) et les images
  • Les messages vocaux (audio)
  • Texte tapé avec un autre clavier, dicté, ou copié-collé
  • L'iPhone (voir ci-dessous)
🔬 Nos pistes pour combler ces manques — réelles, mais qui demandent du temps et de la recherche : l'analyse vocale en local (les messages audio, traités sur l'appareil), l'analyse d'images / captures d'écran, et un modèle temporel plus fort. Nous ne prétendons pas les avoir résolues ; nous indiquons une direction crédible.

Pourquoi Android d'abord, et la limite de l'iPhone. Sur Android, Shelkid peut analyser le texte tapé, sur l'appareil, légalement. Sur iPhone, le « bac à sable » d'Apple interdit structurellement à toute application tierce de lire le contenu textuel circulant dans les autres apps (iMessage, WhatsApp, Instagram, TikTok) : une analyse du harcèlement y est impossible — non par retard de notre part, mais par architecture du système.

Mais nous n'abandonnons pas l'iPhone. Nous y avons développé un navigateur sécurisé, et il reste possible de limiter ou bloquer des applications via l'API officielle d'Apple (Temps d'écran / FamilyControls). Sur iPhone, nous agissons donc sur le contenant (bloquer, filtrer), jamais sur le contenu des messages — et nous le disons clairement, sans surpromesse. C'est pourquoi nous concentrons l'effort de détection sur Android, où vivent ~69 % des 12-17 ans (Arcep/CREDOC, Baromètre du numérique 2024), proportion plus forte encore dans les milieux modestes — là où le besoin est le plus criant.

Les résultats clés — d'abord la réalité déployée

Commençons par le seul chiffre qui engage un enfant aujourd'hui : ce qui est réellement intégré dans l'application (ligne Kotlin Android), mesuré sur le mega-corpus du 30 mai (1 250 conversations annotées).

~25 %
Rappel sur les cas graves — aujourd'hui, l'app en repère environ 1 sur 4 ; elle en manque 3 sur 4.
~27 %
Fausses alertes sur des conversations ordinaires — encore trop élevé pour une mise en production.
Disons-le franchement : à ce stade, l'application n'est pas un outil de protection prêt à être confié à des familles — c'est un programme de recherche prometteur. Un détecteur qui manque aujourd'hui 3 cas graves sur 4 ne protège pas encore. C'est exactement pour ça que nous venons vous voir : non pour faire valider un produit fini, mais pour savoir où nous nous trompons avant d'exposer de vrais enfants.
Là où nous pensons pouvoir aller — le moteur candidat E5 sépare déjà bien mieux le danger explicite du signal subtil, mais uniquement sur données synthétiques, dont la valeur prédictive pour le terrain est quasi nulle (une IA génère des exemples « trop propres », faciles à séparer). Ces mesures indiquent une cible, pas une performance. Le détail — avec tous les graphes — est plus bas, dans les notes de laboratoire, étiqueté comme tel.
📓 Tout ce qui suit dans cette section est de la mesure de laboratoire (en grande partie synthétique) : utile pour comprendre où se situe le verrou, sans valeur de performance terrain.

Quatre approches testées pour le signal subtil

Pourcentage de signaux subtils correctement détectés, pour chaque approche (banc Test B). La référence de départ est à 20 %.

Détection du signal subtil (%) — par approche

Lecture : quatre approches distinctes (apprentissage multi-tâches, lecture de la conversation entière, ajout de données réelles) plafonnent autour de 20–28 %. La meilleure progression vient de l'ajout de vraies conversations — mais en trop faible quantité, elle déséquilibre le modèle. Conclusion : le verrou n'est pas algorithmique, il est dans la donnée réelle disponible.

Taux de fausses alertes (faux positifs)

Sur des conversations parfaitement ordinaires, à quelle fréquence le moteur signale-t-il à tort ? À gauche en l'état ; à droite après réglage des seuils.

Réglage initial

Après calibration

Lecture : au réglage initial, 8 conversations sur 63 déclenchaient au moins une fausse alerte (mesure réelle). Après calibration des seuils, on tombe à 1 conversation sur 63, sans perte sur la détection du danger grave. Sur 63 conversations seulement, la marge d'incertitude est large : ces comptes bruts indiquent une direction, pas un taux établi.

La calibration : resserrer sans sacrifier l'essentiel

À mesure qu'on resserre les seuils (de gauche à droite), les fausses alertes chutent. Sur ce banc synthétique, le danger grave reste repéré à chaque seuil (le 100 % traduit la séparabilité du jeu synthétique, pas une performance terrain). Seule la sensibilité au signal subtil diminue un peu.

Effet du réglage des seuils de décision

Lecture : il existe une réelle marge de réglage, et le danger grave est repéré quel que soit le seuil (sur ce banc synthétique). Le point de fonctionnement exact (combien de fausses alertes tolérer pour ne pas manquer un signal subtil) relève d'un arbitrage de prudence, à co-construire avec des professionnels, pas d'un simple choix technique.

Comparaison des moteurs candidats (E5 vs double cerveau)

Deux moteurs étaient envisageables. Comparés sur le taux de fausses alertes (plus bas = meilleur).

Fausses alertes sur conversations ordinaires (%)

Lecture : le second candidat sur-déclenche massivement (88,9 % de fausses alertes) — inexploitable. Le moteur retenu (E5) reste à 1,6 %. Décision documentée et tracée selon notre protocole.

L'histoire des expériences (journal de bord)

📓 Notes de laboratoire — données synthétiques, indicatives. La section qui suit est notre carnet d'expériences interne, partagé en transparence. La quasi-totalité des chiffres y est mesurée sur des données synthétiques (générées par IA), en petits lots. Ils servent à piloter une direction de recherche, jamais à certifier une performance terrain. Chaque taux porte sur un lot différent et ne se compare pas directement aux autres.

L'historique honnête, étape par étape : ce qu'on a gagné, ce qu'on a cru gagner, ce qu'on a « perdu » en regardant la vérité — et ce qui est réellement intégré aujourd'hui.

⚠️ Ce qui protégera l'enfant — état réel à ce jour

Le filet réellement intégré dans l'application, c'est la ligne Kotlin Android (règles de vigilance + moteur E5 intégré) — éprouvée jusqu'ici sur émulateur et sur corpus de test, pas encore sur de vrais téléphones de familles. Aucune donnée d'un mineur réel n'est traitée à ce jour : tout se passe sur l'appareil, rien ne quitte le téléphone, et l'analyse d'impact (AIPD) sera finalisée avant tout test impliquant une vraie famille. Tout le reste de ce journal — étage du temps, capteurs de silence/dissonance, mémoire sur plusieurs jours, double cerveau — est prospectif : modules candidats mesurés en laboratoire, pas encore branchés. Nous le disons franchement pour ne pas faire passer une direction de recherche pour une protection acquise.

L'étage du temps — avant / après

La crise et le grooming restent en alarme immédiate. Le harcèlement isolé devient un murmure (alarme s'il se répète). Mesuré sur le lot 4 (sans fuite, 50 conversations). Sur ce lot, les fausses alarmes passent de 44 % à 0 sur 50 — un échantillon trop petit pour affirmer un taux nul — et les cas graves restent tous repérés. Note : les taux de fausses alarmes cités dans ce journal (étage du temps, temps-v2, couches, seuil) portent chacun sur un lot différent — synthétique pur ici, réel mixte ailleurs ; ils ne se comparent pas directement.

Avant / après l'étage du temps (lot 4 · sans fuite)

Le chemin dans le temps — réussites, reculs, leçons

L'histoire, étape par étape (récit, pas une courbe de performance : les points venaient de jeux de test différents et ne se comparent pas chiffre à chiffre) :

Couverture par risque — ce que le cerveau actuel repère

Chaque barre = un risque. Vert = repéré, nommé & intégré. Bleu = nommé & mesuré en interne sur données synthétiques (non certifié sur corpus humain), déploiement après validation des relais par les pros : Shelkid repère des contenus à risque (incitation pro-ana, pression aux drogues, radicalisation) pour orienter vers un relais — sans poser de diagnostic ni qualifier un état de santé. Orange = repéré, déjà servi par un voisin (sextorsion→grooming, détresse-ami→crise). Mesuré sur lots inédits synthétiques.

Couverture par risque (lots inédits)

⚠️ « Repéré » ne veut pas dire « précis » : le banal déclenche aussi beaucoup (voir plus bas) — c'est l'étage du temps qui le ramène à un murmure. Données synthétiques, indicatif.

Détection par danger — deux régimes de lecture

Part des situations de chaque type que le moteur fait passer en alarme. « Adultes légitimes » = part correctement épargnée (test anti-faux-positif). Bascule entre le lot sans fuite et les juges (optimiste).

Vue des résultats :

Détection par danger (lot 4 · sans fuite)

⚠️ Lots synthétiques (lot 4 / juges) : un 100 traduit la séparabilité du jeu synthétique, pas une performance terrain. À reconfirmer sur corpus humain.

Combien de données faut-il ? — la courbe d'apprentissage

On ré-entraîne le juge sur des tailles croissantes, mesuré sur le lot 4 (jamais vu). Verdict : repérer un danger plafonne dès ~250 exemples (le gros modèle fait le travail). Les fausses alarmes, elles, restent l'affamé — la donnée seule ne les règle pas (d'où l'étage du temps).

⚠️ Test synthétique issu du même pipeline que l'entraînement : le plateau quasi parfait reflète la facilité de séparation des données générées, pas la performance sur de vrais adolescents. C'est exactement pourquoi le corpus humain reste indispensable.

Courbe d'apprentissage (lot 4 · sans fuite)

La guerre du banal — chaque conversation normale apprise fait baisser les fausses alarmes

On a généré 511 conversations banales variées (vannes entre potes, exclamations dramatiques anodines…) et mesuré l'effet sur le lot 4. Fausses alarmes 56 % → 19 % (÷3), grooming et crise restent captés à chaque fois sur ce banc synthétique. Ça plafonne vers 19 % → l'étage du temps finit le travail (→ 0 %). Le banal est l'affamé, mais il cède.

Fausses alarmes vs quantité de banal appris

Les mécanismes du grooming — ce que disent les données

Sur 1 581 conversations de grooming (synthétiques), les situations se regroupent en quelques mécanismes récurrents (et non en milliers de cas uniques) — regroupement thématique indicatif. C'est ce qui rend la « dentelle » des messages possible.

Mécanismes de grooming récurrents (sur 1 581 conversations · regroupement indicatif)

La mécanique sur plusieurs jours — voir le danger monter sans alarmer une amitié

L'intuition d'Emmanuel : un enfant qui « passe à l'acte » a souvent été chambré plusieurs jours d'affilée, sur plusieurs canaux. L'étage du temps v2 garde une mémoire de 3 jours et pèse chaque signal par sa gravité : un danger qui s'installe finit par franchir le seuil, alors qu'une amitié qui se vanne tous les jours reste sous le radar. Mesuré sur 70 scénarios sur 3 à 10 jours générés exprès (dont 25 « pièges » sains).

Étage du temps v2 — % des cas montés en alarme

Config retenue : mémoire 3 jours, seuil 2.0. En simulation, l'étage du temps v2 capte la grande majorité des dangers qui s'installent et manque encore les cas les plus lents — direction prouvée en simulation, non chiffrable tant qu'elle n'est pas testée sur corpus humain. Sur le sain, les fausses alarmes restent rares (3 cas sur 25) — toutes des « mauvaises passes » (tristesse passagère) qui ne donnent qu'un murmure doux, jamais une alarme dure. Le chambrage amical : 0 cas sur 15. ⚠️ Données synthétiques (générées par IA), petits lots : direction prouvée, pas encore certifiée sur corpus humain. Module candidat (temps-v2.js), pas encore déployé. Réf. sim_temps_v3.py.

Les 4 couches d'écoute — le silence et la dissonance (données d'Emmanuel · sans fuite)

On a découvert deux angles morts (l'enfant qui se tait, la détresse masquée sous l'humour) et on les a comblés sans baisser le seuil — en ajoutant des signaux nouveaux : le silence (la parole qui s'effondre), puis la dissonance (ton léger collé à un contenu lourd). Dangers captés 58 % → 72 % → 83 %, fausses alarmes 3 % sur corpus synthétique · 22,5 % sur corpus réel mixte (voir comparaison des 3 moteurs ci-dessous).

Couches d'écoute — dangers captés vs fausses alarmes

Mesuré sur 71 scénarios synthétiques (retrait silencieux 0/8 → 6/8 ; détresse masquée 6/14 → 11/14). Modules candidats (capteur-silence.js, capteur-dissonance.js, moteur-couches.js), non branchés sur le déployé. Direction prouvée, pas certifiée.

Pourquoi on ne baisse PAS le seuil

La tentation, pour attraper plus, serait d'abaisser le seuil d'alerte. Mais c'est crier au loup : à seuil 1.0 on capte 93 % des dangers… au prix de 67 % de fausses alarmes (2 enfants sur 3 qui vont bien seraient signalés). On garde donc le seuil, et on attrape plus en ajoutant des signaux, jamais en baissant la barre.

Dangers captés vs fausses alarmes quand le seuil descend

Le bon réglage (seuil 2.0) tient les fausses alarmes à 3 % sur corpus synthétique. Sur corpus réel mixte (slang ado authentique) : 22,5 %, en cours de réduction.

Comparaison des 3 moteurs — état réel mesuré (30 mai 2026, 17h)

Sur 1 250 conversations annotées (mega-corpus 30/05), 3 moteurs mesurés indépendamment. C'est l'état le plus brut de ce qui existe — y compris ce qui ship réellement aux parents.

MoteurRappel REDPrécisionFaux positifs
Kotlin Android (ce qui est intégré dans l'app)25,4 %46,1 %27,3 %
Worker shield-detect34 %59 %21 %
Extension JS (ML)96,8 %*22,5 %*

* extension JS = corpus partiel 176 cas. À re-mesurer sur le mega-corpus. Avant publication grand public : nous prévoyons une étape d'annotation hors-ligne d'un corpus d'entraînement (un LLM, Claude Haiku en API, étiquette des données publiques — Van Hee, Jigsaw, eRisk), jamais sur l'appareil ni sur les messages réels d'un enfant ; puis un fine-tune dédié sur ~500 000 cas humains publics. Objectif : rappel ≥ 85 %, FP ≤ 12 %.

À lire honnêtement : ce qui est intégré aujourd'hui = la ligne Kotlin (rappel RED encore modeste, FP encore élevé) — et elle n'a pas encore été éprouvée sur de vraies familles. Les meilleurs chiffres de cette page (extension JS, étage du temps, couches) sont prospectifs — des directions mesurées en laboratoire, pas encore un filet éprouvé sur le terrain. Le moteur champion E5 (synthèse ci-dessus) est la brique d'IA destinée à remonter ces chiffres une fois la donnée réelle disponible.
À lire honnêtement (et à dire tel quel à un expert) :
Sans fuite = le 4ᵉ lot (50 conversations générées par une IA différente, jamais utilisées ni pour entraîner ni pour régler les seuils) → mesure fiable.
Optimiste = les 3 juges, sur lesquels les seuils de décision ont été calés → chiffres flatteurs, à ne pas publier comme preuve.
• Ces lots sont synthétiques (générés par IA). Même excellents, ils ne remplacent pas un corpus humain annoté (CyberAgressionAdo, Ollagnier) — c'est le juge ultime, encore à venir.
• Conséquence assumée : aucun pourcentage avancé comme preuve tant que la validation sur corpus humain n'est pas faite. Nous partageons ce dossier en toute transparence, résultats et limites, pour que vous puissiez le juger sur pièces.
Sources internes : lot 4 (eval_lot4.py / eval_lot4_temps.py), juges (export_judges_gold.py), corpus grooming-fr-synth (1 581 conv), fidélité JS=Python 258/258 (test-pipeline-complet.mjs). Détail complet et daté : MASTER_TECHNIQUE.md §35.

Ce que nous voulons vraiment mesurer : le résultat humain

Un système peut être techniquement parfait — détection juste, zéro fausse alerte — et pourtant humainement mauvais : si le parent réagit mal, si l'enfant se ferme, si la relation se dégrade. Le rappel et la précision ne disent rien de cela.

Nous pensons que la vraie mesure de Shelkid n'est pas une métrique d'intelligence artificielle, mais une mesure humaine :

Nous ne savons pas encore mesurer cela seuls. C'est exactement ce que votre expertise permettrait de construire avec nous : placer l'enfant — et non la performance — au centre de l'évaluation.

Le socle scientifique complet

On ne part pas d'une intuition isolée. L'outil est aligné sur la littérature internationale sur le harcèlement dans le temps : c'est elle qui établit que la répétition et la pente qui monte font la gravité. Toutes les sources ci-dessous ont été vérifiées sur l'original ; les chiffres non confirmés ont été écartés. Nous indiquons la source à chaque fois — et son statut (établi, ou encore à valider).

① L'ampleur du problème (sources françaises)

② Le lien harcèlement → suicide (méta-analyses & cohortes longitudinales)

Méta-analyses
van Geel, Vedder & Tanilon (2014), JAMA Pediatrics — cyber > classique sur l'idéation suicidaire (OR 3,12 vs 2,16 ; n=284 375)
Holt et al. (2015), Pediatrics — idéation OR 2,34 ; comportements OR 2,94
Moore et al. (2017), World J Psychiatry — lien probable tabac/drogues
Reijntjes et al. (2010 / 2011) — internalisation & externalisation, longitudinal, bidirectionnel
Cohortes longitudinales
Copeland et al. (2013), JAMA Psychiatry — bully-victims, risque maximal
Lereya et al. (2013), JAACAP — ALSPAC : harcèlement 7-10 ans → automutilation 16-17 ans
Takizawa et al. (2014), Am J Psychiatry — suivi 50 ans, dose-réponse
Geoffroy et al. (2018 CMAJ ; 2022 Psych Medicine) — trajectoire sévère, décès par suicide
Klomek et al. (2009) ; Baldwin et al. (2019, jumeaux E-Risk) ; Maurya et al. (2022, cyber, suivi 3 ans)

③ Les trajectoires — « la pente qui monte »

④ Le harcèlement, un phénomène de groupe (fondement de notre pédagogie)

⑤ Le cadre français du (cyber)harcèlement

⑥ Détection des signaux faibles (grooming, manipulation)

⑦ Recommandations officielles & déontologie

Sources complètes & revue de presse : Sources scientifiques & revue de presse. Démarche, méthode & éthique : Note méthodologique. Revue hiérarchisée par niveau de preuve : REVUE-360-HARCELEMENT-DANS-LE-TEMPS-27mai.md (dossier interne). Cette base est citée à l'identique dans nos courriers et nos restitutions.

Éthique & cadre juridique

🛡️ Garde-fou identité — neutraliser le risque d'outing

Une grande part du harcèlement adolescent touche l'orientation sexuelle, l'identité de genre, la religion ou la santé. Un outil mal conçu pourrait, en faisant remonter une alerte, révéler à une famille hostile ce que l'enfant gardait pour lui. « Sur l'appareil » protège contre un serveur, pas contre cette révélation vers le foyer. Nous traitons ce risque, nous ne l'ignorons pas : tout contenu touchant l'orientation, le genre, la religion ou la santé n'est jamais relayé d'une façon qui le révèle ; c'est l'enfant qui décide à qui une alerte est transmise.

📨 Qui reçoit l'alerte — l'enfant d'abord

Par défaut, une alerte va d'abord à l'enfant (un murmure adressé à lui), et ne remonte vers un adulte que si l'enfant le choisit, ou en cas de danger vital. Le parent ne voit pas le contenu des messages flaggés : son espace montre des repères et des limites honnêtes, pas la conversation de l'enfant. C'est ce qui distingue « enfant acteur » de « enfant surveillé ». L'enfant voit ce qui le concerne, peut contester (« ce n'est rien »), choisit son adulte de confiance, et peut désactiver. L'interlocuteur (l'ami avec qui l'enfant échange) n'a pas consenti à l'analyse : elle reste locale, et rien de lui n'est conservé.

Pour le parent, en clair : Shelkid est un filet, pas une garantie. Une absence d'alerte ne signifie jamais que tout va bien — rien ne remplace le dialogue et votre attention.
Architecture à trois étages : un message explicite d'appel à l'aide (« je veux me suicider ») est classé « rien » par le modèle statistique seul, mais capté par les règles de vigilance — qui déclenchent alors une orientation vers le 3018 / un adulte de confiance. La combinaison retient toujours le niveau le plus prudent. Aucun étage seul ne suffit.
Étage 1 — Règles en place
Repère le signal explicite. Filet de sécurité indispensable pour la crise.
Étage 2 — Modèle E5 intégré
Repère la nuance (grooming, harcèlement sans insulte). 5–9 ms sur smartphone.
Étage 3 — Dimension temporelle à venir
La répétition dans la durée. Visera le signal subtil, là où la donnée réelle est nécessaire.

Ce qu'il reste — et pourquoi un partenaire

Le signal subtil ne progressera qu'avec davantage de vraie donnée d'adolescents. Nous nous appuyons sur un corpus humain réel annoté (CyberAgressionAdo : 5 608 messages sur 36 conversations d'ados, annoté par 3 experts), complété d'un banc de test de 157 conversations — mais c'est encore étroit (4 thèmes, situations de jeu de rôle) et surtout pauvre en signal subtil, là où nous en aurions le plus besoin. Il en faut beaucoup plus, divers et équilibrés. La preuve sur de vrais téléphones, le paramétrage des seuils (à co-construire avec des professionnels) et le cadre juridique restent aussi à faire. Tout converge vers un test terrain encadré — que nous n'avons pas les moyens de financer seuls.

Ce que nous vous demandons, très concrètement : un échange de 30 minutes et votre regard méthodologique et clinique sur notre approche. Rien de plus pour commencer — pas d'argent, pas de caution publique, pas de label.

Nous ne cherchons pas une caution. Nous cherchons quelqu'un capable de nous dire où nous faisons fausse route — avant d'exposer de vrais enfants à notre solution.

Plus tard, et seulement si votre regard ouvre cette porte (et après finalisation de l'AIPD), nous aimerions un test terrain très encadré : quelques dizaines de familles volontaires (cible 20 à 40), sur 6 à 8 semaines, recrutées par nous (consentement parental + assentiment de l'enfant). Ce test ne sert pas à prouver que Shelkid marche — il sert à découvrir où Shelkid se trompe.

🛡️ Protocole de sécurité du test
  • Le test ne remplace AUCUN dispositif existant : le 3018 et les lignes d'aide restent affichés en permanence.
  • Supervision humaine tout au long ; aucune promesse de protection automatique.
  • L'outil rate encore une part des cas graves (rappel Kotlin ≈ 25 %) : il s'ajoute à la vigilance des adultes, il ne s'y substitue pas. L'enfant n'est jamais moins protégé pendant le test qu'avant.
  • Aucune donnée d'un mineur réel n'est traitée avant la finalisation de l'AIPD.
À propos du 3018 : nous orientons vers le 3018 par respect pour votre mission ; nous ne le ferons à grande échelle qu'avec votre accord et selon les modalités que vous fixerez. La convention reste une demande, pas un fait acquis.
Contact : Emmanuel Klein — SOS Écrans · [email protected] · shieldy.org

Mesures du moteur E5_QUALITY et expériences associées, bancs de test indépendants (n≈157 pour le moteur champion ; lots et corpus synthétiques détaillés ci-dessus), 31 mai – 1ᵉʳ juin 2026. Petit échantillon → marges d'incertitude larges, à reconfirmer sur corpus humain. Le signal subtil reste un problème de recherche ouvert, y compris dans la littérature scientifique ; nous ne prétendons pas l'avoir résolu. Ce qui est intégré dans l'app aujourd'hui = la ligne Kotlin (pas encore éprouvée sur de vraies familles) ; le reste est prospectif. Dossier de présentation préparé pour e-Enfance. SOS Écrans — association loi 1901 (W751283606). Shelkid : outil gratuit d'écoute et d'orientation, sans finalité médicale, sans diagnostic, avec un humain au centre.