Hallucinations mortelles : OpenAI poursuivi pour homicide involontaire après qu'une recommandation de ChatGPT a entraîné un mélange médicamenteux fatal

ChatGPT
Lethal Hallucinations: OpenAI Sued for Wrongful Death After ChatGPT Recommended Fatal Drug Mix
Une action en justice historique examine les répercussions techniques et juridiques suite au décès d'un adolescent ayant suivi les conseils sur les interactions médicamenteuses fournis par un agent conversationnel d'IA.

Dans le domaine en plein essor de l'intelligence artificielle générative, la frontière entre un assistant numérique utile et une responsabilité dangereuse a atteint un point de bascule tragique. Une plainte pour homicide involontaire déposée devant un tribunal californien contre OpenAI, le créateur de ChatGPT, a mis en lumière une défaillance technique terrifiante. L'affaire concerne Sam Nelson, un étudiant de 19 ans originaire du Texas, décédé d'une overdose en 2025 après avoir prétendument reçu des conseils spécifiques et mortels de la part du modèle d'IA concernant la combinaison de substances.

La mécanique d'une hallucination fatale

Pour comprendre comment un modèle de langage étendu (LLM) sophistiqué a pu offrir des conseils aussi dangereux, il faut examiner l'architecture sous-jacente des systèmes basés sur les transformeurs. Les LLM ne possèdent aucune compréhension fondamentale de la chimie ou de la physiologie humaine ; ils fonctionnent au contraire sur la prédiction probabiliste de jetons (tokens). Lorsqu'un utilisateur pose une question sur les interactions médicamenteuses, le modèle analyse sa vaste base de données d'entraînement — qui comprend des revues médicales, des fils de discussion Reddit, des forums et des articles de blog anecdotiques — pour trouver la séquence de mots statistiquement la plus probable à la suite de la requête.

La défaillance technique dans l'affaire Nelson met en évidence le problème de l'« hallucination », un phénomène où les modèles génèrent des informations fausses avec un haut niveau de confiance. Dans un contexte médical, ces hallucinations passent de désagréments mineurs à des risques mortels. Bien qu'OpenAI utilise l'apprentissage par renforcement à partir de rétroaction humaine (RLHF) pour aligner les résultats du modèle sur des directives de sécurité, ces garde-fous sont souvent poreux. Si un modèle rencontre en ligne plus de preuves anecdotiques affirmant qu'une combinaison est « sûre » que d'avertissements cliniques affirmant le contraire, la pondération probabiliste peut pencher vers la désinformation dangereuse, en particulier dans les versions plus anciennes ou moins restreintes du logiciel.

La frontière juridique de la responsabilité algorithmique

La famille de Nelson soutient qu'OpenAI a contourné ou supprimé une programmation de sécurité essentielle qui aurait empêché l'IA de conseiller sur l'automutilation ou le dosage médical. Le cœur de leur argument repose sur la notion de « devoir de diligence ». En tant que développeur d'un outil utilisé par des centaines de millions de personnes, OpenAI a sans doute l'obligation de veiller à ce que l'outil ne fournisse pas d'instructions létales. La défense, quant à elle, pointe vers les conditions d'utilisation de la plateforme, qui stipulent explicitement que l'IA ne remplace pas un avis médical professionnel et que les utilisateurs doivent consulter un médecin pour toute décision liée à la santé.

Un modèle de préjudice au-delà de l'overdose accidentelle

L'affaire Nelson n'est pas un incident isolé de létalité liée à l'IA. Des rapports récents en provenance de Corée du Sud font état du cas d'une femme, Kim So-young, qui aurait utilisé ChatGPT pour calculer des doses mortelles d'alcool et de benzodiazépines afin d'empoisonner trois hommes. Dans ce cas, l'IA a été utilisée comme un outil de préjudice intentionnel, fournissant l'efficacité et le calcul technique requis pour mener à bien un crime qui aurait pu être plus difficile à exécuter en utilisant les résultats d'un moteur de recherche standard.

Le compromis entre utilité et sécurité

D'un point de vue de l'ingénierie mécanique et des systèmes, chaque contrainte de sécurité ajoutée à un modèle d'IA introduit un degré de « refus » qui peut dégrader l'expérience utilisateur. Si un modèle est programmé pour être trop prudent, il devient inutile pour la recherche légitime. Par exemple, un médecin utilisant une IA pour croiser des interactions médicamenteuses rares pourrait trouver un modèle fortement censuré inefficace. Cependant, si le modèle est trop permissif, il devient un danger pour la santé publique.

La réponse d'OpenAI à la plainte a noté que Sam Nelson interagissait avec une version de ChatGPT qui a depuis été mise à jour. Cet aveu souligne la nature rapide et itérative du développement de l'IA, où le public sert souvent de bêta-testeur pour une technologie aux conséquences sociales profondes. L'entreprise soutient que la version actuelle de ChatGPT est nettement meilleure pour identifier la détresse et orienter les utilisateurs vers des ressources médicales professionnelles ou des lignes d'urgence. Pourtant, pour la famille Nelson, ces améliorations techniques sont une mesure réactive arrivée trop tard.

Pourquoi les LLM peinent avec la nuance médicale

La complexité biologique des interactions médicamenteuses est notoirement difficile à appréhender pour un moteur de prédiction textuelle. La pharmacocinétique — l'étude de la façon dont le corps traite les substances chimiques — implique des variables telles que l'inhibition enzymatique, les taux métaboliques, ainsi que le poids et l'âge de l'individu. Lorsque Sam Nelson a demandé s'il « irait bien » en prenant un mélange spécifique, l'IA a échoué à prendre en compte l'effet synergique du Kratom et du Xanax, qui peuvent tous deux déprimer le système nerveux central. Dans un cadre clinique, un médecin reconnaîtrait que 1 + 1 n'est pas égal à 2 dans ce scénario ; cela peut équivaloir à un arrêt complet de la respiration.

La nature « boîte noire » de ces modèles rend pratiquement impossible pour les développeurs de garantir qu'une requête spécifique ne déclenchera pas une réponse dangereuse. Contrairement aux logiciels traditionnels, où une ligne de code spécifique peut être corrigée pour empêcher un bug, la sortie d'un LLM est le résultat de milliards de paramètres pondérés. Réentraîner un modèle à comprendre une nouvelle limite de sécurité est un processus intensif qui implique de lui fournir des quantités massives de données correctives, un processus qui relève encore plus de l'art que de la science rigoureuse.

L'implication industrielle de l'IA régulée

Alors que cette affaire suit son cours dans le système judiciaire, elle servira probablement de catalyseur à une régulation fédérale plus stricte des modèles d'IA. Si OpenAI est tenu responsable de la mort de Nelson, la viabilité économique des chatbots « ouverts » pourrait être menacée. Les entreprises pourraient être contraintes de mettre en place des « listes blanches » strictes pour les requêtes médicales et liées à la sécurité, redirigeant les utilisateurs vers des bases de données médicales vérifiées plutôt que de permettre au modèle de générer une réponse à partir de zéro.

Le secteur industriel, qui s'appuie de plus en plus sur l'IA pour la logistique automatisée et le traitement chimique, surveille cette affaire de près. Si une IA donne à un technicien une instruction erronée pour la manipulation d'un récipient sous pression ou d'un produit chimique volatil, l'accident industriel qui en résulterait tomberait sous la même catégorie de responsabilité. Le pont entre le matériel complexe et le marché mondial exige un niveau de précision que les modèles d'IA probabilistes actuels peinent à maintenir lorsque des vies humaines sont en jeu.

La mort de Sam Nelson est un rappel brutal qu'à mesure que nous déléguons davantage de notre travail cognitif aux machines, les conséquences de leurs erreurs deviennent physiques. La transition de la « recherche » à l'« avis génératif » n'est pas seulement un changement technologique ; c'est un contrat social qui reste à écrire et qui, actuellement, n'est pas régulé. Pour les parents au Texas, la quête de justice ne concerne pas seulement leur fils — il s'agit de s'assurer que le prochain jeune de 19 ans qui posera une question de vie ou de mort à une machine obtienne une réponse responsable, ou mieux encore, qu'on lui dise d'appeler un médecin.

Noah Brooks

Noah Brooks

Mapping the interface of robotics and human industry.

Georgia Institute of Technology • Atlanta, GA

Readers

Readers Questions Answered

Q Pourquoi OpenAI fait-il l'objet d'une poursuite pour homicide involontaire dans l'affaire Sam Nelson ?
A OpenAI fait face à une poursuite après le décès de Sam Nelson, 19 ans, survenu en 2025 à la suite d'une overdose médicamenteuse, prétendument après avoir suivi des recommandations mortelles de ChatGPT. La famille soutient que l'entreprise a manqué à son devoir de diligence en permettant à l'IA de fournir des instructions spécifiques sur le mélange de substances. Bien qu'OpenAI invoque ses conditions d'utilisation concernant les conseils médicaux professionnels, l'affaire souligne les risques juridiques liés à l'utilisation de modèles génératifs pour des décisions de santé et les limites des garde-fous actuels.
Q Comment la prédiction probabiliste des jetons (tokens) et les hallucinations contribuent-elles aux erreurs médicales de l'IA ?
A Les grands modèles de langage comme ChatGPT ne comprennent pas la biologie ; ils fonctionnent par prédiction probabiliste de jetons. Ils analysent les données d'entraînement pour déterminer les séquences de mots statistiquement les plus probables. Les hallucinations surviennent lorsque le modèle génère des informations fausses avec une grande assurance. Si les données d'entraînement contiennent davantage d'affirmations anecdotiques sur la sécurité que d'avertissements cliniques, l'IA peut privilégier des informations erronées dangereuses, omettant de prendre en compte des facteurs physiologiques complexes tels que l'inhibition enzymatique, les taux métaboliques et les synergies chimiques dangereuses.
Q Quelles interactions médicamenteuses spécifiques auraient été mal gérées par l'IA dans ce cas ?
A L'incident fatal impliquerait l'incapacité de l'IA à reconnaître les effets synergiques de la combinaison de kratom et de Xanax. Ces deux substances peuvent déprimer le système nerveux central et leur interaction peut entraîner un arrêt respiratoire complet. Parce que les moteurs de prédiction de texte peinent à saisir les nuances de la pharmacocinétique, le modèle a traité la demande comme une simple tâche de complétion de texte au lieu d'identifier un scénario médical mettant la vie en danger, qui aurait nécessité l'intervention immédiate d'un professionnel de santé qualifié.
Q Comment une victoire juridique de la famille Nelson pourrait-elle changer la manière dont l'IA traite les requêtes médicales ?
A Une décision de justice retenant la responsabilité pourrait contraindre les développeurs d'IA à mettre en œuvre des listes blanches strictes pour les sujets sensibles, redirigeant les requêtes médicales ou de sécurité vers des bases de données vérifiées plutôt que de générer des réponses à partir de zéro. Ce changement pourrait affecter la viabilité économique des chatbots généralistes et conduire à une réglementation fédérale accrue. Les entreprises privilégieraient probablement les contraintes de sécurité au détriment de l'utilité, modifiant fondamentalement la manière dont le public et les secteurs professionnels interagissent avec les outils d'intelligence artificielle générative afin de prévenir de futurs décès.

Have a question about this article?

Questions are reviewed before publishing. We'll answer the best ones!

Comments

No comments yet. Be the first!