Infos Biotech – L’apprentissage automatique actif aide les chasseurs de drogues à s’attaquer à la biologie– Act-in-biotech

Un groupe croissant de startups recherchent des cycles itératifs d’apprentissage automatique, d’expérimentation en laboratoire humide et de rétroaction humaine pour accélérer la découverte de médicaments cibles.

Au cours de la dernière année, une nouvelle marque de société de découverte de médicaments a pris de l’ampleur. Décembre a vu le lancement officiel de Cellarity, une startup de découverte de médicaments qui utilise l’apprentissage automatique pour analyser les données de séquençage unicellulaire intégrées. Mais la biologie computationnelle n’est qu’une partie de la stratégie de Cellarity. La société, alimentée par 50 millions de dollars en soutien à Flagship Pioneering, construit également de vastes installations de laboratoire humide, qui généreront des données biologiques pour l’analyse et l’interprétation par ses algorithmes, générant des informations qui à leur tour peuvent conduire à de meilleurs modèles et à plus d’expériences. intelligent. . Cellarity est l’une des nombreuses startups à appliquer ce que certains appellent « l’apprentissage actif » pour élucider la nouvelle biologie des médicaments.

Les itérations homme-machine permettent une nouvelle façon de faire la biologie.
Crédit: Sean Prior / Alamy Banque D’Images

L’apprentissage actif est un sous-domaine de l’apprentissage automatique qui se concentre sur les algorithmes qui sélectionnent les données dont ils ont besoin pour améliorer leurs propres modèles. Contrairement à l’apprentissage automatique conventionnel, qui crée linéairement des modèles à partir d’un échantillon de données, puis les utilise à des fins telles que la classification, le regroupement ou la prévision, l’apprentissage automatique actif est itératif. Cela signifie qu’il incorpore un composant qui caractérise quels types d’expériences ou de données amélioreraient davantage le modèle. En utilisant cette approche, une équipe de découverte de médicaments peut utiliser de manière itérative des hypothèses générées à partir de modèles d’apprentissage automatique pour planifier et exécuter des expériences ultérieures, produisant de nouvelles données qui sont à nouveau utilisées de manière itérative pour mettre à jour le modèle.

La cave est la dernière d’une gamme croissante d’entreprises qui utilisent cette approche pour accélérer le développement de médicaments. Il s’agit notamment d’Exscientia, LabGenius, Insitro et Recursion Pharmaceuticals. «Il existe certains domaines de découverte scientifique qui sont fondamentalement trop complexes pour que le cerveau humain puisse les comprendre, ou même pour que les groupes humains les comprennent collectivement», explique James Field, fondateur et PDG de LabGenius. Comme Cellarity, sa société parie sur l’idée qu’avoir des humains travaillant avec des algorithmes pour interpréter les données d’expériences bien conçues pourrait briser ces obstacles conceptuels pour identifier de nouvelles cibles médicamenteuses, des produits pharmaceutiques et des voies biologiques pertinentes pour la maladie.

Cette stratégie a déjà généré l’acceptation de l’industrie pharmaceutique. Par exemple, Exscientia, l’une des premières entreprises à entrer dans cet espace, qui s’est séparée de l’Université de Dundee en 2012, a des collaborations actives avec Celgene, Sanofi et GlaxoSmithKline. Peter Crane, directeur de la stratégie d’entreprise chez Synthace, un éditeur de logiciels d’automatisation de laboratoire, a noté la montée de l’intérêt et pense que les capacités technologiques ont finalement atteint un point où ces efforts hybrides homme-machine ne sont pas seulement pratiques. , mais aussi assez puissant pour commencer à s’attaquer à la biomédecine dure. problèmes. « Une variété de méthodes sont maintenant apparues qui, lorsqu’elles sont connectées les unes aux autres, peuvent permettre cette nouvelle façon de faire de la biologie », explique Crane.

Gisbert Schneider, qui étudie la conception de médicaments assistée par ordinateur à l’ETH Zurich, note que les chimistes médicinaux utilisent les techniques d’analyse statistique qui sous-tendent l’apprentissage automatique depuis la fin des années 1970. Et aujourd’hui, de tels algorithmes sont devenus un outil. efficace pour accélérer les étapes clés du processus, telles que la conception composite ou l’identification de candidats potentiels prometteurs. « Franchement, je ferais confiance à un outil d’apprentissage automatique ici plutôt qu’à un groupe de chimistes médicinaux, même étant chimiste médicinal moi-même », a déclaré Schneider. Cependant, il a été démontré qu’il est beaucoup plus difficile de tirer parti d’approches algorithmiques similaires pour caractériser la biologie de la maladie et évaluer l’efficacité du médicament.

L’un des facteurs critiques qui déterminent le succès ou l’échec d’un algorithme est les données que les utilisateurs y saisissent. Lorsque le fondateur d’Insitro, Daphne Koller, a commencé à travailler en biologie computationnelle il y a environ 20 ans, c’était un problème presque insurmontable. «Les ensembles de données n’étaient tout simplement pas très bons: ils étaient petits, pleins d’artefacts et à peine adaptés au problème que je voulais résoudre», dit-elle. Même au sein d’une seule entreprise pharmaceutique, les données de haute qualité provenant de différents programmes pourraient être enfermées dans des silos séparés, explique Milind Kamkolkar, responsable numérique et des données de Cellarity. Il ajoute que, dans de nombreux cas, les experts en informatique opèrent dans un isolement relatif des médecins, des chimistes et des biologistes ayant la compréhension la plus approfondie de la maladie à l’étude. « L’équipe informatique est souvent la dernière équipe à comprendre les hypothèses scientifiques ou pourquoi elle examine ces données particulières », explique Kamkolkar.

Cette nouvelle génération de start-up de découverte de médicaments assistée par apprentissage automatique vise désormais à surmonter ces défis grâce à une intégration étroite de l’informatique et du travail en laboratoire, avec une étroite collaboration entre les deux groupes d’experts. La génération de données sur site est un élément essentiel de ce processus. «Nous avons construit notre propre laboratoire de biologie, où nous effectuons la production de protéines, la génomique structurale, la détection biophysique et la pharmacologie», explique Andrew Hopkins, fondateur et PDG d’Exscientia. « Pour de nombreux projets, nous sommes les premiers à sélectionner un certain objectif. »

Les données générées varient d’une entreprise à l’autre. LabGenius se concentre sur les efforts d’ingénierie des protéines, avec des processus expérimentaux qui peuvent identifier de nouvelles thérapies protéiques et optimiser les propriétés biochimiques et pharmacologiques des protéines existantes. La stratégie de récursivité met l’accent sur l’imagerie cellulaire et tissulaire, et la société prétend avoir rassemblé la plus grande collection de données au monde. D’autres sociétés, telles qu’Insitro et Celsius Therapeutics, s’appuient sur l’analyse de transcriptome de cellules individuelles pour comprendre comment différents types de cellules se comportent en cas de maladie et de santé, ou en réponse à des perturbations spécifiques. « Nous avons un laboratoire de biologie performant qui est essentiellement une usine de données, utilisant des cellules souches pluripotentes induites d’origine humaine qui couvrent un spectre de diversité génétique humaine », a déclaré Koller d’Insitro, notant qu’elles utilisent largement la technologie CRISPR. pour tester les effets des mutations liées à des maladies connues et également travailler avec des échantillons pertinents provenant de donneurs.

Ces résultats sont ensuite introduits dans des pipelines analytiques. Certains des objectifs ici sont relativement conventionnels dans le monde de la biologie computationnelle, par exemple, classer différents types ou états de cellules en fonction des profils d’expression génique. Mais ces algorithmes peuvent également être utilisés pour assembler des descriptions plus détaillées des états cellulaires qui incorporent plusieurs modalités de données telles que l’imagerie, la génomique, la transcriptomique et la protéomique en une seule représentation détaillée. La cellarité appelle ces représentations des «cartes», qui à leur tour peuvent être utilisées pour identifier les signes d’une fonction saine ou anormale. « Nous ne pouvons pas comprendre chaque petit détail de ce qui se passe partout », explique le CTO Chad Nusbaum. « Nous recherchons des marqueurs biologiques du comportement de cette cellule dans un état sain et malsain, et pour prédire ce qui encouragera la cellule à passer à l’état sain. »

Bien que potentiellement informatifs, ces modèles ne sont que des suppositions éclairées jusqu’à ce qu’ils soient validés expérimentalement. Mais au lieu de tester leurs modèles avec des écrans massifs et haute performance qui peuvent finalement s’avérer infructueux, ces startups tirent à nouveau parti de l’apprentissage automatique pour planifier les prochaines étapes.

«L’apprentissage actif consiste à demander quels composés je dois fabriquer et à prouver qu’ils seraient plus instructifs pour faire avancer mon projet», explique Hopkins. « Il s’agit de l’acquisition de données. » Au lieu de milliers ou plus de composés, ces algorithmes pourraient proposer beaucoup moins d’expériences, y compris des candidats pour des médicaments qui devraient échouer, ainsi que ceux qui devraient réussir. Cela fait de l’apprentissage actif un puissant moteur de génération d’hypothèses et de test qui peut aider les développeurs de médicaments à concentrer leurs efforts. « L’élimination précoce des » mauvaises pommes « est là où je vois le principal avantage de l’apprentissage actif », explique Schneider. Le plan expérimental proposé remonte aux expérimentateurs du banc, initiant un nouveau cycle de tests et d’analyses.

Ce développement itératif est une composante essentielle du processus. «La conception de médicaments basée sur l’IA ne vous donnera pas seulement un médicament directement, c’est toujours de la science-fiction», explique Hopkins. Chez Celsius, par exemple, les chercheurs analysent soigneusement les différents types de cellules et profils d’expression génique identifiés lors des premières expériences transcriptomiques unicellulaires, puis testent ces modèles à l’aide d’outils comme CRISPR pour introduire des manipulations génomiques spécifiques qui pourraient confirmer ou invalider cibles pharmacologiques possibles dans la maladie. cellules affectées. «Cela permet de générer ces hypothèses plus rapidement puis de les tester: il est beaucoup plus rapide de pousser des électrons que des cellules», explique le directeur des données Gregory Ryslik. Et à mesure que les algorithmes et les workflows s’améliorent, le processus peut atteindre une plus grande efficacité; Hopkins note que depuis le lancement d’Exscientia en 2012, la société a simplifié le nombre de médicaments généralement nécessaires pour obtenir un candidat approprié pour le développement clinique d’environ 2 500 à 400 ou moins.

Ces gains peuvent être considérablement accélérés si l’automatisation est mise en jeu. Dans ce scénario, la conception réelle de nouvelles expériences incombe toujours aux scientifiques humains, mais une fois le flux de travail formalisé et validé, il peut être facilement automatisé. Chez Insitro, Koller note qu’ils peuvent désormais mener des expériences en quelques semaines, ce qui prendrait des années pour la plupart des laboratoires universitaires, tout en éliminant la variabilité inhérente qui survient même avec des scientifiques experts et expérimentés. LabGenius ‘Field déclare: « Ces plates-formes changent ce que signifie être un scientifique … dans le but de maximiser le temps passé à penser de manière créative et de minimiser le temps passé à effectuer en laboratoire. »

Ce processus peut aider les chercheurs à optimiser plusieurs aspects du processus de développement de médicaments en parallèle, par exemple en sélectionnant simultanément des composés ayant des propriétés pharmacocinétiques et toxicologiques optimales, ainsi que des effets thérapeutiques sélectifs et puissants sur la cible. De nombreuses entreprises dans ce domaine poursuivent initialement des objectifs cliniques difficiles, notamment des maladies multifactorielles complexes telles que la maladie inflammatoire de l’intestin ou le cancer, dont les causes profondes peuvent être mal comprises et nécessiter un traitement soigneusement calibré avec plusieurs médicaments. « Je pense qu’avec notre approche, nous pouvons vraiment nous attaquer à de nombreux réseaux différents qui affectent le comportement des cellules », explique Cristina Rondinone, présidente de Cellarity. Il note également que cette approche pourrait mettre les sociétés pharmaceutiques en position de s’engager dans la science de la découverte dans le domaine de la recherche sur les maladies, un domaine qui reste principalement le domaine universitaire.

Il n’est ni bon marché ni facile de développer des capacités robustes dans l’expérimentation en laboratoire humide et la biologie computationnelle parallèle. D’une part, les techniques de base de l’apprentissage automatique sont bien établies et la disponibilité généralisée du cloud computing a largement éliminé le besoin d’investissements massifs dans l’infrastructure informatique. Mais, d’autre part, Koller note que l’échelle et la complexité de ces données peuvent rapidement submerger les pipelines analytiques conventionnels. «Nous avons dû réécrire les algorithmes d’apprentissage automatique, car ils sont conçus pour des images de microscope de 256 x 256 pixels, et les nôtres sont de 20 000 par 80 000», dit-elle. « Et quand vous pensez à la nature multimodale des modèles que nous devons construire, très peu de tâches d’apprentissage automatique impliquent ce niveau de défi. »

Le travail d’équipe peut être une tâche encore plus difficile. Certaines des techniques de laboratoire utilisées, comme le séquençage d’ARN unicellulaire, sont suffisamment avancées pour qu’il soit difficile de trouver des chercheurs ayant une expérience approfondie. Et sur le plan informatique, les entreprises ne recherchent pas seulement des scientifiques des données, des codeurs et des ingénieurs ayant les compétences nécessaires pour repousser les limites des capacités d’apprentissage automatique, elles sont également en concurrence avec les poches profondes de titans technologiques comme Google. « Les sociétés pharmaceutiques sont-elles vraiment prêtes à avoir une tête d’apprentissage en profondeur qui gagne plus que leur tête de découverte de médicaments? » Demande Crane. Une culture de collaboration est également essentielle pour que ces startups ambitieuses tombent dans des structures organisationnelles isolées qui ont limité l’impact de l’apprentissage automatique sur le développement de médicaments dans le passé.

Mais ce travail et cet investissement pourraient en fin de compte porter leurs fruits massivement s’ils pouvaient améliorer l’efficacité et donc réduire le coût du développement de médicaments. Koller pense que l’avantage vaut clairement le risque. « L’avant n’est pas le bon endroit pour ranger », dit-elle. « Si un programme de découverte de médicaments coûte plus d’un milliard de dollars, vous ne voulez pas économiser 10 à 15 millions de dollars sur un portefeuille de services qui créerait le bon ensemble de données et ferait les bonnes prévisions. » Les premiers produits de cette approche commencent maintenant à s’infiltrer dans le pipeline clinique, notamment un médicament candidat pour le trouble obsessionnel compulsif développé par Exscientia pour Sumitomo Dainippon Pharma, qui est entré en phase 1 plus tôt cette année. Cependant, il n’est pas clair quel impact ce processus de développement aura sur les taux de réussite clinique, en particulier dans les phases ultérieures des essais d’efficacité, où des candidats-médicaments apparemment prometteurs hésitent régulièrement. «Nous travaillons au bord du chaos, où nous interférons avec des systèmes vivants et adaptatifs», explique Schneider. « Ce serait une erreur de s’attendre à des prédictions parfaites. »

Cependant, un nombre croissant d’acteurs majeurs de l’industrie sont impatients d’explorer cette approche. Par exemple, Celsius travaille actuellement avec Janssen pour identifier les biomarqueurs de réponse à une thérapie combinée pour la colite ulcéreuse, et Insitro se prépare à présenter les données préliminaires d’une collaboration avec Gilead pour concevoir de nouveaux médicaments pour les maladies du foie notoirement difficiles à traiter. Stéatohépatite non alcoolique Mais ces startups ne cherchent pas seulement à agir en tant que prestataires de services collaboratifs. « Au fond, nous sommes une entreprise de médecine de précision, et notre objectif à long terme est de développer et de commercialiser des thérapies de manière indépendante », déclare le PDG de Celsius, Tariq Kassum.

En fait, Hopkins voit cette approche comme la prochaine étape naturelle de l’évolution de l’industrie. Il cite l’exemple du grand maître d’échecs Garry Kasparov, qui, après avoir été dépassé par l’ordinateur Deep Blue d’IBM, s’est associé à l’IA pour obtenir un style de jeu plus formidable que l’homme ou la machine seuls. « Il ne s’agit pas de remplacer le concepteur de médicaments », dit-il. « Il s’agit d’améliorer vos compétences et d’augmenter vos chances d’introduire un médicament dans les essais cliniques. »

Informations sur l’auteur

Affiliations

Auteurs

À propos de cet article

Vérifiez la devise et l'authenticité via CrossMark

Citez cet article

Eisenstein, M. L’apprentissage automatique actif aide les chasseurs de drogues à s’attaquer à la biologie.
Nat Biotechnol 38, 512-514 (2020). https://doi.org/10.1038/s41587-020-0521-4

Télécharger le devis

Source: Source link

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *