Exploiter les données en vie réelle : focus sur les algorithmes
Les algorithmes informatiques conventionnels
Des algorithmes pour automatiser l’exploitation des données en vie réelle
L’algorithme conventionnel, un algorithme non-apprenant
Les algorithmes informatiques conventionnels (ou non apprenants) exécutent des programmes d’analyse de données préalablement codés par un opérateur humain.
Ces programmes définissent le type d’opérations à réaliser et leur ordre, guidant ainsi l’algorithme dans la réalisation de requêtes sur des bases de données complexes.
Ces algorithmes peuvent être vus comme de « super requêteurs », ils présentent pour principal intérêt de rendre possible la réalisation de tâches d’exploitation des données qui sont hors de portée d’opérateurs humains.
Un processus de développement guidé par l’intelligence humaine
Le développement d’un algorithme informatique conventionnel consiste à identifier des procédures, des suites d’actions ou de manipulations précises à accomplir séquentiellement pour atteindre un objectif donné.
En médecine, ce type d’algorithme est l’expression d’un consensus d’experts sur une problématique et un cheminement logique qui est traduit en code informatique. Le processus type d’élaboration d’un algorithme informatique conventionnel non-apprenant est le suivant :
- Initialisation : Définir la question posée et identifier les données nécessaires à la résolution de cette question
- Dans cette première étape, il s’agit de mobiliser les bonnes expertises (cliniques, information médicale, épidémiologie, bioinformatique, etc.) pour cadrer la question posée à l’algorithme, les actions qu’il va devoir exécuter, et définir les paramètres qui vont structurer la démarche de celui-ci.
- C’est le temps de l’intelligence humaine, avec la mise en commun de perspectives expertes qui vont guider le développement de l’algorithme.
- Traitement du problème
- Cette seconde étape s’ouvre par la programmation de l’algorithme. Le code informatique de celui-ci est développé avant d’être exécuté sur la/les source(s) de données en vie réelle à exploiter.
- C’est le temps de l’automatisation, l’algorithme développé ayant la capacité de réaliser des opérations complexes en un temps réduit. Il se substitue à l’humain dont la capacité à faire est limitée.
- Analyse et validation des résultats
- Les résultats générés par l’algorithme doivent faire l’objet d’une vérification en mobilisant l’expertise humaine.
- Si les résultats sont satisfaisants, alors une phase de validation peut être initiée pour s’assurer de la fiabilité des données et de la reproductibilité de l’analyse dans le temps et sur différents types de données.
Ces algorithmes peuvent être utilisés notamment pour :
- Identifier une sous-population au sein d’une population globale afin de constituer un échantillon sur lequel réaliser des analyses complémentaires
- Décrire les parcours de prise en charge d’une population afin de soulever des hypothèses pour améliorer la prise en charge
- Mesurer l’évolution d’une maladie afin d’adapter un traitement
- Définir un traitement d’image (ex. extraction de contours) pour identifier des lésions
- Rechercher des régularités dans des données génomiques