Über die Jahre wurde maschinelles Lernen in den verschiedensten Wissenschaftsbereichen eingesetzt. Es sind so zahlreiche Bibliotheken, Frameworks und Systeme entstanden, um ML-gesteuerte Anwendungen zu entwickeln. Jedoch hat die Verbreitung des maschinellen Lernens noch nicht dazu beigetragen, dass der Anwendungsprozess von ML-Algorithmen für Machine-Learning Experten und andere Softwareingenieure erleichtert wird.
Wenn Wissenschaftler ML-Algorithmen reproduzieren und bewerten sollen, müssen sie Abhängigkeiten und Anforderungen zum Ausführen des Algorithmus selbst identifizieren und installieren, um diesen laufen zu lassen. Wenn sie mehrere verschiedene Algorithmen vergleichen und die Resultate beurteilen wollen, wird dieser Vorgang oft mehrmals wiederholt, was mühsam und zeitraubend ist. Zeitgleich wird von Softwareingenieuren verlangt, dass sie mehr ML-Wissen haben und die technischen Fähigkeiten ML-Algorithmen anzuwenden, was nicht immer möglich ist und auch ineffektiv sein kann.
Um die Nutzbarkeit von ML systematischer zu gestalten, imitiert AID traditionelle Bibliotheken und schlägt drei Komponenten vor. Erstens, wie die ISBN für Bücher, stellt AID einheitliche Formate für verschiedene ML-Modelle zur Verfügung, so dass diese Modelle in der gleichen Weise gelesen, extrahiert und indexiert werden können. Zweitens wird von AID eine digitale Bibliothek unterhalten, in der die Benutzer die Möglichkeit haben, vorhandene ML-Modelle zu suchen, zu filtern und zu inspizieren. Zu guter Letzt erlaubt AID ML-Algorithmen herunterzuladen, zu installieren und fertige Modelle laufen zu lassen, dabei vereinheitlicht mit einem Paketmanager, der mit den Abhängigkeiten der Algorithmen umgehen kann. Eine erweiterbare Pipeline ermöglicht, dass die auf der Plattform bestehenden ML-Algorithmen, leicht in vorhandene ML-Systeme integriert werden können.
Mit AID kann die Verwendung von ML-Algorithmen auf folgende Weise besser ermöglicht werden. Zunächst kann das gesamte Team in der Bibliothek nach bewährten ML-Algorithmen suchen, dann stellen die Softwareingenieure die Modelle bereit und laden einen Testdatensatz hoch. Schließlich können Experten aus dem Bereich (z. B. Biologen, Ärzte) die Ergebnisse prüfen und diskutieren, bevor sie eine endgültige Entscheidung über die Implementierung des Algorithmus treffen.
Die Verwendung von AID hat zwei Vorteile: Der Evaluierungsprozess für verschiedene ML-Algorithmen wird einheitlicher, und Entwickler können die ML-Algorithmen mit den immer gleichen kleinen Schritten ausführen. Diese beiden Verbesserungen könnten die Hürden für die Anwendung von ML-Algorithmen wesentlich senken.
Projektdauer
1. Juni 2021 bis 31. Dezember 2021