KI ist mehr als nur ein Modell: Vier Schritte zum vollständigen Workflow-Erfolg

Ingenieur*innen sind zunehmend bestrebt, KI erfolgreich in Projekte und Anwendungen zu integrieren, während sie versuchen, ihre eigene KI-Lernkurve zu meistern. Allerdings werden viele KI-Projekte nach wenig vielversprechenden Ergebnissen wieder verworfen. Woran liegt das? Johanna Pingel, Product Marketing Manager bei MathWorks, erläutert, warum es für Ingenieur*innen wichtig ist, sich auf den gesamten KI-Workflow zu konzentrieren und nicht nur auf die Modellentwicklung:

Ingenieur*innen, die Machine Learning und Deep Learning einsetzen, erwarten oft, dass sie einen großen Teil ihrer Zeit mit der Entwicklung und Feinabstimmung von KI-Modellen verbringen. Die Modellierung ist zwar ein wichtiger Schritt im Workflow, aber das Modell ist nicht alleiniges Ziel. Das Schlüsselelement für den Erfolg bei der praktischen KI-Implementierung ist das frühzeitige Aufdecken von Problemen. Außerdem ist es wichtig zu wissen, auf welche Aspekte des Workflows man Zeit und Ressourcen konzentrieren sollte, um die besten Ergebnisse zu erzielen. Das sind nicht immer die offensichtlichsten Schritte.

Der KI-gesteuerte Workflow

Es lassen sich vier Schritte in einem KI-gesteuerten Workflow differenzieren, wobei jeder Schritt seine eigene Rolle bei der erfolgreichen Implementierung von KI in einem Projekt spielt.
 

Schritt 1: Datenaufbereitung

Die Datenaufbereitung ist wohl der wichtigste Schritt im KI-Workflow: Ohne robuste und genaue Daten zum Trainieren eines Modells sind Projekte rasch zum Scheitern verurteilt. Wenn Ingenieur*innen das Modell mit „schlechten“ Daten füttern, werden sie keine aufschlussreichen Ergebnisse erhalten – und wahrscheinlich viele Stunden damit verbringen, herauszufinden, warum das Modell nicht funktioniert.

Um ein Modell zu trainieren, sollten Ingenieur*innen mit sauberen, gelabelten Daten beginnen, und zwar mit so vielen wie möglich. Dies kann einer der zeitaufwendigsten Schritte des Workflows sein. Wenn Deep Learning-Modelle nicht wie erwartet funktionieren, konzentrieren sich viele darauf, wie man das Modell verbessern kann – durch das Optimieren von Parametern, die Feinabstimmung des Modells und mehrere Trainingsiterationen. Doch noch viel wichtiger ist die Aufbereitung und das korrekte Labeln der Eingabedaten. Das darf nicht vernachlässigt werden, um sicherzustellen, dass Daten korrekt vom Modell verstanden werden können.
 

Schritt 2: KI-Modellierung

Sobald die Daten sauber und richtig gelabelt sind, kann zur Modellierungsphase des Workflows übergegangen werden. Hierbei werden die Daten als Input verwendet und das Modell lernt aus diesen Daten. Das Ziel einer erfolgreichen Modellierungsphase ist die Erstellung eines robusten, genauen Modells, das intelligente Entscheidungen auf Basis der Daten treffen kann. Dies ist auch der Punkt, an dem Deep Learning, Machine Learning oder eine Kombination davon in den Arbeitsablauf einfließt. Hier entscheiden die Ingenieur*innen, welche Methoden das präziseste und robusteste Ergebnis hervorbringt.

Die KI-Modellierung ist ein iterativer Schritt innerhalb des gesamten Workflows, und Ingenieur*innen müssen die Änderungen, die sie während dieses Schrittes am Modell vornehmen, nachverfolgen können. Die Nachverfolgung von Änderungen und die Aufzeichnung von Trainingsiterationen mit Tools wie dem Experiment Manager von MathWorks sind entscheidend, da sie helfen die Parameter zu erklären, die zum genauesten Modell führen und reproduzierbare Ergebnisse liefern.
 

Schritt 3: Simulation und Tests

Ingenieur*innen müssen beachten, dass KI-Elemente meistens nur ein kleiner Teil eines größeren Systems sind. Sie müssen in allen Szenarien im Zusammenspiel mit anderen Teilen des Endprodukts korrekt funktionieren, einschließlich anderer Sensoren und Algorithmen wie Steuerung, Signalverarbeitung und Sensorfusion. Ein Beispiel ist hier ein Szenario für automatisiertes Fahren: Dabei handelt es sich nicht nur um ein System zur Erkennung von Objekten (Fußgänger*innen, Autos, Stoppschilder), sondern dieses System muss mit anderen Systemen zur Lokalisierung, Wegplanung, Steuerung und weiteren integriert werden. Simulationen und Genauigkeitstests sind der Schlüssel, um sicherzustellen, dass das KI-Modell richtig funktioniert und alles gut mit anderen Systemen harmoniert, bevor ein Modell in der realen Welt eingesetzt wird.

Um diesen Grad an Genauigkeit und Robustheit vor dem Einsatz zu erreichen, müssen Ingenieur*innen validieren, dass das Modell in jeder Situation so reagiert, wie es soll. Sie sollten sich auch mit den Fragen befassen, wie exakt das Modell insgesamt ist und ob alle Randfälle abgedeckt sind. Durch den Einsatz von Werkzeugen wie Simulink können Ingenieur*innen überprüfen, ob das Modell für alle erwarteten Anwendungsfälle wie gewünscht funktioniert, und so kosten- und zeitintensive Überarbeitungen vermeiden.
 

Schritt 4: Einsatz

Ist das Modell reif für die Bereitstellung, folgt als nächster Schritt der Einsatz auf der Zielhardware – mit anderen Worten, die Bereitstellung des Modells in der endgültigen Sprache, in der es implementiert werden soll. Das erfordert in der Regel, dass die Entwicklungsingenieur*innen ein implementierungsbereites Modell nutzen, um es in die vorgesehene Hardwareumgebung einzupassen.

Die vorgesehene Hardwareumgebung kann vom Desktop über die Cloud bis hin zu FPGAs reichen. Mithilfe von flexiblen Werkzeugen wie MATLAB kann der endgültige Code für alle Szenarien generiert werden. Das bietet Ingenieur*innen den Spielraum, ihr Modell in einer Vielzahl von Umgebungen einzusetzen, ohne den ursprünglichen Code neu schreiben zu müssen. Das Deployment eines Modells direkt auf einer GPU kann hier als Beispiel dienen: Die automatische Codegenerierung eliminiert Codierungsfehler, die durch eine manuelle Übersetzung entstehen könnten, und liefert hochoptimierten CUDA-Code, der effizient auf der GPU läuft.

Gemeinsam stärker

Ingenieur*innen müssen keine Datenwissenschaftler*innen oder gar KI-Expert*innen werden, um mit KI erfolgreich zu sein. Mit Werkzeugen für die Datenaufbereitung, Anwendungen zur Integration von KI in ihre Arbeitsabläufe und mit verfügbaren Expert*innen, die Fragen zur KI-Integration beantworten, können sie KI-Modelle auf Erfolgskurs bringen. In jedem dieser Schritte im Workflow haben Ingenieur*innen die Möglichkeit, flexibel ihr eigenes Domänenwissen einzubringen. Dies ist eine wichtige Basis, auf der sie mit den richtigen Ressourcen aufbauen und die sie durch KI ergänzen können.

Über MathWorks

MathWorks ist der führende Entwickler von Software für mathematische Berechnungen. MATLAB, die Programmiersprache für Ingenieurwesen und Wissenschaft, ist eine Programmierumgebung für die Algorithmen-Entwicklung, Analyse und Visualisierung von Daten sowie für numerische Berechnungen. Simulink ist eine Blockdiagramm-basierte Entwicklungsumgebung für die Simulation und das Model-Based Design von technischen Mehrdomänen-Systemen und Embedded Systemen. Ingenieure und Wissenschaftler weltweit setzen diese Produktfamilien ein, um die Forschung sowie Innovationen und Entwicklungen in der Automobilindustrie, der Luft- und Raumfahrt, der Elektronik, dem Finanzwesen, der Biotechnologie und weiteren Industriezweigen zu beschleunigen. MATLAB und Simulink sind zudem an Universitäten und Forschungsinstituten weltweit wichtige Lehr- und Forschungswerkzeuge. MathWorks wurde 1984 gegründet und beschäftigt mehr als 5000 Mitarbeiter in 16 Ländern. Der Hauptsitz des Unternehmens ist Natick, Massachusetts, in den USA. Lokale Niederlassungen in der D-A-CH-Region befinden sich in Aachen, München, Paderborn, Stuttgart und Bern. Weitere Informationen finden Sie unter mathworks.com.

Updates für Automatisiertes Fahren und Maschinelles Lernen

MathWorks stellt Release 2017a der MATLAB- und Simulink-Produktfamilien vor

Aachen/München, 9. März 2017MathWorks stellt heute Release 2017a (R2017a) mit einer Reihe neuer Funktionen in MATLAB und Simulink vor. R2017a enthält ein neues Produkt, die Automated Driving System Toolbox, für den Entwurf, die Simulation und das Testen von fortgeschrittenen Fahrerassistenzsystemen (ADAS) und automatisierten Fahrsystemen. R2017a enthält zudem Neuerungen im Bereich Big Data Analytics und Machine Learning ebenso wie Aktualisierungen für 86 vorhandene Produkte.

Neue Funktionen für Automatisiertes Fahren

Das Release 2017a umfasst die neue Automated Driving System Toolbox für das Design und Testen von ADAS und autonomen Fahrsystemen. Sie stellt neue Funktionen zur Entwicklung von Sensor-Fusion- und Tracking-Algorithmen bereit, die den Anwendern helfen, durch das Zusammenführen von Sensordaten aus komplementären Quellen neue und präzisere Kenntnisse über einzelne Verkehrssituationen zu erlangen. Anhand von generierten Verkehrsszenarien und synthetischen Sensordaten lassen sich Algorithmen testen und validieren. Mit weiteren Funktionen können komplette Kamera-, Radar- und Lidar-basierte Sensoren entwickelt werden. Durch die automatische Generierung von Code für den Sensorfusions- und Verfolgungs-Workflow lässt sich wertvolle Entwicklungszeit einsparen.

Von Data Analytics zu Maschinellem Lernen

Ein weiterer Fokus des R2017a liegt auf neuen Funktionen für Data Analytics, Machine Learning und Deep Learning. Neue Tools erleichtern die Skalierung und schnellere Ausführung von Algorithmen in MATLAB und Simulink. Dieser Vorteil kommt beispielsweise zum Tragen, wenn Anwender große Mengen an Bilddaten analysieren möchten, um Algorithmen zur Objekterkennung zu entwickeln.

Mit dem neuen Update ist es möglich, neuronale Netze vollständig selbst zu trainieren oder Transfer Learning mit vortrainierten Modellen zu verwenden, die bereits Tausende von Objekten erkennen. Anwender können das Training mit GPUs auf ihrem Multi-Core Computer oder durch Skalierung in der Cloud beschleunigen.

Das Update umfasst zudem Frameworks zur Objekterkennung, die helfen, Objekte mit Deep Learning noch präziser lokalisieren und klassifizieren zu können. Funktionen für Maschinelles Lernen sind bereits in die Classification Learner App integriert und helfen bei der Klassifizierung von Objekten. Ergänzt wird sie durch die neue Regression Learner App zum Trainieren von Regressionsmodellen mit überwachtem maschinellem Lernen.

Big Data leichter verarbeiten

Bei der Bearbeitung großer Datenmengen stehen Anwender oft vor technischen Problemen, etwa wenn sie Algorithmen entworfen haben und diese skalieren möchten, die Daten aber nicht in den Arbeitsspeicher passen. Zur leichteren Bearbeitung von Big Data wurden im Release 2016b Tall Arrays eingeführt, die bei großen Datenmengen dennoch eine vertraute Syntax bieten. Mit dem Release 2017a werden Tall Arrays auch in vielen Machine-Learning-Funktionen unterstützt.

Leichteres Arbeiten mit Simulink in der Cloud

Auch in Simulink erleichtern Neuerungen des umfassenden Updates die Arbeit mit großen Datenmengen. Zum Beispiel ist es nun möglich, Eingangssignale aus MAT-Dateien zu streamen anstatt sie in den Arbeitsspeicher laden zu müssen. Zudem können Nutzer nun mithilfe des parsim-Befehls mehrere Simulationen parallel ausführen – entweder auf dem eigenen PC oder in der Cloud.

Auf der embedded world 2017 in Nürnberg, 14.-16. März, können Sie sich auf dem MathWorks-Stand (Halle 4, Stand 110) persönlich mit einem Ansprechpartner austauschen

Updates der MATLAB-Produktfamilie:

  • MATLAB
    • Interaktive Aktualisierungen von Abbildungen im Live Editor (einschließlich des Titels, der Beschriftungen, der Legende und weiterer Anmerkungen) sowie die Möglichkeit, Live-Script-Ausgaben in andere Anwendungen zu kopieren
    • Heatmap-Diagrammfunktionen für die Datenvisualisierung
    • Mehr Funktionen für die Arbeit mit Tall Arrays, darunter ismember, sort, conv und Funktionen für sich bewegende Statistiken
  • Econometrics Toolbox
    • Bayes‘sches lineares Regressionsmodell zum Analysieren der Beziehung zwischen einem Ausgang und einer Reihe von Prädiktorvariablen
    • Vektorautoregressives Modell zum Analysieren von Daten multivariater Zeitserien, einschließlich exogener Prädiktoren
  • MATLAB Production Server
    • Webbasiertes Servermanagement-Dashboard für die IT-Konfiguration und -Steuerung
  • Neural Network Toolbox
    • Deep-Learning-Algorithmen zum Trainieren von neuronalen Faltungsnetzwerken (CNNs) für Regressionsaufgaben mit mehreren GPUs auf PCs, auf Clustern und in der Cloud
    • Deep-Learning-Visualisierung für die von einem CNN-Modell erlernten Funktionen mithilfe von Bildoptimierung
    • Funktionen zur Übertragung von Gewichtungen von vortrainierten CNN-Modellen (AlexNet, VGG-16 und VGG-19) und Modellen von Caffe Model Zoo
  • Statistics and Machine Learning Toolbox
    • Regression-Learner-App zum Trainieren von Regressionsmodellen mit überwachtem maschinellem Lernen
    • Tall-Array-Algorithmen für Support Vector Machine (SVM) und naive Bayes-Klassifikation, Entscheidungsbäume mit Bagging sowie Lasso-Regression
  • Computer Vision System Toolbox
    • Deep Learning zur Erkennung von Objekten mit Fast R-CNN und Faster R-CNN
  • Automated Driving System Toolbox
    • Neues Produkt für den Entwurf, die Simulation und das Testen von fortgeschrittenen Fahrerassistenzsystemen (ADAS) und automatisierten Fahrsystemen

Updates der Simulink-Produktfamilie:

  • Simulink
    • Simulink-Projektupgrade für die leichte Aktualisierung aller Dateien in einem Projekt auf das aktuelle Release
    • parsim-Befehl für die direkte Ausführung mehrerer paralleler Simulationen
    • Streaming für umfangreiche Eingangssignale von MAT-Dateien, ohne dass die Daten in den Arbeitsspeicher geladen werden
    • Reduzierte Busverdrahtung zur schnellen Gruppierung von Signalen in Busse und zur automatischen Erstellung von Buselement-Ports, um weniger Signalleitungen zwischen und innerhalb von Subsystemen zu benötigen
    • Automatische Port-Erstellung zum Hinzufügen eingehender und ausgehender Ports zu Blöcken beim Routing von Signalen
  • Simscape Multibody
    • Laufzeitparameter für die Beschleunigung von Simulationsaufgaben und für das Verändern von Komponenten-Parameterwerten ohne erneute Generierung des C-Codes
    • Onshape-CAD-Import zur Verwendung cloudbasierter CAD-Baugruppen in der Mehrkörpersimulation

Zu den Signalverarbeitungs- und Kommunikations-Updates gehören:

  • Antenna Toolbox
    • Antenna Designer-App für die interaktive Auswahl und Analyse von Antennen mit den gewünschten Eigenschaften
  • Communications System Toolbox
    • Modellierung und Simulation für räumlich definierte MIMO-Kanäle in Mehrweg- und Streuungs-Übertragungsszenarien
  • LTE System Toolbox
    • MATLAB-Funktionen zum Simulieren von neuen 3GPP 5G-Mobilfunk-Technologien
    • Sidelink-Empfangsfunktionalität für die Simulation direkter Kommunikation über LTE-A ProSe auf Link-Ebene für Anwendungen in der öffentlichen Sicherheit und der Fahrzeugkommunikation
  • WLAN System Toolbox
    • Unterstützung der Generierung von Wellenformen gemäß IEEE 802.11ad

Zu den Codegenerierungs-Updates gehören:

  • Embedded Coder
    • Release-unabhängige Code-Integration zur Wiederverwendung von generiertem Modell-Referenzcode aus früheren Releases
  • Simulink Coder
    • Unterstützung von dynamisch zugewiesenem Arbeitsspeicher für die Simulation von MATLAB-Funktionsblöcken und die Codegenerierung
  • HDL Coder
    • Generierung von HDL-Code aus Gleitkommaoperationen mit einfacher Genauigkeit nach IEEE-Standard
  • HDL Verifier
    • Unterstützung der Abtastung und Erfassung interner FPGA-Signale zur Analyse in MATLAB oder Simulink

Zu den Verifikations- und Validierungs-Updates gehören:

  • Polyspace Bug Finder
    • Codeüberprüfung für MISRA C:2012 Amendment 1 und neue Kryptografie-Routinen
  • Simulink Verification and Validation
    • Verbesserungen bei der Klon-Erkennung für die Refaktorierung wiederholter Bibliotheksmuster und Subsystem-Klone
    • Unterstützung von DOORS Next Generation für die Verknüpfung von Modellelementen mit Anforderungen und die entsprechende Nachverfolgung in DOORS Next Generation
  • Simulink Design Verifier
    • Virtualisierung der Auswirkungen des Timings von Zustandsaktivitäten auf die Slicer-Hervorhebung für Simulationen
  • Simulink Code Inspector
    • Unterstützung von Schleifen- und Zyklus-Operationen in MATLAB, Simulink und Stateflow

R2017a ist ab sofort weltweit erhältlich. Weitere Informationen siehe R2017a Highlights.

Folgen Sie @MATLAB auf Twitter, um mitzuverfolgen, was bei R2017a neu ist, oder klicken Sie auf der MATLAB Facebook-Seite auf „Gefällt mir”.

.