Skip to main content

Modul: Computer Vision mit Deep Learning

Die automatische Interpretation von Bild & Video-Daten hat viele Anwendungsgebiete und liefert dank Deep Learning beeindruckende Ergebnisse.

Computer Vision ist ein Teilgebiet von AI, in welchem der Computer Videos & Bilder „sehen“ und interpretieren kann. Es gibt bereits heute viele Anwendungsfälle dafür; hier ein paar Beispiele:

  • Bereits heute können Computer Personen dank der Gesichtserkennung zuverlässig identifizieren.
  • Bilddiagnosen unterstützen in der Medizin Ärzte bei der Erkennung von Krebs.
  • Anhand von Bild und Video-Daten können defekte Produktionsteile erkannt werden.
  • In Amazon Go Shops gehören Kassen und Warteschlangen der Vergangenheit an. Es wird unter anderem mit Hilfe von Computer Vision automatisch erkannt, welche Person welche Produkte einpackt oder wieder zurückstellt. Nachdem alle benötigten Produkte in der Tasche sind, wird der Laden verlassen und der Einkauf über das Amazon Konto abgerechnet.
  • Die Autoindustrie beschäftigt sich stark mit Computer Vision mit dem Ziel, Objekte wie Personen, Schilder oder Verkehrssignale auf der Strasse zu erkennen (Personen, Schilder, Verkehrssignale usw.), um die Sicherheit zu maximieren oder ferner selbstfahrende Autos zu ermöglichen.

Die Fortschritte in diesem Gebiet sind dank Deep Learning höchst beeindruckend, da diese Modelle in gewissen Anwendungsfälle zutreffendere Resultate als der Mensch liefern. Die beeindruckende Performance, zukünftige technologische Entwicklungen und das breite Anwendungsgebiet führen in Zukunft noch zu einigen Meilensteinen. Schon heute können mit Deep Learning Objekte auf Videos in Real-Time erkennen.

Modulübersicht

In diesem Modul werden Ihnen einführend Computer Vision und Convolutional Neuronal Networks (CNNs) Grundlagen vermittelt und darauf fokussiert, wie Bilddaten mit Hilfe CNNs interpretiert werden. Im Anschluss beschäftigen Sie sich mit dem Anwendungsfall „Image Classification“ (binär und Multiclass), bei welchem Bilder in Kategorien eingeteilt werden (z.B. Hund oder Katz, defektes oder nicht defektes Bauteil, erkennen von Blumenarten / Hunderassen usw.). Sie erlernen, wie die fürs Training verwendeten Bilddaten vorbereitet werden müssen, wie ein Modell trainiert und evaluiert wird. Zudem werden Techniken wie Regularisierung, Image Augmentation oder Hyperparameter Tuning angewendet, um das Modell zu verbessern.

Neben dem Trainieren eines komplett neuen Modells wird auch vermittelt, wie ein bereits trainiertes Modell auf einen neuen Anwendungsfall angewendet werden kann (Transfer Learning), da es inzwischen viele frei verfügbare vortrainierte Modelle gibt. Abgeschlossen wird dieses Modul mit den Grundlagen zu „Object Detection“, so dass nicht nur komplette Bilder klassifiziert, sondern auch einzelne Teile darauf erkannt werden können.

Weitere Informationen

Diese Seite teilen: