Entdecken Sie, wie selbstüberwachtes Lernen unbeschriftete Daten für effizientes Training nutzt und damit die KI in den Bereichen Computer Vision, NLP und anderen Bereichen verändert.
Selbstüberwachtes Lernen (Self-Supervised Learning, SSL) ist ein Ansatz des maschinellen Lernens (ML), der es Modellen ermöglicht, aus großen Mengen unmarkierter Daten zu lernen. Im Gegensatz zum überwachten Lernen, das stark von sorgfältig gekennzeichneten Daten abhängt, erzeugt SSL auf geniale Weise seine eigenen Überwachungssignale direkt aus den Eingabedaten selbst. Dies macht es besonders wertvoll in Bereichen wie Computer Vision (CV) und Natural Language Processing (NLP), wo unmarkierte Daten im Überfluss vorhanden sind, aber die Kosten und der Aufwand für die manuelle Markierung(Datenannotation) unerschwinglich sein können.
Der Kernmechanismus von SSL besteht darin, eine "Vorwandaufgabe" zu entwerfen. Dabei handelt es sich um eine zusätzliche, selbst erstellte Aufgabe, bei der das Modell bestimmte Eigenschaften der Daten vorhersagen muss, die absichtlich verborgen oder verändert wurden. Durch das Lösen dieser Vorwandaufgabe ist das Modell gezwungen, sinnvolle zugrundeliegende Strukturen und Darstellungen(Einbettungen) der Daten zu lernen, ohne dass der Mensch diese kennzeichnet. Diese erste Trainingsphase wird gemeinhin als Pre-Training bezeichnet.
Im Bereich des Computersehens könnte eine Vorwandaufgabe zum Beispiel darin bestehen:
Im NLP ist eine bekannte Vorwandaufgabe die maskierte Sprachmodellierung, die bekanntlich von Modellen wie BERT verwendet wird. Hier lernt das Modell, Wörter vorherzusagen, die zufällig in Sätzen maskiert (versteckt) wurden.
Nach dem Vortraining auf großen, nicht beschrifteten Datensätzen erfasst das Modell umfangreiche Merkmalsrepräsentationen. Dieses vortrainierte Modell kann dann für spezifische nachgelagerte Aufgaben - wie Objekterkennung, Bildklassifizierung oder Stimmungsanalyse - durcheinen Prozess namens Feinabstimmung angepasst werden. Für die Feinabstimmung ist in der Regel eine viel geringere Menge an markierten Daten erforderlich als für das Training eines Modells von Grund auf, was SSL zu einer wichtigen Voraussetzung für effektives Transferlernen macht.
Es ist entscheidend, SSL von verwandten ML-Paradigmen zu unterscheiden:
SSL verfügt über weitreichende Fähigkeiten im Bereich der künstlichen Intelligenz (KI):
SSL reduziert die Abhängigkeit von teuren markierten Datensätzen erheblich und demokratisiert die Entwicklung leistungsstarker KI-Modelle. Tools wie PyTorch und TensorFlow sowie Plattformen wie Ultralytics HUB bieten Umgebungen zur Nutzung von SSL-Techniken für die Entwicklung und den Einsatz innovativer KI-Lösungen.