Schulabbrecher erklärt Geheimwissenschaft „Machine Learning“. Geht das?

Früher habe ja ich den Physikunterricht geradezu geliebt. Um ihn zu sabotieren. Der Lehrer machte mit uns physikalische Versuche, und oft musste dann zum Beispiel die Zeit gestoppt werden. Das war meine Rolle. Und ich habe die Zeit immer absichtlich falsch genommen. Physiklehrer: mit den Nerven am Ende. Versuch: missglückt. Man sollte nicht stolz darauf sein.

Analytische Geometrie ist mein Untergang.

Kai Schmidhuber, Schüler wider Willen

Noch weniger stolz bin ich allerdings auf meine mathematischen Fähigkeiten. In der Oberstufe habe ich, anstatt die Klausuraufgaben zu lösen, lieber mal einen Aufsatz verfasst – Titel: „Analytische Geometrie ist mein Untergang“. Ausgerechnet der Matheunterricht soll mir heute dabei helfen, Ihnen das Thema „Machine Learning“ näherzubringen.

Jetzt kommt Ihre Doppelstunde „Machine Learning“ – easy!

Also, versetzen Sie sich in alte Zeiten: Holzbank, kippelnder Stuhl, abgelatschter Linoleumboden und der Geruch von feuchten Klamotten nach einer geheimen Raucherpause im Regen hinter der Turnhalle. Ich sehe: Sie haben bereits diesen beseelt-angewiderten Blick. 

Also, los geht’s:

 Beginnen wir mit einer einfachen Erklärung des maschinellen Lernens am Beispiel Mathematikunterricht: Der Lehrer gibt irgendeine Aufgabenstellung vor, die es rechnerisch und logisch zu lösen gilt, und natürlich kommen dann später auch die richtigen Antworten von ihm. So weit, so normal. 



Merke:


  • Die Aufgabenstellung nennt man im Machine-Learning-Kosmos das „Übungsproblem“.
  • Unterschiedliche Übungsprobleme zeichnen sich durch unterschiedliche „Eingabedaten“ aus.

Jetzt nehmen wir einmal meinen persönlichen Worst Case an: Doppelstunde Mathe. Lehrer krank, stattdessen ein topmotivierter Referendar am Start. Und der ballert die Schüler jetzt mit ganz, ganz, ganz vielen Übungsproblemen zu. Und liefert ganz, ganz viele Antworten. Zunächst große Verwirrung: „Was will der Typ?!“ Ganz einfach – der Referendar verlangt von den Schülern, Methoden zur Lösung der Übungsprobleme zu finden, indem sie Muster im Vergleich zwischen den Informationen innerhalb der Probleme und den zugehörigen Antworten erkennen. Denn jedes Übungsproblem kodiert Informationen, die ein Schüler erfassen und sich so eine Antwort zusammenreimen kann. Indem er also die Übungsprobleme miteinander vergleicht, leitet der Schüler aus Gemeinsamkeiten und weiteren Elementen die Antworten ab.

 

Also:

  • Der Referendar ist der „Data Scientist“.
  • Der Schüler ist der „Machine-Learning-Algorithmus“
  • Antworten auf Übungsprobleme werden auch „Labels“ genannt.
  • Den Lernprozess können wir als „Training eines Algorithmus“ bezeichnen.



Nach Hunderten von Übungsproblemen erwartet der radebrechende Referendar, dass unser exemplarischer Schüler nun in der Lage ist, eine Art Muster zu finden, das er nutzen kann, um das Problem zu lösen. Also testet er den Schüler, beauftragt ihn mit der Prüfung von neuen Fragen und vergleicht die generierten Antworten mit den tatsächlichen Antworten.  Er stellt den Algorithmus damit auf die Probe.  

Die große Auflösung. Ist der Algorithmus genau?



Wenn der Schüler (=Algorithmus) jetzt, wie ich damals, einen emotionalen Aufsatz über sein mathematisches Unvermögen schreibt, haben wir zwar eine Weltsensation – aber der Referendar sein Ziel verfehlt. Denn die Bewertung seiner Genauigkeit gibt ihm ein Maß für die Effektivität sowohl des Schülers als auch der Menge der Übungsprobleme, die ihm gegeben wurden.

 Wir wissen aber auch, dass einzelne Schüler zu unterschiedlichen Lernstilen neigen. 

Ganz ähnlich versucht auch jeder maschinelle Lernalgorithmus auf seine eigene Art und Weise, Muster innerhalb der Eingabedaten zu finden. Diese unterschiedlichen Stile machen Schüler in verschiedenen Fächern individuell besonders kompetent, ebenso wie einige ML-Algorithmen nützlicher und robuster für bestimmte Datentypen sind als andere.

Tja, und das ist erst mal alles, was es über das Thema „Machine Learning“ zu wissen gibt – im Prinzip keine Geheimwissenschaft. Und auch nicht unfassbar schwer. Viel schwerer ist es da schon, die richtigen Übungsprobleme zu finden und deren notwendige Daten. Und dann gemeinsam mit der Fachseite, dem Business, aus einer Idee für einen Algorithmus auch ein funktionierendes Produkt zu entwickeln. 



Die Moral von der Geschicht’: 

Algorithmen sind nichts anderes als schlaue Eliteschüler. 

Kein Eliteschüler

Und ich schreibe weiter Aufsätze. 

So wie den hier.

(Zur Info: Ja, ich habe tatsächlich kein Abitur und die Schule in der dreizehnten Klasse abgebrochen. Ich musste mich um mein Startup kümmern. Erschien mir logisch)