Ein künstliches Neuron ist eine Funktion, die $n$ Eingabewerte $x_1, x_2, \ldots, x_n$ entgegennimmt und einen Ausgabewert liefert. Die genaue Funktion des Neurons wird bestimmt durch folgende Konstanten:
Der Ausgangswert des Neurons berechnet sich (bspw. mit Heaviside als Aktivierungsfunktion) folgendermaßen: $$H(x_1\cdot w_1 + x_2\cdot w_2 + \ldots + x_n\cdot w_n - \Theta)$$
Die am häufigsten verwendeten Aktivierungsfunktionen sind:
Hier eine überblicksartige graphische Darstellung eines künstlichen Neurons:
Für Interessierte: Warum ist das künstliche Neuron so definiert?
Ausgewählte Eichen und Pappeln wurden vor dem Fällen vermessen und nach dem Fällen gewogen. Je Baum wurde ein Punkt ins rechts dargestellte Koordinatensystem gezeichnet.
Konstruieren Sie ein künstliches Neuron, das die Baumhöhe in m und die Masse in t als Eingabwerte entgegennimmt und eine 1 ausgibt, falls es sich um eine Eiche handelt und ein 0, falls es sich um eine Pappel handelt.
Wir zeichnen eine Grade ein, die die grünen und Roten Punktmengen möglichst gut voneinander trennt ("Trennlinie"). Sie geht durch die Punkte (2/0) und (8/0,5), kann also durch die Gleichung $$x_2 = x_1 \cdot \frac{1}{12} - \frac{1}{6}\ \ \ (I)$$ beschrieben werden.
Multipliziert man beide Seiten der Gleichung mit 6 und bringt man alle Summanden auf die linke Seite, so erhält man:
$$-0,5 \cdot x_1 + 6\cdot x_2 + 1 = 0\ \ \ (II)$$
Verwendet man für das Neuron die Heaviside-Funktion und als Parameter
$$w_1 = -0,5,\ w_2 = 6,\ \theta = -1$$
so liefert das Neuron den Wert 1, falls
$$w_1 \cdot x_1 + w_2\cdot x_2 - \theta \ge 0\ \ \ (III)$$
(d.h. wenn der Wert "oberhalb" der Trennlinie liegt) und den Wert 0, falls
$$w_1 \cdot x_1 + w_2\cdot x_2 - \theta < 0\ \ \ (IV)$$
(d.h. wenn der Wert "unterhalb" der Trennlinie liegt).
Ein mögliches Neuron, das die Punktmengen der Testdaten gut trennt, ist also:
Die Steigung $m$ der Gerade erhält man als $m = \frac{\Delta x_2}{\Delta x_1} = \frac{0,5 - 0}{8 - 2} = \frac{0,5}{6} = \frac{1}{12}$. Setzt man diese in die Geradengleichung $x_2 = m \cdot x_1 + t$ ein, so erhält man $$x_2 = \frac{1}{12}\cdot x_1 + t$$ Da der Punkt (2/0) auf der Geraden liegt, muss gelten $$0 = \frac{1}{12}\cdot 2 + t$$ Damit erhält man $t = -\frac{1}{6}$ und so die Geradengleichung $$x_2 = x_1 \cdot \frac{1}{12} - \frac{1}{6}$$
Bei den angegebenen Parametern $$w_1 = -0,5,\ w_2 = 6,\ \theta = -1$$ und unter Verwendung der Heaviside-Funktion gibt das Neuron 1 aus, falls $$-0,5 \cdot x_1 + 6\cdot x_2 + 1 \ge 0$$ Wir wissen, dass für alle Punkte auf der Trennlinie gilt $$-0,5 \cdot x_1 + 6\cdot x_2 + 1 = 0$$ Am positiven Faktor 6 vor $x_2$ sehen wir, dass der Wert des Terms auf der linken Seite steigt, falls bei gleichbleibendem $x_1$ der Wert von $x_2$ erhöht wird, das heißt, wenn wir uns im Koordinatensystem nach "oben" bewegen. Für die Eichen, das sind die Punkte auf der Trennlinie und oberhalb, gilt daher $$-0,5 \cdot x_1 + 6\cdot x_2 + 1 \ge 0$$ und damit liefert das Neuron für sie den Wert 1.
Wir hatten natürlich Glück, dass es genau so passt. Falls die Pappeln auf der Halbebene oberhalb der Trennlinie liegen würden, würden wir Gleichung (II) einfach mit -1 durchmultiplizieren. Das würde dann bewirken, dass das Neuron für die Punkte auf- und unterhalb der Trennlinie den Wert 1 ausgibt. Natürlich hätte das Neuron damit die Parameter $$w_1 = 0,5,\ w_2 = -6,\ \theta = 1$$
Ein Ernteroboter soll reife Äpfel direkt von den Bäumen ernten. Er besitzt dazu eine Kamera und einen Abstandssensor, womit er den Rotanteil und den Durchmesser von Äpfel bestimmen kann. Im Graphen unten sind Testdaten für reife und unreife Äpfel dargestellt.
Konstruieren Sie anhand der Testdaten ein künstliches Neuron, das reife von unreifen Äpfeln möglichst gut unterscheiden kann. Verwenden Sie als Aktivierungsfunktion die Heaviside-Funktion.
Ein Automat, der durch ein künstliches Neuron gesteuert wird, vermisst neu hergestellte Schrauben um zu entscheiden, welche den Spezifikationen genügen ("gut") und welche aussortiert werden sollen ("Ausschuss"). Um die KI zu trainieren, werden die ersten ca. 40 Schrauben anhand der Messungen des Automaten von einem Facharbeiter als "gut" oder "Ausschuss" getagged, siehe den Graphen unten. Nun sollen die Parameter des Neurons so angepasst werden, dass es weitere Schrauben korrekt klassifiziert.
Bei vielen Problemstellungen kann man - wie in der obigen Aufgabe - keine Gerade finden, die die unterschiedlichen Punkteklassen sauber trennen kann. Man sagt, diese Probleme sind nicht linear separierbar.