|
||||||||||||||||||||||||||||||||||||
| ISBN: 3423341203 ISBN: 3423341203 ISBN: 3423341203 ISBN: 3423341203 | ||||||||||||||||||||||||||||||||||||
|
|
Wir empfehlen: | |||||||||||||||||||||||||||||||||||
|
Höhere Stufen visueller Verarbeitung Ein Modell der Texturerkennung Die Verarbeitung räumlicher Tiefe
Höhere Stufen visueller VerarbeitungObjektgröße und AnzahlDas beim Abziehbildsignalfluss zusammengeflossene Signal wird an eine neue Ebene weitergegeben, weil es in seiner Stärke und seinem Ort nicht vorausgesagt werden konnte. Der Leser wird sich sicher noch an die Grafik dazu erinnern. Die Signale fließen in der Objektmitte zusammen. Dieser Zusammenfluss wird natürlich umso schneller erfolgen, je kleiner ein Objekt ist, denn dann muss weniger Weg zurückgelegt werden. Ein kleineres Objekt fließt schneller auf einen Punkt zusammen, und sein Fließsignal hält daher kürzer an. Außerdem erscheint das Fließsignal früher. Stellen wir uns nun vor, die Zellen der Ebene an die die Fließsignale ergehen, reagieren auf Signallängen. Durch Adaption haben sie sich so eingestellt, dass sie auf Objekte mittlerer Größe auch mittelmäßig ansprechen. Auf kleine weniger, auf große mehr. (Voraussagefehler gibt es, was die erwartete Signallänge betrifft wahrscheinlich kaum, da alle möglichen Signallängen gleichermaßen häufig auftreten werden.) Signale gleicher Intensität können zueinander eine gute Verbindung aufbauen, und über diese Verbindung abfließen. So können viele gleich große Elemente zusammenfließen. Ihr Gesamtsignal ergibt dann ein Muster, eine Textur. Es handelt sich um ein intensiveres Gesamtsignal, wenn die Elemente groß sind, denn dann senden die Zellen, welche auf Größe reagieren, stärker, und deren Antizellen senden weniger. Wenn die Elemente über eine Fläche verteilt sind, so haben sie nicht alle den gleichen Abstand zu einem Punkt, und können nur nacheinander eintreffen. Dann hält das Signal länger an. So kann die Größe der Form erkannt werden, mit der die Textur gefüllt ist. Texturen mit unterschiedlich großen Objekten und unterschiedlicher Anzahl an Objekten können unserem Modell zufolge leicht unterschieden werden. Aber können sie das auch in Wirklichkeit? An welchen Eigenschaften unterscheiden wir Texturen, und an welchen nicht? Was ist Textur, was Form?Nachdem wir nun über Zellen verfügen, die unterschiedlich auf Konturrichtungen reagieren, und andere, die Objektgrößen erkennen, soll eine Erklärung auf selbstlernender Basis für die Texturabgrenzung gefunden werden. Das Thema Texturerkennung ist deshalb so schön zu behandeln, weil hier sehr viel durch Beobachtungsbeispiele belegt werden kann. Was unterscheidet Textur- und Formerkennung? Texturen können flächendeckend gleichzeitig (parallel) abgegrenzt werden, während eine exaktere Formerkennung nur mehr durch fokussierte Aufmerksamkeit und serielle Verarbeitung geleistet werden kann. Das bedeutet, wir können immer nur eine Form zu einem Zeitpunkt bewusst betrachten (wobei wir natürlich unsere Aufmerksamkeit sehr schnell von Objekt zu Objekt springen lassen können, aber eben nur nacheinander). So sehen wir im folgenden Bild immer nur entweder die Vase oder die Gesichter, aber nie beides gleichzeitig. Das ist ein Phänomen seriellen Denkens.
Anders als in diesem Beispiel können die Elemente einer Textur alle gleichzeitig flächendeckend erfasst werden. Texturen werden, also großteils parallel verarbeitet. Wiederholtes kann als ein Stück gedacht werden, es wird zu einem Chunk verbunden. Das ist ein Prozess, den wir bereits kennen, allerdings sprachen wir bisher meist von zeitlichen, nicht von räumlichen Wiederholungen. Der Übergang von paralleler zu serieller Verarbeitung ist also gleichzusetzen mit dem Übergang von den unbewussten Vorstufen der Auswertung von Seheindrücken zu bewusstem Erkennen. Das macht diesen Übergang so interessant. Die Idee diesen mit Hilfe von Texturbeispielen zu erforschen habe ich mir von Bela Julez abgeschaut (Julez 1987, S.48 Link). Die Beispiele der folgenden Seiten, und die daraus folgenden Schlussfolgerungen stammen aber aus eigener Forschungstätigkeit. Struktur- und TexturbeispieleWas das Gehirn noch parallel zu verarbeiten mag, und was nicht mehr, ist durch die Betrachtung ähnlich strukturierter Flächen erforschbar. Ich will dazu zunächst eine Vielzahl an Beispielen bringen, um dem Leser eine Vorstellung von Strukturdifferenzierung zu geben, bevor ich beschreibe, warum ich glaube, dass das in dieser Arbeit vorgestellte Gehirnmodell zu einer analogen Unterscheidungsfähigkeit führen sollte. Wieso ist diese Thema eigentlich so interessant? Ganz einfach: Es gibt unterschiedliche Texturen, die wir nicht voneinander unterscheiden können, zumindest nicht sofort, bei seriellem Abtasten gelingt uns dies doch. Nun ist serielles Sehen immer mit Aufmerksamkeit und Bewußtsein verbunden. Diese Texturbeispiele weisen also Unterschiede auf, die erst durch serielles Sehen, also erst nach der Zeitcodierung der visuellen Information verarbeitet werden können. Gelingt hingegen eine Texturabgrenzung sofort flächendeckend, so bedarf dies keiner bewussten gerichteten Aufmerksamkeit. Gängige neuronale Netze besitzen keine Zeitcodierung und werden daher die seriellen Denkprozesse der Aufmerksamkeit, die mit Bewusstsein einhergehen, nie erklären können. Das Redundanzkettenfließnetz bietet demgegenüber einen Erklärungsansatz. Die meisten Strukturen können auf Anhieb flächendeckend unterschieden werden. Wir erkennen die Kontur eines quergestreiften Quadrates auf längsgestreiftem Grund sofort. Sicher ist, dass Texturen unterschieden werden, wenn sie unterschiedlich große Flächen beinhalten, wenn sie sich durchschnittlich in der Farbe unterscheiden, oder wenn sie verschieden große Anteile an Konturrichtungen enthalten. Das alles sind statistisch leicht erfassbare Daten. Die folgenden zwei zusammengefügten Texturen unterscheiden sich aber in keinem dieser Punkte und deren Unterschied ist trotzdem sofort erkennbar, und zwar an der Richtung der Anordnung der Balken in der jeweiligen Textur. Es zählt also auch wie die Elemente zueinander positioniert sind. Erfasst wird dabei ein Streif. (Wenn sie das Dokument digital im Word-Format betrachten, gehen sie auf Ansicht 100%)
Ist der Steif in beiden Texturen gleich, so ist keine augenblickliche Unterscheidung der Texturbereiche mehr möglich, wie sich dies hier zeigt:
Und auch die nächstfolgende Textur, die ein abstrahiertes Gewebe in Schrägansicht darstellt, dessen Kett und Schussfäden unterschiedlich gedreht sind, kann von der Textur rundum, deren Kett und Schussfäden andersrum gedreht sind, bei starrem Blick nicht unterschieden werden, weil kein unterschiedlicher Streif vorliegt.
Oben sind die Überkreuzungsstellen der Fäden durchsichtig dargestellt. Die folgende Abbildung zeigt ein richtiges Gewebe. Allerdings lässt sich ein solches Muster nicht so schön mit seinem Spiegelbild verbinden, so dass der Strukturwechsel an der Kontur auffallen würde. Deshalb sind im folgenden Bild mehrere Versionen der Textur dargestellt, wobei sich eine unterscheidet. Die Muster sollten mit starrem (nicht wanderndem Auge) betrachtet werden. Würde die Strukturdifferenzierung des Gehins ansprechen, so sollte die abweichende Version sofort herausstechen. Das tut sie aber nicht.
Verbreitern wir aber die Kettfäden, so enthalten die Texturen eine unterschiedliche Menge an horizontalen und vertikalen Linien pro Flächeneinheit. Jetzt ist auch mit starrem Auge (nicht serielle Betrachtung) eine Unterscheidung möglich. Der Grund für die Unterscheidbarkeit liegt in der relativ ungleichen Menge an horizontalen und vertikalen Linien pro Flächeneinheit, die das Gehirn zu erfassen vermag. In den Texturen sprechen unterschiedlich viele Richtungszellen eines Typs an.
Wenn wir die Kett und Schussfäden unterschiedlich färben, und deren Farbe im Untergrund austauschen, ist interessanterweise ebenfalls keine sofortige Unterscheidung möglich. Das bedeutet, dass die Richtungsverarbeitung sich allgemein auf Konturen bezieht, die Farbgrenzen jedoch nicht getrennt nach Richtung verarbeitet werden. Dies konnten wir bereits aus neurophysiologischer Sicht, und durch das Gehirnmodell erklären. Es entstehen auf der selben Stufe der Verschaltungshierarchie sowohl die Balkenzellen als auch die Gegenfarbenzellen. Da Platzmangel aufkommt, drängeln sich die Gegenfarbenzellen zu Blobs zusammen. Damit ist die räumliche Exaktheit der Anordnung nicht mehr gegeben, die nötig wäre, um Farbgrenzen nachher auch noch auf ihre Richtung hin auszuwerten. Deshalb sehen wir in diesen Texturen keinen Unterschied, obwohl die Farbgrenzen sich deutlich in ihrer Richtung unterscheiden.
Das nächste Muster stellt eine Ableitung der hier dargestellten dar. Es enthält wieder Farbbalken in zwei Richtungen, die in der umgebenden Textur ausgetauscht wurden. Und auch hier ist keine sofortige Texturbereichsabgrenzung möglich.
Anders jedoch wenn sich die Balken in der Helligkeit unterscheiden. Dann hebt sich der dunklere Balken besser vom Untergrund ab als der helle. Seine stärker hervortretenden Konturen geben der Textur eine Richtung. In der umgebenden Textur tritt jedoch nun die andere Richtung hervor. Spontane Texturbereichsabgrenzung ist damit möglich. Das gleiche gilt für das folgende Graustufenbild des Gewebemusters. Unterscheiden sich Kett und Schussfäden nämlich in der Helligkeit, so erhält das Muster einen dominierenden Streifen, der im unteren Muster anders verläuft. Nun ist eine spontane Texturunterscheidung möglich.
Was aber, wenn keine Richtung in der Textur dominierend ist, weil der Untergrund grau, die Balken schwarz und weiß sind, und sich so beide Richtungen gleich gut vom Untergrund abheben? Die folgenden zwei Muster beweisen, dass die Texturunterscheidbarkeit dann wieder abnimmt.
Die Erklärung hierfür liefern die Konturbilder der Grafiken. Die Konturintensität dieses Musters lässt keine Unterscheidung zu, die des vor-vorhergehenden schon. Hier also das Ergebnis eines Konturfilters. Wir sehen, die Texturen werden identisch: Der Leser wird sich nun fragen, warum ich bei den vorhergehenden Texturbeispielen einige schräggestellt habe. Der Grund ist einfach. Die Balken waren dadurch in diagonalen Richtungen angeordnet. Im allgemeinen meide ich die vertikale Richtung in Texturabgrenzungsbeispielen, weil sie für den Menschen eine besondere Bedeutung hat. Er braucht sie, um über optische Reize das Gleichgewicht halten zu können. Es darf angenommen werden, dass der Mensch diese Richtung sensibler wahrnimmt. Dadurch können sich Texturunterscheidungen ergeben, weil gleich starke Konturreize der Abbildung nun nicht mehr gleich stark wirken. Die geradegedrehten Texturen zeigen diesen Effekt. Nun ist auch in den ersten beiden Bildern eine leichte Texturabgrenzung möglich:
Worum es bei diesen vielen Studien letztlich geht, ist der Unterschied in der Verarbeitung von Formen und Texturen. Dieser wird besonders bei folgendem Beispiel deutlich:
Obwohl die Dreiecke eines der Strukturfelder für die Formerkennung deutlich gespiegelt sind, ist dies nur durch serielles, nacheinander Betrachten der Felder, ersichtlich. Natürlich lässt sich einwenden, dass die mangelnde Unterscheidbarkeit noch nichts mit mangelnder Formerkennung zu tun habe, denn die Form des Dreiecks war ja gleich, nur dessen Ausrichtung wurde verändert.
Die einfachste Form ist die Linie und deren Länge, die zweiteinfachste Form ist ein Winkel aus zwei Linien. Die folgenden Bildbeispiele zeigen, dass die Texturverarbeitung weder Linienlängen noch Winkelgrößen zu erfassen vermag. Differenziert können Linien-Streumuster jedoch dann werden, wenn sie eine deutlich unterschiedliche Zahl an Linienenden oder an Linienrichtungen aufweisen. Beides erfordert eine, nur auf wenige Bildpunkte begrenzte Merkmalserfassung, während Winkelgrößen und Linienlängen eine großflächigere Auswertung benötigen würden.
Kehren wir mit dem inzwischen erworbenen Wissen nun noch einmal zurück zur anfangs gezeigten Abbildung, bei der sich eine gute Texturunterscheidung ergab, weil die Texturgrenzen einen Streif ergaben:
Genauer betrachtet besteht dieses Muster ja aus ineinandergestapelten Zickzacklinien. Erhöhen wir den Abstand dieser Stapel, so ist das Muster plötzlich in die andere Richtung gestreift. Wieder ist eine klare Unterscheidung zum gegengleich gestreiften Untergrund möglich.
Was aber, wenn der Abstand der Zickzacklinien so gewählt ist, dass sich Quer und Längsstreif die Wage halten? Es zeigt sich, dass die Texturfelder dann kaum mehr unterscheidbar sind, solange man das Bild ruhig fixiert. Ich habe in der folgenden Grafik, die dies zeigt, aber wieder die Darstellung mit den vier Feldern gewählt, da sonst die Unruhe an der Grenze des Texturwechsels eine Texturabgrenzung ermöglicht, wie dies das bunte Exemplar daneben verdeutlicht. Der Schluss, den man aus diesem Ergebnis ziehen kann ist, dass neben der statistischen Mengenerfassung von Farbwerten, Konturausrichtung und Menge, sowie Flächengrößen der Elemente in der Texturverarbeitung vor allem auch noch eine Anordnungsrichtung erfasst wird. Das heißt es wird erfasst ob ein Streif vorliegt, und ob die Elemente in dieser Richtung regelmäßig oder unregelmäßigen Abständen angeordnet sind.
Auch in den folgenden beiden Bildern, wo den Zickzacklinien durch runde Ecken ihre Richtungsdominanz genommen wurde, ist (bis auf kleine Störungen an Konturbereichen) keine klare Unterscheidung von Figur und Grund zu erkennen. Die Zentren der Halbkreise, aus denen das Muster zusammengesetzt ist, sind in Figur und Grundmuster gleich verteilt. Deshalb kann kein klarer Streif entstehen. Da ein Halbkreis alle Linienrichtungen enthält, ist auch in beiden Texturabwandlungen gleich viel Linienlänge jeder Ausrichtung vorhanden.
Die Unterscheidbarkeit des Zickzack spiegelverkehrter Ausrichtung lässt sich auch durch irritierende Elemente schnell zunichte machen. Im folgenden Bild wirken die Texturbereiche daher gleich.
Nun ergibt sich die Frage, ob Strukturdifferenzierung möglich ist, wenn Strukturen mehrere verschiedene Richtungen enthalten, aber sich in der dominanten Richtung gleichen. Die folgende Struktur enthält zum Beispiel einen dominanten vertikalen Streif, der sich auch bei ihrer Spiegelung nicht ändert. Verändert haben sich jedoch die weniger dominanten schrägen Streifen. Es zeigt sich dass, solange man die Textur ruhig fixiert und sich auf den vertikalen Streif konzentriert, keine ordentliche Texturdifferenzierung möglich ist. Das legt nahe, dass das Gehirn wirklich nur eine Streifrichtung zu einem Zeitpunkt zu erfassen vermag.
Sobald man das Auge in schräger Richtung darübergleiten lässt, tritt aber Texturdifferenzierung ein. Dies kann daraus erklärt werden, dass durch die Bewegungsrichtung bestimmte Konturen stärker verschwimmen als andere. Es entsteht eventuell ein ähnlicher Effekt wie in der folgenden verwischten Version des Musters. Strukturdifferenzierung wird dadurch möglich.
Eine weiteres Phänomen betrifft die Erfassung von Anordnungen und die Auflösungsgrenzen des Auges. Die folgenden drei Texturen mit den Dreiecken sind je nach Entfernung (und damit variierender Größe auf der Netzhaut) unterschiedlich gut zu unterscheiden. Struktur 1 und 2 ist von der Nähe, 2 und 3 hingegen von der Entfernung gut zu unterscheiden. Warum? Weil von der Nähe erkennt man die Ausrichtung der Seitenkanten der Dreiecke sehr genau. Von der Entfernung hingegen springt vor allem die Anordnung der Elemente ins Auge. Dieses Phänomen ist einfach daraus zu erklären, dass auch das Auge eine Auflösungsgrenze hat, und dadurch die kleinen Richtungsunterschiede in den Seitenkanten der Dreiecke von der Entfernung nicht mehr zu bemerken sind.
Wichtig erscheint mir, dass die Texturverarbeitung fähig ist, spontan den Unterschied zwischen einer gestreuten Anordnung von Dreiecken, oder einer regelmäßigen rasterartigen Verteilung zu erkennen, wenn sich gute geradlinige Verbindungslinien (Streif) ergeben. Ich habe oben festgestellt, dass Winkel und Linienlängen wohl deshalb nicht sofort erkannt werden, weil dies mit einer lokalen Verarbeitung nicht möglich ist. Aber daraus würde folgen, dass auch diese Anordnung nicht erkennbar sein sollte, denn das Erkennen von Anordnungsmustern erfordert eindeutig ebenfalls eine, über den lokalen Bildpunkt und seine unmittelbaren Nachbarn hinausgehende Verarbeitung! Es kann sogar gezeigt werden, dass die gedachten Linien, welche die Elemente einer Textur miteinander verbinden, fast genauso wirksam zur Texturdifferenzierung beitragen, wie real eingezeichnete Linien. So ist in den folgenden beiden Beispielen das verdrehte Texturstück gleichermaßen leicht bzw. schwer zu erkennen, obwohl nur im zweiten Beispiel reale Konturlinien da sind, auf die die Richtungsdetektoren reagieren können:
Ein Modell der TexturerkennungDass die Farbe und Größe und Zahl der Elemente, sowie die Menge an Konturen gleicher Ausrichtung in zwei Texturen pro Flächeninhalt gleich sein muss, um sie als identisch zu erleben ist einleuchtend. Dies sind Informationen, die mit wenig Aufwand flächendeckend erfasst werden können. Dass die Anordnungsrichtung nicht verdreht werden darf, ist jedoch bemerkenswert. Wie erfasst das Gehirn die Anordnung der Elemente zueinander? Zunächst natürlich durch die Flächen dazwischen. Aber bei einer verdrehten Struktur sind auch diese gleich. Allerdings haben wir gesehen, dass der Abziehbildsignalfluss auf den Quasiebenen der Richtungszellen ebenfalls gerichtet stattfindet. Das bedeutet, eine Struktur, die viele horizontale Konturen beinhaltet, wird hauptsächlich auch der horizontalen Quasiebene zu einem Abziehbildsignalfluss führen. Daran kann ihre Ausrichtung erkannt werden. FormerkennungDie obigen Wahrnehmungsexperimente beweisen auch, dass wir abgesehen von der parallelen visuellen Erfassung auch über eine serielle Auseinandersetzung mit Formen verfügen, die uns dann weiterhilft, wenn die parallele Erfassung zu wenig ist. Mit dieser Art der Verarbeitung gelingt es uns auch in jenen Abbildungen den Unterschied von Figur und Grund zu erkennen, wo er nicht unmittelbar auffällt. Die untere Darstellung, die wir bereits kennen, zeigt diesen Unterschied sehr schön auf: Die Form des O ist durch ihre Vielzahl an Konturrichtungen so anders als die Vs, dass auch die einfache parallele Auswertung, die wir im Rahmen der Texturwahrnehmung kennen gelernt haben, genügt, um es zu erkennen. Das R unter den P und Q erkennen wir jedoch nur durch bewusstes Hinsehen und Formerfassen. Das bedeutet wir müssen seriell jedes Element einzeln betrachten (Goldstein 1997, S.186, 188 Link).
Das Übergangsfeld zwischen Texturerkennung und Formwahrnehmung ist auch das Übergangsfeld zwischen paralleler Verarbeitung von Signalen, und der nachfolgenden seriellen. Serielle Erkenntnisprozesse, sind von bewusster Aufmerksamkeit begleitet, und zeichnen sich dadurch aus, dass nie mehr als ein Objekte gleichzeitig Denkinhalt sein kann, seriell eben. Dieser Prozess kann nur verstanden werden, wenn wir begreifen, wo die parallele Verarbeitung endet, und wieso. Da letztlich alle Denkinhalte von der parallelen Verarbeitung der Sinne zur seriellen des Bewusstseins wechseln, ist dieser Übergangsbereich grundlegend für das Verständnis des Gehirns. Die Zeitcodierung, mit der wir uns nun so intensiv beschäftigt haben, stellt den Übergang von der parallelen zur seriellen Verarbeitung dar. Ich will die beiden Extreme am Beispiel eines Bildes von einem Hund veranschaulichen. Ohne jegliche Zeitcodierung könnte der Hund nicht wiedererkannt werden, denn er wird nie wieder die selben Bildpunkte einnehmen und schon gar nicht vor dem selben Hintergrund. Er wird das nächste mal anderswo im Bild sitzen, seine Körperhaltung verändern, perspektivisch weiter weg und damit kleiner sein, anders beleuchtet sein, vielleicht haben wir unseren Kopf verdreht und er liegt schief im Bild usw. Deshalb ist es wertlos die Bildinformation räumlich als Bildpunkte so abzuspeichern wie sie vorliegt.
Abgespeichert muss vielmehr eine Beschreibung werden, eine Abstraktion von Hund, so ähnlich wie eine Kinderzeichnung: Da ist ein Ding mit etwa quaderförmigem Zentrum, das auf vier stabförmigen senkrechten Teilen steht. An einem Ende sitzt ein etwa kugelförmiges Teil, dessen Volumen etwa ein viertel des Quaders beträgt. Das Ding kann sich bewegen...usw. Diese Beschreibung, die natürlich nicht wörtlich vorliegt, sondern in den Zeitcodes der Fließsignale, gilt in allen oben genannten Fällen, d.h. der Hund wird immer erkannt, zumindest als Tier. Auf der höchsten Ebene der Formbeschreibung verwenden wir also Grundformen shapes, die wir in vielen Dingen wiederfinden (Edelmann 1998 Link).
Wie die Zeilen unserer Schrift ist auch die Formbeschreibung durch Zeitcodes seriell, also zeitcodierte Information, und entspricht daher dem seriellen bewussten Denken, das nur einen Inhalt pro Zeit zu verfolgen vermag. Kinder geben uns in ihren Zeichnungen solche Beschreibungen der Welt. Sie setzen die Dinge aus einfachen Grundformen zusammen. Mit zunehmendem Alter verwenden sie immer mehr dieser Grundformen, und so wird das Bild detaillierter, das haben wir weiter oben am Beispiel der Männchenzeichnung beobachtet.
Den Schlüssel zur Erforschung der Zeitcodierung boten die Redundanzketten. Das Gehirn verbindet die Elemente, aufgrund von wiederholt eintretender naher Aktiviertheit, zu Ketten. Diesen Ketten entlang wandern die seriellen Signale. Redundanzketten brauchen nicht immer geradlinig zu verlaufen. Die folgende Textur führt zu einer Verkettung ihrer Elemente zu Kreisen. Da ein Element jeweils mehreren Kreisen zugeordnet werden kann, beginnt das Muster zu brodeln. Das Gehirn scheint, sobald eine Lösung gefunden und verarbeitet ist, nach einer weiteren gleichwertigen Lösung zu suchen, und die findet es hier.
Ich vermute, dass die weißen Zwischenflächen der Schlüssel zum Verständnis dessen sind, was beim Betrachten dieser Textur im Gehirn passiert. Die größten durchgängigen weißen Flächen bilden sich rund um die mittelgroßen Punkte. Sie siegen in der Signalverarbeitung. Diese Flächen sind im Kreis angeordnet, und so ineinander verzahnt, dass fast jede Fläche mehreren Kreisen zugeordnet werden kann. Ordnet das Auge die Flächen zu einem Kreis, so unterbricht es damit einen anderen Kreis. Nun ist es so, dass wir mehrere gleiche Objekte als eine Einheit sehen können. Wir können sie gemeinsam als ein Objekt denken, als ein Muster. Aber sobald sich hier einige Kreise zur Einheit vereinen wollen, bemerken wir, dass einige von ihnen gar keine Kreise mehr sind. Sie sind schon durch die anderen zerstört. So ordnen wir das Muster ständig um. Aber bieten nicht auch viel banalere Bespiele die Möglichkeit verschieden geordnet zu werden? Die erste der folgenden Anordnungen von Punkten können wir uns anhand einer vorgestellten Verbindung in Form einer vertikalen und horizontalen Geraden merken. Fügen wir einen Punkt dazu, so kommen wir auf die Darstellung rechts, die wir uns nicht als zwei Teile, sondern als durchgehende Kurve merken.
Wie der Mensch eine Darstellung auffasst, ist durch seine Wiedergabe, und die dabei entstehenden Zeichenfehler überprüfbar. Es zeigt sich, dass der Mensch eine geschlossene Form im Denken nicht aufbricht, sondern als Objekt denkt, auch wenn es manchmal bei der Wiedergabe anders von Vorteil wäre. So ließe sich ein Wabenmuster ganz einfach durch parallele Zickzacklinien erzeugen, die man verbindet (Fig.d). Darauf kam aber keiner der Erwachsenen Personen, die aufgefordert wurden ein Wabenmuster zu zeichnen (aus Arnheim 1978, S. 221 Link).
Die folgende Grafik merken wir uns als Rest einer Torte, nachdem wir einige Stücke herausgeschnitten haben. Die daneben als Bohne. Den Tortenkreis sehen wir in ihr nicht mehr, obwohl sie der rechten Grafik, bis auf die stärker abgestumpften Ecken, genau gleicht.
Die Zentren in der folgenden optischen Täuschung erhalten die Signale von den Konturen der Balkenenden. Diese laufen auf einen Punkt zusammen. Das erzeugt den Kreiseindruck. Ein Quadrat unterscheidet sich vom Kreis dadurch, dass die Signale nicht ganz gleichzeitig ankommen, weil sie einen unterschiedlich langen Weg zum Objektzentrum durchlaufen. Das ist hier in einem sehr geringen Ausmaß auch der Fall. Wenn ich nun das Wort Quadrat unter der Zeichnung lese, so entsteht zusätzlich eine Aktivierung des Gestaltbegriffs Quadrat über die Sprache. Dann sehe ich auch eher Quadrate als Kreise. Ich kann auch Achtecke sehen. Aber da Achtecke eine seltene Form sind, rechnet mein Gehirn weniger mit deren Erscheinung. Es ist bekannt, dass solche Scheinkonturen bereits auf V2 der Sehrinde verarbeitet werden (Birbaumer 1996, S.396 Link). Vielleicht ist das Bild dort zum Teil schon Zeitcodiert.
Non-existing cirles or sqares
Was bringen solche Beispiele? Nun, vielleicht mag sich der Leser fragen, wie ich auf dieses Gehirnmodell gekommen bin. Dazu kann ich nur sagen: Die wichtigste Quelle waren eine Vielzahl solcher Beispiele, und an die hundert Texturbeispiele. Zeichnen und betrachten, das war meine Form der Forschungstätigkeit. Es stellte sich mir die Frage, warum ich mir in einem Fall das Objekt aus zwei Informationen denke, nämlich aus einem Kreis, mit einem fehlenden Teil. Informationen, die ich nur seriell hintereinander denken kann. Im anderen Fall interpretiere ich die Zeichnung als ein gekrümmtes Oval, also als Bohne. Die Antwort war schließlich der Signalfluss und die zeitliche Codierung. Beim Oval führt der Abziehbildsignalfluss erst einmal zu einer gebogenen Symmetrieachse, deren Krümmung und Länge ich auf der nächsten Ebene verarbeite. Da die Signalfließprozesse auch eine Erklärung für so viele andere Phänomene des Denkens boten, ist schließlich mehr daraus geworden, als nur ein Modell des Sehens. Figur/GrundDas Figur/Grund-Problem findet eine Lösung im Abziehbildsignalfluss, denn dieser schafft nämlich einen Zusammenhalt innerhalb einer gleichgereizten Fläche. Die Regeln zur Figur/Grund-Trennung werden besonders dort deutlich, wo wir Figuren sehen, die nicht da sind. Eigentlich bin ich auf dieses Problem bereits eingegangen. Ich möchte aber hier, nachdem wir nun das Sehsystem etwas genauer unter die Lupe genommen haben, noch einmal darauf zurückkommen. Eine Parallele findet sich bei der Verarbeitung von auditiven Signalen. Auch bei diesen ist nicht immer ohneweiters klar, was Figur und Grund ist. Man kann Töne als Figuren betrachten, die sich von den Pausen zwischen ihnen abheben. Was Pause ist, hängt aber wesentlich davon ab, was wir womit in Verbindung bringen. Hören wir zum Beispiel ein Saxophonsolo und dahinter die die regelmäßigen Schläge einer Bassdrum, dann erkennen wir die Pausen zwischen diesen Schlägen als Ganzes, obwohl eigentlich Töne des Saxophons diese Pausen unterbrochen haben. Das ist so, weil Gleiches eher miteinander in Verbindung gebracht wird, und wir somit Bassdrumschläge und Saxophontöne zu einer jeweils eigenen Kette verbinden. Es gelingt außerdem, weil Töne im Gehirn als Reaktionsbild dargestellt werden, und das Saxophon Reaktionen an einem anderen Ort in diesem Reaktionsbild auslöst, als die Bassdrum. So können die Signale aneinander vorbeifinden. Bei der Betrachtung eines Musters ist das ähnlich. Der Streif in einem Muster entsteht einfach dadurch, dass in dieser Richtung eine Kettenverbindung entsteht. Es ist die Richtung mit der engsten Wiederholungsrate, also mit der größten Redundanz. Man kann also von Redundanzketten sprechen. Eine Redundanzkette besteht aus Figuren, die einen bestimmten Bereich belegen. Wie aber gelingt es uns, den Grund als etwas Durchgehendes zu erkennen, das sich hinter den Figuren befindet? Die Erklärung habe ich bereits geliefert. Sie liegt in den rücklaufenden Signalen. Diese dienen nicht nur der Aufmerksamkeit, also der Aktivierung, sondern umgekehrt werden Signale sobald sie erkannt sind auch wieder abgeschaltet. Dazu nun ein Beispiel: Stellen wir uns ein Muster aus regelmäßigen Kreisen vor. Die Kreise werden erkannt und verlieren an Aktivität. Nun ist der Platz frei für den Abziehbildsignalfluss des Grundes. Die Signale brauchen nicht mehr die Kreiskonturen umfließen, was zu einer komplizierten Form führt, sondern sie können, sobald die Aktivität der Kreisflächen verschwunden ist, einfach flächendeckend zusammenfließen, zu einem durchgehenden Hintergrund, der im folgenden Beispiel rechteckig ist. Der selbe Prozess ist auch verantwortlich für unsere Fähigkeit verdeckte oder halb sichtbare Formen zu ergänzen. Erst wird die vordere Form erfasst. Wenn ihre Konturen abgeschalten sind, dann können die hinteren Formen als Ganzes gesehen werden. Es ist also eine gerichtete Aufmerksamkeit nötig. (Kiefer, Neumann u, Spitzer 2000 Link) beschäftigen sich mit der Fähigkeit zur Ergänzung von Objektflächen.
Aber wieso werden in dem Beispiel die Kreise als etwas Bekanntes erkannt, und nicht die komplizierte Form des Hintergrundes. Ganz einfach deshalb, weil annähernd Kreisförmiges in unserer Umgebung oft vorkommt, und deshalb bekannt ist. Die Hintergründe, die im Bild solche kreisförmigen Objekte umschließen, haben ständig neue, sehr komplizierte Formen, die sich nicht so oft wiederholen. Außerdem ist zur Abspeicherung solch komplexer Formen eine wesentlich aufwendigere Verschaltung von Zellen notwendig, die sich nicht so schnell ausbildet, und komplexere Formen sind nicht so gut komprimierbar. Also wird die Hintergrundform nicht erkannt, bevor nicht der Kreis erkannt ist. Aus der Gestaltpsychologie kennt man die Regel, dass die sogenannten guten Gestalten eher als Figur gesehen werden (Arnheim 1978 Link). Jetzt kennen wir die Begründung dazu. Große Komprimierung entsteht aufgrund der Regel, dass was zeitgleich am selben Ort zusammenfließt und gleiche Aktivität aufweist, sich zu einem Gesamtsignal vereint. Dieses Gesamtsignal ist umso stärker, je mehr zusammenfließen konnte, je mehr also komprimiert wurde. Starke Signale siegen. Kreise sind durch den Abziehbildsignalfluss im Zentrum maximal komprimierbar. Deshalb werden Kreise sofort erkannt. Sind sie aber erst einmal verarbeitet und deaktiviert, so sind die überbleibenden Formen auch leichter zu erfassen. Die Bindung der SinnesreizeDas Bindungsproblem ist letztendlich durch die Konditionierung zu lösen. Da das hier dargestellte Modell ja fähig ist, Kontakte zwischen Zellen herzustellen, die an beliebigen Orten positioniert sein können, wenn diese nur oft genug gleichzeitig aktiv werden, ist naheliegend, dass auch zwischen den Sinnen irgendwann Verbindungen entstehen. Objekte tragen ihre Eigenschaften immer bei sich, und so sind in zeitlicher Nähe zu den visuellen Eigenschaften eines Objektes immer auch andere Eigenschaften, wie bestimmte Geräusche, Gerüche, Geschmack oder Ertastetes wahrnehmbar. Alle diese Eigenschaften werden aufgrund der zeitlichen Auftrittsnähe Verbindungen eingehen, und die Chunkzelle für diese Verbindung repräsentiert letztlich das Objekt. Eine wichtige Eigenschaft ist auch der Auftrittsort des Objekts. Wichtig ist, dass zu einem Zeitpunkt meist nur ein kleiner Teil aller bekannten Eigenschaften des Objektes wahrnehmbar sind. Trotzdem ist an der spezifischen Zusammenstellung von Eigenschaften klar, um welches Objekt es sich handeln muss. Studien zum Zusammenspiel der Sinne zeigen, dass Objekte oft allein am Auftrittsort erkannt werden, auch wenn die Sichtbarkeit nur zu einem geringen Teil gegeben ist (Heinecke 2000, WSA 2000.10.20, WSA 2000.11.17, WSA 2001.03.29 Link). Umgekehrt werden Objekte schlechter erkannt, wenn man sie in Bildern an Orte versetzt, wo sie nicht hingehören (Goldstein S.189 Link). Die Verarbeitung räumlicher TiefeDie Stereooptik führt zu seitlichen Verschiebungen zwischen den Konturen von Objekten auf den beiden Netzhautbildern (Gotthalmseder 1998, S.61f, S.117 Link). Diese sogenannte Querdisperation variiert aber auch mit der Fokussierung der Augen. Nehmen wir an die Augen sind gerade auf Objekte einer bestimmten Entfernung fokussiert, dann sind die beiden Netzhautbilder für diese Entfernung deckungsgleich ausgerichtet. Konturen anderer Entfernung erscheinen in den beiden Bildern jedoch verschoben. Liegt an einer Kontur eine Verschiebung zwischen linkem und rechtem Netzhautbild nach links vor, so befindet sich diese Kontur näher bei uns als die derzeitige Fokusierungsentfernung des Auges. Liegt eine Verschiebung nach rechts vor, so ist die Kontur weiter von uns weg als die derzeitige Fokusierungsentfernung. Die Neuronen, welche dies auswerten liegen in Schicht IV der visuellen Sehrinde, und sind in okulären Dominanzsäulen angeordnet (Kolb 1996, S.138, Hubel 1989, S.113 Link). Das Stereooptische Sehen erlernen Kinder mit etwa dreieinhalb Monaten. (Studien dazu bei Goldstein 1997, S.258 Link). Eine Strecke erscheint perspektivisch dann verkürzt, wenn sie in den Raum hineinläuft. Das bedeutet, die seitliche Verschiebung ihrer Kontur, in den zwei Netzhautbildern, wechselt entlang der Strecke kontinuierlich von wenig zu stark. Die seitliche Verschiebung kann im Signalflussmodell durch die Zeitspanne erkannt werden, die Signale brauchen um zueinanderzufinden. Diese Information liegt entlang der Kontur vor. Das Gehirn des Säuglings, der Objekte vor sich dreht, registriert die Veränderung der Längen ihrer Konturen. Gleichzeitig ändern sich auch immer die stereooptischen Informationen entlang der Konturen, wobei die Verkürzungen besonders stark sind, wenn die beschriebenen Verschiebungen entlang der Konturen stark wechseln. Das wird natürlich registriert, und in Zukunft vorausgesagt. Eine längere Kontur wird mit einer verkürzt erscheinenden der selben Länge in Verbindung gebracht, weil diese Erscheinungen bei der Rotation von Objekten immer nacheinander auftreten. Die Verkürzung wird mit der mangelnden Deckungsgleichheit in den Netzhautbildern in Verbindung gebracht, und somit vorausgesagt. Es wird also nur dann ein neues Neuron ansprechen, wenn die Voraussage nicht stimmt. Nur dann haben wir es mit einem neuen Objekt zu tun. Umgekehrt kann, da es sich um Und-Verbindungen handelt, auch aus der mangelnden Deckungsgleichheit in Zukunft auf die Originallänge der wahrgenommenen Gegenstände rückgeschlossen werden. Wir sehen, dass die Konditionierungsregeln durchaus auch elementare Verbindungsprozesse im Gehirn erklären. RaumorientierungAlles bisher Besprochene diente der Erkennung von Objekten in Bildern. Im realen Leben befinden sich Objekte aber an bestimmten Plätzen des Raumes, der uns umgibt. Wenn wir auch Wände oder den Erdboden als Objekte bezeichnen, so könnte man sagen, der Raum ist definiert, durch die Orte an denen sich bestimmte Objekte befinden. Umgekehrt kann man auch sagen, wenn uns der Platz, an dem sich ein Objekt befindet, bekannt ist, und wir auf diesen Ort blicken, haben wir damit automatisch das Objekt erkannt, und alle seine Eigenschaften sind automatisch zueinander gebunden (Heinecke, Armin 2000 Link). Bewegen wir uns, oder unsere Augen, so erhalten wir ständig neue Sinneseindrücke. Um diese sinnvoll zu einem gesamten Raum aneinanderzufügen bedarf es komplizierter Verarbeitungsprozesse. Unter anderem bedient sich das Gehirn dafür des Gleichgewichtsorgans im Ohr. Dieses dient nicht nur als Lot, und gibt uns damit die Lage des Horizontes vor, sondern es ist auch sensibel auf Drehbewegungen, und gibt uns den Winkel an, in dem wir den Kopf gedreht haben. Allerdings gerät es durcheinander, wenn wir uns länger im Kreis drehen, weil es das Trägheitsmoment nützt, das bei der Beschleunigung des Kopfes entsteht. (Kolb 1996, S.97 Link). Dieses Trägheitsmoment tritt jedoch nur am Anfang einer Drehbewegung auf. Ein künstliches System könnte man mit einem stabileren Orientierungsorgan ausstatten. Man könnte einen Kompass einbauen. Direkt über das Reaktionsbild des visuellen Systems, könnten die Orientierungsdaten gelegt werden. Es scheint aber nicht das primäre visuelle Reaktionsbild ideal, sondern eher die letzten Ebenen der visuellen Verarbeitung, in denen das Bild noch in seiner flächigen Form vorliegt, aber bereits Formen erkannt werden. Das Orientierungsorgan würde man in einem künstlichen System nicht im Kopf, sondern direkt am Auge (Kamera) anbringen. Das erspart einige Umrechnungsvorgänge. Nehmen wir an, das künstliche Orientierungsorgan besteht aus einer Kugel, die ihre Orientierung im Raum nicht ändert, weil sie magnetisch ist, und unten schwerer, wie die Kugel eines Flugzeugkompass. Die Kugel schwimmt in einem Umraum, der auf einer Seite, ein rezeptives Feld enthält, das der Größe des mit den Augen wahrnehmbaren Umfeldes entspricht. Nehmen wir weiters an, die Kugel ist mit zwei Sorten von Signalgebern besetzt. Die eine Sorte sendet auf der Oberseite der Kugel stark, nach unten hin jedoch immer schwächer. Die andere sendet an einem Punkt des Umfangs stark, um den Umfang herum jedoch immer schwächer. Im rezeptiven Feld des Orientierungsorgans werden die Signale der beiden Sorten von Signalgebern erfasst, und an das visuelle System geleitet, wo sie über das visuelle Reaktionsbild gelegt werden. Damit werden jedem visuellen Eindruck Orientierungsdaten zugefügt. Diese können mit den bekannten Regeln des Erkenntnisgewinns verarbeitet werden. Das Orientierungsproblem ist damit natürlich noch nicht vollständig gelöst. Solange der Betrachter (das künstliche Wesen) seine Position nicht ändert, wird die gleiche Blickrichtung das gleiche Bild ergeben. Aber was, wenn er dies tut? Was wir erfasst haben, ist die Position der Objekte in Relation zum Betrachter. Diese ist wichtig, um sich im Raum bewegen, und mit Objekten hantieren zu können. Aber für das Wiedererkennen von Räumen und Objekten bringt sie wenig. Hier wäre eher die Position von Objekten in Relation zueinander von Wert, denn diese Daten bleiben konstant, egal wo der Betrachter steht. Wären alle Objekte in ihrer Position zueinander exakt definiert, so bräuchten wir nur ein Objekt erkennen, und die anderen Objekte wären, allein durch ihre Position, bereits miterkannt. Die relative Position, die zwei Objekte zueinander einnehmen, wird erfasst indem so getan wird, als wenn beide Objekte Teile eines Gebildes wären. Dazu müssen sie so betrachtet werden, dass sie sich gemeinsam in einem Bild befinden. Nun wird versucht, die visuell erkennbaren Redundanzketten so fortzusetzen, dass die Konturen oder das Achsenskelett der beiden Objekte verbunden werden können. Dies funktioniert besonders gut, wenn die Objekte gleiche Ausrichtung besitzen. Deshalb neigt der Mensch dazu, Dinge zu schlichten. Dabei werden sie in ihrer Ausrichtung gleichgerichtet, und erscheinen somit übersichtlich, wie ein einziges Objekt. Man kann sagen, die Objekte ergeben zusammen ein Überobjekt. So ergeben Sessel, Bank und Tisch zusammen die Sitzecke. Wir sind derart gewohnt, diese zusammen zu sehen, dass wir möglicherweise nicht einmal recht wissen, wo der Sessel her ist, wenn wir ihn an einem fremden Platz, wie dem Keller vorfinden. Natürlich ist die Problematik der Raumorientierung damit nur ganz grob abgehandelt. Es ist noch überhaupt nicht besprochen, wie die Projektionsfelder der motorischen Zellen dazustoßen. Schließlich muss es hier eine Verbindung geben, sonst könnten wir den Körper nicht sinnvoll im Raum bewegen. Aber nicht nur das visuelle System ermöglicht Raumorientierung. Auch ein Blinder kann sich orientieren. Sein Tastsinn, das Richtungshören, und vor allem sein Merkvermögen für Bewegungsabläufe helfen ihm dabei. Was die Position unserer Körperteile zueinander betrifft, so kommen wir aber durchaus ohne Orientierungsorgan zurecht. Um uns z.B. an einer bestimmten Körperstelle zu kratzen, müssen wir nur die nötigen Gelenksstellungen kennen, um unsere Hand zielgerichtet dorthin führen zu können, wo wir sie ja dann spüren. Der Tastsinn ist also ebenso wichtig für die Raumorientierung, wie der Sehsinn. Er führt ja auch zu einem flächigen Projektionsbild im Gehirn. Wir können ertasten, wo sich unser Raum begrenzt. Die Ergebnisse der Sinne bestätigen sich somit gegenseitig.
|
|
|||||||||||||||||||||||||||||||||||
|
Zurück zu Themenseiten: StudyPaper.com/Startseite/Wissenschaft/Naturwissenschaften StudyPaper.com/Startseite Das Setzen von Verweisen (Links) auf diese Seite ist gestattet und bedarf keine vorherige Absprache. | ||||||||||||||||||||||||||||||||||||
| Startseite | english | Bookmark setzen | Webseite weiterempfehlen | Copyright © | Impressum | ||||||||||||||||||||||||||||||||||||