A látórendszer
A vizuális információk kódolásának megértésében már most olyan előrehaladást értünk el, hogy kísérleti retinaimplantátumok készültek és kerültek sebészeti úton beültetésre páciensekbe.{310} Mindazonáltal a látórendszer viszonylagos bonyolultsága miatt a vizuális információk feldolgozásáról kevesebbet tudunk, mint a hallórendszerről. Két vizuális kéregterület (a V1 és az MT) által végzett transzformációkról készültek előzetes modellek, bár nem az egyes idegsejtek szintjén. Ezeken felül harminchat egyéb vizuális területet ismerünk, és nagyon nagy felbontással kell feltérképeznünk ezeket a mélyebb régiókat, vagy nagyon pontos érzékelőket kell elhelyeznünk bennünk ahhoz, hogy megismerjük a működésüket.
A vizuális információfeldolgozás megismerésének egyik úttörője Tomaso Poggio, az MIT kutatója, aki az azonosításban és a kategorizálásban határozta meg a látás két alapvető feladatát.{311} Poggio szerint az előbbit viszonylag egyszerű megérteni, és már terveztek kísérleti és kereskedelmi rendszereket, amelyek elfogadható sikerrel azonosítják az arcokat.{312} Ezeket használják például a biztonsági beléptetőrendszerekben és a bankautomatákban. A kategorizálás – az a képesség, hogy különbséget tegyünk például egy ember és egy autó, vagy egy kutya és egy macska között – sokkal bonyolultabb feladat, bár a közelmúltban ezen a téren is történtek előrelépések.{313}
A látórendszer (evolúciós szempontból) korai rétegei nagyrészt egy előrecsatolásos (visszacsatolás nélküli) rendszert alkotnak, amelyben egyre kifinomultabb vonásokat fedezünk fel. Poggio és Maximilian Riesenhuber írja, hogy „a makákók hátsó inferotemporális kérgének egyes idegsejtjeit rá lehet hangolni… egy ezer összetett alakzatból álló szótárra”. Annak a bizonyítékai között, hogy a vizuális felismerés előrecsatolásos rendszert használ a felismerés során, olyan MEG-kutatások szerepelnek, amelyek kimutatták, hogy az emberi látórendszer körülbelül 150 milliszekundum alatt érzékel egy tárgyat. Ez megfelel az inferotemporális kéreg alakérzékelő sejtjei késleltetésének, tehát úgy tűnik, nincs idő arra, hogy a visszacsatolás szerepet játsszon ezekben a korai döntésekben.
A legújabb kísérletek hierarchikus megközelítést alkalmaznak, mely során az érzékelt alakzatokat a rendszer későbbi rétegei elemzik.{314} A makákókon végzett kísérletek alapján úgy tűnik, az inferotemporális kéreg idegsejtjei reagálnak azoknak a tárgyaknak az összetett alakjára, amelyekkel az állatokat idomították. Noha az idegsejtek többsége csak a tárgy egy adott nézetére reagál, néhány a perspektívától függetlenül is képes erre. Egyéb, a makákók látórendszerét vizsgáló kutatások sok specifikus sejttípust és kapcsolódási mintázatot tanulmányoztak, és magas szintű leírásokat készítettek az információ áramlásáról.{315}
Kiterjedt irodalom támasztja alá annak az elvnek a használatát a bonyolultabb mintázatfelismerő feladatoknál, amit én „hipotézis és próbának” nevezek. A kéreg „megtippeli”, mit lát, majd meghatározza, hogy a látómezőben lévő alakzatok megfelelnek-e a hipotézisének.{316} Gyakran jobban koncentrálunk a hipotézisre, mint a tulajdonképpeni próbára, ami megmagyarázza, hogy az emberek miért látják és hallják néha azt, amire számítanak, nem pedig azt, ami valójában előttük van. A „hipotézis és próba” a számítógépes mintázatfelismerő rendszerekben is hasznos stratégia.
Noha az az illúziónk, hogy a szemünkből nagy felbontású képeket kapunk, a látóideg valójában csak körvonalakat és a látóterünkben lévő, érdeklődésre számot tartó pontokra való utalásokat küld az agynak. Ezután gyakorlatilag hallucináljuk a világot olyan agykérgi emlékekből, melyek egy sor rendkívül alacsony felbontású, párhuzamos csatornán érkező „mozgóképet” értelmeznek. Frank S. Werblin, a Kaliforniai Egyetem molekuláris és sejtbiológia professzora és Boton Roska doktorandusz egy, a Nature-ben publikált 2001-es tanulmányban kimutatta, hogy a látóidegben tíz-tizenkét kimeneti csatorna van, melyek mindegyike csak minimális információt szállít egy adott látványról.{317} A ganglionsejteknek nevezett csoport csak az élekről (kontrasztváltásokról) küld információt. Egy másik csak nagy, azonos színű területeket érzékel, a harmadik pedig csak az érdeklődésre számot tartó alakok mögötti háttérre érzékeny.