2.5.04

Geri ekki ráð fyrir að margir leggi í þetta...

Þetta eru aðallega glósur fyrir mig, en kannski vill samt einhver kíkja á einhvern hluta af þessu, maður veit aldrei.

- - - - - - - - -

Tölvukenningar um skynjun, gervigreind:

Heilanum alltaf verið líkt við vélar, t.d. símkerfi, reiknivélar og tölvur.

Kenning Marrs um hlutaskynjun:

Bjó til tölvuforrit sem getur skynjað þrívíða hluti. Mataði tölvuna á Gestalt-sálfræðireglum um perceptual grouping. Kerfið reiknar svo út hvernig hluturinn er (eins og heilinn?).

Fjögur stig í kerfi Marrs:

Gránumynd:
Engin úrvinnsla enn, samsvarar þeirri mynd sem fellur á sjónu og er í raun ekkert annað en ljósir og dökkir deplar (í tölvukerfinu, í lit á sjónu). “Pixels”.

Frumskissa:
Unnin úr gránumyndinni. Birtuskila- og útlínugreining sem byggist á rannsóknum á móttökusvæðum frumna í hnoðfrumum og hliðlægu hnélíki. Gránumyndinni “rennt” í gegnum síu sem vinnur á svipaðan hátt og slíkar frumur. Gæti einnig svipað til þess hvernig einfaldar frumur í V1 vinna. Tölvan finnur reyndar yfirleitt of mikið af útlínum, því verður að fara fram sneiðing , þ.e. myndin er aðgreind í fleti á grundvelli Gestalt-lögmála , eins og law of similarity, law of good continuation og law of closure. Dregur fram meginþætti myndarinnar. Notfærði sér, auk Gestaltlögmálanna, ýmislegt sem vitað er um umhverfið, t.d. að snöggar birtubreytingar verða frekar við hlutaskil (reflectance edges) en hægar vegna skugga (illumination edges).

Tveggja og hálfrar víddar mynd:
Unnin úr frumskissu. Sýnir halla og lögun yfirborða. Tengir línur saman til að úr myndist heillegir hlutir. Sýnir afstæða fjarlægð, þ.e. hvar hlutir eru miðað við aðra.

Þrívídd:
Fullskynjaður hlutur. Lögun hlutar óháð sjónarhorni. Marr taldi að sjónkerfið felldi ákveðin frumform að tveggja og hálfrar víddar myndinni (eins og er gert í sumum þrívíddarteikniforritum).

Gallar: Gerir bara ráð fyrir bottom-up en ekki top-down processing.

Þáttagreiningarkenning Treismans (Feature Integration Theory):

Er lík kenningu Marrs að því leyti að gert er ráð fyrir að maður greini sjónáreiti niður og setji svo saman aftur í heila hluti, og gerir einnig ráð fyrir mörgum stigum greiningar.

Preattentive stage (forathugunarstig):
Frumþættir poppa fram, án athygli. Dæmi: Litur, halli, hreyfing, beygja (curvature), línuendar.

Fann frumþætti meðal annars með pop-put boundary aðferðinni, sbr:

/ / / / / / / / / / / / /
/ / / / \ \ \ \ \ / / / /
/ / / / \ \ \ \ \ / / / /
/ / / / / / / / / / / / /

Skilin á milli spretta fram

Notaði einnig sjónleitarverkefni:

Þættir stökkva fram. Auðveldara að finna að þáttur sé til staðar en að hann sé ekki til staðar. Gerist á forathugunarstigi, þarfnast ekki athygli.

Sbr. Finnið Q (auðvelt, samhliðaleit)

O O O O O O O O
O O O O O O O O
O O Q O O O O O
O O O O O O O O
O O O O O O O O

Finnið O (erfiðara, raðleit)

Q Q Q Q Q Q Q Q
Q Q Q Q Q Q Q Q
Q Q Q Q Q Q Q Q
Q Q Q Q Q Q O Q
Q Q Q Q Q Q Q Q

Árni:

Sjónminni kemur við sögu í sjónleit. Raðleit er ekki handahófskennd, sjónkerfið veit hvar það hefur leitað og "merkir við þá staði". Sbr. Finna L innan um T (sömu þættir, þ.e. láréttar og lóðréttar línur). L-ið færist úr stað 10 sinnum á sekúndu. Ef leitin er handahófskennd ætti það ekki að koma að sök, en fólk átti í miklum vandræðum ef þetta var svona, hægari svörun.

Illusory conjunctions :
Kemur stundum fram sýndarsamband á milli frumþátta, bindum þá vitlaust saman. Sýnir að fyrst eru þættirnir til í sitt hvoru lagi, eru ekki enn tengdir ákveðnum hlut. Það sem styður þetta enn frekar er að mismunandi undirkerfi (modules) eru í heilanum sem sjá um að vinna út t.d. lit og hreyfingu.

Focused attenton stage (“athyglisstig”):
Þættir sem eru á sama stað settir saman í hluti. Notum til þess athygli. Á forathugunarstiginu eru þættir aftur á móti ekki tengdir við ákveðna staðsetningu, fólki getur t.d. réttilega sagst hafa séð ákveðinn frumþátt, en ekki vitað hvar hann var. Þetta kemur heim og saman við það að í heilanum eru tveir upplýsingastraumar, Hvað-straumurinn og Hvar/Hvernig straumurinn. Samkvæmt Treisman sameinar athyglin upplýsingar úr þessum tveimur straumum. Formgerð hlutar er að lokum borin saman við minni til að bera kennsl á hann.

Biederman: Recognition-by-Components
Áframhaldandi þróun á kenningum Marrs. “Frumþættir Biedermans eru 36 Geónur, þrívíddarform sem hlutir eru felldir að. Geónur eru þannig að það skiptir ekki máli hvernig hluturinn snýr, það er nær alltaf, nema í afar sérstökum aðstæðum, hægt er að greina geónur hans ( view invariance). Þarf líka afar takmarkaðar upplýsingar ( restistance to visual noise), hluturinn getur því verið hálffalinn á bak við aðra hluti en samt er hægt að greina hver hann er. Geónur eru líka þannig að þær eru það ólíkar hver annarri að auðvelt er að vita hvaða geóna á við ( discriminability ). Sem sagt: Ef nógu miklar upplýsingar eru til að greina eitthvað í geón, þá er hægt að greina sjálfan hlutinn.

Gallar við kenningu Biedermans:
Hvernig getum við greint í sundur hluti sem búnir eru til úr sömu geónum? Við getum greint mun meiri smáatriði en sem samsvarar geónum. Gerir líka ráð fyrir að jafnauðvelt sé að þekkja hluti frá öllum sjónarhornum, sem ekki er rétt (t.d. reiðhjól séð að ofan).

Gott við kenningu Biedermans
Það er í raun auðveldara að þekkja hluti ef maður sér nógu mikið af þeim til að skipta þeim niður í geónur.

Þrívídd, hvar í heilanum?
Þrívíddarform sem “ganga upp” vekja virkni í IT en ekki ef þau eru impossible. Impossible hlutir vekja aftur á móti virkni í dreka, sem svarar við nýjum og óvæntum áreitum.

Gestalt-lögmálin um preceptual grouping
Frumur í V1 svara við línu, ef hún skynjast sem hluti af hóp. Hópast eftir good continuation og simarity (halla). Fruman svarar ekki ef línan stendur ekki út á þennan hátt (salience), heldur virðist einungis vera ein af mörgum randomly arranged línum.

Af hverju eiga tölvur erfitt með sjónskynjun?
-Sama mynd á sjónu getur orðið til vegna ýmissa áreita, t.d. lítið ljós nálægt og stórt ljós langt í burtu.
-Það er erfitt að vita hvort breytingar á birtu séu vegna þess að einn hlutur endar og annar byrjar, eða einungis vegna skugga.
-Það er erfitt að vita hvernig hlutir sem aðrir hlutir eru fyrir framan, og því að hluta til faldir, eru í laginu.
-Tölvur hafa ekki þann gríðarlega þekkingargrunn sem fólk notfærir sér í top-down processing til að bera kennsl á hluti.

Reglur sem skynkerfið gæti stuðst við, ýmis top-down processing

Occlusion heuristic:
Ef lítll hlutur hylur að hluta stærri hlut er litið svo á að stærri hluturinn haldi áfram fyrir aftan minni hlutinn (sbr. B-myndin í bókinni).

Light-from-above heuristic
Undir venjulegum kringumstæðum kemur ljós að ofan og maður túlkar dýpt í samræmi við það (sbr. hringirnir sem sumir virtust fara inn og sumir út).

Ef manni er sýnd sena (t.d. eldhús) og síðan er stuttlega flassað mynd af ákveðnum hlut á maður auðveldara með að bera kennsl á hann ef hann passar inn í senuna (brauðkassi) en ef hann gerir það ekki (póstkassi).

Illusory conjunctions koma síður ef maður veit við hvaða áreitum á að búast, getur túlkað þau (sbr. appelsínugulur þríhyrningur verður gulrót og svartur hringur dekk).

Co-occurrence hypothesis (kenningin um “sambirtingu”
Ef áreiti hafa oft birst saman, grúppast þau í “skynheild”. Flest fólk hefur meiri reynslu af því að sjá bókstafi en tölustafi saman í runu (eins og þessari). Þess vegna á fólk auðveldara að finna ákveðna bókstafi innan um tölustafi en innan um aðra bókstafi (Alpha-numeric category effect eða “bókstafa- og tölustafaflokkaáhrif”) . Áhrifin koma ekki jafn sterft fram hjá kanadískum pósthúsmönnum, sem hafa mikla reynslu af póstnúmerum sem eru samsett úr bæði tölu- og bókstöfum!

Andlitsskynjun

Meðfætt eða lært? Sbr. greebles-sérfræðingar og aparnir sem horfðu á flókin þrívíddaráreiti frá einu sjónarhorni.

Capgrass-heilkennið
Kemur fram við sumar geðraskanir og við ákveðnar heilaskaddanir. Andlit fólks vekja ekki upp tilfinningar, en geta samt greint andlitin.

Andlitsókynni (prosopagnosia)
Geta ekki greint andlit, en sýna samt, ólíkt Capgrassfólki, tilfinningaviðbrögð við andlitum (mælt t.d. með rafleiðni húðar og hjartslætti). Skemmt yfirleitt í Fusiform Face Area (í eða nálægt IT).