第六章
意識

第七章學習

摘自中國校園網

--------------------------------------------------------------------------------

　先天的行為：反射、直覺與銘印

　　人類的行為在哪些方面是先天的、不需學習（pre-programmed）的？

學習（learining），相對於經驗，是行為、思考、感情上較長久的改變。

反射（reflex）和本能（instinct） vs. 習慣化（habituation）:

最簡單的學習反應與習慣化的關係？

也是本能，也是學習？

銘印（imprinting）：

立即的依附，例：剛出生小鴨跟著Lorenz走（關於這部分請參考天下文化：雁鵝與勞倫茲--動物行為啟示錄（科學人文系列15））。

關鍵期（critical period）：

個體成長中某一時期成熟度至適合某一行為的發展（某一行為的學習），若此時失去學習或發展此行為的機會，則該行為較不易建立。

--------------------------------------------------------------------------------

　古典制約

　　古典制約是什麼？他是如何發生的？

　　古典制約學習（classical conditioning，Pavlovian conditioning）

非制約刺激（unconditioned stimulus，US）：不需經過學習就能引起反應的刺激。

非制約反應（unconditioned response，UR）：不需經過學習就能對非制約刺激起的反應。

制約刺激（conditioned stimulus，CS）：本為中性刺激，與非制約刺激連結，能引起反應的刺激。

制約反應（conditioned response，UR）：由制約刺激所引起的反應。

　　Ivan Pavlov與他的狗的實驗（Figure 7-2）：歷史上有兩隻狗，是大家耳熟能詳的，一隻是靈犬萊西（Lassi），另一隻便是 Pavlov 的狗了。

　　制約的獲得（Figure 7-3）；

　　以 Pavlov 的狗實驗為例，Pavlov 穿著實驗用的白衣進入動物房把狗罐頭（不知道當年有沒有寶路）倒進餐盤中，餐盤中的狗食對狗而言就是非制約的刺激（US），因為不需制約的程序，就可以引發狗流口水的反應，因此流口水此種因US而起的反應就是非制約反應（UR），可是有一天，Pavlov 忘了買寶路了，當他同樣穿著實驗白衣進入動物房時，他發現狗仍然有流口水的反應，於是 Pavlov 發現古典制約（classical conditioning）的形成，因為狗學到的是實驗的白衣（一個中性的刺激，S）會出現在狗食（US）之前，經過幾次配對之後，S 與 US 產生連結，變成制約刺激（CS），因此當 CS 出現時，CS 會連結到 US，US 會引發 UR，但是因為此時刺激由 CS 開始，因此此時的反應稱為 CR。（請看以下的簡圖）

US ---> UR

　　各種形式的制約：

延宕制約（delay conditioning）：CS 出現後，隔短暫時間US出現，兩者同時停止。

遺跡制約（trace conditioning）：CS 出現就停，再出現US。CS 和 US 出現的時機距離越長，效果越小。

時間制約（temporal conditioning）：制約刺激不出現，只有非制約刺激每隔一段時間出現一次，到後來，時間變成刺激，稱為時間制約。

同時制約（simultaneous conditioning）：US 與 CS 同時出現，效果不大。

逆向制約（backward conditioning）：US 出現，再出現 CS，無效果。

　　古典制約的階段（phase）

行為獲得（acquisition）

消弱（extinction）：當制約反應產生後，CS不再與US伴隨出現，制約反應將逐漸減弱，甚至完全消失。

自發恢復（spontaneous recovery）：消弱現象出現後，過一段時間，再單獨呈現CS，仍會引發CR。

行為保存（saving）：CS與US再次伴隨出現，時間雖不常，CR可以回到最初獲得的狀態，saving指的是此時所需要的配對次數較原先習得時配對次數少，減少的配對次數就是所謂的saving，也就是省下一些力氣的意思。

　　刺激特徵：類化與區辨

刺激類化（stimulus generalization）：與CS性質相似的其他刺激，不必經過制約學習，也會引起制約反應。也就是因為該刺激的某些特性與CS極為類似，所以也具有引發CR的能力。

刺激區辨（stimulus discrimination）：刺激與CS的相似程度越來越大，CR出現的頻率也隨之提高，但因作業要求刺激辨別，因此個體所需學習的是在兩個極相似的刺激中去找出那個才是真正的CS。若對CS正確反應是給予獎賞，則個體會對越相像CS的刺激反應程度越高，越不像CS的刺激反應程度越低；弱沒對CS正確反應則給予懲罰，則對越相似的刺激，個體會因辨別難度的提高而焦慮，當年Ivan Pavlov即利用此種動物模式研究實驗性精神官能症（experimental neurosis）。

　　制約層次

　　高層制約（higher order conditioning）：CS引起CR後，CS可當作US與另一CS（CS2）配對，形成另一層次的制約。

　　例：開快車被交通警察（CS1）開罰單（US），產生焦慮（CR）。由於交通警察（CS1）與警車（CS2）幾乎同時出現，所以CS2會連結到CS1，CS1會連結到US，US接著引發CR/UR，所以開快車的人也對警車的出現產生焦慮。

　　為什麼制約學習會發生？

　　何謂連續性（continuity）與關連性（contingency）？兩者的差別為何？

　　連續性指的是兩個刺激連續出現，這兩個刺激可能具有關係，也可能恰巧在同一時空出現，譬如說curler每天下午都會到校園散步，某系的漂亮妹妹michele也有同樣的習慣，五分鐘後她也會到同一地點散步，兩個人的出現具有連續性，但是未必具有關連性。又譬如，curler認識校園內復文書城的櫃檯小姐，每次當curler走進復文的時候，櫃檯小姐就會跟curler打招呼，curler進入復文與櫃檯小姐打招呼的動作這兩件事就有關連性，因為只有當curler表現出走進復文的動作，復文的櫃檯小姐才會表現跟curler打招呼的動作。

--------------------------------------------------------------------------------

　操作制約

　　操作制約是什麼？他是如何發生的？

操作制約（operant conditioning）又稱工具性制約（instrumental conditioning）

立論者：E.L. Thorndike， B.F. Skinner

Thordike：

trial-and-error （請自行舉例說明）

law of effect （效果論，請自行舉例說明）

Skinner：（見p.242圖，Skinner box，或是Sniffy程式）

experimental analysis of behavior

schedules of reinforcement

　　增強物（reinforcer）：

　　符合個體需求的刺激物，作為個體有正確反應時之獎賞用。增強指的是行為發生的頻率增高了，所以不管正增強或是負增強看到的行為頻率都是增加的，只是正增強是因為增強物的出現，負增強是因為增強物的移除。

正增強（positive reinforcement）：行為表現後得到酬賞，行為也因之強化，此酬賞為正增強。例：索取統一發票（行為）中大獎（正增強），以後每次購物皆會要統一發票。

負增強（negative reinforcement）：行為表現後即終止所厭惡的刺激，行為得到強化，此厭惡的刺激為負增強。例：戴太陽眼鏡後（行為），陽光不再刺眼（厭惡的刺激），一出門及戴上太陽眼鏡。

處罰（punishment）：給個體厭惡的刺激（正處罰）或取消酬賞物（負處罰），以削弱行為。例：男頭綁紅絲帶被取笑（處罰），不再綁紅絲帶（行為消失）。

＊＊棒下出孝子？不打不成器？

　　處罰可能帶出避開處罰的行為。

迴避學習（avoidance learning）：在經歷厭惡刺激的痛苦後，個體學到在厭惡刺激出現之前逃離現場，以免遭打擊。

　　Premack原則：增強物要給的適當，否則預期行為不易產生。

較喜歡的活動是較不喜歡活動的增強。

在階層結構是上較高層次的較為容易激起制約學習。

　　增強物的類別

原增強物（primary reinforcer）直接滿足個體需求的刺激，如：食物。

次增強物（secondary reinforcer）經學習而間接使個體滿足的刺激物，如獎狀、金錢、地位、代幣（token）。

　　增強物出現的時間

立即增強，行為會重複。行為與增強之間的時間越長，增強效果越差。

　　為塑造（shaping）

　　將現有行為和欲達成目標行為間分解成幾個步驟，對每一個步驟施予操作制約。例：馬戲團以連續漸進式（successive approximation）方式訓練動物表演。

　　增強安排方式（Schedules of Reinforcement）

　　可分成連續增強、部分增強、比率增強與時距增強幾類。以下說明幾種常見的增強方式：

固定比率方式（fixed-ratio, FR）

個體固定做出幾次反應之後，給予增強。譬如FR5指的是動物必須壓桿五下才可以得到一次增強物，所以反應與增強物的比例為五。

不定比率方式（variable-ratio, VR）

不定比率方式會使個體猜測哪一次會得增強物，因而不斷做反應。例如：大家樂。更詳細地說，譬如VR5的程序指的是動物平均壓五下會得到一次增強物，但是可能動物遇到的第一個程序是FR9，第二個程序是FR1，第三個程序是FR8，第四個程序是FR2，以此類推，總之平均而言動物壓五下桿會得到一次增強物。

固定時距方式（fixed-interval, FI）

個體必須在固定時間之後壓桿才會得到增強物。譬如，FI10"（10"表示10秒）的程序要求動物在十秒之後做出反應才會得到增強物，動物在十秒之前不會得到任何增強物，所以動物的反應型態是得到增強物後會休息一段時間不做反應，等到時間快到的時候，才開始做反應，最顯明的例子是學生的讀書行為，學生平常不讀書，等到考試快接近的時候就開始用功的讀書，一考完試，又開始不讀書。（請比較FT與DRL兩種程序）

不固定時距方式（variable-interval, VI）

這個程序與FI的差別就如同FR與VR的差別，譬如VI10"強調的是平均10"動物做出反應會得到增強物。所以動物的反應型態是不斷做反應。（請比較VT程序）

Fixed Time, FT

這個程序指的是當動物做出反應之後，會經過一段固定的時間後才會出現增強物，請注意它和FI的差別。

Variable Time, VT

這個程序指的是當動物做出反應之後，平均而言會經過一段固定的時間後才會出現增強物。

Differential Reinforcement of Low rate, DRL

基本程序與FI差不多，但動物在時間內做出反應，時間會重新計算，因此動物必須等到時間過後才會反應，所以反應率相當低。

Differential Reinforcement of Other behavior, DRO

這個程序是除了某個行為外，其他的行為都會受到增強，因此實驗者的目的是將某個行為消去，譬如小孩子講髒話，父母除了懲罰的方法之外，也可以增強講髒話以外的行為，藉以消除講髒話的行為。

　　制約學習的另一面

　　逃避

　　習得無助（learned helplessness）

　　個體被制約不產生行為，表現出對環境完全無法控制，對未來要發生的事情亦無法預測，甚至放棄一切，以逃避負面增強。這種絕望的心境是由制約學習來的，故稱為「習得的無助感」。

　　無助可以學習得到，樂觀也可以學習得到嗎？Martine Seligman提出樂觀學習的看法，他認為樂觀的人會比較容易有所成就。（請參考樂觀學習‧學習樂觀與教你的小孩學習樂觀這二本書，遠流出版）

　　我們對社會亂象的不反應，是不是習得無助的反應？

有那些現象不是制約可以解釋的學習現象？

--------------------------------------------------------------------------------

　學習-表現的區分：潛在學習

　　一些其他學習的基本現象是什麼？

　　學習因素與表現因素的區分

　　如果某因素對行為的影響是讓這個行為無法被習得，則此因素稱為學習因素（learning variable），如果某因素對行為的影響是讓這個行為無法被表現出來，一旦此因素被移除後，行為即可表現出來的話，此因素稱為表現因素（performance variable）。舉個例子，假設小明在媽媽出現的場合中學習拉小提琴，學習了三個月後（一般人此時皆可習得拉小提琴的技巧），小明仍無法習得拉小提琴的技巧，媽媽的出現即稱為學習因素，又假設小明在媽媽不出現的場合三個月後已習得拉小提琴的技巧，但老師測試的時候，恰巧有個小明暗戀的女生在現場，因此小明仍拉不好小提琴，但該女生離開後，小明即可表現出小提琴的技巧，則該女生稱為表現因素。

　　潛在學習（latent learning）：

　　個體所學習的行為表現不出來（隱而不顯），不表示沒學到。這是因為受到表現因素的影響所導致的後果。

　　認知圖（cognitive map）：

　　Tolman和Honzik的白老鼠在迷津中到處遊走，有了整個迷津的認知圖，他在迷津中行為是有目標導引的行為，不是制約學習的結果。

--------------------------------------------------------------------------------

　社會學習

　　社會學習是什麼？他是如何發生的？

觀察學習（observational learning，替代學習vicarious learning， social learning）見賢思齊，見不賢內自省。

注意到楷模表現的行為。

保留所觀察到的行為。

有表顯此行為的動機（機會）。

有能力表現所觀察到的行為。

例如：一電視所演出劇情或處理事件模式來處理自己所遭遇到相似的事件。

但是，殺雞能儆猴？

這一章介紹的學習理論如何解釋：

語言的習得

道德行為的習得

邏輯思考的習得

＜參考文章：社會學習理論＞

--------------------------------------------------------------------------------

相關閱讀

雁鵝與勞倫茲--動物行為啟示錄（天下文化：科學人文系列15）

樂觀學習‧學習樂觀（遠流出版）

教你的小孩學習樂觀（遠流出版）

相關網站

Newton's Apple: Brain

相關課程

1.學習心理學（Psychology of Learning） 2.學習與動機（Learning and Motivation）

相關軟體

Sniffy可以讓你在電腦上的Skinner Box訓練老鼠。下載

進入心理學的世界－學習

【心理學報報】　第六期 1999/03/02

--------------------------------------------------------------------------------

進入心理學的世界－學習（上）

愛智客<azic@ksmail.seed.net.tw>撰

　　參考書目：洪蘭譯，遠流出版之《心理學》，　　第四章〈學習〉，頁89到108。

　　我們假定每一個對心理學有興趣的讀者，不管是去買或是去借或是站在書店看，都已經有辦法拿到《心理學》這本書。從這一期開始，我們不再循舊法將書中的內容作摘要，請看書吧。我們會嘗試從生活的角度、以生活的實例來切入。

　　如果你手邊沒這本書，可以看看簡單的摘要：

　　中正大學普心網頁‧第七章學習　http://psy.ccu.edu.tw/generalpsy/chap7.htm

　　談到學習，我們似乎無時無刻都在學習，我們聽過這句勉勵人的話：「活到老，學到老。」可是我們也聽過另外一句話：「老狗變不出新把戲。」心理學家可以告訴我們有機體學習的歷程是什麼嗎？是不是有什麼簡單的學習的法則可以用來解釋所有的學習現象的？

　　每次在心理學裏提到學習，就會講那隻流口水的狗。雖然很早的人就知道某些事情之間彼此有連結，例如閃電與打雷，而那隻狗為什麼有名，就是因為 Pavlov 將這種連結現象以實驗來呈現出來。（試試看其他的配對：蘋果會想到誰？風箏呢？浴缸呢？）

古典制約

　　在實驗開始之前， Pavlov 發現食物在狗的口中，狗就開始流口水，而後，當每次食物出現的時候，就伴隨著一個鈴聲，這個鈴聲是一個中性刺激、是不會引起狗狗流口水的，可是在這樣幾次配對出現之後，若是狗狗只單純聽到鈴聲，也會開始流口水。這就是心理學上有名的「古典制約」。

　　古典制約在日常生活中常常見到，很多廣告就是運用古典制約的方法。舉例來說，有一些汽車廣告，就是以親情作為訴求，親情讓我們有好的感覺，然後再配上某某牌子的車，嗯，某某牌子的車也是好的。另外，我們在看到交通警察的時候，通常會比較守交通一點，也許是因為又讓我們想到上一次被開罰單不愉快的感覺。

　　這些是在意識層面可以察覺到的，有一些則是不知道是什麼原因的。例如焦慮症，某些人會怕狗，即使很可愛的小狗也不敢去碰牠。這可能是因為曾經被狗咬、被狗追，曾經讓他有害怕的感覺。以至於遇到狗就會有不舒服的感覺出現。

　　當然，他可能不會記得當初欺負他的是哪一隻狗了，他可能對於狗產生類化作用，只要是狗，就會害怕。俗話說；「一朝被蛇咬，十年怕草繩。」也就是把草繩類化到蛇去了（都是長長的一條。）

操作制約

　　講到古典制約，就要接著講操作制約。在古典制約中，動物要學習的是刺激與反應之間的關係，而在操作制約則是要學習反應與報酬之間的關係。舉動物園中會翻觔斗的海狗為例吧，每當海狗作了一個翻觔斗的動作，牠就會從訓練師手中得到一條魚。操作制約又叫做工具制約，是因為海狗的翻觔斗的行為，是牠用來獲得一條魚的工具。馬戲團的訓練方式就有非常多的操作制約在裡面。

　　因此，一個行為的持續發生與否，全看這個行為發生之後的強化物，或叫做回饋，有正向回饋，這個行為將會被持續，例如前面提到的海狗翻觔斗之後得到的魚就是一個正向回饋。當然海狗在翻觔斗之後也會得到觀眾的鼓掌聲，但是一條魚的獎賞要來得比較實際吧，但是對於人們來說，非實質性的，一個善意的微笑、一句鼓勵的話，都可以是一個正向回饋。

　　那麼，相對來說，也有一種方法會減少行為的出現，那就是懲罰。例如小朋友想用手去碰熱水壺，任憑我們怎麼阻止，他就是想去玩熱水壺，可是一旦他去碰被燙到之後，他就不會再去碰。

　　前面提到怕狗的例子，用操作制約可以來解釋為什麼怕夠的反應會一直持續下去。當在古典制約建立起對狗的害怕之後，每當他又遇到狗，他的恐懼之心由油然而生，這時候他採取了逃避的行為，立刻走掉，一旦離開現場之後，沒看到狗了恐懼感消失了，因此，逃避的行為被增強，他以後在面對狗的時候，就會採取逃避的方式。他也就一直害怕狗了。

　　那麼要怎樣消去逃避反應與怕狗的連結呢？有一個方法叫做「敏感遞減法」，就是慢慢地、一步一步地重新建立與狗的關係。首先，他可以站在離狗五公尺處，不要急著逃跑，他會發現其實沒那麼可怕，再漸漸地靠近狗，最後能夠摸摸牠，和狗玩在一起。聰明的你，也許已經想到，萬一在這過程之中，他又被狗咬了呢？那不是前功盡棄，又更怕狗了嗎？那該怎麼辦呢？

--------------------------------------------------------------------------------

進入心理學的世界－學習（下）

　愛智客 <azic@ksmail.seed.net.tw>

　　參考書目：洪蘭譯，遠流出版之《心理學》，第四章〈學習〉，頁108到130。

　　對行為主義來說，學習是刺激與反應的連結，動物是去學會作某個反應的傾向。然而在最早期的行為主義當時，就有另一派人認為動物學習的真正原因是因為他們學到了新的知識，動物學到的是各種知識，Tolman 把它叫做認知，這些知識在經過組織後，下一次有需要時就可派上用場。

　　比方說，以認知學習的觀點來看 Pavlov 的那隻狗，狗狗不知道鈴聲是和食物有關連的，當食物出現的時候，也有走路聲、吵雜的講話聲、關門聲，甚至是不小心跌倒發出來的「唉岰！」聲。狗狗不只要學到鈴聲和食物是有關連的，他還必須學到其他東西和食物是沒有關連的，說然說這些聲響會和食物一起出現，但更多的時候，食物是沒有出現的。

　　而在另一個經典的潛在學習實驗中，讓一隻老鼠跑一個迷宮十天但卻沒有報酬，當開始將食物放在目標箱的時候，這隻老鼠的錯誤率立刻就降低，比起其他才剛開始要學習的老鼠學得快多。可見得雖然沒有報酬，老鼠還是有學到一些東西，報酬只是讓學習結果表現出來。

　　在另外一個很有名的實驗裏，Seligman 創造了一隻習得無助的狗。

　　他讓兩隻狗一組，當電擊來時，Ａ組的狗可以用他的鼻子去推一塊版子把電擊停止，而Ｂ組的狗並沒有辦法作任何事停止電擊。這兩隻狗所受的電擊次數及電擊量都是一樣的，唯一的差別是Ａ組的狗對免除電擊有控制權而Ｂ組沒有。等到將他們換到新環境去學習迴避：（當電擊來時只要跳到箱子的另一邊即可免除。）Ａ組的狗很快就學會，而Ｂ組的狗確是很被動地，也不脫逃不迴避，就在那兒忍受電擊。雖然已經可以主動地去迴避電擊，他們也不想去嘗試，他們已經習得無助了。

　　「習得的無助」被用來解釋憂鬱症的機制，憂鬱的人都是被動的，什麼事不想作，只是坐以待斃，學習效果很差。因為他面臨過一個作什麼都無法改變的環境，於是他就習得無助了。很多慢性病的人都會伴隨著憂鬱，因為他們在面臨自己的健康漸漸喪失，卻一點辦法都沒有，就再也不願意嘗試了。

　　還有其他更複雜的認知行為，舉生活上的例子來說，有一天小明去逛書店，隔天小華聽說他去過書局，就問他有沒有看到某一本書，雖然小明當時並沒有特定要找哪一本書，可是他這時候卻有個印象：「那本書在某某區上面屬下來第二個櫃子的中間。」好像有一間書局在腦子裡面。

　　另外還有替代學習與觀察學習，「徙木立信」就是一個替代學習的例子，雖然報酬不是我拿到的，可是透過搬木頭那個人拿到賞金的結果，其他人也學習到言出必行的守則；或者，老師當著學生的面稱讚小明常常幫助同學，其他同學也會學習到幫助同學能夠得到稱讚做為報酬。

　　觀察學習則是 Bandura 的敲娃娃經典實驗，觀察學習是一種模仿，模仿可以在觀察者沒有照著作的情況下發生，也可以在他自己沒有得到報酬或是模仿的對象沒有得到報酬的情況下發生。最好的例子就是養小孩子的經驗，我們常聽到一句話，孩子就是父母的翻版，不只是有生理上的相似性，在行為上，父母的行為也都被孩子學去了。也常常有人覺得，自己明明不喜歡父母親那一套管教方式，卻在有小孩子之後，還是使用相同的模式在管教小孩子。我們也聽說過言教不如身教，不知不覺中，父母老師的行為就被學走了，包括好的、不好的。

　　而頓悟學習則是不同於試誤學習，試誤學習是一種循序漸進的感覺，會覺得說，「嗯！我漸漸作對了，我越來越接近正確。」可是頓悟學習在從不知道到解開的過程中，似乎是跳躍性的，「啊哈！我想到了。」當籠子裏的猩猩用手勾不到籠子外的香蕉、拿一根棍子也不夠長，突然他靈機一動，把細的棍子插在粗的棍子上面，終於把香蕉拿到手了。歷史上頓悟學習最出名的應該就是阿基米德了。當他在浴缸裏突然想到怎樣檢驗皇冠是不是真的，他興奮地跑到大街上大喊：「我想到了！我想到了！」

　　雖然行為學派嘗試找出最簡單的學習法則，但總是無法順利解決「人們是如何學習語言的問題。」他們利用古典制約與操作制約要來解釋如何從無開始學習語言，但是無法滿意地解釋複雜的文法以及那麼多的語言特例是怎麼學到的。（如果找到，相信能夠解決我們學習英文的痛苦！）心理學家們訓練好久才能夠讓一隻猩猩認得幾個單字，可是呢，大部份的人類小孩，不需要特別教他，到了三、四歲就會說一大堆的話。我們學弟二外語學得好辛苦，而小小留學生暴露在多種語言的環境下，並沒有特別教他，就學會好多語言。（我聽說有一個住美國小朋友，和朋友講美語，和爸媽講普通話，和爺爺奶奶講台語。）

　　行為學派對學習的研究，是心理學史上的一件重大事件，還有產生了許多的哲學對話。赫胥黎寫的「美麗新世界」即是在探討一個以制約學習為手段創造的世界，Skinner 寫的「桃源二村」也是根基於行為理論所描繪出來的一個自足的世界。這兩本都是很容易閱讀的小說，卻能夠引發許多的思考，如果在看完行為理論之後也有興趣，不妨拿這兩本書來參考參考。

--------------------------------------------------------------------------------

第六章 意識

第六章
意識