训狗

训狗

训练行为方式
训狗是一项艰难又有意义的工作,为社会提供安全保障之一的措施。训狗通常离不开操作性条件反射。训练员引导动物执行一种行为的方法会因人而异。有些人倡导使用食物引导狗就位,而其他人只是等待狗自发做出该行为。多数响片训练员不支持使用手推的方法使狗落位,因为那违背了响片训练中不施加外力的理念。如果您使用响片训练,按照次序逐步地训练,可以使狗学到复杂的行为方式。
    中文名:训狗 外文名: 别名: 英文名:Dog training 解释:训狗是一项艰难又有意义的工作

训狗历史

狗属于脊索动物门、脊椎动物亚门、哺乳纲、真兽亚纲、食肉目、裂脚亚目、犬科动物。中文亦称“犬”,狗分布于世界各地。狗与马、牛、羊、猪、鸡并称“六畜”。有科学家认为狗是由早期人类从灰狼驯化而来,驯养时间在4万年前~1.5万年前。被称为“人类最忠实的朋友”,是饲养率最高的宠物,其寿命大约在12~18年。在中国文化中,狗属于十二生肖之一,在十二生肖中的第11位。

狗是由狼驯化而来的。早在狩猎采集时代,人们就已驯养狗为狩猎时的助手。因此,狗算是人类最早驯养的家畜。河北武安磁山、河南新郑裴李岗、浙江余姚河姆渡等遗址,都发现了狗骨骼,足证其驯养历史之久远。

战国时,东胡开始强盛,占据燕国边地,后燕将秦开率兵袭破东胡,东胡向北退却千里。燕在北边设置上谷、渔阳、右北平、辽西和辽东五郡,修筑长城以防御东胡。据实地考察,燕所筑长城从辽西腹地穿过,在朝阳建平县境内仍保留长城遗迹百余公里。这说明朝阳地区在燕破东胡前曾为东胡占有。

东胡的社会经济为游牧、狩猎和农耕相结合的混合型经济,以游牧的畜牧业为主。东胡墓葬中多出土大量动物骨骼,证明饲养的动物主要有狗、猪、马、牛、羊等。

训狗方式

训狗通常离不开操作性条件反射。B.F.斯金纳是第一位对这一概念进行定义的科学家,他对俄国生理学家巴夫洛夫博士有关动物行为的作品进行了研究。在巴夫洛夫极富创造力的研究中,狗将刺激(这个例子中的刺激物是铃)与主人的喂食联系在一起。该实验从两件看似无关的事件(流口水和喂食)开始,随后增加了第三个元素,即喂食前摇铃。在经过几轮的试验之后,狗学会把铃声与喂食联系到一起,知道听到铃声后便会有食物。因此,即使不提供食物,它们也会在听到铃声后流口水。

因为在提供食物时狗会自然开始流口水,所以食物就是一种非条件性刺激。不需要特殊的条件反射或特殊训练就可以使狗流口水,这是一种非条件反射。

与此相反,铃声本身不会使狗流口水,它们仅在特定条件下才会将铃声与喂食联系在一起,从而流口水。所以,铃声是一种条件刺激。狗所产生的新反应是对刺激物的反射,是一种条件反射。

许多人可以从自己的狗那里了解到这一点。当门铃响时,狗会狂怒咆哮,有时甚至听到电视里的门铃声也会狂叫。在这种情况下,狗已经将铃声刺激与即将到来的陌生人联系到了一起。

驾驶时,当我们看到闪动着的灯或者听到后面有警笛,我们可能会条件反射式地紧张起来并且心率加快。我们已经将警笛声作为条件与得到罚单时那种不愉快的、有压力感的经验联系到了一起,这是典型的条件反射。动物和人类都可以将两个事件联系起来,并在预期第二个事件时对第一个事件做出反应。这种类型的学习是被动且无意识的,它在学习者没有做任何事且经常是没有任何意识时发生。

巴夫洛夫的作品是有关条件刺激的反射性反应,而斯金纳则关注通过添加强化刺激,从而形成的对刺激的特定反应。强化刺激可以是奖励或者惩罚。能够增加行为频率的任何事件都可以称为奖励;反之,能够降低行为频率的任何事件都可以称为惩罚。

因为某种特定行为得到奖励时,我们可能会重复该行为。相反,当我们因为某一行为而得到惩罚时,我们可能会终止该行为。这种类型的学习是主动积极的,它取决于学习者的行为。

由于强化刺激的定义是以其有效性为基础的,所以记住下面一点很重要。同样一个奖励,对于一个人来说也许是有意义的,而对另一个人来说,可能就不是奖励。类似地,一个环境中的奖励在其他的环境中可能也不再有吸引力。

斯金纳证明,动物和人类都会为得到奖赏而重复某些行为。在他使用老鼠和鸽子所做的实验中,斯金纳展示了动物是如何通过按压横杆来获取食物奖励的。当第一次将一些动物引入试验箱时,它们会在箱内随意移动。当它们偶然按压横杆时,会有一小块食物掉下来。这样它们很快就学会了有目的地按压横杆来获取食物。随后,通过对它们逐步进行强化训练,还可能形成更加复杂的行为。为对预期结果(获取食物奖励)作出响应,动物实际在环境中执行了操作(按压横杆),因而斯金纳将自己的方法称为“操作性条件反射”。

我们人类也本能地对良好的行为进行奖励,对不良行为进行惩罚,这是人之常情。在没有对操作性条件反射进行定义之前,人们已经使用它来训练动物很长时间了。康拉德·莫斯特上校在1910年出版了《训狗指南》,他使用的是斯金纳所研究的许多相同的原理(甚至比斯金纳描述这些原理的时间还要早几十年)。虽然莫斯特上校的训练方法根据现在的标准显得有些严酷,但他还是被很多人尊称为“现代训狗之父”。莫斯特和其他训练员同时使用奖励和惩罚塑造并强化动物的行为。

强化刺激

强化刺激可以包括添加一个新元素,或者拿走当前存在的一个元素。这个术语可能有些令人费解。添加某物被称为“正强化”,然而“正”并不意味着“高兴”或者“好”。在这种情况下,“负强化”是移除某物,也并不包括“坏”的意思。因此,奖励和惩罚可以是正强化,也可以是负强化。

鹦鹉做了挥腿的动作,奖励它一片水果,这属于添加积极的刺激(正面奖励);马为了逃避马刺而跑得更快属于终止消极的刺激(负面奖励)。尽管“负面奖励”听起来似乎前后矛盾,但去除某种消极刺激确实是一种奖励。

惩罚的原理也完全相同。当狗朝一个方向拉动皮带时,会在相反的方向得到一个令其疼痛的拖拉刺激,特别是在使用颈圈或叉形链时狗得到的刺激会更大,这属于正面惩罚或修正,狗会因为自身的不良行为而得到不愉快的反馈。或者,惩罚也可以是去除某种正面刺激,即当小孩行为不当时大人会剥夺其出去和朋友玩的权利,这属于负面惩罚。

使用强化刺激训练狗坐下的方法有多种。训练员可以推狗或将它带到一个位置坐下来,或者只需等待直至狗自然而然地坐下。当狗坐下时,训练员可以提供一种正面奖励,例如,口头表扬(“狗儿乖!”)、触摸奖励(轻拍狗的头部)、提供狗喜欢的玩具或者食物奖励。有些训练员使用电击项圈作为负面奖励,这种项圈可以向狗发出适度的电击,而当狗坐下后,电击就会停止。这样狗就学会了通过坐下而消除电击。

出于人道方面的考虑,许多人对此表示不满。但是,这种训练方法所遵循的是与操作性条件反射相同的原理。不管在哪种情况下,狗学会了一听到“坐下”的命令就立刻坐下,紧接着它就会得到奖励。只要对狗有意义的事物都可以作为强化刺激。也许一只狗认为食物比玩具更具价值,而另一条狗则恰恰相反。具体使用哪种强化刺激并没有多大的影响,但是从实际情况来看,有些强化刺激确实比其他强化刺激更有效。

同样,没有必要每次或在每种情况下都使用同一种强化刺激。有些任务则可能需要更具价值的强化刺激。正如PetSmart宠物连锁店的训练员丹·奥利里所言,“如果给你一美元让你从椅子上方跳过去,你可能会做。但你可能不会因为一美元而为我洗车和打蜡。”同样,如果在相对安静的家中您的狗乐于为得到某种类型的奖励而执行某项任务,但在课堂上却需要更有吸引力的奖励才能使狗集中注意力。

标记

凯勒和玛丽安·布里兰是B.F.斯金纳的学生,他们将斯金纳的方法进行扩展,用来训练不同种类的动物。在二十世纪中期,凯勒·布里兰开始制定适用于训练海洋哺乳动物的训练计划。显然,为海豚或者逆戟鲸设计有效的惩罚有一定的难度和危险性。另外,对通常远在地面的训练员来说,及时奖励处于水中的海洋哺乳动物也是一件富有挑战的事情。

在训狗过程中也会遇到相同的问题。如果狗坐下、跳起,然后再转一个圈,从而获得了食物奖励,那么它可能并不知道是表演的哪一部分取悦了训练员。特别是在训练员花了片刻时间去取食物来喂狗时,情况更是如此。通常,狗会将自身所执行的最后一个动作与所获得的食物奖励联系到一起。因此,如果狗坐下,然后跳起,接着获得了食物奖励,那么狗真正得到训练的是跳起,而非坐下。

对于惩罚也同样如此。如果狗从主人身边跑掉,随即跟主人玩追捕游戏,当被主人抓到时自然会遭到惩罚。然而,在狗遭到惩罚前所做的最后一件事却是回到主人身边。因此,当狗听到召唤时很可能减少的行为是回到主人身边,而非跑掉。

为了解决这个问题,布里兰设计了一种标记或暗示,这可以告诉动物其行为正确而且马上会得到奖励。布里兰使用典型条件反射将标记信号与奖励联系在一起,因此当狗听到这一信号时将知道它会获得奖励。然后他又通过操作性条件反射使用正面奖励来塑造动物的行为。

因为标记是即时的,所以有助于强化狗的正确行为。标记本身不属于奖励,而只是一种显示狗行为正确并承诺狗获得奖励的信号。因为海洋哺乳类动物本身更倾向于通过声音进行交流,所以训练员自然会用哨声作为标记。

在二十世纪六十年代,凯伦·普赖尔使用了相同的正面强化技术来训练海豚。她意识到需要广泛应用此类行为修正,于是在1984年撰写了《别毙了那条狗》(Don't Shoot the Dog)一书。除了标题,其实它并不是单单只讲训狗。这本书涉及了有关使用正面强化刺激塑造行为的方法,目标范围从宠物猫到难管的小孩。目前,许多公司仍在使用这本书向员工传授高效管理的方法。

普赖尔使用金属响片作为标记开始塑造狗和其他动物的行为,而一提到现代响片培训人们最常想到的也是普赖尔这个名字。其他训练员采用了她的训练方法,并且随着互联网的出现,响片训练得到了快速的普及。

凯伦·普赖尔将响片描述为对所期望行为进行拍照;在关键的时刻按动响片。响片意味着,“你某件事情做得对,并且因此会得到食物奖励。”

许多初学训练员会犯这样的错误,他们针对动物的某一行为按动了响片,但却没有跟进食物奖励。没有实际的奖励,狗可能还会在一段时间内继续执行该行为,但这一行为会慢慢消失。

引入命令

响片本身对狗没有意义。正如巴夫洛夫的铃声需要通过典型的条件反射,从而使狗认识到响片声音意味着“开饭了!”。为此,训练员需要重复按动“激发”响片,然后立即提供食物奖励。这样,狗就会把响片与食物奖励联系到一起。一旦狗认识到响片意味着食物奖励,它就会开始学习新的行为。

训练员引导动物执行一种行为的方法会因人而异。有些人倡导使用食物引导狗就位,而其他人只是等待狗自发做出该行为。多数响片训练员不支持使用手推的方法使狗落位,因为那违背了响片训练中不施加外力的理念。

一旦狗做出了该行为,把握时机就成为了关键。训练员必须在看到期望行为的同时按动响片。如果狗躺倒,然后又打滚,随即听到响片声,那么打滚(而不是躺倒)的动作会被标记为期望的行为。

如果您使用响片训练,按照次序逐步地训练,可以使狗学到复杂的行为方式。例如,如果您要训练狗跳圈,那么开始时您可能只需让狗走到圈前,就可以按动响片并喂食。一旦狗能够稳定地走到圈前时,您就可以只在狗将头伸入圈口时按响响片,然后又只在它穿过圈时按响响片。最后,您只在狗真正完成跳圈动作时按响响片。在狗对每一项新的步骤开始学习时,对其进行奖励的标准也不断提高。这称为塑造。

除了发出命令随即告诉狗该命令的意义何在之外,多数响片训练员更倾向于在狗可以稳定做出期望行为的时候发出命令。可以先通过食物诱导使狗跟随做出期望动作,然后藏起食物,再采用诱导动作(比如,拿着食物从狗的鼻

子前方移动到地板,从而训练狗“下伏”)发出命令的手势信号。很多训练员感到手势信号比口语信号更易于训练狗,但只要能使狗做出反应,哪种信号都是理想的。一旦狗做出期望的行为,训练员可以开始使用命令,从而使狗学会将两者联系起来。最后,训练员将只需在命令发出后就按响响片,而不是在狗自发做出行为时才按响响片。

记住动物属于情境学习者很重要。这意味着,它们可能在一处了解某个命令的含义,而到了另一处却不适用。当训练员站立时狗可能会完美地坐在那里,但当训练员坐着向其发出命令时,狗则会变得惘然。当训练一种新的命令时,训练员需要添加新的环境(有必要的话可以提前预备),从而帮助狗学习。

消除不良行为

训练狗做好事要远比训练狗不做坏事要容易得多。在准备改掉狗的一个不良行为时,首先需要考虑的是要求狗改掉坏习惯所需的奖励是什么。狗必须得到奖励,否则狗不会坚持做一种行为,但有时奖励作用不会十分明显或适得其反。当狗跃向主人而主人却将其推开的惩罚(对于狗来说,与主人进行肢体接触属于身体触摸奖励)可能比对狗大吼都更具威慑力。

训练员必须注意不要无故对不良的行为进行奖励。一旦训练员察觉并消除意外奖励(达到可能的最大程度),下一步通常是训练一种与之相反的行为。狗学会在主人拾起皮带时坐着不动,不可以同时跳起将主人扑倒。

响片是一种训练工具,然而训练员不应当无节制地使用。使用响片的目的是为了告诉狗什么是期望的行为。一旦狗理解命令并可以稳定执行时,您便可以停止使用响片。您可以继续奖励狗,但随着时间的推移,您可以从一种狗

最喜欢的食物奖励转变成一种对狗吸引力稍小的食物奖励,然后可以转变成只有口头奖励。当行为已完全掌握时,可能根本不需要奖励,尽管狗与人都希望做好一件好事后得到一些反馈。

操作性条件反射在塑造包括狗在内的几乎所有动物的行为都非常有用。训练中强调使用正面强化可以使所有人都乐在其中,并且可以加深训练员和学习者的情感。使用响片可以精确地指出期望行为,并大大加快训练进程。狗没有学会某项任务通常是因为沟通的失败而不是狗不愿意配合,然而一位好的训练员可以解决这些问题。这种训练真正的唯一局限是训练员正确识别有意义的强化刺激的能力,并将期望的行为分解为可管理的步骤的能力。

相关词条

相关搜索

其它词条