奖励,对狗狗来说,是一种积极而快乐的体验,它同样是伴发于某一特定行为---出色完成工作而获得的“酬劳”。奖励同强化的区别在于其各自的时效性。
犬完成要求的动作后必须立刻给予奖励,这样,犬才能将“奖励”同这一行为联系起来。而对于“特定行为”奖励的延迟,即使只有几秒钟,都可能使犬将接下来做的动作误认为是你所要求的动作:打比方说,在训练中,你给犬下达“坐”的指令后,它完成了动作,如果你没有及时给予奖励,而当它站起来时,你才给予美味食物,那么下次在你下达“坐”的指令时,它很可能会做“坐下,站立”两个动作。
各种类型的奖励主要有三种不同性质的奖励方式:
有意识的奖励
目的性奖励不需要花费太多时间进行练习,“金刚箍”和刺耳的吼声也无“用武之地”、它的实质简单的说就是让犬认识到它该怎样做力瀧获得奖励。
用执行“坐”这个指令做例子。手里拿一小块美食(犬喜欢吃的),边展示边移动到犬的头部上方,恰好在它够不到的位置停住。这时它可能会想尽办法来夺这一“美味”,不必理会它。如果它移动了身体,即使只动一丁点儿,迅速将将食物攥在手里不让它得到。反复几次,犬就会有些气馁,转而改变方法,坐下来,仔细端详这“稀罕物”。
在它屁股将着地的瞬间,下达“坐”的口令,让它把口令同“坐”这个姿势联系起来,并给予奖励。当下一次它打算得到美食时,只要情形相似,它会记起要坐下来静候“佳肴”的。如此反复,当它看到食物的时候自然就会坐下来,而不需要下口令。这样它就自学成才,掌握了获得奖励的方法;而我们所要做的则是让犬将“坐”的口令同相 对应动作形成条件反射,即使在我们不提供食物情况下,它也执行命令,准确完成动作。
非有意识的奖励
在日常生活中,我们常常在不经意间给了犬一些奖励,变相地鼓励了那些不好行为,而我们却没有意识到。在那些极度渴求被人们关注的犬身上,这种奖励表现得格外明显。在我们接听电话时,狗叼起一件玩具,我们会很自然地认为那是正常的行为,而不过多关注。如果它叼起人的一只鞋子,我们可能会暂时中断电话,把鞋子从它口中夺下来并拿开。在犬看来,“关注”可没有斥责或赞扬的区别。只要你和它接触了、交流了,即使是粗暴的动作或者大声的叫嚷,在它看来也都是成功。所以当下一次电话铃响起时,它还会重复这样的动作,那时真有些说不清是谁在训练谁了!这样的犬,其本性并不具有抗拒性,而且通常都十分聪明:如果我们不注意,一不小心就可能被它“折腾” 得够戗。或许,正是那些不经意的奖励使犬养成了不好的行为习惯,变得越来越来越不听话了。
生存奖励
某些特定行为对犬产生的奖励效果远比人类所能提供的奖励效果要强大得多。生存是动物唯一目的。如何健康、健壮地存活下去是它们时刻需要考虑和面对的问题。这个目的受到威胁与挑战时,它就会使用“4F”策略中的任何一条。在幼龄时,如果犬没有与人进行良好的接触和沟通,成年后就会对陌生人产生恐惧感。当它看到陌生人时,做出的第一个反应可能就是摆出“进攻”架势或者直接攻击陌生人。而人通常会被吓一跳,向后闪开。这在犬看来,它认为这样“救了自己一命”,是对自己很大的“奖励”,而这种奖励是“生存”意义上的奖励,是最根本,也是最重要的。这种攻击行为将被迅速强化,在犬感到危险时就会表现出来。
在这种情况下,如果你想用食物吸引犬的注意力,这种做法常常是徒劳的。对犬来说,面对生死存亡,食物显然已没有多大诱惑力:一旦出现这样的情况,我们需要预先做好回避反应,将犬的注意力转移回主人身上,然后再采用强化训练方法教会它采用不同的行为来应对类似的情况。
阻止性不奖励
对狗十分期待的奖励给予忽视或取消就是不奖励。它可以使犬和其他动物产生挫败感,即所谓的“希望越大,打击越大”。尽管如此,但如果某一个声音或其他信息已经成为了不奖励的一个标志时,“不奖励”则 不会产生挫败感。动物避开信号,降低挫败感,这本身就是对自身一种奖励,即大家所熟知的“消极回避”。通过这样的方式,犬便可以学会如何避免那牲使它得不到奖励的行为。