操作性调节是一个学习过程在其与后果的关系中获取和修改新行为。加强行为增加了未来再次发生的可能性,同时惩罚行为会降低它将重复的可能性。
在操作调节,加强时间表是学习过程的重要组成部分。当我们加强行为的何时以及多久可能对响应的力量和率产生巨大影响。
加强时间表
A schedule of reinforcement is basically a rule stating which instances of behavior will be reinforced. In some cases, a behavior might be reinforced every time it occurs. Sometimes, a behavior might not be reinforced at all.
加固时间表在天然存在的学习情况以及更多结构化培训情况下进行。在现实世界的环境中,每次发生时,行为都不会加强。在您故意努力加强特定行动的情况(例如在学校,体育或动物培训中),您将遵循特定的加强计划。
某些时间表更适合某些类型的培训情况。在某些情况下,培训可能会呼叫一个时间表,然后一旦教授所需的行为,就会转到另一个时间表。
钢筋时间表的类型
两种整体钢筋调度形式被称为连续加固和部分加固。
Continuous Reinforcement
在连续增强中,每一次发生期望的行为都会加强。在学习的初始阶段,该计划最适用于在行为和响应之间创建强大的关联。
例如,想象一下,你正试图教狗握手。在学习的初始阶段,您将坚持持续的加强计划,以教导和建立行为。这可能涉及抓住狗的爪子,摇晃它,说“摇晃”,然后每次执行这些步骤提供奖励。最终,狗将开始自己执行动作。
在尝试教导新行为时,持续加强时间最有效。它表示每个狭义限定的响应之后的模式,然后是狭义的后果。
部分加固
一旦响应牢固建立,持续加固时间表通常会转换为部分钢筋时间表。在部分(或间歇性)加固中,响应仅加强了一部分的时间。通过部分强化更慢地获得了学习的行为,但响应更耐受灭绝。
想想早期的例子,你训练狗摇晃和。虽然您最初使用持续加固,但每次加强行为都是不切实际的。及时,一旦建立行为或在相当长的时间过去,就可以切换到部分时间表以提供额外的强化。
There are four schedules of partial reinforcement:
固定比例表
固定比例表是否只在指定数量的响应之后加强了响应的那些。该时间表产生高,稳定的响应率,只有在递送加强件后的短暂停顿。固定比例的一个例子将在压力条后将食物颗粒递送到大鼠之后。
可变比例表
可变比例表当在不可预测的响应之后加强响应时发生。该计划创造了高稳定的响应速度。赌博和彩票游戏是基于可变比率计划的奖励的好示例。在实验室设置中,这可能涉及在一条杆压机后将食物颗粒输送到大鼠后,再次在四个条压机后再次,然后再次在两个条压机后再次。
固定间隔时间表
固定间隔时间表是第一个响应仅在特定时间经过的时间奖励的那些。该计划在间隔结束时导致高量的响应,但在送加强件后立即响应较慢。在实验室设置中,在实验室设置中的一个例子将在30秒间隔经过30秒间隔之后通过用于第一条压制的实验室芯片加强大鼠。
可变间隔时间表
可变间隔时间表在不可预测的时间后奖励响应时出现。该计划产生缓慢,稳定的响应速度。
在一分钟间隔之后,第一条压制后,将食物颗粒递送到大鼠的情况下;在5分钟间隔后的第一个反应的第二个颗粒;在三分钟间隔后的第一种反应的第三个颗粒。
Using the Appropriate Schedule
决定何时加强行为可以取决于许多因素。在您专门试图教授新行为的情况下,连续的时间表通常是一个不错的选择。一旦学习了行为,通常更优选地切换到部分时间表。
在日常生活中,削减的部分时间表比连续的更频繁发生。例如,想象一下,如果您在每次展示按时工作时收到奖励。随着时间的推移,而不是奖励是积极的加强,否认奖励可以被视为负强化。
相反,像这样的奖励通常会在更不可预测的部分钢筋时间表中脱颖而出。不仅是这些更现实的,而且它们也倾向于产生更高的反应率,同时不易灭绝。
一旦建立行为,部分时间表会降低饱满的风险。如果没有结束给出奖励,则如果不再需要奖励或需要,则主题可能会停止执行行为。
例如,想象一下,你正试图教狗坐下。如果您每次使用食物作为奖励,那么狗可能会停止执行一次。在这种情况下,像赞美或关注的东西可能更有效地加强已经建立的行为。
来自粗糙的一个词
操作性条件作用可以是一个强大的学习ol. The schedule of reinforcement utilized during training and maintenance process can have a major influence on how quickly a behavior is acquired, the strength of the response, and how frequently the behavior is displayed.
为了确定哪个计划是优选的,您需要考虑情况的不同方面,包括所教导的行为类型以及所需的响应类型。