본문 바로가기

전공관련이론정리

[교육학] 계속적 강화와 간헐적 강화의 유용성

안녕하세요. 이번 포스팅은 교육학에서 나오는 강화계획에 대한 내용을 말씀드리겠습니다. 강화에는 보상을 기준으로한 정적 강화와 부적 강화로 나누어 볼 수 있고, 시간을 기준으로한 계속적 강화와 간헐적 강화 두가지가 있는데 이번 포스팅에서는 계속적 강화와 간헐적 강화를 위주로 이를 정리하고 실생활의 예를 들어 설명드리겠습니다.

 

 행동주의 이론에서는 인간의 행동은 학습에 의해 형성된다고 보았습니다. 여기서 학습이랑 자극에 대한 반응으로 고전적 조건화, 도구적 조건화, 조작적 조건화를 말하는 것입니다. 이 중에서 강화의 강화계획을 알아보기 위해 조작적 조건화에 대해 알아보겠습니다.

 

- 작동조건형성 : 손 다이크에 의해서 도구적 조건형성이 확립된 이후 스키너는 스키너 상자를 이용하여 비둘기의 행동을 실험했습니다. 작동조건형성이란 수동조건형성과는 달리 행동에 의해 반응이 나타나는 것으로 인간의 대부분은 작동조건형성에 의해 학습됩니다. 예를 들어 비둘기가 스위치를 누르면 먹이가 나온다고 할 경우 스위치를 누르는 행동이 먹이라는 반응으로 나타났습니다. 이런 반응이 반복된다면 스위치를 누르는 것을 학습하게 된다는 것입니다.

 

- 강화 : 스키너는 반응을 증가시키는 먹이를 강화물이라고 불렀고, 행동이나 강화시키는 절차를 강화라고 하였습니다. 강화에는 정적 강화와 부적 강화로 나누어지는데 정적 강화란 행동을 함으로써 좋은 것, 이로운 것을 얻게 되는 것이고, 부적 강화란 행동을 함으로써 나쁜 것, 해로운 것을 피할 수 있게 되는 것입니다. 예를 들어 설명하면 칭찬(정적 강화물)을 받기 위해 공부를 열심히 하거나, 숙제(부적 강화물)를 하지 않기 위해 공부를 한다는 예를 생각해 볼 수 있습니다.

 

 여기까지 작동조건 형성과 강화가 무엇인지에 대해 알아보았습니다. 그렇다면 강화를 다시 시간의 분류로 나누어 볼 수 있습니다. 계속적 강화란 행동이 있을 때마다 강화물을 주는 경우로, 행동을 빨리 변화시키기 때문에 학습 초기 단계에 가장 효과적입니다. 간헐적 강화란 행동을 할 때마다 강화물을 주는 것이 아닌 가끔씩 강화물을 주는 경우로, 계속적 강화보다 소거에 대한 저항이 강하고 학습된 행동을 유지하는데 쓰여집니다. 간헐적 강화에는 시간 간경에 따라 강화물을 주는 경우와 반응 수에 따라 강화물을 주는 경우로 나누어지는데, 여기에 시간 및 반응 수를 고정하느냐 변동하느냐로 다시 두 가지로 나누어지게 됩니다. 간헐적 강화는 정해진 횟수를 채울 때마다, 정해진 시간마다, 무작위 횟수마다, 무작위 시간마다 강화를 하는 경우로 4가지로 나누어지는데 이를 강화계획이라고 합니다.

 

 

- 강화계획

 

(1) 고정 비율 계획 : 시간에 관계없이 일정한 수의 반응을 하고 난 후 강화를 주는 것입니다. 5개의 반응을 기준으로 잡았다면 30초에 5개, 1분에 5개와 같이 시간에는 상관없이 5번의 행동 후 강화를 주는 것입니다. 짧은 시간에 많은 반응을 하는 것이 유리함으로 이 강화계획에는 높은 반응률이 나타나게 됩니다. 그 예로, 쿠폰 10장을 모아오면 사은품을 주는 경우, 일정한 수만큼의 제품을 만들었을 때 보상을 해주는 경우가 있습니다.

 

(2) 고정 간격 계획 : 일정한 시간이 지난 다음에 반응을 할 경우 강화를 주는 것입니다. 일정한 간격을 5분이라고 했을 때 강화를 받은 후 5분 동안은 아무리 많은 반응을 하더라도 강화를 주지 않고 다시 5분이 지난 후에 반응에만 강화를 주게 됩니다. 강화하고 난 후 잠깐 동안의 멈춤이 생기나 일정 시간이 지나면 다시 강화를 기대하고 급격한 행동의 향상이 나타나게 됩니다. 그 예로, 모바일 게임에서 일정 간격마다 주는 게임 가능 횟수, 월급, 매주 보는 시험 같은 경우가 있습니다.

 

(3) 변동 비율 계획 : 고정 비율 계획과 같이 일정한 수의 반응을 하면 강화가 주어지지만, 강화와 강화 간에 반응하는 횟수가 평균수에 따라 일정하지 않은 계획입니다. 만약 평균적으로 20번의 보상을 받는다면 어떤 경우에는 1번 만에 받을 수도 있고, 어떤 경우에는 30번이 지나도 강화를 받지 못하는 경우도 있습니다. 그 예로, 행사장에서 무작위로 선택을 할 경우 당첨되기 위해 손을 들었을 경우 첫 번째로 뽑힐 수도 있지만 여러 번 후에 뽑히거나 안 뽑힐 가능성도 있는 경우와, 대표적으로 도박을 생각해 볼 수 있습니다.

 

(4) 변동 간격 계획 : 일정한 시간 간격이 아닌 어떤 평균 시간을 중심으로 변동하여 강화하는 것입니다. 평균 60초의 시간 간격이라면 0~120초 사이에 어느 시간이라도 강화가 일어 날 수 있습니다. 그 예로, 비주기적인 간격으로 선물을 보내면 받는 사람은 기다리게 되는 경우와 예고하지 않고 불시에 시험을 치르는 경우를 생각해 볼 수 있습니다.

 

강화 계획의 종류와 정의, 반응 패턴

 

강화 계획 

 정의

 반응 패턴 

연속 강화

 매 반응 후 강화

 지속성이 거의 없음

고정 간격

 일정한 시간 간격에 따른 예측 가능한 강화

 약한 지속성

 강화자가 나타나기 전에 임박하여 반응률이 높아지고 강화 뒤에 일시적으로 반응이 중단

변동 간격

 불규칙적인 시간 간격에 따른 예상이 불가능한 강화

 강한 지속성

 완만하고 안정된 반응률을 보이며 강화 뒤에 일시적 반응 중단이 없음

고정 비율

 일정한 반응 수에 따른 예측 가능한 강화

 약한 지속성

 높은 반응률을 보이며 강화 뒤에 일시적으로 반응이 중단

변동 비율

 불규칙적인 반응 수에 따른 예상이 불가능한 강화

 강한 지속성

 아주 높은 반응률을 보이며 강화 뒤에 일시적인 반응 중단이 거의 없음

 

 작동조건형성은 강화의 정도에 따라 반응의 횟수가 달라지는 모습을 확인했고, 실생활에서 매우 유용하게 사용할 수 있습니다. 인간은 어떤 행동에 대하여 보상이 주어지면 능률이 높아지고 좋은 행동을 만들고 유지하는데 매우 큰 도움이 되는 것을 확인할 수 있습니다. 예를 들어 일반적인 학생들에게 공부는 하기 싫은 행동이지만 10문제를 풀면 바로 집에 가도 된다는 강화를 준다면 집중력이나 학습 속도 등에 굉장히 큰 영향을 미치게 됩니다. 강화계획에 따라서 지속성의 차이가 있으나 상황에 맞는 계획을 잘 활용한다면 우리 삶에 굉장히 많은 영역에서 영향을 미칠 수 있다고 생각이 듭니다.