부분적보상 part 1

포커심리학

부분적보상 part 1

M 포커라이프 1 4,799 2021.09.29 16:02

53a1ab4f80e87d9d4447322424bb270e_1632898899_2859.jpg
 

자, 오늘은 제가 2번째로 좋아하는 곳, 교실로 돌아가는 중입니다.



교실(*학교)은 언제나 가장 중요하고 좋아하는 곳이였지만 교실에 머무르지 않고 휴식을 취하는 것에 대한 즐거움을 찾았으며 거기다 저는 새롭고 더 재밌는 취미가 생겼습니다. 바로 포커를 하는 것입니다.



하지만 당신이 매주 교실에 찾아온다면, 제가 여전히 교수 복장(?)을 하고 강의를 할 수 밖에 없다는 것을 아실 겁니다. 오늘은 ‘보상(reinforcement)와 보상(reward)’의 2번째 이야기중 중 첫번째 이야기를 하려고 합니다.



당신이 만약 “보상(reward)”을 생각한다면 마치 엄청난 팟을 가져가거나 350명이 참가한 “주간 토너먼트”에서 우승을 한다는 정도로 생각할 것입니다. 틀린 말은 아니지만 또 맞는 말은 아닙니다.



제가 생각하는 것은 더 현실적이지만 심리학적으로 굉장히 흥미로운 것입니다. 예를 들면, 긴 세션에서 엄청나게 고생하지만 다행히 본전으로 끝나거나, 핸드를 잘 플레이했거나, 블러프를 잘 실행하는 것과 같은 작고도 반복적인 ‘보상(reinforcement)’이라고 할 수 있겠습니다.



그리고 심지어는 한줄기 희망과 같은 상황도 포함될 수 있는데, 예를 들면 당신이 상대의 ‘멍청한’ 콜 때문에 돈을 잃었지만 그 뒤에 상대를 suck-out 해서 팟을 취하거나, 아니면 배드빗 잭팟의 일부를 얻는 것 또한 제가 말하는 ‘보상(reinforcement)’이 될 수 있습니다.



여기서 제가 말하는 “보상(reinforcement)”의 개념은 이른 세기의 심리학자들에 의해서 만들어 졌는데 그 이유는 그들은 어떤 점(*이유)들이 보상(rewarding)을 만드는지 몰랐기 때문입니다. 잘 생각해보시면 우리가 일반적으로 말하는 ‘보상(rewarding)’의 개념과는 다르다는 것을 알게 될 것인데 그 이유는 그들과 제가 지금 말하려고 하는 ‘보상(reinforcement)’은 실제로 어떤 것을 ‘보상(rewarding)’해주는지 알 수가 없습니다.



(*글이 많이 어려운데 쉽게 생각해보면 우리가 일반적으로 말하는 ‘보상(reward)’은 예를들면 5시간을 일했고 시급이 5천원이라면 2만 5천원을 받는 게 정해져 있지만 저자가 말하는 ‘보상(reinforcement)’은 이 것과는 다른 것이 우리가 배드빗을 당했거나 상대가 ‘멍청한’ 콜을 해서 돈을 잃었다고는 하지만 그 뒤에 ‘보상(reward)’, 즉 돈을 따는 이유가 앞서 당한 일들 때문이 아니라는 것입니다.)



 


대부분의 사람들은 벗겨진 소가죽 등으로 만들어진 채찍을 별로 좋아하지 않지만 다 그렇지는 않습니다. 몇몇 사람들은 롤러 코스터를 무섭지만 기분을 북돋아 주는 아주 멋진 놀이기구로 생각하지만, 모든 사람이 그렇게 생각하지는 않습니다.  

 


53a1ab4f80e87d9d4447322424bb270e_1632898908_5179.jpg
 

When good reinforcement

goes bad.

 

만약 어떤 것들이 ‘보상(rewarding)’될지 모른다면 당신은 다른 개념이 필요할 것입니다. 그런 것들은 ‘보상(reinforcement)’으로 불려지는, 달리 말하면 그 전에 무슨 일이 일어났던지 간에 ‘지지(*support와 같은 개념)’를 해주는 기능 말입니다 -어떤 일의 상태로 이끌어주는 것들 말입니다.(*위의 주석과 비슷한 설명으로 보시면 되겠습니다.)  

 


첫번째로, 초기의 리서쳐들은 ‘보상(reinforcement) 자체보다 이 것이 어떻게 ‘보상(reinforcement)’에 도달하는 지가 더 중요하다’는 것을 발견했습니다.



두 번째로, ‘보상(reinforcement)’이 불규칙적인 간격으로 도달하고 예상할 수 없다면 이 보상들은 굉장히 받기가 힘듭니다. 그리고 이러한 성질들은 ‘보상(reinforcement)’자체를 굉장히 강하고 걸리기 힘들게 만듭니다.  


 

53a1ab4f80e87d9d4447322424bb270e_1632898921_2888.jpg 

Slots pay off in the long run.

It's a scientific fact. 

 

 

예를 들어 당신은 매일 마다 자판기에서 소다를 사먹는다고 가정합시다. 어느 날 여느때와 마찬가지로 돈을 넣고 소다를 사먹으려고 했는데 소다가 없습니다. 당신은 어떻게 하시겠습니까?



뭐, 당신은 코인을 몇 개 더 넣어서 확인해볼 수 도 있습니다. 그리고 만약 또 소다가 나오지 않는다면 더 이상 그 자판기에 손 대지 않을 것입니다.



자, 그럼 자판기 대신 당신이 slot muchine 에 앉았다고 가정합시다. 위와 똑같이 동전을 넣습니다. 아무 것도 결과물이 없습니다. 또 넣습니다. 꽝입니다. 계속 꽝... 2번 꽝.... 자판기와는 다르게 당신은 굉장히 오랫동안 많은 동전을 투자할 것입니다.



사실, 자판기와 slot machine 둘 다 고장이 났다고(*여기서 slot machine의 ‘고장’의 의미는 돈을 따지 못한다는 사실을 깨닫는 것이겠죠) 알 수 있지만 자판기의 고장을 알아차리는 것보다 slot muchine의 고장을 알아차리는 것이 훨씬 더 오래 걸리는 것은 극명한 사실입니다.



그 이유는 경험적으로나 역사적으로 자판기는 연속된 ‘보상’이라는 시스템을 탑재하고 있습니다. 매번 돈을 넣을 때마다 음료수를 줍니다. 만약 돈을 넣었는데 음료수를 안준다면 당신은 쉽게 그 자판기를 사용하지 않을 것입니다.  



Slot muchine은 반대로 굉장히 힘들 뿐만 아니라 불규칙적으로 보상을 해주기 때문에 굉장히 일관적인 행동을 사람으로 하게 끔 만듭니다. 당신은 그저 계속 코인을 넣고 돌립니다.



두가지의 다른 상황을 우리는 “부분적 보상 효과”라고 하며 이 것은 심리학적으로 가장 강한 원칙 중 하나입니다. 만약 보상(reinforcement)이나 보상(reward)이 굉장히 불규칙적으로 도달한다면 사람들은 드라마틱한 임팩트를 받게 됩니다. 이 것이 무슨 일이든지 간에 당신은 굉장히 그 것을 갈망할 것이며 멈추지 않고 계속 거기에 도전하게 됩니다.



제가 말하는 것에 더 나은 설명을 위해서 여기에 실험 하나를 소개 하겠습니다. 당신이 하는 게임에서 A-K 핸드는 무조건 승리하는 핸드라고 가정합시다. 당신은 작은 리밋에서 게임을 하고 있고 당신이 A-K를 가지고 있을 때마다 1불씩 딴다고 가정합시다.



석 아웃도 없고 반전도 없으며 말도 안되는 카드도 없다고 합시다. 당신이 A-K를 가지고 있을 때마다 그저 1불씩 딴다고 합시다.



자 그리고 또 다른 가정을 하나 만들어봅시다. 다른 게임입니다. 여기서는 당신이 A-K를 들고 있을 때 “평균”적으로 1불을 딴다고 가정합시다. 당신은 상대의 스트레이트에 질 수도 있고 A-K-K-8-6보드에 하트가 4개인 보드에서 상대로 하여금 굉장히 큰 팟을 가져갈 수도 있으며 플랍 전에 레이즈를 했는데 상대가 다 죽어서 별로 되지도 않는 돈을 딸 수도 있습니다. 또한 당신은 상대의 빅 레이즈에 죽을 수도 있구요.



둘 중에 어떤 게임을 더 하고 싶습니까? 저라면 당연히 2번째 게임을 하고 싶습니다. 그리고 포커를 하는 사람들 중 누가 첫번째 게임을 하고 싶어하겠습니까?

 


53a1ab4f80e87d9d4447322424bb270e_1632898930_9846.jpg
 

Some people only see things

in cash-money terms.


이 것은 굉장히 쉬운 것처럼 보입니다. 하지만 아닙니다. 두 가정에서 A-K는 똑 같은 돈의 가치를 가지고 있는 핸드입니다. 두 가지 상황 모두 당신은 A-K를 가졌을 때마다 1불씩 획득하게 됩니다. 하지만 하지만 2번째 경우가 명백하게 더 끌리며, 우리는 그것을 “부분적 보상 효과”때문이라고 합니다.



위에서 말한 ‘부분적 보상 효과’에서 우리는 도파민이라는 신경전달 물질의 효과에 눈 여겨 볼 필요가 있습니다. 위와 같은 빅 팟을 이겼을 때, 도파민이라는 신경전달 물질이 뇌에서 만들어지게 됩니다. 빅 팟을 이겼을 때와 같은 상황은 잘 일어나지도 않지만 예상도 할 수 없기 때문에 이런 상황을 상상하거나 예견한다는 것 자체가 (*뇌에) 큰 효과를 불러 일으킵니다.



결론적으로, ‘보상’의 힘은 이런 ‘부분적인 보상’이 셋팅되어 있어야만 나타나게 됩니다. 만약 당신이 빅 핸드를 가질 때마다 똑 같은 양의 돈을 딴다면, 포커에 대한 흥미와 재미도 없어 질 뿐더러 환희를 느끼기도 힘듭니다.



자, 오늘의 메시지는 이것입니다. 정말 기본적인 것은 뱅크롤의 핵심은 당신이 생각했던 것보다 더 복잡하고 착각하기 쉽습니다. 이 것은 그저 당신이 딴 돈이 얼마큼 되는지를 척도하는 방법이 아닙니다. 이 돈이 어떤 환경에서 쌓아졌는지가 더 중요하다는 것입니다.



2번째 파트에서는 “부분적 보상 효과”가 왜 ‘하수는 계속 하수에 머무는지’에 대해 이해할 수 있게 도와주는지 알아보겠습니다.

, , , , , , , , , , , , , , , , , , , , , , , , , ,

Comments

4 규형 2023.08.23 00:13
좋은자료 감사합니다.