본문 바로가기
심리학/심리학이야기

게임이론 [팃포탯(tit for tat) 전략]

by 발칙한상상가 2022. 11. 18.
반응형

게임이론의 전제는 어떤 사람이건 나쁜 행동(배신)을 할 수도 있고 반대로 착한 행동(협력)도 할 수 있다는 것입니다.
타고난 품성과 상관없이 게임의 환경에 따라 사람은 배신과 협동을 선택하게 됩니다. 게임 전략에 따라 나쁜 놈들로부터 얼마든지 선한 협력을 유도할 수 있습니다. 상대의 협력을 이끌어내는 최고의 전략 '팃포탯(tit for tat)'입니다. [광인일기], [아큐정전]을 쓴 중국의 문학가 겸 사상가 루싄(1881 ~ 1936)은 1929년 '페어플레이는 아직 이르다.'라는 글을 발표했습니다. 
이 글에서 루싄은 "사람을 무는 개가 물에 빠졌을 때 그 개를 구해줘서는 안 된다. 오히려 더 두들겨 패야한다. 그렇지 않으면 개가 물에 나와 다시 사람을 문다."라는 대목이 있습니다. 게임이론에 따르면 루싄의 이 같은 태도는 사회의 전체적인 효용을 높이는 데 매우 유용합니다. 이런 보복 전략을 게임이론에서는 '팃포탯'이라고 부릅니다. 영어로 tit은 '가볍게 툭 친다'는 뜻, 그리고 tat 역시 그와 비슷한 '가볍게 때린다'는 뜻입니다. 즉 팃포탯은 '상대가 먼저 툭 치면 나도 맞받아서 툭 친다'라고 해석이 됩니다. 좀 더 쉽게 표현하자면 함무라비 법전에 나오는 "눈에는 눈, 이에는 이"전략이 팃포텟에 가장 가깝습니다. 이 전략은 매우 단순합니다. 상대가 협력하면 나도 협력하고, 상대가 배신하면 나도 배신한다. 그래서 미시간 대학교 정치학과 로버트 액설로드(Robert Axelrod, 1943 ~)교수가 '컴퓨터로 진행되는 죄수의 딜레마 대회 (Computer Prisoner's Dilemma Tournament)'를 개최했습니다. 죄수의 딜레마 상황을 여러 번 반복했을 때 참가자들이 어떤 전략을 구사하는지를 확인하고자 했습니다. 이 대회에는 경제학자를 비롯해 심리학자, 수학자, 정치학자, 사회학자 등 각 분야의 게임이론 전문가들이 만든 14개의 전략이 참여했습니다. 대회는 라운드 로빈 방식(참가자들이 공정하게 서로 돌아가면서 한 차례씩 싸우는 방식)으로 진행됐는데, 놀랍게는 우승의 영광은 가장 단순한 전략 중 하나였던 팃포탯에게 돌아갔습니다.
팃포탯을 제출한 이는 토론토 대학교 수학과 아나톨 라포포트(Anatol Rapoport, 1911 ~ 2007) 교수였습니다. 1회 대회를 마친 뒤 액설로드 교수는 대회 결과를 널리 알렸습니다. 그리고 팃포탯을 꺾을 새로운 도전자를 찾기 위해 2회 대회를 개최했습니다. 이번에는 진화생물학, 물리학, 컴퓨터과학 분야의 교수들도 참전했습니다. 심지어 1회 대회 우승 전략인 팃포탯을 변형한 전략도 등장했습니다. 이처럼 2회 대회에는 무려 62개의 전략이 도전장을 내밀었는데, 이번에도 우승은 팃포탯에게 돌아갔습니다.
팃포탯 전략의 핵심은 다음의 네 가지입니다.
① 나의 출발은 언제나 협동으로부터 시작합니다. 즉 죄수의 딜레마 상황에서 나는 첫판 때 무조건 협력(범죄 사실을 불지 않는다)으로 시작합니다. ② 상대가 이전 판에서 나를 배신했다면, 나는 다음 판에서 반드시 배신으로 보복합니다. 첫 판에서 나는 협동을 선택했는데 상대가 배신을 택해 이익을 누렸다면, 두 번째 판에서는 나는 반드시 배신을 선택함으로써 상대를 응징합니다. ③ 상대가 이전 판에 협동을 선택했다면, 나는 반드시 다음 판에서 협동으로 보상합니다. 팃포탯 전략은 과거를 묻는 감정적인 전략이 아닙니다. 과거에 상대가 99판을 배신했더라도 직전 판에서 협동을 선택하면 나도 다음 판에서 반드시 협력을 택합니다. ④ 내가 팃포탯 전략을 사용한다는 사실을 만천하에 공표합니다. 이 전략은 상대에게 배신을 두려워하도록 만들고, 협력을 선호하도록 유도합니다. 이건 상대의 인격과 아무 상관이 없는 문제입니다. '네가 배신하면 다도 배신으로 응징한다. 대신 네가 협력하면 나도 반드시 협력으로 보상한다.'는 사실을 반복적으로 주입하면 상대는 결국 배신보다 협력이 자기에게 장기적으로 유리하다는 사실을 깨닫습니다. 팃포탯을 꺾은 새로운 게임이론 챔피언의 등장 엑셀로드 교수의 실험 이후 팃포텟은 지상 최고의 게임 전략으로 떠올랐습니다. 이후 수많은 경제학자, 사회학자, 정치학자, 공학자들이 팃포탯을 꺾을 전략을 연구했습니다. 팃포탯을 포함해 여러 전략들이 경합하는 다양한 대회도 연속적으로 개최됐습니다. 그런데 프랑스의 릴 과학기술 대학교 공학자인 브뤼노 보피스, 장-폴 들라이예, 필리프 마튜 등이 공동 개최 한 대회에서 마침내 새 챔피언이 탄생했습니다. 이 대회에는 부동의 챔피언 팃포텟을 비롯해 인간의 다양한 심리를 담은 12개 대표적 전략이 참여했습니다. 그런데 이들 중 가중처벌(Gradual)이라는 이름의 전략이 팃포탯을 2위로 밀어내고 마침내 새 챔피언에 등극한 것입니다. 가중처벌 전략의 내용은 이렇습니다. 이들은 일단 팃포탯과 마찬가지로 첫 판에서 협동을 선택합니다. 그리고 상대가 한 번 배신하면 나도 다음 판에서 똑같이 배신으로 응징합니다. 여기까지는 팃포탯과 완벽하게 똑같습니다. 그런데 상대가 두 번째로 배신의 버튼을 누르면 나의 응징이 두 배로 강해집니다. 상대의 두 번째 배신에 대해 이 전략은 두 판 연속으로 배신하는 것을 선택함으로써 상대를 더 강하게 압박합니다. 이래도 상대가 정신을 못 차리고 세 번째 배신을 선택하면, 나는 다음 판부터 내리 세 판을 연달아 배신해서 보복의 강도를 더 높입니다. 즉 이 전략은 상대의 배신에 대해 팃포탯보다 더 강하게 응징하는 것을 전략의 원칙으로 삼는 것입니다. 이 전략이 마침내 새로운 챔피언에 올랐지만 그것을 이유로 팃포탯의 위력을 평가절하하는 사람들은 아무도 없었습니다. 왜냐하면 이 와중에도 팃포탯이 2위를 차지하기도 했고, 챔피언에 오른 가중처벌 전략 역시 팃포텟을 계승한 변형 팃포탯이었기 때문입니다. 그래서 이 대회의 결과 또한 다시 한번 팃포탯의 위력을 확인하는 것으로 마무리됐습니다. 새 챔피언의 전략에 따라 우리의 바람직한 행동을 유추해보면 다음과 같습니다. 우리는 여전히 상대가 협력하면 나도 협력하고, 상대가 배신하면 나도 배신(대신 훨씬 더 거칠게 배신한다)해야 합니다.

 

반응형

'심리학 > 심리학이야기' 카테고리의 다른 글

성과급 실험  (0) 2022.11.20
최후통첩게임(Ultimatum game) 심리학  (0) 2022.11.20
함정 게임의 속성  (0) 2022.11.18
전망이론(Prospect Theory) 심리학  (0) 2022.11.16
게임이론의 정의  (0) 2022.11.15

댓글