본문 바로가기
BOOK & FILM/Shoulders of Giants

이대열(2017). 지능의 탄생. 바다출판사

by 지표덕후 2019. 11. 20.
반응형
지능의 탄생
국내도서
저자 : 이대열
출판 : 바다출판사 2017.04.13
상세보기

 

p.23
  지능이란 생각하고 공감하고 꿈꾸고 개념을 생산하는 전반적인 지적 능력을 포괄하는 개념이다.

p.24
  지능은 학자에 따라 다르게 정의되지만, 결국 인간의 지적 능력을 어떻게 세분화할 것인지의 문제 … 공통적으로 지능을 문제 해결 능력과 연관시키고 있따. 특히 해결해야 하는 문제가 복잡할수록 고도의 지능을 요구하는 것은 명백하다.

p.26
  결국 지능이란 다양한 환경에서 복잡한 의사결정의 문제를 해결하는 능력이라고 정의할 수 있다.

  지능의 주체를 분명히 밝히지 않고는 특정 행동이 과연 지능적인 행동인지 아닌지를 구별하기 어려운 경우가 있다. 바이러스나 기생충이 우리 몸에 침입해서 인간의 정상적인 행동을 방해하는 경우들이 그렇다.

p.27
  ‘행동behavior’이란 무엇인가? 일반적으로 행동은 어떠한 체계system가 특정한 사건event에 대해서 반응하는 것을 말한다. … 모든 생명체는 나름대로 외부의 자극에 대해서 특정한 방식으로 반응한다.

p.28
  박테리아의 한 종류인 대장균은 먹이가 되는 화학물질의 농도가 높은 쪽으로 움직여가는 능력을 가지고 있다. 이와 같은 능력을 주화성chemotaxis이라고 한다. 대장균이 이동하는 방식은 주로 두 가지이다. 그 중 하나는 같은 방향으로 지속적으로 수영해가는 것이고, 나머지 하는 뒹구르기tumbling을 통해서 새로운 진행 방향을 무작위로 선택하는 것이다. 

p.30
  신경계의 작용을 한 마디로 요약하면 감각 정보와 기억을 이용해서 근육을 통제하는 일이다. 이처럼 신경계를 이용해 현재와 과거의 경험으로부터 유용한 정보를 추출하여 의사결정에 활용하는 일이야말로 지능의 핵심 …
  신경계를 구성하는 신경세포neuron는 전기적인 신호와 화학적인 신호를 이용해서 외부로부터 받은 정보들을 종합해 그 결과를 다른 신경세포나 근육세포에 전달하는 역할을 한다.. 신경세포가 만들어내는 전기적인 신호는 세포막을 경계로 형성되어 있는 전위가 변화할 때 발생한다. …
  신경세포에서 나뭇가지 같은 모양을 하고 있는 곳을 수상돌기dendrite라고 부르는데, 이곳은 신경세포가 다른 신경세포로부터 화학적 신호를 받아들이거나 외부환경으로부터 물리적인 자극을 받아들이는 곳이다. … 수상돌기의 여러 부위에 도착한 신호들이 만들어낸 막 전위의 변화가 신경세포의 중심에 해당하는 세포체soma에서 합쳐졌을 때 어떤 한계점 또는 역치를 넘게 되면 세포막의 전압이 일시적으로 음전하에서 양전하로 변하는데, 이를 활동전압action potential이라고 한다. 일단 신경세포의 세포체 부근에서 활동전압이 생기면, 이는 축삭axon이라는 가느다란 신경 섬유를 따라 전송되어 축삭종말axon terminal에 도착하게 되고, 그곳에서 신경전달물질neuro transimitter을 분비해 화학적인 신호로 전환된다. 신경전달물질은 신경세포들 사이에 존재하는 시냅스synapse라는 좁은 틈을 건너 다른 신경세포에 도착하고, 그때 신경전달물질과 그것을 받아들이는 수용체의 종류에 따라 그 다음 신경세포의 막 전위에 서로 다른 영향을 …. 

p.32
  신경세포는 크게 세 종류로 나눌 수 있다. 첫째, 감각신경세포sensory neuron … 둘째 운동신경세포motor neuron … 세 번째 … 감각신경세포와 운동신경세포를 연결해주는 중간신경세포interneuron다. 

p.42
  신경세포의 수보다 더 중요한 것은 그것의 위치와 연결상태다. 대부분의 동물은 이동 시에 신체의 특정 부위가 앞서 나가는 경향이 있다. 그렇게 되면 감각정보들이 대부분 신체의 전면을 통해서 들어오기 때문에, 정보의 효율적 처리를 위해서 신경세포들 또한 신체의 앞부분에 집중적으로 분포하게 된다. 따라서 많은 동물에서 신경세포는 대부분 머리 안에 존재한다. 특히 척추동물의 신경세포는 머리 속에 더욱 집중되어 있으며 복잡한 구조를 이룬다. 바로 뇌다.

p.44
  특정한 동물의 신경계 전체를 회로도로 그린 것을 ‘커넥톰connectome’이라고 한다.

p.54
  의사결정을 정량화하는 문제를 해결하기 위해 신경과학자들은 경제학의 효용 이론을 도입하게 되었다. 효용이란 선택 가능한 대상(여기서는 행동)의 가치값을 일컫는 용어로, 

  의사결정에 관한 이론의 대부분은 효용utility, 효용함수utility function 또는 그와 유사한 가치value와 같은 개념들에 기반을 두고 있다. 여기서 효용이란 선택 가능한 모든 대상들에 부여된 실수 값이다.

  선택 가능한 모든 대상에 효용처럼 특정한 값을 할당하여 정량화할 수 있다는 것은 이 대상들을 선호도에 따라 순서대로 나열할 수 있다는 것을 뜻한다. 이런 경우, 우리는 선호도가 ‘이행성transitivity’을 충족한다고 말한다. 

p.57
  의사결정은 단순히 가장 좋은 것을 선택하는 것이 아니다. 여러 변수와 요소들을 고려해 대상들 간의 비교우위를 결정하는 역동적인 과정이다.

p.58
  많은 종류의 의사결정에서 효용값과 기댓값은 일치하지 않는다. 그 이유는 크게 두 가지다. 하나는 기댓값을 계산할 때 사용되는 객관적인 지표와 효용이 반드시 비례하지 않기 때문이다. 돈의 액수나 음식의 양처럼 정량화할 수 있는 지표도 항상 효용값과 일치하지 않는다. … 효용을 계산할 때 필요한 정확한 확률값을 구하기 어렵다는 점이다. …
  원하는 결과를 얻을 때까지 기다려야 하는 시간이 늘어날수록 보통 효용값은 줄어든다. … ‘시간 할인temporal discounting’이라고 한다. … 지금 당장 얻을 수 있는 보상에 치중하게 된다. … 보상이 주어지는 시간이 다른 경우들을 놓고 선택하는 것을 시간 간 선택intertemporal choice라고 한다. …
  가장 잘 알려진 연구는 마시멜로 실험이다. 월터 미셸Walter Mishel 교수에 의해 1960년대에 처음 시장된 이 실험 … 

p.61
  모듬 초밥을 먹을 때 가장 좋아하는 초밥을 남겨두었다가 마지막에 먹는 경우가 그렇다. 이와 같은 행동은 원하는 결과가 지연되었을 때 효용이 오히려 증가한다는 것을 의미하기 때문에 음적 시간 할인negative temporal discounting 또는 음적 시간 선호negative time preference라고 한다.
  미래에 얻을 수 있는 더 큰 보상을 위해서 현재의 작은 보상을 포기할 수 있는 능력은 … 협동이나 규칙을 지키는 것처럼 사회적으로 바람직한 행동들은 많은 경우에 즉각적으로 보상이 따르지 않기 때문이다. … 좋은 명성을 유지하는 데 따르는 혜택은 불확실할 뿐 아니라 대부분의 경우에는 오랜 시간이 지난 후에 …

  경제학적인 관점에서 볼 때 모든 선택의 배후에는 효용값이 존재하고, 선택이란 단순히 가장 큰 효용값을 갖는 대상을 파악하는 과정에 해당한다.

p.65
  효용 이론처럼 실제로 존재하지 않더라도 마치 존재하는 것처럼 가정해 현상을 설명할 수 있는 이론을 흔히 ‘마치 이론as-if theory’이라고 부르곤 한다. 

p.66
  1950년대에 제임스 올즈James Olds와 피터 밀너Peter Milner는 쥐를 대상으로 레버를 누르면 쥐의 뇌에서 쾌락과 관련된 부위에 전기적 자극이 가해지는 장치를 … 탈진할 때까지 레버를 누르기를 반복한다는 사실을 발견했다. 

p.67
  행복의 한 가지 의미는 자신의 현재 상태에 만족하고 있다는 … ‘경험 행복experienced happiness’이라고 부를 수 있다. … 인간이 항상 자신의 경험이나 기분상태를 객관적으로 정확하게 보고한다고 믿을 수는 없기 때문에 …
  행복은 미래에 특정한 조건이 충족되었을 때 얼마나 큰 만족을 얻을 것인가에 대한 예측의 의미로도 … ‘예상 행복anticipated happiness’ …

인간의 행복에는 설정점set point이 존재해, 좋은 일이나 나쁜 일이 생기더라도 일정한 시간이 지나고 나면 행복감은 그와 같은 기저수준으로 회귀한다는 것을 의미한다. 
  … 눈앞이 캄캄해졌다가 몇 분이 지나고 나서야 점차 사물이 보이기 시작하는 것은 ‘암순응dark adaptation’이라고 불리는 과정을 통해서 우리의 시각계가 어두운 환경에 적응 … 

  적응 현상이 감각 현상뿐 아니라 동기의 수준에도 적용된다는 것을 보여준 최초의 실험이었다.

  아무리 노력해도 지속적인 행복을 누린다는 것은 불가능함을 의미한다. … ‘쾌락의 쳇바퀴hedonic treadmill’라고 부른다.

p.71
  원래 MRI는 주로 물에 포함되어 있는 양성자proton, 즉 수소원자의 핵을 자기적으로 흥분시킬 때 발생하는 신호가 신체 조직의 특성에 따라 바뀐다는 점을 이용해서 조직의 구조를 관찰하는 데 사용하는 장치이다. … MRI를 이용해서 혈액의 산소 함유량을 측정함으로써 뇌의 혈류에 관한 정보를 얻을 수 있다는 것을 발견하게 되고 … fMRI는 혈중 산소량이 어떻게 변화하는가를 나타내는 볼드Blood-Oxygen-Level-Dependent: BOLD 신호를 관찰함으로써 간접적으로 뇌의 활동을 측정하는 것이다. 정상인의 뇌에서 신경세포의 활동전압을 직접 측정하는 것이 아직은 불가능하기 때문에, …

p.73
  신경경제학자들은 인간의 뇌 중에서도 특히 전두엽의 일부인 배내측전전두피질ventromedial prefrontal cortex과 기저핵basal ganglia의 일부인 배측선조체ventral striatum를 효용과 관련해 중요한 역할을 하는 뇌 영역으로 지목했다.

p.74
  에드거 에이드리언Edgar Douglas Adrian이다. 그는 신경세포 간에 일어나는 활동전압의 빈도 변화를 통해 정보가 전달된다는 것을 규명했고 …
  … 정보는 활동전압의 형태나 크기가 아니라 빈도에 의해서 전달된다는 결론 … 

p.79
  효용의 일부분은 유전자에 의해 선천적으로 결정된다. 단 음식을 좋아하고 쓴 음식을 멀리하는 성향은 쉽게 바꾸지 못한다. 인분이나 상한 음식의 냄새를 좋아하게 되는 것은 거의 불가능하다. … 효용의 많은 부분은 경험에 의해 바뀌게 된다.

p.81
  1997년에 IBM의 인공지능 체스 컴퓨터 딥블로Deep Blue가 당시 체스 챔피언이었던 게리 카스파로프Garry Kasparov를 제압했고, 2016년에는 구글의 알파고AlphaGo가 … 이세돌을 …

p.82
  인공지능을 진정한 지능이라고 여기지 않는 이유는 그것이 해결해야 하는 문제가 그 자신의 문제가 아니라 인간이 제시한 문제이기 때문이다. … 지능은 그것의 주체와 분리해서 생각할 수 없는 것이다.
  … 인공지능이 인간과 동물처럼 자신의 효용값을 학습할 수 있게 된다면, 인공지능을 진정한 지능이라고 할 수 있을까?

p.84
  각 신경세포에서는 수상돌기를 통해서 들어오는 수천수만 개의 신호들을 서로 합하거나 특정 신호를 배제하는 등의 상호작용을 거쳐 활동전압을 발생시킬 것인지를 결정하는 일이 일어난다. … 두 신경세포 모두로부터 신호를 받아야 활동전압을 방생시키는 신경세포는 두 개의 명제가 모두 참인 경우를 나타내는 논리연산자인 논리곱(AND)에 해당하는 연산을 행한다고 볼 수 있다. 마찬가지로 한쪽에서만 신호를 받아도 되는 경우는 논리합(OR)에 해당하는 연산을 수행하는 것과 같다. … 이런 컴퓨터의 기본 요소가 바로 트랜지스터다. 예를 들어 두 개의 트랜지스터를 이용하면 논리곱을 통해 두 개의 입력 신호를 출력 신호로 전환시키는 회로를 설계할 수 있다.

p.86
  컴퓨터 칩에 포함된 트랜지스터의 수가 2년마다 두 배로 늘어나는 것을 무어의 법칙이라고 한다.

p.87
  인간의 뇌에는 대략 1,000억 개의 신경세포가 있고 각각의 신경세포에는 평균적으로 약 1,000개의 시냅스가 있다는 점을 감안하면, 인간의 뇌에는 대략 100조 개의 시냅스가 있음을 … 시냅스 하나의 기능이 트랜지스터 하나의 그것과 동등하다고 가정하면, …
  이처럼 컴퓨터와 인공지능이 인간의 지능을 능가하게 되는 시점을 기술적 특이점technological singularity이라고 하는데,

p.88
  개발된 모든 인공지능은 인간의 복지, 그것도 대부분이 인공지능의 개발자의 복지를 염두에 둔 것.

p.89
  신경전달물질이 많이 분비될수록, 그리고 수용체가 많을수록 시냅스후 신경세포의 막 전위에 더 큰 변화가 발생하게 된다. …
  … 과거에 자신이 처리했던 신호의 내용에 따라 다른 출력을 만들어내는 트랜지스터가 있다면 즉시 불량품으로 취급될 것이다. 하지만 시냅스의 가변성은 뇌가 학습을 통해 상황에 따른 적절한 반응법을 찾는 데 반드시 필요하다.

p.91
  컴퓨터 프로그램은 컴퓨터에게 어떤 연산을 수행할 것인지를 정해주는 명령체계 같은 것이다. 현존하는 디지털 컴퓨터들은 중앙처리장치가 메모리에서 인출한 정보를 특정한 방식으로 처리한 후, 그 결과를 다시 메모리에 저장하는 작업을 여러 번 반복하게 되는데,

p.92
  하드웨어와 소프트웨어가 분리되어 있는 것은 한 대의 컴퓨터를 여러 가지 목적을 위해서 사용하고자 할 때 큰 장점이 된다. … 인간의 뇌는 컴퓨터처럼 하드웨어와 소프트웨어가 분리되지 않는다. 
  … 지능을 ‘다양한 환경에서 복잡한 의사결정의 문제를 해결하는 능력’으로 정의 … ‘자신(하드웨어)이 처한 환경에서 복잡한 문제를 해결하기 위해 필요한 프로그램(소프트웨어)를 선택하는 능력’이라고 쓸 수 있다. … 여기서 프로그램을 선택하는 것은 … 이 또한 프로그램 … 컴퓨터가 지능을 가지려면 프로그램을 선택하는 메타-프로그램이 필요한 것이다. … 보통의 컴퓨터에서 이 일은 인간에 의해 실행된다. 

p.99
  운동능력을 갖춘 동물의 신경계가 해결해야 할 가장 기본적인 기능은 자신의 생존과 번식을 위해서 필요한 영양분(에너지)을 확보할 수 있는 곳을 찾아 안전하게 이동해가는 능력이라고 … 지능의 가장 기본적인 조건이다.

p.104
  자율적인 의사결정의 역할을 대리인에게 넘겨줌으로써 대리인의 행동을 본인이 원하는 대로 제어할 수 없게 된 상황을 경제학에서는 ‘본인-대리인의 문제principal-agent problem’라고 한다. … 인간의 뇌는 유전자의 자기복제과정을 효육적으로 수행하기 위해서 등장한 생물학적 기계이다.

p.105
  이동거리, 이동시간, 예상되는 연료의 양, 사고의 가능성 등에 따라 효용의 값을 계산하는 알고리듬을 개발해 로버에 장착하면 … 딥 강화 학습 같은 인공지능에서도 효용값이 사용되었다.

p.116
  그 행동의 일차적인 목표는 주체의 보존과 번영이어야 한다. 특히 그 행동은 자기파괴적이어서는 안 된다. 자기 파괴는 그 외의 어떤 형태의 선호도와도 양립할 수 없기 때문이다.
  하지만 열역학 제2법칙에 의하면, 우주에 존재하는 모든 것은 시간이 지남에 따라 형태를 잃고 점점 무너져 내리게 된다. 내부 구조가 복잡할수록 망가질 부분이 많기 때문에 더 빨리 스러져 버린다. … 지능의 주체를 보존하기 위한 최선의 방법은 … 끊임없는 자기복제의 과정이 바로 생명현상의 본질인 것이다. 
  생명체는 자기복제를 통해 그 존재를 지속하기 위해 ‘지능’을 사용한다. 즉, 자기보존적self-preserving이고 일관된 선호도를 기반으로 하는 지능은 생명체의 자기복제를 위한 유용한 도구 …

p.117
  생명체의 가장 근본적인 속성은 DNA와 같은 특정한 화학물질이 아니라 바로 자기 복제의 과정이다. 즉 생명체는 자기 스스로를 복제하는 물리적인 기계로 볼 수 있다.
  … (이런 기계는) 여타 속성을 필수적으로 가지게 된다. 그 첫 번째가 유전heredity이다. … 두 번째는, 주위 환경으로부터 원자재를 모아 들여 자신의 일부로 변환시키고 불필요한 물질을 제거하는 신진대사metabolism다. 자기복제를 한다는 것은 자기와 자기를 둘러싸는 환경과의 경계가 분명하다는 것을 … 세 번째 속성은 진화evolution다. 진화는 자기복제 과정에서 불가피하게 발생하는 ‘실수’에서 비롯된다. …
  … 진화를 통헤 복제과정의 효율성이 점차 증가한다는 것은, 오랜 시간에 걸쳐 생명체가 자신의 환경에 따라 그 특성을 변화시키게 된다는 것을 의미한다.

p.120
  단순한 구조를 갖고 있으면서도 자기복제를 할 수 있는 최초의 물질 … 다음과 같은 성질을 갖고 있을 것 … 첫째는 복제하는 과정에서 사용되는 부품의 숫자가 많지 않고 그 조립방법이 비교적 간단해야 한다 … 둘째 여러 가지 부품을 모아서 조립하는 일을 수행하기 위해서는 그에 요구되는 특정한 모양을 갖출 수 있는 능력이 있어야 …. 셋째, 너무 쉽게 파괴되어서도 안 된다 … 대부분의 생물학자들은 RNA(ribonucleic acid)가 바로 그와 같은 역할을 했을 것이라고 추정한다.
  RNA는 여러 개의 리보뉴클레오티드라는 물질이 한 줄로 연결된 기다란 중합체polymer다. 각각의 리보뉴클레오티드는 리보스ribose라는 단당류와 인삼염, 그리고 질소성 염기로 구성되어 있다. 리보뉴클레오티드를 이루는 질소염 염기에는 구아닌, 우라실, 아데닌, 그리고 시토신의 네 가지가 있으며, … 여러 개의 리보뉴클레오티드로 이루어져 있는 RNA는 는 각각의 리보뉴클레오티드에 포함되어 있는 질소성 염기에 따라, Guanine, Uracil, Adenine, Cytosine 네 글자를 사용해서 나타낸다. 

p.122
  구성 성분인 리보뉴클레오티드 간에 서로 짝을 이루는 경향이 있기 때문 … 
  … 유전자란 복제 과정에서 생명체의 여러 가지 특징을 복사본에게 전달하는 데 필요한 정보가 저장되어 있는 물질을 일컫는 말이다. … 유전자의 복제와 같은 특정한 화학반응을 촉진시키는 도우미의 역할을 하는 물질을 촉매catalyst …

  촉매역할을 하는 RNA를 리보자임ribozyme이라고 한다.

  RNA는 불안정하기 때문에 유전정보를 오랫동안 보존해야 하는 유전물질로는 이상적이지 않다. 그래서 자기복제 RNA의 진화가 계속되던 도중에 어떤 RNA들은 자신과 구조가 유사하지만 보다 단단한 구조를 가진 물질인 DNA를 유전자로 이용하는 방법을 찾아내게 되었을 것이다. … 한 줄 사슬인 RNA에 비해, DNA는 디옥시리보뉴클레오티드deoxyrionucleotide로 만들어진 두 줄의 사슬이라 더 안정적인 구조를 … 수억 년 전의 고생물의 DNA를 해독하는 것이 가능한 이유도 바로 DNA가 화학적으로 지극히 안정된 구조…
  DNA도 RNA처럼 네 가지 질소성 염기를 사용하는데, 그 중 세 가지는 RNA와 동일하게 아데닌, 시토닌, 그리고 구아닌이며 나머지 하나로는 우라실 대신 티민thymine을 이용한다(A-C-G-T). … RNA가 다양한 모양을 하는 것과 달리, 늘 이중나선 구조를 … 두 줄의 DNA는 서로 잘 달라붙는 질소성 염기(G-C와 A-T의 쌍)끼리 마주 보고 있기 때문에, 더욱 안정적인 구조 … 

 

 

Yale School of Medicine, 이대열 교수

 


p.126
  오늘날 세포 안팎에서 이루어지는 다양한 화학반응을 조절하는 촉매의 대부분은 단백질이다. RNA와 DNA와 달리 단백질은 여러 개의 아미노산amino acid이 결합되어 만들어지는데, 그 중에서 촉매로 작용하는 단백질을 효소enzyme이라고 한다. … 아미노산의 순소를 바꾸면 단백질의 구조가 달라지고 그에 따라 기능도 달라진다. … 네 가지 종류의 부품을 사용하는 RNA에 비해서, 단백질을 구성하는 아미노산의 종류는 무려 20가지나 된다. 

  단백질은 DNA로부터 직접 만들어지는 것이 아니라, DNA의 염기 순서에 따라 RNA 중합효소polymerase에 의해서 조립된 메신저 RNA를 이용해서 만들어진다. 이와 같이 DNA에서 RNA가 복사되는 과정을 전사transcription라고 한다. 동물이나 식물과 같이 세포 안에 핵nucleus을 갖고 있는 진핵생물eukaryote의 경우 DNA는 핵 안에 자리잡고 있는데 반해 mRNA는 합성된 이후 핵 밖으로 나온다. 그러면 리보좀ribosome이라는 화학공장에서 mRNA 염기들의 순서에 적혀 있는 대로 아미노산을 결합해 단백질을 만드는 일이 일어난다.
  mRNA에 적혀 있는 정보에 따라 단백질이 합성되는 과정을 번역translation이라고 한다. 그런데 번역 과정에서 RNA를 구성하는 뉴클레오티드는 4종류밖에 되지 않는데, 단백질을 마드는 데 사용되는 아미노산의 종류는 20가지라는 것에서 문제가 발생한다. 이 문제의 해결을 위해, 하나의 아미노산을 지정하기 위해 뉴클레오티드 3개의 순열이 사용된다.  … 유전자란 바로 하나의 단백질을 만드는 데 필요한 유전정보가 저장되어 있는 DNA의 구간을 일컫는 말이다.
  … RNA의 입자에서 보면 유전정보를 보다 안정적으로 저장하는 일과 다양한 촉매의 작용을 각각 DNA와 단백질에 따로따로 위임했다 … 다세포생명체가 등장하고 다양한 종류의 세포들이 생겨나면서, 개체를 보호하고 이동시키는 일, 산소와 영양분을 세포에 운반하는 일 등이 세포들에게로 분담된다. 그 과정에서 이 모든 일을 제어하는 기능을 가진 ‘뇌’가 진화하게 된다.

p.129
  세포막이 존재하지 않느다면 RNA나 DNA의 복제에 필요한 모든 화학물질이 주위 환경에 의해서 희석될 것이므로 자기복제 과정의 효율성이 많이 떨어질 것이다. … 하나의 세포 안에서 DNA 복제가 끝나고 필요한 모든 단백질들의 여분이 충분히 만들어지면, 세포는 분열하는 과정을 거쳐서 스스로를 복제하게 되는 것이다.

p.130
  다세포생명체는 여러 가지 종류의 세포를 만들어 보호 기능, 순환 기능, 면역 기능 등에 전문화된 기관을 만들 수 있다. … 리처드 도킨스Richard Dawkins의 표현대로, 체세포는 생식세포와 생식세포 안에 포함되어 있는 유전자들을 보호하고 운반하는 일종의 생존기계survival machine이라고 생각할 수 있다.
  … 모든 세포가 정상적으로 작동하기 위해서는 각 유전자가 만들어낼 수 있는 단백질의 양이 정확하게 제어되어야 한다. … 단백질의 아미노산의 순서를 지정하는 데 필요한 정보를 담고 있는 암호부위coding region와 전사과정의 양을 조절하는 조절요소regulatory element가 포함되어 있다. …
  다른 유전자의 조절요소에 달라붙어서 해당하는 유전자의 전사과정을 제어하는 단백질을 전사인자transcription factor라고 한다.

p.134
  해면동물은 식물과는 달리 세포에 세포벽이 없을 뿐 아니라, 정자를 만들고, 박테리아와 같은 다른 생명체를 잡아먹으며 살아가기 때문에 동물로 분류된다. … 신경세포가 처음 등장했을 당시에는 신경세포들이 한 곳에 집중되어 있는 것이 아니라 신체의 여러 부위에 분산된 상태에서 자신들의 주위에 있는 근육세포를 제어하는 역할을 했었을 가능성이 높다.

p.135
  척추동물의 경우에는 대부분의 신경세포들이 동물의 등 쪽에 집중되어 끈의 형태를 하게 되고, 점차 머리에 신경세포가 집중되는 대뇌화encephalization라는 과정을 거쳐 뇌를 형성하게 된다.

p.136
  중요한 의사결정은 주로 뇌에서 이루어지고, 척수는 외부로부터 들어오는 정보를 뇌로 전달하고 뇌에서 내려진 명령을 근육에 전달하는 역할을 하게 된다. 즉 척추동물의 신경계는 중앙집권형이라고 할 수 있다.
  하지만 모든 동물의 신경계가 척추동물과 같은 구조를 갖고 있는 것은 아니다. 예를 들어 절지동물이나 연체동물의 신경계는 척수 같은 끈 형태의 신경 구조 대신 여러 개의 신경절ganglion과 그것을 연결하는 신경섬유 또는 신경삭nerve cord으로 이루어져 있다.  …
  … 무척추동물 중에서 지능이 가장 뛰어나다고 하는 문어의 경우를 살펴보자. 

p137
  수정란이 성체로 발달해가는 과정에서 뇌와 같은 복잡한 신경계를 형성하기 위해서는 신경세포들이 충분히 생성되어야 하고, 적절한 장소로 이동해 모여야 하며, 서로 다른 신경세포들 간에 수상돌기와 축삭을 통해서 수많은 시냅스들을 만들어내야 한다. 이 모든 과정을 원활히 진행시키기 위해서는, 적재적소에서 필요한 단백질들이 만들어져야 한다.

p.138
  뇌는 경험을 통해서 최선의 행동을 학습해야 하는 것이다. 반대로, 반사처럼 만일 유전자가 뇌의 기능을 완전히 결정해 버린다면, 그와 같은 뇌는 동물의 경험과 환경을 무시하고 상황에 맞지 않는 행동을 …

p.138
  그러므로 인간의 본성을 이해하기 위해서는 뇌가 유전자의 자기복제를 효율적으로 수행하기 위해 만들어진 다세포 생명체의 부속기관이면서, 동시에 유전자의 구체적인 지시가 없더라도 독립적으로 행동을 선택하는 유전자의 ‘대리인’이라는 사실을 명심해야 한다. 생물학적인 관점에서 볼 때, 개체의 주인은 뇌가 아니라 유전자다.

p.144
  RNA가 전담하던 자기복제 기능 중에서 유전정보를 보존하는 역할은 DNA에게로, 그리고 복제를 위한 촉매 작용은 단백질에게로 위임된다. …
  … RNA는 DNA에 저장되어 있는 유전정보를 전사해서 단백질이 합성되는 세포핵의 밖으로 전달하고 m(메신저)RNA에 적혀 있는 지령에 따라 아미노산을 운반해서 단백질을 합성하는 역할을 맡고 있다.

p.145
  번식기능을 생식세포가 전적으로 떠맡게 되면서, 체세포는 개체의 죽음과 함께 자기복제라는 생명의 가장 근본적인 기능을 자발적으로 포기하게 되었기 때문이다(분업).

p.149
  분업을 위해서 다른 사람에게 특정한 역할을 위임하게 되는 경우, 위임을 하는 사람을 본인principal이라고 하고 위임을 받는 사람을 대리인agent이라고 한다. … 본인이 대리인에게 적절한 동기를 부여해야 한다. … 대리인이 본인을 위해서 행동하도록 만드는 데 필요한 조건을 분석하는 경제학 이론을 ‘본인-대리인 이론’이라고 한다.

p.150
  (1) 대리인의 행동이 본인에게 돌아가는 수익에 어떤 식으로든 영향을 미쳐야 한다. 만일 우리가 DNA와 단백질을 자기복제라는 목적을 달성하려는 RNA의 대리인으로 가정한다면,

  (2) 대리인이 본인에게 없는 정보를 갖고 있어야 한다. … 대부분의 경우 대리인의 행동을 본인이 완전히 파악하는 것은 불가능하다. 그렇기 때문에 본인-대리인 이론의 목표는 그와 같은 정보의 불균형에도 불구하고 대리인이 본인의 목적에 따라 행동하게 만드는 방법을 찾는 것이다.
  … 다세포생명체의 경우에도 다양한 목적에 특화된 세포들은 환경으로부터 수집한 정보의 대부분을 생식세포와 공유하지 않는다.

  (3) 본인-대리인의 관계에서는 본인이 계약의 주도권을 갖는다.

  (4) 본인과 대리인이 원하는 바가 완전히 일치하지 않는다. …
  … 협동이 가능할 수 있었던 이유는 체세포와 생식세포가 동일한 유전자를 포함하고 있기 때문이다. …
  … 고약한 냄새가 나는 물건을 피하는 것 같은 반사들은 개체의 생존과 직결된 것이기 때문에 유전자에 의해서 미리 정해진 행동들이다. … 유전자의 복제를 돕도록 미리 설계되어 고정된 행동들은 유전자가 미처 예상치 못한 환경에서는 유전자의 이익에 반하는 결과를 가져올 수도 있다.

  (5) 본인과 대리인은 합리적인 선택을 한다. … 경제적인 분업은 인간의 자발적인 의사결정의 결과로 이루어지므로, 분업에 참가하는 개인들이 자신의 효용을 극대화하기 위해 합리적인 선택을 한다고 가정 …
  … 유전자와 뇌는 둘 다 합리적인 의사결정의 주체로 볼 수 있다. 진화생물학자들은 유전자가 얼마나 효과적으로 복제되는가를 ‘적합성fitness’이라는 개념으로 표현한다. 진화란 유전자의 적합성이 증가하는 과정이므로 … 

p157
  보험가입자(대리인)가 부주의한 행동을 하는 것을 막는 효과적인 방법이 바로 공제deductible이다. 사고가 발생했을 때 손해를 안전히 보상할 정도의 보험금을 지급하는 것이 아니라, 그로부터 일정 금액을 보험 가입자가 부담하게 함으로써 보험가입자 또는 사고의 결과로 어느 정도의 손해를 보게 하는 것이다. 

p.164
  학습은 유전자와 뇌의 분업관계를 더욱 효과적으로 만든다.

p.168
  반응 학습과 장소 학습은 사실 20세기 초에 에드워드 손다이크, 버러스 F. 스키너 같은 미국의 심리학자들이 발견했던 ‘기구적 조건화instrumental conditioning’라는 학습 방법에 속한다. 한편 비슷한 시기에 러시아에서는 이반 파블로프Ivan Pavlov에 의해서 ‘고전적 조건화classical conditioning’라는 기구적 조건화와는 전혀 달느 학습 방법에 관한 연구가 진행 ….

p.169
  고전적 조건화가 일어나기 위해서는 … 적절한 자극이 주어지면 아무런 학습이 없어도 반사적으로 나타나는 행동이 있어야 한다. 이와 같은 행동을 ‘무조건 반응’이라고 한다. 그리고 무조건 반응을 유발하는 자극(여기서는 먹이)을 ‘무조건 자극’이라고 한다. …
  … 두 번째 조건으로, 무조건 자극이 제시되기 전에 그와는 무관한 중성적 자극이 반복적으로 제시되어야 한다. … 중성적 자극이 제시되었을 때 학습의 결과로 유발되는 반응을 ‘조건 반응’이라고 하고, 학습을 통해 조건 반응을 유발할 수 있게 하는 자극을 ‘조건 자극’이라고 한다.
  … 고전적 조건화는 원래의 무조건 반응이 학습의 결과로 조건 반응이 되어 나타나는 것이다. … 무조건 반응들은 학습하지 않아도 되는 본능적 행동, … 자율신경계의 작용인 경우가 대부분 …

p.171
  결과의 법칙law of effect을 제창한다. 결과의 법칙이란 어떤 행동의 결과가 만족스러우면 다음에도 그 행동을 반복하고, 만족하지 않으면 그 행동을 하지 않는다는 것이다. … 이전에 일어난 행동을 반족하게 만드는 자극을 ‘강화reinforcement’라고 부르고, 이전에 일어난 행동을 피하게 만드는 자극을 ‘처벌punishment’이라고 한다. … 지능은 행동과 그 결과의 관계를 많이, 그리고 신속하게 학습하는 능력 …

p.172
  스키너는 동물들이 스키너 상자 안에서 보상을 받기 위해 취해야 하는 행동을 ‘조작적 행동operant behavior’ 똔느 단순히 ‘조작operant’이라고 불렀고 이와 같은 조작적 행동을 학습하는 과정을 기구적 조건화 또는 조작적 조건화라고 명명했다. …
  고전적 조건화가 일어나기 위해서는 무조건 반응을 유발하는 무조건 자극이 일어나기 전에 또 다른 자극이 일관되게 주어진다. 그 결과로 … 가장 적합한 행동을 찾아서 헤맬 필요가 없다. 반면, 기구적 조건화의 경우는 상황이 전혀 다르다. … 즉 기구적 조건화가 이루어지기 위해서 꼭 필요한 것은 얼핏 보기에는 아무 도움도 되지 않을 것 같은 행동들을 마구잡이로 만들어내고 그 중에서 원하는 결과를 가져오는 행동을 발견하는 것이다. …
  … 고전적 조건하는 학습되는 행동이 침을 흘리는 것 같은 무조건 반응에 국한되는 반면, 기구적 조건화는 동물이 취할 수 있는 어떤 행동에라도 적용이 가능하다는 것이다. … 스키너는 인간의 언어 역시 복잡한 기구적 조건화의 결과라고 주장하여 많은 논란 … 또한 2차 대전 중에는 비둘기들을 미사일을 나르도록 훈련시켜 미사일을 적진의 목표지점에 정확하게 명중시키는 것이 가능하다고 주장 …

p.175
  스키너가 활약했던 1960년대에는 유전적인 요인이 인간의 행동에 어떤 영향을 미치는지에 관해서 별로 알려진 바가 없었기 때문이었을 것이다. … 툴만과 같은 많은 심리학자들은, 스키너가 강력하게 부정했던 인간의 상상력을 포함한 다양한 인지과정이 인간의 행동에 중요한 역할 …

p.176
  개가 어떤 행동을 취했을 때마다 먹이를 준다면, 개는 먹이를 얻기 위해 그 행동을 반복할 것이므로 먹이를 이요한 기구적 조건화가 일어난다. … 개가 클리커 소리를 즐거운 자극으로 받아들이게 된 이후에는 먹이를 주지 않고 클리커 소리만 들려주는 것으로 개의 행동을 강화시킬 수 있으므로 동물들을 효과적으로 훈련시킬 수 … 클리커 소리가 먹을 것을 연상시키는 조건 자극이 되는 과정은 고전적 조건화이다. … 고전적 조건화의 결과로 생겨난 강화를 ‘조건적 강화’또는 이차적 강화라고 한다. 반면 먹이 같이 고전적 조건화의 도움이 없이도 동물의 행동에 영향을 미치는 강화자극을 ‘일차적 강화’라고 한다.

p.177
  여러 가지 조건적 강화와 연결되어 있는 고ㅈ차적 강화를 ‘일반적 강화generalized reinforcer’라고 하기도 한다.

p.179
  광고가 소비자의 상품 구매를 자극하는 것은 ‘파블로프-기구적 전이Pavlov-Instrumental Transfer: PIT’라는 현상의 일종이다. 

  고전적 조건화를 통해서 학습된 조건 자극이 기구적 조건화에서 학습한 행동 반응의 빈도를 증가시키는 현상을 바로 PIT라고 한다.

p.183
  무조건 자극이나 일차적 강화들은 날 때부터 유전적으로 결정되는 것이다. … 많은 심리학자들은 무조건 자극이나 강화가 없이는 그 어떤 종류의 학습도 불가능하다는 극단적인 입장을 취했었다. …
  … 톨만 등의 심리학자들이 강화가 없이도 학습이 일어날 수 있다는 것을 보여주기 위해 주로 사용한 방법은 ‘잠재적 학습latent learning’이다. 잠재적 학습이란, 기구적 학습이 일어나기 전에 동물이 학습을 하게 될 미로와 같은 환경에 미리 노출되어 그 환경의 이모저모를 탐색할 수 있는 기회를 주었을 때 발생하는 학습을 말한다. 비록 아무런 보상도 받지 못했더라도 … 


p.185
  강화가 없이도 자신의 환경의 특징들을 학습하고 기억했다가 나중에 그와 같은 지식을 적절히 사용 …


p.186
  아무런 조건화 과정을 겪지 않은 개에게 종소리와 함께 노란색 깃발과 같은 중성적 자극을 되풀이하여 경험하게 해보자. 다음으로는 노란색 깃발 없이 종소리와 먹이만을 이용해서 고전적 조건화 과정을 거친다 … 조건화 과정 이전에 가해진 두 가지 이상의 중성적인 자극 중에서 하나가 다른 하나를 예고하는 것을 ‘전조건화pre-conditioning’라고 한다. 이는 전조건화 과정에서 노란색 깃발이 이제는 조건 자극이 된 종소리를 예고한다는 것을 학습했음을 의미 ….
  … 전조건화는 노란색 깃발도, 종소리도 아직 조건 자극이 아닐 때 일어나는 것이다. 즉, 고차적 조건화는 사전에 더욱 단순한 조건화를 전제로 하는 반면, 전조건화의 경우에는 무조건 자극이나 일차적 강화의 도움 없이 학습이 일어나는 것이다.

p187
  유전자들은 호기심 많은 뇌를 발명해냈을 것이다. 당장 생리적인 욕구를 만족시키는 데 아무런 도움이 되지 않는다 하더라도 환경의 변화를 성공적으로 예측할 수 있는 내용의 지식이라면 언젠가는 유전자의 자기 복제에 큰 공헌을 할 수 있기 때문이다.

p.191
  대뇌피질의 전두엽이나 두정엽 같은 연합피질에 있는 신경세포들은 자극이 사라지고 난 뒤에도 오랜 시간 반응을 지속하는 경우가 많다. 이와 같은 지속적인 신경세포의 활동은 그 이후에 동물의 의사결정과 행동에 영향을 미치게 되어 학습을 가능하게 한다. 하지만 대부분의 경우에 신경세포의 활동은 자극이 사라진 후 시간이 흐름에 따라 급속도로 약해지는 경향이 있다.
  …. 그에 대한 정보가 시냅스에 저장되어 있다는 것을 의미한다. 
  시냅스가 학습에 중요한 역할을 하는 이유 … 동물의 모든 행동은 수많은 신경세포들이 서로 신호를 주고받는 과정을 통해서 출현하게 된다.

p.192
  하나의 신경세포에서 발생한 활동전압이 시냅스를 통해 다른 신경세포로 전달되어야 한다. 그런데 만일 두 신경세포 사이에 존재하는 시냅스의 신경전달물질이나 수용체가 고갈된다면 시냅스전 신경세포에 활동전압이 발생했다 하덜다ㅗ 시냅스후 신경세포에 시냅스후 전압이 생겨나지 않을 것이다 … 시냅스후 전압의 크기는 시냅스전 신경세포가 시냅스후 신경세포에 얼마나 큰 영향을 미치는가를 나타내기 때문에 두 신경세포 간의 연결 강도connection strength를 반영한다는 의미로 ‘시냅스 가중치synaptic weight’라고 부른다.
  … 경험을 통해서 시냅스 가중치가 변하기 때문이다. … 두 신경세포가 특정한 경험을 한 이후에는 시냅스 가중치가 증가하여, 이후에 시냅스전 신경세포에 동일한 활동전압이 발생했을 때 더욱 큰 반응을 보이는 것이다. … 시냅스의 가중치가 변화하는 것을 시냅스의 ‘가소성plasticity’이라고 한다.

p.193
  만일 학습이 시냅스의 가소성을 통해서 이루어진다면, … 뇌 안에 특정한 학습이나 기억과 관련된 정보가 저장되어 있는 장소를 신경과학자들은 ‘엔그램engram’이라고 부른다.

p.195
  그전에 비해서 시냅스가중치가 늘어나는 현상을 ‘장기적 증강작용long-term potentiation’이라고 한다. 장기적 증강작용이 처음으로 발견된 것은 해마hippocampus라는 구조에서였다.

p.196
  인간이 다른 사람에게 언어를 이용해서 설명할 수 있는 종류의 기억을 ‘서술적 기억declarative memory’이라고 한다. 그 내용을 인간이 의식적으로 회상할 수 있기 때문에 ‘외현적 기억explicit memory’이라 부르기도 한다. 서술적 기억 중에서 과거의 어떤 특정한 시점에 특정한 장소에서 자신이 어떤 일을 경험했는가를 기억하는 것을 ‘일화적 기억episodic memory’이라고 하고, 특정한 사건과 상관 없는 사실에 관한 기억을 ‘의미 기억sematic memory’이라고 한다. … 기억의 내용을 의식하지 못하더라도 반복 훈련을 통해 형성되는 기억을 ‘절차적 기억procedural memory’이라고 한다. … 각 부분이 아니라 전체로 기억되는 것… 

p.198
  일화적 기억은 해마를 필요로 하지만 절차적 기억은 해마가 없어도 된다는 것을 보여준 것 …
  … 절차적 학습은 뇌의 어느 부위 … ‘기저핵basal ganlia’이라고 불리는 영역일 것

p.199
  반응 학습은 일종의 절차적 학습 …
  … 파킨슨병과 같이 기저핵의 기능에 이상이 생긴 환자들의 경우에는 … 절차적 학습에 이상을 보이는 것

p.200
  강화 학습 이론은 바로 경험에 의해서 효용값이 변화하는 방식을 명확하게 기술하는 이론 … 
  … 선택을 결정하는 수치를 효용 이론에서는 ‘효용’이라고 부르는 반면 강화 학습 이론에서는 ‘가치함수value function’ 또는 ‘가치value’라고 부른다.

p.201
  침을 흘리는 행동과 침을 흘리지 않는 행동에 해당하는 두 가지 행동의 가치함수, 즉 ‘행동가치action value’를 계산해야 한다. 강화 학습 이론에서는 개가 침을 흘릴지 아닐지를 결정하는 것은 이 두 가지 행동의 가치값의 차이다.

p.202
  강화 학습 이론에서는 그 이유를 보상에 관한 예측오류, 즉 ‘보상예측오류reward prediction error’를 이용해서 설명한다. 보상예측오류가 발생했다는 것은 그 이전에 예상했던 것보다 더 많거나 더 적은 보상이 주어졌다 ... 보상예측오류가 발생할 때마다 주어진 보상 또는 무조건 자극에 의해서 유발되는 행동의 가치가 늘어난다고 가정한다. … 종소리가 울리고 먹을 것이 주어지는 과정이 되풀이됨에 따라 침 분비 반응의 행동가치는 점차 증가하고, 이 과정은 종소리가 울리고 나서 침을 분비하는 행동의 가치값이 10이 되어 더 이상 예측오류가 발생하지 않을 때까지 계속된다.

p.203
  도파민은 뇌에서 사용되는 신경전달물질 중의 하나다. … 포유류 뇌의 특정한 영역의 신경세포에서만 신경전달물질로 사용된다. … 뇌간에 있는 도파민 세포들은 뇌의 거의 모든 영역에 축삭돌기를 뻗치고 있으며 동기와 학습에 관한 중요한 역할 … 파킨슨병은 뇌간의 도파민 신경세포들이 죽어가기 때문에 생기는 병이고, 코카인이나 … 약물이 중독성을 가지는 것도 뇌 안에 도파민의 농도를 증가시키기 때문이다. …
  … 뇌간에 있는 도파민 신경세포들의 활동이 보상예측오류에 관한 신호를 뇌의 여러 부위에 광범위하게 퍼뜨린다는 것을 발견 … 도파민 세포의 활동이 단순히 보상이 주어졌다는 신호를 보내기 위해서가 아니라 보상예측오류가 발생했음을 나타내기 위해서 … 
  … 받은 보상이 이전의 경험에 비추어 예상했던 것보다 더 많고 적음에 따라 반응 … 

p.206
  기저핵이 도파민 세포가 전해주는 보상예측오류에 관한 정보를 이용해서 여러 가지 반응에 관한 행동가치값을 조절하는 역할 … T자 미로에서 쥐가 오른쪽으로 돌 때마다 먹이를 발견했다면, 쥐의 기저핵에서는 도파민의 농도가 변화하면서 오른쪽으로 회전하는 반응의 행동가치값이 증가하도록 시냅스의 가중치가 변화 … 

p.208
  ‘심적 시뮬레이션mental simulation’이라는 개념으로 잠재적 학습이 일어나는 과정을 설명한다. … 동물이 현재 가지고 있는 지식에 비추어, 특정한 행동을 취했을 때 예상되는 가상의 보상에 기초해서 그와 관련된 행동 가치값을 수정해가는 과정…

지식을 이용한 심적 시뮬레이션을 통해서 행동가치값을 수정하는 과정을 ‘모형에 기초한 강화학습’이라고 한다. 이는 환경에 대한 모형, 즉 지식을 이용하는 학습과정 … ‘유식한 강화학습’이라고 할 수도 있겠다. 반면 지식을 이용하지 않는 단순한 고전적 조건화와 기구적 조건화 같은 학습은 ‘모형 없는 강화 학습’이라고 한다 … ‘무식한 강화 학습’

p.211
  심적 시뮬레이션의 결과를 검토할 만한 충분한 지식과 시간적 영규가 있는 경우에는 유식한 강화 학습이 무식한 강화 학습보다 더 나은 결과 …

p.212
  사람들은 가상의 보상을 끊임없이 계산하고 이전의 행동가치값과 비교해서 두 값 사이에 차이가 있을 때는, 비록 현실에서는 보상예측오류가 발생하지 않았다 하더라도, 가상의 보상예측오류에 따라 행동가치값을 조정 …. 

강화 학습 이론에서 ‘후회regret’란 유식한 강화 학습에 필요한 심적 시뮬레이션을 하는 과정에서, 자신이 선택한 행동에서 얻은 보상이 다른 행동에서 얻을 수 있었던 가상의 보상보다 작을 경우에 발생 … 이와 반대로, ‘안도relief’ … ‘실망disappointment’이란 무식한 강화 학습에서 발생하는 오류다. 즉, 어떠한 특정한 행동을 취했을 때 얻게 된 결과가, 과거에 그와 같은 행동을 했을 때 얻은 결과로부터 예상했던 것보다 나빠서 음성 보상예측오류가 발생했을 때, 그것을 실망이라고 한다. 반대로 실제 결과가 무식한 강화 학습의 결과로부터 예상했던 것보다 나아졌을 경우에 발생하는 양의 보상예측오류를 ‘득의elation’이라고 한다.

p227
  게임 이론은 … 사회적인 의사결정을 다루는 연구 분야다. …인간이 어떻게 자신의 이기적인 본능을 억누르고 타인을 위한 행동을 취할 수 있는지, 그리고 자기복제만을 위해 존재하는 이기적인 유전자들이 그와 같은 이타적인 결정을 할 수 있는 뇌를 만들어내게 된 배경 … 

존 폰 노이만가 오스카어 모르겐슈테른이 공저한 <게임과 경제적 행동에 관한 이론>이라는 책에서 …

전략이란 선택 가능한 모든 행동에 부여된 확률에 해당한다. 예를 들어 가위바위보 게임에서 항상 가위만 내는 전략은, 가위가 선택되는 확률은 1, 바위나 보는 확률 0…

하나의 행동만 선택하는 경우를 순수전략pure strategy이라고 하며, 반면에 선택될 확률이 0보다 큰 행동이 두 가지 이상인 전략을 혼합전략mixed strategy이라고 한다. … 모든 선수들이 성과 행렬을 완벽하게 이해할 뿐 아니라, 모든 선수들이 기대효용치를 최대화 한다고 가정 … 게임 이론의 목적은 합리적이고 이기적인 선수들이 어떻게 행동할지를 예측하는 것 …

제로섬게임이란 모든 참가자가 받게 되는 보상을 합한 경우가 정확하게 0 … 이 말은 자신의 이익을 최대화 하기 위해서는 반드시 다른 사람들의 이익을 최소화 … ‘최상의 대응best respose’이란 상대방이 특정한 전략을 선택했을 때 그에 대응하는 최선의 선택을 말한다. … 최적의 전략optimal strategy은 모든 선수들이 동시에 최상의 대응을 선택할 때 주어지는 전략을 말한다.

p.231
  모든 게임에는 각각에 대한 최적의 전략이 존재할까? … 존 내시 … 아무리 복잡한 게임이라 하더라도 거기에는 최적의 전략이 최소한 하나는 존재 … 모든 선수가 최적의 전략을 선택한 상황을 ‘내시 균형Nash equilibrium’이라고 일컫는다.

p.234
  (수인의 딜레마에서) 나의 최상의 대응은 자백을 하는 것이다. … 상대방의 선택과 무관하게 최상의 대응에 해당하는 자백을 선택할 것이고, 그것이 바로 내시 균형 … 그러나 … 둘이 협동을 해서 침묵을 지킨 것보다 나쁜 결과가 나오므로 이 상황이 ‘딜레마’ …
  게임 이론에 따르면 죄수의 딜레마에서 최적의 전략은 자백, 즉 변절이다.

p.236
  실제로 인류가 … 대부분의 상호작용은 매번 낯선 사람과의 관계에서 발생했을 가능성보다는, 같은 집단에 속한 사람들과 수도 없이 반복적으로 이루어졌을 가능서잉 높다. … ‘반복적iterative 게임’

1980년대 무렵, 정치학자 로버트 액설로드는 다양한 전략을 구사하는 컴퓨터 프로그램들끼리 반복적 죄수의 딜레마 게임을 하여 어느 프로그램이 더 높은 점수를 얻는지 … 행동과학자 아나톨 래포포트가 제안한 ‘맞대응tit-for-tat’이라는 전략이었다. … 첫 번째 시행에서는 협동을 선택한 후, 두 번째 시행부터는 그 이전의 시행에서 상대방이 했던 선택을 되풀이하는 전략 … 

p.238
  파블로프 전략은 이전 시행에서 상대방이 협동을 한 경우에는 자신이 이전 시행에서 선택했던 행동을 반복하고 이전 시행에서 상대방이 변절을 한 경우에는 그 반대의 행동을 선택하는 것…
  … 파블로프 전략가들은 이제까지의 결과와 상관 없이 어떤 경우라도 세 번의 시행 이내에 상호 협동적인 관계로 돌아갈 수 있다. …
  … 파블로프 전략은 이전에 선택했던 행동의 결과에 따라서 자신의 행동을 수정한다는 점에서, 손다이크가 발견한 결과의 법칙과 더 유사하다. … 지난 시행에서 상대방의 선택을 기억해야 한다.

p.242
  개인의 소비활도잉 다른 사람의 효용에 영향을 미치는 것을 ‘외부효과’라고 한다.

  ‘공공재 게임public goods game’이다. …
  … 내가 나의 이익을 최대화하는 최적의 전략은 기부를 하지 않는 것이다. 따라서 모든 사람이 기부를 하는 것은 내시 균형이 될 수 없다. … 일회성 공공재 게임의 경우에도 (일회서 죄수의 딜레마와 마찬가지로) 전혀 기부를 하지 않는 것이 내시 균형 전략으로 …

p.245
  인간의 뇌는 어떤 방법으로 협동의 득실을 예측하고 상황에 따라 적절하게 협동을 선택할 수 있는 것일까 … ‘복수심’ … 

p.247
  변절하는 구성원들에게 일종의 처벌을 가하는 것이다. …
  … 자신이 손해를 입더라도 사회적으로 바람직하지 않은 행동을 선택한 상대방을 처벌하는 것을 ‘이타적 처벌altruistic punishment’이라고 한다. … 이타적 처벌을 하겠다고 결심한 사람의 뇌 … 보상과 효용에 관련된 정보를 처리하는 기저핵의 일부에서 활성이 증가 …. 

p.248
  협동하는 자들에게 추가의 보상 … 발생할 때마다 자주 보상을 해주어야 하므로 이타적 처벌만큼 효율적으로 작동하지 않는다. 이타적 처벌은 원치 않는 행동이 발생할 때만 … 

p. 249
  다른 사람의 지식과 선호도를 예측하고 다른 사람의 행동을 추론할 수 있는 능력을 마음이론theory of mind라고 한다. 

  아이들이 마음이론을 갖게 되는 것이 대략 네 살 정도다.

p.256
  복잡한 사회적 의사결정 과정에 필요한 정보들을 신속하고 정확하게 처리하기 위해서 영장류의 뇌의 크기가 증가했다는 주장을 ‘사회적 지능 가설social intelligence hypothesis’ 또는 ‘마키아벨리적 지능 가설’이라고 한다. … 상대방의 얼굴 표정 하나하나를 자세히 살펴야 하니 시각피질은 당연히 풀가동 … 하는 말을 놓치지 않고 이해하며 적절한 대화를 하기 위해서는 청각피질과 언어 중추 역시 풀가동 … 마음이론을 계속 적용해가면서 상대방의 의도를 파악하기 위해서는 재귀적 추론(그 상대방이 나의 인지과정에 대해서 갖고 있는 생각마저 이해하는 것)을 가능케 하는 작업기억과 같은 관련된 기능 … 인간의 뇌 안에 있는 여러 부위들은 더 많은 신경세포와 더 밀도 높은 연결을 요구 …

p.266
  지식이란 의사결정 과정에서 선택된 행동의 결과를 예측하기 위해 사용될 수 있는 정보. 

마음이론은 필연적으로 재귀적인 속성 … 나의 사고과정에 관한 상대방의 사고과정을 예측하고자 하면 어쩔 수 없이 나의 사고과정에 대한 이해가 생기는 것. … 생명체의 자기복제과정 … 물리적인 현상이라 열역학적인 제약을 받기 때문이지만, 자기인식은 필연적으로 논리적인 모순을 포함한다 … 
  이해하고자 하는 대상이 다름 아니라 이해의 주체가 될 때는 필연적으로 스스로를 언급하는 self-reference(자기지시)가 발생한다. … ‘거짓말쟁이의 역설’이다. “지금 내가 하는 말은 거짓이다.” … 
  … 문장이 자기 스스로를 가리키는 자기지시를 포함하기 때문이다. 자기지시에서 비롯되는 역설들은 다수 존재하는데, 그중에서도 특히 버트런드 러셀의 ‘러셀의 역설’이 가장 유명하다. … ‘이발사의 역설’로도 잘 알려져 … 

p.273
  회상recall은 질문에 대한 대답을 도움이 되는 단서 없이 기억에서 인출하는 과정이다. 즉 회상은 주관식 문제를 푸는 능력 …. 재인recognition이란 질문에 대한 대답이 주어졌을 때 그것이 정답이라는 것을 인지하는 능력 … 객관식

p.279
  자신이 기억하고 있는 정보가 어디서 얻어진 것인지 기억하는 것을 ‘출처기억source memory’이라고 한다. 출처기억은 결국 기억에 관한 기억이기 때문에 메타기억 … 
  … 출처기억에 문제가 생겨 상상과 현실을 잘 구별하지 못하게 되는 경우에 … 망상이나 작화증 … 치매나 조현병의 경우에 자주 나타난다. 

p.280
  부정적인 사건과 관련된 상상을 지나치게 하는 경우를 반추rumination’라고 하는데

p.281
  무식한 강화 학습의 경우처럼 시행착오에 전적으로 의존한다든지 유식한 강화 학습처럼 자신의 환경에 대한 정확한 지식을 요구한다면 … 충분한 경험과 지식이 채 쌓이기 전에 간단하게 … 모방.


지능의 탄생
국내도서
저자 : 이대열
출판 : 바다출판사 2017.04.13
상세보기
반응형

댓글0