2022년 2월 25일 본 칼럼 <오미크론 변이와 ‘적합도 지형’>에서 진화생물학의 적합도 지형에 대해 소개했다. 적합도 지형은 말 그대로 멀리서 바라본 울퉁불퉁한 산의 지형을 닮았다. 내가 사는 수원에 있는 광교산을 예로 들어보자. 광교산을 등산 중인 나의 위치는 매 순간 위도와 경도의 두 숫자로 표시할 수 있고, 위·경도 좌표마다 해발고도가 주어진다. 광교산 전체의 지형은 위도와 경도로 주어진 이차원 평면의 각 점(x, y)에 해발고도를 수직축(z)에 대응시켜 울퉁불퉁한 그림으로 표현할 수 있다. 산을 오를 때 나는 광교산 지형의 현재 위치에서 고도가 높아지는 방향으로 걸어가고 내려올 때는 고도가 낮아지는 방향으로 걸음을 옮긴다. 반딧불이 화장실에서 출발해 형제봉을 거쳐 비로봉에 오르고, 토끼재에서 방향을 바꿔 상광교 버스 종점으로 하산하는 등산로가 내가 자주 이용했던 길이다. 형제봉 주변에서는 형제봉 정상이 가장 높고 비로봉 주변에서는 비로봉 정상이 높다. 광교산 전체의 지형에는 여러 봉우리와 골짜기가 있다.
1932년 이론 진화생물학자 시월 라이트(Sewall Wright)가 제안한 적합도 지형에서는 광교산 지형의 위·경도에 해당하는 것이 가능한 모든 유전형이고, 광교산의 주어진 위·경도 좌표마다 해발고도가 정의되듯이 주어진 유전형마다 적합도가 주어진다. 유전형의 함수인 진화생물학의 적합도는 주어진 유전형을 가진 개체가 낳는 후손의 숫자에 비례한다. 진화의 적합도 지형도 광교산 지형처럼 여러 봉우리와 골짜기가 존재해 울퉁불퉁하다. 상대적으로 높은 적합도를 가진 유전형의 비율이 개체군 내에서 증가하는 것이 진화의 과정이다. 생명은 변이를 통해 적합도 지형의 높은 봉우리를 향해 끊임없이 나아간다. 그런데 이런 표준적인 이해에는 고개를 갸웃하게 하는 의문점이 남아있었다.
적합도가 큰 변이가 유전으로 이어지는 다윈의 진화에서, 변이는 적합도 지형의 현재 위치에서의 작은 발걸음에 해당한다. 진화의 과정에서 유전형의 작은 변이는 대부분 적합도를 줄인다. 광교산의 두 봉우리 사이는 한 걸음 거리가 아니어서 형제봉에서 출발해 비로봉으로 가려면 먼저 산비탈을 한참 걸어 내려와야 다음 봉우리를 향한 오르막이 시작된다. 마찬가지다. 마구잡이 작은 변이로 이루어지는 진화의 과정에서 적합도 지형의 현재 봉우리에서 출발해 멀리 떨어진 더 높은 봉우리로 오르려면 먼저 긴 비탈을 따라 내려와야만 하는 것이 아닐까? 비탈을 내려오며 마주하게 되는 적합도의 감소를 생명은 어떻게 감내하는 것일까?
지금까지 적합도 지형에 대한 연구는 주로 이론적인 모형을 통해 이루어져 왔다. 내가 속한 통계물리학 분야에도 생명의 진화를 적합도 지형의 관점에서 이론 모형으로 살펴보는 연구자가 제법 많다. 최근 학술지 <사이언스>에 대장균(E. Coli)을 이용한 생물학 분야의 놀라운 실험 논문이 출판되었다(DOI:10.1126/science.adh3860, 1988년 시작해 지금도 계속되고 있는 대장균의 장기간 진화 실험에 대해서는 이대한의 책 <인간은 왜 인간이고 초파리는 왜 초파리인가>을 추천한다). 논문의 연구자들은 대장균의 염기서열 중 항생제 내성에 관련된 9개의 염기를 택해서 가능한 모든 조합의 유전형을 가진 개체를 만들어 내고, 각각의 유전형이 가진 적합도를 실험으로 측정했다. 지구 생명의 DNA는 4개의 염기(A, T, G, C)로 구성되어 있다. 따라서 염기서열의 한 위치에 놓일 수 있는 염기의 가짓수는 4가 되고, 결국 길이가 9인 염기서열에서 가능한 모든 경우의 수는 4를 9번 곱한 26만2144가 된다. 논문의 연구자들은 2020년 노벨 화학상을 받은 크리스퍼-캐스9 시스템을 이용해 9개 염기의 모든 가능한 조합을 유전자 편집으로 만들어 냈다. 엄청난 수의 유전형마다 항생제가 있는 환경에서의 적합도를 측정해 대규모의 적합도 지형을 만들어 냈다.
이렇게 구성된 적합도 지형을 분석하기 위해 유용한 분석 틀이 바로 복잡한 연결망(complex network)의 관점이다. 26만개가 넘는 유전형 각각을 연결망의 노드로 정의하고, 두 노드가 딱 한 염기의 차이로 연결되면 둘 사이에 연결망의 링크를 두는 방식인데, 유전형의 차이가 표현형의 차이로 이어지는지도 함께 고려해 전체 연결망을 구성했다. 물론 연결망의 노드마다 실험을 통해 얻어진 적합도가 숫자로 주어지게 된다. 이렇게 만들어진 전체 연결망에서 서로 링크를 통해 묶여 있는 덩어리 중 가장 큰 것을 ‘거대 덩어리’(giant component)라고 한다. 논문에 따르면 거대 덩어리에 52% 정도의 노드가 들어있는데, 바로 이 거대 덩어리 부분의 연결망을 대상으로 분석이 진행되었다.
먼저, 논문의 연구진은 높고 낮은 봉우리가 무려 514개여서 적합도 지형은 상당히 울퉁불퉁하다고 보고한다. 이중 상당히 높이가 낮아서 적합도가 대장균의 야생형(wild type)보다 낮은 봉우리가 400개가 넘는다. 낮은 봉우리 중 하나에서 출발하면 저 높이 솟은 항생제 내성을 가진 높은 봉우리로 이동하는 것이 과연 가능할까? 논문의 연구진은 얼마든지 가능하다고 답한다. 항생제 내성으로 높은 적합도를 가진 적합도 지형의 높은 봉우리로 연결되는 샛길이 존재하는 유전형이 무려 전체의 75% 정도라는 결과다. 게다가 샛길의 길이가 무척 짧아 적은 수의 변이로도 봉우리에 오를 수 있다는 결론이다.
광교산 형제봉에서 출발해 비로봉으로 걸어가려면 아래로 이어지는 긴 발걸음이 필요하지만, 진화의 적합도 지형에서는 형제봉과 비로봉이 단 몇 발짝 떨어져 있다고 비유할 수 있다. 그 이유도 의외로 단순하다. 광교산 지형은 위도와 경도라는 2차원 평면 위에 놓이지만, 진화의 적합도 지형의 공간 차원은 이보다 훨씬 크기 때문이다. 공간 차원이 높아질수록 거리가 줄어드는 이유는 쉽게 이해할 수 있다. 2차원 사각격자의 한 점은 주변의 네 점에서 한 걸음으로 이어지고, 정육면체 모양의 3차원 격자점 하나는 주변 여섯 점에서 한 걸음이다. 공간의 차원이 높아질수록 더 많은 점이 한 걸음으로 연결된다. 논문 연구진에 따르면 실험 결과로 구성한 적합도 지형의 가장 높은 봉우리 주변의 공간 차원이 무려 9차원이라고 한다. 그리고 이처럼 높은 차원의 효과로 무려 75% 정도의 유전형이 항생제 내성으로 무장한 높은 적합도의 봉우리와 쉽게 연결되게 된다. 적합도 지형 위를 변이의 작은 발걸음으로 걸어가는 생명은 높은 봉우리를 의외로 쉽게 오른다는 것이 오늘 소개한 논문의 한 줄 요약이다. 우리가 좁은 도랑을 한걸음에 넘어가듯이, 두 봉우리를 가르는 적합도 지형의 골짜기를 생명은 쉽게 폴짝 건넌다. 아주 높은 봉우리는 몇 없어도 그곳으로 이어지는 샛길은 지천이다. 어디서 출발해도 생명은 의외로 쉽게 길을 찾아 봉우리로 오른다. 울퉁불퉁한 적합도 지형의 많은 봉우리는 부드러운 짧은 샛길로 이어져 있다.