
지구상에는 약 1천만 종의 생명체가 존재하지만, 인간이 관찰한 종은 약 2백만 종에 불과합니다. 나머지 80%는 여전히 미지의 영역으로 남아 있습니다. MIT의 AI 연구원이자 생태학자인 Sara Beery는 인공지능이 이러한 문제를 해결하고, 생태학적 지식을 기하급수적으로 확장할 수 있는 방법을 보여줍니다. 핵심은 단순히 새로운 데이터를 수집하는 것이 아니라, 이미 존재하는 방대한 생태 데이터베이스 속에 숨겨진 지식을 발견하는 데 있습니다. 이 접근법은 과학적 발견의 패러다임을 근본적으로 바꾸는 혁신적인 방법입니다. 이번 강연을 통해 또 다른 인사이트를 얻어가시길 바랍니다.
생태 데이터 속 숨겨진 지식의 보고
현재 우리는 전례 없는 생물 다양성 위기를 겪고 있습니다. 멸종률은 과거 데이터를 기준으로 예상되는 것보다 100~1,000배 더 높습니다. 서식지는 줄어들고, 기온은 상승하며, 화재와 같은 자연 재해는 대규모 사망과 이주를 초래하고 있습니다. 타파눌리 오랑우탄처럼 발견되자마자 이미 심각한 멸종 위기종으로 분류되는 경우도 있습니다. 그러나 희망적인 소식이 있습니다. iNaturalist와 같은 플랫폼에는 열정적인 자원봉사자들이 업로드한 3억 장의 이미지가 있으며, 모든 이미지에서 커뮤니티는 종을 식별했습니다. 이러한 수준의 종 발생 데이터는 이미 과학에 혁신적인 영향을 미치고 있습니다.
하지만 진짜 문제는 픽셀 속에 남아 있는 숨겨진 지식의 보고를 어떻게 효율적으로 접근하느냐입니다. 한 장의 이미지를 예로 들어보겠습니다.
이미지 출처: https://www.inaturalist.org/taxa/447363-Equus-quagga-boehmi/browse_photos?utm_source=chatgpt.com
그랜트얼룩말 (Subspecies Equus quagga boehmi)의 사진 · iNaturalist
www.inaturalist.org
iNaturalist에서 그랜트 얼룩말로 분류된 이미지는 단순히 종의 존재만 증명하지 않습니다. 그 이미지에는 세 마리의 그랜트 얼룩말이 있으며, 고유한 줄무늬 패턴을 기반으로 각 개체를 식별할 수 있습니다. 개체를 식별함으로써 종이 지구를 가로질러 이동하는 방식을 모니터링하고, 종의 사회적 네트워크, 성장, 건강, 심지어 전체 개체수까지 추정할 수 있습니다. 또한 이미지 속 누 떼, 붉은부리소등쪼기새, 배경의 초목 종류와 덮개를 통해 바이오매스를 추정하고 지역에 저장된 탄소에 대해 배울 수 있습니다. 이 많은 지식을 하나의 이미지에 담아 iNaturalist의 3억 장에 곱하고, Xeno-canto의 수백만 건의 생물 음향 녹음, Wildlife Insights의 수천만 건의 카메라 트랩 이미지, FathomNet의 수천 시간 분량의 심해 영상까지 더하면 우리는 생태학적 금광 위에 앉아 있는 셈입니다. 하지만 이미지 하나를 살펴보는 데 1초가 걸린다고 가정하면, iNaturalist의 모든 이미지를 보는 데만 40년 동안 풀타임으로 일해야 합니다. 이것이야말로 과학적 발견이 단순히 새로운 것을 찾는 것이 아니라, 기존 데이터를 새롭게 읽어내는 과정일 수 있다는 통찰을 줍니다.
우리는 정보가 부족한 것이 아니라 그것을 읽을 방법을 몰랐을 뿐입니다. AI는 바로 이 지점에서 혁신적인 역할을 합니다.
| 데이터베이스 | 데이터 유형 | 규모 |
|---|---|---|
| iNaturalist | 이미지 | 3억 장 |
| Xeno-canto | 생물 음향 녹음 | 수백만 건 |
| Wildlife Insights | 카메라 트랩 이미지 | 수천만 건 |
| FathomNet | 심해 영상 | 수천 시간 |
Inquire 시스템: 질문에서 답변까지 3시간
전통적인 AI 접근 방식은 명확한 한계를 가지고 있습니다. 오늘날의 생태학자가 새의 식단에 관심이 있고 데이터베이스에서 곤충을 먹는 새의 사례를 찾고 싶다면, AI 모델을 훈련시키기 위해 수백, 수천 개의 예를 수집해야 합니다. 이 과정은 여전히 너무 느리며, 새로운 질문이 생길 때마다 반복해야 합니다.
Sara Beery의 팀이 MIT에서 개발한 Inquire 시스템은 이 문제를 근본적으로 해결합니다. Inquire는 생태학자들이 어떤 예도 수집하거나 코드를 작성할 필요 없이 데이터에서 답을 찾을 수 있도록 돕습니다. 내부적으로는 이미지와 과학 언어 간의 유사성을 학습하고 이해할 수 있는 AI 모델을 개발했습니다.
Inquire의 작동 방식은 다음과 같습니다.
첫째, 생태학자는 과학적 질문을 가져와 일련의 검색어로 분해하여 실험을 설계합니다. 예를 들어 "곤충을 먹는 새"라는 검색어를 사용합니다. Inquire는 이 검색어를 순식간에 3억 장의 이미지 전체와 직접 비교합니다. 이 시스템은 빠르고 효율적으로 작동하도록 설계되었으며, ChatGPT와 같은 생성형 AI 접근 방식보다 훨씬 적은 연산 능력을 필요로 합니다. 쿼리와의 관련성을 기준으로 이미지를 정렬하면 과학자는 자신과 가장 관련성이 높은 데이터에 집중하고 실제 일치 항목을 빠르게 확인할 수 있습니다. 이제 직접 내보내고 분석할 수 있는, 사람이 확인한 데이터 예시를 얻게 됩니다.
실제 사례를 보면 그 효율성이 더욱 놀랍습니다. 한 협력자는 이 시스템을 사용하여 곤충을 먹는 새뿐만 아니라 씨앗, 과일, 견과류, 썩은 고기, 꿀, 식물 등의 수천 가지 사례를 발견했습니다. 그런 다음 빠르게 발견한 데이터를 사용하여 여름과 겨울 사이 종의 식단 차이를 분석했습니다. 그 결과 아메리카울새는 겨울에도 곤충을 먹지만 여름보다는 훨씬 적게 먹으며, 아메리카나무참새는 여름에는 곤충에 크게 의존하지만 겨울에는 전혀 먹지 않는다는 사실을 발견했습니다.
이 모든 과정, 즉 질문에서 답변까지 약 3시간이 걸렸습니다. 다른 팀은 유사한 연구를 수행하기 위해 데이터를 수동으로 큐레이팅하는 데 1,560시간을 소비했습니다. Inquire의 결과와 해당 연구 결과를 비교하면 거의 완벽하게 일치합니다. 이는 단순한 효율성 향상이 아니라 과학적 질문의 방식 자체를 바꾸는 혁신입니다.
| 방법 | 소요 시간 | 특징 |
|---|---|---|
| Inquire 시스템 | 3시간 | AI 기반 자동 검색 및 분석 |
| 전통적 수동 방식 | 1,560시간 | 사람이 직접 데이터 큐레이팅 |
| 효율성 향상 | 520배 | 거의 완벽한 결과 일치 |
데이터 발견이 여는 보존의 미래
Inquire 시스템의 진정한 가치는 단순히 시간을 절약하는 것을 넘어섭니다. 이 시스템을 사용하는 과학자들의 창의력이 놀랍습니다. 사람들은 화재 후 숲이 어떻게 재생되는지 살펴보거나, 도시와 농촌 지역 간의 종 사망률 차이를 발견하거나, 기후 변화와 관련하여 개화 시기가 어떻게 변하는지 연구하는 등 매우 다양한 질문을 탐구하는 데 이 시스템을 활용하고 있습니다.
이것은 시작에 불과합니다. 이미지를 통해 할 수 있다는 것을 보여줬지만, 생물 음향 녹음, 항공 영상, 위성 데이터, 동물 목걸이에서 나오는 GPS 궤적 등 생각할 수 있는 모든 생태 데이터 유형에 대해서도 유사한 발견 중심 시스템을 설계할 수 있습니다. 이러한 모든 유형의 데이터는 본질적으로 상호 연관되어 있기 때문에 완전히 새로운 기회를 가져다줍니다. 그것들은 모두 지구상의 생명체에 대한 상호 보완적이면서도 뚜렷한 관점을 포착하고 있습니다. 물론 이것만으로는 지구의 자연 위기를 해결할 수 없습니다. 하지만 이미 수집한 데이터의 가치를 극대화하는 데 도움이 됩니다. 결과적으로 지식 격차가 무엇인지 신중하게 이해하고 자원을 전략적으로 사용하여 이러한 격차를 채우기 위해 새로운 데이터를 수집할 수 있습니다.
전반적으로 이는 보존 활동을 지원하는 정보를 얻는 데 드는 시간과 비용을 줄이는 것을 의미합니다. 예를 들어, 먹이와 서식지 자원이 종에게 가장 필요할 때, 즉 해당 지역을 이동할 때, 번식하거나 새끼를 키울 때, 또는 화재와 같은 자연 재해로부터 회복할 때 이러한 자원을 확보하는 방법을 이해할 수 있습니다. 이는 곧 우리가 위협받는 자연을 구하기 위해 지금 당장 행동해야 한다는 것을 의미합니다.
그러나 여기에는 윤리적 질문도 따라옵니다. 이 기술을 누가 사용할 것인가? 과학적 발견이 상업적으로 왜곡될 위험은 없는가? AI가 밝혀낸 데이터를 인간이 어떻게 책임감 있게 활용할 것인가?
이러한 질문들은 기술 발전과 함께 반드시 논의되어야 합니다. 보존의 미래는 외딴 열대 우림이나 깊은 해구에만 있는 것이 아니라 우리가 현재 가지고 있는, 그리고 앞으로 수집할 생태 데이터베이스에 숨어 있습니다. 누구나 데이터를 수집하여 iNaturalist와 같은 플랫폼에 업로드할 수 있습니다. 업로드된 모든 사진, 녹음된 모든 소리, 공유된 모든 관찰은 퍼즐의 한 조각입니다. 우리는 전례 없는 생물 다양성 위기와 이를 해결할 수 있는 전례 없는 도구를 동시에 가지고 있는 역사상 독특한 시점에 서 있습니다. 자연 보존과 과학적 발견에 기여하고자 하는 수백만 명의 사람들이 전 세계에 있으며, 과학자들이 인간만으로는 불가능한 규모로 모든 데이터에서 패턴을 찾을 수 있도록 하는 AI 도구가 있습니다.
AI가 단순한 도구가 아니라 확장된 통찰이라는 점이 중요합니다. AI가 할 수 있는 것은 그저 빨리 계산하는 것이 아니라 데이터 속 정보를 정교하게 읽어내는 것입니다. 자연에 대한 관찰 기록이 수십 년 쌓였더라도 인간의 한계 때문에 보지 못했던 패턴을 AI는 찾아낼 수 있습니다. 이는 우리의 질문 방식 자체를 바꾸는 힘이며, 과학의 정의를 확장시키는 새로운 패러다임입니다. 우리가 이미 가지고 있는 정보, 그 속에 숨어 있는 지식을 읽어낼 줄 아는 사람만이 진짜 미래를 이해하게 될 것입니다.
이 강연은 AI 기술의 놀라움을 보는 것을 넘어, 우리가 세계를 어떻게 관찰하고 이해할지에 대한 새로운 관점을 제시했습니다. 기존 과학의 틀에 갇히지 않고 데이터의 숨은 이야기를 듣고 싶은 사람이라면 그 방향성과 감각을 넓히는 데 큰 자극이 될 것입니다. 다만 현실적 적용 단계, 즉 기업, 연구 기관, 정부의 실제 실행 방식과 정책적 규제, 데이터 접근 문제 같은 현실적 과제에 대해서도 더 깊은 논의가 필요합니다.
자주 묻는 질문 (FAQ)
Q. Inquire 시스템은 일반인도 사용할 수 있나요?
A. 현재 Inquire는 주로 연구 목적으로 개발된 시스템입니다. 하지만 누구나 iNaturalist 같은 플랫폼에 관찰 데이터를 업로드하여 생태 연구에 기여할 수 있으며, 향후 이러한 AI 도구들이 더 대중화될 가능성이 있습니다. 과학적 발견에 참여하고 싶다면 지금 당장 사진을 찍어 업로드하는 것부터 시작할 수 있습니다.
Q. AI가 생태 데이터에서 발견한 정보의 정확도는 어느 정도인가요?
A. 강연에서 소개된 사례에 따르면 Inquire 시스템의 결과는 1,560시간에 걸친 수동 연구 결과와 거의 완벽하게 일치했습니다. AI는 패턴을 찾는 데 매우 효율적이지만, 최종적으로는 전문가의 검증을 거쳐 사람이 확인한 데이터로 분석이 진행됩니다. 이는 정확도와 신뢰성을 모두 확보하는 방식입니다.
Q. 왜 지구 생명체의 80%가 아직 발견되지 않았나요?
A. 지구상에는 약 1천만 종이 존재한다고 추정되지만, 우리는 그중 2백만 종만 관찰했습니다. 많은 종들이 접근하기 어려운 지역에 살거나, 너무 작거나, 밤에만 활동하거나, 개체수가 적어서 발견이 어렵습니다. 또한 전통적인 데이터 수집 방식은 시간과 비용이 많이 들어 현재의 멸종 속도를 따라잡기 어려웠습니다. AI는 바로 이 문제를 해결하는 혁신적 도구입니다.
--- [출처] How AI Is Unearthing Hidden Scientific Knowledge | Sara Beery / TED: https://www.youtube.com/watch?v=fStLnjrZF_c