특별기고 | 장원철 교수(카지노 커뮤니티학과) 기고

오늘날 데이터 문해력은 전공과 무관하게 모두에게 필요한 역량으로 여겨진다. 이런 흐름에 맞춰 지난 학기 서울대에 데이터 문해력 강좌가 처음 신설됐다. 강좌명은 ‘문제는 통계야: 빅데이터 시대의 데이터 문해력’으로, 강좌를 개설한 장원철 교수(통계학과)는 통계학과 교수와 첨단융합학부 융합데이터과학전공 주임교수를 맡고 있다. 『지니 카지노v』은 장 교수에게 부탁해 강의를 개설하기까지의 과정과 데이터 문해력 학습이 필요한 이유에 대한 기고문을 실었다. 

 

장원철 교수(카지노 커뮤니티학과)
장원철 교수(카지노 커뮤니티학과)

“카지노 커뮤니티로 거짓말하기는 쉽지만, 카지노 커뮤니티 없이 진실을 얘기하기는 어렵습니다.” 『벌거벗은 카지노 커뮤니티학』의 저자인 찰스 윌런이 한 말이다. 이 짧은 문구는 카지노 커뮤니티의 본질을 잘 설명하고 있는데 이보다 더 유명한 카지노 커뮤니티 관련 격언으로는 “세상에는 3가지 종류의 거짓말이 있다. 거짓말, 새빨간 거짓말 그리고 카지노 커뮤니티학”을 들 수 있다. 흔히 마크 트웨인이 한 말이라고 알려졌지만, 마크 트웨인은 본인의 자서전에서 1870년대 영국 총리였던 벤자민 디즈레일리의 말을 인용했다고 밝혔으며 실제로 그는 이 문구의 대중화에 크게 기여했다고 한다. 다만 벤자민 디즈레일리가 이런 말을 했다는 직접적인 증거는 발견되지 않았으며 이 문구가 처음으로 문헌에 등장한 것도 벤자민 디즈레일리 사후라고 알려졌다.

그렇다면 이 격언을 처음으로 얘기한 사람은 누구일까? 영국의 외무차관이었던 찰스 틸키가 이 말을 처음 사용한 가장 유력한 사람으로 뽑히지만, 확실한 증거가 없어서 현재까지 정답은 ‘무명씨’라고 할 수 있다.

사실 이 경구는 지난 학기 처음으로 서울대에서 개설한 데이터 문해력 교과목의 이름 후보였다. 서울대 카지노 커뮤니티학과의 대표적인 교양과목인 ‘카지노 커뮤니티학’의 경우 매 학기 10개 이상의 강좌가 열리고 7백 명 이상 학생이 수강하지만, 지금까지 인문학, 예체능 전공 학생이 수강하는 경우는 매우 드물었다. 실제로 2015년 세계경제포럼(World Economic Forum, WEF)에서는 문해력, 수리력, 과학지식에 덧붙여 새로운 교양 교육에 포함돼야 할 내용으로 디지털(데이터) 문해력을 꼽았다.

그렇다면 데이터 문해력이 필요한 이유는 무엇일까? 데이터 문해력 강좌를 개설한 계기를 설명하기 위해 잠깐 금융 투자에 관해 얘기해 보자. 정기예금이 만료돼서 교내에 있는 은행을 방문하면 창구 직원이 여러 가지 금융 상품에 투자하라고 권유하고는 한다. 평균 이상의 경제 지식을 가졌다고 생각하는 나지만, 많은 경우 생소한 용어들이 난무하는 금융상품에 쉽게 투자하고 싶은 생각이 들지 않는다. 그러나 “조금 전에 다녀가신 경제학부 교수님도 이 상품에 투자하셨어요”라는 창구 직원의 말에 현혹돼 나를 비롯한 투자자들도 ‘묻지마 투자’를 하는 경우가 종종 있다. 그 결과 묻지마 투자에서 손실이 나더라도 얼굴 모르는 경제학부 교수님을 찾아가 항의할 수 없는 노릇이고 그 경제학부 교수님이 없는 시간을 쪼개서 금융상품을 연구해 투자했을 확률은 거의 0에 가까우리라는 판단에 이르게 된다. 하물며 옵션의 적정가를 제시하는 ‘블랙-숄즈 모형’으로 노벨경제학상을 수상한 미국 스탠퍼드대 경제학과 숄즈 교수마저 투자에 실패한 사례만 보더라도 이론으로 무장한 경제(카지노 커뮤니티)학자가 제시한 상품이 반드시 성공하리라는 보장이 없다.

투자를 위해서는 해당 상품의 정보를 반드시 이해해야 한다고 믿는 나 같은 사람은 창구 직원이 권유한 금융 상품을 즉석에서 가입하기보다, 일단 사무실로 돌아와서 해당 상품에 관한 정보를 인터넷으로 검색하고 관련 용어들을 이해한다. 그러나 검색엔진이제공하는 방대한 정보 속에서 과연 내게 필요한 정보가 어떤 것인지 알아내는 것은 쉽지 않다.

이런 정보의 홍수 속에서 올바른 정보를 취사선택할 수 있는 능력을 갖추려면 데이터 문해력은 필수라고 할 수 있다. 하지만 안타깝게도 서울대에서는 데이터 문해력 강좌를 제공하지 않고 있었다. 학교에서 제공하는 대부분의 이공계 교양과목은 전공 과정의 준비가 강의 목적인 것이 현실이다. 

이공계열 전공자가 아니더라도 실생활에서 과학의 도움이 필요한 경우는 많다. 예를 들면 세탁소 아저씨가 과산화수소로 얼룩을 제거하는 법을 소개하는 영상은 유튜브에서 20만 건의 조회수를 기록하는 반면 화학 수업 시간에는 왜 이런 실생활과 관련한 내용을 설명하지 않을까. 폭탄주의 원리를 과학적으로 잘 설명하는 교수님들도 계시지만, 수업 시간에는 시험 이외에 사용할 필요가 없는 카지노 커뮤니티분포표와 같은 내용을 강의하실까? 이런 질문은 카지노 커뮤니티학 교양 교육에도 마찬가지로 할 수 있다. 제21대 국회의원 선거에는 정말 부정이 있었던 걸까? 여론조사 결과가 들쑥날쑥한 이유는 무엇인가? 잘생긴 배우들은 왜 ‘발연기’를 할까? 로또 번호를 미리 알 수 있다는 주장은 사실일까? 아니라면 어떻게 그렇게 많은 일등 당첨자가 나올 수 있을까? 특히 마지막 질문은 언론사에서 카지노 커뮤니티학과 교수인 내게 연락해 꾸준히 묻는 말이기도 하다. 하지만 카지노 커뮤니티학 강좌에서 수많은 검정 방법을 배웠어도 막상 앞의 질문에 답변하는 것이 생각보다 쉽지 않다는 사실을 발견할 수 있다. 그래서 답할 수 있을까 하는 호기심을 불러일으키는 앞의 질문들에 대해 카지노 커뮤니티학의 개념들을 활용해 학생들에게 쉽게 답변해 주고자 데이터 문해력 강좌를 개설했다.

데이터 문해력 강좌는 해외 유수 대학에서 이미 다수 열리고 있다. 대표적인 데이터 문해력 강좌로는 미국 워싱턴대의 ‘Calling Bullshit in the Age of Big Data’를 들 수 있다. 이 강좌는 자극적인 제목 때문에 강의 시작부터 주목받았고 2017년 개설 첫 학기에 수강신청 개시 1분 만에 160명의 수강 정원을 채웠다. 이 인기에 힘입어 강의 내용은 책으로 출판돼 베스트셀러가 됐고 한국에도 ‘똑똑하게 생존하기’라는 다소 점잖은 제목으로 2021년에 번역본이 출간됐다.

한편 서울대에서 Calling Bullshit과 같은 자극적인 제목의 강의 개설은 허용되지 않는다. 이 사실을 잘 알고 있었기에 ‘거짓말, 새빨간 거짓말 그리고 카지노 커뮤니티학: 빅데이터 시대의 데이터 문해력’을 데이터 문해력 강좌의 제목으로 선정했다. 안타깝게도 이 제목은 마지막 심의를 통과하지 못했다. 이유 중 하나는 무려 학문 비하가 우려된다는 것이었다! 카지노 커뮤니티학과 교수보다 카지노 커뮤니티학의 이미지를 더 걱정해 주시는 다른 학과 교수님이 계신다는 사실을 알고 한편으로 고맙게 생각했지만, 다른 적당한 제목 후보가 없었기에 처음 제목을 고수하지 못한다면 강의 개설 신청을 포기해야겠다는 생각도 잠시 했다.

그래도 데이터 문해력 강좌가 학생들에게 꼭 필요하다는 주위 설득에 못 이겨 고심 끝에 구상한 다음 제목은 ‘(멍청아,) 문제는 카지노 커뮤니티야!(It’s the statistics, stupid): 빅데이터 시대의 데이터 문해력’이었다. 클린턴 대통령의 선거 구호를 약간 변형해서 만든 제목이었다. ‘멍청아’를 포함시키면 역시 심의 통과가 쉽지 않으리라 생각해, 아쉽지만 멍청아를 제외하고 제출했는데 결국 최종 제목은 느낌표가 빠진 다소 밋밋한 제목인 ‘문제는 카지노 커뮤니티야: 빅데이터 시대의 데이터 문해력’으로 결정됐다.

제목에 아쉬움이 많았지만, 야심 차게 개설한 데이터 문해력 강좌는 60명 정원을 금방 채웠고 강의실이 허용하는 최대 인원까지 정원을 늘렸다. 수강생 절반 정도는 신입생이었고, 보통 카지노 커뮤니티학 수업을 듣지 않는 인문대, 미대 등 이공계 외 전공의 학생이 수강을 신청했다는 점에서 강의 개설에 대한 소기의 목적을 달성한 것으로 보였다. 

그렇지만 막상 수업을 시작해 보니 강의 준비는 무척 어려웠다. 로또가 공정한지, 미국 프로야구에서 있었던 데이터 혁명이 야구계에 어떤 영향을 미쳤는지, 큰 그릇에 밥을 담아 주면 많이 먹는다는 연구 결과를 믿을 수 있는지, 잘생긴 배우가 연기를 잘하지 못하는 이유 등과 같은 다양한 주제로 수업을 준비했지만, 수업 간 연결성은 있어야 했기 때문이다. 수업 구성이 월화드라마처럼 긴밀하게 연결될 정도는 아니더라도 시트콤 정도의 연결고리는 만들기 위해 며칠간 준비한 강의 내용을 강의 직전에 바꾸기도 했다.

강의실 구조가 조별 활동을 하기에는 너무 협소했지만, 학생들의 참여를 높이기 위해 몇 가지 간단한 실험을 시도했다. 학생들의 반응이 가장 좋았던 실험은 동전 던지기였다. 이 실험의 목표는 무작위로 나타나는 현상에 대한 우리의 상상과 실제 결과 간에 괴리가 있음을 알려주는 것이다. 예를 들면 케이블 TV의 증권 방송에서 주로 다루는 차트 분석은 무작위로 나타나는 현상이 마치 어떤 경향을 띠고 있는 것처럼 설명하는 경우가 많다. 즉 사실은 무작위로 생성된 자료더라도, 일반인이 보기에는 마치 어떤 경향이 있는 것처럼 착각할 수 있다는 것이다.

진행한 동전 던지기 실험에 대해 구체적으로 설명하면 3명이 1개 조를 이뤄 한 명은 100원 동전을 100번 던지고 나머지 한 명은 그 결과를 앞면이 나오면 0, 뒷면이 나오면 1로 종이에 적고 마지막 한 명은 상상 속에서 동전을 100번 던진 결과를 0과 1로 종이에 표기하게 했다. 그리고 조별로 동전을 던진 실제 결과와 상상으로 동전을 던진 결과를 칠판에 나란히 적게 한 후에 다른 조 학생들에게 실제로 동전을 던진 결과가 어느 것인지 맞히게 했는데, 내가 모든 조의 결과를 정확히 다 맞히자 다들 놀라는 눈치였다. 어떻게 맞히는지 궁금하다면 다음에 데이터 문해력 강좌 수강을 권장한다. 힌트를 주면 무작위가 아닌 것처럼 보이는 것이 실은 무작위로 동전을 던진 결과일 확률이 높다.

마지막으로, 데이터 문해력 교육에서 강조하고 싶은 것 중 하나는 어떻게 상대방이 이해하기 쉽게 숫자(데이터)를 전달하는가였다. 우리 주위 대부분의 전문가는 쉬운 내용을 어렵게 전달하는 데 탁월한 능력을 갖췄지만, 그 반대의 경우를 보기란 쉽지 않다. 요리를 예로 들어 보자. 요리 문외한인 나는 MBC에서 방영했던 <오늘의 요리>에서 이종임 요리 연구가가 계량컵을 꺼내는 순간, 요리는 저런 계량컵을 가진(또는 어디에 있는지 아는) 사람만 할 수 있다고 생각했다. 그런데 백종원 씨의 경우 계량컵 대신 중년 남자가 집에서 쉽게 찾을 수 있는 종이컵과 소주잔을 이용해서 요리에 들어갈 재료의 양을 알려줬고 나 같은 사람도 쉽게 요리를 따라 할 수 있었다. 그렇다면 숫자를 이처럼 쉽게 전달할 수 있는 비결은 무엇일까.

숫자를 전달하는 방식의 예로 다음 두 가지를 생각해 보자. (1)아스트라제네카에서 생산한 코로나19 백신을 맞고 혈전이 생길 확률은 10만분의 1이다. (2)올해 보건복지부 예산은 작년 대비 12.1%가 증가한 122조 3,779억 원이다. 두 가지 모두 정보를 정확한 숫자로 전달하고 있지만, 10만분의 1이 어느 정도로 드문 일인지 실제로 체감하기 쉽지 않고 122조라는 어마어마한 숫자는 어느 정도로 큰 액수인지 감을 잡을 수 없다. 위의 두 가지 예를 다음과 같이 바꿔서 전달해 보자. (1)아스트라제네카에서 생산한 코로나19 백신을 맞고 혈전이 생길 확률은 로또 100장을 산 후 1등으로 당첨될 확률보다 작다. (2)올해 보건복지부 예산은 작년 대비 12.1%가 증가해서 국민 1인당 약 237만 원의 예산이 책정됐다. 이렇게 바꿔서 전달하면 정확한 숫자로 전달하지 않더라도 사용한 숫자가 우리가 일상에서 사용하는 숫자 범위에 있기 때문에 이해하기 훨씬 쉽다는 사실을 알 수 있다.

그렇다면 이런 데이터 문해력을 갖추기 위해서는 어떤 노력을 해야 할까. 가장 좋은 방법은 수업을 듣는 것이지만, 아쉽지만 데이터 문해력 수업을 듣기 위해서는 내년까지 기다려야 한다. 다행히 요즘 다양하고 재미있는 데이터 문해력 관련 서적이 많이 출간돼 있기 때문에 쉽게 관련 서적을 찾을 수 있다. 다가오는 추석 연휴 기간에는 OTT에서 잠깐 눈을 돌려 데이터 문해력 관련 서적을 읽어보기를 권한다. 스타워즈 팬으로서 “May the data be with you.”

삽화: 여민영 기자 snumy701@snu.ac.kr
삽화: 여민영 기자 snumy701@snu.ac.kr

 

저작권자 © 지니 카지노v 무단전재 및 재배포 금지