1분과학·북툰·SOD

[북툰] 무작위적 데이터가 알려주는 경고(수학의 힘으로 보는 세상)

Buddhastudy 2024. 2. 27. 19:30

 

 

동전을 던져서 앞면이 나올 확률은 50%입니다.

그래서 동전을 던졌는데 계속 뒷면만 나온다면

사람들은 높은 확률로 다음에 앞면이 나올 거라 기대합니다.

하지만 뒷면이 아무리 많이 나온다 해도

새로 던지는 동전의 확률이 바뀌진 않습니다.

 

동전 던지기는

무작위적이고 독립적인 사건입니다.

앞의 결과와 상관없이

새로 던지는 동전의 앞면이 나올 확률은

언제나 50%입니다.

무생물인 동전은

바로 앞의 결과를 기억하지 못합니다.

 

그러나 무작위적이고 독립적인 사건도 충분히 반복되면

원래 기대했던 확률값이 살아납니다.

예를 들어

동전을 100번 던질 때

그중 40에서 60%가 앞면일 것임이 거의 확실하다면

100만 번을 던질 때

이 범위가 49.9%에서 50.1% 좁혀집니다.

 

던지는 사건의 표본이 많아질수록

표본의 평균값이 원래 예상했던 기대값의 가까워지는 것입니다.

이를 수학에서는 큰 수의 법칙이라 합니다.

 

다시 한번 보겠습니다.

동전 던지기의 기대값은 0.5입니다.

동전을 열 번 던졌을 때

그 평균값이 정확히 0.5가 될 확률은 낮습니다.

하지만 100, 천번, 만 번 던질수록

표본 평균은 0.5에 수렴합니다.

 

동전보다 경우의 수가 많은 주사위를 굴릴 때에도

큰 수의 법칙은 똑같이 작용합니다.

주사위 굴리기의 기댓값은 3.5입니다.

주사위를 열 번 굴렸더니

표본 평균이 3.9가 나왔습니다.

 

그러나 주사위를 더 많이 굴린다면

표본 평균은 기대값에 점점 가까워집니다.

 

 

큰수의 법칙에 따라 나온 결과값을 그래프로 나타내면

좌우로 대칭적인 종모양의 곡선이 나옵니다.

이런 곡선을 정규곡선또는 가우스 곡선이라 부릅니다.

 

정규 곡선은 평균을 구하는 많은 상황에서 보편적으로 등장합니다.

그렇다면 동전 던지기와 주사위 굴리기의 정규곡선을 한번 비교해 보겠습니다.

비교를 편리하게 하기 위해

동전 양면에 각각 34를 적겠습니다.

그러면 동전 던지기의 기대값이 3.5가 되어

주사위 굴리기의 기대값과 같아집니다.

 

동전과 주사위를 각각 만 번을 던졌을 때

기대값은 같은데 형태가 조금 다른 정규곡선이 도출되었습니다.

 

동전은 좁고 주사위는 넓습니다.

동전 곡선은 거의 모든 결과값이

가운데 값으로부터 100 이내에 놓이는데 비해

주사위 곡선은 300쯤 떨어져 있습니다.

 

이는 주사위 굴리기가 동전 던지기보다

불확실성이 더 큰 사건임을 보여줍니다.

 

좁은 곡선은 기대값에 더 집중된 결과를 보여주고

넓은 곡선은 더 불확실한 결과를 보여주는 것입니다.

 

실험을 반복할수록 정규곡선의 모양은 좁아집니다.

큰 수의 법칙에 따라 표본 평균이 기대값에 가까워지기 때문입니다.

 

정규곡선은 매우 위력적인 수학적 도구입니다.

분산값을 알고 있는 실험이 종모양의 곡선을 이룬다면

우리는 실험 결과를 미리 예측할 수 있습니다.

 

기대값과 분산은

무작위적인 사건들의 가운데값과 분포 상태를 파악하기에 유용합니다.

하지만 때로는 꼬리를 알아야 하는 경우도 있습니다.

어떤 사건들은 극단값에 본질이 숨어 있습니다.

 

인스타그램을 보면 친구들의 삶은 하나같이 멋있어 보입니다.

와인을 마시고 예쁜 식사를 하며 수시로 여행을 다닙니다.

 

이런 사진이 정말로 친구들의 평균적인 삶을 대표하는 것이라면

내 삶은 왠지 초라해 보입니다.

그렇지 않고 극단값에 해당하는 것이라면

그래도 위로가 됩니다.

 

친구들도 나처럼 대부분의 시간을 평범하게 보내지만

인스타에는 극단적인 순간만 올리고 있는 것입니다.

모르긴 몰라도 친구들의 사진은

종 모양의 가운데보다 꼬리에 해당할 확률이 높겠죠.

 

 

극단값은 특히 날씨를 다룰 때 중요해집니다.

날씨와 관련해서는 일반적인 기상 변화보다 드물지만

홍수, 폭염, 눈보라 같은 이상 기후가

우리 삶에 큰 영향을 끼치기 때문입니다.

 

그래서 기상학자들은

100년에 한번 날까 말까한 홍수와 같은

극단적인 기상 상황을 예측하려고 애를 씁니다.

 

극단 값으로 날씨를 보면

기후 변화 문제가 얼마나 심각한지 이해할 수 있습니다.

 

기후 모델에 따르면

다른 조치를 취하지 않을 경우

2032년까지 지구의 평균 기온이

산업화 이전보다 섭씨 1.5도 높아질 것으로 예상합니다.

 

1.5도라고 하니 그게 그렇게 심각한가?’ 싶기도 합니다.

우리나라의 여름철 전국 평균 기온이 23.7도인데

그게 25.2도가 된다고 해서 딱히 걱정할 이유가 있겠습니까?

 

하지만 기후 변화의 심각성은

평균값이 아닌 극단값에서 드러납니다.

최근에 전 세계적으로 폭염 일수가 점점 많아지고

그에 따라 국가별 최고 기온 기록이 갱신되고 있습니다.

 

2018년에 서울의 최고 기온은

관측 최고치인 39.6도까지 치솟았습니다.

그해 강원도 홍천군은 무려 41도를 기록했습니다.

2022년에 영국의 최고 기온은 40.3도까지 뛰었습니다.

 

섭씨 40도가 넘으면 생태계가 위험하다고 할 때

기후 모델에서 제시한 평균온도 1.5도 상승은

이전에 38.5도였을 날을 위험 범위로 옮겨 놓습니다.

 

또한 기후 변화로 인해 기후의 불확실성이 증가하면

기온 분포의 분산이 증가하고

이는 기온의 변동성을 높여

기온 분포의 양쪽 극단 값을 훨씬 빈번하게 나타나게 합니다

이것이 기후 변화의 위험성입니다.

 

비교적 작은 기온 변화도 극단값으로 보면

위험 범위에 속하는 날이 급격히 늘어날 수 있습니다.

 

극단값은 금융 시장에서도 중요한 변수입니다.

예측을 벗어나는 주가 변동폭은

주로 극단 값에서 나타나기 때문입니다.

이러한 위험 신호를 과소평가하는 바람에

2007년에는 세계 금융 시장이 붕괴할 거라는 가능성을

안이하게 평가하기도 했습니다.

이와 똑같은 일이 기후 변화에서도 일어날 수 있습니다.

 

 

수학은 아마도 극단값에 속하는 학생들 외에

아주 인기 있는 과목은 아니었을 겁니다.

그런 수학이 졸업을 한 뒤에는 인기 분포도가 커지고 있습니다.

 

우리나라 과학책 시장에서 꾸준한 독자층을 가진 분야 중 하나가

바로 수학 관련 교양서적입니다.

수학이 뒤늦게 인기를 끄는 이유는 무엇일까요?

 

사실 현대인에게 숫자와 통계는 일상입니다.

뉴스에서든 직장에서든

우리는 매일매일 쏟아지는 숫자와 통계를 마주합니다.

주식, 부동산, 세금처럼

내 삶에 직접적으로 관련 있는 분야뿐만 아니라

가만 보면 세상 돌아가는 모든 면면이

수학과 관련해 있습니다.

 

쏟아지는 숫자와 통계를 단순한 산술식으로 분석해도 좋겠지만

조금만 더 깊이 있게 분석한다면

더 정확한 결정을 내리고, 더 빨리 변화를 감지하고

더 신중히 미래를 예측하는데 도움이 될 겁니다.

이것이 바로 수학이 뒤늦게 인기를 끄는 이유가 아닐까요?

 

 

올리버 존슨은

영국 브리스톨 대학교의 정보이론 교수이면서

대중들에게 수학과 통계를 쉽게 전달하는 일을 하고 있습니다.

 

그가 쓴 책 <수학의 힘>

영국 아마존의 스테디 셀러에 오를 정도로

독자들의 사랑을 많이 받고 있습니다.

 

<수학의 힘>에서 올리버 존슨은

수학의 본질적인 특성을

구조, 무작위성, 정보의 관점으로 분해서 설명합니다.

 

이 세 가지 관점으로 보면

우리 주변에서 일어난 사건들이 얼마나 재밌는지

혹은 얼마나 본질을 숨기고 있는지를 알 수 있습니다.

 

위험을 예고하는 경고 신호는

보통 극단적인 상황에서 더 자주 나오기 마련입니다.

이를 모르는 바는 아니겠지만

사람들은 종종 그런 경고 신호를 외면하거나 무시하곤 합니다.

 

그렇게 외면하고 무시하고 싶은 상황이라도

누군가가 객관적으로 다시 짚어줄 때

우리는 금방 냉철함을 되찾을 수 있습니다.

 

<수학의 힘>은 바로 그런 부분을 멋지게 다루고 있습니다.

우리 일상을 조금 더 깊이 있게 분석할 필요가 있을 때

우리 일상을 객관적으로 다시 짚어줄 필요가 있을 때

<수학의 힘>을 추천드립니다.

 

지금까지 북툰이었습니다.

시청해주셔서 감사합니다.