닫기

[김동철 칼럼] ‘통계’의 전반적 관리와 이해가 선진국 척도

기사듣기 기사듣기중지

공유하기

닫기

  • 카카오톡

  • 페이스북

  • 트위터 엑스

URL 복사

https://atoo4u.asiatoday.co.kr/kn/view.php?key=20240506010002243

글자크기

닫기

 

승인 : 2024. 05. 06. 18:23

김동철 공학박사
김동철(공학박사, 숭실대 겸임교수)
최고의 전문가가 되기까지 드는 시간과 비용을 모두 알았더라면 시작하기 힘든 분야 중 하나가 '통계'다. 복잡한 응용수학 수준의 통계를 좋아서 시작하는 사람은 별로 없다. 통계 공부를 하다 보면 컴퓨터의 도움 없이는 더 이상 어떻게 해볼 수 없는 벽에 다다른다. 그러나 이제는 컴퓨터가 보편화되면서 통계의 활용도가 탄력을 받고 있다. 이론적으로만 전개해 보던 수학 모형을 이제는 가상의 데이터를 발생시킨 후 모의실험 하거나 실제의 데이터를 가지고 각종 고급통계 기법을 적용하는 시도들이 들불처럼 일어나게 됐다.

일반인들은 통계가 실생활에 어떻게 활용되는지 잘 모른다. 주식투자자라면 주가의 움직임을 표시하는 20일 이동평균선을 기억할 것이다. 이것은 들쭉날쭉한 가격의 추이를 평편하게 보여주는 통계적 데이터 기초 처리기법이다. 일기예보에서는 강수예보를 확률로 표시하기 시작한 지 오래됐다. 선거 개표에서도 당선 확률을 실시간으로 제공한다.

지속가능한 국민연금을 운영하려면 얼마를 거두고 나중에 연금으로 얼마를 지급할지 정하기 위해 개인의 생애를 추정해야 하는 어려움이 있다. 이 경우는 여러 변수를 고려한 고급 통계기법이 사용된다. 만일 평균적인 나이에 사망한 사람이 불입한 금액보다 받은 연금이 너무 많다면 적용된 통계 방법이 잘못된 것이다. 물론 사망한 본인은 모르겠지만 통계의 품질을 관리하는 사람이라면 마땅히 검증해봐야 한다. 또 기대수명은 변화도 계속 추적해야 하는 것은 물론이다.

개인의 신용정보 또한 민감한 통계 사례 중 하나다. 신용평가사들은 개인들의 신용평점을 계산하여 금융기관에 제공한다. 개인 신용점수는 상당히 복잡한 수식을 통해 계산한다. 은행에서 대출을 받거나 보험을 계약할 때 신용도에 따라 대출가능 여부와 이자율 등의 조건이 달라진다.
데이터를 구하기 어려웠던 시절은 지나갔다. 표본 데이터를 가지고 실험을 하던 과거와는 다르게 이제는 마이데이터와 빅데이터의 시대가 한층 무르익고 있다. 스마트폰과 클라우드의 거의 무한대에 가까운 컴퓨터 자원은 모든 개인들의 성향을 다차원적으로 분석해 내고 있다. 인터넷 상점에서 고양이 먹이를 구매했다면, 관련된 영상과 광고가 집중해서 쏟아진다. 전자상거래 책방에서 2차전지에 관한 책을 구입했다면, 전기차에 관련된 책을 다시 구매할 확률이 87%라는 식으로 분류되며, 2차전지 도서를 구매했던 다른 사람들이 함께 구매했던 책들의 리스트를 자동으로 소개해 주는 프로그램이 작동한다.

의사들은 유행하는 감기에 대한 약을 처방할 때, 본인이 알고 있는 제약사의 약을 처방할 수도 있지만, 빅데이터를 참고하는 의사라면 이런 경우 다른 의사들은 어떤 종류의 약을 처방했으며 또 그에 따른 효과와 환자들의 만족도도 알고 싶을 것이다. 이처럼 데이터의 수집과 복잡한 통계적 연산의 한계가 컴퓨터와 빅데이터의 도움으로 해결된 지금 세상은 보이거나 숨어있는 다양한 통계 관련한 일들로 북적거린다.

최근 사용되는 소위 '비즈니스 인텔리전스'라는 분석 소프트웨어는 통계를 잘 모르는 사람들도 쉽게 통계를 사용할 수 있도록 한다. 데이터베이스나 인터넷상에서 필요한 데이터를 쉽게 가지고 와서 즉석에서 관리자에게 보고할 수 있는 자료를 만들 수 있다.

그러나 이러한 기술의 발전과 세상의 변화에도 여전히 미진한 구석이 보인다. 자료를 받아보는 사람의 이해도가 떨어져서 자료를 보고도 질문을 하지 못하는 경우도 많다. 그러한 사람이 한 회사의 대표이사라고 상상해 보라. 또한 데이터와 통계 분석이 적절한지 감리하는 사람도 부족하다. 일례로 전자정부 프로젝트의 경우 IT감리는 있지만 빅데이터나 통계에 대한 감리는 제대로 되고 있는지 살펴볼 부분이다. 이제 통계가 널리 퍼져 있고 한층 중요해지고 있다. 이에 대한 전반적인 관리와 이해가 필수적이고 그것이 바로 선진국의 척도다. 더 이상 터무니없는 통계 문제가 논란이 돼서는 안 된다.

김동철(공학박사, 숭실대 겸임교수)

※본란의 칼럼은 본지 견해와 다를 수 있습니다.

ⓒ 아시아투데이, 무단전재 및 재배포 금지

기사제보 후원하기