본문 바로가기

IT/IT 업무

데이터로 설득하기 - Garbage In Garbage Out(GIGO)

목적을 달성하기 위해선 반드시 누군가를 설득해야 한다.

 

내가 CEO라고 고객을 설득해야 하고,

회사의 구성원이라면 동료들을 설득해야 하고,

심지어 가족 관계도 내가 원하는 목적을 달성하려면 설득해야 한다.

 

 

설득이라는 것은

상대방이 나의 주장을 이해하고 공감하는 것이다.

 

나의 주장을 이해하고 공감하기 위해서는

내 주장이 무엇인지 이야기하고 

주장을 뒷받침 할 근거를 명확히 해야 한다.

그 근거는 사실에 기반으로 할 때 설득력이 가장 높다.

 

 

 

설득을 위한 가장 첫 번째 단계는

정보를 수집을 하는 것이다. 

그리고 모아둔 정보를 나의 주장에 맞게 분석하는 것이 두 번째 단계이다.

 

 

당연한 이야기 처럼 보이지만

많은 사람들이 인공지능, 머신러닝과 같은 데이터 분석 방법을 가지고

분석을 하기에 급급하다. 

 

 

하지만 정보가 사실에 기반하지 않으면

모래 위에 성을 쌓는 격이다. 

분석 방법이 아무리 뛰어나도 자신의 주장을 설득할 수 없다.

 

 

 

정보가 사실에 기반하는지 아는 방법은 다음과 같다. 

1. 정보가 어떻게 생성되는지 알아야 한다.

2. 정보가 어떻게 수집 또는 적재 되는지 알아야 한다.

3. 분석 목적에 맞게 데이터를 잘 가공해야 한다. 

 

 

 

1. 정보가 어떻게 생성되는지 알아야 한다. 

 

어디에서 어떻게 생성되는지 알아야 한다. 

대게 데이터 분석을 데이터가 있는 상태에서 진행되기 때문에 

어떻게 생성되는지에 대해 많이 놓치는 부분이다. 

 

여기에서 데이터 분석 전문가가 아무리 분석알고리즘을 잘 만들어도.

정보 생성자가 그 정보는 잘못 생성된 정보인데요.

하는 순간 와르르 무너지게 된다. 

 

 

 

 

 

2. 정보가 어떻게 수집 또는 적재 되는지 알아야 한다.

1번과 비슷한 맥락이지만, 

생성과 별개로 데이터베이스에 어떻게 적재되냐에 따라

가공하였을 때 천차만별의 결과를 가져올 수 있다.

 

 

예를 들어 

고객의 신용정보가 계속 업데이트되는 경우라면

즉, 과거 정보는 사라지고 새로운 정보로 바뀐다면

그 고객의 최신 신용정보만 사용하면 되겠지만

 

그렇지 않고 신용정보가 계속 누적되는 경우라면

데이터에 업데이트 일자가 존재하지 않을 경우에 

어떤 신용정보가 최신 신용 정보인지 알지 못하게 된다.

(물론, 데이터 적재 시 이런 사항을 고려하여 데이터베이스 전문가들이 다 식별할 수 있게끔 만들어 놓는다.)

 

 

지금은 간단한 예를 들어 설명하였지만

데이터가 생성되고 적재되는 로직이 복잡해질수록

다른 데이터 간의 관계가 많아질수록

아무런 사전 지식 없이 이런 정보를 찾는 것은 정말 힘든 일이다. 

 

 

 

 

3. 분석 목적에 맞게 데이터를 잘 가공해야 한다. 

우선 2번까지의 데이터 생성 및 적재에 대한 파악이 되었다면

이제 분석 목적에 맞게 데이터를 가공하면 된다.

 

 

예를 들어 

내 주장이  "매장 간의 매출 차이가 있다" 라면,

단순히 매장별로 매출 추이를 보면 알 수 있겠지만 

왜 매장별로 매출 차이가 나는지는 알 수 없다.

 

왜 매장별로 차이가 나는지 알기 위해서는

지역별, 지역별 인구수, 매장 위치별 유동인구 등과 같은 정보를 찾아

매출과 분석을 하기 위해 가공해야 한다. 

 

 

다시 한번 강조하지만, 

분석하는 사람들이

데이터가 어떻게 생성되고

어떻게 수집되는지 모르고,

어떻게 가공해야 하는지 모른다면

그 사람은  분석 결과로 그 누구도 설득할 수 없고

그 데이터는 쓰레기가 될 뿐이다. 

설령 보석 같은 데이터였더라도

나한테 필요하지 않으니 쓰레기가 될 수 있다. 

 

 

Garbage in Garbage out 

 

유명한 말이 있다. 

 

데이터는 아무 잘못이 없는데 

혹시 분석하는 사람들이 

보석같은 데이터를 쓰레기로 취급하는 건 아닌지 

다시 한번 생각하는 기회가

되었으면 좋겠다. 

 

 

 

 

 

 

 

반응형