- 데이터에서 직접적인 답을 얻을 수는 없음 → 대신 데이터를 보기 전에 "무엇을 알고 싶은지 / 이를 알게 되면 무엇을 하고 싶은지 / 이를 위해선 어떤 데이터(지표)가 필요한지" 생각하고 그에 대한 답을 찾기 위해 노력해야함
- 데이터의 가치
- 광범위하고 객관적인 주장을 합리적으로 전달 가능
- 절대적인 정답이 존재하지 않을 때, 자신의 생각을 논리적/객관적으로 상대방에게 전달/이해시킬 수 있게 도움을 줌
- 결국 필요한 것은 자신의 결론으로 이끌어내는 이야기를 만드는 능력!
- 데이터 활용 프로세스
- 겉으로 드러난 현상 → 목적 및 문제를 정의 → 지표를 결정 → 현재 상태를 파악 → 평가 → 요인을 분석 → 해결 방안을 모색
- ✴️ 데이터는 목적을 달성하기 위한 도구 ✴️
✴️ 목적 사고력 ✴️
1. 목적 / 문제 정의
- 비즈니스 문제 해결을 위한 문제 정의
- 문제가 무엇인가?
- 그 문제를 일으키는 원인은 무엇인가?
- 그 원인에 대한 해결방안은 무엇인가?
- 결론 도출의 프로세스
- 평가 지표와 기준을 결정 (목적 부합성 판단) → 적합한 데이터 / 그래프 선택 → 결론
- 💭 현 상황에 대한 인과관계 정리 필요
- 💭 데이터를 보고 그로부터 문제를 찾아내게 만들 수 있을까? (객관성 / 논리성)
2. 현상 파악 및 평가력
- 현황 파악 = 성과 및 사실/결과를 확인 & 그에 대한 평가를 진행
- 가치 있는 정보란?
- 구체적인 행동을 특정할 수 있음 (누가 언제 무엇을 했는지)
- 구체적인 판단을 내릴 재료가 됨
- 비교의 기술
- 내부/외부 비교
- 추이/변화 비교
- 편차 고려
- 데이터 평가 기준
데이터 평가 기준 | 대표적 지표 |
값의 크기 | 평균값, 합계 |
추이 | 선형그래프, 막대그래프, 변화율 |
등락폭 | 표준편차, 도수분포도 |
비율 | 분수, 퍼센트 |
3. 원인 파악력
- 원인 파악력: 행동으로 이어지는 힘
- 데이터 활용 조직의 최종 목표
- 데이터에서 나온 정보를 통해 문제 해결 방안을 수립 /
구체적인 행동 계획을 마련 /
관계자들이 납득할 만한 합의 또는 판단을 내림
- 데이터에서 나온 정보를 통해 문제 해결 방안을 수립 /
- 해결 방안은 원인에 실행되어야 함
- 결과에 대한 원인 파악 (왜 그 결과에 이르렀는지, 왜 문제가 일어나고 있는지)
- 현황 파악, 분석 및 비교를 통해 문제점 도출 → 그 결과에 이르게 된 근거 및 원인도 제시되었는가 확인
- 데이터를 통한 원인 분석
- 원인 후보를 열거 → 지표를 결정 → 관련성을 확인
- 주관적인 원인 후보 파악보다는 보다 유연하고 가볍게, 넓은 시야를 가지고 생각해보기
- 목적과 사례에 맞추어 어떤 데이터를 활용할지 결정하는 것이 원칙이지만, 실제로 콕 집어 선택하기 어려운 경우에는 몇 가지 지표를 함께 활용하여 각각 분석을 수행해보는 것이 현실적임
- 문제와 원인 사이의 관련성 파악
- 1단계: 시각적으로 관련성 확인
- 전체적인 경향을 파악 / 그룹화 / 벗어나있는 값들에 주목 / 변화점을 파악
- 2단계: 통계 지표를 확인 (상관분석, 상관계수)
- 1단계: 시각적으로 관련성 확인
- 관련성 탐색 시 주의사항
- 직접적인 관계인지 간접적인 관계인지
- 원인은 한 가지가 아니라 여럿이거나 복잡하게 얽혀있을 수도 있음
- 위험 회피를 위해 모든 가능성을 염두에 두고 사고를 확장해 원인을 고려하는 것이 필요
- 선형이 아닌 관계성도 존재함
- 상관관계가 복잡해보일 때는 전체를 부분으로 나누고 그 범위에서 상관관계 유무를 확인하는 형태로 분석 진행 가능
- 상관관계 ≠ 인과관계
4. 전체 구성력
- 전체 구성력: 스토리(논리)를 만드는 힘
- 무엇이 문제인지를 적절하게 정의하고, 그 문제에 대한 원인을 폭넓게 열거해서, 각 원인에 대한 해결 방안을 도출
- 논리적 사고: 개별 데이터와 분석에 대한 것이 아니라, 전체적인 스토리를 탄탄히 구성하고 결론의 설득력을 높이기 위한 사고력과 구성력
- 해결 방안의 의의
- 어째서 (다른 수단이 아니라) 그것이 필요한지?
- 그로 인해 어떤 것을 실현 또는 해결 가능한지? 효과적인 결과가 나올 것이라는 근거는 어디에 있는가?
5. 정보 집약력
- 정보 집약력: 정보를 수집하고 결론을 이끌어내는 힘
- 결과 ≠ 결론
- 결과: 계산과 분석을 해서 나온 결과물
- 결론: 그 결과가 목적에 대한 어떤 의미가 있는지 설명하는 것
결과 | 결론 |
메일링 리스트에 등록된 사람의 방문횟수가 더 높음. 여성 고객의 경우 등록한 사람이 그렇지 않은 사람보다 평균값이 높음. | 메일링 리스트 등록은 방문 횟수 증가에 효과적임. 메일링 리스트 등록은 여성 고객에게는 효과적이지만 남성 고객에게는 그렇지 않음. |
교외 지역의 평균 집세가 도심 지역의 평균 집세보다 낮음. | 시세는 교외가 도심보다 저렴한 편이지만, 선택의 폭을 선택하면 도심 쪽이 압도적으로 넓다고 할 수 있음. |
6. 시야 확대력
- 시야 확대력: 데이터로부터 시야를 넓히는 힘
- 눈 앞에 있는 데이터에 의존하지 않고 스스로 목적과 문제를 정의해 필요한 데이터와 분석 범위를 얼마나 넓은 시야로 디자인할 수 있는지
- 목적과 문제를 정의
- 이를 위해 필요한 데이터와 지표를 설정
- 그 데이터를 어떻게 분석해야 문제의 정보를 효과적으로 얻을 수 있는지 분석
- 위 사항을 고려한 다음 데이터를 활용해 수행할 작업의 설계도를 그림
- 문제를 구조화하고 정리하면서 생각해야함
- 논리적 사고의 기법
- 짝짓기: 처음 떠올린 아이디어에 대응이 되는 콘셉트 상자를 제작
- 자기 부정: 떠올린 아이디어를 일부러 부정하는 것
- ✴️ 데이터 문해력: 데이터에서 무엇을 읽어내는 능력이 아니라, 스스로 정답에 대해 고민하고 데이터를 무기 삼아 합리적으로 논할 수 있는 능력 ✴️
7. 실행력
- 실행력: 문해력을 실현하는 힘
- 아무리 필요한 프로세스와 이론을 숙지하고 있더라도 이를 실현하려면 시간이 필요. 위 내용이 비즈니스에서 잘 실행되지 못하는 주된 이유는 ‘시간을 확보할 수 없는 환경’ 때문임
- 뭔가 활동하거나 작업하는 것만이 일이라는 인식 밖에 없는 환경 X → 생각의 중요성과 이를 위해 필요한 환경을 이해해야함
- 데이터 분석이란 눈앞의 데이터로부터 어떤 패턴을 추출하는 것이 아님
- ‘데이터를 통해 판독’한 정보는 아무리 훌륭한 데이터 사이언스를 구사하더라도 시사점(인사이트)라고 할 수 없다.
- 분석도 데이터도 어디까지나 수단이고 도구일 뿐, 답을 제시해주지 않는다.
'Book' 카테고리의 다른 글
[빅데이터를 지탱하는 기술] Ch2. 빅데이터의 탐색 (0) | 2024.03.31 |
---|---|
[빅데이터를 지탱하는 기술] Ch1. 빅데이터의 기초 지식 (0) | 2024.02.25 |