데이터 분석 컨설팅
IT detective
데이터 저널리스트 <모두 거짓말을 한다>
직무 설명
1.
야밤에 머신러닝 검색하다가 댓글 남김 ㅎㅎ
음.. 우선 데이터 '분석'이라고 칭하지만 '분석'은 여러 일을 너무 크게 포괄하는 것 같네.
우선 Descriptive, predictive, prescriptive analysis 이렇게 세 가지로 나눌 수 있을 것 같은데.
Descriptive는 말 그대로 데이터에 대해 묘사하는 작업이야. 예컨대 우리 가족의 나이, 키, 생일 등등 데이터가 있다고 해보자. 간단한 계산으로 평균 나이, 최대 키, 가장 빠른 생일 등을 구할 수 있겠지?
요컨대 Descriptive analysis는
1. 여러 데이터를 몇 개의 특징적인 숫자(평균, 최대, 분산 등)로 보여주는 작업
2. 시각화(파이 차트, 바 차트 등)를 통해, 여러 데이터를 한 눈에 보기 쉽게 만드는 작업
을 칭해
2.
Predictive analysis는 형이 한참 하는 머신러닝이 대표적인데. 어떤 데이터 값이 들어왔을 때, 특정 값을 예측하는 작업이야.
도메인 따라 예를 들자면,
ㅡ 컴퓨터 비전 : 고양이 사진 데이터를 넣으면, 이 동물이 고양이라고 예측
ㅡ 자연어처리 : '이 집 크리스피 치킨 군침이 싹도노'라는 텍스트를 넣으면, 긍정적인 리뷰로 분류
ㅡ 추천 시스템 : 이 사람이 스파이더맨, 앤트맨, 아이언맨 영화를 봤다면 어벤저스 영화를 좋아할 거라 예측
등등이지.
3.
Prescriptive analysis는, 말 그대로 데이터를 기반으로 의사결정할 때 쓰여
그런데 의사결정하려면, '어떤 값을 건드리면, 다른 값은 어떻게 변할거다'라는 사실을 알면 좋겠지?
예컨대
'흡연량을 늘리면 폐암 발병률이 높아진다'
'초등학교에 중간, 기말고사를 없애면 학업 성취 평균이 내려간다'
'20대 후반 남성 집단에게 현대자동차 신차 구매 시, 대출 프로모션 해주면 계약율이 10%p 오른다'
등등.
4.
수식으로 비교 요약하자면
Descriptive : f(x). 즉 데이터를 평균, 분산 등 f라는 계산을 거쳐 숫자를 압축 요약
Predictive : f(y|x). 데이터 x가 주어졌을 때, y 값이 무엇일지 알아내는 함수 f를 찾아냄
Prescriptive : f(dy|dx). 데이터 x를 dx만큼 변화시키면, y가 얼만큼 변할지 알아내는 함수 f를 찾아냄
러프하게는 이렇게 정리할 수 있겠네.
이 중에서 횽이 업무나 생활에 접목하고 싶은 일이 뭔지 생각해보면 갈피가 잡힐거야.
개인적으로 이미지나 언어가 데이터인 문제는, predictive 알고리즘 중에 딥러닝을 활용하면 유용할 것 같고.
비즈니스 의사 결정을 한다면 초심자에겐 descriptive를, 숙련됐다면 prescriptive 문제로 접근해서 풀길 추천하고 싶네.
(위에 자료구조 알고리즘 얘기가 나왔는데, 당장은 급하지 않다고 생각)
- 블라인드에서 NEXON 사원
'Data > Analysis Build UP' 카테고리의 다른 글
| 24.07.12 데이터 분야 커리어 (2) | 2024.07.12 |
|---|---|
| 24.05.11 데이터 분석 차트 (0) | 2024.05.11 |
| 24.03.20 데이터 분석을 시작할 때 꼭 읽어봐야 할 책 5권 (0) | 2024.05.03 |
| 24.05.01 데이터 분석 공부 조언 (1) | 2024.05.01 |
| 24.03.13 데이터 분석가 로드맵 (0) | 2024.03.13 |