별의 공부 블로그 🧑🏻‍💻
728x90
728x170

데이터 이해 : 가치 창조를 위한 데이터 사이언스와 전략 인사이트

빅데이터 열풍

  • IT 솔루션은 "공포 마케팅"이 잘 통하는 영역
    • 도입만 하면 모든 문제를 한번에 해소할 것처럼 강조하다 나중에는 합류하지 못하면 위험에 처할지도 모른다는 공포 분위기 조성!
      • 빅데이터 열풍 또한 유사한 패턴과 흐름을 갖음.
    • 거액의 투자를 하지만, 어떻게 활용하고 어떻게 가치를 뽑아내야 할지 첫 번째 물음부터 다시 해야 하는 사태가 벌어짐.
      • 기분 분석 프로젝트를 포장해 놓은 것이 많음.
  • 성공적인 인터넷 기업
    • 데이터 분석과 함께 시작되고 분석이 내부 의사결정에 결정적 정보를 제공함.
  • 성공하지 못한 인터넷 기업
    • 데이터 분석에 기초해 전략적 통찰을 얻고, 효과적인 의사결정을 내리고 성과를 만들어 내는 체계가 없었음.

 

빅데이터 분석

빅데이터 분석, 'Big'이 핵심이 아니다.

  • 데이터의 양이 아닌 유형의 다양성과 관련이 있음.
  • 음성, 텍스트, 이미지, 비디오 → 다양한 정보 원천의 활용

 

전략적 통찰이 없는 분석의 함정

  • 한국의 경영 문화는 여전히 분석을 국소적인 문제 해결 용도로 사용하는 단계
  • 기업의 핵심 가치와 관련해 전략적 통찰력을 가져다 주는 데이터 분석을 내재화 하는 것이 어려움.

 

일차적인 분석 vs. 전략 도출을 위한 가치 기반 분석

  • 일차적 분석을 통해서도 부서나 업무 영역에서 상당한 효과를 얻을 수 있음.
  • 일차적 분석 경험이 증가하고 분석의 활용 범위를 더 넓고 전략적으로 변화시켜야 함.

 

대표적인 일차적 분석 애플리케이션 사례

  • 산업과 분석 애플리케이션 사례
산업 사례
금융 서비스 신용점수 산정, 사기 탐지, 고객 수익성 분석
소매업 재고 보충, 수요예측
제조업 맞춤형 상품 개발, 신상품 개발
에너지 트레이딩, 공급, 수요예측
온라인 웹 매트릭스, 사이트 설계, 고객 추천

 

데이터 사이언스(Data Science)

데이터 사이언스의 정의

  • 데이터로부터 의미 있는 정보를 추출해내는 학문
  • 정형, 반정형, 비정형의 다양한 유형의 데이터를 대상으로 함.
  • 분석 뿐 아니라 이를 효과적으로 구현하고 전달하는 과정까지 포함한 포괄적 개념
  • 데이터 공학, 수학, 통계학, 컴퓨터 공학, 시각화, 해커의 사고방식, 해당 분야의 전문 지식을 종합한 학문
    • 총체적(holistic) 접근법을 사용함.
  • 과학과 인문학의 교차로에 서 있다고 할 수 있음.
    • 스토리텔링, 커뮤니케이션, 창의력, 직관력 필요

 

데이터 사이언스의 핵심 구성 요소

  • IT(Data Management)
  • 분석
  • 비즈니스 컨설팅

 

다른 학문과의 차이점

  데이터 사이언스 통계학 데이터 마이닝
분석 대상 정형, 비정형, 반정형 등 다양한 데이터 유형 정형화된 데이터  
분석 방법 분석 + 시각화 + 전달을 포함한 포괄적 개념   분석에 초점
학문 접근 종합적 학문 또는 총체적 접근법    

 

728x90

 

데이터 사이언티스트의 역량

  • 가트너(Gartner)가 본 데이터 사이언티스트의 역량
    • 데이터 관리, 분석 모델링, 비즈니스 분석, 소프트 스킬 => 공통점은 호기심에서 시작
  • 데이터 해커, 애널리스트, 커뮤니케이션, 신뢰받는 어드바이저 등의 조합이라 할 수 있음.
  • 하드 스킬과 소프트 스킬 능력을 동시에 갖추고 있어야 함.
  • 데이터 처리 기술 이외에 사고방식, 비즈니스 이슈에 대한 감각, 고객들에 대한 공감 능력이 필요함.

 

데이터 사이언티스트가 갖춰야 하는 스킬

스킬 설명
하드 스킬 - Machine Learning, Modeling, Data Technical Skill
- 빅데이터에 대한 이론적 지식 : 관련 기법에 대한 이해와 방법론 습득
- 분석 기술에 대한 숙련 : 최적의 분석 설계 및 노하우 축적
소프트 스킬 - 통찰력 있는 분석 : 창의적 사고, 호기심, 논리적 비판
- 설득력 있는 전달 : Storytelling, Visualization
- 다분야 간 협력 : Communication

 

  • 데이터 사이언디스트들은 주로 데이터 처리나 분석 기술과 관련된 ( 하드 스킬 )만을 요구 받는 것처럼 보인다.
  • 하지만 이러한 ( 하드 스킬 )은 훌륭한 데이터 사이언티스트가 갖춰야 하는 능력의 절반에 불과하다.
  • 나머지 절반은 통찰력 있는 분석, 설득력 있는 전달, 협력 등 ( 소프트 스킬 )이다.

 

데이터 사이언티스트가 효과적 분석 모델 개발을 위해 고려해야 하는 사항

  • 분석 모델이 예측할 수 없는 위험을 살피기 위해 현실 세계를 돌아보고 분석을 경험과 세상에 대한 통찰력과 함께 활용한다.
  • 가정들과 현실의 불일치에 대해 끊임 없이 고찰하고 모델의 능력에 대해 항상 의구심을 갖는다.
  • 분석의 객관성에 의문을 제기하고 분석 모델에 포함된 가정과 해석의 개입 등의 한계를 고려한다.
  • 모델 범위 바깥의 요인은 판단하지 않는다.

 

정보 vs. 통찰력

데이터 사이언티스트에 요구되는 인문학적 사고의 특성과 역할

  과거 현재 미래
정보
(Information)
무슨 일이 일어났는가?
예) 리포팅(보고서)
무슨 일이 일어나고 있는가?
예) 경고
무슨 일이 일어날 것인가?
예) 추출
통찰력
(Insight)
어떻게 왜 일어났는가?
예) 모델링, 실험설계
차선 행동은 무엇인가?
예) 권고
최악, 최선의 상황은?
예) 예측, 최적화

 

최근의 사회경제적 환경의 변화

최근의 사회경제적 환경의 변화 (인문학 열풍의 이유)

  • 단순 세계에서 복잡한 세계로의 변화 : 다양성과 각 사회의 정체성, 연결성, 창조성 키워드 대두
  • 비즈니스의 중심이 제품생산에서 서비스로 이동 : 고객에게 얼마나 뛰어난 서비스를 제공 여부가 관건
  • 경제와 산업의 논리가 생산에서 시장창조로 바뀜 : 무형자산이 중요

 

데이터 기반 분석의 상관관계, 통계적 분석의 인과관계

  • 신속한 의사결정을 원하는 비즈니스에서는 실시간 '상관관계' 분석에서 도출된 인사이트를 바탕으로 수익을 창출할 수 있는 기회가 점점 늘어나고 있음.
  • '상관관계' 를 통해 특정 현상의 발생 가능성이 포착되고, 그에 상응하는 행동을 하도록 추천되는 일이 점점 늘어날 것
  • 데이터 기반의 '상관관계' 분석이 주는 인사이트가 '인과관계'에 의한 미래 예측을 점점 더 압도해가는 시대가 도래하고 있음.

 

의사 결정 오류

의사 결정 오류

오류 설명
로직(논리) 오류 부정확한 가정을 하고 테스트를 하지 않는 것
프로세스 오류 - 결정에서 분석과 통찰력을 고려하지 않은 것
- 데이터 수집이나 분석이 너무 늦어 사용할 수 없게 되는 것
- 대안을 진지하게 고려하지 않은 것

 

가치 패러다임의 변화

Digitalization Connection Agency

 

데이터 사이언스의 한계와 인문학

  • 모든 분석은 가정에 근거함.
    • 잘못된 분석은 안 좋은 결과를 가져올 수 있음
  • 모델의 능력에 대해 항상 의구심을 갖고, 가정과 현실의 불일치에 대해 계속 고찰하고, 분석 모델이 예측할 수 없는 위험을 살펴야 함.
728x90
그리드형(광고전용)
⚠️AdBlock이 감지되었습니다. 원할한 페이지 표시를 위해 AdBlock을 꺼주세요.⚠️
starrykss
starrykss
별의 공부 블로그 🧑🏻‍💻


📖 Contents 📖