별의 공부 블로그 🧑🏻‍💻

🗒️ 데이터분석준전문가 (12)

728x90
  1. 2022.08.28 [ADsP] 데이터분석준전문가 단원별 내용 정리

    데이터분석준전문가(ADsP) 단원별 내용 정리 데이터분석준전문가(ADsP) 자격증을 준비하면서 블로그에 올렸었던 글들을 한 페이지에 정리해본다. 개념 정리 인터넷 블로그, 교재 등을 보면서 정리했던 내용들 과목명 장 링크 시험 개요 https://starrykss.tistory.com/1934 데이터 이해 데이터의 이해 https://starrykss.tistory.com/1941 데이터의 가치와 미래 https://starrykss.tistory.com/1942 가치 창조를 위한 데이터 사이언스와 전략 인사이트 https://starrykss.tistory.com/1943 데이터 분석 기획 데이터분석 기획의 이해 https://starrykss.tistory.com/1945 분석 마스터 플랜 https..

  2. 2022.07.03 [ADsP] 데이터 분석 : 정형 데이터 마이닝

    데이터 분석 : 정형 데이터 마이닝 데이터 마이닝 개요 데이터 마이닝(Data Mining) 기업이 보유하고 있는 일일 거래 데이터, 고객 데이터, 상품 데이터 혹은 각종 마케팅 활동에 있어서의 고객 반응 데이터 등과 이외의 외부 데이터를 포함하는 모든 사용 가능한 원천 데이터를 기반으로 감춰진 지식, 기대하지 못했던 경향 또는 새로운 규칙 등을 발견하고 이를 실제 비즈니스 의사결정 등에 유용한 정보로 활용하는 일련의 작업 데이터 마이닝 5단계 단계 설명 목적 정의 데이터 마이닝 도입 목적을 명확하게 함. 데이터 준비 - 데이터 정제(Cleaning)를 통해 데이터의 품질 확보까지 포함. - 필요시 데이터 양 충분하게 확보 데이터 가공 - 목적 변수를 정의하고, 필요한 데이터를 데이터 마이닝 소프트웨어에..

  3. 2022.07.02 [ADsP] 데이터 분석 : 통계 분석 - 시계열 예측

    데이터 분석 : 통계 분석 - 시계열 예측 시계열 자료(Time Series) 시간의 흐름에 따라 관측된 데이터 시계열 분석을 위해서는 정상성을 만족해야 함. 정상성(Stationary) 시계열의 수준과 분산에 체계적인 변화가 없고, 주기적 변동이 없다는 것 미래는 확률적으로 과거와 동일하다는 것 정상 시계열의 조건 평균은 모든 시점(시간 t)에 대해 일정하다. 분산은 모든 시점(시간 t)에 대해 일정하다. 공분산은 시점(시간 t) 에 의존하지 않고, 단지 시차에만 의존한다. 정상 시계열 전환 정상 시계열로 전환하는 방법 비정상시계열 자료는 정상성을 만족하도록 데이터를 정상 시계열로 만든 후 시계열 분석을 수행함. 평균이 일정하지 않은 경우 : 원계열에 차분 사용 계절성을 갖는 비정상 시계열 : 계절 차..

  4. 2022.07.02 [ADsP] 데이터 분석 : 통계 분석 - 기초 통계 분석

    데이터 분석 : 통계 분석 - 기초 통계 분석 회귀 분석(Regression Analysis) 변수와 변수 사이의 관계를 알아보기 위한 통계적 분석 방법 독립 변수의 값에 의해 종속 변수의 값을 예측하기 위함. 일반 선형 회귀는 종속 변수가 연속형 변수일 때 가능함. 이산형(범주형) → 명목, 서열척도 연속형 → 구간, 비율척도 용어 설명 독립 변수 (Independaent Variable) - 다른 변수에 영향을 받지 않고 독립적으로 변화하는 수 - 설명 변수라고도 함. - 입력 값이나 원인을 나타내는 변수 - y = f(x) 에서 x에 해당하는 것 종속 변수 (Subordination Variable - 독립 변수의 영향을 받아 값이 변화하는 수 - 분석의 대상이 되는 변수 - 결과물이나 효과를 나타..

  5. 2022.07.02 [ADsP] 데이터 분석 : 통계 분석 - 상관 관계를 이용하는 다변량 분석

    데이터 분석 : 통계 분석 - 상관 관계를 이용하는 다변량 분석 상관 분석 상관 계수의 이해 상관 계수는 두 변수의 관련성의 정도를 의미함. (-1 ~ 1의 값으로 나타냄) 두 변수의 상관 관계가 존재하지 않을 경우 상관 계수는 `0` 임. 상관 관계가 높다고 인과 관계가 있다고 할 수는 없음. 피어슨 상관계수와 스피어만 상관계수가 있음. 피어슨 상관계수는 두 변수 간의 선형적인 크기만 측정 가능함. 스피어만 상관계수는 두 변수 간의 비선형적인 관계도 나타낼 수 있음. R의 cor.test() 함수를 사용해 상관 계수 검정을 수행하고, 유의성 검정을 판단할 수 있음. 귀무 가설 : '상관계수가 0이다.' 대립 가설 : '상관계수가 0이 아니다.' 스피어만(Spearman) 상관 계수 대상 자료는 서열 척..

  6. 2022.07.01 [ADsP] 데이터 분석 : 통계 분석 - 통계학 개론

    데이터 분석 : 통계 분석 - 통계학 개론 통계 분석 개요 Population, Parameter, Sample, Statistic 용어 설명 모집단 - 잘 정의된 연구목적과 이와 연계된 명확한 연구대상 (데이터 전체 집합) - 예) 대통령 후보의 지지율 - 유권자 모수 - 모집단의 특성을 나타내는 수치들 - 모집단의 평균(𝝁), 분산(𝝈²) 같은 수치들을 모수(Parameter)라고 함. 표본 - 모집단의 개체 수가 많아 전부 조사하기 힘들 때 모집단에서 추출(sampling) 한 것 - 추출(Sampling)한 표본으로 모집단의 특성을 추론(inference) 함. (오차 발생) - 예) 각종 여론조사에 참여한 유권자 통계량 - 표본의 특성을 나타내는 수치들 - 표본의 평균(`\bar{x}`), 분산..

  7. 2022.06.27 [ADsP] 데이터 분석 : R 기초와 데이터 마트

    데이터 분석 : R 기초와 데이터 마트 R 설치 주의 사항 컴퓨터의 이름을 한글로 하지 않고 영어로 지정 사용자 이름도 한글로 하지 않고 영어로 지정 폴더 이름도 한글로 하지 않고 영어로 지정 (특수문자, 공백도 사용하지 않음.) R Project 홈페이지에서 R 프로그램 다운로드 https://www.r-project.org/ R Studio 설치 https://rstudio.com/ R: The R Project for Statistical Computing www.r-project.org RStudio | Open source & professional software for data science teams RStudio provides open source and enterprise-ready ..

  8. 2022.06.25 [ADsP] 데이터 분석 기획 : 분석 마스터 플랜

    데이터 분석 기획 : 분석 마스터 플랜 분석 마스터 플랜 수립 분석 마스터 플랜 수립 프레임워크 분석 과제 ▶ 우선순위 고려 요소 ▶ 적용 우선순위 결정 적용 범위 / 방식 고려 요소 ▶ 분석 구현 로드맵 수립 - 전략적 중요도 - ROI(투자자본수익률) - 실행 용이성 - 업무 내재화 적용 수준 - 분석 데이터 적용 수준 - 기술 적용 수준 중장기적 마스터 플랜 수립을 위해서는 분석 과제를 대상으로 다양한 기준을 고려해 적용할 우선순위를 설정할 필요가 있음. 분석 과제 수행의 선/후행 관계를 고려하여 우선순위를 조정해 나감. 분석 과제의 적용 범위 및 방식에 대해서도 종합적으로 고려하여 결정함. 수행 과제 도출 및 우선순위 평가 우선순위 평가 방법 및 절차 분석 과제 도출 ▶ 우선순위 평가 ▶ 우선순위..

  9. 2022.06.25 [ADsP] 데이터 분석 기획 : 데이터 분석 기획의 이해

    데이터 분석 기획 : 데이터 분석 기획의 이해 분석 기획 실제 분석을 수행에 앞서 분석을 수행할 과제의 정의 및 의도했던 결과를 도출할 수 있도록 이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업 어떤 목표(What)를 달성하기 위해 어떤 데이터를 가지고 어떤 방식(How)을 수행할지에 대한 일련의 계획을 수립하는 작업 성공적인 분석 결과 도출을 위한 중요 사전 작업 해당 문제 영역에 대한 전문성 역량 및 통계학적 지식을 활용한 분석 역량과 분석 도구인 데이터 및 프로그래밍 기술 역량에 대한 균형 잡힌 시각을 가지고 방향성 및 계획을 수립해야 함. 분석 주제 유형 분석의 대상(What), 분석의 방법(How)에 따라 4가지로 구분한다. 분석 방법(How) 분석 대상(What) Known ..

  10. 2022.06.24 [ADsP] 데이터 이해 : 데이터의 가치와 미래

    데이터 이해 : 데이터의 가치와 미래 빅데이터란? 빅데이터의 정의 일반적인 데이터베이스 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고, 데이터의 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처 데이터의 양(Volume) 데이터 유형과 소스 측면의 다양성(Variety), 데이터 수집과 처리 측면에서 속도(Velocity)가 급격히 증가하면서 나타난 현상 빅데이터 - 4V ROI(Return On Investment, 투자자본수익률) 관점에서 보는 빅데이터 요소 설명 Volume - 데이터의 크기 - 생성되는 모든 데이터를 수집 Variety - 데이터의 다양성 - 정형화된 데이터를 넘어 텍..

  11. 2022.06.24 [ADsP] 데이터 이해 : 데이터의 이해

    데이터의 이해 : 데이터의 이해 데이터 유형 데이터의 정의 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실(Fact) 추론, 예측, 전망, 추정을 위한 근거(Basis)로 기능하는 특성을 갖는다. 다른 객체와의 상호 관계 속에서 가치를 갖음. 데이터 유형 정성적 데이터(Qualitative Data) 자료의 성질, 특징을 자세히 풀어 쓰는 방식 언어, 문자로 기술 예) 설문 조사의 주관식 응답, SNS에 올린 글, 기상특보 비정형 데이터 형태로 저장 분석에 시간과 비용이 필요 정량적 데이터(Quantitative Data) 수치, 기호, 도형으로 표시 예) 지역별 온도, 풍속, 강우량 데이터 양이 증가하더라도 저장, 분석이 용이 암묵지와 형식지 가장 널리 알려진 지식의 차원은 Polanyi에 의..

  12. 2022.06.21 국가공인 데이터분석 준전문가(ADsP) 시험 개요

    국가공인 데이터분석 준전문가(ADsP) 시험 개요 과목 및 내용 데이터분석 준전문가 자격검정 시험의 과목은 총 3과목으로 구성되어 있으며 데이터 이해 과목을 바탕으로 데이터를 분석하는 능력을 검정한다. 필기 과목명 장 절 데이터 이해 데이터의 이해 데이터와 정보 데이터베이스의 정의와 특징 데이터베이스 활용 데이터의 가치와 미래 빅데이터의 이해 빅데이터의 가치와 영향 비즈니스 모델 위기 요인과 통제 방안 미래의 빅데이터 가치 창조를 위한 데이터 사이언스와 전략 인사이트 빅데이터분석과 전략 인사이트 전략 인사이트 도출을 위한 필요 역량 빅데이터 그리고 데이터 사이언스의 미래 데이터분석 기획 데이터분석 기획의 이해 분석 기획 방향성 도출 분석 방법론 분석 과제 발굴 분석 프로젝트 관리 방안 분석 마스터 플랜 ..

728x90


📖 Contents 📖