언어, 교육

빅데이터 준전문가(ADsP) 요약 (2과목)

물리터리 2023. 6. 3. 21:55

데이터 준전문가 요약본입니다.

수제비 빅데이터 준전문가 책을 활용하여 기출문제와 확인해서 정리한 내용이며, 주관식으로 나온 기출문제는 별도 표시했습니다.

저는 이것만 공부해서 합격할 수 있었습니다~! 모두들 열심히 공부해서 희망하시는 바를 이루시기 바랍니다.

 

*빨간색 글씨는 두문글자, 파란색 글씨는 서술로 기출된 사항입니다.

반응형

2과목

 

  What
HOW 최적화 통찰
솔루션 발견

 

목표시점별 분석

과제 중심적 접근 (스퀵솔)

speed & test, Quick-win, Problem-solving

 

분석 기획 시 고려사항 (데유장)

데 : 가용데이터 : 정형,반정형, 비정형 상관이 없음.

유 : 적절한 유스케이스

장 : 장애요서 : 미리 사전계획 수립

 

기업의 합리적 의사결정을 막는 장애요소 (고프편)

고 : 고정관념

프 : 프레이밍 효과 : 동일한 사건, 상황임에도 개인의 판단, 선택이 달라질 수 있는 것

편 : 편향된 생각

 

데이터 분석방법론 구성요소 (절방도산)

절차, 방법, 도구, 산출물

 

개발 방법론

1. 폭포수 모델 : 순차적 진행

2. 나선형 모델 : 처음 시도 프로젝트에 용이, 반복을 통해 발전, 관리체계가 없을 시 복잡도가 상승

3. 프로토타입 모델 : 상향식 접근 방식

 

KDD 방법론 (선전변마평)

선택 -> 전처리(잡음, 이상값 제거) -> 변환(차원축소) -> 데이터마이닝 -> 평가

 

Crisp-DM 방법론 (업이준모평전)

업무이해 -> 데이터 이해 -> 데이터준비 -> 모델링(모델평가 진행) -> 모델링 평가 -> 전개

 

빅데이터 분석 방법론 분석절차 (기준분시평)

1. 기획

2. 데이터준비        2번과 3번을 계속 반복

3. 데이터분석

4. 시스템 구현

5. 평가

 

위험대응방법 (회전완수)

회피, 전가, 완화, 수용

 

분석기획 단계 수행 주요과업 (비정위)

비 : 비즈니스 이해

정 : 프로젝트 정의

위 : 위험계획 수립

 

모델링 : 분석용 데이터를 이용한 가설 설정을 통하여 통계모델을 만들거나 모델을 만드는 과정

 

하향식 접근방식 : 문제가 확실하여 해법을 찾는 것 (탐정해타선)

문제 탐색, 문제 정의, 해결방안 검토, 타당성 검토, 선택

 

하향식 접근방식의 문제탐색 모델

1. 비즈니스 모델 (업제고규지)

가. 업무

나. 제품

다. 고객

라. 규제

마. 지원인프라

 

2. 거시적 관점(STEEP) (사기환경정)

가. 사회

나. 기술

다. 환경

라. 경제

마. 정치

 

3. 경쟁자 (대경진)

가. 대체재

나. 경쟁자

다. 신규진입자

 

4. 시장의 니즈

가. 고객

나. 채널

다. 영향자

 

5. 외부참조,  6. 분석 유스케이스 정의

 

상향식 접근 방식 : 문제의 정의가 어려운 경우 

1. 디자인 사고 : 인간에 대한 관찰과 고찰을 바탕으로~~~

2. 비지도학습

3. 프로토타이핑 접근법

 

상향식 접근방법 ( 분흐식정 )

분류, 흐름분석, 분석요건 식별, 분석요건 정의

 

분석과제 주요 5가지 특성 (크복속분정)

데이터크기, 데이터 복잡성, 속도, 분석 복잡성, 정확도와 정밀도

 

마스터플랜

1. 우선순위 고려요소 (전비알실)

전 : 전략적 중요도

비 : 비즈니스 성과

알 : ROI

실 : 실행용이성

 

2. 적용범위 / 방식 ( 업분기)

업 : 업무 내재화 수준

분 : 분석데이터 수준

기 : 기술적용 수준

 

가치 - 비즈니스효과

크기, 다양성, 속도 - 투자비용 요소

(가비크다속투)

 

ISP : 기업의 경영목표 달성에 필요한 전략적 주요 정보확인 등 전사적인 종합 추진계획

 

분석 거버넌스

1. 분석준비도 (무인문기데아)

가. 분석업무파악

나. 인력 및 조직

다. 분석문화

라. 분석기법

마. 분석데이터

바. IT인프라

 

2. 분석성숙도 모델

가. CMMI : 전산장비 운영업체들의 업무능력 및 조직의 성숙도에 대한 평가를 위한 모델

       * 도입, 활용, 확산, 최적화 ( 도활확최)

 

플랫폼 : 공동활용의 목적으로 구축된 유무형의 구조물

-> 협의의 플랫폼 (프엔라)

     데이터처리 프레임워크, 분석엔진, 분석 라이브러리

 

데이터 거버넌스 : 전사차원의 모든 데이터에 대해 정책,지침,표준화~~ 관리체계 수립&운영활동

   * 마스터데이터, 메타데이터, 데이터 사전

 

데이터 거버넌스 구성요소 (원조프)

원칙, 조식, 프로세스

 

데이터거버넌스 체계 (표관저활)

표 : 데이터표준화 : 표준용어 설정, 메타데이터 구축, 데이터사전 구축

관 : 데이터 관리체계 : 메타데이터, 데이터 사전의 관리원칙 수립

저 : 데이터 저장소 관리

활 : 표준화 활동

 

조직구분 유형

집중구조 : 별도 분석전담조직 ---> 중복,이원화 가능성 높음

기능구조 : 별도분석조직이 없고 각 부서에서 수행 ----> 과거에 국한된 분석

분산구조 : 분석조직인력을 각 기능에 배치 ----> 신속한 업무에 적합

반응형