본문 바로가기

카테고리 없음

데이터 분석을 통한 가치 창출

반응형
SMALL

마이데이터 서비스 안내서

■ 주요 내용

Part.01 배경 및 목차

Part.02 마이데이터 이해하기

Part.03 마이데이터 서비스 및 공통요구사항 적용 방안

데이터 사이언스 캔버스는 “비즈니스 이슈를 분석에서 어떻게 가치를 창출하고 분석 결과를 어떻게 현장에 적용하는가” 를 논리적으로 기술한 것이라 정의할 수 있습니다.더 나은 방향과 성공을 향해 비즈니스 이슈를 해결해 나가는 것을 혁신이라 한다면 데이터 과학은 궁극적으로 기업, 고객 그리고 산업 현장을 위해 가치를 창출하는 것입니다.

분석 과제(주제)는 데이터 분석 결과의 활용을 통해 창출하려는 제안 가치입니다. 데이터 분석의 목적이 데이터를 통한 통찰의 도출에 있다면, 먼저 대상 업무 또는 서비스에서 문제점을 도출하고 데이터 기반으로 해결 방안을 찾을 수 있는 실행 계획을 도출하여 분석 주제로 정의 합니다.

*데이터 분석을 통한 가치 제안 = 데이터 분석 과제

비즈니스의 복잡도가 증가하는 시장 안에서는 의사 결정에 도움이 되는 데이터 분석 결과를 얻기가 매우 어렵습니다. 또한 비즈니스의 속도가 중요해진 지금은 데이터 분석 과제를 수행하는데 있어서 계획을 세우기(planning) 보다 모델을 디자인하면서 진행하는 ‘디자인 씽킹’ 전략이 효율적입니다.

<블록 체크리스트>ㆍ분석 주제를 정의하기 위해서는 해당 업무 파악을 통해 문제점을 도출
ㆍ정의된 문제점에 대해 실현 가능성 검토
ㆍ해당 문제점에 대한 To-Be 목표를 계획
ㆍAs-Is/To-Be 간의 간극을 해결 할 수 있는 데이터 분석 활동 계획을 정의
ㆍ활동 계획을 실행 할 수 있는 대상 데이터, 분석 도구, 분석 자원, 일정 계획 등을 정립

데이터 분석 가치 제안 블록 활용법

분석 주제 정의‘데이터 분석을 통해 업무의 이슈를 개선하거나 신규 업무 개발의 방향 설정 등 비즈니스 가치 창출이 가능한 주제를 정의하는 것 입니다.

분석 주제 정의는 실제 분석을 수행하기에 앞서 분석을 수행할 과제의 정의 및 의도했던 결과를 도출할 수 있도록 이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업입니다. 분석 과제 수행을 통해 어떠한 목표(What)를 달성하기 위하여(Why) 어떠한 데이터를 가지고 어떤 방식으로(How) 수행할 지에 대한 일련의 계획을 수립하는 작업이기 때문에 성공적인 분석 결과를 도출하기 위한 필수 작업입니다.

업무 요구 파악, 이슈 및 쟁점사항 도출

분석 과제는 다양한 비즈니스 문제를 데이터 분석 문제로 변환하고 이를 바탕으로 “데이터 분석 과제 정의서”를 작성하고 분석 과제로서의 타당성을 검토하여 발굴된 과제로 확정합니다. 과제 발굴에는 하향식 접근 방법(Top Down Approach)과 상향식 접근 방법(Bottom Up Approach)이 있다.
 

과제 발굴 접근 방법


As-Is
‘업무 영역의 현 상태에 대한 진단을 통해 분석 주제와 연관된 문제점을 도출합니다.’

현장에서는 어떤 것들이 주로 문제가 될까요 업종에 따라 작업장 마다 다른 문제를 가지고 있을 것입니다. 하지만 비슷한 고민들을 하고 있기도 합니다.

다음과 같은 두 가지 경우를 생각해봅시다.

첫 번째는, 회사에서 판매하고 있는 ‘어떤 상품의 매출이 떨어지고 있다.’라는 문제입니다.
상품의 매출이 떨어지고 있다면 분명 큰 문제일 것입니다. 하지만 이 상품이 회사에서 주력 상품이 아니거나 곧 판매가 중단될 상품이라면 큰 문제가 되지는 않을 것입니다. 물론 회사의 수익에 큰 영향을 미치는 주력 상품이라면 문제가 될 수 있습니다.

두 번째는, 반대로 회사에서 판매하고 있는 ‘어떤 상품의 매출이 오르고 있다.’라는 문제를 생각해봅시다.

매출이 오르는 경우도 문제가 될까요? 보통은 매출이 오르는 상황이라면 특별히 문제가 되지 않을 것 같으나 ‘상품에 들이고 있는 광고비에 맞지 않는 매출 상황’ 이라면 문제가 될 수 있습니다.

이와 같이 ‘현장의 문제’ 라는 것은 어떤 환경에 처해 있느냐에 따라 달라질 수 있습니다. 따라서 ‘As-Is’ 를 파악한다는 것은 문제를 정밀하게 파악하는 중요한 출발점이라 할 수 있습니다.
 
To-be
‘분석 주제로 정의한 비즈니스 문제점에 대한 목표를 설정해야 합니다. 문제점이 해결되었을 때의 목표 수준은 정량적으로 나타내야 합니다.’
 
현상과 문제 구별하기
데이터 분석을 통해 문제점을 해결하기 위한 방안을 제대로 찾기 위해서는 현상과 문제를 명확히 구별할 필요가 있습니다.
‘매출이 떨어지고 있다’ 혹은 ‘불량률이 증가하고 있다’ 등을 현장에서는 ‘문제’로 다룹니다. 그러나 데이터 분석에서
이러한 것들은 단지 ‘현상’에 불과할 수 있습니다. 이러한 ‘현상’을 가지고 담당자와 논의하여 해결해야 할 ‘문제’를 찾
아내는 것이 중요합니다.
매출을 올리거나 불량률을 줄이기 위해서는 어떤 문제 해결을 통해 목표에 도달할 수 있는지 알아야 합니다. 이를 위해 현장에서 달성하고자 하는 ‘To-Be’ 목표를 당사자 간에 공유하는 것은 데이터 분석을 수행하는 데 필수 요소입니다.
현장과 목표를 공유하는 것을 데이터 분석에서는 ‘문제의 발견’ 이라고 합니다. ‘현상(As-Is)’이 공유되고 ‘To-Be’
가? 공유되었을 때 데이터 분석을 수행할 토대가 마련되었다고 할 수 있습니다.
데이터 분석을 통해 As-Is와 To-Be의 차이가 나는 원인이 무엇인지부터 검증해 나갈 수 있습니다.
 
Gap 분석
‘As-Is 와 To-Be의 정량적 차이를 Gap 이라 정의하고, Gap을 해결하기 위한 데이터 분석 활동 계획을 도출 합니다.’
현상As-IsTo-Be문제인가?
 
매출이 떨어졌다. 매출 비율이 낮다. 지금 상태로 OK 문제 아님
매출 비율이 높다. 호경기 매출 문제
불량률이 올랐다. RPM이 높다. RPM을 낮춤 문제
RPM이 적절하다. 지금 상태로 OK 문제 아님
‘문제 발견’을  위한 효과적인 방법 중 하나는 ‘As-Is =To-Be’으로 생각해서 Gap분석을 하는 방법이 있습니다.

‘As-Is’와 ‘To-Be’의 차이를 파악하기 위해서는 다음의 3가지 관점에서 문제를 살펴보아야 합니다.

1. 요인의 전체 영향도 찾기
2. 분해해서 차이 파악 하기
3. 비교해서 차이 파악 하기

대상 데이터

‘데이터 분석에 사용 할 대상 데이터들로 데이터 후보군을 선정합니다.’

이 단계에서는 문제를 검증하기 위해 필요한 데이터를 파악하는 것입니다. 분석에 활용할 대상 데이터를 파악할 때는 다음 5가지를 검토합니다.

1. 문제를 검증하기 위해 어떤 데이터가 필요한가?
2. 필요한 데이터가 보존되어 있는가?
3. 필요한 데이터를 사용할 수 있는가?
4. 데이터가 보존되어 있지 않을 경우, 새로 데이터를 취득할 수 있는가?
5. 새로 데이터를 취득하는데 시간이나 비용이 많이 들 경우, 대체할 수 있는 데이터가 있는가?

데이터 분석가는 작업의 효율을 위해 가급적이면 이미 가지고 있는 데이터로 분석을 하고, 아니면 바로 사용할 수 있는 데이터가 있는지 확인하는 것이 필요 합니다.

데이터를 취득하는데 시간과 비용이 많이 들긴 하지만, 데이터를 새로 취득해서 얻는 분석 결과가 현장에 미치는 효과가 크다고 판단되면 새로 취득하는 것을 검토해 보아야 합니다.

데이터를 새로 취득하게 되면 수집되는 시점부터 데이터가 쌓이기 시작하기 때문에 과거의 현상과 비교할 수 없다는 문제점도 있습니다. 그리고 충분히 데이터가 쌓일 때까지는 데이터 분석을 시작할 수 없는 등 작업에 장애 요인이 생기게 됩니다.
 
분석 주제 타당성 검토
‘확보된 분석 자원과 계획된 일정 내에서 해당 분석 주제의 목표를 달성할 수 있는지 여부를 검토합니다.’
 
분석 자원
‘데이터 엔지니어, 데이터 분석가, 업무 전문가 등 프로젝트 참여 인력에 대한 계획과 분석 인프라에 대한 조사를 합니다.’
 

구분인적자원분석 인프라비고
 
분석 전문가 데이터 엔지니어 HADOOP, SPARK, SQL 등  
데이터 분석가 R, PYTHON, H2O 등  
실무 담당자 업무 담당자 시각화 도구  
데이터 관리자 빅데이터 플랫폼  
 
일정 계획
 
‘데이터 분석을 수행하기 위한 일정계획을 수립합니다.’
일정 계획을 수립할 때는 업무량, 데이터 수집에 걸리는 시간, 분석의 난이도, 목표 사업 기간, 소요 인력, 예산 등에 기초해서 작성해야 합니다.
실제 수행하는 작업 단위를 기준으로 작성하되 작업 단위는 5일 이내에 수행 가능한 작업으로 나누어서 관리하는 것이 좋습니다.

‘매출이 떨어졌다/불량률이 올랐다.’ 등은 As-Is 현상입니다. 이것을 ‘To-Be’와 연결하여 ‘As-Is’와 ‘To-Be’의 차이가 어떤 구조인지 분석하는 것이 문제가 나타난 근본적인 원인을 파악하기 위해 필요한 작업이 됩니다.

데이터 사이언스 캔버스 활용법

캔버스의 8개 블록은 절차대로 사용하여 분석 과정을 수행해야 합니다. 캔버스 활용법을 익혀서 분석 과정을 순차 대로 수행하는 것은 디자인 씽킹의 훈련 과정으로서 매우 중요합니다.

다만,각 블록의 세그먼트들은 사용자의 수준과 목표에 맞게 선정해서 사용할 것을 권장합니다.

사용자의 수준을 정하기 위해서는 구상→학습→심화→전개 과정을 통해 최종 가치 제안(주제)과 목표를 먼저 설정해야 합니다.

실효성 높은 데이터 과학 모델 디자인

ㆍ실제로‘데이터 분석 가치 제안’을 위한 기획 단계에서 활용했을 때,각각의 가치가 어떻게 진행될지 캔버스에  프로토 타입을 전개시킬 수 있습니다.

ㆍ캔버스 위에서 현 비즈니스의 문제 인식을 확인하면서 가치를 구체화해 나갈 수 있습니다.

ㆍ비즈니스 이슈를 검토하다 보면 여러 팀과 의견을 나누게 되는데 공통 언어로서 공감대를 만들어 나가는데 캔버스가 매우 유용하게 쓰일 것입니다.

데이터 사이언스 캔버스 블록의 핵심 구성 요소

데이터 사이언스 캔버스는 8개의 블록으로 구성되며 각 블록은 데이터 과학의 핵심 세그먼트들로 구성되어 있습니다.


 

데이터 사이언스 캔버스 전체구성도(Canvas-8Blocks)

‘캔버스’는 데이터 과학에서 중요한 디시전 메이킹(Decision Making)을 훈련하기 위한 도구로서 개발된 것 입니다. 데이터 과학의 성공 요인은 분석 결과의 우위성(예측력 등)에만 있는 게 아닙니다. 분석 모델 자체의 기능이나 성능이 아니라 분석 결과를 통해 얻고자 하는 가치가 무엇인가 하는 것을 고민하지 않으면 안됩니다. 그것을 고민하지 않으면 데이터 과학은 단지 아름다운 모델링을 추구한 것에 머물 것 입니다.

그래서 디자인 씽킹(Design Thinking)이 매우 중요합니다. 비즈니스 이슈에 대한 가치 제안을 하고, 필요한 데이터를 수집하고, 모델링과 테스트를 하는 과정에서 디시전 메이킹(Decision Making)을 하는 것은 최종 결과에 무척 중요한 영향을 미치게 됩니다. ‘캔버스’는 이와 같은 디자인 씽킹의 도구로서 개발 된 것입니다.

데이터 사이언스 캔버스는 다양한 산업과 기업 현장에서 획득한 경험을 통해 만들어진 것입니다. 많은 시티즌 데이터 과학자 분들의 실천적 활용에 사용되는 공통된 도구로서의 역할을 통해 더욱 발전해 나갈 것을 기대합니다.

데이터 사이언스 캔버스

데이터 분석은 비지니스의 문제를 해결하거나 유용한 정보의 발굴을 통한 새로운 가치를 창출하기 위해 데이터에 대한 과학적 분석을 수행하는 일련의 과정으로 정의할 수 있습니다. 이를 위해서는 수학 ·통계학 ·컴퓨터과학· 산업공학 등의 기술 습득 뿐만 아니라 각 비즈니스 영역의 업무 경험과 데이터 분석 역량이 필요 합니다.

데이터 분석은 이제 산업과 기업의 주요 의사결정의 핵심 요소로 자리잡고 있습니다. 데이터 과학 기술을 습득하는 과정은 쉽지 않을 뿐만 아니라 시간이 걸리는 과정이지만, IT기술과 업무 노하우를 최대한 활용하여 융합 하면 보다 효율적이고 신속하게 데이터 과학 과정에 입문 할 수 있을 것입니다.

데이터 사이언스 캔버스는 10여년 동안 제조· 공공· 금융 등 다양한 산업 현장과 시민 데이터 과학자(Citizen Data Scientist) 양성 교육 과정을 통해 획득한 자산을 체계화하고 비즈니스 모델 캔버스①와 다산 정약용 선생님의 치학(治學) 전략②을 접목하여 개발한 데이터 과학을 위한 도구입니다.

데이터 사이언스 캔버스는 시티즌 데이터 과학자들이 사용자의 수준에 맞는 분석 가이던스와 분석 결과를 활용 할 수 있는 분석 주제별 분석 참조 모델을 제공하여 기업 현장의 업무 전문가 또는 엔지니어가 빠르고 쉽게 데이터 분석 프로젝트에 참여 할 수 있도록 합니다.

① 2005년 알렉산더 오스터왈더의 비즈니스 모델 캔버스 및 루이스 도라드의 머신러닝 캔버스 참조
② 2006년 정민(한양대 인문과학대학)의 다산 선생 지식 경영법(김영사) 참조

 

① 데이터 분석 가치 제안

데이터 분석 결과의 활용을 통해 창출 하려는 가치를 제안합니다.

※ 데이터 분석을 통해 현장의 문제점을 해결하기 위한 활동 계획을 분석 주제로 정의 합니다.

② 데이터 소스

업무현황 파악을 통해 데이터 분석에 사용 가능한 대상 데이터를 선정합니다.

③ 데이터 수집

데이터 소스로부터 분석 모델의 필요 데이터 수집을 위한 기술적인 검토와 수집 데이터를 확정합니다. 데이터 수집 방법을 파악하고 데이터의 속성/수집 주기 등에 대해서 파악을 해두어야 합니다. 이 과정에서는 수집된 데이터를 저장/관리하는 방안에 대해서도 선정해 두어야 합니다.

④ 데이터 전처리 / 데이터 탐색

분석결과의 신뢰성 확보를 위해서는 분석 모델에 입력 할 데이터의 오류와 결측값 등을 파악하여 안정적인 데이터 확보 방안을 마련해야 합니다.

수집데이터의 기초 통계량과 시각화, 상관 분석 등을 통해 데이터에 대한 통찰을 얻도록 합니다.

⑤ 모델 학습/평가

적합한 통계적 방법, 데이터 마이닝, 머신 러닝 등의 분석 방법을 선정하며 모델 생성을 위한 학습 → 검증 → 평가 과정을 수행합니다.

⑥ 데이터분석 워크플로우

분석에 사용된 데이터를 중심으로 데이터 분석 작업의 시작과 끝을 설계합니다. “데이터 소스 → 수집 저장 → 데이터 전처리/데이터 탐색 → 분석 모델링 → 분석 결과” 의 단계별 데이터 입출력 관계와 작업 주기를 정리하여, 그 동안의 분석 과정을 현장에 적용하기 쉽도록 기술하는 과정 입니다.

⑦ 데이터 분석 활용 시나리오

분석 결과로부터 인사이트를 발굴하고 의사결정에 반영하는 방법을 선택합니다. 분석 결과에 활용된 데이터들의 특성에 적합한 다양한 차트와 시각화 도구를 이용하여 분석 결과를 비즈니스에 활용하는 시나리오를 개발합니다.

⑧ 운영 평가/모니터링

분석 결과를 안정적으로 활용하기 위해서는 운영 시스템에 적용한 후 분석 모델을 관리하고, 모델의 성능을 모니터링 하는 작업을 지속해야 합니다. 또한 정기적으로 학습 모델의 성능을 관리하기 위한 모니터링 지표 값을 정립해야 합니다.

데이터 과학도구의 필요

데이터의 시대라고 합니다. 데이터 분석 및 활용이 산업과 기업의 업무 대부분에 적용되고 있습니다. 데이터 과학자의 필요성이 점점 강화되고 있으나 데이터 과학자가 되는 과정은 매우 어렵고 오랜 시간이 필요합니다. 데이터의 시대는 빠른 변화와 혁신을 필요로 합니다. 현장 데이터 과학자 역할을 수행하는 시티즌 데이터 과학자(Citizen Data Scientist) 인력의 확보와 필요성이 급속히 요구되고 있습니다.

Gartner Identifies the Top 10 Strategic Technology Trends for 2019 에서는 분석 전문가가 아닌 사용자들도 데이터로부터 통찰력을 끌어낼 수 있도록 하는 역량인 시티즌 데이터 과학의 수요가 폭발적으로 늘어날 것으로 전망하고 있습니다. 시티즌 데이터 과학자의 양성이 데이터 과학자의 공급 부족과 높은 비용으로 야기된 데이터 과학 인력 부족 현상을 해소할 수 있는 가장 빠른 방법으로 제시되고 있는 것입니다.

[As-Is/To-Be → 데이터 수집 → 데이터 분석 → 실행 계획] 이라는 단계를 거쳐서 이루어지는 데이터 분석 방식으로는 현장의 이슈를 해결하는데 한계가 있습니다. 현장의 업무는 데이터 분석 너머에도 있습니다. 데이터 과학자라면 이러한 일들을 해결할 수 있을 것입니다. 하지만 데이터 과학자가 되는 것은 쉬운 과정이 아닙니다.

산업과 기업의 현장에서 필요로 하는 데이터 분석은 비즈니스 이슈를 데이터 분석으로 해결하고자 하는 목적성을 가지고 있는 것이 대부분입니다. 이러한 목적에 부합하면서 시티즌 데이터 과학자들이 사용하기 쉬운 도구가 필요합니다.

반응형

 

반응형
LIST