인기검색어
  • 1. 이현아
  • 2. 절대평가
  • 3. 일본
  • 4. 성과관리
  • 5. kt&g
  • 6. 피드백
  • 7. 이 회사의 HR이 궁금하다 | LG전자, 우려를 불식시키는 '절대평가'의 도입
  • 8. LG전자
  • 9. 3M
  • 10. 퍼시스
퇴직자 예측으로 알아보는 피플 애널리틱스
사원 A는 치솟는 전세자금을 감당하지 못해 서울 외곽으로 이사를 하게 되면서 출근 시간이 2시간 가량으로 늘어났다.
퇴직자 예측으로 알아보는 피플 애널리틱스
제호 : 2020년 11월호, 등록 : 2020-11-05 10:22:00
  • 기사 개별구매 : 1000원



사원 A는 치솟는 전세자금을 감당하지 못해 서울 외곽으로 이사를 하게 되면서 출근 시간이 2시간 가량으로 늘어났다. 비슷한 시기에 부서도 바뀌었는데 그 부서는 선배보다 일찍 퇴근하는 것이 결례여서 집에 도착하면 9시를 넘기는 일이 빈번했다. 결국 A씨는 다른 기업의 채용 공고를 살펴보게 된다.

B사원은 성과도 잘 내고 있으며 워라밸 또한 잘 지켜지고 있다. 또한, 자기 계발에도 관심이 많아 학업을 병행하며 학위 및 자격증도 취득했으나 오랜 기간 같은 업무에 무료함을 느낀다. 그러던 중 자신의 역량으로 더 큰 가치를 창출할 기회가 생겼고 이직을 마음먹게 된다.

이러한 모습은 기업에서 낯설지 않을 것이다. 그렇다면 사원 A와 B가 퇴직하면서 적는 퇴직사유를 통해 뒤늦게라도 대안을 마련할 수 있을까? 최근 잡코리아와 알바몬에서 직장인 2288명을 대상으로 설문조사한 자료에 의하면 퇴사를 경험한 직장인 52.1%가 "정확한 퇴사사유를 밝히지 않았다"고 답했다. 

그렇다면 사원 A와 B의 사례에서 데이터로 만들 수 있는 부분은 무엇이 있을까? 이미 사원 A와 B는 거주지 변경, 출퇴근 시간, 부서변경 여부, 성과평가, 학력 변경, 자격증 내역 등 많은 데이터 족적을 남겼다. 뿐만 아니라 이렇게 쌓인 데이터들은 유의미한 분석을 위해 또 다른 파생변수를 생성할 수 있다. 이러한 부분을 고려하며 데이터 사이언스 커뮤니티 Kaggle에 있는 HR 데이터로 퇴직자를 예측한 사례에 대해 이야기하겠다.



CRISP-DM으로 알아보는 퇴직자 예측 프로세스
CRISP-DM(Cross-Industry Standard Process for Data Mining)은 전 세계에서 가장 많이 사용되는 표준적이고 포괄적인 방법론으로 어떤 산업 분야에도 적용할 수 있는 데이터 마이닝 프로세스이다. 만약 이러한 프로세스를 무시하고 People Analytics(이하 'PA')를 진행할 경우 실패할 확률이 높으므로 CRISP-DM의 프로세스에 맞추어 퇴직자를 예측한 사례를 설명해 보겠다.

비즈니스 이해Business understanding
데이터 마이닝을 수행하기 전 비즈니스 목적을 파악해, 비즈니스와 데이터 분석결과를 결합할 수 있는지에 대해 생각해 볼 수 있어야 한다. 다시 말해 퇴직자 예측을 수행하기 전 우리 조직에서 핵심인재나 특정 직군 혹은 특정 연차의 이직율이 높아 비즈니스에 많은 영향을 미치는 상황인지에 대해 판단해야 한다. 그렇지 않을 경우 힘들게 진행된 분석 결과가 여러 직원들의 평판조회 수준으로 전락할 수 있다. 그러므로 이 단계에서는 삽을 쓰기 위해 땅을 파는 것인지, 땅을 잘 파기 위해 삽을 쓰는 것인지 깊게 생각해 볼 필요가 있겠다.

데이터 이해Data understanding
이번 단계에서는 문제 해결을 위해 어떤 데이터를 사용해야 하는지와 데이터 이면에 숨겨져 있는 원리에 대해 파악해야 한다. Kaggle의 HR Analytics Case Study에 있는 데이터셋에는 기본적인 HR 데이터를 비롯해 본인 평가 및 관리자 평가 그리고 1년간의 출퇴근기록이 있다. 만약 실무에서 해당 분석을 진행한다면 인사 관리시스템 내에 있는 퇴직금 조회 및 퇴사 신청에 대한 메뉴를 클릭할 때 남는 로그 기록, 전년 대비 연차사용 증감 여부 등도 좋은 데이터가 될 수 있겠다.

특히 PA에서는 데이터보다 사람과 조직을 먼저 바라볼 수 있는 역량이 중요하다. 하버드 경영대학원 교수인 크리스 아지리스Chris Argyris의 추론의 사다리에 의하면 우리는 어떤 환경에 일부만을 선택적으로 취하고 의식에 들어온 정보는 각자 의미를 부여하게 된다. 그 의미는 가정과 결론, 믿음을 만들고 우리는 매 순간 믿음에 따라 행동하게 된다. 그렇기 때문에 같은 환경이라도 조직 또는 사람마다 가지는 의미와 신념에 따라 각각 다른 행동을 보이고 이것이 데이터로 남게 된다. 그래서 AI의 원재료인 학습 데이터는 다른 곳에서 가져올 수 있는 것이 아닌 조직 내부적으로 구축해야 하며 사람과 조직을 본질적으로 이해하는 담당자가 데이터 이면에 숨겨져 있는 원리를 파악하는 데 용이할 것이다.

데이터 준비Data Preparation
이번 단계에서는 데이터를 선택, 정제, 생성, 통합하는 등 초기 데이터로부터 최종 데이터셋을 구성하기 위한 모든 활동들을 커버한다. 실제 AI접목의 가장 큰 걸림돌은 기술적인 제약이 아닌 파편화된 데이터, 부정확한 데이터, 배경과 관련된 데이터 부족에서 발생한다. 특히 PA에서는 비즈니스와 더불어 사람과 조직에 대한 이해를 바탕으로 해당 과정을 수행하는 것이 중요한데 다음 몇 가지 사례를 통해 새로운 변수를 생성하는 과정을 설명해 보겠다.

... 중략 ...

강지상 동아쏘시오홀딩스 인재개발원 과장
 
 
기사 전문은 구독권한이 있는 회원께만 제공됩니다. 먼저 로그인 하세요.
 
  • 리스트로 이동
  • 기사 개별구매 : 1000원