데이터이야기 7

의과대학생이 정신건강에 미치는 영향

1. Planning-  이해하기의과대학생들의 우울증이 심각한 상태학교를 이탈하는 경우가 다수 발생함 환자들의 대면서비스에 대한 불만이 다수 발생-  프로젝트 개요 울증에 영향을 주는 요인과 대체 방안 찾기요인을 찾아 의과대학생들의 이탈율을 방지하고자 함- 데이터 이해 스위스 의과대학 학생들의 empathy(공감), mental health(정신 건강), burnout(탈진) 데이터를 측정한 내용Maslach Burnout Inventory (MBI)는 직업적인 환경에서의 감정적, 정신적, 물리적으로 과도한 스트레 스와 업무스트레스로 인한 "소진" 상태를 평가하기 위한 표준화된 도구임(캐글에서 Medical Student Mental Health를 가공함) 2. 데이터 전처리(1) Data 불러오기imp..

데이터이야기 2024.10.16

분류모형을 이용한 은행 고객 이탈 모형(02)

이탈고객 분석에 대한 개요와 데이터 이해, 데이터 탐색, 데이터 전처리 등이 완료가 되었고, 분류모형을 이용하여 이탈고객 모델링을 하고자 합니다. 목차 - 이탈고객분석 개요 - 목표 - 데이터 이해 - 데이터 탐색 - 데이터 전처리 - 데이터모델링 - 모델평가 3. 데이터 모델링 (1) 학습데이터와 테스트데이터를 분할함 필요 없는 칼럼( 'Avg_Open_To_Buy','Gender')을 삭제합니다 #필요없는 컬럼을 삭제 bank_df.drop(['Avg_Open_To_Buy','Gender', 'Income_Category','Card_Category' ], axis=1, inplace=True) 학습데이터 70%, 테스트 데이터 30%로 나눕니다. X = bank_df.drop('Attrition_F..

데이터이야기 2023.11.14

분류모형을 이용한 은행 고객 이탈 모형

이탈고객 모형이란 이탈 고객이란 고객이 회사의 제품이나 서비스 사용을 중단하는 고객 이탈 고객 관리는 은행, 통신서비스, OTT, 보험 회사 등 온라인 서비스 제공하는 산업에서 매우 중요하며, 수익성에 영향을 미침 신규 고객을 확보하는 데는 기존 고객을 유지하는 것보다 최대 5배 이상의 비용이 소요되므로, 이탈 고객 분석은 비즈니스에 매우 중요하며 필수적 임 이탈 고객 분석을 통해 고객 만족도를 높이고 결과적으로 고객 유지율을 높일 수 있는 전략을 수립해야 함 목표 은행의 이탈고객을 이해하고 예측하는 것 탐색적 데이터 분석(EDA)을 수행하여 고객 이탈에 기여하는 요인을 식별하고 시각화하고, EDA를 바탕으로 고객이 이탈할지 여부를 예측하는 기계 학습 모델을 구축하는데 기반 임 분류모형이고, 이탈할 고객..

데이터이야기 2023.11.13

데이터로 보는 고령자 디지털 정보 역량 군집화와 디지털 격차 해소 방안

고령자 디지털정보 역량을 군집화하여 군집데이터를 정의하고, 그에 따른 서비스 방안을 제시하고자 합니다. 해당 데이터는 레이블이 없어 비지도학습인 군집분석을 진행하고자 합니다. 군집분석은 계층적 분석, 중심 기반 분석, 밀도 기반 분석, 확률 분포 기반 분석 등이 있지만, 계측적 분석과 중심기반분석 중 K-Means 군집화로 진행하고자 합니다. 자세한 내용은 참조를 확인하시면 됩니다. 이 실습은 고령자정보역량을 input데이터로 사용하여 고령자의 디지털 정보 역량을 군집화하는 내용입니다. 각 군집별 격차해소를 위한 방안을 도출하고자 합니다. 1. Planning 2. Data Preparing 3. Data Analyzing - 계층적 군집 - 중심기반 군집 - Visualization 4. 방안제시 1...

데이터이야기 2023.10.09

데이터로 보는 고령자 디지털 격차 데이터전처리, 데이터탐색, 데이터시각화

한국지능정보사회연구원에서는 매년 디지털정보격차 실태조사를 실시합니다. 실태조사한 원본데이터를 활용하여 고령자의 디지털 격차를 확인해 보고, 방안을 제시하고 합니다. 실습에 사용될 데이터 파일은 https://github.com/sense64/data_viz/tree/main/data에 제공되고 있으며, 이중 sinor_data.xlsx 파일을 다운로드합니다. 1. 데이터 불러오기 판다스의 read_excel() 메서드를 메서드를 이용하여 파일을 불러옵니다. head() 메서드를 이용하여 데이터를 확인합니다. import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns df = pd.read_excel..

데이터이야기 2023.10.03

데이터로 보는 고령자 디지털 격차

디지털 격차는 인간의 권리에 대한 여러 가지 문제점이 있습니다. 특히, 고령자의 디지털 격차는 사회문제이고, 그에 따른 정책 방안이 필요합니다. 우리나라는 2023년 9월 약 950만 인구의 18.6%가 고령자 비율이고 고령화 속도가 가팔라서 2025년에는 고령자 비율이 20%인 초고령사회로 접어들게 됩니다. 부산과 전국의 고령자 비율을 살펴보면, 2023년 8월 현재 비교하면 전국 18.6%, 부산 22.2%로 전국에 비해 상당히 높은 편이고 초고령사회로 접어들었습니다. 심각한 고령사회는 많은 문제가 발생되고, 4차 산업 또는 인공지능 등 현재 디지털 의존성이 높아짐에 따라 디지털 활용 능력 등 디지털 격차로 인해 발생되는 문제가 많습니다. 따라서 디지털 격차에 따는 문제를 데이터로 확인하고 문제를 해..

데이터이야기 2023.09.25

필수업무종사자에 관한 이야기

http://news.kbs.co.kr/mobile/news/view.do?ncd=5517334 [필수 노동 실태보고서]① ‘그림자 노동’…그들이 일손을 놓는다면? [앵커] KBS부산 뉴스는 연중 기획으로 코로나19 이후 더 깊어진 양극화와 불평등 문제를 짚고 있습니다. 이... news.kbs.co.kr https://news.kbs.co.kr/mobile/news/view.do?ncd=5517340 [필수 노동 실태보고서]② 필수 노동 첫 실태…고령화에 저임금 ‘심각’ [앵커] KBS는 지금까지 드러나지 않았던 필수 노동자의 실태를 파악하기 위해 전문가와 함께 28만 건이 넘... news.kbs.co.kr https://news.kbs.co.kr/mobile/news/view.do?ncd=55173..

데이터이야기 2022.07.26
728x90