20260310 TIL

2026. 3. 10. 20:45TIL

📢 오늘의 목표

🚩Pandas와 matplotlib을 이용해서 타이타닉 생존자들의 공통의 요인을 분석하고, 당뇨병 데이터로 상관 관계 분석하기


🚩아티클 스터디로 데이터 분석 역량 키우기

 

🚩커리어 스터디로 목표하는 도메인에 대한 정보 얻기


📅 TIL

❇️마케터, 기획자를 위한 실전 데이터 분석 3주차

더보기

1️⃣ 수업 목표

 

2️⃣ 문제 상황

3️⃣가설 설정

❗요금과 생존이 관계가 있을 것이고 부유한 사람들이 더 많이 살아남았을 것이다.

 4️⃣ 데이터 분석

 

▶️ pandas 라이브러리는 데이터 기본 세팅, 데이터 분석을 위해 사용

 

import pandas as pd
import matplotlib.pyplot as plt
titanic = pd.read_table('train (1).csv',sep=',')
# 공백 데이터 파악하기
print(titanic.isnull().sum())
# 공백 데이터 제거하기
titanic = titanic.dropna()
# 상관계수 구하기
corr=titanic.corr (method='pearson')
#survived 1인 요소 제외하기
corr = corr[corr.Survived !=1]
#passengerId 열 삭제 하기
corr = corr.drop(['PassengerId'], axis ='rows')
#생존율 상관관계 바 그래프 생성하기
corr['Survived'].plot.bar()
#x축 레이블 45도 회전하기
plt.xticks(rotation=45)

 

corr = corr[corr.Survived !=1]

이 부분에서 Survived ! = 1 부분이 이해가 안 됬었는데  !=1 이 1인 값만 참고한다는 내용이어서 전체적으로 코드를 해석하면 corr 변수에 대해 Survived=1인 값인 데이터만 추려내어 상관 관계를 분석하는 것이다.

❗상관 관계 분석 결과 성별이 가장 연관성있는 요인이였다.

 

➡️기존 스프레드시트 조사 결과와 일치

# 데이터 분석 & 시각화 기본 세팅
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
# 데이터 불러오기
titanic = pd.read_table('train (1).csv',sep=',')
titanic.head()
# 결측치 제거하기
print(titanic.isnull().sum())
titanic = titanic.dropna()
# 데이터 통계치 요약하기
titanic.describe()
# 나이별 히스토그램 구하기
titanic['Age'].hist(bins=40,figsize=(18,8),grid=True)
# 나이별 구분 및 각 나이별 생존율 확인하기
titanic['Age_cat'] = pd.cut(titanic['Age'],bins=[0,3,7,15,30,60,100],include_lowest=True,labels=['baby','children','teenage','young','adult','old'])
# 연령대를 기준으로 평균값 구하기
titanic.groupby('Age_cat').mean()
# 그래프 크기 설정하기
plt.figure(figsize=(14,5))
바 그래프 그리기
sns.barplot(x='Age_cat', y='Survived', data=titanic, palette='viridis')
plt.show()

 

히스토그램

 

바 그래프
⚡titanic['Age'].hist(bins=40,figsize=(18,8),grid=True)

이 부분에서 bins=40 부분이 이해가 되지 않았는데  이 부분은 구간을 40개로 나눈다는 의미였다. 따라서 전체적인 코드를 해석하면 구간을 40개로 나누고 (18, 8) 크기로 격자선을 추가한다는 의미

⚡palette='viridis'

팔레트가 단색이어서 각 그래프를 다른 색상으로 표기

sns.barplot(x='Age_cat', y='Survived', data=titanic, palette='viridis')

x., y. 형태로 써서 오류 발견

❗상관 관계 분석 결과 영유아의 생존률이 가장 높았다. 그 이유는 타이타닉이 유람선이었기 때문에 성인 승객이 많았을 것이고 보통 재난 상황에서 아이와 노인 여성부터 구조하기 때문에 생존율이 높았을 것이다.

import pandas as pd
diabetes = pd.read_table('/diabetes (1).csv',sep=',')
diabetes.head()
print(diabetes.isnull().sum())
diabetes = diabetes.dropna()
diabetes
corr=diabetes.corr(method='pearson')
corr
corr=corr[corr.Outcome !=1]
corr
import matplotlib.pyplot as plt
corr['Outcome'].plot()
corr['Outcome'].plot.bar()

  5️⃣ 과제

 

#데이터 분석 쿨 준비
import pandas as pd
import matplotlib.pyplot as plt
# 데이터 불러오기
diabetes = pd.read_table('/diabetes (1).csv',sep=',')
diabetes.head()
# 결측치 제거
print(diabetes.isnull().sum())
diabetes = diabetes.dropna()
diabetes
# 상관관계 분석
corr=diabetes.corr(method='pearson')
corr
corr=corr[corr.Outcome !=1]
corr
# 데이터 시각화
corr['Outcome'].plot()
corr['Outcome'].plot.bar()

 

🗯️고찰

기존에 익숙했던 엑셀 말고 파이썬으로 데이터 분석을 하니 처음에는 이해가 안가고 오타 하나로 오류가 났을 때는 왜 안될까 조급한 마음도 들었다.

 

특히 타이타닉 생존자에 대한 막대 그래프를 ploting할때는 강의 자료랑 동일하게 했지만 결과값이 나오지 않아서 뭐가 문제인가 고민을 많이 했다.  그래서 Gemini한테 문제가 뭘까 물어보았고 x축과 y축이 지정되지 않아서 그렇다는 답변을 받고 x축과 y축을 지정했더니 교안과 똑같이 나와서 AI의 문제 해결력에 감탄하였다. 물론 AI에 의지하지 않고 나 혼자 해결하는 문제 해결력도 키워야겠지만 처음 경험하는 분야에서는 AI가 좋은 툴이 될 수 있을 것 같다.

 

 

 

❇️아티클 스터디

더보기

💬요약

 

MES(Manufacturing Execution system)의 핵심 기능인 작업 스케줄링, 제품 추적성, 품질 관리, 공정 라우팅에 대해 분석하고, MES가 검사항목마스터, 설비정보마스터, 검사결과이력을 이용해 어떻게 데이터를 구조화하는지 설명하고, 이 과정에서 생길 수 있는 데이터 가공의 문제, 자동화 설비 데이터의 저장 시간 문제, 자동화 설비 데이터의 시간 동기화 문제에 대해 정리한 기사입니다.

🔆 주요 포인트

MES 핵심기능(작업 스케줄링, 제품 추적성, 품질 관리, 공정 라우팅),

 

품질 데이터의 특징(검사항목마스터, 설비정보마스터, 검사결과이력),

 

데이터 분석을 방해하는 요인

🧭 핵심 개념

▶️ MES(Manufacturing Execution system)

제조 실행 시스템으로 공장에서 생산이 실제로 어떻게 진행되고 있는지 관리하고 기록하는 시스템

용어 정리

*️⃣ ERP

회사 전체의 경영자원(재무, 인사, 구매, 재고, 생산계획 등)을 통합 관리하는 시스템

*️⃣ SPC (Statistical Process Control)

통계 기법을 활용하여 공정이 안정적으로 운영되는지 분석하는 방법

*️⃣ 공정 라우팅

어떤 공정을 어떤 순서로 거치면서 생산할 것인지 정리한 작업 경로

*️⃣ 비전 검사

카메라와 이미지 분석을 이용한 자동 검사 기술, 제품의 외관을 촬영한 후 이미지 처리 기술로 불량 여부를 판단

*️⃣ 미들웨어

서로 다른 시스템 사이에서 데이터를 연결하고 전달해주는 중간 소프트웨어

🗯️고찰

그리고 오후에는 아티클 분석을 했고 Manufacturing Execution System (MES)라는 개념을 알게 되었다. 전반적인 기계 설비를 하나의 사이클로 만들어서 공정 데이터를 수집하고 이를 오류 탐지 및 공정 개선화하는 데 사용하여 생산성을 높인다는 개념이 매우 인상 깊어서 앞으로 자세히 조사해보고 싶은 마음이 들었다.

 

❇️커리어 스터디

더보기

📱 반도체 공정

 

📌반도체 공정은 실리콘 웨이퍼 위에 회로를 형성하여 반도체 소자를 만드는 일련의 제조 과정이다.

 

📌그 중에서 프론트엔드 공정은  웨이퍼 제조 → 산화 → 포토리소그래피 → 식각 → 증착 → 이온 주입 → 금속 배선 → 패키징 등의 단계로 이루어진다.

 

📌각 공정에서는 미세한 회로 패턴을 형성하고 전기적 특성을 구현하기 위한 정밀한 제어가 필요하다.

특히 나노 단위의 공정 오차도 소자의 성능과 수율에 큰 영향을 미친다.


📌
따라서 공정 조건 관리와 품질 관리가 반도체 제조에서 매우 중요한 역할을 한다

 

 

반도체 Front-end 공정

산화 공정 (Oxidation)

👍실리콘 웨이퍼 표면에 **산화막(SiO₂)**을 형성하는 공정

👍전기 절연층 형성,트랜지스터 보호

포토 공정 (Photolithography)

👍웨이퍼 위에 회로 패턴을 그리는 공정

👍감광액(PR) 도포 → 마스크로 빛 노광 → 현상하여 패턴 형성

식각 공정 (Etching)

👍포토 공정에서 만든 패턴을 기준으로 필요 없는 부분을 제거하는 공정.

👍회로 패턴을 실제 구조로 만듬

증착 공정 (Deposition)

👍웨이퍼 표면에 **얇은 박막(Thin Film)**을 형성하는 공정

👍절연층 형성, 금속 배선 형성이 목표

⚡이온 주입 공정 (Ion Implantation)

👍반도체의 전기적 특성을 만들기 위해 불순물 이온을 주입하는 공정

👍전도 특성 형성

금속 배선 공정 (Metalization)

👍회로 간 전기 연결을 위해 금속 배선을 형성하는 공정

👍칩 내부의 전기 신호 전달 역할

CMP 공정 (Chemical Mechanical Polishing)

👍웨이퍼 표면을 화학적 + 기계적으로 연마하여 평탄하게 만드는 공정

👍CMP 공정을 거치지 않으면 crack과 같은 fatal error 발생 가능

⚡테스트 공정 (Test / Inspection)

👍완성된 칩이 정상적으로 작동하는지 검사

 

산화 → 포토 → 식각 → 증착 → 이온주입 → CMP → 금속배선 → 테스트

위 과정을 수십~수백번 반복하여 하나의 칩을 형성

 

 

 

오늘은 부트캠프에 참여한지 2일째 되는 날이다.

 

[오전 시간]

 

스크럼으로 오늘은 전반적인 자격증 취득 계획을 세워보기로 했다.

 

내가 취득하고 싶은 자격증은 총 4개이다.

 

품질경영기사, ADSP, 6시그마, 화학분석기사이고 추가적으로 토익 스피킹 점수도 IM2 > IH나 AL로 높이고 싶다.

 

그중에서 6시그마는 강의만 들으면 딸 수 있다고 해서 가장 먼저 취득할 계획이다.

 

'TIL' 카테고리의 다른 글

20260313 TIL  (0) 2026.03.13
20260312 TIL  (0) 2026.03.12
20260311 TIL  (0) 2026.03.11
20260309 TIL  (0) 2026.03.09
부트캠프 QAQC트랙 수료 중 나의 목표  (0) 2026.03.09