목록Zerobase DS School (34)
log.Sehee

데이터의 경향 표시 인구 수와 소계 컬럼으로 scatter plot 그리기def drawGraph(): plt.figure(figsize=(14, 10)) plt.scatter(data_result['인구수'], data_result['소계'], s=50) plt.xlabel('인구수') plt.ylabel('CCTV') plt.grid(True) plt.show() drawGraph() Numpy를 이용한 1차 직선 만들기 np.polyfit(): 선형관계를 도출할 계수 계산# 인구수를 x축, 소계를 y축으로 1차식 계산, 선형관계 도출fpl = np.polyfit(data_result['인구수'], data_result['소계'], 1)fpl# array([1.1..

CCTV 데이터 훑어보기# 데이터 조회CCTV_Seoul.sort_values(by='소계', ascending=False).head(5)# 기존 컬럼이 없으면 추가, 있으면 수정CCTV_Seoul['최근증가율'] = ( (CCTV_Seoul['2016년'] + CCTV_Seoul['2015년'] + CCTV_Seoul['2014년']) / CCTV_Seoul['2013년도 이전'] * 100)CCTV_Seoul.sort_values(by='최근증가율', ascending=False).head() 인구현황 데이터 훑어보기pop_Seoul.drop([0], axis=0, inplace=True)pop_Seoul.head()# 구별 column의 집합 및 개수 출력pop_Seoul['구별'].uniqu..

Pandas: python에서 R만큼의 강력한 데이터 핸들링 성능을 제공하는 모듈단일 프로세서에서 최대 효율이며 코딩이 가능하고 응용 가능한 엑셀로 받아들여도 됨 Pandas는 통상 pd / numpy는 통상 npimport pandas as pdimport numpy as np Series: index와 value로 이루어져 있음한 가지 데이터 타입만 가질 수 있음# pd.Series(value값, dtype=데이터타입 지정)pd.Series([1, 2, 3, 4], dtype=np.float64) numpy 배열 사용pd.Series(np.array([1, 2, 3])) pd.Series({"Key": "Value"}) data = pd.Series([1, 2, 3, 4])data % 2 DataF..

환경설정1. 홈페이지에서 conda와 home brew 설치2. 터미널에서 conda 버전확인conda --version3. conda 버전 업데이트conda update conda4. 앞으로 사용할 가상환경 생성conda create -n 가상환경이름 python=파이썬 버전 지정5. 해당 가상환경 활성화conda activate 가상환경이름+ 가상환경 비활성화conda deactivate6. 가상환경 현황 확인conda env list+ 가상환경 삭제conda env remove -n 가상환경이름7. 주피터 설치conda install jupyter8. 필요한 추가 패키지 설치conda install ipythonconda install matplotlibconda install seaborncond..