map(), apply(), applymap() 함수 map() : Series에서만 사용가능 apply() : Series, DataFrame 둘 다 사용 가능 applymap() : DataFrame에서만 사용 가능 apply() 함수도바 빠름 map() 함수

apply() 함수

  Series.str string 관련 함수를 모두 사용할 수 있음 Series.str.get() 함수

 

누락 데이터 확인 df.info() df.value_counts(dropna=False) df.isnull() df.notnull() df.isnull().sum(axis=0) df[‘deck’].value_counts(dropna=False) df[‘deck’].isnull() df[‘deck’].notnull() df[‘deck’].isnull().sum() 누락 데이터 제거 df.dropna() df.dropna(axis=0) df.dropna(axis=1) df.dropna(axis=1, thresh=750) df.dropna(how=’any’) df.dropna(how=’any’, axis=1) df.dropna(how=’all’) df[‘age’].dropna() df.dropna(subset=’age’) df[[‘age’,’deck’]].dropna() df[[‘age’,’deck’]].dropna(how=’all’) df.dropna(subset=[‘age’,’deck’]) df.dropna(subset=[‘age’,’deck’], how=’all’) df.dropna(subset=[‘age’,’deck’], how=’all’, ignore_index=True) df.dropna(subset=[‘age’,’deck’], how=’all’, inplace=True) 누락 데이터 치환 df.fillna(100, inplace=True) df[‘age’].fillna(100, inplace=True) m = df[‘age’].mean(axis=0) df[‘age’].fillna(m, inplace=True) m… Continue Reading Part 5. 데이터 사전 처리

Matplotlib 그래프 그리기  기초 titanic 데이터 불러오기

그래프 1

그래프 2

그래프 3

그래프 4

그래프 5

그래프 6

그래프 7

그래프 8

그래프 9

그래프 10

그래프 11

그래프 12

그래프 13

그래프 14

Continue Reading Part 4. 시각화 도구

데이터 일부 보기 df.head(n) : 앞부분 미리 보기 df.tail(n) : 뒷부분 미리 보기 데이터 요약 정보 확인 df.shape df.dtypes / df[열이름].dtypes df.info() df.describe() 데이터 개수 확인 df.count() : 각 열의 데이터 개수를 Series 형으로 반환 df[‘열이름’].value_counts() : 열의 고유값의 개수 통계함수 df.mean() / df[‘열이름’].mean() : 평균 df.median() / df[‘열이름’].median() :… Continue Reading Part 3. 데이터 살펴보기

외부 파일 읽어오기 CSV : read_csv(), to_csv() JSON : read_json(), to_json() HTML : read_html(), to_html() Local Clipboard : read_clipboard(), to_clipboard() MS Excel : read_excel(), to_excel() HDF5 Format : read_hdf(), to_hdf() SQL : read_sql(), to_sql() pd.read_csv() 매개변수들 path : 파일 위치 sep or delimiter : 구분 문자 header : 열이름(기본 0),… Continue Reading Part 2. 데이터 입출력

판다스 자료구조 Series Series의 구조 Series 만들기 : pd.Series() 인덱스 구조 : sr.index,  sr.values 원소 선택 : sr[‘c’],  sr[1] DataFrame DataFrame의 구조 DataFrame 만들기 : pd.DataFrame() 행이름, 열이름 지정 : pd.DataFrame(2차원배열, index=??, columns=??) 행 인덱스 변경 : df.index = [] 열 이름 변경 : df.columns = [] 행 인덱스 일부… Continue Reading Part 1. 판다스 입문

도서의  ISBN 생성규칙에 맞는지 검증하기 주민등록번호 생성규칙에 맞는지 검증하기 신용카드번호 생성규칙에 맞는지 검증하기 성적 파일을 읽어와서 성적처리하기1 (Pandas 활용하지 않기)     성적.zip sungjuk1.csv 를 읽어와서 성적처리하기 sungjuk2.csv 를 읽어와서 성적처리하기 sungjuk3.csv 를 읽어와서 성적처리하기(오류 추가한 파일이니 오류 해결 방법 찾아서) 성적 파일을 읽어와서 성적처리하기2 (Pandas 활용)

농업기상 조회월별 일 기본 관측데이터(XML) 조회

기상청_지상(종관, ASOS) 일자료(JSON) 조회서비스

 

사용 파일 : 엑셀 샘플 파일 사용 시트 : tbook 다양한 검색 방법 엑셀의 고급 필터 데이터베이스의 SQL 판다스의 필터 출판사가 성안당인 것만 검색 엑셀 SQL : SELECT * FROM tbook WHERE 출판사=”성안당”; 판다스 WHERE  절에 사용할 수 있는 연산자 비교 : =,  <>,  <,  <=,  >,  >= 범위 :… Continue Reading 엑셀, 데이터베이스, 판다스를 활용한 검색

error: Content is protected !!