본문 바로가기

전체 글72

Python (데이터 전처리 - 데이터검색, 행/열 추가) 5. 데이터 검색 (조건에 맞는 데이터 추출) 1) 행단위 조건 검색 # 단일 조건 - 기본적인 비교식 사용 1 >>> 성적표.query('국어 > 90') cs ◆ 결과 학년 성별 국어 영어 수학 과학 호영 4 남자 120 50.0 NaN 88.0 철수 1 남자 98 NaN 88.0 64.0 민수 1 남자 92 70.0 NaN NaN # And 조건 사용 1 >>> 성적표.query('국어 > 80 and 수학 > 80') cs ◆ 결과 학년 성별 국어 영어 수학 과학 철수 1 남자 98 NaN 88.0 64.0 # Or 조건 사용 1 >>> 성적표.query('국어 2020. 5. 15.
Python (데이터 전처리 - 행/열 순서 및 이름 변경, 데이터 정렬) 데이터 전처리 : 데이터를 본격적으로 분석하기전, 데이터를 가공하는 작업. 1. 행, 열의 순서 변경 2. 컬럼이나 인덱스의 이름 변경 3. 데이터 정렬 4. 데이터 검색 5. 행, 열 추가 6. 행, 열 삭제 7. 두 개 이상의 데이터 프레임 병합 1. 필요한 패키지 참조 및 샘플 데이터 준비하기. 1) 패키지 참조. 1 2 3 4 5 6 >>> import numpy >>> from pandas import DataFrame # 데이터프레임 클래스 >>> from pandas import Series # 시리즈 클래스 >>> from pandas import ExcelFile # Excel 파일을 읽어들이기 위한 클래스 >>> from pandas import concat # 행단위 병합기능을 제공하.. 2020. 5. 14.
Python(DataFrame) 1. 필수패키지 참조 1 2 >>> pip install --upgrade openpyxl >>> pip install --upgrade xlrd cs 1 2 3 >>> from pandas import DataFrame # 데이터프레임 클래스 >>> from pandas import read_csv # csv파일을 읽어들이기 위한 함수 >>> from pandas import ExcelFile # Excel 파일을 읽어들이기 위한 클래스 cs 2. 데이터 프레임 생성하기 객체 = DataFrame(데이터, index = [ ], columns = [ ] ) 1) 데이터의 종류 - 2차원리스트 - 리스트를 원소로 갖는 딕셔너리 - 동일한 구조를 갖는 딕셔너리들이 모인 리스트 - csv파일 - xlsx 파.. 2020. 5. 14.
Python ( pandas ) Pandas : 데이터분석, 처리 등을 쉽게 하도록 만들어진 Python package, 대용량 데이터를 보다 쉽고 안정적으로 처리 가능 #1. Pandas 패키지 설치 1 >>> pip install pandas cs #2. Pandas의 자료구조 종류 설명 Series value와 index의 형태를 지니는 1열로 구성된 자료구조 DataFrame 여러개의 Dictionary를 처리하는데 있어 Series보다 보기 편한 형태의 구조. 엑셀의 표와 같이 행과 열로 이루어져 있음 #3 Pandas 자료구조 살펴보기 Series 클래스의 생성자 파라미터로 리스트나 Numpy 배열을 전달한다. 리스트, 튜플 --> Numpy배열 -> Series 순서로 업그레이드 됨. 역순으로 다운그레이드 가능 위 표에서 .. 2020. 5. 14.
Python (반복문) 반복문 : 주어진 조건이 참을 충족하는 동안 블록안의 실행문을 반복 종류 설명 while 문 주어진 '조건'이 참(True)인 경우에만 실행 for 문 반복 수행을 위한 범위를 지정하고 지정된 범위 안에서 실행 2020. 5. 13.
Python (조건문) 조건문(IF) : 특정 조건을 충족할 경우에만 실행되는 구문 if문 : 주어진 '조건'이 참(True)일 경우에만 실행된다. if ~ else 문 : 주어진 조건이 참(True)일 경우 if문이 실행되고, 그렇지 않을 경우 (거짓,False) else 문이 실행됨. if ~ elif ~ else문 : 조건을 여러개로 세분화하여 사용. 1 2 3 4 5 6 7 8 9 >>> a = 101 >>> if a > 100: print('a는 100보다 큽니다') a는 100보다 큽니다 >>> b = 100 >>> if b > 100: print('b는 100보다 큽니다') cs b는 조건을 충족 못했으므로 출력되지 않음. 1 2 3 4 5 6 7 8 >>> age = 19 >>> if age > 19: print.. 2020. 5. 13.
Python(딕셔너리) 딕셔너리 : 이름(key)과 값(value)이 쌍을 이루는 자료구조 dic1 = {"이름" : "값","이름" : "값","이름" : "값", ~~,"이름" : "값"} dic2 = {"이름" : ["값0", "값1", "값2"]} --> 값을 리스트로 지정 가능 get( ) : 특정 key에 대응하는 값 얻기 1 2 3 4 5 6 7 >>> dic = {'name' : '철수',' phone' : '010-1234-56789', 'birth' : '0115'} >>> a = dic.get('name') >>> print(a) 철수 Colored by Color Scripter cs keys( ) : key만 모아서 dict_keys라는 객체로 변환 1 2 3 4 5 6 7 >.. 2020. 5. 13.
리스트 리스트(list) : 변수를 그룹으로 묶은 형태의 한 종류, 한 리스트안에 서로 다른 값들이 저장 될 수 있음. - 실무에서는 2차원 리스트를 초과하는 형태는 잘 사용하지 않는다. 1 2 3 >>> list = [1,2,3,'사과','바나나'] # 1차 리스트 >>> list = [[1,2,3],['사과','바나나'] # 2차 리스트 cs 1 2 3 4 5 6 7 8 9 >>> list1 = [1,2,3,'사과','바나나'] >>> print(list1[3]) 사과 >>> list2 = [[1,2,3],['사과','바나나']] >>> print(list2[0][1]) 2 Colored by Color Scripter cs len( ) : 전체 원.. 2020. 5. 12.
문자열, 튜플 문자열(string) : 문장을 표현하는 글자들의 모임을 값으로 갖는 변수 - 문자열을 표현하기 위해서는 "쌍따옴표" 나 '홑따옴표'의 쌍으로 문장을 감싸야한다 >>> msg1 = "Life is too short" >> msg2 = 'you need python' >> msg3 = "Life is too short' 이스케이프 문자 : 문자열에 포함될 수 있는 특수문자 기호 출력 \n 줄 바꿈 \ 탭 \\ \ \' ' \" " %% % 문자열의 인덱스번호 : 0번부터 시작되며 띄어쓰기도 하나의 글자로 처리. 0 1 2 3 4 5 6 7 8 I g o h o m e - 음수 형태의 인덱스 번호도 지원. -9 -8 -7 -6 -5 -4 -3 -2 -1 I g o h o m e 문자열 인덱싱 : 인덱스 번호.. 2020. 5. 12.