본문 바로가기

Python16

python (반복문 유형) 1. 리스트 역순배치 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 >>> mylist = [5, 3, 7, 1, 9] >>> size = len(mylist) # --------> 5 >>> half = size // 2 # 리스트의 반 만큼만 반복 수행 --> 0부터 2전까지 >>> for i in range(0, half): # i번째 항목의 반대쪽에 위치한 원소의 인덱스를 구한다. >>> p = size - i - 1 # i번째 원소와 p번째 원소의 값을 맞바꾼다. >>> mylist[i], mylist[p] = mylist[p], mylist[i] >>> print(mylist) [9, 1, 7, 3, 5] Colored by Color Scripter cs 2. 리스트 원소정.. 2020. 5. 22.
Python (Selenium) Selenium : 웹 브라우저를 직접 제어, 크롤링시 사용되는 스크래핑 도구 웹앱을 테스트하는 웹 프레임워크로서 크롬이나 파이어폭스같은 각 브라우저의 각 브라우저마다 제공되는 Webdriver API를 활용하여 크롬이나 파이어폭스 같은 웹 브라우저를 Java나 C#, Python 같은 프로그래밍 언어를 통해 제어 Selenium 동작방식 Python 소스코드 -> Selenium 패키지 -> ChromeDriver(WebDriver) -> Google Chrome ChromeDriver 내려받기 https://chromedriver.chromium.org/downloads에서 사용중인 운영체제와 Google Chrome 브라우저의 버전에 맞는 ChromeDriver를 내려받는다. 1. 필요한 모듈 참조.. 2020. 5. 22.
python(지도 시각화) 1) 필요한 모듈 1 2 3 4 5 pip install --upgrade folium # 필요한 패키지설치 import folium from pandas import DataFrame # 데이터 분석 패키지 from pandas import ExcelFile # 엑셀파일 가져오기 cs 2) 지도에 마커추가 - 일반 마커 1 2 3 4 5 6 7 8 9 10 11 # 새로운 지도 객체 생성 map_osm1 = folium.Map(location=['위도','경도'], zoom_start='값') # 마커 객체 생성 marker1 = folium.Marker(['위도','경도'], popup='서울특별시청', # 팝업 이름 icon=folium.Icon(color='색',icon='아이콘')) marker.. 2020. 5. 21.
Python (데이터 전처리 - 행/열 삭제 및 병합) 7. 행, 열 삭제 : drop( ) - 원본에 바로 적용하고 싶다면 inplace = True 입력 1) 행 삭제 A) 데이터 복사 1 2 3 >>> 복사본3 = 성적표.copy() >>> 복사본3 cs ◆ 결과 학년 성별 국어 영어 수학 과학 호영 4 남자 120 50.0 NaN 88.0 철수 1 남자 98 NaN 88.0 64.0 영희 2 여자 88 90.0 62.0 72.0 수현 3 여자 63 60.0 31.0 70.0 민수 1 남자 92 70.0 NaN NaN B) 특정 행 삭제하기 1 2 3 >>> d1 = 복사본3.drop('철수') >>> d1 cs ◆ 결과 학년 성별 국어 영어 수학 과학 호영 4 남자 120 50.0 NaN 88.0 영희 2 여자 88 90.0 62.0 72.0 수현 3.. 2020. 5. 15.
Python (데이터 전처리 - 데이터검색, 행/열 추가) 5. 데이터 검색 (조건에 맞는 데이터 추출) 1) 행단위 조건 검색 # 단일 조건 - 기본적인 비교식 사용 1 >>> 성적표.query('국어 > 90') cs ◆ 결과 학년 성별 국어 영어 수학 과학 호영 4 남자 120 50.0 NaN 88.0 철수 1 남자 98 NaN 88.0 64.0 민수 1 남자 92 70.0 NaN NaN # And 조건 사용 1 >>> 성적표.query('국어 > 80 and 수학 > 80') cs ◆ 결과 학년 성별 국어 영어 수학 과학 철수 1 남자 98 NaN 88.0 64.0 # Or 조건 사용 1 >>> 성적표.query('국어 2020. 5. 15.
Python (데이터 전처리 - 행/열 순서 및 이름 변경, 데이터 정렬) 데이터 전처리 : 데이터를 본격적으로 분석하기전, 데이터를 가공하는 작업. 1. 행, 열의 순서 변경 2. 컬럼이나 인덱스의 이름 변경 3. 데이터 정렬 4. 데이터 검색 5. 행, 열 추가 6. 행, 열 삭제 7. 두 개 이상의 데이터 프레임 병합 1. 필요한 패키지 참조 및 샘플 데이터 준비하기. 1) 패키지 참조. 1 2 3 4 5 6 >>> import numpy >>> from pandas import DataFrame # 데이터프레임 클래스 >>> from pandas import Series # 시리즈 클래스 >>> from pandas import ExcelFile # Excel 파일을 읽어들이기 위한 클래스 >>> from pandas import concat # 행단위 병합기능을 제공하.. 2020. 5. 14.
Python(DataFrame) 1. 필수패키지 참조 1 2 >>> pip install --upgrade openpyxl >>> pip install --upgrade xlrd cs 1 2 3 >>> from pandas import DataFrame # 데이터프레임 클래스 >>> from pandas import read_csv # csv파일을 읽어들이기 위한 함수 >>> from pandas import ExcelFile # Excel 파일을 읽어들이기 위한 클래스 cs 2. 데이터 프레임 생성하기 객체 = DataFrame(데이터, index = [ ], columns = [ ] ) 1) 데이터의 종류 - 2차원리스트 - 리스트를 원소로 갖는 딕셔너리 - 동일한 구조를 갖는 딕셔너리들이 모인 리스트 - csv파일 - xlsx 파.. 2020. 5. 14.
Python ( pandas ) Pandas : 데이터분석, 처리 등을 쉽게 하도록 만들어진 Python package, 대용량 데이터를 보다 쉽고 안정적으로 처리 가능 #1. Pandas 패키지 설치 1 >>> pip install pandas cs #2. Pandas의 자료구조 종류 설명 Series value와 index의 형태를 지니는 1열로 구성된 자료구조 DataFrame 여러개의 Dictionary를 처리하는데 있어 Series보다 보기 편한 형태의 구조. 엑셀의 표와 같이 행과 열로 이루어져 있음 #3 Pandas 자료구조 살펴보기 Series 클래스의 생성자 파라미터로 리스트나 Numpy 배열을 전달한다. 리스트, 튜플 --> Numpy배열 -> Series 순서로 업그레이드 됨. 역순으로 다운그레이드 가능 위 표에서 .. 2020. 5. 14.
Python (반복문) 반복문 : 주어진 조건이 참을 충족하는 동안 블록안의 실행문을 반복 종류 설명 while 문 주어진 '조건'이 참(True)인 경우에만 실행 for 문 반복 수행을 위한 범위를 지정하고 지정된 범위 안에서 실행 2020. 5. 13.