목록Python (12)
인턴기록지
# 한번만 설치 pip install virtualenv #가상환경 생성 virtualenv 폴더명 #가상환경 활성화 source ./폴더명/bin/activate #가상환경 종료 - 항상 종료해줘야 한다. deactivate
pip install virtualenv 실행하려 하는데 오류가 남 그래서 밑의 명령어로 pip재설치 curl https://bootstrap.pypa.io/get-pip.py | sudo python 그랬더니 pip -V 하면 또 오류 [root@localhost ~]# pip3 install virutalenv -bash: /usr/bin/pip3: 그런 파일이나 디렉터리가 없습니다 ~/.bashrc 파일을 봐도 pip=pip3가 제대로 되어있음 이상해서 /usr/bin/ 폴더에 가서 pip 파일들을 찾아봄 [root@localhost bin]# vi pip pip-3 pip-3.6 pip2 pip2.7 pip3.6 무수히 많은데 생각해보니 pip=pip3로 되어있는 부분에서 경로를 읽어오지 못하는 ..
중복데이터가 있는지 확인하는 함수는 duplicated()함수이다. 나는 중복된 데이터를 보고 싶었다. #csv0[csv0.duplicated()] 해도 결과는 똑같 display(csv0[csv0.duplicated()]) 위의 두개의 중복데이터들을 볼 수 있다. 그러므로 예를 들어 1번째 행의 데이터가 똑같은 것이 두개가 들어가 있어서 만약 중복데이터 삭제를 한다면 1번째 행 a행의 데이터는 남고 지금 위의 출력화면에 보여진 b행의 데이터는 지워질 것이다. 왜냐하면 keep의 디폴트 값이 first라서 처음 값을 남기고 나머지는 삭제하기 때문이다. 그런데 여기서 이해안가는 점 분명 위의 2개의 데이터가 중복이라는 것을 확인을 해서 중복데이터 제거= drop_duplicates() 했지만 행의 개수가 ..
주피터 노트북으로 파이썬 pandas를 이용해서 csv 파일을 활용해 볼 것이다. 만든 파이썬 파일과 같은 디렉토리 안에 rentalhistory.csv 파일을 넣어준다. import pandas as pd csv=pd.read_csv('./rentalhistory.csv',encoding='CP949') csv read_csv파일을 통해 엑셀파일을 읽어 올 수 있다. encoding 은 해주지 않으면 오류가 나서 넣어줬다. 읽어온 엑셀파일을 csv 변수에 넣어준다. # 인덱스 1048475~1048574까지 끝에서부터 100개의 행을 잘라서 # csv_100이란 새로운 엑셀파일을 생성 print(type(csv.loc[1048475:1048574])) csv_100 = csv.loc[1048475:10..