1. 판다스에서 culmns과 row의 개념
1. read_excel의 skiprows로 원하는 columns를 설정
2. df.loc["행이름", "열이름"]으로 처음에 주인 표 추출
3. df.iloc[행번호, 열번호]로 원하는 양식의 표로 바
----
차례로 시작
순서
1. import pandas as pd 로 판다스를 불러내기
2. pd.read_excel(불러올 엑셀 주소)
※엑셀 주소는 URL도 될 수 있고, 절대 경로, 상대 경로도 될 수 있다. 상대경로의 경우 작업 디렉토리를 기준으로 한 경로
예) 절대경로: pd.read_excel(D:\python\lesson1\test\출장비.xlsx)
py 파일(작업)이 test폴더에 있을 경우의 상대경로: pd.read_excel(출장비.xlsx)
- **절대 경로:**
- 다른 컴퓨터와 파일을 공유할 때
- 경로가 변경될 가능성이 적을 때
- 스크립트가 여러 작업 디렉토리에서 실행될 때
- **상대 경로:**
- 같은 프로젝트 내에서 파일을 참조할 때
- 경로를 간단하게 작성하고 싶을 때
- 스크립트가 한 작업 디렉토리에서만 실행될 떄
그리고 실제 코딩에서
datafile = ('주소')
pd.read_excel(datafile)
와 같이 주소를 먼저 변수에 지정하고, 변수를 불러오는 것으로 작성할 수 있다.
- 3. df = pd.read_excel(datafile)
- 작업을 하기 위해서 불러온 엑셀파일 df라는 변수에 저장
- 이때 그냥 불러오면 첫 번째 열을 culmns로 인식
예시) 출장비 xlsx가 아래와 같은 경우
시내 출장비 | ||||
---|---|---|---|---|
일시 | 대상자 | 출장지 | 소요 일수 | 금액 |
2025.08.12. | 고양이 | 도넛가게 | 4시 00분 | |
2025.12.24 | 고슴도치 | 젤라또가게 | 2시 00분 |
아래와 같이 1번 째 행을 culumns로 인식해 빈 셀은 Unnamed: 나온다.
Unnamed: | Unnamed: | 시내 출장비 | Unnamed: | Unnamed: |
---|---|---|---|---|
일시 | 대상자 | 출장지 | 소요 일수 | 금액 |
2025.08.12. | 고양이 | 도넛가게 | 4시 00분 | |
2025.12.24 | 고슴도치 | 젤라또가게 | 2시 00분 |
이때 skiprows을 이용하면 n수 만큼 행을 건너 뛸 수 있다.
예시 df = pd.read_excel(datafile, skiprows=1)이라고 하면 첫 번째 행을 건너뛰고, 두 번째 행부터 읽는다.
결과
일시 | 대상자 | 출장지 | 소요 일수 | 금액 |
---|---|---|---|---|
2025.08.12. | 고양이 | 도넛가게 | 4시 00분 | |
2025.12.24 | 고슴도치 | 젤라또가게 | 2시 00분 |
pandas-핵심, indexing와 slicingd
```
'Python > 업무자동화-엑셀' 카테고리의 다른 글
02. pandas에서 데이터 프레임의 구조 (0) | 2024.04.14 |
---|