pandas에서
데이터 프레임의 구조
1. 열 이름(column names)
출장자 | 출장지 | 소요일수 | 이동수단 | 지급금액 | ◀column names | |
0 | 고양이 | 도넛가게 | 4시간 | 대중교통 | ||
1 | 고슴도치 | 젤라또가게 | 4시간 | 행정차량 | ||
2 | 다람쥐 | 도토리가게 | 2시간 | 대중교통 | ||
3 | 백룡 | 사우나 | 2시간 | 업무택시 | ||
4 | 표범 | 피자집 | 3시간 | 행정차량 | ||
※df.columns를 출력하면 '출장자', '출장지', '소요일수', '이동수단', '지급금액'이 나옴 |
2. 열(column)
▼column | ||||||
출장자 | 출장지 | 소요일수 | 이동수단 | 지급금액 | ||
0 | 고양이 | 도넛가게 | 4시간 | 대중교통 | ||
1 | 고슴도치 | 젤라또가게 | 4시간 | 행정차량 | ||
2 | 다람쥐 | 도토리가게 | 2시간 | 대중교통 | ||
3 | 백룡 | 사우나 | 2시간 | 업무택시 | ||
4 | 표범 | 피자집 | 3시간 | 행정차량 | ||
※df['출장자']를 출력하면 아래처럼 시리즈로 나옴(1차원 표) 0 고양이 1 고슴도치 2 다람쥐 3 백룡 4 표범 Name: 출장자, dtype: object |
3. Index
▼index | |||||
출장자 | 출장지 | 소요일수 | 이동수단 | 지급금액 | |
0 | 고양이 | 도넛가게 | 4시간 | 대중교통 | |
1 | 고슴도치 | 젤라또가게 | 4시간 | 행정차량 | |
2 | 다람쥐 | 도토리가게 | 2시간 | 대중교통 | |
3 | 백룡 | 사우나 | 2시간 | 업무택시 | |
4 | 표범 | 피자집 | 3시간 | 행정차량 | |
※df .index를 출력하면 index값이 나옴, 지금 데이터프레임에서는 사용자 지정 index가 아니라 기본적으로 생성된 연속적인 정수 index라 RangeIndex(start=0, stop=5, step=1)과 같이 나옴 |
4. row(행)
출장자 | 출장지 | 소요일수 | 이동수단 | 지급금액 | ||
0 | 고양이 | 도넛가게 | 4시간 | 대중교통 | ◀row | |
1 | 고슴도치 | 젤라또가게 | 4시간 | 행정차량 | ||
2 | 다람쥐 | 도토리가게 | 2시간 | 대중교통 | ||
3 | 백룡 | 사우나 | 2시간 | 업무택시 | ||
4 | 표범 | 피자집 | 3시간 | 행정차량 | ||
※ df .loc[0]를 출력하면 인덱스 0에 해당되는 행 전체가 시리즈로 나온다. 시리즈의 경우 column이 하나라서 가로,세로가 의미 없음 출장자 고양이 출장지 도넛가게 소요일수 4시간 이동수단 대중교통 지급금액 None df .loc[[0, 2, 4] ]를 출력하면 인덱스가 0,2,4인 행이 표의 형태로 나온다. 출장자 출장지 소요일수 이동수단 지급금액 0 고양이 도넛가게 4시간 대중교통 None 2 다람쥐 도토리가게 2시간 대중교통 None 4 표범 피자집 3시간 행정차량 None |
'Python > 업무자동화-엑셀' 카테고리의 다른 글
01. Pandas에서 엑셀 파일 불러오기 (0) | 2024.04.08 |
---|