Series
- ndarray를 기반으로 인덱스만 추가하여 만들어짐
- ndarray도 인덱스가 있으나 무조건 zero 베이스 인덱스에 별도 표기 안됨
- 그러나 Series는 인덱스를 문자열, 숫자 등등 별도 지정 가능하며, 별도 표기됨.
pd.Series(ndarray, 인덱스)
- 인덱스 없으면 0베이스 인덱스로 표기됨
Series[인덱스]
- ndarray 처럼 인덱스를 통해 접근 가능함
- ndarray는 인덱스 범위를 넘어가면 에러 발생하나,
- series는 인덱스 범위를 넘어가면 값이 추가가 됨.
- 여기서 인덱스는 무슨 값을 넣든 넣는 순서대로 들어감.
- 나중에 넣은 것은 나중에 출력
연산
- 연산의 경우, 스칼라와의 연산이 가능
- Series끼리의 연산의 경우, 맞지 않는 인덱스 값에 대해서는 NaN을 반환
행렬 인덱싱
- Series로 인덱싱이 가능
- 대괄호 안에 불리언 시리즈를 넣어서 인덱싱 가능
- 결국 series는 ndarray와 거의 비슷하며 index요소가 추가되어 있을 뿐
차이점
- 인덱스가 없을 경우, 값이 추가된다는 것
- 인덱스가 자유롭다는 것
- 다른 함수가 있다는 것
- size, unique(), count(), value_counts()
NaN의 경우, np.NaN를 써서 ndarray와 series에서 모두 원소로 사용 가능
'데이터 분석' 카테고리의 다른 글
Pandas DataFrame - 데이터전처리 (0) | 2020.03.01 |
---|---|
Pandas DataFrame - CRUD (0) | 2020.03.01 |
Numpy Broadcasting (0) | 2020.02.29 |
Numpy 기본 함수 (0) | 2020.02.29 |
Numpy ndarray shape 변경 (0) | 2020.02.29 |
댓글