본문 바로가기
데이터 분석

Pandas Series

by ma_ro 2020. 3. 1.

Series

  • ndarray를 기반으로 인덱스만 추가하여 만들어짐
  • ndarray도 인덱스가 있으나 무조건 zero 베이스 인덱스에 별도 표기 안됨
  • 그러나 Series는 인덱스를 문자열, 숫자 등등 별도 지정 가능하며, 별도 표기됨.

pd.Series(ndarray, 인덱스)

  • 인덱스 없으면 0베이스 인덱스로 표기됨

Series[인덱스]

  • ndarray 처럼 인덱스를 통해 접근 가능함
  • ndarray는 인덱스 범위를 넘어가면 에러 발생하나,
  • series는 인덱스 범위를 넘어가면 값이 추가가 됨.
  • 여기서 인덱스는 무슨 값을 넣든 넣는 순서대로 들어감.
  • 나중에 넣은 것은 나중에 출력

연산

  • 연산의 경우, 스칼라와의 연산이 가능
  • Series끼리의 연산의 경우, 맞지 않는 인덱스 값에 대해서는 NaN을 반환

행렬 인덱싱

  • Series로 인덱싱이 가능
  • 대괄호 안에 불리언 시리즈를 넣어서 인덱싱 가능
  • 결국 series는 ndarray와 거의 비슷하며 index요소가 추가되어 있을 뿐

차이점

  • 인덱스가 없을 경우, 값이 추가된다는 것
  • 인덱스가 자유롭다는 것
  • 다른 함수가 있다는 것
    • size, unique(), count(), value_counts()

NaN의 경우, np.NaN를 써서 ndarray와 series에서 모두 원소로 사용 가능

'데이터 분석' 카테고리의 다른 글

Pandas DataFrame - 데이터전처리  (0) 2020.03.01
Pandas DataFrame - CRUD  (0) 2020.03.01
Numpy Broadcasting  (0) 2020.02.29
Numpy 기본 함수  (0) 2020.02.29
Numpy ndarray shape 변경  (0) 2020.02.29

댓글