본문 바로가기

STUDY/EDA

[pandas] Series 기본

728x90
  • Series : 1차원 배열
  • DataFrame :2차원 배열
  •  
  • index : value 일대일 대응
  • {k:v} : 딕셔너리와 비슷한 구조

 

[딕셔너리에서 시리즈 변환 방법]

import pandas as pd

dict_data = {'a':1, 'b':2, 'c':3}
sr = pd.Series(dict_data) # 시리즈로 변환

print(type(sr))
print('\n')
print(sr)

결과

 

 

[인덱스]

  • 정수형 위치 인덱스
  • 인덱스 이름 / 인덱스 라벨
  • 인덱스 배열 : Series객체.index
  • 데이터 값 배열 : Series객체.values
import pandas as pd

list_data = ['2019-01-02', 3.14, 'ABC, 100, True]
sr = pd.Series(list_data) # 시리즈 생성
print(sr)

결과 2

sr.index # Range Index의 범위의 마지막 값은 포함되지 않음.

결과 3

sr.values

결과 4

 

 

  • 원소 선택 : 파이썬 리스트 슬라이싱 기법과 비슷
  • 정수형 위치 인덱스는 대괄호 ([])안에 위치를 나타내는 숫자 입력
  • 인덱스 이름(라벨)을 사용할 때는 대괄호([]) 안에 이름과 함께 따옴표 입력
# Series() 함수의 index 옵션에 인덱스 이름을 직접 전달 가능
tup_data = ('영인', '2010-05-01', '여', True)
sr = pd.Series(tup_data, index = ['이름', '생년월일', '성별', '학생여부'])
print(sr)
print(sr[0])
print(sr['이름'])

결과 5

print(sr[[1, 2]])
print('\n')
print(sr[['생년월일', '성별']])

결과 6

print(sr[1:2])
print('\n')
print(sr['생년월일':'성별'])

결과 7

728x90

'STUDY > EDA' 카테고리의 다른 글

[시각화 ] 여러가지 템플릿  (0) 2024.01.22