pandas 정리

import pandas as pd

#딕셔너리로 데이터프레임 만들기

d = {'열이름1': [값1, 값2, 값3, 값4],
'열이름2': [값1, 값2, 값3, 값4]}

data = pd.DataFrame(d, index = ['첫번째 행의 인덱스', '두번째 행의 인덱스', '3번째 행의 인덱스', '4번째 행의 인덱스'])

인덱스를 줘도 되고 안줘도 된다. 안주면 0부터 시작함

# 빈 데이터 프레임 만들기

data = pd.DataFrame( index=range(0, 원하는 행 갯수), column=['열이름1', '열이름2',] ) #index는 값을 주지 않아도 만들어진다.

# csv파일로 저장하기, #quoting 쌍따옴표 없애기

import csv

data.to_csv("test.csv", quoting=csv.QUOTE_NONE)

# 행 추가하기, 인덱스 무시

data = data.append({'열이름1': '열에 들어갈 내용1',

'열이름2':'열에 들어갈 내용2}, ignore_index=True)

# 데이터 검색

print(df[df.A > 0]) # 'A'열에서 0보다 큰 값을 가진 행 출력

print(df[df > 0] # 전체 열에서 0이상의 값을 가진 행 출력

print(df['E'] = ['one', 'one','two','three','four','three']) # df에 'E'열 추가

print(df[df['E'].isin(['two', 'four'])]) # 'E'열에서 'two', 'four'을 가지고 있는 행 출력

예제 코드

# 빈 데이터 프레임 만들기

# 마지막 열에 리스트로 row추가 하는 코드

import pandas as pd
from numpy.random import randint

df = pd.DataFrame(columns=['Name', 'First', 'Second']) # 빈데이터 프레임 만들기
for i in range(5):
df.loc[i] = ['name' + str(i)] + list(randint(10, size=2))

print(df)

df.loc[df.index.max() + 1] = ['name' + str(df.index.max() + 1)] + list(randint(10, size=2))

print(df)

LAB

pandas 정리

예제 코드

댓글

티스토리툴바

pandas 정리

예제 코드

관련글

댓글

티스토리툴바