본문 바로가기
파이썬

pandas 정리

by 바나나하나 2020. 12. 10.
반응형

import pandas as pd

 

#딕셔너리로 데이터프레임 만들기

d = {'열이름1': [값1, 값2, 값3, 값4],
     '열이름2': [값1, 값2, 값3, 값4]}

data = pd.DataFrame(d, index = ['첫번째 행의 인덱스', '두번째 행의 인덱스', '3번째 행의 인덱스', '4번째 행의 인덱스'])

인덱스를 줘도 되고 안줘도 된다. 안주면 0부터 시작함

 

# 빈 데이터 프레임 만들기

data = pd.DataFrame( index=range(0, 원하는 행 갯수), column=['열이름1', '열이름2',] )  #index는 값을 주지 않아도 만들어진다.

 

# csv파일로 저장하기, #quoting 쌍따옴표 없애기

import csv

data.to_csv("test.csv", quoting=csv.QUOTE_NONE) 

 

# 행 추가하기, 인덱스 무시

data = data.append({'열이름1': '열에 들어갈 내용1', 

                           '열이름2':'열에 들어갈 내용2}, ignore_index=True)

 

# 데이터 검색

print(df[df.A > 0]) # 'A' 0     

print(df[df > 0] #   0    

print(df['E'] = ['one', 'one','two','three','four','three']) # df 'E' 

print(df[df['E'].isin(['two', 'four'])]) # 'E' 'two', 'four'    

 

예제 코드

# 빈 데이터 프레임 만들기

# 마지막 열에 리스트로 row추가 하는 코드

import pandas as pd
from numpy.random import randint

df = pd.DataFrame(columns=['Name', 'First', 'Second'])   # 빈데이터 프레임 만들기
for i in range(5):
    df.loc[i] = ['name' + str(i)] + list(randint(10, size=2))

print(df)


df.loc[df.index.max() + 1] = ['name' + str(df.index.max() + 1)] + list(randint(10, size=2))

print(df)

 

 

 

반응형

댓글