import pandas as pd
#딕셔너리로 데이터프레임 만들기
d = {'열이름1': [값1, 값2, 값3, 값4],
'열이름2': [값1, 값2, 값3, 값4]}
data = pd.DataFrame(d, index = ['첫번째 행의 인덱스', '두번째 행의 인덱스', '3번째 행의 인덱스', '4번째 행의 인덱스'])
인덱스를 줘도 되고 안줘도 된다. 안주면 0부터 시작함
# 빈 데이터 프레임 만들기
data = pd.DataFrame( index=range(0, 원하는 행 갯수), column=['열이름1', '열이름2',] ) #index는 값을 주지 않아도 만들어진다.
# csv파일로 저장하기, #quoting 쌍따옴표 없애기
import csv
data.to_csv("test.csv", quoting=csv.QUOTE_NONE)
# 행 추가하기, 인덱스 무시
data = data.append({'열이름1': '열에 들어갈 내용1',
'열이름2':'열에 들어갈 내용2}, ignore_index=True)
# 데이터 검색
print(df[df.A > 0]) # 'A'열에서 0보다 큰 값을 가진 행 출력
print(df[df > 0] # 전체 열에서 0이상의 값을 가진 행 출력
print(df['E'] = ['one', 'one','two','three','four','three']) # df에 'E'열 추가
print(df[df['E'].isin(['two', 'four'])]) # 'E'열에서 'two', 'four'을 가지고 있는 행 출력
예제 코드
# 빈 데이터 프레임 만들기
# 마지막 열에 리스트로 row추가 하는 코드
import pandas as pd
from numpy.random import randint
df = pd.DataFrame(columns=['Name', 'First', 'Second']) # 빈데이터 프레임 만들기
for i in range(5):
df.loc[i] = ['name' + str(i)] + list(randint(10, size=2))
print(df)
df.loc[df.index.max() + 1] = ['name' + str(df.index.max() + 1)] + list(randint(10, size=2))
print(df)
댓글