판다스 4

Pandas: 넘파이(Numpy) where() 함수 Pandas에서 사용하기

넘파이(Numpy)에서 if-else 로직을 이용하여 배열(array)에 빠르게 값을 업데이트할 수 있었다. 예를 들어, 아래코드와 같이 넘파이(Numpy) where() 함수를 사용하여 배열(array)을 업데이트한다. import numpy as np #Numpy 배열 값 x = np.arraY([1,3,3,6,7,9]) #새로운 값 배열에 넣기 x = np.where((x 8), x/2, x) #새로운 배열 값 보기 array([0.5, 1.5, 1.5, 6. , 7. , 4.5]) If, 기존 배열에 값이 5보다 작거나 8보다 크면, 그 값을 2로 나눈 값을 새로 저장한다. Else, 나머지는 그대로 둔다. 판다스 데이터 프레임(pandas DataFrame)에서도 판다스(p..

Pandas: 문자열에서 판다스 데이터프레임(pandas DataFrame) 생성하기

문자열(string)에서 아래 간단한 코드로 판다스 데이터프레임을 생성할 수 있다. import pandas as pd import io df = pd.read_csv(io.StringIO(string_data),sep=",") 위의 문법은 'string_data'라는 문자열에서 입력된 값(value)으로 판다스 데이터프레임을 생성한다. 아래 예시에서 어떻게 문법을 사용하는 지 알아본다. 예시 1: 콤마로 문자열 값 나눠 데이터 프레임 생성하기 아래 코드에서 문자열(string)에 입력된 값으로부터 어떻게 ','로 구분하여 판다스 데이터프레임을 생성하는지 보여 준다. import pandas as pd import io #define string string_data="""points, assists, ..

[기본 함수] 두 개의 데이터프레임 쌓기

두 개 이상의 pandas DataFrame을 겹치고 싶을 때 concat() 함수로 쉽게 할 수 있다. 이번 페이지에서 cocnat() 여러 가지 활용 예시를 본다 예시 1: 두 개의 pandas DataFrame 쌓기 예시 2: 세 개의 Panda DataFrame 쌓기 ignore_index=True 의미 pd.concat([df1, df2, df3,..], ignore_index =True) 하지 않으면 이전 데이터에 있던 인덱스(index)를 그대로 가져온다. 그렇기 때문에 특별하게 인덱스를 유지해야 하는 경우가 아니라면 'ignore_index = True' 옵션을 추가한다.

[DataFrame] 열(column)합계 계산하기

sum() sum() 함수를 이용해서 판 다스(pandas)에서 열에 합계를 계산한다. 몇 가지 예시를 보여준다. 예시1: df 프래임을 만들었다. rating, points, assist, rebounds열로 구성돼있다. df ['point']. sum() df ['rebounds']. sum()으로 열 하나에 합계를 구할 수 있다. 예시 2: 두 개 열 합찾기 df[['rebounds', 'points']]. sum()로 두열에 합창을 수 있다. 예시 3: 모든 열에 합찾기 df.sum()으로 모든 열에 합을 찾을 수 있다. 숫자를 포함하지 않은 열에 sum() 함수를 사용하면 예상치 못한 결과를 초례할 수도 있다. sum() 함수에 추가사항은 여기서. pandas.pydata.org/pandas-d..