Wunoodles web

MinYen Taiwan
" I'm a slow walker, but I never walk backwards. -- US President Lincoln "

Profile github Follow me

26Feb

python資料分析的好套件: Pandas
2019/02/26

DataFrame 可以說是 pandas的主體，
我們可以將它視為好幾個Series集合再一起，共用相同的索引。
DataFrame 可以完成很多方便的事情，
像是可以使用類似sql的用法，或是rolling等等。

以下會列出幾個非常實用的例子:

選取特定範圍的資料:

1	data.loc[data.tx_dt > '2015-00-00',:]

列出cloumns裡有出現特定字詞的資料 (正規表示式):

1	df.filter(regex='spike')

將資料根據某個 key 來依序列出:

1	for key,data in data.groupby(['isin','currency']):

列出dataFrame詳細資訊: (顯示平均，標準差，最小值及最大值)

1	pd.describe()

匯出csv

1	df.to_csv(filename , index=False)

匯入csv

1	df.read_csv(filename)

Concatention

1	pd.concat([df1,df2,df3],axis=1)

Join (df 必須先 set index)

1	df1.join(df2 , how='inner') #how=['inner','outer','right']

Applying function

one parameter:

1 2	def double(x): return x*2 df['col1'].apply(double)

two parameter:

def test(x,y): return x*y
df.apply(lambda x : test( x['A'] , x['B']), axis=1)

#or

def test(row): return row['A']*row['B']
df.apply(test, axis=1)