DataFrame 可以說是 pandas的主體,
我們可以將它視為好幾個Series集合再一起,共用相同的索引 。
DataFrame 可以完成很多方便的事情,
像是可以使用類似sql的用法,或是rolling等等。

以下會列出幾個非常實用的例子:

  • 選取特定範圍的資料:
1
data.loc[data.tx_dt > '2015-00-00',:]
  • 列出cloumns裡有出現特定字詞的資料 (正規表示式):
1
df.filter(regex='spike')
  • 將資料根據某個 key 來依序列出:
1
for key,data in data.groupby(['isin','currency']):
  • 列出dataFrame詳細資訊: (顯示平均,標準差,最小值及最大值)
1
pd.describe()
  • 匯出csv
1
df.to_csv(filename , index=False)
  • 匯入csv
1
df.read_csv(filename)
  • Concatention
1
pd.concat([df1,df2,df3],axis=1)
  • Join (df 必須先 set index)
1
df1.join(df2 , how='inner')   #how=['inner','outer','right']
  • Applying function

one parameter:

1
2
def double(x):  return x*2
df['col1'].apply(double)

two parameter:

def test(x,y): return x*y
df.apply(lambda x : test( x['A'] , x['B']), axis=1)

#or

def test(row): return row['A']*row['B']
df.apply(test, axis=1)