python在數據分析,科學計算方面有幾個很重要的庫,分別是pandas,numpy,matplotlib。

剛剛開始接觸,就把自己看的代碼貼上來。

demo1:使用matplotlib 畫一個圖
import matplotlib.pyplot as plt

#x,y 分別表示的是橫坐標和縱坐標
x = [2,3,4,5,6,7]
y = [1,2,1,2,1,2]

plt.plot(x,y)
plt.show()

image.png
demo2:使用pandas 讀取excel文件

前幾天在處理數據的時候,遇到這個問題。問題是:有一個excel文件,裏面存放的是某一個路口每分鐘通過的車流量。


image.png

現在要分析的是,車流量(vol)和時間的關係是什麼?

import pandas as pd
#import numpy as np
import matplotlib.pyplot as plt

path="1.xls"
df=pd.read_excel(path)
#print (df.head())
#print (df['speed'])
#print (df['vol'])

#plt.plot(df['time'],df['vol'])
plt.plot(df['time'],df['vol'],'.')
plt.show()

""" # 測試代碼 
print (df['speed'][1])
print (type(df['speed'][1]))
print (type (df['vol'][1]))
x=[]
y=[]
for i in range(0,10):
    x.append(df['vol'][i])
    y.append(df['speed'][i])
plt.plot(x,y)
plt.show()
"""

運行結果:


2017-05-24 09-17-43屏幕截圖.png

車流量基本上服從泊松分佈。
源碼:https://github.com/zhaozhengcoder/Python/tree/master/Data%20analysis

分享