亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.430618.com 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

最近一直在想怎么分析一下個人的行程數據,看看能夠從行程數據里面分析出點什么來。最開始我的期望還是蠻高的,有如下的一些預期:

 

  • 根據出行時間范圍,可以基本確定他的生活節奏,工作強度

  • 能夠通過行程時間范圍來猜測汽車尾號

  • 根據出行的耗時歷史來建議出行時間

 

如果能夠分析得到這些信息,感覺還是蠻有意思的,于是開始自己動手,第一個問題就是數據源,導航軟件目前還不提供行程數據的導出,所以我是把7-8兩個月的行程數據逐個照著導航行程整理出來了,大體的數據情況還可以,不過其中有些數據做了額外處理,比如時間的處理,因為是如果是7:15,那么按照數字化顯示就不能是7.15,而更合理的顯示是7.4,還有行程時間,比如1:30,是需要統一按照分鐘90分鐘來整合的,整理后得到的數據如下:

使用Python可視化圖表分析行程數據

首先我按照時間做了對行程的耗時做了分析,結果發現這個數據似乎不大理想,本來預期是比較穩定的,還打算按照這個數據做下預測。

使用Python可視化圖表分析行程數據

這種情況下就得換一個思路了,先看看數據的整體分布,使用條形圖其實是不好體現數據的分布情況,因為有些行程之間是沒有直接關聯的,比如早上和晚上的行程,因為時間的差異,條形圖的模式反而會有很大的抖動。

如下是按照行程的耗時分布圖:

使用Python可視化圖表分析行程數據

如下是行程出發時間的分布情況,基本上來說都是在6:30~7:00之間開始出發,晚上基本在20:00左右返程。

使用Python可視化圖表分析行程數據

如下是按照周一到周日的行程耗時分布,可以明顯看到周二的行程分布要少很多,還不如周六,周日的多,所以從這一點是可以猜出來很可能是因為限號。

使用Python可視化圖表分析行程數據

當然前面提到了兩個指標,一個是行程耗時,一個是出發時間,還有一個是路程,因為路程和耗時兩者是有一定關聯,但是折算下來一個折中的指標就是平均速度。所以按照平均速度的分布情況來看,周一和周五是最堵的,相對周四和周六是最通暢的。

使用Python可視化圖表分析行程數據

我們區別于一般的可視化,引入箱線圖,可以看到平均行程的耗時在45分鐘左右,區間基本在30-60分鐘之間。

使用Python可視化圖表分析行程數據

其實數據分析到了這里,還是有很大差異的,雖然或多或少的分析出來了一些內容,但是有些指標還是沒有充分使用到,而且顯示的指標情況還是不夠清晰,所以打算使用seaborn進一步做下調整。

如下是行程距離,行程耗時和星期數的綜合分布圖。

使用Python可視化圖表分析行程數據

如下是星期和行程耗時的分布圖,相比之前的分布圖來說會更加清晰一些。

使用Python可視化圖表分析行程數據

我們繼續引入平均速度,出發時間和星期數進行關聯,可以看到整個行程會有明顯的分水嶺,早間和晚間基本堵是工作日,而其他的時間基本都是周末。

使用Python可視化圖表分析行程數據

而要進一步探索這些數據指標間的關聯,就需要引入略復雜的圖PairGrid,可以把多個指標都放入,可以生成多個維度的分布圖。

使用Python可視化圖表分析行程數據

接下來需要對數據的指標情況進一步分析,引入檢驗和預測的功能。

分享到:
標簽:數據
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定