現(xiàn)在的 Python 科學(xué)棧*成熟,里面有各種用途的數(shù)據(jù)庫,包括機(jī)器學(xué)習(xí)和數(shù)據(jù)分析。數(shù)據(jù)可視化是數(shù)據(jù)分析流程中的一個(gè)重要部分。Python中除了matplotlib外還有哪些數(shù)據(jù)可視化的庫?

過去幾年,出現(xiàn)了許多新的用于可視化數(shù)據(jù)的 Python 庫。在這些庫里面,用的*廣泛的是 matplotlib,但也有一些庫,如 vispy,bokeh,seaborn,pygal,folium 和 networkx,它們大都建立在 matplotlib 上,有些還具有 matplotlib 所不支持的功能。

1. 基礎(chǔ)2D及3D可視化

matplotlib:基于matlib開發(fā)的歷史*久的python繪圖包。功能強(qiáng)大。其具體架構(gòu)可以參考鏈接。

seaborn:是基于matplotlib進(jìn)行*封裝之后的結(jié)果,語法更簡(jiǎn)單,但是功能相對(duì)不如matplotlib。seaborn更多針對(duì)統(tǒng)計(jì)學(xué)領(lǐng)域。

2.交互信息可視化數(shù)據(jù)分析的一個(gè)業(yè)務(wù)場(chǎng)景就是用數(shù)據(jù)講故事,交互信息可視化的工具就在此凸顯出了優(yōu)勢(shì)。

Bokeh: 是一個(gè)用于做瀏覽器端交互可視化的庫,實(shí)現(xiàn)分析師與數(shù)據(jù)的交互。

Pyecharts

圖片源于網(wǎng)絡(luò):侵刪

Plotly: 同樣也是做交互可視化的一把利器。Plotly同時(shí)支持Python和R語言,并且實(shí)現(xiàn)了在線導(dǎo)入數(shù)據(jù)做可視化并保存內(nèi)容在云端server的功能。做演示的時(shí)候,只需要在本地的jupyter notebook與plotly server建立通信,即可調(diào)用已經(jīng)做好的可視化內(nèi)容做展示。Plotly同時(shí)有freemium和premium兩種賬戶,免費(fèi)賬戶已經(jīng)可以滿足基本需要。

Pyecharts

                                                           圖片源于網(wǎng)絡(luò):侵刪

此外,作為數(shù)據(jù)分析師,一個(gè)重要的工作場(chǎng)景就是為業(yè)務(wù)團(tuán)隊(duì)建立dashboard,plotly強(qiáng)大的交互功能得到了淋漓盡致的體現(xiàn)。

Pyecharts 是基于百度echarts的一個(gè)開源項(xiàng)目,也是我目前接觸到的*容易實(shí)現(xiàn)交互可視化的工具,相比bokeh和plotly,pyecharts的語法更簡(jiǎn)單,實(shí)現(xiàn)效果更佳出眾。

Pyecharts

                                                            圖片源于網(wǎng)絡(luò):侵刪

3. 地圖可視化地理信息數(shù)據(jù)也會(huì)是部分?jǐn)?shù)據(jù)分析師的業(yè)務(wù)場(chǎng)景。對(duì)于這類數(shù)據(jù),可能傳統(tǒng)的matplotlib/seaborn,交互屬性的bokeh/plotly無法很好地對(duì)這類數(shù)據(jù)進(jìn)行處理。我們需要使用處理地理數(shù)據(jù)引擎更強(qiáng)的可視化工具庫。

Mapbox

Mapbox

                                              圖片源于網(wǎng)絡(luò):侵刪

Geoplotlib

Geoplotlib

                                    圖片源于網(wǎng)絡(luò):侵刪

Python可視化的庫還有很多,熟練掌握matplotlib和seaborn,針對(duì)具體業(yè)務(wù)用好plotly和bokeh足以從容面對(duì)大多數(shù)的數(shù)據(jù)分析場(chǎng)景。