做大數據分析的怎麼可以不會這個?

《做大數據分析的怎麼可以不會這個?》
Overview:
0 引言
1 環境
2 模塊準備
3 實現思路
4 小試牛刀
5 中試牛刀
6 總結

0 引言

詞雲圖,也叫文字雲,是對文本中出現頻率較高的“關鍵詞”予以視覺化的展現,詞雲圖過濾掉大量的低頻低質的文本信息,使得瀏覽者只要一眼掃過文本就可領略文章的主旨。

1 環境

操作系統:Windows

Python版本:3.7.2

2 模塊準備

本文涉及到的Python第三方模塊,共計四個:分詞模塊jieba,文字雲模塊wordcloud,畫圖模塊matplotlib,用來處理背景圖片的模塊scipy。這些模塊均可通過pip方式進行安裝:
《做大數據分析的怎麼可以不會這個?》

模塊的導入:
《做大數據分析的怎麼可以不會這個?》

3 實現思路

準備好一份自己需要分析的文本材料,這裏選用的是19年兩會新鮮出爐的政府工作報告。我們首先得通過jieba模塊對文本材料進行分詞處理,然後對處理后的材料使用wordcloud文字雲模塊生成相應的詞雲圖片即可。

當然了你可以選擇一個背景圖片,並以此為基礎生成特定的雲圖,這時就用到了上面提到的另外兩個模塊scipy和matplotlib。

好了,思路有了,那就開始實踐吧~

4 小試牛刀

小試牛刀章節教你僅用9行代碼,來生成一個詞雲圖,先欣賞下最終的效果圖。

4.1 效果圖

《做大數據分析的怎麼可以不會這個?》

4.2 代碼實現

製作雲圖的思路,上文已作說明,這些就不再贅述了,直接看代碼,代碼中已添加詳細註釋說明。
《做大數據分析的怎麼可以不會這個?》
除去註釋、導入模塊佔用的兩行,剩下僅7行的代碼,你來說說Python強大不?

小試牛刀不夠牛?上面做出的雲圖不夠完美?那就繼續看下去,這裏來實現一個定製圖案的雲圖。

5 中試牛刀

我們這裡有一張祖國地圖,是否可以定製生成一個祖國版圖樣式的詞雲圖呢?
《做大數據分析的怎麼可以不會這個?》
答案是肯定的,只因為Python太強大,實現思路直接看代碼。

5.1 代碼實現

《做大數據分析的怎麼可以不會這個?》
《做大數據分析的怎麼可以不會這個?》

5.2 效果圖

《做大數據分析的怎麼可以不會這個?》

6 總結

是不是又被強大的Python給震撼了?如引言所述,通過生成詞雲圖,對文章中出現頻率較高的“關鍵詞”予以視覺化的展現,幫助讀者快速領略文章的主旨,既方便又高效!

不過呢,不要高興地太早,這裏給大家暗暗地埋了幾顆雷,詞雲圖功能強大實用自不必說,但是若想正常的用起來,除了上面提到的在安裝wordcloud模塊時會遇到麻煩之外,還有更多的麻煩在等着大家。請關注後續Python排錯集的系列文章。

關注公眾號「Python專欄」,後台回復:zsxq09,獲取本文全套代碼

点赞

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *