Python是當今世界*熱門的編程語言,而它*的應用領域就是使用 Pandas 數(shù)據(jù)分析,使用 Pandas 我們可以 Excel/CSV/TXT/MySQL 等數(shù)據(jù)讀取,然后進行各種清洗、過濾、透視、聚合分析,也可以直接繪制折線圖、餅圖等數(shù)據(jù)分析圖表,在功能上它能夠?qū)崿F(xiàn)自動化的對大文件處理,能夠?qū)崿F(xiàn)Excel的幾乎所有功能并且更加強大。
對數(shù)學專業(yè)的人來說,Pandas可以作為一個*的數(shù)據(jù)分析切入點。下面融躍小編為大家介紹12種用于數(shù)據(jù)分析的Pandas技巧。
1. Boolean Indexing
在表格中,如果你想根據(jù)另一列的條件篩選當前列的值,你會怎么做?舉個例子,假設我們想要一份所有未畢業(yè)但已經(jīng)辦理了貸款的女性清單,具體的操作是什么?在這種情況下,Boolean Indexing,也就是布爾索引能提供相應的功能。
2. Apply Function
Apply函數(shù)是使用數(shù)據(jù)和創(chuàng)建新變量的常用函數(shù)之一。在對DataFrame的特定行/列應用一些函數(shù)后,它會返回相應的值。這些函數(shù)既可以是默認的,也可以是用戶自定義的。
3. 替換缺失值
對于替換缺失值,fillna可以一步到位,它會用目標列的平均值/眾數(shù)/中位數(shù)更新缺失值。
4. Pivot Table
Pandas可以用來創(chuàng)建MS Excel樣式數(shù)據(jù)透視表(Pivot Table)。
5. Multi-Indexing
如果你仔細觀察了“替換缺失值”那一節(jié)的輸出,你可能會發(fā)現(xiàn)一個奇怪的現(xiàn)象,就是每個索引都由3個值組合而成。這被稱為多重索引(Multi-Indexing),它有助于操作的快速執(zhí)行。
注:
多索引需要元組來定義loc語句中的索引組。這是一個在函數(shù)中要用到的元組。
values [0]的后綴是必需的,因為默認情況下返回的值與DataFrame的值不匹配。在這種情況下,直接分配會出現(xiàn)錯誤。
6. Crosstab
這個函數(shù)可以被用來塑造對數(shù)據(jù)的初始“感覺(概覽)”,通俗地講,就是我們可以驗證一些基本假設。如在貸款案例中,“Credit_History”是否會影響個人貸款成功?這可以用交叉表(Crosstab)測試,
7. 合并DataFrame
當我們需要將來自不同來源的信息進行整合時,合并DataFrame(或者你們愛說數(shù)據(jù)框)就變得很重要了。
8. DataFrame排序
Pandas可以輕松基于多列進行排序。
9. 繪圖(Boxplot和直方圖)
很多人可能不知道自己能直接在Pandas里繪制盒形圖和直方圖,無需單獨調(diào)用matplotlib,一行命令就能搞定。
10. Cut function for binning
有時候聚類后的數(shù)據(jù)會更有意義。以今天*近車禍頻發(fā)的自動駕駛汽車為例,如果我們要用它捕獲的數(shù)據(jù)重現(xiàn)某條路上的交通情況,比起一整天的流暢數(shù)據(jù),或是把一天均勻分割為24個小時,“早上”“下午”“晚上”“夜晚”“深夜”這幾個關鍵時段的數(shù)據(jù)包含的信息量更多,也更有效。
11. 為nominal數(shù)據(jù)編碼
有時候我們需要對稱名數(shù)據(jù)(nominal數(shù)據(jù))重新分類,這可能是由于各種原因造成的:一些算法(如Logistic回歸)要求所有輸入都是數(shù)字,所以我們要把稱名變量重新編碼為0,1 ...(n-1)。
有時一個類別可能包含多種表達,如“溫度”可以被記錄為“High”“Medium”“Low”“H”“l(fā)ow”,其中“High”和“H”是一碼事,“Low”和“l(fā)ow”也是一碼事,但Python會認為它們是不同的。有些類別的頻數(shù)*低,所以我們應該把它們合并起來。
為了解決這個問題,這里我們定義了一個簡單的函數(shù),它把輸入作為“字典”,然后調(diào)用Pandas的replace函數(shù)重新編碼。
12. 迭代dataframe的行
這不是一個常用的技巧,但如果遇到這種問題,相信沒人想到時候再絞盡腦汁想辦法,或者直接自暴自棄用for循環(huán)遍歷所有行。這里我們舉兩個要用到這種方法的場景:當帶有數(shù)字的nominal variable被當成數(shù)字。當某一行帶有字符(因為數(shù)據(jù)錯誤)的Numeric variable被當成分類。這時我們就要手動定義列的類別。雖然很麻煩,但這之后如果我們再檢查數(shù)據(jù)類別。
數(shù)據(jù)分析是一個很熱門*有價值的職場技能,學會了 Pandas 會*大的助力你的職業(yè)生涯。
- 報考條件
- 報名時間
- 報名費用
- 考試科目
- 考試時間
-
GARP對于FRM報考條件的規(guī)定:
What qualifications do I need to register for the FRM Program?
There are no educational or professional prerequisites needed toregister.
翻譯為:報名FRM考試沒有任何學歷或?qū)I(yè)的先決條件。
可以理解為,報名FRM考試沒有任何的學歷和專業(yè)的要求,只要是你想考,都可以報名的。查看完整內(nèi)容 -
2024年5月FRM考試報名時間為:
早鳥價報名階段:2023年12月1日-2024年1月31日。
標準價報名階段:2024年2月1日-2024年3月31日。2024年8月FRM考試報名時間為:
早鳥價報名階段:2024年3月1日-2024年4月30日。
標準價報名階段:2024年5月1日-2024年6月30日。2024年11月FRM考試報名時間為:
早鳥價報名時間:2024年5月1日-2024年7月31日。
標準價報名時間:2024年8月1日-2024年9月30日。查看完整內(nèi)容 -
2023年GARP協(xié)會對FRM的各級考試報名的費用作出了修改:將原先早報階段考試費從$550上漲至$600,標準階段考試費從$750上漲至$800。費用分為:
注冊費:$ 400 USD;
考試費:$ 600 USD(第一階段)or $ 800 USD(第二階段);
場地費:$ 40 USD(大陸考生每次參加FRM考試都需繳納場地費);
數(shù)據(jù)費:$ 10 USD(只收取一次);
首次注冊的考生費用為(注冊費 + 考試費 + 場地費 + 數(shù)據(jù)費)= $1050 or $1250 USD。
非首次注冊的考生費用為(考試費 + 場地費) = $640 or $840 USD。查看完整內(nèi)容 -
FRM考試共兩級,F(xiàn)RM一級四門科目,F(xiàn)RM二級六門科目;具體科目及占比如下:
FRM一級(共四門科目)
1、Foundations of Risk Management風險管理基礎(大約占20%)
2、Quantitative Analysis數(shù)量分析(大約占20%)
3、Valuation and Risk Models估值與風險建模(大約占30%)
4、Financial Markets and Products金融市場與金融產(chǎn)品(大約占30%)
FRM二級(共六門科目)
1、Market Risk Measurement and Management市場風險管理與測量(大約占20%)
2、Credit Risk Measurement and Management信用風險管理與測量(大約占20%)
3、Operational and Integrated Risk Management操作及綜合風險管理(大約占20%)
4、Liquidity and Treasury Risk Measurement and Management 流動性風險管理(大約占15%)
5、Risk Management and Investment Management投資風險管理(大約占15%)
6、Current Issues in Financial Markets金融市場前沿話題(大約占10%)查看完整內(nèi)容 -
2024年FRM考試時間安排如下:
FRM一級考試:
2024年5月4日-5月17日;
2024年8月3日(周六)上午;
2024年11月2日-11月15日。FRM二級考試:
2024年5月18日-5月24日;
2024年8月3月(周六)下午;
2024年11月16日-11月22日。查看完整內(nèi)容
-
中文名
金融風險管理師
-
持證人數(shù)
25000(中國)
-
外文名
FRM(Financial Risk Manager)
-
考試等級
FRM考試共分為兩級考試
-
考試時間
5月、8月、11月
-
報名時間
5月考試(12月1日-3月31日)
8月考試(3月1日-6月30日)
11月考試(5月1日-9月30日)