Machine learning 中的 validation sample 是屬于in-sample 還是 out-of-sample 呀?在CFA考試中很多人在問(wèn)這個(gè)問(wèn)題,今天小編給你說(shuō)說(shuō)!

機(jī)器學(xué)習(xí)(Machine Learning),是研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類(lèi)的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。

machine learning機(jī)器學(xué)習(xí),就是把收集到的數(shù)據(jù)分成兩組,一組叫training sample,另一組是validation sample。具體是說(shuō),把training sample的數(shù)據(jù)喂(feed)給電腦,讓它自己識(shí)別學(xué)習(xí),總結(jié)出一套規(guī)律算法。

然后用總結(jié)出的算法放到 validation sample (驗(yàn)證樣本)中檢驗(yàn),看規(guī)律是否成立。

機(jī)器學(xué)習(xí)分為兩種 ,一種是supervised,也就是labeled traning data,就是事先認(rèn)為的給出一些label,比如檢驗(yàn)桃子和蘋(píng)果混合在一起,人為事先給出 檢測(cè)表面有沒(méi)有毛,果實(shí)硬度 這些label讓機(jī)器檢驗(yàn);另一種是unsupervised,也就是not labeled,機(jī)器自己總結(jié)特點(diǎn)規(guī)律,比如實(shí)際中 銀行反洗錢(qián),和垃圾郵件,都是機(jī)器自己識(shí)別,人類(lèi)沒(méi)有給label,此外 機(jī)器學(xué)習(xí)的考點(diǎn)還有,需要人類(lèi)的主觀判斷,會(huì)出現(xiàn)overfitting問(wèn)題,以及暗箱操作(black box)。


然后問(wèn)的 in sample 還是out of sample 中的sample是指training sample 所以 validationout of sample ,所以說(shuō)它就是out-of-sample,如果你在備考中有很多的不懂的知識(shí),可以跟著一起學(xué)習(xí)哦!