在IMA雜志中,有篇文章論述的是關(guān)于數(shù)據(jù)偏見對多樣化與包容性的影響,觀后小躍君感觸很深,今天就和大家分享一下吧。
多樣化與包容性日益受到人們的關(guān)注,且已然成為社交媒體和新聞討論的焦點(diǎn)。在各類企業(yè)與組織收集、分析和運(yùn)用數(shù)據(jù)驅(qū)動決策的同時,多樣化與包容性也是高管和董事會討論的中心議題。
然而在此過程中有一個后果經(jīng)常被忽視,那就是可能會對多樣化與包容性產(chǎn)生負(fù)面影響的數(shù)據(jù)偏見。財(cái)會專業(yè)人士與所有行業(yè)的企業(yè)專業(yè)人士,都有責(zé)任確保以推動無偏見決策的方式來使用數(shù)據(jù)。
首先我們先來了解一下何為數(shù)據(jù)偏見,偏見的英文“bias”由法語biais衍生而來,本義是指一條斜線或者與水平線的偏離,常常用來形容對特定人群的系統(tǒng)性偏好。數(shù)據(jù)偏見是一種風(fēng)險,即會影響一個人基于數(shù)據(jù)的決策,而這些數(shù)據(jù)更有利或更不利于某一特定人群。
那么,為什么會出現(xiàn)數(shù)據(jù)偏見呢?
數(shù)據(jù)偏見雖然有多種不同類型,但兩種*常見的類型是選擇偏見(selection bias)與預(yù)帶偏見的偏見(prejudicebias)。
當(dāng)選擇的數(shù)據(jù)因缺乏必要的隨機(jī)性而不能公正地代表整體時,就出現(xiàn)了選擇偏見。預(yù)帶偏見的偏見因自動化偏見所致,依照M.L.Cummings的定義,自動化偏見是“依據(jù)計(jì)算機(jī)生成的、被認(rèn)為是正確的解決方案,而忽視或不再搜尋矛盾信息的一種傾向”(bit.ly/37pjrfT)。
數(shù)據(jù)生命周期
偏見可能發(fā)生在數(shù)據(jù)生命周期的不同階段。例如,數(shù)據(jù)偏見可能會因設(shè)計(jì)師或開發(fā)者有意識或無意識的偏見而產(chǎn)生,也可能會因所使用的數(shù)據(jù)集本身存在偏見而導(dǎo)致。在另一些例子中,數(shù)據(jù)集并沒有明顯的偏見,但在其選擇或重點(diǎn)方面卻有失公允。
數(shù)據(jù)生命周期涉及以下幾個階段:
1.數(shù)據(jù)采集是企業(yè)運(yùn)用數(shù)據(jù)的*步,即通過數(shù)據(jù)輸入或經(jīng)由數(shù)據(jù)入口、連接設(shè)備或物聯(lián)網(wǎng)獲取數(shù)據(jù)。
2.數(shù)據(jù)維護(hù)是使用一組預(yù)定義的規(guī)則來轉(zhuǎn)換并運(yùn)用數(shù)據(jù),評估數(shù)據(jù)的質(zhì)量及完整性。
3.數(shù)據(jù)合成通常稱為“分析建模”,通過運(yùn)用邏輯或使用其他數(shù)據(jù)輸入來合成數(shù)據(jù),創(chuàng)造更多價值。
4.數(shù)據(jù)運(yùn)用是將轉(zhuǎn)換后的數(shù)據(jù)應(yīng)用到內(nèi)部管理報(bào)告中,幫助企業(yè)做出良好的商業(yè)決策。
5.數(shù)據(jù)發(fā)布是創(chuàng)建外部報(bào)告,并向企業(yè)外部發(fā)布信息。
6.數(shù)據(jù)歸檔將處于主動狀態(tài)的數(shù)據(jù)轉(zhuǎn)換為被動狀態(tài),以便根據(jù)需要對其進(jìn)行檢索和再利用。
7.數(shù)據(jù)清除是從企業(yè)中刪除數(shù)據(jù)(及其拷貝)。
這一數(shù)據(jù)生命周期可在產(chǎn)生偏向性結(jié)果之前指導(dǎo)專業(yè)人員識別并減少數(shù)據(jù)偏見。前文提到的亞馬遜公司案例發(fā)生在數(shù)據(jù)采集和數(shù)據(jù)維護(hù)階段,因?yàn)樵摂?shù)據(jù)采集了過去10年間投遞給該公司的大量簡歷,其中大多數(shù)來自于男性。而COMPAS則是在數(shù)據(jù)運(yùn)用階段出現(xiàn)的偏見,開發(fā)該系統(tǒng)的Northpointe公司運(yùn)用了一種由增加假負(fù)例(即被不公正地歸類為可能再次犯罪的人)來優(yōu)化真正例(即*有可能再次犯罪的人)的邏輯。
盡可能減少數(shù)據(jù)偏見
要減少有偏見的結(jié)果以及更好地進(jìn)行決策,擁有公正無偏見的數(shù)據(jù)是必要條件。所以,企業(yè)應(yīng)當(dāng)在數(shù)據(jù)生命周期的早期階段采集更具多樣化和包容性的數(shù)據(jù)集,并審查數(shù)據(jù)的質(zhì)量。
那些希望減少使用帶偏見數(shù)據(jù)的企業(yè)應(yīng)當(dāng):
1.擁有更多樣化的員工隊(duì)伍,使公司能夠預(yù)測、發(fā)現(xiàn)和審查不公平的偏見問題,更好地融入易受偏見影響的社區(qū)。
2.接收多樣化人群對結(jié)果的反饋,以便在采集到的數(shù)據(jù)中更好地發(fā)現(xiàn)那些未意識到的偏見。多樣化人群有助于減少數(shù)據(jù)生命周期中的偏見,從而*終減少帶偏見的結(jié)果。
大數(shù)據(jù)在快速促進(jìn)社會進(jìn)步。然而,隨著科技的飛速發(fā)展,正確使用數(shù)據(jù)的責(zé)任也越來越大。
企業(yè)日益希望更多地使用大型數(shù)據(jù)集和自動化系統(tǒng)來改進(jìn)工作流程,因此,審查數(shù)據(jù)采集方式并積*減少偏見也變得越來越重要。這首先需要在招聘中運(yùn)用*實(shí)踐,以確保分派到項(xiàng)目的團(tuán)隊(duì)盡可能具有多樣化和包容性,并得到了解數(shù)據(jù)偏見相關(guān)風(fēng)險的管理層自上而下的支持。我們鼓勵采取綜合性的方法,就偏見的類型與減少偏見的*實(shí)踐進(jìn)行定期交流與持續(xù)教育。
隨著社會在科技方面不斷進(jìn)步,我們需要記住的是,技術(shù)無法基于有偏見的數(shù)據(jù)產(chǎn)出無偏見的結(jié)果,它理應(yīng)用來減少而非增加人類的偏見。
免責(zé)聲明:本文來自IMA雜志,轉(zhuǎn)載目的重在分享,如有侵權(quán)請及時聯(lián)系刪除
找組織
-
微信掃碼關(guān)注公眾號
CMA學(xué)習(xí)交流群