在對數(shù)據(jù)進(jìn)行初始分析以后,下一步是確定句是否為干凈的。很多情況下,數(shù)據(jù)可能會具有未知的值,這些值可能不會添加有用的信息,或者可能具有不想在分析時(shí)予以考慮的離群值。需要對此類監(jiān)控?cái)?shù)據(jù)進(jìn)行清理以便具有一個(gè)良好的挖掘模型。通常情況下,監(jiān)控?cái)?shù)據(jù)挖掘模型創(chuàng)建要求某一列中的數(shù)據(jù)是一致的。劣種的每一個(gè)非重復(fù)值都有獨(dú)特的一樣,一次應(yīng)該檢查每一列,以確保不存在多個(gè)相同含義的值??梢允褂弥匦聵?biāo)記向?qū)Э焖俑骋涣兄械倪@種不一致問題。另一個(gè)典型的應(yīng)用場景是,某一列中具有很多不同的值,但可以將這些值匯總為較少的值。例如,Marital Status列可能具有Single、Divorced、Widowed以及其他值。
Clean Data組提供了兩個(gè)向?qū)?,分別稱為離群值和重新標(biāo)記。離群值向?qū)Э梢詭椭銠z測某個(gè)特定列中的離群值并將其刪除,而重新標(biāo)記向?qū)箍梢暂p松地將某一列中的數(shù)據(jù)更改為所需的值。為了了解這些向?qū)?,首先請?jiān)谝褂玫谋碇羞M(jìn)行一些更改。若要開始,請?jiān)赟ource Data工作表中將單元格F4和F13更改為Some College。
可以通過多種方式來檢測在Excel工作表中的不同位置輸入的具有重復(fù)意義的值。一種方法是使某個(gè)列標(biāo)題上的篩選控件向下。如果對Education列執(zhí)行此操作,可以看到Partial College和Some College,它們具有相同的含義?,F(xiàn)在,可以使用清理監(jiān)控?cái)?shù)據(jù)重新標(biāo)記向?qū)Э焖俑@些問題。
?。?)通過在Data Mining功能區(qū)上單擊Clean Data并選擇Re-label來啟動重新標(biāo)記向?qū)А?/span>
(2)在Select Source Data頁面上,使用默認(rèn)的Source Data表選擇,然后單擊Next按鈕。
?。?)在Select Column頁面上選擇Education列,然后單擊Next按鈕。
你將看到Education列上的各個(gè)值以及具有這些值的行計(jì)數(shù)??梢栽谠搶υ捒蛑刑峁┬碌臉?biāo)簽來替換現(xiàn)有標(biāo)簽。
?。?)Select Destination頁面提供了三個(gè)選項(xiàng)用于應(yīng)用所選的新值。第一個(gè)選項(xiàng)是向當(dāng)前工作表中添加新的一列。第二個(gè)選項(xiàng)是將具有更改的工作表數(shù)據(jù)復(fù)制到一個(gè)新的工作表中。第三個(gè)選項(xiàng)是就地更改數(shù)據(jù)。請注意,Re-label Wizard執(zhí)行的操作無法還原。對于選項(xiàng)三來說,這一點(diǎn)非常重要。因此為了安全起見,應(yīng)該使用選項(xiàng)一或者選項(xiàng)二。
?。?)選擇選項(xiàng)二創(chuàng)建一個(gè)新的工作表,然后單擊Finish按鈕。你應(yīng)該看到向?qū)г贓ducation列的旁邊添加新的一列Education2,并將單元格G4和G13的值設(shè)置為Partial College?,F(xiàn)在可以將各個(gè)Education值進(jìn)一步整合為兩個(gè)值,Has Bachelors和No Bachelors,用于表示某位客戶是否具有學(xué)位。Re-label Wizard提供了一個(gè)簡單易用的界面,可以對工作表中某一列的各個(gè)值進(jìn)行全面的更改。該向?qū)Э梢杂糜谡现狄源_保一致性,或者用于許多其他目的,以便快速查看和修改某一列中的所有值。
★關(guān)于WorkWin公司電腦監(jiān)控軟件★
WorkWin的使命是打造Work用途的Windows 電腦系統(tǒng),有效規(guī)范員工上網(wǎng)行為,讓老板知道員工每天在做什么(監(jiān)控包括屏幕、上網(wǎng)在內(nèi)的一舉一動),限制員工不能做什么(禁止網(wǎng)購、游戲、優(yōu)盤等)。
WorkWin基于純軟件設(shè)計(jì),非常容易使用,無需添加或改動任何硬件,使用一臺管理機(jī)監(jiān)控全部員工機(jī)電腦。歷經(jīng)南京網(wǎng)亞十余年精心打造,此時(shí)此刻每天都有成千上萬企業(yè)電腦正在運(yùn)行WorkWin,選擇WorkWin選擇“贏”。
WorkWin監(jiān)控首頁 短視頻講解 下載免費(fèi)試用版
版權(quán)所有,南京網(wǎng)亞計(jì)算機(jī)有限公司 。本文鏈接地址: 清理監(jiān)控?cái)?shù)據(jù):離群值和重新標(biāo)記向?qū)?/a>