當前位置: 首頁 > 統(tǒng)計師 > 統(tǒng)計師備考資料 > 初級統(tǒng)計師考《統(tǒng)計相關知識》:統(tǒng)計數(shù)據(jù)的預處理

初級統(tǒng)計師考《統(tǒng)計相關知識》:統(tǒng)計數(shù)據(jù)的預處理

更新時間:2013-03-04 13:43:22 來源:|0 瀏覽0收藏0

統(tǒng)計師報名、考試、查分時間 免費短信提醒

地區(qū)

獲取驗證 立即預約

請?zhí)顚憟D片驗證碼后獲取短信驗證碼

看不清楚,換張圖片

免費獲取短信驗證碼

摘要 數(shù)據(jù)的預處理是在分組或分類之前對數(shù)據(jù)所做的審核、篩選和排序等。

     相關鏈接:初級統(tǒng)計師《統(tǒng)計相關知識》第二章:統(tǒng)計資料收集方法

  統(tǒng)計數(shù)據(jù)的整理

  數(shù)據(jù)搜集來之后,要對其進行加工整理,以使之系統(tǒng)化、條理化,符合統(tǒng)計分析的要求。數(shù)據(jù)整理通常包括數(shù)據(jù)的預處理、分組或分類、匯總等,其中,編制頻數(shù)分布是統(tǒng)計整理的重要內(nèi)容。

  一、數(shù)據(jù)的預處理

  數(shù)據(jù)的預處理是在分組或分類之前對數(shù)據(jù)所做的審核、篩選和排序等。

  (一)數(shù)據(jù)的審核與篩選

  來自不同渠道的統(tǒng)計數(shù)據(jù)和不同類型的統(tǒng)計數(shù)據(jù),在審核的內(nèi)容和方法上也有差別。對于由直接調查取得的原始數(shù)據(jù),要從完整性和準確性兩方面去審核。完整性審核就是檢查應調查的單位或個體有否遺漏,調查項目填寫是否齊全等。準確性審核,一是看數(shù)據(jù)是否真實,與實際有無出入;二是看數(shù)據(jù)的登錄、計算等是否有誤。邏輯檢查和計算檢查是審核數(shù)據(jù)準確性的兩種方法。邏輯檢查就是從定性角度去看數(shù)據(jù)是否有悖邏輯,相互矛盾之嫌,故多用于審核名類數(shù)據(jù)和順序數(shù)據(jù)。比如,中學文化程度的人所填的職業(yè)是大學教師,這就不符合邏輯了。計算檢查是審核調查表中的各項數(shù)據(jù)在計算結果和計算方法上有無錯誤,故多用于對區(qū)間數(shù)據(jù)和比數(shù)據(jù)的審核。例如,檢查各分項數(shù)字之和是否等于相應的合計數(shù),各組頻數(shù)之和是否等于1或100%,出現(xiàn)在不同表格上的同一指標數(shù)值是否相同等。

  對于通過其他渠道取得的第二手數(shù)據(jù),除了審核其完整性和準確性之外,還應審核其適用性和時效性。第二手數(shù)據(jù)可以來自多種渠道,有些數(shù)據(jù)可能是為特定目的,通過專門調查而取得的,或者是已經(jīng)按特定目的的需要做了加工整理。對于這種數(shù)據(jù),使用者首先應弄清數(shù)據(jù)的來源、口徑以及有關背景材料,不能盲目生搬硬套。而且,有些時效性較強的問題,若取得的數(shù)據(jù)過于滯后,就失去了研究的意義,一般來說,應盡可能使用最新的統(tǒng)計數(shù)據(jù)。

  對審核中發(fā)現(xiàn)的錯誤應盡可能予以糾正。如果對發(fā)現(xiàn)的錯誤無法糾正,或者有些數(shù)據(jù)不符合調查的要求而又無法彌補時,就要對數(shù)據(jù)進行篩選。數(shù)據(jù)篩選有兩方面內(nèi)容:一是將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除;二是將符合某種特定條件的數(shù)據(jù)篩選出來,不符合特定條件的數(shù)據(jù)予以剔除。

  (二)數(shù)據(jù)的排序

  數(shù)據(jù)排序就是按一定順序將數(shù)據(jù)排列,其目的是為了便于研究者通過瀏覽數(shù)據(jù)發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索。排序還有助于對數(shù)據(jù)檢查、糾錯,為重新分組或歸類提供依據(jù)。在某些場合,排序本身就是分析的目的之一,例如,美國的《財富》雜志每年都要排出世界500強企業(yè),通過這一信息,經(jīng)營者不僅能知道本企業(yè)所處的地位和差距,還可以了解到競爭對手的狀況,從而有效地制定本企業(yè)的發(fā)展規(guī)劃和戰(zhàn)略目標。

  名類數(shù)據(jù),如果是字母型數(shù)據(jù),排序有升序與降序之分,升序更常見些,因為升序跟字母的自然排列相同;如果是漢字型數(shù)據(jù),排列方式很多,比如按漢字的首位拼音字母排列,這與字母型數(shù)據(jù)的排序完全一樣,也可按筆畫順序,其中也有筆畫多少的升序與降序之分。交替運用不同方式排序,在漢字型數(shù)據(jù)的檢查、糾錯中十分有用。區(qū)間數(shù)據(jù)和比數(shù)據(jù)的排序只有兩種,即遞增和遞減。設一組數(shù)據(jù)為 ,遞增排序后可表示為: ;遞減排序后可表示為: 。排序后的數(shù)據(jù)亦稱為順序統(tǒng)計量(Order statistics)。無論是定性數(shù)據(jù)還是定量數(shù)據(jù),其排序均可借助計算機完成。

   各省(區(qū)、市)統(tǒng)計專業(yè)技術資格考試辦公室聯(lián)系方式一覽表

    2013初/中級統(tǒng)計師《統(tǒng)計相關知識》知識點匯總

    2013年統(tǒng)計師考試報考條件

    2013年統(tǒng)計師考試招生簡章    全國2012年統(tǒng)計師考試成績查詢匯總

    2013年統(tǒng)計師考試報名時間預估    2012年統(tǒng)計師考試考后交流專區(qū)

    

分享到: 編輯:環(huán)球網(wǎng)校

資料下載 精選課程 老師直播 真題練習

統(tǒng)計師資格查詢

統(tǒng)計師歷年真題下載 更多

統(tǒng)計師每日一練 打卡日歷

0
累計打卡
0
打卡人數(shù)
去打卡

預計用時3分鐘

環(huán)球網(wǎng)校移動課堂APP 直播、聽課。職達未來!

安卓版

下載

iPhone版

下載

返回頂部