澳门太阳城


動態資訊

INFORMATION



調研資訊

數據需要“分析”才能得出正確的結果

2017-02-17

人們一直對平均數深信不疑,最經典的就是簡單算數平均數,以為這個公式算出的結果就是對的,真的嗎?給大家一個實際的例子,大家就會知道,“數據”這個東西絕對不是幾個學過編程的人,代入幾個公式就可以搞明白的。數據需要分析才能得出正確的結果。

      以下是本人2010年發表在《中國經營報》的小文。

      新房價統計方法有數據陷阱

 

                                           劉德寰

 

      國家統計局最近公布了《住宅銷售價格統計調查方案(征求意見稿)》,這是一個曆史性的進步,說明統計局不再我行我素不考慮社會的觀點了。該調查方案有兩點進步:給出了房價計算的基本公式,透明度增加;在資料收集方法上進行了大的改進。但筆者詳細驗證後發現,這些改進無法使房價計算更加科學,還會導致嚴重失真的結果,甚至可能繼續出現類似“2009年70個大中城市房屋銷售價格上漲1.5%”等讓人匪夷所思的統計數據。

  我們以“本月及上月平均價格計算公式”(見“住宅銷售價格統計調查方案公開征求意見”)為例,來考察統計局房價計算方式存在的問題。

  在統計局現有房價計算方式中,“新建住宅銷售價格指數”的計算步驟為:第一,計算某一新建住宅樓盤90平方米及以下、90平方米~144平方米、144平方米以上三個基本分類的環比指數;第二,采用雙加權計算全市三個基本分類的環比指數,即分別利用本月銷售麵積和金額作為權數計算價格指數,然後將兩個價格指數再簡單平均;第三,計算保障性住房環比價格指數,計算方法與商品住宅基本分類計算方法一致。

  這一房價計算方式有兩個嚴重問題:一是所謂樓盤的三個基本分類,其分類方式不合理,我們知道,同樣是90平方米的房子,城市中心與城市邊緣的價格差異非常大,這樣簡單的三個分類,方法武斷而且沒有分析意義;二是“利用本月銷售麵積和金額作為權數計算價格指數”,這一定會陷入到數據陷阱之中。我們舉一個數據的例子來說明這個問題:

 

 

該城市最近三個月的銷售與價格情況

 

第一月

銷售總平米

成交均價

銷售額

甲區

50000

30000

1500000000

乙區

30000

25000

750000000

丙區

40000

18000

720000000

丁區

20000

17000

340000000

合計

140000


3310000000

 

 

第二月

銷售總平米

成交均價

銷售額

甲區

20000

33000

660000000

乙區

30000

27500

825000000

丙區

50000

19800

990000000

丁區

40000

18700

748000000

合計

140000


3223000000

 

 

第三月

銷售總平米

成交均價

銷售額

甲區

5000

36300

181500000

乙區

10000

30250

302500000

丙區

40000

21780

871200000

丁區

50000

20570

1028500000

合計

105000


2383700000

 

 

  假設一個城市中,按照90平方米以下新房屋基本平均銷售價來看,甲、乙、丙、丁四個區域價格不同,距離城市中心依次越來越遠,最近三個月所有區域成交均價每個月都上漲了10%,但是四個區域的新房銷售結構在這三個月中是不同的(以北京為例,三環以內新房供應越來越少,四環以內也在減少,五環之內有所增加,六環之內大量增加)。

  沒有學過統計的人都能夠看出,這個城市最近三個月房價最終上漲了21%,但是統計局的計算公式是以整個城市新房總成交價除以城市銷售總麵積,算出所謂的“成交均價”,因為前麵提到的低價房銷售麵積上升、高價房銷售麵積下降的原因,就會發現這樣算出的三個月的成交均價分別為:23642.857元、23021.429元、22701.9元,房價分別下跌了2.63%和1.39%,合計下跌4 %。“21%”與“-4%”,多麽可怕的差異!

  如果還是這個銷售結構,每個區域每月成交均價都上漲15%,三個月房價實際上漲了32%以上,但是按照統計局的計算公式,房價分別上漲了1.8%和3%,合計上漲5%左右。

  還是在這個銷售結構中,每個區域每月成交均價都上漲20%,三個月房價實際上漲了44%,但是按照統計局的計算公式,房價分別上漲了6.22%和7.58%,合計上漲15%左右。

  這說明統計局的計算方式存在嚴重失誤。因為它以銷售結構決定房價上升與下降,而不是以房價漲跌本身來決定,這是在數據分析中最常見的一種數據陷阱。如果未來我們國家關於房價計算的方式存在這麽大的失誤,會嚴重影響決策部門對真實樓市情況的了解,誤導公眾。

  上述問題不僅僅是統計部門犯的錯誤,也是建設部門和一些所謂的房價監控部門犯的錯誤。中國房價計算方式需要大的改進。


上一篇:

下一篇:

抽樣問卷最容易犯的五個認識錯誤
車流量檢測如何做?