Responsive image
博碩士論文 etd-0101119-092357 詳細資訊
Title page for etd-0101119-092357
論文名稱
Title
基於可解釋機器學習演算法的房屋價值評估-以高雄市為例
Determinants of House Price : Using Interpretable Machine Learning Algorithms - A Case Study of Kaohsiung City
系所名稱
Department
畢業學年期
Year, semester
語文別
Language
學位類別
Degree
頁數
Number of pages
38
研究生
Author
指導教授
Advisor
召集委員
Convenor
口試委員
Advisory Committee
口試日期
Date of Exam
2019-01-25
繳交日期
Date of Submission
2019-02-01
關鍵字
Keywords
實價登錄、地理資訊圖資雲服務平台、房屋價值、坡度提升演算法、機器學習、隨機森林演算法
Machine Learning, XGBoost, Random Forests, Determinants of House Price, TGOS
統計
Statistics
本論文已被瀏覽 6200 次,被下載 84
The thesis/dissertation has been browsed 6200 times, has been downloaded 84 times.
中文摘要
有鑒於台灣地小人稠,土地寸土寸金,近二十年的家庭年平均所得的成長遠不及房價的成長,全台大多數縣市的房價負擔能力指標皆在略低等級,更遑論台北市與新北市已落在過低等級。這篇論文的目的是分析房價與找出可能影響房價的因素,來進一步了解房價是否合理。
有關於房價的估算,在國內的文獻中,偏重的是房子本身的條件,像是地點、樓高、坪數等,而國外的研究,較多是探討與環境相關的條件,像是空氣、種族、鄰居、綠地等,本研究蒐集政府開放的眾多資訊,將國內、外文獻中所考量的條件,一同納入分析,藉此了解房子的內、外條件中,哪些條件才是對房價的有著更關鍵地影響。
在本研究中,我們使用Bagging與Boosting演算法系列中的隨機森林演算法(Ra-ndom Forests, RF)及坡度提升演算法(eXtreme Gradient Boosting, XGBoost),以實價登錄網站提供的資料為基礎,加入經過轉換的新資料,分析多個面向資料並且建立預測模型。

關鍵詞:隨機森林演算法、機器學習、坡度提升演算法、房屋價值、地理資訊圖資雲服務平台、實價登錄
Abstract
With high population density in Taiwan, the growth of the average annual household income is far less than that of house price. The Housing Affordability Index of most counties and cities in Taiwan are at a slightly lower level, let alone Taipei City and New Taipei City, both of which are at an extra low level. The purpose of this paper is to determine whether the house price is reasonable by analyzing and estimating the factors that might influence the prices.
Regarding the research of the estimation of house price in Taiwan, the emphasis is on the conditions of the house itself, such as location, building height, numbers of pings, etc. As for the research in other countries, the discussions are mainly concerned about environmentally relevant conditions, such as air quality, ethnicity, neighbors, green space, etc. This study collects abundant open data from the government and the conditions taken by the researches at home and abroad, to understand which internal and external conditions are the critical factors of house price.
This study uses the Random Forests algorithm (RF) and eXtreme Gradient Boosting (XGBoost) in series of bagging and boosting algorithms. Raw data is based on the registered selling prices of real estate websites with converted data to analyze multiple dimensions of factors and to build prediction models.

Keywords: Random Forests、Machine Learning、XGBoost、Determinants of House Price、TGOS
目次 Table of Contents
論文審定書 i
致謝 ii
摘要 iii
Abstract iv
第一章 研究背景、動機、目的 1
第一節 研究背景 1
一、 房價所得比 1
二、 住宅需求變數 3
三、 房屋結構變數 3
第二節 研究動機 4
第三節 研究目的 4
第二章 文獻探討 4
第一節 實價登錄與地理資訊圖資雲服務平台 4
一、實價登錄 4
二、地理資訊圖資雲服務平台-(TGOS)系統 5
第二節 影響房價重要變數 5
第三章 研究設計 8
第一節 研究資料 8
一、實價登錄資料 8
二、TGOS資料 8
三、座標系統:WGS84、TWD67、TWD97 8
四、大圓距離 9
第二節 研究範圍 10
一、高雄地區實價登錄資料 10
二、外在環境變數 10
第三節 研究方法 10
一、集成式學習演算法 10
二、Random Forests演算法 11
三、XGBoost 演算法 12
四、非負矩陣分解法(Nonnegative Matrix Factorization ,NMF) 12
第四章 研究結果 13
第一節 資料前處理 13
一、 資料集 13
二、 資料處理 24
三、 使用非負矩陣分解進行樓層轉換 24
第二節 實驗結果 27
第三節 結論 29
第五章 參考文獻 31
參考文獻 References
1.106學年度各級學校分布位置. (n.d.). Retrieved December 29, 2018, from https://www.tgos.tw/tgos/Web/Metadata/TGOS_MetaData_View.aspx?MID=EE8127F5A47FE6D983695F2A5D2D3F61&SHOW_BACK_BUTTON=false&keyword=106
2. 陳珍華, Chen Z.-H., 袁賢銘, & Yuan S.-M. (2013). 巨量資料 : 公開資料與房仲網的房價分析 (Thesis). Retrieved from https://ir.nctu.edu.tw:443/handle/11536/74403
3. 大圓距離-維基百科(2018年11月9日)。維基百科,自由的百科全書。(Page Version ID: 51962644)
4. 地理資訊圖資雲服務平台. (n.d.). Retrieved January 6, 2019, from https://tgos.nat.gov.tw/tgos/Web/Address/TGOS_Address.aspx
5. 高雄市國民中小學實施學生人數總量管製作業要點. (n.d.). Retrieved January 1, 2019, from http://www.rootlaw.com.tw/LawContent.aspx?LawID=B180040001011900-0891214
6. 古肇喻. (2016). 高雄捷運紅線對不同區位房價的影響. 國立中山大學, 高雄市. Retrieved from https://hdl.handle.net/11296/ty54m9
7. 黃惠芬. (2017). 以類神經網路方法建構房價估價模型 — 以高雄市實價登錄資料為例. 國立高雄應用科技大學, 高雄市. Retrieved from https://hdl.handle.net/11296/2k9yv5
8. 黃琦淵. (2016). 高雄市公園綠地空間對房價影響之研究. 國立屏東大學, 屏東縣. Retrieved from https://hdl.handle.net/11296/69jm6w
9. 林昭妏. (2013). 實價登錄之類神經網路估價模型-以高雄市農16及美術館區大樓為例. 長榮大學, 台南市. Retrieved from https://hdl.handle.net/11296/a89b2w
10. 內政部營建署. (2010, December 6). 公園綠地系統規劃設計手冊暨操作案例. 內政部營建署. text/html. Retrieved December 23, 2018, from https://www.cpami.gov.tw/最新消息/業務新訊/37-都市計畫組/11812-公園綠地系統規劃設計手冊暨操作案例.html
11. 內政部營建署. (2016, November 29). 中華民國內政部不動產資訊平台-住宅統計. 內政部營建署. 新聞. Retrieved December 15, 2018, from https://pip.moi.gov.tw/V2/E/SCRE0101.aspx
12. 特徵價格法 - MBA智庫百科. (n.d.). Retrieved from https://wiki.mbalib.com/zh-tw/%E7%89%B9%E5%BE%81%E4%BB%B7%E6%A0%BC%E6%B3%95
13. 王威凱. (2016). 明星國中學區對房價之影響-以高雄市左營區為例. 國立中山大學, 高雄市. Retrieved from https://hdl.handle.net/11296/5z9j26
14. 許晏志. (2014). 以均等變異數檢定檢驗房價是否泡沫化─以台北、新北、台中與高雄為例. 國立中山大學, 高雄市. Retrieved from https://hdl.handle.net/11296/9f5d7e
15. 鄭偉安. (2016). 都市公園綠地對於房價之影響‒以高雄市區為例. 國立中山大學, 高雄市. Retrieved from https://hdl.handle.net/11296/an4mtx
16. 中華民國內政部國土測繪中心. (n.d.). Retrieved December 29, 2018, from https://www.nlsc.gov.tw/Home/MakePage/42?level=42
17. Felipe Carozzi, Paul Cheshire and Christian Hilber. (n.d.). DEMOGRAPHIA: Demographics Development Impacts Market-Rating Middle-Income Housing Affordability. Retrieved January 1, 2019, from http://demographia.com/
18. Lee, D. D., & Seung, H. S. (1999). Learning the parts of objects by non-negative matrix factorization. Nature, 401(6755), 788–791. doi:10.1038/44565
19. Wright, M. N., & Ziegler, A. (2017). ranger: A Fast Implementation of Random Forests for High Dimensional Data in C++ and R. Journal of Statistical Software, 77(1). doi:10.18637/jss.v077.i01 (arXiv: 1508.04409)
20. Breiman, L. (2001). Random Forests. Machine Learning, 45(1), 5–32. doi:10.1023/A:1010933404324
21. Chen, T., & Guestrin, C. (2016). XGBoost: A Scalable Tree Boosting System. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining - KDD ’16, 785–794. doi:10.1145/2939672.2939785 (arXiv: 1603.02754)
22. Koitka, S., & Friedrich, C. M. (2016). nmfgpu4R: GPU-Accelerated Computation of the Non-Negative Matrix Factorization (NMF) Using CUDA Capable Hardware, 8, 11.
23. Niu, F., & Liu, W. (2017). Modeling urban housing price: The perspective of household activity demand. Journal of Geographical Sciences, 27(5), 619–630. doi:10.1007/s11442-017-1396-2
24. Panduro, T. E., & Veie, K. L. (2013). Classification and valuation of urban green spaces—A hedonic house price valuation. Landscape and Urban Planning, 120, 119–128. doi:10.1016/j.landurbplan.2013.08.009
25. Zhou, Z.-H. (2012). Ensemble Methods: Foundations and Algorithms. CRC Press.
電子全文 Fulltext
本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
論文使用權限 Thesis access permission:自定論文開放時間 user define
開放時間 Available:
校內 Campus: 已公開 available
校外 Off-campus: 已公開 available


紙本論文 Printed copies
紙本論文的公開資訊在102學年度以後相對較為完整。如果需要查詢101學年度以前的紙本論文公開資訊,請聯繫圖資處紙本論文服務櫃台。如有不便之處敬請見諒。
開放時間 available 已公開 available

QR Code