利用多因子資料與機器學習方法預測股票報酬

  • 羅靖霖
在建立股票預測模型的過程中,一個品質良好、具代表性且符合實務資料處理原則的投資因子資料庫,是模型建構與預測效能的基礎。投資因子的選擇應具備清楚的經濟意涵與實證基礎;而在因子資料的建立過程中,亦須謹慎處理資料的時間一致性。特別是應使用 point-in-time(當時點可取得)的資訊,以避免誤用未來資訊或事後修正的財務數據。例如,不應排除樣本中於當時仍正常交易、但現況已下市的公司,也不應使用當時不存在的財報資訊(誤用當時點尚未發布的財務資訊、或誤用重編後數據)。若忽略這些資料處理原則,將導致生存者偏誤(Survivorship Bias)與前視偏誤(Look-ahead Bias),而產生失真的預測結果。

➢ 相關關鍵字: 台股投資策略因子投資機器學習176期

➢ 延伸閱讀

置頂

會員