您现在的位置: 比特财富网 >> 财经 >  >> 外匯
參數高原、參數孤島和參數優化的方法
外_匯_邦 WaiHuiBang.com        A、參數高原與參數孤島

  參數優化中一個重要的原則就是要爭取參數高原而不是參數孤島。www.emoneybtc.com所謂參數高原,是指存在著一個較寬的參數范圍,模型在這個參數范圍內都能取得較好的效果,一般會以高原的中心形成近似正態分布狀。而所謂參數孤島,是指只有在參數值處於某個很小的范圍內時,模型才有較好表現,而當參數偏離該值時,模型的表現便會顯著變差。

  假設某交易模型內有兩個參數,分別為參數1和參數2,當對兩個參數進行遍歷測試後,得到一張三維的績效圖。好的參數分布應當是參數高原示意圖,即使當參數的設置有所偏移,模型的獲利績效依然能夠得到保證。這樣的參數因穩定性強,可以使得模型在未來實戰中遇到各類行情時,具有較強的因應能力。但如果遍歷參數後的績效結果如參數孤島示意圖,當參數發生小的偏移時,模型的獲利績效就發生較大變動,那麼這樣的參數因適應性能差,往往難以應對實際交易中變化多端的市場環境。

  一般來說,如果附近參數系統的性能遠差於最優參數的性能,那麼這個最優參數有可能是一個過度擬和的結果,在數學上可以認為是奇點解,而不是所要尋找的極大值解。從數學角度來說,奇點是不穩定的,在未來的不確定行情中,一旦市場特征發生變化,最優參數可能會變為最差參數。

  過度擬合與選取的樣本有關系,如果選取的樣本不能代表市場總體特征,只是為了使測試結果達到正的期望值而去調整參數,這種做法無疑是自欺欺人,所得到的參數值是過度擬合的無效參數值。例如,通過分析參數過度擬合,交易模型分別在數值35和63出現了收益率突增現象,如果模型中的相應指標選用35和63做參數,則模型的收益看上去很完美,但實際上卻是典型的參數孤島效應。

  過度擬合與參數優化的主要矛盾在於,模型參數優化得到的最優參數只是建立在已經發生過的歷史數據樣本上,而未來的行情是動態變化的,與歷史行情相比既有相似性,也有變異性。模型設計者可以找到模型在歷史上表現最好的參數,但是這個參數在未來模型實際應用中未必表現最好,更有甚者歷史上表現最好的模型參數,在未來模型實戰中可能是表現很糟糕的參數,甚至帶來大幅虧損。比如,篩選出了一個能抓住歷史上一波大行情的一個參數,但設置這樣參數值的模型,並不意味著模型在未來實戰中也能有如此好的表現,這個歷史上較佳的參數值可能在未來模型的應用中沒有起到任何幫助。

  此外,參數高原與參數孤島往往還與交易次數存在較大關系。如果模型的交易次數較少,往往能找到一個合適的參數點,使得模型在這幾次交易中都盈利,這種參數優化後的模型獲利體現出較強的偶然性。如果模型的交易次數較多,模型獲利的偶然性就會下降,更多地體現出獲利的必然性和規律性,也就會存在一個參數高原。而這種參數優化模型才是進行參數優化的目的所在。

  B、優化參數的方法

  在了解完參數高原與參數孤島之後,優化參數的方法顯得很重要,特別是模型中存在多個參數(下稱參數數組)時,往往一個參數的取值會影響到另外一個參數高原的分布。那麼如何對參數數組進行優化呢?

  一種方法為逐步收斂法。即先單獨對一個參數進行優化,取得其最佳值後固定下來,然後再對另外一個參數進行優化,取得其最佳值後固定下來。如此循環,直到優化結果不再變動。例如,一個均線交叉買賣交易模型,兩個獨立參數分別是均線短周期N1和長周期N2。首先固定N2為1,對N1在1到100的數值范圍內進行測試篩選,尋找最佳數值,最終得到最佳參數為8並固定;其次對N2在1到200之間進行優化,得到最佳值26並固定;再次對N1進行第二輪優化,得到新的最佳值10並固定;最後對N2進行優化得到最佳值28並固定。如此循環的篩選下去,直到優化結果不再變動。假如最終得到的最優參數值分別是N1為10,N2為30。至此,參數優化工作結束。

  另外一種方法是利用帶有較強計算功能的程序化軟件設計平台,直接算出目標函數與參數數組之間的分布,進而求多維差分的分布,定義一個差分阈值,差分絕對值小於阈值范圍內對應的多維體積最大、多維內切球半徑最高者,入選為最穩定參數取值。

  除了參數優化方法,數據樣本選取也是個重要因素。以趨勢跟蹤為交易思想的模型在出現趨勢行情時表現較好,以高賣低買為交易思想的策略在振蕩行情中表現較好。因此,在參數優化時,需要適當剔除吻合交易思想的行情來考慮盈利,增加不吻策略思想的行情數據來考慮虧損。

  以股指期貨為例,上市之初的2010年以及出現極端大牛市行情的2014年下半年至今,股指期貨都是單邊行情。毫無疑問,所有的趨勢模型都會取得不錯的效果。然而如果我們把這種極端行情數據也放進樣本中進行參數優化,得到的模型參數未必是最優的。

  例如,假設某個模型有兩個參數,參數A的測試結果在單邊行情時段效果非常好,在其他的時段表現一般;另一個參數B的測試結果在單邊行情時段效果不如參數A,在其他時段的表現優於參數A,各個時段之間的分布較參數A均勻。即使參數A在整個樣本數據測試的綜合指標如風險收益高於B參數,我們也更傾向於選用參數B,因為參數B相對更加穩定,不依賴於特定樣本。

  總之,在構建程序化交易模型時,一方面,可以通過參數優化改進模型,讓模型更好地適應價格波動的模式,提高投資收益;另一方面,又要防止對參數優化的過度擬合,導致模型對行情變化適用性的大幅降低。

       我們既應不斷通過參數優化改進模型,又要時刻防止對參數優化過度擬合! 外_匯_邦 WaiHuiBang.com
  風險提示:比特財富網的各種信息資料僅供參考,不構成任何投資建議,不對任何交易提供任何擔保,亦不構成任何邀約,不作為任何法律文件,投資人據此進行投資交易而產生的後果請自行承擔,本網站不承擔任何責任,理財有風險,投資需謹慎。
比特財富網 版權所有 © www.emoneybtc.com