- 俄烏 intense fighting over 100 drones,俄烏互稱擊落對方百余架無人機并繼續(xù)激戰(zhàn)
- 挑戰(zhàn),卡尼首次表態(tài):報復特朗普
- 海底撈婚禮,2月汽車銷量排行:誰稱霸春節(jié)假期銷量排行榜,誰又在2月銷量中掙扎?(這個標題在保持原意的基礎上,進行了語言上的精煉和創(chuàng)新,同時增加了懸念和吸引力,符合新聞標題的風格。)
- 重要,航天科技集團在廣州增城啟動低空經(jīng)濟產(chǎn)業(yè)基地項目
- 漢字找茬王反敗為勝的秘密,《漢字找茬:教大家用反CPU通關攻略》或《漢字找茬教大家反CPU通關》
- 數(shù)字經(jīng)濟新機遇,流動的算力釋放數(shù)字經(jīng)濟活力
- 中國癌癥高發(fā)與死亡率,最新中國癌癥數(shù)據(jù)出爐,5大癌種最常見
- 澳大利亞夫婦遭遇機組人員處理不當,澳夫婦在飛行中發(fā)現(xiàn)女子突然死亡,與遺體一同度過4小時
- 固態(tài)電池,固態(tài)電池量產(chǎn)競爭加劇 誰將拔得頭籌?
- 奔馳GLC EQ純電充電極快熱泵+制動,奔馳GLC純電動版最新消息或為替代車型
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
文 | 孫海寧
編輯:黃俊杰
1994 年,量化公司當時是金融界最神秘也是最炙手可熱的公司。他們聘請數(shù)學家和物理學家,大規(guī)模采購高性能計算機,投身于交易領域。這個行業(yè)的標桿企業(yè)是 D.E. Shaw,其單日交易量足以讓紐交所成交量突破 2%。
這一年,D.E. Shaw 在金融領域完成了兩項重要貢獻。一名副總裁帶領團隊開發(fā)并推出了 Juno,這款當時罕見的免費電子郵件產(chǎn)品,最終成功上市;另一名副總裁離職后,帶著團隊的創(chuàng)新理念遷移到西雅圖,推出了全球首個電子商務巨頭,其市值一度超過 20000 億美元。
30 年后,另一家量化公司——幻方(中國頭部量化公司)的“副業(yè)”對整個科技行業(yè)產(chǎn)生了深遠影響:該公司管理數(shù)百億元的資金,推出了大語言模型 DeepSeek R1,憑借無需任何營銷費用的全球震撼表現(xiàn),吸引了大量用戶,其增長速度甚至超過了早年的抖音。
貝索斯創(chuàng)辦亞馬遜,或者梁文峰創(chuàng)立 DeepSeek 的根本原因,自然不是因為他們做過量化投資,而是因為他們都具有創(chuàng)業(yè)者的精神。然而,量化投資這一極其重視人才密度且高度保密的行業(yè)文化,確實為其大模型研發(fā)提供了理想的環(huán)境。
單純地吸引一群聰明人并不一定能帶來創(chuàng)新,一個相對簡單的環(huán)境可能更關鍵。量化投資領域的實踐證明了這一點,而 DeepSeek 則再次證明了這一觀點同樣適用于大模型研發(fā)。
從數(shù)據(jù)中發(fā)現(xiàn)規(guī)律
一名從業(yè)數(shù)十年、曾調(diào)研數(shù)千只基金的投資人士表示,許多“主觀”的投資其實質(zhì)就是依靠信息的收集和嗅探?;鸾?jīng)理們會仔細研究公開的財務數(shù)據(jù),但他們同樣熱衷于舉辦業(yè)內(nèi)人士研討會、支付高額 consulting 費用,甚至雇傭數(shù)百人在咖啡廳外排隊拍攝獨家信息,以便更快地捕捉市場動態(tài)。
因此,人脈同樣不可或缺。盡管橋水基金的創(chuàng)始人瑞·達利歐將利率和匯率變動的原理寫入書籍,反復強調(diào)其投資的成功,但《紐約時報》曾指出,真正讓達利歐獲得巨大財富的秘訣在于,他能夠討好政策制定者,利用他們的“透題”能力獲利,并在書中對此進行了論證。
量化公司完全摒棄這些捷徑。他們堅信任何事情都早有先手,自身無力超越對手做出判斷,因此所有投資決策均建立在基礎事實之上:人類行為具有規(guī)律性,價格運動中蘊含可被捕捉的模式,而計算機恰恰具備這種捕捉能力。
足夠多的人依靠邏輯進行交易,其結(jié)果往往呈現(xiàn)出某種規(guī)律。
可口可樂和百事可樂均從事汽水業(yè)務,受相同市場環(huán)境影響。如果兩家公司的股價差距無端擴大或縮小,至少有一家存在定價錯誤,價格差異最終必將在二者之間找到平衡。四十年前,先察覺這一機會的投資者通過程序監(jiān)控相關股票價格差異的變化,便可管理一只規(guī)模達3000萬美元的基金。
足夠多的人依靠情緒進行交易,其結(jié)果同樣呈現(xiàn)規(guī)律。
可口可樂的投資者中總有過于自信者,他們更傾向于隨自己喜好的消息買入,對不喜歡的消息視若無睹。由此,新消息往往會推高可口可樂股價,學界發(fā)現(xiàn)過去收益較好的公司未來成功率較高,這一現(xiàn)象被稱為“動量效應”。
量化研究員賈乾指出,股票收益波動中最多僅有5%的部分可被解釋。他的工作是找到能刻畫規(guī)律、解釋波動的“因子”,并基于這些因子構(gòu)建投資策略??煽诳蓸肺磥碜邉菖c百事可樂過去股價、可口可樂過去漲幅等因素相關,而股價、漲幅數(shù)據(jù)即可作為“因子”輸入量化模型。
這些因子可以是簡單易懂的信息,也可以更加復雜。
特朗普常會發(fā)布各種令人震驚的想法在Twitter上,他上任初期,J.P. Morgan的研究員通過程序分析特朗普數(shù)以千計的推文語義,構(gòu)建了一個名為“Volfefe”的指數(shù),并驗證其能夠解釋美國國債利率變動。量化模型通過買賣國債賺取利潤時,可以將“Volfefe”指數(shù)作為因子使用。
量化公司文藝復興創(chuàng)始人西蒙斯研究過月球周期對市場的影響。其中一個研究路徑是:月球運動影響潮汐,潮汐影響航運,航運影響油價。但最終卻無功而返。這是因為傳導鏈條過長、中間變量過多,因子對價格的影響就難以識別。
機器學習方法在量化投資領域普及后,許多影響股價的因子已經(jīng)完全無法用邏輯解釋。研究人員確定評價因子的標準,輸入開盤價、收盤價、成交量等“原始因子”,程序便能自動組合、迭代出更能預測股價的新因子。投資機構(gòu)WorldQuant曾分享過一個被實際應用于交易的“較為簡單”的因子:
((rank(correlation(sum(((open * 0.178404) + (close * (1 - 0.178404))), 12.7054), sum(adv120, 12.7054), 16.6208)) < rank(delta(((((high + low / 2) * 0.178404) + (vwap * (1 - 0.178404))), 3.69741))) * -1)
除了能增加因子對價格的解釋能力外,公式中的 0.178404 等數(shù)字并沒有明確的現(xiàn)實意義。量化研究員對此并不介意。如果信號非常明顯,早就會被用于交易。有些信號你不懂,但它們就在那里,可能強度還蠻大。文藝復興的彼得 · 布朗說。
量化分析師軒浩告訴我們,因子的設計需要兼顧現(xiàn)實意義和突發(fā)性,普通人能想出十個就非常了不起。人想出的因子能持續(xù)數(shù)月甚至半年還能為基金帶來收益。而機器挖掘出來的因子很快就會失效,但每天都能產(chǎn)生成千上萬條。
如果信息過多了,搶著做同一種交易,就會導致失效。這讓量化行業(yè)在保密方面近乎偏執(zhí)。頭部量化公司要求前員工 18-24 個月內(nèi)不能自己交易,也不能去其他公司任職。軒浩說,這有點像 gardening leave,回家種花。
D.E. Shaw 的創(chuàng)始人大衛(wèi) · 肖表示,他們的安保水平堪比中央情報局。當記者問他們是否使用神經(jīng)網(wǎng)絡算法時,這位擁有數(shù)十億美元財富的創(chuàng)始人回答說:"我可以告訴你,但必須殺了你。"
單次買賣可能賺也可能賠,但量化公司只關注長期交易中擊敗市場的概率。2000 年初,文藝復興的大獎章基金每天交易 15-30 萬次,員工表示公司只在 50.75% 的情況下是對的,但這已經(jīng)足夠成就公司大獎章基金一年管理 38 億美元、賺 21 億美元的成績。
招募聰明的人,在簡單環(huán)境中解決復雜問題
每年美國國家數(shù)學博物館都會舉辦一次 "數(shù)學大師" 賽事:聚起一群聰明人,比誰能在限時內(nèi)解出最多這樣的數(shù)學題:找到最小正整數(shù) m,使得 m2+7m+89 能被 77 整除。
2014 年的比賽中,參與者中有陶哲軒,當時他 24 歲成為加州大學洛杉磯分校數(shù)學系終身教授,31 歲獲得菲爾茲獎。不過他只是第二名,第一名是約翰 · 奧弗德克,Two Sigma 的聯(lián)合創(chuàng)始人。
奧弗德克可能也不是 Two Sigma 最聰明的人。2015 年時,Two Sigma 已經(jīng)招募了 130 名博士和 6 名國際數(shù)學奧林匹克競賽獲獎者。奧弗德克前東家 D.E. Shaw 直接表示,他們招聘時沒有任何歉意的精英主義,前美國財政部長、哈佛大學校長勞倫斯 · 薩默斯在 2006 年想去 D.E. Shaw 工作,同樣要做智力測驗。
量化投資公司更傾向于招募數(shù)學、計算機科學、統(tǒng)計學等專業(yè)的候選人,而金融學和商科類專業(yè)的背景并非必要優(yōu)勢。
在浙江大學攻讀通信工程專業(yè)的梁文峰,在創(chuàng)立幻方之前,他的職業(yè)生涯曾側(cè)重于參加包括NOI(全國青少年信息學奧林匹克競賽)、IOI(國際信息學奧林匹克競賽)等國際學科競賽,并在取得優(yōu)異成績,尤其是金牌之后的年輕人。如果沒有競賽背景,建議本科階段考入北大、浙大、清華等頂尖學府,并主修計算機科學或電子信息工程專業(yè)。
科學家在該領域的優(yōu)勢不在于計算能力或數(shù)學天賦,而在于他們所具有的科學思維。西蒙斯指出,這些科學家更傾向于避免被偶然事件所左右。
2022年2月,一名曾分析過股票的首席分析師撰寫了一份“定量分析”報告,預測寧德時代未來股價可能下跌超20%。盡管該分析師事后證明他的結(jié)論是正確的,但他采用了一種以偶然性為依據(jù)的推導方式:在一年前,貴州茅臺在類似的市場環(huán)境中出現(xiàn)過相似的股價走勢,因此他推測茅臺的 past 下跌幅度可以作為指引來預判寧德時代的表現(xiàn)。
量化研究則采用了不同的研究范式。在Two Sigma公司面試應征者時,一個例題是如何利用數(shù)學方法驗證“CEO離任會導致公司股價下跌”這一假設。面試者與考官將圍繞這一問題展開討論,涵蓋以下幾點:如何確定收集的數(shù)據(jù)樣本足夠多、足夠全面?如何定義“下跌”——是用一天的跌幅,還是一周、一個月的跌幅?如何設計對照組和測試組以確保兩者盡可能相似?如何區(qū)分CEO離任是由于能力不足還是正常退休?如何區(qū)分股價下跌是由于CEO離任,還是被整體市場向下拖累?采用哪種統(tǒng)計值作為推斷依據(jù)?當該統(tǒng)計值超過多少時,應以多大的置信度拒絕原假設?
盡管量化公司與傳統(tǒng)金融行業(yè)在選址上保持距離,Two Sigma、D.E. Shaw等公司選擇不在華爾街設立辦公室,而將總部設在杭州,其與同行們的北京辦公室則聚集在清華大學科技園,而不是國貿(mào)、金融街等傳統(tǒng)金融區(qū)。這種選址策略本身是一種宣言:不依賴人情世故,不依賴信息交易,潛心研究也能創(chuàng)造財富。
去過D.E. Shaw辦公場所的投資人表示,那里的環(huán)境非常安靜,類似于大學圖書館的研究室。文藝復興公司內(nèi)部有一個可容納100人的禮堂,定期舉辦科學講座,涵蓋如結(jié)直腸癌最新研究等話題?!爱斅牭接腥苏務撚腥さ慕y(tǒng)計應用時,有助于激發(fā)思考?!币幻麊T工如此說道。
為了激勵聰明的人不斷進行創(chuàng)新,最好的方法是減少不必要的管控和干預。
詹 Voros 于一家全球頂級量化投資機構(gòu)任職,該機構(gòu)內(nèi)部設有多個互不相通、獨立運作的投資小組,類似于若干個小型投資機構(gòu):只要各組能夠有效控制風險,投資方法論不必一致,扣除公司提供的分成收益及數(shù)據(jù)接口等費用后,剩下的利潤全部歸該組所有?!坝幸粋€組發(fā)現(xiàn)了某類另類資產(chǎn),制定了獨特的投資策略,賺取了數(shù)十億元的資金。所有員工都實現(xiàn)了財富自由?!?/p>
通過減少不必要的干預和管控,可以更好地激發(fā)創(chuàng)新活力。
另一類量化投資公司更傾向于集體決策,讓團隊共同開發(fā)一個交易系統(tǒng),同時保留一定的自主權(quán)。在文藝復興科技公司,員工可以自由出入同事辦公室,隨時與同事討論或協(xié)作。研究團隊需要將成果進行展示,如果沒有取得顯著進展,團隊成員可能會感到壓力。公司的評判標準非常明確:如果交易賬戶在一天結(jié)束時相比開始時有收益,則被視為成功。
這種管理方式與互聯(lián)網(wǎng)公司有著顯著的不同。大公司通常將中層管理者的晉升機會與手下員工的人數(shù)掛鉤,不允許他們參與其他團隊的工作,也不允許他們在管理層會議中爭奪更多的業(yè)務領域。所有員工都需要在每周、每月、每年的KPI或OKR中提前制定自己的目標和計劃。在這種環(huán)境下,很難區(qū)分個人貢獻與公司整體表現(xiàn),因此管理者必須依靠各種管理手段來激勵員工。
文藝復興科技的管理模式與幻方量化公司相似,并被DeepSeek量化交易團隊繼承。他們的辦公區(qū)在會議室的兩側(cè)都設置了可以隨時推開的門,營造出一種"留有余地"的氛圍。"我們一般不前置分工。"梁文峰這樣表示,員工不需要設定明確的目標KPI,"遇到問題,自己就會拉人討論。"當一個想法顯示出潛力時,公司會根據(jù)需要調(diào)配資源。
一種方式,用到極致
將數(shù)十億美元交給機器進行交易決策,完全信任這些算法,即使對行業(yè)先驅(qū)也是如此。在嘗試使用機器學習算法時,西蒙斯并不放心,因為他無法理解模型為何總是建議買入而不是賣出,"這是一個黑箱!"
緩解這種焦慮的方法不是重新引入人工干預,而是通過窮盡數(shù)據(jù)和算力,充分挖掘算法的潛力。文藝復興科技的數(shù)據(jù)庫自18世紀以來就開始積累,如今"每天增長40TB(1TB=1000GB)"。他們擁有"52000個計算核心和150GB每秒的全球傳輸速度"。Two Sigma則擁有"超過7200個服務器"和"來自10000多個數(shù)據(jù)源的300PB數(shù)據(jù)(1PB=1000TB)"。
在調(diào)用資源、設計量化策略時,團隊需要對每一個細節(jié)都充滿熱情。例如,一個模型預測股價會上漲20%,那么我們應該以什么概率相信它?如果模型建議買入并開倉1000股,那么應該在10秒、20秒還是1分鐘內(nèi)完成交易?在賣出的時候,是等到股價漲到20%、市場交易量減少的時候,還是趁有人愿意以較低價格買入,漲到15%就提前止盈?
不是每一分投資都會有相應的回報,結(jié)果出現(xiàn)之前,量化研究員甚至無法確定自己的努力方向是否正確。伊黎曾嘗試從文本信息中提取因子。她首先人工瀏覽了1000條樣本數(shù)據(jù)并打上了標簽,然后用這些數(shù)據(jù)訓練了一個自動打標的語義分析模型。接著,她又用這個模型驗證打標的準確性。經(jīng)過分析,她篩選出了幾十個因子,測試后發(fā)現(xiàn)有五個因子可以應用。
大模型的發(fā)展與上述量化策略類似。GPT模型的理論架構(gòu)最早來自于谷歌,而OpenAI成為受益者,正是因為他們敢于在前景尚不確定時租用算力資源、購買數(shù)據(jù)集,反復訓練更大的模型。雖然1.17億參數(shù)的模型表現(xiàn)平平,15億參數(shù)的模型依然不夠理想,但到了1750億參數(shù)的階段,模型才真正開始展現(xiàn)出智能。
黃仁勛曾問OpenAI聯(lián)合創(chuàng)始人蘇茨克沃:"在研發(fā)GPT模型時,你一直相信擴大規(guī)模能提高性能嗎?"蘇茨克沃回答:"這是一個直覺。我有一個很強烈的信念,更大意味著更好。"
量化從業(yè)者梁文峰在畢業(yè)后沒有選擇當時較好的就業(yè)機會,反而花了幾年時間獨自研究用算法投資股票,結(jié)果現(xiàn)在再想換工作都很難。
到了2021年,大語言模型的興起更多體現(xiàn)在學術領域,ChatGPT的出現(xiàn)讓量化投資公司開始大量采用機器學習技術。然而,僅有的幾家使用AI的量化公司中,幻方花為了測試技術實力,斥巨資購買了上億元用于購買一萬張英偉達顯卡,用于運行各種大型AI模型。
成功人士往往能找到一套正確的方法論,并將其貫徹到極致。前者更多依賴運氣因素,后者則需要依靠堅持原則的信念,這正是AI無法替代的人類決策特點。
文中提到的賈乾、軒浩、伊黎均為化名。
圖片標題來源:《模仿游戲》
為什么魚不咬鉤,怪物獵人荒野魚不咬鉤原因是什么-魚不咬鉤原因解析 智略,《黑色信標》楔文會介紹 白云機場海關啟用雙前置貨站,白云機場口岸首個雙前置式貨站成功開通運營 新技術,大眾入局換電模式 能否帶來市場破局? 屬性雙刀強化與技能搭配技巧,怪物獵人荒野屬性系雙刀配裝推薦 楊穎從挫折到自我價值的追求,標題改寫建議:從被捧紅到努力崛起改寫說明:1. 原標題較長,信息量較大,改寫后更簡潔明了2. 通過"從被捧紅到努力崛起"突出從低谷到努力奮斗的過程3. 使用"崛起"一詞比"重回舞臺中央"更具吸引力4. 整體保持了原文的核心信息,同時使標題更具沖擊力5. 語序調(diào)整使標題更流暢自然這個改寫后的標題既保持了原文的核心信息,又更簡潔有力,適合用于文章標題或社交媒體分享。 居合拔刀氣刃斬,怪物獵人荒野太刀特殊納刀使用技巧分享 基金行業(yè)重大變動,南玻A四只牛股的背后,基金 Fund manager 突卸任 驚蟄養(yǎng)生,驚蟄時節(jié)如何養(yǎng)生?飲食宜“減酸增甘” 測試倒計時,《開放空間》飯前測試兌換碼分享