- 揭秘英雄,《王國紀元》密林游俠加登圖鑒介紹
- 深入探秘,《王國紀元》萬象魔導法薩拉爾圖鑒介紹
- 奇幻冒險啟程,《全民英杰傳》夏侯淵圖鑒介紹
- 奇幻冒險啟程,《全民英杰傳》夏侯惇圖鑒介紹
- 揭秘強者,《王國紀元》大個子阿不阿多圖鑒介紹
- 探索奇幻世界,《全民英杰傳》甄姬圖鑒介紹
- 揭秘背后故事,《全民英杰傳》曹操圖鑒介紹
- 探秘全程,《古墓麗影:地下世界》全秘視頻攻略
- 探索奇幻角色的奧秘,《王國紀元》小惡魔艾麗斯圖鑒介紹
- 探索強者之路,《王國紀元》狂牛西梅斯特圖鑒介紹
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
作者丨孫海寧
編輯丨黃俊杰
1994 年,量化公司是當時最神秘、最熱門的技術(shù)公司,他們大量引進數(shù)學家和物理學家,配備了大量高性能計算機開展交易業(yè)務(wù)。業(yè)內(nèi)標桿企業(yè)是 D.E. Shaw,該公司的交易量占紐約證券交易所當日成交總額的 2%。
在同一時期,D.E. Shaw 在計算機領(lǐng)域完成了兩項具有里程碑意義的創(chuàng)新。一位副總裁帶領(lǐng)團隊開發(fā) Juno,這是首個免費電子郵件服務(wù),成功上市;另一位副總裁攜團隊離開,創(chuàng)立了全球電商行業(yè)領(lǐng)軍企業(yè)亞馬遜,其市值超過 2000 億美元。
30 年后,另一家量化公司——幻方,通過開發(fā)大語言模型 DeepSeek R1,再次引領(lǐng)了科技潮流。該公司以 100 億元人民幣的資金投入,推出這一模型時幾乎沒有進行任何營銷活動,結(jié)果迅速震撼全球市場。用戶增長速度甚至超過了早期的抖音Such。
創(chuàng)立亞馬遜的貝索斯或創(chuàng)造 DeepSeek 的梁文鋒,其創(chuàng)業(yè)動機并非量化投資,而是源于他們本質(zhì)上都是創(chuàng)業(yè)者。但量化投資這一追求人才密度高且保密性極強的行業(yè)文化,為大模型研發(fā)提供了理想的環(huán)境。
單純吸引人才并不等同于創(chuàng)新,而是在簡單化的環(huán)境中才能實現(xiàn)突破。量化投資領(lǐng)域的實踐證明了這一點,而 DeepSeek 的成功則表明這一理念同樣適用于大模型研發(fā)。
數(shù)據(jù)是投資的核心,主觀因素必須被排除在外,僅通過數(shù)據(jù)分析尋找規(guī)律。
一位從業(yè)數(shù)十年、經(jīng)歷過數(shù)千只基金的投資人表示,許多主觀的投資言論本質(zhì)上都是在打聽信息?;鸾?jīng)理們會仔細研究公開的財務(wù)數(shù)據(jù),但他們同樣熱衷于組織業(yè)內(nèi)人士研討會、支付專家咨詢費用(每小時數(shù)千元人民幣),甚至雇傭數(shù)百人在咖啡館外拍攝獨家信息,以便更快捷地獲取情報,搶占市場先機。
經(jīng)驗與人脈同樣重要。盡管橋水基金的創(chuàng)始人瑞·達利歐將利率和匯率變動的原理寫入著作,但他的成功也離不開對宏觀經(jīng)濟政策的深刻理解。《紐約時報》曾指出,達利歐真正致富的秘訣是通過與政策制定者討好,從中獲益,這也被寫進了他的著作中。
量化公司舍棄了這些捷徑。他們認為,任何事情都早有人知曉,自己也沒能力超越對手做出判斷。他們所有的投資決策都基于一個事實:人類行為總是不斷重復,因此價格運動有規(guī)律可循,而計算機可以捕捉到這種規(guī)律。
足夠多的人依靠邏輯交易,會形成規(guī)律。
可口可樂和百事可樂都涉足汽水市場,受到同樣的市場環(huán)境影響。如果兩家公司股價差距無端擴大或收窄,那至少有一家定價錯誤、價差總要回歸。四十年前,先發(fā)現(xiàn)這個機會的投資者靠程序監(jiān)測六、七只相關(guān)股票的價差變動,就能管理一只規(guī)模達3000萬美元的基金。
足夠多的人依靠情緒交易,也會形成規(guī)律。
可口可樂的投資者中總有過于自信的人,他們會更傾向于跟隨自己喜歡的消息買入,而把自己不喜歡的消息當作噪音。由此,新消息只會將可口可樂股價向上推升,學界發(fā)現(xiàn)過去收益良好的公司,未來大概率還會保持良好狀態(tài),這種現(xiàn)象被稱為“動量效應(yīng)”。
量化研究員賈乾表示,股票每天收益的波動中,最多可能有5%的部分可被解釋。他的工作就是找到能刻畫規(guī)律、解釋波動的“因子”,基于它們構(gòu)建投資策略??煽诳蓸肺磥碜邉菖c百事可樂過往股價、可口可樂過往漲幅相關(guān),股價、漲幅數(shù)據(jù)就能作為“因子”投入量化模型。
因子不僅可以是容易理解的信息,還可以更加復雜。
特朗普習慣在Twitter上發(fā)表各種聳人聽聞的想法。他第一任期內(nèi),J.P. Morgan的研究員通過程序分析特朗普上萬條推文的語義、構(gòu)建了一個指數(shù),稱為“Volfefe指數(shù)”,并驗證它可以解釋美國國債利率變動??抠I賣國債賺錢的量化模型可以把Volfefe指數(shù)當作因子。
量化公司文藝復興創(chuàng)始人西蒙斯研究過月球周期對市場的影響。他的路徑之一可能是:月球運動影響潮汐、潮汐影響航運、航運影響油價。但他最終無功而返。傳導鏈條太長、中間變量太多,因子對價格影響就難以識別。
機器學習方法在量化行業(yè)中得到普及后,許多影響股價的因子已經(jīng)無法用邏輯理解。研究員確定評價因子的標準,輸入開盤價、收盤價、成交量等“原始因子”,程序就能自動組合、迭代出更能預測股價的新因子。投資機構(gòu)WorldQuant曾分享過一個實際用于交易的“較為簡單”的因子:
(rank(correlation(sum(((open * 0.178404) + (close * (1 - 0.178404))), 12.7054), sum(adv120, 12.7054), 16.6208)) < rank(delta(((((high + low / 2) * 0.178404) + (vwap * (1 - 0.178404))), 3.69741))) * -1)
除了能增加因子對價格的解釋能力外,沒人知道公式中的 0.178404 等數(shù)字有什么現(xiàn)實意義。但量化研究員不介意。"如果是意義非常明顯的信號,早就被用于交易了。有些信號你不理解,但它們就在那里,而且可能相對較強。" 文藝復興 CEO 彼得 · 布朗說。
量化研究員軒浩告訴我們,基于現(xiàn)實意義、拍腦袋想因子十分困難,"一天能想十個,就是天才了"。人找的因子通常能持續(xù)幾個月、半年幫基金賺到錢。而機器挖出來的因子失效非???,"但架不住每天能產(chǎn)生幾千個。"
如果知道因子的人多了,搶著做同一種交易,它就會失效。這讓量化行業(yè)在保密方面近乎偏執(zhí)。頭部量化公司會要求離職員工 18-24 個月內(nèi)既不能自己交易、也不能去其他公司任職。"俗稱 Gardening Leave,回家種花。" ?軒浩說。
D.E. Shaw 創(chuàng)始人大衛(wèi) · 肖曾說自己公司安保水平媲美中央情報局。被記者問 D.E Shaw 是否用神經(jīng)網(wǎng)絡(luò)算法構(gòu)思策略時,這名擁有數(shù)十億美元財富的創(chuàng)始人回答:"我可以告訴你,然后必須殺了你。"
單次買賣可賺可賠,量化公司只關(guān)注大量交易時擊敗市場的概率。2000 年初,文藝復興的大獎?wù)禄鹈刻旖灰?15-30 萬次,"我們只在 50.75% 的情況下是對的。" 一名員工說,但這已足夠成就公司大獎?wù)禄鹨荒旯?38 億美元、賺 21 億美元的成績。
雇聰明人,在簡單環(huán)境里解決復雜問題
美國國家數(shù)學博物館每年舉行一次 "數(shù)學大師" 錦標賽:聚起一群聰明人,比誰能在限時內(nèi)能解出最多這樣的數(shù)學問題:找到最小正整數(shù) m,使 m2+7m+89 能被 77 整除。
2014 年比賽夜的參與者有陶哲軒,他 24 歲成為加州大學洛杉磯分校數(shù)學系終身教授,31 歲獲得 "菲爾茲獎"——數(shù)學界的諾貝爾獎。不過他只是第二,贏過他的是約翰 · 奧弗德克,量化公司 Two Sigma 的聯(lián)合創(chuàng)始人。
奧弗德克可能也不是 Two Sigma 最聰明的人。2015 年時,這家公司已經(jīng)招了 130 名博士和 6 名國際數(shù)學奧林匹克競賽獲獎?wù)?。奧弗德克前東家 D.E. Shaw 直接說自己招聘時有 "毫無歉意的精英主義",前美國財政部長、哈佛大學校長勞倫斯 · 薩默斯在 2006 年想去 D.E. Shaw 工作,同樣要做智力測驗。
量化公司更傾向于招募數(shù)學、計算機、統(tǒng)計學等專業(yè)的候選人,而金融、商科背景則不是優(yōu)勢。
梁文鋒在浙江大學主修通信工程專業(yè),之后更傾向于通過參加全國或國際學科競賽(如NOI、IOI等)來展示能力。如果缺乏競賽背景,建議本科期間考取北大、清華、浙大等頂尖學府,并主修計算機或電子信息工程專業(yè)。
西蒙斯指出,科學家在該領(lǐng)域的優(yōu)勢不在于計算能力,而在于具備的科學思維。他們更傾向于將偶然事件視為特殊情況。
2022年,一名資深首席分析師撰寫的一份"定量分析"報告預測寧德時代未來股價可能下跌20%。盡管該結(jié)論被證明是正確的,但其推導方法依賴于偶然性:他觀察到貴州茅臺在相似的市場環(huán)境下股價走勢相似,因此推測茅臺的跌幅可以指引寧德時代的未來表現(xiàn)。
量化研究采用不同的研究范式。Two Sigma在招聘員工時,舉了一個例子,如何用數(shù)學方法驗證"CEO離職導致股價下跌"。應(yīng)聘者和面試官會討論實驗方案:
確定數(shù)據(jù)樣本是否足夠多、足夠全面?定義"下跌"的標準是使用一天的跌幅,還是一周或一個月?如何區(qū)分對照組和測試組以確保其相似性?如何確定CEO離職是由于能力不足還是退休?如何區(qū)分股價下跌是由于CEO離職,還是受市場整體拖累?使用哪種統(tǒng)計值進行推斷?當統(tǒng)計值超過多少時,需以多大的置信度拒絕假設(shè)?
即使在鄰居選擇上,量化公司也與傳統(tǒng)金融行業(yè)保持距離。Two Sigma、D.E. Shaw等公司不在華爾街設(shè)辦公室;幻方總部位于杭州,其北京辦公室與清華科技園相鄰,而非國貿(mào)、金融街。這種選址策略體現(xiàn)了量化研究的獨立性:不依賴人情世故、不借助內(nèi)部信息網(wǎng)絡(luò),而是依靠潛心研究創(chuàng)造價值。
投資人曾表示,D.E. Shaw的辦公室環(huán)境安靜,像圖書館研究室那樣適合思考。員工提到,每當有人談?wù)撚腥さ慕y(tǒng)計應(yīng)用時,這有助于激發(fā)思考。
為了鼓勵持續(xù)創(chuàng)新,最好的方法是減少對人的管控和干預。
軸軒于一家全球頂級量化投資機構(gòu)任職,機構(gòu)內(nèi)部有多個獨立運作的小組,每組負責獨立交易。各組只需要控制好風險,投資方法論不必一致,扣除公司提供的服務(wù)費用后,剩余利潤完全歸自己所有。舉例來說,有一個小組專注于一種另類資產(chǎn),開發(fā)一套策略賺取了數(shù)十億元。所有員工因此實現(xiàn)了財富自由。
另一類量化投資公司更傾向于集體決策,團隊成員共同打造一個交易系統(tǒng),同時保留員工的自主權(quán)。在文藝復興的團隊中,員工可以隨時進入同事的辦公室,尋求建議或共同發(fā)起項目合作。研究人員需要在取得顯著成果前投入大量時間和精力,如果無法顯著提升成果,團隊成員會感到較大的壓力。該團隊的評估標準非常明確:如果賬戶資金在交易結(jié)束后較最初有所增長,團隊的努力即為成功。
這種管理風格與互聯(lián)網(wǎng)公司的文化截然不同。大公司中,中層管理者會將團隊規(guī)模與晉升機會掛鉤,傾向于限制下屬參與其他團隊項目,同時也要求團隊成員在月度例會上主動爭取更多業(yè)務(wù)機會。在公司規(guī)模較大、個人貢獻與整體目標關(guān)系不明確的情況下,員工需要通過制定詳細的KPI或OKR來明確自身工作方向。
幻方的投資管理風格與文藝復興頗為相似,并得到了DeepSeek團隊的傳承。在公司內(nèi)部,會議室的兩側(cè)設(shè)置了可隨時打開的門,為團隊成員提供了"留有余地"的空間。幻方的管理團隊通常不會為員工設(shè)定具體的分工,員工無需設(shè)定個人KPI,遇到問題時,團隊成員會主動尋求幫助。當某個想法具備一定的潛力時,公司會通過調(diào)整資源來支持其發(fā)展。
這種方式達到了極致
他們愿意將數(shù)十億美元委托給機器處理,完全信任這些工具的判斷力,即使對行業(yè)先行者也是如此。在嘗試運用機器學習算法時,西蒙斯曾表示不放心:"我不明白為什么這個模型總是建議買入而不是賣出?這似乎是一個黑箱!"
縮解這種壓力的方法并不是重新引入人工干預,而是通過窮盡數(shù)據(jù)和計算能力,最大限度地提升算法的效能。文藝復興的數(shù)據(jù)庫從18世紀開始構(gòu)建,如今已發(fā)展到每天新增40TB(1TB=1000GB),擁有52000個計算核心和每秒150GB的全球數(shù)據(jù)傳輸速度。Two Sigma則擁有超過7200個服務(wù)器,來自10000多個數(shù)據(jù)源的超過300PB數(shù)據(jù)(1PB=1000TB)。
在運用這些資源和設(shè)計量化策略時,團隊需要細致入微地考慮每一個細節(jié)。例如,一個模型預測某只股票將上漲20%,團隊需要確定以什么概率信任這個預測?如果模型建議以1000單進行交易,團隊需要確定是在10秒、20秒還是1分鐘內(nèi)完成這筆交易?在賣出股票時,是等到股價上漲20%、交易量減少,還是抓住市場流動性高的時機,在有人愿意接盤時提前止盈?
在量化研究員的工作中,回報與投入并不總是成正比。在確定努力方向是否正確方面,團隊成員需要投入大量時間,但結(jié)果尚未顯現(xiàn)時,他們甚至無法確定自己的工作是否在正確軌道上。伊黎曾嘗試從文本數(shù)據(jù)中提取因子,首先人工分析了1000條樣本并打上標簽,隨后訓練了一個自動打標的語義分析模型,并用另一個模型驗證標簽的準確性。經(jīng)過進一步分析,她最終篩選出了幾十個可操作的因子,測試后發(fā)現(xiàn)其中有五個因子表現(xiàn)良好。
大模型的迭代過程與上述類似。GPT模型的理論架構(gòu)最初源于Google,而OpenAI成為了這一領(lǐng)域的受益者,正是因為他們愿意在前景尚不明確時投入大量資源,租用計算資源、購買數(shù)據(jù)集,反復訓練模型,最終才取得了顯著的進步。
黃仁勛曾問OpenAI聯(lián)合創(chuàng)始人蘇茨克沃:"研發(fā)GPT模型時,你一直相信擴大規(guī)模能提高性能嗎?"蘇茨克沃回答:"這是一個直覺。我有一個很強烈的信念,更大規(guī)模意味著更好的性能。"
作為一名量化投資從業(yè)者,我深深感受到πanwenfeng在浙江大學信息與通信工程專業(yè)畢業(yè)后未能選擇一個更好的就業(yè)機會,轉(zhuǎn)而投入大量時間在內(nèi)部研究開發(fā)一個算法交易系統(tǒng)。這個決定導致他無法在畢業(yè)后獲得理想的工作機會。
到2021年時,大語言模型的影響還主要局限于學術(shù)界,而像ChatGPT這樣的商業(yè)產(chǎn)品還未誕生。當時那些頭部量化投資公司紛紛采用機器學習技術(shù),但卻只有幻方在斥資購買上億元以獲得上萬張NVIDIA顯卡,用于運行各種復雜的AI模型。
成功的創(chuàng)業(yè)者往往能夠在正確的方向上總結(jié)出一套有效的方法論,并將其貫徹到底。這種成功更多依賴于偶然性,而后者則需要依靠堅定的信念才能堅持下去,這些是算法無法替代的決策因素。
文中提到的賈乾、軒浩、伊黎均為化名處理。
題圖出處:電影《模仿游戲》
證監(jiān)會財務(wù)造假調(diào)查進展,東方集團財務(wù)造假,大華會計師事務(wù)所財務(wù)造假頻繁發(fā)生? 韓國娛記爆金秀賢與金賽綸戀愛6年終解秘,金秀賢與金賽綸6年交往被曝,女方被男方要求還錢,家屬呼吁嚴懲男方。(說明:這個改寫版本保留了所有關(guān)鍵信息,同時將標題變得更簡短。"曝"改為"被曝","擊垮"改為"被要求還錢","家屬呼吁"改為"家屬呼吁"。整體上更簡潔明了,同時保持了新聞標題的正式風格。) 圖赫爾在比賽中對球員的贊賞,迪恩-亨德森有意留隊 圖赫爾將考察我比賽 野菜雖美切莫食,在野地里"挖呀挖呀挖"?野菜不識莫亂吃 ESGPPT退款騙局,花了1萬多元報名ESG證書,不少消費者反映機構(gòu)收費陷阱多 首席設(shè)計師趙春玲帶領(lǐng)團隊,趙春玲:以創(chuàng)新與實干培育大飛機"夢想之花" 限定120周年,藍推出120周年紀念系列,包括T恤、帽子、圍巾、手提袋等 輕松掌握時尚感針織單品的優(yōu)雅穿搭,40+歲的女性不要隨意打扮,掌握3招提升時尚感 阿麗亞娜6型火箭3月6日發(fā)射推遲與取消,亞麗娜6火箭首次實施商業(yè)發(fā)射任務(wù) 退圈反省,孟耿如退出社交賬號,正式退出娛樂圈,隱退娛樂圈引發(fā)關(guān)注