- 探索新挑戰(zhàn),《命運(yùn)圣契》勇闖名人堂玩法攻略
- 游戲技巧解析,《蒼翼:混沌效應(yīng)》es高文隱藏效果介紹
- 通關(guān)策略詳解,《命運(yùn)圣契》10-10打法攻略
- 快速上手攻略,《命運(yùn)圣契》團(tuán)長等級(jí)快速提升方法
- 修仙路上的必備指南,《仙風(fēng)道骨》寵物獲取途徑
- 高手進(jìn)階,《蒼翼:混沌效應(yīng)》琴恩5連閃操作技巧
- 游戲達(dá)人指南之旅,《仙風(fēng)道骨》真充券與仙玉獲取攻略
- 全面角色解析,《飛碟快閃》坎特斯技能及應(yīng)對(duì)策略
- 新手必備指南,《生存戰(zhàn)爭2》手機(jī)版聯(lián)機(jī)教程
- 全新輔助光錐揭曉,《崩壞:星穹鐵道》回到大地飛行光錐材料一覽
聲明:本文來自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。
記者|何己
編輯|鄢子
上海的一家科技公司,致力于讓AI像真人一樣開口說話。
3月中旬,聲網(wǎng)發(fā)布了對(duì)話式AI引擎,只需兩行代碼,15分鐘內(nèi)即可讓任意文本大模型實(shí)現(xiàn)"能說會(huì)道"。
這是一項(xiàng)"新物種"的創(chuàng)新。
按照?qǐng)F(tuán)隊(duì)介紹,該產(chǎn)品擁有多項(xiàng)獨(dú)特功能,全球范圍內(nèi)找不到同類產(chǎn)品。對(duì)話1分鐘,成本不到1毛錢。
"之前,大模型都是文字輸入,未來,我們將讓大模型明白你。"聲網(wǎng)產(chǎn)品線負(fù)責(zé)人和利鵬表示。
為了推出這項(xiàng)新產(chǎn)品,聲網(wǎng)AI RTE產(chǎn)品線負(fù)責(zé)人姚光華透露,從春節(jié)開始,公司瘋狂投入研發(fā),如同備戰(zhàn)高考,2月18日推出了Public Beta版本,現(xiàn)已達(dá)到商用狀態(tài)。
截至3月7日美股收盤,聲網(wǎng)市值已達(dá)36億元人民幣。
黑屋作戰(zhàn)
DeepSeek的火爆期間,聲網(wǎng)的產(chǎn)品團(tuán)隊(duì)悄悄啟動(dòng)了一場(chǎng)重要戰(zhàn)役。
春節(jié)期間,聲網(wǎng)協(xié)調(diào)不同部門的十幾位核心骨干,組建一個(gè)專注于做一款能與AI實(shí)時(shí)互動(dòng)的功能型產(chǎn)品的專門團(tuán)隊(duì)。
這個(gè)主意早在半年前就已經(jīng)萌芽階段,順應(yīng)DeepSeek興起的潮流,項(xiàng)目迅速推進(jìn)。
姚光華形容當(dāng)時(shí)的場(chǎng)景,就像備戰(zhàn)高考一樣,室內(nèi)掛著一塊白板墻,每天都會(huì)更新倒計(jì)時(shí)日期,提醒大家必須一鼓作氣。
大模型從單一模態(tài)向多模態(tài)的發(fā)展呈現(xiàn)出不可阻擋的趨勢(shì),語音交流被視作重要切入點(diǎn)之一。
聲網(wǎng)以起源于實(shí)時(shí)互動(dòng)云服務(wù)起家,在音視頻領(lǐng)域積累了豐富經(jīng)驗(yàn),期望通過融合自家的RTE技術(shù)與生成式AI,推出新產(chǎn)品搶占制高點(diǎn)。
緊趕慢趕,在除夕當(dāng)天,對(duì)話式AI引擎正式發(fā)布Private Beta版本,首批開發(fā)者和客戶體驗(yàn)良好,第一件事就是讓DeepSeek開口拜年。
對(duì)聲網(wǎng)而言,這款產(chǎn)品意義非凡。
和利鵬在《21CBR》上表示,聲網(wǎng)過去專注于人與人的交流,開發(fā)對(duì)話式AI引擎,現(xiàn)在轉(zhuǎn)向人與機(jī)器的交流,且要做到實(shí)時(shí)互動(dòng)。這種轉(zhuǎn)變使得底層技術(shù)要求也相應(yīng)提升,“工程化落地過程中存在許多挑戰(zhàn)?!?/p>
姚光華指出,功能構(gòu)想源自客戶需求的抽絲剝繭,實(shí)際落地過程中需要邊探索邊完善,不斷查漏補(bǔ)缺,才能讓AI語音秒回提問,并模仿真人對(duì)話的節(jié)奏,隨時(shí)打斷AI系統(tǒng)。
姚光華表示,"比如對(duì)話人聲鎖定這個(gè)功能,就是客戶提出來的。"他強(qiáng)調(diào),某種程度上,客戶也可以說是最好的導(dǎo)師。
拆解引擎
姚光華解釋道,之所以稱這個(gè)產(chǎn)品為"對(duì)話式AI引擎",是因?yàn)槲覀儾皇褂肁gent,而是專注于構(gòu)建對(duì)話式的工具。
在確定產(chǎn)品名字時(shí),團(tuán)隊(duì)一度考慮使用"轉(zhuǎn)換器",這個(gè)詞匯聽起來更通俗,但最終決定采用"引擎"。
盡管"轉(zhuǎn)換器"聽起來更通俗,但"引擎"更能體現(xiàn)出聲網(wǎng)的態(tài)度:我們提供的是能力,而非與大模型廠商競(jìng)爭。
和利鵬補(bǔ)充道,聲網(wǎng)的角色就是在AI基礎(chǔ)設(shè)施中提供交互功能。
他指出,大模型廠商在構(gòu)建交互時(shí),設(shè)備、網(wǎng)絡(luò)等要求也比較高,而聲網(wǎng)已經(jīng)在這方面的解決方案和產(chǎn)品都較為成熟。
用"多快好省"四個(gè)字來概括這個(gè)"引擎"的能力,它包括AI語音秒回、對(duì)話人聲鎖定、智能打斷、全模型適配等多項(xiàng)功能。
姚光華補(bǔ)充道,這個(gè)"引擎"在響應(yīng)延遲方面表現(xiàn)突出,以毫秒為單位進(jìn)行壓縮,中位數(shù)為650ms。
姚光華指出,市場(chǎng)上的一些產(chǎn)品在宣傳上聲稱能夠做到毫秒級(jí)響應(yīng),但實(shí)際測(cè)量結(jié)果卻相差很大。
在對(duì)話體驗(yàn)方面,“專注模式”可以有效屏蔽95%的環(huán)境人聲和噪聲干擾,精準(zhǔn)識(shí)別對(duì)話人聲。即使在丟包率高達(dá)80%或出現(xiàn)3-5秒的斷網(wǎng)情況下,也能保持流暢的對(duì)話交流。
在開發(fā)部署環(huán)節(jié),開發(fā)人員只需一行代碼,15分鐘內(nèi)即可完成部署。只需在LLM和TTS相關(guān)的URL和Key中填入必要的信息,就能快速實(shí)現(xiàn)功能。
關(guān)于價(jià)格問題,經(jīng)過多次討論和精心比價(jià),團(tuán)隊(duì)最終敲定:AI語音對(duì)話費(fèi)用為0.098元/分鐘,作為增值服務(wù)的“智能打斷”功能則定為0.042元/分鐘。
此外,所有開發(fā)者將獲得1000分鐘的免費(fèi)使用額度。
姚光華表示,經(jīng)過一段時(shí)間的優(yōu)化和實(shí)際使用場(chǎng)景的調(diào)研,團(tuán)隊(duì)發(fā)現(xiàn):用戶與AI每一輪對(duì)話平均會(huì)有約3次問答交流,算下來每次對(duì)話時(shí)長約為21.1秒,單次成本約為3分錢。
按照每月15次對(duì)話的頻率計(jì)算,月成本不到5毛錢,年成本僅需5元。
姚光華指出:“這個(gè)價(jià)格足夠便宜,大家都能用得起?!?/p>
人機(jī)未來
對(duì)話式AI引擎能做些什么?
和利鵬表示,目前開發(fā)者可以部署的場(chǎng)景包括智能助手、虛擬陪伴、口語陪練等,公司已實(shí)現(xiàn)了十幾種場(chǎng)景,其中陪伴類場(chǎng)景較多,同時(shí)對(duì)智能硬件的需求量也較大。
比如,讓具備開口對(duì)話功能的DeepSeek成為孩子的智能 companion,不僅能滿足他們對(duì)知識(shí)的無限探索,還能像與父母對(duì)話那樣自然地交流。
和利鵬指出:"孩子們更關(guān)注的是即時(shí)互動(dòng),關(guān)鍵不在于答案的準(zhǔn)確性,而在于能玩起來。"
在他的眼中,實(shí)時(shí)互動(dòng)的模式正在從人與人之間的交流轉(zhuǎn)向人與機(jī)器的互動(dòng),這在聲網(wǎng)深耕的RTE賽道上呈現(xiàn)出顯著的延展空間。
和利鵬進(jìn)一步表示:"或許下一個(gè)轉(zhuǎn)折點(diǎn)將是,所有傳統(tǒng)的人機(jī)交互方式(如觸控和鍵盤輸入)都實(shí)現(xiàn)語音化。目前,我們已經(jīng)看到一些積極的跡象。"
姚光華解釋道,去年李飛飛博士團(tuán)隊(duì)在AI Agent領(lǐng)域發(fā)表了八九十頁的論文,團(tuán)隊(duì)成員需要全部閱讀,最終總結(jié)出的核心觀點(diǎn)是:"從感知到智能"。
他將Agent分為兩類:第一類是陪伴類Agent,主要為用戶提供情緒價(jià)值;第二類是服務(wù)類Agent,提供智能價(jià)值。如果將這兩者融合在一起,再增加一層時(shí)間價(jià)值,將能夠幫助用戶提升效率。
因此,基于對(duì)話式AI引擎開發(fā)的對(duì)話式Agent,既涉及模態(tài)感知,又涉及模態(tài)融合,是整合以上三種價(jià)值的綜合載體。
技術(shù)革新往往帶來突飛猛進(jìn)的變化。
和利鵬引用OpenAI產(chǎn)品經(jīng)理的觀點(diǎn):"AI時(shí)代,只要我們理解其中60%的核心理念,產(chǎn)品就應(yīng)該及時(shí)發(fā)布。"他認(rèn)為,產(chǎn)品的發(fā)布必須緊跟技術(shù)發(fā)展步伐,在市場(chǎng)中及時(shí)檢驗(yàn)并驗(yàn)證,然后根據(jù)反饋持續(xù)迭代。
姚光華補(bǔ)充道:"目前這個(gè)版本雖然在某些特定場(chǎng)景下可能還不夠完美,但用戶體驗(yàn)已經(jīng)達(dá)到了預(yù)期目標(biāo)。未來,我們將繼續(xù)專注于功能的橫向拓展。"
深度求索掀起行業(yè)革新,聲網(wǎng)團(tuán)隊(duì)在細(xì)分領(lǐng)域深耕精作,必將在細(xì)分市場(chǎng)占據(jù)重要席位。
授權(quán)圖庫:視覺中國
中國加征關(guān)稅2024年3月20日生效,關(guān)稅委員會(huì):自3月20日起對(duì)加拿大進(jìn)口商品加征關(guān)稅 哪吒動(dòng)畫票房冠軍,1. 哪吒再創(chuàng)票房神話,意外再創(chuàng)輝煌!2. 哪吒票房再創(chuàng)新高,意外再創(chuàng)輝煌!3. 哪吒再創(chuàng)票房新高,意外再創(chuàng)神話!4. 哪吒票房表現(xiàn)卓越,意外再創(chuàng)高峰!5. 哪吒意外再創(chuàng)票房神話,突破想象!6. 哪吒票房奇跡重現(xiàn),意外再創(chuàng)輝煌!7. 哪吒票房再創(chuàng)輝煌,意外突破預(yù)期!8. 哪吒意外再創(chuàng)票房神話,再創(chuàng)歷史!9. 哪吒票房表現(xiàn)卓越,意外再創(chuàng)高峰!10. 哪吒再創(chuàng)票房神話,意外再創(chuàng)輝煌! 最強(qiáng)虎臣騎虎臣騎陣容搭配周泰太史凌統(tǒng)全網(wǎng)熱門攻略,《三國志戰(zhàn)略版》最強(qiáng)虎臣騎陣容搭配一覽 特朗普?;鹜{引發(fā)烏克蘭危機(jī)升級(jí)美國對(duì)烏武器供應(yīng)陷入僵局,美國停止對(duì)烏援助,將帶來什么? 以閃亮之名為你呈現(xiàn)重雁時(shí)尚潮流 或以閃亮之名國服ID2300934,《以閃亮之名》重雁捏臉數(shù)據(jù)id一覽 鄭州航空港算力創(chuàng)新,河南加速布局算力建設(shè) 深夜電話她為何在方大同電話中崩潰,薛凱琪:43歲方知堅(jiān)強(qiáng)是騙局,方大同逝世后才懂生活真諦 以閃亮之名為,《以閃亮之名》黑咖捏臉數(shù)據(jù)id一覽 停火談判再起,美官員稱烏準(zhǔn)備恢復(fù)與其談判,俄可能參與 停戰(zhàn)談判俄羅斯是否開啟和平之門,俄烏戰(zhàn)爭或迎轉(zhuǎn)機(jī)?普京或同意烏克蘭"有條件"停戰(zhàn)(解釋:這個(gè)改寫版本保持了原意,同時(shí)進(jìn)行了以下調(diào)整:1. 去掉了句尾的疑問詞"或迎轉(zhuǎn)機(jī)?",使標(biāo)題更簡潔2. 調(diào)整了語序,使標(biāo)題更流暢3. 使用了更簡潔的表述方式4. 保留了關(guān)鍵信息:俄烏戰(zhàn)爭、普京同意停戰(zhàn)、烏克蘭、有條件5. 整體保持了簡潔明了的風(fēng)格,適合新聞報(bào)道標(biāo)題)