- 異世界冒險中的挑戰(zhàn)指南,《異世界勇者》恐魔之心副本開荒攻略
- 即將揭秘,《鳴潮》1.3卡池上新一覽
- 游戲攻略指南,《絕區(qū)零》邦布之獄觸發(fā)方法
- 破解謎題的秘密指南,《紙嫁衣7》第二章小孩燈籠解謎攻略
- 挑戰(zhàn)解密之旅,《原神》4.8紙蛙合唱團解密攻略
- 游戲任務指南,《逆水寒手游》亞丁格桑奇遇攻略
- 探索心動小鎮(zhèn)的秘密,《心動小鎮(zhèn)手游》竹莢魚釣魚方法分享
- 副本攻略簡述,《異世界勇者》風暴王座副本開荒攻略
- 解鎖挑戰(zhàn)的秘訣,《原神》4.8連水管解密技巧
- 解密之旅,《紙嫁衣7》地藏殿供桌燭臺謎題答案介紹
聲明:本文來自于(ID:ykqsd.com)授權轉載發(fā)布。
記者|何己派
編輯|鄢子為
一家上海公司,提供像真人一樣開口說話的AI解決方案。
3月上旬,聲網(wǎng)推出了一個新的對話式AI引擎系統(tǒng),只需兩行代碼,15分鐘內即可讓任意文本大模型實現(xiàn)"能說會道"的功能。
這項技術堪稱"新物種"。
按照團隊的說法,聲網(wǎng)的對話系統(tǒng)擁有多項獨特功能,目前全球找不到可比的對手。單次對話僅需不到一毛錢。
"之前,大模型都是文字輸入,但未來,我們希望讓大模型能理解你。"聲網(wǎng)產(chǎn)品線負責人和利鵬表示。
為了這次發(fā)布的新產(chǎn)品,聲網(wǎng)AI RTE產(chǎn)品線負責人姚光華向《21CBR》記者透露,從春節(jié)開始,公司就進入全速生產(chǎn)狀態(tài),就像備戰(zhàn)高考一樣緊張。2月18日推出了Public Beta版本,目前已處于可商用狀態(tài)。
截至3月7日美股收盤,聲網(wǎng)市值為36億元人民幣。
黑屋作戰(zhàn)
在DeepSeek爆紅之際,聲網(wǎng)的產(chǎn)品團隊發(fā)動了一場關鍵戰(zhàn)役。
春節(jié)期間,聲網(wǎng)協(xié)調不同部門的十幾位核心骨干,組建了一個專門團隊,專注于研發(fā)一款支持與AI實時互動的工具產(chǎn)品。
早在半年前,這個構想就已經(jīng)開始醞釀,隨著DeepSeek的浪潮而來,項目速度驟然提升。
姚光華描述當時的工作場景:"大家關在一間'小黑屋'里,所有相關負責人圍坐在一起,快速決策、快速推進。"他用高考備戰(zhàn)來形容當時緊張而有序的節(jié)奏,白板上倒計時不斷更新,提醒著所有人必須加速行動。
大模型已從單一模態(tài)發(fā)展至多模態(tài),語音技術被視作重要的突破方向之一。
聲網(wǎng)作為一家以實時互動云服務起家的公司,在音視頻領域已有較為深厚的積累,他們希望將自家的RTE技術與生成式AI相結合,以一款新作搶占先機。
在除夕當天,對話式AI引擎已正式發(fā)布Private Beta版本,首批開發(fā)者和客戶紛紛 arrive,并立即開始第一項重要工作——讓DeepSeek開口拜年。
對于聲網(wǎng)團隊而言,這款產(chǎn)品的意義不言而喻。
和利鵬向我們介紹,聲網(wǎng)多年以來專注于人的交流,而對話式AI引擎的開發(fā),標志著他們轉向人機交流領域,且要求實現(xiàn)實時互動。和利鵬指出,"工程化落地存在諸多挑戰(zhàn)。"
姚光華提到,為了讓AI能夠迅速回應提問,模擬真實對話的速度和節(jié)奏,團隊需要不斷測試和優(yōu)化,"邊走邊試,查漏補缺。"
“比如對話人聲鎖定這個功能,就是客戶提出來的?!币馊A解釋道,某種程度上,客戶是最好的導師。
拆解引擎
“之所以叫‘對話式AI引擎’,就在于我們不做Agent,只想構建對話式工具?!币馊A向《21CBR》強調道。
在決定產(chǎn)品名字時,團隊一度考慮使用“轉換器”,這個詞匯寓意接入后AI能夠理解人類語言,但最終決定采用“引擎”。
“轉換器”聽起來更通俗,但它沒有明確表達聲網(wǎng)的立場:我們只是提供能力,而非與大型模型廠商競爭。
“我們在討論AI基礎設施時,都認為實時互動也是其中一部分。聲網(wǎng)的角色就是在AI基礎設施中負責交互?!焙屠i透露,公司與國內多家模型廠商有合作關系。
他指出,大型模型廠商通常從頭開始構建交互界面,這對設備、網(wǎng)絡等要求非常高。聲網(wǎng)擁有多年的實時互動經(jīng)驗,其方案和產(chǎn)品成熟度更高,更具優(yōu)勢。
能夠實現(xiàn)讓大模型開口說話的“引擎”,拆解下來,它擁有四個關鍵功能:AI語音秒回、對話人聲鎖定、智能打斷,以及全模型適配能力。姚光華說,用一句話概括就是“多快好省”。
在響應延遲方面,以毫秒為單位壓縮,其中位數(shù)達到了650ms。
姚光華指出,市面上一些產(chǎn)品宣稱能夠實現(xiàn)毫秒級響應,但實際測試中延遲卻有很大差異。
在對話體驗方面,“專注模式”功能可有效屏蔽95%的環(huán)境人聲和噪聲干擾,精準識別對話人聲。即使在丟包率高達80%或網(wǎng)絡中斷3-5秒的情況下,也能保持對話的穩(wěn)定流暢。
在開發(fā)部署方面,開發(fā)人員只需編寫兩行代碼,15分鐘即可完成部署。只需在代碼中填入與復制生成LLM和TTS相關的URL和密鑰,即可快速部署。
關于價格問題,經(jīng)過內部討論和反復商量,團隊最終決定:AI語音對話的單價為每分鐘0.098元,作為增值服務的“智能打斷”技術則定價為每分鐘0.042元。
此外,所有開發(fā)者每人每月可享受1000分鐘免費使用額度。
姚光華表示,經(jīng)過一段時間的打磨和實際使用場景調研,團隊發(fā)現(xiàn),用戶與AI每產(chǎn)生一次對話,平均會有約3輪問答,計算下來平均對話時長約為21秒,單次成本僅為3分錢。
若每月對話次數(shù)為15次,那么月均成本不到5分錢,年度費用僅需5元。
姚光華表示,“這項技術不僅成本低廉,使用門檻極低,完全適合大眾?!?/p>
人機未來
對話式AI引擎,到底能做點啥?
和利鵬表示,目前可部署的場景包括智能助手、虛擬陪伴、口語陪練等,公司已落地十幾種場景,其中陪伴類場景較多,智能硬件的需求也不少。
比如,讓DeepSeek的人工智能可以與孩子自然對話,幫助他們解答"為什么"、"怎么樣"等各類問題,同時還能像和父母聊天一樣輕松自然地交流。
小孩子想要的其實是快速的互動交流,至于答案是否準確,這并不是最重要的。和利鵬說:"小孩子想要的是快速互動,不在于答案是否足夠準確,而是先玩起來。"
在他的看法中,實時的互動交流從人與人的交互,轉向人與機器的交互,對聲網(wǎng)深耕的RTE賽道而言,這是一項重要的延展方向。
和利鵬表示,"或許下一個變革,是所有觸摸式和鍵盤式的交互,都變成語音式的?,F(xiàn)在我們已經(jīng)看到了一些苗頭。"他向《21CBR》表示。
姚光華指出,關于AI Agent的研究,去年李飛飛博士團隊撰寫了七八十頁的論文,團隊每個成員都要認真研讀,最后總結出一句話:"從感知到智能"。
他將Agent分為兩類:一類是陪伴類的Agent,主要為用戶提供情緒價值;另一類是服務類的Agent,提供智能價值。如果將二者結合起來,再加一層時間價值,就能讓用戶在效率上獲得提升。
因此,對話式AI引擎所推動的對話式Agent,既涉及模態(tài)感知,又涉及模態(tài)融合,是吸收以上三重價值的載體。
技術革新往往會讓整個行業(yè)發(fā)生翻天覆地的變化。
和利鵬援引OpenAI產(chǎn)品經(jīng)理的話:"AI時代,只要想通60%,產(chǎn)品就應該發(fā)布。"他認為,產(chǎn)品的發(fā)布必須緊跟技術發(fā)展步伐,及時進入市場檢驗,并根據(jù)反饋不斷迭代升級。
姚光華表示:"現(xiàn)在這個版本,雖然不是任何場景都萬能,但用戶體驗已經(jīng)達到了預期目標。未來,我們將繼續(xù)做好功能的橫向拓展。"
小編帶大家關注音頻領域的最新動態(tài),聲網(wǎng)團隊專注于音頻細分領域的深耕,至少能分到一份湯。
圖片來源于視覺中國
坦克300上市黃金動力+超值購車優(yōu)惠19.98萬起,2025坦克300直降2萬起售價19.98萬 Hi4-T不限號 汪小菲大S撫養(yǎng)費關聯(lián)具俊曄豪宅,重磅爆料:具俊曄藏不住了!律師發(fā)現(xiàn)關鍵證據(jù),大S也被牽連 爭議協(xié)議十年,紅牛品牌歸屬問題已十年,王老吉、喬丹、江小白均是"過來人"。 海關查驗白云機場2023年,首例"雙前置"貨站投用在白云機場口岸 【文/觀察者網(wǎng)特約作者 心智觀察所】《紐約時報》近期發(fā)布了一篇引發(fā)廣泛關注的報道重點探討為何中國的電子產(chǎn)品巨頭能造電動汽車而蘋果卻始終未有建樹文章指出小米作為中國電子行業(yè)的一面旗幟在短短三年間就推出了首款電動汽車SU7而蘋果在探索造車領域已有近十年之久卻在2024年宣布放棄這一計劃《紐約時報》通過深入采訪為本文找到了一些關鍵原因一位專家分析道小米不僅生產(chǎn)各種電子產(chǎn)品還深入到家庭生活的方方面面這種全方位的滲透能力是其他企業(yè)難以企及的另一位專家則從消費者需求切入指出小米對中國消費者的深入了解使品牌優(yōu)勢顯著例如消費者可以通過小米應用商店購買配件如模擬儀表板時鐘和物理開關這種以消費者為中心的服務模式不僅體現(xiàn)了小米的技術實力更展現(xiàn)了其情感價值從這一對比來看《紐約時報》的文章顯得過于淺薄未能對小米的成功和蘋果的失敗進行深入的反思事實上小米和蘋果在電動汽車領域的鮮明對比不僅凸顯了中國在全球電動汽車市場中的獨特地位也折射出中國企業(yè)在技術創(chuàng)新和供應鏈體系構建上的顯著優(yōu)勢,《紐約時報》好奇:小米造電動車,蘋果為何造不出? 關稅調整4月2日特朗普與墨西哥總統(tǒng)通話后,特朗普拒絕因股市波動解釋加墨關稅,表示不看股市這個改寫版本:1. 保留了核心信息:特朗普拒絕解釋、加墨關稅、不看股市2. 使用了更簡潔的表達方式3. 調整了語序,使句子結構更緊湊4. 使用了同義詞替換(拒絕、股市、關稅等)5. 整體長度比原文短了約10%6. 保持了原意,沒有遺漏關鍵信息如果需要進一步調整長度或風格,可以隨時告訴我。 烏克蘭危機中的秘密會晤,澤連斯基反對者承認接觸特朗普團隊 但反對戰(zhàn)時選舉 中日外交,外交部記者會:王毅談中日關系,借臺灣搞事等于給日本添亂說明:1. 將"外交主題"簡化為"外交部"2. 將"王毅談中日關系"合并為更簡潔的表述3. 調整語序,使標題更流暢4. 替換部分同義詞,使表達更簡潔5. 保持了核心信息不變,同時大幅縮短了標題長度 高性價比與科技配置解析,Still struggling to gain traction, the latest 2023途昂Pro variant comes with an一口價起售價 of 26.99萬元。 美國你值得被問5個問題,王毅對美國發(fā)出5問