階躍星辰與吉利宣布聯合開源兩款多模態大模型
發布日期:2025-02-26 09:02 來源:愛卡汽車

       2月18日,階躍星辰和吉利汽車集團聯合宣布:將雙方合作研發的兩(liang) 款階躍 Step 係列多模態大模型向全球開發者開源。其中,包含目前全球範圍內(nei) 參數量最大、性能最好的開源視頻生成模型階躍Step-Video-T2V,以及行業(ye) 內(nei) 首款產(chan) 品級開源語音交互大模型階躍Step-Audio。兩(liang) 款階躍Step係列多模態大模型的開源,為(wei) 開源世界帶來了行業(ye) 最強的多模態大模型能力,將顯著促進大模型技術的共享與(yu) 創新,推動人工智能的普惠發展,為(wei) 全球數字經濟發展貢獻吉利方案與(yu) 中國力量。

吉利汽車

       階躍星辰是吉利汽車集團的科技生態戰略合作夥(huo) 伴,擁有國際頂尖的算法團隊。2023年開始,吉利便與(yu) 階躍星辰在預訓練大模型、垂直領域大模型、應用場景設計、工程開發等方麵展開了深度合作。其中,吉利牽頭了場景設計、模型測評、工程開發等業(ye) 務,階躍星辰主導了模型預訓練等業(ye) 務,雙方優(you) 勢互補,顯著增強了兩(liang) 款階躍Step係列多模態大模型的性能表現。

       階躍Step-Video-T2V大模型參數量達到300 億(yi) ,可以直接生成 204 幀、540P 分辨率的高質量視頻,是當前全球範圍內(nei) 參數量最大、性能最好的開源視頻生成大模型。階躍Step-Audio大模型能夠根據不同的場景需求,生成情緒、方言、語種、歌聲和個(ge) 性化風格的表達,能和用戶自然地高質量對話,是行業(ye) 內(nei) 首個(ge) 產(chan) 品級的開源語音交互模型。

       作為(wei) 中國汽車全球領跑者,吉利致力於(yu) 成為(wei) 智能汽車AI科技的引領者和普及者。早在2021年,吉利就圍繞芯片、軟件操作係統、數據和衛星網搭建了端到端的自研體(ti) 係和生態聯盟,構建了完善的“智能吉利科技生態網”,驅動用戶在智能駕駛、智能座艙上的體(ti) 驗不斷進化。2022年,吉利建成了全球車企首個(ge) “雲(yun) 、數、智”一體(ti) 化的星睿智算中心。2023年,吉利發布了全球首個(ge) 汽車行業(ye) 全棧自研全場景AI大模型——星睿AI大模型,並獲得了中國通信院“4+級”行業(ye) 最高評級。2025年,吉利發布了行業(ye) 首個(ge) “智能汽車全域AI”技術體(ti) 係。

吉利汽車

 

       在全球最強開源的階躍Step係列視頻生成大模型、語音交互大模型,以及汽車行業(ye) 全場景大模型的綜合賦能下,吉利將在行車安全、緊急避險、智慧泊車等全場景為(wei) 用戶帶來自動駕駛程度更高、更安全的高階智駕體(ti) 驗,同時打造更加智能的汽車情感座艙,重新定義(yi) 人車交互體(ti) 驗,推動AI科技在智能汽車領域的普及應用。

       吉利星睿AI大模型中的AI Drive大模型,具備強大場景生成與(yu) 規劃能力,能夠根據雨雪等不同天氣光照條件、道路結構、擁堵路況、立體(ti) 車庫和不常見的交通目標,構建出真實駕駛中難得一遇的極端駕駛場景。基於(yu) 真實的駕駛視頻數據去優(you) 化階躍Step-Video-T2V,可以將它變成一個(ge) 自動駕駛數據合成器。星睿AI大模型正在探索將這些豐(feng) 富的合成場景轉換成“以假亂(luan) 真”的訓練數據,相當於(yu) 自動駕駛係統打造了一個(ge) 豐(feng) 富的"虛擬駕考考場",從(cong) 而顯著提升車輛在智駕行駛時麵對各種路況的應變能力,保障行車安全。

       在階躍Step-Audio大模型超強交互功能賦能下,吉利星睿AI大模型可以大幅提升語音指令響應速度,以及交互過程的情感理解與(yu) 表達能力。當用戶說“導航,快遲到了”的時候,係統不僅(jin) 會(hui) 自動規劃更快路線,還會(hui) 主動詢問是否需要播放輕音樂(le) 緩解情緒。同時,係統不僅(jin) 可識別粵語、四川話等豐(feng) 富的方言,還支持個(ge) 性化聲音定製,用戶既可以選擇係統提供的人聲音色,也能錄製孩子的笑聲製作專(zhuan) 屬提示音,甚至讓車載AI模仿山澗流水聲營造車內(nei) 冥想空間,溫情陪伴每一次出行。

       除此之外,吉利也是首家與(yu) DeepSeek完成深度融合的車企。通過攜手DeepSeek-R1模型,吉利將對星睿車控FunctionCall大模型、汽車主動交互端側(ce) 大模型等進行蒸餾訓練。屆時,吉利智能汽車AI不僅(jin) 能對用戶的模糊意圖實現精準理解,進而準確調用約2000個(ge) 車載接口,還能基於(yu) 車內(nei) 外場景主動分析用戶潛在需求,並為(wei) 用戶主動提供車輛控製、主動對話、售後等服務,智能交互體(ti) 驗將大幅提升,加速AI在智能汽車領域普及。

      目前,基於(yu) “智能汽車全域AI”技術體(ti) 係打造的AI銀河精靈、Flyme Auto 智能座艙、無界空間、AI雲(yun) 動力、AI繪本、AI哨兵等一係列AI應用,已在銀河E8、銀河E5、銀河星艦7EM-i等車型上搭載。今年3月初,吉利還將對外發布重磅AI智能化戰略,加速推動AI數字底盤、高階智能駕駛等最新AI技術的逐步上車,為(wei) 用戶帶來顛覆性的智能化體(ti) 驗。