7月30日,火山引擎官網(wǎng)推出豆包大模型1.6、豆包視覺理解模型、豆包視頻生成模型三款新的AI大模型。
根據(jù)簡介,豆包大模型1.6有更強的推理能力,多模態(tài)理解能力,GUI操作能力和前端頁面編程能力。豆包視覺理解模型對視覺內(nèi)容有更強的識別能力,更強理解和推理能力,以及更細膩的視覺描述能力。豆包視頻生成模型支持將用戶的文本、圖像生成高質(zhì)量的視頻,能夠生成具備豐富的細節(jié)層次的影視即視頻。

另據(jù)報道,今天,在FORCE Link AI創(chuàng)新巡展?廈門站,字節(jié)跳動火山引擎發(fā)布豆包?圖像編輯模型3.0、豆包?同聲傳譯模型2.0,豆包大模型1.6系列全新升級,并宣布開源扣子核心能力,發(fā)布企業(yè)自有模型托管方案、Responses API等多個模型服務(wù)和工具產(chǎn)品。

此次發(fā)布中,豆包?圖像編輯模型 3.0 實現(xiàn)精度與效率雙提升,支持高清細節(jié)修復(fù)、風格遷移等復(fù)雜創(chuàng)意場景;豆包?同聲傳譯模型 2.0 優(yōu)化多語言實時翻譯能力,強化專業(yè)術(shù)語與跨文化語境理解;豆包大模型 1.6 系列則在知識覆蓋、邏輯推理及輕量化部署上全面升級,適配更廣泛終端與行業(yè)場景。
生態(tài)開放層面,火山引擎宣布開源扣子核心能力,開放模型微調(diào)框架等技術(shù)模塊以降低開發(fā)門檻;同步推出企業(yè)自有模型托管方案,支持私有數(shù)據(jù)訓(xùn)練模型的安全部署與運維;上線 Responses API 標準化接口,助力企業(yè)快速集成對話、生成等 AI 能力,縮短應(yīng)用開發(fā)周期。