香港2025年12月5日 /美通社/ -- 領(lǐng)先的內(nèi)容社區(qū)及社交平臺快手科技(「快手」或「公司」;港幣櫃臺股份代號:01024 / 人民幣櫃臺股份代號:81024)宣佈,12月3日,可靈推出視頻生成2.6模型,該模型提供了里程碑式的「音畫同出」能力,徹底改變了傳統(tǒng)AI視頻生成模型「先無聲畫面、後人工配音」的工作流程。它能夠在單次生成中,輸出包含自然語言、動(dòng)作音效以及環(huán)境氛圍音的完整視頻,重構(gòu)了AI視頻創(chuàng)作工作流,極大提升創(chuàng)作效率。
重構(gòu)AI視頻創(chuàng)作工作流 中文語音生成效果全球領(lǐng)先
可靈2.6模型升級了文生音畫、圖生音畫兩大功能,輸入文本或是輸入圖片結(jié)合提示詞文本,均可直接生成帶有語音、音效及環(huán)境音的視頻。語音當(dāng)前支持生成中文以及英文,生成視頻長度最長支持10秒。
該升級重構(gòu)了傳統(tǒng)AI視頻創(chuàng)作「先生成無聲的視頻,再結(jié)合其他軟體完成後期聲音製作」的工作流,創(chuàng)作者使用可靈2.6模型,能夠直接生成包含人聲、環(huán)境與效果音效的視頻,極大提升了創(chuàng)作者的工作效率。
通過對物理世界聲音與動(dòng)態(tài)畫面的深度語義對齊,可靈2.6模型在音畫協(xié)同、音頻質(zhì)量和語義理解上表現(xiàn)亮眼。
音畫協(xié)同上,可靈2.6模型生成的視頻,在語音節(jié)奏、環(huán)境音與畫面動(dòng)作上緊密呼應(yīng),實(shí)現(xiàn)了對畫面動(dòng)態(tài)與聲音節(jié)奏的深度對齊,避免了傳統(tǒng)工作流可能產(chǎn)生的「畫面一套、聲音一套」的割裂體驗(yàn)。
音頻品質(zhì)上,在支持人聲、音效、環(huán)境聲等多類型聲音生成的基礎(chǔ)上,生成的音頻音質(zhì)更乾淨(jìng)、層次更豐富,整體聽感更接近真實(shí)的混音效果,滿足專業(yè)級創(chuàng)作對聲音細(xì)節(jié)的高要求。
語義理解上,該模型對多種場景下的文本描述、口語表達(dá)和複雜劇情有較強(qiáng)的語義理解能力,能夠更準(zhǔn)確地把握創(chuàng)作者意圖,從而輸出邏輯更嚴(yán)密、更貼合用戶需求的音畫內(nèi)容。同時(shí),可靈2.6模型在中文語音生成效果上保持全球領(lǐng)先。
一鍵「音畫同出」 廣告營銷、自媒體、電商等創(chuàng)作場景迎來效率革命
可靈2.6模型支持的聲音類型包括說話、對話、旁白、唱歌、Rap、環(huán)境音效、混合音效等多種聲音的單獨(dú)或混合生成,能夠廣泛地應(yīng)用於廣告營銷、自媒體、電商等行業(yè)的視頻內(nèi)容創(chuàng)作,極大提升創(chuàng)作效率。
例如在廣告營銷行業(yè),可靈2.6模型能夠一鍵生成含有旁白介紹、演員對白、商品展示等綜合聲音效果的廣告短片,極大降低廣告片拍攝的成本,提升效率。
在自媒體領(lǐng)域,可靈2.6模型的應(yīng)用則更加廣泛。通過多人對白能力,創(chuàng)作者可以創(chuàng)作包含訪談節(jié)目、劇情演繹、搞笑短劇等多類型的內(nèi)容創(chuàng)作,還可以借助模型的音樂表演能力,進(jìn)行唱歌、說唱表演、樂器演奏等類型的內(nèi)容創(chuàng)作。運(yùn)用可靈2.6模型,可大幅度降低自媒體創(chuàng)作者的創(chuàng)作成本與難度。
在電商領(lǐng)域,通過單人獨(dú)白、旁白解說等能力,可靈2.6模型能夠完成商品展示、產(chǎn)品講解等電商領(lǐng)域的視頻內(nèi)容創(chuàng)作,提升商家的經(jīng)營效率。
可靈2.6模型的推出,進(jìn)一步降低了內(nèi)容創(chuàng)意行業(yè)視頻創(chuàng)作的成本與難度,未來可靈AI也會(huì)持續(xù)開發(fā)更多實(shí)用功能,為創(chuàng)作者提供更優(yōu)質(zhì)、便捷的AI視頻創(chuàng)作工具。
關(guān)於快手
快手作為中國乃至全球領(lǐng)先的內(nèi)容社區(qū)及社交平臺,致力於成為全球最癡迷于為客戶創(chuàng)造價(jià)值的公司。作為一家以人工智能為核心驅(qū)動(dòng)和技術(shù)依託的科技公司,快手專注於通過持續(xù)的技術(shù)創(chuàng)新和產(chǎn)品升級,不斷豐富服務(wù)和應(yīng)用場景,為客戶創(chuàng)造價(jià)值。在快手,用戶通過短視頻和直播來記錄和分享他們的生活,發(fā)現(xiàn)所需,發(fā)揮所長。通過與內(nèi)容創(chuàng)作者和企業(yè)緊密合作,快手提供的技術(shù)、產(chǎn)品和服務(wù)可滿足用戶的多元化的需求,包括娛樂、線上營銷服務(wù)、電商、本地生活、遊戲等。
前瞻性聲明
除過往事實(shí)的陳述外,本新聞稿載有若干前瞻性陳述。前瞻性陳述一般可透過所使用前瞻性詞彙識別,例如「或會(huì)」、「可能」、「可」、「可以」、「將」、「將會(huì)」、「預(yù)期」、「認(rèn)為」、「繼續(xù)」、「估計(jì)」、「預(yù)計(jì)」、「預(yù)測」、「打算」、「計(jì)劃」、「尋求」或「時(shí)間表」。該等前瞻性陳述受風(fēng)險(xiǎn)、不確定因素及假設(shè)的影響,可能包括業(yè)務(wù)展望、財(cái)務(wù)表現(xiàn)預(yù)測、業(yè)務(wù)計(jì)劃預(yù)測、發(fā)展策略及對我們行業(yè)預(yù)期趨勢的預(yù)測。該等前瞻性陳述是根據(jù)本集團(tuán)現(xiàn)有的資料,亦按本新聞稿刊發(fā)之時(shí)的展望為基準(zhǔn),在本新聞稿內(nèi)載列。該等前瞻性陳述是根據(jù)若干預(yù)測、假設(shè)及前提作出,當(dāng)中許多涉及主觀因素或不受我們控制。該等前瞻性陳述或會(huì)證明為不正確及可能不會(huì)在將來實(shí)現(xiàn)。該等前瞻性陳述涉及大量風(fēng)險(xiǎn)及不明朗因素。鑒於上述風(fēng)險(xiǎn)及不明朗因素,本新聞稿內(nèi)所載列的前瞻性陳述不應(yīng)視為董事會(huì)或本公司聲明該等計(jì)劃及目標(biāo)將會(huì)實(shí)現(xiàn),故投資者不應(yīng)過於依賴該等陳述。除法律要求的情形外,我們並無責(zé)任公開發(fā)佈可能反映本新聞稿日期後發(fā)生的事件或情況或可能反映意料之外事件的該等前瞻性陳述的任何修訂。
投資者及媒體問詢
快手科技
投資者關(guān)係
郵箱:ir@kuaishou.com

繁體中文知識庫正在建設(shè)中,請您選擇簡體中文或英文版查看。
Copyright © 2025 美通社版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載.
Cision 旗下公司.