首頁 >國際 >

圈地產業(yè)鏈 虛擬數(shù)字人的瘋狂 世界微頭條

5月,數(shù)字人的“熱點榜”上一共有三件大事:AI孫燕姿爆火,券商分析師“AI分身”走紅,虛擬歌姬洛天依和因浪姐而走紅的日本歌手美依禮芽的夢幻聯(lián)動。


(資料圖)

在不起眼的地方,還發(fā)生了兩件“小事”。5月16日,小冰公司宣布啟動“GPT克隆人計劃”,官宣的前一天,有著A股“直播電商第一股”之稱的遙望科技與小冰公司開展了合作,目的是為了“推動虛擬人等AI產品在直播行業(yè)的持續(xù)開發(fā)和廣泛應用”。

這幾件事串聯(lián)起了數(shù)字人億萬分身背后龐大的商業(yè)江湖——從虛擬偶像到帶貨直播,面對諸多細分領域的廣闊前景,大廠跑馬圈地,“名利雙收”,小廠雨后春筍,用直售和代理織出細密的銷售網。即便是個人,也能利用技術的“信息差”,做起教程的生意。

“克隆”主播,8000元入門

最短只需3分鐘的數(shù)據(jù),就可以打造源于本人性格、技能、聲音、外貌的AI克隆人,小冰公司的“GPT克隆人計劃”一經推出,便引起了一番熱議。5月22日,遙望科技董事長兼總經理謝如棟剛剛回應,“將盡早讓技術成熟的虛擬人主播們在平臺上和大家見面”。

在直播電商賽道,遙望科技一直顯得有些特殊。更名于“女鞋第一股”星期六,轉型于移動互聯(lián)網,最終以直播帶貨為主業(yè),成功拿下“直播電商第一股”的稱號。財報數(shù)據(jù)顯示,2022年遙望科技核心增長業(yè)務直播電商業(yè)務實現(xiàn)GMV 150億,同比增長約50%。

遙望科技可能是直播行業(yè)里的一個風向標。隨著元宇宙概念而風靡的數(shù)字人,在ChatGPT爆火后,迎來了又一波增長點。聲智科技數(shù)智人產品副總裁黃赟賀稱,制作一個兼具形象和聲音的AI數(shù)字分身的成本因制作方式、技術難度等因素而異,一般來說,成本可能會在幾千元到幾百萬元之間。

各種社交平臺上,數(shù)字人業(yè)務推廣的內容并不罕見。北京商報記者從多位AI數(shù)字人服務商處了解到,數(shù)字人服務通常有兩種,分別為制作特定形象的數(shù)字人和使用服務商提供的系統(tǒng)內置數(shù)字人。

前者大多達成了市場“統(tǒng)一價”8000元,有些服務商則需要在此基礎上按月多加相應的運營費。后者則通常采取按月的方式,根據(jù)質量的不同,價格從每月幾百元到幾千元不等,在諸多商家的系統(tǒng)中,北京商報記者咨詢到的最低“月租”為399元,最高“月租”為5500元,由于形象通用,這種模式也會導致自己的數(shù)字人在市場上趨同。

一家數(shù)字人企業(yè)的創(chuàng)始人向北京商報記者介紹稱,制作特定形象的數(shù)字主播需要獲得被“克隆”人的授權,還要有相應的視頻讓系統(tǒng)學習。此后在平臺輸入語音或者文字,數(shù)字人就會自動進行口型對應。

該創(chuàng)始人介紹,數(shù)字主播背后涉及到的有文本轉語音的TTS技術,以及人工智能對話的自然語言處理NLP技術等,“不過每家公司接入的大模型都不同,有的是自己研發(fā)的,有的是用的別人的”。

另一家數(shù)字人服務商向北京商報記者提到,他所在的公司去年才開始做數(shù)字人,業(yè)務爆發(fā)的時間點則在今年年初。公司大約有20多個員工用自己的個人賬號推廣業(yè)務,有時候一個人一天最多能接到七八十通咨詢電話,算上代理隊伍大約能夠達到300人。

代理似乎也已成為數(shù)字人生意發(fā)展壯大的一個模式。北京商報記者向某服務商了解數(shù)字人定制業(yè)務的前一天,該公司剛剛完成了對北京海淀地區(qū)合伙人的招募,“預計很快就會開始經營”。

據(jù)悉,該企業(yè)將全國各地劃分為5個等級,根據(jù)等級的不同收取10萬-15萬元不等的加盟費,目前所有具體的業(yè)務已經交給合伙人,只能通過相應地區(qū)合伙人進行辦理。價格上直接購買企業(yè)的數(shù)字人一年費用為2.28萬元,定制特定形象的數(shù)字人則需要再加4000元。

打包教程,低至5元

擁有一個數(shù)字人,還有更低成本的“玩法”。在一些電商平臺上,集合了零基礎、無人直播帶貨、AI數(shù)字人虛擬主播教程、自動合成視頻工具等關鍵詞的商品,通常只有幾元錢。

北京商報記者以5元的價格買到了一份上述視頻合集。其中的教程文檔顯示,需要安裝并激活IDM下載工具,確保瀏覽器已啟用IDM擴展后,打開數(shù)字人制作網站。記者打開對方的鏈接,顯示為騰訊智影的會員邀請頁面。

登錄后顯示,用戶獲得了“尊貴智影高級會員”,為期三天,且有視頻轉換時長限制,大約為10分鐘。

隨教程一起打包的,還有賬號搭建及櫥窗申請、如何尋找爆款素材并上架商品、數(shù)字人爆款視頻制作等視頻。這些內容集合在一個叫作“數(shù)字人無人直播訓練營”的文件夾中。

教程顯示,按照“數(shù)字人播報”“選擇人物”“選擇文本驅動,開始制作”“生成預覽”“下載該視頻”的順序,一個完整的數(shù)字人片段就生成了。北京商報記者以一段177字左右的文本進行嘗試,合成視頻長38秒,用時大約5分鐘。

教程特別提示,“制作時一次輸入的字越少越好,字多了慢、卡,可以分多次,一次少些”。

事實上,類似的課程早在ChatGPT走紅后便已經出現(xiàn)在各類平臺上,專業(yè)的課程網站、短視頻課程網站以及各類社交媒體皆在其中。有些網站只需購買單獨的課程,售價幾百到上千元不等,有些則采用會員制,年費百元左右。

近期有媒體報道稱,一些培訓機構利用AIGC割韭菜,“學費一天1萬”令人咋舌。國研新經濟研究院執(zhí)行院長朱克力分析稱,在區(qū)塊鏈、元宇宙、ChatGPT大火時做培訓課、出書的,可能都是同一撥人。或許是這些領域的發(fā)展速度快,市場需求大,因此有很多人都想分一杯羹。但這也可能導致一些不良商家利用熱門話題來進行營銷,而且這些商家可能會采用一些欺騙手段來獲取不當利益。

但凡涉及些技術、運營方面的內容,培訓就很容易成為掙“快錢”的買賣。圍繞著直播帶貨,不久前,一位本地生活服務商還為北京商報記者推薦了一套本地生活培訓課,內容涵蓋直播、探店、短視頻拍攝剪輯、引流等內容。

其中為期7天的培訓課售價9800元,三天的課程需要980元?!拔覀円捕际窃诠窘粚W費學的,要想學透建議報名7天的課程”,目前,該工作人員自己也已經做起了品牌孵化、商家團單推廣、直播團單銷售等生意。

分身,分出了什么

2020年末,財經大V吳曉波曾做過一個預測,每家公司可能都需要一個直播間。兩年后,當吳曉波站在2022年底預測2023年的時候,他做出了一些改變:2023年每家公司可能都需要一個數(shù)字人。

一切似乎都在朝著這個預言的方向演進。從廣義范圍來講,AI孫燕姿、AI券商分析師、虛擬偶像、數(shù)字分身等都屬于數(shù)字人的范疇。如今2023年尚未過半,數(shù)字人便已經在多個具體的領域引爆了話題。

當AI孫燕姿在音樂圈“大殺四方”的時候,金融圈也因一位數(shù)字券商分析師而成為外界關注的焦點。5月12日,招商證券傳媒首席分析師、TMT大組聯(lián)席組長顧佳的AI數(shù)字分身正式曝光。據(jù)悉,顧佳的億萬分身可以同時出現(xiàn)在路演現(xiàn)場、新聞發(fā)布會、研報解讀、分析師電話會等任何客戶需要的地方。

陳帆(化名)是一家數(shù)字人源頭工廠的員工,5月19日,他在自己的朋友圈曬出了一張合同照片,配文顯示,他們的代理商剛剛成交了某券商的客戶。

不久前,美依禮芽也于B站開啟了浪姐后的全網直播首秀,洛天依作為驚喜嘉賓空降直播間。有人感慨,走紅11年,虛擬偶像的頂流依然還是洛天依。

有數(shù)據(jù)顯示,2022年,中國虛擬人帶動產業(yè)市場規(guī)模和核心市場規(guī)模分別為1866.1億元和120.8億元,預計2025年將分別達到6402.7億元和480.6億元,呈現(xiàn)強勁的增長態(tài)勢。2020年中國虛擬偶像市場規(guī)模超645.6億元,預計2023年將達到3334.7億元。

黃赟賀認為,當前虛擬人產業(yè)不斷發(fā)展,出現(xiàn)更逼真的虛擬偶像、虛擬直播主播等。隨著計算機視覺、語音合成等技術的進步,數(shù)字分身成為可能。它可以通過捕捉真人的面部表情、語音、動作等來形成真人的“數(shù)字化分身”,真正造就了數(shù)字分身的火爆。

黃赟賀提到,數(shù)字人的應用場景廣泛,包括客服、電商、健康服務、教育等行業(yè)領域,可以幫助企業(yè)降本增效,成為企業(yè)數(shù)字化轉型的一種有效方式。

但她也提到,數(shù)字人大規(guī)模商用還是處在一個探索階段,可以借助大型語言模型,如ChatGPT、AzeroGPT的能力,通過AI技術提升數(shù)字人的智能性和交互性,讓數(shù)字人更懂行業(yè)更懂場景,能有效提升行業(yè)的服務能效,能提升落地場景內用戶的交互體驗。

除了AI翻唱和AI直播,數(shù)字人應用也在一些商用場景探索,比如AI外呼數(shù)字人以擬人化語音效果及多輪次流暢交互的效果可有效提升觸達用戶的交流體驗,在樓宇里的AI電梯,數(shù)字人可以實現(xiàn)語音呼梯、廣告推廣、樓層冠名、困梯救援等功能,在文旅景區(qū)里AI數(shù)字人可以進行游線推薦、景點講解,成為游客的專屬“游伴”等。

去年9月,北京商報記者曾現(xiàn)場體驗過聲智科技的AI數(shù)字人智能外呼反欺詐系統(tǒng),很難想象一口標準的京腔和靈活的對答竟出自數(shù)字人。據(jù)介紹,聲智科技依托AzeroGPT壹元模型及聲學感知特色技術,為北京及全國多地公安反詐工作提供AI智能外呼解決方案,致力于為反詐工作作出貢獻。

搶灘數(shù)字人市場

在這些形形色色的人物和故事中,數(shù)字人商家的圖譜也逐漸清晰。騰訊智影是頭部玩家的代表,今年3月底,騰訊正式發(fā)布全新的AI智能創(chuàng)作助手“騰訊智影”,推出了智影數(shù)字人、文本配音、文章轉視頻等AI創(chuàng)作工具。

去年,百度就將AI技術和直播結合了起來,推出了數(shù)字人直播平臺“曦靈”,集數(shù)字人生產、內容創(chuàng)作、業(yè)務配置服務為一體,為各行業(yè)提供虛擬主持人、虛擬員工、虛擬偶像、品牌代言人的創(chuàng)建與運營服務。

大廠之外,一些垂直領域的企業(yè)也獲得了巨大的生長空間。不少數(shù)字人服務商在給北京商報記者介紹產品的時候,通常會把硅基智能拉出來做一番比較。

公開資料顯示,成立于2017年的硅基智能是一家專注于數(shù)字人產品研發(fā)的人工智能企業(yè),截至2020年12月的C輪融資,硅基智能已經獲得9輪融資。從去年開始硅基智能大舉推動數(shù)字人商業(yè)化落地,線上進軍電商直播帶貨、線下覆蓋本地生活場景,勢頭迅猛。

硅基智能創(chuàng)始人司馬華鵬曾放言,到2025年,公司將為全球貢獻1億“硅基勞動力”。艾媒咨詢的統(tǒng)計顯示,2022年一年,虛擬主播(數(shù)字人)企業(yè)注冊增加數(shù)高達948家,增速達68%。

企業(yè)蜂擁而入,數(shù)字人會是一本萬利的生意嗎?當產業(yè)尚處于發(fā)展初期的時候,這個問題或許還不好下一個準確的判斷。

以直播行業(yè)為例,有數(shù)字人服務商直言,AI主播與真人呈現(xiàn)出的效果還是有一定差異的,不可能完全替代,但勝在價格低,可以24小時直播,即便是質量上有劣勢,也可以通過數(shù)量去彌補。

這樣的“數(shù)字人海”戰(zhàn)術,也帶來了直播質量的疑問。調皮電商創(chuàng)始人馮華魁認為,在電商領域,數(shù)字人直播的意義其實并不大。最開始出于新鮮感,可能會獲得一定的關注度,但時間久了,這種機械式的話術還是非常容易被識別出來的,長遠來看商業(yè)價值并不大。

值得一提的是,因為內容質量較低、互動性差,無人直播以及一些非實時直播的錄播內容一直是抖音、快手等平臺的重點關注對象,輕則限流,重則封號。

對此,有數(shù)字人服務商坦言,數(shù)字人直播依然會面臨封號的問題,可以用多設置話術進行解決,即便被封,也可以換一個賬號另起爐灶,“要知道平臺對新號新主播也是有助流計劃的”。

抖音方面給北京商報記者發(fā)來過一條關于虛擬主播的平臺公約暨倡議,其中提到虛擬主播需要提前報備,虛擬主播形象和內容需要前置備案,直播應當具有顯著標識,內容同樣也需遵守社區(qū)規(guī)范,包括不得傳播虛假信息或故意捏造事件博取流量等。

司馬華鵬也曾直面過這個問題,強調他們的產品并非“無人直播”,而是“無真人直播”。在他看來,無論買來做什么,數(shù)字人只能節(jié)省直播團隊費用、設備費用,不意味著可以對直播運營撒手不管。

關鍵詞:

責任編輯:Rex_25

推薦閱讀