
來源:融中財經(ID:thecapital) 作者:王濤
人工智能浪潮的掀起,世界正迎來一場前所未有的技術革命。
從(cong) 20世紀50年代開始人工智能技術誕生至今,已經先後四次引起大規模的關(guan) 注。而如今正處在第四次的大模型時代,前三次分別為(wei) 專(zhuan) 家係統時代、機器學習(xi) 時代和深度學習(xi) 時代。
後世之人如果要回顧這次的大模型時代,ChatGPT一定是一個(ge) 繞不開的名字。2022年時,Open AI研發的ChatGPT-3.5橫空出世,技驚四座,無論是寫(xie) 代碼論文還是寫(xie) 詩作畫,吹拉彈唱樣樣精通。
由於(yu) ChatGPT帶起了一股技術熱潮,全國各大科技公司開始紛紛投入資源和人力,開發自己的大模型產(chan) 品,並在不同的場合進行展示和推廣,百模大戰也就此揭開帷幕,標誌AI技術開始邁入新紀元。
時至今日,AI技術的迭代速度和應用廣度均達到了前所未有的高度,每次技術的突破,都為(wei) 人類的生活帶來了翻天覆地的變化。如果回溯中國大模型的發展曆程,記者認為(wei) 起始點為(wei) 2022年年底,彼時國內(nei) 高校率先發布大模型產(chan) 品,比如複旦MOSS、北大ChatExcel測試版、清華大學“chatglm-6B”大模型、上海交通大學研發的“兆言”大模型、東(dong) 北大學的“TechGPT”……高校的湧入打響了這場百模大戰的前奏。
各大高校打響第一槍後,一場關(guan) 於(yu) AI的創業(ye) 浪潮爆發。一時之間,優(you) 秀創業(ye) 者和科技大廠共同湧入此賽道,百模大戰正式打響。
最先的響應者包括百度的文心一言、360智能大模型1.0、智譜AI ChatGLM,後續跟進者包括商湯日日新、阿裏巴巴通義(yi) 千問、昆侖(lun) 萬(wan) 維天工、訊飛星火認知、百川智能Baichuan-7B……根據彼時發布的算法備案,10億(yi) 級參數規模以上的大模型已發布79個(ge) ,境內(nei) 累計41款算法完成深度合成服務算法備案。
值得一提的是,在此期間一係列地方政策開始落地,比如《北京市促進通用人工智能創新發展的若幹趨勢》、《深圳市加快推動人工智能高質量發展高水平應用行動方案》等。一係列支持政策的落地也為(wei) 這場百模大戰再添一把烈火。
眾(zhong) 所周知,競爭(zheng) 會(hui) 推動高質量發展,在這場百模大戰中,AI產(chan) 品更新迭代湧入快車道。大廠在持續加碼,像“月之暗麵”這樣的新玩家也在持續入局。
到今天,這場百模大戰已經持續一年有餘(yu) ,激進期向穩定發展期轉化,目前百模大戰中通用大模型呈現寡頭競爭(zheng) 格局。“四龍六虎”以及大廠加持下的大模型脫穎而出。
但是,這也意味著湧入決(jue) 賽圈玩家們(men) 之間的廝殺會(hui) 更加激烈。
目前,百模大戰朝新方向轉變,此前拚技術的玩家們(men) 必須直麵落地商業(ye) 化的難題。最近,AI圈就有傳(chuan) 聞,由於(yu) 融資降溫,估值卻又在不斷推高的背景之下。大模型公司開始變得舉(ju) 步維艱,大模型六虎開始有人放棄大模型研發轉向應用。浪漫的技術遇上現實的求生難題,而是事實上 ,根據數據,國內(nei) 外都已經出現了不少宣布破產(chan) 的AI企業(ye) 。這其中也不乏有一些研發實力強勁的,但最終倒在了沒有後續資金的困難上,畢竟大模型是個(ge) 極度燒錢的賽道。
滾滾長江東(dong) 逝水,浪花淘盡英雄。這條大模型賽道每天都有優(you) 秀的企業(ye) 在萌芽,也每天都有企業(ye) 在敗退邊緣求生。對於(yu) 大模型企業(ye) 來說,變,則生,不變,則死。
百模大戰進入新局勢,放眼如今的競爭(zheng) 者們(men) ,誰又將成為(wei) 贏家,獨領風騷呢?
百花齊放,百家爭(zheng) 鳴
截至目前,國內(nei) 至少已有200多家大模型廠商推出了各自的產(chan) 品。
這其中包括有互聯網大廠,如百度、阿裏、騰訊、華為(wei) 等;還有垂直於(yu) AI領域的老牌廠商,如以四小龍為(wei) 代表的商湯科技、曠視科技、雲(yun) 從(cong) 科技、依圖科技等;還有一批有出色實力的新秀選手,比如六小虎智譜 AI、百川智能、月之暗麵、零一萬(wan) 物、Minimax和階躍星辰。
互聯網大廠:
騰訊混元大模型是由騰訊公司研發的大語言模型,其智元體(ti) 平台為(wei) 騰訊元器。作為(wei) 騰訊全鏈路自研的通用大語言模型,其參數規模超過萬(wan) 億(yi) ,目前提供hunyuan-pro:萬(wan) 億(yi) 參數版本、hunyuan-standard:千億(yi) 參數版本、hunyuan-lite:百億(yi) 參數版本等 3 個(ge) 版本。
通義(yi) 千問大模型是由阿裏雲(yun) 自主研發的大語言模型,智元體(ti) 平台包括阿裏雲(yun) 、ModelScopeGPT、釘釘AI助理等。通義(yi) 千問具備強大的語言理解、生成和推理能力,支持多語言對話和圖片文本識別,廣泛應用於(yu) 智能搜索引擎、問答係統和智能對話係統等領域,參數規模從(cong) 18億(yi) 到720億(yi) 不等。
字節跳動的雲(yun) 雀大模型是一款基於(yu) 注意力機製的深度學習(xi) 語言模型,適用於(yu) 處理自然語言處理任務。具有良好的並行性和效率,能夠在大規模數據集上進行訓練。雲(yun) 雀大模型的參數規模為(wei) 1300億(yi) ,是目前國內(nei) 最大的中文預訓練模型之一。雲(yun) 雀大模型的智能體(ti) 平台包括Coze、豆包、飛書(shu) 智能夥(huo) 伴。
老牌廠商:
商湯科技:日日新SenseNova大模型是AI四小龍中的商湯科技所推出的大模型。該大模型體(ti) 係以低成本、高效率打通了各類AI應用,提供包括:麵向辦公場景的商湯日日新·商量語言大模型-數據分析版本、麵向醫療場景的日日新·商量語言大模型-醫療版本“大醫”……商湯“日日新·商量大語言模型”已在金融、手機、醫療、汽車、地產(chan) 、能源、傳(chuan) 媒、工業(ye) 製造等眾(zhong) 多垂直行業(ye) ,已與(yu) 超過500家客戶建立深度合作,加速行業(ye) 企業(ye) 的智能化轉型。
曠視科技:“曠視太乙”是曠視科技推出的一款生成式人工智能大模型,具備深度學習(xi) 和推理能力。該模型的應用場景包括城市治理、智慧物流、智慧金融等多個(ge) 領域,能夠提供高效、智能的解決(jue) 方案,幫助企業(ye) 和城市實現數字化轉型和智能化升級。
雲(yun) 從(cong) 科技:雲(yun) 從(cong) 科技推出的從(cong) 容大模型包含但不限於(yu) 語言大模型、視覺大模型、語音大模型、代碼生成大模型以及圖像生成大模型等,它通過實時學習(xi) 並同步反饋結果,可以解決(jue) 諸多AI應用的痛點,從(cong) 而有利於(yu) 快速普及個(ge) 性化應用。同時,其具備上下文學習(xi) 能力,能夠以更好的交互性能,應用於(yu) 金融、安防、政務、交通、能源、教育、醫療、文娛等行業(ye) 領域。
依圖科技:“天問”大模型是上海依圖網絡科技有限公司在2023年底首發的一款多模態大模型,是視頻監控領域內(nei) 第一個(ge) 商用發布的大模型產(chan) 品,基於(yu) 先進的Transformer架構,具有會(hui) 思考、可對話、能進化的三大特點
實力新秀:
月之暗麵:Kimi 是大模型初創企業(ye) 月之暗麵科推出的智能助手產(chan) 品,在自然語言處理、長文本處理、多語言對話支持等方麵占據優(you) 勢。後續通過社交媒體(ti) 平台,在用戶爭(zheng) 奪戰中占據了先機。
百川智能:百小應是百川智能於(yu) 2024 年 5 月 22 日推出的首款 AI 助手,它基於(yu) 百川智能最新發布的基座大模型 Baichuan 4,具備多輪搜索與(yu) 定向搜索、文件閱讀與(yu) 資料整理、智能交互、多模態能力、語音交互、Web 端和移動端應用等能力。此外,百川智能以醫療AI為(wei) 核心業(ye) 務。近期發行的AI健康顧問證明公司正在圍繞醫療應用場景發力,探索醫療增強大模型的用戶價(jia) 值和產(chan) 業(ye) 價(jia) 值
智譜AI:被稱為(wei) 國內(nei) 最有Open AI氣質的大模型企業(ye) 。智譜清言是北京智譜華章科技有限公司推出的一款生成式 AI 助手,基於(yu) 智譜 AI 自主研發的中英雙語對話模型 ChatGLM2,經過萬(wan) 億(yi) 字符的文本與(yu) 代碼預訓練,並采用有監督微調技術。
Minimax:Minimax專(zhuan) 注於(yu) 圖像識別和計算機視覺技術,旗下出品的海螺AI基於(yu) MiniMax自研的多模態大模型,融合了自然語言處理、知識圖譜、語音識別等多種AI技術,賦予了海螺AI強大的語義(yi) 理解和知識推理能力。此外,Minimax還有AI陪伴產(chan) 品“星野”。
零一萬(wan) 物:科技圈大佬李開複博士創立的AI企業(ye) 。旗下大模型產(chan) 品包括Yi-34B、Yi-Lightning、Yi-Large等。應用場景包括但不限於(yu) 智能問答、智能讀文檔、自動分析和理解文檔內(nei) 容、PPT自動化生複雜推理和預測。
階躍星辰:此前的大模型格局是四龍五虎,近期開始變成四龍六虎。多出來的第六隻老虎,是在今年6月,由前微軟全球副總裁薑大昕創辦的階躍星辰。該企業(ye) 是目前資本市場的新寵兒(er) ,以一輪估值20億(yi) 美元的融資躋身進AI獨角獸(shou) 的寶座,由此奠定他第六隻小虎的地位。其推出的“Step係列”通用大模型,讓業(ye) 內(nei) 人士眼前一亮,其Step-2萬(wan) 億(yi) 參數MoE語言大模型,更是國內(nei) 首家發布。
國外AI主流玩家們(men)
過去的兩(liang) 年裏,國內(nei) 外的AI大模型領域都迎來了迅猛的發展和創新。國內(nei) 有百家爭(zheng) 鳴,百花齊放的盛狀;而美國也有如OpenAI、Anthropic、Meta、Google等企業(ye) 紛紛推出了新一代的大模型產(chan) 品。
OpenAI:由山姆·奧爾特曼等人創立,科技巨頭微軟作為(wei) 最大投資者,Open AI也是目前全球範圍內(nei) 公認的最強AI企業(ye) 。旗下產(chan) 品包括GPT-3.5、GPT-4、GPT-4o等。其中GPT-4o作為(wei) OpenAI最新產(chan) 品也被業(ye) 界稱作Open AI有史以來最好的模型,支持跨文本、音頻和視頻進行實時推理——能聽、能說、能看、零延時、可打斷等功能
Anthropic:由OpenAI前研究副總裁達裏奧·阿莫迪、大語言模型GPT-3論文的第一作者湯姆·布朗等人共同創立。前世界首富貝佐斯的亞(ya) 馬遜已對其投資40億(yi) 美元,並持有少數股權。旗下產(chan) 品包括Claude 1、Claude 2 、Claude 3以及Claude 3.5 Sonnet。最新產(chan) 品Claude 3.5 Sonne在2024年6月發布,該產(chan) 品在基準測試中超越了GPT-4o,同時推出了Artifacts功能,增強了用戶與(yu) 模型的交互,使用戶能夠實時查看、編輯並基於(yu) Claude的創作進行構建。
Meta:美國知名互聯網公司,創建者為(wei) 紮克伯格,旗下AI產(chan) 品為(wei) LLaMA係列,特別適用於(yu) 學術研究和開發者社區。2024年7月發布的最新產(chan) 品LLaMA 3.1是目前最大的開源模型之一,支持128K的上下文長度。LLaMA 3.1 在多模態處理、數學推理等方麵表現出色,進一步鞏固了其在開源社區中的領先地位。
Google:作為(wei) 頂級科技公司的穀歌,早在2006就提出了構建人工智能專(zhuan) 用基礎設施的想法,並組建了Google X實驗室人工智能開發團隊。算是最早入局AI的企業(ye) ,目前旗下產(chan) 品為(wei) Gemini 係列。此外,Google還推出了專(zhuan) 為(wei) 設備端優(you) 化的Gemini Nano版本,能夠在androids設備上高效運行,進一步拓展了模型的應用場景。2024年5月,Google在其開發者大會(hui) 上展示了即將發布的Gemini 2係列。這一係列模型通過使用更強大的TPU v5p芯片進行訓練,大幅提升了計算速度和能效比。Gemini 2不僅(jin) 在多模態任務上表現出色,還進一步擴展了支持的語言和應用場景,預示著Google在大模型領域的持續發展。
在技術成熟度方麵,美國AI人工智能的發展起步較早,技術積累深厚。以OpenAI的GPT係列模型為(wei) 例,其在自然語言處理領域的突破,引領了全球AI技術的發展潮流。相比之下,國內(nei) 雖然在大模型領域取得了顯著進展,但與(yu) 國際領先水平仍有一定差距。尤其是在大模型的訓練、優(you) 化和應用方麵,國內(nei) 尚需進一步提升。而在應用落地方麵,國外AI人工智能的應用範圍廣泛,涉及醫療、金融、教育、辦公等多個(ge) 領域。比如,美國開發的BloombergGPT大模型在金融領域得到深入應用,微軟的Office 365 Copilot則開啟了辦公生產(chan) 力革命。而在國內(nei) ,AI人工智能的應用主要集中在互聯網等少數領域,缺乏具有廣泛影響力的商業(ye) 化應用。
截至目前為(wei) 止,中美都孕育了眾(zhong) 多表現出色的大模型獨角獸(shou) 。這些企業(ye) 都在本土市場展現出了強大的創新能力和市場活力,成為(wei) 全球AI技術發展的領頭羊。而跳出中美,盡管獨角獸(shou) 的出現並不頻繁,但它們(men) 依然如一顆顆閃耀的珍珠,在各自地區發光發亮。
Mistral AI於(yu) 2023年4月在發過巴黎成立,由前DeepMind和Meta的科學家共同組建,主要聚焦開源模型及企業(ye) 級服務。Mistral AI開源的Mistral係列大模型受到了業(ye) 界的廣泛讚譽。2024年4月,Mistral AI推出了全新專(zhuan) 家混合(MoE)大模型Mixtral8x22B磁力鏈接。該模型在文本生成、問答理解等方麵表現出色。Mixtral8x22B的具體(ti) 特點包括對64K超長上下文的支持,多語言能力,尤其在法語、德語、西班牙語等語言上表現流暢,以及采用Apache2.0開源協議等。據悉,Mistral AI與(yu) 微軟也建立了長期合作夥(huo) 伴關(guan) 係,利用Azure AI的超級計算基礎設施進行模型訓練,共同為(wei) 客戶提供MIstral AI的模型服務,成為(wei) 繼OpenAI後第二家在微軟Azure雲(yun) 平台上提供商業(ye) 語言模型的公司。
歐洲大陸的另一個(ge) 工業(ye) 大國德國,同樣也有自己的“Open AI”。成立於(yu) 2019年的人工智能初創公司Aleph Alpha,將自身定位為(wei) 歐洲本地AI技術的領導者。2023年,Aleph Alpha在資本市場上取得了顯著成就,當年6月,Aleph Alpha獲得1億(yi) 歐元A+輪融資,晉級德國AI獨角獸(shou) 。2023年底,Aleph Alpha宣布完成超5億(yi) 美元規模的B輪融資。該輪融資的投資方主要來自於(yu) 德國本土,由創新園人工智能(Ipai)、博世風險投資(BoschVentures)和施瓦茨集團(SchwarzGroup)的公司領投。Aleph Alpha主打“數據主權”的概念,即存儲(chu) 在某個(ge) 國家的數據受該國法律的約束,以確保數據的安全性。其生成式人工智能解決(jue) 方案致力於(yu) 為(wei) 企業(ye) 和政府提供突破性的人工智能技術。技術層麵上,Aleph Alpha自研的Luminous係列大語言模型,與(yu) ChatGPT的功能類似,提供生成文本/代碼、總結內(nei) 容、翻譯等服務。
除上述之外,估值50億(yi) 美元的加拿大多倫(lun) 多企業(ye) Cohere、由印度知名企業(ye) 家巴維什・阿加瓦爾創建的Krutrim、以色列AI大模型公司AI21 Labs……這些都是知名的AI獨角獸(shou) 企業(ye) 。
閉源與(yu) 開源之爭(zheng)
在目前千萬(wan) 計的大模型報道中,閉源與(yu) 開源一次被廣泛使用。而這二者究竟是什麽(me) ?又究竟有何區別呢?
開源大模型和閉源大模型都作為(wei) 大模型的兩(liang) 種主要技術形態,其各自擁有獨特魅力和應用場景。
開源大模型是指由開源社區或組織開發、維護和共享的大型軟件模型。其最大的特點在於(yu) 開放性和可擴展性,即代碼和模型結構公開可用,任何人都可以訪問、修改和使用。
而閉源大模型與(yu) 開源大模型相反,其代碼和結構是私有的,僅(jin) 由特定的組織或個(ge) 人擁有並維護。這種模型通常用於(yu) 保護知識產(chan) 權、商業(ye) 機密和競爭(zheng) 優(you) 勢,因此其定製和修改的程度可能受到一定限製。
乍一看,似乎開源大模型的優(you) 勢遠遠強於(yu) 閉源大模型。但目前市場觀點認為(wei) ,在AI最難且最重要的商業(ye) 化領域上,閉源大模型更有優(you) 勢。
市場觀點認為(wei) ,閉源模型是商業(ye) 化模型。開源模型效率不行,無法解決(jue) 算力問題;開源模型成本反而更高;開源模型對技術要求更高……
開源模型因其並未開放訓練源代碼、預訓練和精調數據等影響模型效果的關(guan) 鍵信息,所以無法像開源軟件一樣,靠社區開發者一起參與(yu) 來提升效果和性能,而基座模型的訓練隻能掌握在廠商自己手裏。
百度的CEO李彥宏就是閉源大模型的資深支持者。今年七月的2024年人工智能大會(hui) 期間,李彥宏發表“開源模型是智商稅的言論。”他認為(wei) ,在同樣參數規模下,開源模型的能力不如閉源,“如果開源模型想要在能力上追平閉源模型,就需要更大的參數規模,這將導致更高的推理成本和更慢的反應速度。”
而這也並不是這位大佬第一次發出這樣的聲明。在此前,他就提出開源大模型會(hui) 越來越落後的觀點。而這在不久後就立刻遭到紅衣教主,360CEO周鴻禕的強烈反對。
而事實上,大佬們(men) 對於(yu) 開源還是閉源的爭(zheng) 論還有很多案例,也有像王小川“開源和閉源並非像手機中ioses和安卓必須二選一情況”的中立觀點。這些路線之爭(zheng) ,背後往往是商業(ye) 路線的分歧。
但就目前來講,似乎閉源模型的產(chan) 業(ye) 化和商業(ye) 化能力似乎更強。大模型與(yu) 業(ye) 務結合,需要產(chan) 品、運營、測試工程師等多種角色共同參與(yu) ,同時大模型的長期應用所需的算力、存儲(chu) 、網絡等配套都要跟上,開源社區無法幫助用戶“一站式”解決(jue) 這些細節問題。
此外,閉源大模型的整體(ti) 能力似乎強於(yu) 開源。OpenAI的GPT-4、Anthropic的Claude-3、穀歌的Gemini Ultra都是閉源。
而回到國內(nei) 百模大戰中去看,大多數都是以開源和閉源雙向發展的路徑。比如百川智能、零一萬(wan) 物、阿裏商湯、智譜……但也有像百度和月之暗麵這樣專(zhuan) 攻閉源大模型的存在。
百度一直是主攻閉源大模型的選手,目前為(wei) 止,雖然百度文心一言仍堅持閉源路線,但百度智能雲(yun) 部門在其平台上提供了大量性能很強的第三方開源大模型。百度通過閉源文心一言,也通過開源大模型使用的算力、工具和服務,來實現商業(ye) 上的收益。
而與(yu) 百度相反,阿裏雲(yun) 則正在大力推廣開源,一方麵是為(wei) 了加快市場份額的爭(zheng) 奪;另一方麵作為(wei) 雲(yun) 計算企業(ye) ,它可以在算力、工具和服務上獲得收益。
華為(wei) 雲(yun) 2023年在推出盤古大模型3.0時,就表態采用閉源路線。過去一年,它的重心是在各行業(ye) 進行聯創,落地大模型,並將技術回饋盤古,不斷迭代,未參與(yu) 業(ye) 界開閉源討論。華為(wei) 雲(yun) 在上周也剛剛官宣盤古5.0多模態大模型,發布期間也未涉及開源問題。
實力新秀智譜,也是國內(nei) 最早開源大模型的企業(ye) 。由於(yu) 旗下研究的GLM開源大模型而獲得大量關(guan) 注,也讓這家2019年才成立的公司,在融資和商業(ye) 化上受益頗多。因為(wei) 智譜由清華技術成果轉化而來,2022年,它就將開發的雙語千億(yi) 模型GLM-130B開源,“當時全國懂大模型的研究員加起來也不過百來人”。智譜CEO張鵬稱,開源讓大家知道智譜在做什麽(me) ,同時可以讓更多人參與(yu) 推動大模型。此後在2023年3月,智譜將GLM6b開源,該模型在Hugging Face上的下載量超過1600萬(wan) 。
另一位新秀月之暗麵,則是閉源大模型的擁護者。掌門人楊植麟堅定表示將專(zhuan) 注 ToC,並會(hui) 以長文本輸入為(wei) 核心構建其底座大模型的差異化競爭(zheng) 力。他認為(wei) 這是行業(ye) 現在最需要解決(jue) 的問題,也是通往下一步產(chan) 品化路上的最大卡點。
而對於(yu) 開源和閉源,楊植麟認為(wei) 像 OpenAI 一樣的閉源是通往Super APP(超級應用)的唯一通路,而開源隻是 ToB 的獲客手段。“凡要做 C 端超級 APP 的,都是閉源。”
從(cong) 楊植麟的回答中,或許可以得出閉源與(yu) 開源的選擇或許是基於(yu) 大模型企業(ye) 頂下的商業(ye) 路線是主To C還是Tp B。
百舸爭(zheng) 流 奮楫者先
在數字化浪潮的推動下,百模大戰堪稱人工智能領域一場前所未有的盛事。這場賽事匯聚了全國頂尖的人工智能研發團隊,他們(men) 攜帶著各自精心打造的模型,準備在這場科技盛宴中一展身手。這些模型,如百餘(yu) 艘船隻,在算法的海洋上展開激烈的角逐,展示它們(men) 在圖像識別、自然語言處理、機器學習(xi) 等眾(zhong) 多領域的卓越能力。
大模型時代並不同於(yu) 前三個(ge) 時代,由於(yu) 大模型通用性的特征,其發展十分有望實現商業(ye) 閉環。也因此,在這個(ge) 大模型時代,吸引了眾(zhong) 多玩家湧入賽道競爭(zheng) ,形成百花齊開,百舸爭(zheng) 流的現象。
另一方麵,大模型的市場規模也在持續擴大,資本熱度攀升。在2023年時,國內(nei) 語言大模型的市場規模就突破了100億(yi) 元,並還在繼續上升中。市場規模的擴大為(wei) 這場激烈的百模大戰再添一把火。
目前整個(ge) 大模型賽道處於(yu) 高擁擠的狀態,而對於(yu) 大模型來說至關(guan) 重要的算力等其他資源卻是有限的。隨著市場競爭(zheng) 的日益激烈,算力等資源會(hui) 呈現供需失衡的狀態並出現資源配置傾(qing) 斜。再加上算力成本的不斷上漲,導致大模型玩家們(men) 必須積極競爭(zheng) 來構建優(you) 勢,以此來獲得資源的長期發展和支持。
這也是為(wei) 什麽(me) 業(ye) 界有了“百模大戰,必有一戰”的說法。
如今,這場百模大戰已持續一年有餘(yu) ,戰事正逐漸往新的階段升級。
有一個(ge) 十分明顯的預兆,大模型融資已經在開始慢慢降溫了。
今年伊始,Open AI推出Sora掀起國內(nei) 外視頻大模型的鏖戰。在那段時間,幾乎沒多久就會(hui) 有大模型企業(ye) 融資的消息傳(chuan) 出。而到了6月,似乎一切都改變了。資本的眼球被具身智能等賽道吸引,大模型的融資數量較去年略有下降,開始有降溫跡象的出現。
大模型的發展需要大量資源和算力的消耗,在這種邏輯下,金錢就成了唯一入場券。可是現在大模型技術的進展卻與(yu) 預期差距很大。投資人投入入巨額資金後,何時見效尚未可知,這也引起大多數投資人的焦慮心理。種種之下,如今的降溫現象似乎順理成章。
這樣的境地也迫使大模型人士開始繼續思考未來的商業(ye) 化問題,浪漫的技術研發逐漸向艱苦的落地求生轉化。由此,引發了一係列新的競爭(zheng) 。
首當其衝(chong) 的,就是大模型之間的價(jia) 格戰。
據融中財經記者不完全梳理,目前為(wei) 止已有超過7家大模型企業(ye) 參戰。包括字節跳動、阿裏雲(yun) 、百度、騰訊、智譜AI、科大訊飛等。
根據記者梳理,今年5月11日,大模型獨角獸(shou) 智譜AI宣布其入門級模型GLM-3 Turbo的API降價(jia) 為(wei) 1元/百萬(wan) tokens。5月15日,字節宣布旗下通用模型豆包pro-128k版模型推理輸入價(jia) 格降至比行業(ye) 價(jia) 格低95.8%,豆包pro-32k模型推理輸入降至比行業(ye) 價(jia) 格低99.3%。5月21日,阿裏雲(yun) 宣布旗下9款大模型全麵降價(jia) ,降幅最高達到97%,兩(liang) 款開源模型更是開啟七天限免。幾個(ge) 小時後,百度直接宣布兩(liang) 款輕量級模型ERNIE Speed、ERNIE Lite免費開放。隨後,又有兩(liang) 位玩家入局。先是科大訊飛宣布輕量級模型API永久免費開放。後又有騰訊雲(yun) 宣布混元-lite即日起免費,其他模型降幅最高達到87.5%。
一大基本現實是:當前,國內(nei) 並沒有出現真正的殺手級大模型應用。國內(nei) 頭部大模型玩家們(men) 在整體(ti) 能力差異上,可能並不存在絕對領先的情況,大家都是處於(yu) 趨同的存在,有的隻是在能力上的各有特點與(yu) 側(ce) 重。
這樣的現實之下,如果其他大模型廠商們(men) 不跟進阿裏、百度、字節、騰訊的這一波價(jia) 格戰,最終的結局就可能是被市場淘汰。畢竟在當前現實下,想要維持原本價(jia) 格本已是一件難事兒(er) ,更何況當前這幾大大模型廠商已經開始讓用戶嚐到了更便宜乃至免費的滋味了。當你走進這歡樂(le) 場,悲傷(shang) 所有的夢與(yu) 想,各色的臉上各色的妝,沒人記得你的摸樣。
另外,在新時代下,大模型正在從(cong) 拚參數到卷應用上。
百度的“文心一言”專(zhuan) 注於(yu) 內(nei) 容創作和教育服務,為(wei) 媒體(ti) 和廣告行業(ye) 提供高效的文案支持,並在教育領域成為(wei) 學生的智能學習(xi) 夥(huo) 伴。科大訊飛的“星火”大模型在教育和醫療領域展現出其獨特的價(jia) 值,為(wei) 學生提供定製化的學習(xi) 方案,並輔助醫生進行精確的醫療決(jue) 策。昆侖(lun) 萬(wan) 維的“天工”大模型則專(zhuan) 注於(yu) 遊戲產(chan) 業(ye) ,能夠自動生成遊戲內(nei) 容並進行智能運營。智譜AI在構建與(yu) Open AI相匹敵的模型產(chan) 品的同時,通過提供API和雲(yun) 服務私有化部署等方案,在科研領域為(wei) 研究人員提供文獻檢索和分析服務;並與(yu) 金融機構合作,進行風險評估和投資決(jue) 策分析。此外,智譜AI還與(yu) 國際科研機構和企業(ye) 共同探索大模型的應用。MiniMax通過麵向消費者和企業(ye) 兩(liang) 端的策略,推出了多種類型的應用。在消費者端,推出了智能聊天助手;在企業(ye) 端,與(yu) 企業(ye) 合作開發智能客服係統和辦公自動化軟件。
隨著大模型技術的日益成熟,其在實際應用中的落地成為(wei) 了衡量技術價(jia) 值的關(guan) 鍵,也是技術商業(ye) 化的重要途徑。目前,大模型行業(ye) 的關(guan) 注點已經從(cong) 模型的開發轉向了應用的實際落地。無論是擁有強大背景的大模型公司,還是新興(xing) 的初創企業(ye) ,都在努力推動應用的發展,目標是打造具有廣泛影響力的應用。
不同的廠商采取了不同的策略。一些廠商通過大量的廣告宣傳(chuan) 來吸引用戶,利用流量優(you) 勢;一些則不斷進行產(chan) 品迭代和優(you) 化,以提升產(chan) 品性能和用戶體(ti) 驗;還有一些采取了麵向消費者和企業(ye) 兩(liang) 端的策略,以擴大市場份額。
落地,是任何技術商業(ye) 化的必要途徑,因為(wei) 它能夠給企業(ye) 帶來直接的經濟回報。這也是為(wei) 什麽(me) 現在的百模大戰從(cong) 曾經的拚參數逐漸轉向到卷應用上去。
說到底,如今的百模大戰不論是打價(jia) 格戰還是卷到應用層,這些都是企業(ye) 們(men) 追求盈利的手段。任何浪漫的技術,都需要先活下來,吃飽飯再去追求理想中的烏(wu) 托邦。
而在這樣的路徑上,大模型企業(ye) 怎麽(me) 才能夠闖出成功之路?唯有努力前進,探索更多大模型落地的可能性。正所謂,百舸爭(zheng) 流,奮楫者先。
