- 時間:2026-02-05
- 來源:科技日報
? ◎本報記者 都 芃
新春臨近,AI產業(yè)競爭日漸升溫。今年以來,百度、阿里、DeepSeek圍繞基礎大模型密集發(fā)布新技術、新產品,加速搶占AI創(chuàng)新制高點。
1月22日,百度上線采用原生全模態(tài)統(tǒng)一建模技術的文心大模型5.0正式版,支持文本、圖像、音頻、視頻等多種信息的輸入與輸出;1月26日,阿里發(fā)布千問旗艦推理模型Qwen3-Max-Thinking,創(chuàng)新推理技術,實現性能躍升;隨后,DeepSeek推出全新DeepSeek-OCR-2模型并開源。業(yè)內專家認為,短時間內,中國AI“進入三足鼎立格局”,創(chuàng)新步伐明顯加快。
基礎大模型的演進決定了AI應用能力的上限。文心大模型5.0正式版以原生全模態(tài)架構引領技術革新,塑造競爭優(yōu)勢。百度相關負責人介紹,與業(yè)界多數采用“后期融合”的多模態(tài)方案不同,文心大模型5.0正式版采用統(tǒng)一的自回歸架構進行原生全模態(tài)建模,將文本、圖像、視頻、音頻等多源數據在同一模型框架中進行聯(lián)合訓練,使得多模態(tài)特征在統(tǒng)一架構下充分融合并協(xié)同優(yōu)化,實現原生的全模態(tài)統(tǒng)一理解與生成。此前公布的LMArena全球大模型競技場榜單中,文心大模型5.0正式版多次位居文本榜和視覺理解榜國內第一,躋身國際第一梯隊。
阿里同樣圍繞千問大模型持續(xù)發(fā)力。其最新發(fā)布的推理模型Qwen3-Max-Thinking采用了一種全新的測試時擴展機制,可在相同上下文中實現更高效的推理計算,獲得更智能的推理結果且更加經濟。除此以外,阿里以應用生態(tài)為抓手,憑借自身流量入口優(yōu)勢,推動千問大模型打通電商、酒旅、支付等自身優(yōu)勢領域,深度接入淘寶、支付寶、飛豬等平臺,實現技術與場景高效協(xié)同。
業(yè)內專家表示,與百度、阿里背靠強大自有業(yè)務生態(tài)全面發(fā)力不同,DeepSeek立足開源優(yōu)勢,專注于模型底層能力與開放生態(tài)建設,通過“模型權重+訓練框架+部署工具”的全棧開源,將性價比優(yōu)勢“發(fā)揮到極致”。
DeepSeek最新推出的DeepSeek-OCR-2采用創(chuàng)新的DeepEncoder V2方法,讓模型可根據圖像含義動態(tài)重排圖像各部分,模擬了人類觀看場景的邏輯流程,使得其在處理復雜圖片時更智能、更有邏輯,展現出獨特的技術創(chuàng)新巧思。
1月29日,對標DeepSeek-OCR-2,百度也迅速發(fā)布并開源了文心衍生模型Paddle OCR-VL-1.5,首創(chuàng)OCR(光學字符識別)模型的“異形框定位”技術,能精準識別拍歪、折角、卷邊的不規(guī)則文檔。
百度相關負責人介紹,作為極少數具備全棧AI能力的企業(yè),百度也在軟硬協(xié)同、場景落地方面有著更為持久的投入,在此輪“頭部玩家”的競爭中展現出強勁韌性。
在底層硬件方面,始于自身業(yè)務對算力的極限需求,百度孵化出的AI芯片品牌昆侖芯走過了從專用到通用、從內部支撐到對外服務的完整路徑,驗證了場景定義芯片的可行性,并于近期啟動獨立上市進程,加速多領域布局。目前,百度已點亮國內首個全自研三萬卡昆侖芯集群,可同時支撐多個千億參數大模型訓練,實現自研算力從“可用”到“規(guī)?;蓮椭啤钡目缭健?/p>
可靠的底層算力、領先的云服務,以及強大的模型能力,催生出更加豐富的產品服務?;谖男幕A大模型,百度構建了矩陣模型和專精模型。矩陣模型面向產品級應用和通用場景快速落地;專精模型面向行業(yè)應用和垂直場景,例如文心數字人大模型已在直播電商等領域實現規(guī)模應用,創(chuàng)造出新的交互體驗與內容形態(tài)。2025年“雙11”期間,數字人直播商品交易總額同比增長91%,開播直播間數增長119%,超10萬商家使用。
自2025年春節(jié)期間DeepSeek走紅以來,中國AI便一直是國際科技領域的熱門話題。經過一年多時間發(fā)展,AI技術正在我國邁入規(guī)?;涞匦码A段,AI的價值也在驅動產業(yè)變革、創(chuàng)造更廣泛社會效益中得到進一步驗證。企業(yè)發(fā)展路徑雖各有不同,但其背后是一條清晰可見的創(chuàng)新能力升級之路,共同推動中國AI產業(yè)從“追趕”邁向“領跑”。



