最主流的 AI 應用智能體將爆發
作者/ IT 時報記者 孫妍
編輯/ 孫妍
今年年初,Open AI 文生視頻大模型 Sora 橫空出世,這一 " 王炸 " 點燃了整個人工智能界,一些大模型企業趁熱打鐵,一些則捶胸頓足,但是百度卻沒有跟進。
這一年,百度到底在布局什么方向?李彥宏在百度世界 2024 大會上透露了百度大模型過去一年的重點是解決圖像生成幻覺問題,而確定的方向是智能體和產業應用," 智能體是 AI 應用的最主流形態,即將迎來爆發點。"
李彥宏認為百度要做的是搭建一個平臺,讓每一個想法都能迅速、低成本地變為現實能力,也就是讓每個看不懂代碼的人變成 " 程序員 ",迎來一個只靠想法就能賺錢的時代。
大模型的爆發點在哪?
最主流的智能體將爆發
"智能體是 AI 應用的最主流形態,將迎來它的引爆點。" 從李彥宏的定調來看,百度已將智能體作為最重要的戰略方向。
智能體的門檻已經降低到人人都能上手的程度,在文心智能體平臺上,甚至有 11 歲的小學生在創造智能體。同時,智能體是一個天花板很高的方向,可以解決復雜問題,目前文心智能體平臺已經吸引 15 萬家企業和 80 萬名開發者參與。在百度展示的 TOP100 智能體中,既有農民院士智能體等角色類,還有工具、行業、職場、情感、娛樂等多種類型。
那么,智能體主流應用會是什么場景?"公司官方智能體很可能替代官網,成為最直接面向消費者的界面。" 李彥宏認為。
傳統的 PC 官網只能靜態展示公司介紹、產品參數,客服人員也沒辦法針對個性化問題及時給出滿意回答,只能記錄后電話回訪,而智能體卻能代替客服在一秒鐘內給出答案。李彥宏展示了比亞迪官方智能體,它可以根據顧客需求推薦車型,也可以預約試駕等。比亞迪官方智能體上線后,銷售轉化率提升 119%,聯想 AI PC 智能體的 9 月互動率提升 89%。
百度不止想用智能體革了官網的命,還想創造更多 AI 分析師、AI 律師來解決實際問題。百度文庫和百度網盤聯合打造了工具類智能體 " 自由畫布 ",這是一塊由大模型加持的萬能白板。
以前的研報只停留在圖文、圖表階段,但在 " 自由畫布 " 上,新型研報可以加入發布會視頻、電話會錄音等富媒體內容。有了自由畫板,每個孩子都能成為故事主角,和孫悟空一起游覽花果山,生成自己的話本;有了自由畫板,每個人都能成為漫畫家、短視頻導演。
此外,法律智能體 " 法行寶 ",已回答用戶 1660 萬個法律問題,不僅能像專業律師一樣給出解答,還能計算法律賠償金額、撰寫法律文書,并推薦適配律師。
"就像 PC 時代的網站,移動時代的自媒體賬號,智能體將是 AI 時代的內容、服務和信息的新載體。" 在李彥宏看來,不同的是,智能體更像人,更像銷售、客服、助理。
普通人的機會在哪?
迎來一個只靠想法就能賺錢的時代
既然智能體已經打開大門歡迎普通人,那么普通人如何才能抓住大模型的機會?
當天,李彥宏帶來了 One More Thing ——無代碼工具 " 秒噠 ",一款不需要寫代碼就能實現任意想法的軟件,涵蓋無代碼編程、多智能體協作以及多工具調用等特點,只需說說話,就能構建出各種應用。它能幫助更多普通人、企業打造出應用。
演講現場,李彥宏以開一場蘿卜快跑的技術發布會為例,展示了如何用 " 秒噠 " 完成活動報名系統的搭建。只要在 " 秒噠 " 上用中文描述需求,并補充一份帶有大會時間地點主題的文檔,就可以指揮小組長、策劃、小編、程序員和質檢員五個智能體協作,協同完成策劃、內容和開發等各種工作,還能自動識別 bug、調用各種工具,完成報名系統的開發。
當然," 秒噠 " 還能完成更為復雜的任務,可以為企業省去項目經理、設計人員、開發人員、測試人員,也讓一行代碼都看不懂的普通人具備程序員能力,會說話、有想法就能做出應用來。
李彥宏透露," 秒噠 " 將在明年**季度正式發布。目前,秒噠已正式開啟企業測試申請,發布后不到一天時間,已有 300 余家企業申請秒噠測試。
"這是迄今為止人類歷史上最復雜的多智能體協作工具。只要你有想法,你就可以心想事成,我們將迎來一個前所未有的,只靠想法就能賺錢的時代。" 李彥宏強調。
過去 24 個月 AI 最大變化是什么?
大模型基本消除幻覺
"過去 24 個月,AI 行業的最大變化是大模型基本消除了幻覺,不再一本正經地胡說八道。" 李彥宏認為,讓大模型這一概率模型變得可用、可被信賴的技術,就是 RAG(Retrieval-augmented Generation),即檢索增強技術。
百度做搜索起家,自然要選擇檢索增強這條路,但是事實上,檢索增強不是百度特色,而已成為行業共識。目前,在文生文層面,RAG 已能很好地消除幻覺,但與多模態內容的結合還不夠,絕大多數大模型生成的圖片常常 " 一眼假 "" 機器味兒 ",比如開源模型生成的北京天壇圖片是四層,實際上只有三層。
在百度世界 2024 大會上,百度發布了一大突破——檢索增強的文生圖技術 iRAG(image based RAG),將百度搜索億級圖片資源與文心基礎大模型相結合,可以生成超真實的圖片。
文心大模型生成的大眾攬巡汽車飛躍長城的圖片,從車型車標到長城,均未出現錯誤或變形的幻覺問題。另一組 " 愛因斯坦環游世界 " 的演示圖片中,愛因斯坦與每個背景的結合,與真實世界高度相似,質感接近照片。
幻覺問題正是大模型廣泛應用的最大 " 絆腳石 ",iRAG 極大提高了 AI 生成圖片的可用性。以前拍一組品牌宣傳海報動輒花費幾十萬,但現在的創作成本接近于 0。目前,iRAG 已經不是一個 " 期貨 " 產品,最大的優勢是沒成本、立等可取、無幻覺、超真實,可以大幅降低影視作品、漫畫作品、連續畫本、海報制作等應用場景。
大模型是技術革命還是泡沫?
不做一個超級應用
要做數百萬 " 超級有用 "
過去 24 個月,全球性的大模型狂熱,讓行業不禁思考:這究竟是一場新的技術革命,還是新一輪泡沫?
今年 5 月,李彥宏與百度高管討論大模型的未來:" 怎么才算做成了?" 彼時,李彥宏認為,一年內漲 10 倍,日均調用量從 2 億漲到 20 億,才證明這個大模型是大家真正需要的。
截至 2024 年 11 月初,百度文心大模型的日均調用量已經超過 15 億,相較一年前首次披露的 5000 萬次,增長約 30 倍。離那次高管對話半年之后,文心大模型的成績單已經接近于李彥宏制定的目標。這條陡峭增長的曲線,一定程度上代表著過去兩年中國大模型應用的爆發。
然而,仍有人質疑:到目前為止,大模型還是沒有產生一個殺手級應用。
李彥宏的回答一直沒變,"不要等待一個超級應用,而是要打造數百萬個‘超級有用’的應用。"
在百度世界 2024 大會上,百度秀了一把肌肉,亮出了大模型 100 大產業應用,涵蓋了制造、能源、交通、政務、金融、汽車、教育、互聯網等眾多行業。
在人類信息技術變革的不同歷史時期,應用出現的樣貌也不一樣:在 PC 時期,它是一個個的軟件和網站;在移動時期,它是一個個的 APP 和可被關注的賬號;在 AI 時代,應用主要的形態就是智能體。隨著大模型技術和能力的指數級躍遷,自然語言成為了這個時代最重要的編程語言。我們每一個人都能動手創造一個屬于自己、也屬于他人的 AI 應用,或者智能體。AI 之所以能成為產業革命級的機會,就是因為它給社會經濟帶來了生產力的無限擴張。
" 我是軟件工程師出身,國外有一種說法叫‘軟件吞噬世界’。但我認為,這個世界不應該被吞噬,而應該被創造。AI 時代,應用創造世界。基礎模型能力就緒,我們即將迎來 AI 應用的群星閃耀時刻。" 李彥宏振奮人心地說道。
排版/ 季嘉穎
圖片/ 百度
來源/《IT 時報》公眾號 vittimes
E N D
在北京的 IT 時報好友們看過來 ~
領取方法:
點擊下方 " 我要購票 "
點擊右上角 " 兌換碼 "
輸入 "IT 時報 " 即可領取