科大訊飛終于迎來(lái)屬于自己的時(shí)代。
作者|劉楊楠
編輯|栗子
在發(fā)布大模型這件事上,科大訊飛沒(méi)有食言。
【資料圖】
早在今年2月,ChatGPT剛在國(guó)內(nèi)引爆熱度時(shí),科大訊飛便透露將在5月6日發(fā)布產(chǎn)品級(jí)落地應(yīng)用。而兩周前的業(yè)績(jī)說(shuō)明會(huì)上,科大訊飛也公布了星火認(rèn)知大模型的發(fā)布消息,并向外界開(kāi)放體驗(yàn)。
今天,星火認(rèn)知大模型正式如約而至。
發(fā)布會(huì)現(xiàn)場(chǎng),科大訊飛研究院院長(zhǎng)劉聰在現(xiàn)場(chǎng)通過(guò)語(yǔ)音直接與大模型對(duì)話。發(fā)布會(huì)全程開(kāi)放了大模型的真機(jī)互動(dòng),供參會(huì)人員現(xiàn)場(chǎng)體驗(yàn)。
除模型本身的能力展示外,科大訊飛還展示了星火認(rèn)知大模型在教育、辦公、汽車(chē)、數(shù)字員工等多個(gè)方向的商業(yè)應(yīng)用成果。
在這輪大模型軍備競(jìng)賽中,科大訊飛的存在感極強(qiáng)。作為“A股第一家以人工智能為主業(yè)上市的公司”、老牌人工智能“國(guó)家隊(duì)”企業(yè),科大訊飛多年來(lái)光環(huán)與爭(zhēng)議并存,無(wú)數(shù)雙眼睛正在盯著科大訊飛在這次大模型浪潮中會(huì)如何表現(xiàn)。
此次發(fā)布會(huì)前,公眾已經(jīng)對(duì)開(kāi)放體驗(yàn)的星火大模型“百般刁難”,由于開(kāi)放體驗(yàn)的模型版本不支持多模態(tài)輸入與生成功能,還曾有投資者向科大訊飛董秘表示“頗為失望”。「甲子光年」也進(jìn)行了內(nèi)部測(cè)評(píng)。
好在,今天科大訊飛用實(shí)際行動(dòng)回復(fù)了投資者的期待。
發(fā)布會(huì)開(kāi)始后,科大訊飛董事長(zhǎng)劉慶峰表示:“我們要向OpenAI致敬和學(xué)習(xí),同時(shí)也要快速追趕并努力超越,而這需要一套科學(xué)系統(tǒng)的評(píng)測(cè)體系?!?/strong>
為此,科大訊飛通過(guò)認(rèn)知智能全國(guó)重點(diǎn)實(shí)驗(yàn)室牽頭設(shè)計(jì)了通用認(rèn)知大模型評(píng)測(cè)體系,并與中科院人工智能產(chǎn)學(xué)研創(chuàng)新聯(lián)盟和長(zhǎng)三角人工智能產(chǎn)業(yè)鏈聯(lián)盟共同探討形成了覆蓋7大類(lèi)481個(gè)細(xì)分任務(wù)類(lèi)型。7大類(lèi)能力分別為文本生成、語(yǔ)言理解,知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力。發(fā)布會(huì)現(xiàn)場(chǎng),科大訊飛研究院院長(zhǎng)劉聰還就七大能力進(jìn)行了實(shí)時(shí)演示。
劉慶峰表示,目前海內(nèi)外的大模型技術(shù)普遍存在一些缺陷,例如新知識(shí)難以及時(shí)更新,事實(shí)類(lèi)問(wèn)題容易張冠李戴,對(duì)史實(shí)、典籍內(nèi)容添油加醋等,但對(duì)于這些缺陷,科大訊飛都有辦法一一解決。
不過(guò),無(wú)論是發(fā)布會(huì)上的實(shí)時(shí)演示,還是「甲子光年」的內(nèi)部測(cè)評(píng),星火大模型目前依然存在上述缺陷。
劉慶峰還預(yù)告了星火大模型在今年內(nèi)的三個(gè)升級(jí)節(jié)點(diǎn):
6月9日,實(shí)時(shí)問(wèn)答與多輪對(duì)話的開(kāi)放式問(wèn)答能力將進(jìn)一步提升;
8月15日,代碼能力與多模態(tài)交付能力將進(jìn)一步提升,并正式向客戶開(kāi)放;
10月24日,星火認(rèn)知大模型將趕超ChatGPT,英文能力與ChatGPT持平,中文能力超越ChatGPT。
除技術(shù)成果外,本次發(fā)布會(huì)還發(fā)布了星火大模型在公司現(xiàn)有產(chǎn)品上的四大商業(yè)應(yīng)用成果:
大模型+AI學(xué)習(xí)機(jī):AI可以像老師一樣批改作文,像口語(yǔ)老師一樣實(shí)景對(duì)話;
大模型+智能辦公本:根據(jù)手寫(xiě)要點(diǎn)自動(dòng)生成會(huì)議紀(jì)要;
大模型+智慧駕艙:車(chē)內(nèi)跨業(yè)務(wù),跨場(chǎng)景人車(chē)自由交流;
大模型+數(shù)字員工:基于自然語(yǔ)言生成業(yè)務(wù)流程和 RPA(RPA 即機(jī)器人流程自動(dòng)化),幫助企業(yè)員工完成大量重復(fù)性工作。
此外,訊飛開(kāi)放平臺(tái)也新增星火認(rèn)知大模型,將賦能開(kāi)發(fā)者打造更具價(jià)值的AI應(yīng)用。目前,訊飛開(kāi)放平臺(tái)已經(jīng)開(kāi)放了560項(xiàng)AI能力,并聚集了超過(guò)500萬(wàn)生態(tài)合作伙伴。劉慶峰宣布,首批來(lái)自36個(gè)行業(yè)的3000余家企業(yè)開(kāi)發(fā)者將接入星火大模型。
只不過(guò),盡管科大訊飛全方位展示了星火大模型的各種能力,但模型訓(xùn)練方法、模型參數(shù)、訓(xùn)練數(shù)據(jù)量、數(shù)據(jù)來(lái)源等關(guān)鍵技術(shù)指標(biāo)均未公布。
此前,在4月20日的業(yè)績(jī)交流會(huì)上,科大訊飛董事長(zhǎng)曾向媒體提到,星火認(rèn)知大模型的研發(fā)成本遠(yuǎn)低于外界想象,并不需要像OpenAI那樣花費(fèi)100億美元。
顯而易見(jiàn),ChatGPT點(diǎn)燃了中國(guó)科技界久違的創(chuàng)新熱情。
一時(shí)間,一眾科技企業(yè)紛紛為自己貼上“AI大模型”的標(biāo)簽,并爭(zhēng)先發(fā)布自研大模型。不同于當(dāng)前轟轟烈烈的追風(fēng)者,科大訊飛自成立以來(lái)幾乎一直在“等風(fēng)來(lái)”。
五年前,科大訊飛聯(lián)合創(chuàng)始人、聆思科技董事長(zhǎng)胡郁便對(duì)「甲子光年」表示:“語(yǔ)音還在技術(shù)爆炸之前,但爆炸的臨界點(diǎn)已越來(lái)越近,肯定有人會(huì)贏。”
終于,ChatGPT為科大訊飛吹來(lái)了東風(fēng)。在此之前,以科大訊飛為代表的語(yǔ)音語(yǔ)義類(lèi)人工智能企業(yè)已經(jīng)在“冷板凳”上坐了20多年。
熟悉科大訊飛的人大多聽(tīng)過(guò)這個(gè)傳奇的學(xué)生創(chuàng)業(yè)故事:
1999年,18位年輕人擠在一間租來(lái)的三室一廳中,埋頭開(kāi)發(fā)語(yǔ)音源頭技術(shù)。18位年輕人中,有6人都是中科大BBS論壇的版主,全部來(lái)自于當(dāng)?shù)氐母呖紶钤虬裱?。這個(gè)項(xiàng)目后來(lái)成長(zhǎng)為一家市值千億的上市公司——科大訊飛。
項(xiàng)目的牽頭人叫劉慶峰,當(dāng)時(shí)是中科大六系(電子工程系)“人機(jī)語(yǔ)音通信實(shí)驗(yàn)室”的主力干將,如今是科大訊飛董事長(zhǎng);項(xiàng)目里還有一個(gè)22歲的年輕人叫胡郁,此后多年出任訊飛研究院院長(zhǎng),主導(dǎo)多項(xiàng)技術(shù)與產(chǎn)品發(fā)布。在科大訊飛的二十余年里,劉慶峰和胡郁一直是靈魂人物。
傳奇背后,往往是殘酷的現(xiàn)實(shí)。
1999年,IBM推出ViaVoice,2000年前后,Intel、摩托摩拉、松下、東芝、微軟等相繼建立語(yǔ)音研發(fā)中心,新一輪交互革命似乎正在到來(lái)。同時(shí),國(guó)內(nèi)正掀起一陣大學(xué)生創(chuàng)業(yè)熱潮。這一背景下,中科大的18位年輕人懷著一腔熱血,立志做出一家年收入100億元的偉大企業(yè)。
但這波語(yǔ)音技術(shù)的熱潮僅持續(xù)了幾年,市場(chǎng)高估了PC端對(duì)語(yǔ)音的需求,加之語(yǔ)音技術(shù)尚未成熟,商業(yè)化路徑也不清晰,當(dāng)時(shí)入局語(yǔ)音賽道的企業(yè)后來(lái)都逐漸沒(méi)了蹤影。
科大訊飛雖然已經(jīng)在語(yǔ)音技術(shù)領(lǐng)域堅(jiān)持多年,也實(shí)現(xiàn)了百億營(yíng)收的目標(biāo),但這個(gè)成果來(lái)之不易。
1999年底,科大訊飛拿到了第一筆3000萬(wàn)元融資,投資方均為安徽省本地國(guó)企,如美菱集團(tuán)、安徽省信托投資公司等。
拿到這筆錢(qián)后,劉慶峰聯(lián)合中科院聲學(xué)所、社科院語(yǔ)言所及清華大學(xué)等語(yǔ)音研究機(jī)構(gòu)成立聯(lián)合實(shí)驗(yàn)室,整合語(yǔ)音源頭資源。
之后,科大訊飛推出了第一款to C產(chǎn)品——暢言2000。當(dāng)時(shí)國(guó)內(nèi)正流行PC帶手寫(xiě)板輸入,為了形成差異化,訊飛將語(yǔ)音技術(shù)集成到手寫(xiě)系統(tǒng)中,形成差異化,一套系統(tǒng)售價(jià)超2000元。同時(shí),訊飛在全國(guó)建立總代理,下設(shè)多個(gè)大區(qū)代理,但效果卻很差,大量存貨被積壓在渠道中,產(chǎn)品根本賣(mài)不動(dòng)。
直到1999年,訊飛在高交會(huì)(中國(guó)國(guó)際高新技術(shù)成果交易會(huì))上遇到了華為,成為華為的語(yǔ)音技術(shù)提供商,由此贏得第一桶金,也開(kāi)啟了to B的商業(yè)化道路。
此后幾年,為了活下去,訊飛開(kāi)始嘗試系統(tǒng)集成項(xiàng)目?,F(xiàn)在看來(lái),做系統(tǒng)集成是一把雙刃劍,雖然分散了訊飛在部分核心業(yè)務(wù)的精力,卻也給訊飛創(chuàng)造了可觀的收入,終于在2004年實(shí)現(xiàn)盈虧平衡。
盡管語(yǔ)音技術(shù)的商業(yè)化進(jìn)程較為坎坷,但國(guó)家層面卻對(duì)這項(xiàng)技術(shù)十分重視。
20世紀(jì)90年代,基于大語(yǔ)料庫(kù)的單元挑選與波形拼接合成方法出現(xiàn),可以合成出高質(zhì)量的自然人語(yǔ)音。當(dāng)時(shí),中科大的王仁華教授,即劉慶峰的導(dǎo)師,便從這時(shí)開(kāi)始深耕語(yǔ)音合成領(lǐng)域。
1993年,在中科大召開(kāi)的全國(guó)語(yǔ)音識(shí)別與合成研討會(huì)上,王仁華教授提出了使用播音員錄音的基因片段加處理的方法,獲得了863專家組成員的首肯。之后,專家組向王仁華團(tuán)隊(duì)撥款20萬(wàn)元作為“人機(jī)語(yǔ)音通信實(shí)驗(yàn)室”的研究經(jīng)費(fèi)。此后,王仁華教授的課題也獲得了863計(jì)劃的滾動(dòng)支持——這為科大訊飛的誕生提供了肥沃的土壤。
2014年,科大訊飛正式啟動(dòng)“訊飛超腦計(jì)劃”,研發(fā)基于類(lèi)人神經(jīng)網(wǎng)絡(luò)的認(rèn)知智能系統(tǒng)。
2017年7月,我國(guó)出臺(tái)新一代人工智能規(guī)劃,并推出了首批四大人工智能開(kāi)放平臺(tái),訊飛便是其中之一——科大訊飛正式加入國(guó)家隊(duì)。同年12月,科技部依托訊飛建設(shè)了認(rèn)知智能?chē)?guó)家重點(diǎn)實(shí)驗(yàn)室,預(yù)訓(xùn)練模型是認(rèn)知智能的重要環(huán)節(jié),也為科大訊飛此后的大模型訓(xùn)練打下了基礎(chǔ)。
科大訊飛不僅讓機(jī)器在全球首次通過(guò)了國(guó)家職業(yè)醫(yī)師資格考試、超過(guò)了96.3%參加考試的醫(yī)生,并且在SQuAD機(jī)器閱讀理解中全球首次超過(guò)人類(lèi)平均水平,剛剛過(guò)去的2022年在OpenBookQA 科學(xué)知識(shí)推理中,單模型也超過(guò)人類(lèi)平均水平。
進(jìn)入“國(guó)家隊(duì)”后的科大訊飛,也有了更多資源支持相關(guān)研發(fā)。
2022年,科大訊飛將“訊飛超腦計(jì)劃”升級(jí)為“訊飛超腦2030計(jì)劃”,提出讓懂知識(shí)、善學(xué)習(xí)、能進(jìn)化的通用人工智能技術(shù)成為每個(gè)人未來(lái)發(fā)展的重要機(jī)會(huì),讓機(jī)器人走進(jìn)家庭。
同年,國(guó)家重點(diǎn)實(shí)驗(yàn)室重組,在首批20個(gè)國(guó)家標(biāo)桿實(shí)驗(yàn)室里,科大訊飛是唯一承建認(rèn)知智能的全國(guó)重點(diǎn)實(shí)驗(yàn)室。
盡管科大訊飛頭頂“國(guó)家隊(duì)”光環(huán),但過(guò)往20年,科大訊飛卻一直有著讓人難以看懂的一面。
首先是多年增收不增利,過(guò)度依賴政府補(bǔ)助的尷尬。
在2021年的4月20日業(yè)績(jī)溝通會(huì)上,科大訊飛董事長(zhǎng)劉慶峰提出了“千億目標(biāo)”:按計(jì)劃到“十四五”末,教育業(yè)務(wù)要貢獻(xiàn)300億元,醫(yī)療、消費(fèi)者智能硬件和開(kāi)放平臺(tái)各自貢獻(xiàn)200億元;汽車(chē)業(yè)務(wù)、運(yùn)營(yíng)商、智慧城市3個(gè)方向各100億。
如今兩年過(guò)去,今年4月20日,科大訊飛發(fā)布了2022年年報(bào)。年報(bào)顯示,科大訊飛2022年總營(yíng)收188億元,同比增長(zhǎng)僅2.77%,凈利潤(rùn)為17億元。而這17億中,政府補(bǔ)助高達(dá)11億元。
此外,科大訊飛在二級(jí)市場(chǎng)的投資也收益甚微。
2015年起,科大訊飛陸續(xù)投資三人行、寒武紀(jì)、商湯科技等企業(yè)。其中,除三人行為一家綜合型廣告?zhèn)髅狡髽I(yè)外,寒武紀(jì)和商湯分別為智能芯片和人工智能領(lǐng)域的科技企業(yè)。
盡管幾家企業(yè)都陸續(xù)IPO,科大訊飛也曾在2020年、2021年小賺了一筆。但進(jìn)入2022年,AI賽道開(kāi)始?xì)⒐乐?、擠泡沫,二級(jí)市場(chǎng)上場(chǎng)接近八成的科技股出現(xiàn)破發(fā)。寒武紀(jì)和商湯股價(jià)大跌,科大訊飛“炒股”賺來(lái)的少量收入又大把賠了進(jìn)去。
科大訊飛2022年年報(bào)顯示,其證券投資仍為這三只股票,報(bào)告期末賬面價(jià)值為3.21億元,較2022年半年報(bào)的6.88億元又縮水超50%。
科大訊飛自身的股價(jià)在2022年也不斷走低,從2022年1月3日至2022年12月30日,科大訊飛股價(jià)從52.77元每股跌至32.83元每股,跌幅高達(dá)38%。 不過(guò),在ChatGPT推出后,科大訊飛的股價(jià)在今年一路回升,市值重回千億俱樂(lè)部。
此外,作為一家人工智能企業(yè),過(guò)去15年,科大訊飛的研發(fā)投入增長(zhǎng)不敵銷(xiāo)售、管理費(fèi)用增長(zhǎng),這一點(diǎn)也為人詬病。
不過(guò),從最新發(fā)布的年報(bào)看,科大訊飛2022年的研發(fā)投入達(dá)33.55億元,較上年增長(zhǎng)14.28%;研發(fā)人員也擴(kuò)充至9281人,同比增長(zhǎng)10.92%,占公司總?cè)藬?shù)的61.68%。可見(jiàn),科大訊飛正在將投入重心向技術(shù)本身傾斜。
總體看,科大訊飛想要如期實(shí)現(xiàn)“千億目標(biāo)”,依然要面臨不小壓力。
大模型的出現(xiàn),無(wú)疑向科大訊飛提供了一個(gè)機(jī)會(huì)窗口。
在許多人看來(lái),大模型是繼互聯(lián)網(wǎng)之后下一個(gè)平臺(tái)型機(jī)會(huì),而生態(tài)的建設(shè),將是大模型商業(yè)化進(jìn)程中的重要話題。
在AI的商業(yè)化過(guò)程中,有一個(gè)核心命題是“+AI”還是“AI+”。
李開(kāi)復(fù)曾表示,“AI+”是以AI為核心,工程師、科學(xué)家主導(dǎo)尋找商業(yè)機(jī)會(huì)。而“+AI”是以傳統(tǒng)公司為主導(dǎo),AI賦能傳統(tǒng)行業(yè)產(chǎn)生價(jià)值。換言之,“+AI”生態(tài)中,產(chǎn)業(yè)本身是“1”,AI是“1”后面的無(wú)數(shù)個(gè)“0”;“AI+”生態(tài)中,AI就是“1”本身。
若以ChatGPT的出現(xiàn)為分界,其出現(xiàn)之前許多AI公司都在做“+AI”的事情,而ChatGPT出現(xiàn)后,AI+的生態(tài)邏輯有了現(xiàn)實(shí)依據(jù)。回看科大訊飛的業(yè)務(wù)布局,科大訊飛更傾向于“AI+”邏輯。
目前,大多數(shù)國(guó)內(nèi)的大模型入局企業(yè)大多都在“兩條腿走路”——一邊訓(xùn)練底層大模型,一邊尋找上層應(yīng)用場(chǎng)景,逐步搭建生態(tài)。
而科大訊飛的不同在于,多年的業(yè)務(wù)積累已經(jīng)讓科大訊飛搭建起了相對(duì)完善的應(yīng)用生態(tài)。
例如,在2022年的業(yè)績(jī)說(shuō)明會(huì)上,科大訊飛屢屢提及智慧教育的“G-B-C發(fā)展模式”,即訊飛智慧教育產(chǎn)品主要分為面向地市縣等區(qū)域(G端)的因材施教解決方案,面向?qū)W校(B端)的校內(nèi)大數(shù)據(jù)精準(zhǔn)教學(xué)、英語(yǔ)聽(tīng)說(shuō)考試等,面向家長(zhǎng)孩子(C端)的AI學(xué)習(xí)機(jī)。
除教育外,科大訊飛在醫(yī)療、汽車(chē)、智慧城市、智慧金融等領(lǐng)域均有布局。
科大訊飛大而全的業(yè)務(wù)布局也曾屢遭質(zhì)疑。有人剖析科大訊飛的營(yíng)收結(jié)構(gòu)后,認(rèn)為其真正來(lái)自AI技術(shù)的部分很少。對(duì)此,胡郁曾向「甲子光年」回應(yīng)道,“做技術(shù),永遠(yuǎn)不可能在整個(gè)生態(tài)系統(tǒng)里做成一家很大的公司”,要在生態(tài)中往上爬,做產(chǎn)品,做方案。
如今看來(lái),星火認(rèn)知大模型的加入,給科大訊飛此前的業(yè)務(wù)布局添了一層合理化色彩。
打一個(gè)不太恰當(dāng)?shù)谋扔?,大模型及其商業(yè)生態(tài)的搭建類(lèi)似于“先有雞”還是“先有蛋”的問(wèn)題。
目前大多數(shù)投身大模型的創(chuàng)業(yè)公司屬于“先有雞”的一派:做出大模型,選擇教育、醫(yī)療等知識(shí)密度高、數(shù)據(jù)質(zhì)量好的場(chǎng)景優(yōu)先落地;而科大訊飛則屬于“先有蛋”的一派:在過(guò)往的商業(yè)化過(guò)程中,他們?cè)诙鄠€(gè)行業(yè)尋找落地機(jī)會(huì),這樣不斷做大營(yíng)收的同時(shí),這些業(yè)務(wù)也讓這些科大訊飛真實(shí)積累了大量行業(yè)數(shù)據(jù)與know-how,而大模型出現(xiàn)后讓這些散落各個(gè)領(lǐng)域的業(yè)務(wù)都有了歸處。
話雖如此,科大訊飛能否在大模型混戰(zhàn)中拔得頭籌還是未知數(shù)。
一方面,互聯(lián)網(wǎng)大廠和創(chuàng)業(yè)公司都在迅速投入大模型賽道,市場(chǎng)供給已經(jīng)很多。完善的應(yīng)用生態(tài)固然能讓科大訊飛在大模型落地上有更清晰的路徑。但長(zhǎng)期來(lái)看,要在大模型混戰(zhàn)中取勝,提升模型解決問(wèn)題的能力與降低推理成本,依然是所有大模型玩家需要持續(xù)努力的兩件事。
另一方面,基于“AI+”的商業(yè)模式依然還在探索期,真正在大模型時(shí)代賺到錢(qián)的玩家還未出現(xiàn)。
可喜的是,做了20余年冷板凳的科大訊飛終于迎來(lái)了屬于自己的時(shí)代舞臺(tái),但科大訊飛能否成為大模型時(shí)代的主角,顯然還需要更多時(shí)間來(lái)證明。
責(zé)任編輯:
標(biāo)簽: