界面新聞?dòng)浾?| 查沁君
大模型正在教育領(lǐng)域加速落地。
7月12日,職教巨頭粉筆(02469.HK)推出公考行業(yè)內(nèi)首個(gè)自研的垂直大模型,并宣布將于8月1日上線粉筆AI老師“粉筆頭”。
在此之前,網(wǎng)易有道(NYSE:DAO)、好未來(NYSE:TAL)、作業(yè)幫、猿輔導(dǎo)等教企均已推出各自訓(xùn)練的教育大模型,并結(jié)合口語陪練、作文批改、個(gè)性化學(xué)習(xí)等場景,在學(xué)習(xí)機(jī)、詞典筆等硬件中落地。
此前業(yè)內(nèi)有觀點(diǎn)認(rèn)為,隨著通用大模型能力的普遍增強(qiáng),垂直領(lǐng)域的模型沒有存在的必要。對(duì)此,粉筆CTO陳建華有不同的看法。
據(jù)其介紹,粉筆從2023年一季度開始探索大模型和教育的結(jié)合。他發(fā)現(xiàn),某些場景里,通用大模型的表現(xiàn)不及預(yù)期,比如在回答行測(cè)這類客觀題時(shí),正確率非常低。在命題方面,通用大模型只能做到模仿題目的形態(tài),在題目的難度、內(nèi)容和考點(diǎn)設(shè)置上無法滿足需求。
但通用大模型在面試點(diǎn)評(píng)環(huán)節(jié)這類受限的小場景下,效果非常好且可控。面試點(diǎn)評(píng)是學(xué)生備考的剛需,之前主要由老師人工完成,工作量大、效率低、單價(jià)高,如果借助于AI輔助老師進(jìn)行面試點(diǎn)評(píng),老師的點(diǎn)評(píng)時(shí)間可以從20分鐘縮短到5分鐘之內(nèi)。AI面試點(diǎn)評(píng)的可用率也可在90%以上。
面對(duì)通用大模型和垂直大模型之間的“紛爭”,好未來CTO田密也曾公開表示,現(xiàn)在通用大模型可以來解決很多尋常的通用問題,但在某個(gè)專項(xiàng)任務(wù)上只能解決到六七分的水平,如果想取得更好的結(jié)果,必須在垂直領(lǐng)域上做更專項(xiàng)的訓(xùn)練。
“大模型在B端(企業(yè))內(nèi)部提效方面會(huì)更容易落地?!标惤ㄈA稱,例如上述提到的面試點(diǎn)評(píng)場景,通過大模型給出點(diǎn)評(píng)的內(nèi)容,再由輔導(dǎo)老師把關(guān),輸出到學(xué)生端,可提高效率。
在他看來,對(duì)于準(zhǔn)確性要求比較高的教育場景,C端(用戶)應(yīng)用的落地會(huì)面臨著非常大的挑戰(zhàn),其中最大的挑戰(zhàn)就是大模型的“幻覺”問題,例如在一些歷史人物類的嘗試問題中,可能會(huì)存在張冠李戴的效果,“這一點(diǎn)對(duì)教育行業(yè)來說是非常致命的”。
目前,粉筆的做法是借助于RAG(Retrieval-Augmented Generation)檢索增強(qiáng)生成的輔助來克服幻覺,同時(shí)利用CoT(思維鏈)讓大模型按照步驟一步步進(jìn)行推理。
另一方面,采用分治法,嘗試將復(fù)雜的問題拆分成足夠簡單的任務(wù)再讓模型處理,陳建華稱,效果會(huì)遠(yuǎn)遠(yuǎn)好過于直接將整個(gè)復(fù)雜的任務(wù)交給模型處理。
“每個(gè)產(chǎn)品都值得用大模型技術(shù)重做一遍。”陳建華認(rèn)為,這里的重做不是要推倒過去已有的成果,而是要借助于大模型從效率、過程和結(jié)果上重塑整個(gè)流程,以提供更多可能性。
在應(yīng)用場景上,粉筆AI老師已覆蓋學(xué)員的入班測(cè)試、理論學(xué)習(xí)、強(qiáng)化練習(xí)、模擬套卷,直到最后的沖刺階段。陳建華預(yù)計(jì)今年將上線申論AI老師。此外,面試AI老師、事業(yè)單位和教師項(xiàng)目的AI老師也在籌備中。
粉筆副總裁劉帥表示,粉筆AI老師將是未來粉筆主流的最高端的產(chǎn)品之一。
越來越多的AI老師上線,真人老師會(huì)失業(yè)嗎?
當(dāng)日發(fā)布會(huì)上,粉筆創(chuàng)始人、CEO張小龍對(duì)此予以否定,技術(shù)進(jìn)步并不意味著就能取代行業(yè)人士,學(xué)習(xí)的過程不僅僅是知識(shí)學(xué)習(xí),與此同時(shí)還伴隨著老師提供的情緒價(jià)值。相反,技術(shù)解放了人之后,身體會(huì)變得越來越強(qiáng),人也會(huì)變得越來越有智慧,更有趣、更有意識(shí)。
張小龍還表示,粉筆AI老師作為一款C端的AI產(chǎn)品,是“收費(fèi)”且“收得起費(fèi)”的。他同時(shí)呼吁:“中國科技領(lǐng)域的朋友們,不要都盯著通用大模型,可以多一些針對(duì)具體領(lǐng)域的具體服務(wù)配資網(wǎng)上開戶,早日實(shí)現(xiàn)商業(yè)化?!?/p>
文章為作者獨(dú)立觀點(diǎn),不代表線上配資網(wǎng)觀點(diǎn)