首批通過(guò)!最高評(píng)級(jí)!學(xué)而思九章大模型通過(guò)中國(guó)信通院教育大模型評(píng)估
2024-06-27
隨著教育行業(yè)數(shù)字化轉(zhuǎn)型、智能化升級(jí)呈現(xiàn)加速發(fā)展態(tài)勢(shì),教育大模型持續(xù)探索與教育各環(huán)節(jié)進(jìn)行全面深度融合,全面賦能智能學(xué)習(xí)、智能教學(xué)、智能閱卷等各個(gè)核心場(chǎng)景。為推動(dòng)產(chǎn)業(yè)健康持續(xù)發(fā)展,中國(guó)信息通信研究院(以下簡(jiǎn)稱“中國(guó)信通院”)人工智能研究所聯(lián)合業(yè)界單位共同編制了教育大模型標(biāo)準(zhǔn)。
近期,在中國(guó)信通院組織的首輪教育大模型評(píng)估中,學(xué)而思“九章大模型”順利完成了教育大模型評(píng)估,獲得4+級(jí)證書,成為國(guó)內(nèi)首批通過(guò)該項(xiàng)評(píng)估并獲得當(dāng)前最高評(píng)級(jí)的企業(yè)。教育大模型評(píng)估依據(jù)《面向行業(yè)的大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用評(píng)估方法 第3部分:教育大模型》標(biāo)準(zhǔn),共計(jì)3個(gè)能力域,6個(gè)能力子域,30余個(gè)能力項(xiàng)。標(biāo)準(zhǔn)聚焦教育行業(yè)核心需求,形成教育大模型應(yīng)用成熟度評(píng)價(jià)方法,便于各方衡量教育大模型的應(yīng)用能效,助推教育大模型產(chǎn)品升級(jí)優(yōu)化。
【學(xué)而思九章大模型介紹】
學(xué)而思九章大模型(MathGPT)是好未來(lái)自主研發(fā)的,以解題和講題算法為核心的大模型。九章大模型具有四大核心功能,即數(shù)學(xué)學(xué)科的自動(dòng)解題、復(fù)雜應(yīng)用題的批改,語(yǔ)文英語(yǔ)的作文批改,個(gè)性化的AI分步驟講題。大模型強(qiáng)大的生成、理解能力,既能針對(duì)性解決學(xué)生的個(gè)性化問(wèn)題,從其不懂的題目映射出相應(yīng)知識(shí)點(diǎn),并加以補(bǔ)充講解,使得學(xué)生融會(huì)貫通,又能在內(nèi)置大量?jī)?yōu)質(zhì)教學(xué)資源的同時(shí),向更廣泛的學(xué)生普及。

圖1 學(xué)而思“九章大模型”界面
【評(píng)估介紹】
教育大模型評(píng)估指標(biāo)覆蓋場(chǎng)景豐富度、能力支持度、應(yīng)用成熟度三大維度,在促進(jìn)產(chǎn)業(yè)發(fā)展、提升技術(shù)影響力和服務(wù)規(guī)范等方面具有重要作用。
(1)場(chǎng)景豐富度:關(guān)注教育大模型產(chǎn)品覆蓋廣度,包括學(xué)科支持度(數(shù)學(xué)、語(yǔ)文、物理、化學(xué)等)、場(chǎng)景支持度(知識(shí)檢索、知識(shí)問(wèn)答、自主學(xué)習(xí)、測(cè)評(píng)考試等);
(2)能力支持度:關(guān)注教育大模型任務(wù)支持度和性能優(yōu)越度,包括計(jì)算、問(wèn)答、分析、創(chuàng)作、總結(jié)等能力;
(3)應(yīng)用成熟度:關(guān)注教育大模型安全性、學(xué)習(xí)性、啟發(fā)性、記憶性等,包括服務(wù)多樣性、服務(wù)成熟度兩個(gè)維度。

圖2 評(píng)估范圍
本內(nèi)容轉(zhuǎn)載自“可信AI評(píng)測(cè)”,https://mp.weixin.qq.com/s/WpT_IqDih-5pztuaGcq4MQ?scene=25#wechat_redirect