首个数学领域的教育垂直大模型上线。
8月24日,时值好未来(NYSE:TAL)20周年,好未来CTO田密在直播活动中宣布,该公司自研的数学领域千亿级大模型MathGPT正式上线并开启公测。
今年5月,好未来曾公布正在进行自研数学大模型的研发,由CTO田密牵头,命名为MathGPT。主要面向全球数学爱好者和科研机构,以解题和讲题算法为核心。
(资料图片仅供参考)
MathGPT官网显示,MathGPT的数学计算能力已覆盖小学、初中、高中的数学题,题型涵盖计算题、应用题、代数题等多个类型,还可以针对题目进行追问,暂未开放数学之外的问答互动。
用户使用MathGPT时,用文字或图片方式上传数学题,即可得到对话式的解答反馈,答案包含“分析”、“详解”、“点睛”三个部分;也可以通过“随机来一题”的按钮,随机生成数学题目并由系统给出解答。目前,MathGPT支持中文、英文版本的PC端和移动端。
据好未来提供的MathGPT技术报告显示,在六个公开数学评测集合CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考数学、Math401的测试结果中,MathGPT的表现不差。
其中,以微软华人研究团队发布的基准测试AGIEval为例,Open AI推出的GPT-4、好未来的MathGPT的正确率分别为39.2%、60.34%;但在Math401评测中,GPT-4略胜一筹,正确率高出MathGPT1.5个百分点。
同时,在C-Eval的初高中的全科测试集合上,MathGPT的表现成绩也普遍高于GPT-4和清华团队推出的第二代中英双语对话模型ChatGLM2。
一个普遍共识是,通用大模型“重文轻理”,在数学问题的解决、讲解、问答和推荐方面则存在明显的短板。即使是表现优异的GPT-4也曾在鸡兔同笼的基本数学问题上“栽跟头”。相比大模型更擅长的语文、英语,数学更偏逻辑思维、推理能力,大模型研发难度也更高。
“数学光喂内容没用,因为它是原理问题,现有技术没法做到套一下就能使用(的地步)。”网易有道(NYSE:DAO)CEO近期在媒体交流时表示,相反,如果是文字语言型的应用,不需要特别强的推理。从现有时间经验来说,英语、语文比数学的评测结果更理想,速度也更快。
作为曾经数学培训的头部公司,好未来积累了大量的数学数据和生产能力。2017年,成立AI lab开启人工智能研究。之所以研发数学垂直大模型,该公司称“在通往通用人工智能的路上,数学推理能力很重要,全球有很多大型公司在做相关研究。”
“AI带来了重新定义教育行业的机会,大模型技术使得大规模的因材施教真正有了实现的可能。”田密认为,大模型的本质,是一种更高效的、从数据中学习知识并加以应用的方式。
在AI能力的加持下,“学生自学+AI答疑”的新型学习方式成为广泛的可能。学习者获得优质教学内容的门槛、成本降低,获得的教学内容个性化、精细化程度持续升高,可以实现千人千面的AI教学和答疑辅导。
好未来正与中国信通院、复旦大学、科大讯飞(002230.SZ)、百度(BIDU.US)等科研机构、高校、企业一同编制教育大模型团体标准,从覆盖场景、应用成效、服务可靠等维度全面评估教育大模型能力,为教育大模型应用落地提供参考与指导。
大模型训练、运营及维护需要大量专业人才,好未来目前还在招兵买马。
MathGPT官网显示,其招聘岗位包括大模NLP算法工程师、大模型训练&推理加速工程师、MathGPT产品经理、AI后台Golang开发工程师、资深UI设计师(AI方向),以及用户研究。其中,前两个岗位的工作地点不局限于国内,还包括美国旧金山湾区的库比蒂诺(Cupertino),被称为“硅谷的心脏”,苹果公司总部也位于此。
在MathGPT发布同时,好未来也在官网更新了一个具有代表性和挑战性的数学任务评测集,供全球人工智能专家、数学爱好者体验和测评。
据田密透露,随着公测的顺利进行,MathGPT的解题能力将得到持续提升,基于MathGPT的产品级应用也正在加速研发中,将于近期发布。
标签:
-
好未来推出千亿级数学大模型MathGPT,即日开启公测
首个数学领域的教育垂直大模型上线。8月24日,时值好未来(NYSE:TAL)
-
苹果手机传输到新手机一直显示正在准备传输(苹果手机传输到新手机)
1、首先解锁iphone12,在ios14 5中,两部手机登录相同的AppleID。2、2
-
跨境电商安全浏览器需要考虑哪些功能?如何挑选适合的浏览器?
跨境电商已经成为了现代人购物的一种主要方式,而在进行跨境电商购物时
-
华中科技大学团队打造出“万物不粘”的超滑马桶,节水又卫生
利用3D打印技术,打印出了尺寸是普通马桶1 10的马桶模型,可以有效防止
-
科汇股份正在建设储能模组及PACK生产线 设计开发光储一体化产品
科汇股份正在建设储能模组及PACK生产线设计开发光储一体化产品北极星储
-
沪光股份8月24日快速上涨
以下是沪光股份在北京时间8月24日13:20分盘口异动快照:8月24日,沪光
-
全新款保时捷帕拉梅拉的谍照在网络上流传开来
近日,全新款保时捷帕拉梅拉的谍照在网络上流传开来。新款车型在外观和
-
银保业务将严格执行“报行合一”
上海证券报记者从相关渠道获悉,近日,监管部门向多家人身险公司下发规
-
福昕软件08月23日获沪股通增持4.11万股
08月23日,福昕软件获沪股通增持万股,已连续6日获沪股通增持,共计51
-
重要信号!首家券商加入回购大军,3天又有22家"参军"
近日,上市公司回购股份掀起高潮。
-
美国非农数据被官方挤出30万水分 还牵出了一个“小疑问”
财联社8月24日讯(编辑史正丞)当地时间周三早晨,美国劳工部发布针对
-
中报观察|保利物业节奏放缓
观点网8月22日晚间,保利物业披露2023上半年业绩。从上半年的成绩单来
-
一定要了解的禁烟控烟知识
“吸烟有害健康”都成了老生常谈,甚至被印在了烟盒上,烟民依旧没能放
-
通告!允许社会车辆使用部分公交专用车道!
唐山市公安交通警察支队关于大里路施工期间允许社会车辆使用部分公交专
-
宠爱之名护肤品好用吗(宠爱之名护肤品怎么样)
小科来为大家解答以上问题。宠爱之名护肤品好用吗,宠爱之名护肤品怎
-
清远一女子头发被按摩椅卷入,消防员现场破拆救援
8月22日下午5时许,清远市一名女子在使用电动按摩椅时,不慎将头发卷入
-
珀莱雅(603605)8月23日主力资金净卖出794.18万元
截至2023年8月23日收盘,珀莱雅(603605)报收于100 0元,上涨0 93%,换
-
2023成都车展探馆:远航Y6实车曝光
在即将于8月25日开幕的成都车展前夕,行车视线从相关渠道获取到一组远
-
介绍业务给其他公司收取佣金如何开票?
介绍业务给其他公司收取佣金如何开票?答:介绍业务给其他公司收取佣金
-
化粪池03S702图集(化粪池03s702)
G表示钢筋混凝土化粪池,9表示采用型号为9号,30表示化粪池的有效容积
-
邦邦滴答答是什么梗
随着时代的发展想,现在大家在网上聊天经常会使用网络用语,最近一段时
-
男气功穿什么装备(男气功穿什么甲)
来为大家解答以上问题。男气功穿什么装备,男气功穿什么甲这个很多人还
-
开阳:邱家湾棚户区综合整治项目正在进行
开阳:邱家湾棚户区综合整治项目正在进行,邱家湾,开阳县,老旧小区,棚户
-
碧桂园多只境内债下跌 “21碧地03”跌超30%触发临停
“21碧地03”跌30 23%,触发盘中临时停牌。“20碧地04”跌12 46%,“16
-
大商所期权工具交易规模稳增
自去年8月8日在大商所上市以来,豆一、豆二和豆油期权上线运行已满1年
-
突发!台战机空中起火
据台湾中时新闻网报道,10日上午10点多,台湾一架战机疑似机尾冒出不同
-
内蒙古林长制培训班开班,小草数字分享林长制智慧平台
日前,内蒙古自治区推深做实林长制业务培训班在江西省婺源县召开,内蒙
-
云岩区居民朱命生:老房加装新电梯,上下楼“一键直达”
贵阳网·甲秀新闻讯近日,记者来到位于云岩区鹿冲关生活圈的万江社区,
-
海上风电逐梦深蓝 国际学生参访团解读山东绿色发展密码
中国山东网-感知山东8月9日讯行走在山东港口东营港广利港区码头作业现
-
新语丨对社会美育的全新诠释
普通人对艺术作品有没有发言权?思考这个问题有着特别的意义。历经5个