of69
您的位置:首页 > 资讯 >

微软打造13亿参数小型LLMAI模型,号称实际效果胜于千亿参数GPT-3

来源:IT之家 2023-06-28 14:09:51   阅读量:9400   

,AI 模型盲堆体积实际上效果并不见得更好,更多要看训练数据的质量,微软日前最近发布了一款 13 亿参数的语言模型 phi-1,采用“教科书等级”的高品质资料集训练而成,据称“实际效果胜于千亿参数的 GPT 3.5”。

图源 Arxiv

IT之家注意到,该模型以 Transformer 架构为基础,微软团队使用了包括来自网络的“教科书等级”数据和以 GPT-3.5 经过处理的“逻辑严密的内容”,以及 8 个英伟达 A100 GPU,在短短 4 天内完成训练。

图源 Arxiv

微软团队表示,比起增加模型的参数量,通过提高模型的训练数据集质量,也许更能强化模型的准确率和效率,于是,他们利用高质量数据训练出了 phi-1 模型。在测试中,phi-1 的分数达到 50.6%,比起 1750 亿参数的 GPT-3.5还要好。

图源 Arxiv

微软表示,phi-1 接下来会在 HuggingFace 中开源,而这不是微软第一次开发小型 LLM,此前,他们打造一款 130 亿参数的 Orca,使用了 GPT-4 合成的数据训练而成,表现也同样比 ChatGPT 更好。

目前关于 phi-1 的论文已经在 arXiv 中发布,可以在这里找到论文的相关内容。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

每日推荐
戴尔XPS13Plus日本发布:全新设计,可选i5-1240P/i7-1

戴尔XPS13Plus日本发布:全新设计,可选i5-1240P/i7-1

,据PCWatch报道,戴尔在日本发布了全新的XPS13Plus笔记本,但没有公布价格和出...更多

2022-04-19 16:27:00
全球芯片库存不断累积,业界解读出现分歧

全球芯片库存不断累积,业界解读出现分歧

据彭博社报道,全球主要芯片制造商产成品库存正加速累积,这一现象引发业界担忧。尽管几家受访企...更多

2022-04-19 16:10:00
德龙激光明日申购顶格申购需配市值6.50万元

德龙激光明日申购顶格申购需配市值6.50万元

德龙激光明日开启申购,公司本次发行前总股本为7752.00万股,本次拟公开发行股票2584...更多

2022-04-19 16:01:00
SA:2021年全球智能手机批发ASP突破300美元大关

SA:2021年全球智能手机批发ASP突破300美元大关

StrategyAnalytics的WSS服务最新研究指出,2022年全球智能手机批发收益...更多

2022-04-19 15:31:00
第九届“云鼎奖”申报启动,见证行业过往十年辉煌征程!

第九届“云鼎奖”申报启动,见证行业过往十年辉煌征程!

3月1日起,由第十届全球云计算大会middot;中国站主办方英富曼集团牵头组织的第九届ld...更多

2022-04-19 15:16:00
人民币兑日元逼近20大关上热搜:日元贬值势头依然强劲

人民币兑日元逼近20大关上热搜:日元贬值势头依然强劲

4月19日,日元兑人民币,一度低至0.0499!截至18日上午12时,日本东京外汇市场日元...更多

2022-04-19 14:41:00
中国移动Ⅰ类铅酸蓄电池产品公开集采:总规模约8.778亿Ah

中国移动Ⅰ类铅酸蓄电池产品公开集采:总规模约8.778亿Ah

据中国移动发布的集采公告显示,本期集中采购产品为2V、12VⅠ类铅酸蓄电池产品,预估采购规...更多

2022-04-19 12:58:00
CITE2022观众登记全面开启,享VIP观众只需一步!

CITE2022观众登记全面开启,享VIP观众只需一步!

乘风破浪,破局爆发2022年5月17日第十届中国电子信息博览会即将于深圳会展中心惊艳亮相1...更多

2022-04-19 12:53:00