,Meta 在当地时间周五宣布,它将推出一种针对研究社区的基于人工智能 的新型大型语言模型,与微软、谷歌等一众受到 ChatGPT 刺激的公司一同加入人工智能竞赛。
Meta 的 LLaMA 是“大型语言模型 Meta AI”的缩写,它可以在非商业许可下提供给政府、社区和学术界的研究人员和实体工作者。
该公司将提供底层代码供用户使用,因此用户可以自行调整模型,并将其用于与研究相关的用例。Meta 表示,该模型对算力的要求“低得多”。
据介绍,该公司正在开发多种参数的 LLaMA。其中,LLaMA 65B 和 LLaMA 33B 在1.4 万亿个 tokens上训练,而最小的模型 LLaMA 7B 也经过了1 万亿个 tokens 的训练。
与其他大型语言模型一样,LLaMA 的工作原理是将一系列单词作为“输入”并预测下一个单词以递归生成文本。为了这套模型,Meta 从使用人数最多的 20 种语言中选择文本进行训练,重点是拉丁语和西里尔字母。
当然,与其他模型一样,LLaMA 也面临着偏见、有毒评论和幻觉的挑战,Meta 还需要做更多的研究来解决这类语言模型中的不足。
Meta 表示,LLaMA作为一个基础模型被设计成多功能的,可以应用于许多不同的用例,而不是为特定任务设计的微调模型。通过开源 LLaMA 的代码,其他研究人员可以更轻松地找到限制或消除这些问题的新方法。Meta 还在本文中提供了一组评估模型偏差和毒性的基准评估标准,以显示模型的局限性并支持研究人员在这一关键领域的进一步研究。
值得一提的是,Meta 在去年 5 月也曾推出过大型语言模型 OPT-175B。该项目同样也是针对研究人员的,这构成了其聊天机器人 blenterbot 新迭代的基础。
后来,该公司还推出了一款名为“卡拉狄加” 的模型,据称它可以撰写科学文章和解决数学问题,但其演示版本后来被下架,因为它反复生成“听起来很权威”的内容。
IT之家附官方链接:
Github
申请访问 LLaMA
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
,据PCWatch报道,戴尔在日本发布了全新的XPS13Plus笔记本,但没有公布价格和出...更多
2022-04-19 16:27:00据彭博社报道,全球主要芯片制造商产成品库存正加速累积,这一现象引发业界担忧。尽管几家受访企...更多
2022-04-19 16:10:00德龙激光明日开启申购,公司本次发行前总股本为7752.00万股,本次拟公开发行股票2584...更多
2022-04-19 16:01:00StrategyAnalytics的WSS服务最新研究指出,2022年全球智能手机批发收益...更多
2022-04-19 15:31:003月1日起,由第十届全球云计算大会middot;中国站主办方英富曼集团牵头组织的第九届ld...更多
2022-04-19 15:16:004月19日,日元兑人民币,一度低至0.0499!截至18日上午12时,日本东京外汇市场日元...更多
2022-04-19 14:41:00据中国移动发布的集采公告显示,本期集中采购产品为2V、12VⅠ类铅酸蓄电池产品,预估采购规...更多
2022-04-19 12:58:00乘风破浪,破局爆发2022年5月17日第十届中国电子信息博览会即将于深圳会展中心惊艳亮相1...更多
2022-04-19 12:53:00