Meta 发布 Megabyte AI 模型抗衡 Transformer ，速度提升 4 成环球今日讯

首页 > 资讯 > > 内容页

Meta 发布 Megabyte AI 模型抗衡 Transformer ，速度提升 4 成环球今日讯

发表于: 2023-05-30 19:43:45 来源：搜狐号-IT之家

(相关资料图)

IT之家 5 月 30 日消息，近日 Meta 团队开发了一款名为 Megabyte 的 AI 模型以抗衡 Transformer，据称 Megabyte 解决了 Transformer 模型所面临的问题，并且在速度上提升了 40%。

▲ 图源 Arxiv

目前 Transformer 在自然语言处理等领域非常流行，但由于其序列数据的处理方式是逐步进行的，无法并行化处理，因此训练速度较慢；难以处理长序列，因为其在反向传播过程中，梯度很容易消失或爆炸；此外，由于需要在每一步保留历史信息，内存消耗较大。

而 Megabyte 模型将输入和输出序列划分为 patch，而不是单个的 token。这种架构使得对大多数任务而言字节级别的预测相对容易，例如根据前几个字符预测完成的单词等。这意味着在大型网络中可以精简字符以提升效率，并且内部预测可以使用更小的模型进行。Megabyte 模型的这种方法解决了当今 AI 模型所面临的训练速度、可靠性及硬件占用比挑战。

▲ 图源 Arxiv

此外，在计算效率方面，相比于等大的 Transformer 和 Linear Transformer，Megabyte 模型在固定模型大小和序列长度范围内使用更少的 token。因此相对于 Transformer，Megabyte 模型可以在相同的计算成本下训练内容更丰富、体积更大、性能更好的模型。

目前 Meta 团队放出了 Megabyte 模型的论文，IT之家小伙伴可以前往查阅。

标签：

山东青岛：楼宇经济体劳动争议预防调解联盟成立

2022-02-15查看详情

电力巡线工“偏向虎山行”

2022-02-15查看详情

听！城市的脉动

2022-02-15查看详情

Meta 发布 Megabyte AI 模型抗衡 Transformer ，速度提升 4 成 环球今日讯

Meta 发布 Megabyte AI 模型抗衡 Transformer ，速度提升 4 成 环球今日讯

融创中国港股涨15.45% 环球讯息

达州这些地方将临时关闭考点周边公众移动通信基站

梅罗之后第3人！沙特联赛2亿欧大合同报价本泽马，皇马同意放人

世界杯小组赛全部打平_世界杯小组赛全部平局怎么解决-世界滚动

最新快讯!常州天宁区税务：“沉浸式”体验走流程 面对面交流促提升

新消息丨中国金茂50亿公司债项目状态更新为“已受理”募集拟用于偿还境外债

关注儿童健康生长 这些“长高”误区要避开

世界实时：亚威股份：公司将深耕高端装备制造业主业 同时不断提升自身智能制造水平等

今日要闻!千笔楼丨“60后”带俩“80后”，这个“三人组”有看头

戴姆勒卡车和丰田汽车(TM.US)将合并日本卡车业务|每日讯息

猪场夜间电闸跳闸 高温致五千头猪死亡：损失上千万

体育赛事媒体运行服务（媒体:极限运动赛事不能再野蛮生长） 全球快看

七年级作文素材下册_七年级作文素材

成都理工大学教务处在哪_成都理工大学教务处

热点聚焦：实时herewego：阿德里安下个赛季也会留在利...

国外航天员何时可以进入中国空间站？中国官方：正在积极开展有关筹备_今热点

全球短讯！央广传媒与岚图汽车即将达成战略合作 探索“央媒+央企”合作新模式

玲珑轮胎董秘回复： 公司高度重视全球化发展战略，积极开拓境外市场|焦点速递

冷轧酸洗工艺_冷轧酸洗

马提尼克岛长高的真相_马提尼克岛长高骗局 天天精选

烛光里的妈妈歌词是什么意思_烛光里的妈妈歌词 热资讯

奥迪威：5月29日融资买入3.03万元，融资融券余额84.74万元

神舟十六号载人飞行任务航天员乘组出征仪式举行

全球讯息：铁路人的“天窗”施工

肖战等解锁新代言，杨紫等登刊大赏

琉球这个问题，我们应该跟日本好好谈谈 天天热讯

2023年7月15号长沙萌卡动漫展攻略（门票+地址+时间）

环球报道:咳嗽感冒不可以吃什么水果_咳嗽吃什么水果好得快一些

现代和起亚宣布与FIFA的合作伙伴关系延长至2030年 焦点快报

最忆江南(对于最忆江南简单介绍)

每日报道：哪个银行贷款容易过_哪个银行贷款容易

心惊肉跳！一墙之隔，40米高公寓楼大兴土木！地动房摇墙裂裂，800多户居民求安宁_全球时快讯

六月有贵人相助，鸿运当头，三大生肖喜迎八方横财！

当前要闻：5月29日基金净值：东财沪港深互联网A最新净值0.6455，跌1.68%

焦点热文：同兴达：暂未有AI算力、 数字经济、互联网电商相关方面的合作

以高质量科普助推高水平创新（创新谈） 当前聚焦

全球观速讯丨杭州宝妈买门票被骗3980元，“低价门票”套路千万要当心

三笘薰：首个英超赛季我每天都泡在足球里面，要进一步提升自己-焦点滚动

教师节给老师的祝福语_家长对教师节祝福语大全_当前焦点

集成浴霸接线示意图（集成浴霸接线图） 每日快报

重拳打击！新疆一地13家涉化肥农药经销个体及企业违规受行政处罚

天天滚动:人工智能、数字创意、生命健康......安徽新兴产业跑出“加速度”

口腔健康一点通 | 楔状缺损是什么？一起来了解一下

新时代总部基地健康嘉年华系列活动成功举行

黄浦绿城外滩兰庭二期预计三季度入市,推约180-210㎡3-4房

环塔那些人|“中国红”点燃法国骑手拉力梦|每日观点

大乐透第060期晒票来了，自己不改变的话，新的一年也是重演-焦点消息

即时焦点：每天喝中药对身体有害吗_喝中药对身体有害吗

信息：午间公告：距离“上能转债”停止转股仅剩最后半个交易日

全国垃圾分类宣传周暨五华区生活垃圾分类提升月活动正式启动

盐城近年来最大规模教师培养工程启动 三年时间将培养万名优秀教师-世界快消息

每日视讯：抓机遇、抢风口，发挥非常“6+1”比较优势 盐城接轨珠三角，推动制造业聚链成群

精锻科技：产能利用率目前大概60%+，后续会继续提升 环球今日讯

天天快报!脚本错误怎么解决视频 脚本错误怎么解决

培育荔枝优质种苗 联农带农促进发展

如何制作熟石膏模具 环球头条

当前热讯：山西前4月抽采煤层气34.8亿立方米 创历史新高

中青宝重组方案收问询函 近四年扣非净利亏损

街头篮球挑战赛决赛举行

2023宁夏奶业大会第五届银川国际奶业暨农牧机械展览会在银川开幕

焦点热文：出纳和做账会计能是一个人吗_会计一个完整做账过程

热门：春节放假安排（20不惑）

2023年5月28日河南省柠檬酸价格最新行情预测-天天快播报

C919大型客机商业载客首飞 国产大飞机商业运营正式“起步”_每日讯息

国家电器三包政策 国家三包政策是7天无理由退货吗 实时

某施工企业投标报价时确定企业管理费率以人工费为基础计算_工程造价企业管理费率的计算|焦点要闻

【独家】西红柿面怎么做好吃_西红柿门

https://cl.mzacl.com/index.php_67 220 90 4 forum index php怎么进不去了 焦点消息

环球速看：中邮消费金融发生工商变更：拉卡拉彻底退出，前者内控问题突出

剑与妖精ch.285 环球视点

什么是固定资产净值_什么是固定资产 前沿热点

夏收在即，气象服务助丰收_世界视讯

世界观点：颜值不输百万豪车，零百只需8.8秒，风行T5 EVO狂飚版上市

德桑蒂斯问鼎白宫“利器”，老婆才貌双全比名模还靓

奔驰EQE纯电SUV上市，48.6万元起售

安徽省防办紧急通知：做好山洪地质灾害防范应对

细胞培育肉亮相中关村论坛

苹果双卡手机能分别设置黑名单吗（苹果双卡手机型号）_每日视点

Meta 发布 Megabyte AI 模型抗衡 Transformer ，速度提升 4 成环球今日讯

Meta 发布 Megabyte AI 模型抗衡 Transformer ，速度提升 4 成环球今日讯

最新快讯!常州天宁区税务：“沉浸式”体验走流程面对面交流促提升

关注儿童健康生长这些“长高”误区要避开

世界实时：亚威股份：公司将深耕高端装备制造业主业同时不断提升自身智能制造水平等

猪场夜间电闸跳闸高温致五千头猪死亡：损失上千万

体育赛事媒体运行服务（媒体:极限运动赛事不能再野蛮生长）全球快看

全球短讯！央广传媒与岚图汽车即将达成战略合作探索“央媒+央企”合作新模式

玲珑轮胎董秘回复：公司高度重视全球化发展战略，积极开拓境外市场|焦点速递

马提尼克岛长高的真相_马提尼克岛长高骗局天天精选

烛光里的妈妈歌词是什么意思_烛光里的妈妈歌词热资讯

琉球这个问题，我们应该跟日本好好谈谈天天热讯

现代和起亚宣布与FIFA的合作伙伴关系延长至2030年焦点快报

焦点热文：同兴达：暂未有AI算力、数字经济、互联网电商相关方面的合作

以高质量科普助推高水平创新（创新谈）当前聚焦

集成浴霸接线示意图（集成浴霸接线图）每日快报

盐城近年来最大规模教师培养工程启动三年时间将培养万名优秀教师-世界快消息

每日视讯：抓机遇、抢风口，发挥非常“6+1”比较优势盐城接轨珠三角，推动制造业聚链成群

精锻科技：产能利用率目前大概60%+，后续会继续提升环球今日讯

天天快报!脚本错误怎么解决视频脚本错误怎么解决

培育荔枝优质种苗联农带农促进发展

如何制作熟石膏模具环球头条

当前热讯：山西前4月抽采煤层气34.8亿立方米创历史新高

中青宝重组方案收问询函近四年扣非净利亏损

C919大型客机商业载客首飞国产大飞机商业运营正式“起步”_每日讯息

国家电器三包政策国家三包政策是7天无理由退货吗实时

https://cl.mzacl.com/index.php_67 220 90 4 forum index php怎么进不去了焦点消息

什么是固定资产净值_什么是固定资产前沿热点

时隔20年尼日利亚重建国家航空公司

多人称被苹果充电头电到甚至电伤客服：电流在安全范围内全球热门

今日热门!北京汇源名下价值数亿元房产被获准拍卖被执行金额超30亿元

太保股东大会来了！最新布局曝光这些领域很关键！管理层回应5大热点问题-百事通

向群众报告 | 石马河派出所召开警民恳谈会最新资讯

三角轮胎：4月份以来公司产能发挥较高接近满产目前市场销售情况稳定每日热门

香港非遗展呈现生命力与创意

4月上海辖内银行业金融机构本外币总资产余额23.75万亿元同比增长7.81% 世界百事通

天天快资讯：财政部：1-4月国有企业经济运行态势良好主要效益指标保持增长

每日看点！上门接种疫苗近千剂市社会福利总院送上锦旗

打新早报| 高速增长的微创医疗器械公司西山科技估值低于同行有申购潜力|时讯

住建局职能和科室有哪些住建局职能

聚焦：哈银消费金融：科技引领智能征信管理以人为本净化征信环境

05502_0551相关内容简介介绍天天热推荐

科比黑曼巴称号怎么来的_科比外号黑曼巴的由来环球快资讯

浙江晨风彩印包装有限公司（雨晨包装印刷）热点

Fami通新一周销量榜《塞尔达传说：王国之泪》二连冠

微信新增锁定功能，保护隐私环球聚看点

迟到的团圆被拐26年的孩子回家了

环球今亮点！沙棘粉的功效与作用价格沙棘粉的功效与作用

速看：弘历精神网络官网弘历精神网络电脑版