移动客户端

|

官方微信

|

官方微博

|
长安播报:
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
赵丽颖回应三次陪跑

  科技巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。

  当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或能与谷歌的Gemini 1.5、Anthropic的Claude 3和OpenAI的GPT-4等知名大模型相匹敌。微软或将在5月21日开始举办的Build开发者大会上演示这款新模型。

  据报道,MAI-1的开发由前谷歌AI领导人、曾担任AI初创公司Inflection首席执行官的穆斯塔法·苏莱曼(Mustafa Suleyman)领导。就在今年3月,刚刚领投完Infection的最新一轮融资,微软便从Infection挖走了包括苏莱曼在内的两位联合创始人以及部分员工。有知情人士透露,微软为此向Infection支付了超过6.5亿美元。

  尽管MAI-1可能借鉴了Inflection旗下模型的部分技术,有微软员工表示,MAI-1是一款全新的大语言模型,拥有约5000亿个参数,远超微软此前训练的任何开源模型。不到一个月前,微软刚推出了一款名为Phi-3的小型AI模型,其中Phi-3 mini被优化至可部署在手机上,拥有38亿参数,经过3.3万亿token的训练,微软称其性能与GPT-3.5等模型相当。

  相比之下,MAI-1的规模要大得多,也需要更多的算力投入和训练数据。为了训练该模型,微软已经配置了大量包含英伟达GPU的服务器集群,并从各类来源收集训练数据,包括由OpenAI的GPT-4生成的文本和公共互联网数据。这或将使MAI-1与OpenAI的GPT-4处于相似的水平,据传后者拥有超过1万亿个参数。

  Phi系列模型和MAI-1的研发体现出微软或在AI领域采取了双重策略,一边为移动设备开发小型本地模型,一边开发由云端支持的更大规模的模型。不过,即使在微软内部,MAI-1的确切用途也尚未得到确认。

  更重要的是,MAI-1体现出微软并不希望在AI领域完全依附于合作伙伴OpenAI的技术。来自OpenAI的技术正在驱动微软的各类生成式AI功能,包括集成在Windows中的聊天机器人。此前,有来自微软AI平台团队的员工抱怨称,公司的AI战略过于关注与OpenAI的合作关系,使得微软对AI原创研究的预算减少。

  6日当天,微软首席技术官凯文·斯科特(Kevin Scott)在领英上发帖,间接回应了关于MAI-1的报道。他表示,OpenAI使用微软构建的超级计算机来训练AI模型,而微软的研究部门和产品团队也在构建AI模型:“AI模型几乎出现在我们的每一项产品、服务和运营流程中,制作和运营它们的团队有时需要做一些自定义工作,无论是从头开始训练一个模型,还是微调别人构建的模型。未来将会有更多这样的情况,其中一些模型的名字包括图灵(Turing)和MAI。”

  为了实现在AI方面的突破,微软也在大力囤积算力资源。4月初,有报道称微软计划到今年年底前囤积180万块AI芯片,意味着公司希望在2024年内将所持有的GPU数量增加两倍。据知情人士透露,从2024财年到2027财年(到2027年6月30日结束),微软预计将在GPU和数据中心上花费约1000亿美元。

  澎湃新闻记者 胡含嫣

[ 更多头条 ]
印度列车相撞已致 233 人死亡
  降低收费标准,取消二类区域阶梯计费,保留一类区域阶梯计费,阶梯计时分界点拟由前2小时调整为前3小时,具体收费标准拟定为:一类区域前3小时1.0元/15分钟、3小时后1.5元/15分钟;二类区域0.75元/15分钟;三类区域0.5元/15分钟。[详细]
阿根廷 vs 澳大利亚
  法院经审理后认为,被告人刘某向被害人所声称的可通过各种方式帮助被害人子女进入国内或国外高校就读的办事能力系其虚构,各被害人因对刘某所虚构的办事能力陷入错误认识而交付钱款,刘某也并未将钱款用于被害人所托事项。刘某在明知其受托事项无法办理的情况下,面对被害人长时间、多次的质疑、追问和催要钱款,仍编造种种借口予以拖延,在案发前拒不退还相关款项,足见其非法占有他人财物之目的,其行为已构成诈骗罪,且数额特别巨大,依法应予惩处。 [详细]

热点新闻 更多>

在这首现代rap中,藏着多少世界级非遗?

  相对成年人而言,中国青年就业的劣势比较突出。以OECD(经济合作与发展组织)国家来看,青年失业率与成年失业率的倍数超过4倍就是极高水平,3倍-4倍属于偏高水平。4月,中国青年失业率与成年失业率的倍数已经达到4.62倍。国际经验表明,一个国家或地区的青年失业率一般是整体失业率的2倍到3倍。5月,中国青年失业率已经是整体失业率(5.2%)的4倍。[详细]

黄子琪消失的她

  “校园餐的监管应该从两个主体着手,一个是经营者,就是做饭的,另一个则是供应商,负责送菜的。目前对校园餐的监管重在前端,比如明厨亮灶,卫生清洁等,也就是针对做菜的。但供应链其实是团餐的核心,比如食材从哪里买的,怎么进入的食堂,过程中是否需要冷链,这才是重中之重。”[详细]

长安网群 更多>

移动客户端
官方微信
官方微博
关闭