互联网2024年3月19日报道丨AI资讯早报
英伟达发布AI算力芯片B200,可训练10万亿级参数大模型
当地时间3月18日,英伟达举行GTC2024新品发布会,黄仁勋的AI“核武库”正式上新,新一代的AI算力芯片B200横空出世,将成为科技巨头们追逐的“算力明星”——它不仅会成为新的AI算力底座,也将成为英伟达市值继续攀升的业绩底座。
作为NVIDIA Blackwell架构首款新产品,B200采用双芯片设计,晶体管数量达到2080亿个,基于Blackwell架构的B100,英伟达还提供了包括GB200、DGX GB200 NVL 72,以及基于GB200和B200打造的DGX SuperPOD超算平台。
以下为核心要点:
● B200芯片:采用双芯片设计,晶体管数量达到2080亿个。单GPU AI性能达20 PFLOPS(即每秒2万万亿次)。内存192GB,基于第五代NVLink,带宽达到8TB/s。
● DGX GB200 NVL 72:内置36颗GRACE CPU和72颗Blackwell架构GPU,AI训练性能可达720PFLOPs(即每秒72万万亿次),推理性能为1440PFLOPs(每秒144万万亿次)。
● 基于GB200的DGX SuperPOD超算:搭载8颗DGX GB200,即288颗Grace CPU和576颗B200 GPU,内存达到240TB,FP4精度计算性能达到11.5EFLOPs(每秒11.5百亿亿次)
● Project GR00T:人型机器人项目——包含了人型机器人基础模型,ISAAC Lab开发工具库和Jetson Thor SoC片上系统开发硬件,带宽达到100GB/s,AI计算性能达到800TFLOPs。
● NIM软件:针对AI推理系统的新软件,开发人员可以在其中直接选择模型来构建利用自己数据的人工智能应用程序。
高通发布第三代骁龙8s处理器,支持百亿级大模型
3月18日,高通正式对外发布了第三代骁龙8s芯片,这是一款针对骁龙8 Gen3芯片的升级款。其在端侧生成式AI能力方面进行了重点升级,支持运行百川智能Baichuan-7B、谷歌Gemini nano、Meta Llama 2和智谱ChatGLM等30多个大型语言模型和大型视觉模型,据称最高支持模型参数量为100亿量级。
第三代骁龙8s基于高通Kryo CPU架构打造,与第三代骁龙8采用相同的架构。其1个超级内核主频为3.0GHz、4个性能内核主频为2.8GHz、3个效率内核频率为2.0GHz。根据高通公布的测试结果,其多线程性能可以领先竞品20%。
苹果公司与谷歌、OpenAI商谈手机端侧大模型应用
当地时间3月17日,来自彭博社的独家披露,一位知情人士声称,苹果公司正在与谷歌进行谈判,希望将谷歌的Gemini大模型能力应用在iPhone中,以支持今年iPhone即将增加的各类生成式AI功能。
彭博社发文认为,一旦合作达成,对于双方将是一项重大的协议,大模型大规模的应用落地,可能会撼动整个AI行业。该报道还提到,苹果最近还与OpenAI进行了讨论,也考虑使用其大模型。
国内首个类Sora视频模型Open-Sora宣布开源
3月18日,国内大模型研究公司潞晨科技的创始人尤洋教授发文宣布,潞晨科技旗下Colossal-AI团队开源了其被命名为「Open-Sora」的V1.0视频生成模型,并且对外发布了GitHub代码。包括模型权重、训练源代码和详细的架构。
该模型采用了与OpenAI的Sora相似的Diffusion Transformer(DiT)架构。据了解,团队以使用了DiT架构的开源文生图模型PixArt-α为基础,引入了时间注意力层,并将其扩展到了视频数据上,支持通过参考图生成几秒的动态影像。
李开复:目前最好的大模型已达人类平均IQ的三倍
3月17日,2024 澜舟科技大模型技术和产品发布会上,澜舟科技邀请了创新工场董事长李开复出席活动,并宣布与“零一万物”达成战略合作。
作为“零一万物”的创始人,李开复在活动中表示,大模型的智力水平在两年前就已经比普通人水平“好一点”,而在目前,世界上最好的大模型已经是人类平均智力水平的三倍。
李开复以“答题”举例,即在 100 道考题里,普通人平均只能答对 33 题,而“最好的 AI 大模型”可答对 99 道以上。
从应用角度来看,李开复认为“杀手级”应用早已问世。“至少在美国我们可以看到,AI 应用能够达到 1 亿用户量的时间已远低于以前的各种互联网应用,仅仅 2-6 个月就能达到一亿用户的体量。”
他还认为,杀手级应用已经有了,而且以后会越来越多:“我预测 3 年之后,生成式 AI 的应用将成为用户增长最快的应用,全移动时代的应用将会成为一个过去式。”
“月之暗面”Kimi Chat已支持200万字吞吐
3月18日,国内大模型公司月之暗面(Moonshot AI)宣布其智能助手Kimi在长上下文Tokens窗口技术上取得突破,无损上下文长度提升至200万个中文汉字的Tokens能力。即日起,提供200万字上下文Tokens的Kimi已启动内测。
据称,基于新版的Kimi Chat,用户上传几十万字的德州扑克长篇教程后,Kimi就可以扮演一位“德扑专家”为用户提供出牌策略的指导。