OpenAI发布GPT-4o mini丨知名大模型迎战2024高考全科成绩出炉丨苹果否认如何使用未授权YouTube视频训练AI

互联网2024年7月19日报道丨AI资讯早报 OpenAI发布GPT-4o mini,免费替代GPT-3 5 当地时间7月18日,OpenAI在官网发布了最新的

互联网2024年7月19日报道丨AI资讯早报

OpenAI发布GPT-4o mini,免费替代GPT-3.5

当地时间7月18日,OpenAI在官网发布了最新的一款大模型GPT-4o mini,它是GPT-4o的小尺寸版本,具备文本、图像、音频、视频的多模态推理能力。与GPT-4o保持一致,GPT-4o mini也支持128K的上下文窗口Tokens

根据官方发布的测评报告显示,GPT-4o mini的性能比GPT-4更好,大约有GPT-4o的80%能力。但API的价格却大幅度下降了60%,每100万tokens的输入为15美分,每100万tokens的输出为60美分,是目前市面上性价比最高、性能最佳的大语言模型,其API单价甚至可以与国内的大模型“价格战”打得有来有往。

根据OpenAI公布的测试数据显示,GPT-4o mini的数学、编码、视觉等推理能力非常好,是目前最强的多模态小模型之一。

值得一提的是,从今天开始GPT-4o mini已经取代了GPT-3.5 Turbo,免费为注册的ChatGPT用户提供服务,而GPT-3.5则完成了其历史使命从ChatGPT上下线。同时,这也是OpenAI发布的第一个基于指令层级结构的模型。

微软AI绘图设计工具Designer登陆手机端应用

图片

目前,微软已经在 iOS / Android 平台上发布了 AI 设计应用 Designer 的预览版,该应用允许用户通过模版创建自定义图像、贴纸、贺卡、邀请函等,还能实现 AI 编辑、重新设计图像的进阶功能,用户可以免费使用 15 次进阶功能,Copilot Pro 订阅用户可以获得 100 次。

去年,基于 DALL·E 3 开发的 Designer 最初可以在网页端和微软自家 Edge 浏览器上使用,现在拥有个人微软账户的用户都可以在 Windows 11、iOS 和 Android 平台使用其免费程序。

除了独立应用,微软也在 Word、PowerPoint 中的 Copilot 助手添加了 Designer 支持,Copilot Pro 订阅者可以在 Office 内直接调用。

科大讯飞上线星火大模型Spark Pro-128K API调用

7月18日,科大讯飞对外发布消息,讯飞星火API正式开放长文本上下文大模型——Spark Pro-128K,支持128K Tokens,价格最低0.21元/万Tokens。

现如今,长文本能力越来越受到模型开发商的青睐,区别于传统的文本处理模型,长文本模型具备更准确的文本理解和生成能力以及更强大的跨领域迁移能力,可以一次性理解和生成更多的信息,适用于复杂的对话、长篇内容创作和详细的数据分析等任务,能提升模型解决问题的边界。

今年6月27日,科大讯飞发布了星火大模型V4.0,并且宣布其长文本能力得到提升,针对长文档知识问答的幻觉问题,业界首发「内容溯源」功能。具体来说,星火大模型的回复里边,会向用户提供标注大模型的回复是参考了哪一段的内容,做到精准溯源,可以轻松掌握信息采集来源的准确性。

图片

据互联网了解,星火大模型 Spark Pro -128K 目前已经在开发平台面向所有开发者开放 API 调用,价格为 0.21~ 0.30 元 / 万 Tokens,个人用户可直接免费领取 200 万 Tokens 的尝鲜免费体验量。

知名大模型迎战2024高考全科成绩出炉,理科仅能上二本

7月17日,上海人工智能实验室对外发布了 7 款主流的 AI 大模型的高考全科目测试结果,据大模型开源开放评测体系“司南”相关负责人介绍,“当前大模型仍存在很大的局限性。组织 AI 大模型们参加高考,目的是评测当前大模型的真实水平,找准问题,持续推进技术进步。”

图片

继上个月对外发布了大模型们参与 2024 高考「语数英」三科的成绩后,上海人工智能实验室联合司南评测近日对 7 个 AI 大模型进行了全科目测试,成绩已公布:书生·浦语 2.0 系列文曲星大模型(浦语·文曲星)、阿里通义千问大模型 Qwen2-72B,以及 GPT-4o 包揽文科、理科的前三甲。

根据河南省分数线,前三名的「 AI考生」的成绩分别超过了文科一本线和理科二本线。

其中,阿里通义千问大模型 Qwen2-72B 以 546 分的成绩获 AI 高考「文科状元」,浦语文曲星则以 468.5 分成为理科第一名。总体上看,AI 考生的理科成绩弱于文科,体现了大模型在数理推理能力上普遍存在短板。

苹果回应未经授权使用YouTube视频训练AI:仅用于研究

日前,彭博社爆料苹果、英伟达等科技巨头在未获得授权的情况下使用了大量的 YouTube 上知名创作者的优质内容视频,将该视频的内容音频转成字幕文档素材,用于训练的自家的 AI 大模型。其中,我们了解到,苹果公司向第三方采买了相关的数据训练了开源模型 OpenELM。

图片

现在进一步的追踪进展来了,苹果公关人员回应称,OpenELM 作为一款开源模型,并不为任何的人工智能设备或者机器学习功能提供技术支持,包括旗下最新发布的苹果AI智能服务 「Apple Intellegent」。

苹果强调,OpenELM 模型的目的是为研究社区作出贡献,推进大语言模型开发,仅用于研究目的。

按照苹果的说法,由于 OpenELM 并非「Apple Intellegent」的一部分,因此苹果从未使用未授权的 YouTube 视频字幕作为训练数据。苹果曾经表示,「苹果AI」使用的数据都是经过许可和网络爬虫收集的公开数据。