通义网页版上线AIPPT创作丨OpenAI考虑放弃非营利架构,发布新模型需要政府审批丨谷歌Gemini支持更多文档格式

互联网2024年9月2日报道丨AI资讯早报 阿里云通义网页版上线AI-PPT创作:一句话/一份文档自动生成 8月30日,阿里云旗下通义官方账号发布消息称,通义网

互联网2024年9月2日报道丨AI资讯早报

阿里云通义网页版上线AI-PPT创作:一句话/一份文档自动生成

8月30日,阿里云旗下通义官方账号发布消息称,通义网页版今天上线了“PPT创作”功能,其基于通义大模型打造,由通义实验室全链路自研,用户可免费使用。

据介绍,用户可从通义网页版的“效率”板块进入“PPT创作”页面,输入一句话或上传文档之后,该工具即可围绕用户给出的内容,自动生成大纲和根据需求展开的内容。

此外,PPT 创作支持文生图、图片素材库搜索匹配功能,基于通义万相视觉大模型实现。

除此之外,通义官方还宣布了其他产品的功能更新,包括:

在通义网页版内,音视频转文字AI产品“通义听悟”升级为“实时记录”;长文档阅读助手“通义智文”升级为“阅读助手”,并与“PPT创作”功能合并为名为“通义效率”的新产品。

OpenAI考虑放弃非营利架构,发布新模型需要美国政府审批

当地时间8月30日,据英国金融时报报道,OpenAI 为吸引更多投资者,正考虑调整公司结构。该公司正在推进一项数十亿美元的融资计划,并致力于维持相较于谷歌和其他竞争对手的领先优势。

图片

据三名参与对话的人士透露,OpenAI 已与投资者讨论了重组事宜。他们补充说,虽然尚未就最终形式达成一致,但通过寻求简化当前复杂的非营利结构,该公司可能对投资者更具吸引力。

据知情人士透露,OpenAI 正在谈判以超过 1000亿美元的估值筹集新资本,苹果英伟达微软等大厂参与洽谈。

不仅如此,OpenAI CEO奥特曼当地时间8月30日在推特(X)发文宣布,该公司已经与美国AI安全研究所达成合作协议,对于OpenAI未来的模型进行预发布测试。

这也就是说,只有通过美国政府的各种安全测试,OpenAI才能发布领先的大模型。已经无法自行发布产品,无形之中会限制其技术的发挥。例如,OpenAI正在测试的「草莓」项目和「猎户座」项目在AI功能方面可能会受到影响。

奥特曼这条推文下方评论区前部的多数网友对这个消息持悲观态度,甚至宣布放弃使用OpenAI的产品,并表示OpenAI再也不是那个拥有无尽想象力和创造力的生成式AI领导者,这很可能让这家公司的前途蒙上了一层迷雾。

谷歌升级Gemini功能:支持更多文档格式、提高文档分析力

当地时间8月27日,谷歌官方博客发文透露,旗下 Gemini AI 支持更多类型的文件,通过分析、摘录、洞察文档内容,为用户提供更优质的 AI 服务。

谷歌表示拥有 Gemini Business、Enterprise、Education 或 Education Premium 许可证的 Google Workspace 用户,现在可直接通过谷歌云盘 Google Drive,或本地设备上传各种文档文件到 Gemini AI 内进行数据分析。

同时 Gemini AI 可针对一系列的文档格式进行分析并提供相对应的内容报表输出以及文档总结。

具体如下:

  • 电子表格:Gemini AI 现在可以处理 CSV、XLSX 和 ODS 等格式的电子表格,使用户能够分析数字数据、跟踪趋势,并从财务模型、销售报告等生成洞察力。
  • 演示文稿:用户现在可以上传 PPTX、PDF 和 KEY 等格式的演示文稿,让 Gemini AI 可以提取要点、总结内容并识别图表和图像等视觉元素。
  • 图像:Gemini AI 现在可以分析 JPEG、PNG 和 GIF 等格式的图像,提取文本、识别对象并为视觉内容提供上下文。
  • 音频:用户现在可以上传 MP3、WAV 和 FLAC 等格式的音频文件,让 Gemini AI 能够转录语音、识别发言人,并总结访谈、播客和讲座中的要点。
  • 视频:Gemini AI 现在可以处理 MP4、MOV 和 AVI 等格式的视频文件,从演示文稿、纪录片和培训视频中提取脚本、识别场景并总结关键事件。

首届中国数字人大会9月23~24日在北京举行

8月29日,中国互联网协会日宣布,2024(首届)中国数字人大会将于 9 月 23 日~24 日在北京中关村国家自主创新示范区展示交易中心举办。

本次大会以“数字人应用与未来”为主题,就关乎数字人发展的战略、技术、应用、安全、人才等问题进行系统研究。大会组织的系列精品内容包括开幕大会、多场专题论坛、两场行业赛事、多场产业生态活动。

大会旨在进一步凝聚业界共识,多维度、多视角探讨关系数字人发展的战略、技术、应用、安全、人才等关键话题,并就 AIGC、智能体、具身智能等相关话题,与社会各界人士展开交流。

米哈游创始人蔡浩宇宣布AIGC创业计划,微软、B站大牛加盟

国内头部游戏公司米哈游的创始人蔡浩宇近日宣布将开启个人创业,宣布成立一家AI研究公司名为「Anuttacon」。据其介绍,该公司称“充分利用人工智能技术的潜力创造全新、创新、智能且极具吸引力的虚拟世界体验和AGI产品。”

目前该公司已经招募了前微软全球研究合伙人、图形学技术大佬童欣加盟,并担任首席研究员;此外,还邀请前B站哔哩哔哩副总裁兼直播业务负责人王宇阳加盟,担任公司的用户生态总裁职位。

8月28日,蔡浩宇在其个人领英主页上发言称,AIGC已经彻底改变了游戏开发,未来只有两种人制作游戏是有意义的:一种是前0.0001%的天才,组成精英团队创造前所未有的东西;其他99%的业余爱好者可以为了满足自己的想法而一时兴起创作游戏。

至于普通和专业的游戏技术垂直开发者,蔡浩宇则建议不妨考虑转行,拥抱更广阔的未来。