大模型在行政工作中的实践
2024-07-15
大家对电影中钢铁侠助手贾维斯无缝沟通、多种任务支持的场景一定无比羡慕,今天凌晨,OpenAI让我们更加靠近这一步了。
2024年5月14日凌晨,OpenAI举行春季发布会,我帮大家梳理了一下。
贾维斯那样的全息影像,目前或许还需要一些一段时间。但在电脑桌面上有一个像贾维斯那样的助手,随时准备回答你的问题,已经被OpenAI变成了现实。他们为macOS用户推出了全新的ChatGPT桌面应用,让你能够通过简单的快捷键操作,就能与AI进行互动。而且,不用等太久,Windows用户也将享受到同样的便利。
这次发布会核心中的核心,GPT-4o模型!!!
GPT-4o模型支持全模态交互,这意味着它能够同时理解和处理文本、音频和视频等多种形式的数据。就像贾维斯能够通过各种方式理解并执行钢铁侠的命令,GPT-4o为这一切奠定了技术基础。
直到今天之前,在语音模式下,OpenAI仍需要调用三个模型——转写、智能和文生语音功能,GPT-4o可以自然地在图片、文件和声音上进行推理。同时,GPT-4o能够上传图片、进行分析、使用“浏览器”功能搜索实时信息。GPT-4o也将支持记忆功能。GPT-4o还支持API,供开发者调用。
这么离谱的更新升级,新模型的使用成本竟然更低了,并且通过多模态融合(不像之前多模型拼接),响应速度也有了很大提升。“相较于GPT-4 Turbo,GPT-4o快两倍、便宜50%,速率限制高出5倍。”
对于免费用户来说,OpenAI的这一决定无疑是个大好消息。现在,即使是免费用户也能享受到GPT-4o模型的强大功能,包括数据分析、图像分析等。
当然,付费用户将会获得更高的消息限制(OpenAI说至少是5倍)。另外,OpenAI将在未来1个月左右向Plus用户推出基于GPT-4o改进的语音体验。
对于在GPT应用商店中开发应用的开发者来说,OpenAI的免费开放策略将带来海量的新增用户。这不仅意味着他们的应用将被更多人使用,也为他们创造了更多创新和商业化的机会。
此外,在发布会上,OpenAI还通过一系列生动的演示,展示了GPT-4o模型本次更新的内容。
1. 情感识别与响应:ChatGPT能够从用户的声音中识别出紧张的情绪,并指导用户进行深呼吸。同时,不需要再与机器进行机械的一问一答,避免每次“尴尬地等待2-3秒”。
2. 实时数学解题:通过摄像头,ChatGPT实时帮助解决了一个一元方程题,不需要拍照、录像上传,直接一步到位。
3. 多语言翻译:ChatGPT还进行了意大利语和英语的实时交传翻译,自动识别语言、自动选择翻译,更加像一个智慧的伙伴。
4. 桌面环境互动:ChatGPT桌面版展现了对代码和电脑桌面(如气温图表)的实时解读能力,可以更加方便地无感支持工作,提升工作效率。
随着这些功能的逐步向所有用户推送,我们有理由期待,未来的人工智能将像贾维斯一样,成为我们生活中不可或缺的一部分,帮助我们更高效、更智能地完成各种任务。
本文由飞哥数智谈原创发布,飞哥数智谈是由济南深创信息科技有限公司技术人员创立的公众号,致力于分享数字化、智能化技术的实践与应用。
欢迎关注飞哥说智谈公众号
免责说明:本文仅供学习交流与科普用途,不构成行动建议。对于依据本文采取措施导致的任何后果,我们不负法律责任。