2024年05月13日,OpenAI发布了GPT-4的升级版模型GPT-4o,具有全能输入输出、改进的多模式功能、更快速度和更好的视觉理解能力。
Sora 沉闷未爆,GPT-4o 捷足先登,在 OpenAI 再次面临内部人事动荡之际,最新版的 GPT-4o 推向市场,虽然并没有 GPT-5 或者 GPT search 来的让人惊艳,但是增强对文字、语音和搜索功能的支持也让人眼前一亮。
在本次的升级中,AI 会变得更像人类,主要是能听会说,增强仿人的感知能力,智能也就因此诞生。
感知升级,从文字到多媒体交流
GPT-4o 支持文本、音频和图像等多模态内容处理,提高了交互性和视觉效果,同时在速度和成本上也有显著提升。
GPT-4o 作为 OpenAI 的最新旗舰模型,不仅在技术性能上有显著提升,同时也在成本效率和用户体验上做出了重大改进,使其成为一个更加全能和高效的AI工具,可以总结其特点如下:
- 全能输入输出:GPT-4o支持文本、音频和图像等多种模式的输入和输出,这使得它能够处理更复杂和多样化的任务。
- 速度提升:与前代模型相比,GPT-4o的响应速度显著提高。例如,其音频输入的处理速度可以达到最短232毫秒,平均320毫秒,这接近人类对话的反应时间。
- 视觉能力增强:GPT-4o在理解和讨论图像方面表现出色,例如可以通过分析菜单图片来翻译不同语言的内容。此外,它还具有改进的视觉功能,能够识别和总结户型的优劣势。
- 成本效率:GPT-4o不仅提供了更高的性能,还大幅降低了成本。与GPT-4 Turbo相比,GPT-4o的价格减半,速度提升两倍,速率限制提高五倍。
- 安全性增强:为了提高用户体验和安全性,GPT-4o在设计中加入了跨模式的安全性措施,并创建了新的安全系统,为语音输出提供保护。
从和人类的互动体验上而言,本次最重要的升级是加入了实时语音对话功能,GPT-4o能够直接理解语音和视觉输入,并在语音模式下与用户进行实时交互,无需将音频转换为文本再生成回复,这大大提高了交互的效率和自然度。
对于音频输入,GPT-4o 的响应时间最短至 232 毫秒,平均也不会超过 320 毫秒,这与人类在交谈中的反应速度类似,显著提高了交互的流畅性,也就是更像和人在交互,而非等待机器的反应时间。
此外,GPT-4o 特别加入了情感识别功能,可以识别和理解音频中的情感标记,使得对话更加自然,甚至对于非英语文本,GPT-4o 也可以做到实时对话和输出,并且可以混合处理文本、音频和图像的输入,还能生成这三种形式的输出。
并且,OpenAI 为GPT-4o创建了新的安全系统,专门针对语音输出提供保护。这种保护措施可能包括对生成的语音内容进行实时监控和过滤,以防止不当或有害内容的产生。此外,这种系统可能还包括对语音识别过程中的隐私保护措施,以确保用户信息的安全。
不仅能听会说,还可看片识图。
GPT-4o 升级后,能够理解和处理图像及其内容,包括图像中的文本信息。
这不仅意味着 GPT-4o 具备强大的视觉感知能力,还能够在没有样本学习的情况下保持高水平的视觉理解和推理能力。
例如,在识别房间户型优劣势上,GPT-4o 能够识别户型基本情况,并分辨出”半赠送”的建筑面,同时清楚地总结户型的优劣势。在实际测试中,当用户随机选取一张建筑面积 134 平方米的户型图让其识图并总结户型优劣势时,GPT-4o 呈现了总体令人较为满意的结果。
整体而言,GPT-4o 仍然是在 GPT-4 基础上的改造和升级款,相较于传言中 GPT-5 的通用人工智能模型(AGI)仍旧稍显逊色,但是假以时日,这也可能是通向 AGI 的第一步。
更广泛的意义上而言,GPT-4o 的发布也将会为区块链和 AI 的结合打开新的局面,稍早之前,FET、AGIX 和 OCEAN 组建的超级人工智能联盟(ASI)将三者代币合并,推出统一的 ASI 代币,以更好面对市场竞争。
AI X 区块链浪潮仍在
4 月 16 日,FET、AGIX 和 OCEAN 合并为 ASI 的提案已获批准,此次合并预计总价值为 75 亿美元,预计于 5 月初完成,ASI 定于 5 月 24 日启动。
代币合并将按如下方式进行:FET 1 比 1 兑换为 ASI,总供应量为 26.3055 亿枚代币;AGIX 代币迁移至 ASI,兑换率为 0.433350 比 1;OCEAN 代币迁移至 ASI,兑换率为 0.433226 比 1。
在币赢研究院看来,ASI 的成立和推出,正是看到了 AI 未来的发展趋势,从多模态模型到多媒体交互,真正利用起大模型的技术表征。
在 Fetch.AI 的博客中,透露出合并FET、AGIX和OCEAN为$ASI的原因是为了进一步推动人工超智能(ASI)的发展,即 AGI 和 区块链的结合。
Fetch.AI(FET)、SingularityNET (SNET) 和 Ocean Protocol(OCEAN) 决定将它们的原生加密货币代币合并,以形成一个名为Superintelligence Collective(超级人工智能)实体,该实体拥有 ASI 代币,旨在成为人工智能研究和开发领域最大的开源独立参与者。
AGIX 作为基于 Cardano 区块链的第一个去中心化人工智能数据市场 SingularityNET 的实用代币,CoinW 数据显示其在 2023年表现出色,涨幅超过 700%,这一显著的增长表明了其在AI领域的吸引力和潜力。
FET 作为 Fetch.ai 的货币,其市值在 2023 年最高达到245.6亿美元,成为排名 128 的加密资产。然而,到了 2024年2月5日,FET的市值仅有 5 亿美元,日交易量降低至 5000 万美元。
Ocean 主打加密 AI 数据存储和销售,希望构建去中心化的数据交易和存储市场,可以和 AGIX、FET 联合起来作为一个完整的去中心化 AI 训练、存储和应用模型,以去中心化的方式探索区块链和 AI 结合的有效方式。
结语
在近期的 AI 浪潮中,AI Agent 和数据隐私保护成为两大热点,而AI Agent 和意图颇有异曲同工之妙,而隐私保护是区块链长期实践的重点方向,在 AI 依赖的数据生产和硬件加速等方面,已经诞生 io.net 和 Arweave 等多种 DePIN 方向的探索。