据报道,人工智能公司正在努力改进最新模型
据彭博社最新报道,OpenAI、谷歌和 Anthropic 等领先的人工智能公司在构建新 AI 模型方面付出了高昂代价,但目前正面临“收益递减”的问题。随着苹果继续通过 Apple Intelligence 分阶段推出自己的 AI 功能,这些障碍似乎越来越大。
据报道,OpenAI 的最新模型(内部称为 Orion)未能达到公司的性能预期,尤其是在处理编码任务方面。与 GPT-4 相比,该模型据称缺乏对现有系统的重大改进。
据报道,谷歌即将推出的 Gemini 软件也面临类似障碍,而 Anthropic 则推迟了预期的 Claude 3.5 Opus 模型的发布。接受彭博社采访的行业专家将这些挑战归因于寻找“新的、未开发的高质量人造训练数据来源”的难度越来越大,以及同时开发和运行新模型与现有模型相关的巨大成本。
报告指出,硅谷认为,更多的计算能力、数据和更大的模型将不可避免地带来更好的性能,而最终的圣杯——通用人工智能 (AGI)——可能是基于错误的假设。因此,各公司现在正在探索替代方法,包括进一步的后期训练(结合人工反馈来改善响应和改善语气)和开发称为代理的人工智能工具,这些工具可以执行有针对性的任务,例如代表用户预订航班或发送电子邮件。
人工智能初创公司 Hugging Face 的首席伦理科学家玛格丽特·米切尔 (Margaret Mitchell) 表示:“AGI 泡沫正在一点点破灭。”她告诉彭博社,可能需要“不同的训练方法”才能让人工智能模型在各种任务上真正发挥作用。接受采访的其他专家也赞同米切尔的观点。
这些挑战将对苹果的方法产生多大影响尚不清楚,但相比之下,Apple Intelligence 更加专注,该公司使用基于隐私的内部大型语言模型 (LLM)。苹果的人工智能服务主要在设备上运行,而该公司的私有云计算加密服务器仅在需要更高级处理能力的任务时才会被 ping。
苹果正在将人工智能功能集成到现有产品和服务中,包括写作工具、Siri 改进和图像生成功能,因此不能说它在 LLM 领域直接竞争。不过,苹果已与 OpenAI 达成合作,允许 Siri 选择性地将更多开放式查询交给 ChatGPT。据报道,苹果还与其他 LLM 公司就类似的外包合作关系进行了讨论。
大型人工智能公司在追求突破性通用人工智能模型时面临的挑战可能最终会验证苹果更为保守的策略,即开发可增强用户体验的特定人工智能功能。从这个意义上说,其隐私优先政策可能并不像最初看起来那么束缚人。苹果计划在下个月发布 iOS 18.2 时扩展 Apple Intelligence 功能,然后通过进一步更新到 2025 年。