驱动中国2024年5月14日消息,国盛证券的最新研报显示,GPT-4o的文本和图像功能今天已在ChatGPT中推出,这一进步标志着更自然人机交互的新纪元。该功能的引入为多模态交互提供了崭新的能力,利用端到端模型实现了体验上的新突破,预计将在各种终端上实现用户体验的最大化。此外,开发人员现在可以通过API访问GPT-4o作为文本和视觉模型。与之前的GPT-4Turbo相比,GPT-4o的速度提高了两倍,成本减半,速率限制则提高了五倍。

搜狗高速浏览器截图20240514092216

 

具体来说,GPT-4o的增强功能意味着用户可以期待以下几方面的改进:

强大的识图能力:GPT-4o能够更好地理解和生成图像内容,这为用户提供了更为丰富的交互方式。

提升的文字输入限制:现在用户可输入的单词数量提升至2.5万个,从而可以进行更为复杂和深入的对话。

回答准确性的显著提高:无论是计算题还是其他知识问题,GPT-4o提供的答案准确率有显著提升,这增强了其作为智能助手的可靠性。

多模态普及的推动:GPT-4o不仅加强了文本处理能力,还推动了对算力和训练推理数据需求的双向增长,这对整个人工智能领域都是一大利好。

国盛证券认为,这些改进将有利于智能终端代理、机器人等方向的发展,因为它们依赖于先进的人工智能技术来提供服务和改善用户体验。随着GPT-4o的推出,我们可以预见未来几周内,OpenAI还将在ChatGPT Plus中推出带有GPT-4o的新版本语音模式,这将为人机交互带来更加自然流畅的体验。

总而言之,GPT-4o的推出是人工智能领域的一大里程碑,它不仅提升了现有应用的功能,也为未来的技术发展和应用创新铺平了道路。随着技术的不断进步,我们有理由相信,人工智能将以更加智能和直观的方式服务于社会和人类生活。