ChatGPT即将推出图像及语音功能，AI应用迭代加速_小鸡飞翔

小鸡飞翔

+关注

博主要求身份验证

登录用户ID：

ChatGPT即将推出图像及语音功能，AI应用迭代加速中信建投人工智能

事件：9月25日，OpenAI在官网宣布，将在未来两周内面向Plus和企业用户推出ChatGPT的语音和图像功能，允许用户进行语音对话或向ChatGPT展示其正在谈论的内容。其中，语音功能将在iOS和Android平台推出，图像功能将登陆所有平台。

图像交互能力显著提升。早在3月份GPT-4发布时，其强大的图像能力便受到关注，然而受到安全性和算力的限制，该功能一直未在网页端上线。此次更新后，用户可以更好地与GPT交互，例如演示demo中，用户可以上传自行车和工具箱照片，让GPT-4给出调节自行车高度的方法及使用对应工具的建议。此外，图像功能还可以将生活中的场景拍摄下来给ChatGPT，让其帮助答疑解惑，比如讲解一道数学题、学地标建筑的历史。

语音能力成为更便捷的个人助手。目前的ChatGPT仅支持用户语音转为文字后，GPT通过文字进行回答。更新后语音将直接作为人机交互方式，更明显提升智能化和便捷性，使其成为真正的个人助手和应用流量入口。

随着AI技术和应用的逐渐成熟，AI的商业模式将进一步明晰，以GPT Plus和微软企业版为代表的的产品付费意愿将进一步提升，建议重点关注AI应用在垂直场景的落地。同时，随着语言大模型转向多模态大模型，算力需求将进一步提升，建议关注AI算力产业链的变化。

打开淘股吧APP