ChatGPT即将推出图像及语音功能,AI应用迭代加速
中信建投 人工智能事件:9月25日,OpenAI在官网宣布,将在未来两周内面向Plus和企业用户推出ChatGPT的语音和图像功能,允许用户进行语音对话或向ChatGPT展示其正在谈论的内容。其中,语音功能将在iOS和Android平台推出,图像功能将登陆所有平台。
图像交互能力显著提升。早在3月份GPT-4发布时,其强大的图像能力便受到关注,然而受到安全性和算力的限制,该功能一直未在网页端上线。此次更新后,用户可以更好地与GPT交互,例如演示demo中,用户可以上传自行车和工具箱照片,让GPT-4给出调节自行车高度的方法及使用对应工具的建议。此外,图像功能还可以将生活中的场景拍摄下来给ChatGPT,让其帮助答疑解惑,比如讲解一道数学题、学地标建筑的历史。
语音能力成为更便捷的个人助手。目前的ChatGPT仅支持用户语音转为文字后,GPT通过文字进行回答。更新后语音将直接作为人机交互方式,更明显提升智能化和便捷性,使其成为真正的个人助手和应用流量入口。
随着AI技术和应用的逐渐成熟,AI的商业模式将进一步明晰,以GPT Plus和
微软 企业版为代表的的产品付费意愿将进一步提升,建议重点关注AI应用在垂直场景的落地。同时,随着语言大模型转向多模态大模型,算力需求将进一步提升,建议关注AI算力产业链的变化。