OpenAI新王炸:ChatGPT语音助手可以“看”人说话了,能实时视频对话
创始人
2024-12-13 07:24:45
0

本文作者:李丹

来源:硬AI

OpenAI为期12个工作日的新产品和技术发布活动出了新王炸:在首次公开演示将近七个月后,OpenAI正式面向广大付费用户推出ChatGPT类人高级人工智能(AI)语音助手的新功能,实时视频对话。

美东时间12月12日周四,OpenAI宣布,在ChatGPT的移动端应用程序App中,上线ChatGPT高级语音模式Advanced Voice的视频和共享屏幕功能。Advanced Voice由OpenAI的多模态模型GPT-4o支持。

OpenAI的研究员在直播中演示了任何运用新功能,点击ChatGPT 聊天栏旁边的语音图标,然后点击左下角的视频图标,就可以启动视频对话。如果想共享屏幕,手机用户要点击打开一个有三个喧嚣的菜单,选择其中的“共享屏幕”(Share Screen)。

在和ChatGPT的视频对话中,OpenAI研究员提问,研究员先让GPT看到并和现场的OpenAI工作人员分别打过招呼,然后问GPT,现场谁的打扮最像圣诞老人,谁像圣诞老人的驯鹿,GPT均作出准确而回答。研究员演示了,给GPT转发一个短信内容及图片,让GPT建议如何回复对方的短信。

研究员还演示了,利用Advanced Voice的新功能让GPT帮忙校对或者通过GPT学习新东西。比如找出一些制作手冲咖啡的咖啡壶、过滤杯等工具,向GPT展示并询问如何使用这些工具,在操作时,让GPT评价做得如何,并给出建议。

OpenAI表示,大多数ChatGPT Plus和 Pro套餐的订阅用户以及所有Team用户都将可以在今后几天内通过ChatGPT的App访问周四推出的新功能,预计欧盟、瑞士、冰岛、挪威和列支敦士登的 ChatGPT Plus 和 Pro 用户也将很快可以运用新功能。ChatGPT的企业版和教育版Enterprise和Edu将于明年1月上线新功能。

同时OpenAI宣布,在Advanced Voice这一高级语音模式中,新增了“限时”的圣诞老人声音作为“节日特供”,有效期持续到明年1月初,在全球范围内,所有移动、网络和桌面App用户都可选用,它可通过 ChatGPT 中的雪花图标访问。

OpenAI原计划6月末向一小批Plus计划用户推出该语音模式,6月又宣布推迟一个月发布,以便确保该功能安全有效地处理来自数百万用户的请求。当时OpenAI称,计划今年秋季让所有Plus用户都可以访问该功能,确切的时间表取决于是否达到内部对安全性和可靠性的高标准。

7月末,OpenAI对有限的部分付费Plus用户推出高级语音模式下的ChatGPT,称语音模式无法模仿他人的说话方式,且增加了新的过滤器,保证软件能够发现并拒绝某些生成音乐或其他形式受版权保护音频的请求。当时上线的语音模式缺少5月OpenAI展示过的不少功能,比如计算机视觉功能,类似于本周四OpenAI宣布将要推出的视频对话答问。

相关内容

热门资讯

博力威新注册《一种自动识别切换... 证券之星消息,近日博力威(688345)新注册了《一种自动识别切换CAN终端电阻方法软件V1.0》项...
必易微拟斥资近3亿元收购兴感半... 每经记者|陈晴 每经编辑|陈俊杰 并购重组 中汽股份:拟以现金1.11亿元收购中汽研汽车检验中心(...
官方回应“男子在桂林漂流点救人... 近日,有网友在社交平台发布视频称,8月23日,其弟弟在广西桂林龙脊峡漂流点营救一名落水女子时,两人不...
Rapidus与是德科技日本子... 【日本半导体厂商Rapidus与是德科技日本子公司达成战略合作开发2纳米芯片工艺设计套件】8月26日...
曼联转会风云:B费若赴沙特,巴... 随着夏季转会窗口的临近,曼联的转会动态再次引起了球迷的广泛关注。根据《卫报》的最新报道,如果布鲁诺·...
B费变卦!拒绝沙特天价合同后,... 近日,邮报记者Chris Wheeler独家报道,曼联的中场核心布鲁诺·费尔南德斯(B费)在经历了一...
原创 超... 美军F-35战机压境半岛,特朗普却在白宫抛出核裁军话题,逼中国坐上谈判桌。明知中国不可能答应,他为何...
哈佛和MIT科学家联手破解基因... 想象一下,如果我们能像调节家里的灯光亮度一样,精确控制人体细胞的各种功能,那会是什么样的景象?哈佛大...
股市必读:阳光电源中报 - 第... 截至2025年8月26日收盘,阳光电源(300274)报收于97.01元,下跌5.45%,换手率7....