昨日,OpenAI发布可实时进行音频、视觉和文本推理的新一代AI模型GPT-4o引发广泛关注。今日,360集团创始人、董事长周鸿祎发表视频分享了自己对于GPT-4o技术原理的理解和潜在的社会影响。在谈及GPT-4o的技术原理时,周鸿祎指出,据OpenAI发布会上简短的技术原理介绍,区别于传统将把语音先翻译成文字处理后再翻译成语音的做法,这次的技术是直接把语音进行了处理,形成了一个整合的大模型引擎,实现对语音输入的直接理解——包括把语音中饱含的情绪、感情、语调、口音这些细节都进行了理解,同时是直接输出语音
时间:2025-02-07 | 阅读:61