工程院院士与DeepSeek过了一招。美国当地时间2月17日晚间,马斯克旗下的人工智能公司xAI发布了最新人工智能模型Grok 3。在这场直播发布中,DeepSeek成为屡次被提及的比较对象,以此展示Grok 3的性能。前几年,中国企业每每推出模型时,都要和GPT-3.5、GPT-4进行对比。如今,Grok 3的主要比较对象变成了DeepSeek,这再次证明了DeepSeek在全球人工智能行业中的影响力。
过去,人工智能领域信奉“大力出奇迹”,即通过增加模型规模、数据量和计算资源来显著提升模型性能。而DeepSeek则开辟了一条新路,以低成本、高效率的方式改写了行业竞争法则,给全球人工智能界带来新的启示。早在DeepSeek“出圈”之前,青岛的人工智能企业就开始关注这个“不走寻常路”的新物种,并在DeepSeek推理模型推出的第一时间积极拥抱,用以提升自家行业模型能力。
对青岛的人工智能企业来说,DeepSeek的到来将加速大模型在各行各业的应用,为垂直领域的行业大模型带来新的机遇。但当前再强大的通用大模型对行业专业知识的理解仍有不足,大模型要在各个行业中真正发挥作用仍需学习更多专业知识,垂域大模型还有许多工作要做。
没有人会否认,DeepSeek是继ChatGPT之后全球人工智能领域最引人注目的产品。某种意义上,DeepSeek对于推动全球人工智能发展的意义要远甚于ChatGPT。如果说ChatGPT展示了大模型的强大,那DeepSeek则表明最强的大模型并非遥不可及。
更低的算力成本和开源路线,是DeepSeek与ChatGPT最显著的区别。正是基于这两点,DeepSeek改变了现有全球AI的竞争规则。算法、算力、数据被称为人工智能三要素。自ChatGPT引发全球大模型浪潮以来,算力的重要性不断上升。然而,DeepSeek重构了这种以算力为中心的竞争规则。通过多元专家混合的模型架构,DeepSeek V3版本的训练成本仅为600万美元,显著低于此前海外主流大模型的成本。中国工程院院士李国杰认为,DeepSeek的创新不仅是技术上的突破,也是发展模式上的颠覆性创新。
更低的成本意味着降低了拥抱大模型的门槛。海尔相关负责人表示,依托算法突破大幅降低模型的算力需求,将极大提速大模型的产业化应用进程,成为中国和中国企业赢得AI时代竞争的关键优势。例如,在家电行业,低成本人工智能技术有望突破制造业与生成式人工智能结合的局限性,催生基于垂域大模型赋能的新型智能制造产业,促进智能家居及家用服务机器人同步发展。
选择开源路线,则进一步降低了技术普及应用的门槛,对全球加快构建大模型AI产业生态具有重要意义。专注“AI+教育”领域的青岛罗博数码科技有限公司董事长殷述军表示,如果拿AI行业与移动互联网做类比,可以说这是AI行业的“安卓时刻”,接下来行业一定会像2012年移动互联网一样,产生生态的大爆发。百度也宣布将于6月30日起正式开源下一代文心大模型,似乎也从侧面印证了DeepSeek的影响。
种种迹象表明,DeepSeek是全球AI发展的又一个标志性时刻,大模型商业化落地有望提速。极视角联合创始人陈硕表示,2025年将是大模型在产业侧应用的爆发年。
DeepSeek火爆之后,青岛的人工智能相关企业纷纷第一时间接入DeepSeek。根据DeepSeek提供的解释,接入DeepSeek是指通过API、SDK或预训练模型接口直接调用DeepSeek提供的现有服务或模型能力。从全球来看,微软最早宣布将DeepSeek-R1模型添加到云平台Azure AI Foundry,开发者可用于构建基于云的应用程序和服务。接着,AWS、英伟达、AMD等公司相继宣布在其AI服务平台上部署DeepSeek-R1模型。
青岛的人工智能企业紧跟行业步伐。诞生于海尔生态的三翼鸟HomeGPT智慧家庭领域大模型、卡奥斯天智工业大模型平台、海纳云安全大模型、国创大模型等,均已引入了DeepSeek的能力,为智慧家庭、生产数字化、城市应急安全等场景赋能。海信自研的星海大模型接入DeepSeek,在智慧生活和智慧城市领域为用户带来全新的智能交互体验。青岛联通也进行了模型的本地化部署,开发并上线了多个大模型智能体应用,有效赋能内部营销、客服、财务、管理等多个环节。
尽管DeepSeek十分强大,但对专注于垂直细分领域的人工智能企业来说,要真正将DeepSeek带来的行业利好转化为商业落地前景,“专业”能力仍是要持续精进的核心竞争力。海纳云安全大模型相关负责人介绍,尽管DeepSeek在多个领域展示了其卓越的性能,但在与应急管理结合时仍然面临一些难点,如算法场景适配,应急场景复杂多样等。这就要求模型兼具灵活性和准确性,此外,应急行业很多政策标准文件更新频率快,需要模型具备快速迭代和学习的能力。
今年,罗博科技将基于DeepSeek等开源模型蒸馏训练特定领域的专家模型,在端侧实现更好的效果和更低的成本。如果将DeepSeek等通用大模型比喻为知识面广博的“通才”,那垂直领域行业大模型则为精通某一具体行业的“专才”。从“通才”到“专才”,很多时候并非通过简单地调整几个参数或增加行业数据来实现的。将“通才”的能力为我所用,开发更优秀的“专才”是未来垂域模型的重要发力方向,也是垂域模型的重要核心竞争力所在。
懂得生活网为大家提供:生活,学习,工作,技巧,常识等内容。