当前位置:第一投资网 > 资讯 > 正文

DeepSeek文生图来了部分性能测试不输OpenAI

来源:证券之星  时间:2025-01-28 12:16:16  阅读量:9761次   

北京时间1月28日凌晨,农历新年前夕,中国人工智能初创公司DeepSeek在GitHub(面向开源及私有软件项目的托管平台)以及Hugging Face(AI社区)上发布了多模态大模型Janus-Pro,进军文生图领域。

DeepSeek介绍,Janus-Pro大模型是2024年11月发布的JanusFlow大模型的升级,分为7B和1.5B(15亿)两个参数量版本,且均开源。

AI社区开发者的评论显示,DeepSeek的Janus-Pro模型具备在消费级电脑终端上本地运行的潜力。

Janus-Pro在多模态理解和文本到图像的指令跟踪功能上实现重大进步,其文本到图像生成的稳定性明显提升。

DeepSeek发布的测试结果显示,Janus-Pro的70亿参数版模型在一些基准测试中击败了美国AI独角兽OpenAI的多模态大模型DALL-E3。

尽管Janus-Pro的模型尺寸有限,但从技术报告看,DeepSeek团队添加了7200万张高质量合成图像,模型在预训练阶段的真实数据与合成数据的比例达到了1:1,这使模型的图像视觉生成能力更稳定。

另外,Janus-Pro还通过将视觉编码分离为理解和生成两条路径,既缓解了视觉编码器在理解和生成中的角色冲突,还提升了模型框架的灵活性。

该模型还在多模态理解的训练数据上增加了大约9000万个样本,令其在文生图的同时,也能识别图像及其中的文字、知识等。

就在北京时间1月27日,由DeepSeek开发的App也超越了OpenAI的ChatGPT,成为苹果应用商店下载量最大的免费App。

几乎在同一天,包括英伟达、博通公司、超威半导体公司以及微软等在内的美国科技板块公司股价大幅下跌,华尔街均评估是受中国企业DeepSeek的技术突破影响。

在DeepSeek发布文生图多模态大模型前一晚,达闼机器人创始人黄晓庆接受经济观察网采访时称,其团队已基于DeepSeek的V3及R1大模型,将对话功能应用于旗下的机器人开发创新中,目前正在规划基于DeepSeek的多模态大模型进行二次训练。

黄晓庆认为:DeepSeek开源、开放的模式,有利于第三方进行二次训练,加入多模态和机器人控制模型。DeepSeek的MoE专家模型的融合架构不仅适合模型应用下游厂商的分布式训练场景,对像达闼机器人这样的厂商来说,跨应用场景的各种形态的机器人开发,也可以与DeepSeek的多模态大模型进行融合。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

9962
猜您喜欢
  • 小米RedmiK60Pro手机限时降价300元:搭载骁龙8Gen2,12
    小米RedmiK60Pro手机限时 感谢IT之家网友瓦特Watt、偏科骚黄4100只眼、番茄炒西红柿的线索投递!8GB+256GB到手价3299元12GB+...
  • 券商降薪网友表示很有必要|思维生活+
    券商降薪网友表示很有必要|思维生活 一直以来,国内银行、券商、基金行业的薪酬待遇就处于全行业的偏高水平。Choice数据显示,2021年上市券商中,有29家...
  • 政策暖风劲吹,“三桶油”的新能源投资节奏有望再加快
    政策暖风劲吹,“三桶油”的新能源投 澎湃新闻获悉,4月4日,国家能源局组织召开加快油气勘探开发与新能源融合发展启动会。国家能源局党组成员、副局长任京东主持会...
  • OpenAI发帖介绍如何确保AI安全:监管是必要的,从实际使用中学习预防
    OpenAI发帖介绍如何确保AI安 ,美国当地时间周三,OpenAI发帖,详细介绍了其确保AI安全的方法,包括进行安全评估、改进发布后的保障措施、保护儿童以...
  • 任天堂经典游戏《宝可梦竞技场2》将于4月12日加入SwitchOnlin
    任天堂经典游戏《宝可梦竞技场2》将 ,任天堂宣布,经典游戏《宝可梦竞技场2》将于4月12日加入到SwitchOnline+扩展高级会员所拥有N64游戏库中。...
  • 导师带徒传薪火座谈交流送春风
    导师带徒传薪火座谈交流送春风 4月3日,中铁武汉电气化局一公司潍烟项目部举行ldquo;导师带徒rdquo;拜师仪式暨2023年度大学生座谈会。ldq...