告别“提示词玄学”，拥抱“指哪打哪”！国产全新开源图像生成模型登顶评测！

GPT-4o图像生成的控制功能想必让你印象深刻，它能精准听懂人话并准确表达创意。现在，一款全新的国产图像生成基础模型–智象未来的HiDream I1也能做到这一点，而且是开源！开源！开源！

背景介绍：开源新星，实力不容小觑！

在AI图像生成领域，不断涌现出各种强大的模型。然而，真正开源且性能领先的模型始终是开发者和创意者的共同期盼。HiDream I1正是在这样的背景下应运而生。这是一款由智象未来(HiDream.ai)团队于2025年4月7日正式开源的全新图像生成基础模型。它拥有170亿的参数，目标是在保证高质量图像生成的同时，提供更灵活、更开放的使用体验。

功能与特点：十八般武艺，样样精通！

HiDream I1绝非空有参数，其强大的功能和独特的特点使其在众多模型中脱颖而出：

卓越的图像质量：HiDream I1能够在多种风格上产生出色的效果，包括照片写实、卡通、艺术等。其在HPS v2.1评测中取得了领先的成绩，与人类的审美偏好高度一致。
顶尖的提示词遵循能力：在GenEval和DPG基准测试中，HiDream I1取得了行业领先的成绩，超越了所有其他开源模型。这意味着它能更准确地理解你的文本描述，真正实现“说什么就有什么”。
模型参数与架构：该模型拥有17B个参数，VAE组件使用了FLUX.1 [schnell]，文本编码器则集成了google/t5-v11-xxl和Meta-Llama-3.1-8B-Instruct。其采用了混合专家架构(MoE)的DiT模型，结合了双流MMDiT block与单流DiT block，通过动态路由机制高效分配计算资源。
开源与商业友好：HiDream I1采用MIT许可证发布，旨在推动科学进步和激发创造性创新。生成的图像可以自由用于个人项目、科学研究和商业应用。
多种模型尺寸：HiDream I1提供了三种不同尺寸的版本以适应不同的硬件需求和使用场景：

HiDream-I1-Full (完整版):推理步数为50步，质量最优。但需要较高的硬件配置，Hugging Face仓库中的完整模型权重需要60GB的显存.
HiDream-I1-Dev (蒸馏版):推理步数为28步，在效率和效果之间取得平衡。
HiDream-I1-Fast (极速版):推理步数为16步，适合实时生成需求。
支持多种文本编码器：除了默认的Llama-3.1-8B-Instruct，HiDream I1还集成了OpenCLIP ViT-bigG、OpenAI CLIP ViT-L、T5-XXL等多种文本编码器，显著提升了语义理解能力.
技术优化：模型采用了Flash Attention等优化机制，进一步提升了生成图像的速度和质量.

优势：领先基准，触手可及的强大！

HiDream I1的优势不仅体现在其丰富的功能上，更在于其卓越的性能和开放性：

基准测试领先：在GenEval和DPG基准测试中超越所有其他开源模型，并在HPSv2.1评测中取得SOTA成绩，这直接证明了其在图像质量和提示词理解方面的领先地位.
技术创新：采用混合专家架构和集成多种先进的文本编码器，使其在处理复杂任务和理解用户意图方面更具优势. 使用Llama模型作为文本编码器也被一些用户认为是令人兴奋的创新.
易于上手：官方提供了详细的GitHub仓库和Hugging Face仓库，包含安装指南和使用说明。同时支持命令行和Gradio界面两种使用方式。更有ComfyUI的自定义节点方便用户集成到现有的工作流中.
开源社区支持：遵循MIT许可证鼓励全球开发者自由使用、修改和分发模型。开源短短一周内，GitHub上已有超过500个基于HiDream I1的开源项目，预示着强大的社区支持和无限的潜力.

所属公司与服务方式：智象未来，开放共享！

HiDream I1由位于合肥高新区的AI企业智象未来(HiDream.ai)团队开发并开源。该团队致力于以创新技术推动AI在各个领域的应用.

用户可以通过以下方式获取和使用HiDream I1：

GitHub仓库：https://github.com/HiDream-ai/HiDream-I1
Hugging Face仓库：

HiDream-I1-Full:https://huggingface.co/HiDream-ai/HiDream-I1-Full
HiDream-I1-Dev:https://huggingface.co/HiDream-ai/HiDream-I1-Dev
HiDream-I1-Fast:https://huggingface.co/HiDream-ai/HiDream-I1-Fast
在线体验：部分开发者提供了基于HiDream I1的Hugging Face Space在线演示.
ComfyUI集成：社区开发者提供了ComfyUI自定义节点，方便在ComfyUI中使用HiDream I1.

使用HiDream I1可以通过命令行运行推理脚本，也可以通过运行Gradio演示程序进行交互式图像生成. 对于ComfyUI用户，可以通过安装相应的自定义节点并在工作流中使用HiDream Sampler节点进行图像生成.

与竞品对标比较：实力说话，榜上有名！

HiDream I1在多个方面展现出与现有竞品的强大竞争力：

基准测试对比：根据HPSv2.1基准测试，HiDream I1的平均得分33.82显著高于Stable Diffusion v2.0 (26.38)、SDXL (30.64)、Dall-E 3 (31.44)、SD3 (31.53)、Midjourney V5 (32.33)、CogView4-6B (32.31) 和Flux.1-dev (32.47). 这表明其在图像质量上具有领先优势.
提示词遵循能力：在GenEval和DPG基准测试中超越所有其他开源模型，表明其在理解和执行用户指令方面更胜一筹.
用户反馈：YouTube上的评测视频显示，HiDream I1在提示词遵循方面表现优异，尤其是在生成包含文字的图像时。在自然风格的图像生成方面，其色彩表现也优于Flux. 然而，也有用户指出，作为基础模型，在生成人像等细节方面仍有提升空间. Reddit社区也有用户对HiDream I1的prompt adherence表示赞赏.
与Flux的比较：尽管部分用户在特定场景下更偏好Flux的艺术风格，但总体而言，HiDream I1在图像质量、色彩锐利度和文字生成清晰度方面表现更优. 值得注意的是，HiDream I1的VAE组件使用了FLUX.1 [schnell].
与闭源模型的比较：HiDream I1在开源24小时内便登顶全球知名AI基准测试平台Artificial Analysis的竞技场榜单图像生成模型榜首，并以微弱差异位列综合成绩第二。这显示了其比肩甚至超越GPT-4o等顶尖闭源模型的潜力.

结论：开源赋能，未来可期！

HiDream I1的开源发布，无疑为AI图像生成领域注入了一股强劲的新生力量。其卓越的图像质量、顶尖的提示词遵循能力以及完全开源的特性，使其成为开发者、研究人员和创意工作者的理想选择。虽然作为基础模型仍有进步空间，但凭借其强大的技术底蕴和活跃的开源社区，我们有理由相信，HiDream I1将在未来的发展中不断突破，为我们带来更多惊喜。

Let's Make AGI Real

留下评论取消回复