tag

模型

经过一段时间的打磨,昨天,我们带来了腾讯混元最新的生图模型“混元图像2.1(HunyuanImage 2.1)”。 这是一个开源的文生图模型,支持原生2K生图,在多个方面达到业界领先水平: **01、**在2.0架构的基础上全面升级,更加注重生成效果与性能之间的平衡,性能更强 **02、**不仅支持

9月5日,"混元游戏"(腾讯混元游戏视觉生成平台)发布全新2.0版本,新增游戏图生视频、自定义模型训练、角色一键精修等能力,并大幅提升游戏2D生图模型能力,图生视频和文生图模型在游戏场景达到行业SOTA水平。 这次升级进一步解决了游戏美术设计与宣发中的动态内容生成、风格定制化、细节优化等痛点,在更多

9月1日,我们带来一个在国际机器翻译比赛拿下30个第1名的翻译模型Hunyuan-MT-7B,它总参数量仅7B,支持33个语种、5种民汉语言/方言互译,是一个能力全面的轻量级翻译模型。 同时开源的还有一个翻译集成模型 Hunyuan-MT-Chimera-7B (奇美拉),是业界首个翻译集成模型,它

今天,混元3D世界模型系列最新成员——HunyuanWorld-Voyager(简称混元Voyager)正式发布,这也是业界首个支持原生3D重建的超长漫游世界模型。 该模型聚焦于AI在空间智能领域的应用扩展,将为虚拟现实、物理仿真、游戏开发等领域提供高保真的3D场景漫游能力。 混元Voyager突破

在AI技术迅猛发展的今天,一个高效的智能问答系统能够显著提升工作和生活效率。无论是即时解答常见疑问,还是从庞杂数据中精准提取关键信息。那么关键问题来了:如何快速构建这样一个灵活适配多场景的智能系统? 答案其实很简单!**通过腾讯云轻量应用服务器Lighthouse与开源智能体平台Dify的完美组合,

AI生成的视频音效,已经可以用于视频制作了。 我们来重温一段《猫和老鼠》的名场面: 你能听出这个视频的音效全是 AI 生成的吗? 这个视频音效来自腾讯混元视频音效生成模型Hunyuan-Foley。我们还可以用它来生成流行的ASMR,体验“听觉爽感”,解压效果直接拉满。 8月28日,腾讯混元宣布开源

​ 本文共计2664字 预计阅读时长8分钟 一、引言 本文主要面向对RAG概念有基础了解的读者,因此不再赘述RAG基础概念。在写这篇最佳实践之前,先回答一个问题:在上千万tokens上下文窗口模型出现后,为什么我们仍然需要RAG? 原因很简单,将所有数据都加载到模型上下文存在如下挑战: 1.可扩展性

​ 在人工智能大模型技术飞速发展的今天,曾经只存在于科幻作品中的场景正逐渐走进现实,技术的飞跃让深度情感连接成为可能。从早期只能执行简单指令的程序,到如今能理解复杂语义、感知情绪变化的智能体,AI 技术的每一次突破都在重塑人与机器的关系边界,带来更多关于AI陪伴的创新探索。 在这样的背景下,经历两年

​ 项目背景 我们基于 Megatron-Core 和 SGLang/vLLM 研发了大模型训练库 WeChat-YATT(YATT,Yet Another Transformer Trainer),内部项目名为 gCore,专注于强化学习和多模态模型的训练,旨在提供易扩展、简洁、高效、可靠的大模型

“有没有想过,随手拍的一张风景照,下一秒就能变成可操控的游戏开放世界? 或者把脑海里的奇思妙想或世界名画,直接变成电影级游戏动画? 现在,腾讯混元开源的新工具Hunyuan-GameCraft,让你像导演一样‘打造’游戏场景!” 腾讯混元最新推出的 Hunyuan-GameCraft,是基于Huny

在6月18日中国通信标准化协会主办的2025数据智能大会上,腾讯云大数据TBDS产品中心总经理徐晓敏发表主题演讲,系统阐释了大模型(LLM)对数据分析范式的深刻变革,并分享了腾讯云在Data+AI融合方向的最新实践。他表示,大模型正重塑数据处理架构、分析方法、治理需求与运维模式,腾讯云已构建起覆盖底

一、功能介绍 数据解读,帮助挖掘数据价值、辅助决策与执行 腾讯云ChatBI是腾讯云BI打造的一款智能分析Agent,基于大模型AI技术,支持用户以自然语言提问即可获取数据结论。ChatBI可以帮助用户从数据中发现变化趋势和潜在问题,进行数据波动归因分析,提供业务优化建议,帮助业务决策。 近期,腾讯

6月13日,在2025年衡泰技术金融行业发展峰会上,腾讯云与杭州衡泰技术股份有限公司(以下简称“衡泰技术”)宣布合作全面升级,并面向全行业正式发布衡泰核心产品之一的xIR固收业务管理系统与腾讯云TDSQL数据库等平台产品的深度融合方案,为券商等金融机构提供国产一站式服务。 会上,衡泰技术总经理戴洪波

​ 腾讯混元3D开源_模型_又添新成员。 6月14日,在计算机视觉领域国际顶级会议CVPR 2025上,腾讯混元3D 2.1大_模型_正式对外开源,这也是首个全链路开源的工业级3D生成大_模型_。 相较于广受社区欢迎的混元3D 2.0,2.1_模型_优化了几何生成的质量,同时开放了PBR(基于物理的

今天要发布的是一项神奇的魔法。 仅需一张图和一段音频,就能让图中的主角自然的说话 、唱歌。 比如这样👇 这样👇 以及,这样👇 这一能力来自5月28日腾讯混元发布并开源的语音数字人模型HunyuanVideo-Avatar,由腾讯混元视频大模型(HunyuanVideo)及腾讯音乐天琴实验室Mu