当前位置:首页 > 搜索 "AI"
Kimi K2模型测试:英伟达GB200 NVL72性能较HGX 200提升10倍
AI服务器取得重大性能突破。基于开源大语言模型KimiK2Thinking、Deepseek-R1-0528、MistralLarge3测试,相比上一代HopperHGX200性能提升10倍。IT之家注:混合专家模型(MoE)是一种高效的AI大模型架构。它不像传统模型那......
DeepSeekV3.2技术报告还是老外看得细
AI公司好好上了一波压力。而且,这还不是V4/R2。换句话说,大菜还没上呢,光凉菜就已经让硅谷吃饱了。对于DeepSeek-V3.2这次的成绩,DeepSeek研究院苟志斌(ZhibinGou)在推特上给出了相当直觉性的解答:强化学习在长上下文长度下也能持续扩展。为了理解这句话,我们简要地回顾一下....
字节跳动Seed3D 1.0发布:一张图就能生成高精度3D模型
AI广泛应用的模型架构DiffusionTransformer,来设计3D几何生成和纹理贴图模型。其能够实现对3D几何的高精度构建,既能生成精确的结构细节,又能保证封闭曲面、流形几何等形态的物理完整性,以满足仿真计算要求。官方还表示,Seed3D1.0基于多模态Diffusion......
FP32算力和Tensor算力 (AI TOPS)
AITOPS)是衡量显卡计算能力的两个重要指标,但面向的应用场景和计算特性有显著差异:1. FP32算力(单精度浮点算力)定义:指显卡每秒能执行的32位单精度浮点运算次数,单位为FLOPS(FloatingPointOperationsPerSecond),常用TFLO......
FP32算力和Tensor算力哪个更重要?
AI优化的通用计算任务:例如视频剪辑、3D建模等,这些任务主要依赖显卡的通用计算单元(CUDA核心、流处理器),FP32算力是核心衡量指标。2.当任务聚焦AI推理或深度学习训练时,Tensor算力更重要Tensor算力(AITOPS)的核心优势是并行效率高,专门针对AI任务中最......
谷歌发布AI智能体加入编程混战,Cursor们怎么办?
AI编程堪称进展最快的大模型落地场景之一,大厂和初创争相布局,每个月都有新的产品和话题。美东时间6月25日,谷歌最新发布了开源AI智能体GeminiCLI(命令行界面),将大模型Gemini的能力接入终端,集成到开发者日常使用的命令行界面中。官方表示,这一工具擅长编程,但同时也可用于各种任务,从内....
关于NPU(神经网络处理单元)
AI芯片)的一种。它与CPU(中央处理器)、GPU(图形处理器)的最大区别在于,专为深度学习和神经网络任务优化,能高效处理矩阵运算、向量运算等神经网络核心操作,具有低延迟、高算力、低功耗的特点。NPU的核心特点专为神经网络设计传统CPU/GPU需通过软件框架(如TensorFlow、Py......
黄仁勋:DeepSeek将人工智能计算需求提升100至1000倍
AI落地物理世界的重要载体,其后续应用场景想象空间极大,国内政策支持力度不断提升,2024年以来各地产业基金加速落地,市场参与主体从初创型企业,汽车整车厂到各领域龙头公司,可以预见产业发展将明显提速。特别值得注意的是,根据行业领先者特斯拉的量产计划,2025年将生产1万台Optimus机器人,产能扩...
谷歌迎战OpenAI的“三板斧”:超10亿用户+“全家桶”+DeepMind
AI展开激烈竞争,投入数百亿美元开发新款AI模型并构建支持AI服务的基础设施。今年年度I/O开发者大会上,桑达尔·皮查伊带着产品团队围绕Gemini模型推出了一系列的新产品,并着重强调谷歌在人工智能领域“永不停歇”的创新节奏。在众多更新中,最受关注的是谷歌推出的AIMode(AI模式),其整合......


