Toward LLMs That Understand Misspellings New byte-based model beats Llama 3 on spelling, noise, and translation 基础研究 2025年04月20日 0 点赞 0 评论 201 浏览
MiniMax-01 全新系列模型,性能比肩GPT-4o MiniMax 发布并开源了 MiniMax-01 全新系列模型,其中包含两个模型,基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01,全新模型架构、性能比肩GPT-4o 开源项目 2025年03月31日 0 点赞 0 评论 9 浏览
图灵模式——Turing Pattern 图灵测试是人工智能最初的概念,它甚至早于“人工智能”这个词本身,人工智能一词是在1956年才被提出的。图灵测试的方法很简单,就是让测试者与被测试者(一个人和一台机器)隔开,通过一些装置(如键盘)向被测试者随意提问。进行多次测试后,如果有超过30%的测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人工智能。 它的发明者图灵被誉为计算机科学之父、人工智能之父。 技术解读 1月前 0 点赞 0 评论 33 浏览
零一万物(01.AI)与深度求索(DeepSeek)大模型的对比分析 零一万物(01.AI)与深度求索(DeepSeek)大模型的对比分析,涵盖技术性能、应用场景、成本效率等维度,并总结双方的优势与不足 技术解读 2025年03月20日 2 点赞 0 评论 48 浏览
Linear-MoE统一序列建模,长文本处理迎来革命性突破 学术界与产业界联合研发的Linear-MoE框架,通过统一线性序列建模与混合专家系统,实现百万token长文本处理速度提升3倍,或定义下一代模型架构标准。 基础研究 2025年03月17日 1 点赞 0 评论 32 浏览
OCTS算法突破LLM推理瓶颈,逆长尾问题终得解法 新型OCTS算法通过答案聚类与动态停止机制,有效缓解LLM推理中的逆长尾效应,在复杂任务中提升45%响应速度,降低30%计算资源消耗。 基础研究 2025年03月17日 1 点赞 0 评论 22 浏览
Dynamic Tanh革新Transformer架构,MetaAI重塑归一化技术标准 MetaAI推出Dynamic Tanh(DyT)技术,通过tanh函数替代传统LayerNorm,在H100s显卡上实现训练加速与成本降低,推动多模态Transformer高效化部署,或成下一代模型标准。 基础研究 2025年03月17日 1 点赞 0 评论 21 浏览