夸克AI超级框推出“深度搜索”功能:让搜索拥有“高搜商”

站长之家(ChinaZ.com)5月8日 消息:阿里巴巴旗下AI旗舰应用夸克近日推出“深度搜索”产品,并升级“图片智能处理”功能,通过强化AI的深度思考与信息整合能力,进一步拓展AI工具的应用边界。基于阿里自研推理大模型及每日数十亿次搜索请求的算法优化,夸克“深度搜索”被赋予“高搜商”特性,即高效获取、筛选与利用信息的能力,以应对复杂场景下的用户需求。在复杂问题解决层面,“深度搜索”采用“先思

AI诱惑太大,“贪婪”的硅谷风投们不满足只做个VC了

声明:本文来自于微信公众号 硅星人pro,作者:李京亚,授权站长之家转载发布。在AI以前所未有的力量重塑全球产业结构的今天,一场深刻的身份转变正在海外风险投资(VC)行业悄然上演。简单来说,过去VC们更像是“星探”,早期发现并投资有潜力的初创公司,期待它们一鸣惊人后通过上市或并购退出。但现在,一些顶级的VC巨头似乎不满足于此,它们开始向私募股权投资(PE)的角色靠拢。这意味着它们不再局限于早期

联想刘军:联想AI PC销量已破百万台 服务器收入增长172%

快科技5月8日消息,在今日2025联想中国合作伙伴大会上,联想集团高级副总裁、中国区总裁刘军透露:联想AI PC累计销量已突破100万台;服务器收入年比年增长172%,闯回第一阵营。随着惠普、戴尔、联想等传统电脑品牌纷纷将各类前沿AI技术整合到个人电脑平台,AI PC竞争浪潮愈加猛烈。据IDC数据显示,2025年Q1全球PC出货量同比增长4.9%,联想以24.1%的市场份额稳居首位,而AI P

AI原生手机之战:三大阵营的对决

声明:本文来自微信公众号“新莓daybreak”(ID:new-daybreak),作者:乔雨晴,,授权站长之家转载发布。现实状况是,没有AI卖点,智能新机都不好意思拿出手。刚刚过去的4月,各大手机厂商密集发布新品,实则无形中掀起一场行业AI革命。好似喊了数十年的智能终端,现在才真正「智能兑现」。比如,OPPO Find X8系列的AI一键闪记功能,「小布记忆」堪称「健忘症救星」;荣耀x70i

李想:理想VLA司机大模型 就是从动物进化到人类

快科技5月7日消息,理想汽车今日晚间推出理想AI Talk第二季理想VLA司机大模型,从动物进化到人类”,理想汽车董事长兼CEO李想分享了对于人工智能的最新思考,VLA司机大模型的作用、训练方法和挑战,以及对于创业和个人成长的见解。李想将AI工具分为三个层级,分别是信息工具、辅助工具和生产工具。目前,大多数人将AI作为信息工具使用,但信息工具常伴随大量无效信息、无效结果和无效结论,仅具参考价值

ICEdit – 浙江大学联合哈佛大学推出的指令式图像编辑框架

ICEdit是什么ICEdit(In-Context Edit)是浙江大学和哈佛大学推出的指令式图像编辑框架。基于大规模扩散变换器(Diffusion Transformer)的强大生成能力和上下文感知能力,用自然语言指令对图像进行精准编辑。ICEdit仅需0.1%的训练数据和1%的可训练参数,相比传统方法大幅减少资源需求,在多轮编辑和多任务编辑中表现出色。ICEdit具备开源、低成本、快速处

VPP – 清华和星动纪元推出的首个AIGC机器人大模型

VPP是什么VPP(Video Prediction Policy)是清华大学和星动纪元推出的首个AIGC机器人大模型。基于预训练的视频扩散模型,学习互联网上的大量视频数据,直接预测未来场景生成机器人动作。VPP能提前预知未来,实现高频预测和动作执行,支持跨人形机器人本体切换,显著降低对高质量机器人真机数据的依赖。VPP在Calvin ABC-D基准测试中取得接近满分的成绩,在真实世界的复杂灵

Granite 4.0 Tiny Preview – IBM推出的语言模型

Granite 4.0 Tiny Preview是什么Granite 4.0 Tiny Preview 是 IBM 推出的 Granite 4.0 语言模型家族中最小的模型的预览版本。Granite 4.0 Tiny Preview用极高的计算效率和紧凑的模型结构为特点,在消费级 GPU 上能运行多个长上下文(128K)任务,性能接近 Granite 3.3 2B Instruct,内存需求减

UniTok – 字节联合港大、华中科技推出的统一视觉分词器

UniTok是什么UniTok 是字节跳动联合香港大学和华中科技大学推出的统一视觉分词器,能同时支持视觉生成和理解任务。基于多码本量化技术,将视觉特征分割成多个小块,每块用独立的子码本进行量化,极大地扩展离散分词的表示能力,解决传统分词器在细节捕捉和语义理解之间的矛盾。UniTok 在 ImageNet 上的零样本分类准确率达到 78.6%,重建质量(rFID)仅为 0.38,显著优于现有分词

kimi-thinking-preview – 月之暗面推出的多模态思考模型

kimi-thinking-preview是什么kimi-thinking-preview 是月之暗面推出的多模态思考模型,具备深度推理能力,擅长解决复杂问题,如代码、数学和工作难题。模型基于 reasoning_content 字段展示推理过程,帮助用户理解回答背后的逻辑。kimi-thinking-preview 支持多轮对话,目前处于预览版,暂不支持工具调用、联网搜索、JSON 模式和上

ChatGPT客户端界面更新,工具选项整合为滑块式设计

ChatGPT客户端于2025年5月6日迎来了一次细微但实用的界面更新。此次更新将图像生成、搜索、深度研究等多种工具选项整合为一个全新的滑块式图标,旨在提升用户操作效率与界面简洁性。社交媒体反馈显示,这一变化已逐步在iOS和Android平台的ChatGPT应用中上线,受到用户广泛关注。滑块式图标:一键展开多功能工具新版ChatGPT客户端的最大亮点在于将原本分散的工具选项(如图像生成、网页搜索、

清华与星动纪元联合发布首个 AIGC 机器人大模型 VPP

近日,清华大学叉院的 ISRLab 与北京星动纪元科技有限公司携手推出了首个 AIGC(人工智能生成内容)机器人大模型 ——VPP(视频预测策略)。这一创新成果在2025年国际机器学习大会(ICML2025)上荣获 Spotlight 论文奖,显示出其在全球 AI 研究领域的前沿地位。AIGC 技术近年来迅速崛起,从生成式文本模型到视频生成技术,其应用范围不断扩大。而 VPP 的诞生标志着这一技术

小巧却强大!IBM发布新语言模型Granite 4.0 Tiny Preview:长上下文处理

IBM 发布了 Granite4.0Tiny Preview,这是即将推出的 Granite4.0系列语言模型中最小的一款的预览版本。该模型不仅具备高效的计算能力,还为开源社区提供了一个值得关注的实验平台。高效的性能与极小的内存需求 Granite4.0Tiny 在 FP8精度下,能够在消费级硬件上运行多个长上下文(128K)的并发任务,适用于市面上价格低于350美元的 GPU。尽管该模型目前仅经

阶跃星辰发布并开源音乐大模型——音跃ACE-Step

 阶跃星辰与ACE Studio联合发布了开源音乐大模型ACE-Step(中文名:音跃),标志着音乐创作与生成技术的又一重要突破。ACE-Step是继语音、视频、图片、视觉推理等多模态大模型之后的又一成果,展现了音乐创作与生成的最新进展。ACE Studio是一家以生成式AI技术为核心的科技公司,其产品ACE Studio是一款Gen-AI为核心的音乐创作工作站产品,用户遍布全球,包括格莱美获奖者

巨头砸钱、码农通宵!为何技术大佬集体高潮的MCP 普通人却无感?

最近几个月,AI 圈突然被MCP刷屏了。这个由 Anthropic 在2024年底推出的模型上下文协议(Model Context Protocol),被称为 "AI 世界的 USB-C 接口"。简单来说,它就像一个万能插座,让大模型能轻松连接外部工具、数据库甚至物理设备,实现从 "动口" 到 "动手" 的跨越。图源备注:图片由AI生成技术圈对 MCP 的追捧已经到了疯狂的程度:巨头扎堆:Open

​清华与星动纪元联合开源首个 AIGC 机器人大模型 VPP

近日,星动纪元宣布,已与清华大学叉院的 ISRLab 合作,开源了首个 AIGC(生成式人工智能内容)机器人大模型 ——VPP(视频预测策略)。这一创新成果有望在机器人领域带来革命性的进展。VPP 模型通过将视频扩散模型的泛化能力引入到通用机器人操作策略中,解决了以往机器人推理速度慢的问题。VPP 能够实时预测未来动作,从而极大提升机器人的策略泛化能力。值得注意的是,这一模型已在国际机器学习大会(

Google 高管证实:数据 “偏袒” 自家 AI,拒绝竞品获取搜索数据

在一场备受关注的法庭听证会上,Google 搜索业务负责人利兹・里德(Liz Reed)向外界揭示了公司对待人工智能(AI)模型数据请求的态度。她明确表示,尽管 Google 去年已开始向部分 AI 公司开放利用其搜索结果的渠道,但关键的搜索数据仍然优先供给自家的 AI 服务 Gemini,这一证词为反垄断监管机构的调查提供了重要支持。近年来,美国司法部对 Google 的反垄断调查持续升温,要求

消息称通义视觉负责人薄列峰离职 或加入某大厂新组建多模态团队

据多方信源透露,阿里巴巴通义实验室应用视觉团队负责人薄列峰(职级P10)已于2024年4月30日正式离职,并低调加盟某头部互联网公司,出任新设立的多模态模型部副总经理一职。尽管该互联网公司具体名称尚未公开,坊间普遍猜测其去向可能是字节跳动或腾讯,但目前相关公司及本人均未作出回应,尚无法证实具体归属。图源备注:图片由AI生成,图片授权服务商Midjourney此次人事变动引发业界关注的另一焦点在于“

新兴混合 AI 模型 CausVid:几秒钟内生成高质量视频

近日,麻省理工学院计算机科学人工智能实验室(CSAIL)与 Adobe Research 联合研发的创新性 AI 模型 CausVid 引起了广泛关注。这一混合模型可以在几秒钟内生成高质量视频,标志着视频创作领域的一次重大技术突破。 创新的技术架构CausVid 的设计理念颠覆了传统的视频生成方式。许多现有的 AI 视频生成模型通常采用逐帧生成的方式,效率较低,且质量容易下降。而 CausVid

NBC 将利用 Jim Fagan 的 AI 生成声音为 NBA 赛事增色

NBC 近日宣布,将在即将到来的 NBA 赛事中使用已故体育解说员 Jim Fagan 的 AI 生成声音。Fagan 于2017年去世,他的声音曾在1990至2002年期间为 NBC 的 NBA 报道增添了不少风采。NBC 计划在10月份重新播出 NBA 比赛时,将 Fagan 的 AI 声音运用于选定的片头序列、节目开场及宣传片中。图源备注:图片由AI生成,图片授权服务商MidjourneyF