小红书推出多模态笔记推荐框架 NoteLLM,提升用户体验!

近日,小红书正式推出了名为 NoteLLM 的多模态大型语言模型框架,旨在为用户提供更精准的笔记推荐服务。这个框架不仅能够理解文本信息,还能有效处理图像,借助其强大的语义理解能力,大幅提升了笔记推荐的准确性与相关性。NoteLLM 的核心技术在于生成笔记的压缩嵌入与自动生成标签的能力。通过引入对比学习与指令微调技术,该框架可以更好地解析用户行为数据,从而为每个笔记生成合适的标签和类别。这一创新的功

Voila – 开源端到端语音大模型,实现低延迟语音对话

Voila是什么Voila 是开源的端到端语音大模型,专为语音交互而设计。具备高保真、低延迟的实时流式音频处理能力,能直接处理语音输入并生成语音输出,为用户提供流畅且自然的交互体验。Voila 集成了语音和语言建模能力,支持数百万种预构建和自定义声音,用户可以通过文本指令或音频样本轻松定制说话者的特征和声音。 包含两个主要模型:Voila-e2e 用于端到端语音对话,Voila-autonom

Gemini 2.5 Pro (I/O 版) – 谷歌推出的升级版多模态AI模型

Gemini 2.5 Pro (I/O 版)是什么Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升级版多模态AI模型,具体版本号为 Gemini 2.5 Pro Preview 05-06。模型在编程能力上取得重大突破,擅长构建交互式 Web 应用、游戏和模拟程序。用户仅需提供提示词或手绘草图加功能描述,能快速生成功能完备的应用。Gemi

华大集团与金山办公达成战略合作 推动生命科学与AI办公融合

华大集团与金山办公在深圳正式完成战略签约,标志着双方在生命科学与AI办公领域的深度合作正式开启。根据合作协议,金山办公将为华大集团提供定制化的AI办公解决方案,涵盖文档处理、协作办公、数据分析等核心功能。双方将共同推动生命科学与AI办公的融合发展,加速AI能力在生命科学领域的深入应用与创新。金山办公首席执行官章庆元表示,华大集团作为国内基因行业的奠基者,与金山办公的合作将基于WPS365平台,

苹果计划加入 AI 搜索赛道,终结“谷歌时代”!

在 AI 出现之前,我觉得除了谷歌之外,没有其他合适的选择……站长之家(ChinaZ.com) 5月8日 消息:苹果高管埃迪·库伊 (Eddie Cue) 表示,苹果 “正在积极考虑” 将移动版 Safari 浏览器的搜索体验重点转向人工智能搜索引擎,这可能会挑战谷歌长期以来在搜索领域的主导地位,也会对两家公司利润丰厚的默认搜索引擎协议构成挑战。据彭博社报道,库伊是在美国司法部针对Alphab

AI日报:夸克发布“深度搜索”新品;Anthropic推Claude网络搜API;DeepSeek致谢腾讯技术团队;微软采用谷歌的A2A标准

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、夸克发布“深度搜索”新品:AI先思考后检索,解决复杂问题更聪明夸克最近推出了全新的“深度搜索”产品,标志着其在智能搜索领域的重大进展。该产品依托阿里自研推理大模型,通过对用户

OpenAI鲸吞Windsurf,国产AI编程玩家准备好了吗?

AI编程助手的终局是“AI原生 IDE”。五一假期刚结束,OpenAI 又搞出了两个大新闻。北京时间5月6日凌晨,OpenAI 宣布放弃营利性转型,公司将继续作为一家监督和控制营利性组织的非营利组织,同时原本组织下的营利性有限责任公司将转型为具有相同使命的「公益公司」(简称 PBC,仍可以是营利性公司)。与此同时,根据彭博社5月6日上午报道,OpenAI 已同意以约30亿美元(约合人民币218

联想发布端侧AI新技术 PC本地推理能力媲美 OpenAI-mini

快科技5月7日消息,今日,联想创新科技大会(Tech World)以让AI成为创新生产力”为主题,聚焦混合式人工智能,从个人到企业,全方位展示联想创新技术成果。会上,联想展示了其在端侧算力方面的最新创新成果联想推理加速引擎”。据了解,这款由联想、清华大学及无问芯穹联合研发的推理引擎,是专为高效AI PC推理而设计的软硬件协同优化平台,可以让一台普通PC的本地推理能力,媲美OpenAI去年发布的

科大讯飞等在湖北成立两家新公司 均涉及AI人工智能

据天眼查App平台最新工商信息显示,近日湖北地区新增两家科技企业——湖北小雅科技有限公司与湖北讯源信息科技有限公司,其企业注册信息已通过公开渠道披露。湖北小雅科技有限公司注册资本5000万元人民币,法定代表人为聂小林,经营范围涵盖人工智能应用软件开发、基础软件开发及理论与算法研究等细分领域。股东结构显示,该公司由科大讯飞旗下子公司讯飞华中(武汉)有限公司联合武汉博成众智科技投资合伙企业(有限合

黄仁勋:中国AI市场将达500亿美元 错过将造成巨大损失

站长之家(ChinaZ.com)5月7日 消息:英伟达CEO黄仁勋指出,中国人工智能(AI)市场预计在未来两到三年内规模将突破500亿美元,若因出口管制无法参与这一市场,对英伟达而言将是重大损失。黄仁勋强调,英伟达始终尊重并遵守各国政府政策,但同时呼吁企业在政策框架内保持灵活性,以应对快速变化的市场需求。在采访中,黄仁勋还表达了对全球AI产业发展的期待。他表示,当前全球对AI技术的需求迫切,呼

李想AI Talk第二季来了:理想VLA司机大模型是从动物到人类的进化

快科技5月6日消息,理想汽车创始人、CEO李想宣布,明天(5月7日)晚上8点,《AI Talk第二季》来了,他将和大家分享一下对人工智能最近的思考。此次《AI Talk第二季》上,李想将为大家解答以下三个问题:-为什么我说理想VLA司机大模型,是从动物到人类的进化?-为什么我说还有至少五个企业在打造和理想L9相同的产品?-为什么我说大女儿形成了我和老婆之间的第三个支撑?去年12月25日至27日

OpenAI重组计划被迫改变,但马斯克的起诉仍在继续

尽管OpenAI 放弃了转型为传统营利性公司的决定,但埃隆·马斯克仍将继续对该公司提起诉讼。站长之家(ChinaZ.com) 5月7日 消息:马斯克的律师马克·托伯罗夫(Marc Toberoff)周一在给路透社的一份声明中表示:“今天的声明丝毫不能改变OpenAI仍将为奥特曼、他的投资者以及微软的利益而开发闭源AI的事实。”托伯罗夫表示,OpenAI决定继续接受非营利实体的管理,“掩盖了所谓

9块9的AI洗头:颠覆还是泡沫?

声明:本文来自于微信公众号定焦One(dingjiaoone),作者:梅引冬,授权站长之家转载发布。2015年,38岁的乐山井研男子陈攻科研究16年,玩坏18个头盔,最终发明出立式全自动按摩洗头机,并获得国家专利。十年后的今天,AI正在尝试给这个“旧需求”谱写“新故事”。据媒体报道,上海、深圳、福州等多地出现AI洗头店,店内配有头皮检测服务、可调节力度与水温等模式的智能洗头机、自动吹发设备或人

阿里通义Qwen3语言模型上线 ,开源实力再升级!

在全球人工智能领域,Qwen 系列大型语言模型迎来了新成员 ——Qwen3的发布。今日,通义宣布将 Qwen3开源,带来了令人振奋的技术革新。此次发布的旗舰模型 Qwen3-235B-A22B 以其2350亿个参数的规模在多个基准测试中展现出强大的竞争力,超越了 DeepSeek-R1、o1、o3-mini、Grok-3及 Gemini-2.5-Pro 等顶级模型。此外,Qwen3-30B-A3B

Recraft 获 3000 万美元 B 轮融资,图像生成技术挑战行业巨头

初创公司 Recraft 近日宣布完成3000万美元的 B 轮融资。这轮融资由知名风险投资公司 Accel 领投,其他投资机构如 Khosla Ventures 和 Madrona 也参与其中。Recraft 总部位于美国旧金山,此前在2024年曾获得1200万美元的 A 轮融资,目前公司年化经常性收入已超过500万美元,并拥有400万注册用户。Recraft 推出的图像生成模型 “red_pan

月之暗面 Kimi 长思考模型 API 正式发布

 月之暗面科技有限公司宣布正式发布其最新的长思考模型API——kimi-thinking-preview。这一模型具备多模态推理能力和通用推理能力,擅长深度推理,能够帮助用户解决复杂的代码问题、数学难题和工作中的挑战。kimi-thinking-preview模型是目前最新的k系列思考模型,用户可以通过简单的API调用轻松使用。该模型的API响应中包含了一个独特的字段——reasoning_con

实时口语聊天大模型 LLaMA-Omni 2 来了,能让你的 AI 聊天体验起飞!

最近 AI 圈可是热闹非凡,今天咱们就来聊聊其中的 “狠角色”——LLaMA-Omni2。这是一系列超厉害的语音语言模型(SpeechLMs),参数规模从0.5B 到14B 不等,专门为实现高质量实时语音交互而生,在 Hugging Face 上一经发布,就引起了广泛关注。语音交互发展历程回顾:从 “卡顿” 到 “丝滑”语音交互在人机交互领域的地位愈发重要,它就像是为我们打开了一扇便捷的大门,极大

IBM 首席执行官进军人工智能市场并加大美国投资

在最近的一次采访中,IBM 首席执行官阿尔温德・克里希纳(Arvind Krishna)表示,随着人工智能(AI)市场竞争的加剧,IBM 正计划通过提供能够整合客户使用的不同 AI 代理的工具,来提升其在该领域的销售。这些工具将帮助客户管理他们在关键业务应用中的一系列 AI 代理,主要包括 Salesforce、Workday 和 Adobe 等公司的产品。克里希纳指出,IBM 将助力客户构建适合

音乐界的sd?ACE-Step音乐生成模型发布,20秒打造4分钟完整歌曲

ACE-Step,一款由ACE Studio与StepFun联合开发的音乐生成“基础模型”,于近日正式亮相,被誉为“音乐界的Stable Diffusion”。该模型以其惊人的生成速度和多样化功能引发行业热议,支持19种语言,可在短短20秒内生成一首长达4分钟的完整音乐作品,效率比主流模型快15倍以上。核心功能亮点:从歌词到完整歌曲一气呵成ACE-Step以其强大的生成能力重新定义了AI音乐创作。

Perplexity AI 推出全新 Comet 浏览器,挑战 Chrome 霸主地位

近日,Perplexity AI 宣布将在本月推出其新款 AI 驱动的 Comet 浏览器,标志着互联网浏览器市场的一场变革。作为一种新兴的浏览器,Comet 旨在成为 Google Chrome 的有力竞争者,特别是在信息检索和用户体验方面。图源备注:图片由AI生成,图片授权服务商MidjourneyComet 浏览器的构想早有端倪,近期用户发现 Perplexity 官网上新增了一个 “Lea