计算机视觉 | 标签

首页

资讯

往期整理

结合ResUNet与SAM 3：利用1米NAIP影像实现高精度农田边界提取

最新研究提出结合残差U-Net与文本提示SAM 3的模型，可直接从1米分辨率NAIP影像中高精度提取农田范围与可见边界，显著提升农业监测效率。

U-CFR：基于不确定性引导的自主纠错交互式图像分割框架

了解最新提出的U-CFR框架，该方法通过不确定性引导的级联前向细化和自主生成伪点击，大幅提升交互式图像分割的效率，显著降低人工图像标注成本。

对齐人类专家注意力：AI精准模拟病理学家视角，大幅提升前列腺癌报告生成准确率

最新被MICCAI 2026接收的研究展示了一种引入病理学家人类注意力机制的新型AI模型训练方法。通过多模态数据对齐，该技术不仅将前列腺癌临床组件诊断准确率提升19.3%，更为医学大模型提供了极佳的视觉可解释性。

EGRNet：面向边缘计算的轻量级语义分割网络，兼顾高效与对抗感知

研究人员提出了仅有0.46M参数的轻量级语义分割网络EGRNet，结合边缘门控细化模块与轻量级对抗攻击检测策略，在Cityscapes数据集上达到65.28%的mIoU，专为自动驾驶等实时边缘应用设计。

蚂蚁灵波LingBot 2.0深度解读：11亿参数逆袭，具身AI前沿资讯

深入解读蚂蚁灵波LingBot-Depth 2.0与开源模型LingBot-Vision，11亿参数击败70亿大模型，攻克透明物体感知难题。获取最新AI资讯、AI新闻、大模型动态，探索具身智能与人工智能的未来，尽在AI门户。

RSAgent：多模态大模型“边看边改”，视觉分割准确率提升9%

深入解读ICML 2026论文RSAgent，揭秘多模态大模型如何通过多轮工具调用实现“边看边改”，将视觉分割准确率提升9%。探索AI,大模型,计算机视觉的前沿进展。

深度解读GaussianPile：3DGS如何重塑医学切片成像与体素重建

深入解析CVPR 2026前沿研究GaussianPile，探索如何通过3DGS技术实现切片式容积影像的高效压缩与快速重建，解决医学成像内部结构难题。获取更多AI资讯，请访问AIGC门户。

AI突破：国产团队Scal3R让公里级长视频3D重建稳如磐石

AI新闻：国产Scal3R技术突破长视频3D重建瓶颈，实现公里级大场景稳定高精度重建，AI资讯，LLM，人工智能，大模型。

医学影像分割新突破：浙大与上海AI Lab联手打造IBISAgent

IBISAgent通过多步决策重塑医学图像分割范式，无需修改模型或增加token，实现SOTA级性能。了解AI医疗、大模型、LLM领域的最新技术突破，请关注AI资讯，获取更多前沿信息。

突破3D空间推理瓶颈：北大联合南科大QuatRoPE让大模型读懂三维世界

深入解读CVPR 2026重磅论文QuatRoPE，北大与南科大创新研究。探索如何通过四元数旋转位置嵌入解决大模型3D空间推理难题，实现精准物体关系理解。AI,AI资讯,大模型,3D视觉,空间推理,AGI,LLM。

CVPR2026满分论文解读：Proxy-GS加速3D高斯渲染及最新AI资讯

CVPR2026满分论文,Proxy-GS,3D高斯溅射,3DGS渲染加速,遮挡先验,AI资讯,人工智能前沿,大模型视觉技术,AI新闻门户,AGI发展,AI变现趋势,探讨结构化3D高斯的优化与应用。

微软清华联手BiPS：一拉一推根治AI看图幻觉，迈向AGI关键一步

微软亚洲研究院与清华大学提出BiPS技术，通过“一拉一推”的双向感知塑形，解决视觉语言模型（VLM）看图不准的问题。本文深入解读这一从训练端重塑AI视觉能力的创新，探讨其对大模型、AGI及AI资讯领域的深远影响。

VLM剪枝新SOTA：无需重训练，注意力去偏置技术解析 - AI资讯

VLM剪枝,注意力机制,AI效率优化,大模型部署,机器视觉,AI新闻,LLM优化,无需重训练,上海大学研究,SOTA模型

何恺明团队新作pMF：开启像素级「无潜、单步」生成新范式

何恺明,pMF,像素级生成,无潜空间,单步生成,MeanFlow,生成式AI,计算机视觉,图像生成,AI新闻,AI资讯,aigc.bar,深度学习,端到端模型,ImageNet,FID评分

SplatSSC解读：AAAI 2026 Oral高斯泼溅新范式，重塑单目场景补全

深入解析AAAI 2026 Oral论文SplatSSC，探讨解耦深度引导的高斯泼溅技术如何解决“漂浮物”伪影，提升单目语义场景补全效率。关注AI资讯，了解具身智能与自动驾驶感知的SOTA突破。

视频版Deep Research登场：金字塔感知让Token消耗降58% | AI资讯

深入解读Video-Browser，一种视频版Deep Research新范式。采用金字塔感知架构（Pyramidal Perception），模拟人类先浏览后精读的模式，在Video-BrowseComp基准测试中精度提升，Token消耗降低58.3%。

AAAI 2026大奖揭晓：Bengio获经典奖，华人团队强势霸榜杰出论文

AAAI 2026在新加坡盛大开幕，图灵奖得主Yoshua Bengio凭借知识嵌入论文斩获经典论文奖。5篇杰出论文中华人团队占据3席，涵盖具身智能、LLM多模态及超图神经网络等前沿领域，引领AI资讯新风向。

YOLOv26深度解析：大模型时代，为何工业界仍坚守边缘计算？

深入解读YOLOv26的发布及其背后的工业逻辑。在大模型(LLM)和AGI备受追捧的今天，为何YOLO依然是计算机视觉落地的首选？本文分析其去NMS架构革新、边缘计算优势及成本账，带你了解AI资讯与实体产业的真实结合。

IDEA开源OVSeg3R：2D先验生成3D标注，自动驾驶迎新突破

IDEA团队开源OVSeg3R模型，利用2D先验自动生成3D标注，大幅降低自动驾驶与具身智能的数据成本。关注AIGC.BAR获取更多AI资讯、AGI进展及大模型前沿新闻，了解AI如何重塑未来。

AAAI 2026新作：AdaptCLIP零样本横扫12个工业医疗数据集

深入解读西门子与腾讯优图联合推出的AdaptCLIP模型，AAAI 2026最新研究成果。该模型在零样本和少样本条件下，横扫12个工业与医疗数据集，精准定位缺陷，刷新检测精度SOTA，为人工智能在工业质检领域的应用带来新突破。

←上页下页→