视觉-佐伊科技

科技

字节发布视觉基础模型ViTamin，多项任务实现SOTA，入选CVPR2024

视觉语言模型屡屡出现新突破，但ViT仍是图像编码器的首选网络结构。字节提出新基础模型——ViTamin，专为视觉语言时代设计。在使用相同的数据集和训练方案时，ViTamin在I…

2024年4月27日

00

科技

字节发布视觉基础模型ViTamin，多项任务实现SOTA，入选CVPR2024

视觉语言模型屡屡出现新突破，但ViT仍是图像编码器的首选网络结构。字节提出新基础模型——ViTamin，专为视觉语言时代设计。在使用相同的数据集和训练方案时，ViTamin在I…

2024年4月27日

00

科技

特斯拉坚持纯视觉引争议！华为徐直军：我们用激光雷达好处显而易见

4月20日消息，特斯拉的决定在其自动辅助驾驶系统中坚持使用纯视觉，甚至放弃了毫米波雷达，引发了广泛争议。而与此不同的是，华为则坚持采用激光雷达技术。华为副董事长、轮值董事长徐直军…

2024年4月20日

00

观点

华为视觉智驾能超越特斯拉吗？纯视觉对决成本与性能之争

华为视觉智驾能超越特斯拉吗？纯视觉对决成本与性能之争华为鸿蒙生态春季沟通会于4月11日下午顺利召开，本次发布会聚焦于智界S7和MateBook新品。智界S7是华为与奇瑞联手，基于…

2024年4月12日

00

科技

谷歌推Scenic：可识别视频内容并生成详细描述

划重点: ⭐️ Scenic 是一个以注意力模型为重点的计算机视觉研究代码库。 ⭐️ 提供 SOTA 模型和基线模型，以及共享库和项目。 ⭐️ Scenic 采用 JAX 和 Fl…

2024年4月7日

01

科技

谷歌推Scenic：可识别视频内容并生成详细描述

划重点: ⭐️ Scenic 是一个以注意力模型为重点的计算机视觉研究代码库。 ⭐️ 提供 SOTA 模型和基线模型，以及共享库和项目。 ⭐️ Scenic 采用 JAX 和 Fl…

2024年4月7日

00

科技

李飞飞主讲，斯坦福2024 CS231n开课，依旧座无虚席

「这是自 Karpathy 和我2015年启动这门课程以来的第9个年头，这是人工智能和计算机视觉令人难以置信的十年!」知名 AI 科学家李飞飞的计算机视觉「神课」CS231n，又…

2024年4月6日

00

科技

李飞飞主讲，斯坦福2024 CS231n开课，依旧座无虚席

「这是自 Karpathy 和我2015年启动这门课程以来的第9个年头，这是人工智能和计算机视觉令人难以置信的十年!」知名 AI 科学家李飞飞的计算机视觉「神课」CS231n，又…

2024年4月6日

00

科技

吉娃娃or松饼难题被解决！IDEA研究院新模型T-Rex2打通文本视觉Prompt，连黑客帝国的子弹都能数清楚

还记得黑客帝国经典的子弹时间吗? IDEA研究院最新检测模型T-Rex2，可以齐刷刷给全部识别出来~ 而面对难倒一众大模型「吉娃娃or松饼」的难题，它只需被投喂一张吉娃娃的照片，就…

2024年3月29日

00

科技

吉娃娃or松饼难题被解决！IDEA研究院新模型T-Rex2打通文本视觉Prompt，连黑客帝国的子弹都能数清楚

还记得黑客帝国经典的子弹时间吗? IDEA研究院最新检测模型T-Rex2，可以齐刷刷给全部识别出来~ 而面对难倒一众大模型「吉娃娃or松饼」的难题，它只需被投喂一张吉娃娃的照片，就…

2024年3月29日

00