
OpenBayes 一周速览|vLLM 高效部署 DeepSeek-R1,加速模型推理!超 20w 图像-文本配对,GAIA 视觉语言遥感数据集发布
该数据集专为研究扑翼机器人机翼的深度逆映射模型而创建,旨在为拍翼机器翼的控制提供一种新的学习框架。作为 DeepSeek 系列的高性能版本,它在多个基准测试中表现出色,支持多种应用场景,如移动设备与边缘计算、在线推理服务等,以提高响应速度和降低运营成本,其具备非常强大的推理和决策能力。该数据集是一个用于遥感图像分析的全球性、多模态、多尺度视觉-语言数据集,旨在弥合遥感 (RS) 图像与自然语言理解
公共资源速递
5 个数据集:
* JMED 中文真实医疗数据数据集
* GAIA 视觉语言遥感图像理解数据集
* 110k 基于 DeepSeek-R1 蒸馏数据集
* AI-CUDA-Engineer-Archive 内核集合数据集
* Flapping Wing System Dataset 机器人技术数据集
1 个模型:
* DeepSeek-R1-Distill-Llama-70B
3 个教程:
* VASP:NVT 系综下的分子动力学
* 使用 vLLM 部署 DeepSeek R1 7B
* SkyReels-V1-Hunyuan-I2V 首个 AI 短剧创作模型 Demo
访问官网立即使用:openbayes.com
公共数据集
该数据集是一个基于真实世界医疗数据分布的新型数据集,包含 1k 个问题,每个问题包括 21 个回答选项,其中有一个「以上都不是」选项。这种设计大大增加了区分正确答案的复杂性和难度,从而提供了更严格的评估框架。
* 直接使用:
https://go.openbayes.com/Kf7jp
数据集推理流程
该数据集是一个用于遥感图像分析的全球性、多模态、多尺度视觉-语言数据集,旨在弥合遥感 (RS) 图像与自然语言理解之间的差距,它提供了 205,150 对图像-文本配对,覆盖了多样化的地理区域、卫星任务和遥感模态。
* 直接使用:
https://go.openbayes.com/gpH0W
数据示例
3. 110k 中文基于 DeepSeek-R1 蒸馏数据集
该数据集为中文开源蒸馏满血 DeepSeek-R1 的数据集,数据集中不仅包含 math 数据,还包括大量的通用类型数据,总数量为 110k。
* 直接使用:
https://go.openbayes.com/mQeK0
4. AI-CUDA-Engineer-Archive 内核集合数据集
该数据集是一个由 AI 生成的 CUDA 内核集合,旨在促进开源模型的后续训练和开发更出色的 CUDA 功能模块。它包含超过 3 万个 CUDA 内核,这些内核均由 AI 驱动的 CUDA 工程师生成,其中超过 1.7 万个内核已验证正确,约 50% 的内核性能优于 PyTorch 原生运行时间。
* 直接使用:
https://go.openbayes.com/jn38d
数据集结构
5. Flapping Wing System Dataset 机器人技术数据集
该数据集专为研究扑翼机器人机翼的深度逆映射模型而创建,旨在为拍翼机器翼的控制提供一种新的学习框架。它包含 548 个实验,每个实验 470 个时间点,3 个机翼旋转角度(俯仰、偏航、翻滚)和 5 个特征(3 个力测量值和 2 个扭矩测量值),数据采样率为 25 赫兹。
* 直接使用:
https://go.openbayes.com/QIyxV
物理系统的正向映射与逆向映射
公共模型
1. DeepSeek-R1-Distill-Llama-70B
* 发布机构:深度求索 (DeepSeek) 公司
该模型是一款的开源大语言模型,参数规模高达 700 亿。作为 DeepSeek 系列的高性能版本,它在多个基准测试中表现出色,支持多种应用场景,如移动设备与边缘计算、在线推理服务等,以提高响应速度和降低运营成本,其具备非常强大的推理和决策能力。
* 直接使用:
https://go.openbayes.com/pe0Nh
公共教程
VASP (Vienna Ab initio Simulation Package) 是一个计算机程序,用于从第一性原理进行原子尺度材料建模,例如电子结构计算和量子力学分子动力学。在 VASP 中进行分子动力学模拟时,不需要提供力场参数,只需提供原子的初始结构即可。
该教程演示了 NVT 系综下的分子动力学模拟,介绍了 VASP 分子动力学的核心命令 tag:NVT。用户可按需修改 tag,进行其他系综的分子动力学模拟。
* 在线运行:
https://go.openbayes.com/XZ1TS
原子运动轨迹示例
DeepSeek-R1 是 DeepSeek 于 2025 年推出的高效轻量级语言模型,支持文本生成、对话、翻译、摘要等多种任务。采用知识蒸馏技术,兼顾高性能与低算力需求,适合快速部署与实际应用。而 vLLM 是一款专为大语言模型推理加速而设计的框架,实现了KV缓存内存几乎零浪费,解决了大语言模型推理中的内存管理瓶颈问题。
本项目通过 Gradio 接口可以生成前端交互界面,一键启动,复制 API 地址即可与模型展开对话。
* 在线运行:
https://go.openbayes.com/eBCNF
模型界面示例
3. SkyReels-V1-Hunyuan-I2V 首个 AI 短剧创作模型 Demo
该模型是一个高质量视频生成模型,专注于人类中心的影视级视频生成。它基于 HunyuanVideo 模型进行微调,经过千万级高质量影视数据的训练,能够生成具有电影级质感的视频内容。
该项目相关模型和依赖已经部署完毕,只需上传图片并输入指令,即可开启短剧创作之旅。
* 在线运行:
https://go.openbayes.com/V5Ea0
Demo 示例
以上就是小贝上周在 OpenBayes 的全部更新内容啦
更多推荐
所有评论(0)