大模型训练数据集

数据集空间

多种异构模态数据，如：文本、图像、音视频等

计算机视觉

通过摄影机和电脑模拟人眼对目标进行识别、跟踪和测量等

自然语言处理

人机交互，让计算机理解和处理人类语言的复杂性和多样性等

音频

通过摄影机和电脑模拟人眼对目标进行识别、跟踪和测量等

表格

通过与环境的交互来学习策略，以达成回报最大化或实现特定目标

强化学习

COIG-CQIA：为中文指令微调提供高质量数据集

2024-05-12
CompGuessWhat?!：多任务框架下评估学习神经表示的数据集

2024-05-10
YouTube Transcriptions：技术教程视频的文字转录数据集

2024-05-10
VQA-RAD：放射影像问答数据集的深入分析

2024-05-10
RealWorldQA数据集：评估多模态模型的现实世界空间理解能力

2024-05-10
PathVQA：病理图像问答数据集的全面解析

2024-05-10
Korean Wikipedia Dataset for GPT-2: 韩文维基百科数据集的深度解析

2024-05-10
ShareGPT4V 1.2M：推进多模态模型的字幕数据集

2024-05-10
Visual Genome：连接语言和视觉的众包密集图像注释数据集

2024-05-10
Japanese-Heron-Bench：评估日语视觉-语言模型的基准测试

2024-05-10

12 3 4 5 下一页

到第页共 5 页

深度元素科技，您的信赖之选

Copyright © 深度元素（北京）科技有限公司-京ICP备2023009090号-1 玩物熵智（杭州）工作室-浙ICP备2023014592

服务协议隐私协议

京公网安备11011402054603号

深度元素智能实验室

售后服务

周一至周五 9：00-18：00

产品和技术中心

联系电话: 010-62128818

Email: deepelement.ai@outlook.com

开通流程

帮助中心

注册会员开通

请联系客服

QQ：3812246228

DE.Tech | AI, Think Best, Do Best