AI 数据要素生态平台 AI Data & Computing Platform

激发数据要素价值
赋能数字中国建设
Unlock the Power of Data
Accelerate Intelligent Industries

以数据洞察的方式帮助企业实现人工智能对业务的发展促进作用,打造数据集、算法、算力一站式 AI 服务平台 Helping enterprises harness AI through data-driven insights.One-stop platform for datasets, algorithms, and computing power.

22
数据集Datasets
11
算法模型Algorithms
155+
生态伙伴Partners
6
行业领域Sectors

以数据评测为始,推动 AI 落地实体经济 Data-First Approach to Enterprise AI

完善数据、算法、算力要素市场化配置,打造全新人工智能数据生态 Optimizing data, algorithm, and computing resources to build a new AI ecosystem

数据集商城Dataset Marketplace

提供各行业高质量 AI 训练数据集,覆盖计算机视觉、自然语言处理、语音识别等领域,实现一站式数据集采购。 High-quality AI training datasets across computer vision, NLP, speech recognition, and more — all in one place.

算法商城Algorithm Marketplace

汇聚行业领先的 AI 算法模型,涵盖安全检测、医疗影像、智能制造等场景,开箱即用。 Leading AI algorithm models for security, medical imaging, smart manufacturing, and more — ready to deploy.

算力商城Computing Marketplace

提供弹性 GPU 算力与 AI Token 服务,支持模型训练、推理部署,按需使用,灵活计费。 Elastic GPU computing and AI Token services for model training and inference — flexible, pay-as-you-go billing.

AI 落地方法论 AI Deployment Methodology

以数据评测为始,启动人工智能落地,建立基准和持续迭代 Starting with data evaluation, establishing baselines and continuous iteration

01

提出业务挑战 Define Challenge

基于业务了解,量化改变目标 Quantify business objectives

02

观察和猜测 Observe & Hypothesize

根据数据揭示现象进行逻辑推测 Logical inference from data patterns

03

数据评测 Data Evaluation

评测数据链条完整性和一致性 Assess data completeness and consistency

04

建立数据基准 Data Baseline

夯实算法建模阶段的基础 Foundation for algorithm modeling

05

建立算法基准 Algorithm Baseline

快速确立未来迭代路径 Establish iteration roadmap

06

回答和迭代 Answer & Iterate

持续验证并发现数据潜能 Continuously validate and unlock data value

数据集Datasets

高质量 AI 训练数据,覆盖多个行业领域 High-quality AI training data across multiple industries

社交网络中的意见动态

了解用户如何通过与社交网络中的朋友和邻居的互动来形成和更新他们的意见是在线广告、推荐和营销应用程序的一个基本问题。在我们的研究中,我们使用 Amazon Mechanical Turk 进行了广泛的用户研究,作为其中的一部分,我们测量了参与者对汽车和汽水品牌、绿色能源、有机食品等各种主题的采用和意见变化。实验包括以下步骤1. 要求用户就给定的主题给出她天生的(开始的)意见。2. 向她展示一组参与实验的其他用户的意见。3. 再次询问她对这个话题的看法。这些是匿名用户,数量约为 200。

114 21

FIRE 视网膜眼底病变图像数据

FIRE 是一个视网膜眼底图像数据集,包含 129张 眼底视网膜图像,由不同特征组合成 134对 图像组合。这些图像组合根据特质被划分为3类。眼底图像由 Nidek AFC-210 眼底照相机采集,分辨率为2912x2912,视觉仰角为40度。图像由 Papageorgiou Hospital 医院和Aristotle University of Thessaloniki大学共同构建,由于Thessaloniki 大学采集自39名患者。

22 3

JRC Names各国语言专有实体名称

JRC Names 是一个跨语言实体名称语料库,该语料库包含了大量跨语言人名和组织名称(称之为“实体”),包括不同语言的实体名称,包括汉语、英语、拉丁语、希腊语、阿拉伯语、斯拉夫语、日本语等。2016年之后,JRC Names还关联了其它附加信息,如每个实体在每种语言中出现的频率和时间段等。

16 34

Crowd Segmentation 高密度人群视频数据

Crowd Segmentation Dataset 是一个高密度人群和移动物体视频数据,视频来自BBC Motion Gallery 和 Getty Images 网站。

19 23

Sinhala TTS 语音识别数据

Sinhala TTS 是一个高质量僧伽罗语语音识别数据,由谷歌工作人员在斯里兰卡收集。

18 11

ReDial 数据集(推荐对话)

ReDial(推荐对话)是一个带注释的对话数据集,用户可以在其中相互推荐电影。该数据集由蒙特利尔理工学院、MILA 魁北克人工智能研究所、微软蒙特利尔研究院、蒙特利尔 HEC 和 Element AI 的一组研究人员收集。

10 6

算法模型Algorithm Models

行业领先的 AI 算法,开箱即用 Industry-leading AI algorithms, ready to deploy

AI 算力 & Token 服务 AI Computing & Token Services

弹性 GPU 算力,按需使用。支持主流大模型推理与训练,灵活的 Token 计费方案。 Elastic GPU computing on demand. Support for major LLM inference and training with flexible Token billing.

生态伙伴Ecosystem Partners

155+ 家合作伙伴共建 AI 生态 155+ partners co-building the AI ecosystem

中关村软件园
中关村数智人工智能产业联盟
中关村智用人工智能研究院
中国科学院大学未来学院
联想(北京)有限公司
卓世未来(北京)科技有限公司
阿尔戈纳威(北京)人工智能科技有限公司
中建材信息
韶鼎人工智能科技有限公司
竹间智能
上海道云
山东东泓狮醒人工智能科技有限公司