激发数据要素价值
赋能数字中国建设 Unlock the Power of Data
Accelerate Intelligent Industries
以数据洞察的方式帮助企业实现人工智能对业务的发展促进作用,
打造数据集、算法、算力一站式 AI 服务平台 Helping enterprises harness AI through data-driven insights.
One-stop platform for datasets, algorithms, and computing power.
以数据评测为始,推动 AI 落地实体经济 Data-First Approach to Enterprise AI
完善数据、算法、算力要素市场化配置,打造全新人工智能数据生态 Optimizing data, algorithm, and computing resources to build a new AI ecosystem
数据集商城Dataset Marketplace
提供各行业高质量 AI 训练数据集,覆盖计算机视觉、自然语言处理、语音识别等领域,实现一站式数据集采购。 High-quality AI training datasets across computer vision, NLP, speech recognition, and more — all in one place.
算法商城Algorithm Marketplace
汇聚行业领先的 AI 算法模型,涵盖安全检测、医疗影像、智能制造等场景,开箱即用。 Leading AI algorithm models for security, medical imaging, smart manufacturing, and more — ready to deploy.
算力商城Computing Marketplace
提供弹性 GPU 算力与 AI Token 服务,支持模型训练、推理部署,按需使用,灵活计费。 Elastic GPU computing and AI Token services for model training and inference — flexible, pay-as-you-go billing.
AI 落地方法论 AI Deployment Methodology
以数据评测为始,启动人工智能落地,建立基准和持续迭代 Starting with data evaluation, establishing baselines and continuous iteration
提出业务挑战 Define Challenge
基于业务了解,量化改变目标 Quantify business objectives
观察和猜测 Observe & Hypothesize
根据数据揭示现象进行逻辑推测 Logical inference from data patterns
数据评测 Data Evaluation
评测数据链条完整性和一致性 Assess data completeness and consistency
建立数据基准 Data Baseline
夯实算法建模阶段的基础 Foundation for algorithm modeling
建立算法基准 Algorithm Baseline
快速确立未来迭代路径 Establish iteration roadmap
回答和迭代 Answer & Iterate
持续验证并发现数据潜能 Continuously validate and unlock data value
数据集Datasets
高质量 AI 训练数据,覆盖多个行业领域 High-quality AI training data across multiple industries
社交网络中的意见动态
了解用户如何通过与社交网络中的朋友和邻居的互动来形成和更新他们的意见是在线广告、推荐和营销应用程序的一个基本问题。在我们的研究中,我们使用 Amazon Mechanical Turk 进行了广泛的用户研究,作为其中的一部分,我们测量了参与者对汽车和汽水品牌、绿色能源、有机食品等各种主题的采用和意见变化。实验包括以下步骤1. 要求用户就给定的主题给出她天生的(开始的)意见。2. 向她展示一组参与实验的其他用户的意见。3. 再次询问她对这个话题的看法。这些是匿名用户,数量约为 200。
FIRE 视网膜眼底病变图像数据
FIRE 是一个视网膜眼底图像数据集,包含 129张 眼底视网膜图像,由不同特征组合成 134对 图像组合。这些图像组合根据特质被划分为3类。眼底图像由 Nidek AFC-210 眼底照相机采集,分辨率为2912x2912,视觉仰角为40度。图像由 Papageorgiou Hospital 医院和Aristotle University of Thessaloniki大学共同构建,由于Thessaloniki 大学采集自39名患者。
JRC Names各国语言专有实体名称
JRC Names 是一个跨语言实体名称语料库,该语料库包含了大量跨语言人名和组织名称(称之为“实体”),包括不同语言的实体名称,包括汉语、英语、拉丁语、希腊语、阿拉伯语、斯拉夫语、日本语等。2016年之后,JRC Names还关联了其它附加信息,如每个实体在每种语言中出现的频率和时间段等。
Crowd Segmentation 高密度人群视频数据
Crowd Segmentation Dataset 是一个高密度人群和移动物体视频数据,视频来自BBC Motion Gallery 和 Getty Images 网站。
Sinhala TTS 语音识别数据
Sinhala TTS 是一个高质量僧伽罗语语音识别数据,由谷歌工作人员在斯里兰卡收集。
ReDial 数据集(推荐对话)
ReDial(推荐对话)是一个带注释的对话数据集,用户可以在其中相互推荐电影。该数据集由蒙特利尔理工学院、MILA 魁北克人工智能研究所、微软蒙特利尔研究院、蒙特利尔 HEC 和 Element AI 的一组研究人员收集。
算法模型Algorithm Models
行业领先的 AI 算法,开箱即用 Industry-leading AI algorithms, ready to deploy
安全帽识别
基于大规模安全帽数据识别训练,配合现场摄像头,实现自动识别现场作业人员的安全帽佩戴情况,准确率高于90%,达到高效率监督监管。
安检仪危险品识别
该算法基于计算机识别技术,将X光图像信息进行从线条到材质的多层次拆解,对常规行李包、液体、爆炸物等进行自动识别与报警,减轻工作人员负担,广泛适用于机场铁路、会议等安检情景。极视角第二代智能安检分析终端在Intel OpenVINO™的助力下,能优化视觉推理性能,充分发挥英特尔平台的AI算力潜能及多硬件平台可扩展性,算法也由GPU转化为CPU(Intel i3-8100T)分析,在保持原有算法的识别精度和速度的大前提下,在整体方案交付过程中实现硬件成本的降低。
客流统计
基于动态视频实时统计店铺/活动现场客流量数据、变化趋势等,进行数据采集,综合评估店铺/活动效果,实时突发事件预警,辅助商业决策。
火焰监测
基于大规模火焰数据识别训练,配合摄像头,实时识别监控区内明火情况,立刻发出警报,提醒监控室查看,及时止损。适用于室内外多种复杂环境。
AI 算力 & Token 服务 AI Computing & Token Services
弹性 GPU 算力,按需使用。支持主流大模型推理与训练,灵活的 Token 计费方案。 Elastic GPU computing on demand. Support for major LLM inference and training with flexible Token billing.
生态伙伴Ecosystem Partners
155+ 家合作伙伴共建 AI 生态 155+ partners co-building the AI ecosystem
标准规范Standards
打造人工智能标准规范 Establishing AI standards and best practices
人工智能标准化白皮书
人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能安全标准化白皮书(2019)
推动人工智能健康有序和安全可控发展,并在人工智能伦理道德、人工智能系统安全、机器人、自动驾驶、隐私保护等方向进行了探索与实践。
人工智能开源与标准化研究报告(2019)
本报告中的开源指源码公开、源数据公开及其他成果形式(如软件、系统或 平台架构等)的公开。近年来开源技术蓬勃发展,诸如计算机视觉开源社区 OpenCV、开源数据集 ImageNet、开源智能终端操作系统 Android 和其他大量开 源工具及平台,无不表明开源创新与协同有力推动了产业进程。同理,人工智能 尤其是深度学习相关的开源蓬勃发展,也将对我国人工智能相关产业产生积极影响。