深度学习平台

WIFI WIFI


产品特点

高性能

以支持高性能计算领域的系统、算法和应用为特色,分布式训练的速度和规模显著优于开源产品,助力客户实现业务性能飞跃。

高效率

基于容器化技术高效管理软硬件资源,提供分布式批处理作业调度机制,有效提升机器资源利用率并降低人工运维管理开销。

易使用

提供简洁易用的web控制台和REST API,预置大量通用算法模型,特别支持多类自动学习能力,助力不同背景的用户快速达成目标。

一站式

提供深度学习全生命周期所需的开发环境、训练作业、推理服务、可视化工具等能力,以完整的解决方案帮助客户实现业务的智能化。

产品功能

开发环境

提供Jupyter Notebook等在线IDE,用于开发或修改算法代码及执行交互式调试。

训练作业

以批处理作业方式执行单进程或分布式的深度学习训练,生成神经网络模型。

推理服务

基于模型,部署REST风格的在线推理服务,以便应用业务集成人工智能能力。

可视化工具

提供TensorBoard等工具,以图形化方式呈现神经网络训练过程与模型结构。

多种AI引擎

支持TensorFlow、PyTorch、MXNet、Kaldi等多种业界主流的深度学习引擎。

多种调度类型

支持单进程以及Allreduce、PS-Worker、Horovod MPI等多种分布式执行模式。

自动学习

具有自动超参调优、网络架构搜索等能力,能够显著简化算法的开发与调优过程。

预置算法

预置工业界与学业界流行的多种经典和时兴的通用算法,提供开箱即用的工具。

镜像仓库

支持用户构建包含自定义引擎、开发库与算法的容器镜像,从而扩展平台能力。

集群管理

为运营、运维等后台人员提供集群软硬件资源及数据资产的图形化管理功能。

资源监控

提供CPU、GPU、网络等硬件资源的实时监控,帮助用户分析算法、优化成本。

多租户管理

紧密结合企业多租户应用场景,确保租户内的权限控制及租户间的资源隔离。

产品展示

开发环境

用户可以使用Jupyter Notebook等工具编写算法程序、调试训练代码、测试推理服务,并无缝访问存储资源。

训练作业

基于用户提供或系统预置的算法,输入数据集,以批处理方式执行深度学习训练作业,生成模型与汇总文件。

可视化工具

用户通过TensorBoard等在线工具,实时观察神经网络的参数变化及模型的效果变化,以便分析和优化算法。