model-parallelism

Here are 33 public repositories matching this topic...

explcre / pipeDejavu

pipeDejavu: Hardware-aware Latency Predictable, Differentiable Search for Faster Config and Convergence of Distributed ML Pipeline Parallelism

python deep-learning linear-regression pytorch dynamic-programming predictive-modeling data-parallelism sampling-methods model-parallelism distributed-training differentiable-programming pipeline-parallelism hardware-aware parallel-optmization random-initialization baysian-optimisation differentiable-dynamic-programming

Updated May 9, 2023
Jupyter Notebook

sjlee25 / legion-readme

Star

Description of Framework for Efficient Fused-layer Cost Estimation, Legion (2021)

edge-computing model-parallelism tvm dl-optimization

Updated Dec 18, 2022

joelrorseth / HyperTune

Star

A fully distributed hyperparameter optimization tool for PyTorch DNNs

pytorch data-parallelism model-parallelism horovod gpipe ray-tune

Updated Jan 12, 2022
Python

d4l3k / axe

Star

A simple graph partitioning algorithm written in Go. Designed for use for partitioning neural networks across multiple devices which has an added cost when crossing device boundaries.

machine-learning graph-partitioning model-parallelism

Updated Jun 17, 2020
Go

ryantd / veloce

Star

WIP. Veloce is a low-code Ray-based parallelization library that makes machine learning computation novel, efficient, and heterogeneous.

sparsity deep-learning distributed-computing pytorch distributed ray data-parallelism parameter-server heterogeneity model-parallelism

Updated Aug 4, 2022
Python

Shenggan / atp

Star

Adaptive Tensor Parallelism for Foundation Models

pytorch transformer attention gpt model-parallelism distributed-training large-model

Updated Dec 15, 2022
Python

fanpu / DynPartition

Star

Official implementation of DynPartition: Automatic Optimal Pipeline Parallelism of Dynamic Neural Networks over Heterogeneous GPU Systems for Inference Tasks

machine-learning reinforcement-learning scheduling pytorch neural-networks model-parallelism treelstm pipeline-parallelism dynamic-neural-network dynpartition

Updated May 5, 2023
Python

mzj14 / mesh

Star

Mesh TensorFlow: Model Parallelism Made Easier

python rnn-tensorflow model-parallelism

Updated Dec 18, 2018
Python

garg-aayush / model-parallelism

Star

Model parallelism for NN architectures with skip connections (eg. ResNets, UNets)

pytorch model-parallelism gpipe pipeline-parallelism

Updated May 24, 2022
Python

ankahira / chainermnx

Star

Extended ChainerMN

chainer model-parallelism

Updated Dec 19, 2020
Python

LER0ever / HPGO

Star

Development of Project HPGO | Hybrid Parallelism Global Orchestration

rust machine-learning tensorflow pytorch data-parallelism model-parallelism distributed-training pipedream gpipe pipeline-parallelism

Updated Mar 26, 2021

EunjuYang / distributed-tf

Star

distributed tensorflow (model parallelism) example repository

distributed-tensorflow model-parallelism

Updated Jul 13, 2019
Python

dscpesu / NetTorrent

Star

A decentralized and distributed framework for training DNNs

distributed-computing data-parallelism model-parallelism p2p-networks

Updated Aug 25, 2019
Python

olk / mnist-performance

Star

performance test of MNIST hand writings usign MXNet + TF

python mxnet tensorflow keras mnist classification gluon multi-gpu model-parallelism horovod multi-gpu-training mirrored-strategy

Updated Jan 31, 2020
Python

atakehiro / 3D-U-Net-pytorch-model-parallel

Star

PyTorch implementation of 3D U-Net with model parallel in 2GPU for large model

pytorch model-parallelism 3d-unet

Updated Aug 9, 2020
Python

ngrabaskas / Torch-Automatic-Distributed-Neural-Network

Star

Torch Automatic Distributed Neural Network (TorchAD-NN) training library. Built on top of TorchMPI, this module automatically parallelizes neural network training.

machine-learning neural-network torch7 openmpi data-parallelism model-parallelism distributed-machine-learning

Updated Feb 28, 2018
Lua

AnveshaM / Enhancing-performance-of-big-data-machine-learning-models-on-Google-Cloud-Platform

Star

The project is focused on parallelising pre-processing, measuring and machine learning in the cloud, as well as the evaluation and analysis of the cloud performance.