voice-activity-detection

Here are 131 public repositories matching this topic...

duj12 / ASR-2Pass

ASR 2Pass onnxruntime and websocket server, based on FunASR(https://github.com/alibaba-damo-academy/FunASR).

websocket speech-recognition inverse-text-normalization voice-activity-detection onnxruntime punctuation-restoration streaming-speech-to-text

Updated Jul 16, 2024
HTML

modelscope / FunASR

Star

A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Recognition, Voice Activity Detection, Text Post-processing etc.

pytorch speech-recognition vad punctuation whisper audio-visual-speech-recognition speaker-diarization voice-activity-detection conformer pretrained-model rnnt dfsmn paraformer speechgpt speechllm

Updated Jul 16, 2024
Python

Picovoice / cobra

Star

On-device voice activity detection (VAD) powered by deep learning

speech-recognition vad voice-activity-detection on-device voice-activity voice-activity-detector

Updated Jul 15, 2024
Python

nianlonggu / WhisperSeg

Star

Code for ICASSP 2024 paper WhisperSeg: Positive Transfer of the Whisper Speech Transformer to Human and Animal Voice Activity Detection

transformer whisper audio-segmentation voice-activity-detection icassp2024 animal-sound-detection whisperseg

Updated Jul 15, 2024
Python

snakers4 / silero-vad

Star

Silero VAD: pre-trained enterprise-grade Voice Activity Detector

voice-commands speech pytorch voice-recognition vad voice-control speech-processing voice-detection voice-activity-detection onnx onnxruntime onnx-runtime

Updated Jul 15, 2024
Python

pyannote / pyannote-audio

Star

Neural building blocks for speaker diarization: speech activity detection, speaker change detection, overlapped speech detection, speaker embedding

pytorch pretrained-models speaker-recognition speaker-verification speech-processing speaker-diarization voice-activity-detection speech-activity-detection speaker-change-detection speaker-embedding overlapped-speech-detection

Updated Jul 14, 2024
Jupyter Notebook

gtreshchev / RuntimeAudioImporter

Star

Runtime Audio Importer plugin for Unreal Engine. Importing audio of various formats at runtime.

Updated Jul 14, 2024
C++

mgonzs13 / whisper_ros

Star

Speech-to-Text based on silero-vad + whisper.cpp (GGML STT) for ROS 2

speech-recognition vad speech-to-text ros2 voice-activity-detection whisper-cpp ggml

Updated Jul 9, 2024
C++

shashikg / WhisperS2T

Star

An Optimized Speech-to-Text Pipeline for the Whisper Model Supporting Multiple Inference Engine

deep-learning speech-recognition vad speech-to-text whisper asr tensorrt voice-activity-detection tensorrt-llm

Updated Jul 9, 2024
Jupyter Notebook

juanmc2005 / diart

Star

A python package to build AI-powered real-time audio applications

real-time deep-learning transcription speaker-diarization streaming-audio voice-activity-detection speaker-embedding

Updated Jul 8, 2024
Python

ina-foss / inaSpeechSegmenter

Star

CNN-based audio segmentation toolkit. Allows to detect speech, music, noise and speaker gender. Has been designed for large scale gender equality studies based on speech time per gender.

Updated Jul 2, 2024
Python

baxtree / subaligner

Star

Automatically synchronize and translate subtitles, or create new ones by transcribing, using pre-trained DNNs, Forced Alignments and Transformers. https://subaligner.readthedocs.io/

Updated Jul 1, 2024
Python

Yifei-ZHAO96 / Tr-VAD

Star

Tr-VAD: An Efficient Transformer based Voice Activity Detection Model

vad voice-activity-detection

Updated Jun 30, 2024
Python

Speech-Interaction-Technology-Aalto-U / itsp

Star

Introduction to Speech Processing

speaker-recognition speech-processing speech-analysis voice-activity-detection speech-enhancement speech-modelling speech-coding speech-quality-evaluation

Updated Jun 28, 2024
Jupyter Notebook

OpenVoiceOS / ovos-vad-plugin-silero

Star

ovos plugin for voice activity detection using silero vad

plugin vad voice-activity-detection ovos openvoiceos

Updated Jun 27, 2024
Python

sepnic / litevad

Star

Voice activity detection (VAD) library for speech-end detection, based on WebRTC's VAD engine

webrtc voice-activity-detection speech-detection

Updated Jun 21, 2024
C

neemiasbsilva / datascience-portfolio

Star

Hello guys, welcome to my Data Science Portfolio. I include some knowledges I earn in my journey. I included some case study, papers, and code. Please check the readme.