Skip to content

This repository hosts BonyadAI, a Persian question answering AI Model. We developed an initial web crawler and scraper to gather the dataset. The second phase involved building a machine learning model based on word embeddings and NLP techniques. This AI model operates end-to-end, receiving user voice input and providing responses in Persian voice.

Notifications You must be signed in to change notification settings

M-Taghizadeh/Persian_Question_Answering_Voice2Voice_AI

Repository files navigation

BonyadAI

هوش مصنوعی پرسش و پاسخ به زبان فارسی

نمای کلی پروژه

در این پروژه، ما ابتدا یک خزنده و اسکریپر وب برای جمع‌آوری داده‌ها توسعه دادیم. فاز دوم شامل ساخت یک مدل یادگیری ماشین بر اساس تکنیک‌های تعبیه واژه و پردازش زبان طبیعی بود. این مدل هوش مصنوعی به صورت صوت-به-صوت عمل می‌کند، به این صورت که ورودی صوتی کاربر را دریافت کرده و پاسخ‌هایی به زبان فارسی ارائه می‌دهد.

فازهای پروژه

  1. فاز جمع‌آوری داده‌ها
  • توسعه یک خزنده و وب اسکرپر برای جمع‌آوری داده‌ها و ساخت پیکره
  1. فاز توسعه مدل
  • ساخت یک مدل یادگیری ماشین بر اساس تکنیک‌های تعبیه واژه و پردازش زبان طبیعی برای عملیات پرسش و پاسخ
  1. فاز تبدیل متن به صوت و صوت به متن
  • طراحی و توسعه مدل بازشناسی صوت کاربر و تبدیل آن به متن و سپس تبدیل پاسخ متنی به صوت و ارائه به کاربر

ویژگی‌ها

  • تعامل کاربر به صورت صوت به صوت
  • دریافت ورودی صوتی کاربر و ارائه پاسخ‌ها به زبان فارسی
  • نسخه کاملا بومی سازی شده
  • قابل اجرا به صورت بدون نیاز به اینترنت
  • جمع آوری پیکره و مجموعه داده بومی با خزشگر بومی

روش استفاده و نصب هوش مصنوعی

  1. ابتدا پروژه را از لینک گیتهاب زیر دانلود کنید:

لینک مستقیم دانلود پروژه در فایل زیپ

  1. نصب پایتون نسخه سه:

دانلود پایتون از سایت رسمی

  1. نصب تمام ابزارها و کتابخانه‌ها با دستور زیر
pip install -r requirements.txt
  1. اجرای برنامه
python app.py
  1. در برنامه سوال خود را به صورت صوتی بپرسید و پاسخ خود را به صورت صوتی و متنی دریافت کنید

CODES Folder

این فولدر شامل تمام کدهایی است که در مراحل تحقیق و توسعه پروژه پیاده‌سازی و مورد آزمایش قرار گرفت و عملاً فولدر آزمایشات پروژه است که شامل سه مورد زیر است:

  1. 01-Corpus:

شامل اسکریپت‌ها و آزمایشات ساخت خزنده‌های اینترنتی برای استخراج اطلاعات از سطح اینترنت است

  1. 02-Model:

آزمایشات مدل پردازش زبان طبیعی و یادگیری ماشین برای ساخت مدل پرسش و پاسخ و مغز پروژه است

  1. 03-Speech-Recognition:

شامل آزمایشات تبدیل متن به صدا و تبدیل صدا به متن است

About

This repository hosts BonyadAI, a Persian question answering AI Model. We developed an initial web crawler and scraper to gather the dataset. The second phase involved building a machine learning model based on word embeddings and NLP techniques. This AI model operates end-to-end, receiving user voice input and providing responses in Persian voice.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages