نظرة عامة على المعلّم القرآني

المعلّم القرآني هو طبقة الاستدلال التي تقارن التلاوة بمرجع صوتي وتنتج مخرجات متعددة المستويات: فونيمات + صفات تجويدية لكل مجموعة فونيمات.

نقاط الدخول الأساسية:

الفئة Muaalem في src/quran_muaalem/inference.py.
واجهة Gradio في src/quran_muaalem/gradio_app.py.

لماذا هذا مهم للباحثين؟

النموذج لا يقوم بالنسخ فقط؛ بل ينتج طبقة صفات (سِفَات الحروف) قابلة للقياس والتحليل.
هذا يتيح دراسات مقارنة أدق من WER/PER التقليدي.

مسار الاستدلال الأساسي

داخل Muaalem.__call__:

ترميز المرجع الصوتي عبر MultiLevelTokenizer.
استخراج خصائص الصوت عبر AutoFeatureExtractor.
تشغيل نموذج Wav2Vec2BertForMultilevelCTC.
فك الشيفرة عبر phonemes_level_greedy_decode و multilevel_greedy_decode.
تجميع صفات كل مجموعة فونيمات في Sifa وإرجاع MuaalemOutput.

ملاحظة: المرجع الصوتي يُبنى باستخدام quran_transcript.quran_phonetizer.

القيود العملية

معدل العينة المطلوب: 16 kHz.
جودة النتائج تعتمد على جودة المرجع (الرسم الصوتي) وجودة الصوت.
قيم الاحتمالات (probs) ليست مُعايرة افتراضيًا.

أين تجد التفاصيل؟

واجهة بايثون: شرح المدخلات والمخرجات والأمثلة.
المخرجات: مخطط تفصيلي للـ MuaalemOutput.
المعمارية: تفاصيل CTC متعدد المستويات.

ملفات أساسية

src/quran_muaalem/inference.py — فئة النموذج ومسار الاستدلال.
src/quran_muaalem/decode.py — فك الشيفرة والمحاذاة.
src/quran_muaalem/muaalem_typing.py — تعريف المخرجات.
src/quran_muaalem/gradio_app.py — واجهة المستخدم وإعدادات المصحف.