نظرة عامة على المعلّم القرآني
المعلّم القرآني هو طبقة الاستدلال التي تقارن التلاوة بمرجع صوتي وتنتج مخرجات متعددة المستويات: فونيمات + صفات تجويدية لكل مجموعة فونيمات.
نقاط الدخول الأساسية:
- الفئة
Muaalemفيsrc/quran_muaalem/inference.py. - واجهة Gradio في
src/quran_muaalem/gradio_app.py.
لماذا هذا مهم للباحثين؟
- النموذج لا يقوم بالنسخ فقط؛ بل ينتج طبقة صفات (سِفَات الحروف) قابلة للقياس والتحليل.
- هذا يتيح دراسات مقارنة أدق من WER/PER التقليدي.
مسار الاستدلال الأساسي
داخل Muaalem.__call__:
- ترميز المرجع الصوتي عبر
MultiLevelTokenizer. - استخراج خصائص الصوت عبر
AutoFeatureExtractor. - تشغيل نموذج
Wav2Vec2BertForMultilevelCTC. - فك الشيفرة عبر
phonemes_level_greedy_decodeوmultilevel_greedy_decode. - تجميع صفات كل مجموعة فونيمات في
SifaوإرجاعMuaalemOutput.
ملاحظة: المرجع الصوتي يُبنى باستخدام
quran_transcript.quran_phonetizer.
القيود العملية
- معدل العينة المطلوب: 16 kHz.
- جودة النتائج تعتمد على جودة المرجع (الرسم الصوتي) وجودة الصوت.
- قيم الاحتمالات (
probs) ليست مُعايرة افتراضيًا.
أين تجد التفاصيل؟
- واجهة بايثون: شرح المدخلات والمخرجات والأمثلة.
- المخرجات: مخطط تفصيلي للـ
MuaalemOutput. - المعمارية: تفاصيل CTC متعدد المستويات.
ملفات أساسية
src/quran_muaalem/inference.py— فئة النموذج ومسار الاستدلال.src/quran_muaalem/decode.py— فك الشيفرة والمحاذاة.src/quran_muaalem/muaalem_typing.py— تعريف المخرجات.src/quran_muaalem/gradio_app.py— واجهة المستخدم وإعدادات المصحف.