Skip to content

خطوات المسار

هذا القسم يوسّع الخطوات المذكورة في README.md ويجعل تدفق البيانات والوسوم واضحًا لأغراض البحث وإعادة الإنتاج.

المسار خطوة بخطوة (مفهومي)

الخطوةالمدخلاتالمخرجاتملاحظات
1. جمع التلاواتصوت خاممجموعة صوتية منقّاةيُفضّل تلاوات عالية الجودة مع بيانات وصفية.
2. التقسيم حسب الوقفالصوت الخاممقاطع قصيرةتقسيم الوقف أدق من تقسيم الآية في كثير من الحالات.
3. النسخ الآليالمقاطعنص إملائياستخدام Whisper مخصص للقرآن للنص الأولي.
4. التصحيحنص إملائينص إملائي مصحّحباستخدام خوارزمية التسميع (quran-transcript).
5. تحويل الرسمإملائي → عثمانينص عثمانييعتمد على خريطة الرسم في quran-transcript.
6. التحويل الصوتيعثمانيفونيمات + صفاتquran_transcript.quran_phonetizer يولّد الوسوم.
7. التدريبالصوت + الوسومنموذج CTC متعدد المستوياتWav2Vec2BERT مع رؤوس متعددة.

مخرجات تُحفظ لإعادة الإنتاج

  • segments.jsonl – بيانات المقاطع (البداية/النهاية/المصدر).
  • transcripts_raw.jsonl – النسخ الأولي.
  • transcripts_fixed.jsonl – النص المصحّح.
  • uthmani.jsonl – النص العثماني لكل مقطع.
  • phonetic_labels.jsonl – الفونيمات والصفات.
  • تقسيمات train/valid/test ببذرة ثابتة.

توليد الوسوم

المولّد الأساسي:

python
from quran_transcript import quran_phonetizer

وينتج:

  • phonemes: النص الصوتي
  • sifat: صفات لكل مجموعة فونيمات

ثم تُحوّل هذه الوسوم إلى مُعرّفات عبر MultiLevelTokenizer أثناء التدريب.

حساسيات معروفة

  • أخطاء التقسيم تؤثر مباشرة على المحاذاة ودقة الصفات.
  • الضجيج في النسخ الإملائي قد يسبب فشلًا في التحويل إلى الرسم العثماني.
  • سرعة التلاوة تغيّر توزيع الأطوال وقد تتطلب تقنيات موازنة.

الخطوة التالية

راجع صفحة التقييم والقياسات لاختيار المعايير المناسبة.