Skip to content

Phonetics

The phonetic layer lives under quran-transcript/src/quran_transcript/phonetics/.

Key pieces:

  • SifaOutput and chunck_phonemes in phonetics/sifa.py.
  • quran_phonetizer in phonetics/phonetizer.py.
  • A large set of transformation operations in phonetics/operations.py.

Sifa Output

SifaOutput is a pydantic.BaseModel with phoneme groups and categorical attributes such as hams_or_jahr, shidda_or_rakhawa, tafkheem_or_taqeeq, and others. This is the reference structure that Quran Muaalem compares against.

Chunking Phonemes

chunck_phonemes(phonetic_script) splits a phonetic script string into grouped phonemes. Quran Muaalem uses this same chunking to align predicted outputs with the reference (see src/quran_muaalem/inference.py).

Transcription Scheme (from quran-transcript/README.md)

Phonemes (43)

Phoneme NameSymbolArabic
hamzaءهمزة
baaبباء
taaتتاء
thaaثثاء
jeemججيم
haa_mohmalaححاء
khaaخخاء
daalددال
thaalذذال
raaرراء
zayززاي
seenسسين
sheenششين
saadصصاد
daadضضاد
taa_mofakhamaططاء
zaa_mofakhamaظظاء
aynععين
ghynغغين
faaففاء
qafققاف
kafككاف
lamللام
meemمميم
noonننون
haaههاء
wawوواو
yaaيياء
alifانصف مد ألف
yaa_maddۦنصف مد ياء
waw_maddۥنصف مد واوا
fathaَفتحة
damaُضمة
kasraِكسرة
fatha_momala۪فتحة ممالة
alif_momalaـألف ممالة
hamza_mosahalaٲهمزة مسهلة
qlqlaڇقلقة
noon_mokhfahںنون مخفاة
meem_mokhfah۾ميم مخفاة
saktۜسكت
dama_mokhtalasaؙضمة مختلسة (عند الروم في تأمنا)

Sifat (10)

Sifat (English)Sifat (Arabic)Attributes (English)Attributes (Arabic)
hams_or_jahrالهمس أو الجهرhams, jahrهمس, جهر
shidda_or_rakhawaالشدة أو الرخاوةshadeed, between, rikhwشديد, بين بين, رخو
tafkheem_or_taqeeqالتفخيم أو الترقيقmofakham, moraqaq, low_mofakhamمفخم, مرقق, أدنى المفخم
itbaqالإطباقmonfateh, motbaqمنفتح, مطبق
safeerالصفيرsafeer, no_safeerصفير, لا صفير
qalqlaالقلقلةmoqalqal, not_moqalqalمقلقل, غير مقلقل
tikraarالتكرارmokarar, not_mokararمكرر, غير مكرر
tafashieالتفشيmotafashie, not_motafashieمتفشي, غير متفشي
istitalaالاستطالةmostateel, not_mostateelمستطيل, غير مستطيل
ghonnaالغنةmaghnoon, not_maghnoonمغنون, غير مغنون