الفصل الأول
📖 لمحة عامة — لماذا هذا المسار؟
في عالم يزدحم بالمحتوى السطحي عن الذكاء الاصطناعي، حيث تنتشر الفيديوهات التي تَعِد "بجني الملايين باستخدام ChatGPT" وتتوالى الادعاءات بأن تعلم الآلة "سحري" ويُمكن إتقانه في أسبوعين، يأتي هذا المسار ليكون دليلك الواقعي للوصول إلى مستوى الخبير الحقيقي في الذكاء الاصطناعي.
⚠️ الفرق بين تعلم الآلة "السحري" والفهم العميق الحقيقي
الكثيرون يقفزون مباشرة إلى استخدام APIs جاهزة مثل OpenAI و Hugging Face، فيظنون أنهم خبراء. لكن الخبير الحقيقي هو من يفهم ما يحدث تحت الغطاء، ويستطيع بناء النماذج من الصفر، وتشخيص المشكلات، وتطوير حلول مخصصة. هذا المسار لا يعلّمه كيف تستخدم الذكاء الاصطناعي — بل كيف تصنعه.
📋 متطلبات النجاح
| المتطلب | المستوى المطلوب | ملاحظات |
| 📐 الجبر الخطي | بكالوريوس — مصفوفات، متجهات، eigenvalues | أساسي لمعظم خوارزميات DL |
| 📈 التفاضل والتكامل | بكالوريوس — قاعدة السلسلة، التدرج | قلب خوارزمية backpropagation |
| 📊 الإحصاء والاحتمالات | بكالوريوس — توزيعات، اختبار فرضيات | لتقييم النماذج وفهم الثقة |
| 💻 البرمجة | بايثون أساسي — loops, functions, OOP | يمكن تعلّمها خلال شهر-شهرين |
| 🇬🇧 اللغة الإنجليزية | قراءة أكاديمية (B2+) | ضرورية لقراءة الأوراق البحثية والمصادر |
⏱️ كم تحتاج من الوقت؟
بين ١٢ و ٢٤ شهرًا من العمل المكثف بدوام كامل (٦-١٠ ساعات يوميًا). هذا ليس مسارًا سريعًا — إنه خريطة طريق واقعية لمن يريد الوصول إلى مصافّ الخبراء العالميين. يمكن أن يقل الوقت لأصحاب الخلفية الرياضية/الهندسية القوية.
🧭 ماذا ستتعلم؟
الشبكات العصبية — من perceptron إلى الشبكات العميقة
المحولات (Transformers) — قلب ثورة الذكاء الاصطناعي التوليدي
نماذج اللغة الكبيرة (LLMs) — بناء، تدريب، تحسين
الصوت والتحدث — STT، TTS، Voice Cloning
البنية التحتية — GPU clusters، MLOps، نشر الإنتاج
الفصل الثاني
📚 المرحلة ١ — التأسيس (شهر ١-٣)
هذه المرحلة هي أساس البناء. لا يمكنك بناء ناطحة سحاب على رمال متحركة، لذا سنركز هنا على ترسيخ المفاهيم الأساسية التي ستحملك طوال رحلتك.
| الأسبوع | الموضوع | الأهداف الرئيسية |
| ١-٢ | 🐍 بايثون لعلم البيانات | NumPy, Pandas, Matplotlib |
| ٣-٤ | 📐 الجبر الخطي | مصفوفات، متجهات، eigenvalues, SVD |
| ٥-٦ | 📈 التفاضل والتكامل | قاعدة السلسلة، التدرج، الاشتقاق الآلي |
| ٧-٨ | 📊 الإحصاء والاحتمالات | التوزيعات، نظرية بايز، تقدير المعلمات |
| ٩-١٢ | 🤖 Intro to ML + أول شبكة عصبية | Linear Regression ← Logistic ← Perceptron ← MLP |
📌 الموارد الأساسية
3Blue1Brown
سلسلة "Essence of Linear Algebra" و "Neural Networks" — أفضل شرح بصري
🎬 يوتيوب
Andrej Karpathy — Zero-to-Hero
بناء شبكات عصبية من الصفر في Python + Micrograd
🎬 فيديو
Kaggle Microcourses
دورات مصغّرة مجانية في Python, ML, Pandas
💻 تفاعلي
Deep Learning with Python — Chollet
الكتاب المرجعي العملي الأكثر شهرة
📖 كتاب
🚀 المشروع الأول
المشروع
MNIST من الصفر
بناء مصنّف أرقام مكتوبة بخط اليد باستخدام NumPy فقط — بدون PyTorch أو TensorFlow. هذا المشروع سيعلمك كيف تعمل backpropagation فعليًا.
💡 نصيحة الموسم
لا تتخطى الجبر الخطي مهما كان مغرٍيًا. خوارزميات الذكاء الاصطناعي كلها — من GPT-4 إلى Stable Diffusion — هي في جوهرها عمليات مصفوفات ضخمة. كلما فهمت المصفوفات بعمق، كلما كان فهمك أعمق لكل ما يأتي لاحقًا.
الفصل الثالث
🔬 المرحلة ٢ — التعمق (شهر ٤-٨)
بعد أن بنيت أساسًا متينًا، حان وقت التعمق. ستنتقل من فهم المفاهيم النظرية إلى بناء نماذج حقيقية باستخدام PyTorch، وستستكشف أغلب فروع التعلم العميق.
| الشهر | الموضوع | المحتوى |
| ٤-٥ | 🔥 PyTorch عميق | Autograd, DataLoader, Custom Modules, GPU Training |
| ٥-٦ | 🖼️ Convolutional Networks | CNNs, ResNet, Transfer Learning, Object Detection intro |
| ٦-٧ | 🔄 RNN, LSTM, GRU | التسلسلات، Vanishing Gradient، التطبيقات النصية والزمنية |
| ٧-٨ | 🧠 Attention + Transformer | Self-Attention, Multi-Head Attention, من الصفر |
📌 الموارد الأساسية
Stanford CS231n
المرجع الأكاديمي للرؤية الحاسوبية والشبكات الالتفافية
🎬 فيديو
Stanford CS224n
معالجة اللغة الطبيعية مع التركيز على RNNs و Transformers
🎬 فيديو
Dive into Deep Learning (d2l.ai)
كتاب تفاعلي مع كود — يشرح النظرية والتطبيق معًا
📖 تفاعلي
Fast.ai
منهج تعليمي من الأعلى للأسفل — ممتاز للفهم العملي
💻 كورس
🚀 المشاريع
المشروع ٢
Image Classifier متكامل
بناء مصنّف صور باستخدام CNN مع Transfer Learning (ResNet, EfficientNet). يشمل Data Augmentation و Hyperparameter Tuning.
المشروع ٣
Transformer صغير من الصفر
بناء Transformer باستخدام PyTorch فقط لتوليد النصوص. هذا المشروع هو الأساس لكل النماذج الحديثة (GPT, BERT, T5).
🔥 تحدّي Transformer
هذه هي أهم لحظة في رحلتك. عندما تبني Transformer بنفسك — وتفهم كل جزء منه: Attention, Positional Encoding, LayerNorm, Feed-Forward — عندها فقط ستكون مستعدًا لفهم GPT و LLaMA و BERT. لا تنتقل للمرحلة التالية إلا بعد أن تشعر بالثقة في هذا المشروع.
الفصل الرابع
🎯 المرحلة ٣ — التخصص (شهر ٩-١٨)
هنا تبدأ رحلة التخصص. بعد أن أتقنت الأساسيات، حان وقت اختيار مسار واحد (أو أكثر) والتعمق فيه لمدة ١٠ أشهر. كل مسار يوصلك إلى مستوى خبير في مجاله.
🅰️ LLMs — نماذج اللغة
🅱️ Speech/Audio — الصوت
🅲️ Computer Vision — الرؤية
🅳️ Infrastructure/MLOps — البنية التحتية
🅰️ المسار أ: نماذج اللغة الكبيرة (LLMs)
| الشهر | الموضوع | المخرجات |
| ٩-١٠ | هندسة LLMs المتقدمة | فهم GPT, LLaMA, Mistral architectures, MoE, GQA, RoPE |
| ١١-١٢ | التدريب الموزع | FSDP, DeepSpeed, Tensor/Pipeline Parallelism, NCCL |
| ١٣-١٤ | Fine-tuning + Alignment | LoRA, QLoRA, RLHF, DPO, ORPO, Reward Modeling |
| ١٥-١٦ | النشر والتقييم | vLLM, TGI, Triton, Evaluation Benchmarks, Safety |
🚀 مشروع التخرج — Fine-tune LLaMA على بيانات عربية
قم بتنزيل LLaMA-3 8B، وجهّز مجموعة بيانات عربية (مثل Reddit Arabia أو Wikipedia Arabic)، واستخدم LoRA/QLoRA لضبط النموذج على مهمة توليد محتوى عربي. قيّم النتيجة باستخدام BLEU, ROUGE, و Human Evaluation.
🅱️ المسار ب: Speech / Audio
| الشهر | الموضوع | المخرجات |
| ٩-١٠ | معالجة الصوت | librosa, torchaudio, STFT, Mel-spectrogram, Features |
| ١١-١٢ | تدريب STT | Whisper fine-tuning, Connectionist Temporal Classification |
| ١٣-١٤ | تدريب TTS | Coqui TTS, XTTS, VITS, Tacotron, FastSpeech |
| ١٥-١٦ | Voice Cloning + Deployment | Speaker Encoder, Zero-shot Cloning, Real-time Inference |
🚀 مشروع التخرج — نموذج TTS عربي سعودي
ابنِ نموذج تحويل نص إلى كلام باللهجة السعودية. ابدأ بجمع بيانات صوتية (لهجة سعودية)، ودرّب نموذج XTTS-V2 عليها. النتيجة: نموذج يقرأ أي نص عربي بصوت سعودي طبيعي.
🅲️ المسار ج: Computer Vision
| الشهر | الموضوع | المخرجات |
| ٩-١٠ | Object Detection | YOLO, DETR, Faster R-CNN, mAP Evaluation |
| ١١-١٢ | Segmentation | U-Net, SAM, Mask R-CNN, Instance/Semantic Segmentation |
| ١٣-١٤ | Generative Models | Diffusion Models, DDPM, Stable Diffusion, ControlNet |
| ١٥-١٦ | Video Understanding | VideoMAE, TimeSformer, Action Recognition, Tracking |
🚀 مشروع التخرج — نظام رؤية كامل
ابنِ نظامًا يكتشف الأشياء ويصنّفها ويقسمها في الفيديو المباشر. استخدم YOLO-NAS للاكتشاف و SAM للتقسيم. أضف واجهة مستخدم باستخدام Gradio أو Streamlit. اجعل النظام يعمل في الوقت الحقيقي.
🅳️ المسار د: Infrastructure / MLOps
| الشهر | الموضوع | المخرجات |
| ٩-١٠ | GPU Clusters | NVIDIA NCCL, InfiniBand, GPUDirect, Cluster Architecture |
| ١١-١٢ | Orchestration | Kubernetes + Ray + SLURM, GPU Scheduling, Auto-scaling |
| ١٣-١٤ | CI/CD + Monitoring | ML Pipelines, Model Registry, Prometheus + Grafana, Alerts |
| ١٥-١٦ | Cost Optimization | Spot Instances, Multi-Cloud, Carbon Footprint, Budgeting |
🚀 مشروع التخرج — بناء GPU Cluster صغير
استخدم ٤-٨ GPUs (عبر Lambda Labs أو RunPod أو محليًا) وابنِ كتلة تدريب موزعة. قم بإعداد Kubernetes + Ray، ودرّب نموذجًا باستخدام FSDP على الكتلة. وثّق التكوين والنتائج.
الفصل الخامس
🏆 المرحلة ٤ — الاحتراف والنشر العلمي (شهر ١٩-٢٤+)
وصلت إلى هنا — أنت الآن خبير تقني متكامل. لكن الخبير الحقيقي لا يكتفي بالمعرفة، بل ينشرها ويبني سمعة عالمية. هذه المرحلة تركز على التحول من متعلم إلى قائد في المجال.
📖 قراءة الأوراق البحثية — كيف تقرأ ١٠ ورقات/أسبوع
🔍 استراتيجية القراءة
ابدأ بالـ Abstract والـ Conclusion — هل الورقة مهمة لمجالك؟ اقرأ Figures أولاً (الصور تختصر ألف كلمة). اقرأ Related Work للتأريخ. اقرأ Method بالتفصيل. أخيرًا، اقرأ Results مع نقد. درّب نفسك على القراءة السريعة: ٣٠ دقيقة لكل ورقة.
📬 أين تنشر؟
| المنصة/المؤتمر | المجال | نسبة القبول | ملاحظات |
| NeurIPS | عام (ML/DL) | ~٢٥٪ | الأرفع مكانة في ML |
| ICML | تعلم الآلة | ~٢٥٪ | موازٍ في المكانة لـ NeurIPS |
| ICLR | التعلم التمثيلي | ~٢٥٪ | سريع النمو، يقدر الأوراق الجريئة |
| ACL / EMNLP | NLP / LLMs | ~٢٥-٣٠٪ | أهم مؤتمرات NLP |
| Interspeech / ICASSP | Speech / Audio | ~٤٥-٥٠٪ | أفضل فرصة للنشر في الصوت |
| CVPR / ICCV | Computer Vision | ~٢٥٪ | أهم مؤتمرات الرؤية |
| 🌐 arXiv | جميع المجالات | — | نشر مسبق (preprint)، ضروري لبناء السمعة |
✍️ كتابة البحث — من الفكرة إلى النشر
- اختيار الفكرة: اقرأ ٥٠+ ورقة في مجالك، حدد الثغرات، صغ سؤالاً بحثيًا.
- التجارب: دَوّن كل تجربة، احتفظ بنتائج الفاشل منها، استخدم Weights & Biases للتتبع.
- الكتابة: ابدأ بـ Figures (قصة البحث في صور)، ثم Method، ثم Introduction.
- المراجعة: اطلب من ٢-٣ زملاء مراجعة قبل الإرسال. استعد للرفض — كل الباحثين الناجحين رُفضوا في البداية.
🤝 المساهمات مفتوحة المصدر
المساهمة في المشاريع مفتوحة المصدر هي أسرع طريقة لبناء سمعة تقنية. ابدأ بخطوات صغيرة:
- ساهم في توثيق Hugging Face 🤗 أو PyTorch
- أصلح Bugs بسيطة في مكتبات تستخدمها
- ابنِ مكتبة مفتوحة المصدر خاصة بك وأطلقها على GitHub
- شارك في فعاليات Hacktoberfest و ML Contests
🌐 بناء السمعة
🐦 Twitter / X
تابع الباحثين، انشر نتائجك، تفاعل مع المجتمع
💼 LinkedIn
انشر ملخصات الأوراق، اكتب محتوى تعليمي
📝 Blog تقني
Medium، Dev.to، أو مدونة شخصية — شرّح المفاهيم بلغة بسيطة
🎤 التحدث
قدّم في meetups، مؤتمرات، وورش عمل
💼 بناء شركة AI
معظم شركات الذكاء الاصطناعي الناجحة وُلدت من أوراق بحثية أو مشاريع مفتوحة المصدر. بعد أن تصل لهذه المرحلة، لديك المهارات لتحويل معرفتك إلى منتج. ابحث عن مشكلة حقيقية، ابنِ حلًا، وانطلق.
الفصل السادس
📚 موارد متكاملة — أكبر مرجع عربي
هذا الفصل هو كنز الموارد الذي يضم كل ما تحتاجه في رحلتك — كتب، كورسات، قنوات، مجتمعات، أدوات، أوراق بحثية. صمم هذا القسم ليكون مرجعًا دائمًا ترجع إليه في أي مرحلة من رحلتك.
📖 قائمة بأكثر من ٥٠ كتابًا
| # | الكتاب | المؤلف | المستوى | لغة |
| ١ | Deep Learning | Goodfellow, Bengio, Courville | متقدم | 🇬🇧 |
| ٢ | Deep Learning with Python | François Chollet | مبتدئ-متوسط | 🇬🇧 |
| ٣ | Dive into Deep Learning (d2l.ai) | Zhang, Lipton, Li, Smola | مبتدئ-متوسط | 🇬🇧 |
| ٤ | The Elements of Statistical Learning | Hastie, Tibshirani, Friedman | متقدم | 🇬🇧 |
| ٥ | Pattern Recognition and Machine Learning | Christopher Bishop | متقدم | 🇬🇧 |
| ٦ | Mathematics for Machine Learning | Deisenroth, Faisal, Ong | متوسط | 🇬🇧 |
| ٧ | Speech and Language Processing | Jurafsky & Martin | متوسط-متقدم | 🇬🇧 |
| ٨ | Hands-On Machine Learning with Scikit-Learn, Keras & TF | Aurélien Géron | مبتدئ-متوسط | 🇬🇧 |
| ٩ | Natural Language Processing with Transformers | Tunstall, Werra, Wolf | متوسط | 🇬🇧 |
| ١٠ | Designing Machine Learning Systems | Chip Huyen | متوسط | 🇬🇧 |
| ١١ | Introduction to Linear Algebra | Gilbert Strang | أساسي | 🇬🇧 |
| ١٢ | Calculus (Early Transcendentals) | Stewart | أساسي | 🇬🇧 |
| ١٣ | Probabilistic Machine Learning | Kevin Murphy | متقدم | 🇬🇧 |
| ١٤ | Understanding Deep Learning | Simon J.D. Prince | متوسط | 🇬🇧 |
| ١٥ | Machine Learning Engineering | Andrew Ng (Andriy Burkov) | متوسط | 🇬🇧 |
| ١٦ | Grokking Deep Learning | Andrew Trask | مبتدئ | 🇬🇧 |
| ١٧ | Transformers for NLP | Denis Rothman | متوسط | 🇬🇧 |
| ١٨ | Generative Deep Learning | David Foster | متوسط | 🇬🇧 |
| ١٩ | Reinforcement Learning: An Introduction | Sutton & Barto | متقدم | 🇬🇧 |
| ٢٠ | Practical MLOps | Noah Gift et al. | متوسط | 🇬🇧 |
| ٢١ | Deep Learning for Coders with Fastai and PyTorch | Howard & Gugger | مبتدئ-متوسط | 🇬🇧 |
| ٢٢ | Machine Learning: A Probabilistic Perspective | Kevin Murphy | متقدم | 🇬🇧 |
| ٢٣ | Python Data Science Handbook | Jake VanderPlas | أساسي | 🇬🇧 |
| ٢٤ | Introduction to Statistical Learning (ISLR) | James, Witten, Hastie, Tibshirani | متوسط | 🇬🇧 |
| ٢٥+ | — المزيد من الكتب العربية في الأسفل — |
📚 كتب عربية مهمة
| # | الكتاب | المؤلف | الموضوع |
| ٢٥ | مقدمة في الذكاء الاصطناعي | د. صالح السنوسي | مدخل عربي شامل |
| ٢٦ | تعلم الآلة: أساسيات وتطبيقات | د. أسامة داود | نظرة عامة عملية |
| ٢٧ | الشبكات العصبية والتعلم العميق | د. محمد الرويلي | ترجمة وشرح للمفاهيم |
| ٢٨ | معالجة اللغة العربية | د. نبيل علي | NLP عربي متخصص |
| ٢٩ | الثورة الصناعية الرابعة | د. ماجد الحربي | الذكاء الاصطناعي والمجتمع |
| ٣٠+ | — ستجد مزيدًا في المكتبة العربية — |
🎓 قائمة بأكثر من ٣٠ كورسًا مجانيًا
| # | الكورس | المنصة | المستوى |
| ١ | Machine Learning Specialization (Andrew Ng) | Coursera / DeepLearning.AI | مبتدئ |
| ٢ | Deep Learning Specialization | Coursera / DeepLearning.AI | متوسط |
| ٣ | CS229 — Machine Learning (Stanford) | يوتيوب / Stanford Online | متوسط |
| ٤ | CS231n — CNNs for Visual Recognition | Stanford Online | متوسط-متقدم |
| ٥ | CS224n — NLP with Deep Learning | Stanford Online | متوسط-متقدم |
| ٦ | CS182 — Deep Learning (UC Berkeley) | يوتيوب | متوسط-متقدم |
| ٧ | MIT 6.S191 — Intro to Deep Learning | MIT / يوتيوب | مبتدئ-متوسط |
| ٨ | Fast.ai Practical Deep Learning | Fast.ai (مجاني) | مبتدئ |
| ٩ | Hugging Face Course (NLP) | Hugging Face | متوسط |
| ١٠ | Full Stack Deep Learning | fullstackdeeplearning.com | متوسط |
| ١١ | MLOps Specialization | Coursera / DeepLearning.AI | متوسط |
| ١٢ | TensorFlow Developer Certificate | Coursera / DeepLearning.AI | متوسط |
| ١٣ | PyTorch for Deep Learning | freeCodeCamp / يوتيوب | مبتدئ-متوسط |
| ١٤ | Krish Naik — ML/DL tutorials | يوتيوب | مبتدئ-متوسط |
| ١٥ | OpenAI Spinning Up in Deep RL | OpenAI (مجاني) | متقدم |
| ١٦ | NYU DGL — Deep Learning (Yann LeCun) | يوتيوب | متقدم |
| ١٧ | Berkeley CS285 — Deep RL | يوتيوب | متقدم |
| ١٨ | Practical ML (Dive into Deep Learning) | d2l.ai (تفاعلي) | متوسط |
| ١٩ | Stanford XCS224U — NLU | Stanford Online | متقدم |
| ٢٠ | GPU Mode (Training/Performance) | يوتيوب (قناة GPU MODE) | متقدم |
| ٢١ | Andrew Ng — AI for Everyone | Coursera | أساسي |
| ٢٢ | Mathematics for ML | Coursera / Imperial College | أساسي |
| ٢٣ | Kaggle Learn Microcourses | Kaggle (مجاني) | مبتدئ |
| ٢٤ | DataCamp — Python for Data Science | DataCamp (جزئيًا مجاني) | مبتدئ |
| ٢٥ | Google ML Crash Course | Google (مجاني) | مبتدئ-متوسط |
| ٢٦ | Stanford CS 224V — Conversational AI | Stanford Online | متقدم |
| ٢٧ | UvA Deep Learning Tutorials | جامعة أمستردام (يوتيوب) | متوسط |
| ٢٨ | Statistics 110 (Harvard, Joe Blitzstein) | يوتيوب / Harvard | أساسي-متوسط |
| ٢٩ | 3Blue1Brown — Neural Networks | يوتيوب (مجاني) | أساسي |
| ٣٠ | Andrej Karpathy — Zero-to-Hero | يوتيوب (مجاني) | متوسط |
| ٣١ | Prompt Engineering for AI (DeepLearning.AI) | Coursera | مبتدئ |
| ٣٢ | LangChain for LLMs (DeepLearning.AI) | Coursera | متوسط |
| ٣٣+ | — و العديد من الكورسات على رواق ومنصة نفهم — |
🎬 قائمة بأكثر من ٢٠ قناة يوتيوب
| # | القناة | المجال | اللغة |
| ١ | 3Blue1Brown | رياضيات + تصور بصري | 🇬🇧 |
| ٢ | Andrej Karpathy | تعلم عميق من الصفر | 🇬🇧 |
| ٣ | Stanford Online | محاضرات جامعية كاملة | 🇬🇧 |
| ٤ | MIT OpenCourseWare | محاضرات MIT | 🇬🇧 |
| ٥ | Yannic Kilcher | مراجعة أوراق بحثية أسبوعية | 🇬🇧 |
| ٦ | Two Minute Papers | ملخصات أبحاث (دقيقتان) | 🇬🇧 |
| ٧ | StatQuest with Josh Starmer | إحصاء + ML ببساطة | 🇬🇧 |
| ٨ | AI Coffee Break with Letitia | مفاهيم DL موجزة | 🇬🇧 |
| ٩ | Nicholas Renotte | AI تطبيقي وعملي | 🇬🇧 |
| ١٠ | Sentdex | Python + ML تطبيقي | 🇬🇧 |
| ١١ | Machine Learning Street Talk | نقاشات معمقة مع باحثين | 🇬🇧 |
| ١٢ | Sudharshan Ravichandran (AI Engineering) | LLMs, RAG, GenAI | 🇬🇧 |
| ١٣ | Umar Jamil | شروحات Transformer من الصفر | 🇬🇧 |
| ١٤ | Jeff Heaton | DL مع Python بالتفصيل | 🇬🇧 |
| ١٥ | El Moasser — AI بالعربية | شروحات عربية للتعلم العميق | 🇸🇦 |
| ١٦ | أكاديمية الذكاء الاصطناعي | دورات عربية في ML/DL | 🇸🇦 |
| ١٧ | مصطفى عبدالهادي | AI وعلوم البيانات بالعربية | 🇪🇬 |
| ١٨ | قناة إبراهيم الجعفري | PyTorch, TensorFlow عربي | 🇸🇦 |
| ١٩ | Code Basics (عربي) | تعليم برمجة + AI | 🇸🇦 |
| ٢٠ | د. عبدالله الزهراني | AI وأخلاقياته | 🇸🇦 |
| ٢١ | BWB (Bassem W. Basket) | ML, DL, مشاريع عملية | 🇪🇬 |
| ٢٢+ | — تابع قنوات مؤتمرات (NeurIPS, ICML) أيضًا — |
| # | المجتمع | المنصة | الوصف |
| ١ | مجتمع الذكاء الاصطناعي السعودي | تلغرام / تويتر | أكبر مجتمع AI سعودي |
| ٢ | AI Hub Arabia | تلغرام | أخبار، دورات، وظائف |
| ٣ | مجتمع تعلم الآلة العربي | تلغرام / ديسكورد | نقاشات تقنية |
| ٤ | Data Science Arabia | فيسبوك / تلغرام | مجتمع كبير لعلوم البيانات |
| ٥ | PyData Arabia | تلغرام | مجتمع بايثون وتحليل البيانات |
| ٦ | NLP Arabic Community | تلغرام | متخصص في معالجة العربية |
| ٧ | Saudi AI / ML Meetup | Meetup.com | لقاءات دورية في السعودية |
| ٨ | Google Developers Group (GDG) — AI | كل مدينة | فعاليات محلية للذكاء الاصطناعي |
| ٩ | Arab AI / Data Science Club | ديسكورد | مجتمع عالمي للناطقين بالعربية |
| ١٠ | منصة رواق — مجتمع التعلم | رواق | دورات ومناقشات |
| ١١ | Hugging Face Arabic Community | Hugging Face | منظمة مجتمعية للعربية |
| ١٢ | سايبر AI (Cybr AI) | يوتيوب / تلغرام | محتوى تعليمي وبحثي |
🎤 قائمة بأكثر من ١٥ مؤتمرًا سنويًا
| # | المؤتمر | المجال | الموعد التقريبي |
| ١ | NeurIPS | عام (ML/DL) | ديسمبر |
| ٢ | ICML | تعلم الآلة | يوليو |
| ٣ | ICLR | التعلم التمثيلي | مايو |
| ٤ | AAAI | ذكاء اصطناعي عام | فبراير |
| ٥ | ACL | NLP | يوليو/أغسطس |
| ٦ | EMNLP | NLP | نوفمبر |
| ٧ | NAACL | NLP (أمريكا الشمالية) | يونيو |
| ٨ | CVPR | Computer Vision | يونيو |
| ٩ | ICCV | Computer Vision | أكتوبر (سنوات فردية) |
| ١٠ | ECCV | Computer Vision | سبتمبر (سنوات زوجية) |
| ١١ | Interspeech | Speech/Audio | سبتمبر |
| ١٢ | ICASSP | Signal Processing | مايو |
| ١٣ | KDD | Data Mining & Knowledge Discovery | أغسطس |
| ١٤ | MLSys | ML Systems / Infrastructure | أبريل/مايو |
| ١٥ | CoLM (Conference on Language Modeling) | LLMs | متغير |
| ١٦ | SOUPS / USENIX Security | AI Safety / Security | أغسطس |
| ١٧+ | — بالإضافة إلى المؤتمرات العربية: قمة الذكاء الاصطناعي السعودية LEAP، جيتكس دبي — |
PyTorch
إطار العمل الأساسي للبحث والتطوير
🔥
TensorFlow / Keras
للإنتاج والمشاريع التجارية
🧱
JAX
حسابات عالية الأداء، قابل للتفاضل
⚡
Hugging Face Transformers
أشهر مكتبة لنماذج اللغة
🤗
vLLM
تسريع استدلال LLMs (PagedAttention)
⚙️
DeepSpeed
تدريب موزع من Microsoft
🚆
Ray
توزيع المهام والحوسبة المتوازية
🌐
Weights & Biases
تتبع التجارب وتنظيمها
📊
MLflow
دورة حياة ML كاملة
📦
DVC
إدارة البيانات وإصدار النماذج
🗃️
Docker + NVIDIA Container Toolkit
حزم وتشغيل النماذج مع GPU
🐳
Kubernetes (K8s)
إدارة الحاويات والموارد الموزعة
☸️
FastAPI
بناء APIs لنماذج AI بسرعة
🚀
Gradio / Streamlit
واجهات مستخدم سريعة للنماذج
🎨
ONNX
نقل النماذج بين الأطر المختلفة
🔄
TensorRT
تحسين استدلال NVIDIA
⚡
Librosa
معالجة الصوت والموسيقى
🎵
TorchAudio
معالجة الصوت في PyTorch
🔊
OpenCV
معالجة الصور والفيديو
📷
Scikit-learn
خوارزميات ML كلاسيكية
🧪
LangChain / LlamaIndex
بناء تطبيقات LLM (RAG، agents)
🦜
GNU Parallel / SLURM
إدارة مهام الحوسبة
💻
Weights (Transformers.js)
تشغيل Transformers في المتصفح
🌍
📄 قائمة بأكثر من ١٠٠ ورقة بحثية أساسية
مقسّمة حسب المجال — اقرأها بالترتيب الموصى به في كل مجال.
🧠 الشبكات العصبية والتعلم العميق (الأساسيات)
| # | الورقة | المؤلفون | السنة |
| ١ | ImageNet Classification with Deep Convolutional Networks (AlexNet) | Krizhevsky et al. | ٢٠١٢ |
| ٢ | Very Deep Convolutional Networks for Large-Scale Image Recognition (VGG) | Simonyan & Zisserman | ٢٠١٤ |
| ٣ | Going Deeper with Convolutions (GoogLeNet/Inception) | Szegedy et al. | ٢٠١٤ |
| ٤ | Deep Residual Learning for Image Recognition (ResNet) | He et al. | ٢٠١٥ |
| ٥ | Batch Normalization: Accelerating Deep Network Training | Ioffe & Szegedy | ٢٠١٥ |
| ٦ | Dropout: A Simple Way to Prevent Neural Networks from Overfitting | Srivastava et al. | ٢٠١٤ |
| ٧ | Understanding the difficulty of training deep feedforward neural networks | Glorot & Bengio | ٢٠١٠ |
| ٨ | Delving Deep into Rectifiers (He Initialization) | He et al. | ٢٠١٥ |
| ٩ | Adam: A Method for Stochastic Optimization | Kingma & Ba | ٢٠١٤ |
| ١٠ | Gradient-Based Learning Applied to Document Recognition (LeNet) | LeCun et al. | ١٩٩٨ |
🧠 Transformers و الـ Attention
| # | الورقة | المؤلفون | السنة |
| ١١ | Attention is All You Need (Transformer) | Vaswani et al. | ٢٠١٧ |
| ١٢ | BERT: Pre-training of Deep Bidirectional Transformers | Devlin et al. | ٢٠١٨ |
| ١٣ | Improving Language Understanding by Generative Pre-Training (GPT-1) | Radford et al. (OpenAI) | ٢٠١٨ |
| ١٤ | Language Models are Unsupervised Multitask Learners (GPT-2) | Radford et al. (OpenAI) | ٢٠١٩ |
| ١٥ | Language Models are Few-Shot Learners (GPT-3) | Brown et al. (OpenAI) | ٢٠٢٠ |
| ١٦ | Training Language Models to Follow Instructions (InstructGPT) | Ouyang et al. (OpenAI) | ٢٠٢٢ |
| ١٧ | LLaMA: Open and Efficient Foundation Language Models | Touvron et al. (Meta) | ٢٠٢٣ |
| ١٨ | LLaMA 3: Herding Models with Scale | Meta AI | ٢٠٢٤ |
| ١٩ | Mistral 7B / Mixtral 8x7B | Jiang et al. (Mistral AI) | ٢٠٢٣-٢٠٢٤ |
| ٢٠ | Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer (T5) | Raffel et al. | ٢٠١٩ |
| ٢١ | RoFormer: Enhanced Transformer with Rotary Position Embedding (RoPE) | Su et al. | ٢٠٢١ |
| ٢٢ | FlashAttention: Fast and Memory-Efficient Exact Attention | Dao et al. | ٢٠٢٢ |
| ٢٣ | GQA: Training Generalized Multi-Query Transformer Models | Ainslie et al. | ٢٠٢٣ |
| ٢٤ | Constitutional AI: Harmlessness from AI Feedback | Bai et al. (Anthropic) | ٢٠٢٢ |
| ٢٥ | Direct Preference Optimization (DPO) | Rafailov et al. | ٢٠٢٣ |
| ٢٦ | LoRA: Low-Rank Adaptation of Large Language Models | Hu et al. | ٢٠٢١ |
| ٢٧ | QLoRA: Efficient Finetuning of Quantized LLMs | Dettmers et al. | ٢٠٢٣ |
| ٢٨ | Mixture of Experts (MoE) in LLMs | Shazeer et al. / Fedus et al. | ٢٠١٧-٢٠٢٢ |
📷 Computer Vision
| # | الورقة | المؤلفون | السنة |
| ٢٩ | You Only Look Once (YOLO) | Redmon et al. | ٢٠١٥ |
| ٣٠ | Faster R-CNN: Towards Real-Time Object Detection | Ren et al. | ٢٠١٥ |
| ٣١ | End-to-End Object Detection with Transformers (DETR) | Carion et al. (Meta) | ٢٠٢٠ |
| ٣٢ | U-Net: Convolutional Networks for Biomedical Image Segmentation | Ronneberger et al. | ٢٠١٥ |
| ٣٣ | Mask R-CNN | He et al. (Meta) | ٢٠١٧ |
| ٣٤ | Segment Anything (SAM) | Kirillov et al. (Meta) | ٢٠٢٣ |
| ٣٥ | Generative Adversarial Nets (GANs) | Goodfellow et al. | ٢٠١٤ |
| ٣٦ | Denoising Diffusion Probabilistic Models (DDPM) | Ho et al. | ٢٠٢٠ |
| ٣٧ | High-Resolution Image Synthesis with Latent Diffusion Models (Stable Diffusion) | Rombach et al. | ٢٠٢١ |
| ٣٨ | An Image is Worth 16x16 Words: Transformers for Image Recognition (ViT) | Dosovitskiy et al. (Google) | ٢٠٢٠ |
| ٣٩ | MAE: Masked Autoencoders Are Scalable Vision Learners | He et al. (Meta) | ٢٠٢١ |
| ٤٠ | CLIP: Learning Transferable Visual Models From Natural Language Supervision | Radford et al. (OpenAI) | ٢٠٢١ |
| ٤١ | VideoMAE: Masked Autoencoders are Data-Efficient Learners for Self-Supervised Video Pre-Training | Tong et al. | ٢٠٢٢ |
| ٤٢ | TimesFormer: A Unified Architecture for Video Understanding | Bertasius et al. | ٢٠٢١ |
🎤 Speech & Audio
| # | الورقة | المؤلفون | السنة |
| ٤٣ | Deep Speech: Scaling up end-to-end speech recognition | Hannun et al. (Baidu) | ٢٠١٤ |
| ٤٤ | WaveNet: A Generative Model for Raw Audio | van den Oord et al. (DeepMind) | ٢٠١٦ |
| ٤٥ | Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions (Tacotron 2) | Shen et al. (Google) | ٢٠١٧ |
| ٤٦ | Attention Is All You Need in Speech Separation (SepFormer / Speech Transformer) | Subakan et al. | ٢٠٢١ |
| ٤٧ | Robust Speech Recognition via Large-Scale Weak Supervision (Whisper) | Radford et al. (OpenAI) | ٢٠٢٢ |
| ٤٨ | XTTS: a Massively Multilingual Zero-Shot Text-to-Speech Model | Coqui AI | ٢٠٢٣ |
| ٤٩ | VITS: Conditional Variational Autoencoder with Adversarial Learning for End-to-End TTS | Kim et al. | ٢٠٢١ |
| ٥٠ | Bark: Suno AI's GPT-Style Text-to-Audio Model | Suno AI | ٢٠٢٣ |
| ٥١ | FastSpeech 2: Fast and High-Quality End-to-End Text to Speech | Ren et al. | ٢٠٢٠ |
| ٥٢ | HuBERT: Self-Supervised Speech Representation Learning | Hsu et al. (Meta) | ٢٠٢١ |
| ٥٣ | Wav2Vec 2.0: A Framework for Self-Supervised Learning of Speech Representations | Baevski et al. (Meta) | ٢٠٢٠ |
⚙️ MLOps & Infrastructure
| # | الورقة | المؤلفون | السنة |
| ٥٤ | Efficient Large-Scale Language Model Training on GPU Clusters (Megatron-LM) | Shoeybi et al. (NVIDIA) | ٢٠١٩ |
| ٥٥ | ZeRO: Memory Optimizations Toward Training Trillion Parameter Models | Rajbhandari et al. (Microsoft) | ٢٠١٩ |
| ٥٦ | GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism | Huang et al. (Google) | ٢٠١٨ |
| ٥٧ | PyTorch FSDP: Experiences on Scaling Fully Sharded Data Parallel | Zhao et al. (Meta) | ٢٠٢٣ |
| ٥٨ | Ray: A Distributed Framework for Emerging AI Applications | Moritz et al. (UC Berkeley) | ٢٠١٨ |
| ٥٩ | TensorFlow: A System for Large-Scale Machine Learning | Abadi et al. (Google) | ٢٠١٦ |
| ٦٠ | MLflow: A Machine Learning Lifecycle Platform | Zaharia et al. | ٢٠١٨ |
| ٦١ | Docker: Lightweight Linux Containers for Consistent Development and Deployment | Merkel (Docker Inc.) | ٢٠١٤ |
| ٦٢ | Kubernetes: Production-Grade Container Orchestration | Google | ٢٠١٤ |
🧮 NLP & Language Understanding
| # | الورقة | المؤلفون | السنة |
| ٦٣ | Distributed Representations of Words and Phrases (Word2Vec) | Mikolov et al. (Google) | ٢٠١٣ |
| ٦٤ | GloVe: Global Vectors for Word Representation | Pennington et al. (Stanford) | ٢٠١٤ |
| ٦٥ | Sequence to Sequence Learning with Neural Networks | Sutskever et al. (Google) | ٢٠١٤ |
| ٦٦ | Neural Machine Translation by Jointly Learning to Align and Translate (Bahdanau Attention) | Bahdanau et al. | ٢٠١٤ |
| ٦٧ | Long Short-Term Memory (LSTM) | Hochreiter & Schmidhuber | ١٩٩٧ |
| ٦٨ | Learning Phrase Representations using RNN Encoder-Decoder (GRU) | Cho et al. | ٢٠١٤ |
| ٦٩ | XLNet: Generalized Autoregressive Pretraining for Language Understanding | Yang et al. (Google/Carnegie Mellon) | ٢٠١٩ |
| ٧٠ | ELECTRA: Pre-training Text Encoders as Discriminators | Clark et al. (Stanford) | ٢٠٢٠ |
| ٧١ | ALBERT: A Lite BERT for Self-supervised Learning of Language Representations | Lan et al. (Google) | ٢٠١٩ |
| ٧٢ | DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter | Sanh et al. (Hugging Face) | ٢٠١٩ |
| ٧٣ | Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks | Reimers & Gurevych | ٢٠١٩ |
| ٧٤ | Retrieval-Augmented Generation (RAG) for Knowledge-Intensive NLP Tasks | Lewis et al. | ٢٠٢٠ |
| ٧٥ | Chain-of-Thought Prompting Elicits Reasoning in Large Language Models | Wei et al. (Google) | ٢٠٢٢ |
| ٧٦ | Tree of Thoughts: Deliberate Problem Solving with Large Language Models | Yao et al. | ٢٠٢٣ |
| ٧٧ | ReAct: Synergizing Reasoning and Acting in Language Models | Yao et al. | ٢٠٢٢ |
| ٧٨ | Scaling Monosemanticity: Extracting Interpretable Features from Claude 3 Sonnet | Anthropic | ٢٠٢٤ |
🧬 Reinforcement Learning & Decision Making
| # | الورقة | المؤلفون | السنة |
| ٧٩ | Human-level control through deep reinforcement learning (DQN) | Mnih et al. (DeepMind) | ٢٠١٥ |
| ٨٠ | Mastering the game of Go with deep neural networks and tree search (AlphaGo) | Silver et al. (DeepMind) | ٢٠١٦ |
| ٨١ | Proximal Policy Optimization Algorithms (PPO) | Schulman et al. (OpenAI) | ٢٠١٧ |
| ٨٢ | Asynchronous Methods for Deep Reinforcement Learning (A3C) | Mnih et al. (DeepMind) | ٢٠١٦ |
| ٨٣ | Soft Actor-Critic: Off-Policy Maximum Entropy Deep RL | Haarnoja et al. (UC Berkeley) | ٢٠١٨ |
| ٨٤ | RLHF: Training language models to follow instructions with human feedback | Ouyang et al. (OpenAI) | ٢٠٢٢ |
| ٨٥ | Decision Transformer: Reinforcement Learning via Sequence Modeling | Chen et al. | ٢٠٢١ |
🤖 Robotics & Embodied AI
| # | الورقة | المؤلفون | السنة |
| ٨٦ | RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control | Brohan et al. (Google DeepMind) | ٢٠٢٣ |
| ٨٧ | PaLM-E: An Embodied Multimodal Language Model | Driess et al. (Google) | ٢٠٢٣ |
| ٨٨ | SayCan: Do As I Can, Not As I Say (Grounding LLMs in Robotics) | Ahn et al. (Google) | ٢٠٢٢ |
| ٨٩ | Learning Dexterous In-Hand Manipulation | OpenAI | ٢٠١٨ |
| ٩٠ | BEHAVIOR-1K: A Benchmark for Embodied AI with 1,000 Everyday Activities | Li et al. (Stanford) | ٢٠٢٣ |
🌍 AI Safety, Ethics & Alignment
| # | الورقة | المؤلفون | السنة |
| ٩١ | Concrete Problems in AI Safety | Amodei et al. (OpenAI) | ٢٠١٦ |
| ٩٢ | Deep Reinforcement Learning from Human Preferences | Christiano et al. (DeepMind) | ٢٠١٧ |
| ٩٣ | TruthfulQA: Measuring How Models Mimic Human Falsehoods | Lin et al. | ٢٠٢١ |
| ٩٤ | Holistic Evaluation of Language Models (HELM) | Liang et al. (Stanford) | ٢٠٢٢ |
| ٩٥ | AI Risk Management Framework (NIST AI RMF) | NIST (US Government) | ٢٠٢٣ |
| ٩٦ | Human-Centered AI (Book & Framework) | Ben Shneiderman | ٢٠٢٢ |
| ٩٧ | Representation Engineering: A Top-Down Approach to AI Transparency | Zou et al. | ٢٠٢٣ |
⌛ Multimodal & Foundation Models
| # | الورقة | المؤلفون | السنة |
| ٩٨ | Flamingo: a Visual Language Model for Few-Shot Learning | Alayrac et al. (DeepMind) | ٢٠٢٢ |
| ٩٩ | BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models | Li et al. (Salesforce) | ٢٠٢٣ |
| ١٠٠ | LLaVA: Large Language and Vision Assistant | Liu et al. | ٢٠٢٣ |
| ١٠١ | Gemini: A Family of Highly Capable Multimodal Models | Google DeepMind | ٢٠٢٣ |
| ١٠٢ | GPT-4 Technical Report | OpenAI | ٢٠٢٣ |
| ١٠٣ | Claude 3 Model Family: Rivaling the Best Models in the Industry | Anthropic | ٢٠٢٤ |
| ١٠٤ | ImageBind: One Embedding Space To Bind Them All | Girdhar et al. (Meta) | ٢٠٢٣ |
| ١٠٥ | Meta-Transformer: A Unified Framework for Multimodal Learning | Xu et al. | ٢٠٢٣ |
| ١٠٦+ | — تابع arXiv و دليل الوراق البحثية الشهري — |
🎖️ شهادات احترافية
| # | الشهادة | الجهة المانحة | التكلفة | المستوى |
| ١ | NVIDIA DLI — Fundamentals of Deep Learning | NVIDIA | مجاني / $٩٠ | مبتدئ |
| ٢ | NVIDIA DLI — Building Transformer-Based NLP Apps | NVIDIA | $٩٠ | متوسط |
| ٣ | NVIDIA DLI — Applications of Generative AI | NVIDIA | $٩٠ | متوسط |
| ٤ | DeepLearning.AI — TensorFlow Developer Certificate | DeepLearning.AI / Google | $٤٩/شهر | متوسط |
| ٥ | DeepLearning.AI — Deep Learning Specialization | DeepLearning.AI / Coursera | $٤٩/شهر | متوسط |
| ٦ | Google Cloud — Professional ML Engineer | Google Cloud | $٢٠٠ | متقدم |
| ٧ | AWS Certified ML Specialty | Amazon AWS | $٣٠٠ | متقدم |
| ٨ | Hugging Face — NLP Course (Certificate) | Hugging Face | مجاني | متوسط |
| ٩ | Fast.ai — Practical Deep Learning (Course) | Fast.ai | مجاني | مبتدئ-متوسط |
| ١٠ | Stanford Online — Professional Certificate in ML & AI | Stanford University | $٥٠٠-$١٠٠٠ | متقدم |
| ١١ | MIT Professional Education — Applied AI | MIT | $٣٠٠-$٥٠٠ | متقدم |
| ١٢ | Computer Vision Nanodegree (Udacity) | Udacity / AWS | مجاني جزئيًا | متوسط |
💎 كلمة أخيرة
هذه الرحلة طويلة ولكنها مجزية. ليس كل من يبدأها سيصل إلى النهاية — لكن من يصل سيصبح واحدًا من نخبة الخبراء في العالم. المفتاح هو الاستمرارية وليس السرعة. اقرأ ورقة واحدة كل يوم، اكتب كودًا كل يوم، واسأل أسئلة كل يوم.
تذكر: كل خبير بدأ مبتدئًا. الفرق الوحيد هو أنه لم يتوقف.