🗺️ خارطة الطريق — من الصفر إلى الخبير

المجلد السادس
الفصل الأول

📖 لمحة عامة — لماذا هذا المسار؟

في عالم يزدحم بالمحتوى السطحي عن الذكاء الاصطناعي، حيث تنتشر الفيديوهات التي تَعِد "بجني الملايين باستخدام ChatGPT" وتتوالى الادعاءات بأن تعلم الآلة "سحري" ويُمكن إتقانه في أسبوعين، يأتي هذا المسار ليكون دليلك الواقعي للوصول إلى مستوى الخبير الحقيقي في الذكاء الاصطناعي.

⚠️ الفرق بين تعلم الآلة "السحري" والفهم العميق الحقيقي

الكثيرون يقفزون مباشرة إلى استخدام APIs جاهزة مثل OpenAI و Hugging Face، فيظنون أنهم خبراء. لكن الخبير الحقيقي هو من يفهم ما يحدث تحت الغطاء، ويستطيع بناء النماذج من الصفر، وتشخيص المشكلات، وتطوير حلول مخصصة. هذا المسار لا يعلّمه كيف تستخدم الذكاء الاصطناعي — بل كيف تصنعه.

📋 متطلبات النجاح

المتطلبالمستوى المطلوبملاحظات
📐 الجبر الخطيبكالوريوس — مصفوفات، متجهات، eigenvaluesأساسي لمعظم خوارزميات DL
📈 التفاضل والتكاملبكالوريوس — قاعدة السلسلة، التدرجقلب خوارزمية backpropagation
📊 الإحصاء والاحتمالاتبكالوريوس — توزيعات، اختبار فرضياتلتقييم النماذج وفهم الثقة
💻 البرمجةبايثون أساسي — loops, functions, OOPيمكن تعلّمها خلال شهر-شهرين
🇬🇧 اللغة الإنجليزيةقراءة أكاديمية (B2+)ضرورية لقراءة الأوراق البحثية والمصادر

⏱️ كم تحتاج من الوقت؟

بين ١٢ و ٢٤ شهرًا من العمل المكثف بدوام كامل (٦-١٠ ساعات يوميًا). هذا ليس مسارًا سريعًا — إنه خريطة طريق واقعية لمن يريد الوصول إلى مصافّ الخبراء العالميين. يمكن أن يقل الوقت لأصحاب الخلفية الرياضية/الهندسية القوية.

🧭 ماذا ستتعلم؟

الشبكات العصبية — من perceptron إلى الشبكات العميقة
المحولات (Transformers) — قلب ثورة الذكاء الاصطناعي التوليدي
نماذج اللغة الكبيرة (LLMs) — بناء، تدريب، تحسين
الصوت والتحدث — STT، TTS، Voice Cloning
البنية التحتية — GPU clusters، MLOps، نشر الإنتاج
الفصل الثاني

📚 المرحلة ١ — التأسيس (شهر ١-٣)

هذه المرحلة هي أساس البناء. لا يمكنك بناء ناطحة سحاب على رمال متحركة، لذا سنركز هنا على ترسيخ المفاهيم الأساسية التي ستحملك طوال رحلتك.

الأسبوعالموضوعالأهداف الرئيسية
١-٢🐍 بايثون لعلم البياناتNumPy, Pandas, Matplotlib
٣-٤📐 الجبر الخطيمصفوفات، متجهات، eigenvalues, SVD
٥-٦📈 التفاضل والتكاملقاعدة السلسلة، التدرج، الاشتقاق الآلي
٧-٨📊 الإحصاء والاحتمالاتالتوزيعات، نظرية بايز، تقدير المعلمات
٩-١٢🤖 Intro to ML + أول شبكة عصبيةLinear Regression ← Logistic ← Perceptron ← MLP

📌 الموارد الأساسية

3Blue1Brown
سلسلة "Essence of Linear Algebra" و "Neural Networks" — أفضل شرح بصري
🎬 يوتيوب
Andrej Karpathy — Zero-to-Hero
بناء شبكات عصبية من الصفر في Python + Micrograd
🎬 فيديو
Kaggle Microcourses
دورات مصغّرة مجانية في Python, ML, Pandas
💻 تفاعلي
Deep Learning with Python — Chollet
الكتاب المرجعي العملي الأكثر شهرة
📖 كتاب

🚀 المشروع الأول

المشروع
MNIST من الصفر
بناء مصنّف أرقام مكتوبة بخط اليد باستخدام NumPy فقط — بدون PyTorch أو TensorFlow. هذا المشروع سيعلمك كيف تعمل backpropagation فعليًا.

💡 نصيحة الموسم

لا تتخطى الجبر الخطي مهما كان مغرٍيًا. خوارزميات الذكاء الاصطناعي كلها — من GPT-4 إلى Stable Diffusion — هي في جوهرها عمليات مصفوفات ضخمة. كلما فهمت المصفوفات بعمق، كلما كان فهمك أعمق لكل ما يأتي لاحقًا.

الفصل الثالث

🔬 المرحلة ٢ — التعمق (شهر ٤-٨)

بعد أن بنيت أساسًا متينًا، حان وقت التعمق. ستنتقل من فهم المفاهيم النظرية إلى بناء نماذج حقيقية باستخدام PyTorch، وستستكشف أغلب فروع التعلم العميق.

الشهرالموضوعالمحتوى
٤-٥🔥 PyTorch عميقAutograd, DataLoader, Custom Modules, GPU Training
٥-٦🖼️ Convolutional NetworksCNNs, ResNet, Transfer Learning, Object Detection intro
٦-٧🔄 RNN, LSTM, GRUالتسلسلات، Vanishing Gradient، التطبيقات النصية والزمنية
٧-٨🧠 Attention + TransformerSelf-Attention, Multi-Head Attention, من الصفر

📌 الموارد الأساسية

Stanford CS231n
المرجع الأكاديمي للرؤية الحاسوبية والشبكات الالتفافية
🎬 فيديو
Stanford CS224n
معالجة اللغة الطبيعية مع التركيز على RNNs و Transformers
🎬 فيديو
Dive into Deep Learning (d2l.ai)
كتاب تفاعلي مع كود — يشرح النظرية والتطبيق معًا
📖 تفاعلي
Fast.ai
منهج تعليمي من الأعلى للأسفل — ممتاز للفهم العملي
💻 كورس

🚀 المشاريع

المشروع ٢
Image Classifier متكامل
بناء مصنّف صور باستخدام CNN مع Transfer Learning (ResNet, EfficientNet). يشمل Data Augmentation و Hyperparameter Tuning.
المشروع ٣
Transformer صغير من الصفر
بناء Transformer باستخدام PyTorch فقط لتوليد النصوص. هذا المشروع هو الأساس لكل النماذج الحديثة (GPT, BERT, T5).

🔥 تحدّي Transformer

هذه هي أهم لحظة في رحلتك. عندما تبني Transformer بنفسك — وتفهم كل جزء منه: Attention, Positional Encoding, LayerNorm, Feed-Forward — عندها فقط ستكون مستعدًا لفهم GPT و LLaMA و BERT. لا تنتقل للمرحلة التالية إلا بعد أن تشعر بالثقة في هذا المشروع.

الفصل الرابع

🎯 المرحلة ٣ — التخصص (شهر ٩-١٨)

هنا تبدأ رحلة التخصص. بعد أن أتقنت الأساسيات، حان وقت اختيار مسار واحد (أو أكثر) والتعمق فيه لمدة ١٠ أشهر. كل مسار يوصلك إلى مستوى خبير في مجاله.

🅰️ LLMs — نماذج اللغة 🅱️ Speech/Audio — الصوت 🅲️ Computer Vision — الرؤية 🅳️ Infrastructure/MLOps — البنية التحتية

🅰️ المسار أ: نماذج اللغة الكبيرة (LLMs)

الشهرالموضوعالمخرجات
٩-١٠هندسة LLMs المتقدمةفهم GPT, LLaMA, Mistral architectures, MoE, GQA, RoPE
١١-١٢التدريب الموزعFSDP, DeepSpeed, Tensor/Pipeline Parallelism, NCCL
١٣-١٤Fine-tuning + AlignmentLoRA, QLoRA, RLHF, DPO, ORPO, Reward Modeling
١٥-١٦النشر والتقييمvLLM, TGI, Triton, Evaluation Benchmarks, Safety

🚀 مشروع التخرج — Fine-tune LLaMA على بيانات عربية

قم بتنزيل LLaMA-3 8B، وجهّز مجموعة بيانات عربية (مثل Reddit Arabia أو Wikipedia Arabic)، واستخدم LoRA/QLoRA لضبط النموذج على مهمة توليد محتوى عربي. قيّم النتيجة باستخدام BLEU, ROUGE, و Human Evaluation.

🅱️ المسار ب: Speech / Audio

الشهرالموضوعالمخرجات
٩-١٠معالجة الصوتlibrosa, torchaudio, STFT, Mel-spectrogram, Features
١١-١٢تدريب STTWhisper fine-tuning, Connectionist Temporal Classification
١٣-١٤تدريب TTSCoqui TTS, XTTS, VITS, Tacotron, FastSpeech
١٥-١٦Voice Cloning + DeploymentSpeaker Encoder, Zero-shot Cloning, Real-time Inference

🚀 مشروع التخرج — نموذج TTS عربي سعودي

ابنِ نموذج تحويل نص إلى كلام باللهجة السعودية. ابدأ بجمع بيانات صوتية (لهجة سعودية)، ودرّب نموذج XTTS-V2 عليها. النتيجة: نموذج يقرأ أي نص عربي بصوت سعودي طبيعي.

🅲️ المسار ج: Computer Vision

الشهرالموضوعالمخرجات
٩-١٠Object DetectionYOLO, DETR, Faster R-CNN, mAP Evaluation
١١-١٢SegmentationU-Net, SAM, Mask R-CNN, Instance/Semantic Segmentation
١٣-١٤Generative ModelsDiffusion Models, DDPM, Stable Diffusion, ControlNet
١٥-١٦Video UnderstandingVideoMAE, TimeSformer, Action Recognition, Tracking

🚀 مشروع التخرج — نظام رؤية كامل

ابنِ نظامًا يكتشف الأشياء ويصنّفها ويقسمها في الفيديو المباشر. استخدم YOLO-NAS للاكتشاف و SAM للتقسيم. أضف واجهة مستخدم باستخدام Gradio أو Streamlit. اجعل النظام يعمل في الوقت الحقيقي.

🅳️ المسار د: Infrastructure / MLOps

الشهرالموضوعالمخرجات
٩-١٠GPU ClustersNVIDIA NCCL, InfiniBand, GPUDirect, Cluster Architecture
١١-١٢OrchestrationKubernetes + Ray + SLURM, GPU Scheduling, Auto-scaling
١٣-١٤CI/CD + MonitoringML Pipelines, Model Registry, Prometheus + Grafana, Alerts
١٥-١٦Cost OptimizationSpot Instances, Multi-Cloud, Carbon Footprint, Budgeting

🚀 مشروع التخرج — بناء GPU Cluster صغير

استخدم ٤-٨ GPUs (عبر Lambda Labs أو RunPod أو محليًا) وابنِ كتلة تدريب موزعة. قم بإعداد Kubernetes + Ray، ودرّب نموذجًا باستخدام FSDP على الكتلة. وثّق التكوين والنتائج.

الفصل الخامس

🏆 المرحلة ٤ — الاحتراف والنشر العلمي (شهر ١٩-٢٤+)

وصلت إلى هنا — أنت الآن خبير تقني متكامل. لكن الخبير الحقيقي لا يكتفي بالمعرفة، بل ينشرها ويبني سمعة عالمية. هذه المرحلة تركز على التحول من متعلم إلى قائد في المجال.

📖 قراءة الأوراق البحثية — كيف تقرأ ١٠ ورقات/أسبوع

🔍 استراتيجية القراءة

ابدأ بالـ Abstract والـ Conclusion — هل الورقة مهمة لمجالك؟ اقرأ Figures أولاً (الصور تختصر ألف كلمة). اقرأ Related Work للتأريخ. اقرأ Method بالتفصيل. أخيرًا، اقرأ Results مع نقد. درّب نفسك على القراءة السريعة: ٣٠ دقيقة لكل ورقة.

📬 أين تنشر؟

المنصة/المؤتمرالمجالنسبة القبولملاحظات
NeurIPSعام (ML/DL)~٢٥٪الأرفع مكانة في ML
ICMLتعلم الآلة~٢٥٪موازٍ في المكانة لـ NeurIPS
ICLRالتعلم التمثيلي~٢٥٪سريع النمو، يقدر الأوراق الجريئة
ACL / EMNLPNLP / LLMs~٢٥-٣٠٪أهم مؤتمرات NLP
Interspeech / ICASSPSpeech / Audio~٤٥-٥٠٪أفضل فرصة للنشر في الصوت
CVPR / ICCVComputer Vision~٢٥٪أهم مؤتمرات الرؤية
🌐 arXivجميع المجالاتنشر مسبق (preprint)، ضروري لبناء السمعة

✍️ كتابة البحث — من الفكرة إلى النشر

🤝 المساهمات مفتوحة المصدر

المساهمة في المشاريع مفتوحة المصدر هي أسرع طريقة لبناء سمعة تقنية. ابدأ بخطوات صغيرة:

🌐 بناء السمعة

🐦 Twitter / X
تابع الباحثين، انشر نتائجك، تفاعل مع المجتمع
💼 LinkedIn
انشر ملخصات الأوراق، اكتب محتوى تعليمي
📝 Blog تقني
Medium، Dev.to، أو مدونة شخصية — شرّح المفاهيم بلغة بسيطة
🎤 التحدث
قدّم في meetups، مؤتمرات، وورش عمل

💼 بناء شركة AI

معظم شركات الذكاء الاصطناعي الناجحة وُلدت من أوراق بحثية أو مشاريع مفتوحة المصدر. بعد أن تصل لهذه المرحلة، لديك المهارات لتحويل معرفتك إلى منتج. ابحث عن مشكلة حقيقية، ابنِ حلًا، وانطلق.

الفصل السادس

📚 موارد متكاملة — أكبر مرجع عربي

هذا الفصل هو كنز الموارد الذي يضم كل ما تحتاجه في رحلتك — كتب، كورسات، قنوات، مجتمعات، أدوات، أوراق بحثية. صمم هذا القسم ليكون مرجعًا دائمًا ترجع إليه في أي مرحلة من رحلتك.

📖 قائمة بأكثر من ٥٠ كتابًا

#الكتابالمؤلفالمستوىلغة
١Deep LearningGoodfellow, Bengio, Courvilleمتقدم🇬🇧
٢Deep Learning with PythonFrançois Cholletمبتدئ-متوسط🇬🇧
٣Dive into Deep Learning (d2l.ai)Zhang, Lipton, Li, Smolaمبتدئ-متوسط🇬🇧
٤The Elements of Statistical LearningHastie, Tibshirani, Friedmanمتقدم🇬🇧
٥Pattern Recognition and Machine LearningChristopher Bishopمتقدم🇬🇧
٦Mathematics for Machine LearningDeisenroth, Faisal, Ongمتوسط🇬🇧
٧Speech and Language ProcessingJurafsky & Martinمتوسط-متقدم🇬🇧
٨Hands-On Machine Learning with Scikit-Learn, Keras & TFAurélien Géronمبتدئ-متوسط🇬🇧
٩Natural Language Processing with TransformersTunstall, Werra, Wolfمتوسط🇬🇧
١٠Designing Machine Learning SystemsChip Huyenمتوسط🇬🇧
١١Introduction to Linear AlgebraGilbert Strangأساسي🇬🇧
١٢Calculus (Early Transcendentals)Stewartأساسي🇬🇧
١٣Probabilistic Machine LearningKevin Murphyمتقدم🇬🇧
١٤Understanding Deep LearningSimon J.D. Princeمتوسط🇬🇧
١٥Machine Learning EngineeringAndrew Ng (Andriy Burkov)متوسط🇬🇧
١٦Grokking Deep LearningAndrew Traskمبتدئ🇬🇧
١٧Transformers for NLPDenis Rothmanمتوسط🇬🇧
١٨Generative Deep LearningDavid Fosterمتوسط🇬🇧
١٩Reinforcement Learning: An IntroductionSutton & Bartoمتقدم🇬🇧
٢٠Practical MLOpsNoah Gift et al.متوسط🇬🇧
٢١Deep Learning for Coders with Fastai and PyTorchHoward & Guggerمبتدئ-متوسط🇬🇧
٢٢Machine Learning: A Probabilistic PerspectiveKevin Murphyمتقدم🇬🇧
٢٣Python Data Science HandbookJake VanderPlasأساسي🇬🇧
٢٤Introduction to Statistical Learning (ISLR)James, Witten, Hastie, Tibshiraniمتوسط🇬🇧
٢٥+— المزيد من الكتب العربية في الأسفل —

📚 كتب عربية مهمة

#الكتابالمؤلفالموضوع
٢٥مقدمة في الذكاء الاصطناعيد. صالح السنوسيمدخل عربي شامل
٢٦تعلم الآلة: أساسيات وتطبيقاتد. أسامة داودنظرة عامة عملية
٢٧الشبكات العصبية والتعلم العميقد. محمد الرويليترجمة وشرح للمفاهيم
٢٨معالجة اللغة العربيةد. نبيل عليNLP عربي متخصص
٢٩الثورة الصناعية الرابعةد. ماجد الحربيالذكاء الاصطناعي والمجتمع
٣٠+— ستجد مزيدًا في المكتبة العربية —

🎓 قائمة بأكثر من ٣٠ كورسًا مجانيًا

#الكورسالمنصةالمستوى
١Machine Learning Specialization (Andrew Ng)Coursera / DeepLearning.AIمبتدئ
٢Deep Learning SpecializationCoursera / DeepLearning.AIمتوسط
٣CS229 — Machine Learning (Stanford)يوتيوب / Stanford Onlineمتوسط
٤CS231n — CNNs for Visual RecognitionStanford Onlineمتوسط-متقدم
٥CS224n — NLP with Deep LearningStanford Onlineمتوسط-متقدم
٦CS182 — Deep Learning (UC Berkeley)يوتيوبمتوسط-متقدم
٧MIT 6.S191 — Intro to Deep LearningMIT / يوتيوبمبتدئ-متوسط
٨Fast.ai Practical Deep LearningFast.ai (مجاني)مبتدئ
٩Hugging Face Course (NLP)Hugging Faceمتوسط
١٠Full Stack Deep Learningfullstackdeeplearning.comمتوسط
١١MLOps SpecializationCoursera / DeepLearning.AIمتوسط
١٢TensorFlow Developer CertificateCoursera / DeepLearning.AIمتوسط
١٣PyTorch for Deep LearningfreeCodeCamp / يوتيوبمبتدئ-متوسط
١٤Krish Naik — ML/DL tutorialsيوتيوبمبتدئ-متوسط
١٥OpenAI Spinning Up in Deep RLOpenAI (مجاني)متقدم
١٦NYU DGL — Deep Learning (Yann LeCun)يوتيوبمتقدم
١٧Berkeley CS285 — Deep RLيوتيوبمتقدم
١٨Practical ML (Dive into Deep Learning)d2l.ai (تفاعلي)متوسط
١٩Stanford XCS224U — NLUStanford Onlineمتقدم
٢٠GPU Mode (Training/Performance)يوتيوب (قناة GPU MODE)متقدم
٢١Andrew Ng — AI for EveryoneCourseraأساسي
٢٢Mathematics for MLCoursera / Imperial Collegeأساسي
٢٣Kaggle Learn MicrocoursesKaggle (مجاني)مبتدئ
٢٤DataCamp — Python for Data ScienceDataCamp (جزئيًا مجاني)مبتدئ
٢٥Google ML Crash CourseGoogle (مجاني)مبتدئ-متوسط
٢٦Stanford CS 224V — Conversational AIStanford Onlineمتقدم
٢٧UvA Deep Learning Tutorialsجامعة أمستردام (يوتيوب)متوسط
٢٨Statistics 110 (Harvard, Joe Blitzstein)يوتيوب / Harvardأساسي-متوسط
٢٩3Blue1Brown — Neural Networksيوتيوب (مجاني)أساسي
٣٠Andrej Karpathy — Zero-to-Heroيوتيوب (مجاني)متوسط
٣١Prompt Engineering for AI (DeepLearning.AI)Courseraمبتدئ
٣٢LangChain for LLMs (DeepLearning.AI)Courseraمتوسط
٣٣+— و العديد من الكورسات على رواق ومنصة نفهم —

🎬 قائمة بأكثر من ٢٠ قناة يوتيوب

#القناةالمجالاللغة
١3Blue1Brownرياضيات + تصور بصري🇬🇧
٢Andrej Karpathyتعلم عميق من الصفر🇬🇧
٣Stanford Onlineمحاضرات جامعية كاملة🇬🇧
٤MIT OpenCourseWareمحاضرات MIT🇬🇧
٥Yannic Kilcherمراجعة أوراق بحثية أسبوعية🇬🇧
٦Two Minute Papersملخصات أبحاث (دقيقتان)🇬🇧
٧StatQuest with Josh Starmerإحصاء + ML ببساطة🇬🇧
٨AI Coffee Break with Letitiaمفاهيم DL موجزة🇬🇧
٩Nicholas RenotteAI تطبيقي وعملي🇬🇧
١٠SentdexPython + ML تطبيقي🇬🇧
١١Machine Learning Street Talkنقاشات معمقة مع باحثين🇬🇧
١٢Sudharshan Ravichandran (AI Engineering)LLMs, RAG, GenAI🇬🇧
١٣Umar Jamilشروحات Transformer من الصفر🇬🇧
١٤Jeff HeatonDL مع Python بالتفصيل🇬🇧
١٥El Moasser — AI بالعربيةشروحات عربية للتعلم العميق🇸🇦
١٦أكاديمية الذكاء الاصطناعيدورات عربية في ML/DL🇸🇦
١٧مصطفى عبدالهاديAI وعلوم البيانات بالعربية🇪🇬
١٨قناة إبراهيم الجعفريPyTorch, TensorFlow عربي🇸🇦
١٩Code Basics (عربي)تعليم برمجة + AI🇸🇦
٢٠د. عبدالله الزهرانيAI وأخلاقياته🇸🇦
٢١BWB (Bassem W. Basket)ML, DL, مشاريع عملية🇪🇬
٢٢+— تابع قنوات مؤتمرات (NeurIPS, ICML) أيضًا —

🌍 قائمة بأكثر من ١٠ مجتمعات عربية

#المجتمعالمنصةالوصف
١مجتمع الذكاء الاصطناعي السعوديتلغرام / تويترأكبر مجتمع AI سعودي
٢AI Hub Arabiaتلغرامأخبار، دورات، وظائف
٣مجتمع تعلم الآلة العربيتلغرام / ديسكوردنقاشات تقنية
٤Data Science Arabiaفيسبوك / تلغراممجتمع كبير لعلوم البيانات
٥PyData Arabiaتلغراممجتمع بايثون وتحليل البيانات
٦NLP Arabic Communityتلغراممتخصص في معالجة العربية
٧Saudi AI / ML MeetupMeetup.comلقاءات دورية في السعودية
٨Google Developers Group (GDG) — AIكل مدينةفعاليات محلية للذكاء الاصطناعي
٩Arab AI / Data Science Clubديسكوردمجتمع عالمي للناطقين بالعربية
١٠منصة رواق — مجتمع التعلمرواقدورات ومناقشات
١١Hugging Face Arabic CommunityHugging Faceمنظمة مجتمعية للعربية
١٢سايبر AI (Cybr AI)يوتيوب / تلغراممحتوى تعليمي وبحثي

🎤 قائمة بأكثر من ١٥ مؤتمرًا سنويًا

#المؤتمرالمجالالموعد التقريبي
١NeurIPSعام (ML/DL)ديسمبر
٢ICMLتعلم الآلةيوليو
٣ICLRالتعلم التمثيليمايو
٤AAAIذكاء اصطناعي عامفبراير
٥ACLNLPيوليو/أغسطس
٦EMNLPNLPنوفمبر
٧NAACLNLP (أمريكا الشمالية)يونيو
٨CVPRComputer Visionيونيو
٩ICCVComputer Visionأكتوبر (سنوات فردية)
١٠ECCVComputer Visionسبتمبر (سنوات زوجية)
١١InterspeechSpeech/Audioسبتمبر
١٢ICASSPSignal Processingمايو
١٣KDDData Mining & Knowledge Discoveryأغسطس
١٤MLSysML Systems / Infrastructureأبريل/مايو
١٥CoLM (Conference on Language Modeling)LLMsمتغير
١٦SOUPS / USENIX SecurityAI Safety / Securityأغسطس
١٧+— بالإضافة إلى المؤتمرات العربية: قمة الذكاء الاصطناعي السعودية LEAP، جيتكس دبي —

🛠️ قائمة بأكثر من ٢٠ أداة ومكتبة

PyTorch
إطار العمل الأساسي للبحث والتطوير
🔥
TensorFlow / Keras
للإنتاج والمشاريع التجارية
🧱
JAX
حسابات عالية الأداء، قابل للتفاضل
Hugging Face Transformers
أشهر مكتبة لنماذج اللغة
🤗
vLLM
تسريع استدلال LLMs (PagedAttention)
⚙️
DeepSpeed
تدريب موزع من Microsoft
🚆
Ray
توزيع المهام والحوسبة المتوازية
🌐
Weights & Biases
تتبع التجارب وتنظيمها
📊
MLflow
دورة حياة ML كاملة
📦
DVC
إدارة البيانات وإصدار النماذج
🗃️
Docker + NVIDIA Container Toolkit
حزم وتشغيل النماذج مع GPU
🐳
Kubernetes (K8s)
إدارة الحاويات والموارد الموزعة
☸️
FastAPI
بناء APIs لنماذج AI بسرعة
🚀
Gradio / Streamlit
واجهات مستخدم سريعة للنماذج
🎨
ONNX
نقل النماذج بين الأطر المختلفة
🔄
TensorRT
تحسين استدلال NVIDIA
Librosa
معالجة الصوت والموسيقى
🎵
TorchAudio
معالجة الصوت في PyTorch
🔊
OpenCV
معالجة الصور والفيديو
📷
Scikit-learn
خوارزميات ML كلاسيكية
🧪
LangChain / LlamaIndex
بناء تطبيقات LLM (RAG، agents)
🦜
GNU Parallel / SLURM
إدارة مهام الحوسبة
💻
Weights (Transformers.js)
تشغيل Transformers في المتصفح
🌍

📄 قائمة بأكثر من ١٠٠ ورقة بحثية أساسية

مقسّمة حسب المجال — اقرأها بالترتيب الموصى به في كل مجال.

🧠 الشبكات العصبية والتعلم العميق (الأساسيات)

#الورقةالمؤلفونالسنة
١ImageNet Classification with Deep Convolutional Networks (AlexNet)Krizhevsky et al.٢٠١٢
٢Very Deep Convolutional Networks for Large-Scale Image Recognition (VGG)Simonyan & Zisserman٢٠١٤
٣Going Deeper with Convolutions (GoogLeNet/Inception)Szegedy et al.٢٠١٤
٤Deep Residual Learning for Image Recognition (ResNet)He et al.٢٠١٥
٥Batch Normalization: Accelerating Deep Network TrainingIoffe & Szegedy٢٠١٥
٦Dropout: A Simple Way to Prevent Neural Networks from OverfittingSrivastava et al.٢٠١٤
٧Understanding the difficulty of training deep feedforward neural networksGlorot & Bengio٢٠١٠
٨Delving Deep into Rectifiers (He Initialization)He et al.٢٠١٥
٩Adam: A Method for Stochastic OptimizationKingma & Ba٢٠١٤
١٠Gradient-Based Learning Applied to Document Recognition (LeNet)LeCun et al.١٩٩٨

🧠 Transformers و الـ Attention

#الورقةالمؤلفونالسنة
١١Attention is All You Need (Transformer)Vaswani et al.٢٠١٧
١٢BERT: Pre-training of Deep Bidirectional TransformersDevlin et al.٢٠١٨
١٣Improving Language Understanding by Generative Pre-Training (GPT-1)Radford et al. (OpenAI)٢٠١٨
١٤Language Models are Unsupervised Multitask Learners (GPT-2)Radford et al. (OpenAI)٢٠١٩
١٥Language Models are Few-Shot Learners (GPT-3)Brown et al. (OpenAI)٢٠٢٠
١٦Training Language Models to Follow Instructions (InstructGPT)Ouyang et al. (OpenAI)٢٠٢٢
١٧LLaMA: Open and Efficient Foundation Language ModelsTouvron et al. (Meta)٢٠٢٣
١٨LLaMA 3: Herding Models with ScaleMeta AI٢٠٢٤
١٩Mistral 7B / Mixtral 8x7BJiang et al. (Mistral AI)٢٠٢٣-٢٠٢٤
٢٠Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer (T5)Raffel et al.٢٠١٩
٢١RoFormer: Enhanced Transformer with Rotary Position Embedding (RoPE)Su et al.٢٠٢١
٢٢FlashAttention: Fast and Memory-Efficient Exact AttentionDao et al.٢٠٢٢
٢٣GQA: Training Generalized Multi-Query Transformer ModelsAinslie et al.٢٠٢٣
٢٤Constitutional AI: Harmlessness from AI FeedbackBai et al. (Anthropic)٢٠٢٢
٢٥Direct Preference Optimization (DPO)Rafailov et al.٢٠٢٣
٢٦LoRA: Low-Rank Adaptation of Large Language ModelsHu et al.٢٠٢١
٢٧QLoRA: Efficient Finetuning of Quantized LLMsDettmers et al.٢٠٢٣
٢٨Mixture of Experts (MoE) in LLMsShazeer et al. / Fedus et al.٢٠١٧-٢٠٢٢

📷 Computer Vision

#الورقةالمؤلفونالسنة
٢٩You Only Look Once (YOLO)Redmon et al.٢٠١٥
٣٠Faster R-CNN: Towards Real-Time Object DetectionRen et al.٢٠١٥
٣١End-to-End Object Detection with Transformers (DETR)Carion et al. (Meta)٢٠٢٠
٣٢U-Net: Convolutional Networks for Biomedical Image SegmentationRonneberger et al.٢٠١٥
٣٣Mask R-CNNHe et al. (Meta)٢٠١٧
٣٤Segment Anything (SAM)Kirillov et al. (Meta)٢٠٢٣
٣٥Generative Adversarial Nets (GANs)Goodfellow et al.٢٠١٤
٣٦Denoising Diffusion Probabilistic Models (DDPM)Ho et al.٢٠٢٠
٣٧High-Resolution Image Synthesis with Latent Diffusion Models (Stable Diffusion)Rombach et al.٢٠٢١
٣٨An Image is Worth 16x16 Words: Transformers for Image Recognition (ViT)Dosovitskiy et al. (Google)٢٠٢٠
٣٩MAE: Masked Autoencoders Are Scalable Vision LearnersHe et al. (Meta)٢٠٢١
٤٠CLIP: Learning Transferable Visual Models From Natural Language SupervisionRadford et al. (OpenAI)٢٠٢١
٤١VideoMAE: Masked Autoencoders are Data-Efficient Learners for Self-Supervised Video Pre-TrainingTong et al.٢٠٢٢
٤٢TimesFormer: A Unified Architecture for Video UnderstandingBertasius et al.٢٠٢١

🎤 Speech & Audio

#الورقةالمؤلفونالسنة
٤٣Deep Speech: Scaling up end-to-end speech recognitionHannun et al. (Baidu)٢٠١٤
٤٤WaveNet: A Generative Model for Raw Audiovan den Oord et al. (DeepMind)٢٠١٦
٤٥Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions (Tacotron 2)Shen et al. (Google)٢٠١٧
٤٦Attention Is All You Need in Speech Separation (SepFormer / Speech Transformer)Subakan et al.٢٠٢١
٤٧Robust Speech Recognition via Large-Scale Weak Supervision (Whisper)Radford et al. (OpenAI)٢٠٢٢
٤٨XTTS: a Massively Multilingual Zero-Shot Text-to-Speech ModelCoqui AI٢٠٢٣
٤٩VITS: Conditional Variational Autoencoder with Adversarial Learning for End-to-End TTSKim et al.٢٠٢١
٥٠Bark: Suno AI's GPT-Style Text-to-Audio ModelSuno AI٢٠٢٣
٥١FastSpeech 2: Fast and High-Quality End-to-End Text to SpeechRen et al.٢٠٢٠
٥٢HuBERT: Self-Supervised Speech Representation LearningHsu et al. (Meta)٢٠٢١
٥٣Wav2Vec 2.0: A Framework for Self-Supervised Learning of Speech RepresentationsBaevski et al. (Meta)٢٠٢٠

⚙️ MLOps & Infrastructure

#الورقةالمؤلفونالسنة
٥٤Efficient Large-Scale Language Model Training on GPU Clusters (Megatron-LM)Shoeybi et al. (NVIDIA)٢٠١٩
٥٥ZeRO: Memory Optimizations Toward Training Trillion Parameter ModelsRajbhandari et al. (Microsoft)٢٠١٩
٥٦GPipe: Efficient Training of Giant Neural Networks using Pipeline ParallelismHuang et al. (Google)٢٠١٨
٥٧PyTorch FSDP: Experiences on Scaling Fully Sharded Data ParallelZhao et al. (Meta)٢٠٢٣
٥٨Ray: A Distributed Framework for Emerging AI ApplicationsMoritz et al. (UC Berkeley)٢٠١٨
٥٩TensorFlow: A System for Large-Scale Machine LearningAbadi et al. (Google)٢٠١٦
٦٠MLflow: A Machine Learning Lifecycle PlatformZaharia et al.٢٠١٨
٦١Docker: Lightweight Linux Containers for Consistent Development and DeploymentMerkel (Docker Inc.)٢٠١٤
٦٢Kubernetes: Production-Grade Container OrchestrationGoogle٢٠١٤

🧮 NLP & Language Understanding

#الورقةالمؤلفونالسنة
٦٣Distributed Representations of Words and Phrases (Word2Vec)Mikolov et al. (Google)٢٠١٣
٦٤GloVe: Global Vectors for Word RepresentationPennington et al. (Stanford)٢٠١٤
٦٥Sequence to Sequence Learning with Neural NetworksSutskever et al. (Google)٢٠١٤
٦٦Neural Machine Translation by Jointly Learning to Align and Translate (Bahdanau Attention)Bahdanau et al.٢٠١٤
٦٧Long Short-Term Memory (LSTM)Hochreiter & Schmidhuber١٩٩٧
٦٨Learning Phrase Representations using RNN Encoder-Decoder (GRU)Cho et al.٢٠١٤
٦٩XLNet: Generalized Autoregressive Pretraining for Language UnderstandingYang et al. (Google/Carnegie Mellon)٢٠١٩
٧٠ELECTRA: Pre-training Text Encoders as DiscriminatorsClark et al. (Stanford)٢٠٢٠
٧١ALBERT: A Lite BERT for Self-supervised Learning of Language RepresentationsLan et al. (Google)٢٠١٩
٧٢DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighterSanh et al. (Hugging Face)٢٠١٩
٧٣Sentence-BERT: Sentence Embeddings using Siamese BERT-NetworksReimers & Gurevych٢٠١٩
٧٤Retrieval-Augmented Generation (RAG) for Knowledge-Intensive NLP TasksLewis et al.٢٠٢٠
٧٥Chain-of-Thought Prompting Elicits Reasoning in Large Language ModelsWei et al. (Google)٢٠٢٢
٧٦Tree of Thoughts: Deliberate Problem Solving with Large Language ModelsYao et al.٢٠٢٣
٧٧ReAct: Synergizing Reasoning and Acting in Language ModelsYao et al.٢٠٢٢
٧٨Scaling Monosemanticity: Extracting Interpretable Features from Claude 3 SonnetAnthropic٢٠٢٤

🧬 Reinforcement Learning & Decision Making

#الورقةالمؤلفونالسنة
٧٩Human-level control through deep reinforcement learning (DQN)Mnih et al. (DeepMind)٢٠١٥
٨٠Mastering the game of Go with deep neural networks and tree search (AlphaGo)Silver et al. (DeepMind)٢٠١٦
٨١Proximal Policy Optimization Algorithms (PPO)Schulman et al. (OpenAI)٢٠١٧
٨٢Asynchronous Methods for Deep Reinforcement Learning (A3C)Mnih et al. (DeepMind)٢٠١٦
٨٣Soft Actor-Critic: Off-Policy Maximum Entropy Deep RLHaarnoja et al. (UC Berkeley)٢٠١٨
٨٤RLHF: Training language models to follow instructions with human feedbackOuyang et al. (OpenAI)٢٠٢٢
٨٥Decision Transformer: Reinforcement Learning via Sequence ModelingChen et al.٢٠٢١

🤖 Robotics & Embodied AI

#الورقةالمؤلفونالسنة
٨٦RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic ControlBrohan et al. (Google DeepMind)٢٠٢٣
٨٧PaLM-E: An Embodied Multimodal Language ModelDriess et al. (Google)٢٠٢٣
٨٨SayCan: Do As I Can, Not As I Say (Grounding LLMs in Robotics)Ahn et al. (Google)٢٠٢٢
٨٩Learning Dexterous In-Hand ManipulationOpenAI٢٠١٨
٩٠BEHAVIOR-1K: A Benchmark for Embodied AI with 1,000 Everyday ActivitiesLi et al. (Stanford)٢٠٢٣

🌍 AI Safety, Ethics & Alignment

#الورقةالمؤلفونالسنة
٩١Concrete Problems in AI SafetyAmodei et al. (OpenAI)٢٠١٦
٩٢Deep Reinforcement Learning from Human PreferencesChristiano et al. (DeepMind)٢٠١٧
٩٣TruthfulQA: Measuring How Models Mimic Human FalsehoodsLin et al.٢٠٢١
٩٤Holistic Evaluation of Language Models (HELM)Liang et al. (Stanford)٢٠٢٢
٩٥AI Risk Management Framework (NIST AI RMF)NIST (US Government)٢٠٢٣
٩٦Human-Centered AI (Book & Framework)Ben Shneiderman٢٠٢٢
٩٧Representation Engineering: A Top-Down Approach to AI TransparencyZou et al.٢٠٢٣

⌛ Multimodal & Foundation Models

#الورقةالمؤلفونالسنة
٩٨Flamingo: a Visual Language Model for Few-Shot LearningAlayrac et al. (DeepMind)٢٠٢٢
٩٩BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language ModelsLi et al. (Salesforce)٢٠٢٣
١٠٠LLaVA: Large Language and Vision AssistantLiu et al.٢٠٢٣
١٠١Gemini: A Family of Highly Capable Multimodal ModelsGoogle DeepMind٢٠٢٣
١٠٢GPT-4 Technical ReportOpenAI٢٠٢٣
١٠٣Claude 3 Model Family: Rivaling the Best Models in the IndustryAnthropic٢٠٢٤
١٠٤ImageBind: One Embedding Space To Bind Them AllGirdhar et al. (Meta)٢٠٢٣
١٠٥Meta-Transformer: A Unified Framework for Multimodal LearningXu et al.٢٠٢٣
١٠٦+— تابع arXiv و دليل الوراق البحثية الشهري —

🎖️ شهادات احترافية

#الشهادةالجهة المانحةالتكلفةالمستوى
١NVIDIA DLI — Fundamentals of Deep LearningNVIDIAمجاني / $٩٠مبتدئ
٢NVIDIA DLI — Building Transformer-Based NLP AppsNVIDIA$٩٠متوسط
٣NVIDIA DLI — Applications of Generative AINVIDIA$٩٠متوسط
٤DeepLearning.AI — TensorFlow Developer CertificateDeepLearning.AI / Google$٤٩/شهرمتوسط
٥DeepLearning.AI — Deep Learning SpecializationDeepLearning.AI / Coursera$٤٩/شهرمتوسط
٦Google Cloud — Professional ML EngineerGoogle Cloud$٢٠٠متقدم
٧AWS Certified ML SpecialtyAmazon AWS$٣٠٠متقدم
٨Hugging Face — NLP Course (Certificate)Hugging Faceمجانيمتوسط
٩Fast.ai — Practical Deep Learning (Course)Fast.aiمجانيمبتدئ-متوسط
١٠Stanford Online — Professional Certificate in ML & AIStanford University$٥٠٠-$١٠٠٠متقدم
١١MIT Professional Education — Applied AIMIT$٣٠٠-$٥٠٠متقدم
١٢Computer Vision Nanodegree (Udacity)Udacity / AWSمجاني جزئيًامتوسط

💎 كلمة أخيرة

هذه الرحلة طويلة ولكنها مجزية. ليس كل من يبدأها سيصل إلى النهاية — لكن من يصل سيصبح واحدًا من نخبة الخبراء في العالم. المفتاح هو الاستمرارية وليس السرعة. اقرأ ورقة واحدة كل يوم، اكتب كودًا كل يوم، واسأل أسئلة كل يوم.

تذكر: كل خبير بدأ مبتدئًا. الفرق الوحيد هو أنه لم يتوقف.