Utilisateur:ZEROUAL MR/Brouillon

تعلم الالة هو دراسة الخوارزميات والنماذج الرياضية المستخدمة من طرف أنظمة الحاسوب لتحسين لإنجاز مهمة معينة تدريجيا. خوارزميات تعلم الالة تبني نموذجا رياضيا للمعطيات البسيطة، يعرف بالبيانات التدريبية يهدف إلى القدرة على التنبؤ واتخاذ القرارات دون الحاجة إلى أن يكون قد برمج خصيصا لهذا. خوارزميات تعلم الالة تستخدم في تنقية البريد الالكتروني من البريد الضار، كشف الدخلاء في شبكة الاتصال إضافة إلى مجال الرؤية الحاسوبية لأنه من غير الممكن تطوير خوارزميات بتعليمات محددة لإنجاز هذه المهام. التعلم الالي متعلق تقريبا بالإحصائيات الحسابية التي تعتمد على التنبؤات باستخدام الحاسوب. دراسة استمثال الرياضيات يزود بنظريات وطرق ومجالات تطبيقية في حقل التعلم الالي. تنقيب المعطيات هو مجال متداخل مع التعلم الالي، يعتمد على تحليل البيانات الاستكشافية من خلال التعلم بدون استشراف. في مجال مشاكل الأعمال، تعلم الالة يشار اليه بالتحليل التنبؤي.

:تعريف

modifier

مصطلح التعلم الالي أطلق لأول مرة عام 1959، من طرف أرثر صامويل و توم ميتشال ، ليقدما تعريفا على نطاق واسع للخوارزميات المدروسة في التعلم الالي كالتالي : برنامج حاسوبي يتعلم من تجربة ت فيما يتعلق بالأشغال أ يالنسبة لمقياس الإتمام م إذا كان إتمامه للأشغال أ بالمقياس م قد تحسن بعد التجربة ت إن هذا التعريف للمهام التي يتعلق بها التعلم الآلي يقدم تعريفًا تشغيليًا جوهريًا بدلاً من تعريف الحقل من الناحية المعرفية. هذا يتناسب مع اقتراح ألان تورين في مقاله الحوسبة الآلية والاستخبارات أين استبدل سؤال : هل تستطيع الآلات أن تفكر ب : هل تستطيع الآلات القيام بما نقوم به نحن ككيانات مفكرة ? اقتراح تورين يعرض الخصائص المتعددة التي تستطيع الالة المفكرة اكتسابها والتأثيرات المتعددة للألة المصنوعة.

:تاريخ

modifier

أرثر صامويل ، رائد أمريكي في مجال ألعاب الحاسوب، و الذكاء الاصطناعي، صاغ مصطلح تعلم الالة عام 1959 . التعلم الالي نما من البحث في الذكاء الاصطناعي كمسعى علمي.في بدايات الذكاء الاصطناعي كمجال أكاديمي كان بعض الباحثين مهتمين بتعلم الآلات من البيانات وحاولوا حل المشكلة بطرق رمزية مختلفة وكذلك بما يسمى بالشبكات العصبية. كانت هذه في الغالب نماذج مستقبلة وتم استخدام نماذج أخرى تم اكتشافها فيما بعد على أنها إعادة إنتاج للنماذج الخطية المعممة للإحصاءات. كما تم استخدام التفكير الاحتمالي، خاصة في التشخيص الطبي الآلي. ومع ذلك، فقد أدى التركيز المتزايد على المنهج المنطقي القائم على المعرفة إلى حدوث انشقاق بين الذكاء الاصطناعي والتعلم الآلي. كانت الأنظمة الاحتمالية تعاني من المشاكل النظرية والعملية المتمثلة في الحصول على البيانات والتمثيل. بحلول عام 1980 سيطرت الأنظمة الخبيرة على الذكاء الاصطناعي على حساب الإحصائيات. استمر العمل بالتعلم الرمزي القائم على المعرفة مما قاد إلى ظهور البرمجة المنطقية الاستقرائية في التعرف على الأنماط واسترجاع المعلومات، لكن الخط الإحصائي الأكثر بحثًا أصبح الآن خارج مجال الذكاء الاصطناعي السليم. تم التخلي عن أبحاث الشبكات العصبية من قبل الذكاء الاصطناعي وعلوم الكمبيوتر في نفس الوقت. هذا الخط، أيضا، استمر خارج مجالي الذكاء الاصطناعي وعلوم الكمبيوتر باسم "الترابط"، من قبل الباحثين من التخصصات الأخرى. وقد جاء نجاحهم الرئيسي في منتصف الثمانينيات من القرن الماضي مع إعادة اختراع منهجية الانتشار الخلفي.بدأ التعلم الآلي، الذي أعيد تنظيمه كحقل مستقل، في الازدهار في التسعينات. غير المجال هدفه من تحقيق الذكاء الاصطناعي إلى معالجة المشاكل ذات الطبيعة العملية القابلة للحل. و قد حول التركيز بعيدا عن الطرق الرمزية التي ورثها عن الذكاء الاصطناعي، نحو الأساليب والنماذج المستعارة من الإحصاءات ونظرية الاحتمالات. كما استفاد من زيادة توافر المعلومات الرقمية، والقدرة على توزيعها عبر الإنترنت. في عام 2012، تمكنت الشبكة العصبية التي طورتها جوجل من التعرف على الوجوه البشرية وكذلك القطط في مقاطع فيديو يوتيوب.

هو أول من اجتاز اختبار بإقناع 33٪ من القضاة البشريين بعد خمس دقائق من المحادثة بأنه ليس جهاز كمبيوتر لكن صبيًا أوكرانيًا يبلغ من العمر 13 عامًا Goostman في عام 2014 ، بعد 64 عامًا من توقع آلان تورينج ، كان

، Goعلى أحد أفضل اللاعبين في العالم في لعبة Google من "AlphaGo"في عام 2015 ، يتم الوصول إلى معلم جديد عندما يفوز كمبيوتر

. من القراءة على الشفتين بمعدل نجاح كبير LipNet في عام 2016 ، تمكن نظام ذكاء اصطناعي قائم على تعلم الآلة يدعى

: تطبيقات

modifier

يستخدم التعلم الآلي لتزويد أجهزة الكمبيوتر أو الآلات بما يلي: إدراك البيئة ، التعرف على الأشياء (الوجوه ، المخططات ، اللغات الطبيعية ، الكتابة ، الأشكال النحوية ...) ؛ محرك بحث ؛ المساعدة التشخيصية وخاصة الطبية ، المعلوماتية الحيوية ، والكيميوانفورماتيك ؛ واجهات آلة الدماغ، كشف الاحتيال في بطاقات الائتمان ، والتحليل المالي  بما في ذلك تحليل سوق الأوراق المالية ؛ تصنيف تسلسل الحمض النووي. الألعاب. هندسة البرمجيات ؛ تكييف مواقع الويب، حركة الروبوتات، تحليل تنبؤي في المسائل القانونية والقضائية ...

الأمثلة على ذلك:

قد يسمح نظام التعلم الآلي للروبوت بالقدرة على تحريك أطرافه ولكن في البداية لا يعرف أي شيء عن تنسيق حركات المشي ، تعلم المشي. سيبدأ الروبوت بإجراء تحركات عشوائية ، ومن ثم ، باختيار وتمييز الحركات التي تسمح له بالتقدم ، سيقوم تدريجيا بتأسيس مسيرة أكثر فعالية.

التعرّف على خط اليد مهمة معقدة لأن حرفين متشابهين لا يساويان مطلقًا. يمكن تصميم نظام التعلم التلقائي لتعلم التعرف على الأحرف من خلال ملاحظة "الأمثلة" ، أي الأحرف المعروفة.

  :علاقته بالمجالات الأخرى

modifier

  :علاقته بتنقيب البيانات

modifier

هذان المجالان يعتمدان على نفس الطرق وهما متداخلان بشكل معتبر، مع أن التعلم الالي يعتمد على التنبؤ انطلاقا من خصائص معروفة تم تعلمها من تدريب البيانات، في حين أن تنقيب البيانات يعتمد على استكشاف خصائص غير معروفة سابقا.

تنقيب البيانات يستخدم الكثير من طرق تعلم الالة لكن لأهداف مختلفة، من جهة أخرى فإن التعلم الالي يستخدم الكثير من طرق تنقيب البيانات كتعلم بدون إشراف أو ك خطوة ما قبل المعالجة لتحسين دقة المتعلم. هناك الكثير من المغالطات بين المجالين بسبب الافتراضات القاعدية التي يعملان بها :  

التعلم الالي يقيس الدقة بالقدرة على استنساخ المعرفة المعروفة مسبقا، في حين أن المجال الثاني يتمحور على استكشاف معرفة غير معروفة. الطرق الغير خاضعة للإشراف تتفوق على الطرق الخاضعة للإشراف، لا يمكن استخدام الأساليب الخاضعة للإشراف بسبب عدم توفر بيانات التدريب.


هناك علاقة وطيدة بين المجالين، الكثير من مشكلات التعلم الالي تهدف إلى تقليل بعض وظائف الخسارة في مجموعة من الأمثلة التدريبية. وتعبر دالات الخسارة عن التناقض بين تنبؤات النموذج الذي يتم تدريبه ومثيلات المشكلة الفعلية.

ينشأ الفرق بين الحقلين من هدف التعميم: فخوارزميات التحسين يمكن أن تقلل من الخسارة في مجموعة التدريب، فإن التعلم الآلي يهتم بتقليل الخسارة على العينات غير المرئية.

:علاقته بالإحصاء

modifier

فإن أفكار التعلم الآلي ، من المبادئ المنهجية إلى الأدوات النظرية ، كان لها تاريخ سابق في الإحصاء. كما اقترح مصطلح علم البيانات كتسمية للمجال العام Michael I.Jordanالتعلم الآلي والإحصاء هي مجالات وثيقة الصلة. وفقا ل .

ميز اثنين من نماذج النمذجة الإحصائية : نموذج الخوارزميات والنموذج الحسابي ، [14] حيث "النموذج الخوارزمي" يعني بشكل أكثر أو أقل خوارزميات تعلم الآلة مثل خوارزمية الغابة العشوائية Leo Breiman

اعتمد بعض الإحصائيين أساليب التعلم الآلي، مما أدى إلى وجود مجال مشترك يسمونه التعلُّم الإحصائي.

: أنواعه

modifier

:التعلم تحت الاشراف وشبه الاشراف

modifier

تبني خوارزميات التعلم الخاضعة للإشراف نموذجًا رياضيًا لمجموعة من البيانات التي تحتوي على كل من المدخلات والمخرجات المرغوبة. تُعرف هذه البيانات باسم بيانات التدريب، وتتكون من مجموعة من الأمثلة التدريبية. يحتوي كل مثال تدريبي على مدخل أو أكثر وعلى المخرج مطلوب، والمعروف أيضا باسم إشارة إشرافية.

               في حالة خوارزميات التعلم شبه الخاضعة للإشراف، تفتقد بعض الأمثلة التدريبية إلى النتيجة المرجوة. في النموذج الرياضي يتم تمثيل كل مثال تدريبي من خلال جدول بسيط، وبيانات التدريب عن طريق مصفوفة. من خلال عملية التكرار، تعمل خوارزميات التعلم تحت الإشراف على تطوير وتحسين دالة يمكن استخدامها للتنبؤ بالمخرج المرجو حسب المدخلات الجديدة. ستسمح الدالة المثلى للخوارزمية بتحديد ناتج المدخلات التي لم تكن جزءًا من بيانات التدريب بشكل صحيح. ويقال إن الخوارزمية التي تحسن دقة مخرجاتها أو التنبؤات بمرور الوقت قد تعلمت القيام بهذه المهمة.

           تتضمن خوارزميات التعلم الخاضعة للإشراف خوارزميات التصنيف وخوارزميات الانحدار، أما خوارزميات التصنيف فتستخدم عندما تكون النواتج مقتصرة على مجموعة محدودة من القيم، وتستخدم خوارزميات الانحدار عندما تكون للمخرجات أي قيمة عددية ضمن نطاق معين.

        تعلم التشابه هو مجال من التعلم الآلي الخاضع للإشراف يرتبط ارتباطًا وثيقًا بالانحدار والتصنيف، ولكن الهدف منه هو التعلم من الأمثلة باستخدام دالة تشابه تقيس كيفية وجود تشابه بين شيئين. لديه تطبيقات في الترتيب، وأنظمة التوصية، وتتبع الهوية المرئية، والتحقق من الوجه، والتحقق من السماعات.

:التعلم دون الاشراف

modifier

تأخذ خوارزميات التعلم غير المشفرة مجموعة من البيانات التي تحتوي على مدخلات فقط، وتبحث على بنية في البيانات، مثل بنية لتجميع نقاط البيانات وبالتالي تتعلم الخوارزميات من بيانات الاختبار التي لم يتم وسمها أو تصنيفها.

تحدد خوارزميات التعلم غير الخاضعة للرقابة أوجه التشابه في البيانات وتتفاعل بناءً على وجود أو عدم وجود هذه القواسم المشتركة في كل جزء جديد من البيانات بدلاً من الاستجابة لردود الفعل.

على الرغم من أن التعلم غير الخاضع للإشراف يشمل مجالات أخرى تتضمن تلخيص وشرح خصائص البيانات إلا أن التطبيق المركزي اه هو مجال تقدير الكثافة في الإحصاء.

تحليل الكتلة هو تعيين مجموعة من الملاحظات في مجموعات فرعية (تسمى العناقيد) بحيث تكون الملاحظات داخل نفس المجموعة متشابهة وفقًا لمعيار واحد أو أكثر محدد سلفًا، في حين تختلف الملاحظات المستقاة من العناقيد المختلفة. ﺗﻘﻨﻴﺎت اﻟﺘﺠﻤﻴﻊ اﻟﻤﺨﺘﻠﻔﺔ ﺗﺆدي إﻟﻰ اﻓﺘﺮاﺿﺎت ﻣﺨﺘﻠﻔﺔ ﺣﻮل ﺑﻨﻴﺔ اﻟﺒﻴﺎﻧﺎت، وﻏﺎﻟﺒﺎً ﻣﺎ ﻳﺘﻢ ﺗﻌﺮﻳﻔﻬﺎ ﺑﺒﻌﺾ ﻗﻴﺎﺳﺎت اﻟﺘﺸﺎﺑﻪ كالانتساب اﻟﺪاﺧﻠﻲ، أو اﻟﺘﺸﺎﺑﻪ ﺑﻴﻦ أﻋﻀﺎء ﻧﻔﺲ اﻟﻤﺠﻤﻮﻋﺔ.

تعتمد الطرق الأخرى على الكثافة التقديرية والاتصال البياني.       

:تعزيز التعلم

modifier

يعد تعزيز التعلم مجالًا من مجالات التعلم الآلي يتعلق بكيفية قيام عملاء البرامج باتخاذ إجراءات في بيئة معينة لتحقيق أقصى قدر من مفهوم المكافأة التراكمية.

نظرًا لعموميته ، يتم دراسة المجال في العديد من التخصصات الأخرى ، مثل نظرية الألعاب ونظرية التحكم وأبحاث العمليات ونظرية المعلومات والتحسين القائم على المحاكاة والأنظمة متعددة العوامل وذكاء السرب والإحصاءات والخوارزميات الجينية.

في التعلم الآلي، يتم تمثيل البيئة عادة كقرارات عملية ماركوف (MDP). العديد من خوارزميات التعلم التعزيزية تستخدم تقنيات البرمجة الديناميكية لكنها لا تعتمد على معرفة نموذج رياضي دقيق.  يتم استخدامها عندما تكون النماذج الدقيقة غير مجدية كالسيارات المستقلة أو في تعلم لعب لعبة ضد خصم بشري.

: العمليات والتقنيات

modifier

:تعلم مميز

modifier

تهدف العديد من خوارزميات التعلم إلى اكتشاف تمثيلات أفضل للمدخلات المقدمة أثناء التدريب.

الأمثلة الكلاسيكية تشمل تحليل المكونات الأساسية والتحليل العنقودي. غالبًا ما تحاول خوارزميات تعلم الميزات، والتي تسمى أيضًا خوارزميات التعلم التمثيلية، الحفاظ على المعلومات في مدخلاتها كخطوة ما قبل المعالجة قبل تنفيذ التصنيف أو التنبؤات.، وتحويلها بطريقة تجعلها مفيدة.

تسمح هذه التقنية بإعادة بناء المدخلات القادمة من التوزيع المولّد للبيانات غير المعروفة، والتي لا تكون بالضرورة مؤمنة على تكوينات غير قابلة للتصديق بموجب هذا التوزيع. لاستبدال هندسة الخصائص اليدوية، والسماح للآلة بالتعرف على الميزات واستخدامها لأداء مهمة محددة.

يمكن أن يكون التعليم المميز إما تحت إشراف أو بدون إشراف. في تعلم الميزات الخاضع للإشراف ، يتم استخدام بيانات الإدخال المصنفة. وتشمل الأمثلة الشبكات العصبية الاصطناعية ، والمستقبلات متعددة الطبقات ، وتعلم القاموس تحت الإشراف.

في تعلم الميزات غير الخاضع للإشراف ، يتم استخدام بيانات الإدخال غير الموسومة. كتعلم القاموس ، والتحليل المستقل للمكوّنات ، والمعلمون الآليون ، وتوصيف المصفوفة وأشكال التجميع المختلفة.

يتم تحفيز التعلم المميّز من خلال حقيقة أن مهام التعلّم الآلي ، مثل التصنيف ، غالباً ما تتطلب مدخلاً مناسباً رياضياً وحاسوبيًا لعملية المعالجة. ومع ذلك ، لم تسفر بيانات العالم الحقيقي مثل الصور والفيديو والبيانات الحسية عن محاولات لتعريف خواص محددة بشكل خوارزمي. البديل هو اكتشاف هذه الميزات أو التمثيلات من خلال الفحص ، دون الاعتماد على خوارزميات صريحة.

يستخدم تعلم شجرة القرار شجرة القرار كنموذج تنبئي ينتقل من الملاحظات حول عنصر (متمثلاً في الفروع) إلى استنتاجات حول القيمة المستهدفة للعنصر (ممثلة في الأوراق). إنه واحد من أساليب النمذجة التنبؤية المستخدمة في الإحصاء و استخراج البيانات والتعلم الآلي.

تسمى نماذج الأشجار التي يمكن للمتغير المستهدف أخذ مجموعة منفصلة من القيم باسم أشجار التصنيف، في هذه الهياكل الشجرية، تمثل الأوراق تسميات الطبقات والفروع تمثل عبارات الميزات. تسمى أشجار القرار حيث يمكن أن يأخذ المتغير الهدف قيمًا مستمرة (عادة أرقام حقيقية) بأشجار الانحدار. في تحليل القرار، يمكن استخدام شجرة القرارات لعرض القرارات وصنع القرار بصريًا. في تنقيب البيانات ، تصف شجرة القرارات البيانات ، ولكن يمكن لشجرة التصنيف الناتجة أن تكون مدخلاً لاتخاذ القرار.