معلومات عامة

التعلم العميق للذكاء الاصطناعي

التعلم العميق للذكاء الاصطناعي : بعد عقود من التقدم البطيء للغاية ، اتخذت الأبحاث في مجال الذكاء الاصطناعي خطوة حاسمة ، وهو ما يفسر الانفعال الحالي حول الشبكات العصبية العميقة.

في عام 2016 ، هزم الكمبيوتر Lee Sedol ، بطل ألعاب Go المحترف ، بفضل برنامج صممته شركة Google DeepMind. هذا الإنجاز الرائع هو نتيجة للتقدم الكبير والحديث في مجال الذكاء الاصطناعي. لكن هل نحن قريبون إلى هذا الحد من الذكاء البشري؟ لا ، لأن برنامج DeepMind لا يعرف كيف يفعل أي شيء بخلاف اللعب. كيف وصلنا إلى هناك وكيف نخطط للتقدم؟

جدول المحتويات

يتم إثبات الذكاء من خلال الكفاءة في مجالات معينة

يتم إثبات الذكاء من خلال الكفاءة في مجالات معينة ، الأمر الذي يتطلب معرفة جيدة في المجالات المعنية. من أجل جعل أجهزة الكمبيوتر ذكية مثل البشر ، من الضروري التأكد من أن أجهزة الكمبيوتر لديها على الأقل نفس القدر من المعرفة مثل الإنسان العادي. لعدة عقود ، كان النهج السائد في البحث عن الذكاء الاصطناعي يتمثل في توفير المعرفة مباشرة إلى الجهاز.

ثم كان الأمر يتعلق بإضفاء الطابع الرسمي على معرفتنا ، أي وضعها في شكل واضح ومفهوم بواسطة الكمبيوتر. لكن الكثير من معرفتنا بديهي ولا يمكن الوصول إليه بوعي. الحدس هو ما يمكّن لاعب Go من اختيار حركته التالية جيدًا ، والسائق الجيد لتجنب وقوع حادث ، والطبيب من الجمع بين معرفته الكتابية وعلم النفس للمريض ؛ وفوق كل شيء ، يشمل كل قدراتنا الإدراكية تقريبًا ، والتي لا يمكننا وصفها بدقة ، ولكنها ضرورية لفهمنا للعالم.

إقرأ أيضا:أشهر السجون في العالم

بالنسبة للذكاء الاصطناعي ، فإن الحل الذي أثبت فعاليته بشكل رائع هو أن يكتسب الكمبيوتر معرفته الخاصة ، من خلال التعلم من الأمثلة. شهد المجال العلمي المتعلق بـ “التعلم الآلي” هذا عدة موجات من التقدم ، وتم استكشاف العديد من الخوارزميات والشكليات الرياضية. يتم تجميع جزء كبير منها وراء فكرة “الشبكات العصبية” ، والتي تتكون من استلهام الأفكار من الدماغ لأداء أشكال حسابية مختلفة عن تلك الموجودة في الكمبيوتر الكلاسيكي.

التعلم العميق للذكاء الاصطناعي : الخلايا العصبية الاصطناعية

في هذا النهج ، تستقبل الخلايا العصبية الاصطناعية (أجزاء من البرامج أو الأجهزة) إشارات من الخلايا العصبية الأخرى ، وتقوم بعملية حسابية بسيطة نسبيًا لدمج تلك الإشارات ، وإرسال النتيجة مرة أخرى إلى الخلايا العصبية الأخرى. غالبًا ما يتم تنظيم الشبكات العصبية الاصطناعية في طبقات متتالية ، مع إرسال النتائج المحسوبة بواسطة طبقة واحدة إلى الطبقات اللاحقة. يتم التعلم عن طريق تعديل الحساب الذي يقوم به كل خلية عصبية ، وفقًا لخوارزمية تقوم بضبط “أوزان” الروابط بين الخلايا العصبية (المعاملات التي يعتمد عليها الحساب الذي يتم إجراؤه بواسطة كل خلية عصبية).

في أوائل العقد الأول من القرن الحادي والعشرين ، لم يعد البحث عن الشبكات العصبية رائجًا بسبب الافتقار إلى نتائج مقنعة بما فيه الكفاية. ولكن في هذه اللحظة بالذات حدث اختراق ، بعيدًا عن ضوء أضواء وسائل الإعلام التي تغمر المجال اليوم. لأول مرة ، في عام 2006 ، نجحت ثلاثة فرق ، حول جيفري هينتون ، في جامعة تورنتو ، وأنا في جامعة مونتريال ، ويان ليكون ، في جامعة نيويورك ، بخوارزمية جديدة ، في تدريب “عميق” الشبكات العصبية – تتكون من أكثر من طبقة أو طبقتين بين مدخلات ومخرجات الشبكة. كان لدينا الحدس ، لفترة طويلة ، أن الشبكة العميقة يمكن أن تكون أقوى من تلك التي تم استكشافها حتى الآن. ما تم تأكيده في السنوات التالية.

إقرأ أيضا:كيف تجد السعادة؟

لم تكن المحاولات السابقة لتدريب الشبكات العميقة ناجحة

لم تكن المحاولات السابقة لتدريب الشبكات العميقة ناجحة ، ولا شك في ذلك بسبب صعوبة رياضية لم نفهمها تمامًا بعد. في عام 2011 فقط اكتشف فريقنا أن أشكالًا معينة من اللاخطية في العمليات الحسابية التي تقوم بها الخلايا العصبية الاصطناعية جعلت تدريب الشبكات العميقة أكثر سهولة. منذ ذلك الحين ، تسارع النجاح والتقدم ، أولاً في التعرف على الكلام – في الوقت الحاضر تستخدم جميع أنظمة التشغيل هذه تقريبًا التعلم العميق – ثم من أجل رؤية الكمبيوتر.

أصبحت هذه التطورات ممكنة ليس فقط من خلال الخوارزميات الجديدة وبنى الشبكات العصبية ، ولكن أيضًا من خلال زيادة قوة الحوسبة لرقائق الرسومات (GPUs) وتوافر قواعد البيانات الكبيرة المصنفة (التي تحتوي على ملايين النقاط). (أمثلة مستخدمة في التدريب) ، والتي يتم إخبار الكمبيوتر بالإجابة الصحيحة لإنتاجها ، على سبيل المثال الفئة التي ينتمي إليها الكائن الرئيسي في الصورة).

يقوم الكمبيوتر بالتعلم الخاضع للإشراف: حيث يتم تغذيته بأمثلة يتكون كل منها من زوجين (الإدخال ، الإخراج المرغوب). في كثير من الأحيان ، يجب أن يتم توفير الإخراج المطلوب من قبل الإنسان. هذه الوظيفة الشاقة والمكلفة في وضع العلامات هي في صميم معظم الأنظمة الصناعية القائمة على التعلم العميق اليوم.

إقرأ أيضا:الأطراف الاصطناعية والفكر

التعلم العميق للذكاء الاصطناعي : الشبكات العصبية في التسعينيات كانت مقتصرة في المقام الأول على التعرف على الأنماط

في حين أن الشبكات العصبية في التسعينيات كانت مقتصرة في المقام الأول على التعرف على الأنماط ، مطبقة على إدخال يمثله متجه بحجم ثابت ، يمكن للشبكات العصبية اليوم معالجة المدخلات التي تختلف في الحجم – القوائم ، والمجموعات. ، والأشجار ، والرسوم البيانية ، إلخ.

بالإضافة إلى ذلك ، تمنح بعض الخوارزميات والبنى الشبكات العصبية ما يسمى بآلية الانتباه المنتشر ، والتي تجعل من الممكن في أي وقت تركيز الحساب على عنصر (أو عدد صغير من العناصر) من المدخلات الأكثر صلة. يمكن أن تكون هذه العناصر مواضع في صورة ما ، وفي هذه الحالة نتحدث عن الانتباه البصري أو أجزاء من الرسم البياني أو أي مجموعة أخرى من العناصر التي يتعين على الكمبيوتر معالجتها.

تسهل آلية الانتباه المنتشر تدريب الشبكة العصبية وكانت العنصر الرئيسي الذي سمح لنا بتحقيق اختراق في الترجمة الآلية ، بدءًا من 2014-2015. نجد الآن مثل هذا النظام في ترجمة Google ، بجودة ترجمة أعلى بكثير مما كان موجودًا من قبل.

يشارك الانتباه المنتشر أيضًا في الاستكشاف الحديث لآليات التفكير المنطقي. ينظر باحثو التعلم العميق اليوم إلى الاستدلال على أنه طريقة للجمع المتسلسل بين عدة عناصر (حقائق) من أجل الوصول إلى نتيجة (حقيقة مستنبطة أو مستنتجة). آلية الاستدلال (على سبيل المثال ، قاعدة الاستدلال من النوع: “إذا كان A و B ، ثم C”) نفسها لم يتم إصلاحها مسبقًا ، ولكن يتم تعلمها بواسطة الآلة ، بحيث يمكن للفرد حل المشكلات المقدمة إليها و التي يتطلب حلها المنطق.

تعليم غير مشرف عليه

لمقاربة الذكاء البشري ، سيكون من الضروري اكتشاف آليات التعلم التي يمكن للآلة من خلالها فهم الأعمال الداخلية لبيئتها. ومع ذلك ، من المستحيل الاعتماد على البشر لتقديم تفسير دلالي لجميع البيانات المستخدمة لقيادة الآلة. هذا هو السبب في أن الباحثين يبتعدون عن الإطار التقليدي للتعلم الخاضع للإشراف ويبدأون في الجمع بين التعلم غير الخاضع للإشراف والتعلم “المعزز”.

في التعلم العميق غير الخاضع للإشراف ، يتم تزويد الجهاز بمجموعة من البيانات أو الأمثلة دون تحديد النتيجة التي يجب تعيينها لكل منها: يجب أن تسمح الخوارزمية للنظام بتصنيف هذه البيانات بنفسه. (على سبيل المثال ، من العديد من صور المركبات المقدمة أثناء التدريب ، ستكون الآلة قادرة على تحديد ، على صورة جديدة ، ما إذا كان الكائن .المعروض هو مركبة أو شيء من طبيعة أخرى).

التعلم العميق للذكاء الاصطناعي : يهتم الباحثون بشكل خاص بالتعلم العميق

يهتم الباحثون بشكل خاص بالتعلم العميق غير الخاضع .للإشراف و “التوليدي” ، حيث يمكن للكمبيوتر إنشاء بيانات جديدة ومثيرة للاهتمام بشكل عشوائي ، على سبيل المثال تجميع صور. جديدة وأصوات جديدة .وجمل جديدة. مهمة فنان الكمبيوتر ليست سهلة: لا يكفي إنتاج وحدات البكسل بشكل عشوائي ، يجب تنظيم .هذه البكسلات بطريقة معقولة ، والتي يمكن ، على سبيل المثال ، أن تتوافق مع صورة طبيعية.

أما بالنسبة لما يسمى بعملية التعلم المعزز ، فهي تتكون من التعلم لإنتاج سلسلة من الإجراءات التي تزيد من هدف واحد أو أكثر أو المكافآت المستقبلية. هكذا ، على سبيل المثال ، يتعلم الطفل الفيزياء البديهية دون مساعدة والديه ، من خلال اللعب والمراقبة والتفاعل مع بيئته.

قد يسمح التعلم غير الخاضع للإشراف والمعزز للآلة بتمثيل العالم من حولها بشكل صحيح (أي لفهمه) وبالتالي التخطيط بشكل أفضل لأفعالها. من الصعب تقييم المدى الذي يجب أن نقطعه للوصول إلى مثل هذا المستوى من الذكاء الاصطناعي. ولكن ما هو مؤكد هو أن العديد من التطبيقات المفيدة ستكون ممكنة من الغد بفضل تقنيات التعلم العميق التي نعرفها .بالفعل (ومن هنا حماسة العديد من الشركات لهذا المجال). وأن هذه الإمكانات ستكون أكبر عندما تؤدي الأبحاث الأساسية إلى ذكاء اصطناعي يضاهي ذكاء الإنسان.

العوائق تتغلب تدريجيا

بشكل عام ، الوضع ليس بهذه البساطة ، فالوظيفة التي تربط المعلمات بالهدف الذي تحققه ليست محدبة. ومع ذلك ، يمثل التحسين غير المحدب تحديًا أكثر صعوبة. يعتقد العديد من الباحثين أنه لم يكن من الممكن مقابلته. يمكن أن تتعثر خوارزمية التعلم بالفعل في الحد الأدنى المحلي ، والذي لا يمكنها الخروج منه إذا قامت بتعديل المعلمات في خطوات صغيرة.

لكنني وزملائي أظهرنا أنه إذا كانت الشبكة العصبية كبيرة بما يكفي ، فإن مشكلة الحدود الدنيا المحلية تقل بشكل كبير. في مثل هذه الشبكة ، تتوافق معظم الحدود الدنيا المحلية مع مستوى تعليمي مكافئ تقريبًا لمستوى الحد الأدنى العالمي.

على الرغم من أن المشاكل النظرية للتحسين قابلة للحل . من حيث المبدأ ، إلا أن إنشاء شبكات كبيرة بأكثر من طبقتين أو ثلاث طبقات قد فشل في كثير من الأحيان. منذ عام 2005 ، بدأ البحث الممول من ICRA يؤتي ثماره وتم التغلب على العقبات تدريجياً. في عام 2006 ، تمكنا من تدريب شبكات عصبية أعمق باستخدام تقنية عملت طبقة تلو طبقة.

التعلم العميق للذكاء الاصطناعي : ضوضاء لتعلم أفضل

في وقت لاحق ، في عام 2011 ، وجدنا طريقة لتدريب شبكات .أعمق (مع طبقات أكثر من الخلايا العصبية الافتراضية) عن طريق تغيير العمليات التي تقوم بها كل خلية من الخلايا العصبية ، مما يجعلها أشبه بالخلايا العصبية البيولوجية .بطريقتها الخاصة. لمعالجة المعلومات. وجدنا أيضًا أنه عن طريق حقن ضوضاء عشوائية في الإشارات .المنقولة بين الخلايا العصبية أثناء التعلم – مثل ما يحدث في الدماغ – تتعلم الشبكات بشكل أفضل لتحديد صورة أو صوت بشكل صحيح.

بالإضافة إلى ذلك ، ساهم عاملان أساسيان في نجاح تقنيات التعلم العميق. الأول هو زيادة القوة الحاسوبية لأجهزة الكمبيوتر بمقدار 10 أضعاف بفضل معالجات معالجة الصور المخصصة (المصممة في الأصل لألعاب الفيديو!) ، مما جعل من الممكن تدريب شبكات أكبر في وقت واحد معقول. العامل الثاني هو أنه أصبح بإمكان المرء الآن الوصول إلى قواعد بيانات معنونة ضخمة ، والتي من خلالها تمكنت خوارزميات التعلم من ممارسة التعرف على “قطة” ، على سبيل المثال ، في الصور التي تضمنت قطة من بينها ، وعناصر أخرى.

سبب آخر للنجاحات الأخي

سبب آخر للنجاحات الأخيرة في التعلم العميق .هو أن الشبكة قادرة .على تعلم إجراء مجموعة من العمليات الحسابية التي تبني أو تحلل صورة أو صوت أو أي نوع آخر من البيانات خطوة بخطوة. مع العمق الكافي ، تتفوق هذه الأجهزة في العديد من مهام التعرف البصري أو السمعي. أظهر العمل النظري والتجريبي الأخير أيضًا أنه من المستحيل إجراء بعض هذه العمليات الحسابية بفعالية بدون شبكة عميقة بدرجة كافية.

لكن ما الذي يحدث في قلب الشبكة العصبية العميقة؟ تقوم كل طبقة بتحويل مدخلاتها وتنتج مخرجات يتم إرسالها إلى الطبقة التالية. تركز الطبقات الأولى على التفاصيل في أصغر المقاييس ، ثم تكبر الطبقات التالية المقاييس المدروسة. كلما كانت الطبقات أعمق ، زادت تمثيلها للمفاهيم المجردة. على سبيل المثال ، يمكن للطبقات الأولى .عزل العناصر المميزة للكرسي ، ويمكن أن تظهر صورة الكرسي من معالجة الخلايا العصبية من طبقة أعمق ، على الرغم من أن مفهوم “الكرسي” لم يكن جزءًا من تصنيفات. دربت الشبكة. ويمكن أن يكون مفهوم الكرسي بحد ذاته مجرد خطوة وسيطة نحو إنشاء

السابق
ثورة التعلم العميق
التالي
خصائص الذكاء الاصطناعي