جوجل بدأت إضافة الخيال إلى ديبميند لمنظمة العفو (الدولية الروبوتات لديها خطط الآن)!؟؟؟؟ - Simply the Science

اخر المواضيع

الأحد، 30 يوليو 2017

جوجل بدأت إضافة الخيال إلى ديبميند لمنظمة العفو (الدولية الروبوتات لديها خطط الآن)!؟؟؟؟


وقد بدأ الباحثون تطوير الذكاء الاصطناعي مع الخيال - منظمة العفو الدولية التي يمكن أن العقل من خلال القرارات ووضع خطط للمستقبل، دون أن تكون ملزمة بالتعليمات البشرية.

وهناك طريقة أخرى لوضعها، وهي تخيل عواقب الإجراءات قبل اتخاذها، وهو أمر نأخذه على أنه أمر مسلم به ولكن الأمر أصعب بكثير على الروبوتات القيام به.

يقول الفريق العامل في مختبر ديبميند المملوك لشركة غوغل أن هذه القدرة ستكون حاسمة في تطوير خوارزميات منظمة العفو الدولية للمستقبل، مما يسمح للأنظمة للتكيف بشكل أفضل مع الظروف المتغيرة التي لم يتم برمجتها خصيصا ل. أدخل مخاوفك المعتادة من انتفاضة الروبوت هنا.

"عند وضع الزجاج على حافة طاولة، على سبيل المثال، من المرجح أن نتوقف عن النظر في مدى استقراره وما إذا كان قد ينخفض"، شرح الباحثون في مشاركة بلوق. واضاف "على اساس هذه النتيجة المتخيلة، يمكننا اعادة ضبط الزجاج لمنعه من الوقوع والكسر".

"إذا كانت خوارزمياتنا لتطوير سلوكيات متطورة على قدم المساواة، فإنها أيضا يجب أن يكون لديها القدرة على" تخيل "والعقل حول المستقبل، وبعيدا عن ذلك يجب أن تكون قادرة على بناء خطة باستخدام هذه المعرفة".

لقد رأينا بالفعل نسخة من هذا التخطيط إلى الأمام في الانتصارات الذهاب أن البوتات ديبميند قد سجل أكثر من المعارضين الإنسان في الآونة الأخيرة، كما منظمة العفو الدولية يعمل على النتائج المستقبلية التي سوف تنتج عن أعمالها الحالية.

قواعد العالم الحقيقي هي أكثر تنوعا وتعقيدا بكثير من قواعد الذهاب على الرغم من ذلك، وهذا هو السبب في الفريق يعمل على نظام يعمل على مستوى آخر.

ولتحقيق ذلك، جمع الباحثون عدة مقاربات منظمة العفو الدولية معا، بما في ذلك التعلم التعزيز (التعلم من خلال التجربة والخطأ) والتعلم العميق (التعلم من خلال معالجة كميات هائلة من البيانات بطريقة مماثلة للدماغ البشري).

ما انتهى بهم هو نظام يجمع بين التجربة والخطأ مع قدرات المحاكاة، لذلك السير يمكن معرفة المزيد عن بيئتهم ثم التفكير قبل أن تتصرف.

واحدة من الطرق التي اختبرت خوارزميات جديدة كان مع لعبة فيديو 1980s دعا سوكوبان، والتي اللاعبين لديهم لدفع صناديق حول حل الألغاز. بعض التحركات يمكن أن تجعل مستوى غير قابل للحل، وهناك حاجة إلى التخطيط المتقدم لذلك، ومنظمة العفو الدولية لم تعطى قواعد اللعبة مسبقا.

ووجد الباحثون أن "منظمة العفو الدولية" الخيالية الجديدة حلت 85 في المئة من المستويات التي أعطيت، مقارنة مع 60 في المئة وكلاء منظمة العفو الدولية باستخدام النهج القديمة.

ويضيف الباحثون: "يتفوق الوكلاء المعززون على الخيال على أساسيات الخيال الأقل كثيرا". واضاف "انهم يتعلمون بخبرة اقل ويمكنهم التعامل مع العيوب في نمذجة البيئة".

وأشار الفريق إلى عدد من التحسينات في برامج السير الجديدة: فبإمكانها معالجة الثغرات في معارفها على نحو أفضل، كانت أفضل في التقاط معلومات مفيدة عن عمليات المحاكاة، ويمكنها أن تتعلم استراتيجيات مختلفة لوضع الخطط.

انها ليست مجرد التخطيط المسبق - انها التخطيط المسبق مع المزيد من الإبداع، لذلك يمكن الجمع بين الإجراءات المستقبلية المحتملة معا أو مختلطة بطرق مختلفة من أجل تحديد الطرق الواعدة إلى الأمام.

على الرغم من نجاح اختبار ديبميند، فإنه لا يزال الأيام الأولى لهذه التكنولوجيا، وهذه الألعاب لا تزال شوطا طويلا من تمثيل تعقيد العالم الحقيقي. ومع ذلك، فهي بداية واعدة في تطوير منظمة العفو الدولية التي لن تضع كوب من الماء على طاولة إذا كان من المرجح أن تنتشر، بالإضافة إلى جميع أنواع سيناريوهات أخرى أكثر فائدة.

ويضيف الباحثون: "هناك حاجة إلى مزيد من التحليل والنظر لتوفير حلول قابلة للعوامل الغنية القائمة على نموذج والتي يمكن أن تستخدم خيالهم لسبب - وخطة - للمستقبل".


عبدالرحمن مصطفى

ليست هناك تعليقات:

إرسال تعليق