loading...
مجله تخته نرد شش و بش
soltan_nard بازدید : 952 نظرات (0)

 

خلاصه مقاله:

دراين مقاله يكي از انواع يادگيري ماشين با نام يادگيري تقويتي معرفي شده كاربرد آن در بازي تخته نرد ارايه مي شود. دراين نوع از يادگيري عامل از طريق تعامل با محيط و مشاهده ي نتايج اقداماتش كه بصورت مجازات يا پاداش است از محيط دريافت مي كند سپس عامل ياد مي گيرد چگونه رفتار كند تا پاداش دريافتي اش در طول زمان بيشينه شود در بازيهاي تصادفي راهبردها براي بازيكنان در بازي يكسان نيست. به همين دليل در مسائلي از قبيل اقتصاد و بازار سهام مورد كاربرد قرار ميگيرند. اين مقاله نحوه ي بكارگيري دو الگوريتم به نامهاي يادگيري تفاوت زماني و نوع گسترش يافته ي آن يعني يادگيري كيو را در يكي از مشهورترين بازيهاي تصادفي بيان مي كن .

برای دانلود مقاله به ادامه مطلب مراجعه نمایید




نوع فايل: pdf  دانلود فایل

مطالب مرتبط
ارسال نظر برای این مطلب

کد امنیتی رفرش
درباره ما
مجله تخته نرد شش و بش هر ماه به صورت پی دی اف در یک شماره منتشر میگردد . هدف ما آشنا نمودن شما نردبازان عزیز با متد ها و روش های روز دنیا در این بازیست . مطمئن باشید با یک بار خواندن این مجله مشترک ما خواهید شد . توجه داشته باشید برای دسترسی به تمامی مطالب میبایست عضو شوید. همچین این امکان را برایتان فراهم آورده ایم تا پس از ورود به پنل کاربری بتوانید برای شش و بش مطلب ارسال نمایید . مطالب ارسالی شما پس از بررسی با نام شما در این وبسایت درج خواهد شد . برای مشاهده مناسب وب سایت از مرورگر فایر فاکس استفاده نمایید.
اطلاعات کاربری
  • فراموشی رمز عبور؟
  • آمار سایت
  • کل مطالب : 364
  • کل نظرات : 141
  • افراد آنلاین : 4
  • تعداد اعضا : 2602
  • آی پی امروز : 92
  • آی پی دیروز : 137
  • بازدید امروز : 465
  • باردید دیروز : 347
  • گوگل امروز : 12
  • گوگل دیروز : 9
  • بازدید هفته : 3,826
  • بازدید ماه : 11,175
  • بازدید سال : 90,057
  • بازدید کلی : 1,122,146
  • کدهای اختصاصی