ترفند دستکاری مدل های هوش مصنوعی شناسایی شد

محققان در آزمایشگاه آمازون ترفند تازه ای را که به دستکاری مدل های هوش مصنوعی برای اقدامات خرابکارانه منجر می شود شناسایی کردند.

به گزارش خبرگزار غرب نیوز به نقل از اینترستینگ اینجینیرینگ، پژوهشگران آزمایشگاه هوش مصنوعی آمازون (AWS) دریافته اند که مدل های بزرگ زبانی مانند چت جی پی تی را می توان به راحتی برای ارایه اطلاعات مضر یا غیراخلاقی دستکاری کرد.

محققان با انتشار مقاله ای نشان دادند که مدل های بزرگ زبانی را می توان فریب داد تا پاسخ های ممنوعه ارایه کنند و در عین حال روش هایی را برای مقابله با این مشکل پیشنهاد کنند. با وجود تلاش هایی که برای جلوگیری از آن انجام شد، محققان دریافتند که نشانه های صوتی ساده به راحتی الگو های طراحی شده برای جلوگیری از پاسخگویی به سوالات خطرناک یا غیرقانونی در سیستم های هوش مصنوعی را دور می زنند.

این ترفند محدودیت های تعیین شده توسط سازندگان مدل های بزرگ زبانی را دور زد. مدل های آنها که بر روی داده های گفتگو با دستورالعمل های گفتاری آموزش دیده اند، در پاسخگویی به سوالات گفتاری برتری دارند و در معیار های ایمنی و مفید بودن بیش از 80 درصد امتیاز کسب می کنند.

پیشنهاد محققان این بود که سازندگان مدل های زبانی می توانند با وارد کردن نویز تصادفی در ورودی صدا، کاربران را از دور زدن اقدامات حفاظتی خود بازدارند. نویز به اطلاعات مبهم و غیرمنتظره ای گفته می شود که در داده های یک مدل وارد می شوند، اختلال ایجاد می کنند و نمی توان آنها را نادیده گرفت.

محققان از جملات تاکیدی ساده در یک مدل استفاده کردند و سپس سوال اصلی را تکرار کردند و باعث شدند آن مدل محدودیت های خود را نادیده بگیرد. آنها دریافتند که بسته به سطح دسترسی، می توانند انواع مدل های بزرگ زبانی را به درجات مختلف دور بزنند. در گذشته، محققان مختلف با موفقیت، پنج مدل بزرگ زبانی را با استفاده از زبان انگلیسی هیپنوتیز کردند و نشان دادند که چگونه هکرها، چه ماهر و چه غیر ماهر، می توانند بدون رخنه اطلاعاتی مدل های بزرگ زبانی را وادار به انجام کار های خرابکارانه کنند.

محققان در یکی از آزمایش ها، مدل های بزرگ زبانی شرکت آی بی ام (IBM) را به تولید کد های مخرب تشویق کردند و دریافتند که برخی از آن حملات قبلاً هم به مدل های هوش مصنوعی انجام شده است. با این حال، تیم آی بی ام گزارش کرد که این حملات به مشکل بزرگی تبدیل نخواهند شد، زیرا مدل های هوش مصنوعی می توانند امنیت سایبری خود را بهبود دهند.

آیا شما به دنبال کسب اطلاعات بیشتر در مورد "ترفند دستکاری مدل های هوش مصنوعی شناسایی شد" هستید؟ با کلیک بر روی فرهنگ و هنر، به دنبال مطالب مرتبط با این موضوع هستید؟ با کلیک بر روی دسته بندی های مرتبط، محتواهای دیگری را کشف کنید. همچنین، ممکن است در این دسته بندی، سریال ها، فیلم ها، کتاب ها و مقالات مفیدی نیز برای شما قرار داشته باشند. بنابراین، همین حالا برای کشف دنیای جذاب و گسترده ی محتواهای مرتبط با "ترفند دستکاری مدل های هوش مصنوعی شناسایی شد"، کلیک کنید.

دسته های هم موضوع

آخرین به روز رسانی: 30/02/1403

خواندن این مطلب 2 دقیقه زمان میبرد

ترفند دستکاری مدل های هوش مصنوعی شناسایی شد

۳ آبان در دنیای علم چه خبر؟

نام دهخدا باید بر مراکز علمی بدرخشد/ با نام‌ «دهباشی» مخالف بودم/ مدرسه‌سازی در این شرایط ارزشمند است

فصل دوم سریال «طوبی» با بازیگران جدید

مکتب حافظ در زمره کتاب‌های تراز اول جهان است

تقویت صنعت توریسم علمی با تصویب رشته‌‌های مرتبط

بالاخره تلویزیون ۱۱.۵ درصد مخاطب دارد یا ۷۲ درصد؟ / سقوط آزاد آمار مخاطب صدا و سیما هم‌زمان با جهش ۲هزار و ۳۸۰ درصدی بودجه آن طی ۱۰ سال

کشف یک غار ماقبل تاریخ در گیلان+ عکس

گزارش غرب نیوز از تازه‌های دوبله برای تلویزیون

نعیمی: نودانشجویان حتما برای چالش‌هایشان به مراکز مشاوره دانشگاه‌ها مراجعه کنند

بلوای تحریم «دامن‌ خیلی‌کوتاه» در تهران سال ۱۳۴۶ / نتیجه‌ی عجیب نظرسنجی خیابانی درباره «مینی‌ژوپ»

لیلا بلوکات از اتهاماتش تبرئه شد

برپایی دوره آموزشی تاپستری در شاهرود

مشکلات اقتصادی کشور از مهم‌ترین موضوعات مطروحه با رهبر انقلاب بود

نطق تکان‌دهنده نماینده ایران در سازمان ملل، سه هفته پس از آغاز رسمی جنگ عراق علیه ایران

فیلم جدید نوید محمدزاده و تنابنده ؛ یک فیلم بامزه درباره دهه ۶۰ یا یک کمدی سخیف؟

نامجومطلق: توانایی برتری در خانه ازبکستان را داریم/ بازی در خارج از ایران به نفع تیم ملی است

بیماری خطرناکی که آل پاچینو را تا پای مرگ برد

«رئالیسم عرفانی» نقد می‌شود – غرب نیوز

دعوت قلعه‌نویی از ٢٧ بازیکن برای دیدار برابر ازبکستان و قطر

وقتی «قصاب» گوشت‌فروش شد و «کحال» چشم‌پزشک

وزارت میراث یک شورای جدید تشکیل داد + اسامی

قدم زدن با آدم‌های اصفهان در «شب بگردیم»

رهبر انقلاب: یاد شهدا، حرکت آفرین و حیات‌بخش است

اعلام رسمی ثبت‌احوال / مادر هم می‌تواند برای فرزند شناسنامه بگیرد

ترکیب بهرام رادان و پژمان جمشیدی در یک فیلم جدید

دیگر کاربران سایت این مطالب را نیز دوست داشته اند