به گزارش علمی نیوز و به نقل از Psychology Today، همانطور که ما برای استفاده و درک هوش مصنوعی (AI) تلاش می کنیم، پتانسیل استفاده نشده مدل های زبان بزرگ (LLM) به طور فزاینده ای آشکار می شود. این مدلهای قدرتمند که بر روی مجموعهای از دادهها آموزش دیدهاند، گنجینه عظیمی از دانش را در خود نگه میدارند که بسیار فراتر از توانایی آنها برای تولید متنی شبیه انسان است. با این حال، بسیاری از این دانش نهفته باقی میماند و در انتظار بازگشایی و استفاده برای کاربردهای عملی است. یک مقاله جدید یک رویکرد جدید برای استخراج این حکمت نهفته ارائه میکند ، و LLMها را به دانشمندان و سوژهها از طریق استفاده از مدلهای علّی ساختاری (SCMs) و تکنیکهای انگیزشی با دقت ساخته شده تبدیل میکند.
دوگانگی منحصر به فرد LLM به عنوان دانشمندان و سوژه ها
مقاله منینگ و همکاران. تغییری را در نحوه تعامل و یادگیری ما با LLM ها معرفی می کند. با ادغام SCM ها، ابزاری از تجزیه و تحلیل آماری و یادگیری ماشین، با LLM، محققان آزمایشگاه های مجازی ایجاد می کنند که در آن تعاملات پیچیده انسانی و فرآیندهای تصمیم گیری می تواند تحت شرایط کنترل شده شبیه سازی و مطالعه شود. در این رویکرد، LLMها هم نقش دانشمندان، طراحی و اجرای آزمایشها و هم افراد شرکتکننده در سناریوهای شبیهسازی شده را بر عهده میگیرند.
این نقش دوگانه LLM ها راه های جدیدی را برای درک پویایی های پنهان و سوگیری هایی که نتایج دنیای واقعی را شکل می دهند باز می کند. به عنوان مثال، این مقاله نشان میدهد که چگونه یک LLM میتواند جلسه وثیقه را شبیهسازی کند، با این مدل که به عنوان قاضی، متهم، وکیل مدافع و دادستان عمل میکند. با تغییر سیستماتیک عواملی مانند سابقه کیفری متهم، حجم پرونده قاضی، و میزان پشیمانی متهم، محققان بینش هایی را در مورد چگونگی تأثیر این متغیرها بر مبلغ نهایی وثیقه کشف می کنند. این رویکرد نه تنها دانش ضمنی را از داده های آموزشی LLM استخراج می کند، بلکه تأثیر متقابل پیچیده عواملی را که به تصمیم گیری قضایی کمک می کند، روشن می کند.
قدرت تشویق
در حالی که SCM ها یک چارچوب ساختاریافته برای کاوش دانش نهفته در LLM ها ارائه می دهند، اثربخشی این رویکرد به نقش حیاتی تحریک بستگی دارد. تکنیکهای تحریک شامل ایجاد دقیق توالیهای ورودی است که LLM را به سمت وظایف یا خروجیهای خاص هدایت میکند. در زمینه استفاده از LLM به عنوان دانشمند و موضوع، تحریک نقش مهمی در برانگیختن رفتارهای مورد نظر و استخراج مرتبط ترین بینش ایفا می کند.
این مطالعه همچنین بر اهمیت طراحی اعلانهایی که هم خاص و هم با پایان باز هستند، تأکید میکند و به LLM اجازه میدهد تا دانش خود را در عین حفظ انعطافپذیری برای ایجاد بینشهای جدید به نمایش بگذارد. برای مثال، در سناریوی دادرسی وثیقه، محققان از اعلانهایی استفاده میکنند که زمینه و نقشهای لازم را در اختیار LLM قرار میدهد، در حالی که مدل را تشویق میکند تا تفاوتهای ظریف انگیزهها و فرآیندهای تصمیمگیری هر شخصیت را بررسی کند.
علاوه بر این، این مطالعه بر ماهیت تکرار شونده مهندسی سریع تأکید دارد، جایی که محققان به طور مداوم اعلان های خود را بر اساس پاسخ های LLM و بینش های به دست آمده از هر شبیه سازی اصلاح می کنند. این فرآیند تنظیم دقیق، محققان را قادر میسازد تا عمیقتر در دانش نهفته LLM تحقیق کنند، سوگیریهای پنهان را کشف کنند و مداخلات بالقوه را برای کاهش تأثیر آنها شناسایی کنند.
آزمایشگاه های بزرگ زبان
این رویکرد پیامدهای گسترده ای در حوزه های مختلف دارد. در زمینههایی مانند علوم اجتماعی، اقتصاد و روانشناسی، این روششناسی میتواند شیوهی انجام آزمایشها و آزمایش فرضیهها را متحول کند. با استفاده از LLM به عنوان آزمایشگاه های مجازی، محققان می توانند به سرعت روی طرح های آزمایشی تکرار کنند، موارد خلاف واقع را کشف کنند، و بینش هایی را کشف کنند که ممکن است از طریق تحقیقات سنتی موضوع انسانی به دست آوردن آنها دشوار یا غیراخلاقی باشد.
علاوه بر این، توانایی استخراج و عملیاتی کردن دانش خفته در LLMها دارای پتانسیل قابل توجهی برای کاربردهای دنیای واقعی است. کسبوکارها میتوانند از این تکنیکها برای به دست آوردن بینش عمیقتر در مورد رفتار مصرفکننده ، بهینهسازی فرآیندهای تصمیمگیری، و توسعه راهحلهای شخصیشدهتر و مؤثرتر مبتنی بر هوش مصنوعی استفاده کنند. با کشف و پرداختن به سوگیریهای تعبیهشده در LLM، میتوانیم برای ساختن سیستمهای هوش مصنوعی که تنوع تجربیات انسانی را بهتر منعکس میکند، کار کنیم.
ظهور آزمایش "In-Silico".
با نگاهی به آینده، تحقیقات آینده میتواند بر گسترش دامنه سناریوها و حوزههایی که میتوان در آنها این رویکرد را اعمال کرد، اصلاح تکنیکهای تحریک کننده برای استخراج بینشهای دقیقتر و توسعه ابزارها و چارچوبهای جدید برای سادهسازی ادغام SCMs و LLM تمرکز کرد. همانطور که ما همچنان مرزهای آنچه را که با هوش مصنوعی امکان پذیر است پیش می بریم ، توانایی مهار دانش نهفته در LLM بدون شک نقشی اساسی در شکل دادن به آینده فناوری و جامعه ایفا خواهد کرد.
این مطالعه به عنوان یک فراخوان برای محققان و پزشکان به طور یکسان عمل می کند تا پتانسیل های استفاده نشده در LLM ها را بشناسند و فعالانه به دنبال راه های جدیدی برای استخراج و استفاده از این دانش خفته باشند. با استفاده از قدرت SCM ها و تکنیک های تحریک، می توانیم این مدل های زبانی را به ابزارهای ارزشمندی برای اکتشافات علمی، نوآوری های تجاری و پیشرفت اجتماعی تبدیل کنیم. جواهرات پنهان در LLM ها منتظر کشف ما هستند و کلید باز کردن قفل آنها در توانایی ما برای پرسیدن سؤالات درست و طراحی درخواست های مناسب نهفته است.