همه چیز در مورد OpenAI o1: مدل جدید هوش مصنوعی با قابلیت استدلال

هوش مصنوعی OpenAI o1 خانواده جدیدی از LLMها (مدل‌های زبانی بزرگ) و باهوش‌تر از GPT 4o (LLM قدرت‌دهنده ChatGPT) است. OpenAI ادعا می‌کند که o1 می‌تواند فکر کرده، استدلال کند و به‌طرز شگفت‌انگیزی احساس انسان بودن می‌کند. این شرکت چندین بنچمارک برای حمایت از ادعای خود منتشر کرده است. در ادامه بیایید علاوه‌بر بررسی بنچمارک‌ها، ببینیم که OpenAI o1 چگونه کار می‌کند، چگونه از آن استفاده کنیم، چقدر هزینه دارد و چه کارهایی می‌تواند انجام دهد و چه کاری نمی‌تواند انجام دهد.

هوش مصنوعی OpenAI o1 چیست؛ چگونه از GPT 4o بهتر است؟

پیش از آنکه شروع کنیم، در ابتدا دلیل و چرایی اهمیت o1 را بازگو می‌کنیم. با تولید متن توسط هوش مصنوعی، GPT 4o و همتایان آن، مانند سیستم‌های پیش‌بینی‌کننده پیشرفته با قابلیت تکمیل خودکار عمل می‌کنند. خب، گفته می‌شود که با خانواده مدل‌های LLM تازه معرفی‌شده o1، همه چیز قرار است تغییر کند.

OpenAI دو مدل o1-preview و o1-mini را معرفی کرده است. وقتی در هر جایی از این مقاله به o1 اشاره می‌کنیم، منظور مدل بزرگتر o1-preview است، مگر اینکه خلاف آن مشخص شده باشد.

o1 در داخل شرکت OpenAI با اسم رمز «Strawberry» شناخته می‌شود و به‌دلیل توانایی‌های استدلال مشابه انسان، به‌شدت موردانتظار بوده است.

“o” در O1 مخفف Omni به معنای «همه» و 1 به «بازنشانی شمارنده به 1» اشاره دارد. این نشان می‌دهد که این شرکت احساس می‌کند که o1 نقطه‌عطفی در تحقیقات هوش مصنوعی و نقشه‌راه محصول خود است.

مدل o1 برای یادگیری، درک اشتباهات، یادگیری مجدد و دنبال کردن استراتژی‌های مختلف برای حل یک مشکل آموزش دیده است.

هوش مصنوعی OpenAI o1

هوش مصنوعی OpenAI o1

OpenAI o1 چگونه کار می‌کند؟

o1 با استفاده از یک مجموعه داده جدید متناسب و یک الگوریتم/فرآیند بهینه‌سازی به نام «یادگیری تقویتی» آموزش داده می‌شود. o1 برای تجزیه‌وتحلیل و حل مسائل پیچیده (با ریاضیات و استدلال منطقی) ساخته شده است. به این فکر کنید که چگونه ذهن انسان زنجیره‌ای از افکار خرد را دنبال می‌کند که هر کدام به فکر دیگری منتهی می‌شود. به موازات آن، می‌تواند به چیزهای گسسته نیز فکر کند. به‌طور مشابه، o1 نیز الگوها را یاد می‌گیرد و به‌عنوان یک ماشین با حافظه گسترده، روی تعداد زیادی از مشکلات آموزش می‌بیند.

o1 ساخته شده است تا پاسخ‌های مناسب را تشخیص دهد یا مجموعه‌ای از مراحل مناسب را ازطریق رویکرد هویج و چوب انتخاب کند.

جایی که o1 واقعاً حتی محققان OpenAI را شگفت‌زده می‌کند زمانی است که این مدل درحین حل یک مشکل به یک مانع برخورد می‌کند، منابع بیشتری را جمع‌آوری می‌کند و از آن‌ها برای رسیدن به یک هدف استفاده می‌کند.

نقاط قوت OpenAI o1: کارهایی که می‌تواند انجام دهد

o1 می‌تواند مانند یک انسان استدلال کند.

می‌تواند خود را بررسی کند.

می‌تواند با استفاده از عباراتی شبیه به انسان «اوه، وقتم درحال تمام شدن است، اجازه دهید سریع به جواب برسم» یا «من می‌توانم این کار را انجام دهم، چه کنم؟»

o1 در المپیاد بین‌المللی ریاضی (IMO) برای دانش آموزان دبیرستانی در ایالات‌متحده 83 درصد امتیاز کسب کرده است؛ درحالی‌که GPT 4o فقط می‌تواند 13 درصد را مدیریت کند.

Apollo Research در آزمایش خود دریافته است که o1 نسبت‌به GPT-4o از خودشناسی، خود استدلالی/آگاهی و نظریه کاربردی ذهن بهتری برخوردار است.

o1 همچنین دارای مهارت‌های چندزبانه است، به‌ویژه در زبان‌هایی مانند کره‌ای و عربی.

می‌تواند بازی‌های معمایی مانند بازی‌های منطقی آکروستیک و LSAT را حل کند، به سؤالات شیمی درجه دکتری پاسخ دهد، به فیزیکدانان کمک کند تا فرمول‌های پیچیده را حل کنند، به محققان مراقبت‌های بهداشتی کمک کند تا داده‌های توالی سلولی را حاشیه‌نویسی کنند، بیماری فرد را براساس گزارش آن‌ها ازجمله علائم و تاریخچه تشخیص دهد، کدها، و تجزیه‌وتحلیل مختصر حقوقی بنویسد.

Jakub Pachocki، دانشمند ارشد OpenAI، می‌گوید: «این مدل زمان می‌خواهد؛ می‌تواند به مشکل فکر کند و سعی کند آن را تجزیه کرده و برای ارائه بهترین پاسخ به‌دنبال جواب‌هایی باشد.»

محدودیت‌های OpenAI o1: کارهایی که نمی‌تواند انجام دهد

o1 مانند GPT 4o و دیگر مدل‌های محبوب LLM امروزی چندوجهی نیست. به‌عبارت‌دیگر، نمی‌تواند فایل‌ها، تصاویر، ویدئوها و غیره را تجزیه‌وتحلیل کند. فقط می‌تواند متن را بخواند، پردازش کند و بنویسد.

نمی‌تواند صحفات وب را برای نتایج بلادرنگ مرور کند.

دانش آن تا اکتبر 2023 محدود است، درست مانند GPT-4o.

نگرانی‌های پیرامون OpenAI o1

OpenAI به‌وضوح بیان می‌کند که توهمات و سایر مشکلات ذاتی مدل‌های هوش مصنوعی مانند سوگیری‌ها را حل نکرده است.

پاسخ‌های آن هنوز می‌تواند از نظر واقعی اشتباه باشد.

فقط به این دلیل که در حل مسائل ریاضی خوب است، به این معنی نیست که می‌تواند معلم ریاضی خوبی باشد.

کند است و درحالی‌که به‌نظر می‌رسد در حال فکر کردن است (که حتی ممکن است حدود 10 ثانیه طول بکشد)، پیغامی دریافت می‌کنید که به شما می‌گوید «به چه چیزی فکر می‌کند/چه می‌کند.»

OpenAI برای اولین بار به یکی از مدل‌های خود رتبه «medium» را برای خطر سلاح‌های شیمیایی، بیولوژیکی، رادیولوژیکی و هسته‌ای داده است. این مدل دارای برچسب‌هایی است که به شما در مورد خطرات احتمالی استفاده بی‌احتیاطی از آن هشدار می‌دهد.

هوش مصنوعی OpenAI o1

هوش مصنوعی OpenAI o1

قیمت و زمان در دسترس بودن OpenAI o1

o1-preview و o1-mini اکنون برای کاربران ChatGPT Plus یا ChatGPT Team Plan در دسترس هستند و از 19 سپتامبر/29 شهریور برای کاربران ChatGPT Enterprise و ChatGPT Edu نیز در دسترس خواهند بود.

کاربران پولی می‌توانند تنها به 30 پیام در هفته (در مورد o1-preview) و 50 پیام در هفته (در مورد o1-mini) دسترسی داشته باشند.

o1-preview API تا 15 دلار برای هر 1 میلیون توکن ورودی و 60 دلار به‌ازای هر 1 میلیون توکن خروجی هزینه دارد. این درحالی است که GPT-4o به‌ازای هر 1 میلیون توکن ورودی، 5 دلار و برای هر 1 میلیون توکن خروجی، 15 دلار هزینه دارد.

o1-mini با هزینه‌ای 80 درصد ارزان‌تر از o1-preview در دسترس خواهد بود.

OpenAI همچنین اعلام کرده است که قصد دارد بعدها o1-mini را برای کاربران رایگان ChatGPT در دسترس قرار دهد. اما، این شرکت تاریخ انتشار یا جدول زمانی را اعلام نکرده است.

نحوه استفاده از OpenAI o1

مرحله 1: وب‌سایت ChatGPT.com یا اپلیکیشن ChatGPT را باز کنید.

مرحله 2: وارد حساب کاربری خود شوید. اگر کاربر ChatGPT Plus نیستید، پلن خود را ارتقا دهید.

مرحله 3: هنگامی که در صفحه اصلی قرار گرفتید، روی دکمه «ChatGPT» ضربه بزنید.

مرحله 4: بین مدل o1-preview یا o1-mini یکی را انتخاب کنید.

مرحله 5: با انتخاب کادر پیام شروع به چت کردن کنید. برای تست مدل‌های o1، دستور خود را وارد کنید.

نوشته همه چیز در مورد OpenAI o1: مدل جدید هوش مصنوعی با قابلیت استدلال اولین بار در ترنجی پدیدار شد.

منبع: ترنجی

تاریخ انتشار

در

,


با عنایت به اینکه سایت «اخبار تکنولوژی» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع مطلب و کاربران است. (قانون تجارت الکترونیک)

اخبار تکنولوژی نقشی در تولید محتوا ندارد و مطالب این سایت، بازنشر اخبار پایگاه‌های معتبر خبری است.