سخنران کلیدی

موضوع سخنرانی
به سوی درک عمیق: چرا هوش مصنوعی به چیزی فراتر از مدلهای بزرگ زبانی نیاز دارد؟
چکیده
امروزه گرچه مدلهای بزرگ زبانی (LLM) مرزهای علم و فناوری را در هوش مصنوعی و پردازش زبان طبیعی جابجا کرده اند ولی بدلیل برخی مشکلات و چالشهایشان هنوز تا هوش مصنوعی واقعی فاصله دارند.
این ارائه با اشاره به “معنا” آغاز میشود و به نحوه بازنمایی آن ابتدا در منابع ساختیافته دانش مانند هستانشناسیها و گرافهای دانش، و در ادامه در مدلهای بزرگ زبانی می پردازد. سپس با اشاره به نقاط قوت و ضعف مدلهای بزرگ زبانی، مشکلاتی مانند تولید توهم، درک سطحی، و ناکارآمدی در استنتاج منطقی عمیق را انگیزه ای برای حرکت به سمت تقویت این مدلها با دانش مفهومی و انتزاعی میشمارد. در ادامه پس از بررسی روشهای تلفیق دانش با مدل های بزرگ زبانی، مدلهای بزرگ مفهومی (LCM) را بعنوان یک تغییر پارادایم با بازگشت به مفاهیم بنیادین مهندسی دانش برای حل چالشهای فوق معرفی می نماید. این سخنرانی با تحلیل مزایا و چالشهای مدلهای بزرگ مفهومی ، با ارائه چشماندازی برای آینده به پایان میرسد: مدلهای هوش مصنوعی غنی از دانش که وظایف پیشآموزش، روشهای تزریق دانش، و کل پارادایم را بازتعریف کرده اند تا راه را به سمت درک عمیق و توسعه سیستم های هوشمند واقعی هموار نمایند.