درک زبان طبیعی توسط هوش مصنوعی بایدو: موتور جستجوگر بایدو چین با داشتن هوش مصنوعی زبانی خود با نام Ernie توانسته به رتبه ای بالاتر از نود، در درک زبان طبیعی انسان شود. در ماه دسامبر بایدو توانست بیشترین پتنت در زمینه هوش مصنوعی را ثبت نموده و بزرگانی دیگر در این عرصه از قبیل مایکروسافت و گوگل را پشت سر بگذارد. GLUE بنچمارک شناختهشده و مقبولی در حوزهی مطالعات زبانی است که مشخص میکند هر سیستم هوش مصنوعی چقدر میتواند زبان انسانی را درک کند. این بنچمارک شامل ۹ تکلیف درک زبان طبیعی شامل نامیدن اسامی افراد و سازمانها در جمله و تشخیص مرجع ضمایری چون «آن» در جملات است که مشخص کند به کدامیک از چندین اسم مشخص در جمله بازمیگردد. مدل زبانیای که در جدول ردهبندی GLUE بیشترین امتیاز را دارد، میتواند ازپسِ متنوعترین تکالیف درک مطلب زبانی نیز برآید. عملکرد درک زبان انسانی GLUE نمرهی ۸۷ از ۱۰۰ را کسب کرده است؛ اما اکنون بایدو با مدل زبانی خود بهنام ERNIE اولین تیمی است که موفق شده از نمره ۹۰ فراتر رود.
هوش مصنوعی بایدو
جدول ردهبندی GLUE دائما در حال تغییر است و جای تعجب نخواهد بود اگر تیم دیگری بهزودی جای بایدو را در مقام اول جدول ازآنِ خود کند. نکته درخورتوجه درباره موفقیت بایدو این است که نشان میدهد چگونه تحقیقات هوش مصنوعی از تنوع مشارکتکنندگان سود میبرد. بنابراین، پژوهشگران هوش مصنوعی بایدو تکنیکی را بهطور خاص برای زبان چینی بهنام «بازنمود پیشرفته ازطریق یکپارچهسازی دانش» ساختهاند که بهاختصار ERNIE خوانده میشود. این تکنیک بهطور خاص برای زبان چینی طراحی شده است؛ اما همین تکنیک باعث عملکرد بهتر درک زبان انگلیسی نیز شده است.
آخرین نسخه مدل زبانی ERNIE از چندین تکنیک آموزش دیگر نیز بهرهمند شده است. بهعنوان مثال، ترتیب جملات و فواصل قرارگرفتن بین آنها (یعنی جملهی «الف» باتوجهبه معنا بعد از چند جملهی دیگر برای تکمیل معنای پاراگراف بعد از جملهی «ب» باید آورده شود) را برای درک پیشرفت منطقی پاراگراف در نظر میگیرد. از همهی اینها مهمتر، مدل زبانی ERNIE از روشی بهنام آموزش مداوم بهره میبرد که به آن امکان میدهد آموزش روی دادههای جدید و تکالیف جدید زبانی را بدون فراموشکردن مواردی فراگیرد که قبلا آموخته است. این امر به ERNIE این امکان را میدهد تا در انجام طیف وسیعی از تکالیف زبانی با گذشت زمان و صرف حداقل مداخلههای انسانی عملکرد بهتری داشته باشد.