برای اهالی سینما دیدن فیلمهای مرتبط با هوش مصنوعی همواره جذابیتهای خاص خود را دارد.
یک جستجوی ساده هم شما را به دهها فیلم مشهور با این مضمون هدایت میکند؛ در یکی از دیالوگهای فیلم «Ex Machina» کیلب (انسان) و اوا (هوش مصنوعی) با هم در مورد سن اوا صحبت میکنند. اوا میگوید «من یک هستم» و در برابر پرسش اینکه «یک چی؟ یک سال یا یک روز» تنها پاسخ میدهد «یک».
این درست همان تعریفی است که شاید بتوان در مورد هر هوش مصنوعی دیگری نیز داد. در واقع هوش مصنوعی هر لحظه یک بخش و مرحله جدید است و میتوان گفت که «یک» اینجا عمر واقعی و بدون معیار هوش مصنوعی است.
حالا هوش مصنوعی یک قدم دیگر به سمت پیشرفتهتر شدن برداشته و به توانایی لبخوانی دست یافته است. پروژه گوگل DeepMind با همکاری دانشگاه آکسفورد بر اساس دادهها و برنامههایی که از سوی شبکهی جهانی بیبیسی در اختیار آنها قرار گرفته توانستهاند این قابلیت را به هوش مصنوعی گوگل اضافه کنند.
هوش مصنوعی گوگل نزدیک به ۵ هزار ساعت (از ۶ برنامه متفاوت) را شامل ۱۱۸ هزار جمله بررسی کرده است. محققان گوگل و دانشگاه آکسفورد بر روی این پروژه در فاصله ژانویه ۲۰۱۰ تا دسامبر ۲۰۱۵ تحقیق کردهاند و در فاصله مارس تا سپتامبر ۲۰۱۶ آن را در مرحله تست به راه انداختند.
برای مقایسه دقت این هوش مصنوعی کافیست بدانید که یک لبخوان حرفهای تنها با ۱۲/۴ درصد بدون هیچ خطایی کار میکند و این میزان در هوش مصنوعی گوگل ۴۶/۸ درصد، چیزی نزدیک به ۴ برابر انسان کار میکند. بسیاری از ایرادات این هوش مصنوعی در خواندن کلماتی که به اصطلاح کوتاه ادا میشوند (مانند گفتن S در پایان برخی واژهها) مربوط است.
بسیاری بر این باورند که به سرانجام رسیدن این پروژه گام بسیار بزرگی در رسیدن به «لبخوانی اتوماتیک» است. زینگ ژوو استاد دانشگاه اولو در فنلاند با تایید این نگاه بر این باور است که «دستاورد اخیر بدون در اختیار داشتن این حجم بزرگ از دادهها و آرشیو بسیار دور از دسترس بود».
نزدیک به دو هفته پیش، محققان دانشگاه آکسفورد سیستم مشابهی به نام LipNet معرفی کرده بودند. برنامه موبایلی که میتواند نزدیک به ۹۰ درصد محتوای برخی ویدیوهای ضبط شده را درک کند. اما محدودیتهای بسیار این برنامه نسبت به برنامهای که به تازگی عرضه شده قابل مقایسه نیست.
برای مثال میتوان گفت LipNet تنها به روی افرادی خاص و آن هم زمانی که جملات رسمی بیان میگردند، آزمایش شد اما هوش مصنوعی گوگل در لحظه ویدیوها را نگاه میکند و در شرایط مختلف میتواند لبخوانی کند. در واقع هوش مصنوعی گوگل حالا به برنامههای ضبط شده محدود نیست و میتواند به سرعت خود را با شرایط گوناگون تطبیق دهد.
یکی از مهمترین مسائلی که در ابتدا به ذهن بسیاری میرسد استفاده این هوش مصنوعی برای بالا بردن امنیت و لبخوانی توسط دوربینهای مدار بسته شهری است. اما کارشناسان تاکید دارند که این سیستم امروز تنها به روی ویدیوهای تمام اچ.دی. قابلیت اجرا دارد و هنوز با آنکه بتواند با دوربینهایی که فریم پایین دارند کار کند فاصله زیادی دارد. اما محققان DeepMind تاکید میکنند هدف آنها از توسعه این کیفیت در هوش مصنوعی برای کمک کردن به افرادی است که دارای شنوایی ضعیف هستند تا به آنها در درک بهتر واژهها کمک کنند. از سوی دیگر در صنعت فیلمسازی کمک بسیاری خواهد کرد تا متن فیلمهای صامت نیز نوشته شود و در دنیای فنآوری دستیارهای دیجیتال همچون سیری و آلکسا نیز میتوانند پیشرفتهای بیشتری داشته باشند.
در بخشی از فیلم «Ex Machina»، خالقِ اوا (یک زن هوش مصنوعی) میگوید: «یک روز این موجودات هوش مصنوعی به ما انسانها درست همانطوری نگاه میکنند که ما به فسیلهای پیدا شده در آفریقا نگاه میکنیم: یعنی یک میمون که در گرد و غبار زندگی میکند آن هم با زبانی خام و یک زندگی در حال انقراض.»
اما شاید دنیا به این سیاهیها هم نباشد چرا که هنوز مشخص نیست رابطه انسان و هوش مصنوعی در آینده چه خواهد بود. هرچه هست، امروز رباتها برای کمک به انسانها خلق میشوند تا جامعهه بشری زندگی بهتری را تجربه کند. آینده را کسی نمیداند…
* منبع: New Scientist
* ترجمه و تنظیم: کامیار بهرنگ