هوش مصنوعی گوگل بهتر از انسان لب‌خوانی می‌کند

- برای مقایسه دقت این هوش مصنوعی کافیست بدانید که یک لب‌خوان حرفه‌ای تنها با ۱۲/۴ درصد بدون هیچ خطایی کار می‌کند و این میزان در هوش مصنوعی گوگل ۴۶/۸ درصد، چیزی نزدیک به ۴ برابر انسان است

چهارشنبه ۱۰ آذر ۱۳۹۵ برابر با ۳۰ نوامبر ۲۰۱۶

برای اهالی سینما دیدن فیلم‌های مرتبط با هوش مصنوعی همواره جذابیت‌های خاص خود را دارد.

یک جستجوی ساده هم شما را به ده‌ها فیلم مشهور با این مضمون هدایت می‌کند؛ در یکی از دیالوگ‌های فیلم «Ex Machina» کیلب (انسان) و اوا (هوش مصنوعی) با هم در مورد سن اوا صحبت می‌کنند. اوا می‌گوید «من یک هستم» و در برابر پرسش اینکه «یک چی؟ یک سال یا یک روز» تنها پاسخ می‌دهد «یک».

این درست همان تعریفی است که شاید بتوان در مورد هر هوش مصنوعی دیگری نیز داد. در واقع هوش مصنوعی هر لحظه یک بخش و مرحله جدید است و می‌توان گفت که «یک» اینجا عمر واقعی و بدون معیار هوش مصنوعی است.

حالا هوش‌ مصنوعی یک قدم دیگر به سمت پیشرفته‌تر شدن برداشته و به توانایی لب‌خوانی دست یافته است. پروژه گوگل DeepMind با همکاری دانشگاه آکسفورد بر اساس داده‌ها و برنامه‌هایی که از سوی شبکه‌ی جهانی بی‌بی‌سی در اختیار آنها قرار گرفته توانسته‌اند این قابلیت را به هوش مصنوعی گوگل اضافه کنند.

هوش مصنوعی گوگل نزدیک به ۵ هزار ساعت (از ۶ برنامه متفاوت) را شامل ۱۱۸ هزار جمله بررسی کرده است. محققان گوگل و دانشگاه آکسفورد بر روی این پروژه در فاصله ژانویه ۲۰۱۰ تا دسامبر ۲۰۱۵ تحقیق کرده‌اند و در فاصله مارس تا سپتامبر ۲۰۱۶ آن را در مرحله تست به راه انداختند.

برای مقایسه دقت این هوش مصنوعی کافیست بدانید که یک لب‌خوان حرفه‌ای تنها با ۱۲/۴ درصد بدون هیچ خطایی کار می‌کند و این میزان در هوش مصنوعی گوگل ۴۶/۸ درصد، چیزی نزدیک به ۴ برابر انسان کار می‌کند. بسیاری از ایرادات این هوش مصنوعی در خواندن کلماتی که به اصطلاح کوتاه ادا می‌شوند (مانند گفتن S در پایان برخی واژه‌ها) مربوط است.

بسیاری بر این باورند که به سرانجام رسیدن این پروژه گام بسیار بزرگی در رسیدن به «لب‌خوانی اتوماتیک» است. زینگ ژوو استاد دانشگاه اولو در فنلاند با تایید این نگاه بر این باور است که «دستاورد اخیر بدون در اختیار داشتن این حجم بزرگ از داده‌ها و آرشیو بسیار دور از دسترس بود».

نزدیک به دو هفته پیش، محققان دانشگاه آکسفورد سیستم مشابهی به نام LipNet معرفی کرده بودند. برنامه موبایلی که می‌تواند نزدیک به ۹۰ درصد محتوای برخی ویدیو‌های ضبط شده را درک کند. اما محدودیت‌های بسیار این برنامه نسبت به برنامه‌ای که به تازگی عرضه شده قابل مقایسه نیست.

برای مثال می‌توان گفت LipNet تنها به روی افرادی خاص و آن هم زمانی که جملات رسمی بیان می‌گردند، آزمایش شد اما هوش مصنوعی گوگل در لحظه‌ ویدیوها را نگاه می‌کند و در شرایط مختلف می‌تواند لب‌خوانی کند. در واقع هوش مصنوعی گوگل حالا به برنامه‌های ضبط شده محدود نیست و می‌تواند به سرعت خود را با شرایط گوناگون تطبیق دهد.

یکی از مهمترین مسائلی که در ابتدا به ذهن بسیاری می‌رسد استفاده این هوش مصنوعی برای بالا بردن امنیت و لب‌خوانی توسط دوربین‌های مدار بسته شهری است. اما کارشناسان تاکید دارند که این سیستم امروز تنها به روی ویدیو‌های تمام اچ.دی. قابلیت اجرا دارد و هنوز با آنکه بتواند با دوربین‌هایی که فریم پایین دارند کار کند فاصله زیادی دارد. اما محققان DeepMind تاکید می‌کنند هدف آنها از توسعه این کیفیت در هوش مصنوعی برای کمک کردن به افرادی است که دارای شنوایی ضعیف هستند تا به آنها در درک بهتر واژه‌ها کمک کنند. از سوی دیگر در صنعت فیلم‌سازی کمک بسیاری خواهد کرد تا متن فیلم‌های صامت نیز نوشته شود و در دنیای فن‌آوری دستیارهای دیجیتال همچون سیری و آلکسا نیز می‌توانند پیشرفت‌های بیشتری داشته باشند.

در بخشی از فیلم «Ex Machina»، خالقِ اوا (یک زن هوش مصنوعی) می‌گوید: «یک روز این موجودات هوش‌ مصنوعی به ما انسان‌ها درست همان‌طوری نگاه می‌کنند که ما به فسیل‌های پیدا شده در آفریقا نگاه می‌کنیم: یعنی یک میمون که در گرد و غبار زندگی می‌کند آن هم با زبانی خام و یک زندگی در حال انقراض.»

اما شاید دنیا به این سیاهی‌ها هم نباشد چرا که هنوز مشخص نیست رابطه انسان و هوش مصنوعی در آینده چه خواهد بود. هرچه هست، امروز ربات‌ها برای کمک به انسان‌ها خلق می‌شوند تا جامعهه بشری زندگی بهتری را تجربه کند. آینده را کسی نمی‌داند…

* منبع: New Scientist
* ترجمه و تنظیم: کامیار بهرنگ

برای امتیاز دادن به این مطلب لطفا روی ستاره‌ها کلیک کنید.

توجه: وقتی با ماوس روی ستاره‌ها حرکت می‌کنید، یک ستاره زرد یعنی یک امتیاز و پنج ستاره زرد یعنی پنج امتیاز!

تعداد آرا: ۰ / معدل امتیاز: ۰

کسی تا به حال به این مطلب امتیاز نداده! شما اولین نفر باشید

لینک کوتاه شده این نوشته:
https://kayhan.london/?p=60861

هوش مصنوعی گوگل بهتر از انسان لب‌خوانی می‌کند

کیهان‌لایف، کیهان لندن به زبان انگلیسی

کیهان لندن را در اینستاگرام دنبال کنید

kayhanlondon

پشتیبانی مالی از کیهانِ لندن

مطالب مرتبطمطالب بیشتر از این نویسنده

راه‌هایی ساده برای کاهش اثرات مخرب سیگنال‌های موبایل

سال ۹۶ و خبرهای خوب برای حوزه فن‌آوری اطلاعات و ارتباطات ایران

مجلس رانتی، سردارِ شهردار و ساختارِ فاسد

کیهان‌لایف، کیهان لندن به زبان انگلیسی

کیهان لندن را در اینستاگرام دنبال کنید

kayhanlondon

پشتیبانی مالی از کیهانِ لندن

مطالب مرتبط مطالب بیشتر از این نویسنده