آشنائی با فناوری یادگیری ماشین و کاربرد آن در دستگاه‌‌های همراه

آشنائی با فناوری یادگیری ماشین و کاربرد آن در دستگاه‌‌های همراه

واحد خبر mobile.ir : این روزها هوش مصنوعی و یادگیری ماشین از مهم‌ترین و موردتوجه‌ترین زمینه‌های تحقیق و توسعه در دنیای تکنولوژی‌ به شمار می‌روند. محققین و مهندسین فعال در گرایش‌های مختلف به دنبال آن هستند تا با بهره‌گیری از این تکنولوژی‌ها، قابلیت یادگیری را به ماشین‌ها، تجهیزات الکترونیکی و نرم‌افزارهای مورد نظر خود افزوده و آن‌ها را به معنای واقعی هوشمند نمایند. دستگاه‌های همراه نیز به عنوان پرمخاطب‌ترین و پرکاربردترین محصولات دنیای تکنولوژی از این قافله عقب نمانده‌اند. گوشی‌های هوشمند امروزی که از نظر قدرت پردازشی در رده کامپیوتر‌های شخصی چند سال قبل و حتی ابرکامپیوترهای چند دهه قبل قرار گرفته‌اند، اکنون در شرف این هستند تا به کمک روش‌های یادگیری ماشین و یادگیری عمیق خود را آموزش داده، به ماشین‌هایی هوشمند‌تر و کارآمدتر بدل شوند.

What is Machine Learning and Its Applications in Mobile Devices

یادگیری ماشین چیست؟

پیش از پیدایش و توسعه دانش هوش مصنوعی و یادگیری ماشین، تنها راه به‌کارگیری کامپیوترها برای انجام وظایف مختلف استفاده از برنامه‌هایی بود که در آن‌ها برنامه‌نویس جزئیات عملیات لازم برای اجرا را به طور صریح و گام‌به‌گام برای کامپیوتر مشخص می‌نمود. اگرچه این نوع برنامه‌‌های قطعی و صریح یا به اصطلاح hard-code شده برای انجام بسیاری از امور محاسباتی مناسب بوده و حتی توانایی شکست دادن استادبزرگ‌های شطرنج را به کامپیوترها می‌بخشید، اما در زمینه‌هایی همچون تشخیص چهره‌ها و احساسات، یا در پاسخگویی به سوالات خاص و غیر قابل پیش‌بینی چندان کارآمد نبود. به همین دلیل دانشمندان علوم کامپیوتر به سراغ خلق روش‌ها و الگوریتم‌هایی رفتند که قادر باشد قابلیت درک، یادگیری و تصمیم‌گیری را برای کامپیوترها به ارمغان آورند.

“Machine Learning” یا “یادگیری ماشین” یکی از شاخه‌های دانش هوش مصنوعی‌ست که بر فراهم آوردن قابلیت یادگیری برای کامپیوترها تمرکز دارد. دستگاه‌های هوشمند می‌توانند به کمک الگوریتم‌های یادگیری ماشین داده‌های مختلفی که از کاربر، محیط یا پایگاه‌های داده دریافت نموده‌اند را تفسیر نموده، نکاتی را از آن‌ها آموخته و از دانش به‌دست آمده برای تصمیم‌گیری‌ آگاهانه بهره بگیرند. به عنوان مثال اپلیکیشن‌های استریمینگ موسیقی همچون Pandora و Spotify با استفاده از چنین الگوریتم‌هایی سعی می‌کنند سلایق موسیقیایی کاربران خود را فراگرفته و بر آن اساس با پیش‌بینی این‌که هر کاربر از چه موسیقی‌هایی لذت خواهد برد، آهنگ‌های دیگری را به او پیشنهاد دهند.

What is Machine Learning and Its Applications in Mobile Devices

یادگیری عمیق چیست؟

“Deep Learning” یا “یادگیری عمیق” یکی از روش‌های یادگیری ماشین است که سعی دارد عملیات یادگیری را با الهام از مغز انسان انجام دهد. در حالی که برای یک سیستم یادگیری ماشین عادی لازم است مشخص شود که چگونه یک پیش‌بینی یا تصمیم‌گیری دقیق را انجام دهد، یک سیستم یادگیری عمیق این کار را بدون مداخله انسان و به کمک مغز محاسباتی خود فرا می‌گیرد. شبیه به یک انسان که با دریافت اطلاعات، در مورد آن‌ها فکر کرده و نتیجه‌گیری می‌نماید. سیستم‌های یادگیری عمیق برای تحقق این امر از الگوریتم‌هایی با ساختار چندلایه یا به اصطلاح شبکه‌های عصبی مصنوعی بهره می‌گیرند.

What is Machine Learning and Its Applications in Mobile Devices

یک نمونه مشهور و موفق از سیستم‌های مبتنی بر یادگیری عمیق، پروژه AlphaGo شرکت گوگل است. برنامه‌ای کامپیوتری‌ که توانسته است بازی Go را فراگرفته و در سطح حرفه‌ای به رقابت با انسان‌ها بپردازد. Go یک بازی استراتژیک است که با تخته و مهره‌ انجام شده، نیازمند ذهنی قدرتمند است و مسابقات حرفه‌ای آن در سطح بین‌المللی برگزار می‌شود. AlphaGo اولین برنامه کامپیوتری بود که موفق شد بر یک بازیکن واقعی و حرفه‌ای Go غلبه نموده و حتی در سال 2016 قهرمان جهانی این بازی را با نتیجه 4 به 1 شکست دهد. اتفاقی که سر و صدای زیادی به پا نموده و به شکل ترسناکی نشان داد که یک ماشین می‌تواند با بهره‌گیری از یادگیری عمیق یک بازی پیچیده را فراگرفته و بهترین نمایندگان انسان‌ها را در آن بازی شکست دهد.

دلایل و مزایای استفاده از یادگیری ماشین در اپلیکیشن‌های همراه

امروزه یکی از مهم‌ترین انتظارات کاربران و کسب‌و‌کارها در زمینه اپلیکیشن‌های همراه، شخصی‌سازی هوشمندانه و انطباق محتوا بر اساس سلیقه و نیاز کاربران است. هوش مصنوعی و یادگیری ماشین مهم‌ترین ابزارها برای تحقق این انتظارات هستند. گزارش‌های موسسات تحقیقاتی همچون از میزان و چگونگی توزیع سرمایه‌گذاری شرکت‌ها در زمینه کاربرد شاخه‌های مختلف هوش مصنوعی حاکی از آن است که یادگیری ماشین در کانون توجه اغلب این شرکت‌ها قرار دارد. طبق گزارش‌ این موسسه پروژه‌ها و استارت‌آپ‌های مربوط به کاربردهای یادگیری ماشین در برهه زمانی جولای 2017 موفق به جذب بیش از 8 میلیارد دلار سرمایه از طریق 550 شرکت مختلف گردیده و از این جهت رتبه اول را در میان کاربرد‌های مختلف هوش مصنوعی کسب نموده‌اند.

What is Machine Learning and Its Applications in Mobile Devices

بخش قابل توجهی از این کاربردها و پروژه‌ها به صورت مستقیم یا غیر مستقیم به استفاده از یادگیری ماشین در اپلیکیشن‌های همراه مرتبط هستند. دلیل این مساله مزایای متعددی‌ست که این تکنولوژی می‌تواند برای اپلیکیشن‌ها به ارمغان آورد. برخی از مهم‌ترین این مزایا عبارتند از:

• ارائه محتوا یا محصول مرتبط و متناسب

• تعامل و ارتباط شخصی‌سازی شده با کاربران

• تبلیغات متناسب و هدفمند

• جست‌وجوی سریع و راحت

• خلق تجربه کاربری جذاب و درگیرانه

• پیش‌بینی و تحلیل گرایش‌های عمومی کاربران

• پیش‌گیری و تشخیص کلاه‌برداری یا فعالیت‌های مخرب

استفاده از یادگیری ماشین در اپلیکیشن‌های فروش آنلاین

توسعه‌دهندگان انواع اپلیکیشن‌های فروش آنلاین می‌توانند با بهره‌گیری از این تکنولوژی محتوای ارائه شده به کاربران را شخصی‌سازی نموده و تجربه کاربری به مراتب بهتری را برای آن‌ها رقم زنند. الگوریتم‌های یادگیری ماشین قادر هستند از طریق تحلیل محتوای اپلیکیشن، رفتار مشتری و الگوهای خرید، با هر بار استفاده کاربر از اپلیکیشن، پیشنهاد‌هایی بهتر و متناسب‌تر با سلایق و نیازهای او ارائه نمایند. به علاوه، اپلیکیشن‌ها به کمک یادگیری ماشین قادر به درک بهتر جست‌وجوهای متنی کاربران و در نتیجه ارائه نتایج بیشتر و مرتبط‌تری در پاسخ به آن‌ها خواهند بود. امروزه بسیاری از اپلیکیشن‌های موفق فروش آنلاین از این تکنولوژی برای فراهم آوردن امکان جست‌وجوی بهتر محصولات بهره می‌گیرند. از سوی دیگر، اپلیکیشن‌های فروش آنلاین با توجه به تراکنش‌‌های مالی بالایی که از طریق آن ها انجام می‌گیرد، به طور معمول در معرض اقدامات خلاف‌کارانه و مخرب قرار دارند. یادگیری ماشین می‌تواند امکان نظارت بر فرآیندهای جاری اپلیکیشن را فراهم آورده، فعالیت‌های مشکوک و مخرب را بدون نیاز به مداخله نیروی انسانی شناسایی و متوقف نماید.

از جمله کسب‌وکارهای بزرگی که در اپلیکیشن‌های همراهِ خود، به شکلی کارآمد و تاثیرگذار از یادگیری ماشین استفاده می‌کنند می‌توان به Starbucks ،eBay ،Amazon و Taco Bell اشاره نمود. اپلیکیشن‌های فروشگاهی Amazon و eBay به کمک این تکنولوژی و بر اساس جست‌وجوها، علاقه‌مندی‌ها و الگوی خرید کاربران، محصولات مختلفی را به آن‌ها پیشنهاد داده و نتایج جست‌وجوهای کاربر را شخصی‌سازی می‌نمایند. اپلیکیشن MyStarbucks Barista به کمک یادگیری ماشین به کاربر کمک می‌کند تا قهوه‌ای مطابق با ذائقه خود را به سریع‌ترین شکل ممکن سفارش داده و آن را بدون نیاز به معطل شدن در صف، از فروشگاهی در مسیر خود دریافت نماید.

What is Machine Learning and Its Applications in Mobile Devices

کاربرد یادگیری ماشین در اپلیکیشن‌های ورزش و سلامت

یادگیری ماشین اپلیکیشن‌های کنترل سلامت را قادر می‌سازد تا اطلاعات مربوط به فعالیت‌های روزانه کاربران از جمله ورزش، پیاده‌روی، خواب و نوشیدن آب را به خوبی جمع‌آوری کرده، با تحلیل اطلاعات مربوط به هزاران کاربر و در نظر گرفتن شرایط جسمانی هر یک از آن‌ها، هشدارهای لازم جهت افزایش فعالیت، مصرف آب بیشتر یا کمبود خواب را به ایشان ارائه نماید. چنانچه کاربری مبتلا به دیابت باشد، یک اپلیکیشن سلامت به کمک یادگیری ماشین قادر خواهد بود با دریافت و بررسی نتایج آزمایش‌ها و شرایط جسمانی کاربر، تحلیل و مقایسه آن با اطلاعات سایر کاربران مبتلا به دیابت، فعالیت‌های روزانه کاربر را با هدف کنترل قند خون وی کنترل نموده و درمان‌های متناسب را در شرایط مختلف پیشنهاد دهد. اپلیکیشن‌های ورزش و تناسب اندام می‌توانند با استفاده از یادگیری ماشین تمرین‌های ورزشی و رژیم غذایی هر کاربر را بر اساس شرایط، اهداف و نیازهای او بهینه‌سازی نموده و به این ترتیب به یک مربی شخصی تمام وقت برای کاربران بدل شوند. به عنوان نمونه اپلیکیشن به همین ترتیب نقش یک مربی بدن‌سازی را برای کاربران خود ایفا نموده و سعی می‌کند با ارائه تمرین‌های شخصی‌سازی شده و متناسب با محیط منزل، محل کار یا باشگاه بدن‌سازی، بدنی سالم‌تر و اندامی زیباتر را برای آن‌ها به ارمغان آورد. این اپلیکیشن با بهره‌گیری از یادگیری عمیق و بر اساس اطلاعاتی همچون شرایط فیزیکی کاربر، اطلاعات ژنتیکی وی، تجهیزات موجود، سابقه تمرین‌ها، روند کاهش یا افزایش وزن و وقت آزاد کاربر، سعی می‌نماید نوع تمرین‌ها، وزنه‌های انتخابی (در صورت امکان استفاده از تجهیزات)، تعداد دفعات تکرار و زمان انجام تمرین‌های ورزشی را به متناسب‌ترین شکل ممکن برای کاربر برنامه‌ریزی نماید.

What is Machine Learning and Its Applications in Mobile Devices

ارتقای کیفیت تصاویر دوربین تلفن‌های همراه به کمک یادگیری عمیق

گروهی از دانشمندان سوییسی با ساخت یک شبکه عصبی در تلاش برای توسعه سیستمی هستند که با دریافت تصاویر کم‌کیفیت گرفته شده توسط دوربین گوشی‌های هوشمند، کیفیت آن‌ها را به میزان قابل توجهی ارتقا بخشیده و به سطح تصاویر دوربین‌های حرفه‌ای DSLR نزدیک نمایند. این دانشمندان در مقاله‌ای که در همین ارتباط منتشر شده است بیان داشته‌اند: “دوربین‌های فشرده و پایین‌-رده به دلیل محدودیت‌هایی در خصوص‌ بودجه، سخت‌افزار و اندازه، ضعف‌هایی را در کیفیت تصویر به نمایش می‌گذارند. ما راهکاری مبتنی بر یادگیری عمیق را پیشنهاد می‌دهیم که به صورت خودکار تصاویر گرفته شده توسط دوربین‌هایی با توانایی‌های محدود را به تصاویری با کیفیت DSLR بدل می‌سازد.”

این گروه پس از طراحی و ساخت این سیستم یادگیری عمیق، عکس‌هایی را از سوژه‌ها و مناظر یکسان با استفاده از تعدادی گوشی‌های هوشمند نسبتا قدیمی (از جمله ، و ) و همچنین یک دوربین DSLR (کانن 70D) ثبت نموده، به کمک آن‌ها تفاوت میان عکس‌های کیفیت پایین با عکس‌های DSLR را به این سیستم آموزش دادند. آن‌ها سپس کار آموزش سیستم را با مجموعه‌ای بزرگ از عکس‌های گرفته شده توسط همین دوربین‌ها اما با سوژه‌های تصویری کاملا متفاوت میان دوربین DSLR و دوربین‌ گوشی‌های هوشمند ادامه دادند. اکنون این سیستم با تکیه بر الگوریتم‌های یادگیری عمیق و با استفاده از آموزش‌هایی که دریافت نموده است می‌تواند با دریافت تصاویر گرفته شده توسط دوربین تلفن‌های همراه، کیفیت آن‌ها را به سطح کیفی DSLR ارتقا بخشد.

What is Machine Learning and Its Applications in Mobile Devices

در پروژه‌ای دیگر محققین شرکت گوگل و دانشگاه MIT در حال توسعه یک سیستم مبتنی بر یادگیری عمیق هستند که قادر است در قالب یک اپلیکیشن مستقل، کیفیت تصاویر دریافتی از دوربین گوشی‌های هوشمند را به صورت زنده و هم‌زمان (real-time) بهبود بخشد. در واقع این اپلیکیشن قادر است تا عکس‌ را حتی قبل از این‌که ثبت شود، در سطح یک عکاس حرفه‌ای روتوش نماید. این تیم تحقیقاتی پس از توسعه الگوریتم‌های مورد نظر خود و خلق شبکه عصبی مربوطه، با همکاری شرکت Adobe Systems اقدام به جمع‌آوری مجموعه‌ای نسبتا بزرگ از تصاویر برای آموزش نحوه ارتقا و روتوش تصویر به این سیستم نمودند. مجموعه‌ای متشکل از 5 هزار تصویر مختلف که هر یک توسط 5 عکاس حرفه‌ای مورد روتوش و اصلاح رنگ قرار گرفته، این سیستم مبتنی بر یادگیری عمیق را قادر به فراگیری این مساله ساخته است که چگونه و با اعمال چه تغییراتی می‌توان تصویر اولیه دریافتی را به تصویر مطلوب و بهبود یافته تبدیل نمود.

استفاده از یادگیری ماشین برای بهبود کیفیت تصاویر اتفاق جدیدی نبوده و در گذشته بارها با موفقیت انجام گرفته است. پیشرفت به‌دست آمده در جریان این پروژه اخیر که آن را از نمونه‌های مشابه متمایز نموده‌ است، کوچک نمودن و بهینه‌سازی الگوریتم‌ها در حدی‌ست که این سیستم می‌تواند به صورت مستقل و بدون نیاز به سرورهای ابری، روی یک گوشی هوشمند معمولی تصاویر دریافتی از دوربین را به صورت زنده و بدون وقفه روتوش نماید. چنان‌چه علاقمند به کسب اطلاعات بیش‌تر در مورد این پروژه هستید، شما را به مشاهده — که توسط تیم توسعه‌دهنده آن منتشر شده است — دعوت می‌کنیم.

هنوز خبر دقیقی از زمان عرضه عمومی این اپلیکیشن منتشر نشده است. همچنین مشخص نیست که آیا این سیستم در قالب یک اپلیکیشن جدید و مستقل عرضه خواهد شد، یا جهت ارتقای اپلیکیشن دوربین گوگل در دل گوشی‌های هوشمند پیکسل به کار خواهد رفت. شاید هم در حالت ایده‌آل گواهی استفاده از این تکنولوژی با قیمتی مشخص در اختیار توسعه‌دهندگان اپلیکیشن‌های دوربین و تولیدکنندگان گوشی‌های هوشمند قرار داده شود.

What is Machine Learning and Its Applications in Mobile Devices

خدمات و ابزارهای گوگل در زمینه یادگیری ماشین

گوگل در سال‌های اخیر با سرمایه‌گذاری و تمرکز بالا در این زمینه، نام خود را به عنوان شرکتی پیشگام و تاثیرگذار در زمینه هوش مصنوعی و یادگیری ماشین مطرح نموده است. این شرکت علاوه بر به‌کارگیری یادگیری ماشین در بسیاری اپلیکیشن‌ها، سرویس‌ها و محصولات خود، سیستم‌های هوش مصنوعی پیشرفته‌ای همچون AlphaGo Zero و را با تکیه بر الگوریتم‌های یادگیری عمیق توسعه داده، همچنین با ارائه کتابخانه نرم‌افزاری متن-باز TensorFlow و حتی طراحی تراشه‌های خاص منظوره‌ای با نام TPU (مخفف Tensor Processing Unit) با قابلیت پردازش بهینه و موثر APIهای این کتابخانه، راه دیگر شرکت‌ها و برنامه‌نویسان مستقل را برای توسعه سیستم‌های مبتنی بر یادگیری ماشین هموار نموده است.

امروزه اغلب اپلیکیشن‌ها و سرویس‌های آنلاین گوگل به نوعی از یادگیری ماشین برای ارائه خدمات بهتر، متناسب‌تر و شخصی‌سازی شده‌تر به کاربران بهره می‌گیرند. Google Translate قادر است با استفاده از این تکنولوژی تشخیص دهد که آیا یک عکس حاوی متن هست یا خیر، موقعیت آن را شناسایی نموده و با تشخیص زبان مربوطه، آن را به زبان مورد نظر کاربر ترجمه نماید. Google Music بر اساس سابقه خرید و پخش موسیقی کاربر، سلیقه موسیقیایی وی را تشخیص داده و آهنگ‌هایی متناسب را به او پیشنهاد می‌دهد. موتور جست‌وجوی گوگل بر اساس سابقه جست‌وجوها و نتایج انتخاب‌های کاربران، عبارت‌های جست‌وجوی مناسب را به آن‌ها پیشنهاد داده و در قسمت جست‌وجوی تصاویر، عکس‌ها را بر اساس محتمل‌ترین نیازهای کاربر در گروه‌هایی دسته‌بندی نموده و به او ارائه می‌نماید. YouTube از یادگیری ماشین برای شناسایی موضوعات مورد علاقه کاربر استفاده نموده، بر آن اساس ویدئوهای ارائه شده توسط کانال‌هایی که کاربر در آن‌ها عضویت دارد را مرتب‌سازی می‌نماید و همچنین ویدئوهای جدیدی متناسب با سلایق کاربر به وی پیشنهاد می‌دهد. اپلیکیشن Inbox قادر است ایمیل‌های دریافتی کاربر را بر اساس نیازها، علایق و ارتباطات او با دیگران مرتب‌ و بهینه‌ کند و حتی بر اساس نحوه‌ پاسخگویی کاربر در گذشته، پاسخ‌های هوشمندانه‌ای را برای ایمیل‌های دریافتی تنظیم نماید.

What is Machine Learning and Its Applications in Mobile Devices

در سال‌های اخیر شرکت گوگل دو سیستم هوش مصنوعی خود با نام‌های AlphaGo و Google Assistant را با تکیه بر تکنولوژی شبکه‌های عصبی مصنوعی و یادگیری عمیق توسعه و آموزش داده است. هوش مصنوعی AlphaGo پس از فراگیری بازی استراتژیک Go، در سال‌های 2015 و 2016 موفق گردید بازیکنان حرفه‌ای آن را در عرصه بین‌المللی شکست دهد. به دنبال این موفقیت گوگل نسخه جدید و پیشرفته‌تر این هوش مصنوعی را با نام AlphaGo Zero در سال 2017 معرفی نمود. این هوش مصنوعی که با استفاده از بستر برنامه‌نویسی TensorFlow گوگل توسعه یافته است، به سرعت بازی Go را فرا گرفته و موفق شد با شکست دو نفر از بهترین بازیکنان جهان، به صورت ضمنی عنوان برترین بازیکن Go را به خود اختصاص دهد.

از سوی دیگر با معرفی و عرضه Google Assistant در سال 2017، گوگل سعی نمود هوش مصنوعی و یادگیری عمیق را به صورت مستقیم و در قالب یک دستیار شخصی هوشمند وارد زندگی شخصی کاربران خود نموده و به خدمت ایشان درآورد. این هوش مصنوعی به عنوان مثال در حال حاضر قادر است قرارهای کاربر را به وی یادآوری نماید، فاصله زمانی تا محل کار او را با پیش‌بینی ترافیک تخمین بزند، آهنگ‌‌های مورد علاقه کاربر را دانلود و پخش کند، دوستان او را در عکس‌ها شناسایی نموده و در صورت تمایل کاربر آن عکس‌ها را با ایشان به اشتراک بگذارد. البته با توجه به پتانسیل بالای این هوش مصنوعی و اکوسیستم گسترده گوگل، می‌توان اطمینان داشت که دامنه توانمندی‌های Google Assistant به همین‌ میزان محدود نگردیده، با گذشت زمان سطح هوشمندی و مجموعه قابلیت‌های آن به سرعت افزایش خواهد یافت.

شرکت گوگل در سال 2015 بستر برنامه‌نویسی و کتابخانه نرم‌افزاری ویژه خود برای یادگیری ماشین و یادگیری عمیق با نام TensorFlow را به صورت متن‌باز در اختیار عموم قرار داد تا بدین وسیله دیگر توسعه‌دهندگان را در خلق سیستم‌های مبتنی بر شبکه‌های عصبی یاری دهد. البته گوگل در مسیر ارائه خدمات یادگیری ماشین برای توسعه‌دهندگان به همین‌جا بسنده ننموده است. این شرکت با آماده‌سازی تعدادی مدل یادگیری ماشین به صورت از-پیش-آموزش-یافته و در قالب APIهای تجاری، این امکان را برای توسعه‌دهندگان اپلیکیشن‌های همراه فراهم آورده تا بدون درگیر شدن در فرآیند توسعه شبکه‌های عصبی و سیستم‌های یادگیری ماشین، به راحتی و تنها با فراخوانی APIهای مربوطه در اپلیکیشن‌های خود سیستم‌های پیشرفته یادگیری عمیق گوگل را به خدمت گیرند. استفاده از این APIهای یادگیری ماشین که از طریق بستر خدمات ابری گوگل سرویس‌دهی می‌شوند در سطوح پایین رایگان بوده و در مقیاس تجاری با هزینه‌هایی اندک همراه است. مهم‌ترین و پرکاربردترین APIهای یادگیری ماشین گوگل که به صورت خدمات ابری ارائه می‌شوند عبارتند از: تحلیل تصویر؛ ترجمه ابری؛ تبدیل صدا به متن؛ تحلیل متن؛ تحلیل ویدئو و حتی شغل‌یابی.

What is Machine Learning and Its Applications in Mobile Devices

تشخیص و تحلیل عناصر تصویر با استفاده از سرویس دید ابری گوگل

توسعه‌دهندگان می‌توانند با استفاده از API دید ابری یا Cloud Vision گوگل در دل اپلیکیشن خود، قابلیت شناسایی و درک محتوای یک عکس را به‌ دست آورند. از جمله مهم‌ترین قابلیت‌های این API می‌توان به موارد زیر اشاره نمود:

• تشخیص عناصر تصویر: امکان شناسایی عناصر مختلف موجود در تصویر، توصیف و دسته‌بندی آن‌ها.

• تشخیص چهره: امکان شناسایی چهره‌های متعدد درون یک عکس به همراه خصوصیات کلیدی هر چهره از جمله وضعیت احساسی، پوشش سر و صورت، رنگ پوست و نوع مو.

• تشخیص نوری حروف: قابلیت شناسایی و استخراج متن از درون عکس با پشتیبانی از زبان‌های متعدد و امکان تشخیص خودکار زبان متن.

• تشخیص لوگو: امکان شناسایی لوگوی برندهای معروف و شناخته شده درون تصاویر.

• تشخیص منظره: قابلیت تشخیص مناظر طبیعی و بناهای ساخت دست بشر در تصاویر.

• تشخیص محتوای نامناسب: امکان شناسایی انواع محتوای نامناسب از جمله عناصر خشونت‌آمیز یا مبتذل درون عکس‌ها.

به عنوان مثال Realtor.com به عنوان یک مجموعه فعال در زمینه معاملات املاک، از این API گوگل در توسعه اپلیکیشن خود برای سیستم‌عامل‌های اندروید و iOS بهره گرفته است. هنگامی که کاربران این اپلیکیشن در زمان جست‌وجو برای خرید یک ملک با اجرای اپلیکیشن از آن ملک، تابلو یا آگهی فروش آن عکس بگیرند، این اپلیکیشن با بهره‌گیری از قابلیت‌های دید ابری گوگل عناصر موجود در تصویر را شناسایی نموده، اطلاعات مربوط به مشخصات ملک و شرایط خرید آن را به کاربر ارائه می‌کند.

What is Machine Learning and Its Applications in Mobile Devices

تحلیل، تبدیل و ترجمه متن به کمک APIهای ابری یادگیری ماشین گوگل

شرکت گوگل چند سرویس متکی بر یادگیری ماشین را در قالب APIهایی برای کار با متن ارائه می‌نماید که از مهم‌ترین آن‌ها می‌توان به گوگل Cloud Speech، گوگل Cloud Natural Language و گوگل Cloud Translation اشاره نمود.

سرویس Cloud Speech با بهره‌گیری از مدل‌های قدرتمند شبکه‌ عصبی امکان تبدیل صدا به متن را به راحتی از طریق فراخوانی API مربوطه برای توسعه‌دهندگان اپلیکیشن‌ها فراهم می‌آورد. این API در حال حاضر قادر به تشخیص 110 زبان مختلف بوده و حتی می‌تواند در صورت تمایلِ توسعه‌دهنده به صورت خودکار محتوای نامناسب را در متنی که تولید می‌شود فیلتر نماید. این سرویس می‌تواند با دریافت یک فایل صوتی، زبان آن را تشخیص داده و محتوایش به متن تبدیل نماید. همچنین قادر است صدای کاربر را حتی در محیط‌های شلوغ و دارای نویز به صورت زنده و هم‌زمان به متن تبدیل کند.

Cloud Natural Language دیگر API مهم گوگل برای پردازش متن است که می‌تواند با تحلیل متن موجود در یک فایل، مقاله خبری یا صفحه وب، اطلاعات مختلفی را در مورد اشخاص، مکان‌ها، رویدادها و بسیاری عناصر دیگر از آن استخراج نماید. این سرویس امکان تشخیص زبان متن را دارا بوده و حتی قادر است احساس کلی نویسنده را در خصوص موضوع مورد اشاره در متن شناسایی و درک نماید. این قابلیت مهم می‌تواند ابزاری قدرتمند و کارآمد در دست فروشگاه‌های آنلاین باشد برای تحلیل خودکار نظرهای کاربران و استفاده از نتایج به دست آمده برای اصلاح ایرادات، جلب نظر مشتری و افزایش فروش به صورت کاملا خودکار و کم هزینه. به علاوه، ترکیب این API با سرویس‌های Cloud Vision و Cloud Speech امکان استخراج و تحلیل این نوع اطلاعات متنی را از صدا و تصویر نیز میسر می‌نماید.

Cloud Translation همانطور که از نامش پیداست، به کمک یادگیری ماشین امکان ترجمه هوشمندانه متن‌ را از زبانی به زبان دیگر فراهم می‌آورد. سرویس ترجمه ابری گوگل بیش از 100 زبان مختلف را پشتیبانی نموده و می‌تواند زبان متن را بلافاصله با دقتی بالا شناسایی نماید. این API هم قادر خواهد بود در ترکیب با سرویس‌های Cloud Vision و Cloud Speech، ترجمه محتوای موجود در صدا و تصویر را نیز میسر کند.

What is Machine Learning and Its Applications in Mobile Devices

آشنائی با فناوری یادگیری ماشین و کاربرد آن در دستگاه‌‌های همراه

(image)

واحد خبر mobile.ir : این روزها هوش مصنوعی و یادگیری ماشین از مهم‌ترین و موردتوجه‌ترین زمینه‌های تحقیق و توسعه در دنیای تکنولوژی‌ به شمار می‌روند. محققین و مهندسین فعال در گرایش‌های مختلف به دنبال آن هستند تا با بهره‌گیری از این تکنولوژی‌ها، قابلیت یادگیری را به ماشین‌ها، تجهیزات الکترونیکی و نرم‌افزارهای مورد نظر خود افزوده و آن‌ها را به معنای واقعی هوشمند نمایند. دستگاه‌های همراه نیز به عنوان پرمخاطب‌ترین و پرکاربردترین محصولات دنیای تکنولوژی از این قافله عقب نمانده‌اند. گوشی‌های هوشمند امروزی که از نظر قدرت پردازشی در رده کامپیوتر‌های شخصی چند سال قبل و حتی ابرکامپیوترهای چند دهه قبل قرار گرفته‌اند، اکنون در شرف این هستند تا به کمک روش‌های یادگیری ماشین و یادگیری عمیق خود را آموزش داده، به ماشین‌هایی هوشمند‌تر و کارآمدتر بدل شوند.

(image)

یادگیری ماشین چیست؟

پیش از پیدایش و توسعه دانش هوش مصنوعی و یادگیری ماشین، تنها راه به‌کارگیری کامپیوترها برای انجام وظایف مختلف استفاده از برنامه‌هایی بود که در آن‌ها برنامه‌نویس جزئیات عملیات لازم برای اجرا را به طور صریح و گام‌به‌گام برای کامپیوتر مشخص می‌نمود. اگرچه این نوع برنامه‌‌های قطعی و صریح یا به اصطلاح hard-code شده برای انجام بسیاری از امور محاسباتی مناسب بوده و حتی توانایی شکست دادن استادبزرگ‌های شطرنج را به کامپیوترها می‌بخشید، اما در زمینه‌هایی همچون تشخیص چهره‌ها و احساسات، یا در پاسخگویی به سوالات خاص و غیر قابل پیش‌بینی چندان کارآمد نبود. به همین دلیل دانشمندان علوم کامپیوتر به سراغ خلق روش‌ها و الگوریتم‌هایی رفتند که قادر باشد قابلیت درک، یادگیری و تصمیم‌گیری را برای کامپیوترها به ارمغان آورند.

“Machine Learning” یا “یادگیری ماشین” یکی از شاخه‌های دانش هوش مصنوعی‌ست که بر فراهم آوردن قابلیت یادگیری برای کامپیوترها تمرکز دارد. دستگاه‌های هوشمند می‌توانند به کمک الگوریتم‌های یادگیری ماشین داده‌های مختلفی که از کاربر، محیط یا پایگاه‌های داده دریافت نموده‌اند را تفسیر نموده، نکاتی را از آن‌ها آموخته و از دانش به‌دست آمده برای تصمیم‌گیری‌ آگاهانه بهره بگیرند. به عنوان مثال اپلیکیشن‌های استریمینگ موسیقی همچون Pandora و Spotify با استفاده از چنین الگوریتم‌هایی سعی می‌کنند سلایق موسیقیایی کاربران خود را فراگرفته و بر آن اساس با پیش‌بینی این‌که هر کاربر از چه موسیقی‌هایی لذت خواهد برد، آهنگ‌های دیگری را به او پیشنهاد دهند.

(image)

یادگیری عمیق چیست؟

“Deep Learning” یا “یادگیری عمیق” یکی از روش‌های یادگیری ماشین است که سعی دارد عملیات یادگیری را با الهام از مغز انسان انجام دهد. در حالی که برای یک سیستم یادگیری ماشین عادی لازم است مشخص شود که چگونه یک پیش‌بینی یا تصمیم‌گیری دقیق را انجام دهد، یک سیستم یادگیری عمیق این کار را بدون مداخله انسان و به کمک مغز محاسباتی خود فرا می‌گیرد. شبیه به یک انسان که با دریافت اطلاعات، در مورد آن‌ها فکر کرده و نتیجه‌گیری می‌نماید. سیستم‌های یادگیری عمیق برای تحقق این امر از الگوریتم‌هایی با ساختار چندلایه یا به اصطلاح شبکه‌های عصبی مصنوعی بهره می‌گیرند.

(image)

یک نمونه مشهور و موفق از سیستم‌های مبتنی بر یادگیری عمیق، پروژه AlphaGo شرکت گوگل است. برنامه‌ای کامپیوتری‌ که توانسته است بازی Go را فراگرفته و در سطح حرفه‌ای به رقابت با انسان‌ها بپردازد. Go یک بازی استراتژیک است که با تخته و مهره‌ انجام شده، نیازمند ذهنی قدرتمند است و مسابقات حرفه‌ای آن در سطح بین‌المللی برگزار می‌شود. AlphaGo اولین برنامه کامپیوتری بود که موفق شد بر یک بازیکن واقعی و حرفه‌ای Go غلبه نموده و حتی در سال 2016 قهرمان جهانی این بازی را با نتیجه 4 به 1 شکست دهد. اتفاقی که سر و صدای زیادی به پا نموده و به شکل ترسناکی نشان داد که یک ماشین می‌تواند با بهره‌گیری از یادگیری عمیق یک بازی پیچیده را فراگرفته و بهترین نمایندگان انسان‌ها را در آن بازی شکست دهد.

دلایل و مزایای استفاده از یادگیری ماشین در اپلیکیشن‌های همراه

امروزه یکی از مهم‌ترین انتظارات کاربران و کسب‌و‌کارها در زمینه اپلیکیشن‌های همراه، شخصی‌سازی هوشمندانه و انطباق محتوا بر اساس سلیقه و نیاز کاربران است. هوش مصنوعی و یادگیری ماشین مهم‌ترین ابزارها برای تحقق این انتظارات هستند. گزارش‌های موسسات تحقیقاتی همچون از میزان و چگونگی توزیع سرمایه‌گذاری شرکت‌ها در زمینه کاربرد شاخه‌های مختلف هوش مصنوعی حاکی از آن است که یادگیری ماشین در کانون توجه اغلب این شرکت‌ها قرار دارد. طبق گزارش‌ این موسسه پروژه‌ها و استارت‌آپ‌های مربوط به کاربردهای یادگیری ماشین در برهه زمانی جولای 2017 موفق به جذب بیش از 8 میلیارد دلار سرمایه از طریق 550 شرکت مختلف گردیده و از این جهت رتبه اول را در میان کاربرد‌های مختلف هوش مصنوعی کسب نموده‌اند.

(image)

بخش قابل توجهی از این کاربردها و پروژه‌ها به صورت مستقیم یا غیر مستقیم به استفاده از یادگیری ماشین در اپلیکیشن‌های همراه مرتبط هستند. دلیل این مساله مزایای متعددی‌ست که این تکنولوژی می‌تواند برای اپلیکیشن‌ها به ارمغان آورد. برخی از مهم‌ترین این مزایا عبارتند از:

• ارائه محتوا یا محصول مرتبط و متناسب

• تعامل و ارتباط شخصی‌سازی شده با کاربران

• تبلیغات متناسب و هدفمند

• جست‌وجوی سریع و راحت

• خلق تجربه کاربری جذاب و درگیرانه

• پیش‌بینی و تحلیل گرایش‌های عمومی کاربران

• پیش‌گیری و تشخیص کلاه‌برداری یا فعالیت‌های مخرب

استفاده از یادگیری ماشین در اپلیکیشن‌های فروش آنلاین

توسعه‌دهندگان انواع اپلیکیشن‌های فروش آنلاین می‌توانند با بهره‌گیری از این تکنولوژی محتوای ارائه شده به کاربران را شخصی‌سازی نموده و تجربه کاربری به مراتب بهتری را برای آن‌ها رقم زنند. الگوریتم‌های یادگیری ماشین قادر هستند از طریق تحلیل محتوای اپلیکیشن، رفتار مشتری و الگوهای خرید، با هر بار استفاده کاربر از اپلیکیشن، پیشنهاد‌هایی بهتر و متناسب‌تر با سلایق و نیازهای او ارائه نمایند. به علاوه، اپلیکیشن‌ها به کمک یادگیری ماشین قادر به درک بهتر جست‌وجوهای متنی کاربران و در نتیجه ارائه نتایج بیشتر و مرتبط‌تری در پاسخ به آن‌ها خواهند بود. امروزه بسیاری از اپلیکیشن‌های موفق فروش آنلاین از این تکنولوژی برای فراهم آوردن امکان جست‌وجوی بهتر محصولات بهره می‌گیرند. از سوی دیگر، اپلیکیشن‌های فروش آنلاین با توجه به تراکنش‌‌های مالی بالایی که از طریق آن ها انجام می‌گیرد، به طور معمول در معرض اقدامات خلاف‌کارانه و مخرب قرار دارند. یادگیری ماشین می‌تواند امکان نظارت بر فرآیندهای جاری اپلیکیشن را فراهم آورده، فعالیت‌های مشکوک و مخرب را بدون نیاز به مداخله نیروی انسانی شناسایی و متوقف نماید.

از جمله کسب‌وکارهای بزرگی که در اپلیکیشن‌های همراهِ خود، به شکلی کارآمد و تاثیرگذار از یادگیری ماشین استفاده می‌کنند می‌توان به Starbucks ،eBay ،Amazon و Taco Bell اشاره نمود. اپلیکیشن‌های فروشگاهی Amazon و eBay به کمک این تکنولوژی و بر اساس جست‌وجوها، علاقه‌مندی‌ها و الگوی خرید کاربران، محصولات مختلفی را به آن‌ها پیشنهاد داده و نتایج جست‌وجوهای کاربر را شخصی‌سازی می‌نمایند. اپلیکیشن MyStarbucks Barista به کمک یادگیری ماشین به کاربر کمک می‌کند تا قهوه‌ای مطابق با ذائقه خود را به سریع‌ترین شکل ممکن سفارش داده و آن را بدون نیاز به معطل شدن در صف، از فروشگاهی در مسیر خود دریافت نماید.

(image)

کاربرد یادگیری ماشین در اپلیکیشن‌های ورزش و سلامت

یادگیری ماشین اپلیکیشن‌های کنترل سلامت را قادر می‌سازد تا اطلاعات مربوط به فعالیت‌های روزانه کاربران از جمله ورزش، پیاده‌روی، خواب و نوشیدن آب را به خوبی جمع‌آوری کرده، با تحلیل اطلاعات مربوط به هزاران کاربر و در نظر گرفتن شرایط جسمانی هر یک از آن‌ها، هشدارهای لازم جهت افزایش فعالیت، مصرف آب بیشتر یا کمبود خواب را به ایشان ارائه نماید. چنانچه کاربری مبتلا به دیابت باشد، یک اپلیکیشن سلامت به کمک یادگیری ماشین قادر خواهد بود با دریافت و بررسی نتایج آزمایش‌ها و شرایط جسمانی کاربر، تحلیل و مقایسه آن با اطلاعات سایر کاربران مبتلا به دیابت، فعالیت‌های روزانه کاربر را با هدف کنترل قند خون وی کنترل نموده و درمان‌های متناسب را در شرایط مختلف پیشنهاد دهد. اپلیکیشن‌های ورزش و تناسب اندام می‌توانند با استفاده از یادگیری ماشین تمرین‌های ورزشی و رژیم غذایی هر کاربر را بر اساس شرایط، اهداف و نیازهای او بهینه‌سازی نموده و به این ترتیب به یک مربی شخصی تمام وقت برای کاربران بدل شوند. به عنوان نمونه اپلیکیشن به همین ترتیب نقش یک مربی بدن‌سازی را برای کاربران خود ایفا نموده و سعی می‌کند با ارائه تمرین‌های شخصی‌سازی شده و متناسب با محیط منزل، محل کار یا باشگاه بدن‌سازی، بدنی سالم‌تر و اندامی زیباتر را برای آن‌ها به ارمغان آورد. این اپلیکیشن با بهره‌گیری از یادگیری عمیق و بر اساس اطلاعاتی همچون شرایط فیزیکی کاربر، اطلاعات ژنتیکی وی، تجهیزات موجود، سابقه تمرین‌ها، روند کاهش یا افزایش وزن و وقت آزاد کاربر، سعی می‌نماید نوع تمرین‌ها، وزنه‌های انتخابی (در صورت امکان استفاده از تجهیزات)، تعداد دفعات تکرار و زمان انجام تمرین‌های ورزشی را به متناسب‌ترین شکل ممکن برای کاربر برنامه‌ریزی نماید.

(image)

ارتقای کیفیت تصاویر دوربین تلفن‌های همراه به کمک یادگیری عمیق

گروهی از دانشمندان سوییسی با ساخت یک شبکه عصبی در تلاش برای توسعه سیستمی هستند که با دریافت تصاویر کم‌کیفیت گرفته شده توسط دوربین گوشی‌های هوشمند، کیفیت آن‌ها را به میزان قابل توجهی ارتقا بخشیده و به سطح تصاویر دوربین‌های حرفه‌ای DSLR نزدیک نمایند. این دانشمندان در مقاله‌ای که در همین ارتباط منتشر شده است بیان داشته‌اند: “دوربین‌های فشرده و پایین‌-رده به دلیل محدودیت‌هایی در خصوص‌ بودجه، سخت‌افزار و اندازه، ضعف‌هایی را در کیفیت تصویر به نمایش می‌گذارند. ما راهکاری مبتنی بر یادگیری عمیق را پیشنهاد می‌دهیم که به صورت خودکار تصاویر گرفته شده توسط دوربین‌هایی با توانایی‌های محدود را به تصاویری با کیفیت DSLR بدل می‌سازد.”

این گروه پس از طراحی و ساخت این سیستم یادگیری عمیق، عکس‌هایی را از سوژه‌ها و مناظر یکسان با استفاده از تعدادی گوشی‌های هوشمند نسبتا قدیمی (از جمله ، و ) و همچنین یک دوربین DSLR (کانن 70D) ثبت نموده، به کمک آن‌ها تفاوت میان عکس‌های کیفیت پایین با عکس‌های DSLR را به این سیستم آموزش دادند. آن‌ها سپس کار آموزش سیستم را با مجموعه‌ای بزرگ از عکس‌های گرفته شده توسط همین دوربین‌ها اما با سوژه‌های تصویری کاملا متفاوت میان دوربین DSLR و دوربین‌ گوشی‌های هوشمند ادامه دادند. اکنون این سیستم با تکیه بر الگوریتم‌های یادگیری عمیق و با استفاده از آموزش‌هایی که دریافت نموده است می‌تواند با دریافت تصاویر گرفته شده توسط دوربین تلفن‌های همراه، کیفیت آن‌ها را به سطح کیفی DSLR ارتقا بخشد.

(image)

در پروژه‌ای دیگر محققین شرکت گوگل و دانشگاه MIT در حال توسعه یک سیستم مبتنی بر یادگیری عمیق هستند که قادر است در قالب یک اپلیکیشن مستقل، کیفیت تصاویر دریافتی از دوربین گوشی‌های هوشمند را به صورت زنده و هم‌زمان (real-time) بهبود بخشد. در واقع این اپلیکیشن قادر است تا عکس‌ را حتی قبل از این‌که ثبت شود، در سطح یک عکاس حرفه‌ای روتوش نماید. این تیم تحقیقاتی پس از توسعه الگوریتم‌های مورد نظر خود و خلق شبکه عصبی مربوطه، با همکاری شرکت Adobe Systems اقدام به جمع‌آوری مجموعه‌ای نسبتا بزرگ از تصاویر برای آموزش نحوه ارتقا و روتوش تصویر به این سیستم نمودند. مجموعه‌ای متشکل از 5 هزار تصویر مختلف که هر یک توسط 5 عکاس حرفه‌ای مورد روتوش و اصلاح رنگ قرار گرفته، این سیستم مبتنی بر یادگیری عمیق را قادر به فراگیری این مساله ساخته است که چگونه و با اعمال چه تغییراتی می‌توان تصویر اولیه دریافتی را به تصویر مطلوب و بهبود یافته تبدیل نمود.

استفاده از یادگیری ماشین برای بهبود کیفیت تصاویر اتفاق جدیدی نبوده و در گذشته بارها با موفقیت انجام گرفته است. پیشرفت به‌دست آمده در جریان این پروژه اخیر که آن را از نمونه‌های مشابه متمایز نموده‌ است، کوچک نمودن و بهینه‌سازی الگوریتم‌ها در حدی‌ست که این سیستم می‌تواند به صورت مستقل و بدون نیاز به سرورهای ابری، روی یک گوشی هوشمند معمولی تصاویر دریافتی از دوربین را به صورت زنده و بدون وقفه روتوش نماید. چنان‌چه علاقمند به کسب اطلاعات بیش‌تر در مورد این پروژه هستید، شما را به مشاهده — که توسط تیم توسعه‌دهنده آن منتشر شده است — دعوت می‌کنیم.

هنوز خبر دقیقی از زمان عرضه عمومی این اپلیکیشن منتشر نشده است. همچنین مشخص نیست که آیا این سیستم در قالب یک اپلیکیشن جدید و مستقل عرضه خواهد شد، یا جهت ارتقای اپلیکیشن دوربین گوگل در دل گوشی‌های هوشمند پیکسل به کار خواهد رفت. شاید هم در حالت ایده‌آل گواهی استفاده از این تکنولوژی با قیمتی مشخص در اختیار توسعه‌دهندگان اپلیکیشن‌های دوربین و تولیدکنندگان گوشی‌های هوشمند قرار داده شود.

(image)

خدمات و ابزارهای گوگل در زمینه یادگیری ماشین

گوگل در سال‌های اخیر با سرمایه‌گذاری و تمرکز بالا در این زمینه، نام خود را به عنوان شرکتی پیشگام و تاثیرگذار در زمینه هوش مصنوعی و یادگیری ماشین مطرح نموده است. این شرکت علاوه بر به‌کارگیری یادگیری ماشین در بسیاری اپلیکیشن‌ها، سرویس‌ها و محصولات خود، سیستم‌های هوش مصنوعی پیشرفته‌ای همچون AlphaGo Zero و را با تکیه بر الگوریتم‌های یادگیری عمیق توسعه داده، همچنین با ارائه کتابخانه نرم‌افزاری متن-باز TensorFlow و حتی طراحی تراشه‌های خاص منظوره‌ای با نام TPU (مخفف Tensor Processing Unit) با قابلیت پردازش بهینه و موثر APIهای این کتابخانه، راه دیگر شرکت‌ها و برنامه‌نویسان مستقل را برای توسعه سیستم‌های مبتنی بر یادگیری ماشین هموار نموده است.

امروزه اغلب اپلیکیشن‌ها و سرویس‌های آنلاین گوگل به نوعی از یادگیری ماشین برای ارائه خدمات بهتر، متناسب‌تر و شخصی‌سازی شده‌تر به کاربران بهره می‌گیرند. Google Translate قادر است با استفاده از این تکنولوژی تشخیص دهد که آیا یک عکس حاوی متن هست یا خیر، موقعیت آن را شناسایی نموده و با تشخیص زبان مربوطه، آن را به زبان مورد نظر کاربر ترجمه نماید. Google Music بر اساس سابقه خرید و پخش موسیقی کاربر، سلیقه موسیقیایی وی را تشخیص داده و آهنگ‌هایی متناسب را به او پیشنهاد می‌دهد. موتور جست‌وجوی گوگل بر اساس سابقه جست‌وجوها و نتایج انتخاب‌های کاربران، عبارت‌های جست‌وجوی مناسب را به آن‌ها پیشنهاد داده و در قسمت جست‌وجوی تصاویر، عکس‌ها را بر اساس محتمل‌ترین نیازهای کاربر در گروه‌هایی دسته‌بندی نموده و به او ارائه می‌نماید. YouTube از یادگیری ماشین برای شناسایی موضوعات مورد علاقه کاربر استفاده نموده، بر آن اساس ویدئوهای ارائه شده توسط کانال‌هایی که کاربر در آن‌ها عضویت دارد را مرتب‌سازی می‌نماید و همچنین ویدئوهای جدیدی متناسب با سلایق کاربر به وی پیشنهاد می‌دهد. اپلیکیشن Inbox قادر است ایمیل‌های دریافتی کاربر را بر اساس نیازها، علایق و ارتباطات او با دیگران مرتب‌ و بهینه‌ کند و حتی بر اساس نحوه‌ پاسخگویی کاربر در گذشته، پاسخ‌های هوشمندانه‌ای را برای ایمیل‌های دریافتی تنظیم نماید.

(image)

در سال‌های اخیر شرکت گوگل دو سیستم هوش مصنوعی خود با نام‌های AlphaGo و Google Assistant را با تکیه بر تکنولوژی شبکه‌های عصبی مصنوعی و یادگیری عمیق توسعه و آموزش داده است. هوش مصنوعی AlphaGo پس از فراگیری بازی استراتژیک Go، در سال‌های 2015 و 2016 موفق گردید بازیکنان حرفه‌ای آن را در عرصه بین‌المللی شکست دهد. به دنبال این موفقیت گوگل نسخه جدید و پیشرفته‌تر این هوش مصنوعی را با نام AlphaGo Zero در سال 2017 معرفی نمود. این هوش مصنوعی که با استفاده از بستر برنامه‌نویسی TensorFlow گوگل توسعه یافته است، به سرعت بازی Go را فرا گرفته و موفق شد با شکست دو نفر از بهترین بازیکنان جهان، به صورت ضمنی عنوان برترین بازیکن Go را به خود اختصاص دهد.

از سوی دیگر با معرفی و عرضه Google Assistant در سال 2017، گوگل سعی نمود هوش مصنوعی و یادگیری عمیق را به صورت مستقیم و در قالب یک دستیار شخصی هوشمند وارد زندگی شخصی کاربران خود نموده و به خدمت ایشان درآورد. این هوش مصنوعی به عنوان مثال در حال حاضر قادر است قرارهای کاربر را به وی یادآوری نماید، فاصله زمانی تا محل کار او را با پیش‌بینی ترافیک تخمین بزند، آهنگ‌‌های مورد علاقه کاربر را دانلود و پخش کند، دوستان او را در عکس‌ها شناسایی نموده و در صورت تمایل کاربر آن عکس‌ها را با ایشان به اشتراک بگذارد. البته با توجه به پتانسیل بالای این هوش مصنوعی و اکوسیستم گسترده گوگل، می‌توان اطمینان داشت که دامنه توانمندی‌های Google Assistant به همین‌ میزان محدود نگردیده، با گذشت زمان سطح هوشمندی و مجموعه قابلیت‌های آن به سرعت افزایش خواهد یافت.

شرکت گوگل در سال 2015 بستر برنامه‌نویسی و کتابخانه نرم‌افزاری ویژه خود برای یادگیری ماشین و یادگیری عمیق با نام TensorFlow را به صورت متن‌باز در اختیار عموم قرار داد تا بدین وسیله دیگر توسعه‌دهندگان را در خلق سیستم‌های مبتنی بر شبکه‌های عصبی یاری دهد. البته گوگل در مسیر ارائه خدمات یادگیری ماشین برای توسعه‌دهندگان به همین‌جا بسنده ننموده است. این شرکت با آماده‌سازی تعدادی مدل یادگیری ماشین به صورت از-پیش-آموزش-یافته و در قالب APIهای تجاری، این امکان را برای توسعه‌دهندگان اپلیکیشن‌های همراه فراهم آورده تا بدون درگیر شدن در فرآیند توسعه شبکه‌های عصبی و سیستم‌های یادگیری ماشین، به راحتی و تنها با فراخوانی APIهای مربوطه در اپلیکیشن‌های خود سیستم‌های پیشرفته یادگیری عمیق گوگل را به خدمت گیرند. استفاده از این APIهای یادگیری ماشین که از طریق بستر خدمات ابری گوگل سرویس‌دهی می‌شوند در سطوح پایین رایگان بوده و در مقیاس تجاری با هزینه‌هایی اندک همراه است. مهم‌ترین و پرکاربردترین APIهای یادگیری ماشین گوگل که به صورت خدمات ابری ارائه می‌شوند عبارتند از: تحلیل تصویر؛ ترجمه ابری؛ تبدیل صدا به متن؛ تحلیل متن؛ تحلیل ویدئو و حتی شغل‌یابی.

(image)

تشخیص و تحلیل عناصر تصویر با استفاده از سرویس دید ابری گوگل

توسعه‌دهندگان می‌توانند با استفاده از API دید ابری یا Cloud Vision گوگل در دل اپلیکیشن خود، قابلیت شناسایی و درک محتوای یک عکس را به‌ دست آورند. از جمله مهم‌ترین قابلیت‌های این API می‌توان به موارد زیر اشاره نمود:

• تشخیص عناصر تصویر: امکان شناسایی عناصر مختلف موجود در تصویر، توصیف و دسته‌بندی آن‌ها.

• تشخیص چهره: امکان شناسایی چهره‌های متعدد درون یک عکس به همراه خصوصیات کلیدی هر چهره از جمله وضعیت احساسی، پوشش سر و صورت، رنگ پوست و نوع مو.

• تشخیص نوری حروف: قابلیت شناسایی و استخراج متن از درون عکس با پشتیبانی از زبان‌های متعدد و امکان تشخیص خودکار زبان متن.

• تشخیص لوگو: امکان شناسایی لوگوی برندهای معروف و شناخته شده درون تصاویر.

• تشخیص منظره: قابلیت تشخیص مناظر طبیعی و بناهای ساخت دست بشر در تصاویر.

• تشخیص محتوای نامناسب: امکان شناسایی انواع محتوای نامناسب از جمله عناصر خشونت‌آمیز یا مبتذل درون عکس‌ها.

به عنوان مثال Realtor.com به عنوان یک مجموعه فعال در زمینه معاملات املاک، از این API گوگل در توسعه اپلیکیشن خود برای سیستم‌عامل‌های اندروید و iOS بهره گرفته است. هنگامی که کاربران این اپلیکیشن در زمان جست‌وجو برای خرید یک ملک با اجرای اپلیکیشن از آن ملک، تابلو یا آگهی فروش آن عکس بگیرند، این اپلیکیشن با بهره‌گیری از قابلیت‌های دید ابری گوگل عناصر موجود در تصویر را شناسایی نموده، اطلاعات مربوط به مشخصات ملک و شرایط خرید آن را به کاربر ارائه می‌کند.

(image)

تحلیل، تبدیل و ترجمه متن به کمک APIهای ابری یادگیری ماشین گوگل

شرکت گوگل چند سرویس متکی بر یادگیری ماشین را در قالب APIهایی برای کار با متن ارائه می‌نماید که از مهم‌ترین آن‌ها می‌توان به گوگل Cloud Speech، گوگل Cloud Natural Language و گوگل Cloud Translation اشاره نمود.

سرویس Cloud Speech با بهره‌گیری از مدل‌های قدرتمند شبکه‌ عصبی امکان تبدیل صدا به متن را به راحتی از طریق فراخوانی API مربوطه برای توسعه‌دهندگان اپلیکیشن‌ها فراهم می‌آورد. این API در حال حاضر قادر به تشخیص 110 زبان مختلف بوده و حتی می‌تواند در صورت تمایلِ توسعه‌دهنده به صورت خودکار محتوای نامناسب را در متنی که تولید می‌شود فیلتر نماید. این سرویس می‌تواند با دریافت یک فایل صوتی، زبان آن را تشخیص داده و محتوایش به متن تبدیل نماید. همچنین قادر است صدای کاربر را حتی در محیط‌های شلوغ و دارای نویز به صورت زنده و هم‌زمان به متن تبدیل کند.

Cloud Natural Language دیگر API مهم گوگل برای پردازش متن است که می‌تواند با تحلیل متن موجود در یک فایل، مقاله خبری یا صفحه وب، اطلاعات مختلفی را در مورد اشخاص، مکان‌ها، رویدادها و بسیاری عناصر دیگر از آن استخراج نماید. این سرویس امکان تشخیص زبان متن را دارا بوده و حتی قادر است احساس کلی نویسنده را در خصوص موضوع مورد اشاره در متن شناسایی و درک نماید. این قابلیت مهم می‌تواند ابزاری قدرتمند و کارآمد در دست فروشگاه‌های آنلاین باشد برای تحلیل خودکار نظرهای کاربران و استفاده از نتایج به دست آمده برای اصلاح ایرادات، جلب نظر مشتری و افزایش فروش به صورت کاملا خودکار و کم هزینه. به علاوه، ترکیب این API با سرویس‌های Cloud Vision و Cloud Speech امکان استخراج و تحلیل این نوع اطلاعات متنی را از صدا و تصویر نیز میسر می‌نماید.

Cloud Translation همانطور که از نامش پیداست، به کمک یادگیری ماشین امکان ترجمه هوشمندانه متن‌ را از زبانی به زبان دیگر فراهم می‌آورد. سرویس ترجمه ابری گوگل بیش از 100 زبان مختلف را پشتیبانی نموده و می‌تواند زبان متن را بلافاصله با دقتی بالا شناسایی نماید. این API هم قادر خواهد بود در ترکیب با سرویس‌های Cloud Vision و Cloud Speech، ترجمه محتوای موجود در صدا و تصویر را نیز میسر کند.

(image)

آشنائی با فناوری یادگیری ماشین و کاربرد آن در دستگاه‌‌های همراه