فشرده سازی شبکه عصبی

شبکه‌های عصبی مصنوعی برای طیف گسترده‌ای از وظایف در تجزیه و تحلیل و پردازش چند رسانه‌ای، مانند طبقه‌بندی بصری و صوتی، استخراج توصیفگرهای چندرسانه‌ای یا کدگذاری تصویر و ویدئو، به کار گرفته شده‌اند. شبکه‌های عصبی آموزش‌دیده ‌شده برای این کاربردها حاوی تعداد زیادی پارامتر (یعنی وزن‌ها) هستند که در نتیجه حجم داده قابل‌توجهی دارند. بنابراین، انتقال آنها به کاربرانی که از آنها در برنامه ها استفاده می کنند (به عنوان مثال، تلفن های همراه، دوربین های هوشمند) نیاز به یک نمایش فشرده از شبکه های عصبی دارد.

در آوریل 2021، MPEG اولین استانداردهای بین‌المللی فشرده‌سازی شبکه عصبی برای کاربردهای چندرسانه‌ای ISO/IEC 15938-17) ) که به‌عنوان جعبه ابزار فناوری‌های فشرده‌سازی طراحی شده بود را تکمیل کرد. این مشخصات شامل روش‌های مختلف الف) کاهش پارامترها (مانند هرس، افزایش پراکندگی و تجزیه ماتریس) ب) تبدیل پارامتر (به عنوان مثال، کوانتایزیشن)، و پ)روش‌های کدگذاری آنتروپی است، که می‌توانند برای کدگذاری خطوط لوله با ترکیب یک یا چند خط لوله (در صورت کاهش) بکار گرفته شوند. نتایج نشان می‌دهد که شبکه‌های عصبی آموزش‌دیده برای بسیاری از مشکلات چندرسانه‌ای مانند طبقه‌بندی تصویر یا صدا یا فشرده‌سازی تصویر را می‌توان با ضریب ۱۰ تا ۲۰ بدون افت عملکرد و حتی به نسبت بیش از ۳۰ با مقداری کاهش در عملکرد فشرده کرد. استاندارد جدید به یک معماری شبکه عصبی خاص محدود نمی شود و مستقل از انتخاب قالب تبادل شبکه عصبی است. قابلیت ارتباط با فرمت های رایج تبادل شبکه عصبی در پیوست های استاندارد توضیح داده شده است.

Subscribe
Notify of
guest
0 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments