چرا آینده عکاسی با کدنویسی گره خورده است؟ (بخش پایانی)

به قلم دوین کولدوی /  وب سایت تک کرانچ

دوربین چیست؟ یک لنز، یک شاتر، یک سطح حساس به نور و در دنیای امروز مجموعه ای از الگوریتم های دقیق و پیشرفته. در حالی که تجهیزات فیزیکی مورد استفاده در دوربین های عکاسی به تدریج پیشرفت می کنند، کمپانی هایی مانند گوگل، سامسونگ و اپل نیز سرمایه گذاری های سنگینی را بر روی توسعه روشی کاملا متفاوت از عکاسی انجام داده اند تا امروزه تصویربرداری رایانشی به میدان نبرد حقیقی بین غول های قدیمی و جدید تبدیل شود. دلیل چنین تغییر رویکردی کاملا روشن است: دوربین ها نمی توانند از آنچه امروز هستند بسیار بهترشوند مگر آنکه نحوه کارکرد آنها دچار تغییرات بنیادین گردد. در سال های گذشته تولید کنندگان تلفن های هوشمند دریافتند به تدریج در حال نزدیک شدن به محدودیت های فیزیکی ساخت دوربین در این دستگاه ها هستند و به همین دلیل تصمیم گرفتند به جای روبرو شدن با دیوار این محدودیت ها، میانبری از روی آن برای پیشرفت پیدا کنند.

مساله پول است

سنسورهای به کار رفته در دوربین تلفن های هوشمند در واقع معجزاتی گرانقدر از دنیای تکنولوژی هستند. کاری که کمپانی هایی مانند سونی، اومنی ویژن، سامسونگ و دیگران برای طراحی و تولید چیپ های دقیق، حساس و بسیار کوچک انجام داده اند فوق العاده تحسین برانگیز است. به خصوص برای عکاسانی که روند تدریجی و نسبتا کند پیشرفت دوربین های عکاسی حرفه ای را در طول دهه های اخیر دنبال کرده باشد مشاهده چنین پیشرفت های عظیمی که توسط این چیپ های کوچک به دست آمده اند کاملا ملموس است.

با این حال چیپ های مورد نظر در حال نزدیک شدن به محدودیت های فیزیکی هستند که قانون مور درباره آنها صحبت می کند. جهان دیجیتال در حال حرکت به سمت محدودیت های کوانتومی در ابعاد کمتر از 10 نانومتر است و به همین دلیل سنسورهای دوربین های دیجیتالی موبایل ها نیز با سرعت زیادی به سمت دیوارهای بلند این محدودیت حرکت می کنند. تصور کنید برخورد نور به سنسور دوربین گوشی موبایل شبیه به برخورد قطرات باران به سطح چند سطل آب است. شاید بتوانید تعداد سطل ها را بزرگتر کنید اما تعداد آنها در یک منطقه با ابعاد ثابت کمتر خواهد شد. از طرفی می توانید ابعاد آنها را کوچکتر کنید اما ظرفیت هر کدام از آنها برای جمع کردن قطرات آب هم کمترخواهد شد. شاید بتوانید شکل آنها را تغییر دهید و از سطل های مربعی یا شش ضلعی استفاده کنید اما در نهایت به محدودیتی تسلیم کننده خواهید رسید.

هوش مصنوعی در عکاسی

سنسورهای مورد استفاده در دوربین های تلفن های هوشمند هم با مشکل مشابهی روبرو هستند. این سنسورها به تدریج در حال قدرتمندتر و دقیق تر شدن هستند اما علاوه بر مشکل راضی کردن مشتریان به ارتقای سالانه گوشی های خود که تنها کمی از سال قبل بهتر شده اند، بهبود اندک آنها هم با مشکلات تکنیکی بیشتری به دلیل ابعاد رو به کوچک تر رفتن سنسورها و قطعات سازنده آنها مواجه می شود. شاید تصور کنید بتوان با ارتقای لنز کمی مشکلات را کاهش داد اما در واقع این طور نیست. لنزها در حال حاضر به سطحی از دقت و کمال رسدیه اند که بهبود آنها به خصوص در ابعاد کوچک تقریبا غیر ممکن به نظر می رسد. شاید تصور کنید وقتی از کمبود فضا در یک گوشی صحبت می کنیم صحبت از سانتیمترها است اما باید بدانید در بخشی مانند دوربین دعوا بر سر استفاده از میکرون هاست. تغییرات سالیانه شرکت های سازنده موبایل به بهبود نور عبوری و کاهش اعوجاج ها محدود می شود اما کلیات ثابت باقی می مانند. تنها راه برای جمع آوری نور بیشتر افزایش اندازه لنز است که یا باید از بدنه گوشی به مقدار ناخوشایندی فاصله بگیرد و بزرگتر شود، یا به وسیله جا به جا کردن بخش های دیگر درون بدنه دستگاه امکان پذیر گردد و یا توسط ضخامت بیشتر تلفن های هوشمند ممکن شود. اما هیچ کدام از این روش ها مورد قبول سازندگانی مانند اپل و سامسونگ و حتی مصرف کنندگان نیست. در واقع همه تولید کنندگان روی این نکته توافق کرده اند که تمرکز خود را از جذب نور بیشتر توسط دوربین برداشته و با راهکارهای متفاوت تری مشکل کیفیت عکس ها را حل کنند. اما چه راهکار متفاوتی؟

آیا همین حالا هم عکاسی با رایانش گره نخورده است؟

گسترده ترین تعریف عکاسی رایانشی یا computational photography همه مفاهیم تصویرگری دیجیتال را در بر می گیرد. بر خلاف فیلمبرداری، حتی ساده ترین دوربین های عکاسی دیجیتال هم نیازمند پردازش های رایانه ای برای تبدیل نور برخورد کننده به سنسور به یک تصویر پایدار هستند. تولید کنندگان دوربین ها از روش های مختلفی برای انجام این کار کمک می گیرند و در نتیجه روش های پردازشی مختلفی که از آنها با فرمت های JPEG و RAW و مشابه آنها یاد می کنیم ایجاد می شوند. برای مدتی طولانی تمایل چندانی برای خروج از این اصول ساده وجود نداشت که دلیل عمده آن عدم دسترسی به توان پردازشی بیشتر روی دوربین ها بود. با وجود ترفندهای کوچک سازندگان دوربین و استفاده از فیلترها هنوز گام بزرگی برای پیچیده تر کردن پردازش ها برداشته نمیشد.

اولین گام بزرگ در عکاسی پردازشی ویژگی نسبتا قدیمی و جالبی است که از آن با عنوان تکنولوژی تشخیص چهره یاد می کنیم و سپس تکنولوژی تشخیص و رهگیری اشیا برای حفظ کردن نقطه فوکس عکس به دوربین ها اضافه شد. این ویژگی ها باعث شدند عکس گرفتن از افراد در شرایط نوری مختلف و همچنین عکاسی ورزشی وارد دوران جدیدی شوند و همه آنها اولین نمونه ها از جمع آوری متا دیتا از تصویر و استفاده از آن برای بهبود عکس نهایی بودند. در دوربین های DSLR دقت فوکس خودکار و انعطاف پذیری آن ویژگی هایی کلیدی هستند اما برای سازندگان بزرگ این دوربین ها هم توجه چندان ویژه ای به بهینه سازی آنها صورت نمی گرفت. سنسورهای تصویری سریعتر باعث افزایش سرعت گرفتن عکس های پی در پی می شدند و همین نکته برای معرفی نسل های جدید دوربین های DSLR کافی به نظر می رسید. کسی انتظار نداشت از این دوربین های گران قیمت برای فیلمبرداری یا گرفتن تصاویر واقعیت مجازی استفاده شود و اوضاع به خوبی برای سازندگان مغرور این تجهیزات حرفه ای پیش می رفت. اما به زودی انقلاب تلفن های هوشمند آغاز شد. این دستگاه ها که قبلا هم دوربین های ساده ای را با خود حمل می کردند به تدریج تبدیل به دوربین هایی شدند که قابلیت مکالمه هم داشتند.

محدودیت های تصویربرداری کلاسیک

با وجود طرح ها و رنگ های مختلف و شعارهای تبلیغاتی گوناگون، دوربین تلفن های هوشمند تقریبا یکسان است. همه آنها باید در ابعادی به عمق چند میلیمتر قرار بگیرند و به این ترتیب محدودیتی برای ساختار لنزها و ابعاد سنسور ایجاد می کنند. برای مثال یک دوربین DSLR می تواند از سنسور APS-C با ابعاد 23 در 15 میلیمتر استفاده کند که مساحتی معادل 345 میلیمتر مربع را اشغال می کند. اما در سوی دیگر سنسور به کار رفته در دوربین تلفن هوشمندی مانند آیفون XS که احتمالا بزرگترین و پیشرفته ترین نمونه در کلاس خود در جهان است تنها ابعادی معادل 7 در 5.8 میلیمتر و مساحت کلی برابر با 40.6 میلیمتر مربع دارد.

چنین شرایطی طبیعتا به دلیل کمتر بودن نور ورودی باعث تفاوت چشمگیری در کیفیت عکس گرفته شده توسط این دوربین با یک DSLR میشود. اما در حال حاضر همه کاربران انتظار دارند دوربین آیفون در بدترین حالت با یک دوربین DSLR رده ورودی از نظر بازتولید رنگ و نور، گستره دینامیکی و نویز تصویر برابری کند. استفاده از روش های بهینه سازی سنتی مانند افزودن لرزشگیرهای اپتیکال و دیجیتال می تواند باعث افزایش نورگیری بدون تاری تصویر شود اما این تغییرات هم نمی توانند خواسته های کاربران را برآورده کنند. از سویی اپل (و سایر شرکت ها) هم قادر به اختراع نوع متفاوتی از دوربین های عکاسی نیستند و در نتیجه باید مساله را از روش متفاوتی حل کنند. اینجاست که پای هوش مصنوعی و کدهای پردازشی به میان می آید.

جریان تصاویر

راهبرد کلیدی در عکاسی رایانشی آن است که تصویر ورودی از سنسور دوربین فورا به عنوان تصویر نهایی و آن طور که عکس های قدیمی ظاهر می شدند در نظر گرفته نمی شود. در دوربین های قدیمی شاتر باز و بسته شده و ماده ای حساس به نور را برای مدت کوتاهی در معرض آن قرار می داد. اما داستان دوربین های دیجیتال کمی متفاوت است.

در مدل امروزی سنسور یک دوربین به صورت پیوسته توسط نور بمباران می شود. اگر به مثال ابتدایی این متن برگردیم می توان گفت سطل های آب پیوسته زیر بارش قطرات باران قرار دارند اما زمانی که در حال عکاسی نیستید این سطل ها سوراخ هستند و محتویات آنها بررسی نمی شود. زمانی که قصد ثبت یک عکس را دارید سیستم دوربین به شمارش قطرات باران مورد مثال پرداخته و در حقیقت نوری که با سنسور برخورد می کند را اندازه گیری می نماید و در نهایت نقطه پایان را نیز محاسبه می کند. این کار مشابه همان عمل باز و بسته شدن لحظه ای شاتر است که در دوربین های قدیمی اتفاق می افتاد. شاید این سوال مطرح شود که چرا عکاسی دیجیتال به صورت پیوسته انجام نمی شود؟ پاسخ ساده آن است که می توانید این کار را هم انجام دهید اما بدون شک با مشکلاتی نظیر تخلیه فوری باتری و تولید گرمای بسیار زیاد سخت افزارها روبرو خواهید شد. در سال های اخیر چیپ های پردازشی تصویربرداری به اندازه ای بهینه سازی شده اند که در زمان باز بودن اپلیکیشن دوربین می توانند چندین فریم قبل از فشار دادن دکمه شاتر را به یاد بسپارند و به همین دلیل است که شرکت هایی مانند اپل قابلیتی مانند تصاویر زنده را معرفی می کنند. اما کاربرد این به یاد سپاری تنها در داشتن عکس های متحرک خلاصه نمی شود.

زمانی که چندین فریم قبل یا بعد (یا هر دو حالت) از فشار دادن کلید شاتر به حافظه دستگاه سپرده شود جزئیاتی از تصویر مانند نور و بازتاب آن، اشیا و موقعیت آنها، حرکت و رنگ ها نیز در حافظه دستگاه باقی می مانند. گرفتن تصاویر HDR (گستره دینامیکی بالا) دقیقا از همین تکنیک استفاده می کند تا چند تصویر پشت سر هم با نوردهی متفاوت را از یک منظره ثبت کرده و سپس با ترکیب اطلاعات آنها تصویر نهایی را با شدت نورهای مختلف در نقاط گوناگون تصویر در اختیار کاربر قرار دهد. به جز حالت تصویربرداری HDR می توان در عکس های معمولی هم از همین قابلیت سنسورهای تصویربرداری استفاده کرد و این دقیقا عصای جادویی ویژه ای است که اپل و گوگل برای بهتر کردن عکس های گرفته شده با دوربین گوشی های ساخت خود از آن استفاده می کنند.

در سال های اخیر تکنیکی به نام "افکت بوکه" به یکی از مهم ترین پارامترهای سنجش کیفیت دوربین های موبایل تبدیل شده است. حتما در تصاویری که با دوربین گوشی های نسل جدید گرفته می شوند دیده اید که پس زمینه عکس تار شده و حالتی مشابه عکاسی با دوربین های پیشرفته و حرفه ای ایجاد می کند. در اینجا دستگاه نه تنها باید بتواند سوژه اصلی و فاصله پس زمینه از آن را تشخیص دهد، بلکه می بایست تصمیم بگیرد کدام عناصر موجود در تصویر نیازمند قرار گرفتن در افکت بوکه هستند. این کار می تواند به روش های مختلفی از جمله جداسازی چند کاناله در دو دوربین و یا به کمک هوش مصنوعی که برای یافتن حالت های مختلف صورت و فیزیک انسان تعلیم داده شده انجام شود.

اما استفاده از این تکنیک ها نیز پیش زمینه هایی دارد که اولین آنها وجود جریانی از تصاویر (چندین تصویر پشت سر هم از یک سوژه در فاصله زمانی بسیار کوتاه) و الگوریتم های بهینه سازی شده ای برای انجام محاسبات نرم افزاری و پردازش حجم زیادی از داده ها در کمترین زمان ممکن است و هر دو مورد ذکر شده به توان سخت افزاری بالای سنسور و رم دستگاه نیازمندند. با این حال آنچه درباره این تکنیک ها اهمیت دارد آن است که ممکن است یک کمپانی به دلایلی به جز سخت افزار دوربین قادر به اجرای بهتر آنها باشد. در اینجا کیفیت تصویر نهایی تابعی از مهندسی نرم افزاری و دیدگاه هنری برنامه نویسان خواهد بود.

این درست همان کاری است که شرکت هایی مانند اپل و گوگل انجام می دهند. آنها به واسطه توان نرم افزاری فوق العاده بالای خود الگوریتم هایی را توسعه می دهند که به تدریج هوشمندتر شده و کیفیت تصویر نهایی را به سطحی فراتر از محدودیت های فیزیکی دوربین های خود ارتقا می دهد. در سال های گذشته استفاده از این تکنیک ها برای اعمال افکت هایی مانند بوکه، گستره دینامیکی، کاهش نویز و بهبود کیفیت رنگی تصاویر نتیجه چندان رضایت بخشی حاصل نمیکرد اما به تدریج با قدرتمندتر شدن الگوریتم های هوش مصنوعی حالا باید به آنها به چشم پدیده های جدید دنیای عکاسی دیجیتال نگاه کرد. در تصویربرداری مدرن هر چه اطلاعات بیشتری از منظره عکاسی در اختیار باشد تصویر نهایی دقیق تر خواهد بود. اپل، گوگل و سایر شرکت های توسعه دهنده دوربین های موبایل ارزشی را در اختیار کاربران قرار می دهند که یک شرکت قدیمی تر و تخصصی عکاسی مانند لایکا با پرداخت رقمی مانند 2000 دلار به وسیله یک لنز تولید کرده اند. با این حال تفاوت در آن است که لایکا، کانن و نیکون این کار را به وسیله لرزشگیرهای اپتیکال بهینه سازی شده و لنز انجام می دهند و اپل و گوگل تنها به وسیله توان نرم افزاری و هوش مصنوعی.

دو چشم بینا

با وجود همه این قابلیت ها، رویکرد استفاده از ساختارهای چندگانه دوربین توسط تولید کنندگان کاملا در تضاد با توانایی های هوش مصنوعی و کدنویسی برای عکاسی قرار دارد. استفاده از دوربین های دوگانه، سه گانه و چهارگانه نور بیشتری وارد سنسور نمی کند زیرا این کار به فرآیند اپتیکی بسیار پیچیده تری از تنها اضافه کردن یک لنز دیگر به گوشی نیاز دارد. با این حال اگر تولید کننده بتواند کمی فضای خالی طولی (به جای عمقی) ایجاد کند می توان یک دوربین مجزا در کنار دوربین اصلی قرار داد که البته عکس هایی دقیقا مشابه همان قبلی بگیرد.

این دوربین ها عموما مستقل از هم عمل می کنند و معمولا یکی از آنها دارای خصوصیات زوم بیشتر یا زاویه دید گسترده تر است و یا داده ها را با هم ترکیب کرده تا عمق میدان دید ایجاد کنند. با این حال عمل گرفتن اطلاعات از یک دوربین و ترکیب آن با تصویر دوربینی دیگر نیازمند پردازش و کدنویسی مجزا است و تقریبا مشابه همان کاری را انجام می دهد که دوربین های تکی مانند آنچه گوگل در پیکسل ها عرضه می کند هم انجام می دهند. در نتیجه شاید اضافه کردن یک دوربین روشی برای بهبود سیستم تصویربرداری از نظر فیزیکی باشد اما باز هم راهبرد آن در عکاسی رایانشی نهفته است. برای مثال می توان گوشی کمپانی لایت با 16 سنسور را در نظر گرفت که اصولا تصاویر با کیفیت تری هم نسبت به دوربین آیفون یا پیکسل تولید نمی کند اما با این حال به کمک پردازش های پس زمینه تلاش می کند کیفیت عکس ها را در سطحی متفاوت ارائه کند.

نور و کدنویسی

آینده تصویربرداری بدون شک به پردازش های سخت افزاری وابسته است و بهینه سازی های اپتیکی راهی به آن ندارند. این اتفاق تغییری بزرگ در دنیای دوربین های عکاسی به شمار می رود و همه کمپانی های سازنده این محصولات را درگیر خود می کند. دوربین های کلاسیک عکاسی مانند SLR ها سنگرهای خود را یک به یک از دست می دهند (همین حالا هم دوربین های بدون آینده دنیای SLR ها را تهدید کرده اند) و آینده نیز در تصرف تلفن های هوشمند خواهد بود. از یک دیدگاه چنین اتفاقی بدان معناست که قرار نیست هر سال عدد مگاپیکسل ها، گستره ISO و گشودگی دیافراگم تغییری رادیکال را تجربه کند اما همین امر هم نکته منفی به حساب نمی آید. باید پذیرفت که لنزها از آنچه امروز هستند شفاف تر نخواهند شد و مسیر حرکت نور در دوربین تا رسیدن به چشم ما هم تغییری نخواهد کرد.

با این حال آنچه این دستگاه ها به کمک نور انجام می دهند با سرعت بسیار زیادی در حال تغییر است. این تغییرات ویژگی های عجیب و خیره کننده ای در اختیار کاربران قرار خواهند داد که شاید باتری دستگاه را سریعتر تخلیه کنند اما رضایتشان را نیز جلب خواهند کرد. همان طور که در قرن گذشته دوربین های عکاسی روند تکاملی را طی کرده اند، حالا باید ورود به عصری را شاهد باشیم که تجهیزات فیزیکی نقش پررنگ خود را در ثبت تصاویر از دست می دهند و کدهای هوش مصنوعی کیفیت تصاویر را مشخص می کنند.

(18 رای‌ها)

کاربرانی که در این گفتگو شرکت کرده اند

  • حامد

    سلام
    هنوز تکنولوژی های سخت افزاری جای پیشرفت دارند. برای مثال روش های جالبی مطرح شدند. البته من اطلاعات زیادی در مورد دوربین و لنز ندارم ولی قبلا اتفاقی مطالبی خوانده بودم که برای سایر خوانندگان هم قرار می دهم.
    لینک اول:

    لینک دوم:

    لینک سوم:

    0 پاسخ

دیدگاه خود را اضافه کنید.

ارسال دیدگاه به عنوان مهمان

0
دیدگاه شما پس از تایید مدیریت منتشر خواهد شد.

تصاویر نویسندگان دیدگاه از Gravatar گرفته می‌شود.