somewhere in... blog
x
ফোনেটিক ইউনিজয় বিজয়

মেশিনকে দেয়া একজোড়া ভাল চোখ - 2: দ্্বিমাত্রিক থেকে ত্রিমাত্রিক

০৭ ই জুলাই, ২০০৬ ভোর ৪:৪৭
এই পোস্টটি শেয়ার করতে চাইলে :

**(এই লেখাটা 'মেশিনকে দেয়া একজোড়া ভাল চোখ - 1' এর পরবর্তী অংশ;
একটু কঠিন আলোচনা আছে এখানে, তাই যতটুকু সম্ভব সহজ করে লেখার চেষ্টা করলাম।

হয়ত উলটে আরও কঠিন হয়ে গেছে ( .... )

////////////////////////////////////////////////

আগের পর্বের প্রশ্নটা ছিল কিভাবে 3D measurement accuracy বাড়ানো যায় প্যাসিভ সিস্টেমে, অর্থাৎ শুধু ক্যামেরা ব্যাবহারকারী সিস্টেমে।

ব্যাপারটা বুঝতে হলে আগে শুধু ক্যামেরা ব্যাবহার করে কিভাবে ত্রিমাত্রিক পরিমাপ (3D measurement ) করা যায় তা একটু বুঝতে হবে।

ক্যামেরার সাহায্যে আমরা দ্্বিমাত্রিক ছবি পাই।
সুতরাং, শুধু ক্যামেরা ব্যাবহার করে 3D measurement এর মানে হলো দ্্বিমাত্রিক তথ্য থেকে ত্রিমাত্রিক তথ্য বের করা।

কয়েক রকম উপায় আছে এই 2D to 3D এর জন্য;
তবে সবচেয়ে কার্যকরী এবং কম এররের জন্য যে উপায় বা মেথডটি পরিচিত তা হলো Stereo vision;
এটা সম্পর্কে প্রথমে একটু জানা যাক।

আসুন একটা সহজপরীক্ষা করি;

পরীক্ষার জন্য আপনার দু'চোখ আর ডান/বাম যেকোন হাতের একটা আঙুলই যথেষ্ট। (সরি, সুমন চৌধুরি, আপনার একটু অসুবিধা হতে পারে ... হে হে হে ... :) ...চোখের রেস্ট নেন )

আপনার দুচোখের সামনে মোটামুটি নাক বরাবর যে কোন একটি পজিশনে আঙুলকে ধরুন;
(আপনার চোখের সামনে মোটামুটি 3 মিটার দুরত্বে একটা দেয়াল থাকে সবচেয়ে ভাল।)

নিচের কাজদুটি করুন (ক. আর খ.)

ক. এখন প্রথমে বাম চোখ বন্ধ করে আঙুলটিকে দেখুন;

খ. তারপর ডানচোখ বন্ধ ও বামচোখ খুলুন এবং আঙুলটিকে দেখুন;

আঙুলটি কি ডানদিকে সরে যায়নি?

আবার (ক.) রিপিট করুন;

আঙুলকি বামদিকে সরে আসেনি?

আসলে আমাদের দুইচোখে যেকোন বস্তুর দুটো ছবি তৈরী হয়;
ছবি দুটোকে ব্যাবহার করে মস্তিষ্ক হিসেব করে একটা বস্তু কতদুরে আছে।

এখন ধরুন,ডানচোখে দেখা আঙুলের অবস্থান আর বামচোখে দেখা আঙুলের অবস্থানের মাঝে দুরত্বটা 5 সে.মি. ।
এই দুরত্বটাকে বলে 'ডিসপ্যারিটি'।

পরীক্ষাটা কিন্তু এখনও শেষ হয়নি :)

আপনার আঙুলটিকে এখন সামনে পিছে এনে উপরের (ক.) আর (খ.) রিপিট করে দেখুনতো 'ডিসপ্যারিটি'র কি দশা হয়?

আঙুলকে চোখের কাছে এনে দেখুন।
ডিসপ্যারিটি বাড়ল, না কমল?
বাড়ল, তাইনা?

আঙুলকে চোখ থেকে দূরে নিয়ে যান; ডিসপ্যারিটির কি হলো?
কমল, তাইনা?

এখন যেটা বলা যায়, তা হলো কোন বস্তুর ক্ষেত্রে এই ডিসপ্যারিটি যদি বেশী হয়, তাহলে তা কাছে আছে; আর ডিসপ্যারিটি যদি কম হয় তাহলে তা দূরে আছে;
সুতরাং , ডিসপ্যারিটি থেকে দুরত্বের একটা ধারনা পাও য়া যায়;

এখন ভেবে দেখুন, ডিসপ্যারিটি কি দ্্বিমাত্রিক না?

দুই চোখে যে দুটি ছবি তৈরি হলো, তাতে আঙুলটির অবস্থানের দুরত্বটাই ছিল ডিসপ্যারিটি।
আর এই দ্্বিমাত্রিক ডিসপ্যারিটি থেকে আমরা বস্তুর দূরত্ব জানতে পারি, এবং দূরত্বটা হলো ত্রিমাত্রিক। হয়ে গেল 2D to 3D ...

কঠিন হয়ে গেল?
আরেকবার পড়ুন; সহজ হবে আশা করি :)

তাহলে, এখন দুরত্ব জানতে হলে আমাদের কি জানতে হবে?

জানতে হবে -1. দুই চোখে গঠিত ছবি বা ইমেজের কোথায় কোথায় আঙুলটি অবস্থিত।

জানতে হবে -2. জ্যামিতিক হিসেবের জন্য, দুইচোখের দূরত্ব, দুই চোখের রেটিনাল প্লেনের মধ্যকার কোণ, চোখের লেন্সের ফোকাল লেংথ (এটা একটা বস্তু চোখের রেটিনায় কতভাগ ছোট হয়ে ইমেজড হয় তা হিসেবে সহায়তা করে) -- এসব এবং আরো কিছু প্যারামিটার


Stereo visionটা ঠিক চোখের এই নীতি মেনেই চলে (সহজভাবে বললে);

Stereo vision এ দুটো ক্যামেরা লাগবে (অথবা একটা ক্যামেরাকে দুই জায়গায় রেখে দুবার একই জিনিসের ছবি তোলা লাগবে);

ক্যামেরা দুটো হলো চোখ;

ক্যামেরাদুটোকে সেট করার পর তাদের মধ্যকার দূরত্ব, ক্যামেরাগুলোর রেটিনাল প্লেনদুটোর মধ্যকার কোণ, ক্যামেরাগুলোর ফোকাল লেংথ ও আরও কিছু প্যারামিটার (উপরের জানতে হবে -2) হিসেব করতে হবে -- এটা হলো 'টাস্ক 1' ।
ক্যামেরা ক্যালিব্রেশান পদ্ধতির মাধ্যমে এটা করা যায়;
বর্তমানে এরজন্য ভাল অনেক সফটওয়্যার টুলকিটস আছে; তাই 'টাস্ক 1' -- খতম!!
(ডিটেইলস জানতে চাইলে আওয়াজ দেবেন, রিফারেন্স পেপারের লিংক দেব)

তারপর ছবি তোলা হয়;

ধরুন একটা 'লাল বিন্দু' আর একটা 'নীল বিন্দু'র ছবিই তোলা হলো।

এখন বামের ক্যামেরা আর ডানের ক্যামেরায় তোলা ছবিদুটোতে বিন্দুগুলো কোথায় আছে তা খুঁজে বের করতে হবে -- এটা 'টাস্ক 2';

তাহলে বিন্দুগুলোর ডিসপ্যারিটি জানা যাবে;

ধরুন বামপাশের ছবিতে লাল বিন্দু আছে (100,100)নম্বর পিক্সেলে ... ডানপাশে তা আছে (200,150) নম্বর পিক্সেলে;
তাহলে 'লাল বিন্দু' টার ডিসপ্যারিটি হলো (100,50) অর্থাৎ sqrt(100x100+50x50),
sqrt হলো square root।
যেমন, 4 এর square root হলো 2, 9 এর square root হলো 3।

ধরুন, নীল বিন্দুর ডিসপ্যারিটি হলো (110,50);

তারমানে নীল বিন্দুটির ডিসপ্যারিটি বেশী;

তাহলে, কোন বিন্দুটি বেশী দূরে আছে?
লাল না নীল?
লাল, তাইনা?
কারণ ডিসপ্যারিটি যত কম, দূরত্ব তত বেশী।

এখন দেখুন, ডিসপ্যারিটি জানতে পারলে আমরা একটা বিন্দু দূরে না কাছে তা বলতে পারি;

এখন Exactly কত দূরে বা কাছে তা জানতে হলে ঐ 'জানতে হবে -2' এর প্যারামিটারগুলোও জানতে হবে।

তাহলে একটা বিন্দুর আসল দূরত্ব বলা যাবে;


তাহলে দেখা যাচ্ছে, আমাদের দুটো টাস্ক:

টাস্ক 1: ক্যামেরা ক্যালিব্রেশানের মাধ্যমে 'জানতে হবে -2' এর প্যারামিটারগুলো জানা --- এটা খতম!!

টাস্ক 2: যেকোন বিন্দু বাম আর ডানের ক্যামেরায় কত নম্বর পিক্সেলে ইমেজড হয়েছে তা জানা;
এই ব্যাপারটাকে stereo vision এ বলা হয় 'করেসপন্ডেন্স সার্চ'।

এই টাস্ক 2 ('করেসপন্ডেন্স সার্চ') টাই ঝামেলা!!
এখানে কম্পিউটার গাধাটা মানুষের মতো স্মার্ট না বলেই নানান উপায় (কূলীনরা বলি এ্যালগরিদম) বের করতে হয়!
আর এই কাজটাতে এরর বেশী থাকে বলেই সাধারণত প্যাসিভ সিস্টেমগুলো ভাল পারফর্ম করতে পারেনা!!

আমার পি.এইচ.ডি গবেষণায় আমি প্রস্তাব রেখেছি যে ইমেজের শুধুPhase information ব্যাবহার করলে অনেক কম এররে এই 'করেসপন্ডেন্স সার্চ' করা সম্ভব।

সেটা অনেক জটিল কাহিনী।
পরের লেখায় হাল্কা একটা ধারনা দিতে চেষ্টা করব।

(সহজ করে লেখা যে কি কঠিন, হাড়ে হাড়ে টের পাচ্ছি ... )
সর্বশেষ এডিট : ০৭ ই জুলাই, ২০০৬ ভোর ৪:৫৯
১৯টি মন্তব্য ০টি উত্তর

আপনার মন্তব্য লিখুন

ছবি সংযুক্ত করতে এখানে ড্রাগ করে আনুন অথবা কম্পিউটারের নির্ধারিত স্থান থেকে সংযুক্ত করুন (সর্বোচ্চ ইমেজ সাইজঃ ১০ মেগাবাইট)
Shore O Shore A Hrosho I Dirgho I Hrosho U Dirgho U Ri E OI O OU Ka Kha Ga Gha Uma Cha Chha Ja Jha Yon To TTho Do Dho MurdhonNo TTo Tho DDo DDho No Po Fo Bo Vo Mo Ontoshto Zo Ro Lo Talobyo Sho Murdhonyo So Dontyo So Ho Zukto Kho Doye Bindu Ro Dhoye Bindu Ro Ontosthyo Yo Khondo Tto Uniswor Bisworgo Chondro Bindu A Kar E Kar O Kar Hrosho I Kar Dirgho I Kar Hrosho U Kar Dirgho U Kar Ou Kar Oi Kar Joiner Ro Fola Zo Fola Ref Ri Kar Hoshonto Doi Bo Dari SpaceBar
এই পোস্টটি শেয়ার করতে চাইলে :
আলোচিত ব্লগ

Victims of enforced disappearances পার্সন হিসেবে আমার বক্তব্য.....

লিখেছেন জুল ভার্ন, ০৫ ই মে, ২০২৬ দুপুর ১২:২১

গত ২৫ এবং ২৬ এপ্রিল ২০২৬ এ মানবাধিকার সংগঠন 'অধিকার' এবং World Organization Against Torture (OMCT) এর যৌথ উদ্যোগে ঢাকায় “The Prevention of Torture and the Implementation of UNCAT and... ...বাকিটুকু পড়ুন

পশ্চিমবঙ্গে বিজেপির উত্থান বাংলাদেশের ওপর সম্ভাব্য প্রভাব

লিখেছেন ওয়াসিম ফারুক হ্যাভেন, ০৫ ই মে, ২০২৬ দুপুর ১:২৯

পশ্চিমবঙ্গের বিধান সভা নির্বাচনে ভারতীয় জনতা পার্টির (বিজেপি) জয় এবং এর ফলে উদ্ভূত আদর্শিক পরিবর্তন কেবল ভারতের একটি প্রাদেশিক বিষয় হিসেবে দেখার সুযোগ নেই। এটি দক্ষিণ এশিয়ার ভূ-রাজনৈতিক সমীকরণে,... ...বাকিটুকু পড়ুন

আমাদের খারাপ দিনের পর

লিখেছেন সামিয়া, ০৫ ই মে, ২০২৬ বিকাল ৫:৫৪




আমার মাথা যেন আর কাজ করছিল না। বাইরে থেকে আমি স্বাভাবিক হাঁটছি, চলছি, পড়ছি, বন্ধুদের সাথে আড্ডা দিচ্ছি কিন্তু ভেতরে ভেতরে আমি সম্পূর্ণ ভেঙে পড়েছিলাম মায়ের কথা ছোট বোনটার... ...বাকিটুকু পড়ুন

গেরুয়া মানচিত্রে পশ্চিমবঙ্গ: একটি রাজনৈতিক বিশ্লেষণ ও শিক্ষা।

লিখেছেন কলিমুদ্দি দফাদার, ০৫ ই মে, ২০২৬ রাত ১০:৩৮


দীর্ঘ ১৫ বছরের টিএমসির শাসনের সমাপ্তি ঘটিয়ে অবশেষে বাংলাদেশের সীমান্তবর্তী ভারতীয় রাজ্য পশ্চিমবঙ্গে ক্ষমতার পালাবদল হয়েছে। গেরুয়া শিবিরের এই ভূমিধস জয়ের পেছনে অবশ্য মোদি ম্যাজিকের চেয়ে সাবেক মুখ্যমন্ত্রী মমতার ব্যর্থতার... ...বাকিটুকু পড়ুন

নিজের দোষ দেখা যায় না, পরের দোষ গুনে সারা

লিখেছেন সৈয়দ কুতুব, ০৬ ই মে, ২০২৬ রাত ২:১০


ভারতের বিধানসভা নির্বাচনে মমতা বন্দ্যোপাধ্যায়ের পতন নিয়ে বাংলাদেশে যে পরিমাণ চুলচেরা বিশ্লেষণ হচ্ছে, তা দেখে অবাক না হয়ে উপায় নেই। সোশ্যাল মিডিয়ায় ঢুকলেই দেখা যায় অদ্ভুত সব তত্ত্ব। ফেইসবুক... ...বাকিটুকু পড়ুন

×