কৃত্রিম বুদ্ধিমত্তা GANs ব্যবহার করে জীবন থেকে মোনা লিসা আনা

এটা বিশ্বাস করা হয় যে লিওনার্দো দা ভিঞ্চি এক দশকেরও বেশি সময় ধরে লিসা দেল জিওকোন্ডোর একটি বাস্তবসম্মত সংস্করণ আঁকতে লাগলেন যা বিশ্বের সবচেয়ে বিখ্যাত প্রতিকৃতি 'মোনা লিসা'। দা ভিঞ্চি তার প্রাপ্তবয়স্ক জীবনের তৈরি ভাস্কর্যের মাধ্যমে এবং মানব শরীরবিজ্ঞান অধ্যয়নরত।

কৃত্রিম বুদ্ধিমত্তা GANs ব্যবহার করে জীবন থেকে মোনা লিসা আনা
কৃত্রিম বুদ্ধিমত্তা GANs ব্যবহার করে জীবন থেকে মোনা লিসা আনা


বিস্তারিত জানার জন্য তাঁর চোখটি রেনেসাঁর সময় পেইন্টিংয়ে মানুষের সবচেয়ে বাস্তবসম্মত পুনর্গঠনকে নেতৃত্ব দেয়, যা হাড়ের গঠনকে বিভ্রান্ত করার জন্য আলো এবং ছায়া দিয়ে অভিনয় করে দেখা যায়। এখন চার শতাব্দীরও বেশি সময় পরে পুনর্নির্মাণের একটি ভিন্ন ধরনের সূচনা হয়েছে। সুপার বাস্তবসম্মত প্রতিকৃতি ইতিমধ্যে অতীতের একটি জিনিস।


এখন, কীভাবে ছবিতে বিষয়গুলি নিয়ে যাওয়ার, কথা বলার এবং প্রকাশ করা যায়?

স্যামসাং এআই, মস্কোর গবেষকরা যারা এই কাগজটির লেখক, তারা মেশিন লার্নিং অ্যালগরিদমটি একইভাবে ব্যবহার করেছেন এবং ফলাফলগুলি প্রতিশ্রুতিবদ্ধ। এক ধরনের উদাহরণ এই প্রবন্ধের শুরুতে দেখা যেতে পারে।

২014 সালে এই কাগজ প্রকাশের সাথে সাথে, জিএএনগুলির অ্যাপ্লিকেশনগুলি ব্যাপক বৃদ্ধি পেয়েছে।

জেনেটিক-অ্যাডভারারিয়াল নেটওয়ার্কগুলি সফলভাবে উচ্চ-সততা প্রাকৃতিক ইমেজ সংশ্লেষণের জন্য ব্যবহার করা হয়েছে, শিখেছি চিত্র সংকোচনের এবং ডেটা বর্ধন কর্মগুলি উন্নত করা।

GANs একটি বিন্দুতে অগ্রসর হয়েছে যেখানে তারা ক্ষুদ্র অনুভূতিগুলিকে উল্লেখযোগ্য মানব আবেগগুলি চিহ্নিত করতে পারে।

স্থাপত্য উপর একটি সংক্ষিপ্ত
কয়েকটি শট লার্নিং লক্ষ্য দৃষ্টিভঙ্গির এক উদাহরণে কয়েকটি ব্যবহার করে তথ্য / চিত্র শ্রেণিবদ্ধ করার জন্য কম্পিউটার দৃষ্টি অ্যাপ্লিকেশনগুলিতে একটি জনপ্রিয় কৌশল। উদাহরণস্বরূপ, মোনা লিসার প্রতিকৃতির একমাত্র উদাহরণ রয়েছে। সুতরাং, মডেলটি বাস্তবিক মানবিক এক্সপ্রেশনগুলির সাথে একটি মণি লিসারের দুই মাত্রিক অর্ধেক ঢালযুক্ত মুখটি এম্বেড করার জন্য, নীচে দেখা যেতে পারে এমন মেটা লার্নিং আর্কিটেকচার ব্যবহার করা হয়েছিল।

এটি একটি এম্বেডর নেটওয়ার্ক রয়েছে যা এম্বেডিং ভেক্টরগুলিতে মাথা চিত্রগুলি (আনুমানিক মুখ ল্যান্ডমার্কগুলির সাথে) ম্যাপ করে থাকে, যা পজ-স্বাধীন তথ্য ধারণ করে।

মেটা-লার্নিংয়ের সময়, একই ভিডিওর ফ্রেমের একটি সেট জেনারেটরের অভিযোজিত পরামিতিগুলির পূর্বাভাসের জন্য এম্বেডারের মাধ্যমে প্রেরণ করা হয়। তারপরে, একটি ভিন্ন ফ্রেমের ল্যান্ডমার্ক জেনারেটরের মাধ্যমে গৃহীত হয়, ফলে চিত্রটি স্থল সত্যের সাথে তুলনা করে। এখানে, উদ্দেশ্যমূলক ফাংশনটি ধারণক্ষম এবং প্রতিকূল ক্ষতি অন্তর্ভুক্ত, পরবর্তীটি একটি শর্তাধীন অভিক্ষেপ বৈষম্যমূলক দ্বারা প্রয়োগ করা হচ্ছে।

মডেল প্রশিক্ষণ দেওয়ার জন্য, কথোপকথনের প্রধান ডেটাসেটগুলি, ভক্সক্লিব 1 এবং ভক্সক্লিব 2 ব্যবহার করা হয়েছিল।

মুখোমুখি চ্যালেঞ্জ এবং এই কাজের ভবিষ্যৎ
সফলভাবে মুখের বৈশিষ্ট্যগুলি পুনঃনির্মাণে বেশ কয়েকটি কাজ করা হচ্ছে। মডেলিং মুখগুলি হ'ল মাথার মডেলিংয়ের সাথে সম্পর্কিত একটি অত্যন্ত সম্পর্কিত কাজ, দুটি কাজ একই রকম নয়, কারণ পরবর্তীতে চুল, ঘাড়, মুখ গহ্বর এবং প্রায়শই কাঁধ / উপরের পোশাকের মত মুখহীন অংশগুলি মডেল করা হয়।

"এই নন-মুখ অংশগুলি মুখ মডেলিং পদ্ধতির কিছু ক্ষুদ্র এক্সটেনশান দ্বারা পরিচালিত হতে পারে না কারণ এটি নিবন্ধীকরণের জন্য খুব কম যোগ্য এবং প্রায়শই মুখের অংশে উচ্চতর পরিবর্তনশীলতা এবং উচ্চ জটিলতা থাকে। মূলত, মুখের মডেলিং বা ঠোঁট মডেলিং ফলাফল বিদ্যমান শিরোনাম ভিডিওতে সেলাই করা যেতে পারে। যেমন নকশা, তবে, ফলে ভিডিওতে মাথা ঘূর্ণন উপর সম্পূর্ণ নিয়ন্ত্রণ করার অনুমতি দেয় না এবং অতএব সম্পূর্ণরূপে উন্নত কথোপকথন মাথা সিস্টেমের ফলে হয় না; "তাদের কাগজ লেখক লিখেছেন।

এই কাজের মধ্যে, লেখকরা ব্যক্তিগতকৃত ফটো বাস্তবসম্মত কথোপকথনগুলির প্রধান মডেলগুলি তৈরি করার কাজটিকে বিবেচনা করে, যেমন সিস্টেমগুলি স্পীচ এক্সপ্রেশন এবং বিশেষ ব্যক্তির অনুকরণের সরল ভিডিও-ক্রম সংশ্লেষ করতে পারে। এই কনফারেন্সের জন্য ভিডিও কনফারেন্সিং এবং মাল্টি-প্লেয়ার গেমগুলির পাশাপাশি বিশেষ প্রভাব শিল্প সহ টেলিপ্রেসেন্সের জন্য ব্যবহারিক অ্যাপ্লিকেশন রয়েছে।

0 Comments: