জেনারেটিভ এআইয়ের প্রসারের সঙ্গে এআই-নির্ভর টেক্সট-টু-ইমেজ জেনারেটরগুলো সাম্প্রতিক সময়ে জনপ্রিয় হয়ে উঠছে। মূলত এ পদ্ধতিতে ব্যবহারকারীরা পছন্দমতো কমান্ড দেয়ার মাধ্যমে ইমেজ জেনারেটরে ছবি ও চিত্রকর্ম তৈরি করতে পারে।
বিভিন্ন টেক্সট-টু-ইমেজ সার্ভিসে সাবস্ক্রিপশন সুবিধা থাকলেও সাধারণ ব্যবহারকারীদের কাছে ছবি তৈরিতে ওপেন সোর্স প্লাটফর্মগুলোই আকর্ষণীয়। অনলাইনে থাকা সেরা পাঁচটি ফ্রি ও ওপেন সোর্স এআই টেক্সট-টু-ইমেজ জেনারেটরের তথ্য মেক ইউজ অব সূত্রে জানা গেছে। এগুলো হলো-
ক্রেইয়ন: ক্রেইয়ন বর্তমানে সবচেয়ে সহজে ব্যবহারযোগ্য ওপেন সোর্স এআই ইমেজ জেনারেটর। মূলত এটি ওপেনএআইয়ের ইমেজ জেনারেটর মডেল ডাল-ই মিনির ওপর ভিত্তি করে নির্মাণ করা হয়েছে। ক্রেইয়ন ওয়েবসাইটের মাধ্যমে ক্রেইয়ন টুল বিনামূল্যে ব্যবহার করা যায়। ক্রেইয়নের কোনো অ্যান্ড্রয়েড বা আইওএস অ্যাপ নেই। এতে ব্যাকগ্রাউন্ড রিমুভ করা, হাই-রেজল্যুশন ইমেজ তৈরি, ফাইলের সাইজ ও কোয়ালিটি আপস্কেল করার ফিচার রয়েছে। ব্যবহারকারীরা ক্রেইয়নের আর্ট, ফটো ও ড্রয়িং তিনটি স্টাইল নির্বাচন করতে পারবে। এছাড়া এআই-চালিত রিমুভ ফিচার ছবি থেকে ব্যাকগ্রাউন্ড অপসারণের ক্ষেত্রে ব্যবহারকারীর সময় বাঁচাবে। ক্রেইয়নে ব্যবহারকারীরা বিনামূল্যে প্রতি মিনিটে নয়টি ছবি বা ইমেজ তৈরি করতে পারবেন।
স্ট্যাবল ডিফিউশন: স্ট্যাবল ডিফিউশন বর্তমানে সবচেয়ে জনপ্রিয় ও শক্তিশালী ওপেন সোর্স টেক্সট-টু-ইমেজ জেনারেশন মডেল। এটি ২০২২ সালে প্রকাশ হয়। তার পর থেকে মডেলটিতে একাধিক আপডেট এনেছে ডেভেলপার স্ট্যাবিলিটি এআই। এ মডেলটি কম্পিউটারে ইনস্টল করে ব্যবহার করা যায়। সেক্ষেত্রে কম্পিউটারে কমপক্ষে ৪ গিগাবাইট র্যাম ও একটি ডেডিকেটেড গ্রাফিকস প্রসেসিং ইউনিট (জিপিইউ) থাকা প্রয়োজন। তবে এ মডেলটি অনলাইনেও ব্যবহার করা যায়। স্ট্যাবল ডিফিউশনের বেশ কয়েকটি সংস্করণ অনলাইনে রয়েছে। বর্তমানে তারা সর্বশেষ সংস্করণ স্ট্যাবল ডিফিউশন ৩ উন্নয়নে কাজ করছে।
ড্রিমশেপার: মূলত ড্রিমশেপার স্ট্যাবল ডিফিউশনের ওপর ভিত্তি করে তৈরি করা একটি টেক্সট-টু-ইমেজ জেনারেটিং মডেল। এটি মিডজার্নির ওপেন-সোর্স কোডের বিকল্প হিসেবে তৈরি করা হয়েছিল। মডেলটি ফটোরিয়ালিজমনির্ভর। তবে ড্রিমশেপারের মাধ্যমে ব্যবহারকারীরা অন্যান্য স্টাইলের পাশাপাশি অ্যানেমে ও পেইন্টিং আর্ট স্টাইলেও ছবি বা চিত্রকর্ম তৈরি করতে পারে। ব্যবহারকারীরা পূর্ব প্রশিক্ষণপ্রাপ্ত সংস্করণ ডাউনলোড করে নিজেদের কম্পিউটারে ড্রিমশেপার চালাতে পারবে। এছাড়া জিপিউ এক্সেলারেশন ব্যবহার করে সিনকিনডটএআই, র্যান্ডমসিড ও মেজডটস্পেস ওয়েবসাইটের মাধ্যমে ড্রিমশেপার ব্যবহার করতে পারবে।
ইনভকএআই: ইনভকএআই স্ট্যাবল ডিফিউশনের ওপর ভিত্তি করে তৈরি করা আরেকটি এআই ইমেজ জেনারেশন মডেল। মূলত এটি স্ট্যাবল ডিফিউশনের এক্সএল সংস্করণের মাধ্যমে তৈরি করা হয়েছে। এটি ব্যবহারকারীদের পেশাদার ভিজুয়াল তৈরির সুযোগ দেয়। মডেলটির নিজস্ব ওয়েব ও কমান্ড লাইন ইউজার ইন্টারফেস রয়েছে। ইনস্টলেশন পদ্ধতিগুলোর মধ্যে ইনভকএআইয়ের ইনস্টলার বা দ্য পাইথন প্যাকেজ ইনডেক্স (পাইপিআই) ব্যবহার করা যায়। তবে এটি চালানোর জন্য শক্তিশালী হার্ডওয়্যার প্রয়োজন। ইনভকএআই ব্যবহারে কমপক্ষে ৪ গিগাবাইট র্যামসহ একটি জিপিইউ প্রয়োজন। তবে এক্সএল ভ্যারিয়েন্টের জন্য কমপক্ষে ৬ গিগাবাইট থেকে ৮ র্যাম প্রয়োজন।
ওপেনজার্নি: ওপেনজার্নি একটি ফ্রি ওপেন সোর্স এআই ইমেজ জেনারেশন মডেল, যা স্ট্যাবল ডিফিউশনের ওপর ভিত্তি করে নির্মিত। এটি মিডজার্নি ইমেজ দিয়ে প্রশিক্ষিত। এছাড়া এটি মিডজার্নির স্টাইলে ছবি তৈরি করতে সক্ষম। ওপেনজার্নির মালিক প্রতিষ্ঠান প্রম্পটহিরো স্ট্যাবল ডিফিউশন ও ড্রিমশেপারের মতো অন্যান্য মডেলের ব্যবহার করার সুযোগ দেয়। এটি ব্যবহার করার ক্ষেত্রে ব্যবহারকারীরা সাইন আপ করার সময় ২৫টি বিনামূল্যে ক্রেডিট পাবেন। এরপর ব্যবহারকারীদের প্রো ভার্সনে সাবস্ক্রাইব করতে হবে। যার মূল্য প্রতি মাসে ৯ ডলার। ওপেনজার্নি চালাতেও স্ট্যাবল ডিফিউশনের অনুরূপ হার্ডওয়্যার প্রয়োজন। সাবস্ক্রিপশন ছাড়া মিডজার্নির মতো স্টাইল পেতে হলে ওপেনজার্নি অন্যতম বিকল্প।