এটা কি ‘তার’? ওপেনএআই একটি চ্যাটজিপিটি ভয়েস থামিয়ে দেয় যখন কেউ কেউ বলে যে এটি স্কারলেট জোহানসনের মতো শোনাচ্ছে৷

[ad_1]

নিউইয়র্ক (এপি) – ওপেনএআই বলেছে যে এটি তার একটি চ্যাটজিপিটি ভয়েসের ব্যবহার বন্ধ করার পরিকল্পনা করছে যখন কিছু ব্যবহারকারী বলেছে যে এটি স্কারলেট জোহানসনের মতো শোনাচ্ছে, যিনি বিখ্যাতভাবে একটি কাল্পনিক কণ্ঠ দিয়েছেন এবং সেই সময়ে ভবিষ্যত, 2013 ফিল্মে এআই সহকারী “তার।”

ক পোস্ট সোশ্যাল মিডিয়া প্ল্যাটফর্ম X সোমবার, ওপেনএআই বলেছে যে এটি “পজ করার জন্য কাজ করছে” স্কাই – এটি পাঁচটি ভয়েসের একটির নাম যার সাথে চ্যাটজিপিটি ব্যবহারকারীরা কথা বলতে বেছে নিতে পারেন। সংস্থাটি বলেছে যে এটি কীভাবে তার ফ্ল্যাগশিপ কৃত্রিম বুদ্ধিমত্তা চ্যাটবট, বিশেষত স্কাইয়ের জন্য উপলব্ধ প্রাণবন্ত অডিও বিকল্পগুলি নির্বাচন করে সে সম্পর্কে “প্রশ্ন শুনেছে” এবং সেগুলি সমাধান করতে চায়৷

ওপেনএআই ChatGPT-এর কণ্ঠস্বর কীভাবে বেছে নেওয়া হয়েছিল তার বিশদ বিবরণ দিয়ে একটি সহগামী ব্লগ পোস্টে জোহানসন সম্পর্কে ইন্টারনেটের তত্ত্বগুলিকে উড়িয়ে দিয়েছিল।

“আমরা বিশ্বাস করি যে AI ভয়েসগুলি ইচ্ছাকৃতভাবে কোনও সেলিব্রিটির স্বতন্ত্র কণ্ঠের অনুকরণ করা উচিত নয় — স্কাইয়ের ভয়েসটি স্কারলেট জোহানসনের অনুকরণ নয় তবে তার নিজের স্বাভাবিক কথা বলার ভয়েস ব্যবহার করে একজন ভিন্ন পেশাদার অভিনেত্রীর অন্তর্গত,” কোম্পানিটি লিখেছেন. এটি বলেছে যে এটি গোপনীয়তার কারণে তার ভয়েস অভিনেতাদের নাম ভাগ করতে পারে না।

সান ফ্রান্সিসকো-ভিত্তিক ওপেনএআই কেন এখনও স্কাইয়ের ব্যবহার বন্ধ করার সিদ্ধান্ত নিয়েছে সে সম্পর্কে আরও মন্তব্য করেনি।

OpenAI প্রথম ChatGPT-এর জন্য ভয়েস ক্ষমতা চালু করেছিল, যার মধ্যে পাঁচটি ভিন্ন ভয়েস অন্তর্ভুক্ত ছিল, সেপ্টেম্বর মাসে, ব্যবহারকারীদের এআই সহকারীর সাথে সামনের দিকে কথোপকথনে জড়িত হতে দেয়। “ভয়েস মোড” মূলত অর্থপ্রদত্ত গ্রাহকদের জন্য উপলব্ধ ছিল, কিন্তু নভেম্বরে, OpenAI ঘোষণা যে বৈশিষ্ট্যটি মোবাইল অ্যাপের সমস্ত ব্যবহারকারীদের জন্য বিনামূল্যে হয়ে যাবে৷

এবং ChatGPT এর মিথস্ক্রিয়াগুলি আরও পরিশীলিত হয়ে উঠছে। গত সপ্তাহে ওপেনএআই জানিয়েছে এর জেনারেটিভ এআই মডেলের সর্বশেষ আপডেট এর মৌখিক প্রতিক্রিয়ায় মানুষের ক্যাডেনস অনুকরণ করতে পারে এবং এমনকি মানুষের মেজাজ সনাক্ত করার চেষ্টা করতে পারে।

ওপেনএআই বলছে, নতুন মডেল, ডাব করা GPT-4o, আগের সংস্করণের তুলনায় দ্রুত কাজ করে এবং রিয়েল টাইমে পাঠ্য, অডিও এবং ভিডিও জুড়ে যুক্তি দিতে পারে। ওপেনএআই-এর 13 মে ঘোষণার সময় একটি প্রদর্শনীতে, এআই বট রিয়েল টাইমে চ্যাট করেছিল, আবেগ যোগ করেছিল – বিশেষ করে “আরও নাটক” – অনুরোধ অনুযায়ী তার কণ্ঠে। এটি একজন ব্যক্তির মুখের একটি সেলফি ভিডিও দেখে, ভাষা অনুবাদ, ধাপে ধাপে গণিত সমস্যা এবং আরও অনেক কিছু দেখে তার মানসিক অবস্থাকে এক্সট্রাপোলেট করার জন্য একটি ছুরিকাঘাত করেছে৷

GPT-4o, “omni” এর জন্য সংক্ষিপ্ত, এখনও ব্যাপকভাবে উপলব্ধ নয়৷ এটি ক্রমান্বয়ে আগামী সপ্তাহ এবং মাসগুলিতে ব্যবহারকারীদের নির্বাচন করার পথ তৈরি করবে। মডেলের টেক্সট এবং ইমেজ ক্ষমতা ইতিমধ্যেই রোল আউট করা শুরু করেছে, এবং ChatGPT-এর বিনামূল্যের স্তর ব্যবহার করে এমন কিছুর কাছেও পৌঁছানোর জন্য সেট করা হয়েছে — কিন্তু নতুন ভয়েস মোড শুধুমাত্র ChatGPT Plus-এর অর্থপ্রদানকারী গ্রাহকদের জন্য উপলব্ধ হবে।

যদিও বেশিরভাগই এই নতুন ঘোষিত বৈশিষ্ট্যগুলিতে তাদের হাত পেতে পারেনি, ক্ষমতাগুলি স্পাইক জোনজের ডাইস্টোপিয়ান রোম্যান্স “হার” এর সাথে আরও বেশি তুলনা করেছে, যা একজন অন্তর্মুখী পুরুষকে অনুসরণ করে (জোয়াকিন ফিনিক্স) যে একটি এআই-অপারেটিং এর প্রেমে পড়ে সিস্টেম (জোহানসন), যা অনেক জটিলতার দিকে পরিচালিত করে।

ওপেনএআই সিইও স্যাম অল্টম্যানও এটিতে ট্যাপ করতে দেখা গেছে – সহজভাবে পোস্টিং GPT-4o এর উন্মোচনের দিন সোশ্যাল মিডিয়া প্ল্যাটফর্ম X-এ “তার” শব্দটি।

অনেকেই গত সপ্তাহে মডেলের ডেমোতে প্রতিক্রিয়া দেখিয়েছেন যে কিছু মিথস্ক্রিয়া একটি অদ্ভুতভাবে ফ্লার্টেটিং স্বরে আঘাত করেছে। একটি ভিডিও ওপেনএআই দ্বারা পোস্ট করা হয়েছে, একটি মহিলা-কণ্ঠের চ্যাটজিপিটি একজন কোম্পানির কর্মচারীকে “একটি ওপেনএআই হুডি রকিং” এর প্রশংসা করে, এবং অন্যটিতে চ্যাটবট বলেন “ওহ এটা থামাও, তুমি আমাকে ব্লাশ করে দিচ্ছ” বলার পর এটা আশ্চর্যজনক।

এটি জেন্ডারযুক্ত উপায়ে কিছু কথোপকথনের উদ্রেক করেছে যা সমালোচকরা বলেছে যে প্রযুক্তি সংস্থাগুলি দীর্ঘকাল ধরে ভয়েস সহকারীর বিকাশ এবং জড়িত থাকার জন্য ব্যবহার করেছে, জেনারেটিভ AI এর সর্বশেষ তরঙ্গ AI চ্যাটবটগুলির সক্ষমতা উন্নত করার অনেক আগে থেকেই। 2019 সালে, জাতিসংঘের সংস্কৃতি ও বিজ্ঞান সংস্থা “হার্ডওয়ার্ড পরাধীনতা” এর দিকে নির্দেশ করা হয়েছে ডিফল্ট মহিলা-কণ্ঠ সহকারী (যেমন অ্যাপলের সিরি থেকে অ্যামাজনের অ্যালেক্সার মতো), এমনকি যখন যৌনতাবাদী অপমান এবং হয়রানির মুখোমুখি হন।

“এটি পরিষ্কারভাবে বন্ধুদের অহংকার খাওয়ানোর জন্য প্রোগ্রাম করা হয়েছে,” ডেইলি শো সিনিয়র সংবাদদাতা দেশি লিডিক গত সপ্তাহে একটি সেগমেন্টে GPT-4o সম্পর্কে বলেছিলেন। “আপনি সত্যিই বলতে পারেন যে একজন ব্যক্তি এই প্রযুক্তিটি তৈরি করেছেন।”

[ad_2]

Source link